Sunteți pe pagina 1din 14

Problema A.

- Realizarea i interpretarea regresiei unifactoriale ( )


i i
x f y =
a) Prezentarea problemei
n scopul evalurii influenei produsului intern brut (PIB) asupra numrului mediu de
salariai din sectorul construcii, a fost selectat un eantion de 13 judee din dou regiuni
teritoriale (Sud-Est i Sud-Muntenia), n care s-au urmrit valorile urmtoarelor variabile:
i
y
- Numr mediu de salariai din sectorul construcii (variabil dependent endogen)

i
x
2
- PIB (variabil independent exogen)


b) Definirea modelului de regresie liniar
Modelul de regresie unifactorial are forma:
i i i
x y c | | + + =
2 1 0

la nivelul colectivitii
generale, unde:

i
y
- variabila dependent endogen, efect
1 0
, | |
- parametrii modelului de regresie liniar unifactorial
0
|
- termenul liber,
1
|
coeficientul de regresie
i
x
2
- variabila independent exogen, cauz
i
c
- componenta rezidual sau eroarea aleatoare a modelului de regresie.
n eantion modelul de regresie va avea forma
i i i
e x b b y + + =
2 1 0
, unde b
o
i b
1
sunt
estimatorii lui
1 0
, | |
;

i i
x b b
2 1 0
+ = (forma ajustat a modelului de regresie)

n urma analizei datelor s-au obinut
i i
x
2
0.285459 615,5067 + =




Se constat dependena numrului mediu de salariai din sectorul construcii de PIB, iar
legtura dintre cele dou variabile este liniar i puternic (R= 0.942457)

c) Estimarea parametrilor de regresie i interpretarea acestora
Pentru estimarea parametrilor de regresie se va folosi urmtorul sistem de ecuaii:








0.000
2000.000
4000.000
6000.000
8000.000
10000.000
12000.000
14000.000
16000.000
18000.000
0.000 1000.000 2000.000 3000.000 4000.000 5000.000 6000.000
N
r
.

m
e
d
i
u

d
e

s
a
l
a
r
i
a

i

d
i
n

s
e
c
t
o
r
u
l

c
o
n
s
t
r
u
c

i
i


Produsul Intern Brut (x
2i
)
Evoluia numrului mediu de salariai n sectorul
construcii n funcie de PIB n 2010

Y
Predicted Y

= +
= +

=
c
c
=
c
c


= = =
= =
n
i
n
i
n
i
i i i i
n
i
n
i
i i
y x x b x b
y x b nb
b
S
b
S
1 1 1
2
1 0
1 1
1 0
1
0
0
0
n urma analizei efectuate pe baza numrului mediu de salariai din sectorul construcii i
a produsului intern brut s-au obinut urmtoarele rezultate:

Figura 1: Rezultate obinute cu ajutorul EXCEL


Figura 2: Rezultate obinute cu ajutorul EVIews







b
0
= -1299.194
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -1299.1944 844.3404961 -1.53870905 0.15213028 -3157.575268 559.186536
X Variable 13.11156484 0.332808528 9.34941438 1.4418E-06 2.37905821 3.84407147
2
1 1
2
1 1 1
2
1
0
|
.
|

\
|

|
.
|

\
|
|
.
|

\
|

=


= =
= = = =
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
x x n
y x x x y
b
Intervalul de ncredre pentru
0
este: b
0
t
/2,n-k-1
S
b0

b
0
- t
/2,n-k-1
S
b0

0
b
0
+ t
/2,n-k-1
S
b0

-1299,194 t
0,05/2,13-1-1
844,3405
0
-1299,194 + t
0,05/2,13-1-1
844,3405

-3157,575267
0
559,1865344

Interpretare: b
0
=
i
= -1299.194 dac x
2i
= 0

Dac valoarea produsului intern brut va fi de zero milioane euro, numrul mediu de
salariati din sectorul construcii va avea valoarea lui b
0
= -1299.194.











b
1
= 3.111565

Intervalul de ncredre pentru
1
este: b
1
t
/2,n-k-1
S
b1

b
1
- t
/2,n-k-1
S
b1

1
b
1
+ t
/2,n-k-1
S
b1

3.111565 t
0,05/2,13-1-1
0,332809
1
3.111565 + t
0,05/2,13-1-1
0,332809

2,37905821
1
3,844071473

Interpretare:
b
1
= 3.111565 este coeficient de regresie i reprezint panta liniei drepte.
Deoarece b
1
este > 0, ntre PIB i numrul mediu de salariai din sectorul construcii
exist o legtur direct. Dac PIB crete cu o unitate, atunci numrul mediu de salariai din
sectorul construcii va crete cu b
1
1, adic cu 3.111565 persoane.




=
=
= =
= = =


=
|
.
|

\
|

|
.
|

\
|
|
.
|

\
|

=
n
i
i
n
i
i i
n
i
n
i
i i
n
i
i
n
i
i
n
i
i i
x n x
y x n y x
x x n
y x y x n
b
1
2 2
1
1
2
1
2
1 1 1
1
d) Testarea semnificaiei corelaiei i a parametrilor modelului de regresie


1. Testarea semnificaiei corelaiei (prin R
y/x
i r
y/x
)

a) Testarea semnificaiei lui R
y/x
(a raportului de corelaie)
etapa 1: H
0
: R
y/x
= 0 (raportul de corelaiei nu este semnificativ statistic)
etapa 2: H
1
: R
y/x
0 (raportul de corelaie este semnificativ statistic)
etapa 3: test Fisher (bilateral)
etapa 4:

F
,k,n-k-1
= F
0.05,1,13-1-1
= F
0.05,1,11
= 4.84

etapa 5:

F
calculat
=

= 87.411581


etapa 6:

F
calculat
> F
,k,n-k-1
87.411581> 4.84

Pentru o probabilitate de 95%, exist suficiente dovezi pentru a respinge ipoteza nul i a
accepta ipoteza alternativ, ceea ce nseamn c raportul de corelaie este semnificativ statistic.

b) Testarea seminifcaiei lui r (a coeficientului de corelaie)
etapa 1: H
0
: r
y/x
= 0 (coeficientul de corelaiei nu este semnificativ statistic)
etapa 2: H
1
: r
y/x
0 (coeficientul de corelaie este semnificativ statistic)
etapa 3: test Student (bilateral) n=13 < 30
etapa 4:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.94245663
R Square 0.8882245
Adjusted R Square 0.87806309
Standard Error1539.58181
Observations 13

t
/2,n-k-1
= t
0,05/2, 13-1-1
= 2.201
- t
/2,n-k-1
= - t
0,05/2, 13-1-1
= -2.201
etapa 5:

La modelul liniar, R
y/x
= r
y/x
= 0,9424663

t
calculat
=

= 9,3495

etapa 6:
t
calculat
> t
critic
=> 9.3495 > 2.201
Pentru o probabilitate de 95%, exist suficiente dovezi pentru a respinge ipoteza nul i a
accepta ipoteza alternativ, astfel coeficientul de corelaie este semnificativ statistic.

2. Testarea parametrilor modelului de regresie simpl liniar

a) Testarea semnificaiei parametrului
0
etapa 1: H
0
:
0
= 0 (parametrul
0
nu este semnificativ statistic)
etapa 2: H
1
:
0
0 (parametrul
0
este semnificativ statistic)
etapa 3: test bilateral t (Student) => n= 13<30
etapa 4:

t
/2,n-k-1
= t
0,05/2,13-1-1
= 2,201
-t
/2,n-k-1
= - t
0,05/2,13-1-1
= -2,201

etapa 5:
t
calculat
=

= -1.538709


etapa 6:
t
calculat
< t
critic
-1,538709 < 2,201 se accept H
0

Pentru o probabilitate de 95%, exist suficiente dovezi pentru a accepta ipoteza nul i a
respinge ipoteza alternativ, deci parametrul
0
nu este semnificativ din punct de vedere statistic.

b. Testarea semnificaiei parametrului
1
etapa 1: H
0
:
1
= 0 (parametrul
1
nu este semnificativ statistic)
etapa 2: H
1
:
1
0 (parametrul
1
este semnificativ statistic)
etapa 3: test bilateral t (Student) => n= 13<30
etapa 4:


t
/2,n-k-1
= t
0,05/2,13-1-1
= 2,201
-t
/2,n-k-1
= - t
0,05/2,13-1-1
= -2,201
etapa 5:
t
calculat
=

= 9.349414



etapa 6:
t
calculat
> t
critic
9.349414 > 2,201 se respinge H
0
Pentru o probabilitate de 95%, exist suficiente dovezi pentru a respinge ipoteza nul i a
accepta ipoteza alternativ, deci parametrul
1
este semnificativ din punct de vedere statistic.


4. 88.82% din variaia variabilei efect (numrul mediu de salariai din sectorul construcii) este
explicat de variaia variabilei cauz (produsul intern brut) deoarece R
2
= 0.8882245.


e) Aplicarea analizei de tip ANOVA i interpretarea rezultatelor


Modelul de regresie are n-1 = 12 grade de libertate cu o singur variabil exogen ( k=1),
iar numrul gradelor de libertate corespunztoare valorilor aleatoare este de n-k-1 = 11.
Variaia sistemului (SSR) = 207192656,5 i variaia rezidual (SSE) = 2673433,53,
determinnd o variaie total = 233266090 (SST).
Valoarea calculata testului Fisher este de 87,4115493, iar modelul de regresie este
semnificativ statistic (valid), pentru o probabilitate mai mare de 95%.

f) Testarea ipotezelor clasice asupra modelului de regresie simpla
1. Ipoteze statistice clasice ale modelului de regresie
Ipoteza 1: Forma funcional
ANOVA
df SS MS F Significance F
Regression 1 207192656.5 207192656 87.4115493 1.44182E-06
Residual 11 26073433.53 2370312.14
Total 12 233266090
i i i i i
y x y c c | | + = + + =
1 0
Ipoteza 2: Media erorilor este 0

Ipoteza 3: Homoscedasticitatea: dispersia reziduurilor n populaie este constant pentru
toate valorile x
i


Ipoteza 4: Non-autocorelarea erorilor (deviaiile observaiilor de la valorile lor ateptate
sunt necorelate)


Ipoteza 5: Necorelare ntre regresor i erori


Ipoteza 6: Variabila aleatoare este normal distribuit


2. Testarea liniaritii modelului
H
0
:

(modelul nu este liniar, respectiv nu este valid)


H
1
:

(modelul este liniar, respectiv este valid)


se folosete testul Fisher:

F
calculat
=

= 87,4115493

F
,k,n-k-1
= F
0.05,1,13-1-1
= F
0.05,1,11
= 4.84

F
calculat
> F
,k,n-k-1
87.411581> 4.84

Pentru o probabilitate de 95%, exist suficiente dovezi pentru a respinge ipoteza nul i a
accepta ipoteza alternativ, ceea ce nseamn c modelul este liniar, respectiv este valid.


0 = c
n i , 1 cst
2
= =
c
o
j i Cov
j i
= = 0 ) , ( c c
j i x Cov
j i
si 0 ) , ( = c
) , 0 ( ~
2
o c N
i
3. Testarea normalitii erorilor
H
0
: erorile nu sunt distribuite normal
H
1
: erorile sunt distribuite normal


JB
calculat
= 029342 . 0 )
24
) 3 22991 . 3 (
6
017936 . 0
( 13 ]
24
) 3 (
6
[
2 2 2 2
=

+
k s
n


84 . 3
2
1 ; 05 , 0
2
,
= = _ _
o k

JB
calculat
<
2
=> se accept H
0
Pentru o probabilitate de 95% exist suficiente dovezi pentru a accepta ipoteza nul i a
respinge ipoteza alternativ, deci erorile nu sunt distribuite normal.



4. Testarea ipotezei de homoscedasticitate
H
0
:
0
1 0
= = | |
(modelul este homoscedastic)
H
1
:
0
1 0
= = | |
(modelul este heteroscedastic)
se folosete testul White

LM =
2
R n

LM = 13 0,542934 = 7.058146

84 . 3
2
1 ; 05 , 0
2
,
= = _ _
o k

LM >
2
=> se respinge H
0
Pentru o probabilitate de 95% exist suficiente dovezi pentru a respinge ipoteza nul i a
accepta ipoteza alternativ, deci modelul este heteroscedastic.


5. Testarea ipotezei de autocorelare a erorilor
H
0
: erorile nu sunt autocorelate
H
1
: erorile sunt corelate

322597 . 1
) (
1
2
2
2
1
=

=
=

n
i
i
n
i
i i
calculat
e
e e
DW

DW
,n,p
= DW
0,05,13,2
=>
d
1
= 1,01
d
2
= 1,34


INDECIZIE INDECIZIE







0 2 4 d
1=1,01
d
2=1,34
4-d
2=2,66
4-d
1=2,99
se respinge H
0
(autocorelare
pozitiv a erorilor)
se accept H
0
se respinge H
0
(autocorelare
negativ a erorilor)
DW

Pentru o probabilitate de 95% nu se tie dac se accept sau nu H
0
deoarece DW
calculat
se
afl n zona de indecizie.
g) Previziunea valorii variabilei Y dac variabila X crete cu 10% fa de ultima valoare
nregistrat.
x
n
= x
13
=1303,584
x
n+1
= 1303,584 + 10% 1303,584 = 1433,9424

n+1
= b
0
+ b
1
x
n+1

n+1
= -1299,194 + 3,111565 1433,9424 = 3162,61098
Intervalul de ncredere:

n+1

=

3162,61098 2,201

S-ar putea să vă placă și