Documente Academic
Documente Profesional
Documente Cultură
Proiect Econometrie
Proiect Econometrie
asupra variatiei numrului mediu de salariati din constructii din judetele din regiunile Nord-Est si Bucuresti-Ilfov.
Judet
Populaia din 2007 (mii persoane) (x3i) 719 454 825 566 705 455 294 1931
CERINTE
a. Realizarea i interpretarea regresiei unifactoriale
y i = f ( xi )
y i = f ( x1i , x 2i , x3i )
Numr mediu salariai din construcii = f (Ctig salarial din construcii, PIB, Populaie)
1 S se determine modelul de regresie pe baza datelor din eantion 2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05. 3 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05. 4 S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaia acestuia pentru un nivel de semnificaie 0,05. 5 Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?
REZOLVARE
Cerinta a Realizarea i interpretarea regresiei unifactoriale y i = f ( xi )
PIB
x 2i
Nord-Est
B-IF
Corelograma evideniaz legtura direct i liniar dintre numarul de PIB i numrul de salariati din constructii.
PIB din 2007 (X2i) 90000 80000 numarul nediu salariati din constructii 70000 60000 50000 40000 30000 20000 10000 0 0 20000 40000 60000 pib PIB din 2007 (X2i) 80000 100000 120000
Corelograma dintre numarul de PIB i numarul nediu salariati constructii din 2007
Coefficients Intercept
-1559.167488
Coeficiennts
b0 termen liber
1.157262088 b coeficient de regresie 1 PIB din 2007 (X2i) *rezultate prin aplicarea programului EXCEL
x1 ,i = -1559.1674 +1.1572 xi y
b0 termen liber NU ARE INTERPRETARE ECONOMICA; ne arat c funcia de regesie
y
3.
SS
714778690 4 39383712. 11 718717061 6
MS
71477869 04 6563952.0 18
F
1088.9456 36
Significan ce F
5.15253E08
*rezultate prin aplicarea programului EXCEL H0: modelul nu este valid statistic H1: modelul este valid statistict tiind c pragul de semnificaie este = 0,05 i k = 1 (exist doi factori de influen) se stabilete: valoarea critic: Ftabelar = F; k ; n k 1 = F;1;n 11 = F0, 05;1;10 = 4,96 regiunea de respingere: dac Fc >F ; k ; n k 1 , atunci H0 se respinge Determinarea statisticii testului ( Fcalculat ) are la baz relaia:
F=
2 sy /x
2 e
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05. Coefficien ts
-
Standard Error
t Stat
P-value
0.2056
Lower 95%
4247.2359
Upper 95%
1128.9010
Interce 1559.1674 1098.5555 -1.4192 pt PIB din 2007 1.15726 0.03506 32.9991 (X2i) *rezultate prin aplicarea programului EXCEL
5.15253
1.0714
1.2430
Testarea semnificaiei parametrului 0 : H0 : (panta 0 = 0 0 este zero, adic 0 nu este semnificativ diferit de zero, deci 0 nu este semnificativ statistic) H1: 0 0, (panta 0 nu este diferit de zero, adic 0 este semnificativ diferit de zero, deci 0 este semnificativ statistic) Deoarece n = 8 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 1 (exist doar unul singur factorde influen) se stabilete:
valoarea critic: t critic =t ;nk 1 = t ;n2 = t 0,5 BILATERAL ;82 = t 0,5 BILATERAL; 6 =1,228
2 2
tb0 > t
2
; n 2
atunci H0 se
respinge Statistica testului este: Decizia: Se observ c parametrul 0 nu este semnificativ statistic deoarece:
0. Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: | tb 0 | (1,4192) < t critic ( 2,228) ;
tcalc = tb 0 =
i. Pragul critic P-value b0 = 0.2056 > = 0,05 pragul de semnificaie ii. Limita inferioar a intervalului de ncredere (lower 95% = -4247.2359) este cu semn diferit ca limita superioar a intervalului (upper 95% = 1128.9010); intervalul de ncredere este - 4247.2359 0 1128.90102 ;
Testarea semnificaiei parametrului 1: H0 : (panta 1= 0 1 este zero, adic 1 nu este semnificativ diferit de zero, deci
t calc > t
2
; n 2
sau
t b1 > t
2
; n 2
atunci H0 se
Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: t c ( 0.2246) < t critic (1,228) . Pragul critic P-value b1 = 5.15253 > = 0,05 pragul de semnificaie . Limita inferioar a intervalului de ncredere (lower 95% = 1.0714) este cu acelai semn ca limita superioar a intervalului (upper 95% = 1.2430). Intervalul de ncredere este 1.0714 1 1.2430 .
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05. Coeficientul de corelaie liniar -- se utilizeaz numai n cazul legturilor liniare (semnul indic - direcia legturii, iar valoarea - intensitatea legturii)
yi
xi
(x
( yi y )
( xi x )( y i y )
(x
( yi y ) 2
141788.4 151613
( x
x)
=0
( y
y)
( x
x )( yi y )
=0
= 6176463374
( x
x)
= 5337134463
( y
y)
= 7187170616
( xi x ) ( y i y ) s xy cov ( x, y ) i =1 r= = = n sx s y sx s y n 2 2 ( ) x x i ( yi y ) i =1 i =1
n
Testarea semnificaiei coeficientului de corelaie: - se stabilete ipoteza nul H 0 : = 0 (coeficientul de corelaie al colectivitii din care s-a extras eantionul de 12 judete, nu difer semnificativ de zero, deci nu este semnificativ statistic); - se stabilete ipoteza alternativ Ipoteza alternativ: H 1 : 0 (coeficientul de corelaie al colectivitii din care s-a extras eantionul de 12 judete, difer semnificativ de zero, deci este semnificativ statistic);
=t 0 , 05 UNILATERAL ; 6 =0,812 valoarea critic: t;n k 1 =t;n2 =t 0, 05 UNILATERAL ;82 = regiunea de respingere: regiunea de respingere: dac t calculat >t;n k 1 atunci H0 se respinge
Concluzie:
t calculat (17.28) > t;n k 1 ( 0,812 ) H 0 se H 1 este Deoarece respinge, deci adevrat, prin urmare coeficientul de corelaie al colectivitii din care s-a extras eantionul de 12 judete, difer semnificativ de zero, deci este semnificativ statistic.
6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz Tabel 1 ----SUMMARY OUTPUT
Regression Statistics
Multiple R Raportul de corelatie (R) R Square
0.997256374
R=
R =
2
2y / x 2y
2y / x 2y
= 1
2e 2y
( )
0.994520276
2e =1 2 y
0.993606989
R = 1
2e / n k 1 y / n 1
2 e
Standard Error Abaterea medie ptratic a erorilor n eantion Observations Numrul observaiilor = volumul eantionului (n)
2562.021081
se =
= n2
(y
i =1
i ) y
n 2
Coeficientul de determinaie (R SQUARE - R 2 ) ne indic pondrea de influen a factorului ( x ) n variaia rezultatului ( y ) R SQUARE - R 2 = 0.994520276 ne arat c, 99.45% reprezint influena factorului PIB asupra variaiei numarul mediu salariati din constructii.
y i = f ( x1i , x 2i , x3i )
Numr mediu salariai din construcii = f (Ctig salarial din construcii, PIB, Populaie)
1. eantion S se determine modelul de regresie pe baza datelor din
Coefficients 4290.406055 -9.358141628 1.050414377 8.185043475 Coeficienii
b0 termen liber
Intercept Cstig salarial din constructii (2007) (x1i) PIB din 2007 populaia din 2007 (mii persoane)
b1 coeficient de regresie (primul factor) b2 coeficient de regresie (al doilea factor) b3 coeficient de regresie (al treilea factor)
2.
ANOVA df Regression Residual Total 3 4 7 SS 718283413 6 4336479.55 9 718717061 6 MS 2394278045 1084119.89 F 2208.49932 6
H0: modelul nu este valid statistic H1: modelul este valid statistict tiind c pragul de semnificaie este = 0,05 i k = 1 (exist doi factori de influen) se stabilete: valoarea critic: Ftabelar = F; k ; n k 1 = F;1;n 31 = F0, 05; 4 = 2,035 regiunea de respingere: dac Fc >F ; k ; n k 1 , atunci H0 se respinge F Determinarea statisticii testului ( calculat ) are la baz relaia:
F=
2 sy /x
2 e
Decizia: deoarece Fcalculat ( 2208.499325 ) > F (4,07) H 0 se respinge, ; k ; n k 1 deci H 1 este adevrat, prin urmare, modelul este valid.
3.
Intercept ctig salarial din constructii (2007) PIB din 2007 populaia din 2007 (mii persoane)
Testarea semnificaiei parametrului 0 : H0 : (panta 0 = 0 0 este zero, adic 0 nu este semnificativ diferit de zero, deci 0 nu este semnificativ statistic) H1: 0 0, (panta 0 nu este diferit de zero, adic 0 este semnificativ diferit de zero, deci 0 este semnificativ statistic) Deoarece n = 8 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 3 (exist doar unul singur factorde influen) se stabilete:
t calc > t
2
; n 4
sau
tb0 > t
2
; n 4
atunci H0 se
i. ii. iii.
Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: | t b 0 | (1.04432 ) < t critic (1.6303) ; Pragul critic P-value b0 = 0.355289804 > = 0,05 pragul de semnificaie Limita inferioar a intervalului de ncredere (lower 95% = -7116.06) este cu semn contrar fa de limita superioar a intervalului (upper 95% = 4290.406055); intervalul de ncredere este - 7116.06 0 4290.406055 ;
Testarea semnificaiei parametrului 1: H0 : (panta 1= 0 1 este zero, adic 1 nu este semnificativ diferit de zero, deci
t calc > t
2
; n 4
sau
t b1 > t
2
; n 4
atunci H0 se
Se observ c parametrul 1 nu este semnificativ statistic deoarece: i. ii. iii. Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: t c (1.971531006 ) < t critic ( 2,303) . Pragul critic P-value b1 = 0.084144139> = 0,05 pragul de semnificaie . Limita inferioar a intervalului de ncredere (lower 95% = -1.306937605) este cu acelai semn ca limita superioar a intervalului (upper 95% = 16.71426207). Intervalul de ncredere este - 1.306937605 1 16.71426207 .
tb2 > t
2
; n 4
atunci H0 se
respinge Statistica testului este: Decizia: Se observ c parametrul 2 este semnificativ statistic deoarece:
i. ii. iii.
t calc = t b 2 =
Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: t c (16.9497075303) > t critic (1.6303) . Pragul critic P-value b2 = 7.10381> = 0,05 pragul de semnificaie . Limita inferioar a intervalului de ncredere (lower 95% = 0.8783513) este cu acelasi semn fata de limita superioar a intervalului (upper 95% = 1.050414377). Intervalul de ncredere este 0.8783513 2 1.050414377 .
Testarea semnificaiei parametrului 3 : H0 : (panta 3 = 0 3 este zero, adic 3 nu este semnificativ diferit de zero, deci 3 nu este semnificativ statistic) H1: 3 0, (panta 3 nu este diferit de zero, adic 3 este semnificativ diferit de zero, deci 3 este semnificativ statistic) Deoarece n = 12 < 30 avem eantion de volum redus i pentru testare vom utiliza testul t. tiind c pragul de semnificaie este = 0,05 i k = 3 (exist doar unul singur factorde influen) se stabilete:
t calc > t
2
; n 4
sau
t b3 > t
2
; n 4
atunci H0 se
Din compararea statisticii testului cu valoarea testului critic (tabelar sau teoretic) rezult c: | t c | ( 2.73951629 ) > t critic ( 2,303) . Pragul critic P-value b2 = 0.051931362 > = 0,05 pragul de semnificaie . Limita inferioar a intervalului de ncredere (lower 95% = -0.11033) este cu semn contrar fata de limita superioar a intervalului (upper 95% = 8.185043475). Intervalul de ncredere este - 0.11033 2 8.185043475 .
4. S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaia acestuia pentru un nivel de semnificaie 0,05
ctig Nr. salarial Mediu din salaria construc ti tii yi (2007) (x1i)
9816 4623 14817 6951 8709 4312 4614 97771 1142 933 1060 976 955 862 1336 1321
xi = 8585
PIB
xi
popula i y ) 2 (y ( yi y ) 2 ia din 2007 x1 , x 2 , x3 , i = 5506,3598 + 7,704 x1i + 0,076 x2i 0,7701x3i (mii y persoa ne) (x3i)
719
9846. 2 4737. 7 1207 1.9 6659. 7 8864. 8 3809. 9 1009 1 8570 7.2
2351.421
454
1076.743
825
3650.639
566
2266.208
705
2653.017
455
1727.86
294
2753.555
1931
xi =
8256.66
y
i
y i =
151613
xi =
5949 141788.4
= 36593.07
( y
y ) = 51892890
Raportul de corelaie -- se utilizeaz att n cazul legturilor liniare, ct i n situaia celor de tip neliniar
R=
(y
n
(y
i =1
i =1 n
y y
) )
Rezultatul R = 0,8788 ne arat c, ntre numar mediu salariati din constructii i ambii factori (castig salarial din constructii; PIB; populatie) exist o legtur puternic.
Testarea semnificaiei raportului de corelaie: - se stabilete ipoteza nul H 0 : R = 0 (raportul de corelaie al colectivitii din care s-a extras eantionul 12 judete, nu difer semnificativ de zero, deci nu este semnificativ statistic); - se stabilete ipoteza alternativ H 1 : R 0 ( raportul de corelaie al colectivitii din care s-a extras eantionul de 12 judete, difer semnificativ de zero, deci este semnificativ statistic);
valoarea critic: Ftabelar = F; k ; n k 1 = F;3;n 4 = F0, 05; 3; 4 = 2,035 regiunea de respingere: dac Fc >F ; k ; n k 1 , atunci H0 se respinge Determinarea statisticii testului ( Fcalculat = Fc ) are la baz relaia:
Fc =
Concluzie: Deoarece Fcalc (6.8) > F0, 05; 1; 4 ( 2.035) , atunci H 0 se respinge, deci H 1 se accept, ceea ce nseamn c raportul de corelaie al colectivitii din care s-a extras eantionul de 12 judete, difer semnificativ de zero, deci este semnificativ statistic.
Tabel 1 -----
SUMMARY OUTPUT
Regression Statistics Multiple R Raportul de corelatie (R) R Square Coeficientul (gradul ) de determinaie ( R 2 )
0.9996982 73 R =
2y / x 2y
= 1
2e 2y
0.9993966 2 2y / x 2e R = = 1 36 2y 2y
Adjusted R Square Valoarea ajustat a coeficientului de determinaie Standard Error Abaterea medie ptratic a erorilor n eantion Observations Numrul observaiilor = volumul eantionului (n)
0.9989441 2 2e / n k 1 13 R = 1 / n 1
y
1041.2107 81 s e =
= n2
2 e
(y
i =1
i ) y
n2
Coeficientul de determinaie (R SQUARE - R 2 ) ne indic pondrea de influen a factorului ( x ) n variaia rezultatului ( y ) R SQUARE - R 2 = 0.999396636 ne arat c 99.93%% reprezint influena factori (castig salarial din constructii; PIB; populatie ) asupra variaiei numarul mediu salariati constructii.