Sunteți pe pagina 1din 13

Academia de Studii Economice Facultatea de Comer

Proiect econometrie Nr. Mediu de salariai = f(PIB, populaie) Regiunea 4 si 5 (8 judee)

Bucureti, 2009

Regiunea Sud-Vest

Judeul Dolj Gorj Mehedini Olt Arad Caras Severin Hunedoara Timis

Vest

Populaia la 1 Nr. mediu al iulie 2005(nr. salariailor(m persoane) ii. pers.) 718874 119 384852 79 303869 47 483674 69 459286 116 331876 60 480459 118 658837 190

PIB regional 2004 mil. lei (RON) preturi curente 6610,6 4659,9 2684,8 3759,8 6187,3 3411,3 5266,7 10431,6

Cerinte: a. Realizarea i interpretarea regresiei unifactoriale Nr. mediu de salariai = f (populaie) 1. S se reprezinte grafic datele 2. S se determine modelul de regresie pe baza datelor din eantion 3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05. 4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05. 5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05. 6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz? b. Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie) 1 S se determine modelul de regresie pe baza datelor din eantion 2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05. 3 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05. 4 S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaia acestuia pentru un nivel de semnificaie 0,05. 5 Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?

Rezolvare:
a. Realizarea si interpretarea regresiei unifactoriale Nr. Mediu de salariati = f (populatie)

Se identifica cele doua variabile xi variabila factorial = populatia (n nr persoane) din regiunile Nord-Vest si Sud - Est yi - variabila dependent = numrul mediu de salariati (mii persoane) din regiunile Nord-Vest si Sud Est 1. S se reprezinte grafic datele Graficul construit, denumit corelogram, ne indic existena, forma i direcia legturii dintre cele dou variabile
Corelograma intre populatia din regiunile SV si V si numarul mediu al salariatilor din aceleasi regiuni 200 180 160 Nr mediu al salariatilor 140 120 100 80 60 40 20 0 0 100000 200000 300000 400000 500000 600000 700000 800000 Populatia y = 0.0002x - 18.371 R2 = 0.6235

Scara: 1cm OY = 20 mil persoane 1cm OX = 100 000 persoane Corelograma evideniaz legtura direct (punctele sunt plasate pe direcia primei bisectoare) i liniar (dreapta de regresie are panta pozitiv) dintre populatia din regiunile SV si V si numarul mediu al salariailor
din aceleai regiuni.

SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations ANOVA df Regression Residual Total 1 6 7 SS 9260.017 5591.483 14851.5 Standard Error 38.99547 7.84E-05 MS 9260.017 931.9139 F 9.936558 Significanc eF 0.019759

0.789625 0.623507 0.560758 30.52726 8

Intercept X Variable 1

Coefficients -18.3707 0.000247

t Stat -0.4711 3.152231

P-value 0.654212 0.019759

Lower 95% -113.789 5.53E-05

Upper 95% 77.04781 0.000439

RESIDUAL OUTPUT Observation 1 2 3 4 5 6 7 8 Predicted Y 159.3791 76.78835 56.76439 101.2232 95.193 63.68944 100.4283 144.5343 Residuals -40.3791 2.211645 -9.76439 -32.2232 20.807 -3.68944 17.57173 45.46575

2. S se determine modelul de regresie pe baza datelor din eantion

Aplicarea modelului liniar de regresie presupune utilizarea ecuaiei de regresie liniar: y i = a + bxi
Coefficients -18.3707 0.000247 Standard Error 38.99547 7.84E-05 t Stat -0.4711 3.152231 P-value 0.654212 0.019759 Lower 95% -113.789 5.53E-05 Upper 95% 77.04781 0.000439

Intercept X Variable 1

a = -18.3707
b = 0.000247 y = -18.3707 + 0.000247xi

Interpretare: b = 0.000247 b se numete coeficient de regresie reprezentnd panta liniei drepte b> 0, deci ntre numrul mediu de salariati i populatie exist o legtur direct la creterea populaiei cu o persoana, numrul mediu de salariati se mrete cu 0,5495 mii persoane .
3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.
ANOVA df Regression Residual Total 1 6 7 SS 9260.017 5591.483 14851.5 MS 9260.017 931.9139 F 9.936558 Significanc eF 0.019759

Interpretare rezultate din tabelul ANOVA: n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F= 9.936558, iar Significance F (pragul de semnificaie) este 0.019759 (valoare mai mic de 0,05), atunci modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile.
4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.
Coefficients -18.3707 0.000247 Standard Error 38.99547 7.84E-05 t Stat -0.4711 3.152231 P-value 0.654212 0.019759 Lower 95% -113.789 5.53E-05 Upper 95% 77.04781 0.000439

Intercept X Variable 1

Interpretarea rezultatelor din tabelul : Intercept este termenul liber, deci coeficientul a este -18.3707. Termenul liber este punctul n care variabila explicativ (factorial) este 0. Deci numarul mediu de salariati, dac populatia este 0 va fi t 18.3707 persoane. Deoarece a = -0.4711, iar pragul de semnificaie P-value este 0.654212 > 0,05 nseamn c acest coeficient nu este semnificativ. De altfel faptul c limita inferioar a intervalului de ncredere (-113.789 77.04781) pentru acest parametru este negativ, iar limita superioar este pozitiv arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b este 0.000247, ceea ce nsemn c la creterea a populaiei cu o persoana, numrul mediu de salariati va crete cu 0.000247 mii persoane. Deoarece t b = 3.152231, iar pragul de semnificaie P-value este 0.019759 < 0,05 nseamn c acest coeficient este semnificativ. Intervalul de ncredere pentru acest parametru este 5.53E-05 0.000439
5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05. Coeficientul de corelaie r:
n

s xy cov ( x, y ) r= = = sx s y sx s y

( x
i =1

x ) ( yi y )

n n ( x i x ) 2 ( y i y ) 2 i =1 i =1

sau r =

[n x

n xi y i x i y i
2 i 2

( xi ) n y i2 ( y i )

][

]
5

s xy cov ( x, y ) r= = = sx s y sx s y

( x
i =1

x ) ( yi y )

n n ( x i x ) 2 ( y i y ) 2 i =1 i =1

Populaia Nr. la 1 iulie mediu al 2005(mii salariail persoane or(mii. ) pers.) xi yi 718,874 384,852 303,869 483,674 459,286 331,876 480,459 658,837 119 79 47 69 116 60 118 190

(x

( yi y )

( xi x )( y i y )
12101068

( x x)
i

( yi y ) 2
370,5625 430,5625 2782,563 945,5625 264,0625 1580,063 333,0625 8145,063

628626, 9 89862,3 89943,2 89763,4 89787,8 89915,2 467,459 89588,3

19,25

3,95172E+11

-20,75 -52,75 -30,75 16,25 -39,75 18,25 90,25

1864642

8075224806

4744506 2760226

8089785994 8057473837

-1459052

8061852733

3574130 8531,127 -8085341

8084748698 218517,9167 8026058054

( x
i

x)

721976,9

798

90234,1 1

( y
0

y)

(x

x )( y i y )

( x

x)

15508709

4,43567E + 11

( y

y)

14851,5

xi 718,874 384,852 303,869 483,674 459,286 331,876 480,459 658,837

yi 119 79 47 69 116 60 118 190

xi2
5,1678E+11 148111,0619 92336,36916 233940,5383 210943,6298 110141,6794 230840,8507 434066,1926

y i2
14161 6241 2209 4761 13456 3600 13924 36100

x i yi
85546006 30403,31 14281,84 33373,51 53277,18 19912,560 56694,16 125179

2 i

721976,9

798

5,16781E+11

2 i

= 94452

85879128

x y
i

r = 0,78 > 0, ceea ce ne arata ca intre populatie si numarul mediu al salariatilor exista o legatura directa puternica

Testarea semnificaiei coeficientului de corelaie: - se stabilete ipoteza nul: H0: r nu este semnificativ statistic; - se stabilete ipoteza alternativ: H1: r este semnificativ statistic; - se calculeaz testul t: r r n2 0,78 6 t= = = = 3,0531 2 sr 1 r 1 0,78 2 t0,05;6 = 2,447 tcalc > t0,05;6 Coeficientul de corelaie este semnificativ statistic

Msurarea intensitii legturii cu raportul de corelaie R:

R=

(y
n

(y
i =1

i =1 n

y y

) )

79,64 = 0,78 22,35

Rezultatul R = 0,78 ne arat c, ntre poplulatie i numrul mediu de salariati exist o legtur direct puternic. Deoarece R = r = 0,78, apreciem c exist o legtur liniar, puternic i direct ntre cele dou variabile. Testarea semnificaiei raportului de corelaie (R): H0: raportul de corelaie nu este semnificativ statistic; H1: raportul de corelaie este semnificativ statistic; Decizia: dac Fcalc > F ;k ;n k 1 , atunci H0 se respinge Determinarea lui Fcalculat se face cu relaia : R2 n k 1 0,78 13 F= = = 46,09 2 k 1 0,78 1 1 R Pentru un prag de semnificaie de 5% valoarea tabelat a testului este: F ;k ;n k 1 = F0,05;1;811 = t 0,05;1;6 = 5,99 Deoarece Fcalc > F0, 05; 1; 6 , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul de corelaie (R) este semnificativ statistic.
6. Ce pondere din variaia variabilei efect este explicat de variaia variabilei cauz? Ponderea este data de coeficientul de determinatie (R Square) :

2 y/x 2 y

R2 =

= 1

2 e 2 y

(y
n

(y
i =1

i =1 n

y y

) )

= 0.623507 obtinut in EXCEL care reprezinta faptul ca 62% din variatia

numarului mediu de salariati este explicata de populatie

b. Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie) Pib-ul obtinut in regiunile SV si V Residual Plot
Residuals 50 0 -50 0 2000 4000 6000 8000 10000 12000

Pib-ul obtinut in regiunile SV si V

Populatia in regiunile SV si V Residual Plot


Residuals 50 0 -50 0 200000 400000 600000 800000 Populatia in regiunile SV si V

Nr mediu al salariatilor

Pib-ul obtinut in regiunile SV si V Line Fit Plot


500 0 0 5000 10000 15000 Predicted Nr mediu al salariatilor Pib-ul obtinut in regiunile SV si V Nr mediu al salariatilor

Populatia in regiunile SV si V Line Fit Plot


Nr mediu al salariatilo r 500 0 0 500000 1000000 Populatia in regiunile SV si V Predicted Nr mediu al salariatilor Nr mediu al salariatilor

SUMMARY OUTPUT Regression Statistics Multiple R 0.982622198 R Square 0.965546384 Adjusted R Square 0.951764938 Standard Error 10.1162036 Observations 8 ANOVA df Regression Residual Total 2 5 7 SS 14339.81212 511.687876 14851.5 Standard Error 13.15907743 4.30263E-05 0.002584385 MS 7169.906062 102.3375752 F 70.06132 Significance F 0.000220337

Intercept Populatia in regiunile SV si V Pib-ul obtinut in regiunile SV si V

Coefficients -0.866836063 5.69674E-06 0.018208019

t Stat -0.06587362 0.13240144 7.04539834

P-value 0.950031 0.89983 0.00089

Lower 95% -34.69332146 -0.000104906 0.011564647

Upper 95% 32.95964934 0.000116299 0.024851391

RESIDUAL OUTPUT Predicted Nr mediu al salariatilor 123.5943312 86.17311237 49.74911549 70.3470381 114.4080713 63.13678969 97.76638642 192.8251554

Observation 1 2 3 4 5 6 7 8

Residuals -4.594331244 -7.173112365 -2.749115493 -1.347038099 1.591928682 -3.13678969 20.23361358 -2.825155368

10

1. S se determine modelul de regresie pe baza datelor din esantion Notam:

X1 variabila factorial = populatia (n nr persoane) din regiunile Nord-Vest si Sud Est


X2- variabila factoriala =PIB regional 2004(in mil. lei) Y- variabila dependent = numrul mediu de salariai (mii persoane) din regiunile Nord-Vest si Sud Est
Ecuaia de regresie este: y x1 , x2 = b0 + b1 x1 + b2 x 2 , unde y x1x2 reprezint valorile ajustate ale variabilei Y n funcie de cele dou variabile factoriale X1 i X2.
Standard Error 13.15907743 4.30263E-05 0.002584385

Intercept Populaia in regiunile SV si V PIB-ul obinut in regiunile SV si V

Coefficients -0.866836063 5.69674E-06 0.018208019

t Stat -0.06587362 0.13240144 7.04539834

P-value 0.950031 0.89983 0.00089

Lower 95% -34.69332146 -0.000104906 0.011564647

Upper 95% 32.95964934 0.000116299 0.024851391

b0 = -0.866836063 b1 = 5.69674E-06 b2 = 0.018208019

y i = -0.8668360 63 + 5.69674E - 06 x1i + 0.01820801 9 x 2i


Parametrul b0 are caracter de mrime medie, arat c s-a nregistrat o scdere medie de -0.866836063 mii persoane, dac numrul mediu de salariai ar fi fost influenat de ali factori, exceptnd variabilele X1 i X2, incluse n model. Dac populaia ar crete cu o persoan, atunci numrul mediu de salariai ar crete cu 5.69674E-06 mii persoane, iar dac PIB-ul obinut in cele doua regiuni(Sud-vest si Vest) ar crete cu 1 mil. lei, atunci numrul mediu de salariai ar crete cu 0.018208019 mii persoane. 2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.
ANOVA df Regression Residual Total 2 5 7 SS 14339.81212 511.687876 14851.5 MS 7169.906062 102.3375752 F 70.06132 Significance F 0.000220337

11

Interpretare rezultate din tabelul ANOVA: n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F= 70.06132, iar Significance F (pragul de semnificaie) este 0.000220337 (valoare mai mare de 0,05), atunci modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre variabile.
3. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.
Coefficients -0.866836063 5.69674E-06 0.018208019 Standard Error 13.15907743 4.30263E-05 0.002584385 t Stat -0.06587362 0.13240144 7.04539834 P-value 0.950031 0.89983 0.00089 Lower 95% -34.69332146 -0.000104906 0.011564647 Upper 95% 32.95964934 0.000116299 0.024851391

Intercept Populatia in regiunile SV si V Pib-ul obtinut in regiunile SV si V

Interpretarea rezultatelor din tabelul 3: Intercept este termenul liber, deci coeficientul b0 este -0.866836063. Termenul liber este punctul n care variabilele explicative (factoriale) sunt 0. Deci numarul mediu de salariati, dac valoarea t populatie si a PIB-ului ar fi 0, s-ar situa la nivelul -0.866836063 mii persoane. Deoarece b 0 = -0.06587362, iar pragul de semnificaie P-value este 0.950031 > 0,05 nseamn c acest coeficient nu este semnificativ. De altfel faptul c limita inferioar a intervalului de ncredere pentru acest parametru este negativ, iar limita superioar este pozitiv -34.69332146 32.95964934) arat c parametrul din colectivitatea general este aproximativ zero. Coeficientul b1 este 5.69674E-06, ceea ce nsemn c la creterea populatiei cu o persoana, numarul mediu de salariati va crete cu 5.69674E-06 mii persoane. Deoarece t b1 = 0.13240144, iar pragul de semnificaie P-value este 0.89983 > 0,05 nseamn c acest coeficient nu este semnificativ. De asemenea, acest parametru este aproximativ zero, deoarece limita inferioar a intervalului de ncredere pentru acest parametru este negativ, iar limita superioar este pozitiv ( -0.000104906 0.000116299). Coeficientul b2 este 0.018208019 i ne arat c, la o cretere cu 1 mil a PIB-ului obtinut in cele doua regiuni, numarul mediu de salariati va nregistra o cretere cu 0.018208019 mii persoane. Rezultatul t b 2 =7.04539834 i pragul de semnificaie corespunztor P-value de 0.00089 < 0,05 ne conduce la concluzia c acest coeficient este semnificativ. Intervalul de incredere pentru acest parametru este -0,04114133 0,2493662. 4.
S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaia acestuia pentru un nivel de semnificaie 0,05.

R= 0,989430469 arat c ntre numarul mediu de salariati i cele 2 variabile luate n studiu (PIB-ul obtinut in cele doua regiuni si populatia) exist o legtur directa foarte puternic. Testarea semnificaiei raportului de corelaie (R): H0: raportul de corelaie nu este semnificativ statistic; H1: raportul de corelaie este semnificativ statistic; Decizia: dac Fcalc > F ;k ;n k 1 , atunci H0 se respinge Determinarea lui Fcalculat se face cu relaia :

12

R2 n k 1 0,98 6 = = 148,49 2 k 1 0,98 * 0.98 1 1 R Pentru un prag de semnificaie de 5% valoarea tabelat a testului este: F ;k ;n k 1 = F0,05; 2;811 = F0,05; 2;6 = 5,14 F= Deoarece Fcalc > F0, 05; 1; 6 , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul de corelaie (R) este semnificativ statistic. 5. Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?
Ponderea este data de coeficientul de determinatie (R Square) : = 0.965546384 obtinut in EXCEL care reprezinta faptul ca 96% din variatia numarului mediu de salariati este explicata de populatie si PIB-ul obtinut in cele doua regiuni.

13