Documente Academic
Documente Profesional
Documente Cultură
Econometrie
Academia de Studii Economice Bucuresti
CUPRINS:
1
1. Prezentarea problemei și analiza preliminară a datelor:
Prezentarea problemei:
Datele culese pe 30 de țări din anul 2016 ilustrează o variabilă independentă notată cu x1,
respectiv FORTA DE MUNCA (exprimata in mii de locuitori), o variabila independenta x2,
respective POPULATIA TOTALA, și o variabilă dependentă notată cu y, respectiv PIB
(produsul intern brut exprimat in mii US), pentru a arăta legătura dintre acestea.
Pentru a verifica validitatea modelului de regresie vom verifica mai intai validitatea datelor
preluate. Astfel, vom folosi functia de regresie din excel pe tabelul de mai sus.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.594373676
R Square 0.353280067
Adjusted R Square 0.305374887
Standard Error 784430.2298
Observations 30
ANOVA
df SS MS F Significance F
Regression 2 9.0756E+12 4.54E+12 7.374569 0.002784001
Residual 27 1.66139E+13 6.15E+11
Total 29 2.56895E+13
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 347520.795 155143.8804 2.23999 0.033523 29191.84687 665849.7432 29191.84687 665849.7432
Forta de munca(mii loc.) 70.12308166 26.01468198 2.695519 0.011947 16.74536329 123.5008 16.74536329 123.5008
Populatie(mii loc.) -25.60933262 10.12998924 -2.52807 0.017626 -46.39435368 -4.824311572 -46.39435368 -4.824311572
Mai departe, vom realiza o statistica descriptive a datelor si com calcula prin regula celor 3
Sigma.
Verificam multicoliniaritatea datelor cu functia din excel =corell(x1,x2) iar valoarea o vom
compara cu cea a lui R2 => corel= 0.998230226 iar R2= 0.353280067. Cum valoarea calculate
este mai mare decat valuarea lui R2, rezulta ca avem multicoliniaritate.
a, b = parametrii modelului
ui = variabila reziduală.
Pe baza datelor preluate, vom face 2 grafice care sa ne arate legatura dintre variabile:
500000
400000
300000
200000
100000
0
0 1000000 2000000 3000000 4000000
4
Populatie(mii loc.)
1400000.00
1200000.00
1000000.00
800000.00
600000.00
400000.00
200000.00
0.00
0.00 1000000.00 2000000.00 3000000.00 4000000.00
Coefficients
Intercept 347520.795
Forta de munca(mii loc.) 70.12308166
Populatie(mii loc.) -25.60933262
â=70.12308166 si b̂=-25.60933262
5
Astfel, putem calcula abaterea medie patratică sau abaterea standard (Standard Error din
ANOVA) a variabilei reziduale û și a estimatorilor â și b̂.
Standard Error
Intercept 155143.8804
Forta de munca(mii loc.) 26.01468198
Populatie(mii loc.) 10.12998924
𝐲̂i= b0 + b1∙ x1 + b2 ∙ x2
Interpretare:
P-value
0.033523
0.011947
0.017626
P-value â = 0.011947< ∝ = 0.05 rezultă că estimatorul â este semnificativ din punct de vedere
statistic;
P-value b̂ = 0.017626 < ∝ = 0.05 rezultă că estimatorul b̂ este semnificativ din punct de vedere
statistic.
6
Significance F= 0.002784001< ∝ = 0.05 => modelul este de încredere(este valid).
Pentru a putea testa normalitatea erorilor vom aduce in discutie cele doua ipoteze:
Tabelul erorilor:
RESIDUAL OUTPUT
Mean -6.51926E-10
Standard Error 138189.9875
Median -247198.7152
Mode #N/A
Standard Deviation 756897.7339
Sample Variance 5.72894E+11
Kurtosis 2.966004176
Skewness 1.420615492
Range 3847824.873
Minimum -1647853.408
Maximum 2199971.465
Sum -1.95578E-08
Count 30
Pe baza datelor din statistica descriptiva de mai sus, vom folosi formula JB => JB=
n(Skew^2/6+Kurt^2/24)= 21.08721784>5.99.
Cum JB>val critica(5.99) => acceptam ipoteza H0 => Erorile sunt normal distribuite.
Pentru a putea determina homoscedascititatea vom efectua urmatorul tabel preluat din excel:
8
ei ei^2 x1 x2 x1^2 x2^2 x1x2
-345451 1.19336E+11 1190.93 2876.10 1418314.2649 8271951.21 3425233.773
-37276.5 1389537144 12631.06 40606.05 159543676.7236 1648851296.60 512897453.9
-320402 1.02657E+11 1855.49 4170.60 3442843.1401 17393904.36 7738506.594
-341468 1.166E+11 623.40 1170.13 388627.5600 1369204.22 729459.042
-257114 66107453009 5319.13 10561.63 28293143.9569 111548028.26 56178682.98
-102441 10494218099 2963.84 5731.12 8784347.5456 32845736.45 16986122.7
225522.1 50860211355 31569.88 95688.68 996657323.2144 9156323480.14 3020880145
-338579 1.14636E+11 683.22 1316.48 466789.5684 1733119.59 899445.4656
-157696 24868165006 2676.53 5495.10 7163812.8409 30196124.01 14707800
1723540 2.97059E+12 30055.12 66896.11 903310238.2144 4475089533.13 2010570614
2199971 4.83987E+12 43299.99 82667.68 1874889134.0001 6833945316.58 3579509717
-211864 44886464277 4764.75 10746.74 22702842.5625 115492420.63 51205529.42
-290128 84174071759 4540.32 9817.96 20614505.7024 96392338.56 44576680.15
-332742 1.10717E+11 197.20 334.25 38887.8400 111723.06 65914.1
-25516.8 651109561.1 511281.91 1324171.35 261409191493.2480 1753429764160.82 6.77025E+11
-1647853 2.71542E+12 127198.98 261115.46 16179580513.0404 68181283451.01 33213620174
116498 13571781811 9414.92 37202.57 88640718.6064 1384031214.60 350259220.3
-87708.1 7692718046 2231.46 4773.10 4979413.7316 22782483.61 10650981.73
-85694.8 7343594347 3933.13 8547.10 15469511.5969 73052918.41 33616855.42
1281925 1.64333E+12 25276.49 60600.59 638900946.7201 3672431508.35 1531770207
-237284 56303570295 2432.50 9455.80 5917056.2500 89412153.64 23001233.5
-333145 1.10985E+11 1453.45 2872.30 2112516.9025 8250107.29 4174744.435
-292786 85723463992 287.24 582.97 82506.8176 339854.02 167452.3028
-585585 3.42909E+11 12629.04 24894.55 159492651.3216 619738619.70 314394267.7
-296728 88047478684 14891.69 31187.26 221762431.0561 972645186.31 464431007.9
-339117 1.15001E+11 195.88 436.95 38368.9744 190925.30 85589.766
-338678 1.14703E+11 1267.36 3552.00 1606201.3696 12616704.00 4501662.72
-344812 1.18895E+11 248.32 622.78 61662.8224 387854.93 154648.7296
226229.1 51179584045 9025.92 17018.41 81467231.8464 289626278.93 153606807.2
1576382 2.48498E+12 33881.98 65637.24 1147988568.7204 4308247274.82 2223919653
Testul White:
Ipoteze:
H0: a1=a2=…=a3=0
H1: ai+0
9
W=n*R2auxiliar
Vom prelucra noile date din excel si vom realiza o noua regresie, de data asta cu y=ei2 si x1 si
x2. => urmatoarele date:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.713367249
R Square 0.508892831
Adjusted R Square 0.472514523
Standard Error 8.48371E+11
Observations 30
ANOVA
df SS MS F Significance F
Regression 2 2.01366E+25 1.01E+25 13.98891 6.77454E-05
Residual 27 1.94328E+25 7.2E+23
Total 29 3.95694E+25
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.07406E+11 1.6779E+11 1.832087 0.077992 -36870766733 6.51683E+11 -36870766733 6.51683E+11
X Variable 1 148502519.6 28135207.09 5.278174 1.44E-05 90773843.14 206231196.1 90773843.14 206231196.1
X Variable 2 -57499351.2 10955711.29 -5.24834 1.56E-05 -79978613.95 -35020088.45 -79978613.95 -35020088.45
CORECTAREA ERORILOR:
10
ln(y) ln(x1) ln(x2)
9.386551 7.08249 7.96419
11.95812 9.443914 10.61167
10.82825 7.525904 8.335815
9.893521 6.435188 7.06487
12.17005 8.579065 9.264983
12.63181 7.994241 8.653666
12.72575 10.35996 11.46886
10.04918 6.526817 7.182717
12.37491 7.892276 8.611612
14.71789 10.31079 11.1109
15.05873 10.67591 11.32258
12.17849 8.469 9.282358
11.7308 8.420753 9.191969
9.905855 5.284218 5.811889
14.63243 13.14468 14.0963
13.74537 11.75351 12.47272
12.05227 9.150051 10.52413
12.59152 7.710411 8.470751
12.67214 8.277191 9.053347
14.43068 10.13763 11.01206
10.56242 7.796675 9.154384
10.66286 7.281695 7.962868
11.00123 5.660318 6.368136
9.209405 9.443754 10.1224
12.59933 9.608559 10.34776
9.301012 5.277502 6.079819
8.817227 7.144691 8.175266
8.336453 5.514718 6.434193
13.55524 9.107856 9.742051
14.77826 10.43064 11.0919
11
Mai departe, vom reface regresia pe noile date obtinute:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.831561408
R Square 0.691494374
Adjusted R Square 0.668642106
Standard Error 1.113174651
Observations 30
ANOVA
df SS MS F Significance F
Regression 2 74.99217401 37.496087 30.2593317 1.27365E-07
Residual 27 33.45726069 1.239157803
Total 29 108.4494347
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 6.395669896 1.146670384 5.577601015 6.48302E-06 4.042896611 8.748443182 4.042896611 8.748443182
ln(x1) 2.877009354 1.033301636 2.784288009 0.009681149 0.756849525 4.997169183 0.756849525 4.997169183
ln(x2) -2.034707107 1.009927878 -2.014705358 0.053994146 -4.106907946 0.037493732 -4.106907946 0.037493732
12
8.57E+10 5.660318 6.368136 32.0392 40.55315 1299.291
3.43E+11 9.443754 10.1224 89.18449 102.4631 9138.117
8.8E+10 9.608559 10.34776 92.3244 107.0762 9885.749
1.15E+11 5.277502 6.079819 27.85203 36.9642 1029.528
1.15E+11 7.144691 8.175266 51.04661 66.83498 3411.699
1.19E+11 5.514718 6.434193 30.41212 41.39884 1259.026
5.12E+10 9.107856 9.742051 82.95304 94.90756 7872.87
2.48E+12 10.43064 11.0919 108.7982 123.0302 13385.47
Testam autocorelarea:
13
1.11E+11 54681768850 2.9901E+21 1.23177E+22
-
8.57E+10 25261875153 6.38162E+20 7.34851E+21
3.43E+11 2.57186E+11 6.61445E+22 1.17587E+23
-
8.8E+10 2.54862E+11 6.49545E+22 7.75236E+21
1.15E+11 26953143400 7.26472E+20 1.32251E+22
-
1.15E+11 297756967.5 8.86592E+16 1.31567E+22
1.19E+11 4192118166 1.75739E+19 1.4136E+22
-
5.12E+10 67715399236 4.58538E+21 2.61935E+21
2.48E+12 2.4338E+12 5.92338E+24 6.17513E+24
TOTAL= 2.36564E+12 6.11501E+25
Decizia:
i. d1 = 1.284
ii. d2 = 1.57
Deci: 0 - d1 = -1.284
d1 - d2 = -0.286
d2 - (4 - d2) = -0.86
(4 - d1) – 4 = -1.284\
14
6. Previziunea valorii variabilei Y în ipoteza modificării variabilelor factoriale
𝐲̂i= b0 + b1∙ x1 + b2 ∙ x2
Comentarii:
7. Concluzii:
Modelul de regresie multiplă estimat s-a dovedit a fi unul precis – are un coeficient de
determinare 𝑅2= 0.353280067ce se interpreteaza ca PIB se explică în măsură de aproape 35% de
către variabilele independente incluse în model.
În plus, sunt perfect verificabile ipotezele metodei celor mai mici pătrate (MCMMP) –
erorile sunt homoscedastice, sunt autocorelate, iar variabilele nu sunt coliniare.
BIBLIOGRAFIE:
15