Sunteți pe pagina 1din 15

PROIECT ECONOMETRIE

Profesori coordinatori: Liviu-Stelian Begu și Smaranda Cimpoeru

Proiect realizat de ?, grupa ?, seria ?


FACULTATEA DE RELAȚII ECONOMICE INTERNAȚIONALE, ASE,
BUCUREȘTI
2015
CUPRINS

Înregistrați cel puțin 30 de unități valori specifice ale unor caracteristici (X1, X2, Y) între
care să existe cel puțin o legătură logică. Datele prezentate tabelar fac parte din lucrare. Se cer:

a) Prezentarea problemei;

b) Definirea modelului de regresie;


b.1. Formă, variabile, parametrii;
b.2. Aproximarea grafică a legăturii dintre variabile.

c) Estimarea parametrilor modelului;


c.1. Estimarea punctuală;
c.2. Estimarea prin intervale de încredere

d) Testarea semnificației corelației și a parametrilor modelului de regresie;


d.1. Testarea semnificației corelației;
d.2. testarea estimatorilor â și b̂ ai modelului de regresie liniară.

e) Testarea ipotezelor clasice alemodelului de regresie;


e.1. Ipoteze clasice statistice;
e.2. Testarea liniarității modelului propus;
e.3. Testarea normalității erorilor;
e.4. Testarea ipotezei de homoscedasticitate;
e.5. Testarea ipotezei de autocorelare a erorilor.

f) Previzionarea valorii variabilei Y în ipoteza modificării variabilei factoriale.

1
a) Prezentarea problemelor
Datele culese pe 30 de țări din anul 2014 ilustrează o variabilă independentă notată cu
x1, respectiv IDU (indicele dezvoltarii umane), o variabila independenta x2, respectiv
PIB/locuitor, și o variabilă dependentă notată cu y, respectiv speranta de viata, pentru a arăta
legătura dintre acestea.

Ţara Speranţa de viaţă (%) - y IDU (%) - x1 PIB/loc (%) - x2


Albania 76.5 0.818 8.041
Anglia 79.3 0.947 35.13
Armenia 73.6 0.798 5.693
Austria 79.9 0.955 37.37
Belarus 69 0.826 10.841
Belgia 79.5 0.953 34.935
Bosnia 75.1 0.812 7.764
Bulgaria 73.1 0.84 11.222
Cehia 76.4 0.903 24.144
Cipru 79.6 0.914 24.789
Croatia 76 0.871 16.027
Danemarca 78.2 0.955 36.13
Elvetia 81.7 0.96 40.658
Estonia 72.9 0.883 20.361
Finlanda 79.5 0.959 34.526
Franta 81 0.961 33.674
Germania 79.8 0.947 34.401
Grecia 79.1 0.942 28.517
Irlanda 79.7 0.965 44.613
Islanda 81.7 0.969 35.742
Italia 81.1 0.951 30.353
Letonia 72.3 0.866 16.377
Lituania 71.8 0.87 17.575
Luxemburg 74.4 0.96 79.485
Macedonia 74.1 0.817 9.096
Malta 79.6 0.902 23.08
Muntenegru 74 0.834 11.699
Norvegia 80.5 0.971 53.433
Olanda 79.8 0.964 38.694
Polonia 75.5 0.88 15.987

Sursa: IMF - World Economic Outlook Database 2014

2
b) Definirea modelului de regresie:
b.1. formă, variabile, parametrii;
b.2. aproximarea grafică a legăturii dintre variabile;

b.1. Formă, variabile, parametrii:

𝒚 = 𝒂 + 𝒃𝒙𝒊 + 𝒖𝒊
𝒚 = 𝒃0+𝒃1𝒙1+𝒃2𝒙2

unde,

y = variabila dependentă (speranta de viata);

xi = variabila independentă (IDU; PIB/loc);

a, b = parametrii modelului (la nivel de populație statistică);

ui = variabila reziduală.

b.2. Aproximarea grafică a legăturii dintre variabile:

Modelul de regresie
1.2

1
Speranta de viata (%)

0.8

0.6

0.4

0.2

0
68 70 72 74 76 78 80 82 84
IDU (%)

Speranta de viata (y) cu IDU (x1)

3
Modelul de regresie
90
80
Speranta de viata (%)

70
60
50
40
30
20
10
0
68 70 72 74 76 78 80 82 84
PIB/locuitor (%)

Speranta de viata (y) cu PIB/locuitor (x2)

c) Estimarea parametrilor modelului:


c.1. Estimarea punctuală;
c.2. Estimarea prin intervale de încredere;

c.1. Estimarea punctuală:


Estimările parametrilor â și b̂ ce rezultă din tabelul ANOVA au următoarele valori:

â = 73.13252321

b̂ = −0.111261539
c.2. Estimarea prin intervale de încredere:

â − 𝑡 𝑡𝑎𝑏 ∙ 𝑆𝑎 < 𝑎 < â + 𝑡 𝑡𝑎𝑏 ∙ 𝑆𝑎 => â ϵ [48.90903874; 97.35600768]

b̂ − 𝑡 𝑡𝑎𝑏 ∙ 𝑆𝑏 < 𝑏 < b̂ + 𝑡 𝑡𝑎𝑏 ∙ 𝑆𝑏 => b̂ ϵ [-0.199296186; -0.023226892]

Astfel, putem calcula abaterea medie patratică sau abaterea standard (Standard Error
din ANOVA) a variabilei reziduale û și a estimatorilor â și b̂.

4
 ̂ = 9.730510928
Abaterea medie pătratică a variabilei reziduale (Stb0)S𝐮
 Abaterea medie pătratică a estimatorului (Stb1)S𝐚̂ = 11.80579209
 ̂ = 0.042905419
Abaterea medie pătratică a estimatorului (Stb2)S𝐛
In urma acestor calcule, rezultă că funcția modelului de regresie liniară este:

𝐲̂i= b0 + b1∙ x1 + b2 ∙ x2
Comentarii:
 11.80579209>0 => x1 crește

Dacă x1 crește cu o unitate, Y se modifică cu 11.80579209 unități.

 0.042905419>0 => x2 crește

Dacă x2 crește cu o unitate, Y se modifică cu 0.042905419 unități.

d) Testarea semnificației corelației și a parametrilor modelului de regresie:


d.1. Testarea semnificației corelației;
d.2. Testarea estimatorilor 𝐚̂ și 𝐛̂ ai modelului de regresie liniară.

d.1. Testarea semnificației corelației:

Prin compararea lui Significance F și a pragului de semnificație ∝ = 0.05 rezultă că:


Significance F= 7.51142E-08 > ∝ = 0.05 => modelul nu este de încredere.
Coeficientul de Corelație Multiple R = 0.838646867 ∈ (0,75 - 0,95) => o
legătură puternică.
Coeficientul de Determinare R Square = 0.703328568 ne arată faptul că
variabilele independente x1 (IDU) si x2 (PIB/loc) influențează variabila dependentă y (speranta
de viata) în proporție de 70,33%, restul de 30,77% fiind alți factori.

̂ ai modelului de regresie liniară:


d.2. Testarea estimatorilor 𝐚̂ și 𝐛
Estimatorii modelului de regresie â si b̂ sunt semnificativi diferiți de 0, cu pragul de
semnificație ∝ = 0.05 dacă sunt respectate urmatoarele relații:

5
|𝐚̂| 73.13252321
ta = = = 6.194630795
𝐒𝐚 11.80579209
tα; n-3 = t0.05; 27
tStudent = 2.052

̂ este semnificativ diferit de 0, cu pragul


ta > tStudent => estimatorul 𝒂
semnificație ∝ = 0.05.
̂|
|𝐛 −0.111261539
tb = = = -2.593181542
𝐒𝐛 0.042905419
tα; n-3 = t0.05; 27
tStudent = 2.052

̂ nu este semnificativ diferit de 0, cu pragul


tb < tStudent => estimatorul 𝒃
semnificație ∝ = 0.05.
Se compara P-value pentru â si b̂ cu pragul de semnificatie ∝ = 0.05:
 P-value â = 1.26886E-06 > ∝ = 0.05 rezultă că estimatorul â nu este
semnificativ din punct de vedere statistic;
 P-value b̂ = 0.015171423 < ∝ = 0.05 rezultă că estimatorul b̂ este semnificativ
din punct de vedere statistic.

6
e) Testarea ipotezelor clasice ale modelului de regresie;
e.2. Testarea liniarității modelului propus;
e.3. Testarea normalității erorilor;
e.4. Testarea ipotezei de homoscedasticitate;
e.5. Testarea ipotezei de autocorelare a erorilor.

e.2. Testarea liniarității modelului propus:


Coeficientul de corelație liniară (rx1, x2, y) din ANOVA = 0.849649586.
Calculăm raportul de corelație (Rx1, x2, y) = 0.849649586.
Deoarece rx1, x2, y= Rx1, x2, y = 0.849649586 se poate spune ca legatura dintre variabile este
liniara.
Se verifica semnificația raportului de corelatie Rx1, x2, y. El este semnificativ dacă:
 Fcalculat ≥ Fl,r-1, n-r
𝑅2 0.703328568
Fcalculat = (n-2) * 1−𝑅2 = (30-2) * = 32.00488708 > F0.05, 1, 28 = 9.78424,
1−0.703328568
Raportul de corelație Rx1, x2, y este semnificativ. Pentru ca Rx1, x2, y ≠ 0, ∝ = 0.05, modelul
descrie corect dependența dintre salariul mediu pe economie și PIB-ul pe cap de locuitor.
e.3. Testarea normalității erorilor:
Obs Predicted Y Residuals
1 72.83713258 3.66286742
2 79.25726424 0.042735764
3 71.63572421 1.964275789
4 79.59309857 0.306901427
5 73.11066046 -4.110660456
6 79.71775537 -0.217755375
7 72.42915689 2.670843112
8 74.09212513 -0.992125134
9 77.26175249 -0.861752485
10 77.99444655 1.605553452
11 75.82462166 0.175378343
12 79.73106288 -1.531062882
13 79.59293325 2.107066752
14 76.22000442 -3.320004425
15 80.20205648 -0.702056484
16 80.44311636 0.556883638
17 79.3383739 0.461626102
18 79.62737418 -0.527374179
19 79.51855648 0.181443524
20 80.79808768 0.901912316
21 80.0812907 1.018709298
22 75.4200175 -3.120017503

7
23 75.57925627 -3.779256271
24 75.27298146 -0.87298146
25 72.64661913 1.453380867
26 77.30700224 2.29299776
27 73.60025824 0.399741759
28 78.97602484 1.523975162
29 80.103981 -0.303981004
30 76.48726483 -0.987264828
Tabel residual output din excel

Reprezentarea grafica a reziduurilor (ei) in functie de (predicted Y):

RESIDUALS
5
4
3
2
1
0
70 72 74 76 78 80 82
-1
-2
-3
-4
-5

Grafic preluat din excel


Se calculeaza intervalul [- ttab ∙ Se; ttab ∙ Se]
unde,
Se = Eroarea standard a modelului (preluat din Summary output)
ttab = tα/2; n-3 = t0.25; 27 = 0.684
Se = 1.948109
=> Intervalul este: [-1.33251; 1.332506]
Punctele de pe grafic nu se incadreaza intre cele doua limite ale intervalului (vezi benzile
rosii de pe grafic), deci nu se respecta ipoteza de normalitate a erorilor. Se poate considera ca
erorilor provin dintr-o distributie care nu este normala.

8
e.4. Testarea ipotezei de homoscedasticitate:
Se reprezinta grafic patratele reziduurilor (ei²) = pe axa OY; in functie de valorile variabilei
X (pe axa OX):
ei (Residuals) x1 x2 ei²
3.66286742 0.818 8.041 13.4166
0.042735764 0.947 35.13 0.001826
1.964275789 0.798 5.693 3.858379
0.306901427 0.955 37.37 0.094188
-4.110660456 0.826 10.841 16.89753
-0.217755375 0.953 34.935 0.047417
2.670843112 0.812 7.764 7.133403
-0.992125134 0.84 11.222 0.984312
-0.861752485 0.903 24.144 0.742617
1.605553452 0.914 24.789 2.577802
0.175378343 0.871 16.027 0.030758
-1.531062882 0.955 36.13 2.344154
2.107066752 0.96 40.658 4.43973
-3.320004425 0.883 20.361 11.02243
-0.702056484 0.959 34.526 0.492883
0.556883638 0.961 33.674 0.310119
0.461626102 0.947 34.401 0.213099
-0.527374179 0.942 28.517 0.278124
0.181443524 0.965 44.613 0.032922
0.901912316 0.969 35.742 0.813446
1.018709298 0.951 30.353 1.037769
-3.120017503 0.866 16.377 9.734509
-3.779256271 0.87 17.575 14.28278
-0.87298146 0.96 79.485 0.762097
1.453380867 0.817 9.096 2.112316
2.29299776 0.902 23.08 5.257839
0.399741759 0.834 11.699 0.159793
1.523975162 0.971 53.433 2.3225
-0.303981004 0.964 38.694 0.092404
-0.987264828 0.88 15.987 0.974692
Tabel preluat din Excel

9
x1 - IDU
18
16
14
12
10
8
6
4
2
0
0 0.2 0.4 0.6 0.8 1 1.2

Grafic Excel

x2 - PIB/locuitor
18
16
14
12
10
8
6
4
2
0
0 10 20 30 40 50 60 70 80 90

Grafic Excel
Daca graficul se incadreaza intr-o banda, atunci erorile sunt homoscedastice. Procedura
grafica este insa aproximativa, fiind sugestiva doar pentru esantioanele de volum mare.

10
e.5. Testarea ipotezei de autocorelare a erorilor:
Din Residual Output preluam erorile estimate (residuals).

Obs Predicted Y (Y^) Residuals (ei)


1 72.83713258 3.66286742
2 79.25726424 0.042735764
3 71.63572421 1.964275789
4 79.59309857 0.306901427
5 73.11066046 -4.110660456
6 79.71775537 -0.217755375
7 72.42915689 2.670843112
8 74.09212513 -0.992125134
9 77.26175249 -0.861752485
10 77.99444655 1.605553452
11 75.82462166 0.175378343
12 79.73106288 -1.531062882
13 79.59293325 2.107066752
14 76.22000442 -3.320004425
15 80.20205648 -0.702056484
16 80.44311636 0.556883638
17 79.3383739 0.461626102
18 79.62737418 -0.527374179
19 79.51855648 0.181443524
20 80.79808768 0.901912316
21 80.0812907 1.018709298
22 75.4200175 -3.120017503
23 75.57925627 -3.779256271
24 75.27298146 -0.87298146
25 72.64661913 1.453380867
26 77.30700224 2.29299776
27 73.60025824 0.399741759
28 78.97602484 1.523975162
29 80.103981 -0.303981004
30 76.48726483 -0.987264828

Se aplica statistica Durbin Watson (DW). Testul Durbin-Watson (DW) consta in


calcularea termenului empiric:

ei e(i-1) ei - e(i-1) [ei - e(i-1)]² ei²


3.66286742 13.4166
0.042735764 3.66286742 -3.620131655 13.1053532 0.001826
1.964275789 0.042735764 1.921540025 3.692316067 3.858379
0.306901427 1.964275789 -1.657374362 2.746889777 0.094188
-
4.110660456 0.306901427 -4.417561883 19.51485299 16.89753
-
0.217755375 -4.110660456 3.892905081 15.15470997 0.047417

11
2.670843112 -0.217755375 2.888598487 8.344001221 7.133403
-
0.992125134 2.670843112 -3.662968247 13.41733638 0.984312
-
0.861752485 -0.992125134 0.130372649 0.016997028 0.742617
1.605553452 -0.861752485 2.467305938 6.087598589 2.577802
0.175378343 1.605553452 -1.43017511 2.045400844 0.030758
-
1.531062882 0.175378343 -1.706441224 2.911941652 2.344154
2.107066752 -1.531062882 3.638129634 13.23598723 4.43973
-
3.320004425 2.107066752 -5.427071177 29.45310156 11.02243
-
0.702056484 -3.320004425 2.617947941 6.85365142 0.492883
0.556883638 -0.702056484 1.258940122 1.584930231 0.310119
0.461626102 0.556883638 -0.095257536 0.009073998 0.213099
-
0.527374179 0.461626102 -0.989000281 0.978121557 0.278124
0.181443524 -0.527374179 0.708817703 0.502422537 0.032922
0.901912316 0.181443524 0.720468792 0.51907528 0.813446
1.018709298 0.901912316 0.116796982 0.013641535 1.037769
-
3.120017503 1.018709298 -4.138726801 17.12905953 9.734509
-
3.779256271 -3.120017503 -0.659238769 0.434595754 14.28278
-0.87298146 -3.779256271 2.906274811 8.44643328 0.762097
1.453380867 -0.87298146 2.326362327 5.411961675 2.112316
2.29299776 1.453380867 0.839616893 0.704956527 5.257839
0.399741759 2.29299776 -1.893256001 3.584418285 0.159793
1.523975162 0.399741759 1.124233403 1.263900744 2.3225
-
0.303981004 1.523975162 -1.827956166 3.341423744 0.092404
-
0.987264828 -0.303981004 -0.683283824 0.466876784 0.974692
TOTAL 180.9710294 89.05184

∑30 ̂ 𝑡 − 𝑢̂𝑡−1 )2 ∑30


𝑡=2(𝑢 𝑡=2[𝑒𝑖 − 𝑒(𝑖 − 1)]
2
𝐷𝑊 = =
∑𝑛𝑡=1 𝑢̂𝑡2 ∑𝑛𝑡=2 𝑒𝑖²

180.9710294
𝐷𝑊 =
89.05184

𝐷𝑊 = 2.032198749

12
Decizia:
Se citesc valorile d1, d2 din tabel (alfa = 0,05; n = 30; k = 2):
 d1 = 1.284
 d2 = 1.57

Regiunile de decizie pentru DW sunt urmatoarele:


 0 - d1 – autocorelare pozitiva a erorilor
 d1 - d2 – indecizie
 d2 - (4 - d2) - neautocorelare a erorilor (ipoteza modelului de regresie)
 (4 - d2) - (4 - d1) – indecizie
 (4 - d1) – 4 – autocorelare negativa a erorilor
=>
 0 - d1 = -1.284
 d1 - d2 = -0.286
 d2 - (4 - d2) = -0.86
 (4 - d2) - (4 - d1) = -0.286
 (4 - d1) – 4 = -1.284

DW = 2.032198749 > d1 si d2 si nu se incadreaza in niciunul din intervalele de decizie,


asa incat nu se poate lua nicio decizie cu privire la corelarea erorilor. Se poate trage
concluzia ca erorile nu sunt autocorelate, adica ei nu depinde de ei-1.
f) Previzionarea valorii variabilei Y în ipoteza modificării variabilei factoriale.

𝐲̂i= b0 + b1∙ x1 + b2 ∙ x2

Comentarii:
 10%>0 => x1 crește

Dacă x1 crește cu o unitate, Y se modifică cu 0.10 unități.

 50%>0 => x2 crește

Dacă x2 crește cu o unitate, Y se modifică cu 0.50 unități.

Concluzii

Modelul de regresie multiplă estimat s-a dovedit a fi unul precis – are un coeficient de
determinare mare 𝑅 2 = 0.703328568, adică speranta de viata se explică în măsură de aproape
70% de către variabilele independente incluse în model. În plus, sunt perfect verificabile

13
ipotezele metodei celor mai mici pătrate (MCMMP) – erorile sunt homoscedastice, nu sunt
autocorelate, iar variabilele nu sunt coliniare. Valoarea testului F este suficient de mare pentru
a determina validitatea globală a modelului pentru un prag de semnificaţie de cel puţin
Significance F = 7.51142E-08, cu mult mai mare decât α ales.

14

S-ar putea să vă placă și