Sunteți pe pagina 1din 13

ECONOMETRIE

-PROIECT-

Proiectul realizat constă în analiza relației economice dintre


exporturile și importurile României din perioada 2000 -2009.

1
În tabelul următor avem informaţii privind exporturile și importurile
României în perioada 1999-2008, exprimate în mii Euro :

Export Import

Anul T (mil Euro) (mil Euro)

x y

9,3546

13,261
2

1999 14,964 10,968


9
2000 15,5326
17,193
2001 3 18,4451

2002 18,284 19,927


1
2003 22,2152
21,882
2004 27,3723
8
2005 34,5123
26,401
2006 1 43,2967

2007 31,553 53,9134


2
2008 62,9656
36,574
1

43,220
9

1. Specificarea modelului economic

Se va reprezenta grafic legătura dintre nivelul taxelor şi venit pentru


cele 20 de gospodării prin corelogramă sau diagrama norului de
puncte:

2
Din grafic se poate observa că distribuţia punctelor (xi, yi) poate fi
aproximată cu o dreaptă, deci modelul econometric care descrie legătura
dintre cele două variabile este un model liniar:

y =α0 +α1 x + u

α 0, α 1 – parametrii modelului;

α 1 > 0 (panta dreptei) deoarece legătura dintre cele două variabile


este directă.

2. Estimarea Parametrilor

Pentru estimarea parametrilor modelului de regresie utilizăm


metoda celor mai mici pătrate:

y i = a 0 + a1 xi + u i = 1,10 ecuația de regresie

yˆ i = a 0 + a1 xi ecuația de ajustare

ei = y i − yˆ i erori (valori reziduale)

∑ ( yi − ŷ i ) 2 min ⇔ ∑ ( yi − a 0 − a 1 x i ) 2 min ⇔
i i

3
 n n

 n a0 + a1 ∑ xi = ∑ yi
 i= 1 i= 1
 n n n
a x + a x = x y
 0 ∑i = 1 i 1 ∑i = 1 i ∑i = 1 i i
2

Datele necesare soluționării sistemului:

Export (mil Eur) = Import (mil Eur) =


Anul t x y x*x x*y
1999 9,3546 10,968 87,50854116 102,6012528
2000 13,2612 15,5326 175,8594254 205,9809151
2001 14,9649 18,4451 223,948232 276,029077
2002 17,1933 19,927 295,6095649 342,6108891
2003 18,2841 22,2152 334,3083128 406,1849383
2004 21,8828 27,3723 478,8569358 598,9825664
2005 26,4011 34,5123 697,0180812 911,1626835
2006 31,5532 43,2967 995,6044302 1366,149434
2007 36,5741 53,9134 1337,664791 1971,834083
2008 43,2209 62,9656 1868,046197 2721,429901
total 232,6902 309,1482 6494,42 8902,97

10 a 0 + 232,6902 a1 = 309,1482 a 0 = −5,9163


 ⇔ 
a 0 ⋅ 232,6902 + a1 ⋅ 6494 ,42 = 8902 ,97 a1 = 1,5828

Deci, modelul este:

yˆ i = −5,9163 +1,5828 xi

n ∑y i 10 309 ,1482

a1 =
∑x i ∑x y
i i
=
232 ,6902 8902 ,97
= 1,5828
n ∑x i
10 232 ,6902
∑x i ∑x 2
i
232 ,6902 6494 ,42

a 0 = y − a1 ⋅ x = −5,9163

Aceleași valori ale parametrilor se regasesc si in tabelul rezultat cu


ajutorul programului informatic Excel:

Coefficients
Intercept -5,916305092
X Variable 1 1,582839548

4
Valorile variabilei endogene și valorile reziduale sunt precizate în tabelul
de mai jos:

Observation Predicted Y Residuals


1 8,890525741 2,077474259
2 15,07404672 0,458553282
3 17,77073046 0,674369545
4 21,2979301 -1,370930103
5 23,02449148 -0,809291482
6 28,72065616 -1,348356162
7 35,87240009 -1,36010009
8 44,02734772 -0,730647724
9 51,97462681 1,938773191
10 62,49544471 0,470155285

3. Verificarea ipotezelor metodei celor mai mici pătrate

a. Variabilele observate nu sunt afectate de erori de măsură.

Această ipoteză se poate verifica cu ajutorul următoarelor relaţii:

x − 3s x < x i < x + 3s x

y − 3s y < y i < y + 3s y

unde:

∑ (x )
n
2
i −x
1079,9515
sx = i =1
= = 10,95421
n 10

∑(y )
n
2
i −y
2721,38725
sy = i =1
= = 17,38897
n 10

5
n 10

∑ xi ∑x i
232,6902
x= i =1
= i =1
= = 23,269
n 10 10
10

∑y i
309,1482
y= i =1
= = 30,9148
10 10

23 ,269 − 3 ⋅10 ,954 < xi < 23 ,269 + 3 ⋅10 ,954

− 9,593 < xi < 56 ,131 (adevărat)

30 ,9148 − 3 ⋅17 ,3889 < y i < 30 ,9148 + 3 ⋅17 ,3889

− 21,2519 < y i < 83 ,0195 (adevărat)

Ipoteza poate fi acceptată fără nici un dubiu.

b. Variabila aleatoare (reziduală) u este medie nulă şi dispersia


variabilei reziduale este constantă şi independentă de variabila
factorială (ipoteza de homoscedasticitate).

Ipoteza de homoscedasticitate poate fi verificată cu metoda


grafică (corelograma).

Se reprezintă grafic pe axa OX valorile variabilei factoriale x, iar


pe axa OY se reprezintă valorile variabilei reziduale u.

Va trebui să calculăm valorile variabilei reziduale: u i = y i − ŷ i

Rezultatele sunt prezentate în tabelul de mai jos:

Predicted Y Residuals
8,890525741 2,077474259
15,07404672 0,458553282
17,77073046 0,674369545
21,2979301 -1,370930103
23,02449148 -0,809291482
28,72065616 -1,348356162
35,87240009 -1,36010009
44,02734772 -0,730647724
51,97462681 1,938773191
62,49544471 0,470155285

6
Deoarece graficul punctelor prezintă o evoluţie oscilantă putem
accepta ipoteza că variabila factorială şi cea reziduală sunt independente.

c. Valorile variabilei reziduale nu sunt autocorelate, adică sunt


independente între ele:

Verificarea acestei ipoteze se poate face prin:

- metoda grafică (corelograma);


- testul Durbin-Warson.
Prin metoda grafică se construieşte corelograma trecându-se pe axa
OX valorile variabilei rezultative yi, iar pe axa OY valorile variabilei
reziduale:

Distribuţia erorilor este oscilantă, adică nu avem alternativă


sistematică sub formă de dinţi de fierăstrău, deci putem accepta ipoteza
că erorile sunt independente, adică nu sunt autocorelate.

Testarea ipotezei cu ajutorul testului Durbin-Watson:

7
- se stabileşte ipoteza nulă:

H0: variabila reziduală nu este autocorelată.

- se stabileşte ipoteza alternativă:

H1: variabila reziduală este autocorelată.

- se calculează testul Durbin-Watson:


n

∑ (u − u i −1 )
2
i
i =1 17,1357
d calc = n
= = 1,0916
15,69701
∑u
i =1
2
i

Pentru a efectua calculul lui d vom prezenta rezultatele intermediare


în următorul tabel:

ui u i −1 ( u i − u i−1 ) 2 u i2
2,0774742
59 - - 4,315899297
0,4585532 2,0774742
82 59 2,62090513 0,210271112
0,6743695 0,4585532 0,04657665
45 82 9 0,454774283
-
1,3709301 0,6743695
03 45 4,18325065 1,879449348
- -
0,8092914 1,3709301 0,31543794
82 03 1 0,654952703
- -
1,3483561 0,8092914 0,29059072
62 82 9 1,81806434
- -
1,3601000 1,3483561
9 62 0,00013792 1,849872256
- -
0,7306477 1,3601000 0,39621028
24 9 2 0,533846097
-
1,9387731 0,7306477 7,12580802
91 24 2 3,758841486
0,4701552 1,9387731 2,15683855
85 91 2 0,221045992
17,1357558
9 15,69701691

8
- se compară dcalc cu cele două valori d1 şi d2 din tabelul testului
Durbin-Watson pentru pragul de semnificaţie α = 0,05 pentru numărul
variabilelor exogene k = 1 şi pentru n = 10:

d1 = 0.88 d2 = 1,32

d1 < d calc < d 2

0,88 <1,0916 <1,32 ⇒ erorile sunt independente.

Tot pentru testarea ipotezei privind autocorelarea erorilor poate fi


utilizat şi coeficientul de autocorelaţie de ordinul I:
n

∑u i ⋅ u i −1
r1 = i =1
n
= 0,4542
∑ui =1
2
i

Deoarece r1 este apropiat de 0 putem aprecia că valorile variabilei


reziduale nu sunt autocorelate, adică sunt independente.

d. Valorile variabilei reziduale sunt normal distribuite:

Pentru a testa această ipoteză se foloseşte metoda grafică


(corelograma). Pe axa OX se reprezintă valorile ajustate ŷ i , iar
pe axa OY se reprezintă valorile variabilei reziduale:

Se observă că valorile reziduale ui se înscriu în banda construită, deci


putem accepta ipoteza de normalitate a erorilor pentru un prag de
semnificaţie de α = 0,05.

9
4. Testarea semnificaţiei parametrilor modelului

Testarea semnificaţiei parametrului α 0:

- se stabileşte ipoteza nulă:

H0: α 0 = 0=µa

- se stabileşte ipoteza alternativă:

H1: α 0 ≠ 0

- se calculează testul t:

a0
t=
s a0

∑( y − yˆ i )
2
i
su2 = i

n−2

su2
s 2
=
∑(x )
a0 10
2
i −x
i =1

ta0 se gaseste in tabelul din excel sub forma

t Stat
-
5,4465162
06

- se compară tcalc cu tα /2; n-2 = t0,025; 8 =2,228

Deoarece|tcalc | > tα /2; n-2 ⇒ apreciem că parametrul α 0 este semnificativ


statistic.

Intervalul de încredere pentru parametrul α 0 este:

a 0 − tα / 2; n − 2 ⋅ s a0 ≤ α 0 ≤ a 0 + tα / 2; n − 2 ⋅ s a0

− 5,9163 − 2,228 ⋅1,086 ≤ α0 ≤ −5,9163 + 2,228 ⋅1,086

− 8,42121 ≤ α0 ≤ −3,4113

Testarea semnificaţiei parametrului α 1:

10
- se stabileşte ipoteza nulă: H0: α 1 =0

- se stabileşte ipoteza alternativă: H1: α 1 ≠ 0

a1
t=
s a1

∑x 2
i
s a21 = s u2 ⋅ i

n * ∑ xi − x ( ) 2

∑( y − yˆ i )
2
i
su2 = i

n−2

- se calculează testul t:

t Stat

37,134319
34
- se compară tcalc cu tα /2; n-2 = t0,025; 8 =2,228

Deoarece t calc > t 0, 025 ;8 ⇒ apreciem că parametrul α 1 este semnificativ


statistic.

Intervalul de încredere pentru parametrul α 1 este:

a 1 − t α / 2;n − 2 ⋅ s a1 ≤ α 1 ≤ a 1 + t α / 2;n − 2 ⋅ s a1

1,484546 ≤ α1 ≤ 1,681132

Toate datele se gasesc în ANOVA:

Coefficien Standard Lower Upper


ts Error t Stat P-value 95% 95%
- - - -
Intercep 5,916305 1,086254 5,446516 0,0006 8,421213 3,411396
t 092 932 206 11 455 73
X
Variable 1,582839 0,042624 37,13431 3,03E- 1,484546 1,681132
1 548 709 934 10 793 302

11
Verificarea verosimilității modelului

a. Testarea validităţii modelului de regresie:

- se stabileşte ipoteza nulă: H0: modelul nu este valid.

- se stabileşte ipoteza alternativă: H1: modelul este valid;

- se calculează testul F:

s x2
F= = 1378,958 (ANOVA – Significance F)
su2

- se compară Fcalc cu Fα ; k-1; n-k = F0,05; 1; 8 = 4,414

Fcalc > F0, 05 ;1;8


⇒ se respinge ipoteza nulă şi se acceptă alternativa,
deci modelul este valid.

b. Intensitatea legăturii dintre cele două variabile se apreciază cu ajutorul:

- coeficientului de corelaţie;

- raportului de corelaţie.

Coeficientul de corelaţie:

n ∑ xi y i − ∑ xi ⋅ ∑ y i
ry / x = i i i
= 0,997
   
2
  
2

n ∑ xi −  ∑ xi   n ∑ y i −  ∑ y i  
2 2

 i  i    i  i  

Deoarece ry/x = 0,997 → 1, apreciem că între cele două variabile există o


legătură liniară, directă, foarte puternică.

Testarea semnificaţiei coeficientului de corelaţie pentru colectivitatea


generală:

- se stabileşte ipoteza nulă: H0: ρ = 0 (ρ nu este semnificativ statistic);

- se stabileşte ipoteza alternativă: H 1: ρ ≠ 0 (ρ este semnificativ


statistic);

ρ - coeficientul de corelaţie la nivelul colectivităţii generale

- se calculează testul t:

r n −2 0,997 ⋅ 8
t calc = = = 36 ,717
1 −r 2
1 − 0,997 2

- se compară t calc cu tα;n −2 = t 0 , 05 ; 8 =1,860

12
Deoarece t calc > t 0 , 05 ; 8 ⇒ respingem ipoteza nulă şi acceptăm alternativa,
deci coeficientul de corelaţie este semnificativ statistic.

Raportul de corelaţie R:

∑( y − yˆ i )
2
i
R = 1− i =1
= 0,997
∑(y ) 2
i −y
i =1

Deoarece R = ry/x, apreciem că între cele două variabile există, într-


adevăr, o legătură liniară.

Testarea semnificaţiei raportului de corelaţie:

- se stabileşte ipoteza nulă: H0: R nu este semnificativ statistic;

- se stabileşte ipoteza alternativă: H1: R este semnificativ statistic;

- se calculează testul F:

n − k −1 R 2 8 0,997 2
Fcalc = ⋅ = ⋅ = 1347 ,7966
k 1 − R 2 1 1 − 0,997 2

- se compară Fcalc cu Fα;k −1;n −k = F0 , 05 ;1;8 = 4,414

Deoarece Fcalc > F0 , 05 ; 1; 8 ⇒ se respinge ipoteza nulă şi se acceptă


alternativa, deci raportul de corelaţie este semnificativ statistic.

5. Calculul y2009

Ŷ=-5,9163+1,5828*xi

X2009=110% x2008=47,5429

Y2009= - 5,9163+1,5828*47,5429=69,3347 mil Euro

13