Sunteți pe pagina 1din 20

CURS ECONOMETRIE

Unitatea de învăţare 11
TESTAREA IPOTEZELOR MODELULUI LINIAR DE REGRESIE - I

Cuprins:

1. Ce am învăţat în Unitatea de învăţare 10


2. Obiectivele Unităţii de învăţare 11
3. Enunţarea ipotezelor modelului liniar de regresie
4. I1: Cele două variabile yt şi xt sunt observate fără erori de măsură
5. I2: Ipoteza de homoscedasticitate a erorilor – definiţie, depistare, eliminare
6. I3: Ipoteza de independenţă a erorilor – definiţie, depistare, eliminare
7. Bibliografia Unităţii de învăţare 11
8. Lucrare de verificare 11

1. Ce am învăţat în Unitatea de învăţare 10

Verificarea semnificaţiei modelului econometric multifactorial cu ajutorul metodei


analizei dispersionale sau a variaţiei (ANOVA) şi a testului Fisher-Snedecor (F).
Ipotezele testate:
 H 0 : s y2 / x  su2 => cele două dispersii sunt aproximativ egale, respectiv

influenţa variabilelor exogene X nu este diferită de cea a factorilor


întâmplători, deci modelul nu poate fi validat;
 H 1 : s y2 / x  su2 => influenţa variabilelor exogene X şi a factorilor întâmplători

– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate trece
la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu
modelul real.

Testul statistic F (Fisher):

 yˆ  :   y  yˆ 
2
y
2
s y2 / x
F  i i i

su2 k n  k 1
Regula de decizie:
 Dacă Fcalc≤ Fα,k,n-k-1, atunci se acceptă H0 şi deci modelul nu este semnificativ
statistic;
 Dacă Fcalc> Fα,k,n-k-1, atunci se respinge H0 şi se acceptă H1, deci modelul este
semnificativ statistic (valid).

Coeficientul de determinare
V x2 Vu2
R 2
y/x  2  1 2
V0 V0

0  y  f ( x )  u  x nu este factor (cauza) al fenomenului y;


  y  f ( x )  u  x este factor al variabilei y, dar nu este factor esential;


R y2 / x  0,5
  y  f ( x )  u  x este un factor esential al fenomenului y;


1  y  f ( x )  x este singurul factor de influentaa fenomenului y.

Raportul de corelaţie

V x2 V u2
R y / x  R y2 / x   1
V 02 V 02

0  x şi y sunt independente
  corelatieslabă

Ry / x  0,5
  corelatie puternică

1  corelatiedeterministă - y este corelat strict cu x

Testarea semnificaţiei unui model econometric se poate face tot cu testul „F”, dar,
pornind de la valoarea raportului de corelaţie, R y / x , sau a coeficientului de determinare,

R y2 / x :

s y2 / x V x2 V u2 R2 n  k 1
Fcal   :  
s u2 k n  k 1 1 R 2 k

Astfel:

n  k 1 R 2
- dacă Fcal    F ;v 1  k ;v 2  n  k 1  R y / x  0  se renunţă la
k 1 R 2
modelul econometric obţinut;
n  k 1 R 2
- dacă Fcal    F ;v 1  k ;v 2  n  k 1  R y / x  0  se trece la discuţia
k 1 R 2
econometrică a ecuaţiei analizei variaţiei – V 02 V x2 V u2 .

Raportul de corelaţie ajustat (corectat)

R a  1
n 1
n k
 1 R 2  

Coeficientul de corelaţie parţială în eşantion:


ryx1  ryx2 rx1x2
ryx1 , x2 
(1  ryx2 2 )(1  rx21x2 )

În cazul unui model multifactorial, dacă se cunosc valorile variabilelor factoriale Xj


pentru momentul (n+v), prognoza variabilei endogene se realizează pe baza unui interval de

încredere, deoarece Y este o variabilă aleatoare normală de medie Yˆ n* v şi de abatere medie

pătratică s Yˆ * :
n v

 
P Yˆn* v  t ;v  sYˆ *  y n  v  Yˆn* v  t ;v  sYˆ *  1  
nv nv

unde:
- y n +v = valoarea reală a variabilei y în momentul de prognoză ( n  v );
- Yˆn v  estimaţia punctuală a valorii de prognoză pentru variabila y, care se

calculează cu ajutorul relaţiei:

Yˆ nv  b̂ 0  b̂ 1  x n v ,1  b̂ 2  x n v , 2    b̂ k  x n v , k

Sub formă matriceală, relaţia de mai sus devine:

Yˆ n*v  X v B̂  X v X X
 1 X Y 
unde:
 1 
 
 x n v , 1 
 
Xv   x n v , 2  = vectorul coloană a valorilor de prognoză ale variabilelor x j pentru
  
 
 x n v , k 
 
momentul ( n  v ).
- t;v = variabila aleatoare Student (sau variabila normală z, dacă n>30), preluată din
tabelul distribuţiei respective, în funcţie de pragul de semnificaţie  şi de numărul gradelor
de libertate v = n –k - 1 ;

-s
Yˆ nv
 s2
Yˆ nv

 s u2  1  X v
'
X X 
' 1
X v  reprezintă abaterea de prognoză a
variabilei endogene Y, care exprimă eroarea de previziune.

2. Obiectivele Unităţii de învăţare 11

După studiul acestei unităţi de învăţare vei avea cunoştinţe despre:


1. I2: Cele două variabile yt şi xt sunt observate fără erori de măsură
1. I2: Ipoteza de homoscedasticitate a erorilor – definiţie, depistare, eliminare
2. I3: Ipoteza de independenţă a erorilor – definiţie, depistare, eliminare

3. Enunţarea ipotezelor modelului liniar de regresie

Estimarea parametrilor unui model econometric se fundamentează pe câteva ipoteze


pe care trebuie să le posede acesta. Aceste ipoteze se referă la:
I1 : Cele două variabile yt şi xt sunt observate fără erori de măsură. ut este o
variabilă aleatoare, iar variabila xt este un fenomen cu valori predeterminate => variabila
explicată yt este la rândul ei o variabilă aleatoare;
I2 : Variabila aleatoare ut este de medie nulă, M(ut) = 0, şi de dispersie constantă,

D 2 ( u1 )  D 2 ( u 2 )    D 2 ( u n )   u2 ,  t  1, n . Ipoteza I2 presupune că erorile ut sunt

homoscedastice şi nu heteroscedastice D 2 ( u1 )  D 2 ( u 2 )    D 2 ( u n )   u2 ;

I3 : Valorile variabilei reziduale sunt independente (nu sunt corelate), adică nu


există fenomenul de autocorelare a erorilor:
0, i  j  erorilesunt independente
cov( u i , u j )  
 0, i  j  erorilesunt autocorelate
I4 : Variabila aleatoare ut urmează distribuţia normală, de medie zero şi de abatere

medie pătratică constantă şi egală cu  u   u2  ct , respectiv L(ut) = N(0, σu)

În afara acestor ipoteze care sunt aceleaşi şi în cazul unui model multifactorial, există
o ipoteză specifică modelului multifactorial şi anume:
I5: Variabilele exogene Xj sunt independente între ele, formând un sistem de vectori
liniari independenţi. În caz contrar, apare fenomenul de multicoliniaritate, care implică
imposibilitatea calculării matricei inverse(X’X) –1, precum şi a estimării parametrilor.

Deoarece aceste ipoteze au fost acceptate a priori în etapa de estimare a parametrilor,


în această etapă urmează ca ele să fie testate, iar eventualele abateri de la cerinţele lor să fie
corectate prin utilizarea unor proceduri econometrice adecvate fiecărei abateri.

4. Ipoteza 1: Variabilele x şi y nu sunt afectate de erori de măsură

I1 Variabilele x şi y nu sunt afectate de erori de măsură.


Această ipoteză se poate verifica cu regula celor trei sigma, regulă care constă în
verificarea următoarelor relaţii:
x t  x  3  x   x  3  x  x t  x  3  x

 
y t  y  3 y  y  3 y  y t  y  3 y

unde:

 x t  x 
2
x 
n

 y t  y 
2
y 
n
 
Dacă valorile acestor variabile aparţin intervalelor x t  x  3  x  şi y t  y  3 y ,

ipoteza de mai sus poate fi acceptată fără rezerve.


Această ipoteză, referitoare la calitatea datelor înregistrate, se consideră rezolvată în
etapa de prelucrare a datelor observate statistic sau, cel mai târziu, în etapa de identificare a
modelului.
5. Ipoteza 2: Ipoteza de homoscedasticitate a variabilei reziduale

I2 Ipoteza de homoscedasticitate a variabilei reziduale – Variabila aleatoare


(reziduală) u este de medie nulă M û   0 , iar dispersia ei s û2 este constantă şi independentă
de X.
Pe baza acestei ipoteze se poate admite că legătura dintre Y şi X este relativ stabilă.
Contrariul acestei ipoteze este heteroscedasticitatea.
În cazul modelului liniar yt  a  bxt  ut , reziduurile û t  y t  ŷ t  y t  â  b̂x t
sunt homoscedastice dacă dispersiile lor sunt constante şi egale cu dispersiile teoretice, pentru
orice t şi sunt independente de variabila exogenă x.
su2ˆ  M (uˆ t ) 2   u2 , ()t  1, n

Contrariul homoscedasticităţii este heteroscedasticitatea, care înseamnă că erorile nu


au dispersiile egale ci diferite: M ( u 1 ) 2  M ( u 2 ) 2  ...  M ( u n ) 2   u2 .

Consecinţele fenomenului de heteroscedasticitate a erorilor: dacă dispersiile nu


mai sunt egale, estimatorii rămân nedeplasaţi, dar nu mai sunt eficace, M.C.M.M.P.
conducând la o subestimare a parametrilor modelului, influenţând sensibil şi calitatea
diferitelor teste statistice aplicate acestuia.
Depistarea heteroscedasticităţii se poate realiza prin mai multe procedee:
I2.1) Procedeul grafic - care constă în construirea corelogramei privind valorile
variabilei factoriale x şi ale variabilei reziduale u. Dacă, pe măsura creşterii (scăderii)
valorilor variabilei factoriale x, se observă o creştere (scădere) a valorilor variabilei reziduale
u, înseamnă că cele două variabile sunt corelate şi nu independente.

û û

x x

Figura 1. Corelare pozitivă Figura 2. Corelare negativă


I2.2) Testul White, care, în cazul modelului de regresie uni şi mutifactorial, presupune
parcurgerea următoarelor etape:
- estimarea parametrilor modelului iniţial şi calculul valorilor estimate ale variabilei
reziduale, u;
- construirea unei regresii auxiliare, în cazul modelului unifactorial, bazată pe
presupunerea existenţei unei relaţii de dependenţă între pătratul valorilor erorii, variabila
exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia sau, în cazul modelului
multifactorial, bazată pe presupunerea existenţei unei relaţii de dependenţă între pătratul
valorilor erorii, pe variabilele exogene incluse în model, pe pătratul valorilor acestora la care
se adaugă sau nu produsul dintre variabilele exogene incluse în model, denumit termen
încrucişat:
uˆi2   0  1 xi   2 x 2i  i (11.5.1)

sau, în cazul modelului multifactorial care cuprinde două variabile exogene, x1 şi x2, relaţia
anterioară devine (între paranteze este trecut termenul încrucişat, regresia putându-se efectua
cu sau fără acesta):
uˆi2  0  1x1i  2 x2i  3 x12i  4 x22i  5 x1i x2i   i (11.5.2)
şi calcularea coeficientului de determinare, R2, corespunzător acestei regresii auxiliare;
- verificarea semnificaţiei parametrilor modelului nou construit, iar dacă unul dintre
aceştia este nesemnificativ, atunci ipoteza de heteroscedasticitate a erorilor este acceptată.
Există două variante de aplicare a testului White:
- utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza nulităţii parametrilor,
respectiv: H0:  0  1   2  0 ;
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt nesemnificative
( Fc  F ;v1 ;v2 ), este acceptată, atunci ipoteza de homoscedasticitate se verifică, cazul contrar

semnificând prezenţa heteroscedasticităţii erorilor.


- utilizarea testului LM, calculat ca produs între numărul de observaţii corespunzătoare
modelului, n, şi coeficientul de determinare, R2, corespunzător acestei regresii auxiliare. În
general, testul LM este asimptotic distribuit sub forma unui χ 2 ;v , pentru care numărul gradelor

de libertate este egal cu: v  k , unde k = numărul variabilelor exogene, respectiv:


LM  n  R 2 ~ χ 2 ;v (11.5.3)

Dacă LM  χ 2 ;v , erorile sunt heteroscedastice, în caz contrar, sunt homoscedastice,

respectiv ipoteza nulităţii parametrilor,  0  1   2  0 , este acceptată.


Exemplu
Se consideră modelul de regresie ce descrie legătura, presupusă liniară, între valoarea
investiţiilor realizate (y) şi rata dobânzii (x), înregistrate în perioada 1995-2004.

An 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

Investiţii
15424,9 24998,5 53540,1 67919,9 96630,4 151947,2 241153,6 322836 422535,1 526555,8
(mld. lei)

Rata
dobânzii 36,5 38,1 51,6 38,3 45,4 32,4 26,2 18,4 10,8 11,3
(%)

Verificarea homoscedasticităţii erorilor cu ajutorul testului White


 Etapa 1 : Se estimează parametrii modelului liniar de regresie :

yˆ t  554842,3  11731,01 xt

 Etapa 2 : Se calculează erorile ut  yt  yˆ t iar, pe baza acestora, se estimează modelul :

ut2 = α0+ α1xt+ α2xt2+ωt


şi se obţine:

ut2  9152273479,18 - 565646346,77  xt  11688042,65  xt2 ; R 2  0,2659

 Etapa 3: Se calculează testul LM :

LM  n  R 2  10  0,2659  2,66

LM  2,66   02,05; 2  5,99 se acceptă ipoteza H0 =>erorile sunt homoscedastice.

Se calculează testul Fisher pentru verificarea validităţii modelului nou construit:


Fc =1,27<F0,05;2;7 = 4,74 =>modelul nu este valid=>erorile sunt homoscedastice.

Verificarea homoscedasticităţii erorilor cu ajutorul procedeului grafic presupune


construirea corelogramei privind valorile variabilei factoriale x şi ale variabilei reziduale u.
600000
500000
400000
Residuals

300000
200000
100000
0
-100000 0 10 20 30 40 50 60
-200000
Rata dobanzii

Figura 3

Deoarece graficul punctelor empirice prezintă o distribuţie oscilantă, se poate accepta


ipoteza că cele două variabile, x şi u, sunt independente şi nu corelate.

Eliminarea fenomenului de heteroscedasticitate a erorilor se poate realiza prin


următoarele procedee:

a) Construirea modelului pe baza abaterilor centrate ale variabilelor


Fie yt  a  bxt  ut (11.5.4)

ŷ t  â  b̂x t (11.5.5)
y  a  bx  u (11.5.6)
________________
(11.5.4) – (11.5.6)  y t  y  b ( x t  x )  u t (11.5.7)

y t*  y t  y   y t*  b x t*  u t
Notând cu: 
x t*  x t  x  Yˆt *  bˆ x t*

Estimarea parametrului b presupune minimizarea funcţiei:

 n

F bˆ  min  y t*  Y t *
t 1
2  min tn1y t*  bˆ x t* 2
şi calculul derivatei parţiale a funcţiei:
  
F ' (bˆ)  0  2  y t*  bˆ x t*   x t*  0   u t x t  x   0  covu t , x t   0

b) Metoda regresiei ponderate


Fie modelul iniţial yt  a  bxt  ut

Heteroscedasticitatea presupune M (ut ) 2   u2 , ceea ce înseamnă:

 u2  1 u2
1

 u2  2 u2
2

……………. (11.5.8)
 u2  n u2
n

unde: t este un coeficient de ponderare.


Estimarea parametrilor modelului presupune minimizarea funcţiei:
n
1
min F (aˆ , bˆ)  min  2 ( yt  aˆ  bˆxt ) 2
t 1 u
n
1
Conform relaţiei (11.5.8): min F (aˆ , bˆ)  min  ( yt  aˆ  bˆxt ) 2 (11.5.9)
t 1 t
În relaţia (11.5.9) cantităţile  u2 şi t sunt, în general, necunoscute. S-a constatat însă

că, în practică, abaterile standard,  ut , sunt aproximativ proporţionale cu valorile variabilei

exogene x, adică:
 u   u x1
1

 u   u x2
2

…………… (11.5.10)
 u   u xn
n

Corelând relaţiile (11.5.8) şi (11.5.10), rezultă că relaţia (11.5.9) devine:


n
1 1
min F (aˆ , bˆ)  2 min  2 ( yt  aˆ  bˆxt ) 2
u t xt
2
(11.5.11)
 y  aˆ  bˆxt 
2
n n
 
1
 2 min   t   1 min   yt  aˆ 1  bˆ 
u   2  
t 1  xt  u t 1  xt xt 

Dar relaţia (11.5.11) este echivalentă cu aplicarea M.C.M.M.P. modelului iniţial, după
ce, în prealabil, a fost împărţit la xt:
yt 1 u
yt  a  bxt  u t |: xt   a b t
xt xt xt
2 2
n u  n y 1  (11.5.12)
min F ( â , b̂ )  min   t   min   t  â  b̂ 
t 1  t 
x t 1  t
x x t 

Calculând derivatele parţiale în raport cu â şi b̂ ale funcţiilor (11.5.11) şi (11.5.12) şi


anulându-le se ajunge la acelaşi sistem de ecuaţii pe baza căruia se determină cei doi
estimatori:
 1 ˆ 1 yt
F ' (aˆ )  0  aˆ  x 2  b x   x 2
 t t t
(11.5.13)

F ' (bˆ)  0  aˆ 1 y
  xt
 nbˆ   t
xt

 1 yt 1 yt
  x  x  x  x
2 2
bˆ  t t t t
 1  1 
2

 n 2    

 xt  xt 
 (11.5.14)
 y 1
  x t2  x
aˆ  t
 bˆ t
 1 1
  x2  x2
 t t

În cazul aplicării testului Glejser pentru depistarea heteroscedasticităţii eroilor, care se


bazează pe relaţia dintre erorile estimate în urma aplicării MC.M.M.P. asupra modelului
iniţial şi variabila explicativă presupusă a fi cauza heteroscedasticităţii, acesta pune în
evidenţă în cazul heteroscdasticităţii erorilor, o relaţie de tipul:  u2i  2 xi , caz în care va fi

aplicată regresia ponderată asupra datelor iniţiale, care vor fi împărţite la xi , rezultând

yi a1 ui
astfel un model de forma:   b1 xi  .
xi xi xi

6. Ipoteza 3: Ipoteza de autocorelare a erorilor

I3 Valorile variabilei reziduale u sunt necorelate, respectiv nu există fenomenul de


autocorelare a erorilor.
cov(ut , uk )  M (ut , uk )  0 ()t , k  1, n , t  k

Deoarece aplicaţiile practice au arătat că acest fenomen e frecvent în special în cazul


seriilor cronologice interdependente, verificarea acestuia este necesară, mai ales în cazul
calculelor de prognoză.
Consecinţele fenomenului de autocorelare a erorilor: M.C.M.M.P., în cazul
existenţei fenomenului de autocorelaţie, M (ut , uk )  0 , nu mai permite obţinerea de
estimatori eficienţi, prezentând totodată distorsiuni de la valorile reale. Se păstrează însă
calitatea acestora de a fi consistenţi, fapt ce impune introducerea în calcul a unor serii de date
suficient de lungi (eşantion de valori cât mai mare).

Cauzele autocorelării erorilor: Autocorelarea erorilor se datorează analizei în timp a


legăturii dintre variabile, respectiv a unui efect inerţial în evoluţia variabilelor sau altă cauză
ar constitui o eroare de specificare a modelului, respectiv omiterea unei variabile explicative,
xt, cu influenţă puternică asupra variabilei endogene y.

Depistarea autocorelării erorilor se poate face utilizând următoarele procedee:

1) Procedeul grafic – se realizează corelograma între valorile variabilei endogene


yt şi valorile variabilei reziduale û

2)
ût

yt

Figura 4

Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte mic sau foarte
mare de schimbări ale semnului variabilei aleatoare, fie ca urmare a unor schimbări simetrice
(o oscilaţie regulată a valorilor variabilei reziduale faţă de valorile lui y ).

3) Calculul coeficientului de autocorelaţie de ordinul 1


n n
 û t û t 1  û t û t 1
r1  t  2  t 2 (11.6.1)
n 1 n
2 2
 û t  û t 1
t 1 t 2

Acesta este definit în intervalul  1; 1, având următoarea semnificaţie:


 1, autocorelaţie strict negativă

r( 1)   0, independenţă
 1, autocorelaţie strict pozitivă

4) Testul Durbin-Watson constă în calcularea valorii:

 û t  û t 1 
n 2

d  t 2 n
(11.6.2)
2
 û t
t 1

Această valoare empirică ,„d”, se compară cu două valori teoretice, d1 şi d2, preluate
din tabelul distribuţiei Durbin-Watson în funcţie de un prag de semnificaţie , arbitrar ales,
( = 0,05 sau  = 0,01), de numărul de variabile exogene (k) şi de valorile observate
 n, n  15 .

Regula de decizie a aplicării testului se prezintă în tabelul următor:

0  d  d1 d1  d  d2 d2  d 4-d2 4-d2  d  4-d1 4-d1  d <4


Autocorelare Indecizie Erorile sunt Indecizie Autocorelare
pozitivă independente negativă
← 

Cei doi autori, acceptând ipoteza de normalitate a variabilei reziduale, au demonstrat


că distribuţia variabilei aleatoare d este cuprinsă între două distribuţii limită d1 şi d2, ale căror
mărimi depind de pragul de semnificaţie (), de numărul de variabile exogene (k) şi de
numărul de valori observate (n, n  15).
Dezvoltând relaţia lui d, aceasta devine:

n n n

 uˆt   uˆt 1  2 uˆt uˆt 1


2 2

d t 2 t 2
n
t 2

 uˆ
2
t
t 1
n n n
Pentru un n suficient de mare, cele trei sume,  uˆ t ,  uˆ t21 ,  uˆ t , fiind aproximativ
2 2

t 2 t 2 t 1

egale, relaţia lui d va fi egală cu:

 uˆ uˆ t t 1
d  22 t 2
n 1

 uˆt 1
2
t

 uˆ uˆ t t 1
Se notează cu: r1  t 2
n 1
coeficientul de autocorelaţie de ordinul 1 a reziduurilor
 uˆ
t 1
2
t

ut.


 d  2 1  r 1  r 1  1 
d
2
 (11.6.3)

 d  [0,4]
cu semnificaţia:
 1  autocorelare strict negativă 4
   indecizie 

 

r1   0  independenţă  d  2
   indecizie 
 

 1  autocorelare strict pozitivă 
0

Exemplu – continuare

Verificarea ipotezei de independenţă a erorilor cu ajutorul procedeului grafic


se construieşte corelograma între valorile variabilei endogene y, în cazul nostru Investiţiile,
şi valorile variabilei reziduale u, notate cu Residuals.
80000

Residuals 30000

-55000
-20000 45000 145000 245000 345000 445000

-70000

-120000 Investitii

Figura 5
Deoarece graficul punctelor empirice prezintă o distribuţie oscilantă, se poate accepta
ipoteza de independenţă a erorilor, respectiv erorile nu sunt corelate.

Verificarea ipotezei de independenţă a erorilor cu ajutorul testului Durbin-Watson


 Etapa 1 : Se estimează parametrii modelului liniar de regresie :
ŷt = 554842,3 - 11731,01 xt
 Etapa 2 : Se calculează erorile:
ût = yt- ŷt.
 Etapa 3 : Se calculează valoarea variabilei Durbin -Watson :
n

 uˆ  uˆt 1 
2
t
d t 2
n
 1,85
 uˆ
2
t
t 1

 Etapa 4 : Pentru α = 0,05 (pragul de semnificaţie), k = 1 (nr. variabilelor exogene) şi


n =10≈15 (nr. de observaţii), valorile teoretice ale variabilei Durbin-Watson, preluate din
tabela distribuţiei Durbin-Watson sunt: d1=1,08 şi d2=1,36.

 Etapa 5 : În comparaţie cu acestea, valoarea empirică, d, se situează astfel:


d2=1,36<d =1,85>4-d2 =4-1,36=2,64
Deci, ipoteza de independenţă a erorilor este acceptată.
Eliminarea fenomenului de autocorelare a variabilei reziduale ut – în cazul
depistării sale – se fundamentează pe evitarea cauzelor care îl generează.
O modalitate directă de a evita consecinţele statistice pe care le generează acest
fenomen o constituie utilizarea următoarelor procedee:

a) Aplicarea M.C.M.M.P. generalizate în vederea estimării parametrilor modelului


care, în cazul autocorelării reziduurilor, permite obţinerea de estimatori nedeplasaţi,
consistenţi şi eficienţi. Această metodă este recomandată în situaţia în care numărul
variabilelor cauzale este superior lui unu (modele multifactoriale). Estimatorii modelului se
1
obţin astfel: B̂  ( X ' V X ) 1 ( X ' V 1
Y ) unde V = matricea varianţelor şi covarianţelor
reziduurilor.

b) Un alt procedeu este următorul:


Fie modelul liniar unifactorial: y t  a  bx t  u t .
Se estimează parametrii acestuia, a şi b, cu ajutorul M.C.M.M.P. Se calculează
valorile ajustate ale variabilei endogene - ŷ t  â  b̂x t şi reziduurile -

û t  y t  ŷ t  y t  â  b̂x t (11.6.7) şi se aplică testul “d”. Dacă ipoteza de independenţă a

d
variabilelor reziduale, I3, nu poate fi acceptată ( r1  0 , r1  1  ), aceasta presupune o
2
autocorelare de ordinul întâi a erorilor, respectiv:
uˆt   r(1) uˆt 1  zt (11.6.8)

unde: zt este variabila aleatoare ce verifică ipotezele I2, I3 şi I4.


Ştiind că:
û t 1  y t 1  ŷ t 1  y t 1  â  b̂x t 1 (11.6.9)
Înlocuind relaţiile (11.6.8) şi (11.6.9) în relaţia (11.6.7) se obţine:
y t  aˆ  bˆxt  r(1) ( y t 1  aˆ  bˆxt 1 )  z t

yt  r(1) yt 1  aˆ (1  r(1) )  bˆ( xt  r(1) xt 1 )  zt (11.6.10)

În ecuaţia (11.6.9) variabilele yt şi xt sunt cunoscute, iar valoarea coeficientului de


autocorelaţie se va calcula cu relaţia:
n

u u t t 1
r(1)  t 2
n 1

u t 1
2
t

Se introduc valorile acestuia în relaţia (11.6.10) şi se vor estima parametrii a şi b


prin aplicarea din nou a M.C.M.M.P. Fie ̂ şi ̂ estimaţiile parametrilor a şi b, calculate pe
baza diferenţelor de ordinul întâi ale variabilelor y şi x.
Se ajunge astfel la modelul:
( yt  r(1) yt 1 )   (1  r(1) )   ( xt  r(1) xt 1 ) (11.6.11)

unde: ( yt  r(1) yt 1 ) reprezintă diferenţele teoretice (ajustate) de ordinul întâi ale variabilei

endogene y, calculate pe baza funcţiei de regresie (11.6.10).

c) Procedeul prin baleiaj (Hildreth-Lu)


Dacă există corelaţie se ajunge la relaţia:
y t  r(1) y t 1  aˆ 0 (1  r(1) )  bˆ0 ( xt  r(1) xt 1 )  z t  yt*  a1  b1 xt*  zt

Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în intervalul [0,1] 
autocorelare pozitivă, sau între [-1,0]  autocorelare negativă.
De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1) următoarele valori:
r(1)  0,1  zt2 = 1,75;
r(1)  0,2  zt2 = 2,75;
r(1)  0,3  zt2 = 3,75.
Deci minimul se situează în intervalul [0,2; 0,3].
Se dau apoi valori lui r = 0,21; 0,22;…0,27, oprindu-ne la valoarea pentru care se obţine

min zt2. Pentru această valoare se păstrează estimatorii â şi b̂ obţinuţi în acest caz.

d) Procedeul iterativ al lui D. Cochran şi C. Orcutt


Se consideră modelul yˆ  a  bx . Se estimează parametrii modelului, se aplică
testul D-W, se calculează coeficientul de autocorelaţie de ordinul întâi şi se înlocuieşte
valoarea sa în ecuaţia iniţială, obţinându-se modelul - y *  a1  b1 xt*  z t . În cazul acestui
t

model se verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se continuă
procedeul până când se atinge acest deziderat.
e) Procedeul Durbin
y t  aˆ  bˆxt  r(1) ( y t 1  aˆ  bˆxt 1 )  z t

Se calculează r(1), se introduce în relaţia (11.6.12) şi rezultă estimatorii


parametrilor, aˆ1 , bˆ1 . Această metodă dă rezultate bune numai în cazul existenţei unei
autocorelaţii de ordinul întâi şi este aplicabilă în cazul în se lucrează cu un număr mare de
date.

f) Uneori, eliminarea autocorelaţiei se poate realiza şi prin construirea modelului pe


baza diferenţelor de ordinul întâi ale variabilelor:
yt  yt 1  a  b( xt  xt 1 )  z t  yt*  a  bxt*  z t

g) Pentru eliminarea autocorelaţiei se poate construi un model nou în care se


introduce o variabilă fictivă suplimentară. Această metodă porneşte de la ideea că variabila
reziduală u nu este influenţată numai de factori aleatori, ci există cel puţin un factor sistematic
care provoacă autocorelaţia.

7. Bibliografia Unităţii de învăţare 11

 T. Andrei, S. Stancu, A. I. Iacob, E. Tuşa, Introducere în econometrie utilizând


EViews, Ed. Economica, Bucureşti, 2008,
 T. Andrei, R. Bourbonnais R., Econometrie, Ed. Economica, Bucureşti, 2008
 T. Andrei, Statistică şi econometrie, Ed. Economica, Bucureşti, 2004
 A. I. Iacob, O. E. Tănăsoiu - Modele econometrice, Volumul I, Ed. II rev., Ed. ASE,
Bucureşti, 2005
 A. I. Iacob, O. E. Tănăsoiu – Econometrie. Studii de caz, Ed. ASE, 2005
 W. H. Greene – Econometric Analysis, Macmillan Publishing Company, 1993
 V. Voineagu, E. Ţiţan, R.Şerban, S. Ghiţă, D. Todose, C. Boboc, D. Pele – Teorie şi
practică econometrică, Ed. Meteor Press, 2007
8. Lucrare de verificare 11

I. Se consideră modelul:
yt = a + bxt + ut
În urma prelucrării electronice a calculelor econometrice privind modelul de mai sus s-au
obţinut următoarele rezultate:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0,6809
R Square
Adjusted R Square 0,4223
Standard Error 7,5104
Observations 15

ANOVA
Significance
df SS MS F F
Regression … 633,6594 … … 0,0052
Residual … … 56,4057
Total 14 …

Standard Upper
Coefficients Error t Stat P-value Lower 95% 95%
Intercept -8,5185 … -0,6355 0,5361 -37,4749 …
X Variable 1 0,1812 0,0541 … 0,0052 … 0,2981
Durbin – Watson Statistics = 1,54 ( d1 = 1,08; d2 = 1,36)
F (White Heteroskedasticity Test) =2,03 (Critical F (White Heteroskedasticity Test) = 3,88)
Se cere:
1) Să se verifice semnificaţia parametrilor modelului, să se interpreteze valorile
acestora şi să se determine intervalele de încredere corespunzătoare acestora (Critical t = 2,16);
2) Să se completeze tabelul ANOVA şi să se verifice validitatea modelului de regresie
pentru un prag de semnificaţie de 5% (Critical F = 4,67);
3) Să se verifice ipotezele de independenţă a erorilor şi de homoscedasticitate a
erorilor.
4) Ştiind că în perioada imediat următoare xt+1 = 20 să se estimeze yt+1 pe baza unui
interval de încredere.
II. În urma prelucrării datelor a rezultat următorul model econometric (n = 15):
yˆ t  4,0840  0,9411x1t  0,1124x 2t
4,8906 0,0934 0,0468
R2  0,992; d  1,67; F White heteroskedasticity Test   2,44; su  1,9313.

Critical t =2,179; Critical F =3,88; d1 = 0,95; d2 = 1,54; Critical F (White Heteroskedasticity


Test) =3.48.
Se cere:
1) Să se verifice semnificaţia parametrilor modelului;
2) Să se verifice validitatea modelului de regresie;
3) Să se verifice ipotezele de independenţă a erorilor şi de homoscedasticitate a
erorilor.

III. În urma prelucrării datelor a a rezultat următorul model econometric (n = 15):

yˆ t  15,5970  1,1532x1t
1,1229 0,0355
R 2  0,989; d  1,30; F White heteroskedasticity Test   2,038; su  2,2576.

Critical t =2,16; Critical F =4,67; d1 = 1,08; d2 = 1,36; Critical F (White Heteroskedasticity


Test) = 3,88.
Se cere:
1) Să se verifice semnificaţia parametrilor modelului;
2) Să se verifice validitatea modelului de regresie;
3) Să se verifice ipotezele de independenţă a erorilor şi de homoscedasticitate a
erorilor.

S-ar putea să vă placă și