Sunteți pe pagina 1din 10

AUTOCORELAREA ERORILOR

Până în prezent au fost prezentate probleme legate de estimarea si utilizarea


modelelor de regresie. Insă la utilizarea seriilor de date reale, de cele mai multe
ori una sau mai multe ipoteze nu sunt respectate. De aceia, pentru obţinerea unoe
soluţii optime sunt verificate o serie de ipoteze statistice cum ar fi :

- variabilele reziduale sunt autocorelate. În aceasta situatie, acestea sunt reproduse


prin interrmediul unui proces autoregresiv liniar de ordinul întai sau doi ;
- variabilele reziduale nu au varianţa constantă;
- variabilele exogene nu sunt liniar independente. Două sau mai multe variabile
exogene sunt în dependenţă liniară. În această situaţie, fie parametrii modelului
nu pot fi estimaţi, fie estimatorii au o varianţă mare ;
- valorile variabilelor ce definesc modelul liniar de regresie sunt afectate de erori de
observare..
Toate acestea afecteaza calitatea estimatorilor şi modelul liniar de regresie în
ansamblul său. Metoda celor mai mici patrate nu oferă cele mai bune rezultate în
procesul de estimare a parametrilor, de aceea se recomandă utilizarea altor metode
pentru estimarea parametrilor.

În cadrul regresiei clasice se consideră că variabilele reziduale sunt necorelate. De


exemplu, pentru modelul liniar de regresie y = Xβ+ ε, în general matricea de
covarianţă a variabilelor reziduale defmită prin :
 cov1,1  cov1, 2  ...cov1, n 
Ω(εi, εj) = cov 2,1  cov 2, 2  ..cov 2, n 
cov n,1  cov n, 2  cov n, n  

Daca reziduurile sunt autocorelate, atunci exista indici i ≠j astfel incat :


cov  i ,  j   0

- Dacă variabilele reziduale sunt de medie zero şi de varianţă constantă, atunci


matricea de covarianţă este definita prin intermediul coeficientilor liniari de
corelaţie:
 1 1 ....  n 1 
 
1 ...  n  2 
  2
 i , j    
...
1
... ... ... 
 
 n 2 1 
 n 1 ...
- unde ρk, k=1,n-1, reprezintă coeficientul de autocorelaţie de ordinul k. In
situaţia în care variabilele reziduale sunt homoscedastice, coeficientul de
autocorelaţie de ordinul k se determină prin relaţia :

k 

cov  i ,  i  k 
yk
var  i  var  i  k  y0
k = 1,2…n-1
- În procesul de analiza a autocorelării reziduurilor se pun următoarele probleme:
- identificarea surselor de apariţie a corelării reziduurilor;
- stabilirea consecinţelor pe care le generează corelarea reziduurilor in estimarea
parametrilor;
- investigarea testelor statistice folosite in procesul de analiza a corelării
reziduurilor ;
- alegerea celei mai potrivite metode pentru estimarea parametrilor.

Analiza autocorelării valorilor reziduale este o etapa importantă în analiza unei


serii de timp. Pentru o serie atributivă, analiza reziduului pentru depistarea
autocorelării se recomandă în situaţia în care unităţile sunt ordonate crescător sau
descrescător în raport cu valorile unei caracteristici exogene. Dacă nu se realizează
această operaţie de ordonare a unităţilor populaţiei, valorile reziduale sunt generate
într-o manieră aleatorie.
-2-
Autocorelarea erorilor are in principal următoarele surse:
A. Absent a uneia sau mai multor variabile explicative importante

Una dintre sursele importante ale apariţiei autocorelării erorilor este


neincluderea mai multor variabile explicative importante.
De exemplu, dacă variabila endogenă este explicată prin două variabile exogene,
de regresie este definit prin:

yi  a  bx1i  cx2i   i (1)

Daca în cadrul acestui model este omisă o a treia variabila exogenă, notată prin
variabilele reziduale sunt autocorelate. Într-adevăr, în aceste condiţii reziduul va fi
explicat prin intermediul acestei variabile omise:

(2)  i  a  x3i  ui , unde ui, i =1,....,n, , sunt variabile reziduale ce satisfac ipotezele
modelului clasic de regresie.

B. Modelul de regresie nu este corect specificat

Modelul liniar de regresie nu exprimă corect relaţia de dependenţă dintre variabila


endogenă şi variabilele exogene. Dintre posibilele cauze menţionăm: modelul se
exprima sub forma unei combinaţii liniare de variabile în condiţiile în care o
specificare corectă a modelului trebuie să fie exprimată printr-o combinaţie liniară de
logaritmi de variabile exogene; modelul este corect specificat daca se exprima sub
forma unei combinaţii liniare de diferenţe de ordinul întâi de valori absolute sau
relative; nu toate seriile de date valorice ce corespund variabilelor incluse în model
sunt exprimate în valori nominale etc.

C. Transformări neadecvate şi interpolări de date în cadrul seriei.


3-

Pentru depistarea autocorelării variabilelor reziduale sunt folosite o serie de


procedee statistice. Cel mai simplu mijloc pentru detectarea autocorelării este cel al
reprezentării grafice a seriei valorilor reziduale. Se întocmeşte graficul pentru seria
reziduurilor estimate (i, εi,), unde i=1,n, unde εi = yi- yi^

O regularitate a graficului semnalează o corelare a reziduului. Un asemenea mijloc


de semnalare a autocorelării nu este potrivit în toate cazurile. De aceea, pentru
aprofundarea analizei sunt folosite o serie de teste statistice. Dintre cele mai
importante teste sunt prezentate în cele ce urmează:
- testul Durbin-Watson;
- testul Breusch-Godfrey;
- testele Box- Pierce şi Box-Ljung.

A. Testul Durbin-Watson;
Acesta este testul cel mai utilizat în analiza autocorelării variabilelor reziduale.
Prin acest test se detectează autocorelarea de ordinul întâi a reziduului estimat prin
metoda celor mai mici pătrate. Variabila reziduală satisface ecuaţia unui proces
autoregresiv de ordinul întâi dacă:

εi=ρ εi-1+ui, unde ui este un zgomot alb.


Se testează ipoteza nula H0: ρ = 0, ce corespunde cazului în care reziduurile sunt
necorelate, cu alternativa H1: ρ ≠o, pentru situaţia în care reziduurile verifică un
proces autoregresiv de ordinul întâi.
Statistica testului este evaluată în raport cu seria reziduurilor (ei ), i=1,n , ce este
determinată în situaţia în care parametrii modelului de regresie sunt estimaţi prin
metoda celor mai mici pătrate. Statistica testului este definită prin:
n

 e  e 
2
i i 1
DW  i2
n

e
i 1
2
i
Proprietate. Între statistica testului Durbin-Watson şi estimatorul parametrului
de regresie ρ din modelul de regresie (2) se verifica relaţia de mai jos: DW≡2(l-ρˆ).
Unde ρ se va determina după relaţia :
n


e e i i 1
  i2
m

e
i2
2
i 1

Valoarea statisticii testului pentru un model de regresie este inclusa în intervalul


[0 ,4].O valoare în apropierea lui 2 scoate în evidenţă necorelarea valorilor reziduale.
Valoarea acestei statistici este dificil de interpretat întrucât aceasta depinde nu numai de
seria valorilor reziduale şi de numărul de variabile exogene incluse în modelul de
regresie (p), precum şi de lungimea serie de date (n). De altfel, valoarea medie a
statisticii depinde de cele două elemente:

E DW   2 
2p
n   p  1

Valorile critice ale statisticii depind de numărul de variabile exogene din cadrul
modelului (p), de numarul de observaţii (n) si de pragul de semnificajie ales (α).
Tabelele de valori critice cuprind pentru elementele specificate câte o pereche de
valori dL şi dU. În procesul de testare a ipotezei nule sunt întâlnite următoarele situaţii:
—valoarea statisticii este mai mică decât dL => se respinge ipoteza nulă.
Reziduurile prezintă o autocorelare pozitivă de ordinul întâi;
— valoarea statisticii este mai mare decat 4 - dL => se respinge ipoteza nulă.
Reziduurile prezintă o autocorelare negativă de ordinul întâi;
— dU < DW <4 – dU => se acceptă ipoteza nulă a necoreiarii printr-un proces
autoregresiv de ordinul întâi a valorilor reziduale;
— în situaţia în care dL < DW < dU sau 4 – dU < DW < 4 - dL, testul Durbin-
Watson nu este concludent.
O prezentare sintetică a procesului de testare a autocorelării valorilor reziduale
printr-un proces autoregresiv de ordinul întâi se face în tabelul de mai jos:
Valoarea statisticii Decizia testului
o < DW < dL Se respinge Ho => ρ>0
dL < DW < dU indecizie
dU < DW <4- dU Se acceptă Ho
4- dU < DW <4- dL indecizie
4- dL < DW <4 Se respinge Ho => ρ<0

Testul Durbin-Watson nu poate fi aplicat decât in anumite condiţii. Prezentăm în


cele ce urmează câteva dintre acestea:
1. modelul de regresie trebuie să cuprindă termen liber. Majoritatea tabelelor
statistice cu valorile critice sunt valabile pentru modelele de regresie ce cuprind
termen liber. Farebrother a extins utilizarea statisticii DW şi pentru modelele de
regresie ce nu conţin termen liber, propunând un tabel al valorilor critice pentru
această statistică în această situaţie;
2. matricea X trebuie să fie nestocastică. Modelul de regresie nu trebuie să
includă printre variabilele explicative variabila endogenă cu decalaj. În cazul
în care modelul de regresie cuprinde printre variabilele exogene variabila
endogenă cu decalaj, pentru testarea autocorelării se utilizează testul Breusch-
Godfrey sau următoarele forme derivate ale testului Durbin-Watson.
B. Testul Breusch-Godfrey

Acesta este un test statistic utilizat pentru a verifica dacă reziduul este
reprezentat printr-un model autoregresiv de ordinul r. Acest test se aplică şi în
cazul în care matricea X este stocastică, deci dacă variabila endogenă se
explicitează în raport cu variabile cu decalaj. Prin acest test se verifică dacă
reziduul se reprezintă sub forma:

r
 i    j i  j  u j , unde uj este un zgomot alb.
j 1

Se testează ipoteza nulă:


Ho: ρ1 = ….= ρr =0 <=> reziduul nu este autocorelat,
cu ipoteza alternativă

H1: εi admite o reprezentare autoregresivă de ordinul r.


Sub ipoteza H1, modelul liniar de regresie se reprezintă prin:

r p
yi    j ei  j    j x ji   i
j 1 j 1

Procedura de aplicare a acestui test este următoarea:


- se estimează seria valorilor reziduale et = yi  yˆi , unde parametrii modelului
regresie se estimează prin metoda celor mai mici pătrate;
- folosind seria reziduurilor, se estimează prin metoda celor maoi mici pătrate
parmetrii modelului liniar de regresie
r p
ei    j ei  j    j x ji   i
j 1 j 1

- se testează ipoteza H0, formulată mai înainte, prin utilizarea testului F sau LM
(multiplicatorul Lagrange). În ultimul caz statistica testului este

LM=N*R2 => χ2r


Unde R2 este raportul de determinare calculat pentru modelul de regresie în care
reziduul admite o reprezentare autoregresiva de ordinul r. Pentru un prag de
semnificatie stabilit, daca valoarea statisticii LM este superioară valorii critice a
repartiţiei χ2, se respinge ipoteza nulă.

În situaţia în care reziduul prezintă o autocorelare de un anumit ordin, estimatorii


parametrilor sunt încă nedeplasaţi şi consistenţi, dar nu mai sunt eficienţi. Pentru
corectarea influienţei generate de autocorelarea erorilor sunt folosite o serie de
proceduri. În cele ce urmează sunt prezentate următoarele:

- metoda Cochrane-Orcutt de estimare a parametrilor;


- metoda Durbin;
- metoda Hildreth-Lu;
- metoda generalizata a celor mai mici pătrate;
- metoda verosimilităţii maxime.

Metoda Cochrane-Orcutt

Aceasta este o metoda iterativă de estimare a parametrilor. Procedura Cochrane-


Orcutt constă în parcurgerea următoarelor etape:
Etapa 1. Se estimează parametrii modelului de regresie y = Xβ + ε prin metoda
celor mai mici pătrate. Se obţine seria reziduurilor (ei) i=1, n

Etapa 2. Considerând ca εi, urmează un proces autoregresiv de ordinul întâi definit


prin (2) se estimează parametrul ρ prin metoda celor mai mici pătrate.
Etapa 3. Din relaţia prin care este definit modelul liniar de regresie
 p

 yi   0    j xij   i  se obţine următoarea egalitate:
 
 j 1 

yi  ˆyi 1   0 1  ˆ     j x ji  x ji 1    i  ˆ i 1
p

j 1

Se estimează prin metoda celor mai mici pătrate parametrii modelului liniar de
p
regresie: yi   0    j z ji  vi , unde: yi  yi  ˆyi 1
j 1

 0   0 1  ˆ 

z ji  x ji  ˆx ji 1

vi  N 0, v2 
Se obţin estimatorii ̂ 0 , ˆ1 , ..., ˆ p şi o nouă serie a reziduurilor, calculată prin
 p

 eˆi  yi    0    j xij  , i=1,....,n
 i
 j 1 

Se defineşte modelul autoregresiv de ordinul întâi eˆi  eˆi 1  vi .Se reîncepe cu


etapa doua. Algoritmul se continuă până la epuizarea numărului stabilit de iteraţii sau
până în momentul în care, pentru doua iteraţii succesive, estimaţiile parametrului ρ
diferă cu mai mult de o valoare alesă (se stabileşte de regulă 0,01 sau 0,05).
Metoda Durbin
Se considera modelul liniar de regresie
p
yi   0    j x ji   i ,  i  i 1  vi
j 1
unde   1
v  N 0, 2
 i  v 
Pentru estimarea parametrilor modelului liniar de regresie în cadrul acestei
proceduri se parcurg următoarele etape:
Etapa 1. Se estimeaza ρ.
Prin transformări succesive se obţine modelul liniar de regresie :

yi   0 1     yi 1    j x ji  x ji 1   vi , (3)
p

j 1

Folosind metoda celor mai mici patrate, se estimează parametrii modelului de


regresie [3]. Dintre aceşti estimatori se reţine ̂ .
Etapa 2. Se estimeaza parametrii  0 , 1 , ...,  p .
În cadrul acestei etape se estimează parametrii modelului liniar de regresie

yi  yi 1   0 1     yi 1    j x ji  ˆx ji 1   vi ,


p

j 1

Procedura Hildreth-Lu

Procedura Hildreth-Lu are la bază un algoritm iterativ ce este constituit din


următoarele etape:
Etapa preliminară. Pentru a identifica semnul parametrului ρ se estimează acesta
prin metoda celor mai mici pătrate. În acest sens se utilizează seria reziduurilor
(ei), i=1,n., ce este estimată prin metoda celor mai mici pătrate. În raport cu
semnul parametrului, se fixează valorile acestui parametru ce sunt folosite pentru
estimarea parametrilor modelului. De exemplu, dacă parametrul este pozitiv,
atunci ρ  (0,1; 0,2;...; 0,9; 1).
Etapa iterativă. Folosind succesiv valorile fixate pentru parametrul ρ, se estimează,
prin metoda celor mai mici pătrate, parametrii modelului de regresie

yi  yi 1   0 1       j x ji  x ji 1   vi ,
p

j 1
În cadrul fiecărei etape iterative se determină estimaţiile pentru parametrii
modelului, seria reziduurilor şi suma pătratelor reziduurilor.

Criteriul de alegere a celei mai bune estimaţii: se aleg estimaţiile


parametrilor modelului liniar de regresie pentru etapa în care suma pătratelor
reziduurilor este minimă.

S-ar putea să vă placă și