Sunteți pe pagina 1din 22

UNITATEA DE ÎNVĂȚARE 4

Tema AUTOCORELAŢIA ERORILOR


Obiectivele 1. Natura şi cauzele autocorelaţiei erorilor
2. Detectarea autocorelaţiei
2.1. Exerciţiu - Testul Durbin –Watson
3. Estimatorii metodei celor mai mici pătrate în prezenţa autocorelaţiei
4. Proceduri de estimare a lui 
4.1. Estimarea directă a lui  pornind de la regresia pe modelul iniţial
4.1.1. Exerciţiu - Estimarea parametrilor umui model în prezenţa
autocorelaţiei erorilor
Finalitatea - 1. Detectarea autocorelaţiei erorilor de ordinul 1
Competenţe 2. Aplicarea metodei grafice pentru detectarea autocorelaţiei erorilor
dobândite 3. Estimarea unui model în prezenţa autocorelaţiei erorilor
Mijloace
- citire/învăţare

- întrebări, probleme ce apar, explicaţii

- definiţii, explicaţii ce trebuie reţinute

- situaţii economice concrete, supuse analizei, exemple (sub lupă)

- teme de casă, aplicaţii practice pentru studenţi


Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru 1. Pentru cunoaşterea problemei: 4 ore
necesar 2. Pentru rezolvarea temelor: 4 ore + timpul de documentare

115
AUTOCORELAŢIA ERORILOR

O ipoteză importantă a modelului liniar clasic este aceea a inexistenţei


autocorelaţiei erorilor de ordinul 1 (corelaţie serială). În cazul în care această ipoteză
nu se respectă este util de cunoscut care este natura autocorelaţiei erorilor, care sunt
consecinţele practice ale acesteia şi cum se remediază această problemă.

1. Natura şi cauzele autocorelaţiei erorilor

Prin termenul de autocorelaţie se defineşte corelaţia dintre termenii unei serii


de observări ordonaţi în timp, dacă seria este cronologică, sau ordonaţi în spaţiu dacă
seria este instantanee. În modelul liniar clasic se presupune că nu există o astfel de
autocorelaţie între erorile t, t=1,n. Simbolic, E(t t) = 0 , t  t.
Când autocorelaţia erorilor există atunci: E(t t)  0, t  t. În Figura 4.1, sunt
prezentate diferite forme de tendinţe, ce se pot manifesta în evoluţia erorilor pentru o
serie de timp.
În Figura 4.1, cazul (a) prezintă tendinţă ciclică, (b) şi (c) - tendinţe liniare
crescătoare, respectiv descrescătoare, (d) – tendinţă parabolică, iar (e) nu indică nici
un trend sistematic printre erori, prezentând situaţia când se respectă ipoteza de lipsă
a autocorelaţie a erorilor.
Existenţa autocorelaţiei erorilor semnifică faptul că o eroare apărută la
momentul t depinde de erorile care apar la momente anterioare de timp.
Cauzele care determină autocorelaţia erorilor sunt:
1. inerţia ce se manifestă în majoritatea seriilor economice de timp. Datorită
ciclurilor economice, observările succesive sunt interdependente. În general,
ciclul economic presupune succesiunea unor faze de expansiune cu cele de
recesiune. O expansiune sau o recesiune începută durează, de obicei, mai mulţi
ani. Aceste secvenţe repetate de creştere, sunt urmate de noi creşteri şi
contracţiile sunt urmate de noi contracţii, care definesc inerţia sau persistenţa
ciclurilor economice.
2. eroarea de specificare datorită excluderii unor variabile explicative importante,
conduce la apariţia unui trend în comportamentul erorilor. Influenţa variabilei
excluse este asimilată erorilor, ducând la manifestarea unei tendinţe sistematice
în evoluţia acestora, producând astfel o falsă autocorelaţie;

116
t et t et t et

(a) (b) (c)

t et t et

(d) (e)

Figura 4.1. Forme de evoluţie în timp a erorilor

3. eroarea de specificare datorată alegerii incorecte a funcţiei analitice a


modelului. De exemplu, dacă se alege o funcţie liniară în locul uneia de gradul
doi, atunci termenul care reprezintă pătratul variabilei explicative va fi cuprins în
erori. Efectul sistematic al acestuia face ca erorile să manifeste autocorelaţie din
cauza specificării incorecte a funcţiei analitice;
4. fenomenul pânză de păianjen, care se reflectă, în special, în domeniul ofertei de
produse agricole. Oferta acestor produse reacţionează la preţuri cu un lag
(întârziere) de o perioadă, deoarece deciziile de ofertă durează până se
implementeză (de exemplu: perioada de gestaţie, perioade de creştere a recoltei).
La începutul unui an agricol, recolta este influenţată de preţurile practicate cu un
an în urmă. Astfel funcţia ofertei este: yt = a0 + a1pt-1 + t , unde yt este oferta,
iar pt-1 reprezintă preţurile cu un an în urmă. Dacă în anul t, preţul pt scade faţă de
pt-1, atunci în perioada t+1, agricultorii vor produce mai puţin decât în perioada t.

117
În această situaţie erorile t nu se aşteaptă să fie aleatoare, pentru că, dacă în anul
t a fost supraproducţie, ei tind să-şi diminueze producţia în anul t+1, conducând
astfel la fenomenul numit pânză de păianjen (în limba engleză Cobweb
phemomenon);
5. întârzierile, numite laguri apar deseori în unele modele în care variabilele
dependente observate cu una, două sau mai multe perioade în urmă influenţează
variabila dependentă din perioada curentă. De exemplu, consumul la momentul t-
1 poate influenţa consumul la momentul t, deoarece consumatorii nu-şi schimbă
des comportamentul de consum, din raţiuni psihologice, tehnologice,
instituţionale, etc. Dacă se neglijează termenul întârziat, erorile care apar vor
reflecta sistematic o tendinţă datorită influenţei consumului cu lag asupra
consumului curent. Astfel de modele, când variabila dependentă cu lag devine
variabilă explicativă pentru ea însăşi, se numesc modele autoregresive.
6. modul de prelucrare a datelor poate produce autocorelaţia erorilor în situaţiile
când:
- în regresiile care folosesc serii de date trimestriale sub formă de medii,
care se obţin prin însumarea observărilor pe trei luni şi împărţirea sumei
la 3. Aceste medii netezesc fluctuaţiile lunare şi pot conduce la o tendinţă
sistematică ce se manifestă în erori, introducând autocorelaţie;
- interpolarea sau extrapolarea datelor pot constitui o altă sursă de
manipulare a datelor. Datele obţinute prin interpolare, în interiorul unui
interval de timp, de exemplu, 10 ani, în cazul recensămintelor, care au loc
din 10 în 10 ani, sau datele extrapolate înafara unei perioade de timp
analizate, impun o manifestare sistematică a unei tendinţe în erori, care nu
ar fi existat dacă s-ar fi folosit datele originale.
Problema autocorelaţiei erorilor este cel mai adesea întâlnită la seriile de
timp, dar poate apărea şi la seriile de date instantanee. În seriile instantanee nu poate
exista o ordine cronologică, dar în unele cazuri poate fi stabilită o ordine de
similaritate. Astfel tendinţa de consum poate fi diferită de la o regiune geografică la
alta, deşi este substanţial similară în interiorul unei regiuni date. Reziduurile obţinute
în urma efectuarii unei regresii, pot manifesta o tendinţă sistematică asociată cu
diferenţele regionale. Unii autori numesc aceasta autocorelaţie spaţială, ceea ce
înseamnă corelaţie în spaţiu mai degrabă decât în timp. Este important de ştiut că în

118
analiza seriilor instantanee, ordonarea datelor trebuie să aibă o logică, un interes
economic, care să dea sens existenţei autocorelaţiei erorilor.
Autocorelaţia erorilor este fie pozitivă, fie negativă. Manifestările în timp ale
erorilor, în ambele situaţii sunt prezentate în Figura 4.2. În general, seriile
cronologice manifestă o autocorelaţie pozitivă, pentru că majoritatea lor au, fie o
evoluţie crescătoare, fie descrescătoare pentru o perioadă de timp – prezentată în
cazul (a) şi nu manifestă o mişcare constantă sus – jos, ca cea din cazul (b).
Autocorelaţia este pozitivă, când corelaţia între t şi t-1 este directă (a), şi negativă,
când corelaţia între t şi t-1 este inversă (b).

t t


  
   
    
0    0 
  timp  t-1
  
 

(a)

t t

 
    
 
0  
 
  timp  t-1
  
 

(b)

Figura 4.2. Autocorelaţia erorilor: pozitivă (a) şi negativă (b)

119
În Figurile 4.3 şi 4.4 se prezintă cele două grafice utile pentru a pune în
evidenţă corelaţia pozitivă a reziduurilor. Graficul din Figura 4.3 este de tip Line şi
arată evoluţia în timp a reziduurilor.

Evolutia erorilor
300

250

200

150

100
erorile

50

0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
-50

-100

-150
timpul
-200

Figura 4.3. Evoluţia erorilor în cazul corelaţiei pozitive

Graficul din Figura 4.4. este de tip Scatter şi arată corelaţia de ordinul 1
dintre erorile, respectiv reziduurile, la timpul t şi t-1, care în exemplul prezentat este
de 0.888, arătând o intensitate puternică a cestei autocorelaţii.

Corelaţia serială a erorilor


300
250
200
150
100
et

50
0
-200 -100 -50 0 100 200 300

-100
-150
e t-1
-200

Figura 4.4. Autocorelaţia pozitivă a erorilor, de ordinul 1

120
Figura 4.5 şi Figura 4.6 prezintă aceleaşi tipuri de grafice, pentru corelaţia
negativă. Intensitatea corelaţiei de ordinul 1, prezentată în graficul din Figura 4.6.
este de -0.856.

Corelaţia inversă a erorilor


1.0
0.8
0.6
0.4
0.2
et

0.0
-0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
-0.4
-0.6
-0.8
timpul
-1.0

Figura 4.5. Evoluţia în timp a erorilor, în cazul corelaţiei negative

Corelaţia inversă a erorilor


1.0

0.5
et

0.0
-1.0 -0.5 0.0 0.5 1.0
-0.5

-1.0 e t-1

Figura 4.6. Corelaţia serială a erorilor

În cazul în care nu există autocorelaţia erorilor, graficele evoluţiei în timp a


reziduurilor şi cel al autocorelaţiei de ordinul 1, vor fi asemănătoare celor din Figura
4.7, respectiv 4.8. Coeficientul de corelaţie de ordinul 1 (cu funcţia CORREL) este
0.10, o valoare mică, apropiată de 0, indicând lipsa autocorelaţiei de ordinul 1.
Graficul din Figura 4.7, care arată lipsa autocorelaţiei de ordinul 1, prezintă
succesiuni de reziduuri pozitive şi negative, comparativ cu alternarea strictă a

121
reziduurilor pozitive cu cele negative, la autocorelaţia negativă, în Figura 4.5.
Deosebirea între absenţa autocorelaţiei erorilor faţă de corelaţia lor pozitivă, în
Figura 4.3, constă în lipsa oricărei tendinţe în evoluţia erorilor.

Evoluţia reziduurilor
80
60
40
20
0
-20 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55

-40
-60
-80

Figura 4.7. Evoluţia în timp a reziduurilor, în cazul lipsei autocorelaţiei

Analiza autocorelaţiei reziduurilor de ordinul 1


80
60
40
20
et

0
-80 -60 -40 -20 -20 0 20 40 60 80

-40
-60
-80 et-1

Figura 4.8. Lipsa autocorelaţiei reziduurilor

Graficul din Figura 4.4 prezintă „norul de puncte” în cazul autocorelaţiei


pozitive, orientat, de-a lungul bisectoarei unghiului drept, fiind exact invers orientat
în cazul autocorelaţiei negative, în Figura 4.6. În cazul lipsei autocorelaţiei
reziduurilor, „norul de puncte” este dispersat şi paralel cu axa Ox, în Figura 4.8.

122
Utilizarea celor două grafice: forma de evoluţie a reziduurilor şi corelograma
reziduurilor, constituie una din modalităţile de detectare a prezenţei autocorelaţiei
erorilor.

2. Detectarea autocorelaţiei

Detectarea autocorelaţiei erorilor se face analizând reziduurile, acestea fiind


cunoscute. Metodele de detectare a autocorelaţiei erorilor sunt:
a) - examinarea vizuală a reziduurilor – metoda grafică
- dacă reziduurile sunt fie pozitive, fie negative pe mai multe perioade,
atunci se manifestă o autocorelaţie pozitivă;
- dacă reziduurile alternează (pozitive cu negative), schimbându-şi semnul,
se manifestă o autocorelaţie negativă.
b) - Testul Durbin-Watson (DW)
Acest test permite detectarea autocorelaţiei erorilor de ordinul 1, adică de
forma: ε t  ρε t 1   t , cu t  N(0,2v) , < 1.

Această relaţie este cunoscută sub denumirea de schema Markov de ordinul 1 sau
schema autoregresivă de ordinul 1 - AR(1). Denumirea de model autoregresiv este
corespunzătoare, deoarece se interpretează ca fiind regresia erorilor faţă de ele însăşi,
retardate cu o unitate de timp şi de ordinul 1, deoarece consideră valoarea imediat
trecută, adică de lag maxim 1.
Testul de ipoteze este următorul:
H0:  = 0 - nu există autocorelaţia erorilor;
H1:   0 - există autocorelaţia erorilor ( poate fi  > 0 sau  < 0).
Pentru a testa ipoteza nulă se calculează statistica DW:
n

 e t  et 1 
2

DW  t 2
n
, unde
e
t 1
t
2

et sunt reziduurile rezultate în urma estimării modelului.


Prin construcţia sa, această statistică variază între 0 şi 4. ρ̂ este estimatorul

coeficientului de regresie al variabilei explicative din regresia et  ρ̂ et 1  vt :

123
 et  et 1   et  2et et 1  et21   et  2 et et 1   et21
n n n n n
2

DW  t 2
n
 t 2
n
 t 2 t 2
n
t 2

e e e
2 2 2
t t t
t 1 t 1 t 1

 n n
  n

2  et   et et 1    et et 1 
  t 2 n t 2   21  t  2   21  ˆ 
 2 
n

 
2
et  et 
t 1 t 1 
n

e e t t 1
Coeficientul ρ̂  t 2
n
se mai numeşte coeficient de autocorelaţie de ordinul 1
e
t 1
2
t

sau coeficient de autocorelaţie de lag 1. Ca orice coeficient de corelaţie ρ̂ ia valori


în intervalul -1, +1:
- când ρ̂ = 0, DW = 2 şi atunci nu există autocorelaţia erorilor;
- când ρ̂ = - 1, DW = 4 şi există autocorelaţie negativă a erorilor;

- când ρ̂ = +1, DW = 0 şi există autocorelaţie pozitivă a erorilor.

Durbin şi Watson au tabelat valorile critice ale testului DW, la un prag de


semnificaţie de 5%, în funcţie de volumul eşantionului şi numărul variabilelor
explicative, k. Lectura ascestei tabele permite determinarea a două valori d1 şi d2,
cuprinse între 0 şi 2, care împart spaţiul cuprins între 0 şi 4 astfel:

0 d1 d2 2 4 - d2 4 - d1 4
I I I I I I I
? ?

autocorelaţie lipsă autocorelaţie autocorelaţie


pozitivă negativă
ρ̂ > 0 ρ̂ = 0 ρ̂ < 0

Când d1 < DW < d2 sau 4 – d2 < DW < 4 – d1, se manifestă o îndoială


(nedeterminare) asupra existenţei sau lipsei de autocorelaţie.
Pentru a utiliza această statistică este necesară îndeplinirea simultană a următoarelor
condiţii:
- modelul să aibă termen constant (liber);
- numărul de observări să fie mai mare decât 15;

124
- variabila de explicat să nu figureze printre variabilele explicative (nu în modele
autoregresive);
- pentru seriile de date observate în mod instantaneu, acestea trebuie să fie
ordonate după variabila de explicat.

2.1. Exerciţiu - Testul Durbin -Watson

Pentru modelul cu trei variabile explicative:


yt  a0  a1 x 1t  a2 x 2t  a3 x 3t   t ,
se dispune de datele anuale ale variabilelor, pe o perioadă de 20 de ani, în Tabelul
4.1.

Anii y x1 x2 x3 Anii y x1 x2 x3
1977 90 102 102 112 1987 78 101 72 102
1978 101 104 102 113 1988 80 100 74 101
1979 100 105 102 113 1989 88 100 84 105
1980 101 104 114 107 1990 94 99 105 97
1981 102 105 111 110 1991 106 102 108 101
1982 104 105 109 108 1992 108 103 114 104
1983 106 105 113 111 1993 99 103 95 105
1984 111 105 112 106 1994 107 107 92 107
1985 100 103 104 106 1995 114 108 96 112
1986 92 103 84 107 1996 130 111 110 114
Tabelul 4.1. Evoluţia variabilelor

Pentru a depista o eventuală autocorelaţie a erorilor:


a) să se estimeze parametrii modelului;
b) să se efectueze analiza grafică a reziduurilor;
c) să se calculeze statistica DW şi să se efectueze testul de autocorelaţie a erorilor.

a) Pentru estimarea modelului se obţine tabela de regresie, prezentată în Tabelul


4.2.
Analizând rezultatele din tabela de regresie se ajunge la următorul model:
yt  241.04  3.72x 1  0.39 x 2  0.78 x 3  et , cu raţiile Student:
(-7.57) (8.13) (5.45) (-2.89)

125
SUMMARY OUTPUT Regression Statistics
Multiple R 0.9576
R Square 0.9170
Adjusted R Square 0.9015
Standard Error 3.7045
Observations 20
ANOVA df SS MS F Signif. F
Regression 3 2427.37 809.1233 58.95788 7.21E-09
Residual 16 219.58 13.72375
Total 19 2646.95
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -241.039 31.84 -7.570 1.13E-06 -308.54 -173.54
X Variable 1 3.723 0.458 8.131 4.49E-07 2.75 4.69
X Variable 2 0.391 0.072 5.454 5.31E-05 0.24 0.54
X Variable 3 -0.783 0.271 -2.897 0.010505 -1.35 -0.21
Tabelul 4.2. Tabela de regresie a modelului cu trei variabile explicative

Valoarea teoretică Student pentru un prag de semnificaţie =5% şi 16 grade


de libertate, este 2.12; comparând raţiile Student ale estimatorilor coeficienţilor de
regresie se observă că toţi sunt semnificativ diferiţi de 0. Modelul este global
semnificativ, după cum indică testul Fisher, iar coeficientul de detreminaţie de 0.917
arată că modelul liniar este bine ales. Coeficientul de corelaţie muliplă de 0.957 arată
o intensitate puternică a dependenţei variabilei y de variabilele explicative x1, x2 şi x3.
Graficul evoluţiei variabilei y şi a valorilor ajustate yt prin regresia liniară
este prezentat în Figura 4.9:

Evolutia variabilei y si ajustarea ei


140

130
valorile observate si ajustate

120

110

100

90

80

70

60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
y yt timpul

Figura 4.9. Evoluţia variabilei y şi a valorilor teoretice corespunzătoare

126
b) Analiza grafică a reziduurilor utilizează graficul evoluţiei erorilor din Figura
4.10 şi cel al autocorelaţiei reziduurilor din Figura 4.11.

Evoluţia reziduurilor
8

2
erori

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
-2

-4
timpul
-6

-8

Figura 4.10. Evoluţia reziduurilor

În Figura 4.10, reziduurile se succed ciclic, conducând la presupunerea


existenţei unei autocorelaţii pozitive, deşi graficul din Figura 4.11 sugerează o uşoară
intensitate a autocorelaţiei pozitive, a cărei existenţă este mai evidentă în Figura 4.10.

Autocorelaţia reziduurilor
8

2
et

0
-8 -6 -4 -2 0 2 4 6 8
-2
e t-1
-4

-6

-8

Figura 4.11. Autocorelaţia reziduurilor

127
c) Datele exerciţiului şi modelul specificat îndeplinesc condiţiile pentru
aplicarea testului DW. În Tabelul 4.3 sunt calculate:
 valorile teoretice (ajustate) ŷ t , rotunjite la întreg, pentru a fi similare cu datele
observate,
 reziduurile et, calculate ca diferenţă între valorile observate yt şi cele teoretice ŷ t ,
 diferenţele a două erori consecutive et - et-1,
 pătratele acestor diferenţe şi suma lor, care constituie numărătorul, şi
 calculul valorilor et2 şi suma lor, care reprezintă numitorul.
Pentru n=20 şi k=3, se citesc în tabela lui Durbin-Watson, valorile d1=0.9981; d2
=1.6761.68.

ŷ t et et - et-1 (et - et-1)2 et2


91 -0.88 0.78
98 3.46 4.34 18.81 11.94
101 -1.27 -4.72 22.31 1.61
107 -5.94 -4.67 21.81 35.25
107 -5.14 0.80 0.64 26.39
108 -3.92 1.22 1.48 15.38
107 -1.14 2.79 7.76 1.29
111 0.34 1.47 2.18 0.11
100 -0.09 -0.42 0.18 0.01
91 0.52 0.61 0.37 0.27
83 -5.26 -5.78 33.37 27.63
81 -1.10 4.16 17.28 1.21
82 6.12 7.22 52.15 37.49
93 1.37 -4.76 22.63 1.86
102 4.16 2.79 7.79 17.27
106 2.44 -1.72 2.96 5.93
97 1.65 -0.78 0.62 2.73
110 -2.50 -4.15 17.24 6.26
111 3.13 5.63 31.68 9.78
126 4.05 0.92 0.85 16.39
262.09 218.80
DW= 1.1978
Tabelul 4.3. Calculul statisticii DW

Valoarea calculată DW=1.1978, se situează în zona de incertitudine (?): d1 <


DW < d2, mai aproape de limita inferioară şi se poate mai degrabă accepta o
autocorelaţie pozitivă a reziduurilor, deci o prezumpţie de existenţă a autocorelaţiei
erorilor.

128
0 1 1.19 1.68 2 2.32 3 4
I I I I I I I I
? ?

autocorelaţie lipsă autocorelaţie autocorelaţie


pozitivă negativă

Această concluzie întăreşte pe cea formulată la punctul b), privind graficul


din Figura 4.10, care sugera o intensitate slabă a autocorelaţiei pozitive.
Estimatorii găsiţi sunt nedeplasaţi, dar neeficienţi; nu mai sunt de varianţă
minimă. Se impune utilizarea unei proceduri adecvate de estimare.

3. Estimatorii metodei celor mai mici pătrate în prezenţa


autocorelaţiei

În cazul autocorelaţiei erorilor, elementele de o parte şi de alta a diagonalei


matricei varianţă-covarianţă a erorilor, nu sunt 0, deoarece Cov(t,t-1)0, şi
Ω ε  E(   )   2  I , unde I este matricea unitate. Estimatorii obţinuţi cu metoda
celor mai mici pătrate sunt nedeplasaţi, dar nu mai sunt de varianţă minimă.

Matricea de varianţă-covarianţă a estimatorilor este:  â  E â  a â  a 



 
â  a    X X 1 X  ; â  a    X  X X 1 ,
â  a â  a    X X 1 X  X  X X 1 , de unde
 â   X X  X E  X  X X    X X   X  X  X X 1 .
1 1 1

În cazul respectării ipotezei de independenţă a erorilor, această matrice este


Ω â  σ ε2  X X  , dar în situaţia autocorelării, cum Ω ε  E(   )   2  I , aceasta
1


devine Ω â  X Ω ε X
1
1
.
Metoda pentru obţinerea unor estimatori liniari nedeplasaţi şi de varianţă
minimă se numeşte metoda generalizată a celor mai mici pătrate. Estimatorii
obţinuţi prin această metodă se numesc estimatorii lui Aitken:


â  X Ω ε X
1
 X Ω
1
ε
1
Y 

129
Faptul că în practică, nu se cunoaşte Ω ε , face ca aceste formule să fie
inutilizabile şi să se impună necesitatea utilizării unor proceduri operaţionale de
estimare.

4. Proceduri de estimare a lui 

Aceste proceduri sunt valide numai dacă se consideră că între erori există o
relaţie exprimată sub forma modelului autoregresiv de ordinul 1, adică se cunoaşte
structura autocorelaţiei. ε t  ρε t 1   t , cu t  N(0,2v) , < 1.

Substituind succesiv erorile în acest model, se obţine:


ε t  ρε t 2   t 1    t   2 ε t 2  ε t 1   t 
ε t   t   t 1   2  t 2   3  t 3  ...

Acest proces tinde către 0, deoarece  < 1, iar t îndeplineşte condiţiile modelului
liniar clasic de regresie: E(t)=0 ; E(t2)=2v; E(t ,t )=0, unde tt.

4.1. Estimarea directă a lui  pornind de la regresia pe modelul


iniţial

Etapa 1: se estimează  în două moduri:


n

e e t t 1
- fie, prin regresia directă a lui et în funcţie de et-1: ρ̂  t 2
n

e t 1
2
t

- fie, pornind de la statistica Durbin-Watson: DW  2(1-ρ̂ ) , de unde


DW
ρ̂  1  .
2
Etapa a 2-a: se transformă variabilele şi se efectuaează regresia pe cvasi-diferenţe.

(1) yt  â0  â1 x t  et Dacă este adevărată pentru unitatea de timp t, atunci,
pentru t-1:

(2) yt 1  â0  â1 x t 1  et 1 Se înmulţeşte cu ̂ şi se obţine ecuaţia (3).

(3) 
ˆ yt 1  
ˆ â0  
ˆ â1 x t 1  
ˆ et 1 Se scade ecuaţia (3) din forma (1) şi se obţine

(4):

130
(4) yt  
ˆ yt 1  â0 (1  
ˆ )  â1 ( x t  
ˆ x t 1 )  et  
ˆ et 1 , dar et  
ˆ et 1  vt .

Atunci: yt  
ˆ yt 1  â0 (1  
ˆ )  â1 ( x t  
ˆ x t 1 )  vt , unde vt îndeplineşte ipotezele

pentru a putea utiliza metoda celor mai mici pătrate în estimarea coeficienţilor de
   
regresie pentru modelul transformat: yt  â0  â1 x t  vt , unde
  
yt  yt  
ˆ y t 1 ; x t  x t  
ˆ x t 1 ; â0  â0 (1  
ˆ),

de unde: â0  â0 /(1  
ˆ ) . Parametrii estimaţi sunt a0 şi a1*.

4.1.1. Exerciţiu - Estimarea parametrilor unui model în prezenţa


autocorelaţiei erorilor

Pentru datele din Tabelul 4.1, considerând că există prezumţia de


autocorelaţie pozitivă a erorilor, să se corecteze efectul autocorelaţiei.
Utilizând prima modalitate de obţinere a lui ̂ , prin regresia directă a lui et în
funcţie de et-1, conduce la următoarele rezultate, din Tabelul 4.4:
Coeff. Standard t Stat P- Lower Upper
Error value 95% 95%
Intercept 0.1308 0.7625 0.1715 0.8658 -1.4780 1.7396
X Variable 1 0.3961 0.2332 1.6986 0.1076 -0.0959 0.8881
Tabelul 4.4. Tabela de regresie et=f(et-1)
̂ = 0.396. În etapa a 2-a se fac transformările variabilelor: y, x1, x2, x3, în Tabelul
4.5:
y* x1* x2* x3* 42 60 39 60
65 64 62 69 49 60 45 61
60 64 62 68 56 60 55 65
61 62 74 62 59 59 72 55
62 64 66 68 69 63 66 63
64 63 65 64 66 63 71 64
65 63 70 68 56 62 50 64
69 63 67 62 68 66 54 65
56 61 60 64 72 66 60 70
52 62 43 65 85 68 72 70
Tabelul 4.5. Transformarea variabilelor
Regresia obţinută pe valorile transformate (sunt numai 19 observări
transformate, se pierde primul termen pentru fiecare variabilă) oferă următoarele
informaţii, în Tabelul 4.6:

131
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9001
Adj. R Sq. 0.8801
Std. Error 3.2348
Observations 19
ANOVA df SS MS F Signif. F
Regression 3 1413.828 471.276 45.038 9.7E-08
Residual 15 156.960 10.464
Total 18 1570.788
Coeff. Standard t Stat P-value Lower Upper
Error 95% 95%
Intercept -145.84 22.76 -6.4084 0.00001 -194.34 -97.33
X Variable 1 3.1610 0.571 5.5323 0.00006 1.9431 4.3788
X Variable 2 0.4199 0.079 5.2972 0.00009 0.2509 0.5888
X Variable 3 -0.2563 0.323 -0.7935 0.43985 -0.9446 0.4321
Tabelul 4.6. Tabela de regresie a variabilelor transformate
Se calculează termenul constant: a0 = a0* / (1 - ̂ ) = 145.83/(1 - 0.3961) = -241.48 .
Ceilalţi estimatori sunt: a1* = 3.16; a2* = 0.420; a3* = -0.256.
Modelul determinat este: ŷ t = -241.48 + 3.16x1 + 0.42x2 - 0.25x3.
Se observă că variabila x3 devine nesemnificativă. Valorile teoretice yt1 sunt
calculate în Tabelul 4.8 şi în Figura 4.12. Se repetă regresia pe variabilele
transformate, eliminând variabila x3 şi se obţine tabela de regresie din Tabelul 4.7,
valorile teoretice yt2, în Tabelul 4.8 şi Figura 4.12:

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9465
R Square 0.8959
Adjusted R Square 0.8829
Standard Error 3.1972
Observations 19
ANOVA df SS MS F Signif. F
Regression 2 1407.239 703.620 68.835 1.38E-08
Residual 16 163.549 10.222
Total 18 1570.788
Coeff. Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -141.31 21.7744 -6.49 0.000007 -187.470 -95.150
X Variable 1 2.815 0.3646 7.72 0.000001 2.042 3.588
X Variable 2 0.432 0.0770 5.61 0.000039 0.269 0.595
Tabelul 4.7. Tabela de regresie a variabilelor transformate, după eliminarea variabilei
x3
Se observă că regresia este global semnificativă şi cele două variabile
explicative sunt individual semnificative.

132
Termenul constant: a0 = a0* / (1- ̂ ) = -141.31 / (1-0.396) = -233.99.
Ceilalţi estimatori sunt: a1* = 2.815; a2* = 0.432.
Modelul este: ŷ t = -233.99 + 2.815x1 + 0.432x2.
Anii y yt yt1 yt2
1977 90 91 95 97
1978 101 98 101 103
1979 100 101 104 106
1980 101 107 108 108
1981 102 107 109 109
1982 104 108 109 109
1983 106 107 109 110
1984 111 111 110 110
1985 100 100 101 101
1986 92 91 92 92
1987 78 83 82 81
1988 80 81 80 79
1989 88 82 83 84
1990 94 93 91 90
1991 106 102 100 100
1992 108 106 105 105
1993 99 97 97 97
1994 107 110 108 107
1995 114 111 112 111
1996 130 126 126 126
Tabelul 4.8. Valorile observate şi ajustate prin regresiile efectuate

Graficul valorilor ajustate cu cele două modele determinate după


transformarea variabilelor este prezentat în Figura 4.12.

Evolutia variabilei y si ajustarea ei


140

130
valorile observate si ajustate

120

110

100

90

80

70

60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
y yt1 yt2 timpul

Figura 4.12. Evoluţia variabilei y şi a valorilor teoretice corespunzătoare

133
Pe graficul din Figura 4.12, se observă că cele două modele pe variabilele
transformate sunt foarte apropiate, eliminarea variabilei x3 a avut un impact
nesemnificativ asupra modificării modelului, pe variabilele transformate. Se va reţine
ca fiind cel mai bun, al doilea model, cel stabilit pe baza variabilelor transformate, cu
două variabile explicative x1 şi x2.
Deşi iniţial, modelul cu cele trei variabile explicative, părea a fi foarte bun,
având toate variabilele independente semnificative şi indicatorii calităţii ajustării
foarte buni, totuşi analiza autocorelaţiei erorilor a condus la identificarea şi apoi
eliminarea unei variabile nesemnificative şi obţinerea unui alt model, ai cărui
estimatori sunt nedeplasaţi şi eficienţi în acelaşi timp.
A doua posibilitate de estimare pentru ̂ , este cea pornind de la testul
Durbin-Watson:
- etapa 1: ̂ = (1 - 1.1978/2) = 0.4011, ̂ = 0.4011
- etapa a 2-a: Se realizează transformările variabilelor şi se execută o nouă regresie
pe variabilele astfel transformate. Tabela de regresie este prezentată mai jos şi de
asemenea calculul şi stabilirea estimatorilor modelului. Valoarea lui ̂ obţinută
pornind de la testul Durbin-Watson este foarte apropiată de cea obţinută prin regresia
directă a lui et în funcţie de et-1. De aceea valorile estimatorilor după această regresie
pe variabilele transformate sunt apropiate de cele obţinute prin regresia reziduurilor.
Tabela de regresie pe noile variabile transformate folosind noua valoare ̂ ,
se află în Tabelul 4.9.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9000
Adj. R Sq. 0.8800
Std. Error 3.2273
Observations 19
ANOVA df SS MS F SignificanceF
Regression 3 1405.93 468.6 44.99 9.8E-08
Residual 15 156.23 10.4
Total 18 1562.16
Coefficients Std. Error t Stat P-value Lower 95% Upper 95%
Intercept -144.67 22.59 -6.40 0.00001 -192.8 -96.5
X Variable 1 3.154 0.57 5.52 0.0001 1.94 4.37
X Variable 2 0.420 0.079 5.31 0.0001 0.252 0.5895
X Variable 3 -0.249 0.322 -0.77 0.4506 -0.937 0.437
Tabelul 4.9. Regresia pe variabilele transformate cu noua valoarea ̂

134
Se calculează termenul constant: a0 = a0* / (1- ̂ ) = -241.537.
Estimatorii coeficienţilor de regresie sunt: a1* = 3.15; a2* = 0.42; a3* = -0.25.
Modelul determinat este: ŷ t = -241.54 + 3.15x1 + 0.42x2 - 0.25x3.
Şi în acest caz, variabila x3 devine nesemnificativă. Se reface regresia folosind numai
variabilele explicative semnificative, şi se obţine tabela de regresie din Tabelul 4.10.

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9466
R Square 0.8960
Adjusted R 0.8830
Square
Standard 3.1867
Error
Observations 19
ANOVA df SS MS F Significance F
Regression 2 1399.684 699.842 68.915 1.37E-08
Residual 16 162.482 10.155
Total 18 1562.166
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -140.297 21.598 -6.496 0.000 -186.082 -94.51
X Variable 1 2.817 0.365 7.727 0.000 2.044 3.590
X Variable 2 0.432 0.077 5.624 0.000 0.269 0.595
Tabelul 4.10. Tabela de regresie a modelului cu doua variabile explicative

Se observă în Tabelul 4.10, că variabilele independente sunt semnificative, la


fel şi termenul constant, care devine: a0 = a0* / (1 - ̂ ) = -234.251.
Estimatorii coeficienţilor de regresie sunt: a1* = 2.817; a2* = 0.432.
Noul model este: ŷ t = -234.25 + 2.817x1 + 0.432x2.
Comparând acest model cu cel obţinut prin metoda regresiei reziduurilor:
ŷ t = -233.99 + 2.815x1 + 0.432x2,
se observă că diferenţele sunt foarte mici, estimatorii variabilelor explicative, fiind
aproape identici. Valorile teoretice obţinute cu acest din urmă model, pentru că sunt
rotunjite la numere întregi, sunt identice cu valorile yt2, diferenţele mici dintre
valorile ajustate sunt la nivelul zecimalelor.
Indiferent de procedeul ales pentru estimarea directă a valorii ̂ , rezultatele
sunt aproape identice, fiind la fel de bune.

135
Rezumat
Cand reziduurile sunt corelate între ele apare fenomenul de autocorelaţia
erorilor, ale cărui prezenţă conduce la instabilitatea modelului econometric. În
această situaţie a nerespectării ipotezei de independenţă a reziduurilor, se identifică
natura autocorelaţiei şi se detectează cu ajutorul testului Durbin-Watson, în cazul
autocorelaţiei de ordinul 1. Se aplică o procedură iterativă pentru estimarea
modelului în prezenţa autocorelaţiei erorilor.
Exemplele oferă explicaţii pentru înţelegerea obiectivelor capitolului.

Termeni importanţi
Autocorelaţia erorilor, coeficient de autocorelaţie de ordinul 1, corelaţia
serială a reziduurilor, testul Durbin-Watson, proceduri iterative de estimare a
modelului

Întrebări recapitulative
1. Explicaţi semnificaţia nerespectării ipotezei de independenţă a erorilor.
2. Scrieţi testul Durbin-Watson, intervalul său si interpretarea testului.
3. Care sunt metodele de detectare a autocorelaţiei erorilor ?
4. Care sunt consecinţele autocorelaţiei erorilor?
5. Care sunt mijloacele de remediere a autocorelaţiei erorilor?
6. Care sunt metodele grafice de detectare a autocorelaţiei erorilor?

Teme de casă
• Parcurgeţi exemplele din curs, utilizând calculatorul.
• Aplicaţi metoda grafică pentru detectarea autocorelaţiei reziduurilor pentru
un exemplu numeric din curs.

136

S-ar putea să vă placă și