Documente Academic
Documente Profesional
Documente Cultură
115
AUTOCORELAŢIA ERORILOR
116
t et t et t et
t et t et
(d) (e)
117
În această situaţie erorile t nu se aşteaptă să fie aleatoare, pentru că, dacă în anul
t a fost supraproducţie, ei tind să-şi diminueze producţia în anul t+1, conducând
astfel la fenomenul numit pânză de păianjen (în limba engleză Cobweb
phemomenon);
5. întârzierile, numite laguri apar deseori în unele modele în care variabilele
dependente observate cu una, două sau mai multe perioade în urmă influenţează
variabila dependentă din perioada curentă. De exemplu, consumul la momentul t-
1 poate influenţa consumul la momentul t, deoarece consumatorii nu-şi schimbă
des comportamentul de consum, din raţiuni psihologice, tehnologice,
instituţionale, etc. Dacă se neglijează termenul întârziat, erorile care apar vor
reflecta sistematic o tendinţă datorită influenţei consumului cu lag asupra
consumului curent. Astfel de modele, când variabila dependentă cu lag devine
variabilă explicativă pentru ea însăşi, se numesc modele autoregresive.
6. modul de prelucrare a datelor poate produce autocorelaţia erorilor în situaţiile
când:
- în regresiile care folosesc serii de date trimestriale sub formă de medii,
care se obţin prin însumarea observărilor pe trei luni şi împărţirea sumei
la 3. Aceste medii netezesc fluctuaţiile lunare şi pot conduce la o tendinţă
sistematică ce se manifestă în erori, introducând autocorelaţie;
- interpolarea sau extrapolarea datelor pot constitui o altă sursă de
manipulare a datelor. Datele obţinute prin interpolare, în interiorul unui
interval de timp, de exemplu, 10 ani, în cazul recensămintelor, care au loc
din 10 în 10 ani, sau datele extrapolate înafara unei perioade de timp
analizate, impun o manifestare sistematică a unei tendinţe în erori, care nu
ar fi existat dacă s-ar fi folosit datele originale.
Problema autocorelaţiei erorilor este cel mai adesea întâlnită la seriile de
timp, dar poate apărea şi la seriile de date instantanee. În seriile instantanee nu poate
exista o ordine cronologică, dar în unele cazuri poate fi stabilită o ordine de
similaritate. Astfel tendinţa de consum poate fi diferită de la o regiune geografică la
alta, deşi este substanţial similară în interiorul unei regiuni date. Reziduurile obţinute
în urma efectuarii unei regresii, pot manifesta o tendinţă sistematică asociată cu
diferenţele regionale. Unii autori numesc aceasta autocorelaţie spaţială, ceea ce
înseamnă corelaţie în spaţiu mai degrabă decât în timp. Este important de ştiut că în
118
analiza seriilor instantanee, ordonarea datelor trebuie să aibă o logică, un interes
economic, care să dea sens existenţei autocorelaţiei erorilor.
Autocorelaţia erorilor este fie pozitivă, fie negativă. Manifestările în timp ale
erorilor, în ambele situaţii sunt prezentate în Figura 4.2. În general, seriile
cronologice manifestă o autocorelaţie pozitivă, pentru că majoritatea lor au, fie o
evoluţie crescătoare, fie descrescătoare pentru o perioadă de timp – prezentată în
cazul (a) şi nu manifestă o mişcare constantă sus – jos, ca cea din cazul (b).
Autocorelaţia este pozitivă, când corelaţia între t şi t-1 este directă (a), şi negativă,
când corelaţia între t şi t-1 este inversă (b).
t t
0 0
timp t-1
(a)
t t
0
timp t-1
(b)
119
În Figurile 4.3 şi 4.4 se prezintă cele două grafice utile pentru a pune în
evidenţă corelaţia pozitivă a reziduurilor. Graficul din Figura 4.3 este de tip Line şi
arată evoluţia în timp a reziduurilor.
Evolutia erorilor
300
250
200
150
100
erorile
50
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
-50
-100
-150
timpul
-200
Graficul din Figura 4.4. este de tip Scatter şi arată corelaţia de ordinul 1
dintre erorile, respectiv reziduurile, la timpul t şi t-1, care în exemplul prezentat este
de 0.888, arătând o intensitate puternică a cestei autocorelaţii.
50
0
-200 -100 -50 0 100 200 300
-100
-150
e t-1
-200
120
Figura 4.5 şi Figura 4.6 prezintă aceleaşi tipuri de grafice, pentru corelaţia
negativă. Intensitatea corelaţiei de ordinul 1, prezentată în graficul din Figura 4.6.
este de -0.856.
0.0
-0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
-0.4
-0.6
-0.8
timpul
-1.0
0.5
et
0.0
-1.0 -0.5 0.0 0.5 1.0
-0.5
-1.0 e t-1
121
reziduurilor pozitive cu cele negative, la autocorelaţia negativă, în Figura 4.5.
Deosebirea între absenţa autocorelaţiei erorilor faţă de corelaţia lor pozitivă, în
Figura 4.3, constă în lipsa oricărei tendinţe în evoluţia erorilor.
Evoluţia reziduurilor
80
60
40
20
0
-20 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
-40
-60
-80
0
-80 -60 -40 -20 -20 0 20 40 60 80
-40
-60
-80 et-1
122
Utilizarea celor două grafice: forma de evoluţie a reziduurilor şi corelograma
reziduurilor, constituie una din modalităţile de detectare a prezenţei autocorelaţiei
erorilor.
2. Detectarea autocorelaţiei
Această relaţie este cunoscută sub denumirea de schema Markov de ordinul 1 sau
schema autoregresivă de ordinul 1 - AR(1). Denumirea de model autoregresiv este
corespunzătoare, deoarece se interpretează ca fiind regresia erorilor faţă de ele însăşi,
retardate cu o unitate de timp şi de ordinul 1, deoarece consideră valoarea imediat
trecută, adică de lag maxim 1.
Testul de ipoteze este următorul:
H0: = 0 - nu există autocorelaţia erorilor;
H1: 0 - există autocorelaţia erorilor ( poate fi > 0 sau < 0).
Pentru a testa ipoteza nulă se calculează statistica DW:
n
e t et 1
2
DW t 2
n
, unde
e
t 1
t
2
123
et et 1 et 2et et 1 et21 et 2 et et 1 et21
n n n n n
2
DW t 2
n
t 2
n
t 2 t 2
n
t 2
e e e
2 2 2
t t t
t 1 t 1 t 1
n n
n
2 et et et 1 et et 1
t 2 n t 2 21 t 2 21 ˆ
2
n
2
et et
t 1 t 1
n
e e t t 1
Coeficientul ρ̂ t 2
n
se mai numeşte coeficient de autocorelaţie de ordinul 1
e
t 1
2
t
0 d1 d2 2 4 - d2 4 - d1 4
I I I I I I I
? ?
124
- variabila de explicat să nu figureze printre variabilele explicative (nu în modele
autoregresive);
- pentru seriile de date observate în mod instantaneu, acestea trebuie să fie
ordonate după variabila de explicat.
Anii y x1 x2 x3 Anii y x1 x2 x3
1977 90 102 102 112 1987 78 101 72 102
1978 101 104 102 113 1988 80 100 74 101
1979 100 105 102 113 1989 88 100 84 105
1980 101 104 114 107 1990 94 99 105 97
1981 102 105 111 110 1991 106 102 108 101
1982 104 105 109 108 1992 108 103 114 104
1983 106 105 113 111 1993 99 103 95 105
1984 111 105 112 106 1994 107 107 92 107
1985 100 103 104 106 1995 114 108 96 112
1986 92 103 84 107 1996 130 111 110 114
Tabelul 4.1. Evoluţia variabilelor
125
SUMMARY OUTPUT Regression Statistics
Multiple R 0.9576
R Square 0.9170
Adjusted R Square 0.9015
Standard Error 3.7045
Observations 20
ANOVA df SS MS F Signif. F
Regression 3 2427.37 809.1233 58.95788 7.21E-09
Residual 16 219.58 13.72375
Total 19 2646.95
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -241.039 31.84 -7.570 1.13E-06 -308.54 -173.54
X Variable 1 3.723 0.458 8.131 4.49E-07 2.75 4.69
X Variable 2 0.391 0.072 5.454 5.31E-05 0.24 0.54
X Variable 3 -0.783 0.271 -2.897 0.010505 -1.35 -0.21
Tabelul 4.2. Tabela de regresie a modelului cu trei variabile explicative
130
valorile observate si ajustate
120
110
100
90
80
70
60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
y yt timpul
126
b) Analiza grafică a reziduurilor utilizează graficul evoluţiei erorilor din Figura
4.10 şi cel al autocorelaţiei reziduurilor din Figura 4.11.
Evoluţia reziduurilor
8
2
erori
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
-2
-4
timpul
-6
-8
Autocorelaţia reziduurilor
8
2
et
0
-8 -6 -4 -2 0 2 4 6 8
-2
e t-1
-4
-6
-8
127
c) Datele exerciţiului şi modelul specificat îndeplinesc condiţiile pentru
aplicarea testului DW. În Tabelul 4.3 sunt calculate:
valorile teoretice (ajustate) ŷ t , rotunjite la întreg, pentru a fi similare cu datele
observate,
reziduurile et, calculate ca diferenţă între valorile observate yt şi cele teoretice ŷ t ,
diferenţele a două erori consecutive et - et-1,
pătratele acestor diferenţe şi suma lor, care constituie numărătorul, şi
calculul valorilor et2 şi suma lor, care reprezintă numitorul.
Pentru n=20 şi k=3, se citesc în tabela lui Durbin-Watson, valorile d1=0.9981; d2
=1.6761.68.
128
0 1 1.19 1.68 2 2.32 3 4
I I I I I I I I
? ?
devine Ω â X Ω ε X
1
1
.
Metoda pentru obţinerea unor estimatori liniari nedeplasaţi şi de varianţă
minimă se numeşte metoda generalizată a celor mai mici pătrate. Estimatorii
obţinuţi prin această metodă se numesc estimatorii lui Aitken:
â X Ω ε X
1
X Ω
1
ε
1
Y
129
Faptul că în practică, nu se cunoaşte Ω ε , face ca aceste formule să fie
inutilizabile şi să se impună necesitatea utilizării unor proceduri operaţionale de
estimare.
Aceste proceduri sunt valide numai dacă se consideră că între erori există o
relaţie exprimată sub forma modelului autoregresiv de ordinul 1, adică se cunoaşte
structura autocorelaţiei. ε t ρε t 1 t , cu t N(0,2v) , < 1.
Acest proces tinde către 0, deoarece < 1, iar t îndeplineşte condiţiile modelului
liniar clasic de regresie: E(t)=0 ; E(t2)=2v; E(t ,t )=0, unde tt.
e e t t 1
- fie, prin regresia directă a lui et în funcţie de et-1: ρ̂ t 2
n
e t 1
2
t
(1) yt â0 â1 x t et Dacă este adevărată pentru unitatea de timp t, atunci,
pentru t-1:
(3)
ˆ yt 1
ˆ â0
ˆ â1 x t 1
ˆ et 1 Se scade ecuaţia (3) din forma (1) şi se obţine
(4):
130
(4) yt
ˆ yt 1 â0 (1
ˆ ) â1 ( x t
ˆ x t 1 ) et
ˆ et 1 , dar et
ˆ et 1 vt .
Atunci: yt
ˆ yt 1 â0 (1
ˆ ) â1 ( x t
ˆ x t 1 ) vt , unde vt îndeplineşte ipotezele
pentru a putea utiliza metoda celor mai mici pătrate în estimarea coeficienţilor de
regresie pentru modelul transformat: yt â0 â1 x t vt , unde
yt yt
ˆ y t 1 ; x t x t
ˆ x t 1 ; â0 â0 (1
ˆ),
de unde: â0 â0 /(1
ˆ ) . Parametrii estimaţi sunt a0 şi a1*.
131
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9001
Adj. R Sq. 0.8801
Std. Error 3.2348
Observations 19
ANOVA df SS MS F Signif. F
Regression 3 1413.828 471.276 45.038 9.7E-08
Residual 15 156.960 10.464
Total 18 1570.788
Coeff. Standard t Stat P-value Lower Upper
Error 95% 95%
Intercept -145.84 22.76 -6.4084 0.00001 -194.34 -97.33
X Variable 1 3.1610 0.571 5.5323 0.00006 1.9431 4.3788
X Variable 2 0.4199 0.079 5.2972 0.00009 0.2509 0.5888
X Variable 3 -0.2563 0.323 -0.7935 0.43985 -0.9446 0.4321
Tabelul 4.6. Tabela de regresie a variabilelor transformate
Se calculează termenul constant: a0 = a0* / (1 - ̂ ) = 145.83/(1 - 0.3961) = -241.48 .
Ceilalţi estimatori sunt: a1* = 3.16; a2* = 0.420; a3* = -0.256.
Modelul determinat este: ŷ t = -241.48 + 3.16x1 + 0.42x2 - 0.25x3.
Se observă că variabila x3 devine nesemnificativă. Valorile teoretice yt1 sunt
calculate în Tabelul 4.8 şi în Figura 4.12. Se repetă regresia pe variabilele
transformate, eliminând variabila x3 şi se obţine tabela de regresie din Tabelul 4.7,
valorile teoretice yt2, în Tabelul 4.8 şi Figura 4.12:
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9465
R Square 0.8959
Adjusted R Square 0.8829
Standard Error 3.1972
Observations 19
ANOVA df SS MS F Signif. F
Regression 2 1407.239 703.620 68.835 1.38E-08
Residual 16 163.549 10.222
Total 18 1570.788
Coeff. Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -141.31 21.7744 -6.49 0.000007 -187.470 -95.150
X Variable 1 2.815 0.3646 7.72 0.000001 2.042 3.588
X Variable 2 0.432 0.0770 5.61 0.000039 0.269 0.595
Tabelul 4.7. Tabela de regresie a variabilelor transformate, după eliminarea variabilei
x3
Se observă că regresia este global semnificativă şi cele două variabile
explicative sunt individual semnificative.
132
Termenul constant: a0 = a0* / (1- ̂ ) = -141.31 / (1-0.396) = -233.99.
Ceilalţi estimatori sunt: a1* = 2.815; a2* = 0.432.
Modelul este: ŷ t = -233.99 + 2.815x1 + 0.432x2.
Anii y yt yt1 yt2
1977 90 91 95 97
1978 101 98 101 103
1979 100 101 104 106
1980 101 107 108 108
1981 102 107 109 109
1982 104 108 109 109
1983 106 107 109 110
1984 111 111 110 110
1985 100 100 101 101
1986 92 91 92 92
1987 78 83 82 81
1988 80 81 80 79
1989 88 82 83 84
1990 94 93 91 90
1991 106 102 100 100
1992 108 106 105 105
1993 99 97 97 97
1994 107 110 108 107
1995 114 111 112 111
1996 130 126 126 126
Tabelul 4.8. Valorile observate şi ajustate prin regresiile efectuate
130
valorile observate si ajustate
120
110
100
90
80
70
60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
y yt1 yt2 timpul
133
Pe graficul din Figura 4.12, se observă că cele două modele pe variabilele
transformate sunt foarte apropiate, eliminarea variabilei x3 a avut un impact
nesemnificativ asupra modificării modelului, pe variabilele transformate. Se va reţine
ca fiind cel mai bun, al doilea model, cel stabilit pe baza variabilelor transformate, cu
două variabile explicative x1 şi x2.
Deşi iniţial, modelul cu cele trei variabile explicative, părea a fi foarte bun,
având toate variabilele independente semnificative şi indicatorii calităţii ajustării
foarte buni, totuşi analiza autocorelaţiei erorilor a condus la identificarea şi apoi
eliminarea unei variabile nesemnificative şi obţinerea unui alt model, ai cărui
estimatori sunt nedeplasaţi şi eficienţi în acelaşi timp.
A doua posibilitate de estimare pentru ̂ , este cea pornind de la testul
Durbin-Watson:
- etapa 1: ̂ = (1 - 1.1978/2) = 0.4011, ̂ = 0.4011
- etapa a 2-a: Se realizează transformările variabilelor şi se execută o nouă regresie
pe variabilele astfel transformate. Tabela de regresie este prezentată mai jos şi de
asemenea calculul şi stabilirea estimatorilor modelului. Valoarea lui ̂ obţinută
pornind de la testul Durbin-Watson este foarte apropiată de cea obţinută prin regresia
directă a lui et în funcţie de et-1. De aceea valorile estimatorilor după această regresie
pe variabilele transformate sunt apropiate de cele obţinute prin regresia reziduurilor.
Tabela de regresie pe noile variabile transformate folosind noua valoare ̂ ,
se află în Tabelul 4.9.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9487
R Square 0.9000
Adj. R Sq. 0.8800
Std. Error 3.2273
Observations 19
ANOVA df SS MS F SignificanceF
Regression 3 1405.93 468.6 44.99 9.8E-08
Residual 15 156.23 10.4
Total 18 1562.16
Coefficients Std. Error t Stat P-value Lower 95% Upper 95%
Intercept -144.67 22.59 -6.40 0.00001 -192.8 -96.5
X Variable 1 3.154 0.57 5.52 0.0001 1.94 4.37
X Variable 2 0.420 0.079 5.31 0.0001 0.252 0.5895
X Variable 3 -0.249 0.322 -0.77 0.4506 -0.937 0.437
Tabelul 4.9. Regresia pe variabilele transformate cu noua valoarea ̂
134
Se calculează termenul constant: a0 = a0* / (1- ̂ ) = -241.537.
Estimatorii coeficienţilor de regresie sunt: a1* = 3.15; a2* = 0.42; a3* = -0.25.
Modelul determinat este: ŷ t = -241.54 + 3.15x1 + 0.42x2 - 0.25x3.
Şi în acest caz, variabila x3 devine nesemnificativă. Se reface regresia folosind numai
variabilele explicative semnificative, şi se obţine tabela de regresie din Tabelul 4.10.
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9466
R Square 0.8960
Adjusted R 0.8830
Square
Standard 3.1867
Error
Observations 19
ANOVA df SS MS F Significance F
Regression 2 1399.684 699.842 68.915 1.37E-08
Residual 16 162.482 10.155
Total 18 1562.166
Coefficients Std.Error t Stat P-value Lower 95% Upper 95%
Intercept -140.297 21.598 -6.496 0.000 -186.082 -94.51
X Variable 1 2.817 0.365 7.727 0.000 2.044 3.590
X Variable 2 0.432 0.077 5.624 0.000 0.269 0.595
Tabelul 4.10. Tabela de regresie a modelului cu doua variabile explicative
135
Rezumat
Cand reziduurile sunt corelate între ele apare fenomenul de autocorelaţia
erorilor, ale cărui prezenţă conduce la instabilitatea modelului econometric. În
această situaţie a nerespectării ipotezei de independenţă a reziduurilor, se identifică
natura autocorelaţiei şi se detectează cu ajutorul testului Durbin-Watson, în cazul
autocorelaţiei de ordinul 1. Se aplică o procedură iterativă pentru estimarea
modelului în prezenţa autocorelaţiei erorilor.
Exemplele oferă explicaţii pentru înţelegerea obiectivelor capitolului.
Termeni importanţi
Autocorelaţia erorilor, coeficient de autocorelaţie de ordinul 1, corelaţia
serială a reziduurilor, testul Durbin-Watson, proceduri iterative de estimare a
modelului
Întrebări recapitulative
1. Explicaţi semnificaţia nerespectării ipotezei de independenţă a erorilor.
2. Scrieţi testul Durbin-Watson, intervalul său si interpretarea testului.
3. Care sunt metodele de detectare a autocorelaţiei erorilor ?
4. Care sunt consecinţele autocorelaţiei erorilor?
5. Care sunt mijloacele de remediere a autocorelaţiei erorilor?
6. Care sunt metodele grafice de detectare a autocorelaţiei erorilor?
Teme de casă
• Parcurgeţi exemplele din curs, utilizând calculatorul.
• Aplicaţi metoda grafică pentru detectarea autocorelaţiei reziduurilor pentru
un exemplu numeric din curs.
136