Documente Academic
Documente Profesional
Documente Cultură
4.1. HETEROSCEDASTICITATEA
Definire
Densitatea
1 + 2 Xi
X
şi i j astfel încât i2 2j
Grafic, în cazul modelului de regresie liniar unifactorial, heteroscedasticitatea
poate fi reprezentată astfel:
Densitatea
1 + 2 Xi
X
Exemplul 1:
Presupunem modelul de regresie ce descrie legătura între venitul anual (xi) şi cheltuielile
pentru concediu ale gospodăriilor (yi ).
Dacă creşterea venitului determină în medie creşterea cheltuielilor pentru concediu, iar
variaţia cheltuielilor rămâne aproximativ aceeaşi pentru orice nivel al venitului, erorile vor fi
homoscedastice (fig. 3a). În cazul în care variaţia cheltuielilor pentru concediu ale gospodăriilor
creşte odată cu creşterea venitului, erorile vor fi heteroscedastice (fig.3b).
cheltuieli cheltuieli
pentru pentru
vacanţă 1 + 2 Xi vacanţă 1 + 2 Xi
venit venit
a. model homoscedastic b. model heteroscedastic
Fig. 3
Variaţia erorilor poate să nu rămână constantă datorită mai multor cauze, printre
care:
1. Modelele de învăţare din erori: indivizii învaţă permanent, erorile lor
comportamentale diminuându-se în timp. De exemplu, variaţia erorilor obţinute în
culegerea de text scade odată cu creşterea numărului de ore de practică ca operator PC.
Atunci când indivizii au puţină experienţă, numărul erorilor variază în funcţie de
capacitatea de concentrare şi atenţia acestora. Pe măsură ce aceştia câştigă experienţă,
variaţia erorilor se datorează din ce în ce mai puţin trăsăturilor individuale. În acest caz,
dependenţa între erorile obţinute în culegerea de text şi numărul de ore de practică, se
poate descrie printr-un model de regresie liniară cu panta negativă şi homoscedastic.
erori de
culegere
text
1 + 2 Xi
2<0
număr de ore
de practică
Densitatea
erori de
culegere text
număr de ore 1 + 2 Xi
de practică
Fig. 4
3. Erorile de măsură: unii din respondenţi pot furniza răspunsuri mai precise decât
alţii, ceea ce va produce heteroscedasticitatea.
2 2
xi u i
E xi u xi i
^ ^ 2 2
Var ( 1 ) E ( 1 1 ) E
2
x2
i
x2 i
i xi
2 2
În acest caz:
Var (ui* ) 1, i 1, n deci heteroscedasticitatea a fost înlăturată.
Prin metoda celor mai mici pătrate se obţine estimatorul:
* *
~ xi y i
1
*
xi 2
2
* * * 2
~ ~ xi u i xi 1
Var ( 1 ) E ( 1 1 ) 2 E
x* 2
i
* 2
xi
2
x
i
2
i
xi2 2
~
Var ( 1 ) xi2 i2
xi
2 2
1
Var ( ˆ1 ) xi
2
x
2
xi i i
2 2
i i
Deci, în cazul heteroscedasticităţii estimatorul obţinut prin metoda celor mai mici
pătrate clasică ˆ1 este ineficient în raport cu estimatorul obţinut prin metoda celor mai
~
mici pătrate ponderată 1 .
................................ tb completat
În cazul în care între erori şi variabila exogenă există o corelaţie pozitivă, varianţa
estimatorului parametrului 1 este subestimată. Acesta va conduce la o creştere artificială a
1
din inegalitatea Cauchy-Buniakovski-Schwarz: ai,bi perechi de numere, ai2 bi2 ai bi 2
valorii statisticii student pentru verificarea semnificaţiei estimatorului, existând riscul
acceptării unui parametru ca fiind semnificativ, atunci când nu este.
În cazul în care între erori şi variabila exogenă există o corelaţie negativă, varianţa
estimatorului parametrului 1 este supraestimată, existând riscul respingerii unui estimator
ca fiind nesemnificativ, atunci când în realitate el este.
În aceste cazuri testul de semnificaţie Student nu mai este valabil.
Depistarea heteroscedasticităţii
a. Metoda grafică
ei2 ei2
xi xi
2
ei
xi
a. b. c.
Fig.5 Configuraţii ale pătratelor erorilor
b. Testul White
sau
2. ei2 a1 x1i a2 x2i b1 x12i b2 x22i c1 x1i x2i vi
Se demonstrează că în cazul ipotezei nule, nR2 este repartizată r2, unde r este
numărul de parametri din modelul erorilor folosit.
Deci, statistica testului este:
LM=nR2r2
unde:
- n este numărul observaţiilor folosite pentru estimarea parametrilor şi erorilor
- R2 este raportul de determinare evaluat pentru unul din modelele erorilor
- r este numărul de parametri din modelele erorilor
Observaţii:
1. O creştere a lui r conduce la diminuarea puterii testului.
2. Când sunt un număr mare de variabile exogene se recomandă utilizarea modelului 1.
3. Când sunt un număr moderat de variabile exogene se recomandă utilizarea
modelului 2.
Exemplul 2: Se consideră modelul de regresie ce descrie legătura, presupusă liniară, între valoarea
investiţiilor realizate şi rata dobânzii, înregistrate în perioada 1995-2004.
An 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Investiţii (mld. lei) 15424,9 24998,5 53540,1 67919,9 96630,4 151947,2 241153,6 322836 422535,1 526555,8
Rata dobânzii (%) 36,5 38,1 51,6 38,3 45,4 32,4 26,2 18,4 10,8 11,3
Se doreşte testarea homoscedasticităţii erorilor, folosind testul White.
c. Testul Goldfeld-Quandt
Acest test este util atunci când se presupune că o singură variabilă exogenă este
cauza heteroscedasticităţii.
Presupunem modelul unifactorial şi că i2 este corelată pozitiv cu xi astfel încât:
i2 2 xi2
unde 2 este o constantă.
Etapa 1. Se ordonează crescător seriile observaţiilor după xi, variabila exogenă ce
generează heteroscedasticitatea.
Etapa 2. Se exclud din serie c valori centrale, unde c este determinat a priori.
Se obţin 2 subserii: prima formată din primele (n-c)/2 observaţii şi a doua din ultimele (n-
c)/2 observaţii.
Valoarea c influenţează în mod direct puterea testului, fiind recomandat a se alege
c=n/3 sau n=n/4.
Etapa 3. Folosind cele două serii de observaţii se estimează două modele de
regresie:
yi 0 1 xi ui , i 1, (n - c)/2 cu suma pătratelor erorilor:
( n c ) / 2
SPE1 ( yi yˆ i ) 2
i 1
şi yi 0 1 xi ui , i (n c)/2 1, n cu suma pătratelor erorilor:
n
2
SPE2 ( yi yˆ i )
i ( n c ) / 21
SPE1 suma pătratelor erorilor regresiei relative la cele mai mici xi (grupul cu
varianţa ce mai mică) şi SPE2 suma pătratelor erorilor regresiei relative la cele mai mari xi
(grupul cu varianţa cea mai mare).
Etapa 4. Se calculează raportul:
SPE 2 /( n2 p)
GQ F (n1 p, n2 p) unde n1=n2=(n-c)/2
SPE1 /( n1 p)
Dacă valoarea statisticii GQ calculată este mai mare decât o valoare critică a
repartiţiei F, atunci se consideră că ipoteza homoscedasticităţii nu este validată.
Observaţii:
1. În cazul unei repartiţii normale a erorilor se recomandă utilizarea testului White.
2. Testul Goldfield – Quandt oferă rezultate semnificative numai în măsura în care s-
a identificat corect variabila exogenă ce cauzează nerespectarea ipotezei
homoscedasticităţii.
An 2003 2004 2002 2001 2000 1995 1996 1998 1999 1997
Investiţii (mld. lei) 422535,1 526555,8 322836 241153,6 151947,2 15424,9 24998,5 67919,9 96630,4 53540,1
Rata dobânzii (%) 10,8 11,3 18,4 26,2 32,4 36,5 38,1 38,3 45,4 51,6
Etapa 2. Se exclud din serie c=n/4=2 valori centrale. Se obţin 2 subserii: prima formată din
primele 4 observaţii şi a doua din ultimele 4 observaţii.
Etapa 3. Folosind cele două serii de observaţii se estimează două modele de regresie :
yˆ i 639235,9 15650,12 xi cu R2=0,84 şi SPE1 =181768,4
yˆ i 3507,015 1320,997 xi cu R2=0,082 şi SPE1 =105005,5
Etapa 4. Statistica testului :
105005,5 / 3
GQ 0,58
181768,4 / 3
iar valoarea critică : F0,05 ;3 ;3 = 9,28>GQ.
a. i2 cunoscut
b. i2 2 xi2
În acest caz:
u 2 x2
Var (ui* ) Var ( i ) 2 i 2 , i 1, n deci heteroscedasticitatea a fost
xi xi
înlăturată şi poate fi aplicată metoda celor mai mici pătrate modelului transformat.
c. i2 2 xi
yi x u
0 0i 1 xi i unde x0i=1 pentru orice i.
xi xi xi
sau
yi* 0 x0*i 1 xi* ui*
În acest caz:
ui 2 xi
Var (ui* ) Var ( ) 2 , i 1, n deci heteroscedasticitatea a fost
xi xi
înlăturată şi poate fi aplicată metoda celor mai mici pătrate modelului transformat.
d. Transformarea logaritmică
Exemplul 4:
Se consideră modelul de regresie ce descrie legătura între raportul de solvabilitate bancară2 şi
valoarea totală a creditelor acordate:
2
Indicatorul de solvabilitate bancară este raportul dintre fondurile proprii ale băncilor (capital propriu +
capital suplimentar) şi suma activelor nete şi a celorlalte elemente din afara bilanţului, ponderate în funcţie
de gradul lor de risc de credit.
mar.03 25,02 215,32 mar.04 20,46 324,39
apr.03 23,42 225,9 apr.04 20,06 323,39
mai.03 23,26 239,29 mai.04 20,1 335,84
iun.03 22,82 246,4 iun.04 20,34 346,14
iul.03 22,48 220,31 iul.04 19,86 336,95
aug.03 21,88 232,32 aug.04 19,57 348,57
sep.03 21,36 242,18 sep.04 19,74 354,64
oct.03 20,72 253,84 oct.04 19,82 355,91
nov.03 20,62 268,63 nov.04 19,93 356,75
dec.03 21,09 301,23 dec.04 20,64 365,19
a. i2 2 xi2
b. i2 2 xi
Se transformă modelul de regresie astfel :
yi* 0 x0*i 1 xi* ui*
yi 1
unde : yi* , x0*i şi xi* xi .
xi xi
Deci, modelul liniar de regresie homoscedastic, ce descrie legătura între raportul de solvabilitate
bancară şi valoarea totală a creditelor acordate, este:
yˆ i 29,367 0,027 xi
Definire
0
timp
Fig. 1
cov(u n , u1 ) cov(u n , u 2 ) cov(u n , u n )
u u
timp
timp
Fig. 2
calitatea
Fig. 3
3. Modele autoregresive
În cazul în care una din variabilele exogene este variabila endogenă întârziată se
obţine un model autoregresiv: yt a bxt cy t 1 ut . Dacă se neglijează termenul
întârziat yt-1, eroarea rezultată va avea o distribuţie sistematică, datorată influenţei
variabilei endogene întârziate asupra variabilei endogene.
De exemplu, numărul celor ce caută un loc de muncă într-un domeniu dat, la
momentul t este influenţat de salariul mediu în domeniul respectiv şi de numărul celor ce
căutau un loc de muncă în domeniu respectiv din perioada anterioară. Ofertanţii de forţă
de muncă nu îşi schimbă uşor domeniul, datorită profilului lor profesional şi al experienţei.
4. Transformarea datelor
În practică, de multe ori datele sunt transformate.
De exemplu, în cazul seriilor cronologice, datele lunare se transformă în date
trimestriale, prin calculul unei medii trimestriale. Această transformare, egalizează datele,
amortizând fluctuaţiile lunare, ceea ce poate conduce la autocorelarea erorilor în cazul
modelelor de regresie.
Interpolarea şi extrapolarea datelor se face pe baza unor ipoteze, care pot conduce
la pattern-uri sistematice ale datelor, care produc autocorelarea.
Utilizarea metodei celor mai mici pătrate în condiţiile în care erorile sunt
autocorelate, conduce estimatori nedeplasaţi şi consistenţi, dar nu şi eficienţi, ai
coeficienţilor modelului liniar de regresie, existând alţi estimatori cu varianţa mai mică.
Astfel procedurile clasice de testare a ipotezelor modelului general de regresie, estimat
prin metoda celor mai mici pătrate, nu mai sunt valabile.
Revenind la modelul de regresie iniţial, estimatorul obţinut prin metoda celor mai
mici pătrate pentru panta 1 este:
^
1
xt yt cu Var ( ^ ) 2 , în cazul în care erorile se presupun a nu fi
xt2 1
xt2
autocorelate.
În cazul autocorelării erorilor, se transformă modelul astfel (metoda celor mai mici pătrate
generalizată):
yt yt 1 0 (1 ) 1 ( xt xt 1 ) ut ut 1
obţinându-se:
yt* 0* 1* xt* t cu t verificând ipotezele metodei celor mai mici pătrate.
(x
t 2
t xt 1 ) 2
2
Var ( ˆ * )
1 n
(x t 2
t xt 1 ) 2
Deci, în cazul autocorelării erorilor, pentru testarea ipotezelor modelului general de
regresie şi pentru stabilirea intervalelor de încredere trebuie utilizată metoda celor mai
mici pătrate generalizată, care va furniza estimatori ai parametrilor de verosimilitate
maximă.
Dacă erorile sunt autocorelate şi acest lucru nu este luat în considerare, pot rezulta
erori majore în modelul de regresie clasic prin subestimarea variaţiei reziduale 2 sau a
variaţiei estimatorului 1. Astfel testele t şi F clasice nu mai sunt valabile şi în cazul în
care sunt folosite, pot furniza concluzii eronate asupra semnificaţiei statistice a
coeficienţilor de regresie estimaţi.
Pentru depistarea autocorelării erorilor sunt folosite metode empirice, formale sau
informale, dintre care sunt prezentate:
- metoda grafică
- testul Durbin Watson
- testul Breusch-Godfrey
a. Metoda grafică
0
ut-1
Fig. 4
Etapa 1. Se estimează parametrii modelului de regresie prin metoda celor mai mici
pătrate şi se obţine seria reziduurilor (ei)i=1,n.
Ipotezele ce trebuie testate sunt:
H0: = 0 şi
H1: ≠ 0
unde este coeficientul de autocorelare a erorilor de ordin 1.
(e t et 1 ) 2
DW t 2
n
, situată între 0 şi 4.
e
t 1
t
2
n n n n
n
(et et 1 )2 et2 et21 2 et et 1 et et 1
DW t 2
t 2 t 2 t 2
21 t 2n 2(1 ˆ )
n n
e t
2
e t
2
et2
t 1 t 1 t 1
unde ̂ este coeficientul de autocorelaţie a erorilor de ordin 1, observate, estimator al lui
.
Dacă :
ˆ 0 DW 2 pentru o valoare a statisticii calculate apropiată de 2, erorile nu
sunt autocorelate ;
ˆ 1 DW 0 pentru o valoare a statisticii calculate apropiată de 0, erorile sunt
autocorelate pozitiv ;
ˆ 1 DW 4 pentru o valoare a statisticii calculate apropiată de 4, erorile
sunt autocorelate negativ .
Etapa 3. Se determină valorile critice ale statisticii Durbin Watson, d1 şi d2, în
funcţie de numărul de variabile exogene incluse în modelul de regresie (p), de numărul de
observaţii (n) şi de pragul de semnificaţie ales ().
Exemplul 1: Se consideră modelul de regresie ce descrie legătura, presupusă liniară, între rata de
solvabilitate bancară şi totalul sumelor datorate către bănci în miliarde lei.
Luna Rata solvabilitate Total sume datorate Luna Rata solvabilitate Total sume datorate
ian.02 28,18 166599 iun.03 22,82 296198
feb.02 27,5 172543 iul.03 22,48 296029
mar.02 27,24 184806 aug.03 21,88 314975
apr.02 26,11 196550 sep.03 21,36 321995
mai.02 27,47 201206 oct.03 20,72 336362
iun.02 27,09 206722 nov.03 20,62 341096
iul.02 27,26 208508 dec.03 21,09 364528
aug.02 26,73 215573 ian.04 21,24 354209
sep.02 26,22 220474 feb.04 20,99 370735
oct.02 25,77 227831 mar.04 20,46 386328
nov.02 24,86 241042 apr.04 20,06 397065
dec.02 25,04 252625 mai.04 20,1 407180
ian.03 24,97 257288 iun.04 20,34 435333
feb.03 24,36 260337 iul.04 19,86 458771
mar.03 25,02 268130 aug.04 19,57 467051
apr.03 23,42 278585 sep.04 19,74 484288
mai.03 23,26 286370
(e
t 2
t et 1 ) 2
DW n
=0,427.
e
t 1
t
2
c. Testul Breusch-Godfrey
Pentru rezolvarea situaţiilor în care testul Durbin Watson nu poate fi aplicat,
statisticienii Breusch şi Godfrey au propus un test general pentru testarea autocorelării erorilor.
Se consideră modelul de regresie multifactorial:
Y=Xu
şi se verifică dacă erorile se reprezintă sub forma:
r
ut s ut s t unde t este zgomot alb
s 1
Etapa 1. Se estimează parametrii modelului de regresie prin metoda celor mai mici
pătrate şi se obţine seria reziduurilor (ei)i=1,n.
Ipotezele ce trebuie testate sunt:
H0: 1=...=r=0 erorile nu sunt autocorelate
H1: dacă t admite o reprezentare autoregresivă de ordin r erorile sunt autocorelate
Etapa 2. Se estimează prin metoda celor mai mici pătrate parametrii modelului
liniar de regresie ce descrie legătura între erori şi variabilele exogene iniţiale x j şi erorile
decalate et-s:
r p
et s et s j x jt vt
s 1 j 1
Observaţii:
1. Avantajul acestui test este că nu se bazează pe nici o ipoteză a priori.
2. Inconvenientul major al testului este neprecizarea lungimii decalajului de
autocorelare a erorilor, r.
Atunci:
p p
yt 0 j x jt ut yt yt 1 0 (1 ) j ( x jt x jt 1 ) ut ut 1
j 1 j 1
yt* yt yt 1
*
x x jt x jt 1
Notând: jt
0 0 (1 )
u u
t t t 1
Parametrii modelului se estimează prin metoda celor mai mici pătrate, obţinându-se
estimatori de verosimilitate maximă^.
Pentru aplicarea metodei celor mai mici pătrate generalizată, trebuie cunoscută
autocorelaţia de ordin 1.
e e t t 1
t 2
n
e
t 2
2
t 1
Exemplul 3: Se consideră datele din Exemplul 1. Se doreşte corectarea autocorelării erorilor prin
metoda celor mai mici pătrate generalizată.
Deoarece este necunoscut se va estima pe baza celor două metode prezentate anterior, pentru
identificarea diferenţelor dintre ele.
n
e e t t 1
1. t 2
n
=0,8179
e
t 2
2
t 1
Se observă că diferenţa între cele două valori obţinute prin cele două metode de estimare a
autocorelaţiei erorilor de ordin 1 este foarte mică.
yt yt 0,82 yt 1
*
Se determină * şi se estimează modelul: yt* 0 xt* t prin
xt xt 0,82xt 1
metoda celor mai mici pătrate :
yˆ t* 5,291 2,1 105 xt* R2= 0,376, F=18,061, DW=2,346
(0,323) (0,000)
t = (16,373) (-4,25)
Definire
x 1 x x 1 x
2 2
x1 x2 x1 x2
a. x1 şi x2 necorelate b. x1 şi x2 slab corelate
x 1
x
1 x x
2 2
x1 x 2
x1 x 2
Consecinţele multicolinearităţii
Dacă există colinearitate perfectă între x1 şi x2, atunci există astfel încât x2=x1.
În acest caz det(X’X)=0 şi nu se poate defini inversa matricei X’X, deci nu pot fi
determinaţi estimatorii coeficienţilor de regresie.
În cazul unei multicolinearităţi puternice dar nu perfecte, determinantul matricei X’X
nu va fi identic zero, dar va tinde către zero. Componentele matricei X’X vor tinde către
infinit, deci şi variaţia estimatorilor parametrilor de regresie va tinde către infinit.
Pentru modelul:
yi 0 1 x1i 2 x2i ui
2 2
var( ˆ1 ) şi var( ˆ 2 ) unde r12=cor(x1,x2)
x
2
1i (1 r122 ) x 2
2i (1 r122 )
Depistarea multicolinearităţii
d. Criteriul Klein
Criteriul Klein reprezintă una din cele mai simple modalităţi empirice de
determinare a multicolinearităţii.
Pentru modelul de regresie complet se calculează raportul de corelaţie Ry2. Se
determină matricea de corelaţie liniară a variabilelor exogene: rxi / x j .
i , j 1,n
Multicolinearitatea provine din faptul că unul sau mai mulţi regresori sunt
combinaţii liniare perfecte sau aproape perfecte de alţi regresori. O posibilitate de a
identifica care din variabilele exogene este corelată cu o altă variabilă exogenă, este de a
regresa fiecare variabilă exogenă (j) în funcţie de toate celelalte variabile exogene,
notându-se cu R 2j coeficientul de determinare.
Se calculează apoi factorul de inflaţie:
1
FI j
1 R 2j
Dacă acest factor este foarte mare pentru o variabilă, atunci se poate presupune că
există fenomenul de multicolinearitate datorat variabilei j.
f. Criteriul Belsley
Criteriul Belsley
10 489,1 460,9
Matricea: X ' X 489,1 28394 30110,35
460,9 30110,4 36324,87
Pentru determinarea valorilor proprii ale matricii X’X se determină:
X’X-Ip=-3+64728,862-124714813+101777463
Se consideră funcţia:
f()=-3+64728,862-124714813+101777463
f’()=-32+64728,862-124714813 are soluţiile: 986 şi 42166.
Soluţiile ecuaţiei f()=0 vor fi: max>42166, min<986 şi * între 986 şi 42166.
max
Deci, ( X ) >6,54>1 colinearitatea este prezentă.
min
În urma aplicării celor trei criterii, a rezultat o multicolinearitate puternică a variabilelor
exogene, ce trebuie eliminată pentru estimarea modelului de regresie.
În cazul unei multicolinearităţi puternice, cea mai simplă metodă ar fi eliminarea câte
uneia din variabilele corelate. Însă prin eliminarea unei variabile explicative din model se
produce o eroare de specificare.
Pentru modelul trifactorial: yi 0 1 x1i 2 x2i ui , variabilele x1 şi x2 sunt
puternic corelate.
Eliminând variabila x1 din model se obţine: yi b0 b1 x1i wi , pentru care se poate
demonstra, că:
E(b1)=1+2
unde este panta regresiei variabilei x2 asupra lui x1: x2i=x1i + i.
Deci estimatorul b1 va fi deplasat faţă de 1, atâta timp cât este diferit de zero,
deci când există colinearitatea. Dacă 2 este o valoare pozitivă, estimatorul b1 va
supraestima pe 1, iar când 2 este o valoare negativă, estimatorul b1 va subestima pe 1.
c. Transformarea variabilelor
Transformarea variabilelor
Deoarece atât ritmul anual de creştere a câştigului salarial mediu cât şi ritmului anual de
modificare a consumului final sunt dependente de rata inflaţiei, variabilele se vor împărţi la rata
inflaţiei.
Modelul ce descrie ritmului anual de modificare a consumului final este:
x y
yˆ i* 0 1 xi* unde x i* 1i şi y i* i
x 2i x 2i
Se obţine:
yˆ i* 0,586 0.618 xi* R2=0,746, F=23,463
(0,173) (0,128)
t= (-3,389) (4,844)
Estimatorii acestui model sunt semnificativi iar modelul este valid.
Acastă transformare este recomandată în acest caz pentru înlăturarea fenomenului de
multicolinearitate.
Definire
Observaţie:
Deoarece singura consecinţă negativă a introducerii unei variabile nerelevante în
model este obţinerea de estimatori mai puţin precişi, în timp ce neincluderea în model a
unei variabile relevante conduce la estimatori deplasaţi, intervale de încredere şi teste ce
pot furniza concluzii eronate, este de preferat includerea mai multor variabile în model,
chiar cu riscul ca acestea să fie nerelevante.
Considerarea unui model aditiv (yi =xi+ ui) în locul unui model multiplicativ (yi
= xi ui), este de asemenea o eroare de specificare.
Exemplu:
Examinarea erorilor
O posibilitate de identificare a unei erori de specificare prin omisiunea unei
variabile relevante din model sau prin o formă funcţională incorectă este examinarea
erorilor. Dacă graficul erorilor prezintă configuraţii particulare, există riscul comiterii unei
3
Vezi capitolul de teste de semnificaţie pentru parametrii modelelor de regresie
erori de specificare. Testul Durbin Watson poate fi folosit pentru identificarea unei
autocorelaţii a erorilor care se poate datora unei erori de specificare.
Erori de măsură
Un caz particular de erori de specificare îl reprezintă erorile de măsură ale
variabilei dependente sau a regresorilor. Aceste erori introduc o deplasare a estimatorilor.
Aceste ipoteze fiind verificate, estimatorul lui 1 din ambele modele, cu sau fără
erori de măsură, este nedeplasat, însă varainţele sunt diferite:
u2 ˆ * ) v u
2 2 2
var( ˆ y ) şi var(
xi2 y
xi2 xi2
Deci, în cazul în care intervin erori de măsură varianţa estimatorului creşte, chiar
dacă acesta rămâne nedeplasat. Astfel precizia estimatorului scade.
Problema 1
Se consideră modelul cu trei variabile explicative:
yt a0 a1 x1t a2 x2t a3 x3t ut
Datele observate anuale pentru cele patru variabile sunt:
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regress ion 2496.752 3 832.251 81. 948 .000a
Res idual 162.494 16 10. 156
Tot al 2659.246 19
a. Predic tors : (Const ant ), x3, x2, x1
b. Dependent Variable: y
Coeffici entsa
Modelul de regresie liniară estimat prin metoda celor mai mici pătrate este:
yˆ t 242,79 3,897 x1t 0,404 x2t 0,879 x3t R2= 0,939, F=81,95, DW=1,05
(26,8) (0,4) (0,061) (0,24)
t= (-9,06) (9,74) (6,59) (-3,66)
Interpretare:
Variaţia variabilei yt se datorează în proporţie de 93,9% variaţiei variabilelor x1t, x2t şi x3t:
- la modificarea cu o unitate a variabilei exogene x1t, variabila yt se va modifica în
acelaşi sens cu 3,897 unităţi;
- la modificarea cu o unitate a variabilei exogene x2t, variabila yt se va modifica în
acelaşi sens cu 0,404 unităţi;
- la modificarea cu o unitate a variabilei exogene x3t, variabila yt se va modifica în
direcţie opusă cu 0,879 unităţi.
Metoda grafică
Se reprezintă grafic pătratul erorii în funcţie de cele trei variabile exogene.
Se observă că punctele prezintă o distribuţie aleatoare. Din grafic nu poate fi depistată
prezenţa heteroscedasticităţii.
30.00
20.00
e2
10.00
0.00
x1
30.00
20.00
e2
10.00
0.00
x2
30.00
20.00
e2
10.00
0.00
94.00 96.00 98.00 100.00 102.00 104.00 106.00 108.00 110.00 112.00
x3
Testul White
Folosind seria residualurilor estimate prin aplicarea metodei celor mai mici pătrate la
punctul anterior, se estimează modelul erorilor:
ei2 a1 x1i a2 x2i b1 x12i b2 x22i c1 x1i x2i vi
şi se obţine statistica testului White:
LM = 200,474 = 9,48
Din tabelele repartiţiei 2 se determină valoarea critică 02,05;5 =11,07.
LM < 52 modelul este homoscedastic
Testul Goldfeld-Quandt
Folosind acest test se va verifica dacă există o dependenţă între variaţia erorilor şi
variabila exogenă x1. Se consideră c=n/4=5. Se împart seriile de date în câte 2 subserii, din
primele 8 observaţii, şi din ultimele 8 observaţii.
Se estimează cele două modele de regresie aplicate seriilor de date astfel partiţionate şi se
obţin sumele pătratelor erorilor:
SPE1 = 52,17 SPE2 = 16,70
52,17 / 4
GQ 3,12
16,7 / 4
Din tabelele repartiţiei Fisher se determină valoarea critică F0,05;4,4 = 6,388.
GQ < F0,05;4,4 modelul este homoscedastic
Metoda grafică
Se reprezintă grafic erorile ei în funcţie de erorile deplasate ei-1.
Se observă că punctele nu prezintă o distribuţie aleatoare, sugerând faptul că erorile sunt
autocorelate.
6.00000
4.00000
Unstandardized Residual
2.00000
0.00000
-2.00000
-4.00000
-6.00000
edepl
Testul Breusch-Godfrey
Folosind seria residualurilor estimate prin aplicarea metodei celor mai mici pătrate la
punctul anterior, se estimează modelul erorilor:
et 1et 1 a1 x1t a2 x2t a3 x3t vt
şi se obţine statistica testului Breusch-Godfrey:
LM=(n-r)R2=(20-4)0,186=2,97
Din tabelele repartiţiei 2 se determină valoarea critică 02,05;4 =9,488.
LM < 52 erorile nu sunt autocorelate
Criteriul Klein
Din matricea de corelaţie a variabilelor exogene, se observă că cel mai mare coeficient de
corelaţie este înregistrat pentru variabilele x1 şi x3: r13 = 0,742.
Raportul de corelaţie al modelului de regresie iniţial este: R y2 =0,939.
Deci rij < R y2 pentru oricare dintre variabilele exogene, deci nu există o multicolinearitate
puternică între acestea.
Correlati ons
x1 x2 x3
x1 Pears on C orrelation 1 .384 .742**
Sig. (2-t ailed) .095 .000
N 20 20 20
x2 Pears on C orrelation .384 1 .288
Sig. (2-t ailed) .095 .219
N 20 20 20
x3 Pears on C orrelation .742** .288 1
Sig. (2-t ailed) .000 .219
N 20 20 20
**. Correlat ion is signif icant at t he 0.01 lev el (2-tailed).
Cei trei factori de inflaţie nu sunt foarte mari, deci corelarea variabilelor exogene nu este
puternică.