Sunteți pe pagina 1din 7

Compartimentul 4 Modele eteroscedastice

1) Prezentarea problemei.
Una dintre ipotezele care se referă la modelul regresiei liniare tine de perturbația
variabilei aliatoare în fiecare moment de timp. În cazul când aceste perturbații ui urmează o
distribuție independentă cu o dispersie variantă constantă 2 , atunci spunem că variabila
reziduală este omoscedastică (din greacă, unde semnificația înseamnă o egală împrăștiere în
raport cu valorile variabilei independente xi).
Contrariul acestei ipoteze poartă numele de eteroscedasticitate, care se manifestă prin
faptul că dispersia valorilor ui este variabilă în raport cu observaţiile succesive.
Aşa dar modelul heteroscedastic se prezintă astfel:

y=X+u, E(ui)=0

Var(ui)=i2, ( i= 1,n )
Vom analiza situaţiile când variabilele aleatoare nu sunt autocorelate.
Matricea de covarianţă a erorilor va avea următoarea formă:

Observăm că varianțele erorilor nu mai sunt constante pe prima diagonală a matricei de


covarianță. Aceasta se întâmplă în deosibi când operăm cu date rezultate din observații
efectuate asupra mai multor unități pentru aceiași perioadă sau când observațiile sunt
reprezentate de valorile medii.
Fenomenul de eteroscedasticitate poate fi diminuat prin efectuarea de observații în
diferite momente de timp asupra unuia şi aceluiași obiect economic.
Însă o schimbare considerabilă a variabilei corectate în timp la fel poate duce la
modificarea varianței variabilelor reziduale.
Consecinţele eteroscedasticităţii sunt identice cu cele de autocorelare a erorilor, adică:
- estimatorul este nedeplasat ("SANS BIAIS")
- estimatorul MCMMP n-are mai mult o varianţă minimală.

Cauzele eteroscedasticitătii sunt multiple:

66
- observațiile reprezintă valorile medii ale variabilelor măsurate;
- pentru diferite valori ale variabilei explicative se observă repetarea unei şi aceleaşi
valori a variabilei explicate;
- perturbațiile sunt legate de valorile cuprinse de variabila explicativă, într-un model
cu reprezentare instantanee a datelor.

Corectarea eteroscedasticitâţii
Deşi în anumite condiţii estimatorul MCMMP poate fi consistent, el nu este totuşi în
general eficient. Deaceea o estimaţie eficientă a lui  necesită luarea în consideraţie a matricei
. Pentru aceasta se calculează estimatorul MCMMPG (Generalizate), care este liniar
nedeplasat de dispersie minimă:

Var ( ) =  2 (    −1 ) −1
 = (    −1 ) −1    −1 y
Nu există o metodologie unică de corecţie, însă se aplică diverse metode în funcţie de
cauzele care au adus la eteroscedasticitate.
Regula generală consistă în determinarea unei transformări a datelor a variabilelor care să
ducă în fine la un model cu varianţe constante (homoscedastice).
De exemplu, se cere să estimăm modelul Yi =0+1Xi+ui pentru care cunoaştem numai
relaţia între medii:

 1 
 0
 n1 
 0 1 
 u2
Var ( ui ) =  u = =  n2 
Varianţa ni   
 
 1
 
 ni 
Deoarece modelul este eteroscedastic, vom aplica estimatorul MCMMPG

 = (   u−1) −1 (   u−1 ) = (  V −1) −1 (  V −1 )


67
n1 
 n2 
V −1 = 
unde    , de unde
 
 ni 

  ni  n x 
(  V ) = 
 −1 i i

 ni xi  n x  2
şi
i i

 ni i 
(  V ) = 
 −1

 ni i i 

care ne permit obţinerea rezultatelor de care

avem nevoie.

 n1 
 
M =  
n2
Se poate de notat V-1 =MMT, dar atunci  
 
 nk 
şi

  ( ) ( ) = (    T ) (    T )


−1 −1
 = ( ) ( )
T T

Aceleaşi rezultate se pot obţine şi aplicând regresia ponderată, adică prin multiplicarea
vectorului de observaţii a variabilei endogene Y şi a vectorului variabilei exogene cu matricea
M. Aplicând apoi MCMMP pentru datele transformate ajungem la aceleaşi rezultate.
Estimatorul nedeplasat pentru varianta erorilor are forma
 
u2 =
U U
=
(  −  ) (  −  ) (  −  )   (  −  )
= =
n−k n−k n−k

   ni
  i 
 i i
 −   
( ) ( )
2
n
 −  V −1  −   V −1  −  V −1   ni  i i  
0 1

= =
n−k n−k n−k

68
Estimaţia varianţei coeficienţilor se face cu ajutorul testului t. Matricea varianţiei şi
covarianţei coeficienţilor:

 =  2 (  V −1  ) −1
  u

 
t calc = 0 1  2 = 2  cov(  V −1  )
0

 1 
t = = t 

1  i
i

Dacă

atunci reţinem ipoteza că i, are o influenţă pozitivă.

3. Teste de detectare a eteroscedasticităţii


In primul rând vom verifica
1.Testul de egalitate a varianţelor erorilor.
Ipoteza Io o vom formula în felul următor:

I0: 12 ==  2 i == m2 (i=1,m) numărul de grupe de observaţii.


Algoritmul de calcul.
Pasul 1. Calculăm varianţa empirică pentru fiecare grupă.
m

 ( ij − i ) 2
j =1
i2 =
ni − 1
Pasul 2. Calculăm varianţa totală
m

 (n i − 1)i2
 v  2
i =1
n2 = =
i i
m

 (n − 1)
v
i
i =1
m m
cu v i = ni − 1 si v =  vi =  ( ni − 1)
i =1 i =1

Pasul 3. Calculăm 2 empiric şi verificăm testul.


69
m
Q  = vLni2 −  vi Lni2
Cantitatea
i =1
urmează o lege normală 2 cu (m-1) grade de libertate (Ln - logaritmul natural).
În acelaşi timp estimaţia poate fi ameliorată divizând Q la o constantă la scară C:

1  m 1 1 Q
C = 1+   
− , atunci Q =
3(m − 1)  i =1 vi v  C
→  2 (m − 1)

Dacă Q>20,95 (m-1), atunci ipoteza I0 este respinsă, modelul este eteroscedastic.

2) Testul elaborat de Goldfeld-Quandt.


Acest test este variabil în cazul în care una din variabile este cauza eteroscedasticităţii şi
numărul de observaţii este important.
Algoritmul testului include 3 paşi.
Pasul 1. Ordonăm observaţiile în descreştere pentru variabila explicativă xi, care se
consideră heteroscedasticităţii.
Pasul 2. Excludem C observaţii centrale din datele ordonate, iar valoarea lui C o alegem
aproximativ a 4 parte din eşantion C=n/4
Pasul 3. Calculăm regresiile pentru ambele subeşantioane şi verificăm testul F şi sumele
pătratelor reziduurilor celor două regresii SSE1 şi SSE2.

( )
n1
SSE1 =  yi − yi(1)
t =1

 (y )
n1
(2) 2
SSE 2 = i − y i
n
i =   +1
4

Alcătuim raportul:

70
SSE2 / ( n1 − 2)
Fcalc =
 n 
SSE1  n −   − 2
 4 
F 0.05 n
şi-l comparăm cu n1 − 2 , n −   − 2 . Dacă F(calc)>F(tab), atunci ipoteza Io este respinsă şi
4

modelul este eteroscedastic.


3) Testul Gleisjer.
Testul Gleisjer permite nu numai descoperirea unei eventuale eteroschedasticităţi, dar şi
identificare formei care o îmbracă această eteroscedasticitate. Acest test este fondat pe relaţie
între reziduu şi estimatorul MCMMP efectuate asupra modelului de bază şi variabilei
explicative presupuse a fi cauza eteroscedasticităţii.
Algoritmul testului conţine 4 paşi:
Pasul 1. Regresionăm cu ajutorul MCMMP Yj în dependenţă de Xj.
Vectorul reziduurilor uj atunci devine cunoscut.
Pasul 2. Regresionăm valorile absolute uj ale reziduurilor în raport cu xj
Gleisjer sugerează de testat diferite forme de relaţii. Prima forma generală propusă este

I u j = 0 + 1 x j + v j . cu eteroscedasticitate de tipul

Pasul 3. Ipoteza omoscedasticităţii este respinsă dacă coeficientul 1 din una din
specificaţii este semnificativ diferit de zero. Dacă toate 3 teste "t" Student calculate sunt
superioare "t" teoretic tabelar atunci heteroscedasticitatea este detectată.
5.Corectarea eteroscedasticităţii.
Admitem că modelul este eteroscedastic. Cum vom corecta efectele?
Presupunem că am reţinut prima forma:

 u2 = k 2 x 2j
j

71
Aplicarea regresiei ponderate cu ajutorul factorului l/Xj conduce la un model
homoscedastic:
2
yj 0 uj  uj  1
= + 1 + in care    = 2  u2 = k 2
xj xj xj  Xj Xj j

Având în vedere că testul Gleisjer a pus în evidenţă o relaţie de tipul

 u2 = k 2 x 2j ,
j

pentru a înlătura eteroscedasticitatea vom aplica regresia ponderată asupra datelor brute

divizându-le la xj .

Obţinem

72