Sunteți pe pagina 1din 8

Modele eteroscedastice

1) Efectul eteroscedasticităţii.
Una dintre ipotezele care se referă la modelul regresiei liniare ţine de perturbaţia variabilei aleatore în fiecare
moment de timp. În cazul când aceste perturbaţii ui urmează o distribuţie independentă cu o dispersie variantă
constantă 2 , atunci spunem că variabila reziduală este omoscedastică (din greacă, unde semnificaţia înseamnă o
egală împrăştiere în raport cu valorile variabilei independente xi)).
Contrariul acestei ipoteze poartă numele de eteroscedasticitate, care se manifestă prin faptul că dispersia
valorilor ui este variabilă în raport cu observaţiile succesive.
Aşa dar modelul heteroscedastic se prezintă astfel:
y=X+u, E(ui)=0

Var(ui)=i2, ( i= 1,n )

Vom analiza situaţiile când variabilele aleatoare nu sunt autocorelate.


Matricea de covarianţă a erorilor va avea următoarea formă:

 ( u 1 u 1 ) ( u 1 u 2 )  (u 1 u n )    2u1 0  0 
   
 ( u 2 u 1 ) ( u 2 u 2 )  ( u 2 u n )   0  2u 2  0 
 u  (uu )  
T
 
       
  
 ( u u ) ( u u )  (u n u n )   0   2u n 
 n 1 n 2 0

Observăm că variaţiile erorilor nu mai sunt constante pe prima diagonală a matricei de covarianţă. Aceasta
se întâmplă în deosibi când operăm cu date rezultate din observaţii efectuate asupra mai multor unităţi pentru
aceiaşi perioadă sau când observaţiile sunt reprezentate de valorile medii.
Fenomenul de eteroscedasticitate poate fi diminuat prin efectuarea de observaţii în diferite momente de timp
asupra unuia şi aceluiaşi obiect economic.
Însă o schimbare considerabilă a variabilei corectate în timp la fel poate duce la modificarea varianţiei
variabilelor reziduale.
Consecinţele eteroscedasticităţii sunt identice cu cele de autocorelare a erorilor, adică:
- estimatorul este nedeplasat ("SANS BIAIS")
- estimatorul MCMMP n-are mai mult o varianţă minimală.

Cauzele eteroscedasticitătii sunt multiple:


- observaţiile reprezintă valorile medii ale variabilelor măsurate;
- pentru diferite valori ale variabilei explicative se observă repetarea unei şi aceleaşi valori a variabilei
explicate;
- perturbaţiile sunt legate de valorile cuprinse de variabila explicativă, într-un model cu reprezentare
instantanee a datelor.

66
Corectarea eteroscedasticitâţii
Deşi în anumite condiţii estimatorul MCMMP poate fi consistent, el nu este totuşi în general eficient. De
aceea o estimaţie eficientă a lui  necesită luarea în consideraţie a matricei . Pentru aceasta se calculează
estimatorul MCMMPG (Generalizate), care este liniar nedeplasat de dispersie minimă:

Var ( )   2 (    1 ) 1
Nu există o metodologie unică de corecţie, însă se aplică diverse metode în funcţie
  (    1 ) 1    1 y
de cauzele care au adus la eteroscedasticitate.
Regula generală consistă în determinarea unei transformări a datelor a variabilelor care să ducă în fine la un
model cu varianţe constante (homoscedastice).
De exemplu, se cere să estimăm modelul Yi =01Xiui pentru care cunoaştem numai relaţia între medii:

Yˆi   0  1i  uˆi

 1 
 0
 n1 
Varianţa  0 1 
 u2
Var ( ui )   u   n2 
ni   
 
 1
 
 ni 

Deoarece modelul este eteroscedastic, vom aplica estimatorul MCMMPG

  ( u1) 1 ( u1)  ( V 1) 1 ( V 1)


n1 

  V 1    i  i 2i  şi   V     n
 n2   n nx  i 
unde V 1   , de unde  1

i
    ni xi  ni xi   n
i  i i 
 
 ni 
care ne permit obţinerea rezultatelor de care

avem nevoie.
 n1 
 
Se poate de notat V-1 =MMT, dar atunci M   
n2
 
 
 nk 


şi      
T
  
1 T
        T 
1
    T 
Aceleaşi rezultate se pot obţine şi aplicând regresia ponderată, adică prin multiplicarea vectorului de
observaţii a variabilei endogene Y şi a vectorului variabilei exogene cu matricea M. Aplicând apoi MCMMP
pentru datele transformate ajungem la aceleaşi rezultate.

67
Estimatorul nedeplasat pentru varianta erorilor are forma

  
       
    (   )   
U U
u2    
nk nk nk

   ni
  i  
  
   V 1      n  2
   
 ni  i i  
 V 1    V 1 
i i 0 1

 
nk nk nk

Estimaţia varianţei coeficienţilor se face cu ajutorul testului t. Matricea varianţiei şi covarianţei


coeficienţilor:

   2   V 1  1
  u

 
t calc  0 1  2  2  cov  V 1 
0

1 
t    t 
1   i
i

ˆi 
Dacă t calc   t tab  atunci reţinem ipoteza că i, are o influenţă pozitivă.
 ˆ nk
i

3. Teste de detectare a eteroscedasticităţii


In primul rând vom verifica 1) testul de egalitate a varianţelor erorilor. Ipoteza Io o vom formula în felul

următor: I0: 1   i  m (i=1,m) numărul de grupe de observaţii.
2 2 2

Algoritmul de calcul.
Pasul 1. Calculăm varianţa empirică pentru fiecare grupă.
m

 (
j 1
ij  i ) 2
i2 
ni  1
Pasul 2. Calculăm varianţa totală
m

 n i  1i2
 v  2

  i 1

2 i i
n m

 n  1
v
i
i 1
m m
cu vi  ni  1 si v   vi   ni  1
i 1 i 1

Pasul 3. Calculăm 2 empiric şi verificăm testul.


m

Cantitatea Q   vLni   vi Lni urmează o lege normală 2 cu (m-1)


2 2

i 1

grade de libertate (Ln - logaritmul natural).

68
În acelaşi timp estimaţia poate fi ameliorată divizând Q la o constantă la scară C:

1  m 1 1 Q
C  1     , atunci Q    2 (m  1)
3(m  1)  i 1 vi v  C

Dacă Q>20,95 (m-1), atunci ipoteza I0 este respinsă, modelul este eteroscedastic.

2) Alt test care prezintă interes este elaborat de S.Goldfeld şi R.Quandt.


Acest test este variabil în cazul în care una din variabile este cauza eteroscedasticităţii şi numărul de
observaţii este important.
Algoritmul testului include 3 paşi.
Pasul 1. Ordonăm observaţiile în descreştere pentru variabila explicativă xi, care se consideră
heteroscedasticităţii.
Pasul 2. Excludem C observaţii centrale din datele ordonate, iar valoarea lui C o alegem aproximativ a 4
parte din eşantion C=n/4
Pasul 3. Calculăm regresiile pentru ambele subeşantioane şi verificăm testul F şi sumele pătratelor
reziduurilor celor două regresii SSE1 şi SSE2.
2

 
n1
SSE1   yi  y (1)
i
t 1

 y 
n1
2
SSE2  i  yi( 2 )
n
i    1
4

Alcătuim raportul:

SSE2 /  n1  2 F 0.05 n


Fcalc  şi-l comparăm cu n1  2 , n     2 . Dacă F(calc)>F(tab), atunci ipoteza Io este
 n  4
SSE1  n     2
 4 
respinsă şi modelul este eteroscedastic.
3) Testul Gleisjer.
Testul Gleisjer permite nu numai descoperirea unei eventuale eteroschedasticităţi, dar şi identificare formei
care o îmbracă această eteroscedasticitate. Acest test este fondat pe relaţie între reziduu şi estimatorul MCMMP
efectuate asupra modelului de bază şi variabilei explicative presupuse a fi cauza eteroscedasticităţii.
Algoritmul testului conţine 4 paşi:
Pasul 1. Regresionăm cu ajutorul MCMMP Yj în dependenţă de Xj.
Vectorul reziduurilor uj atunci devine cunoscut.
Pasul 2. Regresionăm valorile absolute uj ale reziduurilor în raport cu xj
Gleisjer sugerează de testat diferite forme de relaţii. Prima forma generală propusă este

I u j  0  1 x j  v j . cu eteroscedasticitate de tipul  u2  k 2 x 2j
j

69
Alta forma : u j   0  1 x1j / 2  v j cu eteroscedasticitatea
de tipul  u2j  k 2 x j

3 forma este u j   0  1 x j 1  v j
 u2  k 2 x j 2
j

Pasul 3. Ipoteza omoscedasticităţii este respinsă dacă coeficientul 1 din una din specificaţii este
semnificativ diferit de zero. Dacă toate 3 teste "t" Student calculate sunt superioare "t" teoretic tabelar atunci
heteroscedasticitatea este detectată.
Pasul 4. Corectarea eteroscedasticităţii.
Admitem că modelul este eteroscedastic. Cum vom corecta efectele?
Presupunem că am reţinut prima forma:

 u2  k 2 x 2j
j

Aplicarea regresiei ponderate cu ajutorul factorului l/Xj conduce la un model homoscedastic:


2
yj 0 uj  uj  1
  1  in care     2  u2j  k 2
xj xj xj  Xj Xj

Având în vedere că testul Gleisjer a pus în evidenţă o relaţie de tipul  u2  k 2 x 2j , pentru a înlătura
j

eteroscedasticitatea vom aplica regresia ponderată asupra datelor brute divizându-le la xj . Obţinem
2
j 0 xj uj  uj 
  1  , unde    1  2  k2
xj xj xj xj  xj  X l2
uj
 

Studiul de caz

În tabelul 1 ce urmează au fost grupate valorile observate ce se referă la doi indicatori: costul mediu Y şi
outputul X a unei firme (tabelul 4.1)

Tabelul 1
Volumul producţiei lansate, Costul de producţie Yi ,lei

70
unităţi (Xi)
2 4,6 4,6 4,7 4,8 5,0 5,1
4 5,0 5,2 5,4 5,4 5,5 5,6
6 5,6 5,8 5,9 6,3 6,3 6,4
8 6,3 6,5 6,8 7,2 7,4 7,5
10 7,4 7,6 7,1 8,2 8,4 8,8

Analizat dependenţa costului de producţie şi volumul producţiei lansate.


REZOLVARE:
1) Regresăm Y în funcţie de X pentru întregul eşantion. Obţinem:
Y  3.,863  0,392 X
(1).
( 01772
. ) ( 0,0267 )

 X  6  (2  4  6  8  10) 180,
 X  6(4  16  36  64  100)  1320,
2

X 
 X  6,
30
 x   X 2  30( X ) 2  240,
2

 Y  186,4,
Y  186,4 : 30  6,2133,
 Y  1199,78,
 y  1199,78  30(Y )  41,6147,
2 2

 XY  2(4,6  4,6  4,7  4,8  5,0  5,1)    10(7,4  7,6  7,1  8,2  8,4  8,8)  1212,4,
1
 xy   XY  30  ( X )( Y )  94,
b1 
 xy 
94
 0,39167 ,
x 2
240
b0  6,2133  0,39167  6  3,8633 ,
Q y 2
 41,6147 ,

Q1  b1   xy  0,39167  94  36 ,8167 ,
Q2  e 2
 Q  Q1  4,7980 ,
Q2
S2   0,17136 ,
30  2
S  0,17136  0,41395 ,
1
S b1  S   0,0267 ,
x 2

S b0  S 
X 2

 0,1772 ,
n x 2

Q1
R2   0,8847 , R  0,9406 .
Q

Deci, regresia calculată explică 88,5% a variaţiei variabilei Y.


Testul F=(Q1:1)/Q2:28)=214,8534. Rezultă, că dependenţa variabililor Y şi X este semnificativă.
71
Testul Student.
0,39167
Pentru coeficientul b, avem tb1   14,66 Coeficientul b1 este semnificativ. Este semnificativ şi
0,0267
b0 3,863
coeficientul b0, deoarece tb0    21,8 .
Sb0 0,1772

2) Calculăm regresiile lui Y în funcţie de X pentru primele 11 şi ultimele 11 observaţii, în conformitate cu


schema ce rezultă din testul Goldfield şi Quandt. Remarcăm, că acest test poate fi aplicat numai în cazurile
dependenţei liniare, şi anume, când sursa încălcării homoscedasticităţii are forma a

 u2   2 xi2 , sau  u2  X i2 (   2 ) , adică atunci, când dispersia variabilei aleatoare de perturbaţie este
proporţională pătratului uneia din variabilele explicative (cauzele Xi).

ˆ (1)
Pentru primele 11 observaţii avem regresia Y '  4,30  0,250 X cu
(0,1913 ) (0,062 )

11
S 2  SSE  (Yi  Yˆt (1) ) 2   e 2  Q2  0,380 si undeQ1  b1  xy  0,6818 ,
2
Q
R 2  0,642  1 .
Q

ˆ ( 2)
Pentru ultimele 11 observaţii Y '  3,7333  0,4183 X Q2( 2)  2,8363, R 2  1  1  2  1 
Q Q 2,8363
 0,4023
(1,5544 ) (0,1700 ) Q Q 4,7454

3) În cazul homoscedasticităţii şi al distribuţiei normale a erorilor, raportul sumelor pătratelor reziduurilor pentru
1 (2)
Q
F  9 2  2,8363  7,46  F ( 0,05;9;9)  3,39
fiecare din cele două regresii trebuie să verifice repartiţia Fisher: 9 ,9 1
0,380
Q2(1)
9
Ipoteza heteroscidasticităţii este deci acceptabilă.

4) Deoarece Var (ui )  i  Xi ,  fiind o constantă nenulă, se poate corecta efectul heteroscidasticităţii,
2 2

împărţind fiecare termen al regresiei prin Xi, apoi reestimând regresia cu ajutorul variabilelor transformate. În acest caz:
Yi b u 1 Y
 (b 0  b 1 x i  u i ) / X i  b 1  0  i . Notăm X  ;Y*  Obţinem dependenţa liniară
Xi xi xi x X

Y  b1  b0 X  i în care termenul eroare devine homoscedastic. Deci:

ui 1 X2
Var( i )  Var( )  2 Var(u i )   i2    S 2 .
Xi xi Xi
Estimările prin MCMMP, plecând de la variabilele transformate, vor fi deci nedeplasate, consistente şi eficiente. Vom
avea:

72
b1 
x y
 

 ( X  X )(Y  Y )  4,0622 ,
   

x 2
 (X  X )
 
2

Yˆ 1
b0  Y  b1 X   0,3363 de undeYˆ  4,0622 X *  0,3537   4,0622  0,3537
X X
si deci :Yˆ  4,062 X  0,3537
(0,0895 ) (0,0242 ) (2).
4,062 0,3537
t b1   45,385; t b0   14,608,
0,0895 0,0242
Q 10,4177
R2  1   0,9866, R  0,9933,
Q 10,5594
unde Q   y2  10,5594; Q1  10,4177,
Q2   uˆ 2  Q  Q1  0,141626.
Caracteristicile (criteriile) arată, că modelul obţinut este mai bun decât cel iniţial: R2=0,9866 este mai mare
decât R2 =0,8847 (ce se referă la modelul iniţial). Erorile standard a coeficienţilor sunt mai mici pentru modelul
(2) faţă de modelul (1).
Respectiv sunt mai mari valorile testelor t şi F.

73

S-ar putea să vă placă și