Sunteți pe pagina 1din 38

Lucrare practică N5 (la tema: Model heteroscedastic)

Se cunosc următoarele date privind Cheltuielile Guvernamentale pentru Educaţie (Y) şi


PIB (X), ambele variabile în milioane u.m. pentru o perioada de timp analizată de 34 ani:
Se cere:
1. Să se specifice modelul (corelograma, estimarea modelului, verificarea
semnificației estimatorilor la un prag de semnificaţie α=5%, verificarea
ipotezei de liniaritate a modelului (coeficientul de corelație liniară simplă,
raportul de corelație), coeficientul de determinație, testarea validății
modelului);
2. Teste de detectare a heteroscedasticității:
a) utilizând procedeul grafic
b) utilizând testul de corelaţie neparametrică - corelația rangurilor Spearman;
c) utilizând testul Goldfeld-Quandt;
d) utilizând testul White
e) utilizând testul Gleisjer
3) Corectarea heteroscedasticităţii
Una din ipotezele de fundamentare a MCMMP şi a
verosimilităţii modelului prevede ca variabila aleatoare
(reziduală) ɛ este de medie nulă M eˆ  0 , iar dispersia ei
2
s ê este constantă şi independentă de X – numai astfel se
admite că legătura dintre Y şi X să fie relativ stabilă.
Ipoteza de homoscedasticitate a erorilor presupune că
variabila aleatoare are o varianță (dispersie) constantă:
V( εi ) = σ 2 , deci variabila aleatoare prezintă o împrăştiere
(dispersie) egală pentru diferite valori ale lui xi, sau
dispersiile valorilor reziduale calculate pentru diverse
segmente de valori xi nu diferă între ele.
Termenul grecesc homoskedastic
(înseamnă egal împrăștiat) –
presupune egala împrăștiere a
valorilor ei
Heteroscedasticitatea este
proprietatea erorilor de a nu avea o
dispersie constantă.
Consecinţele fenomenului de heteroscedasticitate a erorilor:

a) Estimatorii parametrilor din model nu sunt eficienţi (există


estimatori care au o dispersie mai mică);
b) Estimatorii calculaţi pentru dispersia parametrilor sunt
deplasaţi, nu sunt consistenţi;
c) Eroarea standard a coeficienților ai este subestimată, astfel
calculele sugerează o precizie a estimării mai bună decât este
în realitate;
d) Valorile t- statistic, în cazul testării semnificației parametrilor
sunt mai mari decât este în realitate și în acest caz testul t-
Student nu mai este valid.
1. Specificarea modelului
conform corelogramei:

Y  a0  a1 X  

yi  a0  a1 X i   i

i  (1, 3 4)
Funcția de estimație: yˆ i  aˆ0  aˆ1 X i

yˆ i  2.319896  0.066891X i
2. Teste de detectare a heteroscedasticității:
2.a. Procedeul grafic
El constă în construirea
corelogramei privind valorile
variabilei factoriale X şi ale
variabilei reziduale e:

Concluzie: Există corelație dintre X și e


2.b. Testul de corelaţie neparametrică - corelația rangurilor Spearman
Pașii:
se ordonează datele variabilei explicative în mod crescător;
se stabilesc rangurile pentru caracteristica X (Rx) şi pentru
valoarea reziduală ei (care se ia după modul : ΙeiΙ ) →R ΙeiΙ;
 se calculează diferenţele dintre ranguri:
di  Rxi  R e , i  1, n
i
 Se calculează coeficientul de corelaţie conform formulei:
6 d 2

rx ,e  1    1;1
i

n n
3
Cu cât coeficientul se apropie de extremele intervalului, cu atât
legătura este mai puternică.
Pentru simplificarea calcului coeficientului de corelație a
rangurilor e nevoie de cmpletat următorul tabel:
Ipotezele statistice care permit detectarea
heteroscedasticităţii:
H0: nu există dependenţă dintre variabila explicativă şi
variabila reziduală, adică modelul este homoscedastic;
H1: modelul este heteroscedastic.
Pentru a se admite una din ipoteze, se compară valolorile:

rx ,e * n  2
t calc  ttab  t / 2;n  k 1
1 r 2
x ,e
rx,e * n  2 0.59  34  2
tcalc    4.24
2 2
1  rx,e 1  0.59

ttab  t / 2;n  k 1  t0.025;32   2.037

Concluzie: tcalc>ttab => ipoteza H0 se respinge, iar


ipoteza H1 se acceptă, potrivit căreia modelul este
heteroscedastic.
2.c. Testul Goldfeld-Quandt
Paşii:
a) Se ordonează observaţiile în creştere pentru variabila explicativă, care se
consideră cauza heteroscedasticităţii (apoi acestor observaţii li se atribuie
valorile corespunzătoare variabilei dependente);
b) Se exclud C observaţii centrate din datele ordonate, C  n / 4  34 / 4  8.5
(se va lua C=8)
c) Se stabilesc regresiile pentru ambele subeşantioane (cu n1=n2=13observații,
astfel: n1  1,13 și n 2  22,34 se omit observațiile 14,21 ,
se calculează suma pătratelor reziduurilor celor două regresii SPR1 şi SPR2 ,
apoi se verifică testul Fisher.
Modelul estimat pentru primul subeșantion:

SPR1 = 6,092933
Modelul estimat pentru al doilea subeșantion:

SPR2 = 429,6117
Ipotezele statistice care permit detectarea heteroscedasticităţii:
H0: nu există dependenţă dintre variabila explicativă şi variabila
reziduală, adică modelul este homoscedastic;
H1: modelul este heteroscedastic.
Notă explicativă: pentru stabilirea lui Fcalc la numărătorul raportului se ia suma
pătratelor erorilor cu cea mai mare valoare.

SPR2 / n1  2 429.6117/ 13  2


Fcalc    150.64
 n   34 
SPR1 /  n   2  6.092933/  34   2
 4   4 

F n  F0.05;11; 24  2.18 Concluzie: Fcalc > Ftab => H0 se respinge, iar H1 se
tab( ;n1 2;n 2 ) acceptă, potrivit căreia modelul este heteroscedastic.
4
2.d. Testul White
Pașii:
a) estimarea parametrilor modelului inițial și calcularea valorilor
estimate ale variabilei reziduale ei ;
b) construirea unei regresii auxiliare, bazată pe prespunerea
existenţei unei relaţii de dependenţă între pătratul valorilor
erorii, variabila exogenă inclusă în modelul iniţial şi pătratul
valorilor acesteia:

eˆi  a 0  a1 xi  a 2 xi   i
2 2

și calcularea coeficientului de determinare R2 corespunzător


acestei regresii auxiliare;
În Eviews, utilizând comanda Residual Tests, White
Heteroskedasticity (no cross terms) din meniul Equation obținem
următoarele
rezultate:
Există două variante de aplicare a testului White:
-1- utilizarea testului Fisher–Snedecor clasic, bazat pe ipoteza
nulităţii parametrilor, respectiv:
H 0 :  0  1   2  0 (homoscedasticitate)
H1 : 0  1   2  0 (heteroscedasticitate)
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt
nesemnificative (Fc < Fα;v1;v2), este acceptată, atunci ipoteza de
homoscedasticitate se verifică, cazul contrar semnificând prezenţa
heteroscedasticităţii erorilor.
Deoarece Fcalc= 22,04451, iar F(0,05; 1; 32)=4,17, rezultă că Fcalc>Ftab, astfel
ipoteza alternativă este acceptată, potrivit căreia în model este prezentă
heteroscedasticitatea erorilor.
-2- utilizarea testului LM, calculat ca produs între numărul de
observaţii corespunzătoare modelului, n, și coeficientul de
determinare, R2, corespunzător acestei regresii auxiliare. În general,
testul LM este asimptotic distribuit sub forma unui 2 ;v, pentru care
numărul gradelor de libertate este egal cu: v = k , unde k = numărul
variabilelor exogene, respectiv:
2
LM  n  R  19.96333  2
 ; v   2
0.05,1  3 .84

Dacă LM   ;v
2
atunci erorile sunt heteroscedastice, în caz
contrar, sunt homoscedastice, respectiv ipoteza nulităţii parametrilor,
α0 = α1 = α2 = 0, este acceptată.
Deoarece LM   2
;v , rezultă că erorile sunt heteroscedastice
.
c) verificarea semnificației parametrilor modelului
nou construit, iar dacă unul dintre aceștia este
nesemnificativ (în afară de termenul liber) atunci
ipoteza de homoscedasticitate a erorilor este
acceptată și invers.
Deci, verificând semnificația parametrilor
modelului nostru construit (în afară de termenul
liber), se observă că parametrii regresiei auxiliare
sunt semnificativi, astfel ipoteza de
heteroscedasticitate a erorilor este acceptată.
2.e. Testul Gleisjer
Pașii:
a) Se regresionează cu ajutorul MCMMP Yi în dependenţă de Xi şi se
determină vectorul reziduu ei ;
b) Se regresionează valorile absolute ei în raport cu Xi
(presupusă a fi cauză heteroscedasticităţii)

(Gleisjer sugerează de testat diferite forme de relaţii).


În lucrarea se vor propune 2 forme a heteroscedasticităţii:

1. ei   0  1 X i  vi , cu heteroscedasticitatea de tipul

ˆ e2  k 2 X i2
i (presupunând ca dispersia erorilor este proporțională cu Xi2 ).

Se determină valorile ajustate: eˆi  ˆ 0  ˆ1 X i , după care reziduu v i


eˆi  2.37439 0.004418X i
Se testează semnificația estimatorului ̂ 1 (testul t - Student)
Ipotezele statistice:
H0: modelul este omoscedastic;
H1: modelul este heteroscedastic.
Pentru a se admite una din ipoteze, se compară valolorile:
ˆ 1
t calc  și ttab( ,nk 1)
 ˆ 1

Deoarece tcalc=5.579653 > t(0,05;32)=2,037, rezultă că se


acceptă ipoteza alternativă H1 - modelul este heteroscedastic.
2. În lucrare se propune şi următoarea formă:
ei   0  1 X i  vi

cu heteroscedasticitate de tipul ˆ  k
2 2
ui Xi (presupunând ca
dispersia erorilor este proporțională cu Xi ).

Se regresionează valorile absolute ei în raport cu Xi .

Se determină valorile ajustate: eˆi  ˆ0  ˆ1 X i după care


reziduu v i .
eˆi  0.576846  0.235976 X i
Se testează semnificația estimatorului ̂ 1 (testul t - Student)
Ipotezele statistice:
H0: modelul este omoscedastic;
H1: modelul este heteroscedastic.
Pentru a se admite una din ipoteze, se compară valolorile:
ˆ 1
t calc  și ttab( ,nk 1)
 ˆ 1

Deoarece tcalc=7,262798 > t(0,05;32)=2,037, rezultă că se


acceptă ipoteza alternativă H1 - modelul este heteroscedastic.
3. Corectarea heteroscedasticităţii
(Corectarea heteroscedasticităţii presupune ponderarea modelului iniţial)

Dacă se pune în evidență relația de tipul: ˆ  k Xi


2 2
ei

(presupunând că dispersia erorilor este proporțională cu Xi ) ,


pentru a înlătura heteroscedasticitatea vom aplica regresia
ponderată asupra datelor brute divizându-le la Xi .
Yi 0 Xi i
  1 
Xi Xi Xi Xi

ei   0  1 X i  vi ; eˆi  aˆ 0  aˆ1  X i

Pentru facilitarea calculelor se pot face următoarele notaţii:

Yi 1 Xi
Zi  X 1i  X 2i 
Xi Xi Xi
Astfel poate fi obţinut următorul model:
Z i   0 X 1i  1 X 2i  ui
care apoi se estimează:

Zˆi  0.282371X1i  0.05872 X 2i


Concluzia: coeficientul de regresie a lui X1i nu este semnificativ diferit de
zero, astfel variabila respectivă trebuie elimină din model.
Obținem următorul model: Zi=β0 + β1X2i + ɛi pentru care:

Zˆi  0.112035  0.063107 2i


Yi Xi i
 0.112035 0.063107 
Xi Xi Xi

Acest model va fi cel obținut prin corecția


heteroscedasticității :

Yi  0.112035 X i  0.063107X i   i
THE END
P.S.

S-ar putea să vă placă și