Documente Academic
Documente Profesional
Documente Cultură
Heteroscedasticitatea pură
0 𝜀 homoscedastic
distribuție
"îngustă"
distribuție
"largă"
0 𝜀 heteroscedastic
Heteroscedasticitatea impură
𝑉𝑎𝑟(𝜀𝑖 ) = 𝜎 2 𝑍𝑖
După cum s-a discutat, heteroscedasticitatea este o problemă dificilă. Vestea bună
este că există multe teste pentru detectarea heteroscedasticității. Vestea proastă este
heteroscedasticitatea poate lua multe forme diferite și nici un test nu le poate găsi pe toate.
În această secțiune, se prezintă două dintre cele mai populare și puternice teste pentru
detectarea heteroscedasticitate, testul Breusch-Pagan și testul White. Deși niciun test nu
poate „demonstra” existența heteroscedasticității, de multe ori aceste teste pot oferi destul
de multe informații referitoare la prezența heteroscedasticității, precum și la faptul dacă
aceasta reprezintă o problemă pentru modelul de regresie. Înainte de a folosi orice test
pentru detectarea heteroscedasticității, este bine să se răspundă la câteva întrebări
preliminare:
1. Se pot observa erori evidente de specificare? Există variabile omise? Modelul specificat
este liniar, cu toate că, de exemplu, un model log-log ar fi mai potrivit?
Heteroscedasticitatea nu trebuie testată până când specificația nu este cât se poate de
bună. La urma urmei, dacă heteroscedasticitatea este detectată într-un model specificat
incorect, sunt șanse ca în modelul corect acesta să nu existe.
2. Există semne de avertizare timpurie a heteroscedasticității? La fel cum anumite tipuri de
nori pot avertiza asupra furtunilor potențiale, anumite tipuri de date pot semnala o
posibilă heteroscedasticitate. În special, dacă valoarea maximă a variabilei dependente
este de multe ori mai mare decât valoarea minimă, atenție la heteroscedasticitate.
Testul Breusch-Pagan
𝑒𝑖2 = 𝛼0 + 𝛼1 𝑁𝑖 + 𝛼2 𝑃𝑖 + 𝛼3 𝐼𝑖 + 𝑢𝑖
Testul White
Testul White este, probabil, cel mai popular dintre toate testele de
heteroscedasticitate, deoarece poate găsi mai multe tipuri de heteroscedasticitate decât
orice alt test. Acesta este un avantaj distinct într-o lume în care aproape orice variabilă sau
o combinație de variabile, liniare sau neliniare, ar putea ridica o problemă de
heteroscedasticitate. Testul White investighează posibilitatea heteroscedasticității într-o
ecuație, analizând posibilitatea ca pătratul reziduurilor să poată fi explicat prin variabilele
independente ale ecuației, pătratele lor și produsele lor încrucișate. Pentru a rula testul
White trebuie parcurși următorii pași:
1. Se estimează ecuația inițială. Se obține seria de reziduuri.
2. Se estimează regresia auxiliară, utilizând pătratul reziduurilor ca variabilă dependentă,
iar ca variabile independente se folosesc fiecare 𝑋 din ecuația inițială, pătratul fiecărui 𝑋
și produsul fiecărui 𝑋 cu fiecare dintre ceilalți 𝑋 . De exemplu, dacă variabilele
independente ale ecuației originale sunt 𝑋1 și 𝑋2 , ecuația auxiliară pentru testul White
este:
Ca variabile explicative în ecuația auxiliară se includ toate variabilele din modelul inițial,
pătratele și produsele lor încrucișate. Includerea tuturor variabilelor din modelul original
permite testului White să verifice dacă unele dintre ele sau toate sunt factori de
proporționalitate 𝑍 . Includerea tuturor termenilor la pătrat și a produselor încrucișate
permite testarea unor tipuri de heteroscedasticitate mai exotice și complexe. În aceasta stă
puterea testului White.
Testul White conține mai multe variabile în partea dreaptă a ecuației decât regresia
inițială, uneori mult mai multe. Aceasta poate fi cea mai mare slăbiciune a sa. Pentru a
înțelege de ce, se poate observa că, odată cu creșterea numărului de variabile explicative din
regresia originală, numărul de variabile explicative din regresia auxiliară a testului White
crește mult mai repede. De exemplu, există cinci variabile explicative în ecuația auxiliară,
chiar dacă modelul inițial avea doar două, 𝑋1 și 𝑋2 . Cu trei variabile în modelul inițial,
regresia auxiliară White are 9 variabile explicative. Cu 12 variabile explicative în modelul
original, sunt 90 de regresori în regresia White, cu toate pătratele și termenii încrucișați
incluși!
Dacă numărul de variabile din partea dreaptă a regresiei auxiliare depășește numărul de
observări, nu se poate rula regresia White, deoarece numărul de grade de libertate în ecuația
auxiliară devine negativ! Chiar dacă gradele de libertate în ecuația auxiliară sunt pozitive,
dar mici, testul White este nerelevant în detectarea heteroscedasticității, deoarece cu cât
sunt mai puține grade de libertate, cu atât este slabă puterea acestui test. Într-o astfel de
situație, se revine la testul Breusch-Pagan sau la o alternativă a sa.
Ca exemplu de utilizare a testului White, se reia modelul restaurantelor Woody. Ca și în
cazul testului Breusch-Pagan, primul pas este obținerea reziduurilor ecuației inițiale Woody.
Al doilea pas este ridicarea la pătrat a reziduurilor și folosirea acestora ca variabilă
dependentă în ecuația de regresie auxiliară care include ca variabile independente N, P, I,
pătratele lor și produsele lor încrucișate:
Primul lucru de făcut dacă testul Breusch-Pagan sau testul White indică posibilitatea
heteroscedasticității este de a examina cu atenție ecuația pentru a elimina erorile de
specificare. Deși nu ar trebui inclusă niciodată o variabilă explicativă pur și simplu pentru că
un test indică posibilitatea heteroscedasticității, specificarea ecuației de regresie trebuie
gândită riguros. Dacă această regândire vă permite să descoperiți o variabilă care ar fi trebuit
să fie în regresie de la început, atunci acea variabilă ar trebui să fie adăugată în ecuație. În
mod similar, dacă forma funcțională a fot aleasă greșit la început, descoperirea
heteroscedasticității ar putea fi sugestia de a regândi specificația astfel încât să se aleagă
forma funcțională care reprezintă cel mai bine teoria de bază. Cu toate acestea, dacă nu există
erori evidente în specificație, heteroscedasticitatea este probabil de natură pură și trebuie
luat în considerare unul dintre remediile descrise în această secțiune.
Redefinirea variabilelor
unde 𝐸𝑋𝑃𝑖 se referă la cheltuieli, 𝐼𝑁𝐶𝑖 se referă la venituri, 𝑊𝐴𝐺𝐸𝑖 se referă la salariul mediu,
iar 𝑃𝑂𝑃𝑖 se referă la populația orașului.
Ecuația transformată este:
𝐸𝑋𝑃𝑖 𝐼𝑁𝐶𝑖
= 𝛼0 + 𝛼1 + 𝛼2 𝑊𝐴𝐺𝐸𝑖 + 𝑢𝑖
𝑃𝑂𝑃𝑖 𝑃𝑂𝑃𝑖
unde coeficienții β și variabilele sunt identice cu cele din ecuația originală. Împărțirea prin 𝑍
face ca 𝑢𝑖 să fie un termen de eroare homoscedastic, atât timp cât factorul de
proporționalitate 𝑍 este ales corect. Această alegere a factorului de proporționalitate nu este
o problemă banală. Există alte transformări, precum HC, care sunt mult mai ușor de utilizat
decât WLS, așa că nu recomandăm utilizarea WLS.
Sumar
𝑉𝐴𝑅(𝜀𝑖 ) = 𝜎 2 𝑍𝑖