Ce înseamnă multicoliniaritatea? Multicoliniaritatea presupune existenţa unei relaţii liniare între valorile variabilei explicative.
Să presupunem că în ecuaţia de regresie:
Y = a0 + a1X1 + a2X2 + e, între variabilele X1 şi X2 există o relaţie de forma X 2t a bX 1t , t , unde a şi b sunt parametrii cunoscuţi. Dacă se înlocuieşte a doua relaţie în prima relaţie se obţine: Y a 0 a1 X 1 a 2 X 2 e a 0 aa 2 a1 a 2 b X 1 e
Sistemul necunoscutele â0, â1 şi â2 este nedeterminat (are
două ecuaţii şi trei necunoscute). Cum identificăm multicoliniaritatea?
a. Coeficienţii de corelaţie liniară, calculaţi pentru perechile de
variabile explicative din model, sunt mari în valoare absolută (sunt, în modul, apropiaţi de +1).
b.Determinantul matricei (X'X) are valori în apropierea lui zero.
c.Coeficientul de determinare R2 este mare, iar valorile testelor t
(Student), calculate pentru parametrii modelului sunt mici.
d.Estimatorii parametrilor sunt sensibili la specificarea
modelului. Depistarea fenomenului de multicoliniaritate Prima metodă Reprezentarea grafică a seriilor de valori corespunzătoare variabilelor explicative. Analogiile în evoluție ne arată o corelație suficient de intensă între variabilele explicative. Depistarea fenomenului de multicoliniaritate A doua metodă Calculul determinantului matricii X`X, Det(X`X); cu cât valoarea acestui determinant este mai apropiată de zero, cu atât corelaţia dintre variabile este mai puternică. Dacă D(X`X) < 0,1 se consideră că fenomenul de multicoliniaritate este prezent. A treia metodă Se calculează raportul de determinare (R2). Această valoare se compară cu mărimea aceluiaşi coeficient obţinut în condiţiile în care una dintre variabilele factoriale a fost omisă din model. În cazul în care valorile coeficienţilor sunt apropiate ca mărime se poate considera că variabila omisă este coliniară cu celelalte variabile factoriale. Depistarea fenomenului de multicoliniaritate A patra metodă Folosirea testele statistice Student, t- utilizat în vederea verificării semnificaţiei parametrilor modelului, şi Fisher- Snedecor, F- utilizat în vederea verificării semnificaţiei modelului. În cazul în care testul F semnalează semnificaţie, iar testul t, aplicat aceluiaşi model, semnalează nesemnificaţii în rândul parametrilor, acest lucru reprezintă un indiciu că multicoliniaritatea este prezentă. Atenuarea multicoliniarității
se recomandă folosirea unor serii de date cât mai lungi
(T>15), astfel încât eventualele analogii, datorate hazardului, să fie, pe cât posibil, eliminate; în situaţia în care două variabile exogene sunt intens corelate (una dintre ele este coliniară cu cealaltă), se poate renunţa la una dintre ele, considerându-se că variabila omisă este exprimată de cea reţinută în model; dacă datele sunt prezentate sub formă de serii cronologice, se pot calcula diferenţele de ordinul 1 ((1) = yt – yt-1), sau pot fi logaritmate valorile lui Yt, Xi în scopul atenuării coliniarităţii cauzate de prezenţa trendului în cadrul seriilor de date; Atenuarea multicoliniarității
Utilizarea de serii sincrone de date, formate în optică
transversală, poate constitui o modalitate de diminuare sau chiar de eliminare a interdependenţei factorilor. Un exemplu de serii sincrone se referă o observare a unui eşantion statistic de întreprinderi, judeţe, familii etc. Ca urmare a faptului că datele sunt culese pentru aceeaşi perioadă de timp, pe baza aceleaşi metodologii, dar în condiţii diferite de manifestare a factorilor, există şanse mai mari ca ipoteza privind independenţa factorilor să fie satisfăcută. Care sunt consecințele multicoliniarității? Efectele multicoliniarităţii sunt proporţionale cu intensitatea prezenţei acesteia în rândul variabilelor explicative.
Dacă două sau mai multe variabile explicative din modelul de
regresie multiplă sunt perfect corelate, estimatorii
parametrilor nu pot fi calculaţi prin metoda celor mai mici pătrate.
Efectul multicolinearităţii se manifestă în creşterea abaterii
standard a estimatorilor calculaţi pentru parametrii modelului, ceea ce reduce valoarea testului t statistic (Student). Aceasta face estimatorii mai puţin semnificativi (posibil chiar nesemnificativi). Totuşi, testul t rămâne valid. Care sunt consecințele multicoliniarității?
Se reduce precizia estimatorilor calculaţi pentru parametrii
modelului, în sensul că abaterea standard mare duce la creşterea intervalului de încredere în care sunt garantaţi parametrii. Valorile estimatorilor parametrilor modelului sunt afectate, având drept consecinţă deformarea acestor valori într-o asemenea măsură, încât devine neinteligibilă influenţa separată a variabilelor explicative asupra variabilei efect. Procedeee pentru eliminarea fenomenului de multicoliniaritate Metode apriorice - sunt utilizate în vederea selectării şi 1. ordonării introducerii în model a variabilelor explicative: - Metoda regresiei iterative. Se calculează matricea coeficienţilor de corelaţie liniară corespunzători variabilelor exogene. Dacă în matricea coeficienţilor de corelaţie există două variabile explicative al căror coeficient de corelaţie liniară indică o corelaţie puternică, pozitivă sau negativă, se recomandă de la început renunţarea la una dintre aceste variabile. - Metoda regresiei pas cu pas porneşte de la analiza
coeficienţilor de corelaţie , fiind introdusă mai întâi în model
variabila care îndeplinește condiția max , iar apoi cea care îndeplinește condiția max și tot așa. Procedeee pentru eliminarea fenomenului de multicoliniaritate Metodele aposteriorice, care constau în construirea de 2. modele econometrice cu toate variabilele explicative şi acceptarea acestora ca variabile exogene semnificative numai după verificarea testelor statistice care validează această ipoteză. În acest sens se calculează coeficienții de perfomanță globală și cei de performanță parțială ale modelelor. Prin compararea acestora se alege modelul econometric. În cazul modelelor cu acelaşi număr de variabile exogene, cel mai bun model este dat de restricţia : max. În cazul în care se compară două modele al căror număr de variabile exogene este diferit alegerea celui mai bun model se face cu ajutorul testului Fisher-Snedecor.