Sunteți pe pagina 1din 12

Multicoliniaritatea

Ce înseamnă multicoliniaritatea?
Multicoliniaritatea presupune existenţa unei relaţii liniare
între valorile variabilei explicative.

Să presupunem că în ecuaţia de regresie:


Y = a0 + a1X1 + a2X2 + e, între variabilele X1 şi X2 există o
relaţie de forma X 2t  a  bX 1t ,   t , unde a şi b sunt parametrii
cunoscuţi.
Dacă se înlocuieşte a doua relaţie în prima relaţie se obţine:
Y  a 0  a1 X 1  a 2 X 2  e   a 0  aa 2    a1  a 2 b  X 1  e

Sistemul necunoscutele â0, â1 şi â2 este nedeterminat (are


două ecuaţii şi trei necunoscute).
Cum identificăm multicoliniaritatea?

a. Coeficienţii de corelaţie liniară, calculaţi pentru perechile de


variabile explicative din model, sunt mari în valoare absolută
(sunt, în modul, apropiaţi de +1).

b.Determinantul matricei (X'X) are valori în apropierea lui zero.

c.Coeficientul de determinare R2 este mare, iar valorile testelor t


(Student), calculate pentru parametrii modelului sunt mici.

d.Estimatorii parametrilor sunt sensibili la specificarea


modelului.
Depistarea fenomenului de multicoliniaritate
Prima metodă
Reprezentarea grafică a seriilor de valori corespunzătoare
variabilelor explicative. Analogiile în evoluție ne arată o
corelație suficient de intensă între variabilele explicative.
Depistarea fenomenului de multicoliniaritate
A doua metodă
Calculul determinantului matricii X`X, Det(X`X); cu cât
valoarea acestui determinant este mai apropiată de zero, cu atât
corelaţia dintre variabile este mai puternică.
Dacă D(X`X) < 0,1 se consideră că fenomenul de
multicoliniaritate este prezent.
A treia metodă
Se calculează raportul de determinare (R2). Această valoare se
compară cu mărimea aceluiaşi coeficient obţinut în condiţiile în
care una dintre variabilele factoriale a fost omisă din model. În
cazul în care valorile coeficienţilor sunt apropiate ca mărime se
poate considera că variabila omisă este coliniară cu celelalte
variabile factoriale.
Depistarea fenomenului de multicoliniaritate
A patra metodă
Folosirea testele statistice Student, t- utilizat în vederea
verificării semnificaţiei parametrilor modelului, şi Fisher-
Snedecor, F- utilizat în vederea verificării semnificaţiei
modelului.
În cazul în care testul F semnalează semnificaţie, iar testul t,
aplicat aceluiaşi model, semnalează nesemnificaţii în rândul
parametrilor, acest lucru reprezintă un indiciu că
multicoliniaritatea este prezentă.
Atenuarea multicoliniarității

se recomandă folosirea unor serii de date cât mai lungi


(T>15), astfel încât eventualele analogii, datorate hazardului,
să fie, pe cât posibil, eliminate;
în situaţia în care două variabile exogene sunt intens corelate
(una dintre ele este coliniară cu cealaltă), se poate renunţa la
una dintre ele, considerându-se că variabila omisă este
exprimată de cea reţinută în model;
dacă datele sunt prezentate sub formă de serii cronologice, se
pot calcula diferenţele de ordinul 1 ((1) = yt – yt-1), sau pot fi
logaritmate valorile lui Yt, Xi în scopul atenuării coliniarităţii
cauzate de prezenţa trendului în cadrul seriilor de date;
Atenuarea multicoliniarității

Utilizarea de serii sincrone de date, formate în optică


transversală, poate constitui o modalitate de diminuare sau
chiar de eliminare a interdependenţei factorilor.
Un exemplu de serii sincrone se referă o observare a unui
eşantion statistic de întreprinderi, judeţe, familii etc. Ca urmare a
faptului că datele sunt culese pentru aceeaşi perioadă de timp, pe
baza aceleaşi metodologii, dar în condiţii diferite de manifestare a
factorilor, există şanse mai mari ca ipoteza privind independenţa
factorilor să fie satisfăcută.
Care sunt consecințele multicoliniarității?
Efectele multicoliniarităţii sunt proporţionale cu
intensitatea prezenţei acesteia în rândul variabilelor explicative.
 
 Dacă două sau mai multe variabile explicative din modelul de

regresie multiplă sunt perfect corelate, estimatorii


parametrilor nu pot fi calculaţi prin metoda celor mai mici
pătrate.

 Efectul multicolinearităţii se manifestă în creşterea abaterii


standard a estimatorilor calculaţi pentru parametrii
modelului, ceea ce reduce valoarea testului t statistic
(Student). Aceasta face estimatorii mai puţin semnificativi
(posibil chiar nesemnificativi). Totuşi, testul t rămâne valid.
Care sunt consecințele multicoliniarității?

 Se reduce precizia estimatorilor calculaţi pentru parametrii


modelului, în sensul că abaterea standard mare duce la
creşterea intervalului de încredere în care sunt garantaţi
parametrii.
 Valorile estimatorilor parametrilor modelului sunt afectate,
având drept consecinţă deformarea acestor valori într-o
asemenea măsură, încât devine neinteligibilă influenţa
separată a variabilelor explicative asupra variabilei efect.
Procedeee pentru eliminarea fenomenului de
multicoliniaritate
   Metode apriorice - sunt utilizate în vederea selectării şi
1.
ordonării introducerii în model a variabilelor explicative:
 - Metoda regresiei iterative. Se calculează matricea
coeficienţilor de corelaţie liniară corespunzători variabilelor
exogene. Dacă în matricea coeficienţilor de corelaţie există
două variabile explicative al căror coeficient de corelaţie
liniară indică o corelaţie puternică, pozitivă sau negativă, se
recomandă de la început renunţarea la una dintre aceste
variabile.
 - Metoda regresiei pas cu pas porneşte de la analiza

coeficienţilor de corelaţie , fiind introdusă mai întâi în model


variabila care îndeplinește condiția max , iar apoi cea care
îndeplinește condiția max și tot așa.
Procedeee pentru eliminarea fenomenului de
multicoliniaritate
   Metodele aposteriorice, care constau în construirea de
2.
modele econometrice cu toate variabilele explicative şi
acceptarea acestora ca variabile exogene semnificative numai
după verificarea testelor statistice care validează această
ipoteză.
În acest sens se calculează coeficienții de perfomanță globală
și cei de performanță parțială ale modelelor. Prin compararea
acestora se alege modelul econometric.
În cazul modelelor cu acelaşi număr de variabile exogene, cel
mai bun model este dat de restricţia : max.
În cazul în care se compară două modele al căror număr de
variabile exogene este diferit alegerea celui mai bun model se
face cu ajutorul testului Fisher-Snedecor.

S-ar putea să vă placă și