Sunteți pe pagina 1din 9

Tema: MULTICOLINIARITATEA

1. Esena Esena i consecinele multicoliniaritii 2. Metode i tehnici de detectare a multicoliniaritii 3. Metode de atenuare sau remediere a multicoliniaritii 4. Metode de selectare a variabilelor explicative. 5. Coeficienii pariali de corelaie

-1Verificarea semnificaiei unui model econometric presupune inclusiv verificarea ipotezelor de aplicare a metodei celor mai mici ptrate. In aceast etap este necesar verificarea aposterioric a acestor ipotezelor deoarece, n general, estimarea parametrilor se efectueaz n urma acceptrii apriorice a valabilitii ipotezelor enunate. Una din ipoteze I10 presupune c variabilele exogene s formeze un sistem de vectori liniari independeni, adic variabilele exogene s nu fie corelate (sau cel puin s nu fie perfect corelate). Altfel spus seriile variabilelor exogene trebuie s fie de covarian nul cov (xi, xj )=0, i j adic s fie ortogonale. Opusul acestui fenomen l reprezint multicoliniaritatea variabilelor exogen, fenomen foarte frecvent ntlnit n economie datorit multiplelor relaii de dependen i interdependen dintre fenomenele economice. n acest scop se impune o abordare econometric n scopul depistrii i eliminrii acestuia. Termenul de multicoliniaritate este utilizat atunci cnd la baza unui model econometric stau variabile explicative ce depind una de alta. Faptul c dou au mai multe variabile exogene se afl ntr-o corelaie semnificativ afecteaz calitatea rezultatelor obinute, deoarece variaia variabilei dependente nu mai este explicat prin contribuia separat distinct a fiecrei variabile exogene n parte. Astfel parametrul de regresie i pierde sensul economic. n coeficientul de regresie al unei variabile explicative xi este inclus i influena unei alte variabile xj cu care prima este corelat. n termeni econometrici multicoliniaritatea are urmtoarele consecine de baz:

variane mari ale estimatorilor coeficienilor de regresie. Dispersia estimatorilor funciei de

2 regresie S b este cu att mai mare cu ct gradul de multicoliniaritate este mai ridicat.

intervale mari de ncredere ale estimatorilor, din cauza abaterilor standard mari; raiile t Student nesemnificative, din cauza abaterilor standard mari; un coeficient mare de determinaie R2, dar raiile t nesemnificative;

instabilitatea estimatorilor i a abaterilor lor standard la mici schimbri ale datelor. Stabilitatea

unui estimator reprezint acea caracteristic a eantionului de observaii statistice care face ca adugarea de noi observaii (extinderea eantionului) s nu modifice semnificativ valoarea coeficienilor estimai. Multicoliniaritatea este caracterizat prin fluctuaii importante att ca semn ct i ca mrime a valorilor iniiale ale coeficienilor estimai, iar acest fapt afecteaz viabilitatea modelului, modelul nu mai poate fi utilizat n cadrul analizei i prognozei. n caz de multicoliniaritate perfect matricea XTX. este singular (determinatul este 0). In acest caz inversa respectivei matrice nu exist,estimarea coeficienilor este imposibil i variana lor, infinit Singularitatea matricei Un grad nalt de multicoliniaritate este echivalent cu o matrice singular. respectiv e imposibil de a calcula coeficienii funciei de regresie. -2Depistarea fenomenului de multicoliniaritate se poate efectua cu ajutorul mai multor procedee i teste cum ar fi: Reprezentarea grafic a seriilor de valori corespunztoare variabilelor explicative. n cazul n care se constat analogii n evoluia acestor variabile putem aprecia existena unor corelaii suficient de intense ntre variabilele respective.
xj x1

x2

Calculul determinantului matricei XTX. Pe msura ce valoarea acestui determinant se apropie

de 0, ne indic o intercorelare din ce n ce mai strns dintre variabilele exogene. Dac D(X TX)<0,1 se consider c fenomenul de multicoliniaritate este prezent. Calculul mrimii coeficientului de determinaie R2. Aceast valoare este comparat cu mrimea aceluiai coeficient obinut n condiiile n care una din variabilele factoriale este omis din model. n cazul n care valorile coeficienilor sunt apropiate ca mrime se poate considera c variabila omis este coliniar ci celelalte variabile factoriale. Absena acestei variabile din model ar fi de dorit ntruct ar conduce la diminuarea multicoliniaritii fr a afecta semnificativ gradul de determinare a factorilor asupra variabilei efect.

Testele statistice Student, t- utilizat n vederea verificrii semnificaiei parametrilor modelului

i testul Fisher F- utilizat n vederea verificrii semnificaiei modelului difer ca sens. n cazul n care testul F semnaleaz semnificaie, iar testul t, aplicat aceluiai model, semnaleaz nesemnificaii n rndul parametrilor, acest lucru reprezint un indiciu al prezenei multicoliniaritii.

Testul Klein care const n compararea coeficientului de determinaie R2 calculat pe baza unui

model de k factori i fiecare coeficient de corelaie simpl dintre variabilele explicative ridicate la
2 2 2 ptrat rxi , xj . Dac R < rxi , xj atunci exist prezumia de multicoliniaritate.

Calcularea determinantului corespunztor matricei coeficienilor de corelaie simpl dintre variabilele exogene care are forma:

1
D=

rx1x2 rx1x3 .... rx1xk rx 2 x3 ... rx2 xk

rx1x2 1

...... ...... ...... ... ...... rx1xk rx 2 xk rx3xk 1

n cazul n care determinantul tinde ctre valoarea zero exist riscul prezenei multicoliniaritii. Dac variabilele exogene sunt absolut necorelate atunci matricea coeficienilor de corelaie ar fi o matrice unitar, elementele nediagonale fiind egale cu zero, iar determinantul acestei matrice ar fi egal cu 1. De exemplu pentru un model de 3 variabile vom avea:

1 rx1x2 rx1x3 1 0 0 D= r x1x2 1 rx2 x3 = 0 1 0 =1 rx1x3 rx2x3 1 0 0 1


n caz contrar, cnd ntre variabilele explicative exist o corelaie liniar perfect atunci coeficienii de corelaie sunt egali cu 1, i determinantul matricii este egal cu 0.

1 rx1x2 rx1x3 1 1 1 D= r x1x2 1 rx2 x3 = 1 1 1 =0 rx1x3 rx2x3 1 1 1 1


a) Testul lui Farrar i Glauber calcularea determinantului corespunztor matricii coeficienilor de corelaie simpl dintre variabilele exogene. efectuarea testului 2 , postulnd urmtoarele ipoteze: H0: D=1 (seriile sunt independente) H1: D<1 (seriile sunt dependente, avem multicoliniaritate) Valoarea empiric 2 calculat de Farrar i Glauber:
1 2 = [n 1 (2 p + 5)] * ln D 6
2 n- mrimea eantionului, p- numrul de parametri n model. Valoarea 2 se compar cu

Detectarea multicoliniaritii presupune parcurgerea a 2 etape:

b)

preluat din cadrul tabelelor repartiiei 2 hi ptrat corespunztor unui nivel de semnificaie i
1 p ( p 1) grade de libertate. 2
2 2 2 Dac 2 < atunci vom accepta ipoteza nul H0, ipoteza de ortogonalitate, dac ns > vom

accepta ipoteza alternativ H1, ecuaia de regresie fiind susceptibil de multicoliniaritate. -3Printre metodele de atenuare sau remediere a multicoliniaritii vom enumera: a) Extinderea eantionului. Datorit faptului c seriile de date privind variabila efect i factorii si determinani sunt alctuite, de cele mai dese ori, dintr-un numr redus de termeni se recomand includerea de termeni suplimentar, astfel nct eventualele analogii s fie pe ct posibil eliminate. Aceast metod ns are un grad redus de eficien, deoarece fie nu exist posibilitatea includerii de observaii statistice suplimentare, presupunnd c toate datele disponibile sunt utilizate, fie c noile date introduse nu vor modifica n mod esenial caracteristicile eantionului iniial i nu vor conduce la atenuarea multicoliniaritii.

b)

Renunarea la una sau cteva variabile exogene . n situaia n care 2 variabile cauzale sunt

intens corelate se poate renuna la una din ele, considerndu-se c variabila omis este exprimat de cea reinut n model.

c)

Calcularea diferenelor de ordinul unu sau logaritmarea valorilor variabilelor Y i Xj Dac

datele sunt prezentate sub form de serii cronologice se pot calcula diferenele de ordinul 1:
(1) = y t y t 1 sau trecerea la valori logaritmate, n scopul atenurii coliniaritii cauzate de

prezena trendului n cadrul seriilor de date. d) Trecerea la un model ce ar caracteriza nu doar influena separat a factorilor, dar i interdependena lor asupra variabilei rezultative. Spre exemplu pentru un model de 3 factori:
y = a 0 + a1 x1 + a 2 x 2 + a3 x3 + u

Se poate utiliza un model extins: y = a0 + a1 x1 + a 2 x 2 + a3 x3 + a12 x1 x 2 + a13 x1 x3 + a 23 x 2 x3 + u e) Aplicarea regresiei Ridge. Este o metod pur numeric i const n transformarea matricii XTX ntr-o matrice (XTX +cI) unde c este o constant arbitrar aleasa, iar I- matricea unitar. Constanta c multiplicat cu elementele diagonalei principale face s creasc valorile acestora, reducnd n acest fel efectele numerice ale multicoliniaritii.

0 + c + a 1 x1i + a 2 x 2i + ... + a k x ki = y i na i i i i a 1 x12i + c + a 2 x1i x 2i ... + a k x1i x ki = y i x1i x1i + a 0 i i i i i ............................................................................................. 2 0 x ki + a 1 x1i x ki + c + a 2 x 2i x ki ... + a k x ki + c = y i x ki a i i i i i
-4n practic n cadrul elaborrii unui model multifactorial ne confruntm cu alegerea variabilelor explicative x1 x2,xk candidate la explicarea variabilei rezultative y. Includerea n cadrul ecuaiei de regresie multipl al unui set de factori de maxim semnificaie este legat n primul rnd de perceperea i experiena cercettorului privind natura interdependenei dintre indicatorul supus modelrii i factorii de influen ce-l determin. Factorii inclui in model trebuie s satisfac urmtoarele condiii: a) ei trebuie s fie exprimai cantitativ. n cazul includerii unor factori calitativi e necesar s li se atribuie o expresie numeric. b) factorii nu trebuie s fie corelai ntre ei i cu att mai mult s nu fie ntr-o legtur funcional.

Daca construim un model multifactorial de k factori atunci includerea unui factor suplimentar
2 2 trebuie s satisfac urmtoarele condiii: Rk2+1 > Rk2 i S u ( k +1) < S u ( k )

Selecia variabilelor exogene are loc n baza unei analize teoretico-economice calitative. Totui analiza teoretic deseori nu ofer un rspuns clar privind exprimarea cantitativ a intensitii legturii dintre variabile i oportunitatea includerii unui factor n model. Astfel in prim faza se aleg factorii de influen reieind din esena problemei. Apoi pe baza matricii coeficienilor de corelaie simpl sunt alei factorii ce au o intensitate puternic cu variabila rezultativ. La fel pe baza acestei matrice poate fi analizat corelaia dintre factori i de a elimina variabilele explicative ce se dubleaz. Dou variabile sunt evident corelate dac rxixj > 0,7 . Dac factori sunt puternic corelai atunci ei se dubleaz i unul din ei trebuie eliminat din model. Preferin i se acord nu factorului ce este cel mai puternic corelat cu variabila y, ci factorului care fiind puternic corelat cu y are n acelai timp o corelaie mai slab cu ceilali factori. Presupunem ca avem un model de 3 factori i este cunoscut matricea coeficienilor de corelaie simpl:

y x1 x2 x3

y 1 0,8 0,7 0,6

x1 0,8 1 0,8 0,5


0,8 > 0,7

x2 0,7 0,8 1 0,2

x3 0,6 0,5 0,2 1

Este evident c factorii x1 i x2 se dubleaz rx1x 2 = 0,8 corelaie puternic. n model este binevenit includerea variabilei x2 i nu x1 cu toate c corelaia variabilei x1 cu y este mai mare dect cea a variabilei x 2 cu y

ryx1 > ryx 2

Dar corelaia fiecrui factor x1 i x2 cu variabila x3 ne arat c

rx1x 3 = 0,5 iar rx 2 x 3 = 0,2 Astfel vom alege x2 i x3 aceste variabile fiind mai puin corelate avnd o

influen medie asupra variabilei rezultative. Sunt ns o serie de proceduri sau metode ce permit mai uor de a face selectarea variabilelor explicative i n acelai timp s evitm fenomenul de multicoliniaritate. 1) Metoda regresiei multiple. Toate regresiile posibile. Vor fi estimate toate modelele posibile prin combinarea variabilelor independente. Dac vom avea k factori vom avea 2k-1 combinaii. Pentru fiecare model calculndu-se testndu-se semnificaia coeficienilor de regresie prin testul t-Student la fel calculndu-se R2 reinndu-se modelul cu R2 maximal. Evident, aceast metod este aplicat numai n cazul uni numr redus de variabile independente, deoarece ansamblul combinaiilor posibile crete exponenial cu acest numr (dac k=10 numrul de combinaii este 1023)

2)

Metoda eliminrii progresive n amonte (backward elimination) . Acest procedeu const efectuarea unei regresii complete cu toate k variabile explicative. Eliminarea are lor din

aproape n aproape, adic acea variabil creia i corespunde un cel mai mic t-Student sub nivelul critic acceptat va fi eliminat din ecuaie, iar regresia este reestimat n noile condiii. (
ta j = j a Sa j j 0 < t , n p a

i xj este eliminat din model). Procedeul continu prin eliminarea

progresiv a altor variabile aflate n aceleai situaie pn la obinerea unei ecuaii satisfctoare. Aceast procedur este real doar cnd prima ecuaie poate fi estimat ceea ce nu se reuete adeseori existnd riscul ca matricea XTX s fie singular. 3) Metoda eliminrii progresive n aval (forward regresion). Este un procedeu opus celui precedent. Ecuaia de regresie iniial n acest caz conine o singur variabil explicativ, cea care prezint cel mai mare coeficient de corelaie simpl cu variabila explicat y. Fie xj acea variabil inclusa n model. n a doua etap se determin coeficienii de corelaie parial ntre y i fiecare din celelalte variabile explicative i se reine acea variabil a crui coeficient este mai relevant. 4) Metoda regresiei pas cu pas ( stepwise regresion) . Aceast procedur este identic celei precedente, singura diferen constnd n faptul c dup introducerea unei noi variabile exogene analizeaz testul t-Student al fiecrei variabile selecionate n prealabil eliminndu-se acelea al crui t este inferior nivelului critic acceptat. 5) Metoda regresiei etapizate (stagewise regresion). Acest procedeu const n selectarea variabilelor care se bazeaz pe minimizarea intercorelaiilor existente ntre variabilele explicative prin analiza termenului rezidual. Prima etap pornete de la analiza coeficienilor de corelaie ryxj. Se alege acea variabil explicativ al crui coeficient de corelaie simpl cu variabila endogen y este cel mai ridicat (max ryxj). Fie acea variabil xi. Se construiete modelul liniar y=a0+a1xi+u i se determin variabile
0 a 1 xi rezidual corespunztor acestei regresii: e1 = y a

n etapa a doua se calculeaz coeficienii de corelaie simpl ntre e1 i fiecare dintre variabilele explicative rmase ( re1xj
j i ) reinnd variabila cu cel mai mare coeficient ( max re1xj). Fie

xh variabil nou ce va fi introdus n model. Etapa 3. Se construiete un al doilea model ce corespunde dependenei variabilei y i celor dou variabile exogene reinute n etapele precedente: y=a0+a1xi+a2xh+u calculndu-se ulterior i
0 a 1 xi a 2 xh valorile termenului rezidual e2 pentru modelul 2: e2 = y a

Etapa 4. Se calculeaz din nou coeficienii de corelaie ntre noul termen rezidual e2 i fiecare variabilele explicative rmase (re1xj
j i, h) reinndu-se variabila pentru care coefiecientul

respectiv are cea mai ridicat valoare (max re2xj). Noua variabila introdus permite modelarea unui nou model i calcularea valorilor pentru cel de-al treilea termen rezidual.

Procedeul continu pn in momentul n care coeficienii de corelaie simpl calculai devin foarte apropiai de zero. Toate aceste modele obinute pe parcurs sunt testate cu ajutorul testelor
2 2 2 cunoscute t i F urmrindu-se i verificarea condiiei: R y , xi < R y , xh < ... < R y , xixh... xk adic are

loc o cretere progresiv a coeficientului de determinaie.

-5Coeficienii pariali de corelaie caracterizeaz intensitatea legturii dintre variabila rezultativ y i un oarecare factor de influen xj prin eliminarea influenei celorlali factori inclui n ecuaia de regresie. ntr-un model de m factori

y = a + b1 x1 + b2 x2 ... + bm xm + coeficientul

de corelaie

parial exprim influena variabilei xi asupra rezultatului y n condiiile in care influena altor factori din model este eliminat:

ryxi x1x2 ... xi 1xi +1... xm = 1


unde:
2 Ryx coeficientul 1x2 ... xi ... xm

2 1 Ryx 1x2 ... xi ... xm 2 1 Ryx 1x2 ... xi 1xi +1 ... xm

(1)
2 Ryx 1x2 ... xi 1xi +1 ... xm

de determinaie a modelului cu m factori,

coeficientul de determinaie a modelului n care variabila xi a fost eliminat. ntr-un model de 2 factori relaia (1) devine:

ryx1x2 = 1

2 1 Ryx 1x2 2 1 ryx 2

ryx2 x1 = 1

2 1 Ryx 1x2 2 1 ryx 1

(1a)

Ordinul coeficienilor de corelaie pariali se determin n funcie de numrul de factori a cror influen este eliminat. Astfel

ryx1x2

este un coeficient de corelaie parial de ordinul 1.

Corespunztor coeficienii de corelaie simpl se numesc coeficieni de corelaie de ordinul 0. n cadrul unui model de 2 factori putem utiliza relaiile de mai jos:

ryx1x2 =

( 1 r ) ( 1 r )
2 yx2 2 x1x2

ryx1 ryx2 rx1x2

ryx2 x1 =

( 1 r ) ( 1 r )
2 yx1 2 x1x2

ryx2 ryx1 rx1x2

ryx1x2 coeficienii parial de corelaie dintre y i x1 n condiiile n care influena factorului x2 a

fost eliminat
ryx2 x1 coeficienii parial de corelaie dintre y i x2 n condiiile n care influena factorului x1 a

fost eliminat

S-ar putea să vă placă și