Sunteți pe pagina 1din 82

ECONOMETRIE

- anul universitar 20132013-2014


2014--

Planul cursului
1. Introducere

Estimarea i testarea parametrilor unei popula


populaii
ii
2.
3.
4.
5
5.

Modelul de regresie liniar simpl


Modelul de regresie liniar multipl
Modele
Modele de regresie ne
neliniar
liniar
Verificarea ipoteze
potezelor
lor modelului de regresie

5. Verificarea ipoteze
potezelor
lor modelului de
regresie
i
Ipotezele statistice care se formuleaz n modelarea
Ipotezele
econometric sunt ipoteze asupra componentei
aleatoare (erorilor) i ipoteze asupra componentei
deterministe (variabilelor independente).
independente).

5.1.

Ipotezele asupra componentei


(erorilor) sunt urmtoarele
urmtoarele::
a. Media erorilor este nul: M(
M(i)=0.
b Ipoteza de homoscedasticitate:
b.
homoscedasticitate: V(
V(i))=
)=
2

aleatoare

c. Ipoteza de normalitate
normalitate:: i ~ N (0, 2 )
p
de ne
necorelare
corelare sau de independen
p
a erorilor:
d. Ipoteza
cov(i, i)=0.

a. Media erorilor este nul


1. Definire:
Definire: M(
M(
(i))=
)=0
0 care este echivalent
echivalent
cu M(Y/X)=
M(Y/X)=
( / ) 0+
1X
2. Efectele nclcrii acestei ipoteze:
ipoteze:
dac aceast ipotez este nclcat, atunci se modific
proprietile estimatorilor parametrilor modelului de
regresie (parametrii sunt estimai deplasat sau cu o
eroare sistematic)
sistematic)..

3. Testarea ipotezei cu privire la media


erorilor
I
Ipoteze:
M()=0
H0: M(
H1: M(
M()#0

Alegerea testului: t = M ( ) M ( )

( ) )
V ( M

Calculul statisticii test:


tcalc

M ( ei )
=
sM ( )

Decizie
5

4. Exemplu
p

Residuals Statisticsa
Predicted Value
Residual
Std. Predicted Value
Std. Residual

Minimum
58508,12
-98125,2
-,778
,778
-1,290

Maximum
6084511
131202,7
2,300
1,725

Mean
1582428
,00000
,000
,000

Std. Deviation
1957596,554
73271,63549
1,000
,964

N
15
15
15
15

a. Dependent Variable: salariu

One-Sample Statistics
N
Unstandardized Residual

15

Mean
,0000000

Std. Deviation
73271,63549

Std. Error
Mean
18918,65

One-Sample Test
Test Value = 0

t
Unstandardized Residual

df
,000
000

14

Sig. (2-tailed)
1 000
1,000

Mean
Difference
,00000000
00000000

95% Confidence
Interval of the
Difference
Lower
Upper
-40576 5 40576,48
-40576,5
40576 48

5. Corectarea modelului
Modelul
d l l

iniial
ini
iall se corecteaz

estimaiei
erorilor
calculate
eantionului..
eantionului
Modelul corectat este de forma:
forma:
*
yi

= yi M ( i )

cu
la

ajutorull
nivelul

, unde:
unde:
*
yi

= 0 + i xi + u i
9

b. Ipoteza
p
de homoscedasticitate a erorilor

1.

Definire

ipoteza de homoscedasticitate
variana
i erorilor
il s
fie
fi constant
constant:
t t:

presupune

ca

V(i ) = 2
-

aceast ipotez presupune o varian constant i


egal a erorilor la nivelul distribuiilor condiionate
de forma Y X = x
i

10

2. Efectele nclcrii acestei ipoteze


p

pierderea eficienei
p
estimatorilor p
parametrilor modelului de
regresie (estimeaz parametrul cu o varian mai mare).
mare).

3. Identificarea heteroscedasticitii
3.1. Procedee grafice
- presupun reprezentarea distribuiei erorilor i aprecierea
varianei acesteia
acesteia..

11

- cazul existenei
heteroscedasticitii:

3
2
1
X
0

Residuals
0

10

15

20

25

30

35

-1
-2
-3

12

3.2. Procedee numerice


a. Testul Glejser

are la baz un model de regresie ntre variabila


rezidual estimat i variabila independent.
independent.

Etapele testrii:
testrii:
1.
Se estimeaz modelul de regresie
g
de forma
forma::

Y = 0 + 1 X +
2.
3.

S calculeaz
Se
l l erorile
il estimate
i
ei.
Se construiete un model de regresie pe baza
erorilor estimate n valoare absolut i variabila
13

independent. Exemplu:

i = 0 + 1 xi + u i
4.

Se testeaz p
parametrii acestui model
model:: dac
parametrul 1 este semnificativ, atunci modelul iniial
este heteroscedastic
heteroscedastic..

Exemplu::
Exemplu
14

Coefficientsa

Model
1

(Constant)
PIB

Unstandardized
Coefficients
B
Std. Error
50921 663 12000,771
50921,663
12000 771
,016
,012

Standardized
Coefficients
Beta
,348

t
4 243
4,243
1,337

Sig.
,001
001
,204

a. Dependent Variable: erori

15

b. Testul
T
l Spearman
S
(coeficient
( fi i
all corela
corela
l iei
i i neparametrice)
i )
-

se bazeaz pe calculul rangurilor valorilor estimate ale


erorilor i , i a valorilor Xi .
erorilor,

Ipoteze
p
statistice::
statistice
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate

Statistica test:
test:

t=

n 2
1 2
16

V l
Valoarea
calculat
l l a statisticii
i i ii test
test::
tcalc =

r n2
1 r2

unde: r este o estimaie a coeficientului Spearman, care


unde:
se calculeaz astfel
astfel::

r = 1

6 di2
i
2

n( n 1 )
17

- unde:
d

d i = R ei R xi

- se consider
id rangull 1 pentru
t
cea maii mare valoare,
l
rangul 2 pentru urmtoarea valoare ca mrime, .a.m.d.,
pentru ambele iruri de valori xi i ei.
p

18

Regula de decizie:
tcalc>tteor

sau o valoare a lui Sig


Sig.
g. asociat statisticii test t
Student calculate < 0,05 duce la respingerea ipotezei Ho.

Exemplu:
Exemplu:
n studiul legturii dintre dou
dou
variabile, X i Y, s-au
obinut urmtoarele rezultate
rezultate::

19

Correlations

Spearman's rho X

Correlation Coefficient
Sig. (2-tailed)
N
Unstandardized Residual Correlation Coefficient
Sig. (2-tailed)
N

X
1,000
.
5
,000
1,000
5

Unstandardiz
ed Residual
,000
1,000
5
1,000
.
5

20

Se cere s se testeze ipoteza


p
de homoscedasticitate,,
considernd un risc de 0,05
05..
Rezolvare:
Pentru aceasta, se formuleaz urmtoarele ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate

21

S i i test :
Statistica

t=

r n2
1 r2

22

Coeficientul
f
l

Spearman este:

r =0
Statistica

t calc =

test t Student se calculeaz astfel:

r n2
1 r2

0 52
=
=0
10
23

Regula de decizie:
-

pentru exemplul
l l dat:
d

(tcalc = 0) < (t0,025;3 = 3,182)


Deci, se accept,
p cu o p
probabilitate de 0,95,
95, ipoteza
p
Ho,
ipoteza de homoscedasticitate.
homoscedasticitate.

24

c. Testul GoldfeldGoldfeld-Quandt
Q
A la
Are
l baz
b ideea
id
c
ntre

valorile
l il varianei
i
i erorilor
il la
l
nivelul repartiiilor condiionate i valorile variabilei
dependente
p
exist o legtur
g
pozitiv de forma
p
forma::

2
i

2
xi

Ipoteze statistice
statistice::
H0: ipoteza
i t
d homoscedasticitate
de
h
d ti it t
H1: ipoteza de heteroscedasticitate
25

Etape pentru calculul statisticii test:


- se ordoneaz cresctor seria valorilor empirice
p
xi .
- se mparte seria n dou pri egale, dup omiterea unui set
de date din centrul seriei (n cazul seriilor cu un numr
mare de termeni);
termeni);
- se estimeaz parametrii ecuaiei de regresie pentru fiecare
din cele dou seturi de date i se calculeaz variaia
rezidual (RSS) p
pentru fiecare model n p
parte;;
parte

26

se calculeaz statistica test Fisher care compar cele


dou variaii reziduale:
reziduale:

Fcalc

RSS 2
=
RSS 1

unde: RSS1 corespunde celei mai mici valori a variaiei


unde:
reziduale..
reziduale

Regula de decizie:
decizie:
27

Fcalc > F0 , 05;n k ;n k


- dac
d
dac
respinge ipoteza Ho
Ho..

sau Sig
Si .<0.05
Sig.
05,, atuncii se

Exemplu:
p
Pentru dou variabile, X i Y, se cunosc urmtoarele
valori:
valori
l i:

28

xi
2
3
1
4
6
5
7
8
9
10

yi
15
20
10
19
25
23
30
35
38
40
29

Se cere s se testeze ipoteza


p
de homoscedasticitate,,
folosind testul Goldfeld
Goldfeld--Quandt.
Quandt.

Rezolvare:
Rezolvare:
1.
Se ordoneaz cresctor irul valorilor xi.
2
2.
Se mparte seria valorilor xi n dou serii
serii:: prima serie este
reprezentat de valorile 1, 2, , 5; iar a doua serie este
reprezentat de valorile 6, 7, , 10.
10.

30

3. Pentru fiecare din cele dou serii se estimeaz parametrii


p
modelului de regresie.
regresie. Se obine
obine::
Seria 1: Yx=8,3
=8
=8,3+3X
3+3X
3+3X
Seria 2:
2: Yx=3,2+3,8X
4. Pentru aceste modele, se estimeaz variaia rezidual
(valoare prezentat n outputoutput-ul ANOVA):
ANOVA):
- pentru seria 1: RSS=
RSS=3
3,73
73;;
- pentru seria 2: RSS=1
RSS=1,6.

31

5. Se calculeaz raportul F, considernd RSS1 cea mai


mic valoare, i anume RSS1=1,6:
Fcalc=3,73/1,6=2,33.
3 73/1 6 2 33
6
6. Se compar valoarea calculat a statisticii test F cu
valoarea teoretic:

F0 , 05;n1 k ;n2 k = F0 , 05 ;5 2;5 2 = 9,277 .


(k este numrul de parametri estimai).
32

7 Interpretare:
7.
I

( Fcalc = 2,33) < ( F0 , 05 ;3;3 = 9,277 )


Pentru exemplul dat, se accept ipoteza
homoscedasticitate, cu o probabilitate de 0,95
95..

de

33

4. Corectarea heteroscedasticitii
4.1. Dac se cunosc parametrii

i2

Corecia heteroscedasticitii este


modelului
d l l i de
d regresie
i liniar
li i simpl
simpl:
i l:

aplicat

y i = 0 + 1 xi + i
Corectarea
heteroscedasticitii
presupune
ponderarea
d
modelului
d l l i iniial
i ii l cu variabila
i bil 1 .
i

34

Noull model
d l de
d regresie (corectat)
(
) se obine
b
astfel::
astfel

0
xi i
=
+ 1
+
i i
i i
yi

Estimarea parametrilor acestui model se


realizeaz
li
pe baza
b
MCMMP ponderat
d t (method
th d
of weighted least squares).
35

4 2 Dac nu se cunosc parametrii


4.2.

i2

Corecia heteroscedasticitii se realizeaz pe


baza relaiei:
relaiei
:
2
i

2 2
xi

Corectarea
heteroscedasticitii
presupune
ponderarea modelului iniial cu variabila 1/xi.

36

Noull model
d l de
d regresie (corectat)
(
) este de
d
forma::
forma

yi 0
i
=
+ 1 +
xi
xi
xi

37

c. Ipoteza
p
erorilor

de

normalitate

1. Formularea problemei
-

erorile urmeaz o lege normal de medie 0 i


varian
i 2:

i ~ N (0, 2 )
2. Efectele nclcrii acestei ipoteze
-

ip
poteza de normalitate a erorilor este important
p
pentru stabilirea proprietilor estimatorilor
parametrilor modelului de regresie.
regresie.
38

i ~ N ( 0 , )
2

dac
ac

, atunci
t
i estimatorii
ti t ii parametrilor
t il
modelului de regresie urmeaz, de asemenea, o lege
normal::
normal

i ~ N ( i , 2 )
i

dac ipoteza de normalitate este nclcat, atunci


estimatorii parametrilor modelului de regresie nu urmeaz
o lege normal (pentru eantioane de volum mare,
proprietatea
i t t de
d normalitate
lit t este
t atins
ti asimptotic)
asimptotic).
i t ti ).

39

3. Verificarea normalitii erorilor


3.1. Procedee grafice
g
-

Histograma (curba frecven


frecvenei)
ei):: legea normal este definit
de funcia de densitate de probabilitate care este
reprezentat grafic prin curba densitii de probabilitate,
curb cu alur de clopot
clopot..
Box--Plot;
Box
Plot;
P-P Plot
Plot;;
Q-Q Plot.
Plot.

40

a.

Reprezentarea histogramei i a curbei frecvenelor

se reprezint curba frecvenei sau histograma


reziduurilor
id il ii se observ
b
dac
d forma
f
distribuiei
di t ib i i
acestora are alur de clopot
clopot..

Exemplu::
Exemplu

41

Histograma i curba frecvenelor

Histogram
Dependent Variable: greut
Freque
ency

3,0
2,5
2,0
1,5
1,0
0,5
0,0
-2

-1

Regression Standardized Residual

Mean = -1
1,85E
85E-15
15
Std. Dev. = 0,943
N = 10

42

b. Box
Box--plot

70

65

60

55

50

45
greut

43

c. P-P Plot

Normal P-P Plot of Regression Standardized


Residual
Dependent Variable: greut
Ex
xpected Cum
m Prob

1,0
0,8
0,6
0,4
0,2
0,0
0,0

0,2

0,4

0,6

0,8

1,0

Observed Cum Prob

44

3.2. Procedee numerice


a. Testul KolmogorovKolmogorov-SmirnovSmirnov-Lilliefors (KSL)
-

presupune compararea frecvenelor cumulate (calculate)


cu frecvenele

teoretice cumulate extrase din tabelul


Gauss..
Gauss

Ipoteze statistice:

H0: ipoteza de normalitate


H1: distribuia erorilor nu urmeaz o lege normal

Regula de decizie:

45

valoarea
l
probabilitii
b bili ii asociate
i
statisticii
i i ii test calculate
l l
(Sig..) se compar cu
(Sig
(0,05
05)): dac Sig
Sig..<0,05
05,,
p g ipoteza
p
de normalitate a erorilor.
erorilor.
atunci se respinge

Exemplu::
Exemplu

46

One-Sample Kolmogorov-Smirnov Test


greut
N
Normal Parameters

a,b

Most Extreme
Differences

Mean
Std. Deviation
Absolute
Positive
Negative

Kolmogorov-Smirnov Z
A
Asymp.
Si
Sig. (2
(2-tailed)
t il d)

10
58,5000
7,83511
,276
276
,161
-,276
,873
,432
432

a. Test distribution is Normal.


b. Calculated from data.

47

b. Testul Jarque
Jarque--Bera
-

se bazeaz pe verificarea simultan a proprietilor


de asimetrie i boltire ale seriei reziduurilor
reziduurilor.. Pentru
o distribuie normal,
normal valoarea coeficientului de
asimetrie Fisher (skewness) este zero, iar valoarea
coeficientului de boltire Fisher (kurtosis) este zero
zero..

Ipoteze statistice
H0: ipoteza
i
de
d normalitate
li
H1: distribuia erorilor nu urmeaz o lege normal
48

Calculul statisticii test:

statistica
i i test JB se calculeaz
l l dup
d relaia:
relaia
l i :
n 2 ku 2

JB = sk +
6
4

unde:: sw este coeficientul de asimetrie (Skewness):


unde

sw =

3
3

ku este coeficientul de boltire (Kurtosis):


ku =

4
3
2
2

49

n cazul unui model de regresie,


g
, estimaiile

celor doi
parametri ai formei unei distribuii au urmtoarele relaii
relaii::

sw =

(
i

(
i

e i3 2
)
n2
e i2 3
)
n2

ei4
i n 2
ku =
3
2
e
( i )2
i n 2
50

unde: ei = y i y x

Regula de decizie:

Statistica JB urmeaz o lege

,2 .
2

- dac valoarea calculat a statisticii test JBcalc> ; 2


sau Sig
Sig..<, atunci se respinge ipoteza Ho
Ho..

51

Exemplu

Descriptive Statistics
Std
Std.
N
Minimum
Mi
i
M i
Maximum
M
Mean
Statistic Statistic Statistic Statistic Statistic
Unstandardized Resid
7 -2.61905 2.14286 0000000 1.889822
Valid N (listwise)
7

Skewness
Sk
K t i
Kurtosis
Statistic Std. Error Statistic Std. Error
-.529
.794
-1.375
1.587

52

d. Ipoteza de ne
necorelare
corelare sau
independen a erorilor:
erorilor: cov(i, i)=
)=0
0.
1.

de

Noiuni

a. Autocorelarea
Autocorelarea sau corelaia serial :
-

presupune existena unei autocorelri ntre


erorile , altfel spus:
spus
p : cov((i, j) # 0 sau M((i, j )
# 0.

b. Coeficientul de autocorelaie
-

coeficientul de autocorelaie ntre erorile i i i-1


ale unui model de regresie se calculeaz dup
53

relaia:
relaia
l i :

cov( i , i1 )

i i1

cov( i , i1 )

acest coeficient este un coeficient de autocorelaie de


ordinul 1.
coeficientul de autocorelaie de ordinul k este
coeficientul de corelaie calculat ntre termenii i i i-k ,
dup relaia
relaia::
cov( i , i k ) cov( i , i k )
=

i i k

54

c. Funcia de autocorelaie

este definit de valorile coeficienilor de autocorelare de


ordinul
di l k.

2. Sursa autocorelrii erorilor


- neincluderea n modelul de regresie a uneia sau mai multor
variabile explicative importante;
importante;
- iner
neria fenomenelor n timp i decalajul, n cazul seriilor de
timp;;
timp
- modelul de regresie nu este corect specificat
specificat..
3. Testarea autocorelrii erorilor

55

3.1
3.
1. Testul Durbin
Durbin--Watson
Ipoteze
p
statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )

Calculul statisticii test:

DW = d =

)
i i1
i =2

i =1

2
i

56

ntruct i = i 1 + ui statistica DW se mai p


poate scrie astfel:

d=

2
2
i 2ii1 + i1
i

2
i ii1

2 i

ii1
i

= 21
= 2(1 )
2
i

Deoarece 1 1 , valorile
l l statisticii DW sunt date
d
de
d
intervalul: 0 d 4

57

Interpretare:

= 1 d = 0

Dac
, atunci exist autocorelare p
pozitiv
maxim a erorilor;
erorilor;
Dac = 1 d = 4 , atunci exist
exist autocorelare negativ
maxim
i a erorilor;
erorilor
il ;
Dac = 0 d = 2 , atunci nu exist autocorelare
autocorelare..

58

Regula de decizie:

Valorile teoretice ale statisticii DW sunt calculate i tabelate

n
f
funcie
i
d
de
pragull de
d
semnificaie,
ifi i
d
de
volumul
l
l
eantionului i de numrul de parametri ai modelului.
modelului.

tabele se determin dou valori critice, notate cu dL


n
(limita inferioar) i dU (limita superioar).
superioar).

59

n funcie

de aceste valori critice se determin


urmtoarele intervale, care permit luarea deciziei de
respingere sau acceptare a ipotezei nule
nule::

a.

(0<dcalc<dL) se respinge ipoteza Ho, erorile nregistreaz


o autocorelare pozitiv
pozitiv;;
(dL<dcalc<dU) i (4-du<dcalc< 4-dL) sunt regiuni de
nedeterminare, nu se poate decide asupra existenei
autocorelrii
t
l ii erorilor;
erorilor
il ;

b.

60

c. ((du <dcalc< 4- du) se accept


p ipoteza
p
Ho,, erorile nu sunt
autocorelate;;
autocorelate
d. (4-dL <dcalc< 4) se respinge ipoteza Ho, erorile
nregistreaz o autocorelare negativ
negativ..
Exemplu:
Exemplu:
n studiul legturii dintre dou variabile, X i Y, observate
n
pentru un eantion format din 25 uniti statistice, s-a
estimat un model de regresie
g
liniar simpl
p i s-au obinut

urmtoarele
urm
toarele rezultate:
rezultate:

61

Calculul statisticii Durbin Watson n SPSS:

b
Model Summary

Model
1

Adjusted Std. Error of


R
R Square R Square the Estimate
,985a
,970
,960
2,41523

DurbinWatson
1,429

a. Predictors: (Constant), X
b. Dependent Variable: Y

S se testeze ipoteza de autocorelare a erorilor,


considernd un risc de 0,05.
62

3.2. Runs Test


-

se bazeaz p
pe ideea c valorile variabilei reziduale se
constituie n secvene sau seturi de valori pozitive sau
negative numite runs, care se succed ntr
ntr--o anumit ordine
sau aleator
aleator..

ipoteza de baz a acestui test este aceea c


c,, n cazul lipsei
autocorelrii erorilor,
erorilor, succesiunea acestor seturi (runs,
notate k) este aleatoare sau numrul acestora este
distribuit normal
normal..

63

Ipoteze statistice
H0: k este distribuit normal ((nu exist autocorelare a erorilor))
H1: k nu este distribuit normal (ipoteza este nclcat)

Calculul statisticii test


se folosete statistica t Student, calculat dup relaia
relaia::
k M (k )
t calc =
sk
unde:: k este numrul de runs caracterizat prin
unde
prin::
-

64

n1 n 2
M(k ) = 2
+1
n1 + n 2

2 n1n2 n1 n2
s = 2 n1n2
( n1 + n2 ) 2 ( n1 + n2 1)
2
k

65

n1 este numrul de valori pozitive ale erorilor ei ;


n2 este numrul de valori negative ale erorilor ei,
cu n1 + n2 = n .

Regula de decizie:
decizie:
-

dac |tcalcl | ta/2,n


accept
ept ipoteza H0.
,n--2 , atunci se acc

66

Exemplu:
Pentru dou variabile,, X i Y, s-au obinut

urmtoarele
rezultate::
rezultate
R
Runs
T
Test 2

Test Value
Val e a
Cases < Test Value
Cases >= Test Value
Total Cases
Number of Runs
Z
Asymp. Sig. (2-tailed)

Unstandardiz
ed Residual
,0000000
0000000
17
15
32
3
-4,849
,000

a. Mean
67

S se testeze ipoteza
p
de autocorelare a erorilor,, folosind
testul Runs
Runs..

68

4. Efectele nclcrii
necorelare
l
a erorilor
il

ipotezei

de

n aceste condiii,
, p
prin aplicarea
p
MCMMP,, se obine

pentru
p
parametrul 0 un estimator neeficient
neeficient..

69

5 .2 .
Ipotezele
independente

asupra

variabilelor

1. Variabilele independente
p
sunt nestochastice sau
deterministe..
deterministe
2. Variabilele independente i variabila eroare sunt
necorelate, cov (Xi,i)=
)=0
0.
- aceast ipotez este ndeplinit dac variabilele
independente sunt nestochastice.
nestochastice.

70

3. Ipoteza de necoliniaritate a variabilelor


independente
a. Definire
D fi i
Coliniaritatea poate fi definit ca o legtur liniar
funcional existent ntre dou sau mai multe
variabile independente ale unui model de regresie
multipl de forma
forma::

YX 1 ,K Xp = 0 + 1 X 1 + 2 X 2 + K + p X p +
a.1. Coliniaritate perfect
71

apare
p
atunci cnd ntre variabilelele independente
p
X1, X2,
...,, Xp exist o legtur liniar perfect, funcional.
...
funcional.
Aceast legtur poate fi exprimat printr
printr--o relaie de
forma::
forma

1 X 1 + 2 X 2 + K + p X p = 0
unde: i, cu i=
unde:
i=1
1, ...,
..., p, valori constante care nu sunt toate, n
mod simultan, nule.
nule.

72

a.2. Coliniaritatea imperfect

P
Poate
fi definit
d fi i ca o relaie
l i liniar
li i puternic
i existent
i

ntre dou sau mai multe variabile independente.


independente.

1 X 1 + 2 X 2 + K + p X p + u = 0

73

b. Efectele coliniaritii

Variana
estimatorilor p
parametrilor modelului de regresie
g
crete, adic estimatorii pierd proprietatea de eficien.
eficien.
n cazul unei coliniariti perfecte, variana estimatorilor
este
t infinit
i fi it (parametrii
(
t ii modelului
d l l i nu pott fi estimai)
estimai).
ti i).
n cazul unei coliniariti imperfecte, varianele
estimatorilor sunt mari
mari..

74

c. Testarea coliniaritii
c.1.
1 Folosind
F l i d procedee
d grafice
fi
20,00

X2
2

15,00

10,00

5,00

R Sq Linear = 1

0,00
0,00

2,00

4,00

6,00

8,00

10,00

X1

Fi
Figura
1.
1 Reprezentarea
R
t
grafic
fi a coliniaritii
li i itii perfecte
f t

dintre dou variabile independente, X1 i X2

75

20,00

X2

15 00
15,00

10,00

5,00

R Sq Linear = 0,902

0,00
0 00
0,00

2 00
2,00

4 00
4,00

6 00
6,00

8 00
8,00

10 00
10,00

12 00
12,00

14 00
14,00

X1

Figura 2. Reprezentarea grafic a coliniaritii imperfecte

dintre dou variabile independente,


p
, X1 i X2

76

c.2. Folosind procedee numerice


1.

FFactorull varianei
i
i crescute (variance
( i
(variance-inflated
i fl d factor,
f
VIF)

1
VIF j =
1 R 2j

2
R
unde:: j este raportul de determina
unde
determinaie din modelul

de regresie auxiliar, respectiv dintre variabila Xi i


celelalte variabile independente
independente..

77

Interpretare:
Interpretare
p
:

Atunci cnd legturile dintre variabilele independente sunt


puternice, valoarea raportului de determina
determinaie se apropie
d unu, iar
de
i raportul
t l VIF este
t infinit
i fi it.
infinit.

Atunci cnd ntre variabilele independente nu exist


corelaie (R2j=0), valoarea raportului VIF este egal cu
unu..
unu

78

n p
practic,, o valoare VIF>10
VIF>10 indic p
prezena
coliniaritii.
coliniaritii
.

2. Tolerana (Tolerance)
- se calculeaz
l l dup
d relaia:
l i TOL=1/VIF=1
TOL 1/VIF 1-R2j
TOL=1/VIF=1-

Interpretare:
-

Dac valoarea TOL=1, atunci nu exist coliniaritate;


Dac valoarea TOL=0
TOL=0, atunci exist coliniaritate perfect.
perfect.

79

Existena
coliniaritii
este sugerat
g
de valorile mici ale
indicatorului TOL.

d. Corectarea coliniaritii
metodele de corecie in cont de tipul de coliniaritate, de
numrul de variabile din model i de informaiile
suplimentare despre fenomenul studiat.
studiat.

80

Cea mai simpl


p metod const n eliminarea variabilei care
introduce coliniaritatea
coliniaritatea..

Alt metod const n construirea unui model cu variabile


transformate prin diverse funcii sau operatori (de
exemplu, operatorul decalaj, diferen)
diferen)..

81

Exemplu::
Exemplu
n urma analizei legturilor dintre variabilele independente
ale unui model de regresie, s-au obinut urmtoarele
rezultate:
a
Coefficients

Unstandardized Standardized
Coefficients
Coefficients
Model
B
Std. Error
Beta
1
(Constant) 65,705
27,731
X1
48 979
48,979
10 658
10,658
,581
581
X2
59,654
23,625
,359
X3
-1,838
,814
-,324

t
2,369
4 596
4,596
2,525
-2,258

Sig.
,037
,001
001
,028
,045

Collinearity Statistics
Tolerance
VIF
,950
950
,753
,738

1,052
1
052
1,328
1,355

a. Dependent
p
Variable: Y
82

S-ar putea să vă placă și