Sunteți pe pagina 1din 18

Verificarea ipotezelor modelului

de regresie; coliniaritate,
heteroscedasticitate,
autocorelare, repartiie normal

Una din ipotezele de baz ale modelului de regresie liniar: variabilele
explicative nu sunt corelate liniar (nu exist o relaie liniar ntre
variabile).
nclcarea ipotezei (coliniaritate sau multicoliniaritate) => consecine:
parametrii modelului nu sunt estimai cu suficient precizie din cauza
erorilor standard mari; valorile testului t sunt foarte sczute.

Forme:
-coliniaritate perfect
-coliniaritate parial
-legturi intense ntre variabilele factoriale ale modelului
Coliniaritate
Indicii ale coliniaritii:

1. o valoare ridicat a coeficientului de corelaie ntre dou variabile
explicative (> 0,85 sau chiar 0,9).
2. valori mai mari de 0.8 ale coeficientului de determinaie R
2
pentru
regresiile auxiliare -> regresia pe rnd a cte unei variabile explicative
(luat ca variabil dependent) n funcie de restul variabilelor
explicative din modelul iniial;
3. Statistica F este semnificativ dei valorile t sunt nesemnificative
statistic.
4. valori f. mari ale coeficientului de determinaie R
2
n condiiile n
care una sau mai multe estimaii ale parametrilor modelului de regresie
nu trec testul t (nu difer semnificativ de zero)
5. R
2
nu scade mult cnd se renun la una din variabilele explicative
6. reprezentarea grafic a dou variabile explicative (diagrama
mprtierii- scatter plot) semnaleaz tendina de ordonare a perechilor
x
2t
-x
3t
n jurul unei drepte.

Soluii:

1. suplimentarea datelor, mrind numrul cazurilor din
eantion.
2. de cte ori este posibil folosii date transversale (serii
teritoriale) n locul seriilor cronologice.
3. dac este posibil renunai la unul dintre factorii care
prezint o corelaie ridicat cu un alt factor.



Ipotez a modelului de regresie liniar: variaia erorilor (i implicit a
variabilei dependente) este constant pentru toate observaiile
(= egala mprtiere a erorilor):


nclcarea ipotezei => erorile standard i testele bazate pe acestea
sunt afectate

Existena heteroscedasticitii este mai probabil pentru date
transversale (serii teritoriale care includ uniti firme, menaje- de
mrimi diferite) dect pentru serii cronologice (datele se refer la
aceeai unitate economic).



Heteroscedasticitate
Verificarea confirmrii ipotezelor
privind variabila rezidual:
heteroscedasticitate, autocorelare,
repartiie normal
Pentru valori diferite ale veniturilor cheltuielile alimentare
medii sunt diferite, dar variaia este aceeai =>
homoscedasticitate.

Ex. modelul cheltuielilor alimentare n funcie de venituri
Familiile cu venituri mai mari au posibilitatea unor alegeri mai
diversificate => variaia cheltuielilor alimentare y
t
crete odat cu
venitul x
t
=> heteroscedasticitate.

Indicii ale heteroscedasticitii:
Pe msur ce venitul crete, cheltuielile alimentare sunt tot mai ndeprtate de
linia de regresie estimat => erorile (distanele verticale ale observaiilor
individuale fa de linia de regresie) devin tot mai mari. =>
2
nu este constant
(heteroscedasticitate).
income
Depistarea heteroscedasticitii: testul Goldfeld-Quandt
Etape:
(1)Se identific variabila x
t
care este proportional cu variaia erorilor i se
ordoneaz cresctor dup x
t
cele T perechi de observatii x
t
y
t


(2) Se mpart datele n dou pri egale cu T/2 valori fiecare (opional se pot
elimina valorile centrale: cel mult T/3 din total date). Dac exist
heteroscedasticitate, un grup va avea varian mult mai mare dect cellalt.
(3) Se ruleaz cte o regresie separat pentru fiecare grup i se obin sumele
ptratelor erorilor SSE
1
i SSE
2
, fiecare cu (T/2-K) grade de libertate.
(5) Se compar cu F critic: dac GQ > F
c

(0.05, (T/2)-

k, (T/2)-k)
=> respingem H
0
df SSE
df SSE
GQ
/
/

1
2
2
1
2
2
= =
o
o
H
0
: homoscedasticitate H
1
: heteroscedasticitate

(4) Statistica GQ:
(la numrtor se trece grupul cu
varian mai mare)

Ipotez a modelului de regresie liniar: erorile corespunztoare
diferitelor observaii sunt independente ntre ele (necorelate).
Consecina autocorelatiei: estimrile parametrilor sunt deplasate.
Autocorelaia
Datele transversale: se refer la uniti economice diferite (menaje,
firme) => erorile nu sunt corelate.
Seriile cronologice: sunt formate din observatii nregistrate pentru
aceeai unitate economic => erorile succesive pot fi corelate.
timp
0
e
i
^
x
x
x
x
x
x
x
x
x
Autocorelatie pozitiv
timp
0
e
i
^
x
x
x
x
x
x
x
x
Autocorelatie pozitiv
timp 0
Autocorelatie pozitiv-ciclicitate
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Erorile tind s
aib acelai semn
ca cele precedente.
Indiciu: graficul erorilor.
Autocorelaie negativ
timp
e
i
^
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Fr autocorelatie
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
0 timp
x
x
x
e
i
^
Erorile tind s aib semn opus precedentelor.
Model autoregresiv de ordinul 1, AR(1)
dac Cov (e
t
, e
s
) = 0 unde t = s
Y
t
= |
1
+ |
2
X
2t
+ e
t
t = 1,,T
e
t
= e
t-1
+ v
t
-1 < < 1
-eroarea e
t
depinde de valoarea ei anterioar e
t-1
plus o component
aleatoare v
t
de medie nul i varian constant (=> v
t
necorelate).
0 ) , cov(
) var(
0 ) (
2
=
=
=
s t
v t
t
v v
v
v E
o
coeficient de
autocorelaie

e
t
=
1
e
t-1
+ v
t
AR(1)
e
t
=
1
e
t-1
+
2
e
t-2
+ v
t
AR(2)
e
t
=
1
e
t-1
+
2
e
t-2
+ +
n
e
t-n
+ v
t

AR(n)
.
Autocorelaie
de ordin superior
-1 < < 1
DW = ~ 2 (1 - )
(e
t
- e
t-1
)
2

t=2
T
^ ^
e
t
2

t=1
T
^
^
(d)
Depistarea autocorelaiei: testul Durbin-Watson
Condiie: T>15
H
0
: = 0
H
1
: > 0 (autocorelatie
pozitiv)
0
d
i

d
s
2
respinge
H
0

nu exista
autocorelatie

indecis
DW
(d)
4-d
s
4-d
i
4
indecis
respinge
H
0

H
0
: = 0
H
1
: < 0 (autocorelaie
negativ)
Model transformat pentru eliminarea autocorelrii
(1). Model iniial:
Y
t
= |
1
+ |
2
X
t
+ e
t

obinem e
t

^
(2). Rulm regresia e
t
= e
t-1
+ v
t
^
i obinem
^
^
(3).Folosim pt a transforma variabilele :
^



(Y
t
- Y
t-1
)= |
1
(1-) +|
2
(X
t
- X
t-1
) + v
t
^ ^
^
(4). Rulm
Y
t
*
= |
1
X
t1
*
+ |
2
X
t2
*
+ v
t

=

=

=
T
t
t
T
t
t t
e
e e
2
1
2
2
1

Modelul iniial: Y
t
= |
1
+ |
2
X
t
+ e
t
.
Model transformat:

In modelul transformat erorile v
t
nu sunt corelate => estimare nedeplasat pt
1
i
2
.

Statistica Jarque-Bera:





respingem ipoteza nul a distribuiei normale dac
statistica JB calculat > valoarea critic selectat din
distribuia
2
cu T-2 grade de libertate
)
) (
(
4
3
6
2
2

+ =
k
S
T
JB
aplatizare
(kurtosis)
simetrie
(skewness)
nr de
observaii
3
2
2
3
2
|
|
.
|

\
|
|
|
.
|

\
|
=
T
e
T
e
S

2
2
4
|
|
.
|

\
|
|
|
.
|

\
|
=

T
e
T
e
K

Testarea
normalitii
erorilor