Sunteți pe pagina 1din 42

1

ECONOMETRIE CURS 11
-anul universitar 2011-2012
2
Structura cursului:

1. Introducere
2. Regresia liniar simpl
3. Regresia liniar multipl
4. Regresia neliniar
5. Regresia cu variabile alternative
6. Verificarea ipotezelor
modelului de regresie

3
Capitolul 6. Verificarea ipotezelor
modelului de regresie

a) Ipoteze formulate asupra erorilor de
regresie (componenta aleatoare a
modelului)

b) Ipoteze formulate asupra variabilelor
independente (componenta
determinist a modelului)

4
a) Ipoteze formulate asupra variabilelor
reziduale
1. - variabilele reziduale au mediile
nule;
2. - variabilele reziduale au varianele
egale cu o aceeai constant, (ipoteza de
homoscedasticitate);
3. - variabilele reziduale sunt
necorelate;
4. - variabilele reziduale sunt identic
repartizate
n i N
i
, 1 ), , 0 ( ~
2
=
c
o c
n i
i
, 1 , = c
n i
i
, 1 , = c
2
c
o
n i
i
, 1 , = c
n i
i
, 1 , = c
5
b) Ipoteze formulate asupra
variabilelor independente

1. Variabilele independente sunt necoliniare
2. Variabilele independente i variabila
eroare sunt necorelate
6
6.1. Media erorilor este egal cu zero
Erorile de regresie se determin ca diferen ntre valorile
reale (observate) ale variabilei dependente i valorile
ajustate (teoretice), dup relaia:


Definirea ipotezei:
- Factorii neinclui n model i reprezentai prin variabila
rezidual nu afecteaz n mod sistematic media
variabilei dependente Y:

echivalent cu

n i M
i
, 1 , 0 ) ( = = c
n , , , i , y y e
xi i i
2 1 = =
X ) X / Y ( M
1 0
| | + =
7
6.1. Media erorilor este egal cu zero
2. Efectele nclcrii ipotezei
- Dac media erorilor este diferit de zero, atunci estimatorii
parametrilor de regresie, notai cu , sunt
deplasai.

3. Verificarea ipotezei
a) Formularea ipotezelor


b) Alegerea testului statistic t Student



c) Valoarea critic a statisticii t, pentru riscul admis,




1 0
| |

si

o
) (
) ( ) (

) (

i
M
i i
V
M M
t
c
c c
=
n i M H
n i M H
i
i
, 1 , 0 ) ( :
, 1 , 0 ) ( :
1
0
= =
= =
c
c
1 2 n ; /
t
o
8
6.1. Media erorilor este egal cu zero
d) Valoarea calculat a statisticii t


e) Regula de decizie
f) Decizia
g) Interpretarea

) ( M

calculat
s
) e ( M
t
c
=
9
6.1. Media erorilor este egal cu zero
4. Corectarea modelului
- Valorile variabilei dependente se
corecteaz cu media erorilor (semnificativ
diferit de zero), astfel:


- Modelul devine:


) ( M y y
i
*
i
c =
0
1 0
= + + = ) u ( M cu , u x y
i i
*
i
| |
10
6.2. Ipoteza de homoscedasticitate a
erorilor
1. Definire
- ipoteza de homoscedasticitate presupune ca
variana erorilor s fie constant:


n cazul erorilor heteroscedastice, variana acestora
variaz odat cu (variaia) variabila independent.
n i V
i
, 1 , ) (
2
= =
c
o c
11
Model heteroscedastic. Variana erorilor
scade la creterea variabilei independente
4 3 2 1 0
Timpul de verificare a automobilului (ore)
40
30
20
10
0
N
r
.

d
e
f
e
c
t
i
u
n
i
l
o
r

c
o
n
s
t
a
t
e
R Sq Linear = 0,386
12
6.2. Ipoteza de homoscedasticitate a
erorilor
2. Cauze ale heteroscedasticitii:
- Specificarea greit a modelului de regresie,
cnd nu sunt incluse variabile explicative
eseniale;
- Repetarea aceleiai valori a variabilei
independente (explicative) pentru valori
diferite ale variabilei dependente
- ........
13
6.2. Ipoteza de homoscedasticitate a erorilor
3. Consecine ale nclcrii acestei ipoteze
- Dac ipoteza este nclcat, variana estimatorilor parametrilor
de regresie este mai mare dect n cazul erorilor
homoscedastice, astfel nct se pierde eficiena estimatorilor
parametrilor;
- Estimatorii parametrilor de regresie rmn nedeplasai i
consisteni

4. Verificarea ipotezei de homoscedasticitate
a. Testul Spearman
b. Testul Goldfeld-Quandt
c. Testul Glejser
14
a) Testarea corelaiei neparametrice dintre
variabila rezidual i variabila independent X
testul Spearman
- determinarea coeficientului Spearman se
bazeaz pe rangurile ale erorilor
absolute estimate e
i
, i ale valorilor






) n ( n
d
i
i
1
6 1
2
2

= u
i
x
i
e
R
i
x
R
i
i
x
e
i
R R d =
15
a) Testarea corelaiei neparametrice dintre
variabila rezidual i variabila independent X
testul Spearman
Ipoteze statistice:
H
0
: ipoteza de homoscedasticitate ( )
H
1
: ipoteza de heteroscedasticitate ( )

Alegerea testului statistic


) n (
t ~

t
2
2
1
2

=
u
u
0 = u
0 = u
16
a. Testul Spearman

Calculul statisticii test:
Se folosete statistica t Student:



unde: r este estimaia coeficientului Spearman
determinat pe baza datelor eantionului






u
2
1
2
r
n r
t
calc

=
17
a. Testul Spearman

- Atribuirea rangurilor: se consider rangul 1 pentru cea
mai mare valoare, rangul 2 pentru urmtoarea valoare ca
mrime, .a.m.d., pentru ambele iruri de valori x
i
i |e
i
|.

Regula de decizie:
- dac sau se respinge ipotezei H
o,
pentru pragul de semnificaie , variabila eroare i
variabila independent sunt corelate, erorile sunt
heteroscedastice.
- Dac se accept ipoteza nul, erorile sunt homoscedastice

Exemplu: Pentru dou variabile, X i Y, se cunosc
urmtoarele valori:

o < Sig
2 2
>
n ; /
t t
o
o
18
a. Testul Spearman

x
i
y
i
1 10
2 15
3 20
4 30
5 40
15 115
19
a. Testul Spearman

Se cere s se testeze ipoteza de homoscedasticitate
a erorilor, folosind coeficientul Spearman (se
consider un risc de 0,05).

Rezolvare:
Se formuleaz urmtoarele ipoteze statistice:
H
0
: ipoteza de homoscedasticitate
H
1
: ipoteza de heteroscedasticitate
20
a. Testul Spearman
Valoarea statisticii test se calculeaz dup
relaia:



unde: , cu

Pentru aflarea rangurilor valorilor estimate
ale erorilor (R
|ei|
), se calculeaz erorile
.
2
1
2
r
n r
t
calc

=
) n ( n
d
r
i
i
1
6
1
2
2

=
i
i
e
x i
R R d =
i
x i i
y y e =
21
Elementele de calcul ale coeficientului Spearman
sunt prezentate n tabelul de mai jos:

x
i
y
i
e
i
R
xi
R
|ei|
d
i
d
i
2
1 10 2 5 2 3 9
2 15 -0,5 4 3 1 1
3 20 -3 3 1 2 4
4 30 -0,5 2 3 -1 1
5 40 2 1 2 -1 1
15 115 - - - - 16
22
a. Testul Spearman
Coeficientul Spearman este:



Valoarea statisticii t Student se calculeaz
astfel:


( )
2 0
1 25 5
16
6 1 , r =

=
354 0
2 0 1
2 5 2 0
1
2
2 2
,
,
,
r
n r
t
calc
=

=
23
a. Testul Spearman
Valoarea critic:

Regula de decizie:
-
- Se compar valoarea calculat cu valoarea teoretic


Decizia: se accept ipoteza Ho, erorile sunt
homoscedastice, n condiiile riscului acceptat de 5%.

) , t t
; , n , /
182 3
3 025 0 2 2
= =
o
) , t ( ) , t (
; , calc
182 3 354 0
3 025 0
= < =
24
Exemplu - SPSS
Cor relations
1.000 -.529
. .280
6 6
-.529 1.000
.280 .
6 6
Correlation Coef f icient
Sig. (2-tailed)
N
Correlation Coef f icient
Sig. (2-tailed)
N
abs_erori
Productivitatea_medie
Spearman's rho
abs_erori
Productivitat
ea_medie
25
b. Testul Goldfeld-Quandt
Acest test se aplic n situaia n care o singur
variabil independent este cauza
heteroscedasticitii i nr. de observaii este
mare.

Ipoteze statistice:
H
0
: ipoteza de homoscedasticitate
H
1
: ipoteza de heteroscedasticitate

26
b. Testul Goldfeld-Quandt
Etape pentru calculul statisticii test:
- se ordoneaz cresctor seria valorilor variabilei
independente care genereaz
heteroscedasticitatea (x
i
);

- se mparte seria n dou pri egale, dup omiterea
unui set de date din centrul seriei (n cazul seriilor
cu un numr mare de termeni);

- se estimeaz parametrii ecuaiei de regresie
pentru fiecare din cele dou seturi de date i se
calculeaz variaia rezidual (RSS) pentru fiecare
model n parte;
27
b. Testul Goldfeld-Quandt
- se calculeaz statistica test Fisher care compar
cele dou variaii reziduale:



unde: RSS
1
corespunde celei mai mici valori a variaiei
reziduale.

1
2
RSS
RSS
F
calc
=
28
b. Testul Goldfeld-Quandt
-Regula de decizie:

sau - se respinge
ipoteza H
0
.


Exemplu:

Pentru dou variabile, X i Y, se cunosc urmtoarele
valori:

k n ; k n ; calc
F F

>
2 1 o o < Sig
29
b. Testul Goldfeld-Quandt
x
i
y
i
2 15
3 20
1 10
4 19
6 25
5 23
7 30
8 35
9 38
10 40
30
b. Testul Goldfeld-Quandt
Se cere s se testeze ipoteza de
homoscedasticitate, folosind testul Goldfeld-
Quandt.

Rezolvare:
1. Se ordoneaz cresctor irul valorilor x
i
.
2. Se mparte seria valorilor x
i
n dou serii: prima
serie este reprezentat de valorile 1, 2, , 5;
seria a doua este reprezentat de valorile 6, 7,
, 10.
31
b. Testul Goldfeld-Quandt
3. Pentru fiecare din cele dou serii se
estimeaz parametrii modelului de
regresie.



Coefficients
a
8.400 2.026 4.145 .026
3.000 .611 .943 4.910 .016
(Constant)
X1
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Y1
a.
32
b. Testul Goldfeld-Quandt
Coefficients
a
3.200 3.250 .985 .397
3.800 .400 .984 9.500 .002
(Constant)
X2
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardized
Coef f icients
t Sig.
Dependent Variable: Y2
a.
33
b. Testul Goldfeld-Quandt
Se obine:

Seria 1: Y
x
=8,3+3X
Seria 2: Y
x
=3,2+3,8X



34
b. Testul Goldfeld-Quandt
ANOVA
b
90.000 1 90.000 24.107 .016
a
11.200 3 3.733
101.200 4
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), X1
a.
Dependent Variable: Y1
b.
35
b. Testul Goldfeld-Quandt
ANOVA
b
144.400 1 144.400 90.250 .002
a
4.800 3 1.600
149.200 4
Regression
Residual
Total
Model
1
Sum of
Squares df Mean Square F Sig.
Predictors: (Constant), X2
a.
Dependent Variable: Y2
b.
36
b. Testul Goldfeld-Quandt
4. Pentru cele dou modele, se
estimeaz variaia rezidual
(valoare prezentat n output-ul
ANOVA):
- pentru seria 1: RSS=11,2;
- pentru seria 2: RSS = 4,8.
37
b. Testul Goldfeld-Quandt
5. Se calculeaz raportul F, considernd RSS
1
cea
mai mic valoare:RSS
1
=4,8 i RSS
2
=11,2



6. Se compar valoarea calculat a statisticii F cu
valoarea teoretic:


(k este numrul parametrilor).
. , F F
; ; , k n ; k n ; ,
277 9
2 5 2 5 05 0 05 0
2 1
= =

33 , 2
8 , 4
2 , 11
1
2
= = =
RSS
RSS
F
calculat
38
b. Testul Goldfeld-Quandt
7. Interpretare:


Potrivit regulii de decizie, se accept ipoteza de
homoscedasticitate, n condiiile riscului acceptat
de 5%.

) 277 , 9 ( ) 33 , 2 (
3 ; 3 ; 05 , 0
= < = F F
calc
39
c. Testul Glejser
- Acest test permite att identificarea eventualei
heteroscedasticiti, ct i a formei acesteia.
- Se bazeaz pe modelul de regresie ntre variabila
rezidual estimat, pentru care se consider valorile n
mrime absolut, i variabila independent;
- Se recomand doar n cazul eantioanelor cu un
volum mare de date;

40
c. Testul Glejser
Etape:
1. Se construiete modelul de regresie
liniar dintre X i Y i se estimeaz
erorile de regresie, de forma:


2. se construiete modelul de regresie ntre
erorile absolute i variabila
independent, care poate fi de forma:

i i x i i
X Y Y Y e
i
1 0
| | = =
i i i
u X e + + =
1 0
o o
41
Heteroscedasticitatea este de forma:


Alte modele de regresie prin care se poate
explicita

i j e
v X b b s
i
+ + =
2
1 0
2
i
e
i i i
u X e + + =
2 / 1
1 0
o o
i i i
u X e + + =
1
1 0
o o
42
c. Testul Glejser
3. Se testeaz semnificaia modelului estimat n
etapa 2:
- Dac parametrul este semnificativ
statistic, erorile sunt heteroscedastice.
- - Dac parametrul nu este semnificativ
statistic, se accept ipoteza de
homoscedasticitate a erorilor modelului
iniial.
1
o
1
o

S-ar putea să vă placă și