Documente Academic
Documente Profesional
Documente Cultură
Curs12!13!14 Ipoteze
Curs12!13!14 Ipoteze
Planul cursului
1. Introducere
5. Verificarea ipoteze
potezelor
lor modelului de
regresie
i
Ipotezele statistice care se formuleaz n modelarea
Ipotezele
econometric sunt ipoteze asupra componentei
aleatoare (erorilor) i ipoteze asupra componentei
deterministe (variabilelor independente).
independente).
5.1.
aleatoare
c. Ipoteza de normalitate
normalitate:: i ~ N (0, 2 )
p
de ne
necorelare
corelare sau de independen
p
a erorilor:
d. Ipoteza
cov(i, i)=0.
Alegerea testului: t = M ( ) M ( )
( ) )
V ( M
M ( ei )
=
sM ( )
Decizie
5
4. Exemplu
p
Residuals Statisticsa
Predicted Value
Residual
Std. Predicted Value
Std. Residual
Minimum
58508,12
-98125,2
-,778
,778
-1,290
Maximum
6084511
131202,7
2,300
1,725
Mean
1582428
,00000
,000
,000
Std. Deviation
1957596,554
73271,63549
1,000
,964
N
15
15
15
15
One-Sample Statistics
N
Unstandardized Residual
15
Mean
,0000000
Std. Deviation
73271,63549
Std. Error
Mean
18918,65
One-Sample Test
Test Value = 0
t
Unstandardized Residual
df
,000
000
14
Sig. (2-tailed)
1 000
1,000
Mean
Difference
,00000000
00000000
95% Confidence
Interval of the
Difference
Lower
Upper
-40576 5 40576,48
-40576,5
40576 48
5. Corectarea modelului
Modelul
d l l
iniial
ini
iall se corecteaz
estimaiei
erorilor
calculate
eantionului..
eantionului
Modelul corectat este de forma:
forma:
*
yi
= yi M ( i )
cu
la
ajutorull
nivelul
, unde:
unde:
*
yi
= 0 + i xi + u i
9
b. Ipoteza
p
de homoscedasticitate a erorilor
1.
Definire
ipoteza de homoscedasticitate
variana
i erorilor
il s
fie
fi constant
constant:
t t:
presupune
ca
V(i ) = 2
-
10
pierderea eficienei
p
estimatorilor p
parametrilor modelului de
regresie (estimeaz parametrul cu o varian mai mare).
mare).
3. Identificarea heteroscedasticitii
3.1. Procedee grafice
- presupun reprezentarea distribuiei erorilor i aprecierea
varianei acesteia
acesteia..
11
- cazul existenei
heteroscedasticitii:
3
2
1
X
0
Residuals
0
10
15
20
25
30
35
-1
-2
-3
12
Etapele testrii:
testrii:
1.
Se estimeaz modelul de regresie
g
de forma
forma::
Y = 0 + 1 X +
2.
3.
S calculeaz
Se
l l erorile
il estimate
i
ei.
Se construiete un model de regresie pe baza
erorilor estimate n valoare absolut i variabila
13
independent. Exemplu:
i = 0 + 1 xi + u i
4.
Se testeaz p
parametrii acestui model
model:: dac
parametrul 1 este semnificativ, atunci modelul iniial
este heteroscedastic
heteroscedastic..
Exemplu::
Exemplu
14
Coefficientsa
Model
1
(Constant)
PIB
Unstandardized
Coefficients
B
Std. Error
50921 663 12000,771
50921,663
12000 771
,016
,012
Standardized
Coefficients
Beta
,348
t
4 243
4,243
1,337
Sig.
,001
001
,204
15
b. Testul
T
l Spearman
S
(coeficient
( fi i
all corela
corela
l iei
i i neparametrice)
i )
-
Ipoteze
p
statistice::
statistice
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate
Statistica test:
test:
t=
n 2
1 2
16
V l
Valoarea
calculat
l l a statisticii
i i ii test
test::
tcalc =
r n2
1 r2
r = 1
6 di2
i
2
n( n 1 )
17
- unde:
d
d i = R ei R xi
- se consider
id rangull 1 pentru
t
cea maii mare valoare,
l
rangul 2 pentru urmtoarea valoare ca mrime, .a.m.d.,
pentru ambele iruri de valori xi i ei.
p
18
Regula de decizie:
tcalc>tteor
Exemplu:
Exemplu:
n studiul legturii dintre dou
dou
variabile, X i Y, s-au
obinut urmtoarele rezultate
rezultate::
19
Correlations
Spearman's rho X
Correlation Coefficient
Sig. (2-tailed)
N
Unstandardized Residual Correlation Coefficient
Sig. (2-tailed)
N
X
1,000
.
5
,000
1,000
5
Unstandardiz
ed Residual
,000
1,000
5
1,000
.
5
20
21
S i i test :
Statistica
t=
r n2
1 r2
22
Coeficientul
f
l
Spearman este:
r =0
Statistica
t calc =
r n2
1 r2
0 52
=
=0
10
23
Regula de decizie:
-
pentru exemplul
l l dat:
d
24
c. Testul GoldfeldGoldfeld-Quandt
Q
A la
Are
l baz
b ideea
id
c
ntre
valorile
l il varianei
i
i erorilor
il la
l
nivelul repartiiilor condiionate i valorile variabilei
dependente
p
exist o legtur
g
pozitiv de forma
p
forma::
2
i
2
xi
Ipoteze statistice
statistice::
H0: ipoteza
i t
d homoscedasticitate
de
h
d ti it t
H1: ipoteza de heteroscedasticitate
25
26
Fcalc
RSS 2
=
RSS 1
Regula de decizie:
decizie:
27
sau Sig
Si .<0.05
Sig.
05,, atuncii se
Exemplu:
p
Pentru dou variabile, X i Y, se cunosc urmtoarele
valori:
valori
l i:
28
xi
2
3
1
4
6
5
7
8
9
10
yi
15
20
10
19
25
23
30
35
38
40
29
Rezolvare:
Rezolvare:
1.
Se ordoneaz cresctor irul valorilor xi.
2
2.
Se mparte seria valorilor xi n dou serii
serii:: prima serie este
reprezentat de valorile 1, 2, , 5; iar a doua serie este
reprezentat de valorile 6, 7, , 10.
10.
30
31
7 Interpretare:
7.
I
de
33
4. Corectarea heteroscedasticitii
4.1. Dac se cunosc parametrii
i2
aplicat
y i = 0 + 1 xi + i
Corectarea
heteroscedasticitii
presupune
ponderarea
d
modelului
d l l i iniial
i ii l cu variabila
i bil 1 .
i
34
Noull model
d l de
d regresie (corectat)
(
) se obine
b
astfel::
astfel
0
xi i
=
+ 1
+
i i
i i
yi
i2
2 2
xi
Corectarea
heteroscedasticitii
presupune
ponderarea modelului iniial cu variabila 1/xi.
36
Noull model
d l de
d regresie (corectat)
(
) este de
d
forma::
forma
yi 0
i
=
+ 1 +
xi
xi
xi
37
c. Ipoteza
p
erorilor
de
normalitate
1. Formularea problemei
-
i ~ N (0, 2 )
2. Efectele nclcrii acestei ipoteze
-
ip
poteza de normalitate a erorilor este important
p
pentru stabilirea proprietilor estimatorilor
parametrilor modelului de regresie.
regresie.
38
i ~ N ( 0 , )
2
dac
ac
, atunci
t
i estimatorii
ti t ii parametrilor
t il
modelului de regresie urmeaz, de asemenea, o lege
normal::
normal
i ~ N ( i , 2 )
i
39
40
a.
Exemplu::
Exemplu
41
Histogram
Dependent Variable: greut
Freque
ency
3,0
2,5
2,0
1,5
1,0
0,5
0,0
-2
-1
Mean = -1
1,85E
85E-15
15
Std. Dev. = 0,943
N = 10
42
b. Box
Box--plot
70
65
60
55
50
45
greut
43
c. P-P Plot
1,0
0,8
0,6
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
1,0
44
Ipoteze statistice:
Regula de decizie:
45
valoarea
l
probabilitii
b bili ii asociate
i
statisticii
i i ii test calculate
l l
(Sig..) se compar cu
(Sig
(0,05
05)): dac Sig
Sig..<0,05
05,,
p g ipoteza
p
de normalitate a erorilor.
erorilor.
atunci se respinge
Exemplu::
Exemplu
46
a,b
Most Extreme
Differences
Mean
Std. Deviation
Absolute
Positive
Negative
Kolmogorov-Smirnov Z
A
Asymp.
Si
Sig. (2
(2-tailed)
t il d)
10
58,5000
7,83511
,276
276
,161
-,276
,873
,432
432
47
b. Testul Jarque
Jarque--Bera
-
Ipoteze statistice
H0: ipoteza
i
de
d normalitate
li
H1: distribuia erorilor nu urmeaz o lege normal
48
statistica
i i test JB se calculeaz
l l dup
d relaia:
relaia
l i :
n 2 ku 2
JB = sk +
6
4
sw =
3
3
4
3
2
2
49
celor doi
parametri ai formei unei distribuii au urmtoarele relaii
relaii::
sw =
(
i
(
i
e i3 2
)
n2
e i2 3
)
n2
ei4
i n 2
ku =
3
2
e
( i )2
i n 2
50
unde: ei = y i y x
Regula de decizie:
,2 .
2
51
Exemplu
Descriptive Statistics
Std
Std.
N
Minimum
Mi
i
M i
Maximum
M
Mean
Statistic Statistic Statistic Statistic Statistic
Unstandardized Resid
7 -2.61905 2.14286 0000000 1.889822
Valid N (listwise)
7
Skewness
Sk
K t i
Kurtosis
Statistic Std. Error Statistic Std. Error
-.529
.794
-1.375
1.587
52
d. Ipoteza de ne
necorelare
corelare sau
independen a erorilor:
erorilor: cov(i, i)=
)=0
0.
1.
de
Noiuni
a. Autocorelarea
Autocorelarea sau corelaia serial :
-
b. Coeficientul de autocorelaie
-
relaia:
relaia
l i :
cov( i , i1 )
i i1
cov( i , i1 )
i i k
54
c. Funcia de autocorelaie
55
3.1
3.
1. Testul Durbin
Durbin--Watson
Ipoteze
p
statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )
DW = d =
)
i i1
i =2
i =1
2
i
56
d=
2
2
i 2ii1 + i1
i
2
i ii1
2 i
ii1
i
= 21
= 2(1 )
2
i
Deoarece 1 1 , valorile
l l statisticii DW sunt date
d
de
d
intervalul: 0 d 4
57
Interpretare:
= 1 d = 0
Dac
, atunci exist autocorelare p
pozitiv
maxim a erorilor;
erorilor;
Dac = 1 d = 4 , atunci exist
exist autocorelare negativ
maxim
i a erorilor;
erorilor
il ;
Dac = 0 d = 2 , atunci nu exist autocorelare
autocorelare..
58
Regula de decizie:
n
f
funcie
i
d
de
pragull de
d
semnificaie,
ifi i
d
de
volumul
l
l
eantionului i de numrul de parametri ai modelului.
modelului.
59
n funcie
a.
b.
60
urmtoarele
urm
toarele rezultate:
rezultate:
61
b
Model Summary
Model
1
DurbinWatson
1,429
a. Predictors: (Constant), X
b. Dependent Variable: Y
se bazeaz p
pe ideea c valorile variabilei reziduale se
constituie n secvene sau seturi de valori pozitive sau
negative numite runs, care se succed ntr
ntr--o anumit ordine
sau aleator
aleator..
63
Ipoteze statistice
H0: k este distribuit normal ((nu exist autocorelare a erorilor))
H1: k nu este distribuit normal (ipoteza este nclcat)
64
n1 n 2
M(k ) = 2
+1
n1 + n 2
2 n1n2 n1 n2
s = 2 n1n2
( n1 + n2 ) 2 ( n1 + n2 1)
2
k
65
Regula de decizie:
decizie:
-
66
Exemplu:
Pentru dou variabile,, X i Y, s-au obinut
urmtoarele
rezultate::
rezultate
R
Runs
T
Test 2
Test Value
Val e a
Cases < Test Value
Cases >= Test Value
Total Cases
Number of Runs
Z
Asymp. Sig. (2-tailed)
Unstandardiz
ed Residual
,0000000
0000000
17
15
32
3
-4,849
,000
a. Mean
67
S se testeze ipoteza
p
de autocorelare a erorilor,, folosind
testul Runs
Runs..
68
4. Efectele nclcrii
necorelare
l
a erorilor
il
ipotezei
de
n aceste condiii,
, p
prin aplicarea
p
MCMMP,, se obine
pentru
p
parametrul 0 un estimator neeficient
neeficient..
69
5 .2 .
Ipotezele
independente
asupra
variabilelor
1. Variabilele independente
p
sunt nestochastice sau
deterministe..
deterministe
2. Variabilele independente i variabila eroare sunt
necorelate, cov (Xi,i)=
)=0
0.
- aceast ipotez este ndeplinit dac variabilele
independente sunt nestochastice.
nestochastice.
70
YX 1 ,K Xp = 0 + 1 X 1 + 2 X 2 + K + p X p +
a.1. Coliniaritate perfect
71
apare
p
atunci cnd ntre variabilelele independente
p
X1, X2,
...,, Xp exist o legtur liniar perfect, funcional.
...
funcional.
Aceast legtur poate fi exprimat printr
printr--o relaie de
forma::
forma
1 X 1 + 2 X 2 + K + p X p = 0
unde: i, cu i=
unde:
i=1
1, ...,
..., p, valori constante care nu sunt toate, n
mod simultan, nule.
nule.
72
P
Poate
fi definit
d fi i ca o relaie
l i liniar
li i puternic
i existent
i
1 X 1 + 2 X 2 + K + p X p + u = 0
73
b. Efectele coliniaritii
Variana
estimatorilor p
parametrilor modelului de regresie
g
crete, adic estimatorii pierd proprietatea de eficien.
eficien.
n cazul unei coliniariti perfecte, variana estimatorilor
este
t infinit
i fi it (parametrii
(
t ii modelului
d l l i nu pott fi estimai)
estimai).
ti i).
n cazul unei coliniariti imperfecte, varianele
estimatorilor sunt mari
mari..
74
c. Testarea coliniaritii
c.1.
1 Folosind
F l i d procedee
d grafice
fi
20,00
X2
2
15,00
10,00
5,00
R Sq Linear = 1
0,00
0,00
2,00
4,00
6,00
8,00
10,00
X1
Fi
Figura
1.
1 Reprezentarea
R
t
grafic
fi a coliniaritii
li i itii perfecte
f t
75
20,00
X2
15 00
15,00
10,00
5,00
R Sq Linear = 0,902
0,00
0 00
0,00
2 00
2,00
4 00
4,00
6 00
6,00
8 00
8,00
10 00
10,00
12 00
12,00
14 00
14,00
X1
76
FFactorull varianei
i
i crescute (variance
( i
(variance-inflated
i fl d factor,
f
VIF)
1
VIF j =
1 R 2j
2
R
unde:: j este raportul de determina
unde
determinaie din modelul
77
Interpretare:
Interpretare
p
:
78
n p
practic,, o valoare VIF>10
VIF>10 indic p
prezena
coliniaritii.
coliniaritii
.
2. Tolerana (Tolerance)
- se calculeaz
l l dup
d relaia:
l i TOL=1/VIF=1
TOL 1/VIF 1-R2j
TOL=1/VIF=1-
Interpretare:
-
79
Existena
coliniaritii
este sugerat
g
de valorile mici ale
indicatorului TOL.
d. Corectarea coliniaritii
metodele de corecie in cont de tipul de coliniaritate, de
numrul de variabile din model i de informaiile
suplimentare despre fenomenul studiat.
studiat.
80
81
Exemplu::
Exemplu
n urma analizei legturilor dintre variabilele independente
ale unui model de regresie, s-au obinut urmtoarele
rezultate:
a
Coefficients
Unstandardized Standardized
Coefficients
Coefficients
Model
B
Std. Error
Beta
1
(Constant) 65,705
27,731
X1
48 979
48,979
10 658
10,658
,581
581
X2
59,654
23,625
,359
X3
-1,838
,814
-,324
t
2,369
4 596
4,596
2,525
-2,258
Sig.
,037
,001
001
,028
,045
Collinearity Statistics
Tolerance
VIF
,950
950
,753
,738
1,052
1
052
1,328
1,355
a. Dependent
p
Variable: Y
82