1
6.3. Ipoteza de normalitate a erorilor
1. Formularea problemei:
- erorile i urmează o lege normală de medie 0
şi varianţă 2 :
i ~ N ( 0 , 2 )
ˆ 0 ~ N ( 0 , 2ˆ ), ˆ1 ~ N ( 1 , 2ˆ )
0 1
2. Efectele încălcării ipotezei
- dacă ipoteza de normalitate este încălcată, estimatorii
construiţi prin MCMMP au doar proprietăţi asimptotice,
adică urmează legi normale de distribuţie numai în cazul
eşantioanelor de volum mare ( n );
- estimatorii parametrilor din model nu sunt eficienți;
- Testul t statistic aplicat pentru verificarea semnificației
estimatorilor nu este valid.
3
6.3. Ipoteza de normalitate a erorilor
4
6.3. Ipoteza de normalitate a erorilor
Exemplu:
5
6.3. Ipoteza de normalitate a erorilor
Histogram
12
10
8
Frequency
Mean = -3,1086245E-15
Std. Dev. = 6,72464405
0 N = 30
-20,00000 -10,00000 0,00000 10,00000 20,00000
Unstandardized Residual 6
b. Diagrama Boxplot
7
b. Diagrama Boxplot
Unstandardized Residual
-20 -10 0 10
8
xi x
zi
s c. Diagrama P-P Plot
- Compară funcţia de repartiţie a distribuţiei unei variabile
empirice cu funcţia de repartiţie a unei distribuţii teoretice
specificate (ex: distribuţia normală standard);
1.0
0.8
Expected Cum Prob
0.6
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
20
10
Expected Normal Value
-10
-20
-20 -10 0 10 20
Observed Value
11
d. Diagrama Q-Q Plot
Reziduuri asimetrice
12
d. Diagrama Q-Q Plot
• .
13
Procedee numerice de verificare a ipotezei de
normalitate erorilor
Ipoteze statistice:
H0: erorile sunt normal distribuite
H1: erorile nu sunt normal distribuite 14
2.3 Testul Kolmogorov-Smirnov
Regula de decizie:
- valoarea pragului de semnificaţie empiric (Sig.) se
compară cu valoarea teoretică : dacă Sig ,
atunci NU se respinge ipoteza de normalitate a
erorilor.
- Vezi regula de respingere a ipotezei nule
Exemplu:
16
a. Testul Kolmogorov-Smirnov-Lilliefors (KSL)
Unstandardized
Residual
N 75
Normal Parameters a,b Mean .0000000
Std. Deviation 6.51080700
Most Extreme Absolute .077
Differences Positive .051
Negative -.077
Kolmogorov-Smirnov Z .671
Asymp. Sig. (2-tailed) .759
a. Test distribution is Normal.
b. Calculated from data.
17
b. Testul Jarque-Bera
- se bazează pe verificarea simultană a
proprietăţilor de asimetrie şi boltire ale
repartiţiei variabilei reziduale.
Pentru o repartiţie normală:
- valoarea coeficientului de asimetrie (S) nu
diferă semnificativ de zero,
32
S 3
2
- valoarea coeficientului de boltire (K) nu diferă
semnificativ de zero, K 4 3
22 18
b. Testul Jarque-Bera
19
b. Testul Jarque-Bera
20
,
NU!!!
Parametrii formei repartiţiei probabiliste a unei variabile
aleatoare
Coeficientul de asimetrie Fisher
32 3
1 3
2
3
21
n
X ~ 2 (v, ) X i ~ N (0, 2 ), i 1, n X i2 ~ 2 (v, )
i 1
b. Testul Jarque-Bera
Regula de decizie:
Statistica JB urmează o lege de repartiţie chi-pătrat
cu două grade de libertate şi un prag de
semnificaţie specificat, . 2 , 2
2
- dacă valoarea calculată a statisticii test JB > , 2
sau Sig , atunci se respinge ipoteza Ho.
24
6.4. Ipoteza de necorelare a erorilor
- presupune lipsa unei corelaţii între erorile i la
nivelul distribuţiilor condiţionate, de forma Y / X xi
26
6.4. Ipoteza de necorelare a erorilor
27
6.4. Ipoteza de necorelare a erorilor
Efectele autocorelării erorilor:
- Se demonstrează că, în cazul erorilor autocorelate, estimatorul
̂ 0 (obţinut prin MCMMP) are varianţa mai mare decât în cazul în
care erorile nu sunt autocorelate, pierzându-şi astfel eficienţa.
(Estimatorul eficient al unui parametru este estimatorul nedeplasat care
are varianţa minimă, dintre toţi estimatorii posibili)
28
6.4. Ipoteza de necorelare a erorilor
29
1. Testul Durbin-Watson
i i 1 ui , cu ui ~ N (0, u2 )
30
1. Testul Durbin-Watson
1. Ipoteze statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )
(ˆi ˆi 1 ) 2
DW d i
2(1 ˆ )
ˆi2
i
31
1. Testul Durbin-Watson
3 . Valorile critice ale statisticii DW se citesc din tabelul
Durbin-Watson în funcţie de riscul , volumul
eşantionului şi numărul de parametri din model.
• În tabelul DW se citesc două valori critice, notate cu
d L (limita inferioară) şi dU (limita superioară).
2
( ei ei 1 )
dcalc i 2(1 r )
2
ei
i
32
Interpretarea rezultatelor:
33
Regula de decizie:
34
Regula de decizie:
35
Calculul statisticii Durbin Watson cu SPSS:
b
Model Summary
36
Exemplu
2
( ei ei 1 )
25
DWcalc i 1,429
2 17 ,5
ei
i
Interpretare:
Din tabelul Durbin Watson, pentru n=25, k=2 si α=0.05 se citesc
valorile: dL=1,288; dU=1,454.
În exemplul dat:
(dL=1,288)<(DWcalc=1,429)<(dU=1,454), ceea ce arată că nu se
poate decide cu privire la existența autocorelării erorilor.
37
6.4. Ipoteza de necorelare a erorilor
2. Testul Runs
- se bazează pe ideea că valorile variabilei reziduale se
constituie în secvenţe sau seturi de valori pozitive sau
negative numite runs, care se succed într-o anumită ordine
sau aleator.
38
2. Runs Test
1. Ipoteze statistice
H0: erorile NU sunt autocorelate (k este distribuit normal )
H1: erorile sunt autocorelate ( k NU este distribuit normal)
39
2. Runs Test NU!!
n1 n2
M( k ) 2 1
n1 n2
2n1 n2 n1 n2
V ( k ) 2n1 n2
2
k
( n1 n2 )2 ( n1 n2 1 )
40
2. Runs Test
-
5. Regula de decizie:
- dacă t t / 2 , n 2 sau sig sau
k M ( k ) t / 2 , n 2 sk , atunci se
acceptă ipoteza H0 pentru un prag de semnificaţie specificat. 41
NU!! Aplicaţie: Pentru două variabile, X şi Y, se
cunosc valorile xi, yi şi ei (erorile estimate ale
modelului de regresie simpl liniară):
Nr.crt. xi yi ei
1 1 20 -3,07508
2 2 21 -3,05303
3 3 22 -3,03099
4 4 24 -2,00894
5 5 25 -1,98689
6 7 27 -1,94280
7 8 29 -,92075
8 9 30 -,89871
9 10 32 ,12334
10 12 35 1,16743
11 13 37 2,18948
12 15 39 2,23357
13 17 40 1,27766
14 19 43 2,32176
15 20 45 3,34380
42
NU!! Exemplu
16 22 47 3,38790
17 23 48 3,40994
18 25 49 2,45403
19 27 50 1,49813
20 29 52 1,54222
21 30 54 2,56427
22 32 55 1,60836
23 35 57 ,67450
24 37 58 -,28141
25 39 59 -1,23732
26 40 61 -,21527
27 43 62 -2,14913
28 45 63 -3,10504
29 47 66 -2,06094
30 50 70 -,99481
31 52 71 -1,95071
43
32 55 75 -,88457
NU!! Exemplu
Rezolvare:
- În funcţie de semnul valorilor erorilor ei se pot identifica
următoarele seturi sau runs:
(----…-----)(+++…+++)((----…-----)
44
Exemplu
45
Exemplu
Ipoteze statistice
H0: erorile nu sunt autocorelate
H1: erorile sunt autocorelate
Calculul statisticii test:
k M ( k ) 3 16,94
t 4,849( esantion de vol . mic )
sk 2,7712
unde: nn 15 17
M (k ) 2 1 2 1 2 1 16,94
n1 n2 15 17
2n1n2 n1 n2 2 15 17 15 17
sk2 2n1n2 2 15 17 7 ,6796
2 2
( n1 n2 ) ( n1 n2 1 ) ( 15 17 ) ( 15 17 1 )
s k 7,6796 2,7712 46
Exemplu
Regula de decizie:
(|tcalc |=4,849)>(ttab=1,96): se respinge ipoteza Ho, K nu este
distribuit normal, erorile sunt autocorelate, în condiţiile
riscului admis de 5%.
SAU
ICk : ( 16 ,94 1,96 2 ,7712 ) ( 11,51 ; 22 ,37 )
Numărul de seturi de valori k=3 nu este acoperit de intervalul
de încredere, ceea ce arată că se respinge ipoteza Ho,
erorile sunt autocorelate, în condiţiile riscului admis de 5%.
47
Testul Runs în SPSS
Runs Test 2
Unstandardiz
ed Residual
Test Value a ,0000000
Cases < Test Value 17
Cases >= Test Value 15
Total Cases 32
Number of Runs 3
Z -4,849
Asymp. Sig. (2-tailed) ,000
a. Mean
48
b) Ipoteze formulate asupra variabilelor
independente
Y X 1 , X p 0 1 X 1 2 X 2 p X p
49
6.5. Ipoteza de necoliniaritate a variabilelor
independente
50
6.5. Lipsa coliniarităţii variabilelor
independente
Coliniaritate perfectă
1 X 1 2 X 2 p X p 0
51
6.5. Lipsa coliniarităţii variabilelor independente
52
6.5. Lipsa coliniarităţii variabilelor
independente
53
6.5. Lipsa coliniarităţii variabilelor independente
- Efectele coliniarităţii:
- varianţa estimatorilor parametrilor modelului de regresie
creşte, adică estimatorii pierd proprietatea de eficienţă
- pentru o coliniaritate perfectă, varianţa estimatorilor este
infinită, iar parametrii modelului nu pot fi estimaţi
54
Testarea coliniarităţii
15,00
X2
10,00
5,00
R Sq Linear = 1
0,00
X1
55
Testarea coliniarităţii
20,00
15,00
X2
10,00
5,00
X1
56
Testarea coliniarităţii
Procedee numerice
57
Testarea coliniarităţii
58
1
VIF j
Testarea coliniarităţii 1 R 2j
59
Testarea coliniarităţii
1
TOL j (1 R 2j )
VIF j
60
Exemplu
Model Summaryb
61
Exemplu
a
Coefficients
Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 1.806 .592 3.050 .055
X1 .261 .052 .347 5.045 .015 .607 1.648
X2 1.415 .131 .741 10.773 .002 .607 1.648
a. Dependent Variable: Y
62
Exemplu
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 9.837 2.916 3.373 .028
X2 1.591 .988 .627 1.610 .183
a. Dependent Variable: X1
63
Exemplu
Model Summary
64
Exemplu
65
Corectarea coliniarităţii variabilelor
independente
66