Sunteți pe pagina 1din 40

ECONOMETRIE

- Curs 11-

Tematic C11
Ipoteze statistice
Ipoteza de normalitate
Ipoteza de necorelare sau de
independen a erorilor

Ipoteza de normalitate a erorilor

1. Formularea problemei
erorile urmeaz o lege normal de medie 0
i varian 2:

i ~ N ( 0 , 2 )
2. Efectele nclcrii acestei ipoteze
ipoteza de normalitate a erorilor este
important pentru stabilirea proprietilor
estimatorilor parametrilor modelului de
regresie.

dac i ~ N ( 0 , 2, )atunci estimatorii parametrilor


modelului
de
regresie
urmeaz,
de
asemenea, o lege normal:
~ N ( , 2 )
i

dac ipoteza de normalitate este nclcat,


proprietile estimatorilor construii pe baza
metodei celor mai mici ptrate au doar
proprieti
asimptotice,
adic
necesit
eantioane sau seturi mari de date.

3. Verificarea normalitii erorilor

legea normal este definit de funcia de


densitate
de
probabilitate
care
este
reprezentat grafic prin curba densitii de
probabilitate, curb cu alur de clopot.

3.1. Procedee grafice


- Histograma (curba frecvenei);
- Box-Plot.

a.
-

Reprezentarea histogramei i a curbei


frecvenelor
se
reprezint
curba
frecvenei
sau
histograma reziduurilor i se observ dac
forma distribuiei acestora are alur de
clopot.

Exemplu:

H
i
s
t
o
g
r
a
m
D
e
p
n
d
e
V
i
b
l
e
:
g
r
e
u
t
,2
3
0
5
1
,,5
0

F
re
q
u
n
c
y

Histograma i curba frecvenelor

M
e
a
n
=
1
,
8
5
E
1
5
-R
2
1
0
1
2
S
t
d
.
D
v
.
0
9
4
3
e
g
rs
io
n
S
ta
n
d
riz
e
d
R
e
s
id
u
a
lN0

b. Box-plot

3.2. Procedee numerice


a. Testul Kolmogorov-Smirnov-Lilliefors (KSL)
-

presupune compararea frecvenelor cumulate


(calculate) cu frecvenele teoretice cumulate
extrase din tabelul Gauss.

Ipoteze statistice:
H0: ipoteza de normalitate
H1: distribuia erorilor nu urmeaz o lege normal
Regula de decizie:

valoarea probabilitii asociate statisticii test


calculate (Sig.) se compar
cu
(0,05): dac Sig.<0,05, atunci se respinge
ipoteza de normalitate a erorilor.

Exemplu:

One-Sample Kolmogorov-Smirnov Test


greut
N
Normal Parameters a,b
Most Extreme
Differences

Mean
Std. Deviation
Absolute
Positive
Negative

Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
a. Test distribution is Normal.
b. Calculated from data.

10
58,5000
7,83511
,276
,161
-,276
,873
,432

b. Testul Jarque-Bera

se bazeaz pe verificarea simultan a


proprietilor de asimetrie i boltire ale seriei
reziduurilor. Pentru o distribuie normal,
valoarea coeficientului de asimetrie Fisher (sw)
este zero, iar valoarea coeficientului de boltire
Fisher (k) este zero.

Ipoteze statistice
H0: ipoteza de normalitate
H1: distribuia erorilor nu urmeaz o lege normal

Calculul statisticii test:

statistica test JB se calculeaz dup relaia:


2

n
k
2
JB sw
6
4

unde: sw este
(Skewness):
sw 33

coeficientul

de

asimetrie

k este coeficientul
de boltire (Kurtosis):
4
k 2 3
2

Regula de decizie:
2
, 2
Statistica JB urmeaz o lege
-

dac valoarea calculat a statisticii test


2
JBcalc> ; 2
, atunci se respinge ipoteza
Ho.

Exemplu

n
k2
2
JB sw
6
4
JBcalc

0.752
406
0.4682

6
4

24.38

2 , 2 5.991
JBcalc 2 , 2 : se respinge H 0

d. Ipoteza de necorelare sau de


independen a erorilor: cov(i, i)=0.
1.

Noiuni

a. Autocorelarea sau corelaia serial :


presupune existena unei autocorelri ntre
erorile , altfel spus: cov(i, j) # 0 sau M(i *
j ) # 0.
b. Coeficientul de autocorelaie
coeficientul de autocorelaie ntre erorile i i
i-1 ale unui model de regresie se calculeaz
dup

relaia:

cov( i , i 1 ) cov( i , i 1 )

i i 1
2

acest coeficient este un coeficient de


autocorelaie de ordinul 1.
coeficientul de autocorelaie de ordinul k este
coeficientul de corelaie calculat ntre
termenii i i i-k , dup relaia:
cov( i , i k ) cov( i , i k )

i i k
2

c. Funcia de autocorelaie

este definit de valorile coeficienilor de


autocorelare de ordinul k.

2. Sursa autocorelrii erorilor


- neincluderea n modelul de regresie a uneia
sau
mai
multor
variabile
explicative
importante;
- modelul de regresie nu este corect specificat.
3. Testarea autocorelrii erorilor

3.1. Runs Test

se bazeaz pe ideea c valorile variabilei


reziduale se constituie n secvene sau seturi
de valori pozitive sau negative numite runs,
care se succed ntr-o anumit ordine sau
aleator.

ipoteza de baz a acestui test este aceea c n


cazul lipsei autocorelrii erorilor succesiunea
acestor seturi (runs, notate k) este aleatoare
sau numrul acestora este distribuit normal.

Ipoteze statistice

H0: k este distribuit normal (nu exist autocorelare a


erorilor)
H1: k nu este distribuit normal (ipoteza este nclcat)
Calculul statisticii test
- se folosete statistica t Student, calculat dup
relaia:

t calc

k M (k )

sk

unde: k este numrul de runs caracterizat prin:

M( k ) 2

n1 n2
1
n1 n2

2n1n2 n1 n2
s 2n1n2
(n1 n2 ) 2 (n1 n2 1)
2
k

n1 este numrul de valori pozitive ale erorilor ei ;


n2 este numrul de valori negative ale erorilor ei,
cu n1 + n2 = n .
s2k este o valoare calculat la nivelul eantionului
a estimatorului
k2

Regula de decizie:
- dac |tcalc|
ta/2,n-2 sau
accept ipoteza H0.

, katunci
M (k ) se
1,96 s

Exemplu:

Pentru dou variabile, X i Y, se cunosc


urmtoarele valori xi, yi i ei (erori estimate
ale modelului de regresie liniar simpl):

Nr.crt.

xi

yi

ei

20

-3,07508

21

-3,05303

22

-3,03099

24

-2,00894

25

-1,98689

27

-1,94280

29

-,92075

30

-,89871

10

32

,12334

10

12

35

1,16743

11

13

37

2,18948

12

15

39

2,23357

13

17

40

1,27766

14

19

43

2,32176

15

20

45

3,34380

16

22

47

3,38790

17

23

48

3,40994

18

25

49

2,45403

19

27

50

1,49813

20

29

52

1,54222

21

30

54

2,56427

22

32

55

1,60836

23

35

57

,67450

24

37

58

-,28141

25

39

59

-1,23732

26

40

61

-,21527

27

43

62

-2,14913

28

45

63

-3,10504

29

47

66

-2,06094

30

50

70

-,99481

31

52

71

-1,95071

32

55

75

-,88457

S se testeze ipoteza de autocorelare a erorilor,


folosind testul Runs.

Rezolvare:
-

n funcie de semnul valorilor erorilor ei se


pot identifica urmtoarele seturi sau runs:

(---------)(++++++)((---------)
(primele 8 valori ale erorilor ei sunt negative,
urmtoarele 15 valori sunt pozitive iar
ultimele 9 valori sunt negative).

Astfel, numrul total de valori pozitive ale


erorilor ei este n1=15 iar numrul total de
valori negative este n2=17.
Numrul de seturi de valori sau runs formate
este k=3.
Pentru
testarea
statistic
urmtoarele etape:

se

parcurg

Ipoteze statistice
H0: erorile nu sunt autocorelate
H1: erorile sunt autocorelate
Calculul statisticii test:
t calc

k M (k )
sk

unde:

M (k ) 2

n1 n 2
1
n1 n 2

Calculul valorilor M(k) i s(k):

M (k ) 2

n1 n2
15 17
1 2
1 16,94
n1 n2
15 17

s k2 2n1 n2

2n1 n 2 n1 n 2
2 15 17 15 17

15

17

7,6796
2
2
(n1 n2 ) (n1 n2 1)
(15 17) (15 17 1)

s k 7,6796 2,7712

Calculul statisticii test:

tcalc

k M (k )
4,85
sk

Regula de decizie:
|tcalc |=4,85>ttab=1,96 : se respinge ipoteza Ho,
deci erorile sunt autocorelate ntre ele.
SAU

(16,94 1,96 2,7712) (11,51 ; 22,37)

Numrul de seturi de valori k=3 nu este acoperit


de intervalul de ncredere, ceea ce arat c se
respinge ipoteza Ho.

Testul Runs n SPSS

Runs Test 2

Test Valuea
Cases < Test Value
Cases >= Test Value
Total Cases
Number of Runs
Z
Asymp. Sig. (2-tailed)
a. Mean

Unstandardiz
ed Residual
,0000000
17
15
32
3
-4,849
,000

3.2. Testul Durbin-Watson

Ipoteze statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate ( 0 )
Calculul statisticii test:
DW d

)
i i1
i2


i 1

2
i

ntruct i i 1 ui statistica DW se mai poate


scrie astfel:
d

2
2

i i i1 i1
i

i
i

i i i1
i

i
i

i i 1

i
2 1
2( 1 )
2
i

Deoarece 1 1 , valorile statisticii DW sunt


date de intervalul:
0d 4

Interpretare:

Dac 1 d 0 , atunci exist autocorelare


pozitiv maxim a erorilor;
Dac 1 d 4
, atunci exist
autocorelare negativ maxim a erorilor;
Dac 0 d 2
, atunci nu exist
autocorelare.

Regula de decizie:

Valorile teoretice ale statisticii DW sunt


calculate i tabelate n funcie de pragul de
semnificaie, de volumul eantionului i de
numrul de parametri ai modelului.

n tabele se determin dou valori critice,


notate cu dL (limita inferioar) i dU (limita
superioar).

n funcie de aceste valori critice se


determin urmtoarele intervale, care permit
luarea deciziei de respingere sau acceptare a
ipotezei nule:

(0<dcalc<dL) se respinge ipoteza Ho, erorile


nregistreaz o autocorelare pozitiv;
b. (dL<dcalc<dU) i (4-du<dcalc< 4-dL) sunt regiuni
de nedeterminare, nu se poate decide asupra
existenei autocorelrii erorilor;
a.

c. (du <dcalc< 4- du) se accept ipoteza Ho,


erorile nu sunt autocorelate;
d. (4-dL <dcalc< 4) se respinge ipoteza Ho, erorile
nregistreaz o autocorelare negativ.
Exemplu:
1. n studiul legturii dintre dou variabile, X i
Y, observate pentru un eantion format din
25 uniti statistice, s-a obinut o valoare
calculat a statisticii

dcalc =0,189. S se testeze ipoteza de


autocorelare a erorilor, considernd un risc de
0,05.
Rezolvare:
Din tabelul Durbin Watson, se citesc valorile:
dL=1,288; dU=1,454.
0<(dcalc=0,189)<(dL=1,288), ceea ce arat c se
respinge ipoteza Ho, deci erorile sunt autocorelate
pozitiv ntre ele.

2. Pentru un esantion de 5 unitati, pentru


studiul legaturii liniare dintre dou variabile, X
i Y, se cunosc datele:

Model Summaryb
Model
1

R
,985a

R Square
,970

a. Predictors: (Constant), X
b. Dependent Variable: Y

Adjusted
R Square
,960

Std. Error of
the Estimate
2,41523

DurbinWatson
1,429

Calculul statisticii test:

Interpretare:
Din tabelul Durbin Watson se citesc
valorile: dL=0,610; dU=1,400.
n exemplul dat:
(du=1,400)<(dcalc=1,429)<(4-1,4), ceea
ce arat c se accept ipoteza Ho,
erorile nu sunt autocorelate.

S-ar putea să vă placă și