Sunteți pe pagina 1din 41

Analiza seriilor de timp

Testarea ipotezelor cu privire la eroarea de modelare


Statistica si previziune economica
Anul III
2016-2017
TEMATICA
1. Testarea ipotezelor privind eroarea de modelare specifice Eviews
1.Media erorilor de modelare este zero
2.Normalitate
3.Independenta
4.Homoscedasticitate
5. Heteroscedasticitatea conditionata
2. . Alte teste specifice ST in Eviews
1.Testarea radacinii unitate
Testarea Normalitatii erorilor
Testul Jarque- Berra (H0: ε~N(με , σε 2))
Estimarea coeficeintilor de asimetrie Fisher (γ1):
T
i   3
 (
T
)
m m
 1 : Sk  i 1  3  33
T
i   2 m23 s

i 1
(
T
)

Estimarea coeficientilor de boltire Pearson (β2):


T
i   4
 (
T
)
m m
 2 : K  Ti 1  42  44
   2 2 m2 s
( ( i ) )
i 1 T
m2, m3 si m4 momentele centrate de ordin 2 3 si 4:
T
( i   ) r
mr  
i 1 T

iar s este abaterea standard s = m2


Calculul statisticii JB
T 2 ( K  3) 2
JB  ( Sk  ) ~  2 (2) si pentru un  fixat
6 4

JB  2 , 2
Formularea deciziei: => AH0 cu o probabilitate 1-α
JB  2 , 2 => RH0 cu un risc asumat α
60
Series: Residuals
Sample 1992M01 2014M08
50
Observations 272

40 Mean 6.85e-12
Median -5.010046
Maximum 2463.727
30 Minimum -1630.691
Std. Dev. 625.6910
20 Skewness 0.327932
Kurtosis 3.958518

10 Jarque-Bera 15.28770
Probability 0.000479
0
-1500 -1000 -500 0 500 1000 1500 2000 2500
Testarea independentei erorilor
Erorile unei serii de timp sunt independente daca intre oricare doua valori εt si εt+k siutate la
o distanta de k perioade una de cealalta (decalaj) nu exista o legatura semnificativa care sa
depinda de t sau k.
Testarea independentei eroirilor de modelare se face cu ajutorul corelogramelor si a
testelor specifice acestora:
- Testul Ljung-Box sau Statistica Q utilizat pentru testarea coeficientilor de autocorelatie
- Berusch-Godfrey LM test
- Testul de banda ~ ±2/(√T) utilizat pentru testarea coeficientilor partiali de autocorelatie.
H0: nu exista autocorelatii in erorile de modelare mai mari decat ordinul specificat (p)
εt= φ1 εt-1+ φ2εt-2+ φ3εt-3+ ….+ φpεt-p+ ut, cu ut IIND de medie zero.
Testul BREUSCH-GODFREY (BG) sau testul corelatiei seriale LM

Pp. ca urmatorul model liniar a fost estimat prin m. c.m.m.p.:


yt= β1 +β2xt+ β3zt+εt
Pentru eroarea de modelare εt se va construi modelul de regresie auxiliar:
εt= φ1 εt-1+ φ2εt-2+ ….+ φpεt-p+ β’1 +β’2 xt+ β’3zt+ ut
In Eviews vor fi calculate 2 statistici:
- Statistica nR2, prin care se testeaza ipoteza H0, care urmeaza o distributie χ2(p):
BG(p)=nR2~χ2(p) unde n=T nr. obs./ per. de timp observate.
Statistica F pentru testarea simultana a parametrilor modelului: φ1=φ2= ….=φp ne va
conduce la o decizie incerta, deoarece nu se cunoaste distributia lui F in conditiile indeplinirii
H0. Aceasta decizie are scopul de a oferi termen de comparatie cu statistica BG.
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 198.8789 Prob. F(4,52) 0
Obs*R-squared 56.31865 Prob. Chi-Square(4) 0
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 11/26/13 Time: 10:48
Sample: 1993M01 1997M12
Included observations: 60

Presample missing value lagged residuals set to zero.


Variable Coefficient Std. Error t-Statistic Prob.
C 0.033756 0.165421 0.204063 0.8391
TDUM^2 -0.000613 0.001283 -0.47779 0.6348
TDUM^3 3.00E-05 5.12E-05 0.586782 0.5599
TDUM^4 -3.64E-07 5.27E-07 -0.69058 0.4929
RESID(-1) 1.448988 0.139167 10.41184 0
RESID(-2) -0.328413 0.241573 -1.35948 0.1799
RESID(-3) -0.274865 0.242152 -1.13509 0.2615
RESID(-4) 0.011887 0.14284 0.083221 0.934

R-squared 0.938644 Mean dependent var 4.61E-15


Eviews –ul raporteaza si testul t pentru fiecare φi , i =1,p insa acesta nu
este semnificativ deoarece, la fel ca in cazul lui F, distributia statisticii t nu
este cunoscuta. Prin urmare probabilitatile asociate acestui test vor avea si ele
mai mult un caracter orientativ.
Testul Q* a lui Box-Pierce Si Testul Q a lui Ljung-Box
Functia de autocorelatie (FAC)
cov( t ,  t -k )
 k   ( t ,  t -k )  , k  1, p
V ( t ) V ( t -k )
Pentru un proces stohastic homoscedastic V(εt)=V(εt-k)=V(ε)
Notam cu γk functia autocovarianta de ordin k:
T

 (
t 1
t  M ( t ))( t i  M ( t  k ))
k  , k  1, p
T
si γ0=V(εt)/T=σ2.
In concluzie ρ(εt ,εt-k)= γk/ γ0.
FAC(k) este o functie para: ρk= ρ -k.
Notam cu r (fac) valoarea estimata a parametrului ρ (FAC) si aceasta reprezinta
realizarea functiei de autocorelatie FAC. Pentru un proces de tip zgomot alb sau IIND de
medie zero ρk=0 pentru orice k#0 si ρk=1 pentru k=0.
Statistica Q* a lui Box-Pierce, respectiv varianta sa modificata, statistica Ljung-
Box, urmeaza asimptotic o distributie χ2(p) in ipoteza ca erorile IIND pentru cazul in
care testam autocorelatia de ordin p, ρp.
Testul Q nu testeaza individual fiecare coeficient de autocorelatie in parte, ci suma
acestora pana la ordinul p:
p H0
*
Q calculat  T  ri ~  2 ( p ) pentru un  fixat
2

i 1
Acest test are putere mica in detectarea autocorelatiilor de aceea in practica este mult
mai indicat sa se utilizeze pentru acest test un prag de semnificatie de 10% in loc de
5%.
Acest test nu este calculat in Eviews ci varianta sa corectata, Testul Q a lui Ljung-
Box: p 2 H
ri 0

Qcalculat  T (T  2) ~  2 ( p ) pentru un  fixat


i 1 T  i
Datorita faptului ca pentru acest test trebuie sa solicitam explicit ordinul
autocorleatiilor testate este posibil sa omitem autocorelatiile seriale de rang mare.
OBS: In Eviews acest test este posibil de aplicat in doua moduri diferite:
1. Din fereastra ‘Equation’->’View’->’Residual Tests’-> ‘Correlogram Q-
Statistics’
2. Din fisierul RESID->’View’-> ‘Corelogram’.
Pentru cazul in care in generarea erorii a fost utilizat un model liniar univariat nu
exita diferente intre cele doua rezultate insa in cazul contrar rezultatele vor fi diferite.
Pentru a preintampina aceasta eroare este recomandata accesarea testului Q doar
din fereastra ‘Equation’!
Testul Durbin-Watson
Testul Durbin Watson pentru seriile de timp este un test destul de restrictiv,
atat sub aspectul ordinului autocorelatiei testate cat si sub aspectul restrictiilor
impuse modelului pentru care se poate aplica: modelul trebuie sa aiba constatnta
inclusa si variabilele explicative trebuie sa fie exogene.

Nota: Numim variabile exogene acele variabile care influenteaza modelul fara
insa a fi afectate de acesta.
Testarea Homoscedasticitatii
Testarea homoscedasticitatii: H0: σ εt2=ct. oricare ar fi t=1,T.
1.Berush-Pagan-Godfrey
2.Harvey
3.Glesjer
4. White

Testarea heteroscedaticitatii conditionate:


1. ARCH
2. Corelograma patratului erorilor
Testarea heteroscedasticitatii - Testul Berusch Pagan Godfrey
Este un test din familia Lagrange Multiplier (LM) si utilizeaza statistca:
LM(p)=nR2~χ2(p)
BPG efectueaza o regresie, implicita, intre patratul reziduurilor si regresorii modelului
original
Ipoteza nula
H0: γ1=γ2=….= γp=0 (fara constanta γ0)
Alternativ putem utiliza testul F pentru care distributia ramane incerta pentru esantioane
de volum mic!
EXEMPLU: Tabla
Testarea heteroscedaticitatii- Testul Breusch Pagan Godfrey
 OUTPUT EViews

Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 8.5213 Prob. F(2,269) 0.0003


Obs*R-squared 16.2059 Prob. Chi-Square(2) 0.0003
Scaled explained SS 23.4468 Prob. Chi-Square(2) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/16/16 Time: 10:29
Sample: 1992M01 2014M08
Included observations: 272

Variable Coefficient Std. Error t-Statistic Prob.

C -34970.3800 119884.9000 -0.2917 0.7707


TDUM 5642.5880 2027.8330 2.7826 0.0058
TDUM^2 -13.9205 7.1937 -1.9351 0.0540

R-squared 0.0596 Mean dependent var 390050.0000


Adjusted R-squared 0.0526 S.D. dependent var 672136.1000
S.E. of regression 654224.1000 Akaike info criterion 29.6313
Sum squared resid 115000000000000.0000 Schwarz criterion 29.6710
Log likelihood -4026.8510 Hannan-Quinn criter. 29.6472
F-statistic 8.5213 Durbin-Watson stat 1.5694
Prob(F-statistic) 0.0003
Testarea heteroscedaticitatii- Testul HARVEY
Havrey efectueaza implicit o regresie intre logaritm din patratul erorilor si
regresorii modelului original
EXEMPLU: Tabla
OUTPUT EViews
Testarea heteroscedasticitatii - Testul GLEJSER
- efectueaza o regresie implicit intre reziduul in valoare absoluta si regresorii
modelului original
Testarea homoscedasticitatii- Testul White
- este considerat cel mai general test al homoscedasticitatii. Este considerat a fi
unicul test al heteroscedasticitatii, in adevaratul sens al cuvantului, din Eviews.
- face o regresie dupa patratul erorilor de modelare si combinatii ale
regresorilor din modelul original, inclusiv combinatii cu ele insele, si o
constanta. Optional pot fi incluse/exluse combinatiile intre termeni diferiti (White
cross terms).
- este un test de tip LM bazat pe statistica: LM(p)=nR2~χ2(p)
OBS: Interpretarea lui LM se face cu anumite rezerve, vezi observatiile de la testul
independentei BG. Testul W este f. general deoarece odata respinsa ipoteza nula nu ofera
informatii cu privire la identificarea cauzei heteroscedasticitatii. Testul t poate oferi
orientativ informatii cu privire la sursa heteroscedasticitatii cu aceleasi rezerve ca in cazul
testului BG.
- mai multe informatii pot fi obtinute in cazul utilizarii testului BP.
Exemplu: TABLA
CURS 12
HETEROSCEDASTICITATEA CONDITIONATA
Testarea heteroscedaticitatii- Testul ARCH
ARCH - variabila dependenta resid2
Testul ARCH efectueaza o regresie dupa resid2 si resid2 decalate pe un numar
de perioade de timp (fixat printr-o fereastra de dialog) si o constanta.

H0: Nu exista componente ARCH de ordin mai mare decat ordinul precizat (q)
HeteroskedasticityTest: ARCH
F-statistic 19.723 Prob. F(1,269) 0
Obs*R-squared 18.512 Prob. Chi-Square(1) 0

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/16/16 Time: 10:51
Sample (adjusted): 1992M02 2014M08
Included observations: 271 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 288855 45764.03 6.312 0
RESID^2(-1) 0.2614 0.058862 4.441 0
R-squared 0.0683 Mean dependent var 391176.8
Adjusted R-squared 0.0648 S.D. dependent var 673122.2
S.E. of regression 650931 Akaike info criterion 29.61755
Sum squared resid ‘1.14E+14 Schwarz criterion 29.64413
Log likelihood -4011.2 Hannan-Quinn criter. 29.62822
F-statistic 19.723 Durbin-Watson stat 2.023609
Prob(F-statistic) 1E-05
Testarea heteroscedaticitatii- CORELOGRAMA

Correlograma erorilor de modelare la patrat (resid2).

OBS: Rezultatul produs se suprapune cu rezultatul furnizat de testul ARCH in


tabelul modelului de regresie!!!
Informatiile pentru PACF se coreleaza
cu informatiile de la testul ARCH
1.Operatorul de intarziere si operatorul diferenta

2.Trenduri deterministe si trenduri stohastice

3.Testarea radacinii unitate testul DF si testul ADF


1. Operatorul de Intarziere (lag) si Operatorul Diferenta
Operatorul de intarziere sau de decalaj (engl. lag operator sau backward-shift operator)
este notat cu L sau B si are proprietatea:
LYt=Yt-1 , L2Yt=Yt-2, …, LpYt=Yt-p
Specific seriilor de timp este sa utilizam nu atat operatorul de intarziere ci operatorul
de intarziere polinomial :
β(L)= β0 + β1 L+ β2 L2+…+ βpLp+…
si acesta este utilizat in definirea modelelor cu decalaj distribuit:
Yt =B’(L)Yt+εt=(β1 Yt-1+ β2 Yt-2+ …+ βp Yt-p +…)+εt
unde prin B’(L) am notat operatorul de intarziere polinomial fara constanta β0 .
Modelele autoregresive si modelele medie mobila sunt un caz particular de modele
cu decalaj distribuit.
Operatorul diferenta de ordinul I este reprezentat de diferenta dintre doi termeni
succesivi, decalati cu o perioada de timp. Acesta poate si fi exprimat cu ajutorul
operatorului lag:
Δyt=yt-yt-1=(1-L)yt
Operatorul diferenta de ordinul II este reprezentat de diferenta dintre doi termeni
succesivi, decalati cu 2 perioade de timp:
Δ2yt=Δyt-Δyt-1=(yt-yt-1 )-(yt-2-yt-1) =yt-yt-2=(1-L2)yt
2.Trenduri deterministe (trend stationary)
Spunem despre o ST (Yt) ca prezinta trend determinist daca seria poate fi exprimata printr-o
functie determinista in functie de timp (f(t)):
iid
2
Yt =f(t)+εt , cu numita
ε t ~ N(0,σ ε) si proces de tip zgomot alb Gausian (Normal
Independent Distribuita de medie 0) (Gaussian White Noise).
Exemplul cel mai simplu de functie determinista este:
Yt=β0 +β1t+εt , εt ~IIDN(0,σ2ε) ->Independenta Identica Normal Distribuita de medie 0
Este evident ca Yt este un proces nestationar in medie deoarece
M(Yt|t)= β0 +β1t->f(t) media sa fiind conditionata de valoarea lui t.
O ST cu trend determinist poate fi usor stationarizata prin scaderea din valorile variabilei
dependente (yt) a componentei deterministe corespunzatoare momentului t (f(t)):
Yt-f(t)=εt, εt~IIND(0,σε2)
O alta metoda de inlaturare a influentei trendului determinist liniar este diferenta de
ordinul I:
ΔY t=Yt-Yt-1 =[(β0 +β1t)- (β0 +β1(t-1))]+(εt – εt-1)=β1+(εt – εt-1) care este
stationara in medie si varianta:
M(ΔY t)= β1- ct.
O astfel de serie care contine numai trend determinist poarta denumirea de proces
stationar in trend (eng. Trend Stationary Process - TSP).
OBS: Pentru o ST cu trend polinomial de ordin m efectuarea unei diferente de ordin
m conduce la stationarizarea seriei in medie.
Procese Cu trend Stohastic (difference stationary): Process de tip
Mers Aleator (Random Walk Process->RW)
Un proces de tip RW este o serie de timp caracterizata de faptul ca valorile variabilei nu
pot fi inscrise intr-un tipar, acestea fiind aleatoare.
Un model RW este descris de relatia:
Yt=Yt-1+εt, εt~IIND(0,σε2), t = 1,∞
1
Y
(1-L)Yt= εt  t = ε t  Yt= (1+L2+L3+…) εt 
1-L
M(Yt) =M(εt )+M(εt-1 )+M(εt-2 )+…= 0+0+0+….= 0

V(Yt) =V(εt )+V(εt-1 )+V(εt-2 )+…= σ2ε+ σ2ε+ σ2ε+ …= ∞


Dupa cum se poate vedea acesta este un proces stationar in medie dar nestationar
in varianta.
Procese de tip Mers Aleator cu Deviere
(Random Walk with Drift-> RWD)

Modelul RWD este un model RW la care se adauga o constanta:

Yt=β0 + Yt-1+εt, εt~IIND(0,σε2)

Constanta impinge valorile lui Yt intr-o singura directie crescatoare (+) sau
descrescatoare (-).
Procesul este nestationar si prezinta un trend stohastic.
Facand diferenta de ordinul I modelul RW cat si modelul RWD devine stationar:
(Yt-Yt-1)=εt(1-L)Yt =εt ΔYt=εt, εt~IIND(0,σε2)
Acest tip de proces se numeste proces stationar prin diferenta (eng. Difference-
Stationary Process->DSP) sau proces radacina unitate (eng. Unit Root Process).
Fie modelul AR(1) definit prin relatia:
Yt=β1Yt-1+εt  (Yt-β1Yt-1)=εt(1-β1L)Yt=εt, εt~IIND(0,σε2) si |β1|<1
1
(1  1 L)Yt   t  Yt   t  Yt   t  1 t 1  12 t  2  13 t 3  ...
1  1 L
M(Yt) =M(εt )+M(εt-1 )+M(εt-2 )+…= 0 + 0 + 0 +….= 0
2
 
V(Yt) =V(εt )(1+β21 + β41 + β61 +…)= 2
ct.
1  1
Pentru modelul RW , RWD si DSP vom prezenta modelul cu ajutorul decalajului
polinomial:
(1-L)Yt=εt pentru modelel RW si RWD
(1-β1L)Yt=εt, pentru modelul AR(1)
In RW polinomul decalajelor admite solutie doar pe L=1 si pentru modelul AR(1)
admite solutie L=1/β1. Cu alte cuvinte polinomul modelelor nestationare admite o
radacina unitate iar polinomul modelelor stationare admite o radacina supraunitara.
Ipoteza de nestationaritate se testeaza in termenii existentei radacinii unitate:
H0: β1=1 si
H1: | β1|<1 sau varianta sa simplificata 0<β1<1.
DIFERENTA - INTEGRARE

Spunem despre o ST (Yt) ca este integrata de ordinul intai dacaYt nestationara iar ΔYt
este stationara si scriem aceasta : Yt~I(1) (1-L)Yt=εt  ΔYt~I(0)

Spunem despre o ST (Yt) ca este integrata de ordinul doi dacaYt nestationara iar Δ2Yt
stationara si scriem aceasta : Yt~I(2)  ΔYt~I(1)  Δ2Yt~I(0) (1-L)2Yt= εt
Testul Dickey Fuller (DF)
Testul DF este aplicabil modelelor de tip AR si testeaza prezenta radacinii unitate
pentru trei tipuri de modele de procese stohastice:
AR(1) : Yt=β1Yt-1+εt
AR(1) +ct.: Yt=β0+β1Yt-1+εt
AR(1) +ct.+trend det.:Yt=α0+β1Yt-1+α1t+εt
In testarea radacinii parametru de interes maxim este reprezentat de β1 iar valoarea
critica pentru acest parametru in cazul testarii este reprezentata de radacina unitate
(unit root) 1.
In testarea radacinii unitate nu sunt utilizate modelele in forma de mai sus ci intr-o
forma transformata pentru a permite utilizarea testului t.
Modelele transformate se obtin prin scaderea luiYt-1 din ambii termeni ai modelului:
1. AR(1)’ : ΔYt=(1-β1)Yt-1+εt
2. AR(1) ‘+ct.: Δ Yt=β0+(1-β1)Yt-1+εt
3. AR(1) ‘+ct.+trend det.: ΔYt= β 0+(1-β1)Yt-1+λt+εt
notam (1-β1)=γ
Pentru modelele modificate ipoteza testarii radacinii unitate enuntata singular este:
H0: γ=0 cu alternativa H1: γ<0


Statistica utilizata este t  ~ DF-t sub ip. AH 0
s
Testul DF Extins
(Augmented Dikey Fuller->ADF)
Deoarece testul DF este specific doar pentru modele AR(1) pentru cele de ordin mai
mare este incalcata ipoteza de NID pentru eroarea de modelare. In practica este
preferata o varianta extinsa a testului DF denumita testul ADF care permite includerea a p
termeni diferenta cu decalaj.
Pornind de la un model AR(p) de forma:
Yt= β0+β1Yt-1+β2Yt-2+ β3Yt-3+….+ βpYt-p +εt prin adaugari si scaderi repetate se
ajunge la un model de forma:
p 1
1. AR(p) : Yt   Yt 1    i  Yt  i   i unde parametrii αi reprezinta combinatii
i 1
liniare ale parametrilor βi din modelul AR(p) iar γ=1-β1.
Aceleasi transformari se pot efectua si pentru modelele cu constanta si modelele cu
constanta si trend:
p 1

2. AR(p)+ct.: Yt   o   Yt 1    i Yt i   t


i 1

p 1

3. AR(p)+ct.+trend det.: Yt   o   Yt 1    i Yt i   t   t


i 1

La fel ca in cazul testului DF testarea lui γ implica utilizarea statisticii t~DF-t.


OBSERVATII CU CARACTER PRACTIC PRIVIN TESTAREA
RADACINII UNITATE

DISCUTIE