Documente Academic
Documente Profesional
Documente Cultură
O serie de timp univariat poate fi privit ca o realizare a procesului stochastic, care este observat numai pentru un
numr finit de perioade. Presupunem c s-a observat o selecie de volum n a variabilei aleatoare Y, adic {y1 , y 2 ,..., y n } .
Notaia {Y1 , Y2 ,..., Yn } semnific un proces serie de timp, iar notaia {y1 , y 2 ,..., y n } semnific o serie de timp univariat.
Distincia dintre un proces stochastic i o realizare a sa este asemntoare celei dintre o populaie i un eantion extras din
acea populaie. Aa cum se folosete eantionul pentru a obine informaii despre populaie, n seriile de timp se folosete
realizarea pentru a obine informaii despre procesul stochastic de baz.
Componentele unei Serii de Timp
- componenta de trend
- componenta de sezonalitate
- componenta ciclic i
- componenta rezidual.
Analiza Seriilor de Timp este o metod general de caracterizare a seriei cronologice, din perspectiva componentelor
sistematice i aleatoare n vederea msurrii intensitii i continuitii lor, astfel nct procesul analizat s devin
predictibil.
1
O caracteristic intrinsec a unei serii de timp este aceea c observaiile adiacente sunt dependente.
Analiza Seriilor de Timp const n tehnici de analiz a acestei dependene.
Principalul instrument n analiza seriilor de timp este modelul stochastic. Se caut i se folosete un model stochastic de
un anumit tip, capabil s reproduc comportamentul trecut al unei serii, pe baza structurii sale de autocorelaie.
Modelarea seriilor de timp se bazeaz pe metodologia Box-Jenkins i face apel la modele AutoRegresive (AR), modele de
Medie Mobil (MA), modele autoregresive de medie mobil (ARMA) i modele ARIMA (modele autoregresive integrate
medie mobil).
1) Modelele AutoRegresive (AR) descriu procese cu evoluii datorate propriilor realizri din trecut.
Modelul autoregresiv de ordinul 1, notat AR(1): y t = + 1 y t 1 + t
Modelul autoregresiv de ordinul 2, notat AR(2): y t = + 1 y t 1 + 2 y t 2 + t
Modelul autoregresiv de ordinul p, notat AR(p): y t = + 1 y t 1 + 2 y t 2 + L + p y t p + t
2) Modelele de medie mobil (MAMovingAverage) descriu procese cu evoluii generate de o perturbare (abatere
semnificativ de la medie) a procesului.
Modelul de medie mobil de ordinul 1, notat MA(1): yt = + t + 1 t 1
Modelul de medie mobil de ordinul 2, notat MA(2): yt = + t + 1 t 1 + 2 t 2
Modelul de medie mobil de ordinul q, notat MA(q): y t = + t + 1 t 1 + 2 t 2 + L + q t q
3) Modelele mixte (ARMAAutoRegressive MovingAverage) descriu procese cu evoluii datorate ambelor categorii de
factori ( y t k i t k ).
Modelul ARMA(p,q): n cazul absenei tendinei generale n valorile observate, avem:
yt = + 1 y t 1 + 2 y t 2 + L + p yt p + t + 1 t 1 + 2 t 2 + L + q t q
Modelele AR, MA i ARMA sunt modele staionare liniare pentru serii de timp.
2
Serie staionar Serie nestaionar cu trend liniar
Un proces stochastic poate fi descris sau caracterizat prin momentele sale de ordinele 1 i 2:
Media: E ( y t ) = (t ) ; Variana: Var ( y t ) = E ( y t ) 2 = 2 (t ) ; Autocovariana: cov( y t1 , yt 2 ) = (t1 , t 2 ) .
a) Staionaritatea strict
Un proces stochastic este strict staionar dac pentru orice k, distribuia lui (Yt , Yt +1 ,K, Yt + k ) este aceeai pentru toi t,
deci este invariant n timp. Procesul are un comportament care nu se modific n timp.
Prin Lag se nelege decalajul sau ntrzierea, exprimate n uniti de timp, ntre modificarea variabilei cauzale i
manifestarea efectului.
Observaie: Condiia de staionaritate strict este o condiie greu de verificat empiric.
n locul staionaritii stricte este utilizat mai frecvent o definiie mai puin restrictiv a staionaritii.
b) Staionaritatea slab (Staionaritatea n covarian)
Un proces stochastic este slab staionar dac are media i dispersia constante n timp iar covariana sa ntre dou
perioade de timp depinde numai de decalajul dintre cele dou perioade i nu de momentul de timp la care este calculat.
Aceasta nseamn c procesul rmne n echilibru n jurul unui nivel mediu constant.
Seria de timp y t este slab staionar (staionar n covarian, staionar de ordinul 2) dac:
Media este constant: E ( yt ) = ;
Variana este constant: Var ( yt ) = E ( yt ) 2 = 2 ;
Covariana: cov( yt , yt + k ) = E [( yt )( yt + k )] = k . Cov( y s , yt ) depinde numai de decalajul t s .
O serie de timp care nu este staionar n sensul definiiei de mai sus, se numete serie nestaionar.
Covariana dintre valorile yt i yt + k , notat k , este numit autocovariana la lag-ul k.
Exemplu de proces staionar. Procesul Zgomot Alb (White Noise) este un proces ce descrie o variabil aleatoare cu
media zero i variana constant, dar fr o structur anume. Dac t este un ir de variabile aleatoare necorelate
(independente), fiecare cu media zero i variana constant finit, atunci t este staionar, fiind satisfcute condiiile de
staionaritate, adic: E ( t ) = 0 , Var ( t ) = 2 , cov( t , s ) = 0 , t s .
Funcia de autocovarian i Funcia de autocorelaie sunt:
2 , k = 0 1, k = 0
k = i k =
0 , k 0 0 , k 0
Un astfel de ir de variabile aleatoare necorelate este referit ca proces de zgomot alb sau proces aleator complet i pentru
el se folosete notaia t ~ WN (0, 2 ) .
Analiza de regresie bazat pe serii cronologice presupune c seriile de timp sunt staionare. Testele clasice t i F
sunt bazate pe aceast presupunere.
Seriile nestaionare sunt caracterizate de faptul c prezint o tendin de cretere sau de scdere, odat cu trecerea
timpului. Avem:
- Serie nestaionar omogen sau serie nestaionar n medie. Media seriei nu este constant n timp ci are o traiectorie
liniar cu panta pozitiv sau negativ.
- Serie nestaionar neomogen sau serie nestaionar n varian. Media i variana seriei nu sunt constante n timp.
3
a) Serie nestaionar de tip TS (Trend Stationarity). Reprezint o serie nestaionar de tip determinist.
O serie nestaionar este de tip TS dac Trendul este de tip determinist i se elimin prin scdere ( y t yTt ) sau prin
mprire ( yt / yTt ) .
Not: Efectul produs de un oc aleator este tranzitoriu, deci nu se acumuleaz n timp.
7. Testul Dickey-Fuller (Unit Root Test). Testul pentru staionaritate (pentru o rdcin unitar).
1. Se testeaz seria y t pentru a vedea dac este staionar. Dac rspunsul este da, atunci yt ~ I (0) . Dac rspunsul este
nu, atunci yt ~ I (d ) , unde d > 0 .
2. Mai nti se consider diferenele lui y t ca yt = yt yt 1 i se testeaz dac y t este staionar. Dac da, atunci
yt ~ I (0) i yt ~ I (1) . Dac nu, atunci yt ~ I (d ) , unde d > 0 .
Testarea existenei unei rdcini egale cu 1
Considerm un proces de mers la ntmplare: yt = yt 1 + t unde t este un proces zgomot alb. Acesta este un model
AR(1). Deoarece coeficientul lui y t 1 este 1 avem o rdcin egal cu 1, adic serie nestaionar.
Dac n modelul de regresie yt = yt 1 + t gsim c = 1 , spunem c variabila y t are o rdcin unitar. Scriem
ecuaia yt = yt 1 + t sub forma: yt = ( 1) yt 1 + t = yt 1 + t .
Dac = 0 putem scrie yt = yt yt 1 = t . Seria diferenelor de ordinul nti este o serie staionar.
Testul Dickey-Fuller (Unit Root Test)
H 0 : seria are rdcin unitar i este nestaionar ( = 1 sau = 0 )
H 1 : seria este staionar ( < 1 sau < 0 )
Dac respingem ipoteza nul, putem accepta staionaritatea seriei.
Dac = 1 sau = 0 , atunci seria nu este staionar.
Dac > 1 , atunci seria este exploziv (tot nestaionar; de regul astfel de comportament nu este regsit n economie)
Dac < 1 sau < 0 , atunci seria este staionar. Avem un test unilateral.
Testul Dickey-Fuller este testul de baz pentru o rdcin egal cu 1. Sub ipoteza nul c = 1 sau = 0 statistica
folosit este cunoscut ca statistica (tau). Aceasta este definit ca fiind = DF = se() . Aceast statistic nu
urmeaz distribuia t uzual, sub ipoteza nul. Valorile critice sunt obinute prin experimente Monte Carlo i se gsesc n
tabele construite de Dickey i Fuller. Dac respingem ipoteza nul c = 0 sau = 1 , rezult c seria este staionar i
putem folosi testul t.
4
Dac | calc | > | crt | sau Prob< respingem H 0 i acceptm c seria este staionar.
Dac | calc | < | crt | sau Prob> acceptm H 0 adic seria este nestaionar.
Dickey i Fuller au propus trei ecuaii de regresie diferite, care pot fi folosite pentru a testa prezena unei rdcini egale cu
1. n fiecare caz se formuleaz ipoteza nul i ipoteza alternativ.
i) H 0 : yt = yt 1 + t iar H 1 : yt = yt 1 + t , < 1 . Acesta este un test pentru un proces de mers la ntmplare, contra unui
proces autoregresiv, de ordinul nti, AR(1), staionar.
Nu exist termen de interceptare i nu exist trend.
ii) H 0 : yt = yt 1 + t iar H 1 : yt = yt 1 + + t , < 1 . Acesta este un test pentru un proces de mers la ntmplare, contra
unui proces AR(1), staionar, cu deplasare.
Exist termen de interceptare i nu exist trend.
iii) H 0 : yt = yt 1 + t iar H 1 : yt = yt 1 + + t + t , < 1 . Acesta este un test pentru un proces de mers la ntmplare,
contra unui proces AR(1), staionar, cu deplasare i trend n timp.
Diferena dintre cele trei regresii const n prezena elementelor deterministe i . Cele trei modele alternative pot fi
rescrise sub forme echivalente. Vom avea modelele:
yt y t 1 = ( 1) y t 1 + t yt = yt 1 + t
yt yt 1 = ( 1) yt 1 + + t yt = yt 1 + + t
yt yt 1 = ( 1) yt 1 + + t + t yt = yt 1 + + t + t
Parametrul de interes n toate cele trei ecuaii de regresie este . Dac o serie este staionar, condiia 1 < < 1 este
echivalent cu condiia de staionaritate: 2 < < 0 . Dac = 0 , seria conine o rdcin egal cu 1. Testul implic
estimarea uneia din ecuaiile de mai sus prin MCMMP, pentru a obine valorile estimate ale lui i eroarea standard
asociat.
Testul Dickey Fuller dezvoltat (ADF Augmented Dickey Fuller) ine seama i de posibilitatea ca erorile t s nu fie
zgomot alb. Deoarece termenul eroare este puin probabil s fie un proces de zgomot alb, Dickey i Fuller au aplicat o
procedur mbuntit, care folosete p decalaje ale variabilei dependente. Testul ADF include termeni AR(p) ai
termenului yt n cele trei modele alternative. Dac termenul eroare este autocorelat, ultimul din cele trei modele va fi:
p
y t = yt 1 + + t + i y t i + t .
i =1
O problem care apare este determinarea numrului optim de decalaje ale variabilei dependente. Pentru aceasta se
folosesc criteriile AIC (Akaike info criterion) i SIC (Schwarz criterion) din pachetul Eviews.
8. Funcia de autocovarian.
Funcia de autocovarian a unui proces staionar este irul autocovarianelor de lag k, { k } , unde k = 0,1,2,3, K .
Pentru un proces staionar avem E ( yt ) = pentru orice t.
Definim cov( y t , yt + k ) = E ( y t yt + k ) E ( yt ) E ( y t + k ) = k , autocovariana la decalajul sau lag-ul k.
Dac k = 0 se obine 0 = Var ( yt ) , deci variana lui Y, iar dac k = 1 se obine 1 = cov( y t , y t +1 ) = cov( y t , yt 1 ) ,
autocovariana dintre dou valori adiacente ale lui Y, adic la distan de un lag.
k = k pentru toate valorile lui k. O serie de timp este numit ergodic dac k 0 cnd k .
5
2 , daca k = 0
k = cov( t , t + k ) = . Variabilele t au media zero, au variana 2 i sunt necorelate.
0 , altfel
Corelograma este graficul funciei de autocorelaie (ACF) n raport cu decalajul k, i ofer numeroase informaii privind
comportamentul seriei de timp. Proprietile dinamice ale fiecrui model staionar determin o anumit form a
corelogramei (un anumit tipar).
Interpretarea corelogramei
Analiza coeficienilor de autocorelaie arat c o serie de timp ar putea fi:
a) Serie aleatoare. O serie complet aleatoare are coeficienii de autocorelaie k 0 pentru orice k > 0 i pentru valori
mari ale lui n. Pentru o serie aleatoare se demonstreaz c k ~ N (0,1 / n) i atunci ne ateptm ca o singur valoare a lui
k s fie semnificativ.
b) Serie ce prezint corelaie pe termen scurt. O astfel de serie are o valoare mare a lui 1 , dup care urmeaz 2 sau 3
coeficieni diferii de zero dar valorile lor sunt din ce n ce mai mici. Pentru valori mari ale lui k avem valori ale lui k
apropiate de 0.
Ex: O serie de timp n care o observaie aflat deasupra mediei este urmat de una sau mai multe observaii sub medie sau,
o observaie aflat sub medie este urmat de una sau mai multe observaii peste medie. Pentru acest tip de date este
potrivit un model autoregresiv.
c) Serie alternant. Dac valorile seriei alterneaz de o parte i de alta a mediei, atunci i coeficienii de autocorelaie vor
alterna. Coeficientul 1 va fi negativ. Dac valoarea observat la lag-ul 2 tinde s fie de aceeai parte a mediei, atunci 2
va fi pozitiv.
d) Serie nestaionar. Dac o serie conine trend, o observaie de o anumit parte a mediei tinde s fie urmat de un
numr mare de observaii de aceeai parte a mediei. n acest caz, valorile lui k vor tinde la zero doar pentru valori foarte
mari ale lui k. De aceea trendul trebuie eliminat nainte de calcularea coeficienilor k . Cu alte cuvinte, coeficienii k
trebuie calculai numai pentru seriile staionare.
e) Serie cu variaii de sezonalitate. ntr-un astfel de caz, corelograma are aceeai form sinusoidal ca i seria analizat.
Mai nti, trebuie eliminat sezonalitatea din seria de date iniiale.
f) Serie ce conine una sau mai multe valori extreme(outliers). Dac exist o valoare extrem n datele iniiale,
reprezentarea grafic a lui yt n raport cu yt k va conine dou puncte extreme ce vor conduce la coeficieni de corelaie
aproape nuli. Dac exist dou observaii extreme, poate s apar o corelaie foarte mare. Se recomand ca, chiar de la
nceput, aceste observaii extreme s fie ajustate.
Se mai poate nota cu k . Deoarece n aplicaiile practice dispunem doar de o realizare a unui proces stochastic, se pot
calcula doar coeficienii de autocorelaie de selecie de lag k, adic rk = k = k 0 .
Funcia de autocorelaie de selecie (SACF) este mulimea {rk = k = k 0 | k Z } .
Graficul coeficienilor rk n raport cu k este numit corelogram.
Exemplu: Pentru a ilustra calcularea unei funcii SACF, considerm 10 valori ale unei serii de timp y t :
13, 8, 15, 4, 4, 12, 11, 7, 14, 12. S se calculeze autocorelaiile de selecie pentru lag-urile 1, 2 i 3.
Calculm media de selecie i obinem y = 10 . Folosim formulele
( yt y )( yt 1 y ) ( yt y )( yt k y )
n n
r1 = 1 = t = 2 n , rk = k = t = k +1 n
t =1 ( yt y ) 2 t =1 ( yt y ) 2
6
(13 10)(8 10) + (8 10)(15 10) + L + (7 10)(14 10) + (14 10)(12 10) 27
1 = = = 0,188
(13 10) 2 + (8 10) 2 + L + (12 10) 2 144
(13 10)(15 10) + (8 10)(4 10) + L + (11 10)(14 10) + (7 10)(12 10) 29
2 = = = 0,201
(13 10) 2 + (8 10) 2 + L + (12 10) 2 144
26
3 = = 0,181
144
7
Pentru n suficient de mare (pentru a putea aproxima repartiia Student prin cea normal), pentru variana estimatorului
coeficientului de autocorelaie se utilizeaz expresia:
)
Var ( k ) = 1 / n .
Dac ( y1 , y 2 ,..., y n ) reprezint o mulime de observaii iid i E ( yt2 ) < , se poate arta c estimatorul k este asimptotic
normal, cu media 0 i variana 1 / n , pentru orice numr ntreg pozitiv fixat, k.
Propoziie: Dac seria ( y1 , y 2 ,..., y n ) provine dintr-un proces zgomot alb gaussian, atunci k are o distribuie normal cu
media 0 i variana Var ( k ) = 1 / n , adic k ~ N (0,1 / n) . Avem se( k ) = 1 / n .
Consecine:
- Un interval de ncredere 95% pentru k are forma (1,96 / n ; + 1,96 / n ) sau (2 / n ; + 2 / n ) .
- 95% din valorile coeficienilor de autocorelaie se afl in intervalul (2 / n ; + 2 / n ) .
Aceste rezultate sunt folosite pentru teste de semnificaie pentru coeficienii de autocorelaie, construind o regiune de
acceptare pentru un coeficient de autocorelaie estimat, pentru a determina dac acesta este semnificativ diferit de zero.
Testarea semnificaiei unui singur coeficient de autocorelaie k :
H 0 : k = 0 ( k nu este semnificativ statistic)
H 1 : k 0 ( k este semnificativ statistic).
n corelograme, intervalele de ncredere 95% (ale coeficienilor de autocorelaie individuali) sunt reprezentate ca dou
benzi, bazate pe abaterea standard aproximat k 1 / n .
O regiune de acceptare 95% pentru ipoteza nul va fi dat prin intervalul (1,96 / n ; + 1,96 / n ) , pentru k 0 . Dac
valoarea coeficientului de autocorelaie cade n afara acestui interval, pentru o valoare dat a lui k, atunci ipoteza nul c
k = 0 este respins. Se accept ipoteza alternativ: k 0 .
n seleciile finite, k este un estimator deplasat al lui k . Deplasarea este mare n cazul seleciilor de volum redus i este
fr importan n cazul seleciilor de volum mare.
Problema1: Considerm o selecie de volum n=200 de observaii asupra unui proces stochastic pentru care se cunosc
1 = 0,4 i k = 0, k 2 . Autocorelaiile estimate sunt:
k 1 2 3 4 5 6 7 8 9 10
rk -0,38 -0,08 0,11 0,08 0,02 0,00 0,00 0,00 0,07 -0,08
S se testeze i s se indice care coeficient de autocorelaie este semnificativ diferit de zero.
Deoarece variana estimat a lui rk este Var (rk ) = Var ( k ) = 1 / n = 1/200=0,005 rezult c abaterea standard va fi
se( k ) = 1 / n = 1 / 200 = 0,005 = 0,07 . Un coeficient k este semnificativ diferit de zero dac se afl n afara
intervalului (2 / n ; + 2 / n ) , n acest caz (0,14 ; + 0,14) .
Dac k (0,14 ; + 0,14) acceptm ipoteza c k nu este semnificativ diferit de zero.
Deoarece avem r1 = 1 = 0,38 , nseamn c 1 (0,14 ; + 0,14) , deci acceptm ipoteza c k este semnificativ diferit
de zero ( 1 0). Pentru restul coeficienilor acceptm ipoteza c nu sunt semnificativi, adic k = 0, k 2 .
n caz c ipoteza nul este adevrat, se arat c statistica Q(m) urmeaz o distribuie m2 .
8
Dac QLB < crt
2
acceptm H 0 seria este staionar.
Dac QLB > crt
2
respingem H 0 seria este nestaionar.
Performanele statisticii Q depind de mrimea decalajului m. Din diferite studii de simulare, s-a ajuns la concluzia c cea
mai bun mrime a lui m este m ln(n) .
Problema2:
Pentru un eantion de 100 observaii asupra seriei stationare y t am obinut informaiile alturate. Testai ipoteza c primii
4 coeficieni de autocorelaie sunt simultan nuli.