Sunteți pe pagina 1din 18

Serii de timp

Curs 3, Martie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Noţiuni generale
 Definiţie: Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia
aferentă momentului t și variabila aleatoare (Yt ), se definesc:

 media variabilei (Yt ): E (Yt ) =  t

 varianţa variabilei (Yt ) : Var (Yt ) =  t2 = E[(Yt −  t ) 2 ]

 covarianţa dintre două variabile (Yt ) şi ( Y s ), prin:

 ts = cov(Yt , Ys ) = E (Yt −  t )(Ys −  s )


Procese staţionare
 În termeni generali, o serie cronologică este considerată staţionară
dacă nu prezintă nici o modificare sistematică în medie (nu prezintă
tendinţă pe termen lung) şi nici o modificare sistematică în varianţă.

 Graficul unei serii staţionare prezintă fluctuaţii cu amplitudine relativ


constantă (varianţă constantă) în jurul unei medii constante, independente
de timp (staţionaritate în medie).
Procese staţionare
 Definiţie: Un proces stochastic este strict staţionar dacă funcţia
densitate de probabilitate a oricăror doi vectori (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑛 ) şi
(𝑌𝑠 , 𝑌𝑠+1 , … , 𝑌𝑠+𝑛 ) , cu n+1 elemente consecutive, este aceeaşi pentru orice

valori ale lui t şi s, indiferent de mărimea lui n.

 Altfel spus: un proces stochastic este strict staţionar dacă pentru


orice k, distribuţia lui (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑘 ) este aceeaşi pentru toţi t, deci este
invariantă în timp (comportamentul procesului nu se modifică în timp).

 Exemplu: Distribuţia lui (𝑌5 , 𝑌6 , … , 𝑌 10 ) este aceeaşi cu distribuţia lui


(𝑌110 , 𝑌111 , … , 𝑌115 )
Procese staţionare
 Observaţii:
 Distribuţia lui Yt este aceeaşi cu distribuţia lui Yt+k pentru orice întreg k

 1. E(Yt)=E(Yt+k)
 2.Var(Yt)=Var(Yt+k)
 3.Variabilele (Yt) dintr-un proces staţionar sunt identic distribuite (nu
neapărat independente).
 Distribuţia lui (Yt, Ys) este aceeaşi cu distribuţia lui (Yt+k,Ys+k) pentru
toate decalajele (t-s) şi pentru orice întreg k 
 Cov (Yt, Ys) = Cov (Yt+k, Ys+k) =  (k) pentru orice s, t, k.

 Definiţie: Prin lag se înţelege decalajul (întârzierea) exprimată în unităţi de


timp, între modificarea variabilei cauză şi manifestarea efectului.
Procese staţionare

 Definiţie: Un proces stochastic este slab staţionar (staţionar de


ordinul 2, staţionar în covarianţă) dacă media şi dispersia sunt constante în
timp iar covarianţa sa între două perioade de timp depinde numai de
decalajul dintre cele două perioade şi nu de momentul de timp la care este
calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui
nivel mediu constant 
 E (Yt ) =  , t : media este constantă în timp (staţionalitate în medie)
 Var (Yt ) =  2 : varianţa este constantă în timp (staţionalitate în varianţă)
 cov (Yt , Ys ) =  k , t  s unde k=s-t: covarianţa dintre două variabile este funcţie
doar de lungimea intervalului de timp ce separă cele 2 variabile.
Procese staţionare
 Observaţii:
 1. Dacă seria de timp este normal distribuită, atunci staţionaritatea slabă
şi staţionaritatea strictă sunt echivalente.
 2. Seriile cronologice staţionare au proprietatea că media, varianţa şi
covarianţele (atunci când există), pot fi calculate pe baza unui eşantion.
 3. Staţionaritatea slabă implică faptul că reprezentarea grafică a datelor va
arăta că cele n valori fluctuează cu o variaţie constantă în jurul unui nivel
constant.
Procese nestaţionare
Procese nestaţionare - exemple
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var ( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k = 0
 funcţia de autocovarianţă este: k = 
0 , k  0
1, k = 0
 funcţia de autocorelaţie este: k = 
0 , k  0
 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp y t este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci y t , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică y t creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Funcţia de autocorelaţie
 Definiţie: Se defineşte funcţia de autocovarianţă a unui proces staţionar
şirul autocovarianţelor de lag k, (k) unde k=0,±1,±2,…

𝛾𝑘 = 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 = 𝐸 𝑌𝑡 𝑌𝑡+𝑘 − 𝐸 𝑌𝑡 E(𝑌𝑡+𝑘 )

 Definiţie: Se defineşte funcţia de autocorelaţie a unui proces staţionar şirul


autocorelaţiilor de lag k, (k) unde k=0,±1,±2,…
𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝛾𝑘
𝑘 = 𝑐𝑜𝑟𝑟 𝑌𝑡 , 𝑌𝑡+𝑘 = = =
𝑉𝑎𝑟 𝑌𝑡 𝑉𝑎𝑟(𝑌𝑡+𝑘 ) 𝑉𝑎𝑟 𝑌𝑡 𝛾0

 Definiţie: Graficul funcţiei de autocorelaţie în raport cu decalajul k se


numeşte corelogramă
Corelogramă

 Cum interpretăm corelograma?


 Observăm că începe cu valori foarte mari
(0,969 la lag-ul 1) şi scade treptat.
 Chiar la lag-ul 14, coeficientul de autocorelaţie
are o valoare destul de mare (0,500).
 Corelograma arată că seria PIB este
nestaţionară.
 Pentru serii nestaţionare coeficienţii de
autocorelaţie scad foarte încet.
 Prin contrast, dacă un proces stochastic
este pur aleator, autocorelaţia la orice
lag K0 , va fi zero.
Interpretarea corelogramei
a) Serie aleatoare. O serie complet aleatoare are coeficienţii de autocorelaţie
 k  0 pentru orice k  0 şi pentru valori mari ale lui n. Pentru o serie aleatoare
se demonstrează că  k ~ N (0,1 / n) şi atunci ne aşteptăm ca o singură valoare a lui
 k să fie semnificativă.
b) Serie ce prezintă corelaţie pe termen scurt. O astfel de serie are o valoare
mare a lui 1 , după care urmează 2 sau 3 coeficienţi diferiţi de zero dar
valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori
ale lui  k apropiate de 0.
c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei,
atunci şi coeficienţii de autocorelaţie vor alterna. Coeficientul  1 va fi negativ.
Dacă valoarea observată la lag-ul 2 tinde să fie de aceeaşi parte a mediei,
atunci  2 va fi pozitiv.
d) Serie nestaţionară. Dacă o serie conţine trend, o observaţie de o anumită
parte a mediei tinde să fie urmată de un număr mare de observaţii de aceeaşi
parte a mediei. În acest caz, valorile lui  k vor tinde la zero doar pentru valori
foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea
coeficienţilor  k . Cu alte cuvinte, coeficienţii  k trebuie calculaţi numai
pentru seriile staţionare.
Estimarea coeficienţilor de autocorelaţie
 În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionarităţii, media
 şi varianţa 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
1 T
Y =  Yt
T t =1
1 T
s =  (Yt − Y ) 2
2

T t =1

 Coeficientul de autocorelaţie de selecţie se estimează prin:


 (Y − Y )(Yt − k − Y ) /(T − k )
T

t
rˆk = t = k +1
sau prin:
 (Y −Y ) /T
T
2
t
t =1

 (Y − Y )(Yt − k − Y )
T

t dacă T este suficient de mare pentru


rˆk = t = k +1

 (Y −Y ) ca T/T-k să poată fi aproximat cu 1


T
2
t
t =1
Testarea semnificaţiei coeficieţilor de
autocorelaţie (test Bartlet)
Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n, unde n este volumul selecţiei:
ˆ k ~ N (0,1 / n) Putem determina un interval de încredere 95% în care se află k .
Ipoteze:
H0 : rk = 0 (nu diferă semnificativ de zero) . Deci seria de timp este pur aleatoare
H1 : rk  0 . Deci seria de timp nu este staționară
Testul Student:
rˆk
t= converge asimtotic (când T →  ) la N (0,1)
Vˆar (rˆk )
Pentru varianţa estimatorului coeficientului de autocorelaţie
Bartlett a furnizat următoarea expresie:

1  1
 ( )
 k −1
Var (rˆk ) = 1 + 2 rˆi 2  = 1 + 2 rˆ12 +  + rˆk2−1 . Var ( ˆ k ) = 1 / T pentru T mare
T i =1  T

Regula de decizie: O regiune de acceptare 1- pentru H0 va fi dată prin intervalul


Fie  un nivel de semnificaţie  
− ttab / T , ttab / T pentru k0. Dacă valoarea coeficientului de
t calc  − t tab , t tab   se accepta H0 autocorelaţie cade în afara acestui interval, pentru o valoare dată a
lui k, atunci ipoteza H0 este respinsă și se acceptă H1.
Testarea semnificației coeficienților de
autocorelație

 Testarea ipotezei că mai mulţi coeficienţi de autocorelaţie sunt zero:


H 0 : toti  k = 0 1 =  2 =  =  m = 0
H 1 : exista  k  0
m
 Statistica Box şi Pierce: QBP (m) = n  ˆ k2  2m
k =1

m
 ˆ k2 
 Statistica Ljung Box : QLB (m) = n(n + 2 )   ~  m2
k =1  n − k 

 Regula de decizie: QLB   crt


2
 se accepta H 0

QLB   crt
2
 se respinge H 0
Exemplu
 Se consideră 2 variabile economice cu date pe 25 perioade.
vt 1 4 2 2 5 5 3 3 1 4 4 3 3 5 4 4 4 1 3 3 3 3 1 2 2
zt 1 1 2 1 2 2 2 3 3 3 3 3 4 4 5 5 5 5 6 5 6 6 7 8 8

Coeficienţii de autocorelaţie obţinuţi pentru decalajele k=1, 2, 3 sunt:


– pentru seria vt: r1 = 0,1053; r2 = –0,0526; r3 = 0.
– pentru seria zt: r1 = 0,8302; r2 = 0,6887; r3 = 0,5755.

Să se testeze coeficienții de autocorelație folosind testul Bartlet?

 Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n , unde n este volumul selecţiei.
 Putem determina un interval de încredere 95% în care se află  k .
 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k ))   k  (−1,96 *1 / n ; 1,96 *1 / n )

 n=25, varianţa lui este 1/25, iar eroarea standard este 1/5.
 Conform proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice  k va fi
(-0.392,0.392) .
 Pentru seria vt: toţi rk sunt în interiorul intervalului. Seria de timp este pur aleatoare
 Pentru seria zt: toţi rk sunt în afara intervalului deci seria este nestaționară.

S-ar putea să vă placă și