Sunteți pe pagina 1din 33

Serii de timp

Curs 2, Martie 2023


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Componentele unei serii cronologice

Yt = f (Tt , Ct , S t ,  t )
Modele de descompunere a seriilor de timp

 Modelul aditiv Yt = Tt + Ct + S t +  t

 Modelul multiplicativ Yt = Tt  Ct  S t   t

 Combinație mixtă a componentelor seriei


Mediile mobile
 Ipoteza 1: Seria prezintă doar tendință și componentă aleatoare
 Ipoteza 2: Modelul de descompunere este unul aditiv
Yt = Tt +  t

 Definiție: Media mobilă se defineşte ca o combinaţie liniară de puteri


pozitive şi negative ale operatorului de întârziere L:
m2 m2

MM =  i
i
L cu 
i = − m1
i =1 LYt = Yt −1
i = − m1

 unde m1 , m2  N ,  m , ...,  m  R iar operatorul de întârziere L este definit prin:


1 2

 Definiție: O medie mobilă este centrată dacă m1=m2=m.


 Definiție: Media mobilă este simetrică dacă este centrată şi coeficientii
simetrici sunt egali:
 i =  −i , i = 1, ..., m
Mediile mobile
 Observații:
1. Metoda mediilor mobile, utilizată în acest context, are ca şi obiective:
 reducerea amplitudinii componentei aleatoare: f ( t )  0
 conservarea tendinţei T: f (Tt )  Tt
2. Se pune problema determinării adecvate a ordinului mediei mobile simetrice
2m+1 și a coeficienților  m , ... ,  0  R
 Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrată și simetrică
conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de
ordin p+1 a ecuaţiei caracteristice:
 −m +  −m+1 + ... +  m 2 m − m = 0

Proprietate: Dacă u =    și t constituie o secvenţa de variabile aleatoare


m
 t i t −i
i =− m
necorelate şi de aceeaşi varianţă 2 atunci noile variabile ut au proprietățile:
m
Eut = 0;  *2 = Var(u x ) =  2 
i =− m
i
2
Mediile aritmetice
Yt −m + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = ; t = m + 1, m + 2,..., T − m
2m + 1

 Observații:
 1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m

  =1
i =− m
i
1
 2. Raportul de reducere a varianței erorii este: 2m + 1

 3. Mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe


polinomiale de grad mai mare sau egal cu doi. Tendinţa seriei se
estimează prin seria mediilor mobile:
Tt  Yt
 4. Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria
de timp
Medii mobile centrate
 Mediile aritmetice necesită un număr impar de observaţii
p=2m+1, în calculul fiecărei medii. Dacă ordinul mediei mobile
MM(p)este un numar par p=2m atunci de regula se utilizează
mediile mobile centrate şi simetrice, definite astfel:

0,5Yt −m + Yt −m+1 + ... + Yt + ... + Yt +m−1 + 0,5Yt +m


Yt = t = m + 1, m + 2, .... T − m
2m
Estimarea componentei sezoniere
 Presupunem că seria cronologică prezintă tendinţă, sezonalitate şi o
componentă aleatoare.
 În general, este adecvat:
 un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ constantă
Y t = T t + St
 un model multiplicativ dacă amplitudinea creşte sau scade în timp.
Y t = T t * St
 Frecvent în practică este mai adecvat modelul multiplicativ
Aplicarea modelului aditiv
Aplicarea modelului multiplicativ
Perioada componentei sezoniere
 Perioada componentei sezoniere, notată cu p, reprezintă
numărul unităţilor de timp din cadrul unui ciclu sezonier.

Durata unui ciclu sezonier Date Perioada p


1 an trimestriale 4
lunare 12
o săptămână Zilnice 7
o zi din oră în oră 24
Eliminarea componentei sezoniere
utilizând mediile mobile
 Pentru desezonalizarea seriei se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere
 Astfel:
 Se elimină componenta sezonieră
 Se elimină componenta aleatoare
 Se conservă tendința
 Proprietăți:
 Mediile aritmetice de ordin p impar și mediile mobile centrate pentru p
par lasă nedeviată tendința, functia liniara
 Fiecărei valori observate Yt îi corespunde o valoare netezită Y t calculată
ca o medie aritmetică a valorilor adiacente
 Seria valorilor inițiale are mai puțin cu p-1 termeni, respectiv p termeni
decât seria inițială
Estimarea componentei sezoniere
 se realizează prin intermediul coeficienţilor sezonalităţii, modele de regresie multiplă
prin introducerea unor variabile alternative sau prin intermediul funcțiilor
trigonometrice.
 Notaţii:
 i indice pentru ciclu sezonier de la 1 la n;
 j indice pentru sezon de la 1 la p.

 Ipoteză:
 Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
 Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează rapoartele: S ij = Yij / Y ij
 Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij =  Sij ;
n − 1 i =1
j = 1, 2,..., p
p
 Se determină componenta sezonieră astfel incat
Gourieroux & Monfort, 1990
S
i =1
i =1
1 p  j = 1, 2,..., p
S = I /
j I
j  p i
 i =1 

 Valorile rezultate ( S1 , S 2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie


componenta sezonieră
2. Model aditiv
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează diferențele: S ij = Yij − Y ij
 Se determină coeficienții medii pentru fiecare sezon:
1 n −1
Cj =  S ij
n − 1 i =1
 Se determină componenta sezonieră
1 p 
S j = C j −   Ci 
 p i =1 
 Valorile rezultate se numesc coeficienți ai sezonalităţii şi constituie componenta
sezonieră
Exemplu:

Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74

Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:

90
80
70
60
50
40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06

Nr. Bilete (valori reale) Medii mobile

Evoluţia numărului de bilete vândute de agenţie în perioada 2004-2006


Exemplu:

Calculul mediilor mobile

Perioada Yij Y ij Abateri Serie t


Sij =Yij - Y ij desezonalizata
MM (corectata)
~
Yij = Yij − S j
I 2004 32 - - 48 1
II 2004 48 - - 52 2
III 2004 64 51,5 12,5 50 3
IV 2004 58 53 5 52 4
I 2005 40 54,75 -14,75 56 5
II 2005 52 57 -5 56 6
III 2005 74 58,5 15,5 60 7
IV 2005 66 60 6 60 8
I 2006 44 62 -18 60 9
II 2006 60 64 -4 64 10
III 2006 82 - - 68 11
IV 2006 74 - - 68 12
Exemplu:
Mediile mobile vor fi:
32 40
+ 48 + 64 + 58 +
MM 1 = 2 2 = 51,5 = Y 13 bilete
4
48 52
+ 64 + 58 + 40 +
MM 2 = 2 2 = 53 = Y 14 bilete
4

66 74
+ 44 + 60 + 82 +
MM 8 = 2 2 = 64 = Y 32 bilete
4

Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:

b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:

Trim. Yij- Y ij
Anii Suma
I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
 Determinarea trendului seriei desezonalizate:


 Yij = 46 + 1,8112  t unde t momentul de timp la care se realizează previziunea

 Previziunea seriei Yij:




Yˆij = Yij + S j
MODELAREA SERIILOR DE TIMP
UNIVARIATE
Noţiuni generale
 Box & Jenkins (1970) au propus o metodologie de previziune a unei
variabile, utilizând ca şi bază de date doar trecutul şi prezentul acesteia.
Aceste modele se bucură de o largă popularitate datorită:
 calităţii previziunilor generate;

 flexibilităţii modelelor;

 rigurozităţii privind fundamentarea matematică a modelului;

 este o metodă adecvată şi pentru previziunea unor variabile cu o evoluţie


neregulată.
Noţiuni generale
 Definiţie: Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia
aferentă momentului t și variabila aleatoare (Yt ), se definesc:

 media variabilei (Yt ): E (Yt ) =  t

 varianţa variabilei (Yt ) : Var (Yt ) =  t2 = E[(Yt −  t ) 2 ]

 covarianţa dintre două variabile (Yt ) şi ( Y s ), prin:

 ts = cov(Yt , Ys ) = E (Yt −  t )(Ys −  s )


Procese staţionare
 În termeni generali, o serie cronologică este considerată staţionară
dacă nu prezintă nici o modificare sistematică în medie (nu prezintă
tendinţă pe termen lung) şi nici o modificare sistematică în varianţă.

 Graficul unei serii staţionare prezintă fluctuaţii cu amplitudine relativ


constantă (varianţă constantă) în jurul unei medii constante, independente
de timp (staţionaritate în medie).
Procese staţionare
 Definiţie: Un proces stochastic este strict staţionar dacă funcţia
densitate de probabilitate a oricăror doi vectori (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑛 ) şi
(𝑌𝑠 , 𝑌𝑠+1 , … , 𝑌𝑠+𝑛 ) , cu n+1 elemente consecutive, este aceeaşi pentru orice

valori ale lui t şi s, indiferent de mărimea lui n.

 Altfel spus: un proces stochastic este strict staţionar dacă pentru


orice k, distribuţia lui (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑘 ) este aceeaşi pentru toţi t, deci este
invariantă în timp (comportamentul procesului nu se modifică în timp).

 Exemplu: Distribuţia lui (𝑌5 , 𝑌6 , … , 𝑌 10 ) este aceeaşi cu distribuţia lui


(𝑌110 , 𝑌111 , … , 𝑌115 )
Procese staţionare
 Observaţii:
 Distribuţia lui Yt este aceeaşi cu distribuţia lui Yt+k pentru orice întreg k 
 1. E(Yt)=E(Yt+k)
 2.Var(Yt)=Var(Yt+k)
 3.Variabilele (Yt) dintr-un proces staţionar sunt identic distribuite (nu
neapărat independente).

 Distribuţia lui (Yt, Ys) este aceeaşi cu distribuţia lui (Yt+k,Ys+k) pentru toate
decalajele (t-s) şi pentru orice întreg k 
 Cov (Yt, Ys) = Cov (Yt+k, Ys+k) =  (k) pentru orice s, t, k.

 Definiţie: Prin lag se înţelege decalajul (întârzierea) exprimată în unităţi de


timp, între modificarea variabilei cauză şi manifestarea efectului.
Procese staţionare

 Definiţie: Un proces stochastic este slab staţionar (staţionar de


ordinul 2, staţionar în covarianţă) dacă media şi dispersia sunt constante în
timp iar covarianţa sa între două perioade de timp depinde numai de
decalajul dintre cele două perioade şi nu de momentul de timp la care este
calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui
nivel mediu constant 

 E (Yt ) =  , t : media este constantă în timp (staţionalitate în medie)

 Var (Yt ) =  2 : varianţa este constantă în timp (staţionalitate în varianţă)

 cov (Yt , Ys ) =  k , t  s unde k=s-t: covarianţa dintre două variabile este funcţie
doar de lungimea intervalului de timp ce separă cele 2 variabile.
Procese staţionare
 Observaţii:
 1. Dacă seria de timp este normal distribuită, atunci staţionaritatea slabă
şi staţionaritatea strictă sunt echivalente.
 2. Seriile cronologice staţionare au proprietatea că media, varianţa şi
covarianţele (atunci când există), pot fi calculate pe baza unui eşantion.
 3. Staţionaritatea slabă implică faptul că reprezentarea grafică a datelor va
arăta că cele n valori fluctuează cu o variaţie constantă în jurul unui nivel
constant.
Procese nestaţionare
Procese nestaţionare - exemple
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var ( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k = 0
 funcţia de autocovarianţă este: k = 
0 , k  0
1, k = 0
 funcţia de autocorelaţie este: k = 
0 , k  0
 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp y t este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci y t , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică y t creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.

S-ar putea să vă placă și