Sunteți pe pagina 1din 153

Serii de timp

Curs 1 – Februarie 2021


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Serii de timp
 Planul cursului:
 1. Introducere in analiza seriilor de timp: Definirea unei serii de timp; Componentele unei serii de timp;
Descompunerea seriei de timp pe componente; Metode de netezire exponentiala
 2. Modele autoregressive liniare: Serii stationare, serii nestationare si neomogene; Tipuri de serii
nestationare; Operatorii de intarziere si avans; Caracteristicile unei serii de timp: functia de autocorelatie si
de autocorelatie partiala; Teste de nestaţionalitate; Definirea modelelor AR(p), MA(q), ARMA(p,q),
ARIMA(p,d,q); Metodologia Box Jenkins
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

3. Extinderi ale modelelor ARIMA : Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021


SARIMA; Modele ARCH, GARCH
 4. Modele multivariate stationare: Modele VAR; Cauzalitate Granger
 5. Modele multivariate nestationare: Cointegrare; Modele VECM; Teste de cointegrare

 Nota finală:
 50% nota de la examen (sapt 31mai – 4 iunie 2020)
 30% prezentare proiect (sapt. 24-28 mai 2020)
 20% prezenţă şi activitate seminar

 Bibliografie:
 D. Lazar – Suport de curs: Analiza seriilor cronologice și previziune
 P.J. Brockwell, R.A. Davies. Introduction to Time Series and Forecasting, Second Ed., Springer, 2002.
 Damodar N. Gujarati, Dawn C. Porter. Basic Econometrics, Fifth Edition, McGraw-Hill, 2009.
 T.Andrei, R. Bourbonais – Econometrie, Partea a V-a, Ed. Economică, 2008
 E. Titan, S. Ghita, C. Boboc – Bazele Statisticii, Capitolul 6, Ed. Meteor Press
Baze de date pentru serii de timp
 Institutul Național de Statistică http://www.insse.ro/cms/ (TEMPO Online)
 Banca Națională a României http://www.bnr.ro/Home.aspx
 World Bank http://www.worldbank.org/
 Eurostat http://ec.europa.eu/eurostat
 The University of York, Department of Mathematics
https://www.york.ac.uk/depts/maths/data/ts/
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Softuri utile: Eviews, R, SAS


Serii de timp
 Presupunem ca suntem interesați de evoluția unui fenomen în
timp.
 Fenomenul poate fi:
 Produsul Intern Brut
 Inflația
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Șomajul
 Speranța de Viață
 Natalitatea
 Mortalitatea
 Numărul pasagerilor unei companii aeriene
 Cifra de afaceri a unei companii
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

ŶT+h
Y : 
Y Y
 1 2 ... Yt

(Yt )tZ
... YT 

 1 2 ... t ... T 
Definirea unei serii de timp
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

date anuale
Exemplu:
Speranța de viață la naștere pentru populația României,

http://www.worldbank.org/
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Exemplu:
Rata de schimb GBP – EUR, date zilnice

http://www.xe.com/currencycharts/?from=GBP&to=EUR&view=1M
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro Exemplu:

România, date trimestriale


Numarul de pasageri din aeropurturile din
Tipuri de modele de previziune
 Modele univariate: pe baza evoluției înregistrată de variabilă în
trecut este previzionat prezentul ca o funcție de trecut
Yt = f (Yt −1 , Yt −2 ,, Yt − p ,  t )
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

 Modele multivariate: pe baza evoluției variabilei Y, precum și a


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

altor variabile X1, …, Xn ce explică comportamentul acesteia,


este previzionat prezentul variabilei Y.

Yt = f (X1t ,..., X nt , Yt −1 , Yt −2 ,, Yt − p ,  t )


Erori de previziune
 Definiție: Pentru un moment t de timp fixat, eroarea de previziune este
diferenţa între valoarea observată şi cea previzionată Yˆt ambele aferente
momentului t:

et = Yt − Yˆt
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Indicatori sintetici ai erorilor de previziune:


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021


Fie Yˆ1 , Yˆ2 ,..., Yˆs previziunile corespunzătoare observaţiilor Y1 , Y2 ,..., Ys . Se definesc:

 1. Eroarea medie pătratică: MSE =


1 s

s h=1
(Yh − Yˆh )
2

1 s
 2. Eroarea medie absolută: MAE =  Yh − Yˆh
s h=1

ˆ
 3. Eroarea medie absolută exprimată procentual: 1 s Yh − Yh
MAPE = 
s h=1 Yh
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Yt = f (Tt , Ct , St ,  t )
Componentele unei serii cronologice
1. Tendința unei serii cronologice (T)
 redă evoluţia fenomenului pe termen lung, având alura unor funcţii neperiodice, lent variabile în timp.
 este componenta principală a seriei de timp care rezultă din efectul pe termen lung al factorilor socio-
economici și politici
 poate arăta creșterea sau declinul unei serii de timp pe o perioadă lungă de timp.
 forma tendinței poate fi liniară sau neliniară
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
2. Componenta ciclică C
 este observabilă analizând evoluţia fenomenului pe termen lung, şi se manifestă sub
forma unor oscilaţii cu perioadă şi amplitudine ce variază de regulă în timp, un ciclu
acoperind câţiva ani de zile
 aceste oscilații sunt asociate cu ciclurile de afaceri bine cunoscute
 durata ciclului depinde de tipul de afacere sau industrie analizată (de la cinci la
doisprezece ani sau mai mult)
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

https://www.slideshare.net/henrjt/the-business-
cycle-299518
3. Componenta sezonieră S
 se evidenţiază sub forma unor cicluri de durată mai mică sau egală cu un an, şi apare
în principal datorită ritmului impus de schimbarea anotimpurilor dar şi de activităţi
economice respectiv sociale.
 Se notează și se înregistrează prin modificări restrânse în sus și în jos în jurul
componentei de tendință sau a componentei ciclice, cu modificări care se repetă în
mod previzibil pe perioade de sub un an
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

Source Box, G. E. P., Jenkins, G. M. and Reinsel, G. C. (1976) Time Series Analysis, Forecasting and
Control. Third Edition. Holden-Day. Series G.
4. Componenta reziduu sau eroare t
 se manifestă prin fluctuaţii aparent aleatoare în jurul componentelor deterministe, fiind
efectul acţiunii unor factori cu acţiune punctuală în timp
 această componentă este imprevizibilă
 schimbări bruște care apar într-o serie de timp care este puțin probabil să se repete;
astfel de mișcări sunt privite ca evenimente întâmplătoare complet imprevizibile și
probabil nerecuperabile, cum ar fi greve, incendii, inundații, dezastre naturale,
războaie etc.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 este o componentă a unei serii de timp care nu poate fi explicată prin componente de
tendință, ciclice sau sezoniere
Modele de descompunere a seriilor de timp

 Modelul aditiv Yt = Tt + Ct + St +  t

 Modelul multiplicativ Yt = Tt  Ct  St   t
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Combinație mixtă a componentelor seriei


Estimarea tendinței prin funcții
elementare
 Yt = Tt +  t sau Yt = Tt   t

Funcţii elementare utilizate în modelarea tendinţei


Tendinţă Forma liniarizată
liniară : Tt = a + bt
Parabolă: Tt = a + bt + ct 2 T = a + bt + cX
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

unde X = t ²
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

1 T = a + bX
Hiperbolă: Tt = a + b
t 1
Unde X =
t
Exponenţială: Tt = a  b t Z = A + Bt unde Zt = ln Tt ; A = ln a; B = ln b
Putere: Tt = a  t b Z = A + bX
Unde Z t = ln Tt ; A = ln a; X = ln t
Logaritmică: Tt = a + b ln t T = a + bX
unde X = ln t
a
Curba logistică : Tt = , a, c  0
1 + e b −ct
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Parabola
Funcții elementare

Hiperbola
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Exponentială
Funcții elementare
Funcția putere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Functia logaritmică
Funcții elementare

Curba logistică
Exemplu
 Fie seria cronologică privind Luna Număr turiști
numărul de turiști cazați într-o cazați
pensiune nou deschisă. Să se Ianuarie 50
modeleze tendința centrală a seriei Februarie 47
de timp folosind funcțiile
Martie 45
elementare.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Aprilie 55
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

Mai 61
Iunie 68
Iulie 70
August 80
Septembrie 85
Octombrie 90
Noiembrie 89
Decembrie 95
Mediile mobile
 Ipoteza 1: Seria prezintă doar tendință și componentă aleatoare
 Ipoteza 2: Modelul de descompunere este unul aditiv
Yt = Tt +  t

 Definiție: Media mobilă se defineşte ca o combinaţie liniară de puteri


Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

pozitive şi negative ale operatorului de întârziere L:


m2 m2

MM =  i
i
L cu 
i = − m1
i =1
i = − m1

 unde m1 , m2  N ,  m ,...,  m  R iar operatorul de întârziere L este definit prin:


1 2
LYt = Yt −1

 Definiție: O medie mobilă este centrată dacă m1=m2=m.


 Definiție: Media mobilă este simetrică dacă este centrată şi coeficientii
simetrici sunt egali:
 i =  −i , i = 1, ... , m
Mediile mobile
 Observații:
1. Metoda mediilor mobile, utilizată în acest context, are ca şi obiective:
 reducerea amplitudinii componentei aleatoare: f ( t )  0
 conservarea tendinţei T: f (Tt )  Tt
2. Se pune problema determinării adecvate a ordinului mediei mobile simetrice
2m+1 și a coeficienților  m , ... , 0  R
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrată și simetrică


conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de
ordin p+1 a ecuaţiei caracteristice:
 −m +  −m+1 + ... +  m 2m − m = 0

Proprietate: Dacă u =    și t constituie o secvenţa de variabile aleatoare


m
 t i t −i
i =− m
necorelate şi de aceeaşi varianţă 2 atunci noile variabile ut au proprietățile:
m
Eu t = 0;  *2 = Var (u x ) =  2 
i =− m
i
2
Mediile aritmetice
Yt −m + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = ; t = m + 1, m + 2,..., T − m
2m + 1

 Observații:
 1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m

  =1
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

i
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

i =− m
1
 2. Raportul de reducere a varianței erorii este: 2m + 1

 3. Mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe


polinomiale de grad mai mare sau egal cu doi. Tendinţa seriei se
estimează prin seria mediilor mobile:
Tt  Yt
 4. Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria
de timp
Medii mobile centrate
 Mediile aritmetice necesită un număr impar de observaţii
p=2m+1, în calculul fiecărei medii. Dacă ordinul mediei mobile
MM(p)este un numar par p=2m atunci de regula se utilizează
mediile mobile centrate şi simetrice, definite astfel:
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

0,5Yt −m + Yt −m+1 + ... + Yt + ... + Yt +m−1 + 0,5Yt +m


Yt = t = m + 1, m + 2, .... T − m
2m
Estimarea componentei sezoniere
 Presupunem că seria cronologică prezintă tendinţă, sezonalitate şi o
componentă aleatoare.
 În general, este adecvat:
 un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ constantă
Y t = T t + St
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 un model multiplicativ dacă amplitudinea creşte sau scade în timp.


Y t = T t * St
 Frecvent în practică este mai adecvat modelul multiplicativ
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Aplicarea modelului aditiv


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Aplicarea modelului multiplicativ


Perioada componentei sezoniere
 Perioada componentei sezoniere, notată cu p, reprezintă
numărul unităţilor de timp din cadrul unui ciclu sezonier.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

Durata unui ciclu sezonier Date Perioada p


1 an trimestriale 4
lunare 12
o săptămână Zilnice 7
o zi din oră în oră 24
Eliminarea componentei sezoniere
utilizând mediile mobile
 Pentru desezonalizarea seriei se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere
 Astfel:
 Se elimină componenta sezonieră
 Se elimină componenta aleatoare
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Se conservă tendința
 Proprietăți:
 Mediile aritmetice de ordin p impar și mediile mobile centrate pentru p
par lasă nedeviată tendința, functia liniara
 Fiecărei valori observate Yt îi corespunde o valoare netezită Y t calculată
ca o medie aritmetică a valorilor adiacente
 Seria valorilor inițiale are mai puțin cu p-1 termeni, respectiv p termeni
decât seria inițială
Estimarea componentei sezoniere
 se realizează prin intermediul coeficienţilor sezonalităţii, modele de regresie multiplă
prin introducerea unor variabile alternative sau prin intermediul funcțiilor
trigonometrice.
 Notaţii:
 i indice pentru ciclu sezonier de la 1 la n;
 j indice pentru sezon de la 1 la p.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 Ipoteză:
 Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
 Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează rapoartele: Sij = Yij / Y ij
 Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij =  Sij ;
n − 1 i =1
j = 1, 2,..., p
p

S
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Se determină componenta sezonieră astfel incat =1


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

 i
i =1
1 p
 j = 1, 2,..., p
S j = I j /   I i 
 p i =1 

 Valorile rezultate (S1 , S2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie


componenta sezonieră
2. Model aditiv
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează diferențele: Sij = Yij − Y ij
 Se determină coeficienții medii pentru fiecare sezon:
1 n −1
Cj =  S ij
n − 1 i =1
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Se determină componenta sezonieră


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021


1 p 
S j = C j −   Ci 
 p i =1 
 Valorile rezultate se numesc coeficienți ai sezonalităţii şi constituie componenta
sezonieră
Exemplu:

Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74

Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:

90
80
70
60
50
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06

Nr. Bilete (valori reale) Medii mobile

Evoluţia numărului de bilete vândute de agenţie în perioada 2004-2006


Exemplu:

Calculul mediilor mobile

Perioada Yij Y ij Abateri Serie t


Sij =Yij - Y ij desezonalizata
MM (corectata)
~
Yij = Yij − S j
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

I 2004 32 - - 48 1
II 2004 48 - - 52 2
III 2004 64 51,5 12,5 50 3
IV 2004 58 53 5 52 4
I 2005 40 54,75 -14,75 56 5
II 2005 52 57 -5 56 6
III 2005 74 58,5 15,5 60 7
IV 2005 66 60 6 60 8
I 2006 44 62 -18 60 9
II 2006 60 64 -4 64 10
III 2006 82 - - 68 11
IV 2006 74 - - 68 12
Exemplu:
Mediile mobile vor fi:
32 40
+ 48 + 64 + 58 +
MM1 = 2 2 = 51,5 = Y 13 bilete
4
48 52
+ 64 + 58 + 40 +
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

MM 2 = 2 2 = 53 = Y 14 bilete
4

66 74
+ 44 + 60 + 82 +
MM 8 = 2 2 = 64 = Y 32 bilete
4

Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:

b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:

Trim. Yij- Y ij
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

Anii Suma
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021

I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
 Determinarea trendului seriei desezonalizate:


 Yij = 46 + 1,8112 t unde t momentul de timp la care se realizează previziunea
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro

 Previziunea seriei Yij:


Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021



Yˆij = Yij + S j
Serii de timp

Curs 2, Martie 2021


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Componentele unei serii cronologice

Yt = f (Tt , Ct , St ,  t )
Modele de descompunere a seriilor de timp

 Modelul aditiv Yt = Tt + Ct + St +  t

 Modelul multiplicativ Yt = Tt  Ct  St   t

 Combinație mixtă a componentelor seriei


Estimarea tendinței prin funcții
elementare
 Yt = Tt +  t sau Yt = Tt   t

Funcţii elementare utilizate în modelarea tendinţei


Tendinţă Forma liniarizată
liniară : Tt = a + bt
Parabolă: Tt = a + bt + ct 2 T = a + bt + cX
unde X = t ²
1 T = a + bX
Hiperbolă: Tt = a + b
t 1
Unde X =
t
Exponenţială: Tt = a  b t Z = A + Bt unde Zt = ln Tt ; A = ln a; B = ln b
Putere: Tt = a  t b Z = A + bX
Unde Z t = ln Tt ; A = ln a; X = ln t
Logaritmică: Tt = a + b ln t T = a + bX
unde X = ln t
a
Curba logistică : Tt = , a, c  0
1 + e b −ct
Funcții elementare

Parabola Hiperbola
Funcții elementare
Exponentială Funcția putere
Funcții elementare

Functia logaritmică Curba logistică


Exemplu
 Fie seria cronologică privind Luna Număr turiști
numărul de turiști cazați într-o cazați
pensiune nou deschisă. Să se Ianuarie 50
modeleze tendința centrală a seriei Februarie 47
de timp folosind funcțiile
Martie 45
elementare.
Aprilie 55
Mai 61
Iunie 68
Iulie 70
August 80
Septembrie 85
Octombrie 90
Noiembrie 89
Decembrie 95
Mediile mobile
 Ipoteza 1: Seria prezintă doar tendință și componentă aleatoare
 Ipoteza 2: Modelul de descompunere este unul aditiv
Yt = Tt +  t

 Definiție: Media mobilă se defineşte ca o combinaţie liniară de puteri


pozitive şi negative ale operatorului de întârziere L:
m2 m2

MM =  i
i
L cu 
i = − m1
i =1
i = − m1

 unde m1 , m2  N ,  m ,...,  m  R iar operatorul de întârziere L este definit prin:


1 2
LYt = Yt −1

 Definiție: O medie mobilă este centrată dacă m1=m2=m.


 Definiție: Media mobilă este simetrică dacă este centrată şi coeficientii
simetrici sunt egali:
 i =  −i , i = 1, ... , m
Mediile mobile
 Observații:
1. Metoda mediilor mobile, utilizată în acest context, are ca şi obiective:
 reducerea amplitudinii componentei aleatoare: f ( t )  0
 conservarea tendinţei T: f (Tt )  Tt
2. Se pune problema determinării adecvate a ordinului mediei mobile simetrice
2m+1 și a coeficienților  m , ... , 0  R
 Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrată și simetrică
conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de
ordin p+1 a ecuaţiei caracteristice:
 −m +  −m+1 + ... +  m 2m − m = 0

Proprietate: Dacă u =    și t constituie o secvenţa de variabile aleatoare


m
 t i t −i
i =− m
necorelate şi de aceeaşi varianţă 2 atunci noile variabile ut au proprietățile:
m
Eu t = 0;  *2 = Var (u x ) =  2 
i =− m
i
2
Mediile aritmetice
Yt −m + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = ; t = m + 1, m + 2,..., T − m
2m + 1

 Observații:
 1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m

  =1
i =− m
i
1
 2. Raportul de reducere a varianței erorii este: 2m + 1

 3. Mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe


polinomiale de grad mai mare sau egal cu doi. Tendinţa seriei se
estimează prin seria mediilor mobile:
Tt  Yt
 4. Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria
de timp
Medii mobile centrate
 Mediile aritmetice necesită un număr impar de observaţii
p=2m+1, în calculul fiecărei medii. Dacă ordinul mediei mobile
MM(p)este un numar par p=2m atunci de regula se utilizează
mediile mobile centrate şi simetrice, definite astfel:

0,5Yt −m + Yt −m+1 + ... + Yt + ... + Yt +m−1 + 0,5Yt +m


Yt = t = m + 1, m + 2, .... T − m
2m
Estimarea componentei sezoniere
 Presupunem că seria cronologică prezintă tendinţă, sezonalitate şi o
componentă aleatoare.
 În general, este adecvat:
 un model aditiv atunci când amplitudinea oscilaţiilor este aproximativ constantă
Y t = T t + St
 un model multiplicativ dacă amplitudinea creşte sau scade în timp.
Y t = T t * St
 Frecvent în practică este mai adecvat modelul multiplicativ
Aplicarea modelului aditiv
Aplicarea modelului multiplicativ
Perioada componentei sezoniere
 Perioada componentei sezoniere, notată cu p, reprezintă
numărul unităţilor de timp din cadrul unui ciclu sezonier.

Durata unui ciclu sezonier Date Perioada p


1 an trimestriale 4
lunare 12
o săptămână Zilnice 7
o zi din oră în oră 24
Eliminarea componentei sezoniere
utilizând mediile mobile
 Pentru desezonalizarea seriei se aplică datelor o medie mobilă
de ordin p egal cu perioada componentei sezoniere
 Astfel:
 Se elimină componenta sezonieră
 Se elimină componenta aleatoare
 Se conservă tendința
 Proprietăți:
 Mediile aritmetice de ordin p impar și mediile mobile centrate pentru p
par lasă nedeviată tendința, functia liniara
 Fiecărei valori observate Yt îi corespunde o valoare netezită Y t calculată
ca o medie aritmetică a valorilor adiacente
 Seria valorilor inițiale are mai puțin cu p-1 termeni, respectiv p termeni
decât seria inițială
Estimarea componentei sezoniere
 se realizează prin intermediul coeficienţilor sezonalităţii, modele de regresie multiplă
prin introducerea unor variabile alternative sau prin intermediul funcțiilor
trigonometrice.
 Notaţii:
 i indice pentru ciclu sezonier de la 1 la n;
 j indice pentru sezon de la 1 la p.

 Ipoteză:
 Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
 Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează rapoartele: Sij = Yij / Y ij
 Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij =  Sij ;
n − 1 i =1
j = 1, 2,..., p
p
 Se determină componenta sezonieră astfel incat S
i =1
i =1
1 p
 j = 1, 2,..., p
S j = I j /   I i 
 p i =1 

 Valorile rezultate (S1 , S2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie


componenta sezonieră
2. Model aditiv
 1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
 Se calculează diferențele: Sij = Yij − Y ij
 Se determină coeficienții medii pentru fiecare sezon:
1 n −1
Cj =  S ij
n − 1 i =1
 Se determină componenta sezonieră
1 p 
S j = C j −   Ci 
 p i =1 
 Valorile rezultate se numesc coeficienți ai sezonalităţii şi constituie componenta
sezonieră
Exemplu:

Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74

Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:

90
80
70
60
50
40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06

Nr. Bilete (valori reale) Medii mobile

Evoluţia numărului de bilete vândute de agenţie în perioada 2004-2006


Exemplu:

Calculul mediilor mobile

Perioada Yij Y ij Abateri Serie t


Sij =Yij - Y ij desezonalizata
MM (corectata)
~
Yij = Yij − S j
I 2004 32 - - 48 1
II 2004 48 - - 52 2
III 2004 64 51,5 12,5 50 3
IV 2004 58 53 5 52 4
I 2005 40 54,75 -14,75 56 5
II 2005 52 57 -5 56 6
III 2005 74 58,5 15,5 60 7
IV 2005 66 60 6 60 8
I 2006 44 62 -18 60 9
II 2006 60 64 -4 64 10
III 2006 82 - - 68 11
IV 2006 74 - - 68 12
Exemplu:
Mediile mobile vor fi:
32 40
+ 48 + 64 + 58 +
MM1 = 2 2 = 51,5 = Y 13 bilete
4
48 52
+ 64 + 58 + 40 +
MM 2 = 2 2 = 53 = Y 14 bilete
4

66 74
+ 44 + 60 + 82 +
MM 8 = 2 2 = 64 = Y 32 bilete
4

Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:

b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:

Trim. Yij- Y ij
Anii Suma
I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
 Determinarea trendului seriei desezonalizate:


 Yij = 46 + 1,8112 t unde t momentul de timp la care se realizează previziunea

 Previziunea seriei Yij:




Yˆij = Yij + S j
MODELAREA SERIILOR DE TIMP
UNIVARIATE
Noţiuni generale
 Box & Jenkins (1970) au propus o metodologie de previziune a unei
variabile, utilizând ca şi bază de date doar trecutul şi prezentul acesteia.
Aceste modele se bucură de o largă popularitate datorită:
 calităţii previziunilor generate;

 flexibilităţii modelelor;

 rigurozităţii privind fundamentarea matematică a modelului;

 este o metodă adecvată şi pentru previziunea unor variabile cu o evoluţie


neregulată.
Noţiuni generale
 Definiţie: Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia
aferentă momentului t și variabila aleatoare (Yt ), se definesc:

 media variabilei (Yt ): E (Yt ) =  t

 varianţa variabilei (Yt ): Var(Yt ) =  t2 = E[(Yt − t ) 2 ]

 covarianţa dintre două variabile (Yt ) şi ( Ys ), prin:

 ts = cov(Yt , Ys ) = E(Yt −  t )(Ys −  s )


Procese staţionare
 În termeni generali, o serie cronologică este considerată staţionară
dacă nu prezintă nici o modificare sistematică în medie (nu prezintă
tendinţă pe termen lung) şi nici o modificare sistematică în varianţă.

 Graficul unei serii staţionare prezintă fluctuaţii cu amplitudine relativ


constantă (varianţă constantă) în jurul unei medii constante, independente
de timp (staţionaritate în medie).
Procese staţionare
 Definiţie: Un proces stochastic este strict staţionar dacă funcţia
densitate de probabilitate a oricăror doi vectori (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑛 ) şi
(𝑌𝑠 , 𝑌𝑠+1 , … , 𝑌𝑠+𝑛 ) , cu n+1 elemente consecutive, este aceeaşi pentru orice

valori ale lui t şi s, indiferent de mărimea lui n.

 Altfel spus: un proces stochastic este strict staţionar dacă pentru


orice k, distribuţia lui (𝑌𝑡 , 𝑌𝑡+1 , … , 𝑌𝑡+𝑘 ) este aceeaşi pentru toţi t, deci este
invariantă în timp (comportamentul procesului nu se modifică în timp).

 Exemplu: Distribuţia lui (𝑌5 , 𝑌6 , … , 𝑌 10 ) este aceeaşi cu distribuţia lui


(𝑌110 , 𝑌111 , … , 𝑌115 )
Procese staţionare
 Observaţii:
 Distribuţia lui Yt este aceeaşi cu distribuţia lui Yt+k pentru orice întreg k

 1. E(Yt)=E(Yt+k)
 2.Var(Yt)=Var(Yt+k)
 3.Variabilele (Yt) dintr-un proces staţionar sunt identic distribuite (nu
neapărat independente).
 Distribuţia lui (Yt, Ys) este aceeaşi cu distribuţia lui (Yt+k,Ys+k) pentru
toate decalajele (t-s) şi pentru orice întreg k 
 Cov (Yt, Ys) = Cov (Yt+k, Ys+k) =  (k) pentru orice s, t, k.

 Definiţie: Prin lag se înţelege decalajul (întârzierea) exprimată în unităţi de


timp, între modificarea variabilei cauză şi manifestarea efectului.
Procese staţionare

 Definiţie: Un proces stochastic este slab staţionar (staţionar de


ordinul 2, staţionar în covarianţă) dacă media şi dispersia sunt constante în
timp iar covarianţa sa între două perioade de timp depinde numai de
decalajul dintre cele două perioade şi nu de momentul de timp la care este
calculată. Aceasta înseamnă că procesul rămâne în echilibru în jurul unui
nivel mediu constant 
 E (Yt ) =  , t : media este constantă în timp (staţionalitate în medie)
 Var (Yt ) =  2 : varianţa este constantă în timp (staţionalitate în varianţă)
 cov (Yt , Ys ) =  k , t  s unde k=s-t: covarianţa dintre două variabile este funcţie
doar de lungimea intervalului de timp ce separă cele 2 variabile.
Procese staţionare
 Observaţii:
 1. Dacă seria de timp este normal distribuită, atunci staţionaritatea slabă
şi staţionaritatea strictă sunt echivalente.
 2. Seriile cronologice staţionare au proprietatea că media, varianţa şi
covarianţele (atunci când există), pot fi calculate pe baza unui eşantion.
 3. Staţionaritatea slabă implică faptul că reprezentarea grafică a datelor va
arăta că cele n valori fluctuează cu o variaţie constantă în jurul unui nivel
constant.
Procese nestaţionare
Funcţia de autocorelaţie
 Definiţie: Se defineşte funcţia de autocovarianţă a unui proces staţionar
şirul autocovarianţelor de lag k, (k) unde k=0,±1,±2,…

𝛾𝑘 = 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 = 𝐸 𝑌𝑡 𝑌𝑡+𝑘 − 𝐸 𝑌𝑡 E(𝑌𝑡+𝑘 )

 Definiţie: Se defineşte funcţia de autocorelaţie a unui proces staţionar şirul


autocorelaţiilor de lag k, (k) unde k=0,±1,±2,…
𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝛾𝑘
𝑘 = 𝑐𝑜𝑟𝑟 𝑌𝑡 , 𝑌𝑡+𝑘 = = =
𝑉𝑎𝑟 𝑌𝑡 𝑉𝑎𝑟(𝑌𝑡+𝑘 ) 𝑉𝑎𝑟 𝑌𝑡 𝛾0

 Definiţie: Graficul funcţiei de autocorelaţie în raport cu decalajul k se


numeşte corelogramă
Testarea semnificaţiei coeficieţilor de
autocorelaţie (test Bartlet)
Ipoteze:
H0 : rk = 0 (nu diferă semnificativ de zero)
H1 : rk  0
Testul Student:
rˆk
t= converge asimtotic (când T →  ) la N (0,1)
Vˆar(rˆk )
Pentru varianţa estimatorului coeficientului de autocorelaţie
Bartlett a furnizat următoarea expresie:


1  1
 ( )
 k −1
Var(rˆk ) = 1 + 2 rˆi 2  = 1 + 2 rˆ12 +  + rˆk2−1 . Var ( ˆ k ) = 1 / T pentru T mare
T i =1  T

Regula de decizie:
Fie  un nivel de semnificaţie
t calc  − t tab , t tab   se accepta H0
Procese staţionare
 Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
 Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
 E ( t ) = 0
 Var( t ) =  2

cov( t ,  s ) = 0 , t  s
 Observaţie: Pentru un proces zgomot alb:
 2 , k =0
 funcţia de autocovarianţă este: k = 
0 , k 0
1, k =0
 funcţia de autocorelaţie este: k = 
0 , k 0

 Notaţie:  t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp yt este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 +  t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi  t
este zgomot alb.
Observatii:
1. Dacă  t are o distribuţie simetrică în jurul lui zero, atunci yt , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică yt creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu  = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 =  t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Estimarea coeficienţilor de autocorelaţie
 În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionalităţii, media
 şi varianţa 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
1 T
Y =  Yt
T t =1
1 T
s =  (Yt − Y ) 2
2

T t =1

 Coeficientul de autocorelaţie de selecţie se estimează prin:


 (Y − Y )(Yt − k − Y ) /(T − k )
T

t
rˆk = t = k +1
sau prin:
 (Y −Y ) /T
T
2
t
t =1

 (Y − Y )(Yt − k − Y )
T

t
dacă T este suficient de mare pentru
rˆk = t = k +1

 (Y −Y )
T
2 ca T/T-k să poată fi aproximat cu 1
t
t =1
Interpretarea corelogramei
a) Serie aleatoare. O serie complet aleatoare are coeficienţii de autocorelaţie
 k  0 pentru orice k  0 şi pentru valori mari ale lui n. Pentru o serie aleatoare
se demonstrează că  k ~ N (0,1 / n) şi atunci ne aşteptăm ca o singură valoare a lui
 k să fie semnificativă.
b) Serie ce prezintă corelaţie pe termen scurt. O astfel de serie are o valoare
mare a lui 1 , după care urmează 2 sau 3 coeficienţi diferiţi de zero dar
valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori
ale lui  k apropiate de 0.
c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei,
atunci şi coeficienţii de autocorelaţie vor alterna. Coeficientul 1 va fi negativ.
Dacă valoarea observată la lag-ul 2 tinde să fie de aceeaşi parte a mediei,
atunci  2 va fi pozitiv.
d) Serie nestaţionară. Dacă o serie conţine trend, o observaţie de o anumită
parte a mediei tinde să fie urmată de un număr mare de observaţii de aceeaşi
parte a mediei. În acest caz, valorile lui  k vor tinde la zero doar pentru valori
foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea
coeficienţilor  k . Cu alte cuvinte, coeficienţii  k trebuie calculaţi numai
pentru seriile staţionare.
Serii de timp

Curs 3, Martie 2021


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
Funcţia de autocorelaţie
 Definiţie: Se defineşte funcţia de autocovarianţă a unui proces staţionar
şirul autocovarianţelor de lag k, (k) unde k=0,±1,±2,…

𝛾𝑘 = 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 = 𝐸 𝑌𝑡 𝑌𝑡+𝑘 − 𝐸 𝑌𝑡 E(𝑌𝑡+𝑘 )

 Definiţie: Se defineşte funcţia de autocorelaţie a unui proces staţionar


şirul autocorelaţiilor de lag k, (k) unde k=0,±1,±2,…
𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝑐𝑜𝑣 𝑌𝑡 , 𝑌𝑡+𝑘 𝛾𝑘
𝑘 = 𝑐𝑜𝑟𝑟 𝑌𝑡 , 𝑌𝑡+𝑘 = = =
𝑉𝑎𝑟 𝑌𝑡 𝑉𝑎𝑟(𝑌𝑡+𝑘 ) 𝑉𝑎𝑟 𝑌𝑡 𝛾0

 Definiţie: Graficul funcţiei de autocorelaţie în raport cu decalajul k se


numeşte corelogramă
Corelogramă

 Cum interpretăm corelograma?


 Observăm că începe cu valori foarte mari
(0,969 la lag-ul 1) şi scade treptat.
 Chiar la lag-ul 14, coeficientul de autocorelaţie
are o valoare destul de mare (0,500).
 Corelograma arată că seria PIB este
nestaţionară.
 Pentru serii nestaţionare coeficienţii de
autocorelaţie scad foarte încet.
 Prin contrast, dacă un proces stochastic este
pur aleator, autocorelaţia la orice lag K0 , va
fi zero.
Interpretarea corelogramei
a) Serie aleatoare. O serie complet aleatoare are coeficienţii de autocorelaţie
 k  0 pentru orice k  0 şi pentru valori mari ale lui n. Pentru o serie aleatoare
se demonstrează că  k ~ N (0,1 / n) şi atunci ne aşteptăm ca o singură valoare a lui
 k să fie semnificativă.
b) Serie ce prezintă corelaţie pe termen scurt. O astfel de serie are o valoare
mare a lui 1 , după care urmează 2 sau 3 coeficienţi diferiţi de zero dar
valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori
ale lui  k apropiate de 0.
c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei,
atunci şi coeficienţii de autocorelaţie vor alterna. Coeficientul 1 va fi negativ.
Dacă valoarea observată la lag-ul 2 tinde să fie de aceeaşi parte a mediei,
atunci  2 va fi pozitiv.
d) Serie nestaţionară. Dacă o serie conţine trend, o observaţie de o anumită
parte a mediei tinde să fie urmată de un număr mare de observaţii de aceeaşi
parte a mediei. În acest caz, valorile lui  k vor tinde la zero doar pentru valori
foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea
coeficienţilor  k . Cu alte cuvinte, coeficienţii  k trebuie calculaţi numai
pentru seriile staţionare.
Testarea semnificaţiei coeficieţilor de
autocorelaţie (test Bartlet)
Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n, unde n este volumul selecţiei.

ˆ k ~ N (0,1 / n) Putem determina un interval de încredere 95% în care se află  k .


Ipoteze:
H0 : rk = 0 (nu diferă semnificativ de zero) . Deci seria de timp este pur aleatoare
H1 : rk  0 . Deci seria de timp nu este staționară
Testul Student:
rˆk
t= converge asimtotic (când T →  ) la N (0,1)
Vˆar(rˆk )
Pentru varianţa estimatorului coeficientului de autocorelaţie
Bartlett a furnizat următoarea expresie:

1  1
 ( )
 k −1
Var(rˆk ) = 1 + 2 rˆi 2  = 1 + 2 rˆ12 +  + rˆk2−1 . Var ( ˆ k ) = 1 / T pentru T mare
T i =1  T

Regula de decizie:
Fie  un nivel de semnificaţie
t calc  − t tab , t tab   se accepta H0
Estimarea coeficienţilor de autocorelaţie
 În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionarităţii,
media  şi varianţa 2 procesului pot fi estimate utilizând această singură
realizare, prin media respectiv varianţa de eşantionare:
1 T
Y =  Yt
T t =1
1 T
s =  (Yt − Y ) 2
2

T t =1

 Coeficientul de autocorelaţie de selecţie se estimează prin:


 (Y − Y )(Yt − k − Y ) /(T − k )
T

t
rˆk = t = k +1
sau prin:
 (Y −Y ) /T
T
2
t
t =1

 (Y − Y )(Yt − k − Y )
T

t dacă T este suficient de mare pentru


rˆk = t = k +1

 (Y −Y )
T
2 ca T/T-k să poată fi aproximat cu 1
t
t =1
Exemplu
 Se consideră 2 variabile economice cu date pe 25 perioade.
vt 1 4 2 2 5 5 3 3 1 4 4 3 3 5 4 4 4 1 3 3 3 3 1 2 2
zt 1 1 2 1 2 2 2 3 3 3 3 3 4 4 5 5 5 5 6 5 6 6 7 8 8

Coeficienţii de autocorelaţie obţinuţi pentru decalajele k=1, 2, 3 sunt:


– pentru seria vt: r1 = 0,1053; r2 = –0,0526; r3 = 0.
– pentru seria zt: r1 = 0,8302; r2 = 0,6887; r3 = 0,5755.

Să se testeze coeficienții de autocorelație folosind testul Bartlet?

 Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n , unde n este volumul selecţiei.
 Putem determina un interval de încredere 95% în care se află  k .
 k  (−1,96 * se( ˆ k );1,96 * se( ˆ k ))   k  (−1,96 *1 / n ; 1,96 *1 / n )

 n=25, varianţa lui este 1/25, iar eroarea standard este 1/5.
 Conform proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice  k va fi
(-0.392,0.392) .
 Pentru seria vt: toţi rk sunt în interiorul intervalului. Seria de timp este pur aleatoare
 Pentru seria zt: toţi rk sunt în afara intervalului deci seria este nestaționară.
Modele ARMA(p,q)
 Definiție: Un proces autoregresiv (AR) este un proces unde valoarea
curentă a lui y este influenţată de propriile valori din trecut şi de o
perturbaţie t:
yt = f ( yt −1 , yt − 2 , ) +  t

yt = a0 + a1  yt −1 + a2  yt − 2 +  + a p  yt − p

variabila aleatoare t este numită şi inovaţie, deoarece reprezintă partea


nepredictibilă a valorilor variabilei yt, date fiind valorile anterioare yt-1, yt-2, ….;

 Definiție: Un proces de medie mobilă (MA) este un proces unde valoarea


curentă (contemporană) a lui y este influenţată atât de valoarea
contemporană cât şi de valorile din trecut ale termenului inovaţie t:

yt = f ( t −1 ,  t − 2 , ) +  t

yt = a0 − b1 t −1 − b2 t − 2 −  − bq t − q +  t


Modele ARMA(p,q)
 Definiție: Un model de tip autoregresiv-medie mobilă ARMA(p,q) are o
componentă de tip autoregresiv respectiv o componentă de tip medie
mobilă: yt = f ( yt −1 , yt −2 ,) + g ( t −1 ,  t −2 ,) +  t
yt = a0 + a1 yt −1 + a2 yt − 2 +  + a p yt − p − b1 t −1 − b2 t − 2 −  − bq t − q +  t

 unde p este ordinul părţii autoregresive, q ordinul mediei mobile iar t este
un proces de tip zgomot alb (acesta fiind o succesiune de variabile
aleatoare independente şi identic repartizate, cu medie zero).
Funcția parțială de autocorelație (PAC)
 Observație: Coeficientul de autocorelaţie parţială măsoară efectul direct al
lui yt-k asupra variabilei yt (se izolează influenţa variabilei yt-k). Definiția
acestuia este similară cu a coeficientului de corelaţie parţială din
econometrie.
 Definiție: Coeficientul de autocorelaţie parțială între două variabile
separate de k unităţi de timp notat prin kk este coeficientul de regresie al
variabilei yt-k în modelul autoregresiv AR(k):
yt = k1 yt −1 + k 2 yt − 2 +  + kk yt − k +  t

şi măsoară informaţia adiţională adusă de variabila yt-k în explicarea


comportamentului prezent yt (cu câte unităţi se modifică yt dacă yt-k creşte cu
o unitate iar celelalte variabile yt-1, yt-2,…, yt-k+1 rămân nemodificate).
 Definiție: Funcția de autocorelație parțială constă în setul de coeficienți
kk, unde k=1,2,3,…
Estimarea coeficienților de autocorelație
parțială
 11 se estimează cu coeficientul de regresie a variabilei yt-1 în modelul AR(1):
yt = 11 yt −1 +  t  11 = corr ( yt , yt −1 ) = 1

 22 se estimează cu coeficientul de regresie a variabilei yt-2 în modelul AR(2):


yt = 21 yt −1 + 22 yt − 2 +  t  22 = corr ( yt , yt − 2 yt −1 )

Știind că:
r ( x, y ) − r ( x , z ) r ( y , z )
r ( x, y | z ) =  22 = (  2 − 12 ) /(1 − 12 )
1 − r ( x, z ) 1 − r ( y , z )
2 2

 kk se estimează cu coeficientul de regresie a variabilei yt-k în modelul AR(k):

yt = k1 yt −1 + k 2 yt −2 +  + kk yt −k +  t
Estimarea funcției parțiale de autocorelație
 Observaţie: În practică (inclusiv în softurile de statistică) coeficienţii de
autocorelaţie parţială nu se determină prin modele de regresie ci se
folosesc ecuaţiile Yule-Walker, ce redau relaţiile dintre coeficienţii de
autocorelaţie şi coeficienţii de autocorelaţie parţială.
 Ecuaţiile Yule-Walker exprimă coeficienţii de autocorelaţie k sub forma
unor funcţii de coeficienţii autoregresivi i. Definim matricea coeficienţilor
liniari de autocorelaţie prin R(p), vectorul parametrilor modelului prin  şi
vectorul coeficienţilor de autocorelaţie prin .
0 1  p
R( p)   =  R( p) =
1 0 1  p −1
2 1  1
p  p −1  0

 Funcția parțială de autocorelație de selecție este mulțimea coeficienților

{ˆ11 ,ˆ22 ,...} = {ˆkk , k  1}


Testarea semnificației coeficienților de
autocorelație
 Testarea unui singur coeficient de autocorelație (Testul Bartlet):
H 0 : k = 0
H1 :  k  0
 O regiune de acceptare 1- pentru H0 va fi dată prin intervalul − t / T , t / , T  pentru
tab tab

k0. Dacă valoarea coeficientului de autocorelaţie cade în afara acestui interval, pentru
o valoare dată a lui k, atunci ipoteza H0 este respinsă și se acceptă H1.

 Testarea ipotezei că mai mulţi coeficienţi de autocorelaţie sunt zero:


H 0 : toti  k = 0 1 =  2 =  =  m = 0
H 1 : exista  k  0
m
 Statistica Box şi Pierce: QBP (m) = n  ˆ k2  2m
k =1
 ˆ k2 
m
 Statistica Ljung Box : QLB (m) = n(n + 2 ) 
 n − k  ~  m
2

k =1  
 Regula de decizie: QLB   crt
2
 se accepta H 0
QLB   crt
2
 se respinge H 0
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
 Dacă în modelul de regresie
yt = yt −1 +  +  t
 găsim =1 , spunem că variabila are o rădăcină unitară.
yt = (  − 1) yt −1 +  t =  yt −1 +  t
 Ipoteza de rădăcină unitară (Unit Root)
 H0: seria are rădăcină unitară şi este nestaţionară ( =1 sau =0)
 H1: seria este staţionară ( 1 sau 0)
 Testul Dickey-Fuller (Unit Root Test)
 Dacă =1 sau =0 atunci seria nu este staţionară.
 Dacă 1 atunci seria este explozivă (tot nestaţionară; de regulă astfel de comportament nu este
regăsit în economie)
 Dacă 1 sau 0 atunci seria este staţionară.

 Statistica testului:  = DF = ˆ se(ˆ)


 Regula de decizie:
 Dacă |  calc |  |  crt respingem
| H0 şi acceptăm că seria este staţionară.
 Dacă |  calc |  |  crt acceptăm
|
0 H că seria este nestaţionară.
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
 Dickey şi Fuller au propus trei ecuaţii de regresie diferite, care pot fi
folosite pentru a testa prezenţa unei rădăcini egale cu 1
 Test pentru un proces de mers la întâmplare, contra unui proces autoregresiv, de ordinul
întâi, AR(1), staţionar:
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  t ,   1 y t − y t −1 = (  − 1) y t −1 +  t  yt =  yt −1 +  t

 Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  +  t ,   1 yt − yt −1 = (  − 1) yt −1 +  +  t  yt =  yt −1 +  +  t

 Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare şi trend în timp.
H 0 : yt = yt −1 +  t
H 1 : yt = yt −1 +  + t +  t ,   1
yt − yt −1 = (  − 1) yt −1 +  + t +  t  yt =  yt −1 +  + t +  t
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)

 Parametrul de interes în toate cele trei ecuaţii de regresie este .


 Dacă o serie este staţionară, condiţia -1<<1 este echivalentă cu condiţia
de staţionaritate: .-2<<0.
 Dacă =0, seria conţine o rădăcină egală cu 1.
 Testul implică estimarea uneia din ecuaţiile de mai sus prin MCMMP,
pentru a obţine valorile estimate ale lui  şi eroarea standard asociată.
Deoarece termenul eroare este puţin probabil să fie un proces de zgomot
alb, Dickey şi Fuller au aplicat o procedură îmbunătăţită, care foloseşte p
decalaje ale variabilei dependente. Testul ADF include termeni AR(p) ai
termenului yt în cele trei modele alternative. Dacă termenul eroare este
autocorelat, ultimul din cele trei modele va fi:
p
yt =  yt −1 +  +  t +   i yt −i +  t
i =1
1. Analiza graficului unei serii de timp
 Graficele seriilor arată
că seriile au o tendinţă
crescătoare, deşi
trendul nu este neted.
 Se observă că media,
varianţa şi
autocovarianţele
fiecărei serii nu par a fi
invariante în raport cu
timpul. Aceste serii sunt
serii de timp
nestaţionare.

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


2. Analiza staţionarităţii seriei de timp
PIB, pe baza corelogramei seriei

Corelograma arată că seria PIB este nestaţionară.


Intervalul de incredere pentru coeficientii de
autocorelatie este:

(−1,96(0,1066),+1,96(0,1066))

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1,
Seria are Constantă dar nu si Trend

yt =  yt −1 +  t
 Dacă  = 0, spunem că variabila are o rădăcină
unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1
Seria are Constantă si Trend

p
yt =  yt −1 +  + t +   i yt −i +  t
i =1

 Dacă  = 0, spunem că variabila are o rădăcină


unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
Serii de timp

Curs 4, Martie 2021


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Procese nestaționare
 Definiție: Un proces este nestaționar dacă nu verifică una sau mai multe
din cerinţele din definiția procesului staţionar.
 În economie majoritatea seriilor sunt nestaţionare, media respectiv
varianţa acestora nefiind constante în timp.

 Detectarea nestaţionarităţii:
 din cronogramă şi corelogramă: autocorelaţiile unei serii staţionare se apropie
rapid de zero, odată ce k creşte (tind exponenţial spre zero). Pentru o serie
nestaţionară autocorelaţiile sunt mari şi pozitive pentru un număr mare de valori
ale lui k.
 utilizarea unor teste de staţionaritate (numite şi teste de rădăcină unitate)
Serie nestaționară de tip TS (Trend Stationarity)
 Definiție: O serie nestaţionară este de tip TS dacă trendul este de
tip determinist şi se elimină prin scădere sau prin împărţire
y t =  +  t +  t t = 1,2,..., n;  t este zgomot alb
 Proprietăți:
 Media unei serii TS nu este constantă: E ( yt ) = E ( +  t +  t ) =  +  t

Varianța seriei este constantă în timp: Var ( yt ) = Var ( +  t +  t ) =  


2

 Covarianța este zero: cov( y t , y t + h ) = 0 ,  h  0

 Observații:
 Efectul produs de un șoc aleator este tranzitoriu, deci nu se acumulează în timp

 Staționarizarea se face prin estimarea trendului și eliminarea lui din seria


inițială
Serie nestaționară de tip DS (Differency Stationarity)
 Definiție: O serie nestaţionară este de tip DS dacă trendul este de
tip stochastic şi se elimină prin calculul diferențelor de ordinul 1 sau
mai mare decât 2
yt = yt −1 +  +  t t = 1,2,..., n;  t este zgomot alb

 Diferențele de ordin 1 și 2:
yt = yt − yt −1
2 yt = ( yt − yt −1 ) = yt − yt −1 = ( yt − yt −1 ) − ( yt −1 − yt − 2 ) = yt − 2 yt −1 + yt − 2

 Definiție: Dacă =1 spunem că yt are o rădăcină unitate


 Proprietăți:
 Media unei serii DS este variabilă în timp: E ( yt ) = y 0 +  t

Varianța seriei depinde de timp: Var ( yt ) = t 


2

Covarianța seriei nu este zero: cov( yt , yt + h ) = h    ,  h  0


2

Serie nestaționară de tip DS (Differency Stationarity)
 Observații:
 Termenul liber al seriei de tip DS nu este o constantă ci o realizare a variabilei
aleatoare yt

 Efectul produs de un șoc aleator nu este tranzitoriu ci de durată

 Staționarizarea se face prin aplicarea operatorului de diferențiere


Serii integrate
 Definiție:
 Spunem că seria yt este integrată de ordinul 1, sau conţine o rădăcină egală cu 1,
dacă este nestaţionară dar seria diferenţelor este staţionară. O astfel de serie se
notează prin yt  I(1).
 Spunem că seria yt este integrată de ordinul 2 dacă ea conţine două rădăcini egale cu
1 şi astfel, este necesară diferenţierea de două ori pentru a induce staţionaritatea. Se
notează prin yt  I(2).
 Spunem că seria yt este integrată de ordinul d dacă ea conţine d rădăcini egale cu 1
şi astfel, este necesară diferenţierea de d ori pentru a induce staţionaritatea. Se
notează prin yt  I(D).
 Observație:
 Ordinul de integrare al unei serii este egal cu numărul care arată de câte ori trebuie
diferenţiată seria pentru a deveni staţionară şi este egal cu numărul de rădăcini egale cu 1.
 Majoritatea seriilor de date economice conţin o singură rădăcină egală cu 1.
 Cele mai multe serii cronologice macroeconomice au tendinţă şi, în mod specific, ele
conţin trenduri stochastice.
Modele ARIMA
 Definiție: xt este un proces ARIMA(p,d,q) dacă:
 xt este o serie nestaționară
 xt devine staționară după d diferențieri
 d xt = (1-L)dxt este proces ARMA(p,q)

 Scrierea modelelor ARIMA folosind operatorul de diferențiere:


 ARMA(p,q): Yt = a1Yt −1 + a2Yt −2 +  + a PYt −P − b1 t −1 − b2 t −2 −  − bq  t −q +  t
(1 − a L − a L
1 2
2
−  − a p L p )Yt = (1 − b1 L −  − bq Lq ) t

 (L )Yt =  (L) t
 (L ) = 1 − a1 L − a2 L2 −  − a p Lp
 ( L) = 1 − b1 L −  − bq Lq

ARIMA(p,d,q):  (L )(1 − L) X t =  (L ) t
d

Serii integrate
 Definiție:
 Spunem că seria yt este integrată de ordinul 1, sau conţine o rădăcină egală cu 1,
dacă este nestaţionară dar seria diferenţelor este staţionară. O astfel de serie se
notează prin yt  I(1).
 Spunem că seria yt este integrată de ordinul 2 dacă ea conţine două rădăcini egale cu
1 şi astfel, este necesară diferenţierea de două ori pentru a induce staţionaritatea. Se
notează prin yt  I(2).
 Spunem că seria yt este integrată de ordinul d dacă ea conţine d rădăcini egale cu 1
şi astfel, este necesară diferenţierea de d ori pentru a induce staţionaritatea. Se
notează prin yt  I(D).
 Observație:
 Ordinul de integrare al unei serii este egal cu numărul care arată de câte ori trebuie
diferenţiată seria pentru a deveni staţionară şi este egal cu numărul de rădăcini egale cu 1.
 Majoritatea seriilor de date economice conţin o singură rădăcină egală cu 1.
 Cele mai multe serii cronologice macroeconomice au tendinţă şi, în mod specific, ele
conţin trenduri stochastice.
1. Analiza graficului unei serii de timp
 Graficele seriilor arată
că seriile au o tendinţă
crescătoare, deşi
trendul nu este neted.
 Se observă că media,
varianţa şi
autocovarianţele
fiecărei serii nu par a fi
invariante în raport cu
timpul. Aceste serii sunt
serii de timp
nestaţionare.

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


2. Analiza staţionarităţii seriei de timp
PIB, pe baza corelogramei seriei

Corelograma arată că seria PIB este nestaţionară.


Intervalul de incredere pentru coeficientii de
autocorelatie este:

(−1,96(0,1066),+1,96(0,1066))

Sursa: Suport de curs Prof.univ.dr. Silvia Spataru


3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1,
Seria are Constantă dar nu si Trend

yt =  yt −1 +  t
 Dacă  = 0, spunem că variabila are o rădăcină
unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
3. Testul pentru staţionaritate sau pentru o
rădăcină egală cu 1
Seria are Constantă si Trend

p
yt =  yt −1 +  + t +   i yt −i +  t
i =1

 Dacă  = 0, spunem că variabila are o rădăcină


unitară.

Nu putem respinge ipoteza nulă (acceptăm H0).


Există o rădăcină unitară, deci seria PIB este
nestaţionară.
Modele ARIMA
 Definiție: xt este un proces ARIMA(p,d,q) dacă:
 xt este o serie nestaționară
 xt devine staționară după d diferențieri
 d xt = (1-L)dxt este proces ARMA(p,q)
 Scrierea modelelor ARIMA folosind operatorul de diferențiere:
 ARMA(p,q): Yt = a1Yt −1 + a2Yt −2 +  + a PYt −P − b1 t −1 − b2 t −2 −  − bq  t −q +  t
(1 − a L − a L
1 2
2
−  − a p L p )Yt = (1 − b1 L −  − bq Lq ) t

 (L )Yt =  (L) t
 (L ) = 1 − a1 L − a2 L2 −  − a p Lp
 ( L) = 1 − b1 L −  − bq Lq

 ARIMA(p,d,q):  (L )(1 − L) d X t =  (L ) t
Definiții, Notații
 Un proces autoregresiv
 AR (p): yt = a0 + a1  yt −1 + a2  yt − 2 +  + a p  yt − p

 Un proces de medie mobilă


 MA (q): yt = a0 − b1 t −1 − b2 t − 2 −  − bq t − q +  t

 Un model de tip autoregresiv-medie mobilă


 ARMA(p,q): yt = a0 + a1 yt −1 + a2 yt −2 +  + a p yt − p − b1 t −1 − b2 t −2 −  − bq t −q +  t

 Un model integrat de tip autoregresiv-medie mobilă


 ARIMA(p,d,q):  (L)(1 − L) d X t =  (L) t
 (L ) = 1 − a1 L − a2 L2 −  − a p Lp
 ( L) = 1 − b1 L −  − bq Lq
d xt = (1-L)dxt staționară
Teorema de descompunere a lui Wold
 Orice proces stochastic slab staţionar şi absolut nedeterminist (yt - ) poate
fi reprezentat ca o combinaţie liniară (sau filtru liniar) de variabile
aleatoare necorelate.

yt −  =  t − b1 t −1 − b2 t − 2 −  =  j  t − j  0 = 1, j = −b j pentru j = 1,2,...
j =0 


j =0
2
j 

 teste un proces de zgomot alb (white noise), adică un şir de variabile


aleatoare independente, identic distribuite, cu media 0 şi varianţa 2.
Ponderile j sunt legate de autocorelaţiile lui yt prin relaţiile:

  j j +k

  0 =1
 k = k = j =0  2 , k  0
 0 1+   j
j =1
Modele de medie mobilă – MA(1), ARIMA(0,0,1)
 Modelul medie mobilă de ordinul 1 cu media zero:
Yt =  t − b1 t −1  t ~ WN (0, 2 )

 Proprietate: Un model MA(1) este staționar iar funcția sa de autocorelație se anulează


pentru k2.
 Media procesului este nulă: E(Yt ) = E( t ) − b1E( t −1 ) = 0

 Varianța procesului: ( )
Var (Yt ) = E Yt − E (Yt ) = E (Yt 2 ) = E( t − b1 t −1 )( t − b t −1 ) =
2 2

( ) ( ) (
= E  t2 + E(− b1 t −1  t ) − E(− b1 t −1  t ) + E b12 t2−1 =  2 1 + b12 )
 Covarianța procesului: Cov(Yt , Yt −k ) = E ( t − b1 t −1 )( t −k − b1 t −k −1 ) =

=
( )
E ( t − b1 t −1 )( t −1 − b1 t −2 ) = −b1 E  t2−1 = −b1  2 pentru k = 1
0 pentru k  1

0, k2
Funcția de autocorelație: 
 rk =  b1

 1+ b2 , k =1
 1
MA(1): Xt= t + 0,8  t-1
Modele de medie mobilă – MA(q), ARIMA(0,0,q)
 Modelul medie mobilă de ordinul q cu media zero:
Yt =  t − b1 t −1 − b2 t −2 −  − bq  t −q  t ~ WN (0, 2 )

 Proprietate: Un model MA(q) este staționar iar funcția sa de autocorelație se anulează pentru
kq+1.

 Media procesului este nulă: E (Yt ) = 0


 Varianța procesului: Var (Yt ) =  2 (1 + b12 + b22 + ... + bq2 )

 Covarianța procesului: Cov(Yt , Yt − k ) = E ( t − b1 t −1 − b2  t − 2 −  − bq  t − q )( t − k − b1 t − k −1 − b2  t − k − 2 −  − bq  t − k − q ) =


 2 (-b k + b1 b k +1 + ... + b q -k b q ) pentru k = 1, 2,..., q
=
0 pentru k  q + 1

 - b k + b1 b k +1 + ... + b q-k b q
 pentru k = 1, 2,..., q
 Funcția de autocorelație: rk =  1 + b12 + b22 + ... + bq2

0 pentru k  q + 1

 Observație: Dacă procesul are medie nenulă atunci modelul include şi un termen liber, acesta fiind egal
cu media: Yt = m +  t − b1 t −1 −  − bq  t −q
Modele MA
yt =  t + 0,9 *  t −1 yt =  t − 0,9 *  t −1

yt =  t − 0,5  t −1 + 0,25 t −2
Modelul autoregresiv – AR(1), ARIMA(1,0,0)
Var (Yt ) =  0 =  2
 Varianța procesului: 1
1 − a12

 Funcția de autocorelație: k
rk = = a1k
0

 Observații:
 a1 = 1 regăsim varianţa unui proces nestaţionar de tip mers aleator
 a1 > 0 funcţia de autocorelaţie rk descreşte exponenţial
 a1 < 0 descreşte sinusoidal (dinţi de ferăstrău, valorile negative alternează cu cele pozitive)

 Observație: Un proces AR(1) în care apare şi constanta:


Yt = a0 + a1Yt −1 +  t
a0
 Media: E (Yt ) =  =
1 − a1

 Dispersia: Var (Yt ) =  2 1


1 − a12
AR(1): Xt=-0,8Xt-1+t
Modele AR
yt = 0,8 * yt −1 +  t yt = −0,8 * yt −1 +  t
Modelul autoregresiv – AR(p), ARIMA(p,0,0)
 Utilizând scrierea cu operatorul L, un model AR(1) devine:
(1 − a1 L)Yt =  t
 condiţia de staţionaritate a 1  1 este echivalentă cu cerinţa ca rădăcina polinomului
de gradul unu  (L ) = 1 − La,1notată cu x să aibă modulul mai mare decât unu:
1
1 − xa1 = 0  x =
a1
 Proprietate: Un model AR(P):  (L)Yt =este
 t staționar atunci când rădăcinile
polinomului:  ( L) = 1 − a1 L − a2 L2 −  − a(reale
pL
p
sau complexe) sunt în modul mai mari ca
1 (se spune că sunt în afara cercului unitate).

 Proprietate: Coeficienţii de autocorelaţie parţială ai unui model AR(p) sunt egali cu


zero, pentru k mai mare decât p (ordinul modelului).
 Coeficientul de regresie al variabilei Yt-p-1 în modelul autoregresiv AR(p+1):
Yt = a0 + a1Yt −1 + a2Yt −2 +  +a pYt − p +a p +1Yt − p−1 +  t

deoarece pentru un model AR(p) coeficientul ap+1 =0.


Modelul autoregresiv – AR(2), ARIMA(2,0,0)
 Modelul autoregresiv de ordinul 1 de medie zero:
Yt = a1Yt −1 + a2Yt − 2 +  t Yt − a1Yt −1 − a2Yt − 2 =  t (1 − a1 L − a2 L2 )Yt =  t

 (L)Yt =  tunde  ( L) = 1 − a1 L −este


a2 L2 polinomul caracteristic al procesului AR(2)
E (Yt ) = E (a0 + a1Yt −1 + a2Yy − 2 +  t )  E (Yt ) =
a0
 Media procesului este nulă: =0
1 − a1 − a2
 Varianța procesului:
 2
Var (Yt ) = Var ( a1Yt −1 + a2Y y −2 +  t ) = a Var (Yt −1 ) + a Var (Yt −2 ) + Var ( t )  Var (Yt ) =
2 2

1 − a12 − a22
1 2

 Autocorelațiile unui proces AR(2):


 Ecuațiile Yule Walker: rk − a1rk −1 − a2 rk − 2 = 0 pentru k  0
a a12
r1 = 1 r2 = + a2 rk = a1rk −1 + a2 rk − 2 pentru k  2
1 − a2 1 − a2
 Autocorelațiile parțiale ale unui proces AR(2):
c1 = r1
a1 + r1a2 = r1 r2 − r12
 Ecuațiile Yule Walker:   c2 =
1 − r12
r a +
1 1 2 2r = r
ck = 0 pentru k  2
AR(2): Xt=0,5Xt-1+ 0,25Xt-2+ t
Modelul autoregresiv medie mobilă –
ARMA(1,1), ARIMA(1,0,1)
 Modelul autoregresiv medie mobilă de ordinul 1, de medie zero - ARMA(1,1):
Yt = a1Yt −1 +  t − b1 t −1 a1  1  t ~ WN (0,  2 )

(1 − a1 L)Yt = (1 − b1 ) t

 Media procesului este nulă: E (Yt ) = 0

1 + 2a1b1 + b12 2 (a1 + b1 )(1 + a1b1 ) 2


 Covarianța procesului: 0 =  
 = 
1 − a12
1
1 − a12
 k = a1 k −1 pentru k  2

(a1 + b1 )(1 + a1b1 ) rk = a1rk −1 pentru k  2


 Autocorelațiile unui proces ARMA(1,1): r1 =
1 + 2a1b1 + b12

c1 = r1
 Autocorelațiile parțiale ale unui proces ARMA(1,1): r2 − r12
c2 =
1 − r12
ck  0 pentru k  3
ARMA(1,1): Xt=0,8Xt-1+t+0,9  t-1
Serii de timp

Curs 5, Martie 2021


Titular de curs: Prof.univ.dr.Cristina BOBOC
Email: cristina.boboc@csie.ase.ro
WEB page: www.cristinaboboc.wordpress.com
Capitolul 3
MODELE UNIVARIATE DE TIP
AUTOREGRESIV MEDIE MOBILA
Etapele elaborării unui model ARIMA
(autoregresiv integrat medie mobilă)
 1. Identificarea modelului → se precizează valorile adecvate pentru p, d
respectiv q
 Verificarea staționarității: dacă seria se constată că este nestaționară ea se diferențiază până
devine staționară, rezultând ordinul de diferențiere d (în general d=1 sau 2)
 În funcție de forma funcțiilor de autocorelație și parțială de autocorelație se determină valori
plauzibile pentru p și q

 2. Estimarea parametrilor modelului → estimarea coeficienţilor ai, bi,  2

 3. Testarea validităţii modelului


 t este de tip zgomot alb? → teste privind comportamentul
reziduurilor
 teste privind semnificaţia coeficienţilor ai, bi;

 Dacă modelul nu este valid atunci se respecifică modelul (alte valori


plauzibile pentru p,d,q) şi se reiau etapele anterioare.

 4. Generarea previziunilor în baza modelului estimat.


1. Identificarea modelului
 a) Stabilirea ordinului de diferenţiere. Dacă o serie este nestaţionară
în medie (media nu este constantă în timp) se vor calcula diferenţele de
ordin 1 eventual 2, în scopul stabilirii ordinului de diferenţiere d.

 Observaţie. Dacă seria este uşor nestaţionară şi în varianţă este indicat,


inainte de modelare, a se logaritma datele iniţiale, reducând astfel
amplitudinea fluctuaţiilor seriei. Se va lucra în continuare cu datele
logaritmate.

 b) Stabilirea valorilor plauzibile pentru p respectiv q.


 Dacă nu pare adecvat un model AR(p) sau MA(q) cu număr mic de parametri ( p
respectiv q mai mici ca 4) atunci se va încerca un model mixt ARMA ce combină
ambele părţi.
Metodologia Box Jenkins
Model Funcţia de autocorelaţie rk Funcţia de autocorelaţie parţială ck
AR(1) - descreşte exponenţial dacă - c1 semnificativ (> 0 dacă
Yt = a1Yt −1 +  t a1 > 0 a1 > 0 şi <0 dacă a1 < 0);
- descreşte sinusoidal, dacă - ck = 0,  k  2
a1 < 0

AR(2) descreşte exponenţial sau sinusoidal. Forma exactă - c1 şi c2 semnificativi


Yt = a1Yt −1 + a 2 Yt −2 +  t depinde de semnul şi valoarea coeficienţilor a1 şi a2 - ck = 0,  k  3
AR(p) descreşte exponenţial sau sinusoidal. Forma -c1, …, cp – semnificativi
Yt = a1Yt −1 +  + a p Yt −p +  t funcţiei depinde de semnul şi valoarea -ck = 0,  k  p+1
coeficienţilor a1, …, ap
MA(1) r1 semnificativ (> 0 dacă b1< 0şi  0 dacă b1 > 0); exponenţial dacă b1 > 0
Yt =  t − b1 t −1 rk = 0,  k  2 sinusoidal dacă b1 < 0

MA(2) r1 , r2 semnificativ descreşte exponenţial sau sinusoidal. Forma


Yt =  t − b1 t −1 − b 2 t −2 rk = 0,  k  3 exactă depinde de semnul şi valoarea
coeficienţilor b1, b2
MA(q) r1 ,, rq semnificativi descreşte exponenţial sau sinusoidal. Forma
Yt =  t − b1 t −1 −  − bq t −q rk = 0,  k  p+1 funcţiei depinde de semnul şi valoarea
coeficienţilor b1, …, bq
ARMA(1,1) descreşte exponenţial. Semnul lui r1 depinde de cel descreşte exponenţial dacă b1 > 0 respectiv
Yt = a1Yt −1 +  t − b1 t −1 al diferenţei a1–b1 sinudoidal dacă b1 < 0

ARMA (p,q) descreşte exponenţial sau sinusoidal începând cu descreşte exponenţial sau sinusoidal începând cu
k=q-p k=q-p
Metodologia Box Jenkins
 În practică vom căuta:

 cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie parţială ck nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru p ordinul modelului autoregresiv AR(p); AR(p) este adecvat
variabilelor dependente exclusiv de trecutul lor, cu pronunţat caracter inerţial (exemplu:
consumul de bunuri de strictă necesitate unde se creează obişnuinţă).

 cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie rk nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru q, ordinul modelului medie mobila MA(q). MA(q) e adecvat
variabilelor „sensibile” la modificări ale variabilelor exogene, determinând abateri accidentale
de la evoluţia medie.

 În principiu nu este dificil să distingem între un model AR(p) şi un model MA(q), în schimb
determinarea ordinelor p, q pentru un model mixt este un proces relativ incert. Există şi
posibilitatea selectării modelului ce minimizeaza diferite criterii construite utilizând funcţia de
verosimilitate (ex: criteriul Akaike AIC, criteriul Schwarz SC).
Estimarea parametrilor modelului
 Forma restrânsă a unui model
 ARMA(p,q):  (L )Yt =  (L ) t
 ARIMA(p,d,q):  (L)(1 − L) d X t =  (L) t

 Metoda clasică a celor mai mici pătrate de minimizare a sumei pătratelor erorilor
conduce la estimatori ai parametrilor a1, a2,…, ap regăsind ecuațiile Yule-Walker
(relațiile între coeficienții modelului și coeficienții de autocorelație).
 Estimatorii obținuți nu sunt eficienți deoarece există colinearitate între variabilele
explicative din model.
 De aceea se utilizează metoda verosimilității maxime.

 Proprietate: Funcţia de verosimilitate asociată seriei observaţiilor Y=(Y1, …,YT )


este:
1
(2 2 ) −T / 2 det[ (ai , bi )]−1 / 2 exp{ − Y ' [(ai , bi )]−1 Y
2  2

 Maximizarea acesteia conduce la valori pentru coeficienţii ai, bi ce asigură cea mai
mare probabilitate de apariţie a observaţiilor Y1, …, YT.
 Acești estimatori sunt consistenți, asimtotic eficienți și normal distribuiți.
Testarea validității modelului
 Pentru a vedea dacă modelul estimat surprinde adecvat modul de generare a
datelor (caracterul inerţial respectiv cel de asimilare a şocurilor) este utilă în
prealabil o analiza comparativă a funcţiei de autocorelaţie r̂k respectiv de
autocorelaţie parţială ĉk estimate, pentru seria iniţială Yt respectiv pentru seria
generată de model Yˆt .
 O asemănare între corelogramele acestora indică faptul că modelul surprinde
adecvat mecanismul de generare a datelor.
 De asemenea se pot analiza rădăcinile unitate ale polinoamelor autoregresive
respectiv medie mobilă.

 Se vor aplica două grupe de teste:


 teste de semnificație a coeficienţilor modelului
 teste referitoare la reziduuri (pentru a vedea dacă sunt de tip zgomot alb).
Teste privind semnificația coeficienților
 Considerăm un model staţionar ARMA(p,q) cu medie diferită de zero:
 (L )Yt = a0 +  (L ) t

 Se testează dacă ai (sau bi ) diferă semnificativ de zero:

H 0 : ai = 0
H 1 : ai  0
 Statistica: 
 N(0,1)
ai
t= 
Var (ai )
 Regula de decizie: Pentru un nivel de semnificaţie  , dacă atunci ipoteza
nulă H0 nu se respinge. Prin urmare variabila corespunzătoare se elimină
t calc din
− ttabmodel,
,+t tab  şi se
respecifică respectiv re-estimează modelul.

 Observație: Ca teste asupra coeficienţilor se pot utiliza şi alte teste precum testul Wald, sau
teste de tip LM (Multiplicatorul lui Lagrange) pentru omisiunea unor variabile, teste de
stabilitate a coeficienţilor.
Teste privind reziduurile
 Dacă modelul este bine specificat, atunci reziduurile din modelul estimat
sunt generate de un proces de tip zgomot alb (succesiune de variabile
aleatoare independente, identic repartizate), cu medie zero şi normal
distribuit.
 Autocorelarea reziduurilor. Pentru detectarea unor dependenţe în seria
reziduurilor se examinează funcţia de autocorelaţie şi de autocorelaţie
r̂k
parţială a reziduurilor.ĉkDacă reziduurile sunt necorelate, atunci aceşti
coeficienţi nu trebuie să fie semnificativ diferiţi de zero.

 Statistica: rˆk
 N(0,1) unde

Var(rˆk ) =
t= 1
Vˆar(rˆk ) T
 Regula de decizie: Pentru un nivel de semnificaţie  , dacă
rˆk  − ttab /
atunci ipoteza nulă H0 nu se respinge, deci reziduurile sunt necorelate. T , ttab / T 

 Observații:
 1. Același test se aplică și pentru coeficienții parțiali de autocorelație.
 2. Se mai aplică și testul Ljung Box studiat în cursurile precedente
Investigarea normalității reziduurilor
 Testul Jarque&Bera:
 Se bazează pe coeficienții de boltire și de asimetrie
 Dacă un eşantion de T observaţii provine dintr-o distribuţie normală atunci coeficientul de
asimetrie calculat în baza observaţiilor urmează asimptotic legea normală N(0, 6/T) iar
coeficientul boltirii legea N(3,24/T).
 Jarque şi Bera obţin prin însumarea celor două variabile normale independente statistica:
1 1
JB = Tˆ 32 + T (ˆ 4 − 3) 2   2 (2)
6 24
 Regiunea critică:

P( JB  2 , 2 ) = 
Investigarea heteroscedasticităţii
reziduurilor
 Testul multiplicatorilor lui Lagrange pentru heteroscedasticitate de tip
ARCH(p) presupune:
 estimarea reziduurilor et = ˆt din ecuaţia ce defineşte modelul;
 estimarea regresiei auxiliare (ce fundamentează testul):
et2 =  0 +  1et2−1 + ... +  p et2− p

 testarea ipotezei nule în ecuaţia de regresie auxiliară:


H o : 1 =  2 = ... =  p = 0 (nu există efect ARCH).
 Statistica LM definită prin:
LM = T  R 2   2 ( p)
 unde R2 este coeficientul de determinaţie aferent regresiei auxiliare iar T este lungimea seriei
de timp.
 Ipoteza homoscedasticităţii (varianţă constantă în timp) se respinge dacă LM calculat este
superior valorii critice pentru un nivel de semnificație :
P( LM  2 , p ) = 
Criterii de selecție pentru cel mai bun
model ARIMA
 Criteriul AIC (Akaike 1974):
AIC = ln(ˆ 2 ) + 2( p + q ) / T unde ˆ 2 este estimatorul varianței 2 pentru modelul ARMA
potrivit seriei wt=dxt, t=1,2,...,T

 Criteriul BIC (Rissanen, Schwartz 1978):


BIC = ln(ˆ 2 ) + ( p + q) ln(T ) / T unde ˆ 2 este estimatorul varianței 2 pentru modelul ARMA
potrivit seriei wt=dxt, t=1,2,...,T

 Procedura:
 Se determină P și Q maximele ordinelor modelelor AR respectiv MA
 p și q se determină astfel încât să obțin minimul criteriilor descrise
Realizarea previziunilor
 Modelul ARIMA estimat şi validat poate fi utilizat pentru generarea de previziuni:
 previziuni punctuale
 intervale de previziune.
 Previziuni punctuale
 Pentru un orizont de previziune h, ataşăm momentului T+h, unde T este originea efectuării
previziunii, variabila aleatoare YT + h .

YT +h = E(YT +h | YT , YT −1 ,..., Y1 )

YˆT + h = aˆ 0 + aˆ1YT + h−1 + aˆ 2YT + h −2 +  + aˆ pYT + h− p − bˆ1 T + h−1 − bˆ2 T + h −2 −  − bˆq  T + h−q +  T + h
 Previziunile se obţin în baza informaţiilor disponibile până la momentul T, pas cu pas:
 termenii autoregresivi YT + h −i pentru h-i>0 (adică YT +1 , YT + 2 ... se substituie cu previziunile obţinute la
paşii anteriori;
 termenii autoregresivi YT + h −i pentru h-i<0 se înlocuiesc cu valorile înregistrate, aici fiind cunoscuţi
termenii seriei (YT-1, YT-2, ...);
 termenii eroare  T + h −i pentru h-i>0 (adică T+1, T+2,…) se înlocuiesc cu zero (deoarece înlocuindu-i
cu media lor și erorile fiind de tip zgomot alb, media lor este 0)
 termenii eroare  T + h −i pentru h-i<0 (adică T-1, T-2,… ) se înlocuiesc cu reziduurile estimate din
model (spre exemplu  = Y − Yˆ , pentru t<T).
t t t
Determinarea intervalului de previziune
 Eroarea de previziune:

eT + h = YT + h

( )
− YT + h  N 0, V (eT + h ) 
YT + h − YT + h
V (eT + h )
 N (0,1)

 Din distribuţia legii normale de probabilitate, pentru o probabilitate P fixată se determină


k astfel încât:

 Y − Y 
− k  T + h T +h
 k = P

 V (eT + h ) 

 Intervalul de previziune:
YT +h

− k V (eT + h ); YT + h + k V (eT + h ) 
 Calculul varianţei erorii de previziune necesită punerea modelului sub forma mediei mobile cu un număr
infinit de termeni (orice model ARMA poate fi pus în această formă):

Yt =  t + c1 t −1 + c 2 t −2 + ...  Yt = C (L ) t
  ( L)C (L ) =  ( L)
 (L )
Yt = t
 (L )
  h −1 
eT +h = YT +h − YT +h =  t + c1 t −1 + c2 t −2 + ... − (ch T + ch+1 T −1 + ...)  V (eT + h ) =  2 1 +  c 2j 
 
 j =1 
Exemplu
 Fie seria temporală a PIB-ului SUA,
miliarde de dolari SUA, date
trimestriale ajustate sezonier din
1947 până în 2007, exemplu furnizat
în Gujarati, D., Porter, D., Basic
Econometrics, ediția a V-a, McGraw-
Hill, 2009, pp 778-784
Verificarea stationarității seriei
Este seria diferențiată stationară?
Corelograma seriei diferențiate

p
0 1 2
q
0 ARMA(0,0) ARMA(0,1), deci MA(1) ARMA(0,2), deci MA(2)
1 ARMA(1,0), deci AR(1) ARMA(1,1) ARMA(1,2)
ARMA(0, 0)
ARMA(1,0)
ARMA(0,1)
ARMA(0,2)
ARMA(1,1)
ARMA(1,2)
Compararea modelelor

Modele identificate

ARMA(1,0) ARMA(0,1) ARMA(0,2)


ARMA(1,1) ARMA(1,2)
or AR(1) or MA(1) or MA(2)

AIC –6.518950 –6.493237 –6.526104 –6.514880 –6.520065


BIC –6.490116 –6.464488 –6.482979 –6.471629 –6.462397
HQIC –6.507334 –6.481657 –6.508734 –6.497457 –6.496834
Log likelihood 790.7929 790.9283 795.9216 791.3005 792.9279
Adjusted R Square 0.104671 0.081077 0.114402 0.104688 0.112937
Este modelul semnificativ?

yes yes yes yes Yes

C yes yes yes yes Yes


semnificativi?
Parametrii

ar(1) yes yes No


ma(1) yes yes no No
sunt

ma(2) yes No
Rezidualurile sunt White
yes no yes yes Yes
Noise?

S-ar putea să vă placă și