Documente Academic
Documente Profesional
Documente Cultură
3. Extinderi ale modelelor ARIMA : Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
SARIMA; Modele ARCH, GARCH
4. Modele multivariate stationare: Modele VAR; Cauzalitate Granger
5. Modele multivariate nestationare: Cointegrare; Modele VECM; Teste de cointegrare
Nota finală:
50% nota de la examen (sapt 31mai – 4 iunie 2020)
30% prezentare proiect (sapt. 24-28 mai 2020)
20% prezenţă şi activitate seminar
Bibliografie:
D. Lazar – Suport de curs: Analiza seriilor cronologice și previziune
P.J. Brockwell, R.A. Davies. Introduction to Time Series and Forecasting, Second Ed., Springer, 2002.
Damodar N. Gujarati, Dawn C. Porter. Basic Econometrics, Fifth Edition, McGraw-Hill, 2009.
T.Andrei, R. Bourbonais – Econometrie, Partea a V-a, Ed. Economică, 2008
E. Titan, S. Ghita, C. Boboc – Bazele Statisticii, Capitolul 6, Ed. Meteor Press
Baze de date pentru serii de timp
Institutul Național de Statistică http://www.insse.ro/cms/ (TEMPO Online)
Banca Națională a României http://www.bnr.ro/Home.aspx
World Bank http://www.worldbank.org/
Eurostat http://ec.europa.eu/eurostat
The University of York, Department of Mathematics
https://www.york.ac.uk/depts/maths/data/ts/
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Șomajul
Speranța de Viață
Natalitatea
Mortalitatea
Numărul pasagerilor unei companii aeriene
Cifra de afaceri a unei companii
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
ŶT+h
Y :
Y Y
1 2 ... Yt
(Yt )tZ
... YT
1 2 ... t ... T
Definirea unei serii de timp
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
date anuale
Exemplu:
Speranța de viață la naștere pentru populația României,
http://www.worldbank.org/
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Exemplu:
Rata de schimb GBP – EUR, date zilnice
http://www.xe.com/currencycharts/?from=GBP&to=EUR&view=1M
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro Exemplu:
et = Yt − Yˆt
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Fie Yˆ1 , Yˆ2 ,..., Yˆs previziunile corespunzătoare observaţiilor Y1 , Y2 ,..., Ys . Se definesc:
1 s
2. Eroarea medie absolută: MAE = Yh − Yˆh
s h=1
ˆ
3. Eroarea medie absolută exprimată procentual: 1 s Yh − Yh
MAPE =
s h=1 Yh
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Yt = f (Tt , Ct , St , t )
Componentele unei serii cronologice
1. Tendința unei serii cronologice (T)
redă evoluţia fenomenului pe termen lung, având alura unor funcţii neperiodice, lent variabile în timp.
este componenta principală a seriei de timp care rezultă din efectul pe termen lung al factorilor socio-
economici și politici
poate arăta creșterea sau declinul unei serii de timp pe o perioadă lungă de timp.
forma tendinței poate fi liniară sau neliniară
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
2. Componenta ciclică C
este observabilă analizând evoluţia fenomenului pe termen lung, şi se manifestă sub
forma unor oscilaţii cu perioadă şi amplitudine ce variază de regulă în timp, un ciclu
acoperind câţiva ani de zile
aceste oscilații sunt asociate cu ciclurile de afaceri bine cunoscute
durata ciclului depinde de tipul de afacere sau industrie analizată (de la cinci la
doisprezece ani sau mai mult)
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
https://www.slideshare.net/henrjt/the-business-
cycle-299518
3. Componenta sezonieră S
se evidenţiază sub forma unor cicluri de durată mai mică sau egală cu un an, şi apare
în principal datorită ritmului impus de schimbarea anotimpurilor dar şi de activităţi
economice respectiv sociale.
Se notează și se înregistrează prin modificări restrânse în sus și în jos în jurul
componentei de tendință sau a componentei ciclice, cu modificări care se repetă în
mod previzibil pe perioade de sub un an
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Source Box, G. E. P., Jenkins, G. M. and Reinsel, G. C. (1976) Time Series Analysis, Forecasting and
Control. Third Edition. Holden-Day. Series G.
4. Componenta reziduu sau eroare t
se manifestă prin fluctuaţii aparent aleatoare în jurul componentelor deterministe, fiind
efectul acţiunii unor factori cu acţiune punctuală în timp
această componentă este imprevizibilă
schimbări bruște care apar într-o serie de timp care este puțin probabil să se repete;
astfel de mișcări sunt privite ca evenimente întâmplătoare complet imprevizibile și
probabil nerecuperabile, cum ar fi greve, incendii, inundații, dezastre naturale,
războaie etc.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
este o componentă a unei serii de timp care nu poate fi explicată prin componente de
tendință, ciclice sau sezoniere
Modele de descompunere a seriilor de timp
Modelul aditiv Yt = Tt + Ct + St + t
Modelul multiplicativ Yt = Tt Ct St t
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
unde X = t ²
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
1 T = a + bX
Hiperbolă: Tt = a + b
t 1
Unde X =
t
Exponenţială: Tt = a b t Z = A + Bt unde Zt = ln Tt ; A = ln a; B = ln b
Putere: Tt = a t b Z = A + bX
Unde Z t = ln Tt ; A = ln a; X = ln t
Logaritmică: Tt = a + b ln t T = a + bX
unde X = ln t
a
Curba logistică : Tt = , a, c 0
1 + e b −ct
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Parabola
Funcții elementare
Hiperbola
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Exponentială
Funcții elementare
Funcția putere
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Functia logaritmică
Funcții elementare
Curba logistică
Exemplu
Fie seria cronologică privind Luna Număr turiști
numărul de turiști cazați într-o cazați
pensiune nou deschisă. Să se Ianuarie 50
modeleze tendința centrală a seriei Februarie 47
de timp folosind funcțiile
Martie 45
elementare.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Aprilie 55
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Mai 61
Iunie 68
Iulie 70
August 80
Septembrie 85
Octombrie 90
Noiembrie 89
Decembrie 95
Mediile mobile
Ipoteza 1: Seria prezintă doar tendință și componentă aleatoare
Ipoteza 2: Modelul de descompunere este unul aditiv
Yt = Tt + t
MM = i
i
L cu
i = − m1
i =1
i = − m1
Observații:
1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m
=1
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
i
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
i =− m
1
2. Raportul de reducere a varianței erorii este: 2m + 1
Se conservă tendința
Proprietăți:
Mediile aritmetice de ordin p impar și mediile mobile centrate pentru p
par lasă nedeviată tendința, functia liniara
Fiecărei valori observate Yt îi corespunde o valoare netezită Y t calculată
ca o medie aritmetică a valorilor adiacente
Seria valorilor inițiale are mai puțin cu p-1 termeni, respectiv p termeni
decât seria inițială
Estimarea componentei sezoniere
se realizează prin intermediul coeficienţilor sezonalităţii, modele de regresie multiplă
prin introducerea unor variabile alternative sau prin intermediul funcțiilor
trigonometrice.
Notaţii:
i indice pentru ciclu sezonier de la 1 la n;
j indice pentru sezon de la 1 la p.
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
Ipoteză:
Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
Se calculează rapoartele: Sij = Yij / Y ij
Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij = Sij ;
n − 1 i =1
j = 1, 2,..., p
p
S
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
i
i =1
1 p
j = 1, 2,..., p
S j = I j / I i
p i =1
1 p
S j = C j − Ci
p i =1
Valorile rezultate se numesc coeficienți ai sezonalităţii şi constituie componenta
sezonieră
Exemplu:
Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74
Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:
90
80
70
60
50
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06
I 2004 32 - - 48 1
II 2004 48 - - 52 2
III 2004 64 51,5 12,5 50 3
IV 2004 58 53 5 52 4
I 2005 40 54,75 -14,75 56 5
II 2005 52 57 -5 56 6
III 2005 74 58,5 15,5 60 7
IV 2005 66 60 6 60 8
I 2006 44 62 -18 60 9
II 2006 60 64 -4 64 10
III 2006 82 - - 68 11
IV 2006 74 - - 68 12
Exemplu:
Mediile mobile vor fi:
32 40
+ 48 + 64 + 58 +
MM1 = 2 2 = 51,5 = Y 13 bilete
4
48 52
+ 64 + 58 + 40 +
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
MM 2 = 2 2 = 53 = Y 14 bilete
4
…
66 74
+ 44 + 60 + 82 +
MM 8 = 2 2 = 64 = Y 32 bilete
4
Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:
b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:
Trim. Yij- Y ij
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
Anii Suma
Academia de Studii Economice, Departamentul de Statistica si Econometrie, 2021
I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
Determinarea trendului seriei desezonalizate:
~ˆ
Yij = 46 + 1,8112 t unde t momentul de timp la care se realizează previziunea
Date contact: www.cristinaboboc.wordpress.com, e-mail: cristina.boboc@csie.ase.ro
~ˆ
Yˆij = Yij + S j
Serii de timp
Yt = f (Tt , Ct , St , t )
Modele de descompunere a seriilor de timp
Modelul aditiv Yt = Tt + Ct + St + t
Modelul multiplicativ Yt = Tt Ct St t
Parabola Hiperbola
Funcții elementare
Exponentială Funcția putere
Funcții elementare
MM = i
i
L cu
i = − m1
i =1
i = − m1
Observații:
1. Media mobilă lasă invariantă o constantă, condiţie echivalentă cu
m
=1
i =− m
i
1
2. Raportul de reducere a varianței erorii este: 2m + 1
Ipoteză:
Seria prezintă componentă pe termen lung tendință-ciclu dar nu se emite nici o
ipoteză privind forma acestora
Se folosește metoda raportării la mediile mobile
1. Model multiplicativ
1. Se calculează mediile mobile de ordin p egal cu perioada componentei sezoniere (Y t)
Se calculează rapoartele: Sij = Yij / Y ij
Se determină un indice mediu pentru fiecare sezon:
1 n −1
Ij = Sij ;
n − 1 i =1
j = 1, 2,..., p
p
Se determină componenta sezonieră astfel incat S
i =1
i =1
1 p
j = 1, 2,..., p
S j = I j / I i
p i =1
Numărul biletelor de odihnă într-o staţiune montană, vândute de o agenţie de voiaj, a cunoscut în perioada
2004-2006 următoarea evoluţie:
Tabelul 1
Anul Numar de bilete vandute in trimestrul:
I II III IV
2004 32 48 64 58
2005 40 52 74 66
2006 44 60 82 74
Se cere:
a) Să se reprezinte grafic seria cronologică prezentată
b) Să se determine abaterile sezoniere şi coeficienţii sezonieri.
c) Să se previzioneze vanzarile trimestriale de bilete pentru anul 2007.
Exemplu:
90
80
70
60
50
40
30
20
10
0
Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV Tr. I Tr. II Tr. III Tr. IV
‘04 ‘04 ‘04 ‘04 ‘05 ‘05 ‘05 ‘05 06 06 06 06
Reprezentarea grafică a trendului exprimat prin mediile mobile este redată în graficul anterior.
Exemplu:
b) Pentru determinarea abaterilor sezoniere Cj, diferentele Yij- Y ij se vor sistematiza astfel:
Trim. Yij- Y ij
Anii Suma
I II III IV
2004 - - 12,5 5
2005 -14,75 -5 15,5 6
2006 -18 -4 - -
Devieri sez. brute (Cj) -16,375 -4,5 14 5,5 -1,375
Devieri sez. corectate -16 -4 14 6 0
(Sj)
Exemplu:
Determinarea trendului seriei desezonalizate:
~ˆ
Yij = 46 + 1,8112 t unde t momentul de timp la care se realizează previziunea
flexibilităţii modelelor;
1 1
( )
k −1
Var(rˆk ) = 1 + 2 rˆi 2 = 1 + 2 rˆ12 + + rˆk2−1 . Var ( ˆ k ) = 1 / T pentru T mare
T i =1 T
Regula de decizie:
Fie un nivel de semnificaţie
t calc − t tab , t tab se accepta H0
Procese staţionare
Definiţie: Un caz particular de proces staţionar este procesul Zgomot
Alb (White Noise) care este un proces ce descrie o variabilă aleatoare
cu media zero şi varianţa constantă, dar fără o structură anume.
Dacă t este un şir de variabile aleatoare necorelate (independente), fiecare cu
media zero şi varianţa constantă finită, atunci t este staţionar, fiind satisfăcute
condiţiile de staţionaritate, adică:
E ( t ) = 0
Var( t ) = 2
cov( t , s ) = 0 , t s
Observaţie: Pentru un proces zgomot alb:
2 , k =0
funcţia de autocovarianţă este: k =
0 , k 0
1, k =0
funcţia de autocorelaţie este: k =
0 , k 0
Notaţie: t ~ WN (0, 2 )
Proces stochastic nestaţionar
Definitie: O serie de timp yt este mers la întâmplare (Random Walk)
dacă:
yt = yt −1 + t
unde y 0 este unnumăr real care indică valoarea de start a procesului şi t
este zgomot alb.
Observatii:
1. Dacă t are o distribuţie simetrică în jurul lui zero, atunci yt , condiţionat de
y t −1 , are şanse 50-50%, să crească sau să scadă, adică yt creşte sau scade la
întâmplare.
2. Modelul mers la întâmplare este un model de tip AR(1) cu = 1 şi este o serie
nestaţionară cu o rădăcină unitară.
3. Procesul Random Walk este o serie staţionară în prima diferenţă deoarece
prima diferenţă a procesului yt − yt −1 = t este un proces staţionar. Este o
serie I(1), adică integrată de ordinul 1.
Estimarea coeficienţilor de autocorelaţie
În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionalităţii, media
şi varianţa 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
1 T
Y = Yt
T t =1
1 T
s = (Yt − Y ) 2
2
T t =1
t
rˆk = t = k +1
sau prin:
(Y −Y ) /T
T
2
t
t =1
(Y − Y )(Yt − k − Y )
T
t
dacă T este suficient de mare pentru
rˆk = t = k +1
(Y −Y )
T
2 ca T/T-k să poată fi aproximat cu 1
t
t =1
Interpretarea corelogramei
a) Serie aleatoare. O serie complet aleatoare are coeficienţii de autocorelaţie
k 0 pentru orice k 0 şi pentru valori mari ale lui n. Pentru o serie aleatoare
se demonstrează că k ~ N (0,1 / n) şi atunci ne aşteptăm ca o singură valoare a lui
k să fie semnificativă.
b) Serie ce prezintă corelaţie pe termen scurt. O astfel de serie are o valoare
mare a lui 1 , după care urmează 2 sau 3 coeficienţi diferiţi de zero dar
valorile lor sunt din ce în ce mai mici. Pentru valori mari ale lui k avem valori
ale lui k apropiate de 0.
c) Serie alternantă. Dacă valorile seriei alternează de o parte şi de alta a mediei,
atunci şi coeficienţii de autocorelaţie vor alterna. Coeficientul 1 va fi negativ.
Dacă valoarea observată la lag-ul 2 tinde să fie de aceeaşi parte a mediei,
atunci 2 va fi pozitiv.
d) Serie nestaţionară. Dacă o serie conţine trend, o observaţie de o anumită
parte a mediei tinde să fie urmată de un număr mare de observaţii de aceeaşi
parte a mediei. În acest caz, valorile lui k vor tinde la zero doar pentru valori
foarte mari ale lui k. De aceea trendul trebuie eliminat înainte de calcularea
coeficienţilor k . Cu alte cuvinte, coeficienţii k trebuie calculaţi numai
pentru seriile staţionare.
Serii de timp
Regula de decizie:
Fie un nivel de semnificaţie
t calc − t tab , t tab se accepta H0
Estimarea coeficienţilor de autocorelaţie
În practică dispunem de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare). În ipoteza staţionarităţii,
media şi varianţa 2 procesului pot fi estimate utilizând această singură
realizare, prin media respectiv varianţa de eşantionare:
1 T
Y = Yt
T t =1
1 T
s = (Yt − Y ) 2
2
T t =1
t
rˆk = t = k +1
sau prin:
(Y −Y ) /T
T
2
t
t =1
(Y − Y )(Yt − k − Y )
T
(Y −Y )
T
2 ca T/T-k să poată fi aproximat cu 1
t
t =1
Exemplu
Se consideră 2 variabile economice cu date pe 25 perioade.
vt 1 4 2 2 5 5 3 3 1 4 4 3 3 5 4 4 4 1 3 3 3 3 1 2 2
zt 1 1 2 1 2 2 2 3 3 3 3 3 4 4 5 5 5 5 6 5 6 6 7 8 8
Bartlett a arătat că, dacă o serie de timp este pur aleatoare, coeficienţii de autocorelaţie de selecţie sunt
aproximativ normal distribuiţi, cu media 0 şi varianţa 1/n , unde n este volumul selecţiei.
Putem determina un interval de încredere 95% în care se află k .
k (−1,96 * se( ˆ k );1,96 * se( ˆ k )) k (−1,96 *1 / n ; 1,96 *1 / n )
n=25, varianţa lui este 1/25, iar eroarea standard este 1/5.
Conform proprietăţilor distribuţiei normale standard, intervalul de încredere 95% pentru orice k va fi
(-0.392,0.392) .
Pentru seria vt: toţi rk sunt în interiorul intervalului. Seria de timp este pur aleatoare
Pentru seria zt: toţi rk sunt în afara intervalului deci seria este nestaționară.
Modele ARMA(p,q)
Definiție: Un proces autoregresiv (AR) este un proces unde valoarea
curentă a lui y este influenţată de propriile valori din trecut şi de o
perturbaţie t:
yt = f ( yt −1 , yt − 2 , ) + t
yt = a0 + a1 yt −1 + a2 yt − 2 + + a p yt − p
yt = f ( t −1 , t − 2 , ) + t
unde p este ordinul părţii autoregresive, q ordinul mediei mobile iar t este
un proces de tip zgomot alb (acesta fiind o succesiune de variabile
aleatoare independente şi identic repartizate, cu medie zero).
Funcția parțială de autocorelație (PAC)
Observație: Coeficientul de autocorelaţie parţială măsoară efectul direct al
lui yt-k asupra variabilei yt (se izolează influenţa variabilei yt-k). Definiția
acestuia este similară cu a coeficientului de corelaţie parţială din
econometrie.
Definiție: Coeficientul de autocorelaţie parțială între două variabile
separate de k unităţi de timp notat prin kk este coeficientul de regresie al
variabilei yt-k în modelul autoregresiv AR(k):
yt = k1 yt −1 + k 2 yt − 2 + + kk yt − k + t
Știind că:
r ( x, y ) − r ( x , z ) r ( y , z )
r ( x, y | z ) = 22 = ( 2 − 12 ) /(1 − 12 )
1 − r ( x, z ) 1 − r ( y , z )
2 2
yt = k1 yt −1 + k 2 yt −2 + + kk yt −k + t
Estimarea funcției parțiale de autocorelație
Observaţie: În practică (inclusiv în softurile de statistică) coeficienţii de
autocorelaţie parţială nu se determină prin modele de regresie ci se
folosesc ecuaţiile Yule-Walker, ce redau relaţiile dintre coeficienţii de
autocorelaţie şi coeficienţii de autocorelaţie parţială.
Ecuaţiile Yule-Walker exprimă coeficienţii de autocorelaţie k sub forma
unor funcţii de coeficienţii autoregresivi i. Definim matricea coeficienţilor
liniari de autocorelaţie prin R(p), vectorul parametrilor modelului prin şi
vectorul coeficienţilor de autocorelaţie prin .
0 1 p
R( p) = R( p) =
1 0 1 p −1
2 1 1
p p −1 0
k0. Dacă valoarea coeficientului de autocorelaţie cade în afara acestui interval, pentru
o valoare dată a lui k, atunci ipoteza H0 este respinsă și se acceptă H1.
k =1
Regula de decizie: QLB crt
2
se accepta H 0
QLB crt
2
se respinge H 0
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
Dacă în modelul de regresie
yt = yt −1 + + t
găsim =1 , spunem că variabila are o rădăcină unitară.
yt = ( − 1) yt −1 + t = yt −1 + t
Ipoteza de rădăcină unitară (Unit Root)
H0: seria are rădăcină unitară şi este nestaţionară ( =1 sau =0)
H1: seria este staţionară ( 1 sau 0)
Testul Dickey-Fuller (Unit Root Test)
Dacă =1 sau =0 atunci seria nu este staţionară.
Dacă 1 atunci seria este explozivă (tot nestaţionară; de regulă astfel de comportament nu este
regăsit în economie)
Dacă 1 sau 0 atunci seria este staţionară.
Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare
H 0 : yt = yt −1 + t
H 1 : yt = yt −1 + + t , 1 yt − yt −1 = ( − 1) yt −1 + + t yt = yt −1 + + t
Test pentru un proces de mers la întâmplare, contra unui proces AR(1), staţionar, cu
deplasare şi trend în timp.
H 0 : yt = yt −1 + t
H 1 : yt = yt −1 + + t + t , 1
yt − yt −1 = ( − 1) yt −1 + + t + t yt = yt −1 + + t + t
Testul de staționaritate (pentru o rădăcină unitară).
Testul Dickey-Fuller (Unit Root Test)
(−1,96(0,1066),+1,96(0,1066))
yt = yt −1 + t
Dacă = 0, spunem că variabila are o rădăcină
unitară.
p
yt = yt −1 + + t + i yt −i + t
i =1
Detectarea nestaţionarităţii:
din cronogramă şi corelogramă: autocorelaţiile unei serii staţionare se apropie
rapid de zero, odată ce k creşte (tind exponenţial spre zero). Pentru o serie
nestaţionară autocorelaţiile sunt mari şi pozitive pentru un număr mare de valori
ale lui k.
utilizarea unor teste de staţionaritate (numite şi teste de rădăcină unitate)
Serie nestaționară de tip TS (Trend Stationarity)
Definiție: O serie nestaţionară este de tip TS dacă trendul este de
tip determinist şi se elimină prin scădere sau prin împărţire
y t = + t + t t = 1,2,..., n; t este zgomot alb
Proprietăți:
Media unei serii TS nu este constantă: E ( yt ) = E ( + t + t ) = + t
Observații:
Efectul produs de un șoc aleator este tranzitoriu, deci nu se acumulează în timp
Diferențele de ordin 1 și 2:
yt = yt − yt −1
2 yt = ( yt − yt −1 ) = yt − yt −1 = ( yt − yt −1 ) − ( yt −1 − yt − 2 ) = yt − 2 yt −1 + yt − 2
(L )Yt = (L) t
(L ) = 1 − a1 L − a2 L2 − − a p Lp
( L) = 1 − b1 L − − bq Lq
ARIMA(p,d,q): (L )(1 − L) X t = (L ) t
d
Serii integrate
Definiție:
Spunem că seria yt este integrată de ordinul 1, sau conţine o rădăcină egală cu 1,
dacă este nestaţionară dar seria diferenţelor este staţionară. O astfel de serie se
notează prin yt I(1).
Spunem că seria yt este integrată de ordinul 2 dacă ea conţine două rădăcini egale cu
1 şi astfel, este necesară diferenţierea de două ori pentru a induce staţionaritatea. Se
notează prin yt I(2).
Spunem că seria yt este integrată de ordinul d dacă ea conţine d rădăcini egale cu 1
şi astfel, este necesară diferenţierea de d ori pentru a induce staţionaritatea. Se
notează prin yt I(D).
Observație:
Ordinul de integrare al unei serii este egal cu numărul care arată de câte ori trebuie
diferenţiată seria pentru a deveni staţionară şi este egal cu numărul de rădăcini egale cu 1.
Majoritatea seriilor de date economice conţin o singură rădăcină egală cu 1.
Cele mai multe serii cronologice macroeconomice au tendinţă şi, în mod specific, ele
conţin trenduri stochastice.
1. Analiza graficului unei serii de timp
Graficele seriilor arată
că seriile au o tendinţă
crescătoare, deşi
trendul nu este neted.
Se observă că media,
varianţa şi
autocovarianţele
fiecărei serii nu par a fi
invariante în raport cu
timpul. Aceste serii sunt
serii de timp
nestaţionare.
(−1,96(0,1066),+1,96(0,1066))
yt = yt −1 + t
Dacă = 0, spunem că variabila are o rădăcină
unitară.
p
yt = yt −1 + + t + i yt −i + t
i =1
(L )Yt = (L) t
(L ) = 1 − a1 L − a2 L2 − − a p Lp
( L) = 1 − b1 L − − bq Lq
ARIMA(p,d,q): (L )(1 − L) d X t = (L ) t
Definiții, Notații
Un proces autoregresiv
AR (p): yt = a0 + a1 yt −1 + a2 yt − 2 + + a p yt − p
j =0
2
j
j j +k
0 =1
k = k = j =0 2 , k 0
0 1+ j
j =1
Modele de medie mobilă – MA(1), ARIMA(0,0,1)
Modelul medie mobilă de ordinul 1 cu media zero:
Yt = t − b1 t −1 t ~ WN (0, 2 )
Varianța procesului: ( )
Var (Yt ) = E Yt − E (Yt ) = E (Yt 2 ) = E( t − b1 t −1 )( t − b t −1 ) =
2 2
( ) ( ) (
= E t2 + E(− b1 t −1 t ) − E(− b1 t −1 t ) + E b12 t2−1 = 2 1 + b12 )
Covarianța procesului: Cov(Yt , Yt −k ) = E ( t − b1 t −1 )( t −k − b1 t −k −1 ) =
=
( )
E ( t − b1 t −1 )( t −1 − b1 t −2 ) = −b1 E t2−1 = −b1 2 pentru k = 1
0 pentru k 1
0, k2
Funcția de autocorelație:
rk = b1
−
1+ b2 , k =1
1
MA(1): Xt= t + 0,8 t-1
Modele de medie mobilă – MA(q), ARIMA(0,0,q)
Modelul medie mobilă de ordinul q cu media zero:
Yt = t − b1 t −1 − b2 t −2 − − bq t −q t ~ WN (0, 2 )
Proprietate: Un model MA(q) este staționar iar funcția sa de autocorelație se anulează pentru
kq+1.
- b k + b1 b k +1 + ... + b q-k b q
pentru k = 1, 2,..., q
Funcția de autocorelație: rk = 1 + b12 + b22 + ... + bq2
0 pentru k q + 1
Observație: Dacă procesul are medie nenulă atunci modelul include şi un termen liber, acesta fiind egal
cu media: Yt = m + t − b1 t −1 − − bq t −q
Modele MA
yt = t + 0,9 * t −1 yt = t − 0,9 * t −1
yt = t − 0,5 t −1 + 0,25 t −2
Modelul autoregresiv – AR(1), ARIMA(1,0,0)
Var (Yt ) = 0 = 2
Varianța procesului: 1
1 − a12
Funcția de autocorelație: k
rk = = a1k
0
Observații:
a1 = 1 regăsim varianţa unui proces nestaţionar de tip mers aleator
a1 > 0 funcţia de autocorelaţie rk descreşte exponenţial
a1 < 0 descreşte sinusoidal (dinţi de ferăstrău, valorile negative alternează cu cele pozitive)
1 − a12 − a22
1 2
(1 − a1 L)Yt = (1 − b1 ) t
c1 = r1
Autocorelațiile parțiale ale unui proces ARMA(1,1): r2 − r12
c2 =
1 − r12
ck 0 pentru k 3
ARMA(1,1): Xt=0,8Xt-1+t+0,9 t-1
Serii de timp
ARMA (p,q) descreşte exponenţial sau sinusoidal începând cu descreşte exponenţial sau sinusoidal începând cu
k=q-p k=q-p
Metodologia Box Jenkins
În practică vom căuta:
cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie parţială ck nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru p ordinul modelului autoregresiv AR(p); AR(p) este adecvat
variabilelor dependente exclusiv de trecutul lor, cu pronunţat caracter inerţial (exemplu:
consumul de bunuri de strictă necesitate unde se creează obişnuinţă).
cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie rk nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : nu se respinge). Obţinem astfel
valoarea plauzibilă pentru q, ordinul modelului medie mobila MA(q). MA(q) e adecvat
variabilelor „sensibile” la modificări ale variabilelor exogene, determinând abateri accidentale
de la evoluţia medie.
În principiu nu este dificil să distingem între un model AR(p) şi un model MA(q), în schimb
determinarea ordinelor p, q pentru un model mixt este un proces relativ incert. Există şi
posibilitatea selectării modelului ce minimizeaza diferite criterii construite utilizând funcţia de
verosimilitate (ex: criteriul Akaike AIC, criteriul Schwarz SC).
Estimarea parametrilor modelului
Forma restrânsă a unui model
ARMA(p,q): (L )Yt = (L ) t
ARIMA(p,d,q): (L)(1 − L) d X t = (L) t
Metoda clasică a celor mai mici pătrate de minimizare a sumei pătratelor erorilor
conduce la estimatori ai parametrilor a1, a2,…, ap regăsind ecuațiile Yule-Walker
(relațiile între coeficienții modelului și coeficienții de autocorelație).
Estimatorii obținuți nu sunt eficienți deoarece există colinearitate între variabilele
explicative din model.
De aceea se utilizează metoda verosimilității maxime.
Maximizarea acesteia conduce la valori pentru coeficienţii ai, bi ce asigură cea mai
mare probabilitate de apariţie a observaţiilor Y1, …, YT.
Acești estimatori sunt consistenți, asimtotic eficienți și normal distribuiți.
Testarea validității modelului
Pentru a vedea dacă modelul estimat surprinde adecvat modul de generare a
datelor (caracterul inerţial respectiv cel de asimilare a şocurilor) este utilă în
prealabil o analiza comparativă a funcţiei de autocorelaţie r̂k respectiv de
autocorelaţie parţială ĉk estimate, pentru seria iniţială Yt respectiv pentru seria
generată de model Yˆt .
O asemănare între corelogramele acestora indică faptul că modelul surprinde
adecvat mecanismul de generare a datelor.
De asemenea se pot analiza rădăcinile unitate ale polinoamelor autoregresive
respectiv medie mobilă.
H 0 : ai = 0
H 1 : ai 0
Statistica:
N(0,1)
ai
t=
Var (ai )
Regula de decizie: Pentru un nivel de semnificaţie , dacă atunci ipoteza
nulă H0 nu se respinge. Prin urmare variabila corespunzătoare se elimină
t calc din
− ttabmodel,
,+t tab şi se
respecifică respectiv re-estimează modelul.
Observație: Ca teste asupra coeficienţilor se pot utiliza şi alte teste precum testul Wald, sau
teste de tip LM (Multiplicatorul lui Lagrange) pentru omisiunea unor variabile, teste de
stabilitate a coeficienţilor.
Teste privind reziduurile
Dacă modelul este bine specificat, atunci reziduurile din modelul estimat
sunt generate de un proces de tip zgomot alb (succesiune de variabile
aleatoare independente, identic repartizate), cu medie zero şi normal
distribuit.
Autocorelarea reziduurilor. Pentru detectarea unor dependenţe în seria
reziduurilor se examinează funcţia de autocorelaţie şi de autocorelaţie
r̂k
parţială a reziduurilor.ĉkDacă reziduurile sunt necorelate, atunci aceşti
coeficienţi nu trebuie să fie semnificativ diferiţi de zero.
Statistica: rˆk
N(0,1) unde
Var(rˆk ) =
t= 1
Vˆar(rˆk ) T
Regula de decizie: Pentru un nivel de semnificaţie , dacă
rˆk − ttab /
atunci ipoteza nulă H0 nu se respinge, deci reziduurile sunt necorelate. T , ttab / T
Observații:
1. Același test se aplică și pentru coeficienții parțiali de autocorelație.
2. Se mai aplică și testul Ljung Box studiat în cursurile precedente
Investigarea normalității reziduurilor
Testul Jarque&Bera:
Se bazează pe coeficienții de boltire și de asimetrie
Dacă un eşantion de T observaţii provine dintr-o distribuţie normală atunci coeficientul de
asimetrie calculat în baza observaţiilor urmează asimptotic legea normală N(0, 6/T) iar
coeficientul boltirii legea N(3,24/T).
Jarque şi Bera obţin prin însumarea celor două variabile normale independente statistica:
1 1
JB = Tˆ 32 + T (ˆ 4 − 3) 2 2 (2)
6 24
Regiunea critică:
P( JB 2 , 2 ) =
Investigarea heteroscedasticităţii
reziduurilor
Testul multiplicatorilor lui Lagrange pentru heteroscedasticitate de tip
ARCH(p) presupune:
estimarea reziduurilor et = ˆt din ecuaţia ce defineşte modelul;
estimarea regresiei auxiliare (ce fundamentează testul):
et2 = 0 + 1et2−1 + ... + p et2− p
Procedura:
Se determină P și Q maximele ordinelor modelelor AR respectiv MA
p și q se determină astfel încât să obțin minimul criteriilor descrise
Realizarea previziunilor
Modelul ARIMA estimat şi validat poate fi utilizat pentru generarea de previziuni:
previziuni punctuale
intervale de previziune.
Previziuni punctuale
Pentru un orizont de previziune h, ataşăm momentului T+h, unde T este originea efectuării
previziunii, variabila aleatoare YT + h .
YT +h = E(YT +h | YT , YT −1 ,..., Y1 )
YˆT + h = aˆ 0 + aˆ1YT + h−1 + aˆ 2YT + h −2 + + aˆ pYT + h− p − bˆ1 T + h−1 − bˆ2 T + h −2 − − bˆq T + h−q + T + h
Previziunile se obţin în baza informaţiilor disponibile până la momentul T, pas cu pas:
termenii autoregresivi YT + h −i pentru h-i>0 (adică YT +1 , YT + 2 ... se substituie cu previziunile obţinute la
paşii anteriori;
termenii autoregresivi YT + h −i pentru h-i<0 se înlocuiesc cu valorile înregistrate, aici fiind cunoscuţi
termenii seriei (YT-1, YT-2, ...);
termenii eroare T + h −i pentru h-i>0 (adică T+1, T+2,…) se înlocuiesc cu zero (deoarece înlocuindu-i
cu media lor și erorile fiind de tip zgomot alb, media lor este 0)
termenii eroare T + h −i pentru h-i<0 (adică T-1, T-2,… ) se înlocuiesc cu reziduurile estimate din
model (spre exemplu = Y − Yˆ , pentru t<T).
t t t
Determinarea intervalului de previziune
Eroarea de previziune:
eT + h = YT + h
( )
− YT + h N 0, V (eT + h )
YT + h − YT + h
V (eT + h )
N (0,1)
Yt = t + c1 t −1 + c 2 t −2 + ... Yt = C (L ) t
( L)C (L ) = ( L)
(L )
Yt = t
(L )
h −1
eT +h = YT +h − YT +h = t + c1 t −1 + c2 t −2 + ... − (ch T + ch+1 T −1 + ...) V (eT + h ) = 2 1 + c 2j
j =1
Exemplu
Fie seria temporală a PIB-ului SUA,
miliarde de dolari SUA, date
trimestriale ajustate sezonier din
1947 până în 2007, exemplu furnizat
în Gujarati, D., Porter, D., Basic
Econometrics, ediția a V-a, McGraw-
Hill, 2009, pp 778-784
Verificarea stationarității seriei
Este seria diferențiată stationară?
Corelograma seriei diferențiate
p
0 1 2
q
0 ARMA(0,0) ARMA(0,1), deci MA(1) ARMA(0,2), deci MA(2)
1 ARMA(1,0), deci AR(1) ARMA(1,1) ARMA(1,2)
ARMA(0, 0)
ARMA(1,0)
ARMA(0,1)
ARMA(0,2)
ARMA(1,1)
ARMA(1,2)
Compararea modelelor
Modele identificate
ma(2) yes No
Rezidualurile sunt White
yes no yes yes Yes
Noise?