Sunteți pe pagina 1din 182

ANALIZA SERIILOR DE TIMP

Curs predat la specializarea Statistica și Previziune Economică anul III

2021-2023
2 Bibliografie

1. Montgomery D.C., Jennings C. L. & Kulahici M., Introduction to Time series Analysis
and Forecasting. John Wiley &Sons, 2008
2. Ben Vogelvang, Econometrics. Theory and Applications with Eviews, Pearson
Educational Limited, 2005
3. Guy Melard, Methodes de Prevision a court Term, Ed. Universitee de Bruxelles, 1990
4. Diebold X. F., Elements of forecasting,2nd edition, Ed. South- Western, Cincinati,
2001
5. Turturean Ciprian-Ionel, Introducere in analiza seriilor de timp cu SPSS-Ghid
aplicativ, Ed. Universitatii “Al. I. Cuza” Iasi, 2008
6. Turturean Ciprian-Ionel, Analiza seriilor de timp, Ed. Sedcom Libris, Iasi, 2006

Softaware-uri utilizate: EViews si SPSS

C01-C02
3 Structura C01-C02-> ANALIZA SERIILOR DE TIMP
 C01-C02: Noțiuni, concepte definiții elementare în analiza seriilor de timp
 C03-C06: Modelarea, ajustarea și prognoza seriilor de timp formate din trend determinist și
componentă aleatoare. Identificare si testarea punctelor de ruptura si modelarea acestora
cu ajutorul modelelor cu variabile dummy. Valori atipice/ Outlieri pentru seriile de timp.
Metode de ajustare exponentiala
 C07-C09: Modelarea, ajustarea și prognoza seriilor de timp formate din trend determinist,
componentă sezonieră și componentă aleatoare. Metode de ajustare exponentiala.
Identificarea, testarea si imputarea valorilor lipsa si a punctelor de extrem in seriile de timp.
 EVP: din materia cursurilor C01-C09-> 20% din NF
 C10-C11: Modelarea și prognoza seriilor de timp nestaționare în medie (omogene) fără
componentă sezonieră. Modelele AR, MA, ARMA
 C12-13: Procese stohastice omogene cu trend stohastic – procese cu radacina unitate.
Modelarea și prognoza seriilor de timp cu trend stohastic. Modelele: ARIMA
 C14: Procese stohastice omogene cu trend si sezonalitate stohastica: SARIMA
 PROIECT: activitate de semniar desfasurata pe echipe de cate 3 studenti->40% din NF
 EXAMEN FINAL din materia cursurilor C10-C14-> 40% din NF
C01-C02
TEMATICA C01-C02:
4 Notiuni, concepte si definitii elementare în analiza seriilor de timp
 Definitia Seriilor de timp
 Prezentarea generala a unei serii de timp cu componentă deterministă,
componentă stohastică, componentă aleatoare
 Componentele unei serii de timp: componenta ciclu, componenta
sezonieră, componenta trend si componenta aleatoare
 Ipoteze cu privire la componenta aleatoare
 Seriile de timp realizări ale proceselor stohastice. Tipuri de stationaritate
in procesele stohastice – generalități
 Transformarea Box-Cox

C01-C02
5 Definiția seriilor de timp

Seria de timp/ cronologica – reprezinta o serie de inregsitrari ale unui


fenomen, exprimate cantitativ*, in succesiunea lor in timp.

Valorile unei serii de timp reprezintă rezultate ale măsurarii*


fenomenului observat ordonate in ordinea producerii lor lor in timp.

C01-C02
Prezentarea generala a unei serii de timp cu componentă
6 deterministă, componentă stohastică, componentă
aleatoare
Notam cu yt, valoarea variabilei Y la momentul t, cu t=1,T.
yt=f(t)+εt
pentru o serie care prezinta doar un trend determinist si componenta aleatoare
sau in forma sa cea mai complexa
yt=f(xi,t-h, yt-h, εt, t), cu t=1,T si h=0,T-1, i=1,k
pentru o serie care prezinta atat trend determinist cat si trend stohastic
Unde: t- reprezinta perioada de timp pentru care a fost facuta inregistrarea
h- reprezinta intarzierea, denumita lag
i – reprezinta un numar de ordine care face distinctie intre regresorii
modelului
T – reprezinta numarul maxim de perioade pentru care detinem inregistrari
ale pentru variabilele modelului.
C01-C02
7

Presupunand ca inregistram valorile variabilei Y si momentul t este


moment de referinta, atunci valoarea yt este valoarea variabilei Y la
momentul de referinta, valoarea yt-1 este valoarea variabilei Y la momentul
anterior, decalaj -1 (eng. Lag/ Backshift de ord. 1) iar valoarea yt+1 este
valoarea variabilei Y la momentul ulterior/ viitor, decalaj +1 (eng. Lead de
ord. 1).

STOP->S_01

C01-C02
Componentele unei serii de timp: componenta ciclu,
8 componenta sezonieră, componenta trend si
componenta aleatoare
O serie de timp poate fi compusa din patru componente distincte.
In functie de modul lor de manifestare si de proprietatile lor
acestea se impart in:
- Componenta ciclu (Ct)
- Componenta trend (Tt)
- Componenta sezoniera (St)
- Componenta aleatoare (At)
OBS: Componenta aleatoare (At) este frecvent identificata cu
eroarea de modelare (εt) ceea ce din punct de vedere logic nu
este intotdeauna corect!
C01-C02
9 Componenta ciclu (Ct)
 Componenta ciclu, dupa cum reiese si din denumire, este o componenta
care se manifesta ciclic in timp, insa, fata de componenta sezoniera, se
intinde pe durate de timp foarte lungi incepand de la 4 ani in cazul ciclului
electoral pana la zeci sau chiar sute de ani.
 Analiza componentei ciclice necesita instrumente si metode speciale de
analiza si modelare care nu fac obiectul prezentului curs.
 Datorita faptului ca cele mai multe dintre analize se fac pe seturi de date
care rareori depasesc 20 ani, componenta ciclu neavand timp sa parcurga
chiar si un singur ciclu, cei mai multi autori trateaza componenta trend si
componenta ciclu impreuna, ele fiind cunoscute sub denumirea de
componenta trend-ciclu sau componenta extra-sezonieră.
 Pentru estimarea parametrilor care caracterizeaza un ciclu este necesar ca
acesta sa parcurga cel putin 3-4 cicluri pentru a putea estima parametrii!!!
Prin urmare pentru cel mai mic ciclu, cel electoral, ar fi nevoie de date
C01-C02 inregistrate pe cel putin o perioada de 12-14 ani!!!
10
Despre ciclul economic
(Disertaţie cu ocazia decernării titlului de Doctor Honoris Causa al Universităţii Politehnice Bucureşti, M. Isarescu, 18 octombrie 2013,
http://www.bnr.ro/apage.aspx?pid=1332)

Definitie
Ciclului economic reprezinta fluctuaţiile la nivelul activităţii
economice de ansamblu, care se produc în mod recurent pe
parcursul mai multor luni sau ani
 În pofida denumirii, ciclul economic are un grad relativ scăzut de
predictibilitate în ceea ce priveşte frecvenţa şi magnitudinea
Evoluţia ciclică este o caracteristică inerentă economiei de piaţă

Fazele unui ciclu economic


Expansiunea->Maxim-> Recesiunea->Minim

C01-C02
11 Tipologia ciclurilor economice
(Disertaţie cu ocazia decernării titlului de Doctor Honoris Causa al Universităţii Politehnice Bucureşti, 18 octombrie 2013,
http://www.bnr.ro/apage.aspx?pid=1332)

 Literatura economică evidenţiază patru tipuri principale de cicluri


economice
Cicluri ale stocurilor (Kitchin), care au o durată de circa 40 de luni –
principala cauză o reprezintă necesitatea refacerii stocurilor
Cicluri ale investiţiilor în fonduri fixe (Juglar), cu o durată de circa 10
ani, determinate de evoluţiile marilor procese industriale
Cicluri ale investiţiilor în infrastructură (Kuznets), cu o durată de 15-
25 de ani, asociate unor procese demografice (mişcări migratorii)
care influenţează intensitatea activităţii în construcţii
Cicluri lungi (Kondratiev), care au o durată de circa 50 de ani
determinate de inovaţii tehnologice majore si care sunt compuse
dintr-o alternanţă de cicluri economice cu o durată mai mică
C01-C02
12 Exemple de cicluri economice

C01-C02
13 Componenta trend (Tt)

 Reprezinta evolutia generala, de durata, pe termen lung, a unei


serii de timp, sub influenta factorilor esentiali.
 Trendul se manifesta pe perioade lungi de timp si este
componenta cu perioada de manifestare cea mai indelungata
dintre cele patru componente.
 Trendul poate fi de natura determinsta, atunci cand poate fi
descris printr-o functie determinista de tipul Tt=f(t), sau de natura
stohastica, atunci cand are un caracter neregulat si nu poate fi
descris printr-o functie determinista.
 Trendul reprezinta componenta de baza a unei ST in jurul careia
se structureaza celelalte componente.
C01-C02
C01-C02
100
120

20
40
60
80

0
14
Jan-80
Mar-80
May-80
Jul-80
Sep-80
Nov-80
Jan-81
Mar-81
May-81
Jul-81
Sep-81
Nov-81
Jan-82
Mar-82
May-82
Jul-82
Sep-82
Nov-82
Jan-83
Mar-83
May-83
Jul-83
Sep-83
Nov-83
100
120

20
40
60
80

Jan-80
Mar-80
May-80
Jul-80
Exemple de componente trend (Tt)

Sep-80
Nov-80
Jan-81
Mar-81
May-81
Jul-81
Sep-81
Nov-81
Jan-82
Mar-82
May-82
Jul-82
Sep-82
Nov-82
Jan-83
Mar-83
May-83
Jul-83
Sep-83
Nov-83
15

Intr-o serie de timp care prezinta smultan trend determinist


si trend stochastic este recomandata modelarea si
eliminarea influentei trendului determinist si abia ulterior
modelarea trendului stochastic.

Argumente pentru aceasta recomandare vor fi aduse la sectiunea despre trendul


stochastic si modalitati de inlaturare a acestuia!

C01-C02
16 Componenta sezoniera (St)

 Reprezinta o oscilatie periodica a carui ciclu se poate intinde pe o


perioada de maxim un an.
 Componenta sezoniera se “infasoara” in jurul componentei trend-
ciclu.
 Oscilatiile componentei sezoniere au proprietatea de a se repeta cu
regularitate de la o perioada la alta.
 Componenta sezoniera poate fi estimata dupa ce a fost inlaturat
efectul componentei trend.
 La nivelul unui ciclu sezonier, influenta componentei sezoniere este
neutra.

C01-C02
17 Factori determinanti manifestarii sezonalitatii

 Sarbatori – sarbatori religioase, sarbatori nationale;


 Factori climaterici si meteorologici – alternanta anotimpurilor;
sezoane ploioase sau/si secetoase s.a.;
 Periodictatea calendaristică: structurarea calendarului pe
saptamani, luni, ani;
 Legislatia muncii: zile libere, concedii, ziua de munca: 8 ore/zi;
5 zile/ saptamana;
 Structura anului scolar
 Bioritmul
 Astronomici: fazele lunii, pozitia Pamantului pe orbita sa in jurul
Soarelui
C01-C02
18 Exemple de componente sezoniere (St)
+ *

C01-C02
19 Componenta aleatoare (At)

 Reprezinta efectul neregulat al factorilor aleatori asupra seriei de


timp.
 Componenta aleatoare, din punct de vedere metodologic este
asimilata erorii de modelare.
 Eroarea de modelare, la randul sau este tributara modelului utilizat
in modelare si depinde in mod direct de acesta. Datorita acestei
legaturi directe, eorarea de modelare are rolul de amprenta a
modelului. Cu cat modelul este mai bun cu atat eroarea de
modelare contine mai putine abateri de la ipotezele care o
vizeaza.

C01-C02
20 Ipoteze cu privire la componenta aleatoare - formulari

Componenta aleatoare, pe care în continuare o vom numi-o


componenta eroare și o vom nota-o cu εt, trebuie să satisfacă
simultan urmatoarele ipoteze:
1. ipoteza de normalitate: H0: εt~ N(µε, σε2)
2. Ipoteza de independență: H0: cov(εt-1, εt)=0
3. Ipoteza de homoscedasticitate: H0: σε2 – ct. in timp
4. Ipoteza de medie zero: H0: µε= 0
Nota: In functie de modul de compunere al seriei, ipoteza de medie zero
poate fi ipoteza de medie unu situatie care nu afecteaza ipotezele NIH0 !!!

C01-C02
21 Exemple de componente aleatoare (At)

+ *

C01-C02
22 Analiza pe termen scurt vs. Analiza pe termen lung
 Pe termen scurt nu se poate manifesta componenta trend determinist si prin urmare este de
preferat sa se utilizeze modelare cu trend stochastic!!!!
320 80
310
300
290
280
270 y = 0.08417x - 2,460.45117 70
y = 0.058x - 1690.4
260 R² = 0.37098
250 R² = 0.1788
240 60
230
220
210
200 50
190
180
170
160 40
150
140
130
120 30
110
100
90
80 20
70
60
50
40 10
30
20
10
0 0

Nov-80
Jan-80

Jan-81
May-80

May-81
Sep-80
Mar-80

Jul-80

Mar-81
Jan-80

Nov-80
Jan-81

Nov-81
Jan-82

Nov-82
Jan-83

May-83

Nov-83
May-80

May-81

May-82
Sep-80

Sep-81

Sep-82

Sep-83
Mar-83
Mar-80

Jul-80

Mar-81

Jul-81

Mar-82

Jul-82

C01-C02 Jul-83
NOTA!
23

 Pe termen scurt nu se poate manifesta componenta determinist trend


determinista si prin urmare este de preferat sa se utilizeze modelarea
cu trend stochastic!!!!

C01-C02
Seriile de timp realizări ale proceselor stohastic. Tipuri de
24
stationaritate in procesele stohastice – generalități

 Procese stohastice – definiție


 Ipoteza de ergodicitate în analiza seriilor de timp
 Procese stohastice stationare și nestationare
 Serii nestationare – tipologie, tratamente

C01-C02
25 Proces stohastic – definiție

 Un proces stochastic discret* este o familie de variabile aleatoare


{ X t }t =1,T definite pe acelasi spațiu de probabilitate.
 In cazul unei serii de timp cu T înregistrări aceasta poate fi considerată
ca realizarea unui proces stohastic {X t }t =1,T .
 Realizarea procesului stohastic, reprezentand seria de timp se poate
nota {x1, x2, …, xT} sau prescurtat {x t }t =1,T sau {x t }1 .
T

C01-C02
26 Ipoteza de ergodicitate in analiza seriilor de timp

 Un proces stohastic poate fi descris printr-o distributie de


probabilitate T dimensională și prin urmare relația dintre procesul
stohastic și realizarea sa este analoagă cu relația dintre populație și
eșantion. In această accepțiune seria de timp reprezintă pentru
procesul stohastic o realizare singulară a acestuia ceea ce face
imposibilă efectuarea unei inferențe statistice în vederea estimării
parametrilor distribuției. Practic seria de timp reprezinta un eșantion
T dimensional de volum unu.
 Pentru eliminarea acestui inconvenient se acceptată a priori
ipoteza de ergodicitate.

C01-C02
27

 Spunem despre un proces sohastic{ X t }t =1,T ca este un proces ergodic


dacă, pentru orice realizare de volum mare ( T−   ) a procesului ,
momentele centrate de ordin k estimate pe baza realizării{x t }t =1,T ,
tind spre momentele centrate de ordin k corespunzătoare procesului
căruia îi corespund.
 În funcție de ordinul lui k pentru care este îndeplinită ipoteza de
ergodicitate putem vorbi de ergodicitate în medie, în varianță ș.a.

C01-C02
28 Tipuri de procese stohastice stationare
Proces strict stationar
 Spunem despre un proces sohastic{ X t }t =1,T ca este strict stationar daca
variabilele aleatoare care il compun sunt identic distribuite si realizarile
procesului stohastic pentru un decalaj de timp k=1, T-1 sunt caracterizate
de aceeași functie de probabilitate.
Proces stohastic stationar in sens larg
 Spunem despre un proces sohastic { X t }t =1,T ca este stationar in sens larg,
sau stationar in covarianta, daca indeplineste urmatoarele conditii:
1. E(Xt)=μt= μ – ct.
2. V(Xt)=σt2= σ2- ct. si finita
3. Cov(Xt, Xt+k)= (k) – ct. in raport cu t  (k)= (k)/(0)=Cov(Xt, Xt+k)/Cov(Xt, Xt)

C01-C02
29 Proces stohastic stationar pur
Aceste procese mai sunt denumite si procese de tip zgomot alb:
 Spunem despre un proces sohastic { X t }t =1,T ca este proces stohastic de tip
zgomot alb, daca indeplineste urmatoarele conditii:
1.E(Xt)=μt= μ – ct.
2.V(Xt)=σt2= σ2- ct. si finita
3.Cov(Xt, Xt+k)=  = 0 – ct. in raport cu t
O varianta particulara a proceselor de tip zgomot alb sunt procesele
stohastice pure de medie zero:
1.E(Xt)=μt= μ = 0 – ct.
2.V(Xt)=σt2= σ2- ct. si finita
3.Cov(Xt, Xt+k)= 0 – ct. in raport cu t

C01-C02
30 Serii nestationare – tipologie, tratamente
 Procese nestationare in medie
Acest proces mai poarta denumirea de proces nestationar homoscedastic
(omogen):
1.E(Xt)=μt– variaza in timp
2.V(Xt)=σt2= σ2- ct. si finita
3.Cov(Xt, Xt+k)= (k) – ct. in raport cu t
Procesele nestationare in medie sunt procese generatoare de trend stohastic.
Inlaturarea nestationaritatii in medie si prin aceasta a trendului stohastic se face cu
ajutorul diferentelor de ordin d.

C01-C02
31

Diferenta de ordin 1 se calculeaza efectuand diferenta dintre


termenul seriei corespunzator momentului t si termenul seriei
corespunzator momentului t-1:
t(1)=xt-xt-1
Diferenta de ordin 2 se calculeaza efectuand diferenta dintre
diferenta de ordinul 1 corespunzatoare momentului t si diferenta de
ordinul 1 corespunzatoare momentului t-1:
t(2)=t (1) - t -1(1)= xt-xt-1- xt-1+xt-2= xt-2xt-1+xt-2

C01-C02
32

Procese nestationare heteroscedastice


1.E(Xt)=μt= μ – ct.
2.V(Xt)=σt2- variaza in timp
3.Cov(Xt, Xt+k)= (k) – ct. in raport cu t

 O categorie aparte de procese heteroscedatice o repreznita


procesele cu heteroscedaticitate conditionata care pot fi modelate
prin modele de tip ARCH.
 Procesele cu heteroscedatice neconditionata uneori pot fi
stationarizate cu ajutorul transformarilor de tip Box&Cox.

C01-C02
33

 Transformare de tip Box&Cox


Una din formele cele mai cunoscute ale functiei de transformare
Box&Cox este data de relatia:

 x λ −1
 ,  #0
x( ) =  λ
log x,  = 0
De-a lungul timpului aceasta transformare a cunoscut transformari.

C01-C02
ANALIZA SERIILOR DE TIMP
Curs Statistica și Previziune Economică anul III

Curs 03-04
2022-2023
Tematica Cursurilor C03-C05 ANALIZA SERIILOR DE TIMP
2
 C01-C02: Noțiuni, concepte definiții elementare în analiza seriilor de timp
 C03-C05: Modelarea, ajustarea și prognoza seriilor de timp formate din trend determinist și
componentă aleatoare
 Modelarea trendului determinist (TD) (C03)
Estimarea si testarea parametrilor trendului determinist
Indicatori ai acuratetii unui model
 Ruptura de trend (C04)
Teste specifice indetificarii rupturilor de trend
Modelarea trendului determinist cu ruptura de trend: modelarea individuala, modelarea agregata
cu variabile dummy
 Valori atipice pentru serii de timp (C05)
Identificarea valorilor atipice intr-o serie de timp
Modelarea seriilor cu valori atipice: inlaturarea/inlocuirea valorilor atipice intr-o serie de timp,
modelarea seriei cu valori atipice cu ajutorul variabilelor dummy
Ajustarea exponentiala unei serii de timp cu trend determinist, ajustarea exponentiala
(C06)
 EVP: din materia cursurilor C01-C08-> 20% din NF
 PROIECT: activitate de semniar desfasurata pe echipe de cate 3 studenti->40% din NF
3 Modelarea trendului determinist (TD) (C02)
Trendul determinist poate fi ”ajustat” printr-o funcție de timp și este
perfect predictibil.
Model liniar: Yt=β0+β1t+εt , t=1,....T
Model pătratic: Yt=β0+β1t+β2t2+εt , t=1,....T
β 1t + ε t
Model Exponential: Yt = β 0 e , t=1,...T; β0 >0

Model Crestere: Yt = e β 0 +β1t +ε,t t=1,...T

1
Model logistic (varianta):Yt = , t=1,....T și u este limita superioara a
1
+ β 0β1
t
functiei , β0 si β1 >0
u
4 Estimarea si testarea parametrilor unui trend determinist liniar
5 Metoda celor mai mici patrate pentru trend linear determinist

 Δb 0  y t  t −  t  ty t
2

b 0 = =
Δ T t 2 − ( t )
2

S T T T
= 2 (y t − b 0 − b1t )(− 1) = 0 Tb 0 + b1  t =  y t 

b 0 t =1  t =1 t =1 
 sau b 0 = y − b1 t
S T n n n

= 2 (y t − b 0 − b1t )(− t ) = 0 b 0  x t + b1  t =  y t t
2

b1 t =1 t =1 t =1 t =1  Δb1 T ty t −  t  y t
 1
b = =
Δ T t 2 − ( t )
2


6

 2. Satisfacerea restrictictiei care ne asigura ca punctul de extrem obtinut


la punctul anterior este un punct de minim
 2S  2S T
 2S T  2T 2 t  T  t   0
= 2 T; = 2  t 2
; = 2 t  det 0 det
 b0
2
 b1
2
b 0 b1  2 t 2 t 2  t  t 
2
t =1 t =1
 

 T t 2 − (  t ) 2 = T 2σ t2  0

OBS: In relatiile de mai sus s-a tinut cont de faptul ca varianta lui t este egala cu
diferenta dintre suma patratelor si patratul sumei:

E(t 2
) - E (t) =
2  t 2

−(
 t
) 2
= σ t2
T T
Indicatori ai acuratetei unui model econometric
7
EViews Output
Dependent Variable: CONS
Method: Least Squares
Date: 10/07/16 Time: 20:20
Sample: 1959 2000
Included observations: 42 (n)

Variable Coefficient Std. Error t-Statistic Prob.


C -198.773 16.34177 -12.1635 0
t 0.700588 0.002821 248.3724 0

R-squared 0.999352 Mean dependent var 3596.148


Adjusted R-squared 0.999336 S.D. dependent var 1457.646
S.E. of regression 37.56644 Akaike info criterion 10.13655
Sum squared resid 56449.5 Schwarz criterion 10.21929
Log likelihood -210.868 Hannan-Quinn criter. 10.16688
F-statistic 61688.84 Durbin-Watson stat 0.916167
Prob(F-statistic) 0
Indicatori ai acuratetei unui model econometric
8
R-squared (R2) ->[0;1]
 exprimă procentul din variatia lui Y explicată de modelul de regresie
E(Y|1,….i,…. T). Este un indicator al eficeientei estimării.
T T 2
1 1

T t =1
(y t − ŷ t ) 2

T t =1
et
R = 1− T
2
= 1− T
1 1

T t =1
(y t − y t ) 2

T t =1
(y t − y t ) 2
9

 Dacă avem două modele care descriu aceeasi serie de timp cu un


același R2 dar cu grade de complexitate diferite (număr de parametri
de estimat) pe care îl vom alege ca fiind cel mai bun?
 deși interpretarea lui adj. R2 este aceiasi cu cea a lui R2 : adj. R2 ≤ R2
 Valoarea lui adj. R2 este rezultată ca urmare a penalizării valorii lui R2 în
funcție de complexitatea modelului (T-k) pe baza căruia a fost generată
eroarea de modelare.
2
1 T 1 T


T − k t =1
( y t − ˆ
y t ) 2

T − k t =1
et
MSR
R = 1−
2
T
= 1− T
= 1−
1 1
 t  t
MST
( y − y ) 2
( y − y ) 2

T − 1 t =1 T − 1 t =1
unde - k - numărul parametrilor modelului pe baza căruia s-a produs estimarea
- T - numărul observațiilor.
10 S.E. of regression (S.E.R.)

- este abaterea medie pătratică (estimator nedeplasat) a erorii de


modelare:
T

 et
2

SER = t =1
T−k

Este de preferat ca raportul dintre Varianta (e) și Varianta (Y) să


fie mai mare de 10% / 15% . Principiu care se regăseste si la R2.
11 Indicatori ai acuratetei unui model econometric
Sum squared resid (SSR)
T
denumita si variație reziduală: SSR =  e 2t
t =1
F-statistic (F)
este un test omnibus care testează dacă parametrii modelului exceptand
termenul liber sunt simultan zero. ( SSR − SSR ) /(k − 1)
F= 0
SSR /(T − k )
SSR- Sum Square Residual ptr modelul testat (care contine cel putin o variabila).
SSR0 – Sum Square Residuals pentru modelul restricționat care conține doar
constanta.
F - indică cât de mult creste SSR pentru modelul estimat față de un model fara variabile
dependente, model constant.
Prob F-statistic sau p este probabilitatea calculată de a respinge ipoteza nulă
cînd aceasta este adevărată. Aceată valoare se compară cu un prag de
semnificație ales α.
12 Indicatori ai acuratetei unui model econometric

1 T
Mean dependent var. ( y ): y =  yi
T i =1

 i
(y − y ) 2

S.D. dependent var. (sy): sy = i =1


T −1
13 Log Likelihood (!!!!)
 EViews calculeaza valoarea logaritmului functiei de verosimilitate (sub
ipoteza ca erorile sunt normal distribuite) evaluata pentru valorile
estimate ale parametrilor modelului. Testele raportului de verosimilitate
pot fi construite comparand functia de verosimilitate pentru modelele
restrictionate comparativ cu functia de verosimilitate pentru versiunea
nerestrictionata a ecuatiei.
 Logaritmul functiei de verosimilitate este calculat dupa formula:
L = -T(1+log(2π)+log(SSR/T))/2
OBS: Cand comparam rezultatele Eviews si le raportam la rezultatele
obtinute cu alte software-uri, trebuie sa tinem cont de faptul ca in calculul
functiei de verosimilitate nu este ignorat termenul constanta, din modelele
de regresie estimate.
14 Durbin Watson Stat. (DW)
- statistica DW utilizată în testarea autocorelației în timp (corelația serială de
ordin I a erorilor de modelare ).
Yt=β0+β1xt+εt -> εt=γ εt -1+υt , unde υt i.i.d. și υt ~ N(0,σ2)
H0: γ=0 => nu există corelație serială de ordin I
H1: γ#0 => eroarea de modelare poate fi descrisă printr-un model autoregresiv
de ordin I, AR(1). T

 (e − e
2
t t −1 )
DW = i =1
T

e
2
t
i =1
Regulă generală pentru valori ale lui DW situate în jurul valorii de 2 putem afirma
că nu există autocorelație iar pentru valori cuprinse în intervalul, [1,7; 2.3] putem
spune că avem autocorelații pozitive.
Sfat practic: pentru valori sub 1,7 și peste 2,3 recomandam consultarea valorilor
critice ale statisticii DW.
15 Observatie cu privire la utilitatea statisticii DW

In cazul analizei seriilor de timp exista frecvent situatii in care seria este
corelata de ordin superior lui unu fapt pentru care statistica Durbin Watson si
autocorelatia de ordin I sunt insuficiente.
In locul acestora vom utiliza functia partiala de autocorelatie (partial
autocorrelatin function PACF) si graficul specific acesteia, denumit
corelograma PACF.

Acest subiect va fi tratat mai detaliat atunci cand vom prezenta modele din familia ARMA.
16 Criteriile informationale (AIC, SC, HQC)
Scrie si forma ln cf. Montgomery!!!
T

2k i
e 2

Akaike Info criterion (AIC): AIC = e T t =1


T

sau cu ajutorul functie log likelihood AIC=-2L/T+2k/T


T

k i
e 2

Schwarz Info. criterion (SIC): SIC = T T t =1


T
sau cu ajutorul functie log likelihood SIC=-2L/T+(k logT)/T

Hannan-Quin criterion (HQIC): HQIC=-2(L/T)+2k log (log(T))/T


17 Ce criteriu informational utilizam pentru alegerea
modelului

AIC vs. SIC (p.59 Montgomery)


SIC reuseste sa penalizeze mult mai eficient
complexitatea modelelor comparate.
18 C 04. Ruptura de trend
 Ruptura de trend (C04)
 Teste specifice indetificarii rupturilor de trend
 Modelarea trendului determinist cu ruptura de trend: modelarea individuala, modelarea
agregata cu variabile dummy
 Valori atipice pentru serii de timp (C05)
 Identificarea valorilor atipice intr-o serie de timp
 Modelarea seriilor cu valori atipice: inlaturarea/inlocuirea valorilor atipice intr-o serie de
timp, modelarea seriei cu valori atipice cu ajutorul variabilelor dummy
19 Rupura de trend - BREAKPOINT TESTS
 In EViews exista urmatoarele teste utilizate in testarea schimbarilor/rupturilor
structurale (break point):
 1. Testul Chow - Testeaza daca dupa o perioada/ moment critic,
caracterizat de o variatie intensa atipica, se poate spune despre un
fenomen ca a revenit la evolutia specifica perioadei care precede
perioada/ momentul critic sau a suferit schimbari ireversibile. Specific acestui
test este ca punctele de rupture structurala trebuie precizate de operator.
 2. Testul Quandt-Andrews – Testeaza daca exista doua sau mai multe puncte
de schimbare structurala pentru o ecuatie specificata. Specific acestui test
este faptul ca punctele de ruptura structurala nu sunt cunoscute. Acest test
este o generalizare a testului Chow.
 3. Muliple breakpoint test – >incepand cu EViews 8
20 TESTUL CHOW
 Ideea care sta la baza testului Chow este sa estimam doua ecuatii
din aceeasi famile, pentru subesantioanele care preceda si care
succed punctul de ruptura/ schimbare structurala, si sa vedem daca
exista diferente semnificative intre ecuatiile estimate. Existenta unor
diferente semnificative intre acestea semnaleaza existenta unor
schimbari structurale.
 Exemplu: Evolutia PIB-ului Romaniei a urmat aceeasi evolutie dupa
criza din 2008 sau evolutia acestuia s-a schimbat?
 Testul Chow testeaza, implicit, daca exista diferente semnificative
pentru toti parametrii ecuatiei. In caz ca modelul este liniar Eviews
permite si testarea diferentelor doar pentru un set de parametri ai
modelului.
21


22


23

 Exemplu: Fie modelul original


Yt = β0+ β1t+ β2t2+εt
 Daca dorim sa testam 2 puncte de ruptura pentru acest model atunci
vom construi modelul cu 2 variabile dummy pentru a introduce trei
subesantioane dupa cum urmeaza:
Yt = β0+β3D1+β4D2+ (β1+β5D1+β6D2) t+ (β2+β7D1+β8D2)t2+εt
 Unde D1 delimiteaza datele din cel de-al doilea subesantion de datele
din esantionul intreg, iar D2 delimiteaza datele din cel de-al treilea
subesantion de datele din esantionul intreg.
24

 Testul Chow echivaleaza cu testarea ipotezei omnibus:


H0: β3= β4= β5= β6= β7 =β8=0
 Modelul prezentat mai sus permite si o testare individuala a
parametrilor ceea ce ii confera o mai mare flexibilitate in
detalierea efectelor induse de punctele de ruptura structurala.
 2. Likelihood F-statistic este bazat pe compararea erorilor
modelului restrictionat cu cele ale modelelor nerestrictionate.
 3. Wald F- statistic este calculat pentru un test Wald standard sub
restrictia ca toti parametrii modelului sunt aceiasi pentru toate
subesantioanele.
De retinut ca aceste doua statistici sunt identice pentru cazul in care
modelul testat este liniar.
25 Testul Quandt-Andrews
 Este un test pentru unul sau mai multe puncte necunoscute de ruptura
structurala corespunzatoare unui model dat.
 Ideea care a stat la baza testului Q-A este ca un test Chow este efectuat
pentru fiecare perioada de timp delimitata de 2 doua momente de timp
succesive, τ1 si τ2.
 Cele k statistici corespunzatoare testului Chow vor fi insumate intr-o singura
statistica test care testeaza ipoteza nula
H0: Intre momentele τ1 si τ2 nu exista puncte de ruptura
 Testul testeaza implicit daca exista schimbari structurale in parametrii modelului
original, calculat pentru tot esantionul.
 Pentru modelul liniar Eviews permite testarea schimbarilor structurale doar
pentru anumiti parametri din model.
 Pentru fiecare Test al rupturilor de structura Eviews mai raporteaza 2 statistici:
Likelihood Ratio si Wald F-Statistic.
26

 Statisticile individuale pot fi agregate in trei statistici diferite:


1. Supremum sau maximum statistic: MaxF = max ( F ( ))
1   2
1 2 1
2. Exponential statistic: ExpF = ln(  exp( F( ))
2
k  =1 2
1
3. Average statistic : AveF =  F( )
k  =1

 Distributiile corespunzatoare acestor statistici nu sunt standard si


degenereaza (nu mai urmeaza un patern previzibil care sa permita
estimarea valorilor lui p) pe masura ce τ1 si τ2 se apropie de primul si
de ultimul moment pentru care avem inregistrate valorile seriei,
motiv pentru care testul se aplica unui esantion trunchiat simetric.
27 Testul Quandt-Andrews

 Astfel valoarea setata implicit de program pentru trunchiere este de


15% ceea ce inseamna ca primele 7.5% si ultimele 7.5% valori sunt
excluse din analiza.
 Pentru calculul valorilor p corespunzatoare acestor distributii, in
literatura de specialitate, exista propuse mai multe metode de calcul.
EViews-ul lucreaza cu valorile asimptotice ale lui p propuse de
HANSEN(1997).
 Pentru aplicarea acestui test din fereastra corespunzatoare estimarii
modelului urmam calea:
View-> Stability Diagnostics-> Quandt-Andrews Breakpoint TEST…
28 Muliple breakpoint test – >incepand cu EViews 8
29 Learning by doing!
ANALIZA SERIILOR DE TIMP
Curs Statistica și Previziune Economică anul III

Curs 05
2021-2022
C03-C06: Modelarea, ajustarea și prognoza seriilor de
2
timp formate din trend determinist și componentă aleatoare
 Modelarea trendului determinist (TD) (C03)
 Estimarea si testarea parametrilor trendului determinist
 Indicatori ai acuratetii unui model
 Ruptura de trend (C04)
 Teste specifice indetificarii rupturilor de trend
 Modelarea trendului determinist cu ruptura de trend: modelarea individuala, modelarea
agregata cu variabile dummy
 Valori atipice pentru serii de timp (C05)
 Identificarea valorilor atipice intr-o serie de timp
 Modelarea seriilor cu valori atipice: inlaturarea/inlocuirea valorilor atipice intr-o serie de
timp, modelarea seriei cu valori atipice cu ajutorul variabilelor dummy
 Ajustarea exponentiala unei serii de timp cu trend determinist: ajustarea exponentiala
simpla, ajustarea exponentiala dubla, ajustarea exponentiala Holt (C06)
3 Identificarea valorilor atipice intr-o serie de timp
Existenta valorilor atipice intr-o serie de timp poate avea cauze multiple
care de cele mai multe ori tin de conjunctura.
Valorile atipice intr-o serie de timp pot afecta calitatea procesului de
modelare.
Problema valorilor atipice intr-o serie de timp accepta diverse abordari.
Indiferent de autori demersul pe care trebuie sa-l facem cu privire la
valorile atipice/ outlieri intr-o serie de timp este urmtorul:
1.Identificarea valorilor atipice si a cauzalitatii/ contextul producerii
acestora
2.Tratamentul seriei cu privire la valorile atipice – modelarea seriei care
contine outlieri.
4 Identificarea valorilor atipice intr-o serie de timp
In literatura de specialitate putem intalni urmatoarele abordari:
- Lipsa de interventie asupra seriei
- Inlocuirea valorilor atipice cu o valoare mai aproape de specificul
seriei: media mobila, valoarea teoretica generata de trendul seriei,
valori aflate la limita dintre extrem si outlier s.a.( vezi exemplul in Excel:
“S05_2021…”)
Indiferent de strategia aleasa este utila identificarea valorillor atipice
si determinarea factorilor care au dus la aparitia acestora care sa ne
permita identificarea unui pattern care odata reprodus sa poata sa ne
permita anticiparea/ previzionarea comportamentului seriei.
Prin urmare ne vom concentra pe cateva modalitati simple de
identificare a outlierilor unei serii de timp.
5 Identificarea valorilor atipice intr-o serie de timp
Una dintre modalitatile cele mai simple de identificare a outlier-ilor este analiza
distributiei erorilor de modelare.
1.Analiza grafica a distributiei erorilor de modelare prin diagrama Box-Plot. Acest
grafic reprezinta prin puncte externe/extreme valorile care pot fi considerate
atipice pentru serie. RESID

Pentru o distributie normala, asa cum e cazul erorii de modelare, 3,000

de parametri σ ε 2 si µ ε, N(µ ε ,σ ε 2), pot fi considerate valori atipice


valorile care sunt situate in afara intervalului centrat [ε t − 2 sε ; ε t + 2 sε. ] 2,000

O varianta mai des intalnita este cea in care se considera valori


1,000
atipice valorile situate in afara intervalului [ε t − 2,5sε ; ε t + 2,5sε .]
Odata identificate valorile atipice pentru erorile de modelare 0
in functie de indicele t corespunzator acestora vom identifica
valorile seriei originale yt. -1,000

-2,000
6

Daca luam in considerare faptul ca in urma utilizarii metodei celor mai mici
patrate suma erorilor de modelare este nula si implicit media acestora, atunci
se considera valori atipice acele valori corespunzatoare unei erori de
modelare care nu sunt cuprinse in intervalul [−2 sε ;2 sε ] respectiv [−2,5sε ;2,5sε ].
2. Exista si o serie de teste inferentiale care pot duce la identificarea valorilor
atipice cum ar fi:
- Testul Dixon, utilizat pentru serii cu volum mai mic de 25 de inregistrari
- Testul Grebbs, utilizat pentru serii cu un volum depasind 20 de inregistrari
Ipotezele testate de cele doua teste sunt:
H0: εt nu este valoare atipica/ outlier
H1: εt este valoare atipica/ outlier
7

NB: Teste pot fi aplicate numai in ipoteza acceptarii normalitatii distributiei


pentru erorile de modelare.
 Testul Dixon valorile et se ordoneaza crescator sau descrescator astfel
incat valoarea testata sa fie prima in sir si o vom nota cu et(1).
Statistica Dixon o vom calcula in functie de volumul esantionului dupa
cum urmeaza:
e (1) − e (2)
e (1)
− e (2)
D calc = (1)
t t
(T)
ptr. T = 1,7 D calc = t t
ptr. T = 8,10
et − et (1)
et − et (T -1)

e (1) − e (3)
D calc = (1)t t
(T -1)
ptr. T = 14 ,25
et − et
Valorile calculate vor fi comparate cu valorile teoretice Dth=D1-α, T din
tabele speciale.
Criteriu de decizie Dcalc≤ D1-α, T ->AH0 si Dcalc> D1-α, T ->RH0
8

 Testul Grubbs
max | e extr. −e|
Calculul statisticii test g calc = t
daca estimarea modelului de
se
face prin metoda celor mai mici patrate atunci media erorilor este zero si
relatia devine
| e extr. |.
g calc = t
se
Valorile calculate vor fi comparate cu valorile teoretice gth=g1-α, T din
tabele speciale.

Criteriu de decizie gcalc≤ g1-α, T ->AH0 si gcalc> g1-α, T ->RH0


9 Identificarea valorilor atipice intr-o serie de timp

NB: 1. Metodele prezentate sunt metode elementare de identificare a


outlierilor intr-o serie de timp.
2. La momentul actual exista metode mult mai complexe de
identificare a outlier-ilor adaptate diferitelor metode/ modele utilizate
in analiza seriilor de timp, metode care prin complexitatea lor
depasesc obiectivele impuse prin prezentul curs.
3. Este foarte important atunci cand identificam o valoare atipica sa
incercam sa identificam si factorii conjuncturali care au dus la
producerea acelei valori atipice. Acest lucru ne foloseste sa stabilim
niste paternuri in comportamentul seriei care sa ne ajute sa facem
prognoze cat mai acurate.
10 Abordari privind modelarea unei serii de timp cu valori atipice
 Modelarea unei serii de timp care prezinta valori atipice este un subiect
destul de disputat.
 In abordarea clasica a seriilor de timp care implica modelarea unui
trend determinist exista urmatoarele abordari:
1. Inlocuirea valorilor atipice cu valori aflate la limita superioara/ inferioara
acceptata a valorilor tipice -> diminuarea influentei valorilor atipice
pastrand specificul lor
2. Inlocuirea valorilor atipice cu media valorilor din vecinatate -> ajustarea
valorilor atipice cu media mobila
3. Inlocuirea valorilor atipice cu valori teoretice generate de componenta
trend estimata urmata de reestimarea componentei trend -> ajustarea
valorilor atipice cu ajutorul trendului
11

4. Introducerea in model a cate unei variabile dummy care ia valorile 1


pentru momentele corespunzatoare valorilor atipice si 0 pentru restul
momentelor -> modelare cu variabile dummy independente
5. Introducerea in model a unei variabile dummy pentru outlierii pozitivi si
a unei variabile dummy pentru outlierii negativi -> modelare cu variabile
dummy comune pe outlieri de crestere si de descrestere, situatie specifica
cazului in care identificam faptul ca avem cresteri respectiv descresteri
care au la baza cauze comune.
12 Learning by doing!
Ajustarea prin medii mobile
C07

2022-2023
2 Ajustarea unei serii de timp – definitie, avantaje

 Ajustarea unei ST- reprezinta procesul de inlocuire a valorilor originale


ale unei ST cu valori teoretice, generate pe baza unei funcții de
ajustare.
 Prin ajustarea unei ST este scos in evidență patternul acesteia fiind mult
mai ușoară izolarea urmată de modelarea componentelor acesteia.
 Un alt avantaj al ajustării constă în faptul că seria ajustată prezintă
variații mult mai mici în raport cu seria originală.
 Media mobilă (engl. Moving Average) este folosită frecvent în analiza
seriilor de timp ca metoda de ajustare.

C01-C02
Ajustarea trendului prin medie mobilă
 Pocesul de ajustare sau netezire a unei tendințe se poate face mecanic cu
ajutorul mediilor mobile.
 Principiul de bază al ajustării este următorul, termenii seriei sunt înlocuiți/ ajustați
prin mediile mobile calculate pe baza termenilor învecinați acestora. Numărul
termenilor incluși în calculul mediei mobile reprezintă ordinul mediei.
 Clasificarea mediilor mobile poate fi făcută în funcție de două criterii:
C.1: poziția pe care o ocupă termenul înlocuit față de secvența de termeni utilizați
în calculul mediei mobile. Astfel vom identifica:
- mediile mobile balansate, formate din termeni care preced și succed
termenul înlocuit grupați simetric în jurul valorii dezlocuite. Acestea sunt de
obicei utilizate în desezonalizare și netezirea trendurilor. Nu se pot realiza
prognoze pe baza lor.
- mediile mobile nebalansate, formate numai din termenii care preced
termenul dezlocuit. Acestea sunt de obicei utilizate în ajustarea exponențială.
Se pot realiza prognoze pe baza lor.
Ajustarea trendului prin medie mobilă
C2(face referire numai la mediile balansate): poziția pe care o ocupă termenul
dezlocuit față de termenul central al secvenței pe baza căreia se calculează
media mobilă putem avea două tipuri de medii mobile balansate:
 MM centrate în care termenul susbstituit ocupă poziția centrala in cadrul
seriei care a stat la baza calculării MM – este specifciă mediilor mobile
balansate de ordin impar (2k+1);
 MM necentrate termenul susbstituit nu ocupă poziția centrala in cadrul
seriei care a stat la baza calculării MM – este specifciă mediilor mobile
balansate de ordin par (2k).
Aceste medii mobile balansate necentrate necesită de obicei efectuarea
unei operații suplimentare numită centrare a mediilor mobile în urma căreia
se face media aritmetica a două medii mobile succesive de ordin 2k,
k=1,...T/2.
Media cronologică astfel obținută va fi o medie mobilă de ordin 2k+1 pentru
care primul și ultimul termen al seriei au o pondere de 1/2k iar restul
termenilor au o pondere de 1/k. (EXEMPLU tabla)
Exemplu: Ajustarea prin media mobila de ordin 4
Chart Title
14

12

10

0
1 2 3 4 5 6 7 8 9 10 11 12

yt MM(2x4)

NB: Se observa ca se pierd 4 termeni din seria originala


Exemplu: Ajustarea prin media mobila de ordin 3
Chart Title
14

12

10

0
1 2 3 4 5 6 7 8 9 10 11 12
yt MM(3)

NB: Se observa ca se pierd 2 termeni din seria originala


Ajustarea trendului prin medie mobilă
Proprietăți ale mediilor mobile:
1. Seria de timp provenita din ajustarea cu medii mobile a unei ST induce
apariția unei autocorelații între termenii seriei având în vedere că pentru 2
medii mobile succesive de ordin k există k-1 termeni comuni.
2. Ajustarea prin medii mobile de ordin 2k/2k+1 provoacă pierderi de 2k termeni
pentru seria ajustata.
3. Dacă o serie de timp este formată numai dintr-o componentă care prezintă
periodicitate de ordin k, trendul, fiind constant, yt=yt+k=….=yt+mk, unde m-
numarul de cicluri incluse în perioada observată T, atunci mediile mobile de
ordin k sunt constante:
y t (k ) = y t +1 (k ) = ... = y t + m (k )

4. Coroloar 3: Mediile mobile de ordin k elimină în totalitate variațiile ciclice de


ordin k, iar variațiile accidentale de atenuează.
AJUSTAREA EXPONENTIALA
Ajustarea exponentiala simpla
(Simple Exponential Smoothing –SES)
Se aplica pentru serii stationare fara componenta trend sau componenta
sezoniera:
yt=µ+εt
NB: Metoda poate fi utilizata si pentru serii care prezinta rupturi de nivel de
intensitate mica.
Notam cu St, valoarea seriei yt, ajustata exponential simplu.
Seria ajustata exponential simplu se calculeaza dupa formula recurenta:
St=αyt+(1-α)St-1
Unde 0<α≤1 este factorul de amortizare (netezire).
NB: Cu cat mai mica este valoarea lui α cu atat este mai neteda seria St.
 Prin inlocuiri repetate valoarea ajustata a seriei la momentul t, St, se
poate calcula pe baza celor t termeni ai seriei originale, y1,…,yt, seria
ajustata exponential se poate scrie astfel:
t −1
St = α ∑ (1 − α ) yt −i , cu t=1,T (*)
i

i =0
 Valoarea ajustata la momentul t se calculeaza ca o medie ponderata
pentru care ponderile scad exponential. Pentru ca media sa fie
ponderata trebuie ca suma ponderilor sa fie 1 conditie indeplinita la
t
t −1
(1 - α) −1
limita: α ∑ (1 − α) i = 1 <=> α[1 + (1 - α) + (1 - α) 2 + ... + (1 - α) t -1 ] = α =
i =0 (1 - α) - 1
(1 - α) t − 1
=α = 1 − (1 - α) t − > 1 pentru 0 < α ≤ 1 si t - > ∞

Despre prognoza seriei pe un pas si pe un orizont de prognoza k

t −1
St = α ∑ (1 − α ) yt −i , t=1,T (*)
i

i =0

 Cf. Relatiei (*) St reprezinta si prognoza pe un pas a valorilor seriei yt,


St=Ft(1).

 Cf. relatiei (*) previziunile seriei sunt constante pentru orice orizont de
prognoza k>1, FT(k) =ST+k = ST.
Elemente necesare initierii SES

Pentru initierea recurentei St=αyt+(1-α)St-1 sunt necesare doua


componente: valoarea initiala a lui S0 și valoarea parametrului α.

1. Alegerea Valorii initiale a lui S0


Alegerea valorii inițiale S0 = F1 nu are importanță pentru serie decât
dacă α are o valoare apropiată de zero și dacă seria este foarte scurtă.
Valoarea de inițiere a recurenței este mai puțin importantă deoarece seria
previziunilor se ajustează foarte rapid după seria originală pe baza
algoritmului autoadaptiv.
Pentru alegerea lui S0 = F1 in practica se folosesc de obicei urmatoarele
solutii:
1) Pentru o serie fluctuantă (reprezentând de exemplu o serie a
cursurilor la bursă) este recomandată alegerea următoarei soluții: S0 = F1
= y1 .
2) Pentru o serie care oscilează în jurul unei constante (de exemplu
vânzările unui produs pentru care cererea este stabilă) este
recomandată alegerea următoarei soluții: S0 = F1 = E(yt) ptr. t=1,T;
3) Ca un compromis între soluția 1) și 2) este recomandată următoarea
soluție: S0 = F1 = E(yt) ptr. t=1,T1 unde T1<T.
OBS: In EViews valoarea lui S0 = F1 = E(yt) pentru prima jumatate a
termenilor seriei initiale, t=1,(T+1)/2
2. Alegerea valorii lui α
Cu ajutorul constantei de ajustare se poate realiza o negociere între
stabilitatea și sensibilitatea seriei. Aceasta are o importanță deosebită stabilind
flexibilitatea și stabilitatea modelului de tip SES:
- pe măsură ce valoarea lui α crește, apropiindu-se de 1, ponderea valorilor
mai apropiate de momentul prezent va crește. Seria devine flexibilă,
deoarece este sensibilă la schimbările conjuncturale, în defavoarea stabilității
acesteia. În acest caz, spunem că memoria modelului SES scade.
- pe măsură ce valoarea α scade, apropiindu-se de 0, ponderea valorilor
mai îndepărtate de momentul prezent va crește. Seria devine stabilă,
deoarece nu este sensibilă la schimbările conjuncturale, în defavoarea
flexibilității acesteia. În acest caz, spunem că memoria modelului SES crește.
Algoritmul de alegere a valorii optime a lui α:
Se împarte seria de timp în două părți egale. Se calculează media pentru
prima jumătate a seriei, µ1/2, care va fi folosită ca valoare de initiere a
recurentei S0.
Pe baza valorii lui S0 se realizează ajustările exponențiale pentru diferite
valori ale lui α pentru întreaga perioadă de timp.
Valoarea lui α va porni de exemplu de la o valoare minima, de ex. 0,01 și va
crește cu 0,01 sau 0,05 până la voalarea 0,95.
Pentru fiecare valoare a lui α se calculează valorile Mean Square Error, ErrSS
Mean Absolut Error sau un alt criteriu de estimare a performantei modelului.
Se alege valoarea lui α pentru care criteriul ales la pasul anterior este
minim. Aceste criterii pot fi utilizate în forma ponderată sau neponderată.
Obs: Pentru perioade de timp suficient de mari sau în situații excepționale
(atunci când se produc schimbări evidente datorită unor factori exogeni),
este necesară revizuirea valorii lui α pentru a vedea dacă valoarea utilizată
în ajustare mai este optimă în raport cu evoluția seriei de timp.
In practica este recomandata, pentru α, utilizarea valorilor din intervalul
0.01-0.3 sau dupa unii autori din intervalul 0.01-0.4.
Ajustarea exponentiala dubla cu un parametru (DES)
Ajustarea exponențială dublă este o metodă mai generală decât SES și este în
special adaptată pentru seriile de timp care prezintă tendință.
Yt=µ+βt+εt
 DES nu este o metodă de previziune bună dar permite introducerea altor metode
de ajustare exponențială mai performante.
 DES este definita de relatiile de recurenta:
St=αyt+(1-α)St-1
Dt=αSt+(1-α)Dt-1
unde:
St reprezinta seria ajustata simplu exponential;
Dt reprezinta seria ajustata dublu exponential;
0<α≤1 este factorul de amortizare (netezire).
 Prin inlocuiri repetate valoarea ajustata a seriei la momentul t, Dt, se
poate calcula pe baza celor t termeni ai seriei ajustate simplu
exponential, St, care la randul lor se pot calcula pe baza termenilor seriei
originale, y1,…,yt, seria ajustata exponential dublu se poate scrie astfel:
t −1 t −1
Dt = α ∑ (i + 1)(1 − α ) yt −i , St = α ∑ (1 − α ) i yt −i , cu t=1,T (*)
i

i =0 i =0
Prognoza pe k perioade de timp pentru ajustarea exponentiala dubla
este calculata dupa formula:
αk αk α
FT + k = (2 + ) ST − (1 + ) DT = (2 ST − DT + ( ST − DT )k )
1−α 1−α 1−α

Ultima expresie a prognozei pe K perioade de timp demonstreaza ca


valorile prognozate urmeaza un trend de intercept (2ST-DT) si de panta
α ( ST − DT ) .
1−α
Alegerea estimării/ previziunii inițiale
Calculul prin recurență a lui St și Dt
St= α yt + (1-α) St-1
și
Dt= α St+ (1-α) Dt-1

necesită initierea recurențelor prin fixarea valorilor S0 și D0.


Alegerea acestor valori are un efect redus, după o scurtă perioadă de timp,
asupra caliatății ajustării/ previziunii. În conluzie alegerea valorilor pentru S0 și
D0 este mai puțin importantă.
De asemenea rămân valabile și soluțiile prezentate la SES.
Criterii de alegere a celei mai bune ajustari exponentiale
In alegerea celei mai bune ajustari exponentiale, si nu numai, exista tri criterii de
minimizat:
T T
MAPE (Mean absolute percentage eror) ∑| ( y t − yˆ t ) / yt | ∑| e / y
t t |
MAPE = t =1
100 = t =1
100 (y t ≠ 0)
T T
T

∑| e | t
MAD (Mean absolute error/ deviation ) MAE = t =1
T
T

∑ t
( e ) 2

MSD (Mean squared error/ deviation) MSE = t =1


T

Unde prin yˆ t notam valorile estimate St sau D t


Modelarea seriilor care contin trend
si component sezoniera determinista

C08-C09
2016-2017
Structura cursului
2
ANALIZA SERIILOR DE TIMP
 C01-C02: Noțiuni, concepte definiții elementare în analiza seriilor de timp
 C03-C06: Modelarea, ajustarea și prognoza seriilor de timp formate din
trend determinist și componentă aleatoare
 C07-C08: Modelarea, ajustarea și prognoza seriilor de timp formate din
trend determinist, componentă sezonieră și componentă aleatoare
 C09-C10: Modelarea și prognoza seriilor de timp nestaționare în medie
(omogene) fără componentă sezonieră. Modelele AR, MA, ARMA
 C11: Procese stohastice omogene cu trend stohastic – procese cu radacina
unitate
 C12: Modelarea și prognoza seriilor de timp cu trend stohastic. Modelele:
ARIMA

C01-C02
DESEZONALIZAREA PRIN METODA MEDIILOR MOBILE
 Modelarea unei serii de timp compusa din trend, componenta sezoniera si
componenta aleatoare se face pelcand de la izolarea/ filtrarea fiecarei
componente in parte urmata de modelarea ulterioara a acestora.
 Toate metodele utilizate in analiza unei ST cu componenta trend si componenta
sezoniera determinista au la baza ajustarea prin medii mobile.
 Metodele care izoleaza componentele unei serii de timp poarta denumirea de
metode de desezonalizare.
 In practica cele mai des utilizate metode de desonalizare sunt: Metoda mediilor
mobile, Census X11, Census X12, Census X13, metoda Tramo-Seats
 In familia metodelor de desezonalizare metoda mediilor mobile este metoda
elementara, celelalte metode reprezentand variante mai elaborate ale acesteia.
 Avand in vedere usurinta aplicarii metodei mediilor mobile si faptul ca a stat la
baza elaborarii metodelor mai complexe o recomanda ca instrument didactic si
aceasta in ciuda faptului ca rezultatele obtinute sunt mai slabe decat rezultatele
furnizate de celelalte metode.
Metoda mediilor mobile (3M)
O serie de timp poate fi privită ca rezultatul combinării unui set de patru
componente, care prezintă caracteristici specifice:
 Componenta trend (Ti)
 Componenta ciclu (Ci)
 Componenta Sezonalitate/ Sezonieră (Si)
 Componenta Aleatoare/ Neregulata (Ai)
NB: Componentele trend si ciclu va fi tratată ca o singură componentă
purtând denumirea de componenta trend-ciclu sau componeta extra-
sezoniera, notată în continuare cu Dt.
Metoda medilor mobile porneste de la identificarea legii de compunere a
componentelor in seria originala.
3M se aplica diferit pentru seriile in care componentele sunt compuse aditiv
fata de seriile in care componentele sunt compuse multiplicativ.
Modalităti de compunere a componentelor unei serii de timp

În practică, în funcție de modalitatea combinării componentelor , există


mai multe tipuri de serii de timp. Acestea se pot împărți în trei grupe mari:
serii de timp compuse aditiv (modele aditive);
serii de timp compuse multiplicativ (modele multiplicative);
serii de timp compuse mixt (modele mixte).
Modelele aditive
Yt = (Tt + Ct )+ St + At
sau exprimată cu ajutorul componentei extra sezoniere
Yt = Dt + St + At
Pentru ca influențele componentelor sezonieră (St) și aleatoare (At) să fie
neutre la nivelul seriei, trebuie ca suma valorilor fiecăreia dintre ele să fie
zero/ NULE .
NB: Influenta componentei sezoniere trebuie sa fie neutra (pentru model
ADITIV NeutruNul) la nivelul unui an calendaristic!!!!
Acestui tip de model îi este specific faptul că amplitudinile oscilațiilor pentru
componenta sezonieră rămân constante în timp indiferent de evolutia
trendului.
În modelul aditiv, dacă nu se manifestă una dintre componente, atunci ea
este considerată constantă și egală cu 0/ nula.
Cum identificăm in practica un model aditiv?
 TABLA
Modelele multiplicative
În modelul multiplicativ, dacă nu se manifestă una dintre componente, atunci
ea este considerată constantă și egală cu zero.
Yt = (Tt • Ct)• St • At
sau exprimată cu ajutorul componentei extra sezoniere
Yt = Dt • St • At
Pentru ca influențele componentelor sezonieră (St) și aleatoare (At) să fie neutre
la nivelul seriei, trebuie ca suma valorilor fiecăreia dintre ele să fie egală cu unu.
NB: Influenta componentei sezoniere trebuie sa fie neutral (pentru model
MULTIPLICATIV Neutru1) la nivelul unui an calendaristic!!!!
Acestui tip de model îi este specific faptul că amplitudinile oscilațiilor pentru
componenta sezonieră se amplifică sau se atenuează în funcție de
componenta trend.
În modelul multiplicativ, dacă nu se manifestă una dintre componente,
atunci ea este considerată constantă și egală cu unitatea.

Modelul multiplicativ poate fi transformat în model aditiv prin logaritmare.


logYt = log Tt + log Ct +log St+ log At
sau exprimand cu ajutorul componentei extra sezoniere
logYt = log Dt + log St+ log At
Cum identificam in practica un model multiplicativ?
 TABLA
Modelele mixte
Yt = Dt +St • At ; Yt = Dt • (1+St) + At ; Yt = Dt • (1+St)• (1+ At);
Yt = Dt • St • At ; Yt = Dt • (St + At)
Unde componenta extra-sezonieră (Dt) poate fi compusă aditiv sau multiplicativ.

OBS: Neajunsul metodei clasice de descompunere a seriilor de timp pe


componente constă în faptul că factorii care generează componentele sunt
considerați a fi independenți. Aceasta limitează foarte mult domeniul de
aplicabilitate a metodei.
În continuare vom prezenta doar modelul aditiv și modelul multiplicativ.
Despre componenta Sezonieră
Componenta Sezonalitate/ Sezonieră (St) reprezintă o oscilație periodică,
aproximativ uniformă de frecvență mare. Un ciclu sezonier poate avea o
periodă de manifestare de până la un an de zile. (exemple: zile,
luni,trimestre sau semestre).

Componenta sezonieră se înfășoară în jurul componentei trend sau a


componentei trend-ciclu (vezi imaginea anterioara).

Oscilațiile componentei sezoniere au următoarele proprietăți:


- se repetă cu regularitate de la o perioadă la alta (~!?);
- la nivelul unei ciclu influența componentei sezoniere este neutră (0
pentru modelul aditiv, 1 pentru modelul multiplicativ).
Despre componenta Sezonieră
 Componenta sezonieră are un efect neutru la nivelul unui ciclu
sezonier.
 Dacă seria de timp are q cicluri sezoniere (=[T/p]) şi fiecare ciclu
sezonier este alcătuit din câte p subperioade ale ciclului sezonier
atunci:
Sij=S(i+1)j, generalizand: Sij=S(i+h)j unde i=1,q , j=1,p si h=0,q-i
 Legătura dintre T, q şi p, în ipoteza că există un număr complet de
cicluri sezoniere pentru seria de timp studiată este T=qp.
 Efectul cumulat al componentei sezoniere pentru un ciclu sezonier
este nul pentru o serie de timp aditivă şi este egală cu unitatea
pentru o serie de timp multiplicativă:
Despre componenta Sezonieră p
- pentru o serie de timp aditivă : ∑ S = 0, i = 1,q
ij
p
j =1
- pentru o serie de timp multiplicativă: ∑S
j =1
ij = 1, i =1,q
unde pentru orice i=1,q; unde q - numărul total de cicluri corespunzătoare
seriei de timp studiate.
OBS: Pentru calculul coeficienţilor sezonieri, indicele t va fi înlocuit cu alţi doi
indici i şi j, indici, care oferă informaţii mult mai detaliate cu privire la ciclul (i)
şi la subperioada (j) căreia îi aparţine valoarea yij.
yt → yij, i =1,q ; j =1,p , t=1,T unde:
- i – numărul ciclului, i= 1,q
- j – precizează poziţia unei date în cadrul unui ciclu sezonier, j=1,p.
Calculul coeficienţilor de sezonalitate se face utilizând diferite metode. Cea
mai des utilizată metodă este metoda mediilor mobile.
Demersul metodologic al descompunerii unei ST pe componente

- prima etapă, identificarea existenței componentelor în cadrul seriei de


timp brute si a modului lor de compunere.
- a doua etapă, componentele, odată identificate, urmează să fie izolate
din seria brută. Această operație poartă denumirea de descopunere
pe componente a seriei brute.
- a treia etapă, analiza individuală a componentelor izolate în etapa a
doua, prin metode specifice.
- a patra etapă modelarea componentelor si recompunerea acestora,
pentru a obține un model teoretic complex care poate servi în
prognoze.
Algoritmii descompunerii pe componente a unei serii de timp

 Descompunerea unei serii de timp pe componente se poate reduce


de cele mai multe ori la izolarea componentelor: trend-ciclu,
componentă sezonieră şi componentă aleatoare.
 Modelarea unei serii de timp bazată pe descompunerea unei serii de
timp pe componente este un proces complex care implică mai multe
etape, accentul căzând pe desezonalizarea seriei de timp.
 Calculul coeficienţilor/ indicilor de sezonalitate se face utilizând
diferite metode care au la baza metoda mediilor mobile.
 În continuare vom prezenta algoritmul desezonalizării unei serii de
timp prin metoda mediilor mobile pentru modelul aditiv și pentru
modelul multiplicativ.
Etapele DESCOMPUNERII pe COMPONENTE a unei a serii de timp

1. Ajustarea tendinţei seriei prin metoda mediilor mobile


2. Înlăturarea influenţei componentei trend ajustate cu ajutorul mediilor
mobile (detrendizarea seriei de timp)
3. Calcularea coeficienţilor/ indicilor sezonieri ( Ŝ j )
4. Calcularea mediei coeficienţilor/ indicilor sezonieri ( Ŝ)
5. Calcularea coeficienţilor/indicilor sezonieri corectaţi
6. Calcularea valorilor seriei ajustate sezonier ( ~ y t ) pe baza coeficienţilor
sezonieri corectaţi ( S
 ∗j ) şi a seriei originale (yt)

7. Ajustarea componentei trend-ciclu pe baza seriei ajustate sezonier


8. Estimarea componentei aleatoare Ât
Etapele descompunerii unei a serii de timp ADITIVE
Reprezentarea teoretică a modelului: yt =TCt+St+At
1. Ajustarea tendinţei seriei prin metoda mediilor mobile
Valorile yt vor fi ajustate cu ajutorul mediilor mobile de ordinul p. Unde p reprezinta numarul perioadelor existente
intr-un ciclu sezonier. Ex: p=12 pentru serii lunare, p=4 pentru serii trimestriale ș.a.
Dacă p – par atunci este necesară centrarea mediilor mobile1 rezultând o medie mobilă cronologică:
t + p −1 t+ p

y y t t
1 1
t
+ t +1
yt + yt +1 + ..... + yt + p −1 + yt + p
p p
MM t (2  p) = = 2 2 ⎯substituie
⎯⎯⎯ ⎯⎯→ y p ,t= 1, T
termenul

2 p t+
2
Dacă p - impar atunci componenta trend aflată în mijlocul termenilor care întră în componenţa mediilor mobile va fi
substituită cu o medie mobilă simplă2 de tipul:
t + p −1

y t
MM t ( p ) = t
⎯substituie
⎯⎯⎯ ⎯⎯→ y
termenul
p −1 ,t= 1, T
p t+
2
2. Înlăturarea influenţei componentei trend ajustate cu ajutorul mediilor mobile (detrendizarea seriei de timp).
yt –MMt= Ŝ t
3. Calcularea coeficienţilor sezonieri ( Ŝ j )
Notam prin q(q=[T/p] și i=1,q) ciclurile sezoniere şi fiecare ciclu sezonier este alcătuit din câte p subperioade ale
ciclului sezonier (j=1,p).
La nivelul fiecărui ciclu sezonier obţinem coeficienţi sezonieri, Ŝ j , j= 1, p .
1 q
Sˆ j =  Sˆij
q i =1
Prin Ŝ ij am notat valorile coeficienţilor sezonieri Ŝ t exprimate cu ajutorul ciclului i şi la subperioadei j.

4. Calcularea mediei coeficienţilor sezonieri ( Ŝ )


1 p
Sˆ =  Sˆ j
p i =1
Observaţie: Dacă această medie nu diferă de zero va fi necesară corectarea coeficienţilor sezonieri astfel încât
media acestora să devină zero.
5. Calcularea coeficienţilor sezonieri corectaţi3
Sˆ *j = Sˆ j − Sˆ

6. Calcularea valorilor seriei ajustate sezonier ( ~
y t ) pe baza coeficienţilor sezonieri corectaţi ( S j ) şi a seriei
originale ( y t )
y t = y t − Sˆ *j , t ->j unde j=restul lui t la p
~

1
Mediile mobile centrate de ordinul p sunt medii mobile de tipul 2xp.MM(2xp)
2
Mediile mobile simple de ordinul p sunt notate MM(p).
3
Corectarea coeficienţilor/ indicilor sezonieri trebuie făcută ţinând cont de ipotezele de lucru:pentru o serie de timp compusă aditiv, media aritmetică a
coeficienţilor de sezonalitate trebuie să fie zero, iar pentru o serie de timp compusă multiplicativ aceasta trebuie să fie egală cu unitatea.
1
7. Ajustarea componentei trend-ciclu pe baza seriei ajustate sezonier4
Ajustarea componentei trend-ciclu se realizează utilizând termenii seriei ajustate sezonier (SAS). Termenii serie se
ajusteaza dupa o medie mobila de ordin 5 cu ponderi fixate: 1/9; 2/9; 3/9; 2/9;1/9
^ ~
yt −2 + 2 ~
yt −1 + 3 ~
yt + 2 ~
yt +1 + ~
yt +2
TC t = MM t( SAS ) (5) = −~
yt , t = 3, n − 3
9
Pentru cele două valori care se află la începutul şi la sfârşitul seriei se utilizează următoarele formule de calcul:
^ ~
y1 + ~
y2 + ~
y3 y + yn −1 + yn
TC2 = MM 2( SAS ) = −~ ̂ 𝑛−1 = MM n( SAS
y2 𝑇𝐶 −1
)
= n−2 −  yn −1
3 3
şi
^ MM 2( SAS ) − MM 3( SAS ) (5) ^ MM n( −SAS )
− MM n( −SAS )
2 (5)
TC 1 = MM1( SAS ) = MM 2( SAS ) + −  ~y1 , TC n = MM n( SAS ) = MM n( −SAS
1
)
+ 1
−  ~yn
2 2

8. Estimarea componentei aleatoare


yt - MM t(SAS ) ~yt 𝑇𝐶
Ât = ~ ̂
= - 𝑡

4
Ajustarea componentei trend ciclu, în cazul în care forma acesteia o permite poate fi realizată şi cu ajutorul metodelor analitice.
2
Etapele descompunerii unei a serii de timp MULTIPLICATIVE
Reprezentarea teoretică a modelului: yt =TCt*St*At
1. Ajustarea tendinţei seriei prin metoda mediilor mobile
Valorile yt vor fi ajustate cu ajutorul mediilor mobile de ordinul p.Unde p reprezinta numarul perioadelor existente
intr-un ciclu sezonier. Ex: p=12 pentru serii lunare, p=4 pentru serii trimestriale ș.a.
Dacă p - par atunci este necesară şi o centrare a mediilor mobile5 rezultând o medie mobilă cronologică:
t + p −1 t+ p

 yt y t
1 1
t
+ t +1
yt + yt +1 + ..... + yt + p −1 + yt + p
p p
MM t (2  p) = = 2 2 ⎯substituie
⎯⎯⎯ ⎯⎯→ y p ,t= 1, T
termenul

2 p t+
2

Dacă p - impar atunci componenta trend aflată în mijlocul termenilor care intră în componenţa mediilor mobile va fi
substituită cu o medie mobilă simplă6 de tipul:
t + p −1

y t
MM t ( p ) = t
⎯substituie
⎯⎯⎯ ⎯⎯→ y
termenul
p −1 ,t=
1, T
p t+
2
2. Înlăturarea influenţei componentei trend ajustate cu ajutorul mediilor mobile (detrendizarea seriei de timp)
yt/( MM t ) = Ŝ t
3. Calcularea indicilor sezonieri ( Ŝ j )
Notam prin q(q=[T/p] și i=1,q) ciclurile sezoniere şi fiecare ciclu sezonier este alcătuit din câte p subperioade ale
ciclului sezonier (j=1,p).
La nivelul fiecărui ciclu obţinem indici sezonieri, Ŝ j , j= 1, p .
1 q
Ŝ j =  Ŝij
q i =1
Prin Ŝ ij am notat valorile indicilor sezonieri Ŝ t exprimati cu ajutorul ciclului i şi alsubperioadei j.

4. Calcularea mediei indicilor sezonieri ( Ŝ )


1 p
Ŝ =  Ŝ j
p j=1
Observaţie: Dacă această medie nu diferă de unu va fi necesară corectarea indicilor sezonieri astfel încât media
acestora să devină unu.
5. Calcularea indicilor sezonieri corectaţi7
Sˆ *j = Sˆ j / Sˆ

6. Calcularea valorilor seriei ajustate sezonier ( ~
y t ) pe baza indicilor sezonieri corectaţi ( S j ) şi a seriei
originale ( y t )
y t = y t / Sˆ *j
~
7. Ajustarea componentei trend-ciclu pe baza seriei ajustate sezonier8
Ajustarea componentei trend-ciclu se realizează utilizând termenii seriei ajustate sezonier (SAS). Estimarea
componentei trend ciclu se calculează ca o medie aritmetică de trei medii mobile de ordinul 3 consecutive9 pentru
seria ajustată sezonier după formula:
^ ~
yt − 2 + 2 ~
yt −1 + 3 ~
yt + 2 ~
yt +1 + ~
yt + 2
TC t = MM t( SAS ) (5) = −~
yt , t = 3, n − 3
9
Pentru cele două valori care se află la începutul şi la sfârşitul seriei se utilizează următoarele formule de calcul:

5
Mediile mobile centrate de ordinul p sunt medii mobile de tipul 2xp.MM(2xp)
6
Mediile mobile simple de ordinul p sunt medii mobile de tipul 1xp, notate MM(1xp).
7
Corectarea coeficienţilor/ indicilor sezonieri trebuie făcută ţinând cont de ipotezele de lucru:pentru o serie de timp compusă aditiv, media aritmetică a
coeficienţilor de sezonalitate trebuie să fie zero, iar pentru o serie de timp compusă multiplicativ aceasta trebuie să fie egală cu unitatea.
8
Ajustarea componentei trend ciclu, în cazul în care forma acesteia o permite poate fi realizată şi cu ajutorul metodelor analitice.
9
De aici şi denumirea de medie mobilă 3x3.
3
^ ~
y1 + ~
y2 + ~
y3 y + yn −1 + yn
TC 2 = MM 2( SAS ) = −~ ̂ 𝑛−1 = MM n( SAS
y2 ,𝑇𝐶 −1
)
= n−2 −  yn −1
3 3
şi
^ MM 2( SAS ) − MM 3( SAS ) (5) ^
−1 − MM n − 2 (5)
MM n( SAS ) ( SAS )
TC1 = MM1( SAS ) = MM 2( SAS ) + −  ~y1 TC n = MM n( SAS ) = MM n( SAS
−1
)
+ −  ~yn
2 , 2
8. Estimarea componentei aleatoare
Ât = ~
yt / MM t( SAS )

4
STUCTURA PROIECT

Analiza grafica a Yt seriei de timp originala


Descompunerea seriei originale (EViews):
a. SASt – componenta ajustata sezonier
b. St – componenta sezoniera -> coeficienti/ indici de sezonalitate
c. SASt ->modelarea componentei si identificarea punctelor de ruptura pentru componenta:
SASt =f(t)+errt (EViews), unde f(t) modelul trendului determinist cu variabile dummy pentru punctele
de ruptura
d. errt analiza ipotezelor de iiN0 [de medie zero] ->concluzii si solutii in urma testarii iiN0
e. Testarea radicinii unitate pentru errt
f. modelarea prin ARIMA a errt ->ARIMA(p,d,q)+ errt*
g. errt* analiza ipotezelor de iiN0

Yorig = St +/*SASt -> SASt= f(t) + errt ->errt=ARIMA(p,d,q)+ errt*->Alte tipuri de modele (ARCH,
GARCH s.a.)

Yorig = St+/* (f(t) + ARIMA(p,d,q)+ errt*); errt*~IIN0

5
Analiza seriilor de timp
Testarea ipotezelor cu privire la eroarea de modelare
C09-C11
Statistica si previziune economica
Anul III
2022-2023
TEMATICA
1. Testarea ipotezelor privind eroarea de modelare specifice Eviews
1.Media erorilor de modelare este zero
2.Normalitate
3.Independenta
4.Homoscedasticitate
5. Heteroscedasticitatea conditionata
2. . Alte teste specifice ST in Eviews
1.Testarea radacinii unitate
Testarea mediei erorilor de modelare (H0: με=0) in Eviews

Media erorilor de modelare este zero->deschideti fisierul ‘resid’ care contine reziduul
ultimului model rulat in Eviews, pentru aceasta trebuie sa va asigurati ca ati rulat ultimul
model pentru care doriti sa testati reziduul!!!
View-> Descriptive Statistics&Tests->Simple Hypothesis Tests
1.Testarea Normalitatii, Independentei, Homoscedasticitatii neconditionata &
conditionata in Eviews
Testarea Normalitatii erorilor
Testul Jarque- Berra (H0: ε~N(με , σε 2))
Estimarea coeficeintilor de asimetrie Fisher (γ1):
T
i −  3
 (
T
)
m3 m3
 1 : Sk = i =1
= = 3
T
i −  2 3 s

m2
( )
i =1 T

Estimarea coeficientilor de boltire Pearson (β2):


T
i −  4
 (
T
)
m4 m4
2 : K = T i =1
= 2 = 4
 i −  2 2 m2 s
( ( ) )
i =1 T
m2, m3 si m4 momentele centrate de ordin 2 3 si 4:
T
( i −  ) r
mr = 
i =1 T

iar s este abaterea standard s = m2


Calculul statisticii JB
T ( K − 3) 2
JB = ( Sk +
2
) ~  2 (2) si pentru un  fixat
6 4

Formularea deciziei:JB  2 , 2  Prob.(sig.) ≥α => AH0 cu o probabilitate 1-α


JB  2 , 2  Prob.(sig.) <α => RH0 cu un risc asumat α
60
Series: Residuals
Sample 1992M01 2014M08
50
Observations 272

40 Mean 6.85e-12
Median -5.010046
Maximum 2463.727
30 Minimum -1630.691
Std. Dev. 625.6910
20 Skewness 0.327932
Kurtosis 3.958518

10 Jarque-Bera 15.28770
Probability 0.000479
0
-1500 -1000 -500 0 500 1000 1500 2000 2500
Testarea independentei erorilor
Erorile unei serii de timp sunt independente daca intre oricare doua valori εt si εt+k siutate la
o distanta de k perioade una de cealalta (decalaj) nu exista o legatura semnificativa care sa
depinda de t sau k.
Testarea independentei eroirilor de modelare se face cu ajutorul corelogramelor si a
testelor specifice acestora:
- Testul Ljung-Box sau Statistica Q utilizat pentru testarea coeficientilor de autocorelatie
- Breusch-Godfrey LM test
- Testul de banda ~ ±2/(√T) utilizat pentru testarea coeficientilor partiali de autocorelatie.
H0: nu exista autocorelatii in erorile de modelare mai mari decat ordinul specificat (p)
εt= φ1 εt-1+ φ2εt-2+ φ3εt-3+ ….+ φpεt-p+ ut, cu ut IIND de medie zero.
Testul BREUSCH-GODFREY (BG) sau testul corelatiei seriale LM
Pp. ca urmatorul model liniar a fost estimat prin m. c.m.m.p.:
yt= β1 +β2xt+ β3zt+εt
Pentru eroarea de modelare εt se va construi modelul de regresie auxiliar:
εt= φ1 εt-1+ φ2εt-2+ ….+ φpεt-p+ β’1 +β’2 xt+ β’3zt+ ut
In Eviews vor fi calculate 2 statistici:
- Statistica nR2, prin care se testeaza ipoteza H0, care urmeaza o distributie χ2(p):
BG(p)=nR2~χ2(p) unde n=T nr. obs./ per. de timp observate->volumul esantionului observat.
Statistica F pentru testarea simultana a parametrilor modelului: φ1=φ2= ….=φp ne va conduce la
o decizie incerta, deoarece nu se cunoaste distributia lui F in conditiile indeplinirii H0.
Aceasta decizie are scopul de a oferi termen de comparatie cu statistica BG.
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 198.8789 Prob. F(4,52) 0
Obs*R-squared 56.31865 Prob. Chi-Square(4) 0
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 11/26/13 Time: 10:48
Sample: 1993M01 1997M12
Included observations: 60

Presample missing value lagged residuals set to zero.


Variable Coefficient Std. Error t-Statistic Prob.
C 0.033756 0.165421 0.204063 0.8391
t^2 -0.000613 0.001283 -0.47779 0.6348
t^3 3.00E-05 5.12E-05 0.586782 0.5599
t^4 -3.64E-07 5.27E-07 -0.69058 0.4929
RESID(-1) 1.448988 0.139167 10.41184 0
RESID(-2) -0.328413 0.241573 -1.35948 0.1799
RESID(-3) -0.274865 0.242152 -1.13509 0.2615
RESID(-4) 0.011887 0.14284 0.083221 0.934
R-squared 0.938644 Mean dependent var 4.61E-15

Eviews –ul raporteaza si testul t pentru fiecare φi , i =1,p insa acesta nu este
semnificativ deoarece, la fel ca in cazul lui F, distributia statisticii t nu este cunoscuta.
Prin urmare probabilitatile asociate acestui test vor avea si ele mai mult un caracter
orientativ.
Testul Q* a lui Box-Pierce si Testul Q a lui Ljung-Box
Functia de autocorelatie (FAC) cov( t ,  t -k )
 k =  ( t ,  t -k ) = , k = 1, p
V ( t ) V ( t -k )

Pentru un proces stohastic homoscedastic V(εt)=V(εt-k)=V(ε)


Notam cu γk functia autocovarianta de ordin k:
T

 ( t − M ( t ))( t −i − M ( t −k ))
k = t =1
, k = 1, p
T
si γ0=V(εt)/t=σ2.
In concluzie ρ(εt ,εt-k)= γk/ γ0.
FAC(k) este o functie para: ρk= ρ-k.
Notam cu r (fac) valoarea estimata a parametrului ρ(FAC) si aceasta reprezinta realizarea
functiei de autocorelatie FAC. Pentru un proces de tip zgomot alb sau IIND de medie zero ρk=0
pentru orice k≠0 si ρk=1 pentru k=0.
Statistica Q* a lui Box-Pierce, respectiv varianta sa modificata, statistica Ljung-
Box, urmeaza asimptotic o distributie χ2(p) in ipoteza ca erorile IIND pentru cazul in
care testam autocorelatia de ordin p, ρp.
Testul Q nu testeaza individual fiecare p
coeficient
H
de autocorelatie in parte, ci suma
= T  ri 2 ~  2 ( p) pentru un  fixat
0
acestora pana la ordinul p: Qcalculat
*

i =1
Acest test are putere mica in detectarea autocorelatiilor de aceea in practica
este mult mai indicat sa se utilizeze pentru acest test un prag de semnificatie de
10% in loc de 5%.
Acest test nu este calculat in Eviews ci varianta sa corectata, Testul Q a lui Ljung-
Box: p
r2 H
Qcalculat = T (T + 2)
0
i
~  2 ( p) pentru un  fixat
i =1 T −i
Datorita faptului ca pentru acest test trebuie sa solicitam explicit ordinul
autocorleatiilor testate este posibil sa omitem autocorelatiile seriale de rang mare.
OBS: In Eviews acest test este posibil de aplicat in doua moduri diferite:
1. Din fereastra ‘Equation’->’View’->’Residual Tests’-> ‘Correlogram Q-Statistics’
2. Din fisierul RESID->’View’-> ‘Corelogram’.
Pentru cazul in care in generarea erorii a fost utilizat un model liniar univariat nu exita
diferente intre cele doua rezultate insa in cazul contrar rezultatele vor fi diferite. Pentru a
preintampina aceasta eroare este recomandata accesarea testului Q doar din fereastra
‘Equation’!
Paper sheet
Testul Durbin-Watson
Testul Durbin Watson pentru seriile de timp este un test destul de restrictiv,
atat sub aspectul ordinului autocorelatiei testate cat si sub aspectul restrictiilor
impuse modelului pentru care se poate aplica: modelul trebuie sa aiba constatnta
inclusa si variabilele explicative trebuie sa fie exogene.

Nota: Numim variabile exogene acele variabile care influenteaza modelul fara
insa a fi afectate de acesta.
Testarea Homoscedasticitatii
Testarea homoscedasticitatii: H0: σ εt2=ct. oricare ar fi t=1,T.
1.Breush-Pagan-Godfrey
2.Harvey
3.Glesjer
4. White

Testarea heteroscedaticitatii conditionate:


1. ARCH
2. Corelograma patratului erorilor
Testarea heteroscedasticitatii - Testul Breusch Pagan Godfrey
Este un test din familia Lagrange Multiplier (LM) si utilizeaza statistca:
LM(p)=nR2~χ2(p)
BPG efectueaza o regresie, implicita, intre patratul reziduurilor si regresorii modelului original
Ipoteza nula
H0: γ1=γ2=….= γp=0 (fara constanta γ0)
Alternativ putem utiliza testul F pentru care distributia ramane incerta pentru esantioane de
volum mic!
EXEMPLU: Tabla
Testarea heteroscedaticitatii-Testul Breusch Pagan Godfrey
 OUTPUT EViews

Heteroskedasticity Test: Breusch-Pagan-Godfrey

F-statistic 8.5213 Prob. F(2,269) 0.0003


Obs*R-squared 16.2059 Prob. Chi-Square(2) 0.0003
Scaled explained SS 23.4468 Prob. Chi-Square(2) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/16/16 Time: 10:29
Sample: 1992M01 2014M08
Included observations: 272

Variable Coefficient Std. Error t-Statistic Prob.

C -34970.3800 119884.9000 -0.2917 0.7707


t 5642.5880 2027.8330 2.7826 0.0058
t^2 -13.9205 7.1937 -1.9351 0.0540

R-squared 0.0596 Mean dependent var 390050.0000


Adjusted R-squared 0.0526 S.D. dependent var 672136.1000
S.E. of regression 654224.1000 Akaike info criterion 29.6313
Sum squared resid 115000000000000.0000 Schwarz criterion 29.6710
Log likelihood -4026.8510 Hannan-Quinn criter. 29.6472
F-statistic 8.5213 Durbin-Watson stat 1.5694
Prob(F-statistic) 0.0003
Testarea heteroscedaticitatii- Testul HARVEY
Havrey efectueaza implicit o regresie intre logaritm din patratul erorilor si
regresorii modelului original
EXEMPLU: Tabla
OUTPUT EViews
Testarea heteroscedasticitatii - Testul GLEJSER
- efectueaza implicit o regresie intre reziduul in valoare absoluta si regresorii
modelului original
Testarea homoscedasticitatii- Testul White
- este considerat cel mai general test al homoscedasticitatii. Este considerat a fi
unicul test al heteroscedasticitatii, in adevaratul sens al cuvantului, din Eviews.
- face o regresie dupa patratul erorilor de modelare si combinatii ale
regresorilor din modelul original, inclusiv combinatii cu ele insele, si o
constanta. Optional pot fi incluse/exluse combinatiile intre termeni diferiti (White
cross terms).
- este un test de tip LM bazat pe statistica: LM(p)=nR2~χ2(p)
OBS: Interpretarea lui LM se face cu anumite rezerve, vezi observatiile de la testul
independentei BG. Testul W este f. general deoarece odata respinsa ipoteza nula nu ofera
informatii cu privire la identificarea cauzei heteroscedasticitatii. Testul t poate oferi
orientativ informatii cu privire la sursa heteroscedasticitatii cu aceleasi rezerve ca in cazul
testului BG.
- mai multe informatii pot fi obtinute in cazul utilizarii testului BP.
Exemplu: TABLA
Cu privire la abordarea din PROIECT
CURS 10->STOP
HETEROSCEDASTICITATEA CONDITIONATA
Testarea heteroscedaticitatii-Testul ARCH
ARCH - variabila dependenta resid2
Testul ARCH efectueaza o regresie dupa resid2 si resid2 decalate pe un numar
de perioade de timp (fixate printr-o fereastra de dialog) si o constanta.

H0: Nu exista componente ARCH de ordin mai mare decat ordinul precizat (q)
Heteroskedasticity Test: ARCH
F-statistic 19.723 Prob. F(1,269) 0
Obs*R-squared 18.512 Prob. Chi-Square(1) 0

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/16/16 Time: 10:51
Sample (adjusted): 1992M02 2014M08
Included observations: 271 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 288855 45764.03 6.312 0
RESID^2(-1) 0.2614 0.058862 4.441 0
R-squared 0.0683 Mean dependent var 391176.8
Adjusted R-squared 0.0648 S.D. dependent var 673122.2
S.E. of regression 650931 Akaike info criterion 29.61755
Sum squared resid ‘1.14E+14 Schwarz criterion 29.64413
Log likelihood -4011.2 Hannan-Quinn criter. 29.62822
F-statistic 19.723 Durbin-Watson stat 2.023609
Prob(F-statistic) 1E-05
Testarea heteroscedaticitatii- CORELOGRAMA Patratului reziduurilor

Correlograma erorilor de modelare la patrat (resid2).

OBS: Rezultatul produs se suprapune cu rezultatul furnizat de testul ARCH in


tabelul modelului de regresie!!!
Informatiile pentru PACF se coreleaza
cu informatiile de la testul ARCH
1.Operatorul de intarziere si operatorul diferenta
2.Trenduri deterministe si trenduri stohastice
3.Testarea radacinii unitate testul DF si testul ADF
1. Operatorul de Intarziere (lag)
Operatorul de intarziere sau de decalaj (engl. lag operator sau backward-shift operator) este
notat cu L sau B si are proprietatea:
LXt=Xt-1 , L2Xt=Xt-2, …, LpXt=Xt-p
Specific seriilor de timp este sa utilizam nu atat operatorul de intarziere cat operatorul
de intarziere polinomial :
β(L)= β0 + β1 L+ β2 L2+…+ βpLp+…
si acesta este utilizat in definirea modelelor cu decalaj distribuit:
Yt =B’(L)Xt+εt=(β1 Xt-1+ β2 Xt-2+ …+ βp Xt-p +…)+εt
unde prin B’(L) am notat operatorul de intarziere polinomial fara constanta β0 .
Modelele autoregresive si modelele medie mobila sunt un caz particular de modele
cu decalaj distribuit.
... si Operatorul Diferenta

Operatorul diferenta de ordinul I este reprezentat de diferenta dintre doi termeni


succesivi, decalati cu o perioada de timp. Acesta poate si fi exprimat cu ajutorul
operatorului lag:
Δyt=yt-yt-1=(1-L)yt
Operatorul diferenta de ordinul II este reprezentat de diferenta dintre doi termeni
succesivi, decalati cu 2 perioade de timp:
Δ2yt=Δyt-Δyt-1=(yt-yt-1 )-(yt-2-yt-1) =yt-yt-2=(1-L2)yt
2.Trenduri deterministe (Trend Stationary (TS sau TD))
Spunem despre o ST (Yt) ca prezinta trend determinist daca seria poate fi exprimata
printr-o functie determinista de obicei in functie de timp (f(t)):
iid
Yt =f(t)+εt , cu ε t ~ N(0,σ ε2 ) numita si proces de tip zgomot alb Gausian de medie
zero (Normal Independent Distribuita de medie 0) (Gaussian White Noise).
Exemplul cel mai simplu de functie determinista este:
Yt=β0 +β1t+εt , εt ~NID(0,σ2ε)
Este evident ca Yt este un proces nestationar in medie (media variaza in functie
de timp) deoarece
M(Yt|t)= β0 +β1t->f(t) media sa fiind conditionata de valoarea lui t.
O ST cu trend determinist poate fi usor stationarizata prin scaderea din valorile variabilei
dependente (yt) a componentei deterministe corespunzatoare momentului t (f(t)):
Yt-f(t)=εt, εt~NID(0,σε2)
O alta metoda de inlaturare a influentei trendului determinist liniar este diferenta de
ordinul I:
ΔY t=Yt-Yt-1 =[(β0 +β1t)- (β0 +β1(t-1))]+(εt – εt-1)=β1+(εt – εt-1) care este
stationara in medie si varianta:
M(ΔY t)= β1- ct.
O astfel de serie care contine numai trend determinist poarta denumirea de proces cu
trend stationar (eng. Trend Stationary Process - TSP).
OBS: Pentru o ST cu trend polinomial de ordin m efectuarea unei diferente de ordin
m conduce la stationarizarea seriei in medie.
Procese cu trend Stohastic (Difference Stationary (DSP)): Process de
tip Mers Aleator (Random Walk Process->RWP)
Un proces de tip RW este o serie de timp caracterizata de faptul ca valorile variabilei nu
pot fi inscrise intr-un tipar, acestea fiind aleatoare.
Un model RW este descris de relatia:
Yt=Yt-1+εt, εt~NID(0,σε2), t = 1,∞
1
(1-L)Yt= εt  Yt = ε t  Yt= (1+L2+L3+…) εt 
1-L
M(Yt) =M(εt )+M(εt-1 )+M(εt-2 )+…= 0+0+0+….= 0

V(Yt) =V(εt )+V(εt-1 )+V(εt-2 )+…= σ2ε+ σ2ε+ σ2ε+ …= ∞


Dupa cum se poate vedea acesta este un proces stationar in medie dar nestationar in
varianta.
Procese de tip Mers Aleator cu Deviere
(Random Walk with Drift-> RWD)

Procesul RWD este un model RW la care se adauga o constanta (Drift):

Yt=β0 + Yt-1+εt, εt~NID(0,σε2)

Constanta impinge valorile lui Yt intr-o singura directie crescatoare (+) sau
descrescatoare (-).
Procesul este nestationar si prezinta un trend stohastic.
Facand diferenta de ordinul I modelul RW cat si modelul RWD devine stationar:
(Yt-Yt-1)=εt(1-L)Yt =εt ΔYt=εt, εt~NID(0,σε2)
Acest tip de proces se numeste proces stationar prin diferenta (eng. Difference-
Stationary Process->DSP) sau proces radacina unitate (eng. Unit Root Process).
Fie modelul AR(1) definit prin relatia:
Yt=β1Yt-1+εt  (Yt-β1Yt-1)=εt(1-β1L)Yt=εt, εt~NID(0,σε2) si |β1|<1
1
(1 − 1 L)Yt =  t  Yt =  t  Yt =  t + 1 t −1 + 12 t −2 + 13 t −3 + ...
1 − 1 L
M(Yt) =M(εt )+M(εt-1 )+M(εt-2 )+…= 0 + 0 + 0 +….= 0

𝝈 𝟐
V(Yt) =V(εt )(1+β21 + β41 + β61 +…)= 𝜺 -> ct.
𝟏−𝜷
STOP
Pentru modelul RW , RWD si DSP vom prezenta modelul cu ajutorul decalajului
polinomial:
(1-L)Yt=εt pentru modelel RW si RWD
(1-β1L)Yt=εt, pentru modelul AR(1)
In RW polinomul decalajelor admite solutie doar pe L=1 si pentru modelul AR(1)
admite solutie L=1/β1. Cu alte cuvinte polinomul modelelor nestationare admite o
radacina unitate iar polinomul modelelor stationare admite o radacina supraunitara.
Ipoteza de nestationaritate se testeaza in termenii existentei radacinii unitate:
H0: β1=1 si
H1: | β1|<1 sau varianta sa simplificata 0<β1<1.
DIFERENTA - INTEGRARE

Spunem despre o ST (Yt) ca este integrata de ordinul intai dacaYt nestationara iar ΔYt
este stationara si scriem aceasta : Yt~I(1) (1-L)Yt=εt  ΔYt~I(0)

Spunem despre o ST (Yt) ca este integrata de ordinul doi dacaYt nestationara iar Δ2Yt
stationara si scriem aceasta : Yt~I(2)  ΔYt~I(1)  Δ2Yt~I(0) (1-L)2Yt= εt
Testul Dickey Fuller (DF)
Testul DF este aplicabil modelelor de tip AR si testeaza prezenta radacinii unitate
pentru trei tipuri de modele de procese stohastice:
AR(1) : Yt=β1Yt-1+εt
AR(1) +ct.: Yt=β0+β1Yt-1+εt
AR(1) +ct.+trend det.:Yt=α0+β1Yt-1+α1t+εt
In testarea radacinii parametru de interes maxim este reprezentat de β1 iar valoarea
critica pentru acest parametru in cazul testarii este reprezentata de radacina unitate
(unit root) 1.
In testarea radacinii unitate modelele nu sunt utilizate in forma de mai sus ci intr-o
forma transformata pentru a permite utilizarea testului t.
Modelele transformate se obtin prin scaderea luiYt-1 din ambii termeni ai modelului:
1. AR(1)’ : ΔYt=(1-β1)Yt-1+εt
2. AR(1) ‘+ct.: Δ Yt=β0+(1-β1)Yt-1+εt
3. AR(1) ‘+ct.+trend det.: ΔYt= β 0+(1-β1)Yt-1+λt+εt
notam (1-β1)=γ
Pentru modelele modificate ipoteza testarii radacinii unitate enuntata singular este:
H0: γ=0 cu alternativa H1: γ<0
Statistica utilizata este t =

~ DF-t sub ip. AH 0
s
Testul DF Extins
(Augmented Dikey Fuller->ADF)
Deoarece testul DF este specific doar pentru modele AR(1) pentru cele de ordin mai
mare este incalcata ipoteza de NID pentru eroarea de modelare. In practica este
preferata o varianta extinsa a testului DF denumita testul ADF care permite includerea a p
termeni diferenta cu decalaj.
Pornind de la un model AR(p) de forma:
Yt= β0+β1Yt-1+β2Yt-2+ β3Yt-3+….+ βpYt-p +εt prin adaugari si scaderi repetate se
ajunge la un model de forma:
p −1
1. AR(p) :Yt =  Yt −1 +   i Yt −i +  i unde parametrii αi reprezinta combinatii
i =1
liniare ale parametrilor βi din modelul AR(p) iar γ=1-β1.
Aceleasi transformari se pot efectua si pentru modelele cu constanta si modelele cu
constanta si trend:
p −1

2. AR(p)+ct.: Yt = o +  Yt −1 +   i Yt −i +  t


i =1

p −1

3. AR(p)+ct.+trend det.: Yt = o +  Yt −1 +   i Yt −i + t +  t


i =1

La fel ca in cazul testului DF testarea lui γ implica utilizarea statisticii t~DF-t.


OBSERVATII CU CARACTER PRACTIC PRIVIN TESTAREA
RADACINII UNITATE

DISCUTIE
ANALIZA SERIILOR DE TIMP
Curs Statistica și Previziune Economică anul III

Curs 12-13
2022-2023
Modele AR. Identificarea modelului AR(p): comportamentul pacf si acf.
Modele MA. Identificarea modelului MA(q): comportamentul acf si pacf.
Modele ARMA. Identificarea modelului ARMA(p,q): cu ajutorul pacf si
acf.
Modele ARIMA. Identificarea modelului ARIMA(p,d,q): cu ajutorul pacf ,
acf si ADF
Metodologia Box & Jenkins
Modele AR
Modelul AR(p) fara ct.
Yt =φ1 Yt-1+ φ2Yt-2+ φ3Yt-3+…+ φpYt-p+εt φ(L)Yt=εt
unde:
- φ(L)=1-φ1L-φ2L2-φ3L3-…-φpLp
OBS: 1. Yt este un proces stationar daca pentru ecuatia caracteristica, φ(L)=0,
toate cele p solutii sunt in afara cercului unitate (|Li|>1, i=1,p).
2. Deoarece φ(L)=0, este un polinom finit el este inversabil, iar procesul
AR(p) este echivalent cu un proces infinit de tip MA(∞): Yt = φ(L)-1 εt . Pentu ca
acesta sa fie convergent trebuie sa aiba solutiile in afara cercului unitate (|L|>1)
- εt i.i.N.d. de medie zero => M(εt)= 0 si V(εt )=σε – ct.
OBS: Pentru modelul AR(p) cu constanta:
Yt =φ0+φ1Yt-1+φ2Yt-2+….+φpYt-p+εt => M(Yt)=φ0/(1-φ1-…-φp)
Pp. ca M(Yt)=0 in caz contrar efectuam transformarea
Yt-M(Yt)=Yt* si in continuare vom lucra cu variabila transformata M(Yt*)=0.
Identificarea AR(p): comportamentul PACF si ACF
Functia pacf pentru un proces AR(p) ->coeficientii pacf sunt egali cu zero (nu
difera semnificativ de zero), pentru k>p. Valorile coeficientilor pacf sunt
reprezentate de coeficientii, φi, i=1,p, ai modelului AR(p).
Functia pacf poate fi utilizata pentru identificarea ordinului unui proces de
tip AR.

Functia acf pentru un proces AR(p)-> coeficientii acf se amortizeaza


exponential sau armonic pe masura ce valorile lui k cresc. Aceasta face
imposibila diferentierea intre modele AR de ordine diferite.
Functia acf nu poate fi utilizata pentru identificarea ordinului unui proces
de tip AR.
Modele MA
MA(q) fara ct.
Yt = εt-θ1 εt-1- θ2 εt-2- θ3 εt-3-…-θq εt-q Yt = θ(L)εt
unde
θ(L)=1-θ1L -θ2L2 -θ3L3-…-θqLq
OBS: 1. Yt este un proces stationar daca pentru ecuatia caracteristica, θ(L)=0,
toate cele p solutii sunt in afara cercului unitate (|Li|>1, i=1,p).
2. Deoarece θ(L)=0, este un polinom finit el este inversabil, iar procesul
MA(q) este echivalent cu un proces infinit de tip AR(∞): θ(L)-1Yt = εt . Pentu ca
acesta sa fie convergent trebuie sa aiba solutiile in afara cercului unitate (|Li|>1,
i=1,p)
- εt i.i.N.d. de medie zero => M(εt)= 0 si V(εt )=σε – ct.
OBS: Pentru modelul MA(q) cu constanta:
Yt =θ0- εt-θ1 εt-1-…-θq εt-q => M(Yt)=θ0-0-…-0
Identificarea modelului MA(q): comportamentul ACF si PACF

Functia pacf (partial autocorelation function) – Pentru un proces MA(q),


coeficientii pacf se amortizeaza exponential sau armonic pe masura ce valorile lui
k cresc. Aceasta face imposibila diferentierea intre modele MA de ordine diferite.
Functia pacf nu poate fi utilizata pentru identificarea ordinului unui proces de
tip MA.

Functia acf (autocorelation function) – Pentru un proces MA(q), coeficientii acf


sunt egali cu zero, pentru k>q. Functia acf poate fi utilizata pentru identificarea
ordinului unui proces de tip MA.
Modele ARMA
Modelul ARMA(p,q)
– p ordinul componentei AR si q ordinul componentei MA

Yt =φ1 Yt-1+…+ φpYt-p+ εt-θ1 εt-1- …-θq εt-q


φ(L)Yt= θ(L)εt  Yt= [θ(L)/φ(L)]εt

unde:
φ(L)=1-φ1L-φ2L2-φ3L3-…-φpLp
θ(L) =1-θ1L-θ2L2-θ3L3-…-θqLq
εt i.i.N.d. de medie zero => M(εt)= 0 si V(εt )=σε – ct.
Identificarea modelului ARMA: comportamentul ACF si PACF

Functia pacf (partial autocorelation function)


Pentru un proces ARMA(p,q), coeficientii pacf descresc brusc dupa
componenta de ordin p.
Functia pacf poate fi utilizata pentru identificarea ordinului procesului de
tip AR dintr-un model de tip ARMA(p,q).
Functia acf (autocorelation function)
Pentru un proces ARMA(p,q), coeficientii acf descresc brusc dupa
componenta de ordin q.
Functia acf este poate fi utilizata pentru identificarea ordinului unui proces
de tip MA dintr-un model de tip ARMA(p,q).
Modele ARIMA
Modelele de tip ARIMA(p,d,q) sunt modele ARMA cu variabila Yt diferentiata
de ordin d.
ΔdYt =φ1 Yt-1+…+ φpYt-p+ εt+θ1 εt-1+ …+ θq εt-q
φ(L) ΔdYt= θ(L)εt  ΔdYt= [θ(L)/φ(L)]εt
unde:
φ(L)=1-φ1L-φ2L2-φ3L3-…- φpLp
θ(L)=1-θ1L-θ2L2-θ3L3-…-θqLq
εt i.i.N.d. de medie zero => M(εt)= 0 si V(εt )=σε – ct.
Δd=(1-Ld)
Odata integrat modelul devine un model de tip ARMA(p,q) pentru variabila
ΔdY.
OBS: 1. Modelul ARIMA prezentat este un model nestationar omogen de ordin d
si el prezinta numai componenta trend stohastic .
Daca dorim ca modelul sa prezinte simultan si o componenta de tip trend
determinist polinomial de ordin d atunci la modelul ARIMA prezentat anterior se va
mai adauga o constanta θ0:
ΔdYt =φ1 Yt-1+…+ φpYt-q+ θ0+εt-θ1εt-1- …-θqεt-q
φd(L) ΔdYt= θ0+θ(L)εt

2. Ordinul integrarii modelului ARIMA este fixat pe baza unui test radacina
unitate specific.
Metodologia BOX & JENKINS
1. Identificarea clasei de modele corespunzatoare ST analizate
(AR(p), MA(q), ARMA(p,q), ARIMA(p,d,q)):
A. Analiza stationaritatii ST (testarea radacinii unitate):
-identificarea existentei unui trend determnist
-identificarea existentei trendului sohastic =>ordinul de integrare (d)
B. Identificarea ordinului componentelor AR si MA:
-analiza pacf -> ordinul p al componentei AR;
-analiza acf -> ordinul q al componentei MA.

Obs: Fixarea ordinului AR si MA este un ‘compromis’ rezultat in urma analizei


simultane a pacf si acf pentru o familie de modele aflata in imediata vecinatate
a modelului ARMA sugerat de analiza individuala a functiilor pacf si acf.
2. Estimarea si testarea parametrilor pentru familia de modele selectata la
pasul 2.
3. Diagnosticarea si validarea modelului optim din familia de modele
estimate la pasul 2:
A. Testarea ipotezelor cu privire la eroarea de modelare (iiNd de medie zero);
B. Alegerea celui mai bun/ celor mai bune modele pe baza indicatorilor acuratetei
modelelor:
-adjusted R square (max.), AIC (min) , SIC (min.), HQIC (min)
- min(p+q)-> pentru modelul ales
4. Realizarea de prognoze pe baza modelelor selectate la pasul anterior si
alegerea modelului/ modelelor care dau cele mai bune prognoze.
Sfaturi practice privind alegerea celui mai bun model ARIMA

Vezi
TURTUREAN C. I., Introducere in analiza seriilor de timp cu SPSS
- Ghid Aplicativ, 2008, pp.124-127
Modele ARCH-GARCH
GARCH = Generalized Autoregressive Conditional Heteroskedasticity
Modele ARCH specifice erorilor de modelare au fost propuse de
ENGLE (1982) si sunt aplicate cu succes pentru modelarea volatilitatii
pietelor financiare.
Modelul asa cum a fost prezentat de Engle este descris de relatia:

 2 =  0 + 1 t2−1 + ... +  p t2− p


t

sau aceeasi relatie exprimata de data aceasta cu ajutorul operatorilor


mediei si variantei in ipoteza ca M(εt)=0 este satisfacuta:
 2 = V ( t |  t −1 ,  t − 2 ,....,  t − p ) = E( t2 |  t −1 ,  t − 2 ,....,  t − p )
t
In descrierea unui proces de tip ARCH este necesara descrierea a doua
relatii:
1. una pentru a descrie relatia de tip medie conditionata (modelele ARMA
sau orice alt model de regresie liniara multipla) care au generat seria
reziduurilor εt:
ARMA(p,q): φ(L)Yt= θ(L) εt
2. cea de-a doua pentru a descrie modelul de tip ARCH(p):
t = t  2
t

p
unde  2 =  0 + 1 t2−1 +  2 t2− 2 + ... +  p t2− p =  0 +   i t2−i
t
i =1

este ecuatia variantei conditionate ARCH(p) si δt~i.i.d. δt~N(0,1) si εt~N(0, σ2εt).


Varianta mai poate fi exprimata ca un proces de tip ARCH(p) la care se mai
adauga si influenta variantelor anterioare pana la momentul t-q. In acest caz
modelul va purta denumirea de model de tip GARCH(p,q) si va fi descris de
relatia: p q
  =  0 +   i t −i +  i 2
2
t
2
t −i
i =1 i =1

Determinarea ordinelor modelului de tip GARCH se realizeaza prin


corelograma erorilor la patrat asemanator cu identificarea ordinelor modelului
de tip ARMA.
Pot fi utilizate de asemenea teste specifice cum ar fi testul LM ARCH
prezentat intr-un curs anterior.

S-ar putea să vă placă și