Sunteți pe pagina 1din 10

1

Modele staionare liniare pentru analiza seriilor de timp


Curs 13 Econometrie 8 ian. 2014

5. Modele autoregresive de medie mobil (Auto Regressive Moving Average - ARMA(p,q))

Un model de tip ARMA(p,q) are o component de tip autoregresiv i o component de tip medie
mobil. Componenta autoregresiv se justific prin faptul c variabilele economice au n evoluie
un puternic caracter inerial iar componenta de medie mobil este efectul unor evenimente
neateptate, nepredictibile, asupra unei variabile economice.
Modelul ARMA este cel mai indicat model pentru a se realiza predicii n economie.
Fie procesul
t
zgomot alb, 0 , q p numere ntregi i coeficienii
q p
. , , , , , ,
2 1 2 1
L L R.
Un proces stochastic
t
Y cu valori reale este un proces autoregresiv de medie mobil de ordin p,q i
se noteaz ARMA(p,q) dac satisface o ecuaie de forma:
q t q t t t p t p t t t
y y y y

+ + + + + + + = L L
2 2 1 1 2 2 1 1
.
Putem rescrie aceast ecuaie folosind operatorul lag, polinomul autoregresiv de ordin p i
polinomul de medie mobil de ordin q:
t t
L y L ) ( ) ( = , ) , 0 ( ~
2

WN
t

Modelul este staionar dac componenta AR este staionar, adic rdcinile ecuaiei 0 ) ( = z
sunt n afara cercului unitate. Pentru un model ARMA(p,q) avem condiia necesar 1
1
<
=
p
i
i
.
Modelul este inversabil dac componenta MA este inversabil, adic rdcinile ecuaiei 0 ) ( = z
sunt n afara cercului unitate. Caracteristicile unui proces ARMA vor fi o combinaie a celor de la
componentele AR i MA.
ACF descrete la zero cnd decalajul tinde la infinit, scznd exponenial cnd rdcinile ecuaiei
0 ) ( = z sunt reale i cu fluctuaii cnd acestea sunt complexe; PACF descrete la zero,
exponenial cnd rdcinile ecuaiei 0 ) ( = z sunt reale i cu fluctuaii cnd acestea sunt
complexe. Obinerea celor dou funcii necesit calcule algebrice complicate.
Funcia ACF (singur), poate face distincia dintre un proces AR pur i un proces MA pur.
Funcia PACF este util pentru a distinge un proces AR(p) de un proces ARMA(p,q). Astfel, un
proces AR(p) are o ACF descresctoare geometric i o PACF care scade la 0 dup p laguri, n timp
ce un proces ARMA(p,q) are ambele funcii ACF i PACF descresctoare geometric.
Un proces stochastic ARMA(p,q) este un proces cauzal dac procesul
t
Y are o reprezentare n
funcie de termenii procesului zgomot alb t s
s
, i este independent de viitorul dat prin t s
s
> , .
Un proces ARMA(p,q) este cauzal dac exist un ir ) (
j
, astfel nct <

=
| |
0 j j
i
=

= 0 j j t j t
y , Z j .
Un proces ARMA(p,q) este inversabil dac exist un ir ) (
j
, astfel nct <

=
| |
0 j j
i
=

= 0 j j t j t
y , Z j .
Clasa de procese ARMA este folosit pentru a modela procese stochastice staionare.
Proprietile de cauzalitate i inversabilitate depind de zerourile polinoamelor autoregresive i de
medie mobil, respectiv. Reprezentarea cauzal a unui proces ARMA poate fi utilizat pentru a
calcula funcia de covarian, care conine toate informaiile despre structura de dependen.

Modele ARMA(1,1)
Fie } {
t
y un proces stochastic de tip ARMA(1,1).
2

1 1
+ + =
t t t t
y y
a) S se scrie modelul cu ajutorul operatorului de decalaj L.
1 1
+ =
t t t t
y y
t t
L y L ) 1 ( ) 1 ( + =
b) S se scrie procesul } {
t
y ca un proces MA( )
L + + + + =
3 3 2 2 1 1 t t t t t
y
t t
L L L y ) 1 (
3
3
2
2 1
L + + + + =
Cum determinm ponderile ? , , ,
3 2 1
L
t t
L y L ) 1 ( ) 1 ( + =
t t
L L L L L ) 1 ( ) 1 ( ) 1 (
3
3
2
2 1
+ = + + + + L
) 1 ( ) 1 ( ) 1 (
3
3
2
2 1
L L L L L + = + + + + L
Ponderile
j
se calculeaz din identitatea ) 1 ( ) 1 ( ) 1 (
3
3
2
2 1
L L L L L + = + + + + L .
) 1 ( ) 1 (
4
3
3
3
3
2
2
2
2
1 1
L L L L L L L L + = + + + + L
Prin identificarea coeficienilor lui
j
L , se obin ponderile:
=
1
+ =
1

0
1 2
= ) (
1 2
+ = =
0
2 3
= ) (
2
2 3
+ = =
Obinem ponderile ) (
1
1
+ = =

j
j j
, pentru 2 > j .
Ponderile sunt convergente dac 1 | | < . Aceasta este condiia de staionaritate.
Rezult scrierea sub forma L + + + + + + + =
3
2
2 1
) ( ) ( ) (
t t t t t
y
c) S se determine autocovarianele procesului, apoi ssedetermine autocorelaiile procesului.
Am obinut exprimarea cu ajutorul filtrului liniar:
L + + + + + + + =
3
2
2 1
) ( ) ( ) (
t t t t t
y
Obinem:
2
3
2
2 1
)) ) ( ) ( ) ( ( ( ) ( = + + + + + + + =

L
t t t t t t t
E y E
2
3
2
2 1 1 1
) ( )) ) ( ) ( ) ( ( ( ) ( + = + + + + + + + =

L
t t t t t t t
E y E
L + + + + + + + =
4
2
3 2 1 1
) ( ) ( ) (
t t t t t
y
0 )) ) ( ) ( ) ( ( ( ) (
4
2
3 2 1 1
= + + + + + + + =

L
t t t t t t t
E y E
2
4
2
3 2 1 1 1 1
)) ) ( ) ( ) ( ( ( ) ( = + + + + + + + =

L
t t t t t t t
E y E
0 ) (
2 1
=
t t
y E
Relaia
1 1
+ =
t t t t
y y o nmulim cu
k t
y


k t t k t t k t t k t t
y y y y y y

+ =
1 1

Aplicm operatorul de medie:
) ( ) ( ) ( ) (
1 1 k t t k t t k t t k t t
y E y E y y E y y E

+ =
) ( ) (
1 1 k t t k t t k k
y E y E

+ =
Pentru k=0 obinem:
) ( ) (
1 1 0 t t t t
y E y E

+ =
2 2 2
1 0
)) ( 1 ( ) ( + + = + + =
3

Pentru k=1 obinem:
) ( ) (
1 1 1 0 1
+ =
t t t t
y E y E
2
0 1
0 + =
2
0 1
+ =
nlocuim n ecuaia obinut pentru k=0 i obinem:
2 2
0 0
)) ( 1 ( ) ( + + = +
2 2 2
0
2
) 2 1 ( )) ( 1 ( ) 1 ( + + = + + + =
2
2
2
0
1
2 1

+ +
=
Dar
2
2
2 2 2
2
0 1
1
2

+ + +
= + =
2
2
2
2
2 2
1
1
) 1 )( (
1

+ +
=

+ + +
=
Pentru k=2 obinem: 0 ) ( ) (
2 1 2 1 2
= + =
t t t t
y E y E
Pentru 2 k avem
1
=
k k

Determinm ACF
2
0
1
1
2 1
) 1 )( (

+ +
+ +
= =
Pentru 2 k avem
1
=
k k
. Mrimea lui
1
depinde att de ct i de .
Dac 1 0 < < , convergena este direct. Dac 0 1 < < , autocorelaiile vor oscila.
Funcia ACF a unui model ARMA(1,1) este similar cu cea a unui proces AR(1), fiind o
descretere exponenial. Diferena este c descreterea ncepe de la
1
i nu de la 1
0
= ca n
cazul AR(1).
Funcia PACF pentru un model ARMA(1,1) se comport ca n cazul MA(1), dup valoarea iniial
1 11
= urmeaz o descretere exponenial.
2
1
2
1 2
22
1

=
1
1
, 1
1
1
, 1
1
k
j
j j k
k
j
j k j k k
kk


, unde 1 ,..., 3 , 2 , 1 ,
, 1 , 1
= =

k j
j k k kk j k kj
.
Exemplu:
1 1
+ + =
t t t t
y y
1 1
7 , 0 7 , 0

+ =
t t t t
y y 7 , 0 = i 7 , 0 =
a) S se calculeze ACF:
2
0
1
1
2 1
) 1 )( (

+ +
+ +
= = 8445 , 0
49 , 0 ) 49 , 0 ( 2 1
) 49 , 0 1 )( 7 , 0 7 , 0 (
1
=
+ +
+
=


Pentru 2 k avem
1
=
k k

591 , 0 ) 8445 , 0 )( 7 , 0 (
1 2
= = =
414 , 0
2 3
= = ; 290 , 0
4
= ; 203 , 0
5
= ; 142 , 0
6
= , 099 , 0
7
= ; 07 , 0
8
=
b) S se calculeze PACF:
8445 , 0
1 11
= =
4

426 , 0
) 8445 , 0 ( 1
) 8445 , 0 ( 591 , 0
1
2
2
2
1
2
1 2
22
=


=



Pentru a determina
33
, calculm 204 , 1
11 22 11 21
= =
262 , 0
) 591 , 0 )( 426 , 0 ( ) 8445 , 0 )( 204 , 1 ( 1
) 8445 , 0 )( 426 , 0 ( ) 591 , 0 )( 204 , 1 ( ) 414 , 0 (
1
2
1
2
2
1
3 2 3
33
=


=

=
=

j
j j
j
j j



173 , 0
1
3
1
3
3
1
4 3 4
44
=

=
=

j
j j
j
j j



unde
j j j
=
2 , 2 33 2 3
315 , 1
31
= ; 74 , 0
32
= ;
117 , 0
55
= ; 081 , 0
66
= ; 056 , 0
77
= ; 039 , 0
88
=

6. Modelele ARIMA i construirea lor prin metodologia Box-Jenkins

Box i Jenkins(1970) au propus o metodologie pentru previzionarea unei variabile doar pe baza
valorii prezente i a valorilor din trecul ale variabilei.
1. Cum modelm o serie nestaionar, i ce fel de model putem folosi pentru a descrie
comportamentul unei serii staionare?
2. Cum folosim modelul ajustat pentru prognoz?
Modelele de tip ARMA pot s aproximeze cele mai multe procese staionare.
Pentru c n economie sunt puine serii de timp staionare, sunt necesare modele care s fie
capabile s reproduc comportamentul nestaionar. Modelele ARMA au fost generalizate pentru
serii nestationare care devin staionare prin difereniere. Modelele rezultate au fost numite modele
autoregresive de medie mobil integrate ARIMA(p,d,q) unde d este ordinul de difereniere
necesar pentru staionarizarea seriei. Astfel de modele (modele ARMA integrate), se obin prin
presupunerea c o serie cronologic poate fi reprezentat, dup difereniere, printr-un model de tip
ARMA.
O serie de timp
t
y este un proces ARIMA(p,1,q) dac seria
t t t t
y L y y z ) 1 (
1
= =

, obinut
prin aplicarea operatorului de diferen urmeaz un model ARMA(p,q) staionar i inversabil.
Modele ARIMA(AutoRegressive Integrated Moving Average) sunt folosite pentru a analiza
dinamica seriilor de timp unidimensionale. Un model ARIMA are trei componente: termenul
autoregresiv, termenul privind ordinul de integrare i termenul de medie mobil.
Ordinul de integrare arat ordinul d, de difereniere al seriei analizate. Valoarea 1 = d semnific
faptul c modelul este specificat pentru prima diferen a seriei originale. Valoarea 2 = d
corespunde diferenelor de ordin doi ale seriei originale.
Modelele ARIMA sunt utile pentru a reprezenta perturbaii n sisteme cu grad mare de inerie.
Aceste modele sunt foarte performante n a reprezenta serii de timp nestaionare omogene.

Multe serii de timp din economie sunt nestaionare, dar sunt integrate. Dac o serie de timp este
) (d I , dup diferenierea seriei de d ori se obine o serie staionar, adic ) 0 ( I . Aplicnd un model
ARMA acestei serii ) 0 ( I , spunem c seria de timp iniial este un proces de medie mobil
integrat, autoregresiv, notat ARIMA(p,d,q). Se tie deja c p indic numrul de termeni
autoregresivi, q indic numrul de termeni de medie mobil, iar d arat de cte ori a fost
difereniat seria pentru a deveni staionar.
5

Metodologia Box-Jenkins are ca obiectiv identificarea i estimarea unui model statistic care poate
fi considerat c a generat datele de selecie. Acest model estimat va fi utilizat pentru prognoze i
este necesar presupunerea c are caracteristici constante n timp. Selectarea modelului ARIMA
potrivit pentru datele observate se realizeaz printr-o procedur iterativ (metodologia Box-
Jenkins), bazat pe mai multe etape.

EtapaI. Identificarea.
Obiectivul identificrii este de a selecta o subclas a unei familii de modele ARIMA, potrivite
pentru a reprezenta o serie de timp, adic un proces economic evolutiv.
n etapa de identificare sunt analizate datele observate i toate informaiile disponibile care sunt
capabile s sugereze o subclas de modele ce pot descrie modul de generare a datelor.
Elementele de teorie economic pot sugera tipul de model potrivit pentru un anumit proces
economic. Astfel, procesele economice ineriale (consumul, inflaia, plata impozitelor) sau cele
dependente de propriile realizri anterioare (exportul, productivitatea, investiiile, producia din
sectorul zootehnic, calitatea produciei), se recomand a fi reprezentate de un model AR, ARI,
ARMA sau ARIMA.
Procesele economice care pot fi relativ uor influenate de ocuri exterioare, dar care permit
msuri compensatorii n timp (aprovizionarea, producia, cotaia la burs) se recomand a fi
reprezentate de un model MA sau care include o component MA.
Identificarea nseamn determinarea tipului de model i a ordinului modelului ce urmeaz a fi
folosit pentru a reproduce caracteristicile dinamice ale datelor. Pentru a determina cea mai bun
specificare sunt folosite reprezentri grafice ale datelor i ale funciilor ACF i PACF de selecie.
Se analizeaz funciile de autocorelaie i autocorelaie parial de selecie.
Mai nti se examineaz seria de analizat, pentru a vedea dac ar fi putut fi generat de un proces
staionar. De regul, seriile de timp din economie nu sunt staioanare. O astfel de serie poate avea
urmtoarele caracteristici:
1. Seria prezint o medie care nu este constant n timp, dar variaiile sunt constante de la o
perioad la alta; seria urmeaz, de regul, o traiectorie liniar, cu panta pozitiv sau negativ. Se
spune c este o serie nestaionar de tip omogen.
2. Seria prezint variaii care nu sunt constante de la o perioad la alta. Se spune c este o serie
nestaionar de tip neomogen.
Folosim reprezentarea grafic a seriei pentru a vedea dac are varian staionar. Dac dispersia
datelor variaz cu timpul, seria este nestaionar. n acest caz se poate aplica datelor tansformarea
Box-Cox: 0 , / ) 1 ( ) ( =

y y i 0 , log ) ( = = y .
Urmeaz analiza staionaritii n medie. Acest lucru se poate face examinnd graficul valorilor
seriei, examinnd corelogramele de selecie sau aplicnd un test pentru o rdcin unitar, precum
testul Dickey-Fuller. Autocorelaiile de selecie sunt estimaii consistente ale coeficienilor
populaiei, aa nct corelograma de selecie a unui proces staionar tinde la zero pentru lungimi de
lag moderate. O serie nestaionar are o SACF care nu descrete. O serie integrat are SACF ce
descrete foarte ncet, iar SPACF scade foarte repede, la lag-ul 2 = k i prima valoare este foarte
apropiat de 1.
Dac seria arat un model de nestaionaritate, se staionarizeaz seria prin aplicarea unor
transformri potrivite. De exemplu, se logaritmeaz valorile iniiale ale seriei, apoi se difereniaz
seria pn la obinerea staionaritii. Lum seria diferenelor de ordinul nti i analizm dac este
staionar, ntr-un mod similar. Metodele grafice pot fi nsoite de teste de rdcin unitar. Acest
proces de a efectua diferenele va continua pn la obinerea unei serii staionare.
Dup obinerea unei serii staionare, se compar SACF i SPACF ale seriei staionare cu diferite
modele liniare teoretice ARMA, iar aceast comparaie poate sugera cteva modele plauzibile.
6

n cazul unui model AR(p) ACF este infinit iar PACF este finit.
Coeficienii de autocorelaie descresc spre 0 geometric sau n alternan, pe msur ce crete lag-ul
k. Coeficienii de autocorelaie parial descresc brusc la 0 dup un anumit numr de decalaje,
astfel nct pentru 0 , >
kk
p k .
Rezult c, dac coeficienii
k
scad n progresie geometric i coeficienii
kk

scad brusc
astfel nct 0


kk
, pentru p k > , se recomand un model AR(p). Deci p este cea mai mare
valoare a lui k, pentru care coeficienii de autocorelaie parial estimai,
kk

, se afl n afara
intervalului ) / 96 , 1 ( n .
n cazul unui model MA(q), PACF este infinit iar ACF este finit.
Coeficienii de autocorelaie scad brusc la 0 astfel nct pentru 0 , >
k
q k .
Coeficienii de autocorelaie parial descresc spre 0 exponenial sau cu fluctuaii. Rezult c,
dac coeficienii
k
scad brusc astfel nct 0
k
pentru q k > i coeficienii
kk

scad n
progresie geometric, se recomand un model MA(q). Deci q este cea mai mare valoare a lui
k, pentru care coeficienii de autocorelaie estimai,
k
, se afl n afara intervalului
) / 96 , 1 ( n .
Pentru un model ARMA(p,q), att coeficienii de autocorelaie ct i coeficienii de autocorelaie
parial descresc spre 0 exponenial sau geometric. Ordinul p, al prii autoregresive din model,
este dat de coeficientul de autocorelaie parial care prezint un nivel semnificativ, iar ordinul q,
al prii de medie mobil din model, este dat de coeficientul de autocorelaie care prezint un nivel
semnificativ. La acest moment, folosirea unui model de tip ARMA(p,q) este doar la stadiul de
intenie.
Observaie: Scderea coeficienilor de autocorelaie trebuie neleas n valoare absolut.
Descretera coeficienilor de AC sau PAC poate fi ntrerupt de valori mai mari (n valoare
absolut) n cazul n care datele prezint sezonalitate (de ex., n cazul datelor trimestriale, se pot
ntlni valori mari ale coeficienilor
4
sau
44

, comparativ cu valorile coeficienilor


3
,
5
,
6
.
Se recomand selectarea mai multor variante de modele, printre care i o variant ARMA, pentru a
fi estimate i verificate.
- Dac exist o valoare a decalajului, q, dup care valoarea funciei de autocorelaie scade brusc
spre 0 rezult c, pentru prelucrarea seriei, este indicat folosirea unui proces MA(q) pur sau a
unui proces ce conine o component MA(q).
- Dac valoarea funciei de autocorelaie parial
kk kk

= , scade brusc spre 0 dup o valoare a


decalajului egal cu p, rezult c, pentru prelucrarea seriei, este indicat folosirea unui proces
AR(p) pur sau a unui proces ce conine o component AR(p). Se consider c valoarea lui
kk kk

= difer semnificativ fa de zero dac nu este coninut n intervalul


( ) n t n t
n n
/ 1 ; / 1
2 ; 2 / 2 ; 2 /
+

.

Etapa II. Estimarea parametrilor modelului identificat.
Estimarea parametrilor unui model de tip AR(p) se face prin MCMMP, minimiznd suma
ptratelor reziduurilor sau prin ecuaiile Yule-Walker de selecie.
Dac n model exist termeni de tip MA, minimizarea sumei ptratelor reziduurilor sau
maximizarea funciei de verosimilitate necesit metode de estimare neliniare (Newton, Davidson-
Fletcher-Powell).
7

Parametrii unui model ARIMA(p,d,q), se pot estima consistent prin MCMMP sau prin metoda
verosimilitii maxime. Ambele procedee de estimare sunt bazate pe calculul inovaiilor
t
din
valorile variabilei staionare.
Estimarea diverselor variante de modele, care au fost sugerate de corelogram n etapa de
identificare, va fi realizat cu ajutorul unui program ARMA dintr-un pachet de programe (EViews,
SAS, SPSS). Vom atribui valori pentru p i q n diverse combinaii i vom obine estimaii ale
coeficienilor modelelor corespunztoare.
Verificarea corectitudinii modelului identificat.
Dup ce modelele ARMA selectate au fost estimate, dorim s ne asigurm c sunt potrivite. Pentru
aceasta se analizeaz att reziduurile ct i parametrii pentru fiecare model.
Testarea reziduurilor
Practica standard este de a reprezenta grafic reziduurile modelului estimat.
Dac modelul estimat este adecvat, reziduurile ar trebui s fie aproximativ zgomot alb. Deci,
reziduurile obinute pentru modelul estimat sunt analizate pentru a stabili dac provin dintr-un
proces de zgomot alb. n caz afirmativ, tipul de model propus este o bun aproximaie pentru
procesul stochastic de baz. n caz contrar, procesul este reluat, metoda fiind una iterativ.
Pentru a controla dac reziduurile au media zero i sunt necorelate folosim att graficul, ct i
ACF i PACF ale reziduurilor. ACF i PACF teoretice ale procesului WN iau valoarea zero
pentru lagurile 0 k , aa c, dac modelul este potrivit, cei mai muli din coeficienii funciilor
SACF i SPACF ar trebui s fie apropiai de zero. n practic, cerem ca 95% din aceti coeficieni
s se afle n interiorul unor limite de nesemnificaie. Mai mult, statistica Ljung-Box ar trebui s
aibe valori mici, deoarece corespunde la variabile necorelate.
Un model care conduce la obinerea unor coeficieni de autocorelaie a reziduurilor semnificativi
sau la o statistic Q semnificativ la nivelul de semnificaie de 10%, trebuie eliminat.
Dac se observ c variana reziduurilor este cresctoare, rezult c este potrivit o transformare
logaritmic. Este foarte important ca reziduurile obinute prin estimarea unui model s fie serial
necorelate. Deci, orice model care nu produce reziduuri aleatoare ar trebui s nu fie luat n
considerare, ci eliminat.
Testarea parametrilor
Se pot aplica testele de semnificaie clasice t i F
Este important, de asemenea, s fie satisfcute condiiile de staionaritate i inversabilitate. Dac
factorizm polinoamele AR i MA i una din aceste rdcini este apropiat de 1, aceasta este un
semn de absen a staionaritii sau inversabilitii.
Departajarea ntre mai multe modele
Presupunnd c sunt estimai parametrii pentru mai multe modele identificate ca fiind
ARIMA(p
i
,d,q
i
), se pot utiliza dou tipuri de indicatori: ai calitii reziduurilor sau ai teoriei
informaiei.
a) Indicatori ai calitii reziduurilor
Dintre modele estimate se alege modelul cu cea mai mic varian a reziduurilor, cu cea mai mare
valoare a lui
2
R i cu cea mai mare valoare a statisticii F.
b) Indicatori ai teoriei informaiei
Pentru fiecare din modelele estimate se calculeaz indicatorii AIC(criteriul Akaike) i BIC
(criteriul Schwarz): AIC
n
q p +
+ = 2 log
2

, BIC
n
n
q p
log
) ( log
2
+ + =

.
Se alege modelul cu cea mai mic valoare a indicatorului.

Etapa III. Efectuarea de prognoze cu ajutorul modelelor ARIMA.
8

Obiectivul principal urmrit prin construirea unui model ARMA este de a predicta sau prognoza
evoluia viitoare a unei variabile economice. Modelul selectat, pentru care s-a verificat
corectitudinea, poate fi utilizat pentru prognoz. Modelele ARIMA sunt destul de apreciate pentru
succesul n a face predicii. Prognozele obinute prin aceaste modele sunt considerate mai bune,
mai ales pe termen scurt, dect cele obinute prin modelarea econometric tradiional, n cazul
seriilor cronologice.
Prognozarea unei serii de timp const n ncercarea de a previziona valori viitoare ale seriei, innd
seama de valorile din trecut ale seriei i de valorile din trecut ale unui termen eroare. Se pot
efectua prognoze punctuale (se previzionaz o singur valoare a variabilei) sau prognoze pe
interval (se determin un domeniu de valori n care anticipm c se va afla valoarea viitoare a
variabilei, pentru un nivel de semnificaie dat).
Ipoteza cheie: Stationaritatea seriei
-regula de baz care guverneaz nu se schimb
-comportamentul viitor poate fi dedus pe baza trecutului
-avem suficiente observaii din trecut pentru a nelege procesul de baz.
Considerm c ) (
t
y este un proces stochastic staionar cu media zero. Putem presupune c suntem
la momentul t i suntem interesai de a prognoza sau previziona valorile acestui proces pentru
cteva perioade din viitor, pe baza observaiilor din trecut. Istoria acestui proces este coninut
ntr-o mulime a informaiilor iar predicia va fi bazat pe aceast mulime de informaii. n
practic, aceast mulime este o mulime finit } ,..., , {
1 p t t t
y y y

, reprezentnd trecutul recent.
Totui, n dezvoltarea teoriei prediciei, este util a se considera o mulime a informaiilor infinit
,...} ,..., , {
1 p t t t t
y y y I

= , reprezentnd ntregul trecut. Vom nota predicia lui
h t
y
+
, care este fcut
la momentul t, prin ) (h y
t
sau
h t
y
+
. Vom spune c t este originea, h este orizontul de timp iar
) (h y
t
este valoarea previzionat pentru
h t
y
+
cu h perioade nainte. n general, predictorul
) (h y
t
( predictorul lui
h t
y
+
, construit la timpul t), este o funcie de variabilele din mulimea
t
I .
Definim eroarea de previziune (de prognoz) a lui
h t
y
+
, diferena dintre valoarea real i cea
previzionat:
h t h t t h t
y y h y y
+ + +
= ) (
Criteriul folosit n mod obinuit pentru a aprecia performana unui estimator sau predictor al unei
variabile aleatoare este minimizarea ptratului erorii medii condiionate, de prognoz, adic:
( )
t t h t
I h y y E | )) ( ( min
2

+
.
Vom folosi una din notaiile: ) ( ) | ( ) (
h t t t h t t
y E I y E h y
+ +
= = .
Notm cu
h t
f
,
o prognoz pentru o serie y, prognoz realizat folosind un model ARMA(p,q), la
momentul t, pentru h perioade n viitor.
Predicia cu ajutorul modelului MA(q)
Un proces MA(q) are o memorie doar de lungime q i aceasta limiteaz orizontul de prognoz.
De exemplu, presupunem c am estimat un model MA(3):
3 3 2 2 1 1
+ + + + =
t t t t t
y
Deoarece se presupune c parametrii sunt constani n timp, dac relaia anterioar are loc la
timpul t, ea va avea loc i la momentele ,... 2 , 1 + + t t . Vom putea scrie relaiile:
2 3 1 2 1 1 1 + +
+ + + + =
t t t t t
y
1 3 2 1 1 2 2 + + +
+ + + + =
t t t t t
y
t t t t t
y
3 1 2 2 1 3 3
+ + + + =
+ + + +

9

inem cont c toate informaiile pn la timpul t, inclusiv cele de la timpul t, sunt cunoscute i
disponibile. Realizarea de prognoze nseamn a considera mediile condiionate de informaiile
disponibile. Perturbaiile ,... ,
2 1 + + t t
nu sunt cunoscute la timpul t. Cea mai bun prognoz pentru
media condiionat a lui
1 + t
este zero, adic 0 ) | ( ) (
1 1
= =
+ + t t t t
I E E , datorit ipotezelor
procesului de zgomot alb. Vom obine:
2 3 1 2 1 2 3 1 2 1 1 1 1 ,
) ( ) (
+ +
+ + + = + + + + = =
t t t t t t t t t t
E y E f
1 3 2 1 3 2 1 1 2 2 2 ,
) ( ) (
+ + +
+ + = + + + + = =
t t t t t t t t t
E y E f
t t t t t t t t t
E y E f
3 3 1 2 2 1 3 3 3 ,
) ( ) ( + = + + + + = =
+ + + +

= + + + + = =
+ + + + +
) ( ) (
1 3 2 2 3 1 4 4 4 , t t t t t t t t
E y E f
4 ) ( , ) (
,
= =
+
h y E f
h t t h t
.
Deoarece procesul MA(3) are o memorie de numai 3 perioade, toate prediciile pentru 4 sau mai
multe perioade n viitor, se reduc la parametrul de interceptare din model. Dac n model nu exist
constant, aceste prognoze vor fi 0.
Am folosit faptul c:

>

= =
+
+ +
0 , 0
0 ,
) | ( ) (
j
j
I E E
j t
t j t j t t


Pentru 0 j avem valori cunoscute iar pentru 0 > j avem valori viitoare care au media 0.
Predicia cu ajutorul modelului AR(p)
Un proces AR are memorie infinit, spre deosebire de un proces MA(q) care are memorie de
numai q perioade. Considerm c a fost estimat un model AR(2):
t t t t
y y y + + + =
2 2 1 1

Vom apela, din nou, la presupunerea de stabilitate a parametrilor i vom putea scrie relaiile:
1 1 2 1 1 + +
+ + + =
t t t t
y y y
2 2 1 1 2 + + +
+ + + =
t t t t
y y y
3 1 2 2 1 3 + + + +
+ + + =
t t t t
y y y .
Obinerea prognozei pentru o perioad n viitor este simpl deoarece toate informaiile despre y
sunt cunoscute la timpul t. Aplicm operatorul de medie i considerm 0 ) | ( ) (
1 1
= =
+ + t t t t
I E E .
1 2 1 1 1 2 1 1 1 ,
) ( ) (
+ +
+ + = + + + = =
t t t t t t t t t
y y y y E y E f
Aplicm acelai raionament pentru a obine prognoza pentru dou perioade nainte:
t t t t t t t t t t t t t
y f y E y E y y E y E f
2 1 , 1 2 1 1 2 2 1 1 2 2 ,
) ( ) ( ) ( ) ( + + = + + = + + + = =
+ + + +

1 , 2 2 , 1 1 2 2 1 3 1 2 2 1 3 3 ,
) ( ) ( ) ( ) (
t t t t t t t t t t t t t
f f y E y E y y E y E f + + = + + = + + + = =
+ + + + + +

2 , 2 3 , 1 4 4 ,
) (
t t t t t
f f y E f + + = =
+

2 , 2 1 , 1 ,
) (
+
+ + = =
h t h t h t t h t
f f y E f
Predicia cu ajutorul modelului ARMA(p,q)
Prognozele pot fi generate prin aa numita funcie de prognoz:

=
+
=

+ =
q
j
j h t j
p
i
i h t i h t
f f
1 1
, ,
,unde 0 ,
,
=
+
h y f
h t h t
, 0 , =
+ +
h
h t h t
i 0 , 0 > =
+
h
h t
.
Predicia folosind modele ARIMA(p,d,q)
Presupunem c seria
n
y y y , , ,
2 1
K urmeaz un model general ARIMA(p,d,q), model ce poate fi
rescris n funcie de valoarea curent i de valorile anterioare ale lui
t
:
t t t
d
t
L L L
L
L
y ) 1 ( ) (
) (
) (
2 2
2 1
L + + + = =

=


10

Valoarea viitoare
h n
y
+
este generat prin model astfel:
L + + + =
+ + + + 2 2 1 1 h n h n h n h n
y
Prognoza optimal a lui
h n
y
+
este media condiionat
h n n h n n
f I y E h y
,
) | ( ) ( = =
+
. Termenul de
prognoz optimal este folosit n sensul c minimizeaz eroarea ptratic medie (MSE). Dei
media condiionat poate s nu fie funcie liniar de valorile lui y, vom considera prognozele
liniare pentru c este mai simplu de lucrat cu acestea. n plus, dac procesul este normal, prognoza
MSE minim (MMSE) este liniar.
Prognoza optimal peste h perioade n viitor este:
= + + + = = =
+ + + +
) ( ) | ( ) (
2 2 1 1 ,
L
h n h n h n n n h n n h n
E I y E h y f
L + + + =
+ + 2 2 1 1 n h n h n h

Eroarea de prognoz corespunztoare funciei de prognoz
h n
f
,
la originea n este o combinaie
liniar de ocuri viitoare care intr n sistem dup timpul de origine n:
1 1 2 2 1 1
) ( ) (
+ + + + +
+ + + + = =
n h h n h n h n n h n n
h y y h e L .
Deoarece 0 ] | ) ( [ =
n n
I h e E , prognoza ) (h y
n
este nedeplasat cu MSE:
) 1 ( )) ( ( )] ( [
2 2
1
2
h n n
h e Var h y MSE

+ + + = = L .
Dac procesul este normal, un interval de ncredere ) 1 ( va fi ] )) ( ( ) ( [
2 /
h e Var z h y
n n
.
Pentru 1 = h avem
1 1
) 1 ( ) 1 (
+ +
= =
n n n n
y y e , deci
2

poate fi interpretat ca variana erorii de


prognoz pentru o perioad n viitor.
Concluzii
Metodologia Box-Jenkins se refer la identificarea, estimarea, verificarea i previzionarea unei
serii de timp univariate. Modelele ARMA pot fi vzute ca o clas special de ecuaii stochastice
cu diferene, liniare. Prin definiie, un model ARMA este slab staionar dac are media i
covarianele finite i invariante n raport cu timpul. Pentru ca un model s fie staionar trebuie ca
rdcinile ecuaiei caracteristice s se afle n interiorul cercului unitar. n plus, procesul trebuie s
fie totdeauna n echilibru.
n etapa de identificare, seria cronologic este reprezentat grafic i sunt examinai coeficienii de
autocorelaie de selecie i coeficienii de autocorelaie parial de selecie. O funcie de
autocorelaie care scade lent spre zero sugereaz un comportament nestaionar. n aceast situaie,
Box i Jenkins recomand diferenierea datelor. Dac variana datelor nu este constant, se
recomand o transformare logaritmic.
Funciile SACF i SPACF ale datelor transformate n mod convenabil, sunt comparate cu cele ale
diferitelor procese ARMA teoretice. Sunt estimate toate modelele considerate ca fiind plauzibile i
apoi sunt comparate folosind diferite criterii.
O chestiune fundamental este dac dorim un model care s dea cea mai bun descriere a datelor
sau un model care s dea cele mai bune previziuni. Obinem previziuni mai bune dac optm
pentru un model mai mic, deoarece un astfel de model are intervale de ncredere mai mici, n jurul
valorilor prognozate.
Un model bine estimat: nu este foarte complex (este restrns); are coeficieni care induc
staionaritatea i inversabilitatea; aproximeaz bine datele observate; are reziduuri care
aproximeaz un proces de zgomot alb; are coeficieni care nu se modific pe perioada de selecie;
are prognoze bune.