Sunteți pe pagina 1din 10

Modele staionare liniare pentru analiza seriilor de timp Curs 13 Econometrie 8 ian.

2014
5. Modele autoregresive de medie mobil (Auto Regressive Moving Average - ARMA(p,q)) Un model de tip ARMA(p,q) are o component de tip autoregresiv i o component de tip medie mobil. Componenta autoregresiv se justific prin faptul c variabilele economice au n evoluie un puternic caracter inerial iar componenta de medie mobil este efectul unor evenimente neateptate, nepredictibile, asupra unei variabile economice. Modelul ARMA este cel mai indicat model pentru a se realiza predicii n economie. Fie procesul t zgomot alb, p, q 0 numere ntregi i coeficienii 1 , 2 , L , p , 1 , 2 , L. q R. Un proces stochastic Yt cu valori reale este un proces autoregresiv de medie mobil de ordin p,q i se noteaz ARMA(p,q) dac satisface o ecuaie de forma: yt = 1 y t 1 + 2 yt 2 + L + p y t p + t + 1 t 1 + 2 t 2 L + q t q . Putem rescrie aceast ecuaie folosind operatorul lag, polinomul autoregresiv de ordin p i polinomul de medie mobil de ordin q: ( L) y t = ( L) t , t ~ WN (0, 2 ) Modelul este staionar dac componenta AR este staionar, adic rdcinile ecuaiei ( z ) = 0
sunt n afara cercului unitate. Pentru un model ARMA(p,q) avem condiia necesar i < 1 .
i =1 p

Modelul este inversabil dac componenta MA este inversabil, adic rdcinile ecuaiei ( z ) = 0 sunt n afara cercului unitate. Caracteristicile unui proces ARMA vor fi o combinaie a celor de la componentele AR i MA. ACF descrete la zero cnd decalajul tinde la infinit, scznd exponenial cnd rdcinile ecuaiei ( z ) = 0 sunt reale i cu fluctuaii cnd acestea sunt complexe; PACF descrete la zero, exponenial cnd rdcinile ecuaiei ( z ) = 0 sunt reale i cu fluctuaii cnd acestea sunt complexe. Obinerea celor dou funcii necesit calcule algebrice complicate. Funcia ACF (singur), poate face distincia dintre un proces AR pur i un proces MA pur. Funcia PACF este util pentru a distinge un proces AR(p) de un proces ARMA(p,q). Astfel, un proces AR(p) are o ACF descresctoare geometric i o PACF care scade la 0 dup p laguri, n timp ce un proces ARMA(p,q) are ambele funcii ACF i PACF descresctoare geometric. Un proces stochastic ARMA(p,q) este un proces cauzal dac procesul Yt are o reprezentare n funcie de termenii procesului zgomot alb s , s t i este independent de viitorul dat prin s , s > t . i Un proces ARMA(p,q) este cauzal dac exist un ir ( j ) , astfel nct j = 0 | j |<
y t = j = 0 j t j , j Z .

Un proces ARMA(p,q) este inversabil dac exist un ir ( j ) , astfel nct j = 0 | j |<


t =
j =0

j yt j , j Z .

Clasa de procese ARMA este folosit pentru a modela procese stochastice staionare. Proprietile de cauzalitate i inversabilitate depind de zerourile polinoamelor autoregresive i de medie mobil, respectiv. Reprezentarea cauzal a unui proces ARMA poate fi utilizat pentru a calcula funcia de covarian, care conine toate informaiile despre structura de dependen.

Modele ARMA(1,1) Fie { y t } un proces stochastic de tip ARMA(1,1). 1

yt = y t 1 + t + t 1 a) S se scrie modelul cu ajutorul operatorului de decalaj L. yt y t 1 = t + t 1 (1 L) y t = (1 + L) t b) S se scrie procesul { y t } ca un proces MA( ) yt = t + 1 t 1 + 2 t 2 + 3 t 3 + L yt = (1 + 1 L + 2 L2 + 3 L3 + L) t Cum determinm ponderile 1 , 2 , 3 , L ? (1 L) y t = (1 + L) t (1 L) (1 + 1 L + 2 L2 + 3 L3 + L) t = (1 + L) t (1 L) (1 + 1 L + 2 L2 + 3 L3 + L) = (1 + L) Ponderile j se calculeaz din identitatea (1 L) (1 + 1 L + 2 L2 + 3 L3 + L) = (1 + L) . (1 L + 1 L 1 L2 + 2 L2 2 L3 + 3 L3 3 L4 + L) = (1 + L) Prin identificarea coeficienilor lui L j , se obin ponderile: 1 = 1 = + 2 1 = 0 2 = 1 = ( + )

3 2 = 0 3 = 2 = 2 ( + ) Obinem ponderile j = j 1 = j 1 ( + ) , pentru j > 2 . Ponderile sunt convergente dac | |< 1 . Aceasta este condiia de staionaritate. Rezult scrierea sub forma yt = t + ( + ) t 1 + ( + ) t 2 + 2 ( + ) t 3 + L
c) S se determine autocovarianele procesului, apoi ssedetermine autocorelaiile procesului. Am obinut exprimarea cu ajutorul filtrului liniar: yt = t + ( + ) t 1 + ( + ) t 2 + 2 ( + ) t 3 + L Obinem: E ( t y t ) = E ( t ( t + ( + ) t 1 + ( + ) t 2 + 2 ( + ) t 3 + L)) = 2 E ( t 1 y t ) = E ( t 1 ( t + ( + ) t 1 + ( + ) t 2 + 2 ( + ) t 3 + L)) = ( + ) 2 yt 1 = t 1 + ( + ) t 2 + ( + ) t 3 + 2 ( + ) t 4 + L E ( t y t 1 ) = E ( t ( t 1 + ( + ) t 2 + ( + ) t 3 + 2 ( + ) t 4 + L)) = 0 E ( t 1 y t 1 ) = E ( t 1 ( t 1 + ( + ) t 2 + ( + ) t 3 + 2 ( + ) t 4 + L)) = 2 E ( t 1 y t 2 ) = 0 Relaia yt y t 1 = t + t 1 o nmulim cu y t k yt y t k y t 1 y t k = t y t k + t 1 yt k Aplicm operatorul de medie: E ( y t y t k ) E ( y t 1 y t k ) = E ( t y t k ) + E ( t 1 y t k )

k k 1 = E ( t y t k ) + E ( t 1 y t k )
Pentru k=0 obinem: 0 1 = E ( t yt ) + E ( t 1 y t )

0 1 = 2 + ( + ) 2 = (1 + ( + )) 2
2

Pentru k=1 obinem: 1 0 = E ( t y t 1 ) + E ( t 1 yt 1 )

1 0 = 0 + 2 1 = 0 + 2
nlocuim n ecuaia obinut pentru k=0 i obinem: 0 ( 0 + 2 ) = (1 + ( + )) 2 (1 2 ) 0 = (1 + + ( + )) 2 = (1 + 2 + 2 ) 2 1 + 2 + 2 2 0 = 1 2

+ 2 2 + 2 + 2 2 Dar 1 = 0 + = 1 2 + + 2 + 2 2 ( + )(1 + ) 2 = 1 = 1 2 1 2 Pentru k=2 obinem: 2 1 = E ( t y t 2 ) + E ( t 1 yt 2 ) = 0 Pentru k 2 avem k = k 1


2

Determinm ACF ( + )(1 + ) 1 = 1 = 0 1 + 2 + 2 Pentru k 2 avem k = k 1 . Mrimea lui 1 depinde att de ct i de . Dac 0 < < 1 , convergena este direct. Dac 1 < < 0 , autocorelaiile vor oscila. Funcia ACF a unui model ARMA(1,1) este similar cu cea a unui proces AR(1), fiind o descretere exponenial. Diferena este c descreterea ncepe de la 1 i nu de la 0 = 1 ca n cazul AR(1). Funcia PACF pentru un model ARMA(1,1) se comport ca n cazul MA(1), dup valoarea iniial 11 = 1 urmeaz o descretere exponenial.

22 = kk =

2 12 1 12 k j =1 k 1, j k j
1 j =1 k 1, j j
k 1 k 1

, unde kj = k 1, j kk k 1,k j , j = 1,2,3,..., k 1 .

Exemplu: yt = y t 1 + t + t 1 yt = 0,7 y t 1 + t 0,7 t 1 = 0,7 i = 0,7 a) S se calculeze ACF: (0,7 0,7 )(1 + 0,49) ( + )(1 + ) 1 = = 0,8445 1 = 1 = 2 1 + 2(0,49) + 0,49 0 1 + 2 + Pentru k 2 avem k = k 1 2 = 1 = (0,7)(0,8445) = 0,591 3 = 2 = 0,414 ; 4 = 0,290 ; 5 = 0,203 ; 6 = 0,142 , 7 = 0,099 ; 8 = 0,07 b) S se calculeze PACF: 11 = 1 = 0,8445
3

2 12 0,591 (0,8445) 2 = = 0,426 1 12 1 (0,8445) 2 Pentru a determina 33 , calculm 21 = 11 2211 = 1,204 22 = 33 = 3 j =1 2 j 3 j


2

1 j =1 2 j j
2

(0,414) (1,204)(0,591) (0,426)(0,8445) = 0,262 1 (1,204)(0,8445) (0,426)(0,591)

44 =

4 j =13 j 4 j
3

1 j =13 j j
3

= 0,173

unde 3 j = 2 j 33 2, 2 j 31 = 1,315 ; 32 = 0,74 ;

55 = 0,117 ; 66 = 0,081 ; 77 = 0,056 ; 88 = 0,039

6. Modelele ARIMA i construirea lor prin metodologia Box-Jenkins


Box i Jenkins(1970) au propus o metodologie pentru previzionarea unei variabile doar pe baza valorii prezente i a valorilor din trecul ale variabilei. 1. Cum modelm o serie nestaionar, i ce fel de model putem folosi pentru a descrie comportamentul unei serii staionare? 2. Cum folosim modelul ajustat pentru prognoz? Modelele de tip ARMA pot s aproximeze cele mai multe procese staionare. Pentru c n economie sunt puine serii de timp staionare, sunt necesare modele care s fie capabile s reproduc comportamentul nestaionar. Modelele ARMA au fost generalizate pentru serii nestationare care devin staionare prin difereniere. Modelele rezultate au fost numite modele autoregresive de medie mobil integrate ARIMA(p,d,q) unde d este ordinul de difereniere necesar pentru staionarizarea seriei. Astfel de modele (modele ARMA integrate), se obin prin presupunerea c o serie cronologic poate fi reprezentat, dup difereniere, printr-un model de tip ARMA. O serie de timp y t este un proces ARIMA(p,1,q) dac seria z t = y t y t 1 = (1 L) y t , obinut prin aplicarea operatorului de diferen urmeaz un model ARMA(p,q) staionar i inversabil. Modele ARIMA(AutoRegressive Integrated Moving Average) sunt folosite pentru a analiza dinamica seriilor de timp unidimensionale. Un model ARIMA are trei componente: termenul autoregresiv, termenul privind ordinul de integrare i termenul de medie mobil. Ordinul de integrare arat ordinul d, de difereniere al seriei analizate. Valoarea d = 1 semnific faptul c modelul este specificat pentru prima diferen a seriei originale. Valoarea d = 2 corespunde diferenelor de ordin doi ale seriei originale. Modelele ARIMA sunt utile pentru a reprezenta perturbaii n sisteme cu grad mare de inerie. Aceste modele sunt foarte performante n a reprezenta serii de timp nestaionare omogene. Multe serii de timp din economie sunt nestaionare, dar sunt integrate. Dac o serie de timp este I (d ) , dup diferenierea seriei de d ori se obine o serie staionar, adic I (0) . Aplicnd un model ARMA acestei serii I (0) , spunem c seria de timp iniial este un proces de medie mobil integrat, autoregresiv, notat ARIMA(p,d,q). Se tie deja c p indic numrul de termeni autoregresivi, q indic numrul de termeni de medie mobil, iar d arat de cte ori a fost difereniat seria pentru a deveni staionar. 4

Metodologia Box-Jenkins are ca obiectiv identificarea i estimarea unui model statistic care poate fi considerat c a generat datele de selecie. Acest model estimat va fi utilizat pentru prognoze i este necesar presupunerea c are caracteristici constante n timp. Selectarea modelului ARIMA potrivit pentru datele observate se realizeaz printr-o procedur iterativ (metodologia BoxJenkins), bazat pe mai multe etape.

EtapaI. Identificarea. Obiectivul identificrii este de a selecta o subclas a unei familii de modele ARIMA, potrivite pentru a reprezenta o serie de timp, adic un proces economic evolutiv. n etapa de identificare sunt analizate datele observate i toate informaiile disponibile care sunt capabile s sugereze o subclas de modele ce pot descrie modul de generare a datelor. Elementele de teorie economic pot sugera tipul de model potrivit pentru un anumit proces economic. Astfel, procesele economice ineriale (consumul, inflaia, plata impozitelor) sau cele dependente de propriile realizri anterioare (exportul, productivitatea, investiiile, producia din sectorul zootehnic, calitatea produciei), se recomand a fi reprezentate de un model AR, ARI, ARMA sau ARIMA. Procesele economice care pot fi relativ uor influenate de ocuri exterioare, dar care permit msuri compensatorii n timp (aprovizionarea, producia, cotaia la burs) se recomand a fi reprezentate de un model MA sau care include o component MA. Identificarea nseamn determinarea tipului de model i a ordinului modelului ce urmeaz a fi folosit pentru a reproduce caracteristicile dinamice ale datelor. Pentru a determina cea mai bun specificare sunt folosite reprezentri grafice ale datelor i ale funciilor ACF i PACF de selecie. Se analizeaz funciile de autocorelaie i autocorelaie parial de selecie. Mai nti se examineaz seria de analizat, pentru a vedea dac ar fi putut fi generat de un proces staionar. De regul, seriile de timp din economie nu sunt staioanare. O astfel de serie poate avea urmtoarele caracteristici: 1. Seria prezint o medie care nu este constant n timp, dar variaiile sunt constante de la o perioad la alta; seria urmeaz, de regul, o traiectorie liniar, cu panta pozitiv sau negativ. Se spune c este o serie nestaionar de tip omogen. 2. Seria prezint variaii care nu sunt constante de la o perioad la alta. Se spune c este o serie nestaionar de tip neomogen. Folosim reprezentarea grafic a seriei pentru a vedea dac are varian staionar. Dac dispersia datelor variaz cu timpul, seria este nestaionar. n acest caz se poate aplica datelor tansformarea Box-Cox: y ( ) = ( y 1) / , 0 i y ( ) = log , = 0 . Urmeaz analiza staionaritii n medie. Acest lucru se poate face examinnd graficul valorilor seriei, examinnd corelogramele de selecie sau aplicnd un test pentru o rdcin unitar, precum testul Dickey-Fuller. Autocorelaiile de selecie sunt estimaii consistente ale coeficienilor populaiei, aa nct corelograma de selecie a unui proces staionar tinde la zero pentru lungimi de lag moderate. O serie nestaionar are o SACF care nu descrete. O serie integrat are SACF ce descrete foarte ncet, iar SPACF scade foarte repede, la lag-ul k = 2 i prima valoare este foarte apropiat de 1. Dac seria arat un model de nestaionaritate, se staionarizeaz seria prin aplicarea unor transformri potrivite. De exemplu, se logaritmeaz valorile iniiale ale seriei, apoi se difereniaz seria pn la obinerea staionaritii. Lum seria diferenelor de ordinul nti i analizm dac este staionar, ntr-un mod similar. Metodele grafice pot fi nsoite de teste de rdcin unitar. Acest proces de a efectua diferenele va continua pn la obinerea unei serii staionare. Dup obinerea unei serii staionare, se compar SACF i SPACF ale seriei staionare cu diferite modele liniare teoretice ARMA, iar aceast comparaie poate sugera cteva modele plauzibile.
5

n cazul unui model AR(p) ACF este infinit iar PACF este finit. Coeficienii de autocorelaie descresc spre 0 geometric sau n alternan, pe msur ce crete lag-ul k. Coeficienii de autocorelaie parial descresc brusc la 0 dup un anumit numr de decalaje, astfel nct pentru k > p , kk 0 . scad brusc scad n progresie geometric i coeficienii Rezult c, dac coeficienii
k kk

0 , pentru k > p , se recomand un model AR(p). Deci p este cea mai mare astfel nct kk , se afl n afara valoare a lui k, pentru care coeficienii de autocorelaie parial estimai,
kk

intervalului (1,96 / n ) . n cazul unui model MA(q), PACF este infinit iar ACF este finit. Coeficienii de autocorelaie scad brusc la 0 astfel nct pentru k > q , k 0 . Coeficienii de autocorelaie parial descresc spre 0 exponenial sau cu fluctuaii. Rezult c, scad n k scad brusc astfel nct k 0 pentru k > q i coeficienii dac coeficienii kk progresie geometric, se recomand un model MA(q). Deci q este cea mai mare valoare a lui k , se afl n afara intervalului k, pentru care coeficienii de autocorelaie estimai,
(1,96 / n ) . Pentru un model ARMA(p,q), att coeficienii de autocorelaie ct i coeficienii de autocorelaie parial descresc spre 0 exponenial sau geometric. Ordinul p, al prii autoregresive din model, este dat de coeficientul de autocorelaie parial care prezint un nivel semnificativ, iar ordinul q, al prii de medie mobil din model, este dat de coeficientul de autocorelaie care prezint un nivel semnificativ. La acest moment, folosirea unui model de tip ARMA(p,q) este doar la stadiul de intenie. Observaie: Scderea coeficienilor de autocorelaie trebuie neleas n valoare absolut. Descretera coeficienilor de AC sau PAC poate fi ntrerupt de valori mai mari (n valoare absolut) n cazul n care datele prezint sezonalitate (de ex., n cazul datelor trimestriale, se pot , comparativ cu valorile coeficienilor 4 sau 3 , 5 , 6 . ntlni valori mari ale coeficienilor 44 Se recomand selectarea mai multor variante de modele, printre care i o variant ARMA, pentru a fi estimate i verificate. - Dac exist o valoare a decalajului, q, dup care valoarea funciei de autocorelaie scade brusc spre 0 rezult c, pentru prelucrarea seriei, este indicat folosirea unui proces MA(q) pur sau a unui proces ce conine o component MA(q). , scade brusc spre 0 dup o valoare a kk = - Dac valoarea funciei de autocorelaie parial kk decalajului egal cu p, rezult c, pentru prelucrarea seriei, este indicat folosirea unui proces AR(p) pur sau a unui proces ce conine o component AR(p). Se consider c valoarea lui kk = difer semnificativ fa de zero dac nu este coninut n intervalul kk

( t

/ 2; n 2

1 / n ; + t / 2;n 2 1 / n .

Etapa II. Estimarea parametrilor modelului identificat. Estimarea parametrilor unui model de tip AR(p) se face prin MCMMP, minimiznd suma ptratelor reziduurilor sau prin ecuaiile Yule-Walker de selecie. Dac n model exist termeni de tip MA, minimizarea sumei ptratelor reziduurilor sau maximizarea funciei de verosimilitate necesit metode de estimare neliniare (Newton, DavidsonFletcher-Powell).
6

Parametrii unui model ARIMA(p,d,q), se pot estima consistent prin MCMMP sau prin metoda verosimilitii maxime. Ambele procedee de estimare sunt bazate pe calculul inovaiilor t din valorile variabilei staionare. Estimarea diverselor variante de modele, care au fost sugerate de corelogram n etapa de identificare, va fi realizat cu ajutorul unui program ARMA dintr-un pachet de programe (EViews, SAS, SPSS). Vom atribui valori pentru p i q n diverse combinaii i vom obine estimaii ale coeficienilor modelelor corespunztoare. Verificarea corectitudinii modelului identificat. Dup ce modelele ARMA selectate au fost estimate, dorim s ne asigurm c sunt potrivite. Pentru aceasta se analizeaz att reziduurile ct i parametrii pentru fiecare model. Testarea reziduurilor Practica standard este de a reprezenta grafic reziduurile modelului estimat. Dac modelul estimat este adecvat, reziduurile ar trebui s fie aproximativ zgomot alb. Deci, reziduurile obinute pentru modelul estimat sunt analizate pentru a stabili dac provin dintr-un proces de zgomot alb. n caz afirmativ, tipul de model propus este o bun aproximaie pentru procesul stochastic de baz. n caz contrar, procesul este reluat, metoda fiind una iterativ. Pentru a controla dac reziduurile au media zero i sunt necorelate folosim att graficul, ct i ACF i PACF ale reziduurilor. ACF i PACF teoretice ale procesului WN iau valoarea zero pentru lagurile k 0 , aa c, dac modelul este potrivit, cei mai muli din coeficienii funciilor SACF i SPACF ar trebui s fie apropiai de zero. n practic, cerem ca 95% din aceti coeficieni s se afle n interiorul unor limite de nesemnificaie. Mai mult, statistica Ljung-Box ar trebui s aibe valori mici, deoarece corespunde la variabile necorelate. Un model care conduce la obinerea unor coeficieni de autocorelaie a reziduurilor semnificativi sau la o statistic Q semnificativ la nivelul de semnificaie de 10%, trebuie eliminat. Dac se observ c variana reziduurilor este cresctoare, rezult c este potrivit o transformare logaritmic. Este foarte important ca reziduurile obinute prin estimarea unui model s fie serial necorelate. Deci, orice model care nu produce reziduuri aleatoare ar trebui s nu fie luat n considerare, ci eliminat. Testarea parametrilor Se pot aplica testele de semnificaie clasice t i F Este important, de asemenea, s fie satisfcute condiiile de staionaritate i inversabilitate. Dac factorizm polinoamele AR i MA i una din aceste rdcini este apropiat de 1, aceasta este un semn de absen a staionaritii sau inversabilitii. Departajarea ntre mai multe modele Presupunnd c sunt estimai parametrii pentru mai multe modele identificate ca fiind ARIMA(pi,d,qi), se pot utiliza dou tipuri de indicatori: ai calitii reziduurilor sau ai teoriei informaiei. a) Indicatori ai calitii reziduurilor Dintre modele estimate se alege modelul cu cea mai mic varian a reziduurilor, cu cea mai mare valoare a lui R 2 i cu cea mai mare valoare a statisticii F. b) Indicatori ai teoriei informaiei Pentru fiecare din modelele estimate se calculeaz indicatorii AIC(criteriul Akaike) i BIC p+q log n 2 + 2 2 + ( p + q ) (criteriul Schwarz): AIC = log , BIC = log . n n Se alege modelul cu cea mai mic valoare a indicatorului.

Etapa III. Efectuarea de prognoze cu ajutorul modelelor ARIMA.


7

Obiectivul principal urmrit prin construirea unui model ARMA este de a predicta sau prognoza evoluia viitoare a unei variabile economice. Modelul selectat, pentru care s-a verificat corectitudinea, poate fi utilizat pentru prognoz. Modelele ARIMA sunt destul de apreciate pentru succesul n a face predicii. Prognozele obinute prin aceaste modele sunt considerate mai bune, mai ales pe termen scurt, dect cele obinute prin modelarea econometric tradiional, n cazul seriilor cronologice. Prognozarea unei serii de timp const n ncercarea de a previziona valori viitoare ale seriei, innd seama de valorile din trecut ale seriei i de valorile din trecut ale unui termen eroare. Se pot efectua prognoze punctuale (se previzionaz o singur valoare a variabilei) sau prognoze pe interval (se determin un domeniu de valori n care anticipm c se va afla valoarea viitoare a variabilei, pentru un nivel de semnificaie dat). Ipoteza cheie: Stationaritatea seriei -regula de baz care guverneaz nu se schimb -comportamentul viitor poate fi dedus pe baza trecutului -avem suficiente observaii din trecut pentru a nelege procesul de baz. Considerm c ( y t ) este un proces stochastic staionar cu media zero. Putem presupune c suntem la momentul t i suntem interesai de a prognoza sau previziona valorile acestui proces pentru cteva perioade din viitor, pe baza observaiilor din trecut. Istoria acestui proces este coninut ntr-o mulime a informaiilor iar predicia va fi bazat pe aceast mulime de informaii. n practic, aceast mulime este o mulime finit { y t , y t 1 ,..., y t p } , reprezentnd trecutul recent. Totui, n dezvoltarea teoriei prediciei, este util a se considera o mulime a informaiilor infinit I t = { y t , y t 1 ,..., yt p ,...} , reprezentnd ntregul trecut. Vom nota predicia lui y t + h , care este fcut t + h . Vom spune c t este originea, h este orizontul de timp iar la momentul t, prin y t (h) sau y y t (h) este valoarea previzionat pentru y t + h cu h perioade nainte. n general, predictorul y t (h) ( predictorul lui y t + h , construit la timpul t), este o funcie de variabilele din mulimea I t . Definim eroarea de previziune (de prognoz) a lui y t + h , diferena dintre valoarea real i cea t +h previzionat: yt + h y t (h) = y t + h y Criteriul folosit n mod obinuit pentru a aprecia performana unui estimator sau predictor al unei variabile aleatoare este minimizarea ptratului erorii medii condiionate, de prognoz, adic: min E ( y t + h y t (h)) 2 | I t .

Vom folosi una din notaiile: yt (h) = E ( y t + h | I t ) = E t ( y t + h ) . Notm cu f t ,h o prognoz pentru o serie y, prognoz realizat folosind un model ARMA(p,q), la momentul t, pentru h perioade n viitor. Predicia cu ajutorul modelului MA(q) Un proces MA(q) are o memorie doar de lungime q i aceasta limiteaz orizontul de prognoz. De exemplu, presupunem c am estimat un model MA(3): yt = + t + 1 t 1 + 2 t 2 + 3 t 3 Deoarece se presupune c parametrii sunt constani n timp, dac relaia anterioar are loc la timpul t, ea va avea loc i la momentele t + 1, t + 2,... . Vom putea scrie relaiile: yt +1 = + t +1 + 1 t + 2 t 1 + 3 t 2 yt + 2 = + t + 2 + 1 t +1 + 2 t + 3 t 1 yt +3 = + t +3 + 1 t + 2 + 2 t +1 + 3 t 8

inem cont c toate informaiile pn la timpul t, inclusiv cele de la timpul t, sunt cunoscute i disponibile. Realizarea de prognoze nseamn a considera mediile condiionate de informaiile disponibile. Perturbaiile t +1 , t + 2 ,... nu sunt cunoscute la timpul t. Cea mai bun prognoz pentru media condiionat a lui t +1 este zero, adic E t ( t +1 ) = E ( t +1 | I t ) = 0 , datorit ipotezelor procesului de zgomot alb. Vom obine: f t ,1 = E t ( y t +1 ) = E ( + t +1 + 1 t + 2 t 1 + 3 t 2 ) = + 1 t + 2 t 1 + 3 t 2 f t , 2 = E t ( y t + 2 ) = E ( + t + 2 + 1 t +1 + 2 t + 3 t 1 ) = + 2 t + 3 t 1 f t ,3 = Et ( y t +3 ) = Et ( + t +3 + 1 t + 2 + 2 t +1 + 3 t ) = + 3 t f t , 4 = E t ( y t + 4 ) = E t ( + t + 4 + 1 t +3 + 2 t + 2 + 3 t +1 ) = f t ,h = E t ( y t + h ) = , () h 4 . Deoarece procesul MA(3) are o memorie de numai 3 perioade, toate prediciile pentru 4 sau mai multe perioade n viitor, se reduc la parametrul de interceptare din model. Dac n model nu exist constant, aceste prognoze vor fi 0. t + j , j 0 Am folosit faptul c: Et ( t + j ) = E ( t + j | I t ) = 0 , j > 0 Pentru j 0 avem valori cunoscute iar pentru j > 0 avem valori viitoare care au media 0. Predicia cu ajutorul modelului AR(p) Un proces AR are memorie infinit, spre deosebire de un proces MA(q) care are memorie de numai q perioade. Considerm c a fost estimat un model AR(2): y t = + 1 y t 1 + 2 y t 2 + t Vom apela, din nou, la presupunerea de stabilitate a parametrilor i vom putea scrie relaiile: yt +1 = + 1 y t + 2 y t 1 + t +1 yt + 2 = + 1 y t +1 + 2 y t + t + 2 yt + 3 = + 1 y t + 2 + 2 y t +1 + t +3 . Obinerea prognozei pentru o perioad n viitor este simpl deoarece toate informaiile despre y sunt cunoscute la timpul t. Aplicm operatorul de medie i considerm E t ( t +1 ) = E ( t +1 | I t ) = 0 . f t ,1 = E t ( y t +1 ) = E t ( + 1 y t + 2 y t 1 + t +1 ) = + 1 y t + 2 y t 1 Aplicm acelai raionament pentru a obine prognoza pentru dou perioade nainte: f t , 2 = E t ( y t + 2 ) = E t ( + 1 y t +1 + 2 y t + t + 2 ) = + 1 Et ( y t +1 ) + 2 E t ( y t ) = + 1 f t ,1 + 2 y t f t ,3 = Et ( y t +3 ) = E t ( + 1 y t + 2 + 2 y t +1 + t + 3 ) = + 1 E t ( y t + 2 ) + 2 Et ( y t +1 ) = + 1 f t , 2 + 2 f t ,1 f t , 4 = E t ( y t + 4 ) = + 1 f t ,3 + 2 f t , 2 f t ,h = E t ( y t + h ) = + 1 f t ,h 1 + 2 f t ,h 2

Predicia cu ajutorul modelului ARMA(p,q) Prognozele pot fi generate prin aa numita funcie de prognoz: p q f t ,h = i =1i f t ,h i + j =1 j t + h j ,unde f t ,h = y t + h , h 0 , t + h = t + h , h 0 i t + h = 0 , h > 0 . Predicia folosind modele ARIMA(p,d,q) Presupunem c seria y1 , y 2 , K , y n urmeaz un model general ARIMA(p,d,q), model ce poate fi
rescris n funcie de valoarea curent i de valorile anterioare ale lui t : ( L ) 2 2 yt = t = ( L) t = (1 + 1 L + 2 L + L) t d ( L) 9

Valoarea viitoare y n + h este generat prin model astfel:

y n + h = n+ h + 1 n + h1 + 2 n + h 2 + L
Prognoza optimal a lui y n + h este media condiionat y n (h) = E ( y n + h | I n ) = f n ,h . Termenul de prognoz optimal este folosit n sensul c minimizeaz eroarea ptratic medie (MSE). Dei media condiionat poate s nu fie funcie liniar de valorile lui y, vom considera prognozele liniare pentru c este mai simplu de lucrat cu acestea. n plus, dac procesul este normal, prognoza MSE minim (MMSE) este liniar. Prognoza optimal peste h perioade n viitor este: f n ,h = y n (h) = E ( y n+ h | I n ) = E n ( n + h + 1 n + h 1 + 2 n + h 2 + L) = = h n + h+1 n 1 + h + 2 n 2 + L Eroarea de prognoz corespunztoare funciei de prognoz f n ,h la originea n este o combinaie liniar de ocuri viitoare care intr n sistem dup timpul de origine n: en (h) = y n + h y n (h) = n+ h + 1 n + h 1 + 2 n+ h 2 + L + h1 n +1 . Deoarece E[en (h) | I n ] = 0 , prognoza y n (h) este nedeplasat cu MSE:
2 MSE[ y n (h)] = Var (en (h)) = 2 (1 + 12 + L + h ).

Dac procesul este normal, un interval de ncredere (1 ) va fi [ y n (h) z / 2 Var (en (h)) ] . Pentru h = 1 avem en (1) = y n+1 y n (1) = n +1 , deci 2 poate fi interpretat ca variana erorii de prognoz pentru o perioad n viitor. Concluzii Metodologia Box-Jenkins se refer la identificarea, estimarea, verificarea i previzionarea unei serii de timp univariate. Modelele ARMA pot fi vzute ca o clas special de ecuaii stochastice cu diferene, liniare. Prin definiie, un model ARMA este slab staionar dac are media i covarianele finite i invariante n raport cu timpul. Pentru ca un model s fie staionar trebuie ca rdcinile ecuaiei caracteristice s se afle n interiorul cercului unitar. n plus, procesul trebuie s fie totdeauna n echilibru. n etapa de identificare, seria cronologic este reprezentat grafic i sunt examinai coeficienii de autocorelaie de selecie i coeficienii de autocorelaie parial de selecie. O funcie de autocorelaie care scade lent spre zero sugereaz un comportament nestaionar. n aceast situaie, Box i Jenkins recomand diferenierea datelor. Dac variana datelor nu este constant, se recomand o transformare logaritmic. Funciile SACF i SPACF ale datelor transformate n mod convenabil, sunt comparate cu cele ale diferitelor procese ARMA teoretice. Sunt estimate toate modelele considerate ca fiind plauzibile i apoi sunt comparate folosind diferite criterii. O chestiune fundamental este dac dorim un model care s dea cea mai bun descriere a datelor sau un model care s dea cele mai bune previziuni. Obinem previziuni mai bune dac optm pentru un model mai mic, deoarece un astfel de model are intervale de ncredere mai mici, n jurul valorilor prognozate. Un model bine estimat: nu este foarte complex (este restrns); are coeficieni care induc staionaritatea i inversabilitatea; aproximeaz bine datele observate; are reziduuri care aproximeaz un proces de zgomot alb; are coeficieni care nu se modific pe perioada de selecie; are prognoze bune.

10