Sunteți pe pagina 1din 16

Elemente de analză a seriilor temporale

Vom prezenta tehnicile de analiză a seriilor cronologice.


I. Staţionaritatea

A. Definiţie şi proprietăţi
Înaintea prelucrării unei serii cronologice, se recomandă de a studia mai întâi
caracteristicile stochastice. Dacă aceste caracteristici stochastice – adică speranţa şi varianţa sa
– cunosc modificări în timp, seria cronologică este considerată drept nestaţionară; în cazul
unui proces stochastic invariat, seria de timp este staţionară.
În mod formal, procesul stochastic y, este staţionar dacă:
E ( yt )  E ( yt  m )  t si m , media este constantă şi
independentă de timp;
var(yt) < ∞t, varianţa este finită şi independentă de timp;
cov(yt, yt+k) = E[(yt — μ)(yt+k — μ)] = γk, covarianţa este independentă de timp.
În baza acestor proprietăţi, un proces de zgomot alb εt, este staţionar, dacă εt sunt
independente şi supuse aceleiaşi legi N(0,σε2) .
O serie cronologică este deci staţionară, dacă ea este realizarea unui proces staţionar.
Faptul presupune că seria nu este supusă nici tendinţei, nici sezonalităţii şi în general nici
un factor nu evoluează în timp.

B. Funcţiile de autocorelare simplă şi parţială


Funcţia de autocorelare (FAC) , notată ρk ,care măsoară corelaţia seriei cu ea însăşi
cu decalare de k perioade, după cum se arată în tabelul 1.
Formula de calculare:
n
 ( y  y )( y  y)
cov( y , y ) t t k
  t t k  t  k 1
k   2 [1]
yt y n n
tk  ( y  y)
2
 (y  y)
t tk
t  k 1 t  k 1

unde y este media seriei calculată pentru n — k perioade, n = numărul de observaţii. Se


poate deduce că:
 0  1 si  k   k
Această formulă [1] este dificil de aplicat deoarece se cere recalcularea pentru fiecare
termen ρk a mediilor şi varianţelor, de aceea se preferă funcţia de autocorelare a
eşantionului:
1
n
 ( y  y )( y  y)
t tk
̂  t  k  1
k n 2
 ( y  y)
[2]
t
t 1
unde y este media seriei calculată pentru n perioade.
Tabelul 1 Exemplu de calcul a unei funcţii de autocorelare
K 0 1 2 3 4
T yt yt-1 yt-2 yt-3 yt-4
1 123
2 130 123
3 125 130 123
4 138 125 130 123
5 145 138 125 130 123
6 142 145 138 125 130
7 141 142 145 138 125
8 146 141 142 145 138
9 147 146 141 142 145
10 157 147 146 141 142
11 150 157 147 146 141
12 145 150 157 147 146
Media yt 140,75 142,36 143,60 145,67 146,63
Media yt-k 140,75 140,36 139,40 137,44 136,25
Varianţa yt 95,02 72,41 62,84 24,11 22,23
Varianţa yt-k 95,02 101,87 101,84 74,91 71,44
ρk 1 0,77 0,62 0,59 0,55

Funcţia de autocorelare parţială se aseamănă noţiunii de corelare parţială, definit


anterior ca fiind calculul influenţei lui x1 asupra lui x2 prin eliminarea influenţelor altor
variabile x3, x4, ..., xt. Analogic, se poate defini autocorelarea parţială de k întârzieri drept
coeficient de corelare parţială între yt şi yt-k, adică ca fiind corelarea între yt et yt-k, influenţa
altor variabile decalate cu k perioade (yt-1, yt-2, …, yt-k+1) fiind eliminate.
Pentru a evita ambiguităţile între cele două funcţii de autocorelare, numim funcţie de
autocorelare simplă prin funcţie de autocorelare.

C. Testele “zgomotului alb” şi a staţionarităţii


Nu se pot clar identifica caracteristicile stochastice ale unei serii cronologice decât
dacă ea este staţionară. Acest studiu de staţionaritate se realizează în mare parte în baza
studiului funcţiilor de autocorelare (sau a reprezentării lor grafice numită
“corelogramă”). O serie cronologică este staţionară dacă ea nu este supusă nici
tendinţei, nici sezonalităţii. Deci, în baza studiului corelogramei unei serii, vom încerca
2
să arătăm în ce mod se pot evidenţia cele două componente.
Se pot distinge diferite tipuri de serii staţionare:
- de memorie, adică care pot modela printr-o lege de reproducţie procesul;
- identic şi independent distribuită notată i.i.d. sau numită Zgomot Alb (“White Noise”);
- normal (conform unei legi normale) şi independent distribuită notată n.i.d. sau numită
Zgomotul Alb gaussian.

1) Analiza funcţiilor de autocorelare


Întrebarea care apare, atunci când se studiază funcţia de autocorelare a unei serii
cronologice, este de a cunoaşte care sunt termenii ρk semnificativi diferiţi de 0.
De fapt, de exemplu, dacă nici un termen nu este semnificativ diferit de 0, se poate
conchide că procesul studiat este fără memorie şi deci el nu este afectat nici de tendinţă, nici
de sezonalitate. Sau chiar, dacă o serie lunară prezintă o valoare ridicată pentru ρ12 (corelare
între yt şi yt-12), seria studiată este singura afectată de o mişcare sezoniară. Vom verifica,
în baza diferitor exemple, aceste cazuri.
Testul ipotezelor pentru un termen ρk este următorul:
H0 : ρk = 0
Hl : ρ k ≠ 0
Se poate utiliza testul ipotezelor unui coeficient de corelare, bazat pe compararea unui
test t Student empiric şi teoretic. Insă Quenouille a demonstrat că pentru un eşantion mare
(n > 30), coeficientul ρk tinde în mod asimptotic spre o lege normală cu media 0 şi abaterea tip
1/ n .
Intervalul de încredere al coeficientului ρk este atunci :

 0  t / 2
1

k n
n = numărul de observaţii.
Dacă coeficientul calculat ̂ k se află în exteriorul acestui interval de încredere, el este
 /2
semnificativ diferit de 0 la pragul  (în general  = 0,05 şi t  1,96 ).
Majoritatea logicielilor furnizează, odată cu corelograma, intervalul de încredere, ceea ce
permite o interpretare imediată.
Este necesar de subliniat o limită a testelor de 5%, atunci când o funcţie de autocorelare
este calculată pentru un număr important de întârzieri, ne putem aştepta ca câteva să fie, în
mod fortuit (întâmplător), semnificativ diferite de 0. Dacă h este numărul de întârzieri,
numărul posibil de respingeri false este deci de 0,05 x h, pentru un prag de încredere de 5%.
În cazul în care corelograma nu arată nici o descreştere a termenilor săi (absenţa vre-unui
“cut off”), se poate conchide că seria nu este staţionară în tendinţă.

3
2) Statisticile Box-Pierce şi Ljung-Box

Testul Box-Pierce permite identificarea proceselor de zgomot alb (urmare a


variabilelor aleatoare ale aceleiaşi distribuţii şi independente între ele). Trebuie să
identificăm cov(yt,, yt-k) = 0 sau chiar ρk = 0 k.
Un proces zgomot alb presupune că ρl = ρ2 = . . . = ρk = 0, sau ipotezele:
HO : ρ1 = ρ2 = . . . = ρk = 0
Hl : există cel puţin un ρi semnificativ diferit de 0.
Pentru a efectua acest test, se va recurge la statistica Q (datorată lui Box-Pierce)
prezentată prin formula:

h 2
Q  n  ̂
k
k 1

,unde h – numărul de întârzieri, ̂ k – autocorelarea empirică de ordinul k, n – numărul de


observaţii.
Statistica Q este distribuită în mod asimptotic analog distribuţiei χ2 cu h grade de
libertate. Vom respinge ipoteza zgomotului alb, cu pragul  , dacă statistica Q este
superioară lui χ2 citit în tabel la pragul (1 - α) şi h grade de libertate.
Se poate utiliza de asemenea o altă statistică, a cărei proprietăţi asimptotice sunt mai
bune, derivată din prima care este Q' a lui Ljung et Box:

2
h ˆ k
Q '  n ( n  2) 
k 1 n k
care este de asemenea distribuită conform χ cu h grade de libertate şi a cărei reguli de
2
decizie sunt identice. Aceste teste sunt numite în engleză: “portmanteau test” sau tradus
literalmente testul “total îmblănit”.

3) Teste de normalitate

Pentru a calcula intervalele de încredere prevăzute şi de asemenea pentru a efectua


testele Student asupra parametrilor, se recomandă de a verifica normalitatea erorilor. Testul
Jarque şi Bera (1984), fondat pe noţiunile de Skewness (asimetrie) şi Kurtosis (aplatizare),
permite verificarea normalităţii unei distribuţii statistice.
4
a) Testele Skewness şi Kurtosis
1 n k
k   ( xi  x )
Fie n i 1 momentul centrat de ordinul k,
3
11 / 2 
coeficientul Skewness β11/2 este egal cu:  23 / 2

4
2 
şi coeficientul Kurtosis: 2 .
2

Dacă distribuţia este normală şi numărul observaţiilor mare (n > 30) :


 6  24 
 1/ 2

 N  0;  
si  2  N  3; 
1
n  n 
   
Se construiesc atunci statisticile:
11/ 2  0 2  3
v1  si v2 
6 24
care se compară cu 1,96 (valoarea legii normale la
n n
pragul de 5%).
Dacă ipotezele H0: v1 = 0 (simetrie) şi v2 = 0 (nivelarea normală)
sunt verificate, atunci v1 < 1,96 şi v2 < 1,96, în caz contrar, ipoteza de
normalitate se respinge.
b) Testul Jarque şi Bera
Este vorba de un test care sintetizează rezultatele precedente, dacă β11/2 şi β2 se supun
n n
s 1  (  2  3) 2
legilor normale atunci cantitatea s: 6 24 urmează un χ2 cu două
grade de libertate.
s  X 12 
Deci, dacă (2), se respinge ipoteza H0 de normalitate a reziduurilor la
pragul α.
Aceste teste de normalitate servesc de asemenea în cazul când este vorba
heteroscedascititate. De fapt, heteroscedascititatea se manifestă pe graficul distribuţiei prin
cozile de probabilitate mai dese (distribuţia leptokurtică) decât cozile legii normale.
4) Teste de staţionaritate:
testele Dickey-Fuller şi Dickey-Fuller Extins
Testele Dickey-Fuller permit nu doar de a detecta existenţa unei tendinţe (testele de
5
verificare a rădăcinii unitare, Unit Root Test), dar de asemenea de a determina
modalitatea bună de staţionarizare a unei cronici.
Se disting două tipuri de procese:
- procese TS (Trend Stationnary) care reprezintă o nestaţionaritate de tip determinist;
- procese DS (Diffeerency Stationnary) pentru procesele nestaţionare de tip aleator.

a) Procesele TS
Un proces TS se scrie: xt = ft +εt unde ft este o funcţie polinomială de timp, lineară
sau nelineară, şi εt un proces staţionar. Procesul TS cel mai simplu (şi cel mai răspândit) este
reprezentat printr-o funcţie polinomială de gradul 1, care este numit linear şi se scrie:
xt=a0+a1t+εt
Acest proces TS este nestaţionar deoarece E[xt] depinde de timp. Cunoscând â 0
şi â1 procesul xt poate staţionariza reducând valoarea lui xt în t, valoarea estimată
ˆ0  a
a ˆ1t
. În acest tip de modelizare, efectul produs printr-un şoc (sau prin

mai multe şocuri aleatoare) la un moment t este tranzitoriu. Modelul fiind detreminist,
cronica îşi regăseşte mişcarea pe termen lung prin dreapta tendinţei. Este posibil de a
generaliza acest exemplu la funcţii polinomiale de un anumit grad..
b) Procesele DS
Procesele DS sunt procese care se pot transforma în staţionare folosind un filtru de
diferenţe: (1 — D)dxt = β + εt unde εt este un proces staţionar, β o constantă reală, D
operator de decalaj, şi d ordinul filtrului diferenţelor.
Aceste procese sunt deseori reprezentate folosind filtrul diferenţelor primare (d = 1),
numit proces de prim ordin şi se scrie:
(1 - D)xt = β + εt  xt = xt-1 + β + εt
Introducerea constantei β în procesul DS permite de a defini cele două procese diferite:
• β=0: procesul DS fără derivă.
Procesul are forma: xt = xt-1 + εt
Precum εt , este un zgomot alb, acest proces DS este numit modelul mersului la
întâmplare sau a mersului aleatoriu (Random Walk Model). Foarte des el este folosit pentru a
analiza eficienţa pieţelor financiare.
Pentru a staţionariza mersul aleatoriu, este suficient de a aplica procesului filtrul
diferenţelor primare: xt = xt-1 + εt,  (1 - D)xt = εt..
• β≠0: procesul este numit proces DS cu derivă.
Procesul are forma: xt = xt-1 + β + εt
Staţionarizarea acestui proces este realizată folosind filtrul diferenţelor primare:
xt = xt-1 + β + εt,  (1 - D)xt =β + εt
6
În procesul de tip DS, un şoc la un moment dat se repercutează la infinit asupra
valorilor viitoare ale seriei; efectul şocului este deci permanent şi i în descreştere.
În concluzie, pentru staţionarizarea unui proces TS, metoda cea bună este acea a celor
mai mici pătrate ordinare; pentru un proces DS trebuie de folosit filtrul diferenţelor. Alegerea
unui proces DS sau TS drept structură a cronicii nu este deci neutră.
c) Consecinţele unei proaste staţionarizări a procesului
Pentru un proces TS, o metoda bună de staţionarizare este acea a celor mai mici
pătrate ordinare.
Ce se întâmplă , dacă pentru procesul TS de prim ordin se aplică un filtru cu diferenţe
primare. A priori, deoarece gradul polinomului e 1, acest filtru poate fi considerat drept
corect, deoarece un filtru cu diferenţe de ordinul d elimină un polinom de acelaşi grad. În
acelaşi timp, se demonstrează că aplicarea unui filtru cu diferenţe creează o perturbaţie
artificială.
Pentru un proces DS, metoda bună de staţionarizare este filtrul cu diferenţe primare.
Dacă presupunem că se aplică metoda celor mai mici pătrate ordinare (regresie în timp)
asupra observaţiilor unui eşantion al procesului, parametrii tendinţei sunt estimaţi şi în
consecinţă reziduul regresiei trebuie să fie un zgomot alb. Nelson şi Kang arată în baza
simulărilor, că eliminarea unei tendinţe lineare asupra unui proces de mers aleatoriu creează
artificial o puternică autocorelare a reziduurilor pentru primele întârzieri.
În plan econometric, este deci primordial de a identifica clar procesul şi de a folosi
metoda adecvată de staţionarizare. În caz contrar riscul de a crea “zgomote parazite”
artificiale este foarte mare.
Consecinţele sunt de asemenea importante în plan economic.
d) Testele rădăcini unitare: testele Dickey-Fuller (1979)
Testele Dickey-Fuller (DF) permit de a pune în evidenţă caracterul staţionar sau nu al
unei cronici prin determinarea unei tendinţe deterministe sau stochastice.
Modelele care stau la baza construcţiei acestor teste sunt trei. Principiul acestor testelor
este simplu:
Dacă ipoteza H0: φ1 = 1 este reţinută în unul din aceste trei modele, atunci procesul
este nestaţionar.

[1] xt = φ1xt-1 + εt Model autoregresiv de ordinul 1.


[2] xt = φ1xt-1 + β + εt Model autoregresiv cu constantă.
[3] xt = φ1xt-1 + bt + c + εt Model autoregresiv cu tendinţă.
Dacă ipoteza H0 este verificată cronica x nu este staţionară indiferent de modelul
reţinut.

În modelul [3], dacă se acceptă H1: φ1<1 şi dacă coeficientul b este semnificativ
diferit de 0, atunci procesul este un proces TS; se poate transforma în staţionar calculând
reziduurile în comparaţie cu tendinţa estimată prin metoda celor mai mici pătrate ordinare.

Conform H0, regulile obişnuite de inferenţă statistică nu se pot aplica pentru a testa
7
această ipoteză, în particular distribuţia Student a parametrului φ1; Dickey şi Fuller au studiat
distribuţia asimptotică a estimatorului φ1 în conformitate cu ipoteza H0. Cu ajutorul
simulărilor Monte-Carlo, alcătuind tabele cu valori critice pentru eşantioane de mărimi
diferite. Aceste tabele sunt analoage tabelelor t Student. Autorii au ales să testeze valoarea

( ˆ 1  1 ) în locul lui ˆ1 din motive pur statistice. Aceasta nu este jenant pentru test. De
fapt, xt = φ1xt-1 + εt se scrie de asemenea:

xt – xt-1 = φ1xt-1 – xt-1 + εt

Δxt = (φ1 –1)xt-1 + εt

Deci, este echivalentă testarea ipotezei H0: φ1 = 1 sau φ1 - 1 = 0.

Principiile generale ale testului sunt următoare.


Se estimează prin MCO parametrii φ1 notat ˆ 1 pentru modelele [1], [2] şi [3].

Estimarea coeficienţilor şi abaterilor tip a modelului prin MCO furnizează t


ˆ
1
care este
analog statisticii Student (raportul coeficientului la abaterea tip).

t  t
Dacă ˆ1 tabel , atunci se acceptă ipoteza H0; există o rădăcină unitară, procesul
nu este deci staţionar. Este posibil de asemenea de a efectua acest test folosind cantitatea
n ( ˆ1 1 ) unde n este mărimea eşantionului (numărul de observaţii). Dacă

n (ˆ1  1)  n (ˆ1  1) tab , se acceptă ipoteza H0 de existenţă a rădăcinei unitare.


Remarcă: principalele programe computerizate de analiză a seriilor de timp oferă
valorile critice t
ˆ
1
.
e) Testele Dickey et Fuller Extinse (ADF)
În modelele precedente folosite pentru testele Dickey-Fuller simple, procesul εt, este,
ipotetic, un zgomot alb. Or, nu este nici un motiv pentru care, a priori, eroarea să nu fie
corelată. Testele Dickey-Fuller Extins (ADF, 1981) ia în consideraţie această ipoteză.
Testele ADF se bazează pe ipoteza alternativă 1  1, prin estimarea prin MCMMP
a trei modele:
p

Modelul [4]:
 x   x     x t t 1
j 2
j t  j 1
 t

8
p

Modelul [5]:
x  x    x
t t 1 j t  j 1
c  t
j 2
p

Modelul [6]:
x  x    x
t t 1 j t  j 1
 c  bt   t
j 2
unde εt → i.i.d.
Testul se derulează în mod similar cu testele DF simple, doar tabelele statistice sunt
diferite.
Valoarea p este determinată conform criteriilor Akaike şi Schwarz, sau chiar în baza
unei valori destul de importante p,
se estimează un model cu p–1 întârzieri, apoi cu
p–2 întârzieri, până când coeficientul al p întârzieri să fie semnificativ.

f) Testul Phillips şi Perron (1988)

Acest test este construit în baza unei corecţii neparametrice a statisticilor Dickey-Fuller
pentru a ţine cont de erorile heteroscedastice. El se derulează în patru etape:
1) estimarea prin MCMMP a trei modele de bază cu ajutorul testelor Dickey-Fuller şi
calculul statisticilor asociate, fie et reziduul estimat;
1 n 2
2) estimarea varianţei ,zisă pe termen scurt
̂   et ; 2

n t 1
3) estimarea unui factor corectiv s (numit varianţă pe termen lung) stabilit în baza
2
t
structurii covarianţelor reziduurilor modelelor estimate anterior, astfel încât
transformările realizate să conducă la distribuţii identice celor Dickey-Fuller standard:

1  i 1
n t n

s   e  2  1 
2
 e e
2

 l 1 n
t i
n
t t t
t 1 i 1 t i 1

Pentru a estima această varianţă pe termen lung, este necesar de a defini un număr de
întârzieri l (tăierea Newey-West) estimat în funcţie de numărul de observaţii n,
l  4n / 100
2/9
;

t *
k
ˆ  1 nk  1ˆ
 1 ˆ1

ˆ
ˆ
4) Calculul statisticii PP: 1

ˆ1
k , unde

9
ˆ 2

k (care este egal cu 1 – în mod asimptotic – dacă et este un zgomot alb).


s t
2

Această statistică se compară cu valorile critice din tabelul MacKinnon.

g) Strategia testelor

Vom constata că pentru a realiza un test de rădăcină unitară, rezultatul nu este identic
conform utilizării unuia din cele trei modele precum procesul ce generează cronica
începutului.
Concluziile la care se ajunge sunt deci diferite şi pot implica transformări eronate.
Acesta este motivul pentru care Dickey şi Fuller, precum şi alţi autori, au elaborat strategia
testelor.
Vom prezenta un exemplu simplificat (schema 1) a unei strategii de teste. Valorile

critice a cˆ t si t
bˆ care permit de a testa nulitatea coeficienţilor c şi b a modelelor [2]
şi [3] sunt date în anexă.

h) Testul KPSS (1992)

Kwiatkowski şi alţii (1992) propun folosirea unui test al multiplicatorului Lagrange


(LM), bazat pe ipoteza nulă de staţionaritate. După estimarea modelelor [2] sau[3], se
t

calculează suma parţială a reziduurilor: S  e


t i şi se estimează varianţa pe termen lung
i 1

( s 2
t ) ca şi pentru testul Philips şi Perron.
n

1 S
2
t

Statistica este deci LM  t 1


. Vom respinge ipoteza de staţionaritate
s 2
t
n 2

dacă această statistică este mai mare decât valorile critice din tabelul elaborat de autori.

II. Modelele ARIMA

În continuare se va prezenta o familie de procese aleatoare care încearcă să acopere o


gamă foarte largă a evoluţiei posibile a seriilor cronologice: procese autoregresive şi
procese ale mediei mobile

A. Tipologia modelelor AR, MA şi ARMA


1) Modelul AR (Autoregresiv)
10
a) Formularea
În procesul autoregresiv de ordinul p, observaţia prezentă yt este generată de o medie
ponderată a observaţiilor trecute până la perioada p în forma următoare:
AR(1): y   y  
t 1 t 1 t

AR(2): y   y   y  
t 1 t 1 2 t 2 t


AR(p): y   y   y  ...   y  
t 1 t 1 2
[4]
t 2 p t p t

unde θ1, θ2, … , θp sunt parametrii de estimat pozitivi sau negativi, εt este un risc gaussian.
Putem adăuga la acest proces o constantă care nu modifică cu nimic proprietăţile
stochastice. Ecuaţia [4] poate de asemenea fi scrisă cu ajutorul operatorul de decalaj D:
(1 - θ1D – θ2D2 - … - θpDp)yt = εt
b) Caracteristicile corelogramei
Este demonstrat că corelograma simplă a unui proces AR(p) este caracterizată printr-
o descreştere geometrică a termenilor săi tip:
ρk = ρk
Corelograma parţială are proprii săi p primi termeni diferiţi de 0.

2) Modelul MA (Moving Average : Medie Mobilă)


a) Formularea
În procesul mediei mobile de ordin q, fiecare observaţie yt este generată de o medie
ponderată de riscuri până la perioada q.
MA(1): yt   t  1 t 1
MA(2): y        
t t 1 t 1 2 t 2


MA(q): y          ...   
t t 1
[5]
t 1 2 t 2 q t q

unde α1, α2, … , αq sunt parametri care pot fi pozitivi sau negativi şi εt este un risc
gaussian.
Ecuaţia [5] poate de asemenea fi scrisă:
(1 - α1D – α2D2 - … - αqDq)εt = yt
În acest proces, la fel ca şi în modelul autoregresiv AR, riscurile sunt presupuse a fi
generate de un proces de tip zgomot alb. Se poate interpreta modelul MA ca fiind
reprezentativ de o serie cronologică ce fluctuează în jurul mediei în mod aleatoriu, de unde
şi termenul de medie mobilă căci acesta, nivelând seria, şterge zgomotul creat de risc.
Trebuie de specificat că este o echivalenţă între un proces MA(1) şi un proces AR de
ordinul p infinit:
MA(1) = AR(∞).
b) Caracteristicile corelogramelor
Corelograma simplă a unui proces MA(q) este în forma generală:

11
i q k

  i ik
 k
i 0
i q


i 0
2
i
pentru k = 0, 1, … , q şi ρk = 0 pentru k > q.

Adică doar primi q termeni ai corelogramei simple sunt semnificativ diferiţi de 0.


Corelograma parţială este caracterizată prin descreşterea geometrică a întârzierilor.

3) Modelul ARMA (amestecul proceselor AR şi AM)


a) Formulare
Modelele ARMA sunt deci reprezentative ale unui proces generat de o combinare a
valorilor trecute şi a erorilor trecute. Ele sunt definite prin ecuaţia:
ARMA(p,q): (1 - θ1D – θ2D2 - … - θpDp)yt = (1 - α1D – α2D2 - … - αqDq)εt
Deci, avem:
ARMA(1,0) = AR(1); ARMA(0,1)=MA(1).
b) Caracteristicile corelogramelor
Corelogramele simple şi parţiale sunt, în consecinţă, un amestec a două corelograme
a proceselor AR şi MA pure. Astfel se dovedeşte a fi mai delicat de a identifica aceste
procese în baza studiului funcţiilor de autocorelare empirice.
Tabelul 2 sintetizează caracteristicile corelogramelor proceselor AR, MA şi ARMA.

Tab.2 – Rezumatul proprietăţilor funcţiilor de autocorelare simplă şi parţială


Procesul Funcţia de autocorelare simplă Funcţia de autocorelare parţială
AR(1) Descreştere exponenţială (θ1 > 0) Vârf semnificativ pentru prima
sau sinusoidală amortizată (θ1 < 0) întârziere: pozitiv dacă θ1 > 0, şi
negativ, dacă θ1 < 0, alţi
coeficienţi nuli pentru întârzierile
>1
AR(2) Descreşterea exponenţială sau Vârf semnificativ pentru prima şi
sinusoidală după semnele θ1 şi θ2 a doua întârzieri, alţi coeficienţi
sunt nuli pentru întârzierile > 2
AR(p) Descreşterea exponenţială şi/sau Vârf semnificativ pentru primele
sinusoidală p întârzieri, alţi coeficienţi sunt
nuli pentru întârzierile > p
MA(1) Vârf semnificativ pentru prima Descreştere exponenţială (α1 > 0)
întârziere: pozitiv dacă α1 < 0, şi sau sinusoidală amortizată (α1 <
negativ, dacă α1 > 0, alţi coeficienţi 0)
nuli pentru întârzierile > 1
MA(2) Vârf semnificativ pentru prima şi a Descreşterea exponenţială sau
doua întârzieri, alţi coeficienţi sunt sinusoidală după semnele α1 şi α2
nuli pentru întârzierile > 2
MA(q) Vârf semnificativ pentru primele q Descreşterea exponenţială şi/sau
întârzieri, alţi coeficienţi sunt nuli sinusoidală
12
pentru întârzierile > q
ARMA(1, Descreştere geometrică în baza Descreştere exponenţială (α1 > 0)
1) primei întârzieri, semnul este sau sinusoidală amortizată (α1 <
determinat de θ1 – α1 0)
ARMA(p, Descreştere exponenţială sau Descreştere exponenţială sau
q) sinusoidală amortizată tăiată după sinusoidală amortizată tăiată
(q – p) întârzieri după p – q întârzieri

4) Condiţiile de utilizare
Modelele AR, MA, ARMA nu sunt reprezentative decât pentru cronici:
- staţionare de tendinţă;
- corectate de variaţiile sezoniere.

B. Extinderea proceselor ARIMA şi SARIMA


Testele Dickey-Fuller şi Dickey-Fuller Mărite văzute mai sus permit de a determina
dacă seria este staţionară şi în caz de nestaţionaritate, de ce tip e: TS sau DS.
Dacă seria studiată este de tip TS, se recomandă de a staţionariza prin regresie asupra
timpului şi reziduul de estimare este atunci studiat conform metodologiei Box-Jenkins.
Aceasta permite de a determina ordinele p şi q a părţilor AR şi MA a reziduului. Modelul
este mereu, în acest caz, un ARMA(p,q).
Dacă seria studiată este de tip DS, se recomandă de a e staţionariza prin trecerea la
diferenţe conform ordinului de integrare I = d (adică de câte ori trebuie diferenţiată seria
pentru a o face staţionară). Seria diferenţiată este atunci studiată conform metodologiei
Box-Jenkins care permite de a determina ordinele p şi q a părţilor AR şi MA se notează
acest tip de model ARIMA(p,d,q).
Modelele SARIMA permit de a integra un ordin de diferenţiere legat de o
sezonalitate generalizată prin transformarea: (1 – Ds)yt = yt – yt-1 unde s corespunde
periodicităţii datelor (s = 4 pentru o serie trimestrială, s = 12 pentru o serie lunară).

III. Metoda Box şi Jenkins

Partea autoregresivă a unui proces, notată AR, este constitută dintr-o combinare
lineară finită a valorilor trecute a procesului. Partea medie mobilă, notată MA, este
formată dintr-o combinare lineară finită în t a valorilot trecute a unui zgomot alb. Wold
(1954) arată că modelele ARMA permit reprezentarea majorităţii proceselor staţionare.
Abordarea Box şi Jenkins (1976) constă dintr-o metodologie de studiu sistematic a seriilor
cronologice în baza caracteristicilor lor pentru a determina, în familia modelelor ARIMA,
cea mai adaptată reprezentare a fenomenului studiat. Trei etape principale sunt definite.

A. Cercetarea reprezentării adecvate: identificarea


Faza de identificare este cea mai importantă şi cea mai dificilă: ea constă în
determinarea modelului adecvat din familia modelelor ARIMA. Ea este fondată pe studiul
corelogramelor simple şi parţiale. Se poate încerca prezentarea câtorva reguli simple ce
13
uşurează cercetarea parametrilor p, d, q a modelului ARIMA.

1) Desezonalizarea
În cazul unei serii afectată de o mişcare sezonieră, se recomandă de a o scoate în
prealabil, din prelucrarea statistică. Această sezonalitate este adăugată la seria prevăzută la
sfârşitul prelucrării pentru a obţine o previziune în termeni bruţi.
2) Cercetarea staţionarităţii în termeni de tendinţă
Dacă studiul corelogramei simple şi testele statistice la care se raportează (statistica
Q) prevede o serie afectată de o tendinţă, se recomandă de a-i studia caracteristicile
conform testelor Dickey-Fuller. Metoda de eliminare a tendinţei este funcţia procesului DS
sau TS subordonată cronicii studiate.
După staţionarizare, putem identifica valorile parametrilor p, q din modelul ARMA.
- Dacă corelograma simplă nu are decât primii săi q termeni (q = 3 maxim) diferiţi
de 0 şi că termenii corelogramei parţiale scad încet, putem pronostioca MA(q);
- Dacă corelograma parţială nu are decât primii săi p termeni (p = 3 maxim) diferiţi
de 0 şi că termenii corelogramei simple scad încet, aceasta caracterizează AR(p);
- Dacă funcţiile de autocorelare simplă şi parţială nu par a fi tăiate, este vorba de un
proces de tip ARMA, a căror parametri depind de foma particulară a
corelogramelor.

B. Estimarea parametrilor
Metodele de estimare sunt diferite în dependenţă de tipul procesului diagnosticat. În
cazul unui model AR(p), putem aplica o metodă a celor mai mici pătrate sau chiar putem
folosi relaţiile existente între autocorelări şi coeficienţii modelului (ecuaţiile Yule-
Walker).
Estimarea parametrilor modelului MA(q) se dovedeşte a fi complexă. Box şi Jenkins
sugerează de a utiliza o procedură iterativă de tip măturare pe care o putem arăta în felul
următor.
Să presupunem procesul:
(1 - θ1D – θ2D2)yt = (1 - α1D – α2D2)εt
pe care îl putem scrie:
1
y  1   D   D  2

1  D  D
t 2 1 2 t
1 2
1
Notăm:  t   , şi deci avem:
1  D  D 2 t
1 2

14
      
t 1 t 1 2 t 2 t [6]
De unde obţinem:
y    
t t 1 t 1
  unde t  yt  1t 1   2t 2
2 t 2
[7]
Acum putem începe procedura de măturare în baza a două intervale de valori
plauzibile pentru (ˆ1 ;ˆ 2 ) şi de un pas adăugare.

Apoi, pentru fiecare pereche de valori ( ˆ1 ;ˆ 2 ), notăm ˆ  0 şi ˆ  0 ,


0 1
şi calculăm valorile estimate ale lui ̂ t în baza relaţiei[7]:
ˆ  y2 2

ˆ  y  ˆ ˆ
3 3 1 2

ˆ  y  ˆ ˆ  ˆ ˆ ,
4 4 1 3 2 2
etc.
După calculul tuturor valorilor ̂ t , se estimează parametrii θ1 şi θ2 prin metoda celor
mai mici pătrate aplicată ecuaţiei [6]:
       
t 1 t 1 2 t 2 t [8]
Reţinem valorile ˆ1 , ˆ2 şi ˆ1 , ˆ 2 care reduc la minimum suma pătratelor
reziduurilor obţinută din regresia ecuaţiei [8].
Această metodă de estimare nu e valabilă decât dacă numărul parametrilor de estimat
nu este destul de mare.
Se pot menţiona metodele de estimare bazate pe o maximizare a funcţiilor de
asemănare ce recurg atunci la procedurile iterative de regresie nelineară, precum cele
prezentate în cap.6.

C. Teste de adecvare a modelului de previziune


Parametrii modelului fiind estimaţi (se verifică convergenţa procedurii iterative de
estimare), vom examina acum rezultatele de estimare.
 Coeficienţii modelului trebuie să fie semnificativ diferiţi de 0 (testul t Student se aplică
în mod clasic). Dacă un coeficient nu este semnificativ diferit de 0, se recomandă de a
prevedea o nouă specificare prin eliminarea ordinului modelului AR sau MA
nevalabile.
 Analiza reziduurilor se efectuează în baza a două criterii ce trebuie respectate:
- media este nulă, în caz contrar se recomandă de a adăuga o constantă la model;
- reziduul este un zgomot alb, statisticile Q şi Q Box-Pierce şi Ljung-Box (gradul
de libertate este egal cu numărul de întârzieri h micşorat cu numărul de coeficienţi
estimaţi), permit de a testa această ipoteză. Dacă reziduul nu este un zgomot alb,
aceasta înseamnă că specificarea modelului este incompletă şi că lipseşte cel puţin
un ordin al procesului.
15
Faza de validitate a modelului este foarte importantă şi necesită de cele mai dese ori o
întoarcere la faza de identificare.
Atunci când modelul este valabil, previziunea poate fi calculată la un orizont de
câteva perioade, limitate căci varianţa erorii de previziune creşte foarte repede odata cu
orizontul.

Se pot rezuma fazele metodologiei Box şi Jenkins precum e arătat în schema 2.

Seria xt. Analiza graficului şi a corelogramei

Analiza sezonalităţii

Testul Dickey-Fuller

Regresie asupra timpului, dacă TS Trecerea la diferenţe, dacă DS

Seria staţionară yt

Analiza corelogramelor simplă şi parţială

Determinarea ordinelor p şi q a proceslului ARMA

Estimarea parametrilor

Testul Student. Coeficienţii nesemnificativi sunt


eliminaţi

Teste ale reziduurilor. Sunt ele zgomote albe?

Da Nu. Se adaugă un ordin p sau q

Previziunea ARMA

Recolorarea seriei (exponenţială, sezonalitate,


…)

Etapele metodologie Box şi Jenkins

16

S-ar putea să vă placă și