Documente Academic
Documente Profesional
Documente Cultură
A. Definiţie şi proprietăţi
Înaintea prelucrării unei serii cronologice, se recomandă de a studia mai întâi
caracteristicile stochastice. Dacă aceste caracteristici stochastice – adică speranţa şi varianţa sa
– cunosc modificări în timp, seria cronologică este considerată drept nestaţionară; în cazul
unui proces stochastic invariat, seria de timp este staţionară.
În mod formal, procesul stochastic y, este staţionar dacă:
E ( yt ) E ( yt m ) t si m , media este constantă şi
independentă de timp;
var(yt) < ∞t, varianţa este finită şi independentă de timp;
cov(yt, yt+k) = E[(yt — μ)(yt+k — μ)] = γk, covarianţa este independentă de timp.
În baza acestor proprietăţi, un proces de zgomot alb εt, este staţionar, dacă εt sunt
independente şi supuse aceleiaşi legi N(0,σε2) .
O serie cronologică este deci staţionară, dacă ea este realizarea unui proces staţionar.
Faptul presupune că seria nu este supusă nici tendinţei, nici sezonalităţii şi în general nici
un factor nu evoluează în timp.
0 t / 2
1
k n
n = numărul de observaţii.
Dacă coeficientul calculat ̂ k se află în exteriorul acestui interval de încredere, el este
/2
semnificativ diferit de 0 la pragul (în general = 0,05 şi t 1,96 ).
Majoritatea logicielilor furnizează, odată cu corelograma, intervalul de încredere, ceea ce
permite o interpretare imediată.
Este necesar de subliniat o limită a testelor de 5%, atunci când o funcţie de autocorelare
este calculată pentru un număr important de întârzieri, ne putem aştepta ca câteva să fie, în
mod fortuit (întâmplător), semnificativ diferite de 0. Dacă h este numărul de întârzieri,
numărul posibil de respingeri false este deci de 0,05 x h, pentru un prag de încredere de 5%.
În cazul în care corelograma nu arată nici o descreştere a termenilor săi (absenţa vre-unui
“cut off”), se poate conchide că seria nu este staţionară în tendinţă.
3
2) Statisticile Box-Pierce şi Ljung-Box
h 2
Q n ̂
k
k 1
2
h ˆ k
Q ' n ( n 2)
k 1 n k
care este de asemenea distribuită conform χ cu h grade de libertate şi a cărei reguli de
2
decizie sunt identice. Aceste teste sunt numite în engleză: “portmanteau test” sau tradus
literalmente testul “total îmblănit”.
3) Teste de normalitate
4
2
şi coeficientul Kurtosis: 2 .
2
a) Procesele TS
Un proces TS se scrie: xt = ft +εt unde ft este o funcţie polinomială de timp, lineară
sau nelineară, şi εt un proces staţionar. Procesul TS cel mai simplu (şi cel mai răspândit) este
reprezentat printr-o funcţie polinomială de gradul 1, care este numit linear şi se scrie:
xt=a0+a1t+εt
Acest proces TS este nestaţionar deoarece E[xt] depinde de timp. Cunoscând â 0
şi â1 procesul xt poate staţionariza reducând valoarea lui xt în t, valoarea estimată
ˆ0 a
a ˆ1t
. În acest tip de modelizare, efectul produs printr-un şoc (sau prin
mai multe şocuri aleatoare) la un moment t este tranzitoriu. Modelul fiind detreminist,
cronica îşi regăseşte mişcarea pe termen lung prin dreapta tendinţei. Este posibil de a
generaliza acest exemplu la funcţii polinomiale de un anumit grad..
b) Procesele DS
Procesele DS sunt procese care se pot transforma în staţionare folosind un filtru de
diferenţe: (1 — D)dxt = β + εt unde εt este un proces staţionar, β o constantă reală, D
operator de decalaj, şi d ordinul filtrului diferenţelor.
Aceste procese sunt deseori reprezentate folosind filtrul diferenţelor primare (d = 1),
numit proces de prim ordin şi se scrie:
(1 - D)xt = β + εt xt = xt-1 + β + εt
Introducerea constantei β în procesul DS permite de a defini cele două procese diferite:
• β=0: procesul DS fără derivă.
Procesul are forma: xt = xt-1 + εt
Precum εt , este un zgomot alb, acest proces DS este numit modelul mersului la
întâmplare sau a mersului aleatoriu (Random Walk Model). Foarte des el este folosit pentru a
analiza eficienţa pieţelor financiare.
Pentru a staţionariza mersul aleatoriu, este suficient de a aplica procesului filtrul
diferenţelor primare: xt = xt-1 + εt, (1 - D)xt = εt..
• β≠0: procesul este numit proces DS cu derivă.
Procesul are forma: xt = xt-1 + β + εt
Staţionarizarea acestui proces este realizată folosind filtrul diferenţelor primare:
xt = xt-1 + β + εt, (1 - D)xt =β + εt
6
În procesul de tip DS, un şoc la un moment dat se repercutează la infinit asupra
valorilor viitoare ale seriei; efectul şocului este deci permanent şi i în descreştere.
În concluzie, pentru staţionarizarea unui proces TS, metoda cea bună este acea a celor
mai mici pătrate ordinare; pentru un proces DS trebuie de folosit filtrul diferenţelor. Alegerea
unui proces DS sau TS drept structură a cronicii nu este deci neutră.
c) Consecinţele unei proaste staţionarizări a procesului
Pentru un proces TS, o metoda bună de staţionarizare este acea a celor mai mici
pătrate ordinare.
Ce se întâmplă , dacă pentru procesul TS de prim ordin se aplică un filtru cu diferenţe
primare. A priori, deoarece gradul polinomului e 1, acest filtru poate fi considerat drept
corect, deoarece un filtru cu diferenţe de ordinul d elimină un polinom de acelaşi grad. În
acelaşi timp, se demonstrează că aplicarea unui filtru cu diferenţe creează o perturbaţie
artificială.
Pentru un proces DS, metoda bună de staţionarizare este filtrul cu diferenţe primare.
Dacă presupunem că se aplică metoda celor mai mici pătrate ordinare (regresie în timp)
asupra observaţiilor unui eşantion al procesului, parametrii tendinţei sunt estimaţi şi în
consecinţă reziduul regresiei trebuie să fie un zgomot alb. Nelson şi Kang arată în baza
simulărilor, că eliminarea unei tendinţe lineare asupra unui proces de mers aleatoriu creează
artificial o puternică autocorelare a reziduurilor pentru primele întârzieri.
În plan econometric, este deci primordial de a identifica clar procesul şi de a folosi
metoda adecvată de staţionarizare. În caz contrar riscul de a crea “zgomote parazite”
artificiale este foarte mare.
Consecinţele sunt de asemenea importante în plan economic.
d) Testele rădăcini unitare: testele Dickey-Fuller (1979)
Testele Dickey-Fuller (DF) permit de a pune în evidenţă caracterul staţionar sau nu al
unei cronici prin determinarea unei tendinţe deterministe sau stochastice.
Modelele care stau la baza construcţiei acestor teste sunt trei. Principiul acestor testelor
este simplu:
Dacă ipoteza H0: φ1 = 1 este reţinută în unul din aceste trei modele, atunci procesul
este nestaţionar.
În modelul [3], dacă se acceptă H1: φ1<1 şi dacă coeficientul b este semnificativ
diferit de 0, atunci procesul este un proces TS; se poate transforma în staţionar calculând
reziduurile în comparaţie cu tendinţa estimată prin metoda celor mai mici pătrate ordinare.
Conform H0, regulile obişnuite de inferenţă statistică nu se pot aplica pentru a testa
7
această ipoteză, în particular distribuţia Student a parametrului φ1; Dickey şi Fuller au studiat
distribuţia asimptotică a estimatorului φ1 în conformitate cu ipoteza H0. Cu ajutorul
simulărilor Monte-Carlo, alcătuind tabele cu valori critice pentru eşantioane de mărimi
diferite. Aceste tabele sunt analoage tabelelor t Student. Autorii au ales să testeze valoarea
( ˆ 1 1 ) în locul lui ˆ1 din motive pur statistice. Aceasta nu este jenant pentru test. De
fapt, xt = φ1xt-1 + εt se scrie de asemenea:
t t
Dacă ˆ1 tabel , atunci se acceptă ipoteza H0; există o rădăcină unitară, procesul
nu este deci staţionar. Este posibil de asemenea de a efectua acest test folosind cantitatea
n ( ˆ1 1 ) unde n este mărimea eşantionului (numărul de observaţii). Dacă
Modelul [4]:
x x x t t 1
j 2
j t j 1
t
8
p
Modelul [5]:
x x x
t t 1 j t j 1
c t
j 2
p
Modelul [6]:
x x x
t t 1 j t j 1
c bt t
j 2
unde εt → i.i.d.
Testul se derulează în mod similar cu testele DF simple, doar tabelele statistice sunt
diferite.
Valoarea p este determinată conform criteriilor Akaike şi Schwarz, sau chiar în baza
unei valori destul de importante p,
se estimează un model cu p–1 întârzieri, apoi cu
p–2 întârzieri, până când coeficientul al p întârzieri să fie semnificativ.
Acest test este construit în baza unei corecţii neparametrice a statisticilor Dickey-Fuller
pentru a ţine cont de erorile heteroscedastice. El se derulează în patru etape:
1) estimarea prin MCMMP a trei modele de bază cu ajutorul testelor Dickey-Fuller şi
calculul statisticilor asociate, fie et reziduul estimat;
1 n 2
2) estimarea varianţei ,zisă pe termen scurt
̂ et ; 2
n t 1
3) estimarea unui factor corectiv s (numit varianţă pe termen lung) stabilit în baza
2
t
structurii covarianţelor reziduurilor modelelor estimate anterior, astfel încât
transformările realizate să conducă la distribuţii identice celor Dickey-Fuller standard:
1 i 1
n t n
s e 2 1
2
e e
2
l 1 n
t i
n
t t t
t 1 i 1 t i 1
Pentru a estima această varianţă pe termen lung, este necesar de a defini un număr de
întârzieri l (tăierea Newey-West) estimat în funcţie de numărul de observaţii n,
l 4n / 100
2/9
;
t *
k
ˆ 1 nk 1ˆ
1 ˆ1
ˆ
ˆ
4) Calculul statisticii PP: 1
ˆ1
k , unde
9
ˆ 2
g) Strategia testelor
Vom constata că pentru a realiza un test de rădăcină unitară, rezultatul nu este identic
conform utilizării unuia din cele trei modele precum procesul ce generează cronica
începutului.
Concluziile la care se ajunge sunt deci diferite şi pot implica transformări eronate.
Acesta este motivul pentru care Dickey şi Fuller, precum şi alţi autori, au elaborat strategia
testelor.
Vom prezenta un exemplu simplificat (schema 1) a unei strategii de teste. Valorile
critice a cˆ t si t
bˆ care permit de a testa nulitatea coeficienţilor c şi b a modelelor [2]
şi [3] sunt date în anexă.
( s 2
t ) ca şi pentru testul Philips şi Perron.
n
1 S
2
t
dacă această statistică este mai mare decât valorile critice din tabelul elaborat de autori.
AR(2): y y y
t 1 t 1 2 t 2 t
…
AR(p): y y y ... y
t 1 t 1 2
[4]
t 2 p t p t
unde θ1, θ2, … , θp sunt parametrii de estimat pozitivi sau negativi, εt este un risc gaussian.
Putem adăuga la acest proces o constantă care nu modifică cu nimic proprietăţile
stochastice. Ecuaţia [4] poate de asemenea fi scrisă cu ajutorul operatorul de decalaj D:
(1 - θ1D – θ2D2 - … - θpDp)yt = εt
b) Caracteristicile corelogramei
Este demonstrat că corelograma simplă a unui proces AR(p) este caracterizată printr-
o descreştere geometrică a termenilor săi tip:
ρk = ρk
Corelograma parţială are proprii săi p primi termeni diferiţi de 0.
…
MA(q): y ...
t t 1
[5]
t 1 2 t 2 q t q
unde α1, α2, … , αq sunt parametri care pot fi pozitivi sau negativi şi εt este un risc
gaussian.
Ecuaţia [5] poate de asemenea fi scrisă:
(1 - α1D – α2D2 - … - αqDq)εt = yt
În acest proces, la fel ca şi în modelul autoregresiv AR, riscurile sunt presupuse a fi
generate de un proces de tip zgomot alb. Se poate interpreta modelul MA ca fiind
reprezentativ de o serie cronologică ce fluctuează în jurul mediei în mod aleatoriu, de unde
şi termenul de medie mobilă căci acesta, nivelând seria, şterge zgomotul creat de risc.
Trebuie de specificat că este o echivalenţă între un proces MA(1) şi un proces AR de
ordinul p infinit:
MA(1) = AR(∞).
b) Caracteristicile corelogramelor
Corelograma simplă a unui proces MA(q) este în forma generală:
11
i q k
i ik
k
i 0
i q
i 0
2
i
pentru k = 0, 1, … , q şi ρk = 0 pentru k > q.
4) Condiţiile de utilizare
Modelele AR, MA, ARMA nu sunt reprezentative decât pentru cronici:
- staţionare de tendinţă;
- corectate de variaţiile sezoniere.
Partea autoregresivă a unui proces, notată AR, este constitută dintr-o combinare
lineară finită a valorilor trecute a procesului. Partea medie mobilă, notată MA, este
formată dintr-o combinare lineară finită în t a valorilot trecute a unui zgomot alb. Wold
(1954) arată că modelele ARMA permit reprezentarea majorităţii proceselor staţionare.
Abordarea Box şi Jenkins (1976) constă dintr-o metodologie de studiu sistematic a seriilor
cronologice în baza caracteristicilor lor pentru a determina, în familia modelelor ARIMA,
cea mai adaptată reprezentare a fenomenului studiat. Trei etape principale sunt definite.
1) Desezonalizarea
În cazul unei serii afectată de o mişcare sezonieră, se recomandă de a o scoate în
prealabil, din prelucrarea statistică. Această sezonalitate este adăugată la seria prevăzută la
sfârşitul prelucrării pentru a obţine o previziune în termeni bruţi.
2) Cercetarea staţionarităţii în termeni de tendinţă
Dacă studiul corelogramei simple şi testele statistice la care se raportează (statistica
Q) prevede o serie afectată de o tendinţă, se recomandă de a-i studia caracteristicile
conform testelor Dickey-Fuller. Metoda de eliminare a tendinţei este funcţia procesului DS
sau TS subordonată cronicii studiate.
După staţionarizare, putem identifica valorile parametrilor p, q din modelul ARMA.
- Dacă corelograma simplă nu are decât primii săi q termeni (q = 3 maxim) diferiţi
de 0 şi că termenii corelogramei parţiale scad încet, putem pronostioca MA(q);
- Dacă corelograma parţială nu are decât primii săi p termeni (p = 3 maxim) diferiţi
de 0 şi că termenii corelogramei simple scad încet, aceasta caracterizează AR(p);
- Dacă funcţiile de autocorelare simplă şi parţială nu par a fi tăiate, este vorba de un
proces de tip ARMA, a căror parametri depind de foma particulară a
corelogramelor.
B. Estimarea parametrilor
Metodele de estimare sunt diferite în dependenţă de tipul procesului diagnosticat. În
cazul unui model AR(p), putem aplica o metodă a celor mai mici pătrate sau chiar putem
folosi relaţiile existente între autocorelări şi coeficienţii modelului (ecuaţiile Yule-
Walker).
Estimarea parametrilor modelului MA(q) se dovedeşte a fi complexă. Box şi Jenkins
sugerează de a utiliza o procedură iterativă de tip măturare pe care o putem arăta în felul
următor.
Să presupunem procesul:
(1 - θ1D – θ2D2)yt = (1 - α1D – α2D2)εt
pe care îl putem scrie:
1
y 1 D D 2
1 D D
t 2 1 2 t
1 2
1
Notăm: t , şi deci avem:
1 D D 2 t
1 2
14
t 1 t 1 2 t 2 t [6]
De unde obţinem:
y
t t 1 t 1
unde t yt 1t 1 2t 2
2 t 2
[7]
Acum putem începe procedura de măturare în baza a două intervale de valori
plauzibile pentru (ˆ1 ;ˆ 2 ) şi de un pas adăugare.
ˆ y ˆ ˆ
3 3 1 2
ˆ y ˆ ˆ ˆ ˆ ,
4 4 1 3 2 2
etc.
După calculul tuturor valorilor ̂ t , se estimează parametrii θ1 şi θ2 prin metoda celor
mai mici pătrate aplicată ecuaţiei [6]:
t 1 t 1 2 t 2 t [8]
Reţinem valorile ˆ1 , ˆ2 şi ˆ1 , ˆ 2 care reduc la minimum suma pătratelor
reziduurilor obţinută din regresia ecuaţiei [8].
Această metodă de estimare nu e valabilă decât dacă numărul parametrilor de estimat
nu este destul de mare.
Se pot menţiona metodele de estimare bazate pe o maximizare a funcţiilor de
asemănare ce recurg atunci la procedurile iterative de regresie nelineară, precum cele
prezentate în cap.6.
Analiza sezonalităţii
Testul Dickey-Fuller
Seria staţionară yt
Estimarea parametrilor
Previziunea ARMA
16