Sunteți pe pagina 1din 77

SUPORT DE CURS

ANALIZA SERIILOR CRONOLOGICE ŞI PREVIZIUNE

Lect. Dr. Dorina LAZAR

1
CUPRINS

Capitolul 1 . Componentele deterministe ale unei serii de timp


1.1 Concepte de bază
1.2. Măsuri pentru acurateţea previziunilor
1.3. Componentele unei serii de timp
1.4. Estimarea tendinţei prin funcţii elementare
1.5. Estimarea tendintei utilizând mediile mobile
1.6. Componenta sezonieră. Estimarea componentei sezoniere
1.6.1 Modelul de descompunere. Perioada componentei sezoniere
1.6.2 Eliminarea componentei sezoniere utilizând mediile mobile
1.6.3 Estimarea componentei sezoniere
1.7 Descompunerea seriei pe componente

Capitolul 2. Metode de netezire exponenţială


2.1. Metoda de netezire exponenţială simplă
2.2 Metoda Holt de netezire exponenţială
2.3. Metoda Holt-Winters de netezire exponenţială

Capitolul 3. Modele de tip autoregresiv medie mobilă (ARMA, ARIMA)


3.1. Principalele concepte pe care se fundamentează metodologia Box-Jenkins
3.2. Modelul autoregresiv. Proprietăţile funcţiei de autocorelaţie respectiv de
autocorelaţie parţială
3.3. Modelul medie mobilă. Proprietăţile funcţiei de autocorelaţie respectiv de
autocorelaţie parţială
3.4. Etapele elaborării unui model ARIMA
3.4.1 Identificarea (specificarea) modelului
3.4.2 Estimarea parametrilor modelului
3.4.3 Teste de validitate şi respecificarea modelului
3.4.4. Elaborarea previziunilor
3.5. Alte extinderi ale modelelor ARIMA
3.5.1. Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere
SARIMA
3.5.2. Modele de tip ARCH
3.6. Regresii cu serii de timp

Capitolul 4. Modele VAR şi modele VECM


4.1. Teste de nestaţionalitate (teste de tip „unit roots”)
4.2. Serii cointegrate. Metodologia Engle-Granger
4.3. Analiza cauzalităţii dintre variabile
4.4. Modele vector autoregresiv VAR
4.5. Cointegrare în sisteme de ecuaţii. Metodologia Johansen-Juselius

2
Capitolul 1. Componentele deterministe ale unei serii de timp

1.1 Concepte de bază

În derularea activităţii lor, frecvent agenţii economici sunt puşi în situaţia de a


anticipa viitorul, iar apoi de a lua decizii în consecinţă. Oamenii de afaceri sunt nevoiţi să
previzioneze anual cererea dintr-un produs, cifra de afaceri şi alte elemente necesare
întocmirii unui plan de afaceri, investitorii sunt interesaţi de profitul viitor degajat de
investiţie, respectiv guvernele de previziunea consumului sau a cheltuielilor
guvernamentale etc.. Softurile de statistică facilitează obţinerea rapidă de previziuni
utilizând modele cantitative de previziune. Anticiparea, previziunea evoluţiei viitoare a
fenomenelor economice presupune în primul rând cunoaşterea istoriei acestora, punerea
în evidenţă a unor legităţi privind comportamentul lor trecut. Baza de date pe care se
fundamentează analiza evoluţiei fenomenelor în timp este constituită din serii de timp
(sau serii cronologice).
O serie de timp constă într-o secvenţă de observaţii asupra unei variabile Y ,
ordonate după parametrul timp. Frecvent, măsurătorile asupra variabilei sunt efectuate la
intervale egale de timp, seria cronologică fiind prezentată sub forma:
1 2 ... t ... T 
Y :
Y 
 1 Y2 ... Yt ... YT 

Seria de timp formată cu valorile observate constituie o realizare a secvenţei de variabile
aleatoare Y1 , Y2 ,...., YT , adică a unui proces aleator (proces stochastic) de tip discret.
Evoluţia unei variabile în timp este reprezentată printr-un proces aleator.
Proces aleator de tip discret = secvenţă de variabile aleatoare (Yt ) unde t ∈ Z ,
ordonate după parametrul timp. Pentru fiecare moment de timp t, Yt e o variabilă
aleatoare şi dispunem de regulă de o singură observaţie relativ la aceasta. În cele ce
urmează vom utiliza aceeaşi notaţie respectiv Yt atât pentru variabila aleatoare ataşată
momentului t cât şi pentru valoarea observată la acest moment de timp. Scopul analizei
seriilor de timp constă în înţelegerea şi modelarea mecanismului de generare a termenilor
seriei; odată elaborat, modelul este utilizat pentru obţinerea de previziuni.
Previziune = inferenţă asupra variabilei, în afara perioadei observate. Vom nota prin
ŶT +h previziunea variabilei Y efectuată la momentul T pentru un orizontul de timp h.
Baza de date utilizată pentru generarea de previziuni poate consta în:
a) evoluţia înregistrată de către variabilă în trecut, privind prezentul ca o funcţie de
trecut:
Yt = f (Yt −1 , Yt −2 ,  , Yt −p , εt ) → modele univariabile
Aceasta abordare este adecvata atunci cand este dificil de identificat factorii ce
explica comportamentul variabilei de previzionat sau este dificil de cuantificat
influenta exercitata de catre variabilele explicative. Daca, spre exemplu, scopul
nostru este doar previziunea PIB fara sa ne intrebam de ce acesta a inregistrat o
anumita valoare atunci vom apela la aceasta abordare
PIB t = f ( PIB t −1 , PIB t −2 ,  , PIB t −p , εt ) .

3
b) serii de timp ce redau evoluţia variabilei Y precum şi a altor variabile
X 1 , X 2 ,  , X n ce explică comportamentul acesteia → modele multivariabile
(modele explicative).
Modelele explicative pot fi utilizate in previziune dar si pentru testatea empirica si
simularea unor politici economice sau pentru luarea unor decizii.

Baza de date trebuie să fie adecvată cantitativ şi calitativ.


În analiza seriilor cronologice este necesar ca lungimea perioadei observate să fie
suficient de lungă pentru a face posibilă estimarea unui model adecvat calitativ, care să
surprindă mecanismul real de generare al fenomenului, respectiv să permită identificarea
unor componente ale evoluţiei pe termen lung. De regulă se impune utilizarea unor serii
cronologice cu cel puţin 15 termeni, respectiv pentru serii sezoniere este de dorit ca
perioada observată să acopere cel puţin cinci cicluri sezoniere.
În acelaşi timp datele trebuie să rămână comparabile în timp. Condiţiile în care
evoluează fenomenul este necesar să rămână în esenţă aceleaşi. Astfel, nu este indicat a
se utiliza în elaborarea de modele, serii cronologice ce acoperă perioade de schimbări
economice sau politice majore, război, sau alte evenimente excepţionale; în analiza
evoluţiei majorităţii indicatorilor economici pentru ţara noastră este indicat ca datele să
înceapă după 1989. Înainte de aplicarea tehnicilor specifice de analiză şi previziune, dacă
este necesar, unii indicatori vor fi exprimaţi în preţuri comparabile. Când se analizează
spre exemplu evoluţia cifrei de afaceri sau a indicatorilor macroeconomici de rezultate şi
ne interesează evoluţia datelor neafectate de schimbările de preţ, este indicat a se exprima
datele în preţurile unui an bază de comparaţie, prin împărţirea acestora la un indice
adecvat al preţurilor. De asemenea, creşterea în timp a unor variabile din economie se
datorează în principal creşterii populaţiei, astfel că în aceste situaţii este mai util a se
analiza evoluţia variabilei per cap de locuitor.
Atunci când cronograma indică prezenţa unor valori aberante, corespunzătoare unor
greve, calamităţi naturale sau altor evenimente punctuale, acestea vor fi înlocuite cu
valorile medii ce ar fi fost înregistrate în circumstanţe normale.
Frecvenţa măsurătorilor este condiţionată şi de practică. Spre exemplu, vânzările
unui magazin pot fi înregistrate zilnic, profitul poate fi observat lunar şi / sau anual
respectiv indicele bursier la încheierea zilei de cotaţie. În general, acolo unde sunt
disponibile, poate fi utilă utilizarea unor date cât mai frecvente. Datele anuale nu fac
posibilă observarea caracterului sezonier specific anumitor indicatori respectiv modelarea
unor dependenţe în care timpul de reacţie al variabilei efect este scurt.
Atunci când elaborăm previziuni, bazate pe metode statistice, pornim de la ipoteza că
fenomenul va continua să aibă acelaşi comportament ca şi în trecut. Este important ca
analistul să se întrebe în ce măsură această presupunere este realistă, respectiv să ţină
seama de aşteptările sale. Se spune pe bună dreptate că „previziunea rămâne în acelaşi
timp ştiinţă şi artă”. Previziunea fenomenelor economice este o sarcină relativ dificilă,
urmare a complexităţii mediului economic. Abordările tradiţionale sunt uneori subiective
şi prea simplificatoare, în timp ce metodele moderne sunt mai riguros fundamentate
teoretic dar sunt şi mai complexe, necesitând experienţă şi o intervenţie activă a
analistului.

1.2. Măsuri pentru acurateţea previziunilor

4
Pentru un moment t de timp fixat, eroarea de previziune este diferenţa între
valoarea observată şi cea previzionată Yˆt ambele aferente momentului t:

et = Yt −Yˆt

Dacă modelul statistic generează previziunile Yˆ1 , Yˆ2 ,..., Yˆs corespunzătoare
observaţiilor Y1 , Y2 ,..., Ys pentru a măsura calitatea acestuia de a genera previziuni
adecvate se utilizează o serie de indicatori sintetici ai erorilor de previziune, cei mai
frecvent întâlniţi fiind:
- eroarea medie pătratică: MSE =
1 s

s h=1
(
Yh − Yˆh )
2

1 s
- eroarea medie absolută: MAE = ∑ Yh − Yˆh
s h =1

s Yh −Yˆh
- eroarea medie absolută exprimată procentual: MAPE = 1 ∑
s h =1 Yh
Acesti indicatori pot fi utilizati si pentru a masura capacitatea modelului de a genera
valori apropiate de cele observate, pentru seria de timp disponibila.
Atunci cand ne intereseaza calitatea preziunilor, inafara perioadei observate, de
regula se utilizează doar o parte din date în estimarea modelului, cele rămase (cele mai
recente), urmând a fi comparate cu previziunile corespunzătoare generate de model.
Dintre mai multe modele alternative de previziune este selectat cel ce conduce la erori
medii de previziune mai mici. După alegerea modelului, acesta poate fi reestimat luând în
considerare toate datele disponibile. O altă variantă de lucru constă în compararea
previziunilor obţinute din model cu cele generate “naiv”. Conform “modelului naiv de
previziune” (mers aleator) valoarea înregistrată de variabilă în următoarea perioadă va fi
cea înregistrată în prezent.

1.3. Componentele unei serii de timp


În abordarea tradiţională, fluctuaţiile din seriile de timp sunt privite ca o rezultantă a
suprapunerii următoarelor componente: tendinţa T, componenta ciclică C, sezonieră S
respectiv componenta reziduu sau eroare ε :
Yt = f (Tt , Ct , S t , εt )
Primele trei componente sunt considerate deterministe, sistematice, determinate de
factori cu acţiune continuă asupra fenomenului, în timp ce componenta reziduală are
caracter aleator fiind efectul acţiunii unor factori imprevizibili, accidentali.
Modelul clasic de descompunere a seriilor de timp este de regulă:
• aditiv: Yt = Tt + Ct + S t + εt sau
• multiplicativ: Yt = Tt ⋅ Ct ⋅ S t ⋅ ε t respectiv
• o combinaţie mixtă a componentelor seriei.

5
Deseori cele doua componente tendinta-ciclu sunt tratate ca si o singura
componenta, ce surprinde evolutia pe termen lung, si se noteaza prin T, astfel
Yt = f (Tt , S t , eroareE t ) .
În acest context, tehnicile de analiză a seriilor de timp au ca obiective:
• separarea fiecărei componente şi modelarea comportamentului său, respectiv
• previziunea evoluţiei fiecărei componente, iar apoi compunerea acestora în scopul
obţinerii de previziuni privind evoluţia fenomenului Y. Principiul de la baza
acestei tehnici este “descompune pentru a modela iar apoi recompune”.
Previziunile utilizând modelul de descompunere se obţin prin compunerea
previziunilor realizate pentru fiecare componentă deterministă prezentă în serie, ţinând
seama de forma modelului, aditiv respectiv multiplicativ:
Yˆ = Tˆ + Cˆ + Sˆ respectiv Yˆ = Tˆ ⋅ Cˆ ⋅ Sˆ .
Extrapolarea tendinţei respectiv a celorlalte componente deterministe, conduce la
previziuni adecvate în condiţiile în care:
- modelele estimate reuşesc să surprindă ceea ce este esenţial, repetabil, în
comportamentul trecut al fenomenului respectiv
- comportamentul factorilor ce determină schimbările în timp în nivelul înregistrat
de variabila Y rămâne şi pe viitor aproximativ acelaşi.
Extrapolarea este adecvată în principal pentru obţinerea de previziuni pe termen
scurt, elaborându-se de regulă două sau mai multe scenarii de evoluţie.
Menţionăm deasemenea că uneori, în principal în econometrie unde variabilele
incluse inre-un model sunt în prealabil desezonalizate, este necesară eliminarea
componentei sezoniere din seria de timp, obţinându-se seria ajustată sezonier d:
Y
d= .
S

Componentele deterministe sunt dificil de definit.


Tendinţa sau tendinţa generală redă evoluţia fenomenului pe termen lung, având alura
unor funcţii neperiodice, lent variabile în timp. Factori cu acţiune permanentă asupra
fenomenului (ex. creşterea populaţiei, progresul tehnic, inflaţia) imprimă, pe o perioadă
lungă de timp, o tendinţă de regulă crescătoare sau descrescătoare majorităţii indicatorilor
economici.
Un caz particular il constituie aici seriile de timp ce fluctueaza in jurul unei medii
constante (tendinta este orizontala, paralela cu axa OX); spunem ca aceste serii sunt
stationare, in medie)
Componenta ciclică este observabilă analizând evoluţia fenomenului pe termen lung,
şi se manifestă sub forma unor oscilaţii cu perioadă şi amplitudine ce variază de regulă în
timp, un ciclu acoperind câţiva ani de zile. Evoluţiile ciclice apar în principal urmare a
ciclurilor economice sau a pulsaţiilor din cererea unui produs, componenta fiind prezentă
în evoluţia unor indicatori macroeconomici de rezultate sau din domeniul financiar dar şi
în alte domenii.
Componenta sezonieră se evidenţiază sub forma unor cicluri de durată mai mică sau
egală cu un an, şi apare în principal datorită ritmului impus de schimbarea anotimpurilor
dar şi de activităţi economice respectiv sociale (regularităţi în plata salariilor, sărbători,
vacanţe, obiceiuri, tradiţii, etc.).

6
Componenta aleatoare sau reziduală se manifestă prin fluctuaţii aparent aleatoare în
jurul componentelor deterministe, fiind efectul acţiunii unor factori cu acţiune punctuală
în timp, de tipul evenimentelor politice sau meteorologice.
Componenta aleatoare este prezentă în toate seriile cronologice, în timp ce o serie
poate prezenta sau nu tendinţa, variaţie ciclică sau sezonieră. Evidenţierea componentelor
deterministe este dependentă şi de perioada supusă observării respectiv de frecvenţa
observaţiilor. Deseori cronograma seriei si natura indicatorului sugerează componentele
prezente.
Vor face obiectul acestui capitol doar componentele deterministe. Componenta
aleatoare nu trebuie ignorată deoarece conţine informaţii utile în previziune, modelarea
acesteia fiind abordată în principal în capitolul trei. Dacă nu se precizează altfel, în
prezentul capitol pentru previziunea variabilei Y componenta aleatoare se ignoră (se
presupune a fi nepredictibilă, adică de tip zgomot alb). In practică, identificarea şi
separarea celor patru componente din seria cronologică nu sunt de regulă realizabile cu
exactitate, reziduul rămas după extragerea estimaţiilor componentelor deterministe
regăsindu-se în componenta aleatoare.

1.4. Estimarea tendinţei prin funcţii elementare

Pentru modelarea şi previziunea tendinţei se au în vedere funcţiile elementare lent


variabile în timp. Vom considera în acest paragraf că seria prezintă doar tendinţă şi
componentă aleatoare, modelul de descompunere fiind aditiv respectiv multiplicativ:
Yt = Tt + εt respectiv Yt = Tt ⋅ εt .
De asemenea, în acest context presupunem ca tendinţa poate fi modelată suficient de bine
prin funcţii elementare. Cele mai uzuale funcţii utilizate pentru modelarea tendinţei
indicatorilor din economie sunt redate în tabelul 1.
Tabelul 1. Funcţii elementare utilizate în modelarea tendinţei
Tendinţă Forma liniarizată
liniară
Tt = a + bt
parabolă T = a +bt +cX

Tt = a + bt + ct 2
unde X = t ²
hiperbolă T = a +bX
1 1
Tt = a + b Unde X =
t t
exponenţială Z = A + Bt unde
Tt = a ⋅ b t
Z t = ln Tt ; A = ln a; B = ln b
putere Z = A +bX Unde
Tt = a ⋅ t b
Z t = ln Tt ; A = ln a; X = ln t
logaritmică T = a +bX
Tt = a + b ln t unde X = ln t
curba logistică
a
Tt = , a, c > 0
1 + e b −ct

7
Curba logistică este o legitate specifică evoluţiei vânzărilor dintr-un nou produs, dar
nu exclusiv acesteia, fiind adecvată pentru modelarea evoluţiei pe termen lung şi a altor
indicatori (Melard, 1990).

Figura 1. Curba logistică

Graficul său din figura 1 indică, pentru exemplul vânzărilor dintr-un nou produs, o
creştere accelerată a acestora după lansarea produsului, urmată de o încetinire a ritmului
de creştere spre un prag de saturaţie egal cu a. Punctul de inflexiune al curbei este de
coordonate (b/c, a/2).
Pentru estimarea parametrilor tendinţei liniare
Tt = a + bt
se utilizează metoda celor mai mici pătrate (utilizată în estimarea ecuatiei de regresie
liniara). Rolul variabilei exogene (independente) este jucat aici de variabila timp t:
Yt = a + bt + ε t t = 1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci următoarele:
n

∑ (t − t )(Y t −Y)
b= t =1
n ,
∑ (t − t )
t =1
2

a =Y −bt ,
sau echivalent
M (tY ) − M (t ) M (Y )
b= ,
M (t 2 ) −[ M (t )] 2
a = Y − bt .
Seria prezintă o tendinţă de creştere atunci când b > 0 respectiv de descreştere dacă b <
0.

Precizăm că variabila timp se măsoară cu ajutorul scalei de interval, astfel că


originea scalei respectiv unitatea de măsură se pot stabili în mod arbitrar. Uneori, pentru
uşurarea calculelor sunt stabilite astfel încât t = 0 , variantele variabilei t rezultând în
consecinţă. Astfel, daca n este impar t =..., −3, −2, −1, 0,1, 2, 3,... respectiv pentru n
par t =..., −2,5; −1,5; −0,5; 0,5;1,5; 2,5;... sau t =...., −5, −3, −1,1, 3, 5,....

Cu excepţia curbei logistice, celelalte funcţii neliniare din tabelul 6.1. pot fi aduse la
o formă liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de
logaritmare în cazul funcţiei exponenţiale şi a funcţiei putere.

8
Spre exemplu în cazul tendinţei exponenţiale
Tt = a ⋅ b t ,
considerând un model de descompunere multiplicativ Yt = Tt ⋅ εt , operaţia de logaritmare
a ambilor membri conduce la:
ln Yt = ln a + t ln b + ln εt .
Prin substituţiile A = ln a, B = ln b,ηt = ln ε t se obţine forma liniarizată:
ln Yt = A + Bt +ηt .
Aplicând metoda celor mai mici pătrate, se determină A, B:
M (tX ) − M (t ) M ( X )
B=
M (t 2 ) − [ M (t )]
2

A = M ( X ) − bM (t )
unde s-a notat X = ln Y . Coeficienţii A respectiv B se pot determina parametrii tendinţei
exponenţiale a = e A , b = e B .

În cazul tendinţei parabolice:


Yt = a + bt + cX + ε t
unde X = t ² , pentru estimarea parametrilor a, b, c se utilizează relatiile de calcul deduse
în cadrul regresiei liniare multiple, lucrând eventual cu variante pentru variabila t astfel
încât t = 0 (scopul fiind uşurarea calculelor).

Estimarea parametrilor curbei logistice necesită utilizarea unor metode specifice


de tipul procedurilor numerice iterative pentru modele neliniare sau a metodei celor trei
puncte (Melard, 1990), metode integrate în softurile pentru statistică.

Exemplu 1. Estimarea tendinţei liniare. Evoluţia lunară a uni indicator economic


este redată în tabelul următor:
Luna (t) 1 2 3 4 5 6 7 8 9
Indicator (yt) 3.7 3.8 4.1 4.3 4.5 4.8 4.9 5.1 5.3
Luna (t) 10 11 12 13 14 15 16 17 18
Indicator (yt) 5.5 5.6 5.8 6.0 6.2 6.3 6.5 6.6 7.0

Cronograma seriei sugerează prezenţa unei tendinţe liniare, peste care se suprapune o
componentă aleatoare de amplitudine redusă:
Yt = a + bt + εt , t =1, 2,..., 18 .
Parametrii tendinţei se determină din relaţiile:
M (tY ) − M (t ) M (Y )
b=
M (t 2 ) − [ M (t ) ]
2

a = M (Y ) − bM (t ).

9
Figura 1. --ο —Evolutie indicator; ------ Tendinţa

Exemplificăm din calculele intermediare:


1 + 2 +  + 18
M (t ) = = 9.5
18
3 .7 + 3 .8 +  + 7 .0
M (Y ) = = 5.33
18
(1 × 3.7) + (2 × 3.8) +  + (18 × 7.0)
M (tY ) = = 55 .72
18
12 + 2 2 +  + 18 2
M (t 2 ) = = 117 ,2
18
rezultând
55 .72 − 9.5 ×5.33
b= = 0.19 ,
117 .2 − (9.5) 2
a = 5.33 − 0.19 ×9.5 = 3.55 .
Tendinţa seriei se estimează prin funcţia de gradul întâi:
Tt = 3.55 + 0.19 t ,
al cărei grafic este redat în figura 1.
Previziunea obţinută prin extrapolarea tenţinţei estimate, pentru următoarea lună
este:
Yˆ19 = T̂19 =3.55 + 0.19 × 19 = 7.16.

Exemplu 2. Estimarea tendinţei parabolice


Vânzările dintr-un produs urmează în general pe termen lung o tendinţă conformă
curbei logistice. Considerând intervale mai scurte de timp, curba logistică poate fi privită
ca o succesiune de tendinţe: în prima fază evoluţia poate fi schiţată printr-o dreaptă,
urmată apoi de o exponenţială, iar în partea finală, pentru perioada de creştere lentă
respectiv saturaţie se apelează de regulă la o parabolă.
Datele de mai jos redau evoluţia vânzărilor pe o perioadă de 10 luni consecutive din
această perioadă finală:

Luna F M A M I I A S O N

10
Vânzăr 20 32 40 47 52 60 62 63 65 67
i

Figura 2. Evoluţia volumului vânzărilor

Considerăm adecvat pentru modelarea tendinţei un polinom de gradul doi:


Tt = a + bt + ct 2
În condiţiile în care pentru estimarea parametrilor a, b şi c nu facem uz de un soft
de statistică, vom stabili variantele variabilei timp astfel încât t = 0 , respectiv aici (n par)
t = −9, −7,  ,−1,1,  7, 9 . Parametrii sunt în acest caz daţi de relaţiile:
M (tY )
b= ,
M (t 2 )
M (t 2Y ) − M (Y ) M (t 2 )
c= ,
[
M (t 4 ) − M (t 2 ) ] 2

a = M (Y ) − cM (t 2 ).
Calcule intermediare:

t -9 -7 -5 -3 -1 1 3 5 7 9 Media
yt 20 32 40 47 52 60 62 63 65 67 50.8
t2 81 49 25 9 1 1 9 25 49 81 33
tY t -180 -224 -200 -141 -52 60 186 315 455 603 82.2
t4 6561 2401 625 81 1 1 81 625 2401 6561 1933.8
t 2Yt 1620 1568 1000 423 52 60 558 1575 3185 5427 1546.8

Se obţin următoarele valori pentru parametrii tendinţei:


b = 2.49 , c = −0.15, a = 55 .86 ,
Tt = 55 .86 + 2.49 t − 0.15t . 2

Dacă ne punem problema alegerii celei mai adecvate funcţii dintre parabolă şi
dreaptă (posibile funcţii sugerate de cronogramă pentru modelarea tendinţei) şi dispunem

11
de un soft de statistica pentru efectuarea calculelor, este indicat a se utiliza criteriul
minimizării sumei pătratelor reziduurilor SSR= ∑(Yt −Tt ) . Astfel:
2

• se estimează parametrii dreptei Tt = 50 .8 + 2.5t , apoi se determină suma


pătratelor reziduurilor SSR=
∑(Y − (50 .8 + 2.5t ) ) = ( 20 − 28 .3) 2 + ... + (67 − 73 .3) 2 =210.07.
2
t
t

Variantele variabilei timp au fost considerate şi aici t = −9, −7,  ,−1,1,  7, 9 ;


• pentru parabolă Tt = 55 .86 + 2.49 t − 0.15 t se obţine SSR = 11.25.
2

Conform acestui criteriu, parabola este mai indicată decât dreapta în modelarea tendinţei.

Exemplu 3. Estimarea tendinţei exponenţiale


Previziunea populaţiei unei ţări, a schimbărilor în structura sa pe vârste, constituie
componente importante ale deciziilor pe termen lung privind sistemul asigurărilor sociale
(în principal a pensiilor) influenţând şi politica de imigrare.
Populaţia României a crescut în perioada 1980-1988 într-un ritm destul de
accelerat, după cum arată şi datele de mai jos:
An 1980 1981 1982 1983 1984 1985 1986 1987 1988
Nr. populaţiei 22.20 22.35 22.48 22.55 22.62 22.72 22.82 22.94 23.15
(mil. loc.)

Vom modela tendinţa printr-o funcţie exponenţială, avand in vedere modelul


multiplicativ:
Yt = a ⋅ b t ⋅ ε t
Logaritmarea ambilor membrii conduce la liniarizarea tendinţei:
ln Yt = ln a + t ln b + ln εt ,
respectiv
Z t = A + Bt +ηt ,
unde Z t = ln Yt , A = ln a, B = ln b, ηt = ln εt .

t 1 2 3 4 5 6 7 8 9
Z t = ln Yt 3.100 3.107 3.109 3.116 3.119 3.123 3.128 3.133 3.142

M (tZ ) − M (t ) M ( Z )
B= ,
M (t 2 ) − [ M (t )]
2

A = M ( Z ) − BM (t ).
3.100 + 3.107 + + 3.142
M (Z ) = = 3.119 ,
9
(1 × 3.100 ) + ( 2 × 3.107 ) + + (9 × 3.142 )
M (tZ ) =
9
Se obţin pentru parametrii A respectiv B următoarele estimaţii:
B = 0.005 , A = 3.09 .
Parametrii tendinţei exponenţiale rezultă în consecinţă:

12
a = e A = 22 .11, b = e B = 1.005
Tt = 22.11 × (1.005) t .

O extrapolare a acestei tendinţe ar indica o populaţie previzibilă pentru anul 2000 de:
Yˆ21 =Tˆ21 = 22.11 × (1.005)21 = 24.36 mil. locuitori,

valoarea reală fiind de 22.43 mil. locuitori. După 1989 nu s-a menţinut tendinţa de
creştere a numărului populaţiei, mediul economic şi social, cu influenţă directă asupra
evoluţiei populaţiei unei ţări, schimbăndu-se substanţial faţă de cel din perioada 1980 –
1988 (perioadă utilizată în estimarea tendinţei).
1.5. Estimarea tendintei utilizând mediile mobile
Atunci când cronograma seriei nu oferă indicii foarte clare privind prezenţa respectiv
forma tendinţei, este indicat a se utiliza în prealabil o tehnică de netezire ce atenuează
amplitudinea fluctuaţiilor aleatoare din serie, scopul fiind evidenţierea (estimarea)
tendinţei. Metoda mediilor mobile, netezirea exponenţială dar şi alte filtre de netezire
sunt utilizate frecvent în practică. Consideram în acest paragraf că seria prezintă doar
tendinţă şi componentă aleatoare, iar modelul de descompunere este unul aditiv:
Yt = Tt + εt .
Metoda mediilor mobile
Media mobilă se defineşte ca o combinaţie liniară de puteri pozitive şi negative
ale operatorului de întârziere L:
m2 m2
MM = ∑ θi L−i cu
i =− m1
∑θ
i =−m1
i =1

unde m1 , m2 ∈N , θm1 , ... , θm2 ∈R iar operatorul de întârziere L este definit


prin:
LY t =Yt −1
O medie mobilă este centrată dacă m1=m2=m. Media mobilă este simetrică dacă este
centrată şi coeficientii simetrici sunt egali θi =θ−i , i =1, ... , m . O medie mobilă
simetrică se notează prin {2m +1]; [θ−m , θ−m +1 ... , θ0 ]} , indicându-se ordinul
acesteia respectiv coeficienţii. Transformările utilizate frecvent în practică sunt mediile
mobile simetrice:
m
MM = ∑θ
i =−m
i L−i

fiecare valoare observată fiind înlocuită cu o medie ponderată a termenilor adiacenţi.


Metoda mediilor mobile, utilizată în acest context, are ca şi obiective conservarea
tendintei T şi reducerea amplitudinii componentei eroare:
• eliminarea componentei aleatoare f (εt ) ≈ 0 respectiv
• conservarea tendinţei f (Tt ) ≈ Tt .

Pornind de la cele două cerinţe se pune problema determinării adecvate a ordinului


mediei mobile 2m +1 respectiv a coeficienţilor θm , ... , θ0 .
Se va aborda în continuare problema determinării unor condiţii suficiente pentru
ca media mobilă să conserve o tendinta liniata. În acest sens se cunoaşte următoarea

13
proprietate ce specifică condiţii suficiente pentru ca o medie mobilă să conserve
polinoame de un anumit grad.

Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrata si simetrica


conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de ordin
p +1 a ecuaţiei caracteristice:
θ−m + θ−m+1λ + ... + θm λ2 m − λm = 0
În ceea ce priveşte transformarea componentei eroare printr-o medie mobilă:
m
ut = ∑θ ε
i =−m
i t −i

se observă că atunci când εt constituie o secvenţa de variabile aleatoare necorelate şi de


aceeaşi varianţă σ 2 , noile variabile u x au media respectiv varianţa:
m
Eu t = 0; σ *2 = Var (u x ) = σ 2 ∑θ
i =−m
i
2
.
Prin aplicarea unei medii mobile, varianţa componentei eroare este diminuată atunci când
m

∑θ
i =−m
i
2
< 1 . Raportul de reducere a varianţei erorii se defineşte prin:
m
σ *2 / σ 2 = ∑θ
i =−m
i
2

şi măsoară capacitatea mediei mobile de a reduce această componentă.

Mediile aritmetice
Cele mai simple medii mobile simetrice sunt mediile aritmetice:
Y + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = t −m ; t = m + 1, m + 2,..., T − m ;
2m + 1
Mediile aritmetice constituie un caz particular de medie mobilă centrată şi simetrică,
1
coeficienţii fiind toţi egali cu θi = . Coeficienţii acesteia s-au dedus din
2m +1
următoarele cerinţe (Gourieroux & Monfort, 1990):
m

• media mobilă lasă invariantă o constantă, condiţie echivalentă cu ∑θ


i =−m
i =1

respectiv
m

• minimizează raportul de reducere a varianţei componentei eroare ∑θ


i =−m
i
2
.
Se arată că mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe
polinomiale de grad mai mare sau egal cu doi.
Observaţii. a) Pentru o medie aritmetică, raportul de reducere a varianţei erorii
1
este egal cu , astfel că secvenţa rezultată în urma aplicării mediilor mobile este
2m +1
cu atât mai netedă cu cât ordinul mediei mobile este mai mare;
b) Tendinţa seriei se estimează prin seria mediilor mobile Tt ≈Yt .
Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria de timp.

14
În practică, alegerea ordinului mediei mobile pentru eliminarea componentei
aleatoare rămâne în sarcina statisticianului, fiind indicat un ordin mai mare dacă
amplitudinea fluctuaţiilor aleatoare este mai mare. Oricum, oscilaţiile din componenta
aleatoare fiind neregulate, eliminarea acesteia se realizează doar parţial. Prin aplicarea
unei medii mobile, indiferent de ordinul acesteia, amplitudinea fluctuaţiilor se reduce.

Medii mobile centrate


Mediile aritmetice necesită un numar impar p = 2m +1 de observaţii, în calculul
fiecărei medii. Dacă ordinul mediei mobile MM(p)este un numar par p = 2m atunci de
regula se utilizeaza mediile mobile centrate şi simetrice, definite astfel:
0,5Yt −m + Yt −m+1 + ... + Yt + ... + Yt +m−1 + 0,5Yt +m
Yt = , t = m +1, m +2, .... T −m
2m
În cazul particular p = 4 mediile mobile centrate sunt date de relaţiile:
0,5Yt −2 + Yt −1 + Yt + Yt +1 + 0,5Yt +2
Yt =
4
sau
Y t =0.125 Yt −2 +0.5Yt −1 +0.5Yt +0.5Yt +1 +0,125 Yt +2

Rezultă:
0,5Y1 + Y2 + Y3 + Y4 + 0,5Y5
Y3 =
4
0,5Y2 +Y3 +Y4 +Y5 + 0,5Y6
Y4 =
4

0,5YT −4 +YY −3 +YT −2 +YT −1 + 0,5YT
Y T −2 = .
4

Astfel, se realizează o corespondenţă între valorile observate Yt şi mediile mobile Y t .

Alte medii mobile utilizate în practică


Deasemenea, în scopul netezirii seriei sunt utilizate şi alte cazuri particulare de
medii mobile, precum mediile lui Henderson (sau filtrul Henderson) de ordin 5, 7, 9, 13,
23 (Makridakis et all, 1998). Acestea sunt medii centrate, simetrice, spre exemplu mediile
lui Henderson de ordin 9 au coeficienţii
{[ 9]; [ −0.041 , −0.01 , 0.119 , 0.267 , 0.33 ]} :
Y t = −0,041 Yt −4 −0,01Yt −3 +0,119 Yt −2 +0.267 Yt −1 +0.33 Yt +0.267 Yt +1 +
+0,0119 Yt +2 −0,01Yt +3 −0.041 Yt +4
Mediile mobile ponderate acordă o importanţă diferită observaţiilor, de regulă
ponderea mai mare corespunde observaţiei corespunzător căreia i se ataşează valoarea
netezită; un exemplu de medie mobilă pnderată este şi următoarea:
Y + 2Yt −1 + 3Yt + 2Yt +1 + Yt +2
Yt = t −2 .
9

15
Mediile mobile sunt deasemenea cele mai populare tehnici de netezire utilizate în
analiza tehnică. Analiza tehnică este utilizata de către investitorii pe piaţa de capital, în
scopul identificării tendinţei Există mai multe tipuri de medii mobile utilizate în acest
context. Singura diferenţă semnificativă între diversele tipuri de medie mobile este
ponderea acordată datelor recente; acestea sunt de regulă medii asimetrice. Media mobilă
simplă spre exemplu asociază ponderi egale tuturor preţurilor şi se calculează însumând
preţurile de închidere ale unei acţiuni pentru ultimele p perioade şi împărţind totalul la
numărul de perioade ales:
Yt −p +Yt −p −1 +... +Yt
Yt = .
p
Ordinul mediei mobile p trebuie să se potrivească cu ciclul pieţei pe care dorim să îl
urmărim. De exemplu, dacă o acţiune are un ciclu de creştere-scădere de 40 de zile,
media mobilă ideală se va baza pe 21 de zile de tranzacţionare; practica sugerează
următoarea regulă: ordinul mediei mobile = lungimea cilcului bursier/2 +1. Un ordin des
utilizat este cel de 200 de zile, reuşind să indice tendinţa pieţei pe termen lung (tendinţa
generală a pieţei). Un semnal de cumpărare este generat când preţul acţiunii creşte peste
media sa mobilă, iar semnalul de vânzare este generat de scăderea preţului sub media
mobilă.

Exemplu 4. Reducerea amplitudinii componentei aleatoare utilizând medii


mobile
Evoluţia cursului unei acţiuni este dominată în principal de fluctuaţii aleatoare.
Evidenţierea şi estimarea unor componente deterministe, în scopul efectuării de
previziuni este uneori imposibilă, cea mai adecvată previziune pentru cursul din cotaţia
următoare fiind chiar cursul prezent (model de tip mers aleator).
Pentru 16 zile succesive de cotaţie redăm grafic în figura 3 evoluţia cursului unei
acţiuni. In scopul evidenţierii tendinţei s-au utilizat mediile mobile de ordin 3, respectiv
7, rezultatele fiind redate în tabelul de mai jos, iar grafic în figura 3:

Zi (t) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Curs 29. 29. 30. 31. 31. 30. 28. 31. 31. 30. 31. 30. 31. 30. 31. 32.
(yt) 9 8 1 2 9 1 6 5 2 7 2 4 0 4 5 7
MM(3) - 29. 30. 31. 31. 30. 30. 30. 31. 31. 30. 30. 30. 31. 31. -
9 4 1 1 2 1 4 1 0 8 9 6 0 5

Mediile mobile de ordin 3:


Yt −1 + Yt + Yt +1
Yt =
3
respectiv
Y1 + Y2 + Y3 29 .9 + 29 .8 + 30 .1
Y2 = = = 29 .9
3 3
Y + Y3 + Y4 29 .8 + 30 .1 + 31 .2
Y3 = 2 = = 30 .4
3 3
celelalte fiind calculate într-o manieră similară.
Observăm că mediile mobile de ordin 3 nu conduc la rezultate satisfăcătoare. Prin
utilizarea unei medii mobile de ordin 7 gradul de netezire creşte, dar numărul termenilor
seriei valorilor netezite se reduce substanţial (la 10 termeni).

16
Figura 3. --ο -- Cursul acţiunii , -- -- MM(3), ----- MM(7)

1.6. Componenta sezonieră. Estimarea componentei sezoniere


Presupunem în acest paragraf că seria cronologică prezintă tendinţă,
sezonalitate şi o componentă aleatoare.

1.6.1 Modelul de descompunere. Perioada componentei sezoniere

Pentru alegerea modelului de descompunere este indicat a se analiza cronograma


seriei. Tabelul 1 ilustrează modul de obţinere a două serii, din date fictive, prin
compunerea dintre o tendinţă liniară şi o componentă sezonieră. Pentru claritate, s-a
considerat ca seriile nu prezintă componentă ciclică respectiv aleatoare, adică C = 0 şi
ε = 0 în cazul modelului aditiv respectiv C = 1 şi ε = 1 în caz multiplicativ.

Tabelul 1. Modele de descompunere a seriilor cronologice


Trim t Model aditiv Model multiplicativ
Tt St Yt = Tt + St Tt St Yt = Tt * St
I 1 10 -3 7 10 0,75 7,5
II 2 12 4 16 20 1,25 25
III 3 14 6 20 30 1,5 45
IV 4 16 -7 9 40 0,5 20
I 5 18 -3 15 50 0,75 37,5
II 6 20 4 24 60 1,25 81
III 7 22 6 28 70 1,5 105
IV 8 24 -7 17 80 0,5 40
I 9 26 -3 23 90 0.75 67.5
II 10 28 4 32 100 1.25 125
III 11 30 6 36 110 1.5 165
IV 12 32 -7 25 120 0.5 60

Cronograma celor două serii este redată în figura 4 respectiv 5.

17
În general, este adecvat un model aditiv atunci când amplitudinea oscilaţiilor este
aproximativ constantă (vezi figura 4) respectiv multiplicativ dacă amplitudinea creşte
(figura 5) sau scade în timp. Frecvent în practică este mai adecvat modelul multiplicativ.

Perioada componentei sezoniere, notată cu p, reprezintă numărul unităţilor de


timp din cadrul unui ciclu sezonier. Majoritatea seriilor sezoniere din domeniul economic
au durata unui ciclu de un an, p fiind egal cu 4 în cazul datelor trimestriale respectiv 12
în cazul datelor lunare. Prin extensie pot fi studiate şi fenomene cu durata unui ciclu mai
mică de un an. Exemple în acest sens sunt prezentate în tabelul 2.

Figura 4. Modelul aditiv T + S

Figura 5. Modelul multiplicativ T⋅ S

Tabelul 2. Exemple de serii cu componentă sezonieră


Durata unui Date Perioada p Exemple
ciclu sezonier
1 an trimestriale 4 • încasări din vânzarea băuturilor
lunare 12 răcoritoare
• vânzările de jucării
• preţul unor produse agricole

18
• cifra de afaceri a societatilor din
transportul de calatori respectiv
din construcţii
• consum gaz, energie electrică
pentru uz casnic.
o săptămână Zilnice 7 • volumul vânzărilor unui magazin
alimentar
• încasările unui cinematograf
o zi din oră în • numarul de călători ce folosesc
oră mijloacele de transport în comun
• retragerile de la o bancă

Cronograma seriei respectiv natura variabilei sugerează de regulă perioada p.


Pentru descoperirea unor oscilaţii ascunse se apelează la metode specifice analizei
spectrale (Tertişco ş.a., 1985).

1.6.2 Eliminarea componentei sezoniere utilizând mediile mobile

Pentru eliminarea componentei sezoniere (desezonalizarea seriei), în scopul


separării ei, se aplică datelor o medie mobilă de ordin p egal cu perioada componentei
sezoniere. În acest context mediile mobile sunt transformări liniare f utilizate în scopul
desezonalizării seriei respectiv al atenuării amplitudinii fluctuaţiilor aleatoare:
• eliminarea componentei sezoniere f ( St ) ≈ 0 ,
• eliminarea componentei aleatoare f (εt ) ≈ 0 respectiv
• conservarea tendinţei şi a componentei ciclice f (Tt ) ≈ Tt .

Proprietăţi ale mediilor mobile


• Dacă seria este periodică:
Yt +p =Yt , ∀t
atunci prin aplicarea unei medii mobile de ordin p egal cu perioada, oscilaţiile se
elimină din date, valorile netezite fiind constante Y t =Yt +1 , ∀t . Astfel, pentru
eliminarea unei componente sezoniere de ordin p se va aplica seriei o medie
mobilă de ordin p.
• Mediile mobile de tipul mediilor aritmetice pentru p impar respectiv a mediilor
mobile centrate pentru p par, prezentate în paragraful anterior, lasă nedeviată
tendinţa de gradul întâi Tt = a + bt . Astfel, tendinţa liniară se conservă prin
aplicarea acestor medii mobile. Teoria permite construirea unor medii mobile
ponderate ce conservă şi polinoame de grad superior.
• Valorii observate Yt îi corespunde o valoare netezită Y t calculată ca o medie
aritmetică a valorilor adiacente.
• Seria valorilor netezite are mai puţin cu p −1 respectiv cu p termeni decât seria
iniţială, după cum p este impar sau par. Acest aspect constituie un dezavantaj al
metodei.

19
Exemplu 5. Eliminarea componentei sezoniere utilizând mediile mobile
Datele din tabelul de mai jos se referă la transportul feroviar de călători. Parcursul
pasagerilor, exprimat în milioane kilometri, a evoluat lunar astfel:

Lună I F M A M I I A S O N D
An
1999 184 167 193 220 202 252 325 296 220 196 174 253
2000 178 175 188 230 213 272 330 279 225 198 187 247
2001 176 157 183 220 189 332 315 276 209 186 164 243

Graficul seriei din figura 6 sugerează o componentă sezonieră predominantă, de perioadă


p = 12, conform aşteptărilor traficul fiind mai intens în lunile de vară respectiv în
perioada sărbătorilor de iarnă. Pentru eliminarea sezonalităţii aplicăm datelor o medie
mobilă de ordin 12, egal cu perioada componentei sezoniere. Graficul valorilor
desezonalizate este prezentat în figura 6.
Mediile mobile de ordin p = 12 sunt calculate conform relaţiei de definiţie a mediilor
mobile centrate. Astfel, spre exemplu:

0.5 ×Y1 + Y2 + Y3 + Y4 + Y5 + Y6 + Y7 + Y8 + Y9 + Y10 + Y11 + Y12 + 0.5 ×Y13


Y7 = =
12
0.5 ×184 +167 +193 + 220 + 202 + 252 + 325 + 296 + 220 +196 +174 + 253 + 0.5 ×178
= =
12
= 223 .3
...
0.5 ×Y24 + Y25 + Y26 + Y27 + Y28 + Y29 + Y30 + Y31 + Y32 + Y33 + Y34 + Y35 + 0.5 ×Y36
Y30 = =
12
0.5 × 247 +176 +157 +183 + 220 +189 + 332 + 315 + 276 + 209 +186 +164 + 0.5 × 243
= =
12
= 221 .0

Figura 6. --ο -- Parcurs pasageri; ----- MM(12)

20
Datele observate au fost indexate aici în ordine cronologică Y1 , Y2 , ... Y36 . Tabelul 3
indică valorile mediilor mobile. Seria mediilor mobile prezentată grafic în figura 6 indică
absenţa componentei de tendinţă în evoluţia traficului de călători pe perioada considerată.

Tabelul 3. Mediile mobile de ordin 12


t MM(12) t MM(12) t MM(12)
1 - 13 226.9 25 226.3
2 - 14 226.4 26 225.5
3 - 15 225.9 27 224.7
4 - 16 226.2 28 223.6
5 - 17 226.8 29 222.1
6 - 18 227.1 30 221.0
7 223.3 19 226.7 31 -
8 223.3 20 225.9 32 -
9 223.5 21 224.9 33 -
10 223.7 22 224.3 34 -
11 224.5 23 222.9 35 -
12 225.8 24 224.4 36 -

1.6.3 Estimarea componentei sezoniere

În cele ce urmează estimarea componentei sezoniere se realizează prin intermediul


coeficienţilor sezonalităţii. Alte alternative de estimare a componentei sezoniere sunt:
• introducerea ei într-un model de regresie multiplă prin intermediul unor variabile
alternative(Gourieroux et all, 1990);
• modelarea componentei sezoniere prin intermediul funcţiilor trigonometrice
(Tertişco ş.a., 1985).
În vederea determinării coeficienţilor sezonalităţii vom utiliza următoarele notaţii:
i indice pentru ciclu sezonier, variind de la 1 la n;
j indice pentru sezon, variind de la 1 la p.

Modelul de descompunere aditiv respectiv multiplicativ are forma:


yij = Tij + S j + εij respectiv yij = Tij ⋅ S j ⋅ εij

Sezonalitatea se manifestă sub forma unor abateri de la componentele evoluţiei pe termen


lung (tendinţă şi componenta ciclică). Indicii respectiv coeficienţii sezonalităţii cuantifică
aceste abateri de la tendinţă - ciclu, urmare a acţiunii factorilor sezonieri. În funcţie de
ipoteza considerată privind componenta tendinţă - ciclu în practică întâlnim în principal
două metode de calcul a acestora: metoda comparării cu mediile mobile respectiv metoda
comparării cu tendinţa.

1. Metoda comparării cu mediile mobile

Se consideră, în acest context, că seria prezintă componentă pe termen lung tendinţă-


ciclu, dar nu se emite o ipoteză privind forma acestora. Componenta evoluţiei pe termen

21
lung tendinţă- ciclu este privită ca o medie curentă a seriei TC t =Yt , estimată prin
mediile mobile Y ij .
În cazul modelului multiplicativ
yij = Tij ⋅ S j ⋅ εij ,
metoda se întâlneşte în literatură şi sub denumire de metoda raportării la mediile mobile
şi constă în următoarele:
• calculul mediilor mobile Y ij de ordin p egal cu perioada componentei sezoniere;
• calculul rapoartelor S ij =Yij / Y ij ce cuantifică abaterea datelor observate de la
tendinţă. Dacă fixăm indicele j, aceste rapoarte constituie estimaţii pentru indicele
sezonalitaţii aferent sezonului S j ;
• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaţiilor
precedente:
1 n−1
Ij = ∑ Sij ; j = 1, 2,..., p ,
n −1 i =1
aceasta justificându-se prin necesitatea eliminării efectului aleator din S ij . Pentru
a nu fi afectaţi de valorile extreme, uneori înainte de calculul mediei, aceste valori
se elimină, sau în loc de medie se consideră valoarea mediană a estimaţiilor S ij ;
• determinarea componentei sezoniere S j , etapă ce constă într-o corecţie adusă
indicilor medii I j astfel încât media lor să fie 1:
1 p 
S j = I j /  ∑ I i  j =1, 2,..., p .
 p i =1 
Această cerinţă impusă indicilor sezonalităţii este naturală, variaţiile sezoniere se
compensează în medie pe parcursul unui an.
Observaţie: uneori nu se efectuează această corecţie, componenta sezonieră fiind
estimată prin indicii indicilor medii I j .
Valorile rezultate ( S1 , S 2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie
componenta sezonieră. În sezoanele pentru care Sj *100 < 100 factorii sezonieri au
condus la o abatere în minus a valorii observate faţă de valoarea corespunzătoare de pe
tendinţă în medie cu 100(Sj –1) procente, respectiv dacă Sj > 1 valorile observate sunt
mai mari decât cele de pe tendinţă în medie de Sj ori.

În cazul modelului aditiv


yij = Tij + S ij + εij
determinarea componentei sezoniere decurge analog, dar având în vedere forma aditivă
de descompunere, coeficienţii ce intervin se determină astfel:
S ij =Yij −Y ij
1 n −1
Cj = ∑ S ij
n − 1 i =1
iar ajustarea coeficienţilor medii C j , pentru a obţine componenta sezonieră S j sau
coeficienţii sezonalităţii se face astfel încât media lor să fie zero:
1 p
∑C j = 0 .
p j =1

22
2. Metoda comparării cu tendinţa

Această metodă porneşte de la premisa modelării tendinţei printr-o funcţie


elementară. Calculele privind estimarea componentei sezoniere decurg după aceleaşi
principii expuse la metoda comparării cu mediile mobile. Astfel, spre exemplu în cazul
modelului multiplicativ se determină:
• valorile tendinţei Tij ;
• raportul între valorile observate şi tendinţă S ij =Yij / Tij ;
• componenta sezonieră, aceasta constând în indicii sezonalităţii:
1 n
S j = ∑ S ij ; j = 1, 2,..., p .
n i =1

1.7 Descompunerea seriei pe componente


Estimarea tendinţei seriilor sezoniere
În cazul seriilor sezoniere se întâlnesc preponderent în literatură mai multe
modalităţi de estimare a tendinţei:
• desezonalizarea seriei iar apoi estimarea tendinţei pornind de la valorile
desezonalizate (Florea ş.a., 1998);
• modelarea tendinţei pornind de la mediile anuale
• estimarea tendinţei prin utilizarea unei metode de netezire.

Estimarea tendinţei pornind de la valorile desezonalizate


Conform proprietăţii mediilor mobile de anulare a componentelor periodice, pentru
eliminarea componentei sezoniere se va aplica datelor o medie mobilă de ordin p, unde p
este perioada componentei sezoniere. Seria mediilor mobile Y t rezultată, numită şi seria
valorilor desezonalizate, nu conţine componenta sezonieră. Pentru modelarea tendinţei
seriei iniţiale se va estima deci componenta de tendinţă, conform celor prezentate în
paragraful 1.4, pornind de la seria mediilor mobile Y t . În exemplul 6 vom utiliza această
abordare.
Estimarea tendinţei în baza mediilor aferente fiecărui ciclu sezonier
Această modalitate de estimare presupune calculul valorii medii a variabilei Y pentru
fiecare din cele n cicluri sezoniere supuse observării:
Yi1 +Yi 2 +... +Yip
Yi = , i =1, 2,..., n .
p
Seria cronologica a mediilor corespunzatoare fiecărui an:
1 2 ... n 
Y i :   ,
Y 1 Y 2 ... Y i 
nu conţine componentă sezonieră, estimarea tendinţei realizându-se aici în baza celor
prezentate în paragraful 1.4.
Estimarea tendinţei prin utilizarea unei metode de netezire
Pentru estimarea tendinţei se poate aplica o metoda de netezire. De regulă acesta se
aplică seriei ajustate sezonier (sau desezonalizate):

23
Yt
dt =
St
Spre exemplu în softul Statistica, pentru estimarea tendinţei se aplică o medie mobilă
ponderată de ordin 5:
Y + 2Yt −1 + 3Yt + 2Yt +1 + Yt +2
Yt = t −2
9
seriei ajustate eszonier. Această metodă nu permite şi generarea de previziuni.
Odată estimate componentele deterministe, componenta aleatoare se obţine prin
eliminarea acestora din datele observate:
Yij
• ε ij = în cazul modelului multiplicativ, respectiv
Tij ⋅ S j
• εij = Yij − (Tij + S j ) în caz aditiv.
Seria cronologică cu datele iniţiale poate fi descompusă astfel pe componente.

Exemplu 6. Estimarea componentelor deterministe în cazul seriilor sezoniere


Datele privind evoluţia trimestrială a producţiei de bere (mii hl) realizată de către o
societate în perioada 2001-2006 sunt indicate în tabelul 4.
Tabelul 4. Evoluţia trimestrială a producţiei de bere, perioada 2001-2006
An/Trim I II III IV
.
2001 124.1 263.2 252.4 124.5
2002 130.1 280.2 260.6 151.1
2003 157.5 301.2 353.3 185.0
2004 169.7 340.0 350.9 168.7
2005 177.5 407.6 417.2 224.1
2006 202 .9 385 .3 425 .6 196 .6

a) Calculul mediilor mobile de ordin p=4


Graficul seriei, din figura 7, indică prezenţa unei componente sezoniere
predominante, de perioadă p = 4. Punctul de pornire în estimarea componentelor
deterministe îl constituie seria mediilor mobile (valorilor desezonalizate) prezentată în
tabelul 5, iar grafic în figura 7.

Mediile mobile de ordin p = 4 sunt calculate conform relaţiei de definiţie a mediilor


mobile centrate. Astfel, spre exemplu:

0.5 × Y1 + Y2 + Y3 + Y4 + 0.5 ×Y5


Y3 = =
4
0.5 ×124 .1 + 263 .2 + 252 .4 +124 .5 + 0.5 ×130 .1
= = 191 .8
4

24
0.5 × Y2 + Y3 + Y4 + Y5 + 0.5 × Y6
Y4 = =
4
0.5 × 263 .2 + 252 .4 + 124 .5 + 130 .1 + 0.5 × 280 .2
= = 194 .7
4

0.5 × Y20 + Y21 + Y22 + Y23 + 0.5 × Y24


Y22 = =
4
0.5 × 224 .1 + 202 .9 + 385 .3 + 425 .6 + 0.5 ×196 .6
= = 306 .0.
4

Datele observate au fost numerotate aici în ordine cronologică Y1 , Y2 , ... Y24 .


Tabelul 4. Mediile mobile de ordinul 4
t MM(4) t MM(4)
1 - 13 261.7
2 - 14 259.4
3 191.8 15 258.3
4 194.7 16 267.7
5 197.8 17 284.5
6 202.2 18 299.7
7 208.9 19 309.8
8 214.9 20 310.2
9 229.2 21 308.4
10 245.0 22 306.0
11 250.8 23 -
12 257.1 24 -

b) Estimarea tendinţei pornind de la seria mediilor mobile


Seria mediilor mobile prezentată grafic în figura 7. relevă o uşoară tendinţă de
creştere a producţiei de bere. Vom considera tendinţa liniară:
Tt = a + bt + εt ,
originea de măsurare a timpului trimestrul II al anului 2001, unitatea de măsură un
trimestru. Astfel, pentru trimestrul III 2001 avem t = 1 ş.a.m.d:

t 1 2 3 ... 19 20
Mediile mobile ( Z t ) 191.8 194.7 197.8 ... 308.4 306.0

M (tZ ) − M (t ) M ( Z )
b= ,
M (t 2 ) − [ M (t )]
2

a = M ( Z ) − bM (t ).
Calcule intermediare:
M (t ) =10 .5, M ( Z ) = 252 .9, M (t 2 ) =143 .5, M (tZ ) = 2884 .9,
b = 6.9, a =180 .44 .
Tendinţa producţiei de bere în este estimată prin ecuaţia liniară:
Tt =180 .44 + 6.9 ×t .

25
500

450

400

350

300

250

200

150

100

50
0 2 4 6 8 10 12 14 16 18 20 22 24 26
P r o d u c tia d e b e r e M M (4 )

Figura 7. --ο -- Producţia de bere; -- -- MM(4); ---- Tendinţa

c) Estimarea componentei sezoniere prin metoda raportării la mediile mobile


Cum amplitudinea oscilaţiilor creşte uşor în timp, cronograma seriei sugerează luarea
în considerare a unui model multiplicativ:
Yij = Tij ⋅ S j ⋅ εij ; i =1, 2,..., 6 iar j =1, 2, 3, 4 .
Datele sunt disponibile pentru 6 ani şi sunt prezente aici 4 sezoane. Ţinând seama
de notaţiile specifice acestui paragraf, Yij reprezintă nivelul producţiei de bere în anul i
trimestrul j. Astfel,
spre exemplu Y13 =Y2001 ;III = 252 .4 sau y34 = y2003 ; IV =185 .0 . Mediile mobile din
tabelul 4 vor fi transpuse într-un tabel analog cu cel de prezentare a datelor observate:
An/Trim. I II III IV
2001 - - 191.8 194.7
2002 197.8 202.2 208.9 214.9
2003 229.2 245.0 250.8 257.1
2004 261.7 259.4 258.3 267.7
2005 284.5 299.7 309.8 310.2
2006 308.4 306.0 - -
Yij
Rapoartele S ij = ⋅100 , respectiv mediile acestora pentru fiecare sezon sunt indicate în
Yij
tabelul 5.

Tabelul 5. Calculul indicilor sezonalităţii


An/Trim. I II III IV
1996 - - 131.6 63.9
1997 65.8 138.6 124.7 70.3
1998 68.7 122.9 140.9 71.9
1999 64.8 131.1 135.8 63.0
2000 62.4 136.0 134.7 72.7
2001 65.8 125.9 - -
I j 65.5 130.9 133.5 68.4 Media 99.6
Sj 65.6 131.4 134.0 68.8 Media 100

26
Explicaţii privind calculele:
Y 252 .4 Y 124 .5
S13 = 13 ⋅ 100 = ⋅ 100 = 131 .6 , S14 = 14 ⋅ 100 = ⋅ 100 = 63 .9 ,
Y13 191 .8 Y14 194 .7
Y 130 .1
S 21 = 21 ⋅100 = ⋅100 = 65.8 , ş.a.m.d.
Y21 197 .8
Cum era de aşteptat, aceste rapoarte între datele observate şi mediile mobile sunt mai
mici decât 1 pentru trimestrele I şi IV, când nivelul producţiei a fost sistematic mai mic
(sub tendinţă).

S 21 + S 31 + S 41 + S 51
I1 = = 65.5, I 2 = 130 .9,
4
S + S 23 + S 33 + S 43
I 3 = 13 = 133 .5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel că este necesară o corecţie astfel încât
media să fie 100:
I 65 .5
S1 = 1 ⋅100 = ⋅100 = 65 .6, S 2 = 131 .4, S 3 = 134 .0, S 4 = 68 .8 .
99 .6 99 .6
Urmare a caracterului sezonier specific producţiei de bere, în trimestrul I producţia a fost
mai mică în medie cu 34.4% decât valorile corespunzătoare de pe tendinţă. În trimestrul
II producţia a fost în medie mai mare de 1.314 ori decât valorile de pe tendinţă. Analog se
interpretează S3 şi S4.
Componenta sezonieră este dată de vectorul format cu indicii sezonalităţii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).

d)Descompunerea seriei pe componente


Pentru tendinţă a fost estimat modelul liniar:
Tt =180 .44 + 6.9t t=1, 2, ....
originea de măsurare a timpului fiind trimestrul II al anului 2001, unitatea de măsură un
trimestru. Componenta sezonieră constă în indicii sezonalităţii:
S1 = 65 .6, S 2 = 131 .4, S 3 = 134 .0, S 4 = 68 .8 .
Componenta aleatoare (reziduu) se deduce ţinand seama de forma multiplicativă a
modelului:
Y
Comp. aleatoare (Reziduu) =
T ⋅S
Tabelul 6. Descompunerea seriei pe componente

An Trim. Producţie MM(4) Tendinţă Comp. Reziduu


Y T sezonieră S
2001 I 124.1 - - - -
II 263.2 - - - -
III 252.4 191.8 187.34 1.340 1.005
IV 124.5 194.7 194.24 0.668 0.959
2002 I 130.1 197.8 201.14 0.656 0.986
II 280.2 202.2 208.40 1.314 1.023

27
III 260.6 208.9 214.94 1.340 0.905
IV 151.1 214.9 221.84 0.688 1.020
2003 I 157.5 229.2 228.74 0.656 1.049
II 301.2 245.0 235.64 1.314 0.973
III 353.3 250.8 242.54 1.340 1.087
IV 185.0 257.1 249.44 0.688 1.078
2004 I 169.7 261.7 256.34 0.656 1.009
II 340.0 259.4 263.24 1.314 0.983
III 350.9 258.3 270.14 1.340 0.969
IV 168.7 267.7 277.04 0.688 0.885
2005 I 177.5 284.5 283.94 0.656 0.953
II 407.6 299.7 290.84 1.314 1.066
III 417.2 309.8 297.74 1.340 1.046
IV 224.1 310.2 304.64 0.688 1.069
2006 I 209.9 308.4 311.54 0.656 1.027
II 385.3 306.0 318.44 1.314 0.856
III 425.6 - 325.34 1.340 0.976
IV 196.6 - 332.24 0.688 0.860

e) Previziuni utilizând modelul de descompunere


Previziunile privind evoluţia variabilei analizate Yˆ se obţin prin compunerea
previziunilor realizate pentru fiecare componentă prezentă în serie, ţinând seama de
forma modelului:
Yˆ = Tˆ + Sˆ respectiv Yˆ = Tˆ ⋅ Sˆ .
Notăm cu YˆT +h previziunea realizată la momentul T, utilizând datele
Y1 , Y2 ,...., YT , pentru un orizont de timp h. În cele ce urmează previziunea
componentelor deterministe se realizează astfel:
• tendinţa: se extrapolează tendinţa estimată printr-o funcţie elementară. Spre
exemplu în cazul tendinţei liniare:
TˆT +h = a + b(T + h)
dacă variantele variabilei timp t sunt: 1, 2, ...T. Se are în vedere aici modul de
definire a variantelor variabilei timp;
• componenta sezonieră: se utilizează coeficientul sezonalităţii aferent sezonului
corespunzător momentului T+h.
Tabelul următor conţine previziunile privind nivelul producţiei de bere pentru
următoarele trei trimestre:

An Trim. Tendinţă Sezonalitate Previziune

2006 III 325.34 1.34 435.95


IV 332.24 0.688 228.58
2007 I 339.14 0.656 217.9

Modelul de descompunere considerat a fost cel multiplicativ, astfel că valorile


previzionate se obţin din relaţia:
Yˆ = Tˆ ⋅ Sˆ
Spre exemplu, pentru trimestrul III din 2006, valorile tendinţei respectiv a componentei
sezoniere sunt:

28
Tˆ (21) = 180.44 + 6.9 × 21 = 325.34 respectiv Ŝ 3 = 1.34

valoarea previzionată fiind:


Yˆ = Tˆ ⋅ Sˆ = 325 .34 ×1.34 = 435 .95 .

Capitolul 2. Metode de netezire exponenţială

Tehnicile de netezire sunt utilizate pentru a genera valori netezite (atenuarea


fluctuaţiilor aleatoare ε din date) din care s-a eliminat componenta aleatoare) respectiv
pentru obţinerea de previziuni. Valoarea netezita corespunzatoare valorii observate Yt se

29
va nota prin S t . Deasemenea vom nota prin Ŷt ( h) previziunea variabilei Y efectuată la
momentul t, pe baza datelor disponibile în acest moment Y1 , Y2 , ..., Yt , pentru un
orizontul de timp h. O alta notatie intalnita in literatura de specialitate pentru Ŷt ( h) este
Ŷt +h , aceasta fiind de fapt o previziune pentru variabila aleatoare Yt +h . Previziunea
pentru urmatoarea perioada este considerata egala cu valoarea netezita curenta:
Ŷt (1) = S t

Daca seria de timp este generată de un proces staţionar în medie (proces aflat în echilibru
în jurul unei constante) atunci, media ultimilor t termeni ai seriei poate fi utilizată pentru
generarea previziunii aferente urmatoarei perioade:
Y + Yt −1 + ... + Y1
Yˆt (1) = Y = t .
t
Valoarea medie minimizează indicatorul MSE.
Deasemenea daca seria contine doar tendinta si componenta aleatoare atunci o medie
mobila, de tipul mediei aritmetice simple calculată pentru ultimele k observaţii poate fi
considerată previziune pentru urmatoarea perioadă de timp:
Y + Yt −1 + ... + Yt −k +1
Yˆt (1) = S t = t .
k
Gradul de netezire al seriei este mai mare pe masura ce k creste. Observam caci termenii
seriei netezite sunt generati de o relatie de recurenta:
Y − Yt −k
S t = S t −1 + t unde t ≥ k +1 .
k
Pentru primii k termeni ai seriei nu pot fi determinate valorile netezite corespunzatoare.
În acest caz numărul termenilor din medie rămâne constant, iar observaţiile au toate
aceeaşi pondere. O extensie naturală a acestei abordări (de previziune cu ajutorul
mediilor mobile) o constituie previziunea utilizând medii mobile ponderate:
t −k −1
Yˆt (1) = S t =θ0Yt +θ1Yt −1 +... +θt −k +1Yt −k +1 unde ∑θ
i =0
i =1 .

De regula ponderile alocate observatiilor recente sunt mai mari. În acest capitol vom
discuta o clasă de metode ce atribuie termenilor seriei ponderi descrescătoare
exponenţial, pe măsură ce observaţiile sunt mai îndepărtate în timp, numite metode de
netezire exponentiala.
Avantaje ale metodelor de netezire exponentiala, în previziune:
- reduc intervenţia analistului în elaborarea previziunilor. Se utilizează pentru
obţinerea rapidă de previziuni (ex. pentru previziune lunară a vânzărilor unei
firme, din fiecare sortiment de produs). Pot fi aplicate si atunci cand lungimea
seriilor de timp este mai scurta
- nu necesită separarea componentelor deterministe (tendinţă, sezonalitate)
- în practică s-au dovedit a fi candidate serioase ale altor metode mai complexe.
Metodele din această clasă implică utilizarea unor coeficienţi de netezire, cu valori între 0
şi 1, ce facilitează alocarea unor ponderi inegale termenilor seriei.

2.1. Metoda de netezire exponenţială simplă (pentru serii staţionare)

30
Ca şi metoda de previziune, acest model este adecvat pentru previziunea seriilor de timp
ce fluctuează aleator în jurul unei valori constante (staţionare în medie), nu au tendinţă
sau componentă sezonieră):
Yt = m + ε t
Se presupune aici caci constanta m ramane relativ stabila pe intervale succesive de timp.
Considerăm t momentul prezent. Pentru a previziona următoarea valoare Yt +1 ,
utilizând datele disponibile până la acest moment Y1 , Y2 , ..., Yt se utilizează relaţia
de recurenţă:
Yˆt +1 =c Yt + (1 −c )Yˆt t=1,2,....
unde c ∈[0,1] este constanta de netezire. Aceasta metoda poate fi privita ca o metoda de
netezire. Relatia de recurenta se aplica succesiv pentru fiecare observatie din seria de
timp. Valoarea previzionata pentru următoarea perioadă Yˆt +1 se calculează ca o medie
ponderata intre observatia curenta Yt (ultima valoare disponibilă) si previziunea
precedentă Yˆt (efectuată la pasul anterior). Cand c =1 valorile previzionate sunt egale
cu ultima observaţie.
Atunci când se utilizează în scopul netezirii, valoarea netezită S t asociată valorii
observate Yt este generată de o relaţie similară:
S t = c Yt + (1 −c ) S t −1
întrucât previziunea pentru următoarea perioadă este considerată egală cu valoarea
netezită curentă:
Ŷt (1) =Yˆt +1 = S t .
Pentru perioada observată, seria cu valorile previzionate Yˆ1 , Yˆ2 , ..., YˆT −1 , sau
echivalent S1 , S 2 , ..., S T este seria valorilor netezite.
Intuitiv, implicaţiile metodei
 
devin maievidente dacă utilizăm succesiv relaţia de
recurenţă anterioară pentru Yt , Yt − 1 , ..., Y2 :
 
Yˆt +1 = c Yt +(1 −c )Yt =cY t +(1 −c) cY t −1 +(1 −c )Yt −1 = = [ ]
= cY + c (1 − c )Y
t + c (1 − c ) 2 Y
t −1 +  + c (1 − c ) t −1 Y + (1 − c ) t Yˆ
t −2 1 1
Astfel, valoarea previzonată se determină ca o media ponderată a tuturor observaţiilor,
ponderea fiecărei observaţii descreşte exponenţial pe măsură ce ne îndepărtăm de prezent,
ţinând seama de următoarele:
Yt pondere c
Yt-1 pondere c(1-c)
Yt-2 pondere c(1-c)2
………. ................................................
t-1
Y 1 pondere c(1-c)
Cea mai mare pondere o are observaţia curentă Yt. Suma ponderilor asociate tuturor
observaţiilor tinde spe unu atunci cand numărul observaţiilor este mare.
Deasemenea, o altă formă a relaţiei de recurenţă este următoarea:
Yˆt +1 =Yt +c (Yt −Yˆt )

unde et = Yt − Yˆt este eroarea de previziune, la momentul t. Se poate vedea că


previziunea pentru următoarea perioadă este egală cu valoarea curentă ajustată în funcţie
de ultima eroare de previziune.

31
Utilizarea oricăreia din cele trei forme ale relaţiilor ce definesc această metoda
necesită:
- o valoare iniţială Yˆ1 . De regulă pentru aceasta se consideră prima valoare
observată Yˆ1 =Y1 sau media seriei sau media primilor termeni ai seriei;
- o valoare adecvată pentru constanta de netezire c. Cand c are o valoare apropiată
de 1 atunci se acordă o pondere mai mare observaţiilor recente, fiind adecvată
pentru serii netede. Atunci când c este aproape de 0 previziunea depinde într-o
mai mare măsură de valorile înregistrate în trecut, fiind adecvată pentru serii cu o
amplitudine mare a fluctuaţiilor.
De regulă softurile statistice selectează o valoare optimă pentru c, fiind aceea valoare
pentru care unul din indicatorii sintetici ai erorilor de previziune (MSE, MAE, MAPE
or SSE) este minim. Frecvent se minimizează media pătratelor erorilor de previziune
(
1 T −1
) 1 T −1 2
SSE = ∑ Yt +1 − Yˆt +1 = ∑et +1 → min
T t =0
2

T t =0
eroarea de previziune fiind:
et +1 =Yt +1 −Yˆt +1 .
Atunci când este utilizată în scopul netezirii, metoda produce valori mai netede atunci
când c este aproape de zero, ponderile asociate valorilor curente, în relaţia de recurenţă:
S t = c Yt + (1 −c ) S t −1
fiind mici.
Previziunile înafara perioadei observate sunt constante, pentru orice orizont de
previziune h > 0 :
YˆT ( h) = YˆT (1) = cY T + (1 −c )YˆT .

2.2 Metoda Holt de netezire exponenţială (pentru serii cu tendinţă)


Metode de netezire exponenţială simplă a fost extinsă de către Holt pentru serii ce
prezintă tendinţă (şi componentă aleatoare). Ideea: ajustarea seriei în vecinătatea originii
previziunii cu o dreaptă, tendinţa fiind presupusă liniară pe porţiuni:
Yˆt +h = at + hbt
unde nivelul seriei at (termenul liber din ecuaţia dreptei de ) respectiv panta dreptei bt se
modifică conform unor relaţii de recurenţă asemănătoare cu cele din cazul metodei de
netezire exponenţiale simple:
at = αYt + (1 −α ) ( at −1 + bt −1 )
bt = β ( at − at −1 ) + (1 − β ) bt −1 .

Pentru previziune, panta bt se înmulţeşte cu orizontul de previziune şi se adună la nivelul


seriei at . Pentru perioada observată, previziunile se fac pas cu pas, astfel orizontul de
previziune este unu. Valoarea previzionată pentru următoarea perioadă:
Yˆt +1 = at + bt
Atunci când devine disponibilă o nouă observaţie Yt (şi originea previziunii devine t)
parametrii dreptei, termenul liber a t asimilat cu nivelul seriei respectiv panta dreptei bt
se ajustează conform relaţiilor de recurenţă prezentate. Nivelul seriei la momentul t notat

32
prin a t este o medie ponderată între nivelul său previzionat anterior a t −1 + bt −1 = Yˆt şi
noua observaţie disponibilă. Panta dreptei la momentul t notată bt este o medie
ponderată între panta estimată prin diferenţa între ultimele valori netezite ale nivelului
seriei şi panta estimată la momentul precedent.
Utilizarea relaţiilor de recurenţă necesită valori iniţiale pentru a t respectiv bt .
Variante de iniţializare întâlnite în practică:
- a1 = Y1 şi b1 = 0
- a1 = Y1 şi b1 = Y2 −Y1 sau b1 = (Y4 −Y1 ) / 3 .
Constantele de netezire α, β ∈[0,1] sunt determinate de regulă din condiţia
minimizării erorilor de previziune, fiind acele valori pentru care unul din indicatorii
sintetici ai erorilor de previziune (MSE, MAE, MAPE or SSE) este minim. De regulă
aceste constante se determină din condiţia minimizării mediei pătratelor erorilor de
previziune este minimă:
(
1 T −1
) 1 T −1 2
MSE = ∑ Yt +1 − Yt +1 = ∑et +1 → min
T t =0
ˆ 2

T t =0
eroarea de previziune fiind:
et +1 =Yt +1 −Yˆt +1 .

Previziunile înafara perioadei observate, pentru un orizont de timp h, se situează pe


dreapta ce are ca şi parametri ultimele estimaţii:
YˆT ( h) = YˆT +h = aT + hb T .

2.3. Metoda Holt-Winters de netezire exponenţială (pentru serii cu tendinţă şi


sezonalitate)

Metoda Holt-Winters este adecvată seriilor ce prezintă tendinţă şi componentă sezonieră.


Metoda implică trei ecuaţii de recurenţă, şi prin urmare trei constante de netezire, una
pentru nivelul seriei, una pentru panta dreptei de tendinţă respectiv una pentru coeficienţii
sezonalităţii. Notăm cu p perioada cpmponentei sezoniere.
Tendinţa seriei este modelată local printr-o dreaptă, în mod similar cu metoda Holt.
Ţinând seama de modelul de descompunere a seriei, aditiv sau multiplicativ, există două
variante ale metodei.

a) Modelul multiplicativ
Previziunile sunt generate în baza unei ecuaţii de forma:
Yˆt +h =( at +h bt ) S t −p +h
unde nivelul seriei at , panta dreptei de tendinţă bt respectiv componenta sezonieră S t
sunt generate de relaţiile de recurenţă:
 Y 
at = α  t  + (1 −α )( at −1 + bt −1 )
 S t − p 

bt = α ( at − at −1 ) + (1 − β ) bt −1

33
Y 
S t = δ  t  + (1 − δ ) S t − p .
 at 
Componenta sezonieră este reprezentată aici prin indici de tipul indicilor sezonalităţii.
Estimaţia pentru componenta sezonieră, la momentul t, este o medie ponderată între
indicele sezonalităţii estimat prin raportul între valoarea curentă şi nivelul seriei Yt / at şi
ultima valoare a indicelui generat pentru respectivul sezon S t −p (calculat la momentul t-
p, unde p este perioada componentei sezoniere). Ecuaţia pentru panta dreptei de tendinţă
este identică cu cea din metoda Holt. În ecuaţia pentru nivelul seriei se utilizează valoarea
desezonalizată curentă Yt / S t −p estimată prin valoarea curentă împărţită la cea mai
recentă estimaţie a indicelui sezonalităţii pentru respectivul sezon.
Ca şi valori iniţiale, necesare în relaţiile de recurenţă, sunt sugerate următoarele:
1 p
- media datelor ce acoperă primul ciclu sezonier p a = ∑Yk , fiind astfel
p k =1
eliminată sezonalitatea din nivelul seriei a1
1 Y p +1 −Y1 Y p +2 −Y1 Y2 p −Y p
- bp = ( + +... + ) , fiecare termen din sumă fiind o
p p p p
estimaţie pentru panta dreptei aferentă unui sezon;
- indicii sezonalităţii sunt estimaţi prin indicii sezonalităţii determinaţi prin metoda
raportării la mediile mobile, varianta multiplicativă. O altă variantă de lucru este
următoarea:
Y Y Y
S1 = 1 , S 2 = 2 , ..., S p = p .
ap ap ap
Cele trei constante de netezire α, β, γ ∈[0,1] sunt determinate din condiţia de
minimizare a erorilor de previziune (MSE, MAPE, SSE).
Previziunile înafara perioadei observate, pentru un orizont de timp h, sunt calculate
utilizând ultimele estimaţii, pentru aT , bT respectiv S T −p +h , determinate din
relaţiile de recurenţă:
YˆT +h =( aT +h bT ) S T −p +h .

b) Modelul aditiv
Având în vedere compunerea aditivă a celor două componente tendinţă şi componentă
sezonieră, previziunile sunt generate în baza unei ecuaţii de forma:
Yˆt +h = at +h bt +S t −p +h
unde nivelul seriei at , panta dreptei de tendinţă bt respectiv componenta sezonieră S t
sunt generate de relaţiile de recurenţă:
at = α(Yt − S t − p ) + (1 −α )( at −1 + bt −1 )

bt = α ( at − at −1 ) + (1 − β ) bt −1
S t = δ (Yt − at ) + (1 −δ ) S t − p .
Pentru iniţializarea coeficienţilor sezonalităţii se poate utiliza metoda raportării la mediile
mobile, varianta aditiva sau diferenţele:
S1 =Y1 −a p , S 2 = Y2 − a p , ..., S p = Y p − a p .

34
Previziunile înafara perioadei observate, pentru un orizont de timp h, sunt calculate
ţinând seama de forma aditivă a modelului:
YˆT +h = aT +h bT +S T −p +h .

35
Capitolul 3. Modele de tip autoregresiv medie mobilă (ARMA, ARIMA)

Box & Jenkins (1970) au propus o metodologie de previziune a unei variabile, utilizând
ca şi bază de date doar trecutul şi prezentul acesteia. Aceste modele se bucură de o largă
popularitate datorită:
- calităţii previziunilor generate;
- flexibilităţii modelelor;
- rigurozităţii privind fundamentarea matematică a modelului;
- este o metodă adecvată şi pentru previziunea unor variabile cu o evoluţie
neregulată.
Observaţie: s-au introdus într-o perioadă în care modelele econometrice clasice, în
principal cele macroeconomice cu mai multe ecuaţii au condus frecvent la previziuni mai
slabe decât metodele simple univariante.
Un model de tip autoregresiv-medie mobilă ARMA(p,q) are o componentă de tip
autoregresiv respectiv o componentă de tip medie mobilă:
Yt = a 0 + a1Yt −1 + a 2Yt −2 + + a p Yt −p −b1εt −1 −b2 εt −2 − −bq εt −q +εt
unde p este ordinul părţii autoregresive, q ordinul mediei mobile iar εt este un proces de
tip zgomot alb (acesta fiind o succesiune de variabile aleatoare independente şi identic
repartizate, cu medie zero).
Atunci când q=0 se obtine modelul autoregresiv de ordin p, notat AR(p):
Yt = a 0 + a1Yt −1 + a 2Yt −2 + + a p Yt −p
iar pentru p=0, se obtine modelul medie mobilă de ordin q:
Yt = a 0 − b1εt −1 − b2 εt −2 − − bq εt −q + εt .
La baza elaborării unor astfel de modele stau următoarele considerente:
- evoluţia fenomenelor economice se află sub impulsul resurselor existente, a
capacităţilor deja create, a experienţei acumulate, a tradiţiei, obişnuinţei (spre exemplu în
consum). Variabilele din economie au caracter inerţial, fiind prezentă o puternică
componentă autoregresivă (în prinipal în evoluţia indicatorilor macroeconomici). Ar fi
imposibil de imaginat sore exemplu o economie în care datele din seria de timp ce redă
evoluţia preţului unui produs sunt extrase aleator dintr-o urnă. Partea autoregresiva
surprinde mecanismele interne de generare ale procesului;
- componentă de tip medie mobilă este efectul unor evenimente nepredictibile, asupra
variabilei, efecte asimilate treptat în timp. Această componentă este justificată prin
intervenţia unor schimbări bruşte, neaşteptate în rândul factorilor exteriori corelaţi cu
variabila (ex.greve, diverse ştiri, schimbarea bruscă a vremii → pentru varibile din
agricultură). Spre exemplu efectul unei ştiri importante, dar neaşteptate, privind

36
activitatea unei societăţi se va repercuta asupra cursului actiunilor sale la bursă în
următoarele săptămâni. Partea medie modilă surprinde asimilarea treptată a şocurilor
(abaterilor accidentale) din afara sistemului.

3.1. Principalele concepte pe care se fundamentează metodologia Box-Jenkins

Considerăm în continuare o clasă particulară de procese aleatoare, numite procese


staţionare.

Fie un proces aleator (Yt ) unde t ∈ Z . Pentru observaţia aferentă momentului t,


variabila aleatoare Yt , se definesc:
- media variabilei E ( Yt ) = µt
- varianţa Var ( Yt ) = σ t = E[(Yt − µ t ) ]
2 2

- covarianţa dintre două variabile Yt şi Ys , prin


γ ts = cov( Yt , Ys ) = E [ ( Yt − µ t )( Ys − µ s ) ] .
Deoarece dispunem de o singură observaţie pentru fiecare variabilă Yt este imposibil
de estimat aceste elemente. Estimarea devine posibilă pentru o clasă particulară de
procese aleatoare, numite procese staţionare.
Definiţie. Un proces staţionar de ordinul doi dacă verifică următoarele trei condiţii:
(1) E (Yt ) = µ, ∀t media este constantă în timp (staţionalitate în medie)
(2 Var ( Yt ) = σ varianţa este constantă în timp (staţionalitate în varianţă)
2

(3) cov ( Yt , Ys ) = γ k , t ≠ s unde k = s −t covarianţa dintre două


variabile este funcţie doar de lungimea intervalului de timp ce separă cele 2 variabile.
Pentru un proces staţionar, funcţia de autocovarianţă devine:
γ k = E[ ( Yt − µ )( Ys − µ ) ] unde k = s −t .
Un proces staţionar se află într-o state de echilibru (are proprietatea de a reveni la
medie ori de căte ori se îndepărtează prea mult de la aceasta).
In cronogramă, o serie staţionară se manifestă sub forma unor fluctuaţii cu
amplitudine relativ constantă (varianţă constantă) în jurul unei medii constante,
independente de timp (staţionalitate în medie). Nestaţionalitatea în medie este specifică
seriilor cu tendinţă, iar nestaţionalitatea în varianţă se observă prin modificarea în timp a
amplitudinii fluctuaţiilor.
Zgomot alb (white noise). Un caz particular de proces staţionar, este cel de tip zgomot
alb (denumire luată din tehnică), acesta fiind o succesiune de variabile aleatoare
εt , t ∈N independente şi identic repartizate, cu medie zero. Astfel:
- E(ε t ) = 0
- Var( ε t ) = σ ε2 = E (ε t2 )
- Cov ( ε t ,η s ) = 0, ∀t ≠ s .

3.1.1. Funcţia de autocorelaţie (AC)


Considerăm un proces staţionar. Funcţia de autocorelaţie rk se defineşte prin:

37
γ k E [ ( Yt − µ )( Yt − k − µ ) ]
rk = =
γ0 [
E ( Yt − µ )
2
], k∈Z

şi măsoară corelaţia liniară dintre două variabile Yt şi Yt-k separate de k unităţi de timp.
Pentru k=1 respectiv k=2 coeficientul de autocorelaţie devine
E [ ( Yt − µ )( Yt −1 − µ ) ]
r1 =
[
E ( Yt − µ )
2
]
E[ ( Yt − µ )( Yt − 2 − µ ) ]
r2 =
[
E ( Yt − µ )
2
]
Observaţii:
cov ( Yt , Yt −k )
rk =
Var ( Yt ) Var ( Yt −k )
1. → regăsim coeficientul de corelaţie liniară
dintre Yt şi Yt-k
2. rk ∈[ −1,+1]
3. γ 0 = E ( Yt − µ ) = Var ( Yt ) = σ 2
2

4. rk = r−k funcţia de autocorelaţie este o funcţie pară.


Pentru un proces de tip zgomot alb, funcţia de autocorelaţie devine:

1 k = 0
rk =  .

0 k≠ 0
variabille fiind necorelate.
Estimarea funcţiei de autocorelaţie este o etapă importantă în faza de identificare a
unui model de tip ARIMA modelului. Graficul funcţiei de autocorelaţie se numeşte
corelogramă şi oferă informaţii importane privind comportamentul seriei.
Estimarea funcţiei revine la calculul unor coeficienţi de autocorelaţie (corelaţie
liniară) pentru fiecare cuplu (Yt, Yt-k):

k=1 (Yt, Yt-1). r1


k=2 (Yt, Yt-2). r2
.................................................................
k=M (Yt, Yt-M) rM

Prezintă importanţa calculul primelor T/4 autocorelaţii (spre exemplu, dacă lungimea
seriei este T=80 ⇒ M = 80/4 = 20).

Estimarea coeficienţilor de autocorelaţie


In practică dispun de o serie cronologică Y1, …, YT (eşantion finit în timp, şi o
singură observaţie pentru fiecare variabila aleatoare Yt ). In ipoteza staţionalităţii, media

38
µ şi varianţa σ 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
T
1
Y =
T
∑Y
t =1
t

1 T

s2 =
T t =1
(Yt − Y ) 2 .

r
Coeficientul de autocorelaţie k se estimează prin:

∑ (Y − Y )(Yt −k − Y ) /(T − k )
T

t
rˆk = t =k +1

∑ (Y −Y ) /T
T
2
t
t =1
respectiv

∑ (Y − Y )(Yt −k − Y )
T

t
rˆk = t =k +1

∑ (Y −Y )
T
2
t
t =1
dacă lungimea seriei este suficient de mare (şi astfel T-k nu diferă foarte mult de T).

Testarea semnificativităţii coeficieţilor de autocorelaţie


Testarea semnificativităţii coeficientului de autocorelaţie rk :
H0 : rk = 0 (nu diferă semnificativ de zero)
H1 : rk ≠ 0
se realizează utilizând un statistica Student
rˆk
t= converge asimtotic (când T → ∞ ) la legea normală
Vˆar ( rˆk )
N (0,1)
Pentru varianţa estimatorului coeficientului de autocorelaţie Bartlett a furnizat
următoarea expresie (vezi curs C. Hurlin):

1  1
[ ( )]
 k −1
Var ( rˆk ) = 1 + 2∑ rˆi 2  = 1 + 2 rˆ12 +  + rˆk2−1 .
T i =1  T
Decizia: pentru un nivel de semnificaţie α , ipoteza nulă H0 nu se respinge dacă
[ 
t calc ∈ [ − t tab , t tab ] sau echivalent rˆk ∈ − t tab Var ( rˆk ) , t tab Var ( rˆ k ) .

]
Observaţie. Uneori pentru varianţa estimatorului se utilizează expresia
Var ( rˆk ) = 1 / T (expresie adecvată de fapt doar atunci când seria este de tip zgomt alb).
ˆ
Astfel pentru T suficient de mare (pentru a putea aproxima legea ştudent prin legea
normală), o valoare absolută pentru coeficientul de autocorelaţie mai mare decât
1.96 / T (nivelul de semnificaţie fiind fixat la 5%) indică faptul ca acesta diferă
semnificativ de zero.

39
3.1.2. Funcţia de autocorelaţie parţială (PAC)
Deseori corelaţia intre doua variabile este determinată de faptul că ambele sunt corelate
cu o a treia variabilă. In acest context o mare parte din corelaţia intre două variable Yt şi
Yt-k poate apare urmare a unui efect indirect, de corelare a ambelor variabile cu variabilele
intermediare Yt −1 , Yt −2 , Yt −k −1 . Pentru a se evita acest fapt se utilizează coeficientul
de autocorelaţie parţială, acesta măsurând efecul direct al lui Yt-k asupra variabilei Yt (se
izolează influenţa variabilei Yt-k). Definitia acestuia este similară cu a coeficientului de
corelaţie parţială din econometrie.
Coeficientul de autocorelaţie partială între două variabile separate de k unităţi de timp
notat prin c k este coeficientul de regresie a variabilei Yt −k în modelul autoregresiv
AR(k):
Yt = a 0 + a1Yt −1 + a 2Yt −2 + +c k Yt −k +εt
şi măsoară informaţia adiţională adusă de variabila Yt −k în exoplicarea
comportamentului prezent Yt (cu câte unităţi se modifică Yt dacă Yt −k creşte cu o
unitate iar celelalte variabile Yt −1 , Yt −2 , Yt −k −1 rămân nemodificate). Astfel,
coeficientul de autocorelaţie parţială măsoară corelaţia între Yt şi Yt −k , în condiţiile în
care celelalte variabile Yt −1 , Yt −2 , Yt −k −1 sunt menţinute constante (se izolează
influenţa variabilei Yt −k ). Astfel, coeficientul de autocorelaţie parţială între Yt şi Yt −2
, adică c 2 , este egal cu coeficientul de autocorelaţie r2 dacă Yt şi Yt −2 sunt ambele
necorelate cu Yt −1 .
Funcţia de autocorelaţie parţială constă în setul de coeficienţi c k , unde k=1, 2, 3, .....
Pentru k=1 coeficientul de autocorelaţie şi coeficientul de autocorelaţie parţială coincid
r1 = c1 . Coeficienţii de autocorelaţie parţială înregistrează valori între -1 şi 1.

Estimarea coeficienţilor de autocorelaţie parţială


O estimare directă a coeficienţilor de autocorelaţie parţială constă în estimarea
coeficienţilor de regresii pentru mai multe regresii. Astfel, c1 se estimează cu
coeficientul de regresie a variabilei Yt −1 în modelul autoregresiv AR(1):
Yt = a 0 + c1Yt −1 + εt
c 2 este coeficientul de regresie a variabilei Yt −2 în modelul autoregresiv AR(2):
Yt = a 0 + a1Yt −1 + c 2Yt −2 + εt
c 3 este coeficientul de regresie a variabilei Yt −3 în modelul autoregresiv AR(3):
Yt = a 0 + a1Yt −1 + c 2Yt −2 + εt
.............................................................
c k este coeficientul de regresie a variabilei Yt −k în modelul autoregresiv AR(k):

Yt = a 0 + a1Yt −1 + a 2Yt −2 + +c k Yt −k +εt .

In practică (inclusiv în algoritmii de calcul implementaţi în softurile de statistică) aceştia


nu sunt de regulă calculaţi în acest mod, ci se utilizează ecuaţiile Yule-Walker, ce redau
relaţiile dintre coeficienţii de autocorelaţie şi coeficienţii de autocorelaţie parţială.

40
Testarea semnificativităţii coeficineţilor de autocorelaţie parţială
Testarea semnificativităţii coeficientului de autocorelaţie parţială c k :
H0 : c k = 0 (nu diferă semnificativ de zero)
H1 : c k ≠ 0
se realizează utilizând statistica Student
rˆk
t= converge asimtotic (când T → ∞ ) la legea normală
Vˆar ( rˆk )
N (0,1) .
Pentru varianţa estimatorului coeficientului de autocorelaţie parţială se următoarea
expresie:

 1
Var ( cˆ k ) = .
T
Decizia: pentru un nivel de semnificaţie α , ipoteza nulă H0 nu se respinge dacă
[ ]
t calc ∈ [ − t tab , t tab ] sau echivalent cˆk ∈ − t tab / T , t tab / T .

3.1.3. Procese nestaţionare


Un proces este nestaţionar dacă nu verifică una sau mai multe din cerinţele din
definitia procesului staţionar. În economie majoritatea seriilor sunt nestaţionare, media
respectiv varianţa acestora nefiind constantă în timp.
Detectarea nestaţionarităţii:
- din cronogramă şi corelogramă respectiv
- utilizarea unor teste de staţionaritate (numite şi teste de rădăcină unitate); acestea
vor fi discutate în capitolul următor.
Din cronogramă:
- seria este nestaţionară în medie dacă media nu este constantă în timp. O serie ce
prezintă spre exemplu o tendinţă deterministă (ce poate fi modelată prin funcţii
elementare) este nestaţionară;
- seria este nestaţionară în varianţă dacă varianţa nu este constantă în timp.
In acest paragraf avem în vedere un proces (serie) nestationar în medie. Nestaţionalitatea
relativ la varianţă va fi abordata într-un paragraf următor (prin modele de tip ARCH,
GARCH...).
Din corelogramă (graficul funcţiei de autocorelaţie): autocorelaţiile rk unei serii
staţionare se apropie rapid de zero, odată ce k creşte (tind exponenţial spre zero). Pentru
o serie nestaţionară autocorelaţiile sunt mari şi pozitive pentru un numar mare de valori
ale lui k.
Modelele ARMA sunt adecvate seriilor staţionare. Acestea au fost generalizate pentru
serii nestationare ce devin staţionare prin diferenţiere, modelele rezultate fiind denumite
modele autoregresive-integrate-medie mobilă ARIMA(p, d, q) unde d este ordinul de
diferenţiere necesar pentru staţionalizarea seriei.
Considerăm un proces aleator cu medie zero. Vom indica modul de scriere a
modelelor utilizând operatorul de întârziere LY t =Yt −1 .
ARMA(p,q): Yt = a1Yt −1 + a 2Yt −2 + + a P Yt −P −b1εt −1 −b2 εt −2 − −bq εt −q +εt
(1 − a1 L − a 2 L2 −  − a p Lp )Yt = (1 − b1 L −  − bq Lq )ε t sau

41
φ( L )Yt = θ ( L )ε t
unde φ( L ) =1 − a1 L −a2 L − − a p L iar θ( L) = 1 − b1 L − − bq L sunt polinoame
2 p q

de gradul p respectiv q în L.
Cât de generale sunt aceste modele? Teorema de reprezentare a lui World arată că
orice proces staţionar poate fi scris ca şi un proces de tip medie mobila cu un număr
infinit (mare) de termeni.
Dacă seria este nestaţionară şi devine stationară după d diferenţieri,
Xt ∈ ARIMA(p,d,q) (adică ∆ X t = (1 − L) X t ∈ ARMA(p,q)) foma restrânsă este:
d d

φ( L ) (1 − L) d X t = θ ( L )ε t .
Caz particular: mersul aleator ARIMA(0,1,0).
Există două modalităţi de generare a unor serii nestaţionare.
a) Seriile nestaţionare în medie cu tendinţă deterministă polinomială devin staţionare
dacă sunt diferenţiate de un număr de ori egal cu gradul polinomului de tendinţă.. De
regulă seriile din economie devin taţionare după una sau două diferenţieri (astfel d=1 sau
d=2). Spre exemplu daca seria are o tendinţă deterministă liniară atunci seria devine
staţionară după o singură diferenţiere:
Yt = a + bt + ε t
∆Yt = b + ∆ε t
unde εt este un proces staţionar (prin urmare şi ∆εt ). In acest caz valorile fluctuează în
jurul unei drepte, sunt staţionare relativ la dreapta de tendinţă. Dacă seria are o tendinţă
polinomiala de gradul 2 atunci sunt necesare două diferenţieri pentru ca seria să devină
staţionară. Dacă seria este staţionară relativ la o tendinţă deterministă se spune ca seria
este staţionară relativ la tendinţă.
O alta modalitate de transformare a acestora în serii staţionare constă în extragerea
tendinţei deterministe din date (dupa estimarea ei prin functii elemenare).
b) Un alt tip de proces nestaţionare este generat de de o ecuaţie de tipul AR(1) unde
coficientul variabilei este unu:
Yt = Yt −1 + εt sau Yt = a 0 + Yt −1 + ε t
εt fiind zgomot alb. Acesta se numeşte mers aleator şi în evoluţia acestuia se observă
periade cu aparente tendinţe de creştere sau descreştere care apoi îşi schimbă brusc,
nepredictibil direcţia. Spunem că un astfel de proces are tendinţă stochastică, fiind
rezultatul acumulării unor socuri aleatoare ce nu au o baza sistematică. Aceste evoluţii
sunt specifice variabilelor financiare şi în principal seriilor ce redau evoluţia cursului
unor acţiuni. Varianţa unui proces de tip mers aleator fară termen liber nu este constantă
şi creşte odată cu t iar pentru forma cu termen liber atât media cât şi varianţa variază în
timp (cresc odată cu t). Spre exemplu daca valoarea de pornire la momentul t=0 este Y0
atunci:
Yt = ε t + ε t −1 + ε t −2 + ... + ε1 + Y0
iar varianţa creşte odată cu t, deoarece Var ( Yt ) = tσ ε .
2

Mersul aleator constituie un prototip pentru o clasă de proces nestaţionare numite


procese integrate; trebuie evidentiată şi importanţa practica a acestui model, fiind întâlnit
specific mai ales seriilor din dmeniul financiar. Observăm că şi in acest caz după o
singură diferenţiere seria devine staţionară:
∆Yt = ε t respectiv ∆Yt = a 0 + ε t .

42
Polinomul in L asociat părţii autoregresive din modelulul AR(p):
φ( L )Yt = εt
(1 − L )Yt = εt
1− χ = 0 ⇒ χ =1
are o singură rădăcină pe cercul unitate (în modul egală cu 1). Seria este staţionară prin
diferenţiere sau este integrată de ordinul 1 (sau are o radăcină unitate, „unit root”), şi se
notează prin I(1). Rădăcinile unitate, adică rădăcinile polinomului autoregresiv ce se află
pe cercul unitate se referă doar la comonenta stochastică a seriei. Majoritatea seriilor din
economie sunt nestaţionare în medie Yt dar diferenţa de ordin întâi
Z t = ∆Yt = Yt − Yt −1 = (1 − L)Yt devine staţionară. Dacă sunt necesare două diferenţieri
succesive pentru ca seria să devină staţionară:
∆2Yt = ∆Z t = (Yt − Yt −1 ) − (Yt −1 − Yt −2 ) = Yt − 2Yt −1 + Yt −2 = (1 − L ) 2 Yt
spunem că seria este integrată de ordin doi I(2).
In general, un proces (serie) este integrat de ordin d, notat prin I(d), dacă este necesar
a fi diferenţiat de d ori până devine staţionară; Z t = ∆d Yt = (1 − L) d Yt este staţionară.
Modelele de tip ARIMA acoperă o clasă largă de procese nestaţionare. Atât seriile cu
tendinţă deterministă polinomiala cât şi cele cu tendinţă stochastică pot fi transformate în
serii staţionare prin diferenţiere.

3.2. Modelul autoregresiv. Proprietăţile funcţiei de autocorelaţie respectiv de


autocorelaţie parţială

a) Funcţia de autocorelaţie
Considerăm un model autoregresiv de ordinul unu AR(1) sau ARIMA(1,0,0):
Yt = a 0 + a1Yt −1 + εt unde a1 <1
iar εt este zgomot alb cu media E ( ε t ) = 0 şi varianţa Var (ε t ) = σ ε2 . Procesul este staţionar
dacă coeficientul a1 <1 .
Observaţii. a) Dacă a1 >1 procesul este nestaţionar, şi are o evoluţie explozivă,
exponenţială. Un asemenea comportament este rar întâlnit în practică (creştere
exponenţiala, pe termen nelimitat).
b) Dacă a1 = 1 regăsim mersul aleator.
c) Pentru procesul este de tip zgomot alb de medie a0 .
Fără a restrânge generalitatea considerăm un model autoregresiv de ordinul unu AR(1) cu
medie zero (dacă media procesului µ este diferită de zero se realizează substituţia
X t = Yt − µ ) :
Yt = a1Yt −1 +εt unde a1 <1 .
Proprietate. Dacă a1 <1 atunci procesul AR(1)este staţionar. Funcţia de
autocorelaţie a unui proces autoregresiv de ordinul unu AR(1) are expresia:
rk = a1k .

Demonstraţie.

43
Yt = ε t + a1Yt −1 = ε t + a1 ( a1Yt −2 + ε t −1 ) = ε t + a1ε t −1 + a1 Yt −2 =
2

t −1
= ε t + a1ε t −1 + a1 ( a1Yt −3 + ε t −2 ) =  = ε t + a1ε t −1 + a1 ε t −2 + a1 ε t −3 +  + a1t −1ε 1 = ∑ a1j ε t − j
2 2 3

j =0

Astfel:
• E(Yt) = 0 (erorile au media zero), deci independentă de t
• Cov (Yt , Yt −k ) = Cov (Yt , Yt +k ) = E (Yt Yt +k ) − E (Yt ) E (Yt +k ) = E (Yt Yt +k ) =
( )(
= E ε t + a1ε t −1 +  + a1t −1ε1 ε t +k + a1ε t +k −1 +  + a1t +k −1ε1 = )
= E (ε + a ε
t 1 t −1 +  + a1t −1ε 1 )(ε t +k + a1ε t + k −1 +  + a1k ε t + a1k +1ε t −`1 + a1k + 2 ε t −`2 +  + a1t + k −1ε 1 )
= E( a ε + a
k
1 t
2 k +2 2
1 ε
t −1 ) ( ) (
+  + a1k + 2( t −1) ε 12 = σ ε2 a1k +  + a1k + 2( t −1) = σ ε2 . a1k 1 +  + a12( t −1) . )
Covarianţa devine:

 2 k 1 − a12t
 σ ε a1 2 , a1 ≠ 1
Cov (Yt , Yt −k )=  1 − a1
σ 2 t , a1 = 1
 ε
a1k
atunci cov( Yt , Yt + k )  
t→ ∞
Dacă a 1 <1 → γ k = σ 2
independentă de t.
ε
1 − a12
1
Var ( Yt ) = γ 0 = σ ε2
• 1 − a12 fiind independentă de t.
Observatie. In cazul a1 =1 regasim varianţa unui proces nestaţionar de tip mers
aleator.

Prin urmare, funcţia de autocorelaţie este independentă de t şi are expresia:


γ
rk = k = a1k .
γ0
Observatie. Atunci când a1 > 0 ⇒ funcţia de autocorelaţie rk descreşte
exponenţial, iar pentru a1 < 0 descreşte sinusoidal (dinţi de ferăstrău, valorile negative
alternează cu cele pozitive).
Un proces AR(1) în care apare şi constanta:
Yt = a 0 + a1Yt −1 + εt
a0 1
are media egală cu E (Yt ) = µ = respectiv varianţa Var (Yt ) = σ ε
2
.
1 − a1 1 − a12
Astfel, dacă seria fluctuează în jurulunei valori diferită de zero, media fiind nenulă, în
ecuaţia modelului se va introduce şi termenul constant.
Utilizând scrierea cu operatorul L, un model AR(1) devine
(1 − a1 L)Yt = εt
iar condiţia de staţionalitate a 1 <1 este echivalentă cu cerinţa ca radăcina polinomului
de gradul unu φ ( L ) = 1 − La 1 , notata cu x să aibă modulul mai mare decât unu:

44
1 − xa 1 =0 rezultă , adică x = 1 / a1
Operatorul L face posibila scrierean succintă a unui filtru cu un număr infinit de termeni.
Spre exemplu pentru AR(1) rezultă:
1
(1 − a1 L)Yt = ε t = (1 + a1 L + a12 L2 + )ε t =
1 − a1 L
= ε t + a1ε t −1 + a12 ε t −2 + 
iar condiţia de stabilitate a procesului revine la condiţia de convergenţă a seriei formată

cu coeficienţii filtrului ∑a
i =1
i
1 ; regăsim aceeaşi condiţie de stabilitate, seria fiind

convergentă atunci când a 1 <1 .


Redăm, fără demonstratie, următoarea proprietate, ce indică condiţiile ce trebuie
verificate de coeficienţii unui model AR(p) pentru ca acesta să fie staţionar.
Proprietate. Un model AR(p):
φ( L )Yt = εt
este staţionar atunci când rădăcinile polinomului φ( L ) =1 − a1 L − a 2 L − − a p L
2 p

( rădăcini reale sau complexe) sunt în modul mai mari decât unu (se mai spune ca sunt in
exteriorul cercului unitate) .

b) Funcţia de autocorelatie partială


Din definiţia funcţiei de autocorelaţie parţială rezultă căci coeficienţii de autocorelaţie
parţiala a unui model AR(p) sunt egali cu zero, pentru k mai mare decât p (ordinul
modelului).
Yt = a 0 + a1Yt −1 + a 2Yt −2 + +a pYt −p +εt
Spre exemplu c p +1 este coeficientul de regresie a variabilei Yt −p −1 în modelul
autoregresiv AR(p+1):

Yt = a 0 +a1Yt −1 + a 2Yt −2 + +a pYt −p +a p +1Yt −p −1 +εt .


ori acesta este nul deoarece pentru un model AR(p) coeficientul a p +1 =0.

3.3. Modelul medie mobilă. Proprietăţile funcţiei de autocorelaţie respectiv de


autocorelaţie parţială
Intr-un model de tip medie mobilă sunt utilizate erorile înregistrate în trecut ca şi
variabile explicative:
Yt = a 0 − b1εt −1 − b2 εt −2 − − bq εt −q + εt .

a) Funcţia de autocorelaţie
Considerăm un model medie mobilă de ordinul unu MA(1) sau ARIMA(0,0,1) cu medie
zero:
Yt = εt − b1εt −1
Proprietate. Un model de tipul MA(1) este staţionar iar funcţia sa de autocorelaţie se
anulează pentru k ≥ 2 .
Demonstraţie. Media procesului este nulă: E( Yt ) = E ( ε t ) − b1E( ε t −1 ) = 0
Varianţa procesului:

45
Var ( Yt ) = σ ε2 (1 + b12 )
deoarece:
( )
V ar( Yt ) = E Yt − [ E ( Yt ) ] = E ( Yt 2 ) = E [ ( ε t − b1ε t −1 )( ε t − bε t −1 ) ] =
2 2

= E (ε t2 ) + E ( − b1ε t −1 ε t ) − E ( − b1ε t −1 ε t ) + E (b12ε t2−1 ) = σ ε2 (1 + b12 ) rezultă


(
Var ( Yt ) = σ ε2 1 + b12 )
Covarianţa:

C o( Yvt , Yt − k ) = E ( ε t − b1ε t − 1 )( ε t − k − b1ε t − k − 1 ) =


( )
 { E ( ε t − b1ε t − 1 ) ( ε t − 1 − b1ε t − 2 ) = − b1 E ε t2− 1 = − b1 σ ε2 p e n t rku= 1
=
0 p e n t rk u≠ 1
rezultă funcţia de autocorelatie:

 0, k ≥ 2

rk =  b1
 − 1+ b2 , k = 1
 1
Semnul coeficientului de autocorelatie r1 este invers semnului lui b1 .

Proprietate. Funcţia de autocorelaţie a unui model de tipul MA(q) se anulează pentru


k ≥ q +1 .
Demonstraţie.
Yt = εt − b1εt −1 − b2 εt −2 − − bq εt −q
Media este nulă: E ( Yt ) = 0
Varianţa procesului:
Var ( Yt ) = σ ε2 (1 + b12 + b22 + ... + bq2 ) .
Covarianţa:
C o (vYt , Yt − k ) = E ( ε t − b1ε t − 1 − b2ε t − 2 −  − bq ε t − q ) ( ε t − k − b1ε t − k − 1 − b2ε t − k − 2 −  − bq ε t − k − q ) =
 σ ε2 ( - bk + b1b k + 1 + ...+ b q-k b q ) p e n tr uk = 1, 2,...,q
=
 0 p e n tr uk ≥ q + 1
rezultă funcţia de autocorelatie:

46
 - b k + b1b k + 1 + . . .+ b q-k b q
 p e n t rku= 1, 2, . . .q,
rk =  1 + b12 + b22 + . . .+ bq2

0 p e n t rku≥ q + 1

Funcţia de autocorelatie parţială a unui model medie mobilă se comportă in mod similar
cu funcţia de autocorelaţie a modelelor autoregresive.
Dacă procesul are medie nenulă atunci modelul include şi un termen liber, acesta
fiind egal cu media:
Yt = m + εt − b1εt −1 − − bq εt −q
deoarece E ( Yt ) = m + 0 +  + 0 = m .

3.4. Etapele elaborării unui model ARIMA (autoregresiv integrat medie mobilă)

Etapele (metodologia) de elaborare a unui model ARIMA (p,d,q)


1. Identificarea modelului → se precizează valorile adecvate pentru p, d respectiv
2. Estimarea parametrilor modelului → estimarea coeficienţilor ai, bi, σε2
3. Testarea validităţii modelului şi respecificarea acestuia. Daca modelul nu este
valid atunci se respecifica modelul (alte valori plauzibile pentru p,d,q) şi se reiau
etapele anterioare.
4. Utilizarea modelului in generarea de peviziuni (odată ce a trecut testele devalidare).

Modelarea ARIMA presupune în esenţă urmatoarele:


- verificarea staţionalităţii. Dacă se constată că seria este nestaţionară atunci se
diferenţiază până când devine staţionară, rezultând ordinul de diferenţiere d (de regulă d
= 1, 2);
- ţinând seama de forma funcţiei de autorelaţie şi de autocorelaţie parţială (estimate) r̂k
şi ĉ k pentru seria diferenţiată se stabilesc valori plauzibile pentru p respectiv q adecvate;
- se estimează modelul selectat;
- se testează validitatea modelului. Aici avem doua grupe de teste:
- εt este de tip zgomot alb? → teste privind comportamentul reziduurilor
- teste privind semnificaţia coeficienţilor ai, bi;
- generarea previziunilor, în baza modelului estimat.

Estimarea
Identificare NU
parametrilor Teste de validitate Previziuni
model DA
modelului

47
stabilire valori ai, bi = ? -rez. zgomot alb
p,q,d - semnif. coef.

3.4.1 Identificarea (specificarea) modelului


Este etapa cea mai importantă dar şi cea mai dificilă. Sunt utile funcţiile de autocorelaţie
şi de autocorelaţie parţială estimate. Forma acestora indică modele posibile (teoretice),
adică cele mai plauzibile valori pentru p, q şi d. Comparând funcţiile estimate cu cele
teoretice specifice fiecărui model şi se vor alege unu sau mai multe modele teoretice ce
par adecvate.

a) Stabilirea ordinului de diferenţiere. Dacă o serie este nestaţionară în medie (media


nu este constantă în timp) se vor calcula diferenţele de ordin 1 eventual 2, în scopul
stabilirii ordinului de diferenţiere d.

Observaţie. Dacă seria este uşor nestaţionară şi în varianţă este indicat, inainte de
modelare, a se logaritma datele iniţiale, reducând astfel amplitudinea fluctuaţiilor seriei.
Se va lucra în continuare cu datele logaritmate. De regulă seriile din domeniul financiar
au un astfel de comportament.

b) Stabilirea valorilor plauzibile pentru p respectiv q.


După eventuale diferenţieri şi alte transormări aplicate datelor iniţiale (exemplu
logaritmare), în scopul staţionarizării seriei, se trece la stabilirea unui model adecvat, de
tip autoregresiv medie mobilă ARMA(p,q), pentru datele obţinute în urma diferenţierii
(care sunt staţionare). Dacă nu pare adecvat un model AR(p) sau MA(q) cu număr mic de
paramarametri ( p respectiv q ≤ 4) atunci se va încerca un model mixt ARMA ce
combină ambele părţi.

Se au în vedere următoarele proprietăţi ale funcţiile de autocorelaţie şi de autocorelaţie


parţială, expuse pentru cele mai frecvente modele.
Funcţia de autocorelaţie
Model Funcţia de autocorelaţie rk
parţială ck
AR(1) - descreşte exponenţial dacă - c1 semnificativ (> 0 dacă
Yt = a 1Yt −1 + εt a1 > 0 a1 > 0 şi <0 dacă a1 < 0);
- descreşte sinusoidal, dacă - ck = 0, ∀k ≥ 2
a1 < 0

AR(2) descreşte exponenţial sau - c1 şi c2 semnificativi


Yt = a 1Yt −1 + a 2 Yt −2 + εt sinusoidal. Forma exactă - ck = 0, ∀k ≥ 3
depinde de semnul şi valoarea
coeficienţilor a1 şi a2
AR(p) descreşte exponenţial sau -c1, …, cp – semnificativi
Yt = a 1Yt −1 + + a p Yt −p +εt sinusoidal. Forma funcţiei -ck = 0, ∀k ≥ p+1
depinde de semnul şi valoarea
coeficienţilor a1, …, ap
MA(1) r1 semnificativ (> 0 dacă b1< exponenţial dacă b1 > 0

48
Yt = εt − b1εt −1 0şi < 0 dacă b1 > 0); sinusoidal dacă b1 < 0
rk = 0, ∀k ≥ 2
MA(2) r1 , r2 semnificativ descreşte exponenţial sau
Yt = ε t − b1ε t −1 − b 2ε t −2 rk = 0, ∀k ≥ 3 sinusoidal. Forma exactă
depinde de semnul şi
valoarea coeficienţilor b1,
b2
MA(q) r1 ,  , rq semnificativi descreşte exponenţial sau
Yt = εt − b1εt −1 − − b q εt −q rk = 0, ∀k ≥ p+1 sinusoidal. Forma funcţiei
depinde de semnul şi
valoarea coeficienţilor b1,
…, bq
ARMA(1,1) descreşte exponenţial. descreşte exponenţial
Yt = a1Yt −1 +εt −b1εt −1 Semnul lui r1 depinde de cel dacă b1 > 0 respectiv
al diferenţei a1–b1 sinudoidal dacă b1 < 0

ARMA (p,q) descreşte exponenţial sau descreşte exponenţial sau


sinusoidal începând cu k=q-p sinusoidal începând cu
k=q-p

În practică dispunem doar de estimaţii pentru funcţia de autocorelaţie respectiv


autocorelaţie parţială. Prin urmare, vom căuta:
- cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie parţială
nu diferă semnificativ de zero (începând de la care ipoteza nulă H0 : c k = 0 nu se
respinge). Obţinem astfel valoarea plauzibilă pentru p ordinul modelului
autoregresiv AR(p);
- cea mai mică valoare a lui k începând de la care funcţia de autocorelaţie nu diferă
semnificativ de zero (începând de la care ipoteza nulă H0 : rk = 0 nu se respinge).
Obţinem astfel valoarea plauzibilă pentru q, ordinul modelului medie mobila
MA(q).
În principiu nu este dificil să distingem între un model AR(p) şi un model MA(q), în
schimb determinarea ordinelor p, q pentru un model mixt este un proces relativ incert.
Există şi posibilitatea selectării modelului ce minimizeaza diferite criterii construite
utilizând funcţia de verosimilitate (ex: criteriul Akaike AIC, criteriul Schwarz SC).
AR(p) este adecvat variabilelor dependente exclusiv de trecutul lor, cu pronunţat
caracter inerţial (exemplu: consumul de bunuri de strictă necesitate unde se creează
obişnuinţă). MA(q) e adecvat variabilelor „sensibile” la modificări ale variabilelor
exogene, determinând abateri accidentale de la evoluţia medie. In economie, undele
ambele efecte sunt prezente, modelele mixte s-au dovedit a fi deseori adecvate.
Observaţie. Dacă există mai multe modele ce par a fi adecvate atunci se va reţine cel
cu numar minim de coeficienţi.

3.4.2 Estimarea parametrilor modelului


Forma restrânsă a unui model ARMA(p,q) cu medie zero este:
φ( L )Yt = θ ( L )ε t

49
respectiv a unui model ARIMA(p,q):
φ( L ) (1 − L) d X t = θ ( L )ε t .
Considerăm un model AR ( p ) :
Yt = a1Yt −1 + + a p Yt −p +εt

Metoda clasică a celor mai mici pătrate ∑ε →


t
t
2
min conduce la estimatori, pentru
parametrii a1 , a 2 ,..., a p , regăsind ecuaţiile Yule-Walker; acestea sunt relaţii între
coeficienţii de autocorelaţie şi parametrii coeficienţii modelului.
Considerăm un model AR ( 2 ) cu medie zero:
Yt = a1Yt −1 + a 2Yt −2
Inmulţim această relaţie cu Yt −1 şi trecem la medie. Se obţine:
E (Yt ⋅ Yt −1 ) = a1 E (Yt −1 ⋅ Yt −1 ) + a 2 E (Yt ⋅Yt −2 )
sau
cov (Yt , Yt −1 ) = a1 cov (Yt −1 , Yt −1 ) + a 2 cov (Yt −2 , Yt −1 )
deoarece E (Yt ) = 0, ∀t . Impărţind relaţia anterioară la varianţa procesului var (Yt ) ,
rezultă:
r1 = a1 + a 2 r1 .
Analog, dacă se înmulţeşte relaţia t = a1Yt −1 + a 2Yt −2 cu Yt −2 rezultă
Y
r2 = a1 r1 + a 2
Astfel, dacă în prealabil s-au calculat estimaţii pentru coeficienţii de autocorelaţie, din
sistemul de ecuaţii
rˆ1 = a1 + a 2 rˆ1
rˆ2 = a1 rˆ1 + a 2

putem obţine estimaţii pentru coeficienţii modelului a1 , a 2 .
In mod similar, pentru un model AR(p) rezultă sistemul de ecuaţii ce fac legătura între
coeficienţii de autocorelaţie şi coeficienţii modelului, numite ecuaţiile Yule-Walker:
cov (Yt , Yt −i ) = a1 cov (Yt −1 , Yt −i ) + a 2 cov (Yt −2 , Yt −i ) +... + a P cov (Yt −p , Yt −i )
pentru i=1,2,...,p, respectiv
ri = a1 ri −1 +a 2 ri −2 +... + a p ri −p ,
i=1,2,...,p
unde r0 =1 . Dacă în prealabil s-au calculat estimaţii pentru coeficienţii de autocorelaţie
r̂1 , r̂2 , ..., r̂p , din acest sistem de ecuaţii rezultă estimaţii pentru coeficienţii
 
modelului a1 , a 2 ,..., a p .
Metoda clasică a celor mai mici pătrate ∑ε t → min respectiv ecuaţiile Yule-
2

Walker conduc la estimatori ce nu sunt eficienţi deoarece există coliniaritate între


variabilele explicative din model Yt −1 , Yt −2 ,..., Yt −p .
Dacă modelul include şi o componentă medie mobilă, fiind MA(q) sau ARMA(p,q)
φ( L )
atunci apare o neliniaritate în raport cu parametrii (având în vedere relaţia ε t = Yt
θ ( L)
.
De regulă se utilizează metoda verosimilităţii maxime; se recurge aici la utilizarea
unor olgoritmi de optimizare neliniară (ex. algoritmul Newton-Raphson), aceştia fiind
metode iterative specifice rezolvării modelelor neliniare în raport cu parametrii. Se

50
presupune că erorile din model sunt o succesiune de variabile aleatoare independente,
identic repartizate, cu medie zero şi normal distribuite. Ipoteza normalităţii erorilor
ε t ∈ N (0, σ ε2 ) este necesară pentru a putea specifica o formă funcţională a funcţiei de
verosimilitate.
Funcţia de verosimilitate asociată seriei observaţiilor Y=(Y1, …, YT ) este:

2 − T /2 − 1/ 2 1 ' −1
(2π ε ) d Ωe(ait,bi[) ] e x− σ p2 Y {[Ω (ai ,bi ) ]Y
2σ ε
Maximizarea acesteia conduce la valori pentru coeficienţii ai , bi ce asigură cea mai mare
probabilitate de apariţie a observaţiilor Y1, …, YT.

3.4.3 Teste de validitate şi respecificarea modelului


Pentru a vedea dacă modelul estimat surprinde adecvat modul de generare a datelor
(caracterul inerţial respectiv cel de asimilare a şocurilor) este utilă în prealabil o analiza
comparativă a funcţiei de autocorelaţie r̂k respectiv de autocorelaţie parţială ĉ k
estimate, pentru seria iniţială Yt respectiv pentru seria generată de model Yˆt . O
asemănare între corelogramele acestora indică faptul că model surprinde adecvat
mecanismul de generare a datelor. Deasemenea se pot analiza radacinile unitate ale
polinoamelor autoregresive respectiv medie mobilă.
Se parcurg aici două grupe de teste: teste de semnificativitate a coeficienţilor
modelului respectiv teste referitoare la reziduuri (pentru a vedea dacă sunt de tip zgomot
alb).
a) Teste privind semnificativitatea coeficienţilor
Considerăm un model staţionar ARMA(p,q) cu medie diferită de zero:
φ( L )Yt = a 0 + θ ( L )ε t
Pornind de la matricea de varianţă-covarianţă a estimatorilor obţinuţi prin metoda
verosimilităţii maxime (estimatori ce sunt convergenţi) se pot construi statistici de tip
Student, pentru a testa semnificativitatea coeficienţilor a i respectiv bi . Distribuţia
asimtotică a acestor statistici este dată de legea normală.
Se testează dacă a i (sau bi ) diferă semnificativ de zero:
H 0 : ai = 0
H 1 : ai ≠ 0

ai
utilizând statistica t =  ce urmează asimtotic legea normală N(0,1).
Var ( ai )
Pentru un nivel de semnificaţie α ≤ 5% , daca t calc ∈ [ − t tab ,+t tab ] atunci ipoteza nulă H0
nu se respinge. Prin urmare variabila corespunzătoare se eliminină din model, şi se
respecifică respectiv reestimează modelul.
Pentru teste asupra coeficienţilor se pot utiliza aici şi alte teste precum testul Wald,
sau teste de tip LM (Multiplicatorul lui Lagrange) pentru omisiunea unor variabile, teste
de stabilitate a coeficienţilor.

51
b) Teste privind reziduurile
Dacă modelul este bine specificat, atunci reziduurile din modelul estimat sunt generate de
un proces de tip zgomot alb (succesiune de variabile aleatoare independente, identic
repartizate), cu medie zero şi normal distribuit.
Autocorelarea reziduurilor. Pentru detectarea unor dependenţe în seria reziduurilor se
examinează funcţia de autocorelaţie r̂k şi de autocorelaţie parţială ĉ k a reziduurilor.
Dacă reziduurile sunt necorelate, atunci aceşti coeficienţi nu trebuie să fie semnificativ
diferiţi de zero.
rˆk
Se utilizează statistica student t = ce converge asimtotic la legea normală
Vˆar ( rˆk )
N (0,1) , cu varianţa estimatorului coeficientului de autocorelaţie estimat prin
 1
Var ( rˆk ) = . Pentru un nivel de semnificaţie α = 5% , ipoteza necorelării reziduurilor nu
T
se respinge dacă t calc ∈[ −1.96 ,1.96 ] sau echivalent rˆk ∈ −1.96 / T , 1.96 / T . [ ]
Identic decurge şi testarea semnificativităţii autocorelaţiilor parţiale ale reziduurilor.
Se utilizează aici şi teste mai puternice de autocorelaţie, fiind teste globale de
semnificativitate a coeficienţilor de autocorelaţie a reziduurilor, testându-se o ipoteza de
forma:
H 0 : r1 = r2 = ... = rM = 0
H 1 : ∃k ∈[1, M ] pentru care rk ≠ 0
Testul Ljung-Box sau statistica Q:
M rˆj2
Q = T (T + 2)∑ ∈ χ 2 ( M − p − q)
j =1 T−j
Dacă Qcalc > χ 2
tab atunci se respinge ipoteza nulă, fiind necesară respecificarea
modelului. Atunci când Q nu diferă semnificativ de zero, primele M autocorelaţii sunt
nesemnificative. In practica M se consideră arbitrar, sugerându-se valori între 10 şi 20.
Investigarea normalităţii reziduurilor. Coeficientul de asimetrie α̂3 respectiv de
boltire α̂4 şi analiza histogramei oferă o primă imagine asupra formei distribuţiei
erorilor. Coeficienţii de asimetrie respectiv boltire sunt calculaţi în baza momentelor
centrate:
µˆ 3 µˆ
αˆ 3 = 3 ;
αˆ 4 = 44
σˆ σˆ
unde µ̂j este momentul centrat de ordin j.
Pentru testarea normalităţii erorilor se recomandă, în literatura de specialitate,
utilizarea testului Jarque-Bera (1981), bazat pe coeficienţii de asimetrie şi boltire.
Valoarea calculată a acestei statistici este furnizată implicit de majoritatea softurilor odată
cu alte statistici descriptive. Dacă un eşantion de T observaţii provine dintr-o distribuţie
normală atunci coeficientul de asimetrie calculat în baza observaţiilor urmează asimptotic
legea normală N(0, 6/T) iar coeficientul boltirii legea N(3,24/T). Jarque şi Bera obţin prin
însumarea celor două variabile normale independente statistica:
1 1
JB = Tαˆ 32 + T (αˆ 4 − 3) 2 ∈ χ 2 (2) ,
6 24

52
ce urmeaza legea χ 2 ( 2) . Valoarea critică corespunzătoare nivelului de semnificaţie α se
determină din tabelul de distribuţie a legii χ 2, numărul gradelor de libertate fiind 2. Zona
critică este P ( JB > χα2 ) = α .
Investigarea heteroscedasticităţii reziduurilor. Testul multiplicatorilor lui
Lagrange pentru heteroscedasticitate de tip ARCH(p) presupune:
- estimarea reziduurilor et = ε̂t din ecuaţia ce defineşte modelul;
- estimarea regresiei auxiliare (ce fundamentează testul):
et2 = α0 + α1et2−1 + ... +α p et2− p ;
- testarea ipotezei nule în ecuaţia de regresie auxiliară:
H o : α1 = α 2 = ... = α p = 0 (nu există efect ARCH).

Dacă ipoteza nulă este adevarată, statistica LM definită prin:


LM = T ⋅ R 2 ∈ χ 2 ( p) ,
unde R 2 este coeficientul de determinaţie aferent regresiei auxiliare iar T este
lungimea seiei de timp, urmează asimptotic legea χ 2 ( p ) . Ipoteza
omoscedasticităţii (varianţă constantă în timp) se respinge dacă LM calculat este
superior valorii critice.

3.4.4. Elaborarea previziunilor

Odată elaborat şi validat, modelul ARIMA este utilizat pentru generarea de previziuni. Se
elaborează:
a) previziuni punctuale
b) intervale de previziune.

a) Previziuni punctuale

Pentru un orizont de previziune h, ataşăm momentului T+h, unde T este originea


efectuării previziunii, variabila aleatoare YT +h . O previziune punctuală, notată YˆT +h
este dată de media (sau speranţa matematică) variabilei YT +h , această medie fiind
condiţionată de istoricul variabilei.

In general
YT +h = E (YT +h | YT , YT −1 ,..., Y1 )
YT +h = aˆ 0 + aˆ1YT +h −1 + aˆ 2YT +h −2 + + aˆ p YT +h −p −bˆ1εT +h −1 −bˆ2 εT +h −2 − −bˆq εT +h −q +εT +h
ˆ
Previziunile se obţin în baza informaţiilor disponibile până la momentul T. Previziunile
punctuale se obţin pas cu pas, pentru calculul unei previziuni fiind necesare valorile
previzionate aferente perioadelor anterioare pentru termenii autoregresivi YT +h −i dar şi
pentru erorile εT +h −i . Reguli de urmat:
- termenii autoregresivi YT +h −i pentru h − i > 0 (adică YT +1 , YT +2 ... se
substituie cu previziunile obţinute la paşii anteriori;
- termenii autoregresivi YT +h −i pentru h − i < 0 se înlocuiesc cu valorile
înregistate, aici fiind cunoscuţi termenii seriei ( YT −1 , YT −2 , ...);

53
- termenii eroare εT +h −i pentru h − i > 0 (adică εT +1 , εT +2 ... ) se înlocuiesc cu
zero, (se înlocuiesc cu media acestora E ( ε T +S = 0 ) , deoarece erorile sunt de tip
zgomot alb, cu media 0; previziunile optime sunt date de media acestora).
- termenii eroare εT +h −i pentru h − i < 0 (adică εT −1 , εT −2 ... ) se înlocuiesc cu

reziduurile estimate din model (spre exemplu εt = Yt −Yˆt , pentru t < T ) .

Exemplu. Se consideră modelul ARMA(1,1):


Yt = 50 + 0,5Yt −1 + εt + 0,8εt −1
lungimea seriei fiind T=70 iar Y70 = 40 .3 iar reziduul aferent ultimei observaţii este

ε70 = −1,5 . Previziuni punctuale:
 
h = 1; Y71 = Y70 (1) = 50 + 0,5 × Y70 + 0,8 × ε 70 + ε 71

Y71 = 50 + 0,5 ×40 ,3 − 0,8 ×1,5 = 68 ,95

h=2; Y72 = 50 + 0,5 ×68 ,95 = 84 ,47 .

Dacă seria a fost diferenţiată / logaritmată în prealabil atunci se va ţine seama ca acest
aspect în elaborarea previziunii (de regulă se aplică operaţia inversă transformării). In
general este utilă scrierea concentrată a modelului, utilizând operatorul de diferenţiere L.

b) Determinarea intervalului de previziune


Eroarea de previziune: 
eT +h =YT +h −YT +h .
Presupunem că erorile modelului sunt normal distribuite ε t ∈ N ( 0, σ ε ) . Eroarea de
previziune urmează de asemenea legea normală:

(
eT +h = YT +h − YT +h ∈ N 0, V ( eT +h ) )
rezultă 
YT +h − YT +h
∈ N (0,1) .
V ( eT +h )
Din distribuţia legii normale de probabilitate, pentru o probabilitate P fixată se determină
k astfel încât:

 
 − k < YT +h − YT +h < k  = P

 V ( eT +h ) 

[
 
rezultă intervalul de previziune: YT +h − k V ( eT +h ) ; YT +h + k V ( eT +h )]
Calculul varianţei erorii de preziune V ( eT +h ) necesită punerea modelului sub
forma mediei mobile cu un numar infinir de termeni (orice model ARMA poate fi pus în
această formă):

Yt = ε t + c1ε t −1 + c 2ε t −2 + ...
sau
Yt = C ( L )ε t
unde C ( L) = 1 + c1 L + c 2 L2 + ... este polinomul coeficienţilor.

54
θ ( L)
Din forma redusă a modelui ARMA φ( L )Yt = θ ( L )ε t rezultă Yt =
ε t , astfel
φ( L )
coeficienţii polinomului C se obţine egalând coeficienţii termenilor de forma Lj , j=1,2,…
în egalitatea φ( L)C ( L ) =θ( L) .
Utilizând forma medie mobilă:
Yt = ε t + c1ε t −1 + c 2 ε t − 2 + ...

YT +h = c h εT +c h +1εT −1 +...

rezultă eT +h = YT +h −YT +h = εt + c1εt −1 + c 2 εt −2 +... − (c h εT + c h +1εT −1 +...)

 h −1 
V ( eT + h ) = σ ε2 1 + ∑ c 2j  .
 j =1 
Pentru dispersia erorii de previziune σε se utilizează estimaţia sa σˆ ε2 .
2

Observaţie. Calitatea modelului de a genera previziuni adecvate poate fi verificată


pe baza unor previziuni „de probă”, utilizând ultimele observaţii disponibile ca şi
secvenţă „martor” de observaţii. În etapa elaborării modelului se are în vedere seria
cronologică ce nu conţine această secvenţă martor şi se măsoară acurateţea previziunii
printr-un indicator sintetic de tip MSE, MAPE sau RMSE (ce trebuie să fie minim).

3.5. Alte extinderi ale modelelor ARIMA

3.5.1. Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere SARIMA

Notăm prin s perioada componentei sezoniere. Dacă seria este nestaţionară relativ la
componenta sezonieră (amplitudinea oscilaţiilor creşte sau scade în timp) atunci se
determină diferenţele sezoniere de ordin 1:
X t = Yt −Yt −s
In general se norează cu D numărul de diferenţieri sezoniere necesare pentru a
staţionaliza componenta sezonieră (de regulă D=1).
Etapa de identificare:
1. se identifică o combinaţie de valori plauzibile pentru d şi D care
staţionalizează seria;
2. din graficele funcţiilor de autocorelaţie respectiv autocorelaţie parţială a
seriei diferenţiate (care este staţionară) se identifică valori plauzibile
pentru gradele polinomului autoregresiv p, polinomului medie mobilă q
respectiv pentru gradele polinomului autoregresiv sezonier P şi a
polinomului medie mobilă sezonier Q:
φ( Ls ) = 1 − a1 Ls − a 2 L2 s −  − a P LPs iar θ ( Ls ) = 1 − b1 L2 s − − bq LQs .
Notaţia generală SARIMA(p,d,q)(P,D,Q). Ordinele polinoamelor
sezoniere P, Q sunt identificate în mod similar cu p, q
analizând funtiile de autocorelaţie rk respectiv de autocorelaţie parţială c k
pentru k=s, 2s, ....

3.5.2. Modele de tip ARCH (autoregessive conditional heteroskedastic)

55
In abordarea tradiţională de tip Box-Jenkins previziunile sunt bazate pe media
condiţionată a variabilei E (Yt | Yt −1 , Yt −2 ,...) . Abordarea de tip ARCH ia în
considerare, în elaborarea previziunilor, şi informaţiile conţinute în varianţa condiţionată
a procesului (momentul condiţionat de ordinul doi). Este specific seriilor cu varianţă
variabilă în timp (nestaţionare relativ la varianţă). Erorile nu au aceeaşi varianţă (adică nu
verifică condiţia de homoscedasticitate) intervale de timp cu erori de preziune mari (în
perioade de instabilitate economicâ) fiind urmate de intervale cu valori mici. Engle
(1982) a introdus pentru prima dată acest tip de modele, considerând că varianţa erorii
depinde de termeni de tipul Yt −i şi εt −i .
2

Avem aici două tipuri de ecuaţii: ecuaţia mediei condiţionate ce poate include şi
variabile exogene respectiv ecuaţia varianţei condiţionate.
Analiza evoluţiei pe termen lung a variabilelor financiare sau economice, relevă
deseori faptul ca varianţa acestora variază în timp. Modelele de tip ARCH sunt o clasă de
modele populare în domeniul financiar (evoluţia ratei inflaţiei, ratei dobânzii, ratei rentabilităţii
activelor ş.a.). Volatilitatea ridicată apare deseori în perioade cu turbulenţe politice sau
economice sau ca răspuns la anumite evenimente punctuale.
Dedependenţa de timp a varianţei empirice în seria ratei rentabilităţii acţiunilor a
fost observată pentru prima dată de Kendall (1953), seria de timp disponibilă atunci fiind
împărţită în două subeşantioane de date, în scopul analizei omogenităţii varianţei în timp.
Autorul observa: “este o situaţie neobişnuită pentru o serie de timp: media rămâne
constantă dar varianţa pare a creşte în timp”. În consecinţă spre exemplu în modelul de
tip mers aleator, pentru logaritmul indicelui Pt preţului acţiunilor p t = ln Pt , erorile,
egale cu ratele rentabilităţii ( rt ≡ ∆pt ) nu au mai fost considerate identic distribuite:
p t = p t −1 + rt , rt ∈ N (o, σ t2 )

Primul pas în direcţia modelării varianţei condiţionate a fost făcut de Engle în


1982, care a propus un model de tip ARCH, specificat prin intermediul primelor două
momente condiţionate:
E ( rt / Rtp−1 ) = g t ( rt −1 , rt −2 ,... rt −p ) ,

v r /Ra ) = E{r − ( [rE / R ) / R] }= h (r ,r , r . ) . .


p p2 p
t t− 1 t t / t− 1 t− 1 t t− 1 t− 2 t− p
,

unde Rt −1 ={rt −1 , rt −2 ,... rt −p } .


p

Iniţial, varianţa condiţionată a fost exprimată ca o medie ponderată a pătratului


erorilor ε t = rt − E (rt / Rtp−1 ) , adică în funcţie de şocurile trecute, aceasta fiind forma
ARCH(p):
p
var( rt / Rtp−1 ) = ω + ∑α i ε t2−i , a 0 > 0, ai ≥ 0 .
i −1

56
Studiile empirice au arătat însă că o reprezentare adecvată necesită un p destul de
mare. Pentru evitarea numărului mare de parametri necesar a fi estimaţi, Bollerslev
(1986) a propus o formă mixtă analoagă cu cea din procesele autregresive – medie mobilă
(notaţia consacrată GARCH):
p q
var( rt / Rtp−1 ) = ht = ω + ∑α i ε t2−i + ∑ β i ht2−i .
i −1 i −1

Modelele GARCH găsesc suport empiric în domeniul financiar, specificarea


pentru cel mai simplu model din această clasă GARCH(1,1) sugerând intuitiv următorul
comportament:
- dacă rentabilitatea activului a fost mult mai mare sau mult mai mică decât cea
aşteptată atunci şi varianţa estimată pentru următoarea perioadă va fi mai mare,
incertitudinea privind nivelul ratei în următoarea perioadă crescând (termenii medie
mobilă εt2−i );
- de asemenea deviaţiile mari ale rentabilităţii tind a fi urmate de abateri mari
(termenii autoregresivi ht2−i ).
O serie de alte forme sunt propuse în literatură pentru modelarea varianţei, cele
mai uzuale includ şi alte variabile explicative în ecuaţia varianţei condiţionate sau impun
anumite restricţii privind parametrii din această ecuaţie.
Un proces heteroscedastic presupune specificarea unui model pentru media
condiţionată ca o funcţie de variabile exogene şi termenul eroare εt ∈ N (0, σt2 ) , respectiv
a unui model pentru varianţa erorii. Forma generală a unei ecuaţii de tip GARCH(p,q)
pentru varianţa erorii este:
p q
σ t2 = ω + ∑α i ε t2−i + ∑ β j σ t2− j
i −1 j −1

unde p este ordinul părţii medie mobile ARCH (unde intervin pătratele reziduurilor din
ecuaţia mediei) iar q ordinul parţii autoregresive GARCH. Varianţa condiţionată este
varianţa erorii εt , din ecuaţia mediei, condiţionată de informaţiile disponibile:
σt2 = Var (εt / εt −1 ,..., εt −p )
= E (εt2 / εt −1 ,..., εt −p )

Astfel, este necesar aici a se specifica două grupe de ecuaţii: ecuaţia mediei
condiţionate respectiv ecuaţia varianţei condiţionate. Exemplele clasice sunt modelul
ARMA(p,q) cu erori heteroscedastice GARCH:
 y t ∈ ARMA( p, q )
 2
σ t ∈ GARCH ( p' , q ' )
sau regresia cu erori heteroscedastice GARCH (scriere matricială):
 y = Xb + ε
 2
σ t ∈ GARCH ( p' , q ' )
În specificarea unei forme GARCH pentru varianţă sunt utile instrumentele
utilizate pentru identificarea ordinului părţii autoregresive p respectiv medie mobilă q

57
relativ la modelele ARMA(p,q). Variabila pentru care dorim specificarea unui model de
2
această formă este în acest context pătratul reziduurilor et .

3.6. Regresii cu serii de timp


Specificarea dinamică a unui model include specificarea efectului întârziat a variabilelor
explicative (strucura dinamică a părţii sistematice din model) dar şi specificarea dinamică
a termenului eroare (partea nesistemaţică din model). Considerăm un model liniar clasic
de regresie, cu o singură ecuaţie:
Yt = X t β + u t t=1,2, ...,T
unde X t este vectorul celor K variabile explicative (de dimensiune 1xK), iar βeste
vectorul coeficienţilor modelului (de dimensiune Kx1) .
Atunci când erorile din model sunt corelate, fiind generate spre exemplu de un proces
ARMA, estimatorii obţinuţi pentru coeficienţi prin metoda celor mai mici pătrate
respectiv prin metoda verosimilităţii maxime rămân nedeplasaţi dar sunt ineficienţi. De
asemenea estimatorul matricii de varianţă-covarianţă a estimatorului β̂ este deplasat,
astfel toate testele bazate pe matricea de varianţă-covarianţă estimată devin ineficienţi
2
(ex. testul t, testul F, testele bazate pe R ....). Un model greşit speficat conduce la
previziuni inadecvate, iar pentru generarea unor previziuni eficiente este necesar a se ţine
seama şi de informaţiile conţinute în reziduuri û (faptul că reziduurile precedente ajută la
previziunea reziduurilor curente). De asemenea dacă apar variabile de tip autoregresiv
Yt −i ca şi variabile explicative atunci estimatorii obţinuţi prin metoda celor mai mici
pătrate sunt deplasaţi. Printre cauzele autocorelării erorilor se află şi specificarea greşită a
dinamicii părţii sistematice din model.
Pentru detectarea autocorelaţiei erorilor sunt utile testul Durbin-Watson, corelograma
rezidurilor, testul Ljung-Box. Un alt test cese bucură de popularitate este testul LM.
Testul LM pentru erori de tipul AR(p) and MA(q) (testul Breusch-Godfrey).
Considerăm un model cu erori corelate de tip AR(p):
Yt = X t β + u t
u t = a1u t −1 + + a p u t − p + εt
unde εt este un proces de tip zgomot alb. Ipoteza nula (nu există autocorelaţie până la
ordnul p) respectiv alternativa sunt:
H 0 : a1 = a 2 = ... = a p = 0
H 1 : ∃i : ai ≠ 0
Seria reziduurilor uˆ t = Yt − X t β̂ este obţinută în urma estimării ecuaţiei de regresie, prin
metoda celor mai mici pătrate. Utilizând aceste reziduuri se estimează regresia auxiliară:
uˆ t = X t γ + δ1uˆ t −1 + + δ p uˆ t − p + εt t=p+1,...,T
Atunci când ipoteza nulă este adevărată, statistica:
LM = T ⋅ R 2 ∈ χ 2 ( p)
urmează legea χ2 ( p ) , unde R 2 este coeficientul de determinaţie din regresia auxiliară.
Ipoteza nulă se respinge atunci când LM depăşeşte valoarea critică, pentru un anumit
nivel de semnificaţie R 2 . Testul LM rămâne acelaşi şi atunci când erorile sunt de tip
MA(q).
Atunci când erorile din modelul de regresie sunt corelate, este necesară respecificarea
modelului, soluţiile clasice fiind respecificarea variabilelor explicative sau a formei

58
modelului dar şi respecificarea părţii nesistematice, adică a erorii. Această ultimă soluţie
se are în vedere în cele ce urmează. Există implementate în softurile statistice proceduri
de estimare adecvate pentru estimarea unor modele de regresie cu erori de tip ARMA.
Metoda celor mai mici pătrate în două etape notată TSLS în EViews este adecvată
pentru estimarea unui model de regresie cu erori autocorelate sau a unor modele în care
există corelaţii între variabilele explicative şi termenul eroare. Ca şi variabile explicative
pot figura aici şi termeni de tip autoregresiv pentru variabila dependentă. Această metodă
se bazează pe metoda variabilelor instrumentale; se caută aici alte variabile explicative
care să fie corelate cu variabilele explicative iniţiale dar necorelate cu eroarea. Atunci
când se estimează modele cu erori ARMA in Eviews sunt incluse automat ca şi variabile
instrumentale termenii de tip autoregresiv pentru variabila dependentă respectiv pentru
variabilele independente, corespunzători ordinului speficat pentru eroare.

Capitolul 4. Modele VAR şi modele VECM

4.1. Teste de nestaţionalitate (teste de tip „unit roots”)

Există două tipuri de procese (serii) nestaţionare:


a) serii nestaţionare dar staţionare relativ la o tendinţă deterministă TS („time
stationary”). Exemplu: o serie ce fluctuează staţionar în jurul unei tendinţe deterministe
liniare:
Yt = a + bt + ε t
unde εt este un proces staţionar;

59
b) serii nestaţionare generate de un proces pentru care polinomul autoregresiv din
reprezentarea autoregresivă AR(p) are rădăcini unitare (are radacini unitate „unit root”,
sau pe cercul unitate). Spunem că seria este staţionară prin diferenţiere DS („differency
stationary”) sau că are tendinţă stochastică (seria „hoinăreşte”); seria are radacină
unitate. Exemplul tipic aici este mersul aleator Yt = Yt −1 + εt . Polinomul in L asociat
părţii autoregresive φ( L ) din modelulul AR(p):
φ( L )Yt = ε t unde φ( L ) =1 − L
(1 − L )Yt = εt
1− x = 0 ⇒ x =1
il are pe unu ca şi rădăcină. Multe serii din economie au un comportament de mers
aleator, Yt este nestaţionară dar ∆Yt = εt devine stationară. Dacă este necesar a se
diferenţia seria de d ori până devine staţionară, Z t = ∆d Yt = (1 − L) d Yt fiind staţionară,
polinomul autoreresiv îl are pe 1 ca şi rădăcină multipla de ordin d si spunem că seria este
integrată de ordin d, notând I(d).

Teste de tip Dickey-Fuller (ADF)


Testele dezvoltate în continuare sunt destinate detectării nestaţionalităţii de tip DF,
adică a detectării rădăcinii unitate în reprezentarea procesului. Testele Dickey-Fuller sunt
utile:
– pentru a testa dacă o serie este staţionară (relativ la medie sau relativ la o tendintă
deterministă);
– pentru a identifica natura tendinţei seriei (seria poate avea tendintă deterministă
sau/şi tendintă stochastică) respectiv pentru a determina ordinul de integrare.
Dacă Yt are o radăcină unitate atunci în ecuaţia de regresie:
Yt = a1Yt −1 + εt

ne aşteptăm ca a1 să fie aproape de 1, sau echivalent ne aşteptăm ca α = a1 − 1 să fie


aproape de zero în regresia:
∆Yt = αYt −1 + εt (V1)
(obţinută scăzând Yt −1 din ambii membri, în ecuaţia anterioară). Pornind de la această
idee, iniţial testul Dickey-Fuller, (pentru detectarea unei rădăcini unitate) a fost dezvoltat
pentru testarea ipotezei:
H 0 : a1 = 1
H1 : a1 <1
în modelul autoregresiv de ordinul unu:
Yt = a1Yt −1 + εt
unde erorile εt sunt presupuse independente şi identic distribuite, cu medie 0 şi varianţă
σε2 . Astfel, testul facilitează alegerea între un proces de tip mers aleator (proces
nestaţionar) şi un proces autoregresiv de ordinul unu (proces staţionar). Dacă ipoteza nulă
este adevarată seria conţine o rădăcină unitate, în caz contrar seria fiind staţionară de tip

60
AR(1). Varianta a1 >1 corespunde unor procese explozive, ce nu-şi găsesc
aplicabilitate.
Ipoteza nulă din testul Dickey-Fuller este o ipoteză privind semnificativitatea
coeficientului termenului Yt −1 :
H0 : α = 0
H1 : α < 0
în ecuaţia de regresie ∆Yt = αYt −1 + εt , unde α = a1 − 1 . “Raportul Student”
α ˆ ) aferent coeficientului α , utilizat în mod obişnuit pentru testarea unei
ˆ / var( α
ipoteze relativ la un coeficient de regresie, nu urmează legea Student. Distribuţia
asimptotică a acestei variabile a fost studiată de către Dickey (1975) şi Fuller (1976), iar
mai recent MacKinnon (1991) obţine prin simulare valori critice mai precise. Pentru un
nivel de semnificaţie de 5% spre exemplu, valoarea critică rezultată este –1.95:
P( DF < −1.95 ) = 0.05 .
Menţionăm că valoarea critică, pentru acest nivel de semnificaţie, este de –1.64 în cazul
legii normale P ( z < −1.64 ) = 0.05 , astfel că utilizarea testului z sau t în testarea
ipotezei H 0 conduce prea frecvent la respingerea ipotezei nule.
Distribuţia asimptotică a statisticii t de tip Student diferă după cum se include sau
nu o constantă în regresie. In cazul prezenţei unei constante în forma autoregresivă:
Yt = a 0 + a1Yt −1 + ε t
testul privind semnificativitatea coeficientului a1 se realizează în ecuaţie
∆Yt = a 0 + αYt −1 + ε t (V2)
Deasemenea o altă variantă interesantă a testului faciliteaza alegerea între un
process nestaţionar cu tendinţă stochastică (proces integrat) şi unul cu tendinţă
deterministă. Aceasta se realizează prin testarea ipotezei de rădăcină unitate:
H 0 : a1 =1
H 1 : a1 <1
pentru un proces de tipul:
Yt = a + bt + a1Yt −1 + εt .
Testarea ipotezei anterioare este echivalentă şi aici cu o ipoteză privind semnificativitatea
coeficientului lui Yt −1 în ecuaţia de regresie:
∆Yt = a + bt + αYt −1 + ε t (V3)
Fuller (1976) a studiat comportamentul asimptotic al statisticii t şi în acest caz obţinând,
prin simulare, valorile critice corespunzătoare acestei variante a testului. Spre exemplu la
un nivel de semnificaţie de 5% valoarea critică obţinută este de –3.41:
P ( DF < −3.41 ) = 0.05 .
Acest test facilitează selecţia între două procese nestaţionare de tipul:
Yt = a + bt + Yt −1 + ε t , respectiv
Yt = a + bt + a1Yt −1 + εt , cu a1 <1 .
Procesul generat de prima ecuaţie conţine o rădăcină unitate ( ρ =1) , seria are tendinţă
stochastică. Cel de-al doilea proces aleator, pentru care a1 <1 , nu are rădăcină unitate
şi este obţinut prin însumarea dintre o tendinţă deterministă liniară şi un proces staţionar
de tip autoregresiv AR(1); seria este astfel staţionară în jurul unei tendinţe deterministe
liniare.

61
Distribuţiile asimtotice anterioare sunt valabile în ipoteza în care εt este de tip zgomot
alb. Altfel este necesară o abordare ce ţine seama şi de autocorelaţiile reziduurilor din
ecuaţia de regresie în care se testează semnificativitatea coeficientului lui Yt −1 .Un
proces AR(1) cu erori autocorelate de ordin p-1 poate fi pus într-o reprezentare AR(p) cu
erori de tip zgomot alb. Se ţine seama apoi de reprezentarea de tip Sims-Stock-Watson
(1990) a unui model AR(p), scrisă utilizând diferenţele de ordinul unu, din care se obţine
forma generală a ecuaţiei de regresie utilizate în forma generală a testului.
În forma generală, testul Dickey-Fuller îmbunătăţit ADF (Augmented Dickey-Fuller)
se efectuează relativ la coeficientul termenului Yt −1 :
H0 : α = 0
H1 : α < 0
în ecuaţia de regresie următoare:
p −1
∆Yt = a + bt + αYt −1 + ∑ βi ∆Yt −i + ε t .
i =1

Distribuţia asimptotică a raportului t asociat coeficientului α este aceeaşi cu cea din


cazul AR(1), astfel că se utilizează aceleaşi valori critice. La aplicarea testului, p este
selectat astfel încât reziduurile din ecuaţia de regresie să rămână necorelate. Au fost
dezvoltate trei variante ale testului DF, aferente respectiv regresiilor:
p −1
∆Yt = αYt −1 + ∑βi ∆Yt −i + ε t (V1)
i =1
p −1
∆Yt = a + αYt −1 + ∑ βi ∆Yt −i + ε t (V2)
i =1
p −1
∆Yt = a + bt + αYt −1 + ∑ βi ∆Yt −i + ε t (V3)
i =1

Distribuţiile asimtotice şi deci valorile critice sunt specifice fiecărei variante. Valorile
critice nu depind însă de numărul de întărzieri p.
Decizia asupra ipotezei nule, un anumit nivel de semnificaţie:

tcalc < t*tab ⇒ H0 se respinge ⇒ seria nu are rădăcină unitate (este


staţionară relativ la medie în V1 şi V2, sau staţionară
relativ la o tendinţă deterministă în varuianta V3)

tcalc > t*tab ⇒ H0 se acceptă ⇒ seria are o rădăcină unitate (este


nestaţionară, cu tendinţă stochastică).
Testul ADF este de test de nestaţionalitate stochastică (dacă H0 este adevărată, seria este
nestaţionară de tip DF).
Alegerea între cele trei variante rămâne totuşi o problemă. O soluţie logică pare a fi
efectuarea testului în varianta generală (V3), dar includerea unor regresori cu coeficienţi
nesemnificativi reduce puterea testului; astfel, testul poate indica prezenţa unei rădăcini
unitate când în realitate seria nu o conţine. Principiul general constă în a alege o variantă
conformă cu datele:
- dacă seria prezintă o tendinţă (deterministă sau stochastică) se aplică varianta
generală (V3);

62
- dacă seria nu are o tendinţă vizibilă şi are medie diferită de zero, se aplică varianta
(V2) respectiv
- dacă seria fluctuează în jurul lui zero se aplica testul în varianta (V1).
După aplicarea testului este indicat a se examina şi semnificativitatea coeficienţilor de
regresie (din ecuaţia de regresie aferentă testului aplicat) în principal atunci când nu
suntem siguri asupra variantei adecvate respectiv asupra valorii lui p. Dacă se consideră
necesar, se poate aplica din nou testul cu o altă specificare pentru ecuaţia de regresie.
Pentru alegerea odinului p se poate utiliza de asemenea criteriile de informaţie (AIC,
SC,...)
Dacă ipoteza nulă nu este respinsă atunci se aplica în continuare testul DF pentru
detectarea rădăcinii unitate în diferenţele de ordin unu. Pentru determinarea ordinului de
integrare se aplică testul succesiv pentru datele iniţiale, diferenţele de ordin unu şi
eventual doi; seriile din domeniul economic necesită de regulă o singură diferenţiere.
Dacă pentru datele iniţiale H0 se acceptă, iar pentru datele diferenţiate ∆Yt ipoteza nulă
H0 se respinge ⇒ Yt e nestaţionar dar diferenţele de ordin 1 sunt staţionare ⇒ Yt este
integrată de ordin 1 sau Yt ∈I(1). Dacă ipoteza nulă H0 se acceptă atât pentru datele
iniţiale Yt cât şi pentru cele difererenţiate ∆Yt dar se respenge pentru datele de două ori
dioferenţiate ∆ Yt ⇒ seria este integrată de ordinul doi sau Yt ∈I( 2).
2

Tendinţă deterministă versus tendinţă stochastică. O serie poate avea tendintă


deterministă sau/şi tendinţă stochastică; o serie ce are atât tendinţă deterministă cât şi
tendinţă stochastică se comportă ca şi o serie cu tendinţă stochastică. Graficul de mai jos
redă comparativ două serii de timp nestaţionare cu şi respectiv fără rădăcină unitate
(prima serie are atât tendinţă deterministă cât şi tendinţă stochastică):
Yt = 10 + 0.1t + u t , unde u t = u t −1 + ε t , şi
Yt = 10 + 0.1t + u t , unde u t = 0.9u t −1 + εt
obţinute prin simulare. Pentru eroarea εt ∈ N (0,1) au fost generate 200 de valori
aleatoare. În cazul seriei staţionare relativ la o tendinţă deterministă valorile fluctuează
staţionar în jurul tendinţei, în timp ce seria cu rădăcină unitate se îndepărtează de la
tendinţa deterministă iar amplitudinea fluctuaţiilor creşte sau descreşte în timp.
Observaţie. Varianţa erorii în cazul seriei staţionare relativ la tendinţa deterministă liniară
rămâne constantă în timp.

63
Diferenţele de ordin unu pentru ambele tipuri de procese:
Yt = a + bt + u t , u t = u t −1 + ε t ;
Yt = a + bt + u t , u t = ρu t −1 + εt , cu ρ <1 ,
sunt staţionare:
∆Yt = b + ε t , respectiv
∆Yt = b + ∆u t .
Prin urmare, prin analiza seriilor diferenţiate nu se poate face distincţie între cele două
tipuri de nestaţionalitate. Există o diferenţă esenţială între cele două serii de timp:
- dacă seria conţine rădăcini unitate atunci şocurile ( εt ) asupra seriei sunt permanente,
deoarece (Johnston şi DiNardo, 1994): u t +s = ut −1 +εt . Dacă o serie macroeconomică
este de tip DS atunci impactul şocurilor conjuncturale are un efect permanent asupra
nivelului seriei. Originea nestaţionalităţii unui mers aleator constă în acumularea de
şocuri aleatoare, deoarece: Yt = ε t + ε t −1 + ε t −2 + ... + ε1 + Y0 ;
- în cazul seriilor staţionare relativ la tendinţă influenţa şocurilor asupra următoarelor
abateri de la tendinţa deterministă se diminuează în timp: u t +s = u t −1 + ρ s ε t .

Pentru a detectarea naturii tendinţei unei serii nestaţionare se poate utiliza varianta V3
a testului ADF:
p −1
∆Yt = a + bt + αYt −1 + ∑ βi ∆Yt −i + ε t (V3)
i =1

H0 : α = 0
H1 : α < 0
Dacă H0 se acceptă ⇒ seria are rădăcină unitate ⇒ seria are tendinţa stochastică. Dacă
H0 se respinge seria nu are rădăcină unitate, prin urmare nu are tendinţă stochastică.
Pentru a detecta prezenţă unei tendinţei deterministe se va testa semnificativitatea
coeficientului de regresie b în ecuaţia de regresie aferentă testului aplicat V3, utilizând
testul Student clasic. De asemenea dacă se estimează tendinţa deterministă iar reziduul
este staţionar atunci seria este stationară relativ la tendinţă.

64
Existenţa sau nu a unei rădăcini unitate într-o serie nestaţionară determină natura
tendinţei. Cunoaşterea naturii tendinţei unei variabile nestaţionare este importantă în
previziune respectiv în modelarea econometrică. Staţionalitatea/nestaţionalitatea
respectiv detectarea naturii nestaţionalităţii determină tipul de modelare şi proprietăţile
asimtotice ale metodelor econometrice de estimare.

4.2. Serii cointegrate. Metodologia Engle-Granger (cointegrare într-o singură


ecuaţie)

Noţiunea de cointegrare este strâns legată de cea de „regresii false” cu serii de timp.
Atunci când se estimează regresii cu serii de timp în economie deseori din R2 este mare
(R → 1) iar statistica Durbin-Watson este mică DW → 0 (erorile sunt corelate). In
general, R → 1, DWcalc → 0 şi R2 > DWcalc poate fi un semnal ca regresia este falsă;
dependenţa este exagerată iar estimatorii sunt suspecţi. Aceasta se întâmplă deoarece
variabilele din economie sunt deseori nestaţionare şi se comportă ca şi un proces de tip
mers aleator (au rădăcină unitate). Dacă două serii sunt I(1) atunci deseori se respinge
ipoteza inexistenţei unei relaţii între ele chiar când aceasta un există. Generând două serii
de tip mers aleator independente şi estimând ecuaţia de regresie dintre ele, Engle şi
ranger au observat că ipoteza conform căreia panta dreptei de regresie este
nesemnificativă s-a respins în 76% din cazuri, utilizând testul t; au sugerat ca regresia să
fie estimată pentru seriile diferenţiate.
Pentru a exista o relaţie pe termen lung între variabile, acestea trebuie să fie
cointegrate. Un test de cointegrare poate fi aplicat, pentru a se evita regresiile false. Un
este indicat a se estima regresii cu serii de timp, excepţie atunci când seriile sunt
cointegrate. Engle şi Granger (1987) au observat faptul că o combinaţie liniară a două sau
mai multe serii nestaţionare poate fi staţionară.
Definiţie (Engle and Granger, 1987). Dacă două serii Yt , X t sunt integrate de acelaşi
ordin I(d) şi există β astfel încât reziduul din regresie ε t = Yt − βX t are un ordin mai
mic de integrare I(d-b) atunci, conform definitiei Engle-Granger (1987), cele doua serii
sunt cointegrate de ordin CI(d,b).
Astfel, dacă Yt , X t sunt I(1) şi εt ∈ I (0) atunci cele două serii sunt cointegrate de
ordin CI(1,1). In acest caz, pentru a estima relaţia pe termen lung dintre variabile este
suficient a se estima modelul de regresie static Yt = βX t + ε t , estimatorii MMP fiind
consistenţi atunci când lungimea seriei este mare. Ne vor referi, în continuare, doar la
acest caz.

Două serii nestaţionare Y şi X, integrate de ordinul 1, adică I(1), pentru care există o
combinaţie liniară, notată cu εt :
ε t = Yt − a0 − a1 X t

ce este staţionară, ε t ∈ I(0) se numesc se numesc serii cointegrate (de ordinul 1).
Vectorul (1, −a1 ) se numeşte vector de cointegrare. Astfel diferenţa Yt − a1 X t rămâne
stabilă în jurul unei medii fixe a0 (media lui εt este zero). Dacă constanta este zero,
relaţia ce le menţine legate pe termen lung este una de proporţionalitate Yt = a1 X t .

65
Variabilele rămân legate pe termen lung prin relaţia de echilibru Yt = a 0 + a1 X t iar
deviaţiile de la aceasta au loc doar pe termen scurt; această relaţie de echilibru poate fi
interpretată ca o relaţie echilibru pe termen lung, „deranjată” doar de şocuri aleatoare ( ε
) cu efect pe termen scurt. Relaţia Yt = a 0 + a1 X t + ε t se numeşte relaţie de cointegrare
între cele două variabile. Relatia de echilibru pe termen lung este înţeleasă în sensul de
stabilitate a relaţiei de dependentă.
Două serii cointegrate au o tendinţă stochastică comună (tendinţe de evoluţie
similare), adică „hoinăresc” împreună (analogie în evoluţie). Relaţia de dependenţă dintre
ele este stabilă.
Exemple. Posibile relaţii de cointegrare sugerate de teoria economică, variabilele fiind
de regulă considerate în formă logaritmată:
- între venit PIB şi consum C. Raportul C/PIB este constant pe termen lung, astfel
ln(C)-ln(PIB) este staţionar iar ln(C) şi ln(PIB) sunt cointegrate. In mod similar PIB şi
învestiţiile;
- cererea de monedă, preţuri, venit
- între cursul valutar, preţurile domestice respectiv preţurile din ţara străină, cursul
real având comportament staţionar (conform teoriei parităţii de cumpărare);
- cusul diferitelor acţiuni;
- rentabilitatea activelor şi rata inflaţiei, diferenţa acestora adică rata reală a
rentabilităţii, ce are comportament staţionar;
- ratele dobânzii pentru diferite maturităţi, diferenţa faţă de rata activului fără risc
(rata pe termen scurt) reflectând prima de risc a investitorilor;
- logaritmul indicelui preţului acţiunilor respectiv al dividendelor diferenţa
reprezentând logaritmul randamentului ln Pt − ln Dt ∈ I (0) .
- logaritmul indicelui preţurilor ln Qt respectiv al salariului ln S t , diferenţa
ln S t − ln Qt ∈ I (0) reprezentând logaritmul indicelui salariului real;
- cursurile acţiunilor (de regulă în formă logaritmată) etc.
Aceste posibile relaţii de cointegrare trebuie confirmate şi de datele empirice.
Abordări în teoria cointegrării:
- abordari bazate pe o singură ecuaţie, cea mai cunoscută fiind metoda în două
etape propusă de Engle şi Granger;
- abordarea multivariată de tip VAR respectiv VECM; în acest caz ne asteptăm la
existenţa mai multor relaţii de cointegrare. În cazul general dat fiind un grup de mai
multe variabile nestaţionare suntem interesaţi dacă acestea sunt cointegrate, şi dacă sunt,
care este relaţia de echilibru pe termen lung dintre ele. Pentru analiza cointegrării între
mai multe procese nestaţionare, cu rădăcină unitate, se apelează la metodologia
dezvoltată de Johansen şi Juseliu (1990), implementată în softurile de statistică.

Metodologia Engle-Granger :
Etapa 1. Testarea existenţei unei relaţii de cointegrare între două variabile:
a) se testează dacă ambele variabile sunt integrate Yt , X t ∈I(1) de ordin 1, utilizând
teste de tip unit root, precum testul ADF
b) se estimează regresia liniară Yt = a 0 + a 1X t + ε t prin MMP pentru a obţine o
estimatie a relaţiei (vectorului) de cointegrare. Interesant este că estimatorii obţinuţi
 
pentru a 0 şi a 1 sunt superconsistenţi (în acest caz, când ambele variabile sunt I(1)),

66
chiar dacă erorile sunt corelate. Erorile standard nu sunt însă de încredere, astfel nu se pot
realiza inferenţe privind modelul pe termen lung. Dacă există o relaţie de cointegrare
atunci MMP o va depista, iar dacă nu există atunci regresia este falsă. Se extrag apoi
  
estimaţiile pentru reziduuri ε t = Yt − a 0 − a 1X t ;

c) se testează dacă reziduurile εt sunt staţionare. Dacă ipoteza existenţei rădăcinii
unitate în seria reziduurilor este respinsă, atunci între cele două procese există relaţia de
cointegrare. Dacă reziduurile sunt staţionare cele două serii sunt cointegrate, relaţia de
 
cointegrare fiind cea estimată Yt = a 0 + a 1X t + ε t iar relaţia de echilibru pe termen lung
 
este Yt = a 0 + a 1X t .
După estimarea coeficienţilor de regresie şi prin urmare a reziduurilor ε̂t , se aplică
testul ADF au un alt test de tip unit root pentru detectarea nestaţionalităţii reziduurilor
(detectarea rădăcinii unitate). Valorile critice însă nu sunt cele clasice deoarece seria
reziduurilor a rezultat prin estimare. Valorile adecvate testului ADF de cointegrare au
fost obţinute de către MacKinnon de asemenea prin simulare şi pot fi găsite în Johnston şi
DiNardo (1994).
Exemple de valori critice pentru ADF pentru cointegrare, α = 5%
T – lunginea seriei ADF (p=4)
50 -3,29
100 -3,17
200 -3,25

Dacă tcalc < t tab ⇒ H0 se respinge ⇒ εt sunt staţionare ⇒ Xt, Yt cointegrate (există
*

o relaţie de dependenţă stabilă între ele numită relaţie de cointegrare.


De asemenea se poate utiliza testul Durbin-Watson pentru cointegrare (CRDW)
propus de Bhargava si Sargan. Se calculeaza statistica Durbin-Watson iar daca dcalc >
*
d tab ⇒ Xt, Yt sunt cointegrate; valorile tabelate sunt: 0.386 pentru α =5%, 0.322
pentru α =1%. Observatie: d=2(1- r1 ), r1 fiind coeficientul de autocorelatie a
reziduurilor de ordinul 1.

Etapa 2. Elaborarea unui model de tip ECM


Două serii cu tendinţe stochastice ce sunt cointegrate evoluează împreună în timp,
acest echilibru pe termen lung fiind "deranjat" doar de şocuri aleatoare cu efect pe termen
scurt. Dacă există, relaţiile de echilibru pe termen lung dintre variabile este necesar a fi
încoporate în modelul dinamic, destinat previziunii. Astfel, ne asigurăm că modelul va
genera, atunci când este utilizat în simulare, pentru variabilele cointegrate serii ce vor
evolua împreună. Dacă se ignoră existenţa cointegrării şi se modelează diferenţele de
ordin întâi ca şi variabile staţionare, atunci cele două serii vor evolua independent, fiecare
după tendinţa sa stochastică, şi prin urmare neconform cu datele istorice.
Relaţia pe termen scurt dintre două variabile cointegrate, cu relaţia de cointegrare
Yt = a 0 + a1 X t + ε t , poate fi descrisă printr-un model de corecţie a erorilor (“error
correction model”), forma simplă a acestuia fiind:
∆Yt = µ + β1 ∆X t + α(Yt −1 − aˆ 0 − aˆ1 X t −1 ) +ηt , sau
∆Yt = µ + β1 ∆X t + αεˆt −1 +ηt .

67
Reziduurile din ecuaţia de cointegrare εˆt −1 =Yt −1 −aˆ −bˆX t −1 (ce surprind dezechilibrele
pe termen lung) sunt luate în considerare în modelul dinamic, fiind introduse ca un factor.
Astfel, modificările variabilei Y pe termen scurt depind de cele ale variabilei Xşi de
abaterea lui Y de la valoarea sa de echilibru pe termen lung a +bX t −1 din perioada
precedentă.
Dezechilibrul dintr-o perioada este corectat in perioada imediat urmatoare; spre
exemplu un dezechilibru intre cerere si oferta din perioada anterioara determina o
modificare a pretului (dezechilibrul a determinat o corectie a pretului in perioada
curenta). Coeficientul α indica in ce proportie un dezechilibru aparut in evolutia celor
doua variabile (abatere de la relatia de cointegrare), se regaseste intr-o corectie a
variabilei Y in perioada imediat urmatoare.
Observăm că în acest model coeficienţii de regresie β1 , β2 sunt coeficienţi ai unor
variabile staţionare, fiind aplicabile tehnicile clasice de estimare şi validare.
Observaţie. Forma ecuaţiei ECM rezultă rearanjând modelul dinamic:
Yt = µ + β1 X t + β2 X t −1 +α1Yt −1 +ηt
unde ηt este zgomot alb. Rezultă forma ECM:
∆Yt = β1 ∆X t − (1 −α1 )[Yt −1 − a 0 − a1 X t −1 ) +ηt
unde a 0 = µ /(1 − α1 ) şi a1 = ( β1 + β 2 ) /(1 − α1 ) . Cele două ecuaţii sunt echivalente, dar forma
ECM are avantajul de a încorpora şi dezechilibrele pe ermen lung, de la ecuaţia de cointegrare
(atunci când variabilele sunt cointegrate) iar coeficientul 1 −α1 oferă informaţii privind viteza
de ajustare.
Ecuaţia anterioară poate include şi un termen determinist în t, respectiv alţi termeni de
tipul ∆X t −i sau ∆Yt −i :
m n
∆Yt = µ + χt + αεˆt −1 + ∑ β i ∆X t −i + ∑δ i ∆Yt −i + η t .
i =1 i =1

astfel încât termenul eroare ηt să fie de tip zgomot alb. Forma finală a modelului rezultă
utilizând procedurile obişnuite de validare şi estimare. Coeficientul α măsoară viteza de
ajustare la dezechilibrele pe termen lung.
O altă modalitate de a detecta existenta unei relaţii de cointegrare constă în testarea
semnificativităţii coeficientului α (cu alternativa mai mic decât zero) în modelul ECM;
dacă acesta este semnificativ atunci nu există o relaţie de cointegrare între variabile.
Deşi se estimează o relaţie de echilibru pe termen lung între două variabile
cointegrate, este important de considerat şi relaţia pe termen scurt dintre acestea,
deoarece sistemul poate să nu fie întotdeauna în echilibru.
Metodologia ne este aplicabilă pentru studiul cointegrării între mai multe vriabile.
În concluzie, relativ la estimarea regresiei între două variabile relativ la care baza
de date este formată din serii de timp sunt utile reperele următoare:
• Dacă variabilele sunt staţionare sau staţionare relativ la tendinţă (deterministă)
modelul este specificat pentru variabilele observate. Forma generală a modelului
dinamic adecvate în acest scop este:
p q
Yt = α + δt + ∑βi Yt −i + ∑φ j X t − j + ε t .
i =1 j =o

68
- Termenul δt se include doar dacă una din variabile este staţionară relativ la
tendinţă. In acest caz testele clasice din regresie, bazate pe metoda c.m.mici
pătrate sunt asimptotic valide (dacă numărul datelor e suficient de mare).

• Dacă variabilele sunt nestaţionare, staţionare după o singură diferenţiere şi nu sunt


cointegrate, atunci, regresia se va estima pentru variabilele diferenţiate. Modelul
dinamic are forma:
p q
∆Yt = α + ∑βi ∆Yt −i + ∑φ j ∆Yt − j + ε t .
i =1 j =o

• Dacă variabilele sunt nestaţionare şi cu rădăcină unitate, staţionare după prima


diferenţiere şi cointegrate, atunci regresia:
Yt = a 0 + a1 X t + ε t ,
furnizează un estimator (super)consistent pentru relaţia de cointegrare pe termen
lung dintre variabile (Johnston şi DiNardo, 1994). Relaţia dintre variabile este
modelată estimată utilizând un model de tip corecţie a erorilor:
m n
∆Yt = µ + χt + αεˆt −1 + ∑ β i ∆X t −i + ∑δ i ∆Yt −i + η t
i =1 i =1

unde εˆt −1 = Yt − aˆ 0 − aˆ1 X t


Această ecuaţie încorporează atât dinamica pe termen scurt cât şi cea pe termen lung.

4.3. Analiza cauzalităţii dintre variabile


Înainte de specificarea unui model actuarial pentru investiţii este important de
testat natura relaţiilor existente între variabile. Ne vom referi în continuare, pentru
simplitatea expunerii, la două variabile Y respectiv X.
În sensul abordării propuse de Granger (1969) X este cauza pentru Y, sau X
explică pe Y, dacă X ajută la predicţia lui Y. Procedura presupune a se cuantifica cât din
nivelul current al variabilei Y poate fi explicat prin valorile sale istorice iar apoi a se
vedea dacă adăugând variabile de tipul xt −i variaţia explicată creşte.
Analiza cauzalităţii între două variabile presupune parcurgerea etapelor de mai
jos.
1) Pentru a testa dacă X este cauză pentru Y, în sens Granger, se estimează ecuaţia
de regresie:
k k
Yt = µ + ∑ βi Yt −i + ∑α j X t − j + ε t , (u)
i =1 j =0

unde k este fixat astfel încât erorile să fie zgomot alb. Relativ la această ecuaţie, ipoteza
nulă respectiv alternativa sunt:
H 0 : α1 = α 2 = ... = α l = 0 , X nu este cauză pentru Y,
H 1 : ∃ αi ≠ 0 .

Testarea ipotezei precedente se realizează utilizând un test de tip Fisher-Snedecor


construit astfel:

69
( SSRr − SSRu ) / k ( Ru2 − Rr2 ) / k
F= = ∈ F (k , n − 2k − 1) ,
SSRu /(T − 2k − 1) (1 − Ru2 ) /( n − 2k − 1)
2
unde SSR u şi Ru reprezintă suma pătratelor reziduurilor respectiv coeficientul de
determinaţie în ecuaţia fără restricţii (u) iar SSR r şi Rr2 sunt aceleaşi elemente dar în
ecuaţia de regresie cu restricţii (r) ce include doar termenii de tip y t −i :
k
Yt = µ + ∑ β i Yt −i + ε t . (r)
i =1
Se respinge ipoteza nulă dacă valoarea calculată pentru statistica F este mai mare decât
valoarea critică.
2) Analog, se testează dacă Y este cauză pentru X pornind de la regresia:
k k
X t = µ + ∑ϕi X t −i + ∑δ j Yt − j + ε t , (u)
i =1 j =0

Ipoteza nulă respectiv alternativa sunt:


H 0 : δ 1 = δ 2 = ... = δ l = 0 , Y nu este cauză pentru X
H1 : ∃δi ≠ 0 .

Testul F are aceeaşi formă:


( SSRr − SSRu ) / k ( Ru2 − Rr2 ) / k
F= = ∈ F (k , n − 2k − 1) ,
SSRu /(T − 2k − 1) (1 − Ru2 ) /( n − 2k − 1)
SSR r şi Rr2 referindu-se la ecuaţia de regresie cu restricţii (r):
k
X t = µ + ∑ ϕ i X t −i + ε t . (r)
i =1

3) În urma aplicării celor două teste sunt posibile patru concluzii:


i) cauzalitate unidirecţională: X este cauză pentru Y (X → Y) dacă ipoteza nulă
se respinge la 1) şi se acceptă la 2);
ii) cauzalitate unidirecţională: Y este cauză pentru X (Y → X) dacă ipoteza nulă
se respinge la 2) şi se acceptă la 1);
iii) cauzalitate bidirecţională: X ↔ Y dacă ipoteza nulă se respinge atât la 1) cât
şi la 2).
iv) cele două variabile sunt independente dacă ipoteza nulă se acceptă la 1) şi la
2).
4.4. Modele vector autoregresiv VAR
Reprezentarea autoregresivă AR(p) este extinsă pentru un vector de variabile dependente
VAR(p). In scrierea matriciala, pentru două variabile, un model VAR(1) are forma:

70
Y1tb a1 Y1t− ε 12
= +  +
Y2 t  b  a 2  Y2 t − 1  ε 1 2
sau Yt = B + AY t −1 + εt unde Yt este vectorul variabilelor dependente (2x1), B vectorul
termenilor liberi (2x1), A matricea coeficienţilor (2x2) iar ε vectorul erorilor
(perturbaţiilor). Prezentul variabilelor este dependent de propriul trecut.

71
Un sistem econometric cu ecuaţii simultane poate fi pus în forma VAR. Aceste modele
sunt destinate previziunii (avantaj: nu sunt necesare previziuni ale variabilelor, înafara
sistemului) şi se utilizează deasemenea pentru a analiza impactul unor perturbaţii (şocuri)
aleatoare asupra variabilelor sistemului.
Fiecare variabilă este exprimată funcţie de trecutul celorlalte variabile din sistem.
Forma generală VAR(p) este redată prin ecuaţia vectorială:
Yt = B + A1Yt −1 + A2Yt −2 +... + A p Yt −p +εt

unde Yt este vectorul variabilelor dependente (kx1), Ai (kxk) matrici ale coeficienţilor
iar εt este vectorul (kx1) inovaţiilor (erorilor); Yt = (Y1t , Y2 t ,..., Ykt )' adică transpusa
.
vectorului Se presupune ca inovaţiile sunt necorelate cu trecutul acestora respectiv cu
variabilele din partea dreapta a ecuaţiei.
Pentru estimarea coeficienţilor se utilizează metoda celor mai mici pătrate pentru fiecare
ecuaţie în parte, fără a se pierde din eficientă.
Se utilizează atunci când ne interesează interacţiunea dintre variabile.
Se definesc şi aici condiţii de stabilitate, staţionalitate a modelului. In operatorul
intarziere modelul se scrie:
Π( L)Yt = B + εt

unde Π( L) = I k − A1 L − A2 L −.... − A p L , prin I k fiind notată matricea unitate.


2 p

Modelul VAR(p) este stabil dacă rădăcinile ecuaţiei


det( Π( z )) = det( I k − A1 z − A2 z 2 − .... − A p z p ) = 0

sunt înafara cercului unitate (au modulul mai mare decât unu). Un model stabil este
staţionar, mediile, varianţele şi autocovarianţele fiind independente de timp.
Inainte de elaborarea unui model se recomandă eliminarea tendinţei şi a
sezonalităţii din date, dacă există; o metodă alternativă constă în introducerea unui
termen t în ecuaţia vectorială pentru a extrage tendinţa deterministă. Pentru validare se
aplică teste specifice, similare cu cele din cazul unui model autoregresiv cu o singură
ecuaţie: erorile trebuie să fie necorelate, să aibă aceeaşi varianţă (constantă în timp), iar
pentru elaborarea de previziuni este necesară şi normalitatea erorilor.
Testul Granger de cauzalitate, numit şi test de exogeneitate slabă, ne indică dacă o
variabilă endogenă poate fi tratată ca exogenă. Intr-un model VAR cu 2 variabile, Y2 nu
este cauză de tip Granger pentru Y1 dacă toate matricile coeficienţilor sunt
triunghiulare, cu 0 deasupra diagonalei principale.

4.5. Cointegrare în sisteme de ecuaţii. Metodologia Johansen


In general, abordarea Engle-Granger este adecvată doar pentru două variabile. Dacă
avem n variabile şi n-1 dintre ele nu sunt (slab) exogene, şi/sau există mai multe relaţii de
cointegrare între variabile atunci abordarea prin intermediul unei singure ecuaţii nu este
adecvată (Harris and Sollis, 2003).

72
In modelele multivariată toate variabilele sunt abordate simultan, şi se urmăreşte
explicarea comportamentului unei variabile funcţie de trecutul său şi a celorlalte
variabile.
Etapele metodologiei Johansen, destinată elaborării modelelor dinamice, sunt:
1) testarea ordinului de integrare pentru fiecare variabilă;
2) determinarea numărului
3) ....
Pentru un vector Yt (kx1) de k potenţiale variabile endogene specificăm un model
autoregresiv VAR(p):
Yt = B + A1Yt −1 + A2Yt −2 +... + A p Yt −p +εt

Atunci când ecuaţia


det( Π( z )) = det( I k − A1 z − A2 z 2 − .... − A p z p ) = 0
are rădăcini în interiorul cercului unitate atunci unele sau toate variabile din vectorul Yt
sunt nestaţionare I(1), iar între ele pot exista relaţii de cointegrare.
Definiţie. Un vector de variabile integrate de acelaşi ordin I(d) este cointegrat CI(d,b)
cu vectorul de cointegrare β dacă β Yt este integrat de ordin mai mic I(d-b). Astfel,
'

există anumite combinaţii liniare ale variabilelor din vector ce sunt integrate de un ordin
mai mic.
Observaţie. Pentru un vector ce conţine două variabile integrate I(1) Yt =( Yt , X t )
pentru care reziduul din regresia Yt = βX t + ε t este staţionar I(0), vectorul de cointegrare
este β = (1,−β) ; β Yt = Yt − βX t adică reziduul ε t = Yt − βX t este staţionar.
'

'
Dacă toate variabilele din vectorul Yt =( Y1t , Y2 t ,..., Ykt ) sunt staţionare I(0),
atunci se aplică metodologia clasică VAR, pentru elaborarea acestui model. Dacă cel
puţin una din variabile este nestaţionară I(1) atunci există două posibilităţi: (1) nu există
nici o relaţie de echilibru (sau de cointegrare) între elementele lui Yt caz în care modelul
costituie un sistem de regresii false, respectiv (2) există una sau mai multe relaţii de
echilibru (sau de cointegrare) între elementele lui Yt , când se are în vedere
reprezentarea VECM a modelui (aceasta fiind o reprezentare VAR cu restricţii).
Abordarea Johansen constă în identificarea a r combinaţii liniare de cointegrare,
printre cele k variabile integrate, şi încorporarea lor într-un model dinamic.
Cum pot fi identificate aceste relaţii de cointegrare?
Dacă Yt sunt cointegrate atunci reprezentarea VAR nu este prea adecvată pentru
analiză deoarece relaţiile de cointegrare nu apar explicit. Relaţiile de cointegrare devin
vizibile în reprezentarea VECM, reprezentare echivalentă cu VAR, aceasta fiind:
∆Yt = ΠYt −1 +Γ1 ∆Yt −1 +... +Γp −1 ∆Yt −p +1 +εt
p
unde Π = ∑ Ai − I iar Γi = −( Ai +1 + Ai +2 + ... + A2 ) .
i =1

Justificare. Considerăm k=2.


Yt −Yt −1 = B + ( A1 − I )Yt −1 + A2Yt −2 + εt
⇔ ∆Yt = B + ( A1 − I )(Yt −1 − Yt −2 ) + ( A2 + A1 − I )Yt −2 + ε t

73
⇔ ∆Yt = B + ( A1 − I ) ∆Yt −1 + ( A2 + A1 − I )Yt −2 + ε t
Este mai convenabil să apară Yt −1 pentru a putea evidenţia eventual reziduul din
perioada anterioară, astfel:
∆Yt = B + ( A1 − I ) ∆Yt −1 + ( A2 + A1 − I )Yt −2 − ( A2 + A1 − I )Yt −1 + ( A2 + A1 − I )Yt −1 + ε t
∆Yt = ( A1 + A2 − I )Yt −1 − A2 ∆Yt −1 + B + εt
sau
∆Yt = ΠYt −1 + Γ1 ∆Yt −1 + B + εt
unde Π = A1 + A2 − I iar Γ1 = −A2 .
Această reprezentare echivalentă are mai multe avantaje (Juselius, 2003): se
reduce efectul multicoliniarităţii, informaţiile pe termen lung sunt sintetizate în matricea
Π, avem o interpretare mai intuitivă a coeficienţilor (surprind efetul pe termen lng
respectiv scurt), este o reprezentare adcvată atunci când ne interesează modificările faţă
de perioada anterioară (ex. în cazul ratei inflaţiei).
b) Legătura între rangul matricii Π şi numărul relaţiilor de cointegrare
Coeficienţii Γ i conţin informaţii despre ajustarea pe termen scurt, iar pentru a identifica

eventuale relaţii de echilibru pe termen lung între elementele vectorului Yt ne


concentrăm asupra matricii Π. Rangul matricii Π indică numărul relaţiilor de
cointegrare prezente între cele k varibile din vectorul Yt .
Cum Yt sunt I(1) rezultă ∆Yt staţionare, astfel rangul matricii, notat cu r, trebuie
să fie mai mic decât numărul variabilelor r=rang( Π)<k (altfel în partea stângă avem o
variabilă nestaţionară iar în partea dreaptă una nestaţionară); dacă spre exemplu Π = I k
atunci membrul stâng al ecuaţiilor este o variabilă staţionară ∆Yt iar în cel drept avem o
variabilă nestaţionară Yt −1 plus variabile staţionare ( ∆Yt −i respectiv reziduul). Astfel
Π = 0 sau rang( Π)<k. Rangul matricii este egal cu numărul de linii (sau coloane) liniar
independente. Avem rang( Π)=k doar atunci când toate variabilele sunt staţionare; în
acest caz nu se pune problema cointegrării.
În cazul nestaţionalităţii de tip I(1), deoarece un proces nestaţionar nu poate fi
egal cu unul staţionar forma VECM are sens doar atunci când Π Yt −1 defineşte
combinaţii liniare staţionare, adică între variabile există relaţii de cointegrare.
Atunci când matricea Π(kxk) are rang redus 1 ≤ r ≤ k − 1 acesta poate fi
descompusă în două matrici α (kxr) şi β(kxr) fiecare cu rangul r:
Π = αβ ' .
Astfel în ipoteza unor variabile I(1) reprezentarea VECM a unui vector cointegrat cu r
relaţii de cointegrare este:
∆Yt = αβ 'Yt −1 + Γ1 ∆Yt −1 +... + Γp −1 ∆Yt −p +1 + B +εt
sau
∆Yt =αµt −1 +Γ1 ∆Yt −1 +... +Γp −1 ∆Yt −p +1 + B +εt
unde β Yt −1 = µt −1 este staţionar I(0) fiind vectorul rx1 relaţiilor de cointegrare, β(kxr)
'

este matricea vectorilor de cointegrare (r vectori de cointegrare, fiecare coloană


reprezentând coeficienţii unui vector de cointegrare); aceştia formează o bază în spaţiul
vectorilor de cointegrare, orice combinaţie liniară a vectorilor din bază fiind de asemenea
un vector de cointegrare. Avem în această reprezentare un VAR(p-1) în care toate

74
variabilele sunt staţionare. Matricea coeficienţlor de ajustare α din αµt −1 reprezintă
viteza cu care ∆Yt se ajustează la dezechilibre in relaţia de cointegrare.
Descomunerea Π = αβ ' nu este unică deoarece pentru orice matrice M(rxr)
nesingulară avem Π = αβ' = (αM )( M −1 β ' ) = (αM )( βM −1' ) ' = ab ' unde a = αM iar
b = βM −1' . Pentru a obţine valori unice sunt necesare anumite restricţii, precum
normalizarea (se împart toţi coeficienţii vectorului de cointegrare la unul dintre ei) sau
restricţii sugerate de teoria economică.
Prin urmare, avem următoarele cazuri:
1) r=rang( Π)=k, caz în care Yt −1 sunt staţionare şi se va elabora un model
VAR pentru variabilele observate Yt , utilizând inferenţele standard;
2) 1 ≤ r ≤ k − 1 când există r combinaţii liniare a variabilelor ce sunt staţionare
prin urmare r relaţii de cointegrare, Yt fiind cointegrate. Reprezentarea
VECM este validă, toate variabilele ce intervin fiind staţionare. Reprezentarea
VAR în Yt este consistentă dar ineficientă, iar reprezentarea VAR pentru
diferenţe este greşită (Cochran, 2005);
3) r=0 când nu există combinaţii liniare staţionare şi se va elabora un model
VAR pentru diferenţe ∆Yt (acestea fiind staţionare).

c) Testarea numărului relaţiilor de cointegrare şi estimarea acestora

Johansen (1988) a obţinut estimaţii pentru α (kxr) şi β(kxr) utilizând pocedura


cunoscută ca şi regresia rangului redus. Estimatorii de maximă verosimilitate ML pentru
β sunt obţinuţi ca şi vectori proprii corespunzători celor mai mari r valori proprii.
Testele sunt bazate pe estimarea reprezentării VECM:
∆Yt = ΠYt −1 +Γ1 ∆Yt −1 +... +Γp −1 ∆Yt −p +1 + B +εt
şi se definesc utilizând cele mai mari valori proprii ale matricii Π. In scopul stabilirii
numărului relaţiilor de cointegrare sunt estimate valorile proprii (sau rădăcinile
caracteristice) ale matricii Π: λˆ1 ≥ λˆ2 ≥ ... ≥ λˆk −1 . Aceste valori proprii sunt deasemenea
egale cu patratul corelaţiei canonice între ∆Yt şi Yt −1 corectată de diferenţele ∆Yt −i ,
astfel că iau valori între 0 şi 1. Numărul valorilor proprii semnificativ diferite de zero
indică numărul relaţiilor de cointegrare. Rangul matricii Πeste egal cu numărul
valorilor proprii diferite de zero.
Următoarele două teste, de tip LR(“likelihood ratio”), sunt utilizate pentru
determinarea numărului r de valori proprii semnificativ diferite de zero, adică a
numărului relaţiilor de cointegrare:
1. testul sau statistica “trace”
LR trace (r) = −T ∑i =r +1 ln ( 1 − λˆi )
k

Se testează succesiv, pentru r=0,1, ...,k-1 următoarele ipoteze:

75
H 0 : cel mult r relaţii de cointegrare (rangul matricii este cel mult r)
până la primul r pentru care ipoteza nulă se acceptă. Când ipoteza nulă H 0 se acceptă
valoarea statisticii LR este aproape de zero, adică ultimele k- r valori proprii sunt
nesemnificative λr +1 ,..., λ ˆ . Ipoteza nulă se respinge atunci când valoarea calculată
k

este mai mare decât cea critică.


2. testul „maximum eigenvalue”
LR max (r,r +1 ) = −T ln ( 1 − λˆr +1 ) sau
LR max (r,r +1 ) = LR trace (r ) − LR trace (r +1)
Ipoteza nulă respectiv alternativa sunt:
H 0 : r relaţii de cointegrare (rangul matricii este cel mult r)
H 1 : r+1 relaţii de cointegrare
pentru r=0,1, ...,k-1.
Valorile critice sunt determinate de mai mulţi autori, printre care Johansen and
Juselius (1990), MacKinnon-Haug-Michelis (1999). Valorile critice diferă după cum se
seriile au constantă şi/sau tendinţă deterministă respectiv ecuaţiile de cointegrare conţin
constantă şi/sau tendinţă deterministă. Forma generală a modelului:
∆Yt = ΠYt −1 +Γ1 ∆Yt −1 +... +Γp −1 ∆Yt −p +1 + Bx t +εt
poate include şi tendinţe deterministe, de tip t, prin vectorul variabilelor deterministe xt .
Pentru selecţia numărului de întârzieri, în analizele de tip VECM sau VAR, se pot
utilize criteriile AIC (Akaike Information Criterion), SIC (Schwarz Information
Criterion), sau HQ (Hannan-Quinn Information Criterion). Se alege aceea valoare pentru
p ce minimezează valoarea acestor funcţii, în modelul VAR.
Acestă abordarea facilitează testarea unor restricţii, utilizând teste de tip LR
distribuite după legea λ2 , restricţii eventual sugerate de teoria economică, asupra
elementelor matricii vectorilor de cointegrare sau a matricii coeficienţlor de ajustare α ;
regăsim aici şi testele de exogeneitate (slabă sau tare).
Modelul dinamic VECM poate fi utilizat pentru generarea de previziuni respectiv
pentru a analiza impactul unor perturbaţii (şocuri) aleatoare asupra variabilelor
sistemului.

76
Bibliografie

1. Bresson G., Pirotte A., Econometrie des series temporalles, Presses Universitaires
de France, 1995.
2. Buiga A., Dragoş, C, Lazar D., Parpucea I., Statistică descriptivă, Editura
Mediamira, 2004.
3. Florea I., Parpucea I., Buiga A., Lazar D., Statistică inferenţială, Presa
Universitară Clujeană, 2000.
4. Florea, I. Econometrie, Editura Universităţii din Oradea, 2004.
5. Harris R., Sollis R., Applied time series modeling and forecasting, John Wiley &
Sons, 2003.
6. Makridakis S., Wheelwright S.C., Hyndman R.J., Forecasting. Methods and
Applications, John Wiley & Sons Inc., 1998
7. Melard G., Methodes de prevision a court terme, Universite de Bruxelles, 1990.
8. Mills, T.C., The econometric modelling of financial time series, Cambridge
University Press, 1999.
9. Pecican, E.S., Econometria pentru … economişti, Editura Economică, 2004.
10. Pecican E.S., Econometrie, Ed. ALL, Bucureşti, 1994.
11. Tertisco M., Stoica P., Popescu Th., Modelarea si predictia seriilor de timp, Ed.
Academiei, Bucureşti, 1985.

77

S-ar putea să vă placă și