Documente Academic
Documente Profesional
Documente Cultură
1
CUPRINS
2
Capitolul 1. Componentele deterministe ale unei serii de timp
3
b) serii de timp ce redau evoluţia variabilei Y precum şi a altor variabile
X 1 , X 2 , , X n ce explică comportamentul acesteia → modele multivariabile
(modele explicative).
Modelele explicative pot fi utilizate in previziune dar si pentru testatea empirica si
simularea unor politici economice sau pentru luarea unor decizii.
4
Pentru un moment t de timp fixat, eroarea de previziune este diferenţa între
valoarea observată şi cea previzionată Yˆt ambele aferente momentului t:
et = Yt −Yˆt
Dacă modelul statistic generează previziunile Yˆ1 , Yˆ2 ,..., Yˆs corespunzătoare
observaţiilor Y1 , Y2 ,..., Ys pentru a măsura calitatea acestuia de a genera previziuni
adecvate se utilizează o serie de indicatori sintetici ai erorilor de previziune, cei mai
frecvent întâlniţi fiind:
- eroarea medie pătratică: MSE =
1 s
∑
s h=1
(
Yh − Yˆh )
2
1 s
- eroarea medie absolută: MAE = ∑ Yh − Yˆh
s h =1
s Yh −Yˆh
- eroarea medie absolută exprimată procentual: MAPE = 1 ∑
s h =1 Yh
Acesti indicatori pot fi utilizati si pentru a masura capacitatea modelului de a genera
valori apropiate de cele observate, pentru seria de timp disponibila.
Atunci cand ne intereseaza calitatea preziunilor, inafara perioadei observate, de
regula se utilizează doar o parte din date în estimarea modelului, cele rămase (cele mai
recente), urmând a fi comparate cu previziunile corespunzătoare generate de model.
Dintre mai multe modele alternative de previziune este selectat cel ce conduce la erori
medii de previziune mai mici. După alegerea modelului, acesta poate fi reestimat luând în
considerare toate datele disponibile. O altă variantă de lucru constă în compararea
previziunilor obţinute din model cu cele generate “naiv”. Conform “modelului naiv de
previziune” (mers aleator) valoarea înregistrată de variabilă în următoarea perioadă va fi
cea înregistrată în prezent.
5
Deseori cele doua componente tendinta-ciclu sunt tratate ca si o singura
componenta, ce surprinde evolutia pe termen lung, si se noteaza prin T, astfel
Yt = f (Tt , S t , eroareE t ) .
În acest context, tehnicile de analiză a seriilor de timp au ca obiective:
• separarea fiecărei componente şi modelarea comportamentului său, respectiv
• previziunea evoluţiei fiecărei componente, iar apoi compunerea acestora în scopul
obţinerii de previziuni privind evoluţia fenomenului Y. Principiul de la baza
acestei tehnici este “descompune pentru a modela iar apoi recompune”.
Previziunile utilizând modelul de descompunere se obţin prin compunerea
previziunilor realizate pentru fiecare componentă deterministă prezentă în serie, ţinând
seama de forma modelului, aditiv respectiv multiplicativ:
Yˆ = Tˆ + Cˆ + Sˆ respectiv Yˆ = Tˆ ⋅ Cˆ ⋅ Sˆ .
Extrapolarea tendinţei respectiv a celorlalte componente deterministe, conduce la
previziuni adecvate în condiţiile în care:
- modelele estimate reuşesc să surprindă ceea ce este esenţial, repetabil, în
comportamentul trecut al fenomenului respectiv
- comportamentul factorilor ce determină schimbările în timp în nivelul înregistrat
de variabila Y rămâne şi pe viitor aproximativ acelaşi.
Extrapolarea este adecvată în principal pentru obţinerea de previziuni pe termen
scurt, elaborându-se de regulă două sau mai multe scenarii de evoluţie.
Menţionăm deasemenea că uneori, în principal în econometrie unde variabilele
incluse inre-un model sunt în prealabil desezonalizate, este necesară eliminarea
componentei sezoniere din seria de timp, obţinându-se seria ajustată sezonier d:
Y
d= .
S
6
Componenta aleatoare sau reziduală se manifestă prin fluctuaţii aparent aleatoare în
jurul componentelor deterministe, fiind efectul acţiunii unor factori cu acţiune punctuală
în timp, de tipul evenimentelor politice sau meteorologice.
Componenta aleatoare este prezentă în toate seriile cronologice, în timp ce o serie
poate prezenta sau nu tendinţa, variaţie ciclică sau sezonieră. Evidenţierea componentelor
deterministe este dependentă şi de perioada supusă observării respectiv de frecvenţa
observaţiilor. Deseori cronograma seriei si natura indicatorului sugerează componentele
prezente.
Vor face obiectul acestui capitol doar componentele deterministe. Componenta
aleatoare nu trebuie ignorată deoarece conţine informaţii utile în previziune, modelarea
acesteia fiind abordată în principal în capitolul trei. Dacă nu se precizează altfel, în
prezentul capitol pentru previziunea variabilei Y componenta aleatoare se ignoră (se
presupune a fi nepredictibilă, adică de tip zgomot alb). In practică, identificarea şi
separarea celor patru componente din seria cronologică nu sunt de regulă realizabile cu
exactitate, reziduul rămas după extragerea estimaţiilor componentelor deterministe
regăsindu-se în componenta aleatoare.
Tt = a + bt + ct 2
unde X = t ²
hiperbolă T = a +bX
1 1
Tt = a + b Unde X =
t t
exponenţială Z = A + Bt unde
Tt = a ⋅ b t
Z t = ln Tt ; A = ln a; B = ln b
putere Z = A +bX Unde
Tt = a ⋅ t b
Z t = ln Tt ; A = ln a; X = ln t
logaritmică T = a +bX
Tt = a + b ln t unde X = ln t
curba logistică
a
Tt = , a, c > 0
1 + e b −ct
7
Curba logistică este o legitate specifică evoluţiei vânzărilor dintr-un nou produs, dar
nu exclusiv acesteia, fiind adecvată pentru modelarea evoluţiei pe termen lung şi a altor
indicatori (Melard, 1990).
Graficul său din figura 1 indică, pentru exemplul vânzărilor dintr-un nou produs, o
creştere accelerată a acestora după lansarea produsului, urmată de o încetinire a ritmului
de creştere spre un prag de saturaţie egal cu a. Punctul de inflexiune al curbei este de
coordonate (b/c, a/2).
Pentru estimarea parametrilor tendinţei liniare
Tt = a + bt
se utilizează metoda celor mai mici pătrate (utilizată în estimarea ecuatiei de regresie
liniara). Rolul variabilei exogene (independente) este jucat aici de variabila timp t:
Yt = a + bt + ε t t = 1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci următoarele:
n
∑ (t − t )(Y t −Y)
b= t =1
n ,
∑ (t − t )
t =1
2
a =Y −bt ,
sau echivalent
M (tY ) − M (t ) M (Y )
b= ,
M (t 2 ) −[ M (t )] 2
a = Y − bt .
Seria prezintă o tendinţă de creştere atunci când b > 0 respectiv de descreştere dacă b <
0.
Cu excepţia curbei logistice, celelalte funcţii neliniare din tabelul 6.1. pot fi aduse la
o formă liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de
logaritmare în cazul funcţiei exponenţiale şi a funcţiei putere.
8
Spre exemplu în cazul tendinţei exponenţiale
Tt = a ⋅ b t ,
considerând un model de descompunere multiplicativ Yt = Tt ⋅ εt , operaţia de logaritmare
a ambilor membri conduce la:
ln Yt = ln a + t ln b + ln εt .
Prin substituţiile A = ln a, B = ln b,ηt = ln ε t se obţine forma liniarizată:
ln Yt = A + Bt +ηt .
Aplicând metoda celor mai mici pătrate, se determină A, B:
M (tX ) − M (t ) M ( X )
B=
M (t 2 ) − [ M (t )]
2
A = M ( X ) − bM (t )
unde s-a notat X = ln Y . Coeficienţii A respectiv B se pot determina parametrii tendinţei
exponenţiale a = e A , b = e B .
Cronograma seriei sugerează prezenţa unei tendinţe liniare, peste care se suprapune o
componentă aleatoare de amplitudine redusă:
Yt = a + bt + εt , t =1, 2,..., 18 .
Parametrii tendinţei se determină din relaţiile:
M (tY ) − M (t ) M (Y )
b=
M (t 2 ) − [ M (t ) ]
2
a = M (Y ) − bM (t ).
9
Figura 1. --ο —Evolutie indicator; ------ Tendinţa
Luna F M A M I I A S O N
10
Vânzăr 20 32 40 47 52 60 62 63 65 67
i
a = M (Y ) − cM (t 2 ).
Calcule intermediare:
t -9 -7 -5 -3 -1 1 3 5 7 9 Media
yt 20 32 40 47 52 60 62 63 65 67 50.8
t2 81 49 25 9 1 1 9 25 49 81 33
tY t -180 -224 -200 -141 -52 60 186 315 455 603 82.2
t4 6561 2401 625 81 1 1 81 625 2401 6561 1933.8
t 2Yt 1620 1568 1000 423 52 60 558 1575 3185 5427 1546.8
Dacă ne punem problema alegerii celei mai adecvate funcţii dintre parabolă şi
dreaptă (posibile funcţii sugerate de cronogramă pentru modelarea tendinţei) şi dispunem
11
de un soft de statistica pentru efectuarea calculelor, este indicat a se utiliza criteriul
minimizării sumei pătratelor reziduurilor SSR= ∑(Yt −Tt ) . Astfel:
2
Conform acestui criteriu, parabola este mai indicată decât dreapta în modelarea tendinţei.
t 1 2 3 4 5 6 7 8 9
Z t = ln Yt 3.100 3.107 3.109 3.116 3.119 3.123 3.128 3.133 3.142
M (tZ ) − M (t ) M ( Z )
B= ,
M (t 2 ) − [ M (t )]
2
A = M ( Z ) − BM (t ).
3.100 + 3.107 + + 3.142
M (Z ) = = 3.119 ,
9
(1 × 3.100 ) + ( 2 × 3.107 ) + + (9 × 3.142 )
M (tZ ) =
9
Se obţin pentru parametrii A respectiv B următoarele estimaţii:
B = 0.005 , A = 3.09 .
Parametrii tendinţei exponenţiale rezultă în consecinţă:
12
a = e A = 22 .11, b = e B = 1.005
Tt = 22.11 × (1.005) t .
O extrapolare a acestei tendinţe ar indica o populaţie previzibilă pentru anul 2000 de:
Yˆ21 =Tˆ21 = 22.11 × (1.005)21 = 24.36 mil. locuitori,
valoarea reală fiind de 22.43 mil. locuitori. După 1989 nu s-a menţinut tendinţa de
creştere a numărului populaţiei, mediul economic şi social, cu influenţă directă asupra
evoluţiei populaţiei unei ţări, schimbăndu-se substanţial faţă de cel din perioada 1980 –
1988 (perioadă utilizată în estimarea tendinţei).
1.5. Estimarea tendintei utilizând mediile mobile
Atunci când cronograma seriei nu oferă indicii foarte clare privind prezenţa respectiv
forma tendinţei, este indicat a se utiliza în prealabil o tehnică de netezire ce atenuează
amplitudinea fluctuaţiilor aleatoare din serie, scopul fiind evidenţierea (estimarea)
tendinţei. Metoda mediilor mobile, netezirea exponenţială dar şi alte filtre de netezire
sunt utilizate frecvent în practică. Consideram în acest paragraf că seria prezintă doar
tendinţă şi componentă aleatoare, iar modelul de descompunere este unul aditiv:
Yt = Tt + εt .
Metoda mediilor mobile
Media mobilă se defineşte ca o combinaţie liniară de puteri pozitive şi negative
ale operatorului de întârziere L:
m2 m2
MM = ∑ θi L−i cu
i =− m1
∑θ
i =−m1
i =1
13
proprietate ce specifică condiţii suficiente pentru ca o medie mobilă să conserve
polinoame de un anumit grad.
∑θ
i =−m
i
2
< 1 . Raportul de reducere a varianţei erorii se defineşte prin:
m
σ *2 / σ 2 = ∑θ
i =−m
i
2
Mediile aritmetice
Cele mai simple medii mobile simetrice sunt mediile aritmetice:
Y + Yt −m−1 + ... + Yt + ... + Yt +m−1 + Yt +m
Yt = t −m ; t = m + 1, m + 2,..., T − m ;
2m + 1
Mediile aritmetice constituie un caz particular de medie mobilă centrată şi simetrică,
1
coeficienţii fiind toţi egali cu θi = . Coeficienţii acesteia s-au dedus din
2m +1
următoarele cerinţe (Gourieroux & Monfort, 1990):
m
respectiv
m
14
În practică, alegerea ordinului mediei mobile pentru eliminarea componentei
aleatoare rămâne în sarcina statisticianului, fiind indicat un ordin mai mare dacă
amplitudinea fluctuaţiilor aleatoare este mai mare. Oricum, oscilaţiile din componenta
aleatoare fiind neregulate, eliminarea acesteia se realizează doar parţial. Prin aplicarea
unei medii mobile, indiferent de ordinul acesteia, amplitudinea fluctuaţiilor se reduce.
Rezultă:
0,5Y1 + Y2 + Y3 + Y4 + 0,5Y5
Y3 =
4
0,5Y2 +Y3 +Y4 +Y5 + 0,5Y6
Y4 =
4
0,5YT −4 +YY −3 +YT −2 +YT −1 + 0,5YT
Y T −2 = .
4
15
Mediile mobile sunt deasemenea cele mai populare tehnici de netezire utilizate în
analiza tehnică. Analiza tehnică este utilizata de către investitorii pe piaţa de capital, în
scopul identificării tendinţei Există mai multe tipuri de medii mobile utilizate în acest
context. Singura diferenţă semnificativă între diversele tipuri de medie mobile este
ponderea acordată datelor recente; acestea sunt de regulă medii asimetrice. Media mobilă
simplă spre exemplu asociază ponderi egale tuturor preţurilor şi se calculează însumând
preţurile de închidere ale unei acţiuni pentru ultimele p perioade şi împărţind totalul la
numărul de perioade ales:
Yt −p +Yt −p −1 +... +Yt
Yt = .
p
Ordinul mediei mobile p trebuie să se potrivească cu ciclul pieţei pe care dorim să îl
urmărim. De exemplu, dacă o acţiune are un ciclu de creştere-scădere de 40 de zile,
media mobilă ideală se va baza pe 21 de zile de tranzacţionare; practica sugerează
următoarea regulă: ordinul mediei mobile = lungimea cilcului bursier/2 +1. Un ordin des
utilizat este cel de 200 de zile, reuşind să indice tendinţa pieţei pe termen lung (tendinţa
generală a pieţei). Un semnal de cumpărare este generat când preţul acţiunii creşte peste
media sa mobilă, iar semnalul de vânzare este generat de scăderea preţului sub media
mobilă.
Zi (t) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Curs 29. 29. 30. 31. 31. 30. 28. 31. 31. 30. 31. 30. 31. 30. 31. 32.
(yt) 9 8 1 2 9 1 6 5 2 7 2 4 0 4 5 7
MM(3) - 29. 30. 31. 31. 30. 30. 30. 31. 31. 30. 30. 30. 31. 31. -
9 4 1 1 2 1 4 1 0 8 9 6 0 5
16
Figura 3. --ο -- Cursul acţiunii , -- -- MM(3), ----- MM(7)
17
În general, este adecvat un model aditiv atunci când amplitudinea oscilaţiilor este
aproximativ constantă (vezi figura 4) respectiv multiplicativ dacă amplitudinea creşte
(figura 5) sau scade în timp. Frecvent în practică este mai adecvat modelul multiplicativ.
18
• cifra de afaceri a societatilor din
transportul de calatori respectiv
din construcţii
• consum gaz, energie electrică
pentru uz casnic.
o săptămână Zilnice 7 • volumul vânzărilor unui magazin
alimentar
• încasările unui cinematograf
o zi din oră în • numarul de călători ce folosesc
oră mijloacele de transport în comun
• retragerile de la o bancă
19
Exemplu 5. Eliminarea componentei sezoniere utilizând mediile mobile
Datele din tabelul de mai jos se referă la transportul feroviar de călători. Parcursul
pasagerilor, exprimat în milioane kilometri, a evoluat lunar astfel:
Lună I F M A M I I A S O N D
An
1999 184 167 193 220 202 252 325 296 220 196 174 253
2000 178 175 188 230 213 272 330 279 225 198 187 247
2001 176 157 183 220 189 332 315 276 209 186 164 243
20
Datele observate au fost indexate aici în ordine cronologică Y1 , Y2 , ... Y36 . Tabelul 3
indică valorile mediilor mobile. Seria mediilor mobile prezentată grafic în figura 6 indică
absenţa componentei de tendinţă în evoluţia traficului de călători pe perioada considerată.
21
lung tendinţă- ciclu este privită ca o medie curentă a seriei TC t =Yt , estimată prin
mediile mobile Y ij .
În cazul modelului multiplicativ
yij = Tij ⋅ S j ⋅ εij ,
metoda se întâlneşte în literatură şi sub denumire de metoda raportării la mediile mobile
şi constă în următoarele:
• calculul mediilor mobile Y ij de ordin p egal cu perioada componentei sezoniere;
• calculul rapoartelor S ij =Yij / Y ij ce cuantifică abaterea datelor observate de la
tendinţă. Dacă fixăm indicele j, aceste rapoarte constituie estimaţii pentru indicele
sezonalitaţii aferent sezonului S j ;
• determinarea unui indice mediu pentru fiecare sezon ca o medie a estimaţiilor
precedente:
1 n−1
Ij = ∑ Sij ; j = 1, 2,..., p ,
n −1 i =1
aceasta justificându-se prin necesitatea eliminării efectului aleator din S ij . Pentru
a nu fi afectaţi de valorile extreme, uneori înainte de calculul mediei, aceste valori
se elimină, sau în loc de medie se consideră valoarea mediană a estimaţiilor S ij ;
• determinarea componentei sezoniere S j , etapă ce constă într-o corecţie adusă
indicilor medii I j astfel încât media lor să fie 1:
1 p
S j = I j / ∑ I i j =1, 2,..., p .
p i =1
Această cerinţă impusă indicilor sezonalităţii este naturală, variaţiile sezoniere se
compensează în medie pe parcursul unui an.
Observaţie: uneori nu se efectuează această corecţie, componenta sezonieră fiind
estimată prin indicii indicilor medii I j .
Valorile rezultate ( S1 , S 2 , ..., S j ) se numesc indici ai sezonalităţii şi constituie
componenta sezonieră. În sezoanele pentru care Sj *100 < 100 factorii sezonieri au
condus la o abatere în minus a valorii observate faţă de valoarea corespunzătoare de pe
tendinţă în medie cu 100(Sj –1) procente, respectiv dacă Sj > 1 valorile observate sunt
mai mari decât cele de pe tendinţă în medie de Sj ori.
22
2. Metoda comparării cu tendinţa
23
Yt
dt =
St
Spre exemplu în softul Statistica, pentru estimarea tendinţei se aplică o medie mobilă
ponderată de ordin 5:
Y + 2Yt −1 + 3Yt + 2Yt +1 + Yt +2
Yt = t −2
9
seriei ajustate eszonier. Această metodă nu permite şi generarea de previziuni.
Odată estimate componentele deterministe, componenta aleatoare se obţine prin
eliminarea acestora din datele observate:
Yij
• ε ij = în cazul modelului multiplicativ, respectiv
Tij ⋅ S j
• εij = Yij − (Tij + S j ) în caz aditiv.
Seria cronologică cu datele iniţiale poate fi descompusă astfel pe componente.
24
0.5 × Y2 + Y3 + Y4 + Y5 + 0.5 × Y6
Y4 = =
4
0.5 × 263 .2 + 252 .4 + 124 .5 + 130 .1 + 0.5 × 280 .2
= = 194 .7
4
t 1 2 3 ... 19 20
Mediile mobile ( Z t ) 191.8 194.7 197.8 ... 308.4 306.0
M (tZ ) − M (t ) M ( Z )
b= ,
M (t 2 ) − [ M (t )]
2
a = M ( Z ) − bM (t ).
Calcule intermediare:
M (t ) =10 .5, M ( Z ) = 252 .9, M (t 2 ) =143 .5, M (tZ ) = 2884 .9,
b = 6.9, a =180 .44 .
Tendinţa producţiei de bere în este estimată prin ecuaţia liniară:
Tt =180 .44 + 6.9 ×t .
25
500
450
400
350
300
250
200
150
100
50
0 2 4 6 8 10 12 14 16 18 20 22 24 26
P r o d u c tia d e b e r e M M (4 )
26
Explicaţii privind calculele:
Y 252 .4 Y 124 .5
S13 = 13 ⋅ 100 = ⋅ 100 = 131 .6 , S14 = 14 ⋅ 100 = ⋅ 100 = 63 .9 ,
Y13 191 .8 Y14 194 .7
Y 130 .1
S 21 = 21 ⋅100 = ⋅100 = 65.8 , ş.a.m.d.
Y21 197 .8
Cum era de aşteptat, aceste rapoarte între datele observate şi mediile mobile sunt mai
mici decât 1 pentru trimestrele I şi IV, când nivelul producţiei a fost sistematic mai mic
(sub tendinţă).
S 21 + S 31 + S 41 + S 51
I1 = = 65.5, I 2 = 130 .9,
4
S + S 23 + S 33 + S 43
I 3 = 13 = 133 .5, I 4 = 68.4.
4
Valoarea medie a acestor indici este 99.6, astfel că este necesară o corecţie astfel încât
media să fie 100:
I 65 .5
S1 = 1 ⋅100 = ⋅100 = 65 .6, S 2 = 131 .4, S 3 = 134 .0, S 4 = 68 .8 .
99 .6 99 .6
Urmare a caracterului sezonier specific producţiei de bere, în trimestrul I producţia a fost
mai mică în medie cu 34.4% decât valorile corespunzătoare de pe tendinţă. În trimestrul
II producţia a fost în medie mai mare de 1.314 ori decât valorile de pe tendinţă. Analog se
interpretează S3 şi S4.
Componenta sezonieră este dată de vectorul format cu indicii sezonalităţii:
S=(S1, S2, S3 , S4 ) = (0.656; 1.314; 1.340; 0.688).
27
III 260.6 208.9 214.94 1.340 0.905
IV 151.1 214.9 221.84 0.688 1.020
2003 I 157.5 229.2 228.74 0.656 1.049
II 301.2 245.0 235.64 1.314 0.973
III 353.3 250.8 242.54 1.340 1.087
IV 185.0 257.1 249.44 0.688 1.078
2004 I 169.7 261.7 256.34 0.656 1.009
II 340.0 259.4 263.24 1.314 0.983
III 350.9 258.3 270.14 1.340 0.969
IV 168.7 267.7 277.04 0.688 0.885
2005 I 177.5 284.5 283.94 0.656 0.953
II 407.6 299.7 290.84 1.314 1.066
III 417.2 309.8 297.74 1.340 1.046
IV 224.1 310.2 304.64 0.688 1.069
2006 I 209.9 308.4 311.54 0.656 1.027
II 385.3 306.0 318.44 1.314 0.856
III 425.6 - 325.34 1.340 0.976
IV 196.6 - 332.24 0.688 0.860
28
Tˆ (21) = 180.44 + 6.9 × 21 = 325.34 respectiv Ŝ 3 = 1.34
29
va nota prin S t . Deasemenea vom nota prin Ŷt ( h) previziunea variabilei Y efectuată la
momentul t, pe baza datelor disponibile în acest moment Y1 , Y2 , ..., Yt , pentru un
orizontul de timp h. O alta notatie intalnita in literatura de specialitate pentru Ŷt ( h) este
Ŷt +h , aceasta fiind de fapt o previziune pentru variabila aleatoare Yt +h . Previziunea
pentru urmatoarea perioada este considerata egala cu valoarea netezita curenta:
Ŷt (1) = S t
Daca seria de timp este generată de un proces staţionar în medie (proces aflat în echilibru
în jurul unei constante) atunci, media ultimilor t termeni ai seriei poate fi utilizată pentru
generarea previziunii aferente urmatoarei perioade:
Y + Yt −1 + ... + Y1
Yˆt (1) = Y = t .
t
Valoarea medie minimizează indicatorul MSE.
Deasemenea daca seria contine doar tendinta si componenta aleatoare atunci o medie
mobila, de tipul mediei aritmetice simple calculată pentru ultimele k observaţii poate fi
considerată previziune pentru urmatoarea perioadă de timp:
Y + Yt −1 + ... + Yt −k +1
Yˆt (1) = S t = t .
k
Gradul de netezire al seriei este mai mare pe masura ce k creste. Observam caci termenii
seriei netezite sunt generati de o relatie de recurenta:
Y − Yt −k
S t = S t −1 + t unde t ≥ k +1 .
k
Pentru primii k termeni ai seriei nu pot fi determinate valorile netezite corespunzatoare.
În acest caz numărul termenilor din medie rămâne constant, iar observaţiile au toate
aceeaşi pondere. O extensie naturală a acestei abordări (de previziune cu ajutorul
mediilor mobile) o constituie previziunea utilizând medii mobile ponderate:
t −k −1
Yˆt (1) = S t =θ0Yt +θ1Yt −1 +... +θt −k +1Yt −k +1 unde ∑θ
i =0
i =1 .
De regula ponderile alocate observatiilor recente sunt mai mari. În acest capitol vom
discuta o clasă de metode ce atribuie termenilor seriei ponderi descrescătoare
exponenţial, pe măsură ce observaţiile sunt mai îndepărtate în timp, numite metode de
netezire exponentiala.
Avantaje ale metodelor de netezire exponentiala, în previziune:
- reduc intervenţia analistului în elaborarea previziunilor. Se utilizează pentru
obţinerea rapidă de previziuni (ex. pentru previziune lunară a vânzărilor unei
firme, din fiecare sortiment de produs). Pot fi aplicate si atunci cand lungimea
seriilor de timp este mai scurta
- nu necesită separarea componentelor deterministe (tendinţă, sezonalitate)
- în practică s-au dovedit a fi candidate serioase ale altor metode mai complexe.
Metodele din această clasă implică utilizarea unor coeficienţi de netezire, cu valori între 0
şi 1, ce facilitează alocarea unor ponderi inegale termenilor seriei.
30
Ca şi metoda de previziune, acest model este adecvat pentru previziunea seriilor de timp
ce fluctuează aleator în jurul unei valori constante (staţionare în medie), nu au tendinţă
sau componentă sezonieră):
Yt = m + ε t
Se presupune aici caci constanta m ramane relativ stabila pe intervale succesive de timp.
Considerăm t momentul prezent. Pentru a previziona următoarea valoare Yt +1 ,
utilizând datele disponibile până la acest moment Y1 , Y2 , ..., Yt se utilizează relaţia
de recurenţă:
Yˆt +1 =c Yt + (1 −c )Yˆt t=1,2,....
unde c ∈[0,1] este constanta de netezire. Aceasta metoda poate fi privita ca o metoda de
netezire. Relatia de recurenta se aplica succesiv pentru fiecare observatie din seria de
timp. Valoarea previzionata pentru următoarea perioadă Yˆt +1 se calculează ca o medie
ponderata intre observatia curenta Yt (ultima valoare disponibilă) si previziunea
precedentă Yˆt (efectuată la pasul anterior). Cand c =1 valorile previzionate sunt egale
cu ultima observaţie.
Atunci când se utilizează în scopul netezirii, valoarea netezită S t asociată valorii
observate Yt este generată de o relaţie similară:
S t = c Yt + (1 −c ) S t −1
întrucât previziunea pentru următoarea perioadă este considerată egală cu valoarea
netezită curentă:
Ŷt (1) =Yˆt +1 = S t .
Pentru perioada observată, seria cu valorile previzionate Yˆ1 , Yˆ2 , ..., YˆT −1 , sau
echivalent S1 , S 2 , ..., S T este seria valorilor netezite.
Intuitiv, implicaţiile metodei
devin maievidente dacă utilizăm succesiv relaţia de
recurenţă anterioară pentru Yt , Yt − 1 , ..., Y2 :
Yˆt +1 = c Yt +(1 −c )Yt =cY t +(1 −c) cY t −1 +(1 −c )Yt −1 = = [ ]
= cY + c (1 − c )Y
t + c (1 − c ) 2 Y
t −1 + + c (1 − c ) t −1 Y + (1 − c ) t Yˆ
t −2 1 1
Astfel, valoarea previzonată se determină ca o media ponderată a tuturor observaţiilor,
ponderea fiecărei observaţii descreşte exponenţial pe măsură ce ne îndepărtăm de prezent,
ţinând seama de următoarele:
Yt pondere c
Yt-1 pondere c(1-c)
Yt-2 pondere c(1-c)2
………. ................................................
t-1
Y 1 pondere c(1-c)
Cea mai mare pondere o are observaţia curentă Yt. Suma ponderilor asociate tuturor
observaţiilor tinde spe unu atunci cand numărul observaţiilor este mare.
Deasemenea, o altă formă a relaţiei de recurenţă este următoarea:
Yˆt +1 =Yt +c (Yt −Yˆt )
31
Utilizarea oricăreia din cele trei forme ale relaţiilor ce definesc această metoda
necesită:
- o valoare iniţială Yˆ1 . De regulă pentru aceasta se consideră prima valoare
observată Yˆ1 =Y1 sau media seriei sau media primilor termeni ai seriei;
- o valoare adecvată pentru constanta de netezire c. Cand c are o valoare apropiată
de 1 atunci se acordă o pondere mai mare observaţiilor recente, fiind adecvată
pentru serii netede. Atunci când c este aproape de 0 previziunea depinde într-o
mai mare măsură de valorile înregistrate în trecut, fiind adecvată pentru serii cu o
amplitudine mare a fluctuaţiilor.
De regulă softurile statistice selectează o valoare optimă pentru c, fiind aceea valoare
pentru care unul din indicatorii sintetici ai erorilor de previziune (MSE, MAE, MAPE
or SSE) este minim. Frecvent se minimizează media pătratelor erorilor de previziune
(
1 T −1
) 1 T −1 2
SSE = ∑ Yt +1 − Yˆt +1 = ∑et +1 → min
T t =0
2
T t =0
eroarea de previziune fiind:
et +1 =Yt +1 −Yˆt +1 .
Atunci când este utilizată în scopul netezirii, metoda produce valori mai netede atunci
când c este aproape de zero, ponderile asociate valorilor curente, în relaţia de recurenţă:
S t = c Yt + (1 −c ) S t −1
fiind mici.
Previziunile înafara perioadei observate sunt constante, pentru orice orizont de
previziune h > 0 :
YˆT ( h) = YˆT (1) = cY T + (1 −c )YˆT .
32
prin a t este o medie ponderată între nivelul său previzionat anterior a t −1 + bt −1 = Yˆt şi
noua observaţie disponibilă. Panta dreptei la momentul t notată bt este o medie
ponderată între panta estimată prin diferenţa între ultimele valori netezite ale nivelului
seriei şi panta estimată la momentul precedent.
Utilizarea relaţiilor de recurenţă necesită valori iniţiale pentru a t respectiv bt .
Variante de iniţializare întâlnite în practică:
- a1 = Y1 şi b1 = 0
- a1 = Y1 şi b1 = Y2 −Y1 sau b1 = (Y4 −Y1 ) / 3 .
Constantele de netezire α, β ∈[0,1] sunt determinate de regulă din condiţia
minimizării erorilor de previziune, fiind acele valori pentru care unul din indicatorii
sintetici ai erorilor de previziune (MSE, MAE, MAPE or SSE) este minim. De regulă
aceste constante se determină din condiţia minimizării mediei pătratelor erorilor de
previziune este minimă:
(
1 T −1
) 1 T −1 2
MSE = ∑ Yt +1 − Yt +1 = ∑et +1 → min
T t =0
ˆ 2
T t =0
eroarea de previziune fiind:
et +1 =Yt +1 −Yˆt +1 .
a) Modelul multiplicativ
Previziunile sunt generate în baza unei ecuaţii de forma:
Yˆt +h =( at +h bt ) S t −p +h
unde nivelul seriei at , panta dreptei de tendinţă bt respectiv componenta sezonieră S t
sunt generate de relaţiile de recurenţă:
Y
at = α t + (1 −α )( at −1 + bt −1 )
S t − p
bt = α ( at − at −1 ) + (1 − β ) bt −1
33
Y
S t = δ t + (1 − δ ) S t − p .
at
Componenta sezonieră este reprezentată aici prin indici de tipul indicilor sezonalităţii.
Estimaţia pentru componenta sezonieră, la momentul t, este o medie ponderată între
indicele sezonalităţii estimat prin raportul între valoarea curentă şi nivelul seriei Yt / at şi
ultima valoare a indicelui generat pentru respectivul sezon S t −p (calculat la momentul t-
p, unde p este perioada componentei sezoniere). Ecuaţia pentru panta dreptei de tendinţă
este identică cu cea din metoda Holt. În ecuaţia pentru nivelul seriei se utilizează valoarea
desezonalizată curentă Yt / S t −p estimată prin valoarea curentă împărţită la cea mai
recentă estimaţie a indicelui sezonalităţii pentru respectivul sezon.
Ca şi valori iniţiale, necesare în relaţiile de recurenţă, sunt sugerate următoarele:
1 p
- media datelor ce acoperă primul ciclu sezonier p a = ∑Yk , fiind astfel
p k =1
eliminată sezonalitatea din nivelul seriei a1
1 Y p +1 −Y1 Y p +2 −Y1 Y2 p −Y p
- bp = ( + +... + ) , fiecare termen din sumă fiind o
p p p p
estimaţie pentru panta dreptei aferentă unui sezon;
- indicii sezonalităţii sunt estimaţi prin indicii sezonalităţii determinaţi prin metoda
raportării la mediile mobile, varianta multiplicativă. O altă variantă de lucru este
următoarea:
Y Y Y
S1 = 1 , S 2 = 2 , ..., S p = p .
ap ap ap
Cele trei constante de netezire α, β, γ ∈[0,1] sunt determinate din condiţia de
minimizare a erorilor de previziune (MSE, MAPE, SSE).
Previziunile înafara perioadei observate, pentru un orizont de timp h, sunt calculate
utilizând ultimele estimaţii, pentru aT , bT respectiv S T −p +h , determinate din
relaţiile de recurenţă:
YˆT +h =( aT +h bT ) S T −p +h .
b) Modelul aditiv
Având în vedere compunerea aditivă a celor două componente tendinţă şi componentă
sezonieră, previziunile sunt generate în baza unei ecuaţii de forma:
Yˆt +h = at +h bt +S t −p +h
unde nivelul seriei at , panta dreptei de tendinţă bt respectiv componenta sezonieră S t
sunt generate de relaţiile de recurenţă:
at = α(Yt − S t − p ) + (1 −α )( at −1 + bt −1 )
bt = α ( at − at −1 ) + (1 − β ) bt −1
S t = δ (Yt − at ) + (1 −δ ) S t − p .
Pentru iniţializarea coeficienţilor sezonalităţii se poate utiliza metoda raportării la mediile
mobile, varianta aditiva sau diferenţele:
S1 =Y1 −a p , S 2 = Y2 − a p , ..., S p = Y p − a p .
34
Previziunile înafara perioadei observate, pentru un orizont de timp h, sunt calculate
ţinând seama de forma aditivă a modelului:
YˆT +h = aT +h bT +S T −p +h .
35
Capitolul 3. Modele de tip autoregresiv medie mobilă (ARMA, ARIMA)
Box & Jenkins (1970) au propus o metodologie de previziune a unei variabile, utilizând
ca şi bază de date doar trecutul şi prezentul acesteia. Aceste modele se bucură de o largă
popularitate datorită:
- calităţii previziunilor generate;
- flexibilităţii modelelor;
- rigurozităţii privind fundamentarea matematică a modelului;
- este o metodă adecvată şi pentru previziunea unor variabile cu o evoluţie
neregulată.
Observaţie: s-au introdus într-o perioadă în care modelele econometrice clasice, în
principal cele macroeconomice cu mai multe ecuaţii au condus frecvent la previziuni mai
slabe decât metodele simple univariante.
Un model de tip autoregresiv-medie mobilă ARMA(p,q) are o componentă de tip
autoregresiv respectiv o componentă de tip medie mobilă:
Yt = a 0 + a1Yt −1 + a 2Yt −2 + + a p Yt −p −b1εt −1 −b2 εt −2 − −bq εt −q +εt
unde p este ordinul părţii autoregresive, q ordinul mediei mobile iar εt este un proces de
tip zgomot alb (acesta fiind o succesiune de variabile aleatoare independente şi identic
repartizate, cu medie zero).
Atunci când q=0 se obtine modelul autoregresiv de ordin p, notat AR(p):
Yt = a 0 + a1Yt −1 + a 2Yt −2 + + a p Yt −p
iar pentru p=0, se obtine modelul medie mobilă de ordin q:
Yt = a 0 − b1εt −1 − b2 εt −2 − − bq εt −q + εt .
La baza elaborării unor astfel de modele stau următoarele considerente:
- evoluţia fenomenelor economice se află sub impulsul resurselor existente, a
capacităţilor deja create, a experienţei acumulate, a tradiţiei, obişnuinţei (spre exemplu în
consum). Variabilele din economie au caracter inerţial, fiind prezentă o puternică
componentă autoregresivă (în prinipal în evoluţia indicatorilor macroeconomici). Ar fi
imposibil de imaginat sore exemplu o economie în care datele din seria de timp ce redă
evoluţia preţului unui produs sunt extrase aleator dintr-o urnă. Partea autoregresiva
surprinde mecanismele interne de generare ale procesului;
- componentă de tip medie mobilă este efectul unor evenimente nepredictibile, asupra
variabilei, efecte asimilate treptat în timp. Această componentă este justificată prin
intervenţia unor schimbări bruşte, neaşteptate în rândul factorilor exteriori corelaţi cu
variabila (ex.greve, diverse ştiri, schimbarea bruscă a vremii → pentru varibile din
agricultură). Spre exemplu efectul unei ştiri importante, dar neaşteptate, privind
36
activitatea unei societăţi se va repercuta asupra cursului actiunilor sale la bursă în
următoarele săptămâni. Partea medie modilă surprinde asimilarea treptată a şocurilor
(abaterilor accidentale) din afara sistemului.
37
γ k E [ ( Yt − µ )( Yt − k − µ ) ]
rk = =
γ0 [
E ( Yt − µ )
2
], k∈Z
şi măsoară corelaţia liniară dintre două variabile Yt şi Yt-k separate de k unităţi de timp.
Pentru k=1 respectiv k=2 coeficientul de autocorelaţie devine
E [ ( Yt − µ )( Yt −1 − µ ) ]
r1 =
[
E ( Yt − µ )
2
]
E[ ( Yt − µ )( Yt − 2 − µ ) ]
r2 =
[
E ( Yt − µ )
2
]
Observaţii:
cov ( Yt , Yt −k )
rk =
Var ( Yt ) Var ( Yt −k )
1. → regăsim coeficientul de corelaţie liniară
dintre Yt şi Yt-k
2. rk ∈[ −1,+1]
3. γ 0 = E ( Yt − µ ) = Var ( Yt ) = σ 2
2
1 k = 0
rk = .
0 k≠ 0
variabille fiind necorelate.
Estimarea funcţiei de autocorelaţie este o etapă importantă în faza de identificare a
unui model de tip ARIMA modelului. Graficul funcţiei de autocorelaţie se numeşte
corelogramă şi oferă informaţii importane privind comportamentul seriei.
Estimarea funcţiei revine la calculul unor coeficienţi de autocorelaţie (corelaţie
liniară) pentru fiecare cuplu (Yt, Yt-k):
Prezintă importanţa calculul primelor T/4 autocorelaţii (spre exemplu, dacă lungimea
seriei este T=80 ⇒ M = 80/4 = 20).
38
µ şi varianţa σ 2 procesului pot fi estimate utilizând această singură realizare, prin
media respectiv varianţa de eşantionare:
T
1
Y =
T
∑Y
t =1
t
1 T
∑
s2 =
T t =1
(Yt − Y ) 2 .
r
Coeficientul de autocorelaţie k se estimează prin:
∑ (Y − Y )(Yt −k − Y ) /(T − k )
T
t
rˆk = t =k +1
∑ (Y −Y ) /T
T
2
t
t =1
respectiv
∑ (Y − Y )(Yt −k − Y )
T
t
rˆk = t =k +1
∑ (Y −Y )
T
2
t
t =1
dacă lungimea seriei este suficient de mare (şi astfel T-k nu diferă foarte mult de T).
1 1
[ ( )]
k −1
Var ( rˆk ) = 1 + 2∑ rˆi 2 = 1 + 2 rˆ12 + + rˆk2−1 .
T i =1 T
Decizia: pentru un nivel de semnificaţie α , ipoteza nulă H0 nu se respinge dacă
[
t calc ∈ [ − t tab , t tab ] sau echivalent rˆk ∈ − t tab Var ( rˆk ) , t tab Var ( rˆ k ) .
]
Observaţie. Uneori pentru varianţa estimatorului se utilizează expresia
Var ( rˆk ) = 1 / T (expresie adecvată de fapt doar atunci când seria este de tip zgomt alb).
ˆ
Astfel pentru T suficient de mare (pentru a putea aproxima legea ştudent prin legea
normală), o valoare absolută pentru coeficientul de autocorelaţie mai mare decât
1.96 / T (nivelul de semnificaţie fiind fixat la 5%) indică faptul ca acesta diferă
semnificativ de zero.
39
3.1.2. Funcţia de autocorelaţie parţială (PAC)
Deseori corelaţia intre doua variabile este determinată de faptul că ambele sunt corelate
cu o a treia variabilă. In acest context o mare parte din corelaţia intre două variable Yt şi
Yt-k poate apare urmare a unui efect indirect, de corelare a ambelor variabile cu variabilele
intermediare Yt −1 , Yt −2 , Yt −k −1 . Pentru a se evita acest fapt se utilizează coeficientul
de autocorelaţie parţială, acesta măsurând efecul direct al lui Yt-k asupra variabilei Yt (se
izolează influenţa variabilei Yt-k). Definitia acestuia este similară cu a coeficientului de
corelaţie parţială din econometrie.
Coeficientul de autocorelaţie partială între două variabile separate de k unităţi de timp
notat prin c k este coeficientul de regresie a variabilei Yt −k în modelul autoregresiv
AR(k):
Yt = a 0 + a1Yt −1 + a 2Yt −2 + +c k Yt −k +εt
şi măsoară informaţia adiţională adusă de variabila Yt −k în exoplicarea
comportamentului prezent Yt (cu câte unităţi se modifică Yt dacă Yt −k creşte cu o
unitate iar celelalte variabile Yt −1 , Yt −2 , Yt −k −1 rămân nemodificate). Astfel,
coeficientul de autocorelaţie parţială măsoară corelaţia între Yt şi Yt −k , în condiţiile în
care celelalte variabile Yt −1 , Yt −2 , Yt −k −1 sunt menţinute constante (se izolează
influenţa variabilei Yt −k ). Astfel, coeficientul de autocorelaţie parţială între Yt şi Yt −2
, adică c 2 , este egal cu coeficientul de autocorelaţie r2 dacă Yt şi Yt −2 sunt ambele
necorelate cu Yt −1 .
Funcţia de autocorelaţie parţială constă în setul de coeficienţi c k , unde k=1, 2, 3, .....
Pentru k=1 coeficientul de autocorelaţie şi coeficientul de autocorelaţie parţială coincid
r1 = c1 . Coeficienţii de autocorelaţie parţială înregistrează valori între -1 şi 1.
40
Testarea semnificativităţii coeficineţilor de autocorelaţie parţială
Testarea semnificativităţii coeficientului de autocorelaţie parţială c k :
H0 : c k = 0 (nu diferă semnificativ de zero)
H1 : c k ≠ 0
se realizează utilizând statistica Student
rˆk
t= converge asimtotic (când T → ∞ ) la legea normală
Vˆar ( rˆk )
N (0,1) .
Pentru varianţa estimatorului coeficientului de autocorelaţie parţială se următoarea
expresie:
1
Var ( cˆ k ) = .
T
Decizia: pentru un nivel de semnificaţie α , ipoteza nulă H0 nu se respinge dacă
[ ]
t calc ∈ [ − t tab , t tab ] sau echivalent cˆk ∈ − t tab / T , t tab / T .
41
φ( L )Yt = θ ( L )ε t
unde φ( L ) =1 − a1 L −a2 L − − a p L iar θ( L) = 1 − b1 L − − bq L sunt polinoame
2 p q
de gradul p respectiv q în L.
Cât de generale sunt aceste modele? Teorema de reprezentare a lui World arată că
orice proces staţionar poate fi scris ca şi un proces de tip medie mobila cu un număr
infinit (mare) de termeni.
Dacă seria este nestaţionară şi devine stationară după d diferenţieri,
Xt ∈ ARIMA(p,d,q) (adică ∆ X t = (1 − L) X t ∈ ARMA(p,q)) foma restrânsă este:
d d
φ( L ) (1 − L) d X t = θ ( L )ε t .
Caz particular: mersul aleator ARIMA(0,1,0).
Există două modalităţi de generare a unor serii nestaţionare.
a) Seriile nestaţionare în medie cu tendinţă deterministă polinomială devin staţionare
dacă sunt diferenţiate de un număr de ori egal cu gradul polinomului de tendinţă.. De
regulă seriile din economie devin taţionare după una sau două diferenţieri (astfel d=1 sau
d=2). Spre exemplu daca seria are o tendinţă deterministă liniară atunci seria devine
staţionară după o singură diferenţiere:
Yt = a + bt + ε t
∆Yt = b + ∆ε t
unde εt este un proces staţionar (prin urmare şi ∆εt ). In acest caz valorile fluctuează în
jurul unei drepte, sunt staţionare relativ la dreapta de tendinţă. Dacă seria are o tendinţă
polinomiala de gradul 2 atunci sunt necesare două diferenţieri pentru ca seria să devină
staţionară. Dacă seria este staţionară relativ la o tendinţă deterministă se spune ca seria
este staţionară relativ la tendinţă.
O alta modalitate de transformare a acestora în serii staţionare constă în extragerea
tendinţei deterministe din date (dupa estimarea ei prin functii elemenare).
b) Un alt tip de proces nestaţionare este generat de de o ecuaţie de tipul AR(1) unde
coficientul variabilei este unu:
Yt = Yt −1 + εt sau Yt = a 0 + Yt −1 + ε t
εt fiind zgomot alb. Acesta se numeşte mers aleator şi în evoluţia acestuia se observă
periade cu aparente tendinţe de creştere sau descreştere care apoi îşi schimbă brusc,
nepredictibil direcţia. Spunem că un astfel de proces are tendinţă stochastică, fiind
rezultatul acumulării unor socuri aleatoare ce nu au o baza sistematică. Aceste evoluţii
sunt specifice variabilelor financiare şi în principal seriilor ce redau evoluţia cursului
unor acţiuni. Varianţa unui proces de tip mers aleator fară termen liber nu este constantă
şi creşte odată cu t iar pentru forma cu termen liber atât media cât şi varianţa variază în
timp (cresc odată cu t). Spre exemplu daca valoarea de pornire la momentul t=0 este Y0
atunci:
Yt = ε t + ε t −1 + ε t −2 + ... + ε1 + Y0
iar varianţa creşte odată cu t, deoarece Var ( Yt ) = tσ ε .
2
42
Polinomul in L asociat părţii autoregresive din modelulul AR(p):
φ( L )Yt = εt
(1 − L )Yt = εt
1− χ = 0 ⇒ χ =1
are o singură rădăcină pe cercul unitate (în modul egală cu 1). Seria este staţionară prin
diferenţiere sau este integrată de ordinul 1 (sau are o radăcină unitate, „unit root”), şi se
notează prin I(1). Rădăcinile unitate, adică rădăcinile polinomului autoregresiv ce se află
pe cercul unitate se referă doar la comonenta stochastică a seriei. Majoritatea seriilor din
economie sunt nestaţionare în medie Yt dar diferenţa de ordin întâi
Z t = ∆Yt = Yt − Yt −1 = (1 − L)Yt devine staţionară. Dacă sunt necesare două diferenţieri
succesive pentru ca seria să devină staţionară:
∆2Yt = ∆Z t = (Yt − Yt −1 ) − (Yt −1 − Yt −2 ) = Yt − 2Yt −1 + Yt −2 = (1 − L ) 2 Yt
spunem că seria este integrată de ordin doi I(2).
In general, un proces (serie) este integrat de ordin d, notat prin I(d), dacă este necesar
a fi diferenţiat de d ori până devine staţionară; Z t = ∆d Yt = (1 − L) d Yt este staţionară.
Modelele de tip ARIMA acoperă o clasă largă de procese nestaţionare. Atât seriile cu
tendinţă deterministă polinomiala cât şi cele cu tendinţă stochastică pot fi transformate în
serii staţionare prin diferenţiere.
a) Funcţia de autocorelaţie
Considerăm un model autoregresiv de ordinul unu AR(1) sau ARIMA(1,0,0):
Yt = a 0 + a1Yt −1 + εt unde a1 <1
iar εt este zgomot alb cu media E ( ε t ) = 0 şi varianţa Var (ε t ) = σ ε2 . Procesul este staţionar
dacă coeficientul a1 <1 .
Observaţii. a) Dacă a1 >1 procesul este nestaţionar, şi are o evoluţie explozivă,
exponenţială. Un asemenea comportament este rar întâlnit în practică (creştere
exponenţiala, pe termen nelimitat).
b) Dacă a1 = 1 regăsim mersul aleator.
c) Pentru procesul este de tip zgomot alb de medie a0 .
Fără a restrânge generalitatea considerăm un model autoregresiv de ordinul unu AR(1) cu
medie zero (dacă media procesului µ este diferită de zero se realizează substituţia
X t = Yt − µ ) :
Yt = a1Yt −1 +εt unde a1 <1 .
Proprietate. Dacă a1 <1 atunci procesul AR(1)este staţionar. Funcţia de
autocorelaţie a unui proces autoregresiv de ordinul unu AR(1) are expresia:
rk = a1k .
Demonstraţie.
43
Yt = ε t + a1Yt −1 = ε t + a1 ( a1Yt −2 + ε t −1 ) = ε t + a1ε t −1 + a1 Yt −2 =
2
t −1
= ε t + a1ε t −1 + a1 ( a1Yt −3 + ε t −2 ) = = ε t + a1ε t −1 + a1 ε t −2 + a1 ε t −3 + + a1t −1ε 1 = ∑ a1j ε t − j
2 2 3
j =0
Astfel:
• E(Yt) = 0 (erorile au media zero), deci independentă de t
• Cov (Yt , Yt −k ) = Cov (Yt , Yt +k ) = E (Yt Yt +k ) − E (Yt ) E (Yt +k ) = E (Yt Yt +k ) =
( )(
= E ε t + a1ε t −1 + + a1t −1ε1 ε t +k + a1ε t +k −1 + + a1t +k −1ε1 = )
= E (ε + a ε
t 1 t −1 + + a1t −1ε 1 )(ε t +k + a1ε t + k −1 + + a1k ε t + a1k +1ε t −`1 + a1k + 2 ε t −`2 + + a1t + k −1ε 1 )
= E( a ε + a
k
1 t
2 k +2 2
1 ε
t −1 ) ( ) (
+ + a1k + 2( t −1) ε 12 = σ ε2 a1k + + a1k + 2( t −1) = σ ε2 . a1k 1 + + a12( t −1) . )
Covarianţa devine:
2 k 1 − a12t
σ ε a1 2 , a1 ≠ 1
Cov (Yt , Yt −k )= 1 − a1
σ 2 t , a1 = 1
ε
a1k
atunci cov( Yt , Yt + k )
t→ ∞
Dacă a 1 <1 → γ k = σ 2
independentă de t.
ε
1 − a12
1
Var ( Yt ) = γ 0 = σ ε2
• 1 − a12 fiind independentă de t.
Observatie. In cazul a1 =1 regasim varianţa unui proces nestaţionar de tip mers
aleator.
44
1 − xa 1 =0 rezultă , adică x = 1 / a1
Operatorul L face posibila scrierean succintă a unui filtru cu un număr infinit de termeni.
Spre exemplu pentru AR(1) rezultă:
1
(1 − a1 L)Yt = ε t = (1 + a1 L + a12 L2 + )ε t =
1 − a1 L
= ε t + a1ε t −1 + a12 ε t −2 +
iar condiţia de stabilitate a procesului revine la condiţia de convergenţă a seriei formată
∞
cu coeficienţii filtrului ∑a
i =1
i
1 ; regăsim aceeaşi condiţie de stabilitate, seria fiind
( rădăcini reale sau complexe) sunt în modul mai mari decât unu (se mai spune ca sunt in
exteriorul cercului unitate) .
a) Funcţia de autocorelaţie
Considerăm un model medie mobilă de ordinul unu MA(1) sau ARIMA(0,0,1) cu medie
zero:
Yt = εt − b1εt −1
Proprietate. Un model de tipul MA(1) este staţionar iar funcţia sa de autocorelaţie se
anulează pentru k ≥ 2 .
Demonstraţie. Media procesului este nulă: E( Yt ) = E ( ε t ) − b1E( ε t −1 ) = 0
Varianţa procesului:
45
Var ( Yt ) = σ ε2 (1 + b12 )
deoarece:
( )
V ar( Yt ) = E Yt − [ E ( Yt ) ] = E ( Yt 2 ) = E [ ( ε t − b1ε t −1 )( ε t − bε t −1 ) ] =
2 2
0, k ≥ 2
rk = b1
− 1+ b2 , k = 1
1
Semnul coeficientului de autocorelatie r1 este invers semnului lui b1 .
46
- b k + b1b k + 1 + . . .+ b q-k b q
p e n t rku= 1, 2, . . .q,
rk = 1 + b12 + b22 + . . .+ bq2
0 p e n t rku≥ q + 1
Funcţia de autocorelatie parţială a unui model medie mobilă se comportă in mod similar
cu funcţia de autocorelaţie a modelelor autoregresive.
Dacă procesul are medie nenulă atunci modelul include şi un termen liber, acesta
fiind egal cu media:
Yt = m + εt − b1εt −1 − − bq εt −q
deoarece E ( Yt ) = m + 0 + + 0 = m .
3.4. Etapele elaborării unui model ARIMA (autoregresiv integrat medie mobilă)
Estimarea
Identificare NU
parametrilor Teste de validitate Previziuni
model DA
modelului
47
stabilire valori ai, bi = ? -rez. zgomot alb
p,q,d - semnif. coef.
Observaţie. Dacă seria este uşor nestaţionară şi în varianţă este indicat, inainte de
modelare, a se logaritma datele iniţiale, reducând astfel amplitudinea fluctuaţiilor seriei.
Se va lucra în continuare cu datele logaritmate. De regulă seriile din domeniul financiar
au un astfel de comportament.
48
Yt = εt − b1εt −1 0şi < 0 dacă b1 > 0); sinusoidal dacă b1 < 0
rk = 0, ∀k ≥ 2
MA(2) r1 , r2 semnificativ descreşte exponenţial sau
Yt = ε t − b1ε t −1 − b 2ε t −2 rk = 0, ∀k ≥ 3 sinusoidal. Forma exactă
depinde de semnul şi
valoarea coeficienţilor b1,
b2
MA(q) r1 , , rq semnificativi descreşte exponenţial sau
Yt = εt − b1εt −1 − − b q εt −q rk = 0, ∀k ≥ p+1 sinusoidal. Forma funcţiei
depinde de semnul şi
valoarea coeficienţilor b1,
…, bq
ARMA(1,1) descreşte exponenţial. descreşte exponenţial
Yt = a1Yt −1 +εt −b1εt −1 Semnul lui r1 depinde de cel dacă b1 > 0 respectiv
al diferenţei a1–b1 sinudoidal dacă b1 < 0
49
respectiv a unui model ARIMA(p,q):
φ( L ) (1 − L) d X t = θ ( L )ε t .
Considerăm un model AR ( p ) :
Yt = a1Yt −1 + + a p Yt −p +εt
50
presupune că erorile din model sunt o succesiune de variabile aleatoare independente,
identic repartizate, cu medie zero şi normal distribuite. Ipoteza normalităţii erorilor
ε t ∈ N (0, σ ε2 ) este necesară pentru a putea specifica o formă funcţională a funcţiei de
verosimilitate.
Funcţia de verosimilitate asociată seriei observaţiilor Y=(Y1, …, YT ) este:
2 − T /2 − 1/ 2 1 ' −1
(2π ε ) d Ωe(ait,bi[) ] e x− σ p2 Y {[Ω (ai ,bi ) ]Y
2σ ε
Maximizarea acesteia conduce la valori pentru coeficienţii ai , bi ce asigură cea mai mare
probabilitate de apariţie a observaţiilor Y1, …, YT.
51
b) Teste privind reziduurile
Dacă modelul este bine specificat, atunci reziduurile din modelul estimat sunt generate de
un proces de tip zgomot alb (succesiune de variabile aleatoare independente, identic
repartizate), cu medie zero şi normal distribuit.
Autocorelarea reziduurilor. Pentru detectarea unor dependenţe în seria reziduurilor se
examinează funcţia de autocorelaţie r̂k şi de autocorelaţie parţială ĉ k a reziduurilor.
Dacă reziduurile sunt necorelate, atunci aceşti coeficienţi nu trebuie să fie semnificativ
diferiţi de zero.
rˆk
Se utilizează statistica student t = ce converge asimtotic la legea normală
Vˆar ( rˆk )
N (0,1) , cu varianţa estimatorului coeficientului de autocorelaţie estimat prin
1
Var ( rˆk ) = . Pentru un nivel de semnificaţie α = 5% , ipoteza necorelării reziduurilor nu
T
se respinge dacă t calc ∈[ −1.96 ,1.96 ] sau echivalent rˆk ∈ −1.96 / T , 1.96 / T . [ ]
Identic decurge şi testarea semnificativităţii autocorelaţiilor parţiale ale reziduurilor.
Se utilizează aici şi teste mai puternice de autocorelaţie, fiind teste globale de
semnificativitate a coeficienţilor de autocorelaţie a reziduurilor, testându-se o ipoteza de
forma:
H 0 : r1 = r2 = ... = rM = 0
H 1 : ∃k ∈[1, M ] pentru care rk ≠ 0
Testul Ljung-Box sau statistica Q:
M rˆj2
Q = T (T + 2)∑ ∈ χ 2 ( M − p − q)
j =1 T−j
Dacă Qcalc > χ 2
tab atunci se respinge ipoteza nulă, fiind necesară respecificarea
modelului. Atunci când Q nu diferă semnificativ de zero, primele M autocorelaţii sunt
nesemnificative. In practica M se consideră arbitrar, sugerându-se valori între 10 şi 20.
Investigarea normalităţii reziduurilor. Coeficientul de asimetrie α̂3 respectiv de
boltire α̂4 şi analiza histogramei oferă o primă imagine asupra formei distribuţiei
erorilor. Coeficienţii de asimetrie respectiv boltire sunt calculaţi în baza momentelor
centrate:
µˆ 3 µˆ
αˆ 3 = 3 ;
αˆ 4 = 44
σˆ σˆ
unde µ̂j este momentul centrat de ordin j.
Pentru testarea normalităţii erorilor se recomandă, în literatura de specialitate,
utilizarea testului Jarque-Bera (1981), bazat pe coeficienţii de asimetrie şi boltire.
Valoarea calculată a acestei statistici este furnizată implicit de majoritatea softurilor odată
cu alte statistici descriptive. Dacă un eşantion de T observaţii provine dintr-o distribuţie
normală atunci coeficientul de asimetrie calculat în baza observaţiilor urmează asimptotic
legea normală N(0, 6/T) iar coeficientul boltirii legea N(3,24/T). Jarque şi Bera obţin prin
însumarea celor două variabile normale independente statistica:
1 1
JB = Tαˆ 32 + T (αˆ 4 − 3) 2 ∈ χ 2 (2) ,
6 24
52
ce urmeaza legea χ 2 ( 2) . Valoarea critică corespunzătoare nivelului de semnificaţie α se
determină din tabelul de distribuţie a legii χ 2, numărul gradelor de libertate fiind 2. Zona
critică este P ( JB > χα2 ) = α .
Investigarea heteroscedasticităţii reziduurilor. Testul multiplicatorilor lui
Lagrange pentru heteroscedasticitate de tip ARCH(p) presupune:
- estimarea reziduurilor et = ε̂t din ecuaţia ce defineşte modelul;
- estimarea regresiei auxiliare (ce fundamentează testul):
et2 = α0 + α1et2−1 + ... +α p et2− p ;
- testarea ipotezei nule în ecuaţia de regresie auxiliară:
H o : α1 = α 2 = ... = α p = 0 (nu există efect ARCH).
Odată elaborat şi validat, modelul ARIMA este utilizat pentru generarea de previziuni. Se
elaborează:
a) previziuni punctuale
b) intervale de previziune.
a) Previziuni punctuale
53
- termenii eroare εT +h −i pentru h − i > 0 (adică εT +1 , εT +2 ... ) se înlocuiesc cu
zero, (se înlocuiesc cu media acestora E ( ε T +S = 0 ) , deoarece erorile sunt de tip
zgomot alb, cu media 0; previziunile optime sunt date de media acestora).
- termenii eroare εT +h −i pentru h − i < 0 (adică εT −1 , εT −2 ... ) se înlocuiesc cu
reziduurile estimate din model (spre exemplu εt = Yt −Yˆt , pentru t < T ) .
Dacă seria a fost diferenţiată / logaritmată în prealabil atunci se va ţine seama ca acest
aspect în elaborarea previziunii (de regulă se aplică operaţia inversă transformării). In
general este utilă scrierea concentrată a modelului, utilizând operatorul de diferenţiere L.
Yt = ε t + c1ε t −1 + c 2ε t −2 + ...
sau
Yt = C ( L )ε t
unde C ( L) = 1 + c1 L + c 2 L2 + ... este polinomul coeficienţilor.
54
θ ( L)
Din forma redusă a modelui ARMA φ( L )Yt = θ ( L )ε t rezultă Yt =
ε t , astfel
φ( L )
coeficienţii polinomului C se obţine egalând coeficienţii termenilor de forma Lj , j=1,2,…
în egalitatea φ( L)C ( L ) =θ( L) .
Utilizând forma medie mobilă:
Yt = ε t + c1ε t −1 + c 2 ε t − 2 + ...
YT +h = c h εT +c h +1εT −1 +...
rezultă eT +h = YT +h −YT +h = εt + c1εt −1 + c 2 εt −2 +... − (c h εT + c h +1εT −1 +...)
h −1
V ( eT + h ) = σ ε2 1 + ∑ c 2j .
j =1
Pentru dispersia erorii de previziune σε se utilizează estimaţia sa σˆ ε2 .
2
3.5.1. Modele de tip autoregresiv medie mobilă pentru evoluţii sezoniere SARIMA
Notăm prin s perioada componentei sezoniere. Dacă seria este nestaţionară relativ la
componenta sezonieră (amplitudinea oscilaţiilor creşte sau scade în timp) atunci se
determină diferenţele sezoniere de ordin 1:
X t = Yt −Yt −s
In general se norează cu D numărul de diferenţieri sezoniere necesare pentru a
staţionaliza componenta sezonieră (de regulă D=1).
Etapa de identificare:
1. se identifică o combinaţie de valori plauzibile pentru d şi D care
staţionalizează seria;
2. din graficele funcţiilor de autocorelaţie respectiv autocorelaţie parţială a
seriei diferenţiate (care este staţionară) se identifică valori plauzibile
pentru gradele polinomului autoregresiv p, polinomului medie mobilă q
respectiv pentru gradele polinomului autoregresiv sezonier P şi a
polinomului medie mobilă sezonier Q:
φ( Ls ) = 1 − a1 Ls − a 2 L2 s − − a P LPs iar θ ( Ls ) = 1 − b1 L2 s − − bq LQs .
Notaţia generală SARIMA(p,d,q)(P,D,Q). Ordinele polinoamelor
sezoniere P, Q sunt identificate în mod similar cu p, q
analizând funtiile de autocorelaţie rk respectiv de autocorelaţie parţială c k
pentru k=s, 2s, ....
55
In abordarea tradiţională de tip Box-Jenkins previziunile sunt bazate pe media
condiţionată a variabilei E (Yt | Yt −1 , Yt −2 ,...) . Abordarea de tip ARCH ia în
considerare, în elaborarea previziunilor, şi informaţiile conţinute în varianţa condiţionată
a procesului (momentul condiţionat de ordinul doi). Este specific seriilor cu varianţă
variabilă în timp (nestaţionare relativ la varianţă). Erorile nu au aceeaşi varianţă (adică nu
verifică condiţia de homoscedasticitate) intervale de timp cu erori de preziune mari (în
perioade de instabilitate economicâ) fiind urmate de intervale cu valori mici. Engle
(1982) a introdus pentru prima dată acest tip de modele, considerând că varianţa erorii
depinde de termeni de tipul Yt −i şi εt −i .
2
Avem aici două tipuri de ecuaţii: ecuaţia mediei condiţionate ce poate include şi
variabile exogene respectiv ecuaţia varianţei condiţionate.
Analiza evoluţiei pe termen lung a variabilelor financiare sau economice, relevă
deseori faptul ca varianţa acestora variază în timp. Modelele de tip ARCH sunt o clasă de
modele populare în domeniul financiar (evoluţia ratei inflaţiei, ratei dobânzii, ratei rentabilităţii
activelor ş.a.). Volatilitatea ridicată apare deseori în perioade cu turbulenţe politice sau
economice sau ca răspuns la anumite evenimente punctuale.
Dedependenţa de timp a varianţei empirice în seria ratei rentabilităţii acţiunilor a
fost observată pentru prima dată de Kendall (1953), seria de timp disponibilă atunci fiind
împărţită în două subeşantioane de date, în scopul analizei omogenităţii varianţei în timp.
Autorul observa: “este o situaţie neobişnuită pentru o serie de timp: media rămâne
constantă dar varianţa pare a creşte în timp”. În consecinţă spre exemplu în modelul de
tip mers aleator, pentru logaritmul indicelui Pt preţului acţiunilor p t = ln Pt , erorile,
egale cu ratele rentabilităţii ( rt ≡ ∆pt ) nu au mai fost considerate identic distribuite:
p t = p t −1 + rt , rt ∈ N (o, σ t2 )
56
Studiile empirice au arătat însă că o reprezentare adecvată necesită un p destul de
mare. Pentru evitarea numărului mare de parametri necesar a fi estimaţi, Bollerslev
(1986) a propus o formă mixtă analoagă cu cea din procesele autregresive – medie mobilă
(notaţia consacrată GARCH):
p q
var( rt / Rtp−1 ) = ht = ω + ∑α i ε t2−i + ∑ β i ht2−i .
i −1 i −1
unde p este ordinul părţii medie mobile ARCH (unde intervin pătratele reziduurilor din
ecuaţia mediei) iar q ordinul parţii autoregresive GARCH. Varianţa condiţionată este
varianţa erorii εt , din ecuaţia mediei, condiţionată de informaţiile disponibile:
σt2 = Var (εt / εt −1 ,..., εt −p )
= E (εt2 / εt −1 ,..., εt −p )
Astfel, este necesar aici a se specifica două grupe de ecuaţii: ecuaţia mediei
condiţionate respectiv ecuaţia varianţei condiţionate. Exemplele clasice sunt modelul
ARMA(p,q) cu erori heteroscedastice GARCH:
y t ∈ ARMA( p, q )
2
σ t ∈ GARCH ( p' , q ' )
sau regresia cu erori heteroscedastice GARCH (scriere matricială):
y = Xb + ε
2
σ t ∈ GARCH ( p' , q ' )
În specificarea unei forme GARCH pentru varianţă sunt utile instrumentele
utilizate pentru identificarea ordinului părţii autoregresive p respectiv medie mobilă q
57
relativ la modelele ARMA(p,q). Variabila pentru care dorim specificarea unui model de
2
această formă este în acest context pătratul reziduurilor et .
58
modelului dar şi respecificarea părţii nesistematice, adică a erorii. Această ultimă soluţie
se are în vedere în cele ce urmează. Există implementate în softurile statistice proceduri
de estimare adecvate pentru estimarea unor modele de regresie cu erori de tip ARMA.
Metoda celor mai mici pătrate în două etape notată TSLS în EViews este adecvată
pentru estimarea unui model de regresie cu erori autocorelate sau a unor modele în care
există corelaţii între variabilele explicative şi termenul eroare. Ca şi variabile explicative
pot figura aici şi termeni de tip autoregresiv pentru variabila dependentă. Această metodă
se bazează pe metoda variabilelor instrumentale; se caută aici alte variabile explicative
care să fie corelate cu variabilele explicative iniţiale dar necorelate cu eroarea. Atunci
când se estimează modele cu erori ARMA in Eviews sunt incluse automat ca şi variabile
instrumentale termenii de tip autoregresiv pentru variabila dependentă respectiv pentru
variabilele independente, corespunzători ordinului speficat pentru eroare.
59
b) serii nestaţionare generate de un proces pentru care polinomul autoregresiv din
reprezentarea autoregresivă AR(p) are rădăcini unitare (are radacini unitate „unit root”,
sau pe cercul unitate). Spunem că seria este staţionară prin diferenţiere DS („differency
stationary”) sau că are tendinţă stochastică (seria „hoinăreşte”); seria are radacină
unitate. Exemplul tipic aici este mersul aleator Yt = Yt −1 + εt . Polinomul in L asociat
părţii autoregresive φ( L ) din modelulul AR(p):
φ( L )Yt = ε t unde φ( L ) =1 − L
(1 − L )Yt = εt
1− x = 0 ⇒ x =1
il are pe unu ca şi rădăcină. Multe serii din economie au un comportament de mers
aleator, Yt este nestaţionară dar ∆Yt = εt devine stationară. Dacă este necesar a se
diferenţia seria de d ori până devine staţionară, Z t = ∆d Yt = (1 − L) d Yt fiind staţionară,
polinomul autoreresiv îl are pe 1 ca şi rădăcină multipla de ordin d si spunem că seria este
integrată de ordin d, notând I(d).
60
AR(1). Varianta a1 >1 corespunde unor procese explozive, ce nu-şi găsesc
aplicabilitate.
Ipoteza nulă din testul Dickey-Fuller este o ipoteză privind semnificativitatea
coeficientului termenului Yt −1 :
H0 : α = 0
H1 : α < 0
în ecuaţia de regresie ∆Yt = αYt −1 + εt , unde α = a1 − 1 . “Raportul Student”
α ˆ ) aferent coeficientului α , utilizat în mod obişnuit pentru testarea unei
ˆ / var( α
ipoteze relativ la un coeficient de regresie, nu urmează legea Student. Distribuţia
asimptotică a acestei variabile a fost studiată de către Dickey (1975) şi Fuller (1976), iar
mai recent MacKinnon (1991) obţine prin simulare valori critice mai precise. Pentru un
nivel de semnificaţie de 5% spre exemplu, valoarea critică rezultată este –1.95:
P( DF < −1.95 ) = 0.05 .
Menţionăm că valoarea critică, pentru acest nivel de semnificaţie, este de –1.64 în cazul
legii normale P ( z < −1.64 ) = 0.05 , astfel că utilizarea testului z sau t în testarea
ipotezei H 0 conduce prea frecvent la respingerea ipotezei nule.
Distribuţia asimptotică a statisticii t de tip Student diferă după cum se include sau
nu o constantă în regresie. In cazul prezenţei unei constante în forma autoregresivă:
Yt = a 0 + a1Yt −1 + ε t
testul privind semnificativitatea coeficientului a1 se realizează în ecuaţie
∆Yt = a 0 + αYt −1 + ε t (V2)
Deasemenea o altă variantă interesantă a testului faciliteaza alegerea între un
process nestaţionar cu tendinţă stochastică (proces integrat) şi unul cu tendinţă
deterministă. Aceasta se realizează prin testarea ipotezei de rădăcină unitate:
H 0 : a1 =1
H 1 : a1 <1
pentru un proces de tipul:
Yt = a + bt + a1Yt −1 + εt .
Testarea ipotezei anterioare este echivalentă şi aici cu o ipoteză privind semnificativitatea
coeficientului lui Yt −1 în ecuaţia de regresie:
∆Yt = a + bt + αYt −1 + ε t (V3)
Fuller (1976) a studiat comportamentul asimptotic al statisticii t şi în acest caz obţinând,
prin simulare, valorile critice corespunzătoare acestei variante a testului. Spre exemplu la
un nivel de semnificaţie de 5% valoarea critică obţinută este de –3.41:
P ( DF < −3.41 ) = 0.05 .
Acest test facilitează selecţia între două procese nestaţionare de tipul:
Yt = a + bt + Yt −1 + ε t , respectiv
Yt = a + bt + a1Yt −1 + εt , cu a1 <1 .
Procesul generat de prima ecuaţie conţine o rădăcină unitate ( ρ =1) , seria are tendinţă
stochastică. Cel de-al doilea proces aleator, pentru care a1 <1 , nu are rădăcină unitate
şi este obţinut prin însumarea dintre o tendinţă deterministă liniară şi un proces staţionar
de tip autoregresiv AR(1); seria este astfel staţionară în jurul unei tendinţe deterministe
liniare.
61
Distribuţiile asimtotice anterioare sunt valabile în ipoteza în care εt este de tip zgomot
alb. Altfel este necesară o abordare ce ţine seama şi de autocorelaţiile reziduurilor din
ecuaţia de regresie în care se testează semnificativitatea coeficientului lui Yt −1 .Un
proces AR(1) cu erori autocorelate de ordin p-1 poate fi pus într-o reprezentare AR(p) cu
erori de tip zgomot alb. Se ţine seama apoi de reprezentarea de tip Sims-Stock-Watson
(1990) a unui model AR(p), scrisă utilizând diferenţele de ordinul unu, din care se obţine
forma generală a ecuaţiei de regresie utilizate în forma generală a testului.
În forma generală, testul Dickey-Fuller îmbunătăţit ADF (Augmented Dickey-Fuller)
se efectuează relativ la coeficientul termenului Yt −1 :
H0 : α = 0
H1 : α < 0
în ecuaţia de regresie următoare:
p −1
∆Yt = a + bt + αYt −1 + ∑ βi ∆Yt −i + ε t .
i =1
Distribuţiile asimtotice şi deci valorile critice sunt specifice fiecărei variante. Valorile
critice nu depind însă de numărul de întărzieri p.
Decizia asupra ipotezei nule, un anumit nivel de semnificaţie:
62
- dacă seria nu are o tendinţă vizibilă şi are medie diferită de zero, se aplică varianta
(V2) respectiv
- dacă seria fluctuează în jurul lui zero se aplica testul în varianta (V1).
După aplicarea testului este indicat a se examina şi semnificativitatea coeficienţilor de
regresie (din ecuaţia de regresie aferentă testului aplicat) în principal atunci când nu
suntem siguri asupra variantei adecvate respectiv asupra valorii lui p. Dacă se consideră
necesar, se poate aplica din nou testul cu o altă specificare pentru ecuaţia de regresie.
Pentru alegerea odinului p se poate utiliza de asemenea criteriile de informaţie (AIC,
SC,...)
Dacă ipoteza nulă nu este respinsă atunci se aplica în continuare testul DF pentru
detectarea rădăcinii unitate în diferenţele de ordin unu. Pentru determinarea ordinului de
integrare se aplică testul succesiv pentru datele iniţiale, diferenţele de ordin unu şi
eventual doi; seriile din domeniul economic necesită de regulă o singură diferenţiere.
Dacă pentru datele iniţiale H0 se acceptă, iar pentru datele diferenţiate ∆Yt ipoteza nulă
H0 se respinge ⇒ Yt e nestaţionar dar diferenţele de ordin 1 sunt staţionare ⇒ Yt este
integrată de ordin 1 sau Yt ∈I(1). Dacă ipoteza nulă H0 se acceptă atât pentru datele
iniţiale Yt cât şi pentru cele difererenţiate ∆Yt dar se respenge pentru datele de două ori
dioferenţiate ∆ Yt ⇒ seria este integrată de ordinul doi sau Yt ∈I( 2).
2
63
Diferenţele de ordin unu pentru ambele tipuri de procese:
Yt = a + bt + u t , u t = u t −1 + ε t ;
Yt = a + bt + u t , u t = ρu t −1 + εt , cu ρ <1 ,
sunt staţionare:
∆Yt = b + ε t , respectiv
∆Yt = b + ∆u t .
Prin urmare, prin analiza seriilor diferenţiate nu se poate face distincţie între cele două
tipuri de nestaţionalitate. Există o diferenţă esenţială între cele două serii de timp:
- dacă seria conţine rădăcini unitate atunci şocurile ( εt ) asupra seriei sunt permanente,
deoarece (Johnston şi DiNardo, 1994): u t +s = ut −1 +εt . Dacă o serie macroeconomică
este de tip DS atunci impactul şocurilor conjuncturale are un efect permanent asupra
nivelului seriei. Originea nestaţionalităţii unui mers aleator constă în acumularea de
şocuri aleatoare, deoarece: Yt = ε t + ε t −1 + ε t −2 + ... + ε1 + Y0 ;
- în cazul seriilor staţionare relativ la tendinţă influenţa şocurilor asupra următoarelor
abateri de la tendinţa deterministă se diminuează în timp: u t +s = u t −1 + ρ s ε t .
Pentru a detectarea naturii tendinţei unei serii nestaţionare se poate utiliza varianta V3
a testului ADF:
p −1
∆Yt = a + bt + αYt −1 + ∑ βi ∆Yt −i + ε t (V3)
i =1
H0 : α = 0
H1 : α < 0
Dacă H0 se acceptă ⇒ seria are rădăcină unitate ⇒ seria are tendinţa stochastică. Dacă
H0 se respinge seria nu are rădăcină unitate, prin urmare nu are tendinţă stochastică.
Pentru a detecta prezenţă unei tendinţei deterministe se va testa semnificativitatea
coeficientului de regresie b în ecuaţia de regresie aferentă testului aplicat V3, utilizând
testul Student clasic. De asemenea dacă se estimează tendinţa deterministă iar reziduul
este staţionar atunci seria este stationară relativ la tendinţă.
64
Existenţa sau nu a unei rădăcini unitate într-o serie nestaţionară determină natura
tendinţei. Cunoaşterea naturii tendinţei unei variabile nestaţionare este importantă în
previziune respectiv în modelarea econometrică. Staţionalitatea/nestaţionalitatea
respectiv detectarea naturii nestaţionalităţii determină tipul de modelare şi proprietăţile
asimtotice ale metodelor econometrice de estimare.
Noţiunea de cointegrare este strâns legată de cea de „regresii false” cu serii de timp.
Atunci când se estimează regresii cu serii de timp în economie deseori din R2 este mare
(R → 1) iar statistica Durbin-Watson este mică DW → 0 (erorile sunt corelate). In
general, R → 1, DWcalc → 0 şi R2 > DWcalc poate fi un semnal ca regresia este falsă;
dependenţa este exagerată iar estimatorii sunt suspecţi. Aceasta se întâmplă deoarece
variabilele din economie sunt deseori nestaţionare şi se comportă ca şi un proces de tip
mers aleator (au rădăcină unitate). Dacă două serii sunt I(1) atunci deseori se respinge
ipoteza inexistenţei unei relaţii între ele chiar când aceasta un există. Generând două serii
de tip mers aleator independente şi estimând ecuaţia de regresie dintre ele, Engle şi
ranger au observat că ipoteza conform căreia panta dreptei de regresie este
nesemnificativă s-a respins în 76% din cazuri, utilizând testul t; au sugerat ca regresia să
fie estimată pentru seriile diferenţiate.
Pentru a exista o relaţie pe termen lung între variabile, acestea trebuie să fie
cointegrate. Un test de cointegrare poate fi aplicat, pentru a se evita regresiile false. Un
este indicat a se estima regresii cu serii de timp, excepţie atunci când seriile sunt
cointegrate. Engle şi Granger (1987) au observat faptul că o combinaţie liniară a două sau
mai multe serii nestaţionare poate fi staţionară.
Definiţie (Engle and Granger, 1987). Dacă două serii Yt , X t sunt integrate de acelaşi
ordin I(d) şi există β astfel încât reziduul din regresie ε t = Yt − βX t are un ordin mai
mic de integrare I(d-b) atunci, conform definitiei Engle-Granger (1987), cele doua serii
sunt cointegrate de ordin CI(d,b).
Astfel, dacă Yt , X t sunt I(1) şi εt ∈ I (0) atunci cele două serii sunt cointegrate de
ordin CI(1,1). In acest caz, pentru a estima relaţia pe termen lung dintre variabile este
suficient a se estima modelul de regresie static Yt = βX t + ε t , estimatorii MMP fiind
consistenţi atunci când lungimea seriei este mare. Ne vor referi, în continuare, doar la
acest caz.
Două serii nestaţionare Y şi X, integrate de ordinul 1, adică I(1), pentru care există o
combinaţie liniară, notată cu εt :
ε t = Yt − a0 − a1 X t
ce este staţionară, ε t ∈ I(0) se numesc se numesc serii cointegrate (de ordinul 1).
Vectorul (1, −a1 ) se numeşte vector de cointegrare. Astfel diferenţa Yt − a1 X t rămâne
stabilă în jurul unei medii fixe a0 (media lui εt este zero). Dacă constanta este zero,
relaţia ce le menţine legate pe termen lung este una de proporţionalitate Yt = a1 X t .
65
Variabilele rămân legate pe termen lung prin relaţia de echilibru Yt = a 0 + a1 X t iar
deviaţiile de la aceasta au loc doar pe termen scurt; această relaţie de echilibru poate fi
interpretată ca o relaţie echilibru pe termen lung, „deranjată” doar de şocuri aleatoare ( ε
) cu efect pe termen scurt. Relaţia Yt = a 0 + a1 X t + ε t se numeşte relaţie de cointegrare
între cele două variabile. Relatia de echilibru pe termen lung este înţeleasă în sensul de
stabilitate a relaţiei de dependentă.
Două serii cointegrate au o tendinţă stochastică comună (tendinţe de evoluţie
similare), adică „hoinăresc” împreună (analogie în evoluţie). Relaţia de dependenţă dintre
ele este stabilă.
Exemple. Posibile relaţii de cointegrare sugerate de teoria economică, variabilele fiind
de regulă considerate în formă logaritmată:
- între venit PIB şi consum C. Raportul C/PIB este constant pe termen lung, astfel
ln(C)-ln(PIB) este staţionar iar ln(C) şi ln(PIB) sunt cointegrate. In mod similar PIB şi
învestiţiile;
- cererea de monedă, preţuri, venit
- între cursul valutar, preţurile domestice respectiv preţurile din ţara străină, cursul
real având comportament staţionar (conform teoriei parităţii de cumpărare);
- cusul diferitelor acţiuni;
- rentabilitatea activelor şi rata inflaţiei, diferenţa acestora adică rata reală a
rentabilităţii, ce are comportament staţionar;
- ratele dobânzii pentru diferite maturităţi, diferenţa faţă de rata activului fără risc
(rata pe termen scurt) reflectând prima de risc a investitorilor;
- logaritmul indicelui preţului acţiunilor respectiv al dividendelor diferenţa
reprezentând logaritmul randamentului ln Pt − ln Dt ∈ I (0) .
- logaritmul indicelui preţurilor ln Qt respectiv al salariului ln S t , diferenţa
ln S t − ln Qt ∈ I (0) reprezentând logaritmul indicelui salariului real;
- cursurile acţiunilor (de regulă în formă logaritmată) etc.
Aceste posibile relaţii de cointegrare trebuie confirmate şi de datele empirice.
Abordări în teoria cointegrării:
- abordari bazate pe o singură ecuaţie, cea mai cunoscută fiind metoda în două
etape propusă de Engle şi Granger;
- abordarea multivariată de tip VAR respectiv VECM; în acest caz ne asteptăm la
existenţa mai multor relaţii de cointegrare. În cazul general dat fiind un grup de mai
multe variabile nestaţionare suntem interesaţi dacă acestea sunt cointegrate, şi dacă sunt,
care este relaţia de echilibru pe termen lung dintre ele. Pentru analiza cointegrării între
mai multe procese nestaţionare, cu rădăcină unitate, se apelează la metodologia
dezvoltată de Johansen şi Juseliu (1990), implementată în softurile de statistică.
Metodologia Engle-Granger :
Etapa 1. Testarea existenţei unei relaţii de cointegrare între două variabile:
a) se testează dacă ambele variabile sunt integrate Yt , X t ∈I(1) de ordin 1, utilizând
teste de tip unit root, precum testul ADF
b) se estimează regresia liniară Yt = a 0 + a 1X t + ε t prin MMP pentru a obţine o
estimatie a relaţiei (vectorului) de cointegrare. Interesant este că estimatorii obţinuţi
pentru a 0 şi a 1 sunt superconsistenţi (în acest caz, când ambele variabile sunt I(1)),
66
chiar dacă erorile sunt corelate. Erorile standard nu sunt însă de încredere, astfel nu se pot
realiza inferenţe privind modelul pe termen lung. Dacă există o relaţie de cointegrare
atunci MMP o va depista, iar dacă nu există atunci regresia este falsă. Se extrag apoi
estimaţiile pentru reziduuri ε t = Yt − a 0 − a 1X t ;
c) se testează dacă reziduurile εt sunt staţionare. Dacă ipoteza existenţei rădăcinii
unitate în seria reziduurilor este respinsă, atunci între cele două procese există relaţia de
cointegrare. Dacă reziduurile sunt staţionare cele două serii sunt cointegrate, relaţia de
cointegrare fiind cea estimată Yt = a 0 + a 1X t + ε t iar relaţia de echilibru pe termen lung
este Yt = a 0 + a 1X t .
După estimarea coeficienţilor de regresie şi prin urmare a reziduurilor ε̂t , se aplică
testul ADF au un alt test de tip unit root pentru detectarea nestaţionalităţii reziduurilor
(detectarea rădăcinii unitate). Valorile critice însă nu sunt cele clasice deoarece seria
reziduurilor a rezultat prin estimare. Valorile adecvate testului ADF de cointegrare au
fost obţinute de către MacKinnon de asemenea prin simulare şi pot fi găsite în Johnston şi
DiNardo (1994).
Exemple de valori critice pentru ADF pentru cointegrare, α = 5%
T – lunginea seriei ADF (p=4)
50 -3,29
100 -3,17
200 -3,25
Dacă tcalc < t tab ⇒ H0 se respinge ⇒ εt sunt staţionare ⇒ Xt, Yt cointegrate (există
*
67
Reziduurile din ecuaţia de cointegrare εˆt −1 =Yt −1 −aˆ −bˆX t −1 (ce surprind dezechilibrele
pe termen lung) sunt luate în considerare în modelul dinamic, fiind introduse ca un factor.
Astfel, modificările variabilei Y pe termen scurt depind de cele ale variabilei Xşi de
abaterea lui Y de la valoarea sa de echilibru pe termen lung a +bX t −1 din perioada
precedentă.
Dezechilibrul dintr-o perioada este corectat in perioada imediat urmatoare; spre
exemplu un dezechilibru intre cerere si oferta din perioada anterioara determina o
modificare a pretului (dezechilibrul a determinat o corectie a pretului in perioada
curenta). Coeficientul α indica in ce proportie un dezechilibru aparut in evolutia celor
doua variabile (abatere de la relatia de cointegrare), se regaseste intr-o corectie a
variabilei Y in perioada imediat urmatoare.
Observăm că în acest model coeficienţii de regresie β1 , β2 sunt coeficienţi ai unor
variabile staţionare, fiind aplicabile tehnicile clasice de estimare şi validare.
Observaţie. Forma ecuaţiei ECM rezultă rearanjând modelul dinamic:
Yt = µ + β1 X t + β2 X t −1 +α1Yt −1 +ηt
unde ηt este zgomot alb. Rezultă forma ECM:
∆Yt = β1 ∆X t − (1 −α1 )[Yt −1 − a 0 − a1 X t −1 ) +ηt
unde a 0 = µ /(1 − α1 ) şi a1 = ( β1 + β 2 ) /(1 − α1 ) . Cele două ecuaţii sunt echivalente, dar forma
ECM are avantajul de a încorpora şi dezechilibrele pe ermen lung, de la ecuaţia de cointegrare
(atunci când variabilele sunt cointegrate) iar coeficientul 1 −α1 oferă informaţii privind viteza
de ajustare.
Ecuaţia anterioară poate include şi un termen determinist în t, respectiv alţi termeni de
tipul ∆X t −i sau ∆Yt −i :
m n
∆Yt = µ + χt + αεˆt −1 + ∑ β i ∆X t −i + ∑δ i ∆Yt −i + η t .
i =1 i =1
astfel încât termenul eroare ηt să fie de tip zgomot alb. Forma finală a modelului rezultă
utilizând procedurile obişnuite de validare şi estimare. Coeficientul α măsoară viteza de
ajustare la dezechilibrele pe termen lung.
O altă modalitate de a detecta existenta unei relaţii de cointegrare constă în testarea
semnificativităţii coeficientului α (cu alternativa mai mic decât zero) în modelul ECM;
dacă acesta este semnificativ atunci nu există o relaţie de cointegrare între variabile.
Deşi se estimează o relaţie de echilibru pe termen lung între două variabile
cointegrate, este important de considerat şi relaţia pe termen scurt dintre acestea,
deoarece sistemul poate să nu fie întotdeauna în echilibru.
Metodologia ne este aplicabilă pentru studiul cointegrării între mai multe vriabile.
În concluzie, relativ la estimarea regresiei între două variabile relativ la care baza
de date este formată din serii de timp sunt utile reperele următoare:
• Dacă variabilele sunt staţionare sau staţionare relativ la tendinţă (deterministă)
modelul este specificat pentru variabilele observate. Forma generală a modelului
dinamic adecvate în acest scop este:
p q
Yt = α + δt + ∑βi Yt −i + ∑φ j X t − j + ε t .
i =1 j =o
68
- Termenul δt se include doar dacă una din variabile este staţionară relativ la
tendinţă. In acest caz testele clasice din regresie, bazate pe metoda c.m.mici
pătrate sunt asimptotic valide (dacă numărul datelor e suficient de mare).
unde k este fixat astfel încât erorile să fie zgomot alb. Relativ la această ecuaţie, ipoteza
nulă respectiv alternativa sunt:
H 0 : α1 = α 2 = ... = α l = 0 , X nu este cauză pentru Y,
H 1 : ∃ αi ≠ 0 .
69
( SSRr − SSRu ) / k ( Ru2 − Rr2 ) / k
F= = ∈ F (k , n − 2k − 1) ,
SSRu /(T − 2k − 1) (1 − Ru2 ) /( n − 2k − 1)
2
unde SSR u şi Ru reprezintă suma pătratelor reziduurilor respectiv coeficientul de
determinaţie în ecuaţia fără restricţii (u) iar SSR r şi Rr2 sunt aceleaşi elemente dar în
ecuaţia de regresie cu restricţii (r) ce include doar termenii de tip y t −i :
k
Yt = µ + ∑ β i Yt −i + ε t . (r)
i =1
Se respinge ipoteza nulă dacă valoarea calculată pentru statistica F este mai mare decât
valoarea critică.
2) Analog, se testează dacă Y este cauză pentru X pornind de la regresia:
k k
X t = µ + ∑ϕi X t −i + ∑δ j Yt − j + ε t , (u)
i =1 j =0
70
Y1tb a1 Y1t− ε 12
= + +
Y2 t b a 2 Y2 t − 1 ε 1 2
sau Yt = B + AY t −1 + εt unde Yt este vectorul variabilelor dependente (2x1), B vectorul
termenilor liberi (2x1), A matricea coeficienţilor (2x2) iar ε vectorul erorilor
(perturbaţiilor). Prezentul variabilelor este dependent de propriul trecut.
71
Un sistem econometric cu ecuaţii simultane poate fi pus în forma VAR. Aceste modele
sunt destinate previziunii (avantaj: nu sunt necesare previziuni ale variabilelor, înafara
sistemului) şi se utilizează deasemenea pentru a analiza impactul unor perturbaţii (şocuri)
aleatoare asupra variabilelor sistemului.
Fiecare variabilă este exprimată funcţie de trecutul celorlalte variabile din sistem.
Forma generală VAR(p) este redată prin ecuaţia vectorială:
Yt = B + A1Yt −1 + A2Yt −2 +... + A p Yt −p +εt
unde Yt este vectorul variabilelor dependente (kx1), Ai (kxk) matrici ale coeficienţilor
iar εt este vectorul (kx1) inovaţiilor (erorilor); Yt = (Y1t , Y2 t ,..., Ykt )' adică transpusa
.
vectorului Se presupune ca inovaţiile sunt necorelate cu trecutul acestora respectiv cu
variabilele din partea dreapta a ecuaţiei.
Pentru estimarea coeficienţilor se utilizează metoda celor mai mici pătrate pentru fiecare
ecuaţie în parte, fără a se pierde din eficientă.
Se utilizează atunci când ne interesează interacţiunea dintre variabile.
Se definesc şi aici condiţii de stabilitate, staţionalitate a modelului. In operatorul
intarziere modelul se scrie:
Π( L)Yt = B + εt
sunt înafara cercului unitate (au modulul mai mare decât unu). Un model stabil este
staţionar, mediile, varianţele şi autocovarianţele fiind independente de timp.
Inainte de elaborarea unui model se recomandă eliminarea tendinţei şi a
sezonalităţii din date, dacă există; o metodă alternativă constă în introducerea unui
termen t în ecuaţia vectorială pentru a extrage tendinţa deterministă. Pentru validare se
aplică teste specifice, similare cu cele din cazul unui model autoregresiv cu o singură
ecuaţie: erorile trebuie să fie necorelate, să aibă aceeaşi varianţă (constantă în timp), iar
pentru elaborarea de previziuni este necesară şi normalitatea erorilor.
Testul Granger de cauzalitate, numit şi test de exogeneitate slabă, ne indică dacă o
variabilă endogenă poate fi tratată ca exogenă. Intr-un model VAR cu 2 variabile, Y2 nu
este cauză de tip Granger pentru Y1 dacă toate matricile coeficienţilor sunt
triunghiulare, cu 0 deasupra diagonalei principale.
72
In modelele multivariată toate variabilele sunt abordate simultan, şi se urmăreşte
explicarea comportamentului unei variabile funcţie de trecutul său şi a celorlalte
variabile.
Etapele metodologiei Johansen, destinată elaborării modelelor dinamice, sunt:
1) testarea ordinului de integrare pentru fiecare variabilă;
2) determinarea numărului
3) ....
Pentru un vector Yt (kx1) de k potenţiale variabile endogene specificăm un model
autoregresiv VAR(p):
Yt = B + A1Yt −1 + A2Yt −2 +... + A p Yt −p +εt
există anumite combinaţii liniare ale variabilelor din vector ce sunt integrate de un ordin
mai mic.
Observaţie. Pentru un vector ce conţine două variabile integrate I(1) Yt =( Yt , X t )
pentru care reziduul din regresia Yt = βX t + ε t este staţionar I(0), vectorul de cointegrare
este β = (1,−β) ; β Yt = Yt − βX t adică reziduul ε t = Yt − βX t este staţionar.
'
'
Dacă toate variabilele din vectorul Yt =( Y1t , Y2 t ,..., Ykt ) sunt staţionare I(0),
atunci se aplică metodologia clasică VAR, pentru elaborarea acestui model. Dacă cel
puţin una din variabile este nestaţionară I(1) atunci există două posibilităţi: (1) nu există
nici o relaţie de echilibru (sau de cointegrare) între elementele lui Yt caz în care modelul
costituie un sistem de regresii false, respectiv (2) există una sau mai multe relaţii de
echilibru (sau de cointegrare) între elementele lui Yt , când se are în vedere
reprezentarea VECM a modelui (aceasta fiind o reprezentare VAR cu restricţii).
Abordarea Johansen constă în identificarea a r combinaţii liniare de cointegrare,
printre cele k variabile integrate, şi încorporarea lor într-un model dinamic.
Cum pot fi identificate aceste relaţii de cointegrare?
Dacă Yt sunt cointegrate atunci reprezentarea VAR nu este prea adecvată pentru
analiză deoarece relaţiile de cointegrare nu apar explicit. Relaţiile de cointegrare devin
vizibile în reprezentarea VECM, reprezentare echivalentă cu VAR, aceasta fiind:
∆Yt = ΠYt −1 +Γ1 ∆Yt −1 +... +Γp −1 ∆Yt −p +1 +εt
p
unde Π = ∑ Ai − I iar Γi = −( Ai +1 + Ai +2 + ... + A2 ) .
i =1
73
⇔ ∆Yt = B + ( A1 − I ) ∆Yt −1 + ( A2 + A1 − I )Yt −2 + ε t
Este mai convenabil să apară Yt −1 pentru a putea evidenţia eventual reziduul din
perioada anterioară, astfel:
∆Yt = B + ( A1 − I ) ∆Yt −1 + ( A2 + A1 − I )Yt −2 − ( A2 + A1 − I )Yt −1 + ( A2 + A1 − I )Yt −1 + ε t
∆Yt = ( A1 + A2 − I )Yt −1 − A2 ∆Yt −1 + B + εt
sau
∆Yt = ΠYt −1 + Γ1 ∆Yt −1 + B + εt
unde Π = A1 + A2 − I iar Γ1 = −A2 .
Această reprezentare echivalentă are mai multe avantaje (Juselius, 2003): se
reduce efectul multicoliniarităţii, informaţiile pe termen lung sunt sintetizate în matricea
Π, avem o interpretare mai intuitivă a coeficienţilor (surprind efetul pe termen lng
respectiv scurt), este o reprezentare adcvată atunci când ne interesează modificările faţă
de perioada anterioară (ex. în cazul ratei inflaţiei).
b) Legătura între rangul matricii Π şi numărul relaţiilor de cointegrare
Coeficienţii Γ i conţin informaţii despre ajustarea pe termen scurt, iar pentru a identifica
74
variabilele sunt staţionare. Matricea coeficienţlor de ajustare α din αµt −1 reprezintă
viteza cu care ∆Yt se ajustează la dezechilibre in relaţia de cointegrare.
Descomunerea Π = αβ ' nu este unică deoarece pentru orice matrice M(rxr)
nesingulară avem Π = αβ' = (αM )( M −1 β ' ) = (αM )( βM −1' ) ' = ab ' unde a = αM iar
b = βM −1' . Pentru a obţine valori unice sunt necesare anumite restricţii, precum
normalizarea (se împart toţi coeficienţii vectorului de cointegrare la unul dintre ei) sau
restricţii sugerate de teoria economică.
Prin urmare, avem următoarele cazuri:
1) r=rang( Π)=k, caz în care Yt −1 sunt staţionare şi se va elabora un model
VAR pentru variabilele observate Yt , utilizând inferenţele standard;
2) 1 ≤ r ≤ k − 1 când există r combinaţii liniare a variabilelor ce sunt staţionare
prin urmare r relaţii de cointegrare, Yt fiind cointegrate. Reprezentarea
VECM este validă, toate variabilele ce intervin fiind staţionare. Reprezentarea
VAR în Yt este consistentă dar ineficientă, iar reprezentarea VAR pentru
diferenţe este greşită (Cochran, 2005);
3) r=0 când nu există combinaţii liniare staţionare şi se va elabora un model
VAR pentru diferenţe ∆Yt (acestea fiind staţionare).
75
H 0 : cel mult r relaţii de cointegrare (rangul matricii este cel mult r)
până la primul r pentru care ipoteza nulă se acceptă. Când ipoteza nulă H 0 se acceptă
valoarea statisticii LR este aproape de zero, adică ultimele k- r valori proprii sunt
nesemnificative λr +1 ,..., λ ˆ . Ipoteza nulă se respinge atunci când valoarea calculată
k
76
Bibliografie
1. Bresson G., Pirotte A., Econometrie des series temporalles, Presses Universitaires
de France, 1995.
2. Buiga A., Dragoş, C, Lazar D., Parpucea I., Statistică descriptivă, Editura
Mediamira, 2004.
3. Florea I., Parpucea I., Buiga A., Lazar D., Statistică inferenţială, Presa
Universitară Clujeană, 2000.
4. Florea, I. Econometrie, Editura Universităţii din Oradea, 2004.
5. Harris R., Sollis R., Applied time series modeling and forecasting, John Wiley &
Sons, 2003.
6. Makridakis S., Wheelwright S.C., Hyndman R.J., Forecasting. Methods and
Applications, John Wiley & Sons Inc., 1998
7. Melard G., Methodes de prevision a court terme, Universite de Bruxelles, 1990.
8. Mills, T.C., The econometric modelling of financial time series, Cambridge
University Press, 1999.
9. Pecican, E.S., Econometria pentru … economişti, Editura Economică, 2004.
10. Pecican E.S., Econometrie, Ed. ALL, Bucureşti, 1994.
11. Tertisco M., Stoica P., Popescu Th., Modelarea si predictia seriilor de timp, Ed.
Academiei, Bucureşti, 1985.
77