Documente Academic
Documente Profesional
Documente Cultură
aditiv: Yt Tt Ct S t t sau
multiplicativ: Yt Tt Ct S t t , respectiv
o combinaţie mixtă a componentelor seriei.
Componenta sezonieră se evidenţiază sub forma unor cicluri de durată mai mică sau egală
cu un an, şi apare, în principal, datorită ritmului impus de schimbarea anotimpurilor, dar şi
de activităţi economice, respectiv sociale (regularităţi în plata salariilor, sărbători, vacanţe,
obiceiuri, tradiţii, etc.).
Vor face obiectul acestui curs doar componentele deterministe. Componenta aleatoare nu
trebuie ignorată, deoarece conţine informaţii utile în previziune, modelarea acesteia fiind
abordată în cursurile următoare. Dacă nu se precizează altfel, pentru previziunea variabilei Y,
componenta aleatoare se ignoră (se presupune a fi nepredictibilă, adică de tip zgomot alb). În
practică, identificarea şi separarea celor patru componente din seria cronologică nu sunt de
regulă realizabile cu exactitate, reziduul rămas după extragerea estimaţiilor componentelor
deterministe regăsindu-se în componenta aleatoare.
Metode de ajustare a trendului
-metoda grafică;
yt = y1 + (t − 1)∆
yt = y1 ∙ I (t−1)
Estimarea tendinţei prin funcţii elementare
logaritmică T a bX
Tt a b ln t unde X ln t
curba logistică
a
Tt , a, c 0
1 e b ct
Curba logistică este o legitate specifică evoluţiei vânzărilor dintr-un nou produs, dar
nu exclusiv acesteia, fiind adecvată pentru modelarea evoluţiei pe termen lung şi a altor
indicatori (Melard, 1990).
Graficul său din figura 1 indică, pentru exemplul vânzărilor dintr-un nou produs, o
creştere accelerată a acestora după lansarea produsului, urmată de o încetinire a ritmului
de creştere spre un prag de saturaţie egal cu a. Punctul de inflexiune al curbei este de
coordonate (b/c, a/2).
Pentru estimarea parametrilor tendinţei liniare
Tt a bt
se utilizează metoda celor mai mici pătrate (utilizată în estimarea ecuatiei de regresie
liniară). Rolul variabilei exogene (independente) este jucat aici de variabila timp t:
Yt a bt t t 1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci următoarele:
n
(t t )(Y t Y)
b t 1
n
,
(t t )
t 1
2
a Y bt ,
sau echivalent
M (tY ) M (t ) M (Y )
b ,
M (t 2 ) [ M (t )]2
a Y bt.
Seria prezintă o tendinţă de creştere dacă b > 0, respectiv de descreştere dacă b < 0.
Variabila timp se măsoară cu ajutorul scalei de interval, astfel că originea scalei,
respectiv unitatea de măsură, se pot stabili în mod arbitrar. Uneori, pentru uşurarea
calculelor sunt stabilite astfel încât t 0 , adică ∑t=0 , variantele variabilei t rezultând în
consecinţă. Astfel, daca n este impar t ..., 3, 2, 1, 0,1, 2, 3,... , respectiv pentru n par
t ..., 2,5; 1,5; 0,5; 0,5;1,5; 2,5;... sau t ...., 5, 3, 1,1, 3, 5,....
Cu excepţia curbei logistice, celelalte funcţii neliniare din Tabelul 1 pot fi aduse la o
formă liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de logaritmare
în cazul funcţiei exponenţiale şi a funcţiei putere.
Spre exemplu, în cazul tendinţei exponenţiale
Tt a b t ,
considerând un model de descompunere multiplicativ Yt Tt t , operaţia de logaritmare a
ambilor membri conduce la:
ln Yt ln a t ln b ln t .
Prin substituţiile A ln a, B ln b, t ln t se obţine forma liniarizată:
ln Yt A Bt t .
Aplicând metoda celor mai mici pătrate, se determină A și B:
M (tX ) M (t ) M ( X )
B
M (t 2 ) M (t )
2
A M ( X ) bM (t )
unde s-a notat X ln Y . Pe baza coeficienţilor A și B se pot determina parametrii
tendinţei exponenţiale a e A , b e B .
În cazul tendinţei parabolice
Yt a bt cX t
unde X t ² , pentru estimarea parametrilor a, b, c se utilizează relațiile de calcul deduse
în cadrul regresiei liniare multiple, lucrând, eventual, cu variante pentru variabila t astfel
încât t 0 (∑t=0) (scopul este uşurarea calculelor).
Când cronograma seriei nu oferă indicii foarte clare privind prezenţa, respectiv forma
tendinţei, este indicat a se utiliza, în prealabil, o tehnică de netezire ce atenuează
amplitudinea fluctuaţiilor aleatoare din serie, scopul fiind evidenţierea (estimarea)
tendinţei. Metoda mediilor mobile, netezirea exponenţială, dar şi alte filtre de netezire
sunt utilizate frecvent în practică. Se consideră că seria prezintă doar tendinţă şi
componentă aleatoare, iar modelul de descompunere este unul aditiv:
Yt Tt t .
Metoda mediilor mobile
Prin aplicarea unei medii mobile, varianţa componentei eroare este diminuată atunci când
m
i m
i
2
1 . Raportul de reducere a varianţei erorii se defineşte prin:
m
/
*2 2
i m
i
2
respectiv
m
minimizează raportul de reducere a varianţei componentei eroare
i m
i
2
.
Rezultă:
0,5Y1 Y2 Y3 Y4 0,5Y5
Y3
4
0,5Y2 Y3 Y4 Y5 0,5Y6
Y4
4
0,5YT 4 YY 3 YT 2 YT 1 0,5YT
Y T 2 .
4
Definiţie. Un proces staţionar de ordinul doi dacă verifică următoarele trei condiţii:
(1) E Yt , t media este constantă în timp (staţionaritate în medie)
(2 Var Yt 2 varianţa este constantă în timp (staţionaritate în varianţă)
(3) cov Yt , Ys k , t s unde k s t covarianţa dintre două variabile
este funcţie doar de lungimea intervalului de timp ce separă cele 2 variabile. Pentru un
proces staţionar, funcţia de autocovarianţă devine:
k EYt Ys unde k s t .
Un proces staţionar se află într-o stare de echilibru (are proprietatea de a reveni
la medie ori de căte ori se îndepărtează prea mult de la aceasta).
E t 0
Var t 2 E( t2 )
𝐶𝑜𝑣 𝜀𝑡 , 𝜀𝑠 = 0, ∀ 𝑡 ≠ 𝑠
Autocovarianța măsoară dependența liniară dintre două valori ale aceleași serii
înregistrate la momente diferite de timp. Autocovarianțele reprezintă momentul de
ordinul II al seriilor de timp (media este momentul de ordinul I). Funcția de
autocovarianță 𝛾𝑡 (𝑘) evaluează posibilele legături dintre variabila 𝑦𝑡 și variabilele
𝑦𝑡 −1 , 𝑦𝑡−2 , 𝑦𝑡 −3 , ..., adică legătura dintre valorile curente și cele trecute ale seriei
de timp analizate pentru k=1,2,...
E(.) este valoarea așteptată (expectată) (engl., expected value) sau media pentru
variabila analizată.
2. 0 E Yt 2 VarYt 2
4.
𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−𝑘 )
𝜌𝑘 =
𝑉𝑎𝑟(𝑌𝑡 ) ∙ 𝑉𝑎𝑟(𝑌𝑡−𝑘 )
𝜌𝑘 = 1, 𝑝𝑒𝑛𝑡𝑟𝑢 𝑘 = 0 ș𝑖 𝜌𝑘 = 0, 𝑝𝑒𝑛𝑡𝑟𝑢 𝑘 ≠ 0.
.................................................................
Prezintă importanţa calculul primelor T/4 autocorelaţii (spre exemplu, dacă lungimea seriei este
T=80 M = 80/4 = 20).
Estimarea coeficienţilor de autocorelaţie
1 T
Y Yt
T t 1
1 T
s (Yt Y ) 2 .
2
T t 1
Coeficientul de autocorelaţie 𝜌𝑘 se estimează prin:
𝑇
𝑡=𝑘+1(𝑌𝑡 − 𝑌)(𝑌𝑡−𝑘 − 𝑌)/(𝑇 − 𝑘)
𝜌𝑘 = 𝑇 2
𝑡=1(𝑌𝑡 − 𝑌 ) /𝑇
respectiv
𝑇
𝑡=𝑘+1(𝑌𝑡 − 𝑌 )(𝑌𝑡−𝑘 − 𝑌)
𝜌𝑘 = 𝑇 2
𝑡=1(𝑌𝑡 − 𝑌)
dacă lungimea seriei este suficient de mare (şi astfel T-k nu diferă foarte mult de T).
Testarea semnificației coeficieţilor de autocorelaţie
H0 : 𝜌𝑘 = 0
H1 : 𝜌𝑘 ≠ 0
𝜌𝑘
𝑡 =
𝑉𝑎𝑟 (𝜌 𝑘 )
converge asimptotic (când T ) la legea normală N (0,1)
-verifică o ipoteză combinată (denumită ipoteză de tip portmanteau (în lb. română,
valiză)), potrivit căreia toți coeficienții de autocorelație până la un rang m sunt
simultan nuli.
H0 : 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0
Q=T ρ2k
k=1
Dacă Q > 𝜒𝑚2 , atunci se respinge ipoteza nulă la un anumit nivel de semnificație 𝛼.
H0 : 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0
În multe cazuri, corelaţia între două variabile este determinată de faptul că ambele variabile
sunt corelate cu o a treia variabilă. În acest context, o mare parte din corelaţia între două variable
Yt şi Yt-k poate exista ca urmare a unui efect indirect de corelare a ambelor variabile cu
variabilele intermediare Yt 1 , Yt 2 , Yt k 1 . Pentru a se evita această situație, se utilizează
coeficientul de autocorelaţie parţială, acesta măsurând efectul direct al lui Yt-k asupra variabilei
Yt (se izolează influenţa variabilei Yt-k). Definiția acestui coeficient este similară cu cea
coeficientului de corelaţie parţială utilizat în econometrie.
Coeficientul de autocorelaţie parțială între două variabile separate de k unităţi de timp notat
prin c k este coeficientul de regresie a variabilei Yt k în modelul autoregresiv AR(k):
𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝜀𝑡
𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝑐2 𝑌𝑡−2 + 𝜀𝑡
c3 este coeficientul de regresie a variabilei Yt 3 în modelul autoregresiv AR(3):
.............................................................
H0 : c k 0
H1 : c k 0
𝑐𝑘
𝑡=
𝑉𝑎𝑟 (𝑐𝑘 )
Un proces este nestaţionar dacă nu verifică una sau mai multe din cerinţele din definiția
procesului staţionar. În economie, majoritatea seriilor sunt nestaţionare, adică media,
respectiv varianţa acestora nu este constantă în timp.
Detectarea nestaţionarităţii:
Din cronogramă:
- seria este nestaţionară în medie dacă media nu este constantă în timp. O serie ce
prezintă, spre exemplu, o tendinţă deterministă (ce poate fi modelată prin funcţii
elementare) este nestaţionară;
- seria este nestaţionară în varianţă, dacă varianţa nu este constantă în timp.
Din corelogramă (graficul funcţiei de autocorelaţie) se observă că autocorelaţiile
𝜌𝑘 ale unei serii staţionare se apropie rapid de zero, odată ce k creşte (tind
exponenţial spre zero). Pentru o serie nestaţionară în medie, autocorelaţiile sunt
mari şi pozitive pentru un număr mare de valori ale lui k.
operatorul de întârziere LYt Yt 1 .
a) Seriile nestaționare de tip determinist (Trend Stationary- TS) devin staţionare prin
extragerea tendinţei deterministe din date (dupa estimarea ei prin funcții elementare).
Dacă seria este staţionară relativ la o tendinţă deterministă, se spune ca seria este
staţionară relativ la tendinţă.
b) Seriile nestaționare de tip stochastic (DS- difference stationary) devin staționare prin
diferențiere (aplicarea operatorului diferență). De regulă, seriile din economie devin
staţionare după una sau două diferenţieri (astfel, d=1 sau d=2).
Un tip particular de proces nestaţionar este generat de o ecuaţie de tip autoregresiv, unde
coeficientul variabilei este unu:
Yt Yt 1 t sau Yt a0 Yt 1 t
t fiind zgomot alb. Acesta se numeşte mers aleator (random walk) şi în evoluţia sa se observă
perioade cu aparente tendinţe de creştere sau descreştere, care apoi îşi schimbă brusc și
nepredictibil direcţia. Spunem că un astfel de proces are tendinţă stochastică, fiind rezultatul
acumulării unor șocuri aleatoare ce nu au o bază sistematică. Aceste evoluţii sunt specifice
variabilelor financiare şi, în principal, seriilor ce redau evoluţia cursului unor acţiuni. Varianţa
unui proces de tip mers aleator fără termen liber (fără drift) nu este constantă şi creşte odată cu t,
iar pentru forma cu termen liber (cu drift) atât media, cât şi varianţa (dispersia) variază în timp
(cresc odată cu t). Spre exemplu, dacă valoarea de pornire la momentul t=0 este Y0 atunci:
Yt t t 1 t 2 ... 1 Y0
Pentru analiza în dinamică a unui fenomen economic nu este suficient doar să se explice
o variabilă dependentă pe baza uneia sau a mai multor variabile explicative, ci trebuie
considerate mai multe ecuații de tip regresie sau egalitate în cadrul unor modele cu ecuații
simultane (MES) sau sisteme cu ecuații simultane (Simultaneous equations models- SEM). Acest
tip de modele a fost introdus la începutul anilor ‘40 ai secolului trecut de către Comisia Cowles
din cadrul Universității din Chicago (Andrei și Bourbonnais, 20081).
Dacă se consideră n variabile endogene Y1, Y2, ...,Yn și m variabile exogene X1, X2, ...,
Xm pentru care se cunosc realizările acestora în decursul a T perioade. La momentul t, se poate
scrie modelul cu ecuații simultane în formă structurală:
poate fi o variabilă aleatorie de tip zgomot alb, caz în care este identificată o relație
comportamentală (de comportament) sau poate fi o constantă, caz în care există o relație de
tip identitate.
În cadrul unei relații, unii parametrii (coeficienți) pot fi nuli, însă în cadrul fiecărei relații
cel puțin un parametru asociat setul de variabile endogene trebuie să fie nenul.
Limitele (limitările) modelelor MES: dificultatea împărțirii variabilelor în endogene și
exogene, dificultatea estimării parametrilor, eșecul previziunilor pe baza MES.
1
Andrei, T. & Bourbonnais, R. (2008). Econometrie. Editura Economică, București.
În MES în formă structurală, fiecare variabilă endogenă se exprimă în funcție de alte
variabile endogene și exogene; nu se poate aplica metoda celor mai mici pătrate. Parametrii MES
în formă structurală sunt interpretabili din puncte de vedere economic.
(*)
Relația de mai sus este forma redusă a modelului general cu ecuații simultane. În MES în
formă redusă, fiecare variabilă endogenă se exprimă în funcție de variabile exogene.
Dacă se aplică metoda celor mai mici pătrate fiecărei ecuații din modelul (*), ipotezele
modelului liniar general de regresie trebuie îndeplinite pentru fiecare ecuație. Ipotezele
referitoare la erorile sunt: erorile din ecuația i (i=1,2,...,) sunt independente (
), erorile relative la două ecuații i și j și două momente t și t’ sunt independente (
), matricea de varianță-covarianță a erorilor la momentul t este:
- restricții de excludere, când o variabilă endogenă sau exogenă nu apare într-o ecuație
structurală, caz în care coeficientul acestei variabile este zero;
- restricții liniare, când specificările modelului impun ca unele variabile ca să aibă un
coeficient identic, ceea ce implică impunerea unor restricții a priori asupra unor coeficienți.
Pentru estimarea parametrilor MES trebuie stabilite mai întâi condițiile de identificare și,
în funcție de tipul de identificare, se stabilește metoda de estimare a parametrilor folosită.
Condițiile de identificare se determină ecuație cu ecuație. Modelul cu ecuații simultane este sub-
identificat, dacă există o ecuație sub-identificată. Modelul este exact-identificat (just-identificat),
dacă toate ecuațiile sunt exact-identificate și supra-identificat, dacă ecuațiile modelului sunt fie
exact-identificate, fie supra-identificate.
Se reia modelul în formă structurală, cu ipotezele anterioare (se presupune, între altele, și
absența coliniarității între variabilele exogene din fiecare ecuație). Se precizează noțiunea de
restricție relativă la o ecuație din forma structurală.
A. Fiecare restricție pe forma structurală se traduce printr-o relație liniară omogenă între
coeficienții unei ecuații.
B. Se definește o matrice a restricțiilor Ri relativă la ecuația a i-a și o matrice de
structură S obținută prin juxtapunerea matricilor B și C.
S=(BC)
Matricea restricțiilor Ri se definește astfel: dacă Si este a i-a linie a matricei S și Rih este a
h-a coloană a matricei Ri (corespunzătoare la a h-a restricție din ecuația i), atunci SiRih=0.
Identificarea MES pe baza condiției de ordin se poate face folosind una dintre abordările
echivalente de mai jos:
c) O ecuație este identificată dacă numărul total de restricții asupra parametrilor săi este
cel puțin egal cu numărul de ecuații ale modelului minus unu.
Fie n1- numărul de ecuații structurale (veritabile) din model (de regresie,
comportamentale).
ecuație exact-identificată: număr de variabile absente din ecuație, dar existente în sistem= n1-
1;
ecuație neidentificată (sub-identificată): număr de variabile absente din ecuație, dar existente
în sistem < n1-1;
ecuație supra-identificată: număr de variabile absente din ecuație, dar existente în sistem> n1-
1.
Fie un MES care satisface ipotezele precedente. A i-a ecuație este identificată dacă și
numai dacă rangul matricei este egal cu n1+n2-1, unde n1 este numărul de ecuații
veritabile (structurale) din MES, n2- numărul de identități din model și n=n1+n2 este numărul de
variabile endogene din model.
Dacă MES este sub-identificat, nu se pot estima parametrii modelului. Dacă MES este
exact-identificat, metodele de estimare ce pot fi folosite sunt: metoda celor mai mici pătrate
indirectă (MCMMP indirectă), metoda celor mai mici pătrate în două stadii (faze) (MCMMP în
două faze), metoda celor mai mici pătrate în trei stadii (faze) (MCMMP în trei faze). Dacă MES
este supra-identificat, se pot folosi ca metode de estimare metoda celor mai mici pătrate în două
stadii și metoda celor mai mici pătrate în trei stadii.
MCMMP indirectă
(*)
Dacă fiecare ecuație din model este identificabilă, se pot estima coeficienții matricei A
din forma redusă folosind MCMMP și pe baza relațiilor de legătură între coeficienți se determină
estimatorii parametrilor în formă structurală. Sub ipotezele precizate anterior, estimatorii obținuți
sunt convergenți. Estimatorii sunt nedeplasați, eficienți și consistenți, dar, pentru eșantioane de
volum mic, estimatorii sunt deplasați.
MCMMP în două stadii sau MCMMP în două faze ((TSLS- two-stage least squares sau
2SLS)
Estimatorii parametrilor MES în formă structurală obținuți prin MCMMP în două stadii
au aceleași proprietăți asimptotice ca și estimatorii obținuți prin MCMMP. Pentru eșantioane de
volum redus, estimatorii sunt deplasați.
Această metodă se poate folosi când ecuațiile sunt supra-identificate. Se reia modelul în
formă structurală și se presupune că prima ecuație este supra-identificată. În
prima etapă, se estimează prin MCMMP parametrii variabilelor endogene care figurează în
prima ecuație pe baza formei reduse a celorlalte ecuații (pornind de la a doua ecuație). Se
determină , (**) etc. În al doilea stadiu, variabilele endogene din
prima ecuație se înlocuiesc cu valorile date în (**) și rezultă alte ecuații pentru care se aplică
MCMMP.
2
Thomas, R. L. (1997). Modern econometrics: an introduction. Financial Times/Prentice Hall.
Forma redusă a sistemului de ecuații simultane implică explicarea unei variabile
endogene numai în funcție de variabilele exogene și de termenii eroare din model. din
ecuația (2) se înlocuiește în relația (1):
(5)
Condiția de ordin
O ecuație este identificată dacă numărul total de restricții asupra parametrilor săi este cel
puțin egal cu numărul de ecuații ale modelului minus unu.
Fie n1- numărul de ecuații structurale (veritabile) din model (de regresie,
comportamentale).
ecuație exact-identificată: număr de variabile absente din ecuație, dar existente în sistem=
n1-1;
ecuație neidentificată (sub-identificată): număr de variabile absente din ecuație, dar
existente în sistem < n1-1;
ecuație supra-identificată: număr de variabile absente din ecuație, dar existente în sistem>
n1-1.
Ecuațiile (1) și (2) devin identificate dacă se mai adaugă o variabilă exogenă în
ecuația (2). Această variabilă este reprezentată de masa monetară (M). O combinație liniară
între ecuațiile (1) și (2) conține variabilele M și E, însă în ecuația (1) nu apare M și în ecuația
(2) nu apare E. astfel, cele două ecuații (1) și (2) nu pot fi confundate cu o combinație liniară
a acestora.
Condiția de ordin poate fi formulată și într-o formă mai restrictivă, fără a impune
constrângeri asupra parametrilor. De exemplu, dacă se consideră o funcție de producție de tip
Cobb-Douglas, se poate formula o restricție astfel încât randamentele de scară să fie
constante.
Întrucât condiția de ordin nu este suficientă, se folosește condiția de rang, care este
necesară și suficientă. Aceasta din urmă presupune construirea unei matrici pentru parametrii
modelului, alocându-se o coloană pentru fiecare variabilă din model (endogenă sau exogenă)
și o linie pentru fiecare din cele n1 ecuații de regresie. O ecuație este identificată dacă există
cel puțin un determinant diferit de zero de rang n1-1 pornind de la parametrii modelului care
nu apar în ecuația analizată.
În condițiile unor ecuații identificate, se pot aplica metode specifice de estimare
pentru obținerea unor estimatori nedeplasați și consistenți, cum ar fi metoda variabilelor
instrumentale.
Se pornește de la modelul de regresie liniară simplă:
Se determină , , .
În a doua etapă, se estimează în funcție de .
(5)
(6)
Rata inflației, care este variabilă endogenă în ecuația (6), apare ca variabilă explicativă în ecuația
(5). Se determină rata inflației din ecuația (5) și se introduce în ecuația (6).
Parametrii ecuației de mai sus sunt înlocuiți cu a0, a1 și a2 pentru simplificare și se rescrie
ecuația astfel:
(7)
Pe baza metodei celor mai mici pătrate se determină estimatorii ecuațiilor (7) și (8), și
. Practic, primul stadiu a constat în aplicarea metodei celor mai mici pătrate pentru estimarea
parametrilor ecuațiilor (7) și (8) și determinarea valorilor ajustate ale variabilelor dependente.
II. Al doilea stadiu constă în estimarea ecuațiilor structurale folosind metoda celor
mai mici pătrate și valorile endogene estimate în primul stadiu ca variabile
instrumentale.
Pornind de la ecuațiile (5) și (6), se estimează ecuația (5) utilizând ca variabilă
instrumentală și ecuația (6) pe baza variabilei instrumentale . Variabilele
instrument înlocuiesc valorile lui și din ecuația (5) și, respectiv ecuația (6).
Se aplică metoda celor mai mici pătrate ecuațiilor de mai jos:
(9)
(10)
Serii cointegrate
Noţiunea de cointegrare este strâns legată de cea de „regresie falsă (aparentă)” (spurious
regression, engl.) construită pe serii de timp. Pe date economice, deseori regresiile bazate pe serii
de timp au coeficientul de determinare R2 mare, cu o valoare aproape de unu (R2 1), iar
statistica Durbin-Watson (DW) are o valoare mică, apropiată de zero (DW calc 0) (erorile sunt
autocorelate). În general, când R2 1, DWcalc 0 şi R2 > DWcalc există un semnal că
regresia este falsă. În aceste condiții, dependenţa dintre variabile este exagerată, iar estimatorii
nu sunt de încredere. Aceasta se întâmplă deoarece seriile de timp pentru variabilele economice
sunt, deseori, nestaţionare şi se comportă ca un proces de tip mers aleator (au rădăcină unitate).
Dacă două serii sunt integrate de ordinul întâi I(1), adică au o rădăcină unitate fiecare,
atunci, în multe cazuri, se respinge ipoteza inexistenţei unei relaţii între acestea (adică se admite
existența unei relații), chiar când aceasta nu există. Generând două serii de tip mers aleator
independente şi estimând ecuaţia de regresie dintre acestea, Engle şi Granger (1987) au observat
că ipoteza conform căreia panta dreptei de regresie este nesemnificativă s-a respins în 76% din
cazuri, pe baza testului t. Cercetătorii au sugerat ca regresia să fie estimată pentru seriile
diferenţiate.
Detectarea regresiei false se face analizând corelograma reziduurilor sau prin testarea
staționarității cu teste de rădăcină unitate.
Se folosesc serii de date staționare obținute prin diferențierea seriilor inițiale care erau
nestaționare.
Astfel, dacă Yt , X t sunt I(1) şi seria reziduurilor , atunci cele două serii sunt
cointegrate de ordinul 1, CI(1,1). În acest caz, pentru a estima relaţia pe termen lung dintre
variabile este suficient să se construiască modelul de regresie static Yt X t t , estimatorii pe
baza metodei celor mai mici pătrate fiind consistenţi, când lungimea seriilor este mare. Se va
face referire, în continuare, doar la acest caz.
Două serii nestaţionare Yt şi Xt, integrate de ordinul 1, adică I(1), pentru care există o
combinaţie liniară, notată cu t :
t Yt a0 a1 X t
ce este staţionară, adică I(0), se numesc serii cointegrate (de ordinul 1). Vectorul (1, a1 ) se
numeşte vector de cointegrare. Astfel, diferenţa Yt a1 X t rămâne stabilă în jurul unei medii fixe
a0 (media lui t este zero). Dacă constanta este zero, relaţia ce le menţine legate pe termen lung
este una de proporţionalitate Yt a1 X t . Variabilele rămân în legătură pe termen lung prin relaţia
de echilibru Yt a0 a1 X t , iar deviaţiile de la aceasta au loc doar pe termen scurt; această relaţie
de echilibru poate fi interpretată ca o relaţie de echilibru pe termen lung, „perturbată” doar de
şocuri aleatoare ( t ) cu efect pe termen scurt. Relaţia Yt a0 a1 X t t se numeşte relaţie de
cointegrare între seriile celor două variabile. Relația de echilibru pe termen lung este înţeleasă în
sensul de stabilitate a relaţiei de dependență.
Două serii cointegrate au o tendinţă stochastică comună (tendinţe de evoluţie similare), adică
„hoinăresc” împreună (analogie în evoluţie). Relaţia de dependenţă dintre acestea este stabilă.
- între venit (PIB) şi consum (C). Raportul C/PIB este constant pe termen lung, astfel că
ln(C)-ln(PIB) este staţionar, iar ln(C) şi ln(PIB) sunt cointegrate. În mod similar, avem relația
între PIB şi investiţii;
- între rentabilitatea activelor şi rata inflaţiei, diferenţa acestora, adică rata reală a
rentabilităţii, având un comportament staţionar;
- între ratele dobânzii pentru diferite maturităţi, diferenţa faţă de rata activului fără risc (rata
pe termen scurt) reflectând prima de risc a investitorilor;
- între logaritmul indicelui preţului acţiunilor, respectiv al dividendelor, diferenţa
reprezentând logaritmul randamentului ln Pt ln Dt I (0) ;
- între logaritmul indicelui preţurilor, respectiv al salariului, diferenţa dintre logaritmul
indicelului salariului și al indicelului prețului fiind staționară și reprezentând logaritmul
indicelui salariului real etc.
Murray, M. P. (1994). A drunk and her dog: an illustration of cointegration and error
correction. The American Statistician, 48(1), 37-39.
Imagini: https://www.eco.uc3m.es/~jgonzalo/teaching/econometriaii/cointegration.htm
- abordări bazate pe o singură ecuaţie, cea mai cunoscută fiind metoda în două etape
propusă de Engle şi Granger;
- abordarea multivariată de tip VECM (VECM- vector error correction model, adică
model vectorial de corecție a erorilor sau model corector al erorilor); în acest caz, ne așteptăm la
existenţa mai multor relaţii de cointegrare. În cazul general, dat fiind un grup de mai multe
variabile cu serii nestaţionare, se verifică dacă acestea sunt cointegrate, şi, dacă sunt cointegrate,
care este relaţia de echilibru pe termen lung dintre acestea. Pentru analiza cointegrării între mai
multe procese nestaţionare (cu rădăcină unitate), se folosește metodologia propusă de Johansen şi
Juseliu (1990), care este implementată în soft-urile statistice.
Testarea existenţei unei relaţii de cointegrare între seriile de timp pentru două variabile:
Ipoteza nulă a testului Engle-Granger indică lipsa relației de cointegrare între seriile variabilelor
analizate. Acest test se bazează pe ipoteza că erorile sunt independente și homoscedastice, ceea
ce nu se verifică în multe cazuri pe date empirice. De aceea, o alternativă la testul Engle-Granger
este testul Philips-Ouliaris (1990), care este, de asemenea, un test bazat pe reziduuri.
Procedura testului Engle-Granger
a) se testează dacă seriile pentru ambele variabile, și , sunt integrate de ordinul 1 (I(1)),
utilizând teste de rădăcină unitate (de exemplu, testul ADF, PP, KPSS);
50 -3,29
100 -3,17
200 -3,25
Dacă tcalc < t tab se respinge H0 seria reziduurilor t este staţionară seriile Xt, Yt sunt
*
cointegrate (există o relaţie de dependenţă stabilă între cele două serii numită relaţie de
cointegrare).
În general, abordarea Engle-Granger este adecvată mai mult pentru situația în care se verifică
relația de cointegrare între seriile de timp asociate unui număr de două variabile. Dacă avem n
variabile şi n-1 dintre acestea nu sunt (slab) exogene şi/sau există mai multe relaţii de cointegrare
între serii, atunci abordarea prin intermediul unei singure ecuaţii nu este adecvată, conform lui
Harris și Sollis (2003).
Când ecuaţia
are rădăcini în interiorul cercului unitate, atunci unele serii sau toate seriile pentru variabilele din
vectorul Y sunt nestaţionare I(1), iar între acestea pot exista relaţii de cointegrare.
Definiţie. Un vector de variabile cu serii integrate de acelaşi ordin I(d) este cointegrat
CI(d,b), cu vectorul de cointegrare , dacă 'Yt este integrat de ordin mai mic I(d-b). Astfel,
există anumite combinaţii liniare ale variabilelor din vector cu serii integrate de un ordin mai
mic.
Observaţie. Pentru un vector ce conţine serii integrate de ordinul întâi I(1) pentru două
variabile ( Yt , X t ) , dacă seria reziduurilor din regresia Yt X t t este staţionară, adică I(0),
vectorul de cointegrare este (1, ) .
Dacă toate variabilele din vectorul Yt =( Y1t , Y2t ,..., Ykt ) ' au serii staţionare, adică I(0), atunci se
construiesc modele VAR. Dacă există serii nestaţionare, în forma I(1), atunci există două
posibilităţi:
(1) nu există nici o relaţie de echilibru (sau de cointegrare) între elementele lui Yt , caz în
care modelul costituie un sistem de regresii false;
(2) există una sau mai multe relaţii de echilibru (sau de cointegrare) între elementele lui Yt ,
când se are în vedere reprezentarea unui model vectorial de corecție a erorilor (VECM- vector
error correction model).
Dacă seriile din vectorul Y sunt cointegrate, atunci reprezentarea VAR nu este adecvată
pentru analiză. Relaţiile de cointegrare devin vizibile în reprezentarea VECM, aceasta fiind
redată mai jos.
, t=1,2,...,T
Este convenabil să apară Yt 1 pentru a putea evidenţia reziduurile din perioada anterioară. Se
scade și se adună în partea dreaptă (A2+A1-I)Yt-1, pentru a da ulterior factor comun -(A2+A1-I).
sau
unde A1 A2 I iar 1 A2 .
Această reprezentare echivalentă are mai multe avantaje (Juselius, 2003): se reduce
efectul multicoliniarităţii, informaţiile pe termen lung sunt sintetizate în matricea , avem o
interpretare mai intuitivă a coeficienţilor (surprind efectul pe termen lung, respectiv pe termen
scurt). Această reprezentare este adecvată când ne interesează modificările faţă de perioada
anterioară (de exemplu, în cazul ratei inflaţiei).
Coeficienţii i conţin informaţii despre ajustarea pe termen scurt, iar pentru a identifica
eventuale relaţii de echilibru pe termen lung între elementele vectorului Y se pornește de la
matricea . Rangul matricii indică numărul relaţiilor de cointegrare prezente între seriile
celor k variabile din vectorul Y.
Cum seriile din Yt sunt I(1), rezultă că seriile din Yt sunt staţionare; astfel rangul
matricei, notat cu r, trebuie să fie mai mic decât numărul variabilelor r=rang( )<k; dacă spre
exemplu I k , atunci membrul stâng al ecuaţiilor este o serie staţionară Yt , iar în cel drept
avem o serie nestaţionară Yt 1 plus seriile staţionare ( Yt i , respectiv reziduul). Astfel, 0
sau rang( )<k. Rangul matricii este egal cu numărul de linii (sau coloane) liniar independente.
Avem rang( )=k doar când toate variabilele au serii staţionare; în acest caz, nu se pune
problema cointegrării.
Când matricea (kxk) are rang redus 1 r k 1, aceasta poate fi descompusă în două
matrici (kxr) şi (kxr), fiecare cu rangul r:
' .
Astfel, în ipoteza unor variabile cu serii I(1), reprezentarea VECM a unui vector cointegrat cu r
relaţii de cointegrare este:
sau
unde 'Yt 1 t 1 are serie staţionară I(0), fiind vectorul r x 1 al relaţiilor de cointegrare, (kxr)
este matricea vectorilor de cointegrare (r vectori de cointegrare, fiecare coloană reprezentând
coeficienţii unui vector de cointegrare); aceştia formează o bază în spaţiul vectorilor de
cointegrare, orice combinaţie liniară a vectorilor din bază fiind, de asemenea, un vector de
cointegrare. Avem în această reprezentare un VAR(p-1), în care toate seriile sunt staţionare.
Matricea coeficienţilor de ajustare din t 1 reprezintă viteza cu care Yt se ajustează la
dezechilibre în relaţia de cointegrare.
Descompunerea ' nu este unică, deoarece pentru orice matrice M(rxr) nesingulară
avem ' (M )(M 1 ' ) (M )(M 1' ) ' ab ' , unde a M , iar b M 1' . Pentru a
obţine valori unice sunt necesare anumite restricţii, precum normalizarea (se împart toţi
coeficienţii vectorului de cointegrare la unul dintre ei) sau restricţii sugerate de teoria economică.
şi se definesc utilizând cele mai mari valori proprii ale matricii . În scopul stabilirii numărului
de relaţii de cointegrare, sunt estimate valorile proprii (sau rădăcinile caracteristice) ale matricei
: ˆ1 ˆ2 ... ˆk 1 . Aceste valori proprii sunt egale cu pătratul corelaţiei canonice între Yt şi
Yt 1 corectată de diferenţele Yt i , astfel că iau valori între 0 şi 1. Numărul valorilor proprii
semnificativ diferite de zero indică numărul relaţiilor de cointegrare. Rangul matricii este egal
cu numărul valorilor proprii diferite de zero.
Următoarele două teste, de tip raport al verosimilității (LR- “likelihood ratio”), sunt utilizate
pentru determinarea numărului r de valori proprii semnificativ diferite de zero, adică a numărului
relaţiilor de cointegrare:
Cu alte cuvinte, se testează succesiv, pentru r=0,1, ...,k-1 dacă există cel mult r relaţii de
cointegrare până la primul r pentru care ipoteza nulă nu se respinge. Când ipoteza nulă H 0 nu se
respinge, valoarea statisticii LR este aproape de zero, adică ultimele k- r valori proprii sunt
nesemnificative r 1 ,..., ˆk . Ipoteza nulă se respinge când valoarea calculată a statisticii este mai
mare decât cea critică.
Ipoteza nulă poate fi formulată astfel: rangul matricei este egal cu r contra unei ipoteze
alternative care specifică faptul că rangul matricei este r+1. Se respinge ipoteza nulă când
statistica testului este mai mare decât valoarea critică.
Cu alte cuvinte, se testează succesiv, pentru r=0,1, ...,k-1 dacă există cel mult r relaţii de
cointegrare contra ipotezei alternative care specifică existența a r+1 relaţii de cointegrare
Valorile critice sunt determinate de mai mulţi autori, printre care Johansen și Juselius
(1990), MacKinnon-Haug-Michelis (1999). Valorile critice diferă după cum seriile au constantă
şi/sau tendinţă deterministă, respectiv ecuaţiile de cointegrare conţin constantă şi/sau tendinţă
deterministă. Forma generală a modelului este:
Pentru selecţia numărului de întârzieri (decalaje, lag-uri), în analizele de tip VECM sau
VAR, se pot utiliza criteriile informaționale (de exemplu, AIC (Akaike Information Criterion),
SIC (Schwarz Information Criterion) sau HQ (Hannan-Quinn Information Criterion)). Se alege
acea valoare pentru p ce minimezează valoarea acestor criterii informaționale.
Această abordare facilitează testarea unor restricţii, utilizând teste de tip LR distribuite
după legea hi-pătrat ( ), restricţii eventual sugerate de teoria economică, asupra elementelor
matricei vectorilor de cointegrare sau a matricei coeficienţilor de ajustare ; regăsim aici şi
testele de exogeneitate (slabă sau tare).
Modelul dinamic VECM poate fi utilizat pentru generarea de previziuni, respectiv pentru
a analiza impactul unor perturbaţii (şocuri) aleatoare asupra variabilelor sistemului.
Modificare
Țara
structurală în:
Constantă și Constantă, pantă și
Constantă Constantă și pantă
trend trend
Franța -5.88 (-5.28) [2001] -5.86 (-5.57) -6.77 (-6.00) [2000] -6.56 (-6.32) [2000]
[2001]
Spania -4.82 (-4.61) -5.30 (-4.99) -4.99 (-4.95) [1990] -5.96 (-5.50)
[2003] [2003] [1997]
Germania -4.93 (-4.61) -5.84 (-5.57) -5.73 (-4.95) [1991] -5.72 (-5.50)
[1991] [1991] [1991]
Note: se raportează valorile calculate ale statisticii Z. Valorile critice la un nivel de semnificație de 5% și anul în
care a avut loc o modificare structurală se raportează în paranteze.
Testul de cointegrare al lui Johansen și Juselius (1990) indică existența numărului de relații de
cointegrare sub diverse specificări.
Tablelul 2. Rezultatele testului de cointegrare Johansen și Juselius (1990)