Sunteți pe pagina 1din 94

Serii de timp

CURS III: ESTIMAREA TENDINȚEI PRIN FUNCȚII


ELEMENTARE (METODE ANALITICE) ȘI METODE
MECANICE
Componentele unei serii de timp

În abordarea tradiţională, fluctuaţiile din seriile de timp sunt privite ca o rezultantă a


suprapunerii următoarelor componente: tendinţa sau trendul T, componenta ciclică C,
componenta sezonieră S, respectiv componenta eroare  :
Yt  f (Tt , Ct , St ,  t )
Primele trei componente sunt considerate deterministe, sistematice, determinate de
factori cu acţiune continuă asupra fenomenului, în timp ce componenta eroare are
caracter aleator fiind efectul acţiunii unor factori imprevizibili, accidentali.

Modelul tradițional de descompunere a seriilor de timp este, de regulă:

 aditiv: Yt  Tt  Ct  S t   t sau
 multiplicativ: Yt  Tt  Ct  S t   t , respectiv
 o combinaţie mixtă a componentelor seriei.

Deseori, cele două componente tendință-ciclu sunt tratate ca și o singură componentă, ce


surprinde evoluția pe termen lung, și se notează prin T, astfel Yt  f (Tt , St , eroareEt ) .
În acest context, tehnicile de analiză a seriilor de timp au ca obiective:
 separarea fiecărei componente şi modelarea comportamentului său, respectiv
 previziunea evoluţiei fiecărei componente, iar apoi compunerea acestora în scopul
obţinerii de previziuni privind evoluţia fenomenului Y. Principiul de la baza
acestei tehnici este “descompune pentru a modela iar apoi recompune”.
Previziunile utilizând modelul de descompunere se obţin prin compunerea
previziunilor realizate pentru fiecare componentă deterministă prezentă în serie, ţinând
seama de forma modelului, aditiv respectiv multiplicativ:
Yˆ  Tˆ  Cˆ  Sˆ respectiv Yˆ  Tˆ  Cˆ  Sˆ .
Extrapolarea tendinţei respectiv a celorlalte componente deterministe, conduce la
previziuni adecvate în condiţiile în care:
- modelele estimate reuşesc să surprindă ceea ce este esenţial, repetabil, în
comportamentul trecut al fenomenului respectiv
- comportamentul factorilor ce determină schimbările în timp în nivelul înregistrat
de variabila Y rămâne şi pe viitor aproximativ acelaşi.
Extrapolarea este adecvată, în principal, pentru obţinerea de previziuni pe termen
scurt, elaborându-se de regulă două sau mai multe scenarii de evoluţie. Menţionăm, de
asemenea, că uneori, în principal în econometrie, unde variabilele incluse într-un model
sunt în prealabil desezonalizate, este necesară eliminarea componentei sezoniere din seria
de timp, obţinându-se seria ajustată sezonier d:
Y
d .
S

Componentele deterministe sunt dificil de definit.


Tendinţa sau tendinţa generală redă evoluţia fenomenului pe termen lung, având alura
unor funcţii neperiodice, lent variabile în timp. Factori cu acţiune permanentă asupra
fenomenului (de exemplu, creşterea populaţiei, progresul tehnic, inflaţia) imprimă, pe o
perioadă lungă de timp, o tendinţă, de regulă crescătoare sau descrescătoare, majorităţii
indicatorilor economici.
Un caz particular il constituie aici seriile de timp ce fluctuează în jurul unei medii
constante (tendința este orizontală, paralelă cu axa OX); spunem ca aceste serii sunt
staționare în medie).
Componenta ciclică este observabilă, analizând evoluţia fenomenului pe termen lung, şi
se manifestă sub forma unor oscilaţii cu perioadă şi amplitudine ce variază, de regulă, în
timp, un ciclu acoperind câţiva ani. Evoluţiile ciclice apar, în principal, ca urmare a
ciclurilor economice sau a fluctuațiilor din cererea unui produs, componenta fiind
prezentă în evoluţia unor indicatori macroeconomici de rezultate sau a unor indicatori din
domeniul financiar, dar şi din alte domenii.

Componenta sezonieră se evidenţiază sub forma unor cicluri de durată mai mică sau egală
cu un an, şi apare, în principal, datorită ritmului impus de schimbarea anotimpurilor, dar şi
de activităţi economice, respectiv sociale (regularităţi în plata salariilor, sărbători, vacanţe,
obiceiuri, tradiţii, etc.).

Componenta eroare se manifestă prin fluctuaţii aparent aleatoare în jurul componentelor


deterministe, fiind efectul acţiunii unor factori cu acţiune punctuală în timp, de tipul
evenimentelor politice sau meteorologice.
Componenta aleatoare este prezentă în toate seriile cronologice, în timp ce o serie poate
prezenta sau nu tendinţă, variaţie ciclică sau sezonieră. Evidenţierea componentelor
deterministe este dependentă şi de perioada supusă observării, respectiv de frecvenţa
observaţiilor. Deseori, cronograma seriei și natura indicatorului sugerează componentele
prezente.

Vor face obiectul acestui curs doar componentele deterministe. Componenta aleatoare nu
trebuie ignorată, deoarece conţine informaţii utile în previziune, modelarea acesteia fiind
abordată în cursurile următoare. Dacă nu se precizează altfel, pentru previziunea variabilei Y,
componenta aleatoare se ignoră (se presupune a fi nepredictibilă, adică de tip zgomot alb). În
practică, identificarea şi separarea celor patru componente din seria cronologică nu sunt de
regulă realizabile cu exactitate, reziduul rămas după extragerea estimaţiilor componentelor
deterministe regăsindu-se în componenta aleatoare.
Metode de ajustare a trendului

-metoda grafică;

-metode analitice (prin funcții elementare);

-metode mecanice (metoda mediilor eșalonate, metoda mediilor mobile, metoda


sporului mediu, metoda indicelui mediu; metodele mecanice au la bază utilizarea
unei formule pentru calculul valorilor ajustate; unii autori tratează metoda mediilor
mobile separat de celelalte metode mecanice).

Estimarea trendului prin metoda sporului mediu și metoda indicelui mediu

Metoda sporului mediu sau metoda modificării medii absolute

yt = y1 + (t − 1)∆

Metoda indicelui mediu de dinamică

yt = y1 ∙ I (t−1)
Estimarea tendinţei prin funcţii elementare

Pentru modelarea şi previzionarea tendinţei se au în vedere funcţiile elementare lent


variabile în timp. Vom considera că seria prezintă doar tendinţă şi componentă aleatoare,
modelul de descompunere fiind aditiv, respectiv multiplicativ:
Yt  Tt   t , respectiv Yt  Tt   t .
De asemenea, în acest context presupunem că tendinţa poate fi modelată suficient de bine
prin funcţii elementare. Cele mai uzuale funcţii utilizate pentru modelarea tendinţei
indicatorilor din economie sunt redate în Tabelul 1.
Tabelul 1. Funcţii elementare utilizate în modelarea tendinţei

Tendinţă Forma liniarizată


liniară
Tt  a  bt
parabolă T  a  bt  cX
Tt  a  bt  ct 2 unde X  t ²
hiperbolă T  a  bX
1
Tt  a  b unde X 
1
t t
exponenţială Z  A  Bt , unde
Tt  a  b t Zt  ln Tt ; A  ln a; B  ln b
putere Z  A  bX , unde
Tt  a  t b Z t  ln Tt ; A  ln a; X  ln t

logaritmică T  a  bX
Tt  a  b ln t unde X  ln t
curba logistică
a
Tt  , a, c  0
1  e b ct
Curba logistică este o legitate specifică evoluţiei vânzărilor dintr-un nou produs, dar
nu exclusiv acesteia, fiind adecvată pentru modelarea evoluţiei pe termen lung şi a altor
indicatori (Melard, 1990).

Figura 1. Curba logistică

Graficul său din figura 1 indică, pentru exemplul vânzărilor dintr-un nou produs, o
creştere accelerată a acestora după lansarea produsului, urmată de o încetinire a ritmului
de creştere spre un prag de saturaţie egal cu a. Punctul de inflexiune al curbei este de
coordonate (b/c, a/2).
Pentru estimarea parametrilor tendinţei liniare
Tt  a  bt
se utilizează metoda celor mai mici pătrate (utilizată în estimarea ecuatiei de regresie
liniară). Rolul variabilei exogene (independente) este jucat aici de variabila timp t:
Yt  a  bt   t t  1, 2, ... , n .
Expresiile de calcul a parametrilor a, b sunt deci următoarele:
n

 (t  t )(Y t Y)
b t 1
n
,
 (t  t )
t 1
2

a  Y  bt ,
sau echivalent
M (tY )  M (t ) M (Y )
b ,
M (t 2 )  [ M (t )]2
a  Y  bt.
Seria prezintă o tendinţă de creştere dacă b > 0, respectiv de descreştere dacă b < 0.
Variabila timp se măsoară cu ajutorul scalei de interval, astfel că originea scalei,
respectiv unitatea de măsură, se pot stabili în mod arbitrar. Uneori, pentru uşurarea
calculelor sunt stabilite astfel încât t  0 , adică ∑t=0 , variantele variabilei t rezultând în
consecinţă. Astfel, daca n este impar t  ..., 3,  2,  1, 0,1, 2, 3,... , respectiv pentru n par
t  ..., 2,5;  1,5;  0,5; 0,5;1,5; 2,5;... sau t  ...., 5,  3,  1,1, 3, 5,....

Cu excepţia curbei logistice, celelalte funcţii neliniare din Tabelul 1 pot fi aduse la o
formă liniarizată prin anumite substituţii, respectiv prin aplicarea operaţiei de logaritmare
în cazul funcţiei exponenţiale şi a funcţiei putere.
Spre exemplu, în cazul tendinţei exponenţiale
Tt  a  b t ,
considerând un model de descompunere multiplicativ Yt  Tt   t , operaţia de logaritmare a
ambilor membri conduce la:
ln Yt  ln a  t ln b  ln  t .
Prin substituţiile A  ln a, B  ln b, t  ln  t se obţine forma liniarizată:
ln Yt  A  Bt  t .
Aplicând metoda celor mai mici pătrate, se determină A și B:
M (tX )  M (t ) M ( X )
B
M (t 2 )  M (t )
2

A  M ( X )  bM (t )
unde s-a notat X  ln Y . Pe baza coeficienţilor A și B se pot determina parametrii
tendinţei exponenţiale a  e A , b  e B .
În cazul tendinţei parabolice
Yt  a  bt  cX   t
unde X  t ² , pentru estimarea parametrilor a, b, c se utilizează relațiile de calcul deduse
în cadrul regresiei liniare multiple, lucrând, eventual, cu variante pentru variabila t astfel
încât t  0 (∑t=0) (scopul este uşurarea calculelor).

Estimarea parametrilor curbei logistice necesită utilizarea unor metode specifice


de tipul procedurilor numerice iterative pentru modele neliniare sau a metodei celor trei
puncte (Melard, 1990), metode integrate în softurile de statistică.
Estimarea tendintei utilizând mediile mobile

Când cronograma seriei nu oferă indicii foarte clare privind prezenţa, respectiv forma
tendinţei, este indicat a se utiliza, în prealabil, o tehnică de netezire ce atenuează
amplitudinea fluctuaţiilor aleatoare din serie, scopul fiind evidenţierea (estimarea)
tendinţei. Metoda mediilor mobile, netezirea exponenţială, dar şi alte filtre de netezire
sunt utilizate frecvent în practică. Se consideră că seria prezintă doar tendinţă şi
componentă aleatoare, iar modelul de descompunere este unul aditiv:
Yt  Tt   t .
Metoda mediilor mobile

Media mobilă se defineşte ca o combinaţie liniară de puteri pozitive şi negative


ale operatorului de întârziere L:
m2 m2
MM  
i   m1
i L
i
cu 
i   m1
i  1

unde m1 , m2  N ,  m1 , ... ,  m2  R iar operatorul de întârziere L este definit prin:


LYt  Yt 1
O medie mobilă este centrată dacă m1=m2=m. Media mobilă este simetrică dacă este
centrată şi coeficientii simetrici sunt egali  i   i , i  1, ... , m . O medie mobilă simetrică
se notează prin , indicându-se ordinul acesteia, respectiv
coeficienţii. Transformările utilizate frecvent în practică sunt mediile mobile simetrice:
m
MM  
i  m
i Li

fiecare valoare observată fiind înlocuită cu o medie ponderată a termenilor adiacenţi.


Metoda mediilor mobile, utilizată în acest context, are ca şi obiective conservarea
tendinței T şi reducerea amplitudinii componentei eroare:
 eliminarea componentei aleatoare f ( t )  0 respectiv
 conservarea tendinţei f (Tt )  Tt .

Pornind de la cele două cerinţe se pune problema determinării adecvate a ordinului


mediei mobile 2m  1 respectiv a coeficienţilor  m , ... ,  0 .
Se va aborda în continuare problema determinării unor condiţii suficiente pentru
ca media mobilă să conserve o tendință liniară. În acest sens, se cunoaşte următoarea
proprietate ce specifică condiţii suficiente pentru ca o medie mobilă să conserve
polinoame de un anumit grad.

Proprietate (Gourieroux & Monfort, 1990). O medie mobilă centrată și simetrică


conservă polinoame de grad mai mic sau egal cu p dacă λ = 1 este rădăcină de ordin
p  1 a ecuaţiei caracteristice:
 m   m1  ...   m2m  m  0
În ceea ce priveşte transformarea componentei eroare printr-o medie mobilă:
m
ut  
i  m
 i  t i

se observă că atunci când  t constituie o secvenţa de variabile aleatoare necorelate şi de


aceeaşi varianţă  2 , noile variabile au media, respectiv varianţa:

Prin aplicarea unei medii mobile, varianţa componentei eroare este diminuată atunci când
m


i m
i
2
 1 . Raportul de reducere a varianţei erorii se defineşte prin:
m
 / 
*2 2

i  m
i
2

şi măsoară capacitatea mediei mobile de a reduce această componentă.


Mediile aritmetice
Cele mai simple medii mobile simetrice sunt mediile aritmetice:
Y Y  ...  Yt  ...  Yt m1  Yt m
Yt  t m t m1 ; t  m  1, m  2,..., T  m ;
2m  1
Mediile aritmetice constituie un caz particular de medie mobilă centrată şi simetrică,
1
coeficienţii fiind toţi egali cu  i  . Coeficienţii acesteia s-au dedus din
2m  1
următoarele cerinţe (Gourieroux & Monfort, 1990):
m
 media mobilă lasă invariantă o constantă, condiţie echivalentă cu 
i m
i 1

respectiv
m
 minimizează raportul de reducere a varianţei componentei eroare 
i m
i
2
.

Se arată că mediile aritmetice lasă invariantă tendinţa liniară, dar nu şi tendinţe


polinomiale de grad mai mare sau egal cu doi.
Observaţii. a) Pentru o medie aritmetică, raportul de reducere a varianţei erorii este
1
egal cu , astfel că secvenţa rezultată în urma aplicării mediilor mobile este cu atât
2m  1
mai netedă cu cât ordinul mediei mobile este mai mare;
b) Tendinţa seriei se estimează prin seria mediilor mobile Tt  Yt .
Dezavantajul major al metodei mediilor mobile constă în imposibilitatea
determinării unor valori netezite pentru primii respectiv ultimii termeni din seria de timp.

În practică, alegerea ordinului mediei mobile pentru eliminarea componentei


aleatoare rămâne în sarcina statisticianului, fiind indicat un ordin mai mare dacă
amplitudinea fluctuaţiilor aleatoare este mai mare. Oricum, oscilaţiile din componenta
aleatoare fiind neregulate, eliminarea acesteia se realizează doar parţial. Prin aplicarea
unei medii mobile, indiferent de ordinul acesteia, amplitudinea fluctuaţiilor se reduce.
Medii mobile centrate

Mediile aritmetice necesită un număr impar p  2m  1 de observaţii, în calculul fiecărei


medii. Dacă ordinul mediei mobile MM(p) este un număr par p  2 m , atunci, de regulă,
se utilizeaza mediile mobile centrate şi simetrice, definite astfel:
0,5Yt m  Yt m1  ...  Yt  ...  Yt  m1  0,5Yt  m
Yt  , t  m  1, m  2, .... T  m
2m
În cazul particular p = 4, mediile mobile centrate sunt date de relaţiile:
0,5Yt 2  Yt 1  Yt  Yt 1  0,5Yt  2
Yt 
4
sau
Y t  0.125Yt 2  0.5Yt 1  0.5Yt  0.5Yt 1  0,125Yt 2

Rezultă:
0,5Y1  Y2  Y3  Y4  0,5Y5
Y3 
4
0,5Y2  Y3  Y4  Y5  0,5Y6
Y4 
4

0,5YT 4  YY 3  YT 2  YT 1  0,5YT
Y T 2  .
4

Astfel, se realizează o corespondenţă între valorile observate Yt şi mediile mobile Y t .


Mediile mobile sunt, de asemenea, cele mai populare tehnici de netezire utilizate
în analiza tehnică. Analiza tehnică este utilizată de către investitorii pe piaţa de capital, în
scopul identificării tendinţei Există mai multe tipuri de medii mobile utilizate în acest
context. Singura diferenţă semnificativă între diversele tipuri de medie mobile este
ponderea acordată datelor recente; acestea sunt, de regulă, medii asimetrice. Media
mobilă simplă, spre exemplu, asociază ponderi egale tuturor preţurilor şi se calculează
însumând preţurile de închidere ale unei acţiuni pentru ultimele p perioade şi împărţind
totalul la numărul de perioade ales:
Yt  p  Yt  p1  ...  Yt
Yt  .
p
Ordinul mediei mobile p trebuie să se potrivească cu ciclul pieţei pe care dorim să îl
urmărim. De exemplu, dacă o acţiune are un ciclu de creştere-scădere de 40 de zile,
media mobilă ideală se va baza pe 21 de zile de tranzacţionare; practica sugerează
următoarea regulă: ordinul mediei mobile = lungimea ciclului bursier/2 +1. Un ordin des
utilizat este cel de 200 de zile, reuşind să indice tendinţa pieţei pe termen lung (tendinţa
generală a pieţei). Un semnal de cumpărare este generat când preţul acţiunii creşte peste
media sa mobilă, iar semnalul de vânzare este generat de scăderea preţului sub media
mobilă.
Ordinul unei medii mobile (p) se alege în funcție de frecvența
datelor: ordinul 3 sau 5 pentru date anuale, ordinul 4 pentru date
trimestriale, ordinul 12 pentru date lunare. Dacă se calculează
medii mobile dintr-un număr impar de termeni, atunci se pierd p-1
termeni corespunzători termenilor de la începutul și sfârșitul seriei
ințiale. Dacă se calculează medii mobile dintr-un număr par de
termeni, atunci se pierd p termeni corespunzători termenilor de la
începutul și sfârșitul seriei ințiale.
Serii de timp
CURS VI: PROCESE ALEATORII. FUNCȚIA DE
AUTOCORELAȚIE ȘI FUNCȚIA DE AUTOCORELAȚIE
PARȚIALĂ
Un proces aleatoriu sau stochastic reprezintă un set de variabile aleatorii
ordonate în timp. Din punct de vedere matematic, procesul aleatoriu este o funcție care
asociază un număr real fiecărei realizări a unui eveniment la un anumit moment de timp
dat. Variabila aleatorie se notează cu y(t) dacă aceasta este continuă și cu yt dacă este
discretă. Electrocardiograma este o variabilă aleatorie continuă, iar rata șomajului, PIB,
rata inflației etc. sunt variabile aleatorii discrete. În cazul seriilor de timp cu înregistrări
discrete, de obicei datele sunt observate la intervale egale de timp.
Fie o secvență de T variabile aleatorii, indexate după timp, realizări ale unui
proces stochastic: . Eșantionul observat reprezintă o realizare particulară în
T unități de timp a aceluiași proces stochastic. Realizarea acestui proces de generare a
datelor (DGP- data generating process) este o serie de timp (stochastică).
În funcție de mărimea orizontului de timp, în analizele economice se folosesc două abordări:
Considerăm în continuare o clasă particulară de procese aleatoare, numite procese
staţionare.

Fie un proces aleator (Yt ) unde t  Z . Pentru observaţia aferentă momentului t, a


variabilei aleatoare Yt , se definesc:
- media variabilei E Yt    t
- varianţa Var Yt    t2  E[(Yt   t ) 2 ]
- covarianţa dintre două variabile Yt şi Ys , prin
 ts  covYt , Ys   E Yt   t Ys   s  .
Deoarece dispunem de o singură observaţie pentru fiecare variabilă Yt este imposibil
de estimat aceste elemente. Estimarea devine posibilă pentru o clasă particulară de
procese aleatoare, numite procese staţionare.
Staționaritate în sens strict și staționaritate în covarianță (de ordinul doi)
Un proces este staționar când momentele sale sunt independente de timp. Dacă sunt
independente de timp doar momentele de ordinul doi, procesul este staționar de ordinul doi sau
staționar în covarianță. Staționaritatea de ordinul doi este suficientă pentru a demonstra
proprietățile importante ale estimatorilor.

Definiţie. Un proces staţionar de ordinul doi dacă verifică următoarele trei condiţii:
(1) E Yt    , t media este constantă în timp (staţionaritate în medie)
(2 Var Yt    2 varianţa este constantă în timp (staţionaritate în varianţă)
(3) cov Yt , Ys    k , t  s unde k  s  t covarianţa dintre două variabile
este funcţie doar de lungimea intervalului de timp ce separă cele 2 variabile. Pentru un
proces staţionar, funcţia de autocovarianţă devine:
 k  EYt   Ys    unde k  s  t .
Un proces staţionar se află într-o stare de echilibru (are proprietatea de a reveni
la medie ori de căte ori se îndepărtează prea mult de la aceasta).

În cronogramă, o serie staţionară se manifestă sub forma unor fluctuaţii cu


amplitudine relativ constantă (varianţă constantă) în jurul unei medii constante,
independente de timp (staţionaritate în medie). Nestaţionaritatea în medie este
specifică seriilor cu tendinţă, iar nestaţionaritatea în varianţă se observă prin
modificarea în timp a amplitudinii fluctuaţiilor.
Zgomot alb (white noise). Un caz particular de proces staţionar este cel de tip
zgomot alb (denumire luată din tehnică), acesta fiind o succesiune de variabile
aleatoare  t , t  N independente şi identic distribuite, cu medie zero. Astfel:

 E  t   0
 Var t    2  E( t2 )
 𝐶𝑜𝑣 𝜀𝑡 , 𝜀𝑠 = 0, ∀ 𝑡 ≠ 𝑠
Autocovarianța măsoară dependența liniară dintre două valori ale aceleași serii
înregistrate la momente diferite de timp. Autocovarianțele reprezintă momentul de
ordinul II al seriilor de timp (media este momentul de ordinul I). Funcția de
autocovarianță 𝛾𝑡 (𝑘) evaluează posibilele legături dintre variabila 𝑦𝑡 și variabilele
𝑦𝑡 −1 , 𝑦𝑡−2 , 𝑦𝑡 −3 , ..., adică legătura dintre valorile curente și cele trecute ale seriei
de timp analizate pentru k=1,2,...

Coeficientul de autocovarianță de ordinul k este definit prin relația:

𝛾𝑡 𝑘 = 𝑐𝑜𝑣 𝑦𝑡 , 𝑦𝑡 −𝑘 = 𝐸 𝑦𝑡 − 𝐸 𝑦𝑡 [𝑦𝑡−𝑘 − 𝐸 𝑦𝑡−𝑘 ] , ∀ 𝑡, 𝑘 ∈ 𝑍

E(.) este valoarea așteptată (expectată) (engl., expected value) sau media pentru
variabila analizată.

Autocovarianța de ordinul k=0 este dispersia (varianța) variabilei 𝑦𝑡 , notată cu


var(𝑦𝑡 ) sau 𝜎𝑦2 .
2
𝛾𝑡 0 = 𝑐𝑜𝑣 𝑦𝑡 , 𝑦𝑡 = 𝐸 𝑦𝑡 − 𝐸 𝑦𝑡 = 𝜎𝑦2 , ∀ 𝑡 ∈ 𝑍
Funcţia de autocorelaţie (ACF- autocorrelation function)

Considerăm un proces staţionar. Funcţia de autocorelaţie 𝝆𝒌 se defineşte prin:


𝛾𝑘 𝐸[(𝑌𝑡 −𝜇 )(𝑌𝑡−𝑘 −𝜇 )]
𝜌𝑘 = = , kZ
𝛾0 𝐸[(𝑌𝑡 −𝜇 )2 ]

şi măsoară corelaţia liniară dintre două variabile Yt şi Yt-k separate de k unităţi de


timp.

Pentru k=1 respectiv k=2 coeficientul de autocorelaţie devine

𝛾1 𝐸[(𝑌𝑡 − 𝜇)(𝑌𝑡−1 − 𝜇)]


𝜌1 = =
𝛾0 𝐸[(𝑌𝑡 − 𝜇)2 ]
𝛾2 𝐸[(𝑌𝑡 − 𝜇)(𝑌𝑡−2 − 𝜇)]
𝜌2 = =
𝛾0 𝐸[(𝑌𝑡 − 𝜇)2 ]
1. 𝜌𝑘 ∈ [−1,1]

2.  0  E Yt   2  VarYt    2

3. 𝜌𝑘 = 𝜌−𝑘 , adică funcţia de autocorelaţie este o funcţie pară.

4.
𝑐𝑜𝑣(𝑌𝑡 , 𝑌𝑡−𝑘 )
𝜌𝑘 =
𝑉𝑎𝑟(𝑌𝑡 ) ∙ 𝑉𝑎𝑟(𝑌𝑡−𝑘 )

→ regăsim coeficientul de corelaţie liniară dintre Yt şi Yt-k

Pentru un proces de tip zgomot alb, funcţia de autocorelaţie devine:

𝜌𝑘 = 1, 𝑝𝑒𝑛𝑡𝑟𝑢 𝑘 = 0 ș𝑖 𝜌𝑘 = 0, 𝑝𝑒𝑛𝑡𝑟𝑢 𝑘 ≠ 0.

variabilele fiind necorelate.


Graficul funcţiei de autocorelaţie se numeşte corelogramă şi oferă informaţii importante privind
comportamentul seriei de timp. Estimarea funcţiei presupune calculul unor coeficienţi de
autocorelaţie (corelaţie liniară) pentru fiecare cuplu (Yt, Yt-k):

k=1 (Yt, Yt-1). 𝜌1

k=2 (Yt, Yt-2). 𝜌2

.................................................................

k=M (Yt, Yt-M) 𝜌𝑀

Prezintă importanţa calculul primelor T/4 autocorelaţii (spre exemplu, dacă lungimea seriei este
T=80  M = 80/4 = 20).
Estimarea coeficienţilor de autocorelaţie

În practică, se dispune de o serie cronologică Y1, …, YT (eşantion finit în timp şi există o


singură observaţie pentru fiecare variabila aleatoare Yt ). În ipoteza staţionarităţii, media  şi
varianţa  2 procesului pot fi estimate utilizând această singură realizare, prin media, respectiv
varianţa de eşantionare:

1 T
Y   Yt
T t 1

1 T
s   (Yt  Y ) 2 .
2

T t 1
Coeficientul de autocorelaţie 𝜌𝑘 se estimează prin:

𝑇
𝑡=𝑘+1(𝑌𝑡 − 𝑌)(𝑌𝑡−𝑘 − 𝑌)/(𝑇 − 𝑘)
𝜌𝑘 = 𝑇 2
𝑡=1(𝑌𝑡 − 𝑌 ) /𝑇

respectiv

𝑇
𝑡=𝑘+1(𝑌𝑡 − 𝑌 )(𝑌𝑡−𝑘 − 𝑌)
𝜌𝑘 = 𝑇 2
𝑡=1(𝑌𝑡 − 𝑌)

dacă lungimea seriei este suficient de mare (şi astfel T-k nu diferă foarte mult de T).
Testarea semnificației coeficieţilor de autocorelaţie

Testarea semnificației coeficientului de autocorelaţie 𝜌𝑘 :

1. Formularea ipotezelor testului:

H0 : 𝜌𝑘 = 0

H1 : 𝜌𝑘 ≠ 0

2. Calculul statisticii testului de tip t-Student:

𝜌𝑘
𝑡 =
𝑉𝑎𝑟 (𝜌 𝑘 )
converge asimptotic (când T   ) la legea normală N (0,1)

Pentru varianţa estimatorului coeficientului de autocorelaţie, Bartlett a furnizat


următoarea expresie:
𝑘 −1
1 1
𝑉𝑎𝑟 𝜌𝑘 = 1+2 𝜌𝑘2 = 1 + 2(𝜌12 + 𝜌22 + ⋯ + 𝜌𝑘2−1 )
𝑇 𝑇
𝑖=1
3.Decizia testului: pentru un nivel de semnificaţie  , ipoteza nulă H0 nu
se respinge dacă t calc   t tab , t tab  sau echivalent cu
𝜌𝑘 ∈ −𝑡𝑡𝑎𝑏 𝑉𝑎𝑟 𝜌𝑘 , 𝑡𝑡𝑎𝑏 𝑉𝑎𝑟 𝜌𝑘 .

Observaţie. Uneori pentru varianţa estimatorului se utilizează expresia


1
𝑉𝑎𝑟 𝜌𝑘 = (expresie adecvată de fapt doar când seria este de tip zgomot alb).
𝑇
Astfel, pentru T suficient de mare (pentru a putea aproxima legea Student prin
legea normală), o valoare absolută pentru coeficientul de autocorelaţie mai mare
decât 1.96 / T (nivelul de semnificaţie fiind fixat la 5%) indică faptul ca acesta
diferă semnificativ de zero.
Testul combinat Box-Pierce

-verifică o ipoteză combinată (denumită ipoteză de tip portmanteau (în lb. română,
valiză)), potrivit căreia toți coeficienții de autocorelație până la un rang m sunt
simultan nuli.

Ipotezele testului Box-Pierce

H0 : 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0

H1 : există cel puțin un 𝜌𝑘 semnificativ diferit de zero

Statistica testului Box-Pierce


m

Q=T ρ2k
k=1

m- numărul maxim de întârzieri (laguri, decalaje)

𝜌𝑘 - coeficientul de autocorelație de selecție (empiric) de ordinul k

T- numărul de observații din seria de timp.


Dacă valorile 𝑦𝑡 sunt normal distribuite, atunci Q tinde asimptotic către o
distribuție 𝜒𝑚2 (hi-pătrat cu m grade de libertate).

𝜒𝑚2 - valoarea teoretică (critică)

Dacă Q > 𝜒𝑚2 , atunci se respinge ipoteza nulă la un anumit nivel de semnificație 𝛼.

Este suficient ca un singur coeficient de autocorelație să fie semnificativ pentru a


respinge ipoteza nulă. Testul este valabil oricare ar fi media seriei, însă este puțin
performant în cazul seriilor scurte.
Testul Ljung-Box
Testul Box-Pierce nu are proprietăți asimptotice bune în cazul eșantioanelor de
dimensiuni reduse. De aceea, Ljung și Box (1978) au dezvoltat un test cu
proprietăți mai bune pentru eșantioane mici, sub aceeași ipoteză nulă.

Ipotezele testului Ljung-Box

H0 : 𝜌1 = 𝜌2 = ⋯ = 𝜌𝑘 = 0

H1 : există cel puțin un 𝜌𝑘 semnificativ diferit de zero

Statistica testului Ljung-Box


m

ρ2
k
Q = T(T + 2)
T−k
k=1

m- numărul maxim de întârzieri (laguri, decalaje)

𝜌𝑘 - coeficientul de autocorelație de selecție (empiric) de ordinul k

T- numărul de observații din seria de timp.


2
Statistica Ljung-Box este distribuită 𝜒𝑚 (hi-pătrat cu m grade de libertate), iar
regula de decizie este similară testului Box-Pierce. Proprietățile asimptotice ale
statisticii Q* sunt superioare proprietăților statisticii Q.
Funcţia de autocorelaţie parţială (PACF- partial autocorrelation function)

În multe cazuri, corelaţia între două variabile este determinată de faptul că ambele variabile
sunt corelate cu o a treia variabilă. În acest context, o mare parte din corelaţia între două variable
Yt şi Yt-k poate exista ca urmare a unui efect indirect de corelare a ambelor variabile cu
variabilele intermediare Yt 1 , Yt  2 , Yt  k 1 . Pentru a se evita această situație, se utilizează
coeficientul de autocorelaţie parţială, acesta măsurând efectul direct al lui Yt-k asupra variabilei
Yt (se izolează influenţa variabilei Yt-k). Definiția acestui coeficient este similară cu cea
coeficientului de corelaţie parţială utilizat în econometrie.

Coeficientul de autocorelaţie parțială între două variabile separate de k unităţi de timp notat
prin c k este coeficientul de regresie a variabilei Yt  k în modelul autoregresiv AR(k):

𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝑐2 𝑌𝑡−2 + ⋯ + 𝑐𝑘 𝑌𝑡−𝑘 + 𝜀𝑡

şi măsoară informaţia adiţională adusă de variabila Yt  k în explicarea comportamentului prezent


Yt (cu câte unităţi se modifică Yt dacă Yt  k creşte cu o unitate, iar celelalte variabile
Yt 1 , Yt  2 , Yt  k 1 rămân nemodificate). Astfel, coeficientul de autocorelaţie parţială măsoară
corelaţia între Yt şi Yt  k , în condiţiile în care celelalte variabile Yt 1 , Yt  2 , Yt  k 1 sunt menţinute
constante (se izolează influenţa variabilei Yt  k ). Coeficientul de autocorelaţie parţială între Yt şi
Yt  2 , adică c 2 , este egal cu acel coeficient de autocorelaţie 𝜌2 , dacă Yt şi Yt  2 sunt ambele
necorelate cu Yt 1 .
Funcţia de autocorelaţie parţială constă în setul de coeficienţi c k , unde k=1, 2, 3, ..... Pentru
k=1, coeficientul de autocorelaţie şi coeficientul de autocorelaţie parţială coincid 𝜌1 = 𝑐1 .
Coeficienţii de autocorelaţie parţială înregistrează valori între -1 şi 1.

Estimarea coeficienţilor de autocorelaţie parţială

O estimare directă a coeficienţilor de autocorelaţie parţială constă în estimarea coeficienţilor de


regresie pentru mai multe regresii. Astfel, c1 se estimează prin coeficientul de regresie a
variabilei Yt 1 în modelul autoregresiv AR(1):

𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝜀𝑡

c2 este coeficientul de regresie a variabilei Yt  2 în modelul autoregresiv AR(2):

𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝑐2 𝑌𝑡−2 + 𝜀𝑡
c3 este coeficientul de regresie a variabilei Yt 3 în modelul autoregresiv AR(3):

𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝑐2 𝑌𝑡−2 + 𝑐3 𝑌𝑡−3 + 𝜀𝑡

.............................................................

c k este coeficientul de regresie a variabilei Yt k în modelul autoregresiv AR(k):

𝑌𝑡 = 𝑐0 + 𝑐1 𝑌𝑡−1 + 𝑐2 𝑌𝑡−2 + ⋯ + 𝑐𝑘 𝑌𝑡−𝑘 + 𝜀𝑡


Testarea semnificației coeficienţilor de autocorelaţie parţială

Testarea semnificației coeficientului de autocorelaţie parţială c k :

H0 : c k  0

H1 : c k  0

se realizează utilizând statistica t-Student care converge asimptotic (când T   )


la legea normală N (0,1) .

𝑐𝑘
𝑡=
𝑉𝑎𝑟 (𝑐𝑘 )

Pentru varianţa estimatorului coeficientului de autocorelaţie parţială se folosește


următoarea expresie:

Var cˆ k  1
T

Decizia: pentru un nivel de semnificaţie  , ipoteza nulă H0 nu se respinge dacă


t calc   t tab , t tab  sau echivalent cˆk   t tab / T , t tab / T .
Procese nestaţionare

Un proces este nestaţionar dacă nu verifică una sau mai multe din cerinţele din definiția
procesului staţionar. În economie, majoritatea seriilor sunt nestaţionare, adică media,
respectiv varianţa acestora nu este constantă în timp.

Detectarea nestaţionarităţii:

- din cronogramă şi corelogramă;


- utilizarea unor teste pentru verificarea staţionarității, numite teste de rădăcină
unitate.

Din cronogramă:

- seria este nestaţionară în medie dacă media nu este constantă în timp. O serie ce
prezintă, spre exemplu, o tendinţă deterministă (ce poate fi modelată prin funcţii
elementare) este nestaţionară;
- seria este nestaţionară în varianţă, dacă varianţa nu este constantă în timp.
Din corelogramă (graficul funcţiei de autocorelaţie) se observă că autocorelaţiile
𝜌𝑘 ale unei serii staţionare se apropie rapid de zero, odată ce k creşte (tind
exponenţial spre zero). Pentru o serie nestaţionară în medie, autocorelaţiile sunt
mari şi pozitive pentru un număr mare de valori ale lui k.
operatorul de întârziere LYt  Yt 1 .

Există două tipuri de serii nestaționare:

a) Seriile nestaționare de tip determinist (Trend Stationary- TS) devin staţionare prin
extragerea tendinţei deterministe din date (dupa estimarea ei prin funcții elementare).
Dacă seria este staţionară relativ la o tendinţă deterministă, se spune ca seria este
staţionară relativ la tendinţă.
b) Seriile nestaționare de tip stochastic (DS- difference stationary) devin staționare prin
diferențiere (aplicarea operatorului diferență). De regulă, seriile din economie devin
staţionare după una sau două diferenţieri (astfel, d=1 sau d=2).
Un tip particular de proces nestaţionar este generat de o ecuaţie de tip autoregresiv, unde
coeficientul variabilei este unu:

Yt  Yt 1   t sau Yt  a0  Yt 1   t

 t fiind zgomot alb. Acesta se numeşte mers aleator (random walk) şi în evoluţia sa se observă
perioade cu aparente tendinţe de creştere sau descreştere, care apoi îşi schimbă brusc și
nepredictibil direcţia. Spunem că un astfel de proces are tendinţă stochastică, fiind rezultatul
acumulării unor șocuri aleatoare ce nu au o bază sistematică. Aceste evoluţii sunt specifice
variabilelor financiare şi, în principal, seriilor ce redau evoluţia cursului unor acţiuni. Varianţa
unui proces de tip mers aleator fără termen liber (fără drift) nu este constantă şi creşte odată cu t,
iar pentru forma cu termen liber (cu drift) atât media, cât şi varianţa (dispersia) variază în timp
(cresc odată cu t). Spre exemplu, dacă valoarea de pornire la momentul t=0 este Y0 atunci:

Yt   t   t 1   t  2  ...   1  Y0

iar varianţa creşte odată cu t, deoarece VarYt   t 2 .


CURSUL X: Modele cu ecuații simultane (MES)

Pentru analiza în dinamică a unui fenomen economic nu este suficient doar să se explice
o variabilă dependentă pe baza uneia sau a mai multor variabile explicative, ci trebuie
considerate mai multe ecuații de tip regresie sau egalitate în cadrul unor modele cu ecuații
simultane (MES) sau sisteme cu ecuații simultane (Simultaneous equations models- SEM). Acest
tip de modele a fost introdus la începutul anilor ‘40 ai secolului trecut de către Comisia Cowles
din cadrul Universității din Chicago (Andrei și Bourbonnais, 20081).

Forma structurală a unui model cu ecuații simultane

Dacă se consideră n variabile endogene Y1, Y2, ...,Yn și m variabile exogene X1, X2, ...,
Xm pentru care se cunosc realizările acestora în decursul a T perioade. La momentul t, se poate
scrie modelul cu ecuații simultane în formă structurală:

poate fi o variabilă aleatorie de tip zgomot alb, caz în care este identificată o relație
comportamentală (de comportament) sau poate fi o constantă, caz în care există o relație de
tip identitate.

Tipuri de ecuații în MES

- ecuații structurale (comportamentale, de comportament, veritabile) sunt ecuațiile de regresie


cunoscute;
- relații de tip identitate (ecuații contabile, ecuații de echilibru).

În cadrul unei relații, unii parametrii (coeficienți) pot fi nuli, însă în cadrul fiecărei relații
cel puțin un parametru asociat setul de variabile endogene trebuie să fie nenul.
Limitele (limitările) modelelor MES: dificultatea împărțirii variabilelor în endogene și
exogene, dificultatea estimării parametrilor, eșecul previziunilor pe baza MES.

Sub formă matricială, sistemul se scrie:

1
Andrei, T. & Bourbonnais, R. (2008). Econometrie. Editura Economică, București.
În MES în formă structurală, fiecare variabilă endogenă se exprimă în funcție de alte
variabile endogene și exogene; nu se poate aplica metoda celor mai mici pătrate. Parametrii MES
în formă structurală sunt interpretabili din puncte de vedere economic.

Forma redusă a unui model cu ecuații simultane

Dacă matricea B este inversabilă, atunci se obține:

Dacă se notează și , atunci relația anterioară devine:

(*)

Relația de mai sus este forma redusă a modelului general cu ecuații simultane. În MES în
formă redusă, fiecare variabilă endogenă se exprimă în funcție de variabile exogene.
Dacă se aplică metoda celor mai mici pătrate fiecărei ecuații din modelul (*), ipotezele
modelului liniar general de regresie trebuie îndeplinite pentru fiecare ecuație. Ipotezele
referitoare la erorile sunt: erorile din ecuația i (i=1,2,...,) sunt independente (
), erorile relative la două ecuații i și j și două momente t și t’ sunt independente (
), matricea de varianță-covarianță a erorilor la momentul t este:

Ca și în cazul modelului liniar general, se presupune că matricea de varianță-covarianță


empirică a variabilelor exogene tinde către o matrice finită când .
Dacă se îndeplinesc aceste condiții, se pot estima parametrii fiecărei ecuații din modelul
scris în formă redusă. Estimatorii obținuți sunt nedeplasați și eficienți. Se obține matricea , care
are ca elemente estimatori nedeplasați ai parametrilor formei reduse care converg în probabilitate
către valorile adevărate ale acestor parametrii.
Cunoscând , estimator al lui A, se propune ca obiectiv întoarcerea la matricile B și C.
Cum A are n x m elemente, vor exista n x m relații între coeficienți. Matricea B are n2 elemente,
iar C are n x m elemente. Se obține un sistem de n2 + n*m necunoscute. Această problemă nu
poate fi rezolvată, în general, decât dacă între parametrii formei structurale există, a priori, n 2
relații sau restricții. Împărțind succesiv membrul al doilea al fiecărei ecuații din forma structurală
prin , se obține matricea B cu diagonala având doar elemente egale cu 1, ceea ce
reduce numărul de restricții a priori la n2-n. Aceste restricții pot fi de excludere (unele variabile
absente în ecuațiile formei structurale, însemnând că parametrii corespunzători sunt nuli) sau de
legături a apriori între elementele matricilor B și C.

Există două tipuri de restricții asupra parametrilor (coeficienților) modelului:

- restricții de excludere, când o variabilă endogenă sau exogenă nu apare într-o ecuație
structurală, caz în care coeficientul acestei variabile este zero;
- restricții liniare, când specificările modelului impun ca unele variabile ca să aibă un
coeficient identic, ceea ce implică impunerea unor restricții a priori asupra unor coeficienți.

Pentru estimarea parametrilor MES trebuie stabilite mai întâi condițiile de identificare și,
în funcție de tipul de identificare, se stabilește metoda de estimare a parametrilor folosită.
Condițiile de identificare se determină ecuație cu ecuație. Modelul cu ecuații simultane este sub-
identificat, dacă există o ecuație sub-identificată. Modelul este exact-identificat (just-identificat),
dacă toate ecuațiile sunt exact-identificate și supra-identificat, dacă ecuațiile modelului sunt fie
exact-identificate, fie supra-identificate.
Se reia modelul în formă structurală, cu ipotezele anterioare (se presupune, între altele, și
absența coliniarității între variabilele exogene din fiecare ecuație). Se precizează noțiunea de
restricție relativă la o ecuație din forma structurală.

A. Fiecare restricție pe forma structurală se traduce printr-o relație liniară omogenă între
coeficienții unei ecuații.
B. Se definește o matrice a restricțiilor Ri relativă la ecuația a i-a și o matrice de
structură S obținută prin juxtapunerea matricilor B și C.

S=(BC)

Matricea restricțiilor Ri se definește astfel: dacă Si este a i-a linie a matricei S și Rih este a
h-a coloană a matricei Ri (corespunzătoare la a h-a restricție din ecuația i), atunci SiRih=0.

Criteriile de identificare a MES

I. Condiția de ordin (necesară, dar nu suficientă)

Formulări ale condiției de ordin

Identificarea MES pe baza condiției de ordin se poate face folosind una dintre abordările
echivalente de mai jos:

a) Fie r numărul de restricții liniare, n numărul de variabile endogene din modelul cu


ecuații simultane, n’ numărul de variabile endogene dintr-o ecuație, m numărul de
variabile exogene din model și m’ numărul de variabile exogene din ecuație.

Dacă n- n’+m- m’+r < n-1, atunci ecuația este sub-identificată.


Dacă n- n’+m- m’+r = n-1, atunci ecuația este exact-identificată.
Dacă n- n’+m- m’+r > n-1, atunci ecuația este supra-identificată.

Dacă există doar restricții de excluziune, atunci relațiile se scriu:

Dacă n- n’+m- m’ < n-1, atunci ecuația este sub-identificată.


Dacă n- n’+m- m’ = n-1, atunci ecuația este exact-identificată.
Dacă n- n’+m- m’ > n-1, atunci ecuația este supra-identificată.
b) O ecuație în formă structurală a modelului este identificată (exact-identificată sau
supra-identificată) dacă numărul restricțiilor a priori la care sunt supuși coeficienții
ecuației trebuie să fie cel puțin egală cu numărul de variabile endogene minus 1 (n-1).
Dacă n1 este numărul de ecuații structurale (veritabile) din modelul cu ecuații
simultane și n2 este numărul de identități din model (ecuații contabile sau de
echilibru), atunci numărul de variabile endogene se scrie n=n1+n2. Astfel, condiția de
ordin se poate formula: O ecuație în formă structurală a modelului este identificată
dacă numărul restricțiilor a priori la care sunt supuși coeficienții ecuației este cel
puțin egal cu n1+n2-1.

c) O ecuație este identificată dacă numărul total de restricții asupra parametrilor săi este
cel puțin egal cu numărul de ecuații ale modelului minus unu.

Fie n1- numărul de ecuații structurale (veritabile) din model (de regresie,
comportamentale).

 ecuație exact-identificată: număr de variabile absente din ecuație, dar existente în sistem= n1-
1;
 ecuație neidentificată (sub-identificată): număr de variabile absente din ecuație, dar existente
în sistem < n1-1;
 ecuație supra-identificată: număr de variabile absente din ecuație, dar existente în sistem> n1-
1.

II. Condiția de rang (necesară și suficientă)

Fie un MES care satisface ipotezele precedente. A i-a ecuație este identificată dacă și
numai dacă rangul matricei este egal cu n1+n2-1, unde n1 este numărul de ecuații
veritabile (structurale) din MES, n2- numărul de identități din model și n=n1+n2 este numărul de
variabile endogene din model.

III. condiția în funcție de numărul de restricții a priori care afectează ecuațiile

Fie numărul de restricții a priori care afectează ecuația i.

 dacă , atunci ecuația i nu este identificată, adică este sub-


identificată;
 dacă , atunci ecuația i este supra-identificată și este, totodată,
identificabilă în aproape toate structurile modelului;
 dacă , atunci ecuația i nu este supra-identificată și poate fi
identificabilă în aproape toate structurile modelului.
Observație: din criteriile formulate rezultă că un model este supra-identificat dacă există
mai mult de n1+n2-1 restricții asupra oricărei ecuații în formă structurală.

Dacă MES este sub-identificat, nu se pot estima parametrii modelului. Dacă MES este
exact-identificat, metodele de estimare ce pot fi folosite sunt: metoda celor mai mici pătrate
indirectă (MCMMP indirectă), metoda celor mai mici pătrate în două stadii (faze) (MCMMP în
două faze), metoda celor mai mici pătrate în trei stadii (faze) (MCMMP în trei faze). Dacă MES
este supra-identificat, se pot folosi ca metode de estimare metoda celor mai mici pătrate în două
stadii și metoda celor mai mici pătrate în trei stadii.

MCMMP indirectă

Sub formă matricială, MES se scrie:

Dacă matricea B este inversabilă, atunci se obține:

Dacă se notează și , atunci relația anterioară devine:

(*)

Dacă fiecare ecuație din model este identificabilă, se pot estima coeficienții matricei A
din forma redusă folosind MCMMP și pe baza relațiilor de legătură între coeficienți se determină
estimatorii parametrilor în formă structurală. Sub ipotezele precizate anterior, estimatorii obținuți
sunt convergenți. Estimatorii sunt nedeplasați, eficienți și consistenți, dar, pentru eșantioane de
volum mic, estimatorii sunt deplasați.

MCMMP în două stadii sau MCMMP în două faze ((TSLS- two-stage least squares sau
2SLS)

Etapele aplicării metodei sunt:

a) pe baza MCMMP se estimează parametrii modelului în formă redusă. Se obțin


estimațiile pentru seriile de timp corespunzătoare variabilelor endogene Y1, Y2, ...,Yn.
b) Se estimează parametrii a n modele de regresie. Se definește câte un model de
regresie pentru fiecare variabilă endogenă, având drept variabile explicative:
 celelalte n-1 variabile endogene din MES; valorile inițiale ale acestor
variabile sunt înlocuite cu cele estimate în prima etapă;
 variabilele exogene din MES.

Estimatorii parametrilor MES în formă structurală obținuți prin MCMMP în două stadii
au aceleași proprietăți asimptotice ca și estimatorii obținuți prin MCMMP. Pentru eșantioane de
volum redus, estimatorii sunt deplasați.
Această metodă se poate folosi când ecuațiile sunt supra-identificate. Se reia modelul în
formă structurală și se presupune că prima ecuație este supra-identificată. În
prima etapă, se estimează prin MCMMP parametrii variabilelor endogene care figurează în
prima ecuație pe baza formei reduse a celorlalte ecuații (pornind de la a doua ecuație). Se
determină , (**) etc. În al doilea stadiu, variabilele endogene din
prima ecuație se înlocuiesc cu valorile date în (**) și rezultă alte ecuații pentru care se aplică
MCMMP.

Se consideră modelul de determinare simultană a modificărilor ratei inflației și salariilor


descris de Thomas (1997)2:
(1)
(2)

S- rata de modificare a salariilor


RI- rata inflației
E- măsură a excesului de ofertă de la nivelul pieței muncii, presupus a fi o
variabilă exogenă, independentă de erori
e, - erori

În cadrul acestor modele, se operează cu noțiuni specifice. De exemplu, noțiunile de


variabile explicative și variabile exogene nu sunt echivalente. O variabilă este predeterminată
dacă sunt cunoscute valorile sale la un anumit moment de timp t. Sunt considerate variabile
predeterminate variabilele exogene și variabilele cu valori precedente care au fost determinate pe
baza modelului.
Forma structurală a modelui cu ecuații simultane presupune explicarea unei variabile
endogene în ecuațiile de comportament de tip regresie pe baza variabilelor exogene și a altor
variabile endogene. Ecuațiile (1) și (2) redau forma structurală a modelului.

2
Thomas, R. L. (1997). Modern econometrics: an introduction. Financial Times/Prentice Hall.
Forma redusă a sistemului de ecuații simultane implică explicarea unei variabile
endogene numai în funcție de variabilele exogene și de termenii eroare din model. din
ecuația (2) se înlocuiește în relația (1):

Forma redusă a modelului este dată de ecuațiile (3) și (4):


(3)
Dacă din ecuația (3) se înlocuiește în ecuația (2), atunci rezultă:
(4)

Variabila se corelează instantaneu cu termenul eroare în sensul că rata inflației la


momentul t se corelează cu eroarea la același moment de timp t. În consecință, în ecuația (1),
covarianța dintre variabila explicativă și diferă de valoarea nulă. Estimatorii pe baza metodei
celor mai mici pătrate sunt inconsistenți și deplasați, dacă parametrii ecuației (1) sunt estimați
fără a se lua în considerare feedback-ul generat de ecuația (2). Consecințele ignorării
simultaneității ecuațiilor de regresie din sistem sunt sintetizate mai jos:
 estimatori inconsistenți și deplasați calculați pe baza metodei celor mai
mici pătrate (deplasarea este cunoscută, în acest caz, ca distorsiune de simultaneitate);
 testele privind verificarea semnificației coeficienților nu sunt valide;
 previziunile pe baza modelului sunt inconsistente și deplasate.
În aceste condiții, în cazul sistemelor de ecuații simultane sunt necesare alte metode de
estimare, dar și analiza problemei de identificare. Ecuațiile (1) și (2) se înmulțesc cu valorile
constante A și, respectiv, B, apoi se însumează cele două relații și se determină .

(5)

Notații pentru simplificare:

Ecuația (5) poate fi rescrisă și are aceeași structură ca ecuația (1):


Cum A și B pot lua orice valori, în cazul modelului (5) pot exista o infinitate de
ecuații de regresie care nu sunt diferite de modelul (1). Nu se poate stabili, astfel, dacă s-a
rezolvat ecuația (1) sau o altă ecuație din infinitatea de ecuații. De aceea, ecuația (1) este
neidentificată și nu se poate găsi o strategie de determinare a estimatorilor consistenți și
nedeplasați. Ecuația (2) redă relația dintre RI și S, fără a include variabila E și este o ecuație
identificată. Această situație este echivalentă cu impunerea unei restricții asupra parametrilor,
și anume, coeficientul variabilei E este setat la valoarea zero.
Există reguli generale aplicate pentru soluționarea problemei de identificare,
independent de numărul de ecuații. Condiția de ordin pentru problema de identificare este
cea mai folosită regulă, o condiție necesară, dar nu și suficientă, care se formulează astfel:

Condiția de ordin

O ecuație este identificată dacă numărul total de restricții asupra parametrilor săi este cel
puțin egal cu numărul de ecuații ale modelului minus unu.

Fie n1- numărul de ecuații structurale (veritabile) din model (de regresie,
comportamentale).

 ecuație exact-identificată: număr de variabile absente din ecuație, dar existente în sistem=
n1-1;
 ecuație neidentificată (sub-identificată): număr de variabile absente din ecuație, dar
existente în sistem < n1-1;
 ecuație supra-identificată: număr de variabile absente din ecuație, dar existente în sistem>
n1-1.

Ecuațiile (1) și (2) devin identificate dacă se mai adaugă o variabilă exogenă în
ecuația (2). Această variabilă este reprezentată de masa monetară (M). O combinație liniară
între ecuațiile (1) și (2) conține variabilele M și E, însă în ecuația (1) nu apare M și în ecuația
(2) nu apare E. astfel, cele două ecuații (1) și (2) nu pot fi confundate cu o combinație liniară
a acestora.
Condiția de ordin poate fi formulată și într-o formă mai restrictivă, fără a impune
constrângeri asupra parametrilor. De exemplu, dacă se consideră o funcție de producție de tip
Cobb-Douglas, se poate formula o restricție astfel încât randamentele de scară să fie
constante.
Întrucât condiția de ordin nu este suficientă, se folosește condiția de rang, care este
necesară și suficientă. Aceasta din urmă presupune construirea unei matrici pentru parametrii
modelului, alocându-se o coloană pentru fiecare variabilă din model (endogenă sau exogenă)
și o linie pentru fiecare din cele n1 ecuații de regresie. O ecuație este identificată dacă există
cel puțin un determinant diferit de zero de rang n1-1 pornind de la parametrii modelului care
nu apar în ecuația analizată.
În condițiile unor ecuații identificate, se pot aplica metode specifice de estimare
pentru obținerea unor estimatori nedeplasați și consistenți, cum ar fi metoda variabilelor
instrumentale.
Se pornește de la modelul de regresie liniară simplă:

Dacă se minimizează suma pătratelor erorilor și se anulează derivata de ordinul întâi, se


obține sistemul de ecuații normale prin aplicarea metodei celor mai mici pătrate (sumele sunt
după t luând valori de la 1 la n):

Se înmulțește ecuația de regresie cu .

Relația se însumează după t:

, dacă erorile nu sunt corelate cu variabila explicativă.

Dacă variabilele și nu sunt independente, atunci și estimatorii bazați


pe metoda celor mai mici pătrate sunt deplasați și inconsistenți.
Se presupune că și sunt corelate și există o variabilă , denumită variabilă
instrumentală sau variabilă instrument, independentă de eroarea , dar corelată cu .
Introducerea în model a unor variabile independente de erori conduce la obținerea unor
estimatori consistenți și nedeplasați. Cum și nu sunt corelate, . Se înmulțește
ecuația de regresie cu și se rescrie sistemul de ecuații normale:
Prin rezolvarea acestui sistem se obțin estimatori IV (instrumental variable estimators),
iar metoda este denumită metoda IV (metoda variabilelor instrumentale), care este echivalentă cu
o procedură în două stadii (etape).
În prima etapă, se aplică metoda celor mai mici pătrate pentru ecuația de regresie:

Se determină , , .
În a doua etapă, se estimează în funcție de .

În acest caz, estimatorii sunt consistenți și nedeplasați.


Metoda IV folosită în cazul modelelor de regresie liniară multiplă presupune identificarea
de variabile instrumentale pentru fiecare variabilă explicativă ce este corelată instantaneu cu
eroarea. Instrumentele trebuie să fie cât mai puternic corelate cu variabila explicativă
corespunzătoare. În cazul existenței unor variabile care nu se corelează cu erorile, acestea se pot
utiliza ca propriile instrumente.
Se consideră situația în care fiecărei variabile explicative îi corespund mai multe
instrumente. De exemplu, pentru fiecare variabilă din modelul
există m variabile instrumentale , , ..., . Modelul descris prin
se transformă astfel:

Dacă nicio variabilă , i=1,2,..,m nu se corelează instantaneu cu eroarea din modelul


inițial , atunci nicio combinație liniară a acestora nu se corelează cu . Se determină pentru
a se introduce în ecuația .

Procedura prezentată este denumită metoda generalizată a variabilelor instrumentale


(metoda GIV- Generalized Instrumental Variable), iar estimatorii determinați pe baza acestei
metode sunt estimatori ai metodei generalizate a variabilelor instrumentale (estimatori GIVE-
Generalized Instrumental Variable Estimators). În practică, este dificilă identificarea variabilelor
instrumentale care să se coreleze cu variabila explicativă, dar nu și cu erorile din model. O
soluție poate fi utilizarea variabilelor explicative într-o perioadă anterioară ca variabile
instrumentale. De exemplu, se poate folosi ca variabilă instrument pentru , deoarece cele
două variabile se corelează puternic datorită unor factori permanenți, însă factorii perturbatori
fac ca și să nu fie corelate.
Metoda GIVE aplicată în cazul modelelor cu ecuații simultane este cunoscută și ca
metoda celor mai mici pătrate în două stadii (TSLS- two-stage least squares sau 2SLS). TSLS se
poate folosi numai în cazul sistemelor cu ecuații identificate (supraidentificate sau perfect
identificate), generând estimatori consistenți și nedeplasați. Cele două stadii caracteristice
metodei sunt:

I. Primul stadiu constă în estimarea în formă redusă a ecuațiilor care descriu


variabile endogene în situația în care aceste variabile apar ca variabile explicative
în cel puțin una dintre celelalte ecuații.
În ecuația (2) se introduce variabila dată de modificarea masei monetare ( ),
care este independentă de erori și face ca ecuațiile (1) și (2) să fie idenitificate.

(5)
(6)

Rata inflației, care este variabilă endogenă în ecuația (6), apare ca variabilă explicativă în ecuația
(5). Se determină rata inflației din ecuația (5) și se introduce în ecuația (6).

Parametrii ecuației de mai sus sunt înlocuiți cu a0, a1 și a2 pentru simplificare și se rescrie
ecuația astfel:
(7)

Variabilele instrumentale sunt și . Similar, se construiește și forma redusă a ecuației


salariilor:
(8)

Pe baza metodei celor mai mici pătrate se determină estimatorii ecuațiilor (7) și (8), și
. Practic, primul stadiu a constat în aplicarea metodei celor mai mici pătrate pentru estimarea
parametrilor ecuațiilor (7) și (8) și determinarea valorilor ajustate ale variabilelor dependente.

II. Al doilea stadiu constă în estimarea ecuațiilor structurale folosind metoda celor
mai mici pătrate și valorile endogene estimate în primul stadiu ca variabile
instrumentale.
Pornind de la ecuațiile (5) și (6), se estimează ecuația (5) utilizând ca variabilă
instrumentală și ecuația (6) pe baza variabilei instrumentale . Variabilele
instrument înlocuiesc valorile lui și din ecuația (5) și, respectiv ecuația (6).
Se aplică metoda celor mai mici pătrate ecuațiilor de mai jos:

(9)
(10)

Variabilele și , cât și orice combinație liniară a acestora sunt necorelate cu erorile,


ceea ce determină independența lui față de și a lui față de . Folosirea metodei celei
mai mici pătrate pentru estimarea parametrilor din ecuațiile (9) și (10) determină estimatori
nedeplasați și consistenți.
CURSUL XII: REGRESIA APARENTĂ (FALSĂ). SERII COINTEGRATE

Serii cointegrate

Noţiunea de cointegrare este strâns legată de cea de „regresie falsă (aparentă)” (spurious
regression, engl.) construită pe serii de timp. Pe date economice, deseori regresiile bazate pe serii
de timp au coeficientul de determinare R2 mare, cu o valoare aproape de unu (R2  1), iar
statistica Durbin-Watson (DW) are o valoare mică, apropiată de zero (DW calc  0) (erorile sunt
autocorelate). În general, când R2  1, DWcalc  0 şi R2 > DWcalc există un semnal că
regresia este falsă. În aceste condiții, dependenţa dintre variabile este exagerată, iar estimatorii
nu sunt de încredere. Aceasta se întâmplă deoarece seriile de timp pentru variabilele economice
sunt, deseori, nestaţionare şi se comportă ca un proces de tip mers aleator (au rădăcină unitate).
Dacă două serii sunt integrate de ordinul întâi I(1), adică au o rădăcină unitate fiecare,
atunci, în multe cazuri, se respinge ipoteza inexistenţei unei relaţii între acestea (adică se admite
existența unei relații), chiar când aceasta nu există. Generând două serii de tip mers aleator
independente şi estimând ecuaţia de regresie dintre acestea, Engle şi Granger (1987) au observat
că ipoteza conform căreia panta dreptei de regresie este nesemnificativă s-a respins în 76% din
cazuri, pe baza testului t. Cercetătorii au sugerat ca regresia să fie estimată pentru seriile
diferenţiate.

Cum detectăm o regresie falsă (între serii integrate)?

Detectarea regresiei false se face analizând corelograma reziduurilor sau prin testarea
staționarității cu teste de rădăcină unitate.

Cum convertim o regresie falsă într-o regresie validă?

Se folosesc serii de date staționare obținute prin diferențierea seriilor inițiale care erau
nestaționare.

Se rezolvă, astfel, problema regresiei false?

Se rezolvă problemele statistice, dar nu interpretarea economică a regresiei. Prin folosirea


seriilor de date diferențiate pierdem informații. Nu este aceeași informație conținută într-o
regresie care implică rate de creștere comparativ cu o regresie ce folosește seriile de date în nivel
ale variabilelor.
Pentru a exista o relaţie pe termen lung între variabile, seriile acestor variabile trebuie să
fie cointegrate. Se poate aplica un test de cointegrare pentru a se evita regresiile false. Engle şi
Granger (1987) au observat că o combinaţie liniară a două sau mai multe serii nestaţionare poate
fi staţionară.
Definiţie. (Engle și Granger, 1987). Dacă două serii Yt , X t sunt integrate de acelaşi ordin ,,d”
I(d) şi seria reziduurilor din regresie are un ordin mai mic de integrare I(d-b), atunci, conform
definiției lui Engle-Granger (1987), cele două serii sunt cointegrate de ordinul d, CI(d,b).

Astfel, dacă Yt , X t sunt I(1) şi seria reziduurilor , atunci cele două serii sunt
cointegrate de ordinul 1, CI(1,1). În acest caz, pentru a estima relaţia pe termen lung dintre
variabile este suficient să se construiască modelul de regresie static Yt  X t   t , estimatorii pe
baza metodei celor mai mici pătrate fiind consistenţi, când lungimea seriilor este mare. Se va
face referire, în continuare, doar la acest caz.

Două serii nestaţionare Yt şi Xt, integrate de ordinul 1, adică I(1), pentru care există o
combinaţie liniară, notată cu  t :

 t  Yt  a0  a1 X t

ce este staţionară, adică I(0), se numesc serii cointegrate (de ordinul 1). Vectorul (1,  a1 ) se
numeşte vector de cointegrare. Astfel, diferenţa Yt  a1 X t rămâne stabilă în jurul unei medii fixe
a0 (media lui  t este zero). Dacă constanta este zero, relaţia ce le menţine legate pe termen lung
este una de proporţionalitate Yt  a1 X t . Variabilele rămân în legătură pe termen lung prin relaţia
de echilibru Yt  a0  a1 X t , iar deviaţiile de la aceasta au loc doar pe termen scurt; această relaţie
de echilibru poate fi interpretată ca o relaţie de echilibru pe termen lung, „perturbată” doar de
şocuri aleatoare (  t ) cu efect pe termen scurt. Relaţia Yt  a0  a1 X t   t se numeşte relaţie de
cointegrare între seriile celor două variabile. Relația de echilibru pe termen lung este înţeleasă în
sensul de stabilitate a relaţiei de dependență.

Două serii cointegrate au o tendinţă stochastică comună (tendinţe de evoluţie similare), adică
„hoinăresc” împreună (analogie în evoluţie). Relaţia de dependenţă dintre acestea este stabilă.

Exemple. Posibile relaţii de cointegrare sugerate de teoria economică, variabilele fiind, de


obicei, considerate în formă logaritmată:

- între venit (PIB) şi consum (C). Raportul C/PIB este constant pe termen lung, astfel că
ln(C)-ln(PIB) este staţionar, iar ln(C) şi ln(PIB) sunt cointegrate. În mod similar, avem relația
între PIB şi investiţii;

- între cererea de monedă, preţuri, venit;


- între cursul valutar, preţurile interne, respectiv preţurile dintr-o ţară străină, cursul de
schimb real având comportament staţionar (conform teoriei parităţii de cumpărare);

- între cursul diferitelor acţiuni (de regulă, în formă logaritmată);

- între rentabilitatea activelor şi rata inflaţiei, diferenţa acestora, adică rata reală a
rentabilităţii, având un comportament staţionar;
- între ratele dobânzii pentru diferite maturităţi, diferenţa faţă de rata activului fără risc (rata
pe termen scurt) reflectând prima de risc a investitorilor;
- între logaritmul indicelui preţului acţiunilor, respectiv al dividendelor, diferenţa
reprezentând logaritmul randamentului ln Pt  ln Dt  I (0) ;
- între logaritmul indicelui preţurilor, respectiv al salariului, diferenţa dintre logaritmul
indicelului salariului și al indicelului prețului fiind staționară și reprezentând logaritmul
indicelui salariului real etc.

Aceste posibile relaţii de cointegrare trebuie confirmate şi de datele empirice.

Dacă seriile Xt și Yt sunt I(1) și

atunci Xt și Yt sunt cointegrate.


Conceptul de atractor este legat de conceptul de echilibru pe termen lung între două
procese stochastice. Permitem celor două variabile să nu se coreleze pe termen scurt; dar, pe
termen lung, trebuie să conveargă la o regiune comună numită regiune de atracție. Cu alte
cuvinte, dacă de acum înainte nu există șocuri în sistem, cele două procese stochastice vor evolua
împreună către un set de atractori comuni.
Un om beat face o plimbare la întâmplare (aleatorie). Câinele său face, de asemenea, o
plimbare ,,aleatorie” pe cont propriu. Mai apoi, cei doi intră într-un parc unde câinilor nu li se
permite să fie dezlegați. De aceea, omul beat pune un lanț câinelui său și ambii intră în parc.
Căile acestora vor fi cointegrate? De ce?

Murray, M. P. (1994). A drunk and her dog: an illustration of cointegration and error
correction. The American Statistician, 48(1), 37-39.

Articol disponibil la: http://www-stat.wharton.upenn.edu/~steele/Courses/434F2005/Context/Co-


integration/Murray93DrunkAndDog.pdf

Imagini: https://www.eco.uc3m.es/~jgonzalo/teaching/econometriaii/cointegration.htm

Abordări în teoria cointegrării

- abordări bazate pe o singură ecuaţie, cea mai cunoscută fiind metoda în două etape
propusă de Engle şi Granger;

- abordarea multivariată de tip VECM (VECM- vector error correction model, adică
model vectorial de corecție a erorilor sau model corector al erorilor); în acest caz, ne așteptăm la
existenţa mai multor relaţii de cointegrare. În cazul general, dat fiind un grup de mai multe
variabile cu serii nestaţionare, se verifică dacă acestea sunt cointegrate, şi, dacă sunt cointegrate,
care este relaţia de echilibru pe termen lung dintre acestea. Pentru analiza cointegrării între mai
multe procese nestaţionare (cu rădăcină unitate), se folosește metodologia propusă de Johansen şi
Juseliu (1990), care este implementată în soft-urile statistice.

Metodologia Engle-Granger (cointegrare într-o singură ecuaţie)

Testarea existenţei unei relaţii de cointegrare între seriile de timp pentru două variabile:

Ipoteza nulă a testului Engle-Granger indică lipsa relației de cointegrare între seriile variabilelor
analizate. Acest test se bazează pe ipoteza că erorile sunt independente și homoscedastice, ceea
ce nu se verifică în multe cazuri pe date empirice. De aceea, o alternativă la testul Engle-Granger
este testul Philips-Ouliaris (1990), care este, de asemenea, un test bazat pe reziduuri.
Procedura testului Engle-Granger

a) se testează dacă seriile pentru ambele variabile, și , sunt integrate de ordinul 1 (I(1)),
utilizând teste de rădăcină unitate (de exemplu, testul ADF, PP, KPSS);

b) se estimează parametrii modelului de regresie liniară Yt  a 0  a1X t   t prin metoda celor


mai mici pătrate pentru a obţine o estimație a relaţiei (vectorului) de cointegrare. Estimatorii
 
obţinuţi ( a 0 şi a 1 ) sunt superconsistenţi (în acest caz, când seriilor corespunzătoare ambelor
variabile sunt I(1)), chiar dacă erorile sunt corelate). Erorile standard nu sunt, însă, de încredere,
astfel că nu se pot realiza inferenţe privind modelul pe termen lung. Dacă există o relaţie de
cointegrare, atunci metoda celor mai mici pătrate o va depista, iar dacă nu există, atunci regresia
  
este falsă. Se determină, ulterior, seria reziduurilor  t  Yt  a 0  a1X t ;

c) se testează dacă seria reziduurilor  t este staţionară. Dacă ipoteza existenţei rădăcinii
unitate în seria reziduurilor este respinsă, atunci între cele două procese există relaţie de
cointegrare. Cu alte cuvinte, dacă reziduurile sunt staţionare, cele două serii sunt cointegrate,
 
relaţia de cointegrare fiind cea estimată Yt  a 0  a1X t   t , iar relaţia de echilibru pe termen
 
lung este Yt  a 0  a1X t .

Pe scurt, după estimarea parametrilor modelului de regresie şi determinarea seriei


reziduurilor ˆt , se aplică testul ADF sau un alt test de tip rădăcină unitate pentru detectarea
staţionarităţii/nestaționarității reziduurilor (lipsa/prezența rădăcinii unitate în seria reziduurilor).
Valorile critice, însă, nu sunt cele uzuale, deoarece seria reziduurilor a rezultat prin estimare.
Valorile adecvate testului ADF pentru cointegrare au fost obţinute de către MacKinnon prin
simulare şi pot fi găsite în Johnston şi DiNardo (1994).

Exemple de valori critice pentru ADF pentru cointegrare,   5%

T – lunginea seriei ADF (p=4)

50 -3,29

100 -3,17

200 -3,25

Dacă tcalc < t tab  se respinge H0  seria reziduurilor  t este staţionară  seriile Xt, Yt sunt
*

cointegrate (există o relaţie de dependenţă stabilă între cele două serii numită relaţie de
cointegrare).

De asemenea, se poate utiliza testul Durbin-Watson pentru cointegrare (CRDW) propus de


Bhargava si Sargan. Se calculează statistica Durbin-Watson, iar dacă aceasta are o valoare mai
 seriile Xt, Yt sunt cointegrate; valorile tabelate sunt: 0.386 pentru  =5%,
*
mare decât d tab
0.322 pentru  =1%.

Observație: De la econometrie, ne amintim că DW=2(1- ), fiind coeficientul de autocorelație


de ordinul întâi (I) estimat pentru seria reziduurilor.

Cointegrare în sisteme de ecuații. Metodologia Johansen

În general, abordarea Engle-Granger este adecvată mai mult pentru situația în care se verifică
relația de cointegrare între seriile de timp asociate unui număr de două variabile. Dacă avem n
variabile şi n-1 dintre acestea nu sunt (slab) exogene şi/sau există mai multe relaţii de cointegrare
între serii, atunci abordarea prin intermediul unei singure ecuaţii nu este adecvată, conform lui
Harris și Sollis (2003).

În modelele multivariate, toate variabilele sunt abordate simultan şi se urmăreşte explicarea


comportamentului unei variabile în funcţie de trecutul său şi a celorlalte variabile.

Etapele metodologiei Johansen, destinată elaborării modelelor dinamice, sunt:

1) testarea ordinului de integrare a seriei pentru fiecare variabilă;


2) determinarea numărului de relații de cointegrare și estimarea acestora.

Pentru un vector Y de k potenţiale variabile endogene specificăm un model vectorial-


autoregresiv VAR(p):

Yt  B  A1Yt 1  A2Yt 2  ...  ApYt  p   t

Când ecuaţia

det(( z ))  det(I k  A1 z  A2 z 2  ....  Ap z p )  0

are rădăcini în interiorul cercului unitate, atunci unele serii sau toate seriile pentru variabilele din
vectorul Y sunt nestaţionare I(1), iar între acestea pot exista relaţii de cointegrare.
Definiţie. Un vector de variabile cu serii integrate de acelaşi ordin I(d) este cointegrat
CI(d,b), cu vectorul de cointegrare  , dacă  'Yt este integrat de ordin mai mic I(d-b). Astfel,
există anumite combinaţii liniare ale variabilelor din vector cu serii integrate de un ordin mai
mic.

Observaţie. Pentru un vector ce conţine serii integrate de ordinul întâi I(1) pentru două
variabile ( Yt , X t ) , dacă seria reziduurilor din regresia Yt  X t   t este staţionară, adică I(0),
vectorul de cointegrare este   (1,  ) .

Dacă toate variabilele din vectorul Yt =( Y1t , Y2t ,..., Ykt ) ' au serii staţionare, adică I(0), atunci se
construiesc modele VAR. Dacă există serii nestaţionare, în forma I(1), atunci există două
posibilităţi:

(1) nu există nici o relaţie de echilibru (sau de cointegrare) între elementele lui Yt , caz în
care modelul costituie un sistem de regresii false;

(2) există una sau mai multe relaţii de echilibru (sau de cointegrare) între elementele lui Yt ,
când se are în vedere reprezentarea unui model vectorial de corecție a erorilor (VECM- vector
error correction model).

Abordarea Johansen constă în identificarea a r combinaţii liniare de cointegrare, pe baza


seriilor integrate de același ordin şi includerea acestora într-un model dinamic.

Cum pot fi identificate aceste relaţii de cointegrare?

Dacă seriile din vectorul Y sunt cointegrate, atunci reprezentarea VAR nu este adecvată
pentru analiză. Relaţiile de cointegrare devin vizibile în reprezentarea VECM, aceasta fiind
redată mai jos.

În reprezentarea VAR(p) avem:

, t=1,2,...,T

Pornind de la relația de mai sus, se scrie reprezentarea VECM:


p
unde    Ai  I și
i 1

Justificare. Considerăm p=2, ordinul procesului VAR. Pornim de la reprezentarea VAR(2) și se


scade Yt-1 și în stânga și în dreapta ecuației. Se dă factor comun în dreapta Yt-1 . Mai apoi, se
scade și se adună (A1-I)Yt-2, pentru a da ulterior factor comun (A1-I).

Yt  Yt 1  B  ( A1  I )Yt 1  A2Yt 2   t = B + (A1-I)Yt-1- (A1-I)Yt-2+(A1-I)Yt-2+A2 Yt-2+  t

 Yt  B  ( A1  I )(Yt 1  Yt 2 )  ( A2  A1  I )Yt 2   t

 Yt  B  ( A1  I )Yt 1  ( A2  A1  I )Yt 2   t

Este convenabil să apară Yt 1 pentru a putea evidenţia reziduurile din perioada anterioară. Se
scade și se adună în partea dreaptă (A2+A1-I)Yt-1, pentru a da ulterior factor comun -(A2+A1-I).

Yt  B  ( A1  I )Yt 1  ( A2  A1  I )Yt 2  ( A2  A1  I )Yt 1  ( A2  A1  I )Yt 1   t


Yt  ( A1  A2  I )Yt 1  A2 Yt 1  B   t (s-a dat factor comun -(A2+A1-I), apoi s-a dat
factor comun )

sau

Yt  Yt 1  1 Yt 1  B   t

unde   A1  A2  I iar 1   A2 .

Această reprezentare echivalentă are mai multe avantaje (Juselius, 2003): se reduce
efectul multicoliniarităţii, informaţiile pe termen lung sunt sintetizate în matricea  , avem o
interpretare mai intuitivă a coeficienţilor (surprind efectul pe termen lung, respectiv pe termen
scurt). Această reprezentare este adecvată când ne interesează modificările faţă de perioada
anterioară (de exemplu, în cazul ratei inflaţiei).

Legătura între rangul matricii  şi numărul relaţiilor de cointegrare

Coeficienţii i conţin informaţii despre ajustarea pe termen scurt, iar pentru a identifica
eventuale relaţii de echilibru pe termen lung între elementele vectorului Y se pornește de la
matricea  . Rangul matricii  indică numărul relaţiilor de cointegrare prezente între seriile
celor k variabile din vectorul Y.
Cum seriile din Yt sunt I(1), rezultă că seriile din Yt sunt staţionare; astfel rangul
matricei, notat cu r, trebuie să fie mai mic decât numărul variabilelor r=rang(  )<k; dacă spre
exemplu   I k , atunci membrul stâng al ecuaţiilor este o serie staţionară Yt , iar în cel drept
avem o serie nestaţionară Yt 1 plus seriile staţionare ( Yt i , respectiv reziduul). Astfel,   0
sau rang(  )<k. Rangul matricii este egal cu numărul de linii (sau coloane) liniar independente.
Avem rang(  )=k doar când toate variabilele au serii staţionare; în acest caz, nu se pune
problema cointegrării.

În cazul nestaţionarităţii de tip I(1), deoarece un proces nestaţionar nu poate fi egal cu


unul staţionar, forma VECM are sens doar când Yt 1 defineşte combinaţii liniare staţionare,
adică între seriile variabilelor există relaţii de cointegrare.

Când matricea  (kxk) are rang redus 1  r  k  1, aceasta poate fi descompusă în două
matrici  (kxr) şi  (kxr), fiecare cu rangul r:

   ' .

Astfel, în ipoteza unor variabile cu serii I(1), reprezentarea VECM a unui vector cointegrat cu r
relaţii de cointegrare este:

Yt   'Yt 1  1Yt 1  ...  p 1Yt  p 1  B   t

sau

Yt  t 1  1Yt 1  ...  p1Yt  p1  B   t

unde  'Yt 1   t 1 are serie staţionară I(0), fiind vectorul r x 1 al relaţiilor de cointegrare,  (kxr)
este matricea vectorilor de cointegrare (r vectori de cointegrare, fiecare coloană reprezentând
coeficienţii unui vector de cointegrare); aceştia formează o bază în spaţiul vectorilor de
cointegrare, orice combinaţie liniară a vectorilor din bază fiind, de asemenea, un vector de
cointegrare. Avem în această reprezentare un VAR(p-1), în care toate seriile sunt staţionare.
Matricea coeficienţilor de ajustare  din  t 1 reprezintă viteza cu care Yt se ajustează la
dezechilibre în relaţia de cointegrare.

Descompunerea    ' nu este unică, deoarece pentru orice matrice M(rxr) nesingulară
avem    '  (M )(M 1  ' )  (M )(M 1' ) '  ab ' , unde a  M , iar b  M 1' . Pentru a
obţine valori unice sunt necesare anumite restricţii, precum normalizarea (se împart toţi
coeficienţii vectorului de cointegrare la unul dintre ei) sau restricţii sugerate de teoria economică.

Prin urmare, avem următoarele cazuri:


1) r=rang(  )=k, caz în care seriile corespunzătoare lui Yt 1 sunt staţionare şi se va
elabora un model VAR pentru variabilele observate Yt , utilizând inferenţele standard;
2) 1  r  k  1, când există r combinaţii liniare ale variabilelor, aceste combinații
având serii staţionare. Prin urmare, sunt r relaţii de cointegrare, seriile din Yt fiind
cointegrate. Reprezentarea VECM este validă. În acest caz, reprezentarea VAR pe
seriile diferențiate este greşită (Cochran, 2005);
3) r=0, când nu există combinaţii liniare staţionare şi se va elabora un model VAR
pentru seriile diferențiate Yt (acestea fiind staţionare).

c) Testarea numărului relaţiilor de cointegrare şi estimarea acestora

Johansen (1988) a obţinut estimaţii pentru  (kxr) şi  (kxr) utilizând procedura


cunoscută ca regresia rangului redus. Estimatorii de maximă verosimilitate (ML) pentru  sunt
obţinuţi ca şi vectori proprii corespunzători celor mai mari r valori proprii.

Testele sunt bazate pe estimarea parametrilor reprezentării VECM:

Yt  Yt 1  1Yt 1  ...  p1Yt  p1  B   t

şi se definesc utilizând cele mai mari valori proprii ale matricii  . În scopul stabilirii numărului
de relaţii de cointegrare, sunt estimate valorile proprii (sau rădăcinile caracteristice) ale matricei
 : ˆ1  ˆ2  ...  ˆk 1 . Aceste valori proprii sunt egale cu pătratul corelaţiei canonice între Yt şi
Yt 1 corectată de diferenţele Yt i , astfel că iau valori între 0 şi 1. Numărul valorilor proprii
semnificativ diferite de zero indică numărul relaţiilor de cointegrare. Rangul matricii  este egal
cu numărul valorilor proprii diferite de zero.

Următoarele două teste, de tip raport al verosimilității (LR- “likelihood ratio”), sunt utilizate
pentru determinarea numărului r de valori proprii semnificativ diferite de zero, adică a numărului
relaţiilor de cointegrare:

1. testul urmei (“trace test)”

LRtrace(r)  T i r 1 ln ( 1  λˆi ) , care urmează o distribuție hi-pătrat (


k
)
Ipoteza nulă poate fi formulată astfel: rangul matricei  este egal cu r contra unei ipoteze
alternative care specifică faptul că rangul matricei  este mai mare decât r.

Cu alte cuvinte, se testează succesiv, pentru r=0,1, ...,k-1 dacă există cel mult r relaţii de
cointegrare până la primul r pentru care ipoteza nulă nu se respinge. Când ipoteza nulă H 0 nu se
respinge, valoarea statisticii LR este aproape de zero, adică ultimele k- r valori proprii sunt
nesemnificative r 1 ,..., ˆk . Ipoteza nulă se respinge când valoarea calculată a statisticii este mai
mare decât cea critică.

2. testul valorii proprii maxime („maximum eigenvalue test”)

LRmax(r,r  1 )  T ln ( 1  λˆr 1 ) sau

LRmax(r,r  1 )  LRtrace (r )  LRtrace (r  1)

Ipoteza nulă poate fi formulată astfel: rangul matricei  este egal cu r contra unei ipoteze
alternative care specifică faptul că rangul matricei  este r+1. Se respinge ipoteza nulă când
statistica testului este mai mare decât valoarea critică.

Cu alte cuvinte, se testează succesiv, pentru r=0,1, ...,k-1 dacă există cel mult r relaţii de
cointegrare contra ipotezei alternative care specifică existența a r+1 relaţii de cointegrare

Valorile critice sunt determinate de mai mulţi autori, printre care Johansen și Juselius
(1990), MacKinnon-Haug-Michelis (1999). Valorile critice diferă după cum seriile au constantă
şi/sau tendinţă deterministă, respectiv ecuaţiile de cointegrare conţin constantă şi/sau tendinţă
deterministă. Forma generală a modelului este:

Yt  Yt 1  1Yt 1  ...  p1Yt  p1  Bxt   t

Poate include şi tendinţe deterministe, de tip t, prin vectorul variabilelor deterministe xt .

Pentru selecţia numărului de întârzieri (decalaje, lag-uri), în analizele de tip VECM sau
VAR, se pot utiliza criteriile informaționale (de exemplu, AIC (Akaike Information Criterion),
SIC (Schwarz Information Criterion) sau HQ (Hannan-Quinn Information Criterion)). Se alege
acea valoare pentru p ce minimezează valoarea acestor criterii informaționale.

Această abordare facilitează testarea unor restricţii, utilizând teste de tip LR distribuite
după legea hi-pătrat ( ), restricţii eventual sugerate de teoria economică, asupra elementelor
matricei vectorilor de cointegrare sau a matricei coeficienţilor de ajustare  ; regăsim aici şi
testele de exogeneitate (slabă sau tare).

Modelul dinamic VECM poate fi utilizat pentru generarea de previziuni, respectiv pentru
a analiza impactul unor perturbaţii (şocuri) aleatoare asupra variabilelor sistemului.

Testul de cointegrare propus de Gregory și Hansen (1996) cu modificări structurale este


bazat pe schimbările în regimul trendului, pentru că admite existența modificărilor structurale
determinate endogen în relația de cointegrare pe termen lung. Forma generală a modificării
structurale considerată de Gregory și Hansen (1996) admite modificări în termenul liber
(intercepție (engl., intercept)) și/sau modificări ale pantei, dar nu și în coeficienții asociați
trendului. Ipoteza nulă a testului stabilește lipsa relației de cointegrare între seriile variabilelor
contra unei ipoteze alternative care indică existența cointegrării cu o modificare structurală.
Se introduce o variabilă dummy pentru a cuantifica o schimbare în regresia de
cointegrare. Variabila dummy ține seama de modificarea structurală în constantă (I), în constantă
și trend (II), în constantă și pantă (III), în constantă, pantă și trendul seriei (IV). Cele patru
modele sunt asociate cu ipoteze diferite ale vectorului de cointegrare. Valoarea cea mai mică a
statisticii ADF identifică punctul de schimbare căruia i se asociază valori critice calculate de
Gregory și Hansen (1996).
Se consideră regresia de mai jos:

- termenul liber, coeficientul trendului și coeficienții pantelor înainte de schimbarea


de regim
- termenul liber, coeficientul trendului și coeficienții pantelor după schimbarea de
regim

Yt și Xit reprezintă variabila dependentă la momentul t, respectiv variabilele independente (k


variabile) la momentul t. este termenul eroare, care are o serie staționară, I(0). În ecuația de
mai sus, este variabila dummy, definită astfel:

- sincronizarea relativă a punctului de schimbare

[] înseamnă partea întreagă


Dacă seriile analizate au același ordin de integrare, atunci se poate stabili dacă există pe
termen lung o relație între seriile variabilelor analizate.
Anterior aplicării testului Gregory-Hansen, se aplică testul de rădăcină unitate pentru
modificări structurale Zivot-Andrews (ZA). Ipoteza nulă a acestui test specifică existența
rădăcinii unitate în procesul cu derivă (drift) care exclude modificările structurale exogene.
Abordarea ZA estimează punctul de modificare (breakpoint) acolo unde valoarea statisticii ADF
calculate este minimă.

Exemplu: verificarea relației de cointegrare între seriile logaritmate pentru PIB,


consumul de energie regenerabilă, formarea brută de capital (factorul capital) și ocupare ca
număr de persoane angajate (factorul muncă) în perioada 1983-2019 în Franța, Spania și
Germania.
Se aplică testul ZA și se determină recursiv modificările endogene în anii 1993 și 2007-
2008, ceea ce indică prezența unor șocuri în aceste perioade. În urma aplicării testului ZA, a
rezultat că toate seriile sunt integrate de ordinul întâi (I(1)). Mai jos se afișează rezultatele
testului de cointegrare a lui Gregory și Hansen (1996) considerând cele 4 tipuri de modele.
Ipoteza nulă a testului fixează lipsa relației de cointegrare între seriile variabilelor menționate
mai sus. Cum valorile calculate ale statisticii Z în modul sunt mai mari decât valorile critice
afișate în paranteze (), se respinge ipoteza nulă și la un nivel de semnificație de 5% se admite
existența relației de cointegrare între seriile variabilelor pentru toate țările analizate (Franța,
Spania, Germania).

Tabel 1: Rezultatele testului de cointegrare a lui Gregory și Hansen (1996)

Modificare
Țara
structurală în:
Constantă și Constantă, pantă și
Constantă Constantă și pantă
trend trend
Franța -5.88 (-5.28) [2001] -5.86 (-5.57) -6.77 (-6.00) [2000] -6.56 (-6.32) [2000]
[2001]
Spania -4.82 (-4.61) -5.30 (-4.99) -4.99 (-4.95) [1990] -5.96 (-5.50)
[2003] [2003] [1997]
Germania -4.93 (-4.61) -5.84 (-5.57) -5.73 (-4.95) [1991] -5.72 (-5.50)
[1991] [1991] [1991]
Note: se raportează valorile calculate ale statisticii Z. Valorile critice la un nivel de semnificație de 5% și anul în
care a avut loc o modificare structurală se raportează în paranteze.

Testul de cointegrare al lui Johansen și Juselius (1990) indică existența numărului de relații de
cointegrare sub diverse specificări.
Tablelul 2. Rezultatele testului de cointegrare Johansen și Juselius (1990)

Țara Testul None None Linear Linear Quadratic


No Intercept Intercept Intercept Intercept Intercept
No Trend No Trend No Trend Trend Trend
Franța Testul urmei 3 4 3 3 2
Testul valorii
proprii
maxime 2 3 1 1 1
Spania Testul urmei 4 3 2 3 5
Testul valorii
proprii
maxime 1 1 1 1 1
Germania Testul urmei 2 4 1 3 3
Testul valorii
proprii
maxime 1 1 1 1 1

S-ar putea să vă placă și