Documente Academic
Documente Profesional
Documente Cultură
5
CAPITOLUL 1. PRINCIPII ALE MODELĂRII
ECONOMETRICE
6
După sensul legăturii, acestea pot fi legături directe, atunci când
modificarea variabilei rezultative este în acelaşi sens cu modificarea factorului
de influenţă analizat, sau legături inverse, atunci când variabila rezultativă se
modifică în sens contrar modificării factorului de influenţă. În modelele
econometrice pot exista situaţii în care între aceleaşi variabile pe anumite
porţiuni să existe legături directe, iar pe alte porţiuni să existe legături inverse,
în funcţie de evoluţia factorilor de influenţă.
În funcţie de forma legăturii dintre variabile, folosind clasificarea
dihotomică, distingem legături liniare şi legături neliniare. Forma legăturii se
determină cel mai adesea intuitiv, prin modul de transpunere a punctelor în
planul de reprezentare grafică a variabilelor rezultative şi factoriale. În modele
econometrice, legătura liniară ocupă un loc aparte, datorită accesibilităţii
prezentării şi a posibilităţilor numeroase de interpretare, cu toate că în natură şi
în evoluţia reală a fenomenelor economice este mai puţin întâlnită. Identificarea
modelelor neliniare (parabolice, exponenţiale, hiperbolice, logistice, etc.),
uneori mult mai adecvate, ridică probleme mari şi diverse în determinarea şi,
mai ales, în interpretarea parametrilor. Există şi situaţii în care modele de tip
neliniar pot fi liniarizate prin anumite metode (cel mai adesea prin logaritmare)
şi interpretate prin prisma legăturilor de tip liniar.
După momentul în care se realizează legătura, legăturile pot fi
concomitente sau sincrone, caz în care dacă variabila factorială se modifică şi
variabila rezultativă se va modifica în acelaşi timp, ori legături asincrone sau cu
decalaj, caz în care variaţia variabilei rezultative se produce după scurgerea
unei perioade de timp de la modificarea variabilei factoriale.
După intensitatea conexiunii cauzale distingem independenţă totală sau
lipsa de legături, legături funcţionale sau totale şi legături relative sau statistice.
Conexiunea nulă semnifică absenţa oricărei legături între variabila rezultativă şi
factorii de influenţă luaţi în considerare, sau în formulare statistică, absenţa
reciprocă a corelaţiilor dintre aceste variabile, în timp ce conexiunea
funcţională apare atunci când la fiecare valoare posibilă a variabilei rezultative
corespunde o singură valoare a factorului de influenţă. Această conexiune este
una specifică ştiinţelor tehnice şi ale naturii, în care pentru o valoare dată a
factorului de influenţă există o singură valoare posibilă a variabilei rezultative.
Aceste conexiuni sunt rar întâlnite în economie, unde practic nu există astfel de
dependenţe totale. Conexiunea relativă sau statistică (stochastică) este tipul de
legătură cel mai des întâlnit în studiul fenomenelor din economie.
Interes aparte, prin urmare, îl prezintă acest din urmă tip de legături.
Particularitatea lor principală constă în faptul că la o valoare dată a factorului de
influenţă corespunde o distribuţie de valori posibile ale variabilei rezultative.
7
1.2. Modelul – element fundamental al analizei
econometrice
8
legăturile dintre variabilele exogene şi endogene şi, în modul acesta, permite
rezolvarea unei serii de probleme economice. Fără îndoială că, privind lucrurile
în mod abstract, modelele econometrice sunt întotdeauna de preferat, conferind
o calitate maximă analizei. Din păcate, eficacitatea modelelor econometrice
este, uneori, destul de limitată, iar aceasta din mai multe motive.
O dependenţă statistică, larg utilizată în econometrie, se prezintă sub
forma:
Ci = f(Xi) + i
9
testarea statistică a semnificaţiei parametrilor estimaţi;
interpretarea rezultatelor obţinute în funcţie de semnul şi nivelul
parametrilor respectivi;
previzionarea variabilei rezultative pe baza modelului construit.
O altă direcţie în domeniul analizei cantitative a desfăşurării proceselor
economice o reprezintă studiul, prin metode statistice, a comportamentului
seriilor cronologice. Seriile lungi de date oferite de publicaţiile statistice scot în
evidenţă repetabilităţi care pot fi descrise de modele adecvate de analiză şi
previziune a evoluţiei în timp a cursurilor de schimb.
În cazul acestor serii cronologice, de timp sau dinamice, cum mai sunt ele
denumite, factorii de influenţă utilizaţi în funcţiile de regresie sunt înlocuiţi de
către factorul timp înţeles ca o acumulare de perioade de timp egale, aspect
exprimat frecvent prin şirul numerelor naturale (1, 2, 3, ….. , t).
Cea mai utilizată formă de analiză a seriilor cronologice este reprezentată
de descompunerea evoluţiei seriei pe componente determinate de acţiunea
diferiţilor factori de influenţă. Sub acţiunea unui complex de factori de
influenţă, consideraţi independenţi unul faţă de celălalt, în cadrul unei serii
dinamice se pot identifica următoarele componente: 2
trendul sau tendinţa centrală (tt) reflectă legitatea specifică de
evoluţie a variabilei rezultative pe o perioadă lungă de timp (de ordinul anilor),
făcând abstracţie de abaterile faţă de nivelul mediu, respectiv, de erorile sau
valorile reziduale datorite influenţei factorilor aleatori;
variaţiile ciclice (ct) reprezintă oscilaţiile interanuale în jurul
tendinţei centrale cu un caracter mai puţin sistematic, în sensul că atât
intervalele la care oscilaţiile se manifestă, cât şi intensitatea lor, prezintă o
relativă inconstanţă în decursul timpului;
variaţiile sezoniere (st) sunt acea componentă sistematică ce se
manifestă prin oscilaţii de perioadă mai mică sau cel mult egală cu un an,
repetabile în timp. Sezonalitatea se manifestă sub forma unor abateri de la
medie care revin regulat de-a lungul unui an şi are un caracter mai mult sau mai
puţin pregnant în funcţie de specificul domeniului studiat;
variaţiile aleatoare (t) apar datorită unor factori necuantificabili şi
cu acţiuni imprevizibile. În funcţie de proprietăţile variabilei aleatoare pot fi
aplicate anumite tehnici de estimare şi previziune a seriei cronologice.
În măsura în care volumul de date studiat este suficient de mare, în
analiza unei serii cronologice se regăsesc mai multe tipuri de scheme de
descompunere.
2
T. Andrei, S. Stancu – Statistica. Teorie şi aplicaţii, Editura ALL, Bucureşti, 1995, pag. 385
10
O primă schemă o reprezintă schema aditivă în care cele patru
componente ale seriei studiate sunt însumabile direct, astfel:
Ct = tt + ct + st + t ,
dt = tt + ct
Ct = dt + dt st + t = dt (1 + st) + t
Ct = dt (1 + st)(1 + t)
11
Ct = f(Ct-1, Ct-2, …… ,Ct-k) + t
unde prin k s-a desemnat numărul perioadelor din trecut care acţionează asupra
valorii prezente a cursului de schimb.
Aceste modele econometrice, fie ele regresii sau serii cronologice, nu pot
fi utilizate fără a se ţine cont de principiile stabilite de teoriile economice care
analizează comportamentul variabilelor economice, fapt pentru care se impune
evitarea matematizării lor excesive, care duce de cele mai multe ori la ruperea
legăturii cu realităţile economice studiate.
Desigur, econometria prezintă numeroase avantaje, dar şi destule limite,
important fiind ca soluţiile noi oferite de către aceasta, care se dovedesc a fi
serios argumentate şi rezistente la rigorile practicii economice, să fie preluate în
rândul metodelor general acceptate, astfel încât rolul econometriei în cadrul
analizei economice să fie consolidat.
12
13
CAPITOLUL 2. MODELE ECONOMETRICE
UNIFACTORIALE
y=+x+
3
J.H. Stock, M.W. Watson, Introduction to Econometrics, Addison – Wesley, 2003, pag. 93 – 96
14
Parametrul reprezintă valoarea pe care o ia variabila rezultativă y atunci
când variabila factorială are valoarea zero şi poate avea relevanţă în model sau
nu, în funcţie de cazul concret analizat.
Parametrul , numit şi coeficient de regresie, reprezintă panta dreptei de
regresie, adică valoarea cu care se modifică variabila rezultativă y atunci când
variabila factorială x se modifică cu o unitate.
Semnul şi valoarea parametrului prezintă o importanţă majoră în
descrierea interdependenţei dintre variabila rezultativă şi cea factorială.
Astfel, dacă 0, atunci legătura dintre variabila factorială x şi variabila
rezultativă y este directă (când x are evoluţie crescătoare, creşte şi y, iar când x
are evoluţie descrescătoare, scade şi y). Când este pozitiv se pot distinge trei
situaţii: dacă 1, atunci influenţa variabilei factoriale asupra celei rezultative
este mai slabă (la variaţia cu o unitate a variabilei factoriale x, variabila
rezultativă y variază cu o valoare subunitară); dacă 1, atunci influenţa
variabilei factoriale asupra celei rezultative este foarte puternică (la variaţia cu o
unitate a variabilei factoriale x, variabila rezultativă y variază cu o valoare
supraunitară); dacă = 1, atunci variabila rezultativă y variază direct
proporţional cu variaţia variabilei factoriale x.
Dacă 0, atunci legătura dintre variabila factorială x şi variabila
rezultativă y este inversă, de sens contrar (când x evoluează crescător, y are o
evoluţie descrescătoare, iar când x evoluează descrescător, y are o evoluţie
crescătoare).
În situaţia în care = 0, variabila rezultativă y este complet
independentă în raport cu variabila factorială x.
Analiza de regresie în cazul modelului unifactorial liniar constă în
estimarea parametrilor şi , prin determinarea a doi estimatori ̂ şi ̂ .
Aceşti estimatori trebuie calculaţi astfel încât diferenţa dintre valorile
reale ale variabilei rezultative (yi) şi valorile estimate cu ajutorul parametrilor
calculaţi ( ŷi ˆ ˆ xi ) să fie cât mai mică ( yi ŷi min im ).
Deoarece funcţia de regresie utilizată este de tip stochastic, parametrii
şi nu sunt valori unice, ci au conţinut de medii, care se estimează cu ajutorul
metodelor specifice oferite de matematică şi statistică 4.
15
Dacă se ia în studiu un set de date reale referitoare la variabila
rezultativă, respectiv la variabila factorială, se va observa că reprezentarea
grafică a modelului liniar aproximează mai mult sau mai puţin exact legătura
dintre cele două variabile. Este puţin probabil ca cele două variabile să fie
legate strict printr-o relaţie liniară, de tip funcţional.
O cuantificare deterministă, exactă a valorilor parametrilor şi este
imposibil de realizat, deoarece nu se pot cuprinde în model absolut toate
influenţele existente. Acest lucru a determinat introducerea în model a variabilei
aleatoare, perturbatoare , care însumează efectul tuturor factorilor rămaşi în
afara modelului, fie ei nesemnificativi sau necuantificabili.
Variabila aleatoare se presupune că are o repartiţie normală de medie
nulă şi varianţă constantă pentru eşantionul de date analizat. Cu cât volumul
eşantionului este mai mare, cu atât aceste presupuneri sunt mai apropiate de
realitate.
În aceste condiţii, fiecărei valori date xi a variabilei factoriale îi
corespunde o distribuţie normală de valori yi ale variabilei rezultative, de medie
+ xi şi varianţă constantă.
Aceste ipoteze permit abordarea în condiţii de rigurozitate ştiinţifică a
problematicii estimării parametrilor şi .
Valorile estimatorilor parametrilor, notate mai sus cu ̂ şi ̂ pot fi
determinate cu ajutorul mai multor metode matematice şi statistice.
Una din metodele care ţine seama de restricţiile prezentate este
metoda celor mai mici pătrate iniţiată de matematicianul francez A.M.
Legendre şi îmbunătăţită de K. Gauss, P.S. Laplace, P.L. Cebîşev şi A.A.
Markov.5 Aplicarea ei are la bază câteva ipoteze fundamentale:
datele privind variabila rezultativă şi cea factorială sunt obţinute fără
erori de observare sau măsurare;
variabila aleatoare sau reziduală este de distribuţie normală, de
medie nulă (E(i) = 0) şi de varianţă constantă şi diferită de zero;
variabila aleatoare urmează o distribuţie independentă de valorile
variabilei factoriale x;
valorile variabilei aleatoare nu sunt autocorelate.
Principiul metodei celor mai mici pătrate constă în minimizarea sumei
pătratelor erorilor de estimare, conform relaţiei:
n
n n
i yi ŷi yi ˆ ˆ xi min
i 1
2
i 1
2
i 1
2
5
E. Pecican, Econometrie, Editura ALL, Bucureşti, 1994, pag. 50
16
Condiţia necesară pentru îndeplinirea acestei restricţii este ca
derivatele parţiale ale sumei pătratelor erorilor de estimare în raport cu şi să
fie egale cu zero, deoarece aceasta ne conduce la un extrem al funcţiei
respective, conform teoremei lui Fermat.
Se poate demonstra că acest extrem este un minim deoarece pentru ca
el să fie un maxim ar trebui ca şi să fie egali cu , iar posibilitatea de a fi
un punct de inflexiune este exclusă dată fiind natura pătratică a funcţiei 6.
Derivatele parţiale ale funcţiei în raport cu parametrii şi se
egalează cu zero şi rezultă relaţiile:
n
2 yi ˆ ˆ xi 1 0
i 1
n
2 yi ˆ ˆ xi xi 0
i 1
n ˆ ˆ n x n y
i i
i 1 i 1
n n n
ˆ xi ˆ xi2 xi yi
i 1 i 1 i 1
6
E. Pecican, op. cit., pag. 51
17
eficienţi şi consistenţi. Atunci când se utilizează metoda celor mai mici pătrate
este necesar să fie cunoscute câteva consideraţii privind calitatea estimatorilor
rezultaţi7:
ridicarea la pătrat a abaterilor ( yi ŷi ) conduce la pătratele de arie minimă
a erorilor de estimare, ceea ce reprezintă un element pozitiv. Trebuie avut
însă în vedere faptul că această modalitate de calcul atribuie o importanţă
destul de mare abaterilor mari, în sus sau în jos, faţă de medie, deoarece
acestea prin ridicare la pătrat devin extrem de mari, afectând corespunzător
estimaţiile. De aceea, atunci când se studiază perioadele cu fluctuaţii foarte
mari ale variabilei rezultative în raport cu media, este indicată minimizarea
n
sumei abaterilor luate în calcul la valoarea lor absolută: yi ŷi = min;
i 1
calitatea estimatorilor de a fi nedistorsionaţi nu implică neapărat egalităţile
ˆ şi ˆ , ci presupune ca media estimatorului, obţinută pe baza
unui număr cât mai mare de eşantioane, să fie egală cu valoarea reală a
parametrului corespunzător. Din acest punct de vedere, este importantă
repartiţia valorilor variabilei aleatoare , precum şi varianţa valorilor
estimate în jurul mediei. Cu cât această varianţă este mai mică, cu atât
estimatorii sunt mai puţin distorsionaţi;
pentru eşantioane mai mici de 30 de valori este dificil să se ajungă la
estimatori ai parametrilor modelului care să respecte toate restricţiile.
Repartiţia variabilei aleatoare se modifică, varianţa estimatorilor creşte, iar
distorsiunea devine tot mai mare, pe măsură ce volumul eşantionului scade.
De aceea, modelele cu cele mai mari şanse de reuşită sunt cele bazate pe
eşantioane de volum mare.
Obţinerea valorilor estimate ale parametrilor şi înseamnă finalizarea
analizei de regresie a modelului unifactorial liniar.
Analiza corelaţiei în cazul modelului unifactorial liniar se realizează cu
ajutorul coeficientului de corelaţie liniară simplă, a raportului de corelaţie
simplă şi a coeficientului de determinaţie, dacă variabilele sunt cantitative, iar
dacă variabilele sunt calitative, se utilizează metodele neparametrice de
măsurare a intensităţii legăturii.
18
se determină printr-un ansamblu de metode şi teste statistice care sunt numite
generic verificarea statistică a modelului.
Această etapă de verificare a modelelor econometrice pe baza unor
teste statistice este absolut necesară, datorită faptului că estimarea parametrilor
modelelor se realizează pe baza unor eşantioane de date, mai mult sau mai puţin
reprezentative. Astfel, luând în considerare un număr destul de redus de valori
(uneori sub 30 de date) se doreşte să se ajungă la estimări valabile pentru o
colectivitate generală formată din sute sau chiar mii de cazuri. Orice modificare
a volumului eşantionului duce, de regulă, la modificarea valorilor estimate, ceea
ce înseamnă că aceste valori au un grad ridicat de relativitate. 8
În aceste condiţii, apar probleme legate de măsura în care soluţiile
unui model pot fi generalizate, de faptul că estimaţiile obţinute pot fi
semnificative sau doar întâmplătoare, rezultat al unei conjuncturi de valori din
cadrul eşantionului, precum şi de limitele între care estimatorii pot varia fără a
influenţa aprecierile iniţiale şi concluziile referitoare la semnificaţia lor.
Aceste probleme sunt rezolvate, în general, cu ajutorul testelor
statistice, care studiază semnificaţia parametrilor modelului econometric şi
calitatea acestuia de a descrie relaţia de dependenţă dintre variabila rezultativă
şi factorii de influenţă luaţi în considerare. Pentru aceasta, în primul rând,
trebuie cunoscută legea de repartiţie care caracterizează comportamentul
variabilelor studiate – rezultativă, factorială şi aleatoare.
Legea de repartiţie a unei variabile aleatoare x exprimă probabilitatea
P ca variabila respectivă să ia o anumită valoare.
Funcţia de repartiţie F(x) se referă la probabilitatea ca variabila x să ia
o valoare mai mică decât un anumit nivel dat xi:
xi
F(x) = P(x < xi) = f x dx
0
x2
F(x) = P(x1 < x < x2) = f x dx
x1
8
C. Şipoş, Modelarea comportamentului cursului de schimb al leului, Editura Universităţii de
Vest, Timişoara, 2003, pag. 80
19
unde f(x) este prima derivată a funcţiei de repartiţie şi exprimă densitatea,
aglomerarea variabilei în punctul x.
De regulă, legea care guvernează variabilele şi frecvenţa apariţiei
acestora în economie este legea de repartiţie normală, notată cu N(m, ).
Distribuţia normală prezintă importanţă atât din motive teoretice cât şi practice,
reprezentând un model adecvat ori de câte ori o variabilă este dependentă de
unul sau mai mulţi factori care exercită asupra ei influenţe de intensitate relativ
mică şi în diverse sensuri.
Dacă x este o variabilă aleatoare continuă care urmează o repartiţie
normală de medie m şi abatere medie pătratică , N(m, ), atunci densitatea de
probabilitate este:
x m
2
1
f x e 2 2
2
xm
z
1
1 z 2
f z e 2
2
t m 2
x x
1
F x P X x f t dt e 2 2
dt
2
20
Din ecuaţia f(x) = 0 se obţine x = m şi valoarea maximă a densităţii de
1
probabilitate este atinsă în punctul (m, ). 9
2
Această lege de repartiţie a fost luată în considerare atunci a fost
caracterizată variabila aleatoare şi când au fost apreciate valorile ŷi în funcţie
de un nivel dat al variabilei factoriale xi. Dacă se au în vedere parametrii şi
din modelul liniar unifactorial, atunci, deoarece variabila i urmează o repartiţie
normală, iar ̂ şi ̂ sunt combinaţii liniare ale variabilei i , înseamnă că aceşti
parametri sunt ei înşişi normal distribuiţi.
Media estimatorului fiecărui parametru, în ipoteza unei estimaţii
nedistorsionate, este mărimea parametrului din colectivitatea generală. Varianţa
estimatorului fiecărui parametru, în cazul unei estimaţii eficiente, depinde de
împrăştierea variabilei aleatoare şi de împrăştierea valorilor variabilei factoriale.
Verificarea statistică este, de fapt, o operaţiune de validare a
modelului, în funcţie de concluziile ei luându-se decizia de confirmare sau de
infirmare a posibilităţilor acestuia de a reflecta corect situaţia reală. Setul de
metode statistice care stă la baza verificării unui model econometric unifactorial
este compus din mai multe tipuri de teste specifice, prezentate sintetic în cele ce
urmează.
O primă verificare constă în determinarea şi interpretarea erorilor
standard generate de model. Erorile standard reprezintă abateri ale valorilor
estimate de la valorile reale şi se împart în două categorii:
prima categorie, calculată ca abatere a valorilor estimate ale
variabilei rezultative y i faţă de cele reale yi, se numeşte eroare standard a
modelului (s) şi se determină cu relaţia:
1 n
yi ŷi
2
s
n 2 i 1
În principiu, cu cât această eroare este mai mică în raport cu valorile
variabilei rezultative, cu atât modelul aproximează mai corect realitatea
economică studiată. Interpretarea calităţii modelului în funcţie de valoarea erorii
standard a modelului este destul de relativă, fapt pentru care utilitatea acesteia
constă mai degrabă în a fi folosită în determinarea altor parametri statistici de
verificare a modelului;
a doua categorie reprezintă abateri ale valorilor estimate ale
parametrilor funcţiei de regresie de la valorile lor reale şi se numesc erori
9
C. Chilărescu, O. Ciorîcă, C. Preda, C. Şipoş, N. Surulescu, Bazele statisticii, Editura
Universităţii de Vest, Timişoara, 2002, pag. 110 – 114
21
standard ale parametrilor modelului. Ele se determină pentru fiecare parametru
în parte. În cazul modelului unifactorial liniar, cele două erori standard ale
parametrilor şi , notate cu s , respectiv, s sunt:
n
2
xi
s s i 1
2
n x xi
n n
2
i
i 1 i 1
n
s s 2
n x xi
n n
2
i
i 1 i 1
Cu cât aceste erori ale parametrilor modelului sunt mai mici în raport
cu valorile absolute ale parametrilor pe care îi caracterizează, cu atât valorile
estimate ale parametrilor respectivi sunt mai apropiate de cele reale.
Pentru ca modelul elaborat să fie corect din punct de vedere statistic,
el trebuie să îndeplinească condiţia de normalitate a variabilei aleatoare ,
prezentată în etapa formulării ipotezelor iniţiale 10. Aceasta se poate verifica cu
ajutorul mai multor teste statistice, dintre care mai des utilizat este testul 2, care
constă în compararea frecvenţelor absolute efective, ni, ataşate valorilor
variabilei aleatoare, cu valorile teoretice, pi.
Efectuarea testului 2 presupune parcurgerea următoarelor etape:
1. Se formulează ipoteza nulă H0, prin care se presupune că distribuţia
variabilei aleatoare este normală;
2. Se calculează valorile standardizate zi, conform relaţiei:
xi m
zi
10
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
22
k ni npi 2
c=
2
i 1 npi
n
i i 1
2
i2
d= n
i2
i 1
11
C. Chilărescu, Modele econometrice aplicate, Editura Mirton, Timişoara, 1994, pag. 25 – 26
23
ce implică faptul că şi înregistrările de date în eşantioane au fost independente.
În această situaţie, modelul este corect din punct de vedere statistic. În practica
econometrică, având în vedere faptul că, rareori, valorile tabelare ale acestui test
depăşesc valoarea 2 se spune că dacă valoarea calculată d este mai mare decât 2,
atunci modelul este corect. Pentru rigurozitate ştiinţifică, însă, este de preferat
să se tragă concluziile după compararea lui d cu valorile tabelare aferente
testului Durbin – Watson.12
În prima situaţie, cea în care modelul trebuie corectat, se parcurge un
algoritm de corecţie, după cum urmează:
Având în vedere faptul că variabila aleatoare este autocorelată,
înseamnă că între fiecare pereche de valori ( i; i-1 ) există o relaţie care poate fi
descrisă cu ajutorul unei funcţii de regresie de forma:
i = r i-1 + ui
unde r este panta dreptei de regresie, iar ui este perturbaţia aferentă acestei
funcţii.
Deoarece variabila aleatoare este autocorelată, r va fi un estimator al
coeficientului de corelaţie care arată intensitatea legăturii între i şi i-1 13 şi se
determină cu relaţia:
n
i i1
r i 2 n
i
2
i 1
12
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
13
W.H. Greene, Econometric Analysis, Fifth Edition, Prentice Hall, 2003, pag. 268 – 271
14
R.S. Pindyck, D.L. Rubinfeld, op. cit., pag. 161 – 162
24
Înmulţind ecuaţia cu r şi scăzând-o din ecuaţia iniţială a modelului, se
obţine funcţia corectată, cu variabila aleatoare cu o distribuţie independentă de
medie nulă şi varianţă constantă, conform relaţiei:
unde yi*, xi* şi ui sunt diferenţele generalizate ale lui y, x şi , definite de relaţiile:
yi* = yi – r yi-1
xi* = xi – r xi-1
ui = i – i-1
s 2y / x
Fc
s2
Etapa IV. Se alege valoarea tabelară sau critică (Ft) din tabelul
repartiţiei Fisher – Snedecor în funcţie de nivelul de semnificaţie şi de
numărul de grade de libertate;
25
Etapa V. Se compară valoarea calculată Fc cu valoarea tabelară Ft şi
pot rezulta două situaţii:
– dacă Fc Ft, ipoteza nulă se acceptă cu probabilitatea p = 1 – , ceea
ce înseamnă că modelul trebuie reconsiderat, fie în sensul alegerii altui factor de
influenţă, fie în sensul optării pentru o altă formă a funcţiei de regresie;
– dacă Fc > Ft, ipoteza nulă se respinge cu probabilitatea p = 1 – , ceea
ce înseamnă că modelul a rezistat verificării, adică variabila factorială are o
influenţă semnificativă asupra variabilei rezultative.
Pentru a cerceta dacă parametrii obţinuţi în urma aplicării metodei
celor mai mici pătrate sunt consistenţi se utilizează testul Student de verificare a
semnificaţiei parametrilor modelului. Media estimatorului fiecărui parametru,
în ipoteza unei estimaţii nedistorsionate, este mărimea reală a parametrului.
Varianţa estimatorului fiecărui parametru, în cazul unei estimaţii eficiente,
depinde de împrăştierea variabilei aleatoare şi de împrăştierea valorilor
variabilelor factoriale.
Ceea ce interesează în mod deosebit este semnificaţia parametrului
corespunzător variabilei factoriale, , dată fiind importanţa lui în măsurarea
influenţei acesteia asupra evoluţiei variabilei rezultative.
Etapele verificării semnificaţiei parametrilor cu ajutorul testului
Student sunt următoarele:
Etapa I. Se stabileşte ipoteza nulă H0 conform căreia parametrii
estimaţi ̂ şi ̂ nu diferă semnificativ de zero. Acest lucru înseamnă că se
porneşte de la presupunerea că modelul este irelevant;
Etapa II. Se stabileşte nivelul de semnificaţie al testului, notat cu ;
Etapa III. Se determină valorile calculate ale testului Student pentru
fiecare parametru în parte, ca raport între valoarea absolută a parametrului
estimat şi eroarea sa standard, conform relaţiilor:
ˆ
t
s
ˆ
t
s
26
– dacă nivelul calculat al ambilor parametri ai modelului este mai mic
sau cel mult egal cu valoarea critică (t , t < tcritic), ipoteza nulă se acceptă şi se
poate spune cu probabilitatea p = 1 – că estimatorii ̂ şi ̂ nu diferă
semnificativ de zero. În aceste condiţii, datele nu confirmă existenţa legăturii
între variabila factorială şi cea rezultativă, fiind necesară fie alegerea altui factor
de influenţă, fie găsirea unei noi forme a legăturii;
– dacă nivelul calculat al ambilor parametri ai modelului este mai mare
decât valoarea critică (t , t tcritic), ipoteza nulă se respinge şi se poate spune
cu probabilitatea p = 1 – că estimatorii ̂ şi ̂ diferă semnificativ de zero,
adică parametrii estimaţi sunt semnificativi, iar modelul este corect din punct de
vedere statistic.
Parcurgerea tuturor acestor etape ale verificării statistice a modelului
unifactorial liniar, poate conduce la ideea unei anumite nesiguranţe privind
calitatea rezultatelor obţinute. În urma verificărilor, însă, această nesiguranţă
dispare şi, chiar dacă nu există certitudini, există convingerea că, pentru o
probabilitate suficient de mare, concluzia la care se ajunge este cea adevărată.
27
În econometrie, cele mai cunoscute şi mai des întâlnite modele
unifactoriale neliniare sunt: modelul hiperbolic, modelul parabolic şi modelul
exponenţial.
yi
0
0
0 xi
1
yi i
xi
yi xi' i
28
În aceste condiţii, sistemul de ecuaţii care conduce la valorile estimate
ale parametrilor şi , obţinut conform algoritmului prezentat în cazul
modelului unifactorial liniar, este:
n ˆ ˆ n x' n y
i i
i 1 i 1
n
n 2 n
ˆ x ˆ x x' y
' '
i 1 i i 1 i i 1 i i
Ajustarea prin hiperbolă se recomandă atunci când variabila
rezultativă y scade, respectiv, creşte asimptotic către o valoare reală dată de
parametrul , fapt ilustrat şi de figura 1.
Analiza de corelaţie în cazul modelului hiperbolic se realizează cu
ajutorul raportului de corelaţie R şi a coeficientului de determinaţie simplă R2.
Verificarea statistică a modelului şi discuţiile referitoare la
homoscedasticitatea variabilei aleatoare sunt similare cu cele prezentate la
modelul unifactorial liniar.
În funcţie de reprezentarea grafică a legăturii, pot fi utilizate variante
y
ale funcţiei hiperbolice, care au la bază diverse ecuaţii: y e ; x 1;
x
1
y etc.
x
2.2.2. Modelul parabolic
Acest model, numit şi modelul pătratic, este folosit, de regulă, atunci
când ritmul de evoluţie al caracteristicii urmează o curbă de tip U, cu vârfurile
în jos sau în sus. Pentru exprimarea modelului parabolic se utilizează funcţia de
gradul doi, după relaţia:
yi = + 1xi +2xi2 + i
yi
2 0
29
2 0
0 xi
Figura 2. Reprezentarea grafică a funcţiei parabolice
n ˆ ˆ n x ˆ n x 2 n y
1 i 2 i i
i 1 i 1 i 1
n
ˆ
n
2 ˆ
n n
ˆ
i 1 i 2 i xi yi
x x x 3
i1 i 1 i 1 i 1
ˆ n x 2 ˆ n x 3 ˆ n x 4 n x 2 y
i1 i 1 i1 i 2 i1 i i1 i i
yi xi
30
Figura 3. Reprezentarea grafică a funcţiei exponenţiale
01
0 xi
31
Analiza de corelaţie în cazul modelului exponenţial, similar cu
celelalte modele neliniare, se realizează prin determinarea şi interpretarea
raportului de corelaţie R şi a coeficientului de determinaţie simplă R2.
Verificarea statistică a modelului şi discuţiile referitoare la
homoscedasticitatea variabilei aleatoare sunt, ca şi în celelalte cazuri neliniare,
similare cu cele prezentate la modelul unifactorial liniar.
Modelul exponenţial are, la rândul său, numeroase variante de
exprimare, cum ar fi: y e x ; y e x etc.
În afara acestor tipuri de modele neliniare simple, pot fi luate în
considerare multe altele, în funcţie de modul de dispunere a punctelor din
reprezentarea grafică.
Trebuie observată, însă, importanţa deosebită a modelului unifactorial
liniar, deoarece aproape toate modelele se raportează la acesta într-o formă sau
alta. Cu toate acestea, principalul dezavantaj al unui model unifactorial este
acela că ia în considerare prea puţine variabile factoriale, fapt pentru care este
necesar să se apeleze la modele care studiază dependenţa dintre variabila
rezultativă şi mai mulţi factori de influenţă, care acţionează simultan.
32
CAPITOLUL 3. MODELE ECONOMETRICE
MULTIFACTORIALE
33
variabila aleatoare i urmează o distribuţie independentă de valorile
variabilelor factoriale x1i, x2i, …, xki;
variabilele factoriale nu sunt corelate liniar unele faţă de celelalte
(ipoteza absenţei multicoliniarităţii);
valorile variabilei aleatoare nu sunt autocorelate.
Conform principiului metodei celor mai mici pătrate, valorile
variabilei aleatoare i prin ridicare la pătrat, urmată de însumarea acestora,
conduc la obţinerea expresiei:
i 1
2
n
i 1
2
n
i 1
i yi ŷi yi ˆ ˆ 1 x1i ... ˆ k xki 2
n
i2 = minim
i 1
n
2 yi ˆ ˆ 1 x1i ˆ 2 x 2i ... ˆ k xki 0
i 1
n
2 x1i yi ˆ ˆ 1 x1i ˆ 2 x 2i ... ˆ k xki 0
i 1
34
n
2 x 2i yi ˆ ˆ 1 x1i ˆ 2 x 2i ... ˆ k xki 0
i 1
n
2 xki yi ˆ ˆ 1 x1i ˆ 2 x 2i ... ˆ k xki 0
i 1
Din relaţiile anterioare rezultă sistemul de k + 1 ecuaţii cu k + 1
necunoscute:
nˆ ˆ n x1 ˆ n x 2 ... ˆ n xk n y
1 i 2 i k i i
i 1 i 1 i 1 i 1
n n n n n
ˆ x1i ˆ 1 x1i2 ˆ 2 x1i x2i ... ˆ k x1i xki x1i yi
i1 i 1 i 1 i 1 i 1
n n n n n
ˆ x 2 ˆ x1 x 2 ˆ
x 2 2
... ˆ
x 2 xk x 2i yi
i 1 i i 2 i k i i
i 1 i 1 i 1 i 1 i 1
n n n n n
ˆ xk i ˆ 1 x1i xki ˆ 2 x 2i xki ... ˆ k xk i2 xk i yi
i1 i 1 i 1 i 1 i 1
35
termenului liber nu are relevanţă economică şi trebuie eliminat din funcţie.
Acest lucru se realizează prin construirea unei ecuaţii liniare multiple fără
termen liber, conform relaţiei:
36
valoare supraunitară); dacă 1 = 1, atunci variabila rezultativă y variază direct
proporţional cu variaţia variabilei factoriale x1.
Dacă 1 0, atunci legătura dintre variabila factorială x1 şi variabila
rezultativă y este inversă, de sens contrar – când x1 evoluează crescător, y are o
evoluţie descrescătoare, iar când x1 evoluează descrescător, y are o evoluţie
crescătoare.
În situaţia în care 1 = 0, variabila rezultativă y este complet
independentă în raport cu variabila factorială x1.
Similar se interpretează şi valorile lui 2, 3, …, k.
Obţinerea valorilor estimate ale parametrilor , 1, 2, …, k înseamnă
finalizarea analizei de regresie a modelului multifactorial liniar.
Analiza corelaţiei în cazul modelului multifactorial liniar cu variabile
cantitative se realizează cu ajutorul raportului de corelaţie multiplă, a
coeficientului de determinaţie multiplă, precum şi a coeficienţilor de corelaţie şi
determinaţie parţială .
Dacă modelul multifactorial conţine variabile calitative, se utilizează
metodele neparametrice de măsurare a intensităţii legăturii.
37
n
1
y yi
2
s
n k 1 i 1
i
s s c jj
j
Cu cât aceste erori sunt mai mici în raport cu valorile absolute ale
parametrilor pe care îi caracterizează (j), cu atât valorile estimate ale
parametrilor respectivi sunt mai apropiate de cele reale.
Condiţia de normalitate a variabilei aleatoare i, prezentată în etapa
formulării ipotezelor iniţiale, se poate verifica cu ajutorul testului 2, care constă
în compararea frecvenţelor absolute efective, ni, ataşate valorilor variabilei
aleatoare, cu valorile teoretice, pi. Efectuarea testului 2 presupune parcurgerea
următoarelor etape:
Etapa 1. Se formulează ipoteza nulă H0, prin care se presupune că
distribuţia variabilei aleatoare este normală;
15
E. Pecican, Econometrie, Editura ALL, Bucureşti, 1994, pag. 75 – 82
38
Etapa 2. Se calculează valorile standardizate zi, conform relaţiei:
i m
zi
k ni npi 2
c=
2
i 1 npi
39
s 2y / x 1,x 2 ,...,xk
F
s2
16
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
40
De obicei, în economie, variabilele factoriale nu sunt complet
independente unele de celelalte. Acest lucru înseamnă că, întotdeauna într-un
model econometric va exista un anumit efect de multicoliniaritate. Problema
care se pune este a gradului de multicoliniaritate peste care modelul devine
ineficient.
Eliminarea efectelor multicoliniarităţii se face cel mai sigur prin
eliminarea variabilelor factoriale corelate (eventual, păstrarea uneia dintre ele şi
eliminarea celorlalte). Acest lucru este posibil, însă, numai dacă modelul
cuprinde suficient de multe variabile factoriale.
O altă modalitate de evitare a multicoliniarităţii este segmentarea
eşantionului de date în mai multe părţi şi analizarea separată a fiecărei porţiuni,
cu condiţia ca eşantioanele rezultate în urma segmentării să fie suficient de
mari.
Un ultim test utilizat în cadrul acestei etape este testul Student de
verificare a semnificaţiei parametrilor modelului. Calitatea parametrilor
corespunzători variabilelor factoriale este foarte importantă, dat fiind rolul lor în
măsurarea impactului fiecărei variabile factoriale asupra evoluţiei variabilei
rezultative.
Pentru aceasta se calculează estimatorii varianţelor acestor parametri
s 2ˆ în funcţie de varianţa variabilei aleatoare s2 şi de varianţele variabilelor
k
factoriale.
Etapele verificării semnificaţiei parametrilor cu ajutorul testului
Student sunt următoarele:
Etapa 1. Se stabileşte ipoteza nulă H0 conform căreia parametrii
estimaţi ˆ , ˆ 1 , ˆ 2 ,..., ˆ k nu diferă semnificativ de zero;
Etapa 2. Se stabileşte nivelul de semnificaţie al testului, ;
Etapa 3. Se determină valorile calculate ale testului Student t k
pentru fiecare parametru în parte, ca raport între valoarea absolută a
parametrului estimat ̂ k şi eroarea sa standard s k , conform relaţiei:
ˆ k
t
k
s k
41
– dacă toate valorile calculate sunt mai mari decât nivelul critic ( t k >
tcritic), ipoteza nulă se respinge şi se poate spune cu probabilitatea p = 1 – că
toţi estimatorii determinaţi cu metoda celor mai mici pătrate diferă semnificativ
de zero, adică parametrii estimaţi sunt semnificativi, iar modelul este corect din
punct de vedere statistic;
– dacă unele valori calculate sunt mai mari decât nivelul critic, iar altele
sunt mai mici, parametrii aferenţi valorilor calculate mai mari decât nivelul
critic sunt semnificativi şi trebuie păstraţi în model, în timp ce parametrii
aferenţi valorilor calculate mai mici decât nivelul critic sunt nesemnificativi şi
trebuie eliminaţi din model. În această situaţie, modelul se va reface în raport de
variabilele factoriale rămase semnificative;
– dacă toate valorile calculate sunt mai mici decât nivelul critic ( tak <
tcritic), ipoteza nulă se acceptă şi se poate spune cu probabilitatea p = 1 – că
estimatorii nu diferă semnificativ de zero şi rezultatul obţinut este întâmplător.
În aceste condiţii, datele studiate nu confirmă existenţa legăturii între variabila
rezultativă şi factorii de influenţă analizaţi, fiind necesară fie alegerea altor
factori, fie găsirea unei noi forme a legăturii.
y = 1 x1 2 x2 … k xk
42
log y = log + x1 log 1 + … + xk log k + log
y e x1 e
1 2x2
... e k xk
y = x1 1 x2 2 … xk k
43
3.3. Funcţii de producţie
Y = L K
17
C. Chilărescu, Modele econometrice aplicate, Editura Mirton, Timişoara, 1994, pag. 81 – 85
44
Valoarea estimată pentru elasticitatea arată, în valoare procentuală,
cu cât se modifică venitul Y, atunci când forţa de muncă L se modifică cu o
unitate.
Similar, valoarea estimată a elasticităţii arată, în valoare procentuală,
cu cât se modifică venitul Y, atunci când capitalul fix K se modifică cu o unitate.
Iniţial, autorii au ajuns la concluzia că, pe termen lung, într-o
economie deschisă de piaţă, suma elasticităţilor şi tinde către 1, ipoteză
infirmată, însă, de cercetări ulterioare 18.
O altă funcţie de producţie, care este o completare a funcţiei Cobb –
Douglas, o reprezintă funcţia de producţie Solow, care pe lângă forţa de muncă
şi capitalul fix, ia în considerare şi impactul tehnologic (progresul tehnic sau
inovarea) ca fiind factor esenţial de producţie. Această funcţie are la bază
următoarea ecuaţie:
Y = L K e t
ln Y = ln L + ln K + t
ˆ n ln L 2 ˆ n ln L ln K ˆ n t ln L n ln Y ln L
i1 i i
i 1
i i i i i
i 1 i 1
n
n n n
ˆ
i ln L ln K i ˆ i ln K 2
ˆ i t ln K i ln Yi ln K i
i1 i 1 i 1 i 1
ˆ n t ln L ˆ n t ln K ˆ n t 2 n t ln Y
i1 i i i
i 1
i i i i
i 1 i 1
18
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
45
unde ̂ , ̂ şi ̂ sunt estimatorii elasticităţilor , şi .
O altă funcţie de producţie cunoscută în econometrie este funcţia de
producţie CES,19 care porneşte de la ipoteza elasticităţii constante a substituţiei
factorilor de producţie L şi K. Ecuaţia acestei funcţii este de forma:
ln Y ln
ln K 1 L
1 2
ln Y ln ln K 1 ln L 1 ln K ln L '
2
= 1 x1 + 2 x2 + 3 x3 + 4 x4 + ’
1
unde: x1 = 1; x2 = ln K; x3 = ln L; x4 ln 2 K / L , iar transformările
2
efectuate sunt:
19
W.H. Greene, Econometric Analysis, Fifth Edition, Prentice Hall, 2003, pag. 128 – 130
46
47
CAPITOLUL 4. MODELE ECONOMETRICE BAZATE
PE FACTORUL TIMP
y1 y2 . . yi . . yn
t t . . t . . t
1 2 i n
Un model econometric bazat pe influenţa timpului asupra evoluţiei unei
variabile economice prezintă câteva caracteristici fundamentale:
1. Variabilitatea termenilor unei serii de timp, care este dată de faptul că
fiecare termen se obţine prin centralizarea unor date individuale cu caracteristici
diferite. Cu cât acţiunea caracteristicilor individuale este mai pregnantă, cu atât
apar diferenţe mai mari între comportamentele termenilor seriei, ceea ce face ca
20
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
48
variaţiile, fluctuaţiile în cadrul seriei să fie mai puternice. Având în vedere
această trăsătură, este necesar ca, în analiza unei serii de timp, să se măsoare
atât influenţa factorilor esenţiali, care imprimă fenomenului o anumită tendinţă
specifică de evoluţie, cât şi marja de abatere de la această tendinţă, rezultată din
influenţa factorilor neesenţiali;
2. Omogenitatea termenilor, care constă în includerea în cadrul unei serii
de timp numai a fenomenelor de acelaşi gen, care sunt rezultatul acţiunii
aceloraşi cauze esenţiale. Pentru a asigura omogenitatea seriei, trebuie păstrată
aceeaşi metodologie de culegere a datelor, de calcul a indicatorilor şi evaluare a
rezultatelor, precum şi menţinerea lungimii intervalelor de grupare şi a unităţii
de măsurare a timpului. Atunci când se analizează o serie de timp, este necesar
să se verifice dacă datele provin din aceeaşi sursă, cu acelaşi grad de cuprindere
şi dacă au fost folosite aceleaşi principii şi metode de culegere şi prelucrare a
datelor;
3. Periodicitatea termenilor, care presupune asigurarea continuităţii
datelor în raport cu timpul şi reprezintă o caracteristică foarte importantă în
utilizarea metodelor analitice de analiză a seriilor dinamice. Variabila timp
poate fi înregistrată cu periodicităţi diferite, începând de la unităţi de timp de
ordinul minutelor, orelor sau zilelor şi continuând cu perioade de ordinul anilor,
deceniilor sau chiar secolelor, în funcţie de specificul variabilelor economice
analizate;
4. Interdependenţa termenilor seriei de timp, care înseamnă existenţa
unor legături între valorile înregistrate la perioade diferite de timp, adică
relevarea unor interdependenţe între nivelul curent al variabilei şi nivelurile
înregistrate în perioadele anterioare. Dacă aceste interdependenţe sunt foarte
puternice, atunci se poate vorbi despre un caracter “autoregresiv” al variabilei
analizate, care poate fi studiat cu ajutorul unor modele specifice, cu largă
utilizare în econometrie.
Un element fundamental al analizei econometrice cu ajutorul seriilor de
timp îl reprezintă alegerea lungimii seriei de date, de regulă, fiind necesar un
număr suficient de mare de termeni, astfel încât să poată fi aplicate principiile
legii numerelor mari şi să poată fi fundamentate corect previziunile pe diferite
perioade de timp.
Un alt element fundamental îl reprezintă alegerea formei optime de
analiză a seriei de date. Din acest punct de vedere, cea mai utilizată modalitate
de analiză a seriilor de timp o reprezintă descompunerea evoluţiei seriei
dinamice pe componente determinate de acţiunea diferiţilor factori de influenţă.
49
Sub acţiunea unui sistem complex de variabile factoriale sau aleatoare,
considerate independente una faţă de cealaltă, în cadrul unei serii dinamice se
pot identifica următoarele componente:21
1. Trendul sau tendinţa centrală Tt, care reflectă legitatea specifică de
evoluţie a variabilelor economice studiate pe o perioadă lungă de timp, făcând
abstracţie de abaterile faţă de nivelul mediu, respectiv, de erorile sau valorile
reziduale datorate influenţei factorilor aleatori. Identificarea trendului unei serii
de timp se realizează cu ajutorul a diverse metode econometrice, cunoscute
generic sub numele de “ajustarea seriilor de timp”;
2. Variaţiile ciclice Ct, care reprezintă oscilaţiile interanuale în jurul
tendinţei centrale cu un caracter nesistematic, în sensul că atât intervalele la care
oscilaţiile se manifestă, cât şi intensitatea lor, sunt diferite de-a lungul timpului;
3. Variaţiile sezoniere St sunt acea componentă sistematică ce se
manifestă prin oscilaţii de perioadă mai mică sau cel mult egală cu un an,
repetabile în timp. Sezonalitatea se manifestă sub forma unor abateri de la
medie care apar regulat în timpul unui an şi are un caracter mai mult sau mai
puţin pregnant în funcţie de specificul domeniului studiat;
4. Variaţiile aleatoare sau reziduale (perturbatoare) t apar datorită unor
factori necuantificabili şi cu acţiuni absolut imprevizibile. În funcţie de
proprietăţile atribuite variabilei aleatoare pot fi aplicate anumite tehnici de
estimare şi previziune a comportamentului seriei de date.
În măsura în care volumul de date studiat este suficient de mare, în
analiza unei serii de timp se regăsesc mai multe tipuri de scheme de
descompunere a influenţelor pe cele patru componente 22.
Schema cea mai simplă şi mai des utilizată este schema aditivă, în care
cele patru componente ale seriei se însumează direct, conform relaţiei:
yt = Tt + Ct + St + t ,
Dt = Tt + Ct
21
T. Andrei, S. Stancu, Statistica. Teorie şi aplicaţii, Editura ALL, Bucureşti, 1995, pag. 385
22
P. Newbold, W.L. Carlson, Betty Thorne, Statistics for Business and Economics, Fifth Edition,
Pearson Prentice Hall, 2003, pag. 668 – 671
50
A doua schemă este cea multiplicativă, cu două variante:
1. Atunci când componenta sezonieră este proporţională cu componenta
extrasezonieră, schema de compunere se prezintă în felul următor:
yt = Dt + Dt St + t = Dt (1 + St) + t
yt = Dt (1 + St)(1 + t)
51
serii de timp bazate pe indicatori absoluţi, care reprezintă forma
fundamentală de exprimare a unei serii de timp şi pe baza căreia se pot obţine
indicatori generalizatori aferenţi întregii perioade studiate;
serii de timp bazate pe indicatori relativi, care arată variaţii de la o
perioadă la alta, exprimate, de obicei, sub formă procentuală. În cazul acestei
modalităţi de exprimare este foarte importantă alegerea şi specificarea clară a
perioadei luate ca bază de referinţă;
serii de timp bazate pe indicatori medii, care sunt exprimate sub forma
unor indicatori calculaţi ca medii, folosite îndeosebi atunci când se analizează
fenomene care se produc în anumite perioade de timp (media anuală sau lunară
a producţiei, numărul mediu anual de lucrători etc.) sau în anumite unităţi de
spaţiu (recolta medie la hectar, producţia medie a unui utilaj etc.).
Scopul principal al analizei econometrice a unei serii de date este acela de
a studia evoluţia fenomenelor şi proceselor economice pe o perioadă de timp
trecută, istorică, în vederea extrapolării rezultatelor pentru fundamentarea unor
previziuni pentru perioadele viitoare. Această analiză econometrică se
realizează diferenţiat în funcţie de tipul seriei (de intervale sau de momente), de
lungimea seriei de date, de periodicitatea şi variaţiile acesteia şi de alte elemente
specifice variabilei studiate.
Ajustarea unei serii de timp constă în determinarea trendului sau a
tendinţei centrale prin diverse metode, care au la bază principiul înlocuirii
termenilor seriei studiate cu termenii unei serii teoretice, obţinuţi prin calcule.
Termenii teoretici pot fi determinaţi prin aplicarea a diverse procedee de
cuantificare a legităţii specifice de dezvoltare pe termen lung datorată unor
factori esenţiali şi de eliminare a fluctuaţiilor periodice sau aleatoare.
Varianţa totală a termenilor seriei, care semnifică variaţia medie produsă
de influenţa tuturor factorilor, atât esenţiali, cât şi întâmplători, este compusă
din variaţia datorată factorului timp, cuantificată cu ajutorul varianţei valorilor
ajustate faţă de medie şi din variaţia reziduală, cuantificată prin varianţa
termenilor reali faţă de valorile ajustate.
Valorile teoretice (ajustate) în funcţie de timp se pot determina folosind
numeroase metode, unele mai simple, altele mai complexe. O condiţie esenţială,
comună tuturor acestor metode, este aceea că numărul termenilor seriei trebuie
să fie suficient de mare pentru a se putea aplica legea numerelor mari şi, astfel,
să se asigure caracterul de tendinţă al analizei.
În econometrie, cele mai des utilizate metode de ajustare a seriilor de
timp sunt cele de tip analitic, bazate pe funcţii matematice care descriu evoluţia
fenomenului cercetat. Ele pornesc, însă, de la încercarea de a determina forma şi
sensul legăturii cu ajutorul unor metode elementare de tipul metodei grafice, a
metodei sporului mediu sau a ritmului mediu. O metodă mai elaborată, care
52
ajută semnificativ abordările analitice ulterioare aplicării ei, este ajustarea pe
baza mediilor mobile.
Metoda grafică este una dintre cele mai simple modalităţi de determinare
a trendului unei serii de timp. Ea reprezintă o metodă preliminară altor metode
de ajustare, servind la alegerea modelului de evoluţie care descrie cel mai bine
evoluţia fenomenului sau procesului economic studiat.
Aplicarea acestei metode constă în reprezentarea grafică a seriei de date
empirice avute la dispoziţie şi în trasarea vizuală a segmentului de dreaptă sau
curbă care uneşte punctele extreme ale seriei, astfel încât să existe abateri
minime faţă de poziţia valorilor reale. Ajustarea vizuală porneşte de la premisa
că acţiunea factorilor de influenţă a fost relativ constantă pe toată perioada
studiată, imprimând, astfel, termenilor seriei o regulă de variaţie comună, care
poate fi descrisă de segmentul de dreaptă sau curbă trasat.
Reprezentarea grafică poartă numele de cronogramă şi este prezentată în
figura 4:
yn
yi
y1
0 t1 ti tn
Figura 4. Cronograma
53
yt = y1 + (t – 1)
yt y1 I t 1
54
Dacă numărul de termeni luaţi în calcul la determinarea mediilor mobile
este par, valorile obţinute vor fi poziţionate între două valori reale. În aceste
condiţii, avem de-a face cu medii mobile provizorii, care se centrează prin
calcularea mediei aritmetice simple a două medii provizorii consecutive şi se
obţin mediile mobile centrate, ce vor înlocui termenii iniţiali. 24
Transpuse grafic, valorile medii mobile corespund liniei tendinţei
centrale, iar abaterile de la tendinţa centrală redau fluctuaţiile ciclice sau
sezoniere.
Un inconvenient al acestei metode este acela că, indiferent că se ia un
număr par sau impar de termeni, se pierd informaţiile referitoare la primii şi la
ultimii termeni ai seriei.
Toate aceste metode elementare de ajustare a seriilor de timp sunt etape
preliminare analizei econometrice propriu-zise, care presupune utilizarea
funcţiilor matematice şi statistice de ajustare a trendului.
Cele mai cunoscute modele analitice de ajustare sunt: funcţiile de timp
liniare şi neliniare, modelele cu time – lag şi modelele autoregresive.
yt = f(t) + t
24
C. Şipoş, C. Preda, Econometrie, Editura Mirton, Timişoara, 2006
55
reprezentarea grafică sugerează o linie dreaptă sau se poate utiliza o funcţie de
timp neliniară, dacă reprezentarea grafică sugerează o curbă.
După cum se poate observa, tendinţa de variaţie se aproximează, de cele
mai multe ori, cu ajutorul funcţiilor ale căror curbe şi ecuaţii de estimare au fost
prezentate în capitolul de modele unifactoriale, variabila x din modelele
respective devenind acum factorul timp t. Parametrii acestor funcţii de timp,
similar cu cei ai modelelor de regresie, se estimează în cele mai multe cazuri cu
metoda celor mai mici pătrate.
yt = + t + t
56
variabilei rezultative yt şi valorile estimate cu ajutorul parametrilor calculaţi
ŷt ˆ ˆ t să fie cât mai mică ( yt ŷt min im ).
Dacă se ia în studiu un set de date istorice referitoare la variabila
rezultativă, se va observa că reprezentarea grafică a funcţiei liniare de timp
aproximează mai mult sau mai puţin exact evoluţia în timp a variabilei studiate.
Este puţin probabil ca variabila rezultativă să evolueze în timp strict liniar. În
aceste condiţii, este uşor de înţeles că o cuantificare deterministă, exactă a
valorilor parametrilor şi este imposibil de realizat, deoarece nu se pot
cuprinde în model absolut toate influenţele existente. Acest lucru a determinat
introducerea în model a variabilei aleatoare, perturbatoare t, care însumează
efectul tuturor factorilor rămaşi în afara modelului, fie ei nesemnificativi sau
necuantificabili.
Cu cât volumul seriei de date este mai mare, cu atât estimările sunt
mai apropiate de realitate.
În aceste condiţii, fiecărui moment dat t îi corespunde o distribuţie
normală de valori yt ale variabilei rezultative, de medie + t şi varianţă
constantă.
Valorile estimatorilor parametrilor, notate cu ̂ şi ̂ , pot fi
determinate cu ajutorul mai multor metode matematice şi statistice, dintre care
mai des utilizată, ca şi în cazul modelului unifactorial liniar, este metoda celor
mai mici pătrate.
În principiu, aplicarea metodei presupune respectarea aceloraşi
restricţii:
datele privind variabila rezultativă sunt obţinute fără erori de
observare sau măsurare;
variabila aleatoare t este de distribuţie normală, de medie nulă (E(t)
= 0) şi de varianţă constantă şi diferită de zero în timp;
variabila aleatoare t urmează o distribuţie independentă faţă de timp;
valorile variabilei aleatoare nu sunt autocorelate.
În urma aplicării metodei se ajunge la un sistem de două ecuaţii cu
necunoscutele ̂ şi ̂ , de forma:
n ˆ ˆ n t n y
t
t 1 t 1
n n n
ˆ t ˆ t 2 t yt
t 1 t 1 t 1
57
Prin rezolvarea acestui sistem de ecuaţii se obţin valorile estimatorilor
̂ şi ̂ . Aşa cum s-a mai arătat, estimatorii determinaţi cu această metodă
corespund obiectivului urmărit dacă valoarea medie a estimatorului este egală
cu valoarea reală a parametrului corespunzător, iar varianţa fiecărui estimator
este relativ mică în raport cu numărul de date pe baza cărora s-a efectuat
analiza.
Analiza corelaţiei în cazul funcţiei liniare de timp are un caracter aparte,
deoarece toate variabilele economice sunt influenţate de timp, mai mul sau mai
puţin. Dacă în cazul modelelor unifactoriale sau multifactoriale se poate
înregistra corelaţie nulă, în cadrul funcţiilor de timp acest lucru este practic
imposibil, deoarece nici o variabilă economică nu este constantă în timp, decât,
eventual, pe perioade foarte scurte.
Se pot calcula şi aici valorile coeficientului de corelaţie liniară (pentru a
verifica existenţa evoluţiei liniare în timp), a raportului de corelaţie şi a
coeficientului de determinaţie, care, în principiu, au aceeaşi interpretare: dacă
valorile lor sunt apropiate de 1, variabila studiată are o evoluţie stabilă în timp şi
se poate determina un trend liniar, iar dacă valorile acestor coeficienţi sunt
apropiate de 0, evoluţia este haotică, instabilă şi nu poate fi ajustată cu un trend
liniar.
Şi în cazul funcţiilor de timp este necesară parcurgerea etapelor de
verificarea statistică a modelului. În general, acestea sunt similare cu cele
parcurse în cazul modelului unifactorial.
58
În principiu, o funcţie de timp neliniară este acea funcţie a cărei pantă,
dată de parametrul , nu este constantă pentru orice valoare a lui t. Estimarea
parametrilor unei astfel de funcţii se realizează fie direct prin metoda celor mai
mici pătrate, fie prin diverse transformări care duc la liniarizarea funcţiei, fie
prin utilizarea unor metode numerice de estimare.
În econometrie, cele mai cunoscute şi mai des întâlnite funcţii de timp
neliniare sunt: funcţia hiperbolică, funcţia parabolică şi funcţia exponenţială.
Funcţia de timp hiperbolică se utilizează atunci când “norul de
puncte” urmează o traiectorie de tip hiperbolă. Funcţia hiperbolică are la bază
următoarea ecuaţie:
1
yt t
t
yt t ' t
n ˆ ˆ n t' n y
t
t 1 t 1
n
t 1
n 2 n
ˆ t ˆ t' t' y
'
t 1 t 1
t
59
De asemenea, verificarea statistică a funcţiei este aceeaşi cu
verificarea modelului unifactorial liniar.
În funcţie de reprezentarea grafică a legăturii, pot fi utilizate variante
ale funcţiei hiperbolice, care au la bază diverse ecuaţii: yt e t ;
yt 1
1 ; yt etc.
t
t
Funcţia de timp parabolică, sau pătratică, este folosită, de regulă,
atunci când ritmul de evoluţie al variabilei studiate urmează o curbă de tip U, cu
vârfurile în jos sau în sus. Pentru exprimarea funcţiei de timp parabolică se
utilizează funcţia de gradul doi, după relaţia:
yt = + 1 t +2 t2 + t
n ˆ ˆ n t ˆ n t 2 n y
1 2 t
t 1 t 1 t 1
n
n n n
t 1 t 2 t t yt
ˆ 2 ˆ 3
ˆ
t 1 t 1 t 1 t 1
t1 1
t 1
2
t 1
ˆ n t 2 ˆ n t 3 ˆ n t 4 n t 2 y
t
t 1
60
Funcţia parabolică are, la rândul său, foarte multe variante de
exprimare, cum ar fi: lg yt 1 t 2 t 2 ; yt t 2 ;
yt e t t 2
; yt 1 lg t 2 lg t etc.
1 2
2
yt t
Pe ecuaţia dată de relaţia 6.18 se aplică metoda celor mai mici pătrate şi
se obţine sistemul de ecuaţii:
61
Funcţia de timp exponenţială are, şi ea, numeroase variante de
exprimare, după cum urmează: yt e t ; yt e t etc.
În afara acestor tipuri de funcţii de timp neliniare, pot fi luate în
considerare multe altele, în funcţie de modul de dispunere a punctelor din
reprezentarea grafică.
t
y t k xt k t
k 0
62
Dacă numărul de perioade k pe care se manifestă în urmă influenţele este
suficient de mic25, atunci estimarea parametrilor modelului se poate face cu
metoda celor mai mici pătrate. În această situaţie, ipotezele de pornire ale
modelului sunt date de restricţiile metodei celor mai mici pătrate, în care
variabila aleatoare este de repartiţie normală, de medie nulă şi homoscedastică,
iar variabila factorială şi cea aleatoare nu sunt autocorelate (nivelurile anterioare
nu au nici o influenţă asupra nivelului prezent). Valorile estimate ale
parametrilor se obţin şi se interpretează similar cu modelele multifactoriale.
Probleme apar în momentul în care influenţele sunt decalate cu multe
perioade în urmă, iar informaţiile deţinute despre ceea ce s-a întâmplat în trecut
sunt insuficiente. În aceste condiţii, aplicarea directă a metodei celor mai mici
pătrate poate genera estimatori deplasaţi şi neconsistenţi, datorită posibilităţii
apariţiei fenomenului de multicoliniaritate.
Deficienţele aplicării metodei celor mai mici pătrate pot fi eliminate prin
specificarea unor restricţii referitoare la distribuţia decalajelor. Există mai multe
variante de atingere a acestui deziderat.
O primă modalitate este cea care porneşte de la presupunerea că
parametrii modelului aferenţi variabilelor decalate sunt pozitivi subunitari (0
1) şi descresc în progresie geometrică. Modelul, numit al decalajului în
progresie geometrică, este de forma:
yt xt xt 1 2 xt 2 ... k xt k t
t
yt k xt k t
k 0
63
t t
k k k
k
/ 1
2
d k 0
k 0
t
k
t
k 1 / 1 1
k 0 k 0
yt 1 xt 1 xt 2 ... k xt k 1 t 1
yt – yt-1 = (1 – ) + xt + ut
unde ut = t – t-1.
yt = (1 – ) + yt-1 + xt + ut
yt = + xt* + t
64
permanente ajustări între valoarea curentă reală a lui x şi valoarea anterioară
aşteptată a lui x, astfel:
unde 0 1.
Ecuaţia poate fi rescrisă sub forma:
t
x*t 1 xt k
k
k 0
t
1 xt k
k
yt = + + t
k 0
65
4.4.1. Caracterul autoregresiv al variabilelor economice
De obicei, în practica economică, variabilele economice, pe lângă
influenţele importante pe care le suferă din partea unor variabile factoriale, au şi
un caracter autoregresiv, de memorare a comportamentului anterior.
Din punct de vedere econometric, termenul de autoregresiv defineşte
măsura în care o variabilă economică prezintă caracteristica de a se autocorela,
în sensul că nivelul curent al acesteia este determinat într-o măsură
semnificativă de nivelurile sale anterioare, decalate cu una sau mai multe
perioade în urmă.26
În această situaţie, efectul asupra variabilei rezultative nu este cauzat de
influenţa directă a unor variabile factoriale, ci este unul retroactiv, indus de
încărcătura informaţională a variabilei studiate.
În principal, efectul autoregresiv se concretizează în modul mai mult sau
mai puţin pregnant în care nivelul actual al cursului este influenţat de nivelurile
sale anterioare, decalajul în timp a influenţelor putând avea diferite valori. În
general, cu cât acest decalaj este mai mare, adică deplasarea în urmă faţă de
momentul prezent este mai accentuată, cu atât influenţele sunt mai slabe,
problema care apare fiind cea a determinării momentului când acestea devin
nesemnificative, pentru a fi eliminate din model, similar cu cele prezentate la
modelele cu time – lag.
Această caracteristică ţine de capacitatea mediului înconjurător de a
reţine comportamentele anterioare ale variabilei studiate şi de a acţiona în
funcţie de acestea în formarea anticipaţiilor pentru perioadele următoare.
Mecanismul de formare al anticipaţiilor în condiţii de informare
incompletă, are, de regulă, o natură mixtă, anticipaţiile fiind atât adaptive, în
sens friedmanian, cât şi raţionale, adică bazate pe cunoaşterea, fie şi parţială, a
situaţiei actuale. În lipsa unor informaţii actuale complete, agenţii economici
acţionează ţinând cont şi de informaţiile din perioadele precedente, fiind, de
asemenea, capabili să înveţe din erorile de anticipaţie comise în aceste perioade.
Volatilitatea crescută şi, uneori, imprevizibilă a anticipaţiilor din
economie fac din acestea o categorie specifică, pseudo–adaptivă, ceea ce
înseamnă că principiul de formare poate fi de tip bulgăre de zăpadă, viteza de
propagare fiind foarte mare, iar sensul de evoluţie contrar teoriei.
O problemă importantă este aceea că între diversele categorii de agenţi
economici există o importantă asimetrie informaţională, ceea ce echivalează cu
forme diferite ale funcţiilor ce descriu formal mecanismele lor anticipaţionale.
Această asimetrie poate fi însă atenuată prin realizarea estimaţiilor pe perioade
26
C. Şipoş, Modelarea comportamentului cursului de schimb al leului, Editura Universităţii de
Vest, Timişoara, 2003, pag. 133 – 135
66
de timp distincte. Totuşi, se pot distinge cel puţin două mari categorii de
operatori.
Comportamentul operatorilor din prima categorie se consideră că are
impact cu precădere pe termen mediu şi lung, iar efectul anticipaţiilor este
indirect pus în evidenţă, prin intermediul variabilelor factoriale luate în
considerare. Această categorie de anticipaţii este înglobată de informaţia dată de
variabilele factoriale incluse într-un model multifactorial şi nu necesită un
studiu aparte a fenomenului anticipaţiilor.
Subiecţii economici din a doua categorie, interesaţi în formularea unor
anticipaţii cu grad sporit de acurateţe – mai precis, interesaţi de aspectul
cantitativ al modificărilor survenite în variabila studiată – urmăresc de o
manieră sistematică această evoluţie, orientându-se în estimarea nivelului
anticipat al variabilei în funcţie de nivelul său din perioadele precedente.
Desigur, această formulare reprezintă o particularizare a celor enunţate anterior,
subiecţii economici tinzând să-şi formuleze anticipaţiile prin extrapolarea
cvasi–mecanică a situaţiei curente, introducând, eventual, o anumită corecţie în
raport de evoluţiile precedente.
Această afirmaţie echivalează cu adoptarea ipotezei existenţei unei relaţii
de dependenţă liniară între nivelul estimat al variabilei studiate şi nivelurile sale
anterioare. O astfel de relaţie poate fi studiată cu ajutorul modelelor
autoregresive de diverse ordine.
yt = + 1 yt–1 + t
67
la o singură perioadă din urmă. El se bazează pe o capacitate de memorare şi
asimilare a informaţiilor pe termen foarte scurt, fără a ţine seama de ceea ce s-a
întâmplat cu mai multe perioade în urmă.
În funcţie de condiţiile existente în economie, anticipaţiile operatorilor
pot să se bazeze nu numai pe nivelul imediat anterior al variabilei, evidenţiat de
modelul de ordinul întâi, ci şi pe comportamentul mai vechi al acesteia, decalat
cu două sau mai multe perioade în urmă. În modul acesta, se pot construi
modele autoregresive de ordine superioare.
Astfel, următorul model este modelul autoregresiv de ordinul doi
AR(2), care are la bază următoarea ecuaţie:
68
Cu cât influenţa nivelurilor anterioare asupra nivelului curent al variabilei
studiate este mai mare, cu atât sunt mai importante anticipaţiile operatorilor în
determinarea comportamentului variabilei respective. Dacă modelul
autoregresiv arată o legătură puternică între nivelurile anterioare şi nivelul
curent, înseamnă că o proporţie semnificativă a evoluţiei variabilei studiate se
bazează pe anticipaţii şi mai puţin pe influenţele obiective pe care aceasta le
suferă din partea celorlalte variabile factoriale.
Un modelul autoregresiv semnificativ evidenţiază importanţa sporită a
factorilor subiectivi în determinarea evoluţiei variabilelor economice în
detrimentul factorilor obiectivi.
Parametrii unui model autoregresiv de ordin k se estimează direct cu
metoda celor mai mici pătrate, dacă valoarea lui k este suficient de mică încât să
existe informaţii despre perioadele anterioare analizate.
Dacă valoarea lui k este mai mare, se utilizează metodele de estimare
prezentate la modelele cu time – lag, unde în locul valorilor variabilei factoriale
cu influenţă decalată în timp xt-1, xt-2, …, xt-k se introduc valorile anterioare ale
variabilei rezultative yt-1, yt-2, …, yt-k .
Estimarea corectă a parametrilor unui model autoregresiv se poate realiza
numai dacă acesta îndeplineşte condiţia de staţionaritate. Această condiţie
înseamnă că media variabilei rezultative este considerată constantă, iar varianţa
este nulă de-a lungul timpului, conform relaţiei:
m
1 1 2 ... k
69
1 + 2 + … + k 1
1. Andrei T., Stancu S., Statistica. Teorie şi aplicaţii, Editura ALL, Bucureşti,
1995
70
2. Baron T., Anghelache C., Ţiţan E., Statistică, Editura Economică, Bucureşti,
1996
4. Chilărescu C., Ciorîcă O., Preda C., Şipoş C., Surulescu N., Bazele
statisticii, Editura Universităţii de Vest, Timişoara, 2002
6. Levine D.M., Stephan D., Krehbiel T.C., Berenson M.L., Statistics for
Managers using Microsoft Excel, Third Edition, Prentice Hall,
2002
7. Newbold P., Carlson W.L., Thorne B., Statistics for Business and
Economics, Fifth Edition, Pearson Prentice Hall, 2003
12. Şipoş C., Preda C., Statistică Economică, Editura Mirton, Timişoara, 2004
13. Şipoş C., Preda C., Econometrie, Editura Mirton, Timişoara, 2006
71