Sunteți pe pagina 1din 60

CAPITOLUL 23

ECONOMETRIE

§ 23.1 Apariţia, dezvoltarea, conţinutul şi obiectivele Econometriei


Econometria este una dintre disciplinele de vârf ale ştiinţei economice, cu na-
tură cantitativă, teoretico-aplicativă, care se ocupă cu modelarea economico-mate-
matică a relaţiilor spaţiale şi temporale de cauzalitate dintre fenomenele şi proce-
sele economice, în scopul descrierii formalizate şi cuantificării acestor relaţii,
testării unor ipoteze specifice gândirii economice, analizei cantitative, predicţiei şi
simulării comportamentului fenomenelor economice.
Apărută la începutul deceniului patru al secolului XX, econometria a cunos-
cut, mai ales în ultimele 3-4 decenii, o dezvoltare cu adevărat spectaculoasă.
Această dezvoltare a fost determinată, în principal, de necesitatea găsirii unor răs-
punsuri cât mai adcvate la problemele decizionale din ce în ce mai complexe pe
care le ridică evoluţiile sistemelor economice contemporane, precum şi de dezvol-
tarea fără precedent a sistemelor hardware şi software, dezvoltare care a creat posi-
bilitatea soluţionării eficiente şi riguroase a numeroase probleme numerice care
apar în contextul analizei econometrice.
Etimologic, termenul “econometrie”1 îşi are originea în limba greacă, prove-
nind din combinarea cuvintelor “oiconomia” şi “metron”, care înseamnă economie,
respectiv măsură. Termenul “econometrie” a fost utilizat pentru prima oară într-o
lucrare, relativ obscură, a austriacului Pawel CIOMPA, publicată în Germania, în
anul 1910. Accepţiunea dată în 1910 de Pawel Ciompa termenului “econometrie”
este o accepţiune restrânsă, asimilată de acesta cu statistica economică.
Literatura de specialitate a domeniului acreditează ideea că termenul de “eco-
nometrie” a apărut şi a fost utilizat în accepţiunea sa largă şi consistentă, similară
cu sensul în care termenul este utilizat şi astăzi, la începutul anilor ‘30 ai secolului
trecut, odată cu apariţia primelor preocupări legate, în mod exclusiv, de măsurarea
legăturilor în domeniul economic.
Punerea în valoare şi în circulaţie a termenului de “econometrie” datează din
jurul anului 1926 şi este atribuită economistului norvegian Ragnar FRISCH
(1895-1973), laureat al premiului Nobel pentru economie, în anul 1969, precum şi
statisticianului american Irving FISHER (1867-1947).

1
În limba engleză “Econometrics”, iar în limba franceză “Économétrie”.
Într-o încercare de definire a econometriei, Ragnar FRISCH a arătat că econo-
metria nu trebuie asimilată, în mod separat, nici cu statistica economică, nici cu
teoria economică generală şi nici cu utilizarea metodelor statistico-matematice în
domeniul economic. În acest context, Ragnar FRISCH defineşte econometria ca
reprezentând o unificare, o îmbinare, a celor trei domenii, această unificare fiind
tocmai elementul care conferă econometriei forţă ştiinţifică şi eficienţă aplicativă
deosebite.
Un impuls deosebit pentru dezvoltarea econometriei, încă din momentul
apariţiei acesteia, a fost reprezentat de înfiinţarea Societăţii de Econometrie (Eco-
nometric Society), la Cleveland, în Ohio, în anul 1930, la iniţiativa statisticianului
Irving FISHER, care a fost primul său preşedinte, şi a economistului Ragnar
FRISCH. Primele două reuniuni ştiinţifice ale acestui for econometric au avut loc
în septembrie 1931, la Universitatea din Lausanne, respectiv în decembrie 1931, la
Washington D.C.. Impulsul dat dezvoltării econometriei prin înfiinţarea Societăţii
de Econometrie a fost amplificat prin apariţia în 1933, a celei mai prestigioase
reviste din domeniu, revista Econometrica, care a ajuns în prezent la peste 75 de
ani de apariţie neîntreruptă. Colegiul de conducere al revistei Econometrica este
localizat în prezent la Universitatea Princeton şi include cele mai prestigioase nume
ştiinţifice şi universitare din domeniu, cum ar fi Stephen MORRIS (Princeton
University), Larry SAMUELSON (Yale University), Whitney NEWEY (MIT),
Daron ACEMOGLU (MIT), Steven BERRY (Yale University), David LEVINE
(Washington University, St. Louis), Harald UHLIG (University of Chicago).
În prezent, există în lume sute şi sute de reviste cu profil econometric, iar
numărul de articole, studii şi cărţi pe acest profil este de ordinul zecilor sau chiar
sutelor de mii2 . De asemenea, econometria este predată, ca disciplină economică
fundamentală şi cu pondere foarte mare în procesul de pregătire universitară, la
toate universităţile economice de prestigiu din lume.
Tot ca semn al importanţei, valorii ştiinţifice şi utilităţii econometriei în
contextul ştiinţei economice contemporane, poate fi menţionat şi numărul mare de
premii Nobel acordate pentru contribuţii ştiinţifice în domeniul econometriei.
Pentru exemplificare, menţionăm premiile Nobel pentru economie, acordate unor
personalităţi marcante din domeniul econometriei, cum ar fi: Jan TINBERGEN şi
Ragnar FRISCH - în anul 1969, pentru dezvoltarea şi aplicarea modelelor
econometrice dinamice la analiza proceselor economice; Lawrence KLEIN - în
anul 1980, pentru modelarea econometrică cu ajutorul calculatorului în domeniul
proceselor macroeconomice; Trygve HAAVELMO - în anul 1989, pentru nume-
roasele lucrări publicate în domeniul econometriei şi pentru rezultatele obţinute în
domeniul fundamentării probabilistice a econometriei; Daniel McFADDEN şi
James HECKMAN - în anul 2000, pentru cercetările şi contribuţiile din domeniul
microeconometriei; Robert ENGLE and Clive GRANGER - în anul 2003, pentru
realizările spectaculoase din domeniul analizei seriilor de timp, reprezentate de

2
De exemp lu, o simplă căutare pe Internet, doar după cuvintele cheie engleze
“Econometrics” şi “Econometric Analysis”, listează peste 5 milioane de lucrări.
modelele de tip ARCH şi metodele de identificare a fenomenului de cointegrare a
seriilor de timp. În plus faţă de aceste premii Nobel acordate pe problematica
econometriei, alte premii Nobel pentru economie au fost acordate pentru preo-
cupări legate, mai mult sau mai puţin direct, tot de domeniul econometriei.
Dezvoltarea explozivă a econometriei şi modelării econometrice, ca instru-
mente de cunoaştere ştiinţifică, de simplificare a complexităţii şi de sintetizare a
cauzalităţii din diverse domenii de activitate, a fost stimulată şi de dezvoltarea
mijloacelor electronice de calcul. Apariţia calculatoarelor bazate pe micropro-
cesoare şi larga accesibilitate a acestora din punct de vedere al preţului şi software-
ului aplicativ au făcut ca, în prezent, să nu existe domeniu de cercetare în care
calculatorul electronic să nu fie instrumentul cel mai frecvent folosit pentru
rezolvarea celor mai diverse probleme. Calculatorul electronic a devenit instru-
mentul predilect şi de neînlocuit în procesul de analiză econometrică, în activitatea
de predicţie şi, în general, în orice activitate ştiinţifică bazată pe modelarea mate-
matică. Prelucrarea unui volum uriaş de informaţii, pe baza unor algoritmi de o
complexitate deosebită şi în condiţii de precizie ridicată, nu se poate realiza decât
cu ajutorul calculatorului electronic.
O utilizare, relativ recentă şi în acelaşi timp spectaculoasă, a calculatorului
electronic este cea legată de analiza, prelucrarea şi sintetizarea grafică a infor-
maţiei, ca activităţi importante ale demersului econometric. Posibilităţile extraor-
dinare pe care le oferă tehnica de calcul actuală în acest domeniu reprezintă un
motiv care face ca utilizarea calculatorului electronic să devină indispensabilă în
orice problemă de analiză econometrică.
În prezent, există zeci şi zeci de produse software dedicate soluţionării proble-
melor din domeniul econometriei, produse apărute şi dezvoltate în ultimele 3-4
decenii, pe măsura dezvoltării tehnicii de calcul şi ca răspuns la dezvoltarea
extraordinară a abordărilor econometrice. O inventariere pe care am făcut-o recent,
şi care nu este nici pe departe exhaustivă, ci doar minimală, cu privire la instru-
mentele software existente în lume la acest moment și dedicate domeniului econo-
metric, a condus la identificarea a peste 100 de astfel de instrumente software.
Acest număr este cu atât mai semnificativ, cu cât aceste produse software sunt de
notorietate mondială, având o largă utilizare în practica econometrică. Prin comple-
xitatea lor, prin multitudinea de facilităţi pe care le oferă şi prin uşurinţa cu care pot
fi folosite, produsele software elaborate pentru domeniul econometriei pot fi
considerate ca fiind adevărate medii informatice pentru desfăşurarea activităţilor de
cercetare ştiinţifică din acest domeniu.
Printre cele mai noi şi mai performante instrumente software existente în
prezent, destinate, total sau parţial, activităţilor legate de conţinutul econometriei,
putem menţiona: • EVIEWS 6.0, Quantitative Micro Software, Irvine, CA, USA,
2008; • SPSS 17.0, SPSS Inc., Chicago, IL, USA, 2009; • STATISTICA 8.0, Stat-
Soft Inc., Tulsa, OK, USA, 2008; • S-PLUS 8.0, MathSoft Inc., Seattle, Washing-
ton, USA, 2008;• SAS 9.2, SAS Institute Inc., Cary, NC, USA, 2008; • SYSTAT
12.02, SPSS Inc., Chicago, IL, USA, 2007; • RATS 7.2, Estima Evanston, IL,
USA, 2009; • R - Project 2.9, 2009; • JMP 8.0, SAS Institute Inc., Cary, NC, USA,
2008; • SPAD 7.0, CISIA, Saint Mande, France, 2007; • STATA MP 10.1, Stata
Corp., Texas, USA, 2009; • GAUSS 9.0, Aptech System Inc., 2008; • MATHEMA-
TICA 7.0, Wolfram Research, Champaign, IL, USA, 2009.
Pe lângă instrumentele software menţionate anterior, mai există o mare varie-
tate de produse informatice nespecializate pe domeniul econometric, care includ
însă proceduri software dedicate exclusiv soluţionării unor probleme din domeniul
econometriei, cum ar fi EXCEL, MATLAB, MATCAD etc.
În contextul dezvoltării deosebite a instrumentelor software dedicate analizei
econometrice, econometria poate fi privită ca reprezentând o combinare eficientă a
statisticii economice, teoriei economice generale, teoriei probabilităţilor statisticii
matematice şi informaticii.
În România, primele preocupări mai relevante în domeniul econometriei au
apărut după anul 1965, odată cu înfiinţarea Facultăţii de Calcul Economic şi
Cibernetică Economică 3 , în cadrul Academiei de Studii Economice din Bucu-
reşti, cu înfiinţarea Laboratoarelor de Cercetare ale Catedrei de Cibernetică
Economică şi cu apariţia revistelor ştiinţifice “Studii şi Cercetări de Calcul Eco-
nomic şi Cibernetică Economică” şi “Economic Computation and Economic
Cybernetics Studies and Research”. Profilul facultăţii, al laboratoarelor de cer-
cetare şi al celor două reviste ştiinţifice, natura cantitativă a majorităţii disciplinelor
predate în facultate, preocupările ştiinţifice ale cadrelor universitare, precum şi
proiectele de cercetare şi lucrările publicate de acestea, au reprezentat elemente
stimulatorii pentru dezvoltarea econometriei în România şi pentru extinderea apli-
caţiilor acesteia în economia românească, încă din perioada anilor 1965-1970. În
acest context, merită a fi menţionate contribuţiile şi rezultatele remarcabile obţi-
nute în acest domeniu de profesorii universitari: Ludovic TÖVISSI, Corneliu
CUŞA, Eugen PECICAN, Gheorghe RUXANDA, Vergil VOINEAGU, Cons-
tantin MITRUŢ, Tudorel ANDREI etc.
Un element important al contribuţiei Facultăţii de Calcul Economic şi Ciber-
netică Economică, la promovarea şi dezvoltarea econometriei în ţara noastră, este
reprezentat de instrumentul software EMI - Limbaj pentru Analiză şi Predicţie,
instrument dezvoltat de prof. dr. Gheorghe RUXANDA şi utilizat de generaţii
întregi de studenţi din Academia de Studii Economice din Bucureşti.
Deşi iniţial obiectul econometriei a fost legat în mod exclusiv de domeniul
economic, ulterior, utilizarea metodelor şi tehnicilor econometrice a fost extinsă şi
în afara domeniului economic, ele fiind folosite în prezent şi în alte domenii, cum
ar fi: sociologia, psihologia, medicina, biologia, ştiinţa politică etc.
În general, se poate spune că econometria este o ramură a ştiinţei economice,
care se ocupă cu estimarea empirică şi testarea relaţiilor sau legăturilor care se
manifestă între fenomene şi procese din realitatea economică.
Econometria este disciplina care se ocupă cu identificarea, estimarea empirică
şi testarea unor relaţii economice, prin intermediul construirii unor modele mate-

3
În prezent, Facultatea de Cibernetică, Statistică şi Informatică Economică
matice specifice, numite modele econometrice, în scopul analizei, simulării şi
predicţiei comportamentului fenomenelor economice reale.
Econometria are ca principal obiectiv aplicarea unor metode şi tehnici ale teo-
riei probabilităţilor şi statisticii matematice la date economice obţinute prin obser-
vare statistică, în scopul:
• identificării, măsurării şi formalizării unor legături dintre diferite fenomene
sau procese din realitatea economică, sub forma modelelor econometrice;
• estimării parametrilor modelelor econometrice care descriu legături cauzale
semnificative pentru domeniul economic;
• cuantificării influenţelor exercitate de anumite fenomene şi verificării sem-
nificaţiei acestor influenţe;
• verificării unor ipoteze sau idei teoretice formulate cu privire la natura şi
semnificaţia unor legături dintre fenomene şi procese economice;
• utilizării modelelor econometrice pentru efectuarea de analize, evaluări,
simulări şi predicţii.
Econometria utilizează o serie de elemente fundamentale, reprezentate de
teorii economice, fapte exprimate prin intermediul unor date relevante şi metode
statistice, numite tehnici econometrice, în scopul construirii unor modele care să
descrie o serie de relaţii de interes existente în realitatea economică. Econometria
utilizează datele existente pentru a estima legături manifestate în lumea reală şi
pentru a verifica anumite ipoteze cu privire la aceste legături.
Obiectul de studiu al econometriei include, ca elemente de importanţă mai
semnificativă, analiza corelaţiei, analiza regresiei, analiza varianţei şi analiza
seriilor de timp. Produsul final şi semnificativ al demersului econometric este
reprezentat de modelul econometric estimat şi validat, model care poate fi utilizat
pentru analiză, simulare sau predicţie.
Având în vedere natura, conţinutul şi derularea oricărui demers econometric,
etapele cele mai relevante ale acestui demers pot fi sintetizate sub forma următoare:
a. formularea unui principiu, unei teorii sau a unei ipoteze, referitoare fie la
natura comportamentului unuia sau mai multor fenomene economice, fie la
existenţa uneia sau mai multor legături de cauzalitate din realitatea economică;
b. culegerea datelor necesare, verificarea calităţii acestora şi construirea bazei
informaţionale ce va fi utilizată pentru identificarea, estimarea şi validarea
modelului econometric;
c. efectuarea unor analize preliminare, cu natură exploratorie, în scopul suma-
rizării datelor, identificării principalelor caracteristici şi tendinţe evidenţiate de
date, detectării eventualelor erori prezente în date şi inventarierii factorilor
semnificativi care trebuie reţinuţi în analiza econometrică;
d. specificarea unui model econometric adecvat, compatibil cu postulatele
teoriei economice şi cu datele disponibile, şi formularea ipotezelor statistice
care stau la baza specificării modelului econometric;
e. alegerea metodei de estimare, a instrumentului software adecvat şi utilizarea
acestora şi a bazei informaţionale existente, pentru estimarea parametrilor
modelului econometric;
f. testarea modului în care sunt îndeplinite ipotezele statistice care stau la baza
specificării modelului econometric şi aplicarea procedurilor de corecţie adec-
vate, în condiţiile în care anumite ipoteze nu sunt verificate;
g. validarea modelului econometric, pe baza unor indicatori, criterii, proceduri
şi teste referitoare la calitatea acestuia;
h. respecificarea modelului econometric, în situaţia în care acesta nu înde-
plineşte cerinţele necesare pentru validare sau se dovedeşte a nu fi în concor-
danţă cu teoria economică și cu realitatea economică evidenţiată de datele
disponibile;
i. utilizarea modelului econometric, estimat şi validat, pentru analize şi eva-
luări cantitative, pentru simulare şi pentru predicţie;
j. formularea unor concluzii şi propuneri pentru fundamentarea unor decizii şi
măsuri de politică economică.
Având în vedere etapele şi modul în care are loc derularea unui demers econo-
metric general, se poate spune că acesta are o natură extrem de laborioasă, cu o
pronunţată tentă de iterativitate, implică o multitudine de activităţi şi presupune
utilizarea unei game variate de instrumente statistico-matematice.
Orice demers econometric complet, care conduce aproape totdeauna la obţi-
nerea unui model econometric estimat şi validat, se finalizează prin utilizarea mo-
delului econometric în trei scopuri principale: analiza, simularea şi predicţia. Cele
trei activităţi care reprezintă obiectivele finale ale demersului econometric, sunt
activităţi foarte importante pentru fundamentarea proceselor decizionale din dome-
niul economic.
Analiza efectuată pe baza modelelor econometrice este o analiză de tip structu-
ral, care are ca scop validarea unor puncte de vedere teoretice cu privire la com-
portamentul unor fenomene şi unor legături cauzale, testarea semnificaţiei pe care o
are influenţa anumitor factori cauzali şi cuantificarea acestei influenţe, măsurarea
senzitivităţii unor fenomene de tip efect, în raport cu o serie de fenomene de tip
cauză, astfel încât analiza pe baza modelului econometric poate conduce la o mai
bună înţelegere a manifestării fenomenelor economice reale şi a legăturilor dintre
acestea, îmbogăţind în acest fel cunoaşterea economică.
Într-o accepţiune restrânsă şi simplificată, activitatea de analiză econometrică
poate fi privită ca fiind activitatea care vizează: explicarea şi înţelegerea compor-
tamentului fenomenelor economice şi legăturilor dintre acestea, obţinerea unor noi
cunoştinţe economice şi adâncirea cunoaşterii realităţii economice, identificarea
unor noi legităţi, care guvernează comportamentul fenomenelor economice.
Predicţiile efectuate cu ajutorul modelelor econometrice, au scopul de a antici-
pa viitoarele manifestări ale unor fenomene economice sau ale unor legături dintre
aceste fenomene, asigurând în acest fel creşterea eficienţei deciziilor şi acţiunilor
umane din domeniul economic.
Activitatea de predicţie economică presupune utilizarea modelelor econome-
trice în scopul determinării celor mai probabile stări şi evoluţii pe care le vor înre-
gistra în viitor fenomenele şi procesele economice.
În afară de utilizarea sa în scopuri de analiză şi predicţie, modelul econometric
poate fi utilizat şi în scopul simulării comportamentului unor fenomene sau pro-
cese, sau în scopul evaluării impactului unor alternative decizionale, în vederea
alegerii celei mai bune decizii.
Prin intermediul simulării, se încearcă să se determine modul în care se
schimbă comportamentul fenomenelor, în condiţiile modificării împrejurărilor care
condiţionează manifestarea acestuia.
Simularea reprezintă totalitatea activităţilor ştiinţifice prin intermediul cărora
se încearcă să se reproducă, într-o manieră artificială, pe bază de calcule şi cu
ajutorul modelului econometric, modul în care se poate schimba comportamentul
unui fenomen, în raport cu o serie de modificări ipotetice ale condiţiilor care deter-
mină acest comportament.

§ 23.2 Concepte fundamentale ale Econometriei


Teoria şi practica econometrică se bazează pe o serie de concepte fundamen-
tale, a căror cunoaştere condiţionează modul în care sunt înţelese numeroase
aspecte importante, cum ar fi cele legate de: esenţa şi scopurile demersului ştiinţific
întreprins în contextul econometric, modalităţile concrete de desfăşurare a unui
studiu econometric eficient, cerinţele pe care trebuie să le îndeplinească datele
utilizate în activitatea de analiză econometrică, facilităţile pe care le oferă instru-
mentele econometrice, modalităţile de alegere şi de utilizare a celor mai adecvate
metode, tehnici sau proceduri econometrice, posibilităţile de interpretare a rezulta-
telor obţinute, modurile în care pot fi formulate concluziile studiului econometric.
Pe lângă conceptele proprii, cu natură specifică, cum ar fi, de exemplu,
modelul econometric sau predicţia bazată pe modelul econometric, în econometrie
sunt frecvent utilizate şi concepte care ţin de alte domenii ştiinţifice, cum ar fi:
teoria probabilităţilor şi statistica matematică, teoria economică, statistica eco-
nomică etc. Din acest motiv, mulţimea conceptelor cu care se operează în econo-
metrie este extrem de cuprinzătoare şi extrem de variată.
Necesitatea definirii clare şi riguroase a conceptelor care intervin în econo-
metrie decurge, pe de o parte, din faptul că aplicarea metodelor şi tehnicilor
specifice acestui domeniu devine posibilă şi se poate desfăşura în condiţii de
eficienţă, numai dacă noţiunile şi conceptele care stau la baza fundamentării
acestor metode şi tehnici sunt cunoscute riguros şi profund, chiar până la nivel de
subtilitate teoretică. Pe de altă parte, cunoaşterea profundă a conceptelor utilizate în
econometrie este cu atât mai necesară, cu cât demersul econometric este mai
complex şi implică utilizarea unor metode şi tehnici extrem de rafinate din punct de
vedere ştiinţific, care depăşesc cu mult nivelul intuitiv sau nivelul obişnuit de
înțelegere.

Relaţii economice modelate econometric şi tipurile acestora


Relaţiile dintre fenomenele şi procesele din lumea economică reală sunt
importante în econometrie din mai multe puncte de vedere. În primul rând, aceste
relaţii reprezintă obiectul intrinsec al modelării econometrice. În al doilea rând,
natura şi tipul relaţiilor care fac obiectul econometriei determină în mod direct atât
natura datelor utilizate ca “materie primă” în econometrie, cât și tipurile de modele
şi proceduri care pot fi utilizate pentru descrierea respectivelor relaţii.
Fenomenele economice nu se manifestă niciodată într-o manieră de strictă
independenţă, în care manifestarea unui fenomen să fie total izolată sau total
separată de manifestarea altor fenomene sau procese economice, iar evoluţia
acestuia să fie total independentă atât în raport cu evoluţia altor fenomene, cât şi în
raport cu propria evoluţie anterioară. Dimpotrivă, ceea ce este specific domeniului
economic, este faptul că mişcarea şi evoluţia oricărui fenomen din acest domeniu
se manifestă totdeauna sub forma unui angrenaj extrem de complex, în cadrul
căruia fenomenele şi procesele interacţionează unele cu altele, se condiţionează
reciproc şi se influenţează unele pe altele. Din acest punct de vedere, realitatea
economică poate fi privită ca un ansamblu format dintr-o mulţime de fenomene şi
procese, pe de o parte, şi dintr-o mulţime de relaţii sau legături între aceste
fenemene şi procese, pe de altă parte.
Atât evoluţia de ansamblu a realităţii economice, cât şi mişcarea fiecăruia
dintre fenomenele sau procesele care aparţin acestei realităţi, sunt determinate, în
cea mai mare parte a lor, de legăturile sau de relaţiile care se manifestă între aceste
fenomene sau procese. Relaţiile existente la un moment dat între fenomenele sau
procesele din realitate sunt extrem de importante, deoarece aceste relaţii sunt, de
fapt, cele care determină sau care influenţează în mod semnificativ atât nivelul,
structura şi evoluţia respectivelor fenomene sau procese, cât şi forma sau inten-
sitatea cu care aceste relaţii se vor manifesta ulterior, într-un viitor mai mult sau
mai puţin îndepărtat.
Relaţiile dintre fenomenele sau procesele din lumea înconjurătoare se concre-
tizează sub forma unei multitudini de legături, interacţiuni, influenţe, condiţionări
sau conexiuni, care au forme extrem de variate, care se pot manifesta atât între
fenomene sau procese individuale, cât şi între clase de fenomene sau procese, şi
care cunosc numeroase modificări în timp şi spaţiu.
Modificările în timp sau în spaţiu ale relaţiilor dintre fenomene determină o
continuă schimbare spaţio-temporală a configuraţiei mulţimii acestor relaţii şi
constau din manifestarea relaţiilor cu o intensitate mai mare sau mai mică, în mod
direct, indirect sau chiar inversat, pe unul sau mai multe planuri sau pentru o
perioadă mai scurtă sau mai lungă de timp.
În econometrie, de cele mai multe ori, existenţa unei legături dintre două sau
dintre mai multe fenomene este presupusă a fi cunoscută aprioric, pe baza cu-
noştinţelor teoretice şi practice existente în domeniul respectiv. Ceea ce însă nu se
cunoaşte dinainte, însă este necesar a fi cunoscut, este forma sau tipul şi forţa sau
intensitatea cu care această legătură se manifestă.
Deducerea unei dimensiuni cantitative, exprimată sub o formă numerică con-
cretă, pentru intensitatea cu care se manifestă o anumită legătură, precum şi stabi-
lirea tipului sau formei respectivei legături, constituie două dintre obiectivele
importante ale econometriei. Construirea unei măsuri numerice, care să cuantifice
intensitatea şi sensul unei anumite legături dintre fenomene, presupune utilizarea
unor instrumente statistico-matematice adecvate şi face obiectul unui capitol spe-
cial al econometriei, cunoscut sub numele de analiza corelaţiei.
În cazul special al relaţiilor de cauzalitate, de exemplu, problema econometrică
cea mai importantă este aceea a construirii unui model statistico-matematic, numit
şi model econometric, cu ajutorul căruia să poată fi descrisă, într-o manieră sin-
tetică şi relevantă, o anumită relaţie de cauzalitate. În general, activităţile legate de
construirea modelelor econometrice fac obiectul altor capitole ale econometriei,
cunoscute sub numele de analiza regresiei şi analiza seriilor de timp.
Construirea unui model adecvat pentru descrierea unei relaţii de cauzalitate, în
care unul sau mai multe fenomene, determină nivelul sau evoluţia unuia sau mai
multor alte fenomene, presupune, cu necesitate, cunoaşterea apriorică a sensului
relaţiei de cauzalitate.
Sensul în care se manifestă o relaţie de cauzalitate, direct sau invers, este dedus
pe baza cunoştinţelor existente în domeniul respectiv. De altfel, nu există niciun
instrument şi nicio metodă statistico-matematică, cu ajutorul cărora să se poată
identifica cu precizie sensul unei relaţii de cauzalitate, respectiv să se poată stabili
care este fenomenul efect şi care este fenomenul cauză. Stabilirea sensului unei
relaţii de cauzalitate se face totdeauna într-o manieră exogenă, în afara contextului
econometric propriu-zis.
Descrierea relațiilor de cauzalitate cu ajutorul unor modele econometrice pune
în evidenţă atât legăturile existente, cât şi direcţiile în care se manifestă influenţele
exercitate în contextul acestor legături. În orice descriere de acest fel se precizează,
în mod explicit, atât fenomenul sau fenomenele de tip efect, cât şi fenomenul sau
fenomenele de tip cauză, care determină nivelul, variabilitatea şi evoluţia efectului.
În domeniul economic, legăturile sau relaţiile dintre fenomene şi procese cu-
nosc o mare varietate de forme de manifestare, astfel încât apare necesitatea unei
diferenţieri a acestora pe categorii sau clase, în funcţie de mai multe criterii
specifice. Această diferenţiere este importantă în econometrie, deoarece natura şi
tipul metodelor, tehnicilor şi modelelor utilizate pentru descrierea legăturilor dintre
fenomene, este strict dependentă de natura şi tipul relaţiilor supuse investigării.
În econometrie prezintă interes clasificarea relaţiilor sau legăturilor în funcție
de câteva criterii importante, cum ar fi: impactul pe care existenţa unei legături îl
are asupra unora dintre fenomenele implicate în manifestarea acestei legături,
precizia cu care se manifestă o legătură, contextul manifestarii legăturii şi forma
sub care se manifestă respectiva legătură.
Din punct de vedere al impactului pe care relaţiile economice îl pot exercita
asupra unor fenomene angrenate într-o astfel de legătură, relaţiile pot să fie de două
tipuri: relaţii circumstanţiale şi relaţii cauzale. Din punct de vedere al preciziei cu
care se manifestă relaţiile economice, există două tipuri de relaţii: relaţii deter-
ministe şi relaţii stohastice. În funcție de contextul manifestării lor, relațiile sunt de
două tipuri: spatiale și temporale. În sfârşit, din punct de vedere al formelor parti-
culare sub care se pot manifesta relaţiile economice, pot fi deosebite alte două
categorii importante de relaţii: relaţii liniare şi relaţii neliniare.
După cum se poate presupune, atât relaţiile circumstanţiale, cât şi relaţiile
cauzale, se pot manifesta atât sub forma unor relaţii de tip liniar, cât şi sub forma
unor relaţii de tip neliniar, în funcţie de forma particulară a fiecăreia dintre cele
două tipuri de relaţii.

• a. Relaţii circumstanţiale şi relaţii cauzale


Relaţiile dintre fenomenele şi procesele economice se pot manifesta fie ca
simple corelări simetrice ale nivelurilor sau ale evoluţiile fenomenelor, fie ca
mecanisme de tip cauzal, în cadrul cărora variabilitatea în timp şi spaţiu a unui
fenomen, este determinată de variabilitatea în timp şi spaţiu a unor alte fenomene.
Din punct de vedere al existenţei posibilităţii reale ca anumite fenomene econo-
mice să determine sau să influenţeze alte fenomene economice, relaţiile pot fi de
două feluri: relaţii circumstanţiale şi relaţii cauzale.
Relaţiile circumstanţiale se manifestă în situaţiile în care fenomenele angre-
nate într-o astfel de relaţie tind să se mişte în mod corelat şi simetric, fie în acelaşi
sens, fie în sensuri diferite, fără ca manifestarea vreunuia dintre aceste fenomene să
poată fi calificată ca fiind determinantă cauzal pentru manifestarea celorlalte
fenomene.
Relaţiile circumstanţiale sunt relaţii non-cauzale, de tip pasiv, în care niciunul
dintre fenomenele în raport cu care se manifestă o astfel de relaţie, nu influenţează
celelalte fenomene şi, la rândul său, niciunul dintre fenomenele respective nu este
influenţat, în mod direct, sistematic şi semnificativ, de către celelalte fenomene.
Altfel spus, relaţiile circumstanţiale sunt relaţii nedirecţionate, pentru care nu se
poate identifica cu precizie niciun sens de influenţă cauzală de la un fenomen la
altul, respectiv relaţiile pentru care nu se poate stabili nici o legătură semnificativă
de tip cauză-efect.
Ceea ce este specific relațiilor de tip circumstanţial, cel puţin din punct de
vedere teoretic, este faptul că acestea nu se pretează la descrierea cu ajutorul unor
relaţii funcţionale, adică nu pot fi formalizate cu ajutorul unui model econometric
propriu-zis. Din acest motiv, singurele probleme importante care se pun în mod
efectiv în legătură cu relaţiile de tip circumstanţial, sunt doar cele legate de evalu-
area intensităţii şi de stabilirea tipului şi sensului relaţiilor din această categorie.
Problemele specifice relaţiilor de tip circumstanţial constituie obiectul de studiu al
analizei corelaţiei.
Relaţiile de cauzalitate sunt definite ca fiind acele legături în cadrul cărora
unul sau mai multe fenomene, numite cauze sau factori de influenţă, determină, în
mod semnificativ şi stabil, mişcarea unor fenomene de tip efect. Relaţiile cauzale
sunt relaţii de dependenţă, de tip activ, direcţionate foarte precis.
Spre deosebire de relaţiile circumstanţiale, în a căror analiză prezintă interes
doar modul în care pot fi evaluate intensitatea, sensul şi tipul manifestării acestora,
în investigarea relaţiilor de tip cauzal, obiectivul cel mai important este acela al
descrierii formale a acestor relaţii, cu ajutorul unui model econometric. Descrierea
relaţiilor de cauzalitate cu ajutorul modelelor econometrice, constituie obiectul de
studiul al analizei regresiei şi analizei seriilor de timp.
Prima şi cea mai importantă problemă care se pune în legătură cu descrierea
formalizată a unei relaţii de cauzalitate este aceea a identificării sau stabilirii aprio-
rice a rolului pe care îl are fiecare fenomen angrenat în relaţia cauzală respectivă.
Această identificare se referă la cunoaşterea apriorică şi precisă, de manieră exo-
genă, a fenomenului care joacă rolul de efect şi a fenomenului sau fenomenelor
care joacă rolul de cauze sau de factori de influenţă.
În econometrie, fenomenele sau procesele implicate în manifestarea unei
relaţii, indiferent dacă această relaţie este sau nu de tip cauzal, sunt reprezentate
prin intermediul unor variabile. Dacă în cazul relaţiilor circumstanţiale, variabilele
care definesc fenomenele implicate sunt notate, de obicei, cu , în cazul
relaţiilor de cauzalitate, variabilele care definesc efecte sau rezultate se numesc
variabile dependente și sunt notate cu , iar variabilele care definesc
cauze sau factori de influenţă se numesc variabile independente și sunt notate cu
. De regulă, variabilele care descriu fenomene supuse investigaţiei
econometrice sunt considerate a fi variabile aleatoare. Există însă o excepţie de la
această regulă, reprezentată de contextul econometric în care este introdus con-
ceptul de condiţionare statistică, context în care variabilele care descriu fenomene
de tip cauză sunt considerate a fi de tip determinist.
În funcţie de numărul de variabile de tip efect implicate într-o relaţie de cauza-
litate, există două categorii de modele econometrice: modele unidimensionale sau
scalare, corespunzătoare situaţiei în care există o singură variabilă de tip efect,
respectiv modele multidimensionale, vectoriale sau structurale, în cazul în care
există mai multe variabile de tip efect.
Modelele econometrice din contextul analizei regresiei, cum sunt modelele de
regresie simplă şi modelele de regresie multiplă, precum şi o serie de modele din
domeniul seriilor de timp, cum ar fi modelele de tip autoregresiv (AR), de tip
medie mobilă (MA), de tip mixt autoregresiv-medie mobilă (ARMA) sau modelele
cu corecţie de erori (ECM), sunt modele unidimensionale. Anumite clase de mode-
le din domeniul seriilor de timp, cum ar fi modelele cu ecuaţii simultane, modelele
de tip vectori autoregresivi (VAR), de tip vectori medie mobilă (VMA) sau de tip
vectori cu corecţie de erori (VECM), sunt modele multidimensionale.
Factorii de influenţă implicaţi într-o relaţie de cauzalitate, pot reprezenta fie
fenomene complet diferite de fenomenele de tip cauză din această relaţie, aşa cum
se întâmplă în cazul abordărilor din domeniul analizei de regresie, fie stări
anterioare ale fenomenelor de tip cauză, de forma simbolică ,
aşa cum se întâmplă în cazul abordărilor din domeniul analizei seriilor de timp, fie
combinaţii ale ale acestor două categorii de tipuri de factori de influenţă.
Relaţiile de dependenţă cauzală pot fi exprimate prin intermediul unui model
matematic, în care comportamentul fenomenului efect este descris cu ajutorul unei
funcţii, ale cărei argumente sunt exprimări simbolice ale fenemenului sau feno-
menelor care joacă rolul de cauze, respectiv variabile independente. În condiţiile
simbolurilor utilizate în mod uzual în econometrie, relaţiile de cauzalitate pot fi
descrise, într-o manieră simplificată, prin intermediul unor modele de formele:
sau
,
unde prima formă de model este specifică analizei de regresie, iar ultimele două
forme de modele sunt specifice analizei seriilor de timp.

• b. Relaţii deterministe şi relaţii stohastice


Din punct de vedere al preciziei cu care se manifestă, relaţiile dintre fenomene
pot fi clasificate în două mari categorii: relaţii deterministe şi relaţii stohastice sau
statistice. Deşi această clasificare se referă la relaţii în general, în cele ce urmează
vom lua în considerare clasificarea în funcție de a cest criteriu doar pentru cazul
particular al relaţiilor de cauzalitate, doarece această clasificare are o semnificaţie
mai ridicată numai în cazul acestui tip de relaţii.
Modul specific în care se manifestă fenomenele economice reale face ca
formele particulare de manifestare a acestora să aibă natura realizărilor ale unor
variabile aleatoare, motiv pentru care fenomenele sunt formalizate prin intermediul
conceptului de variabilă aleatoare. Aceasta înseamnă că relaţiile dintre fenomenele
economice pot fi privite ca fiind similare cu relaţiile dintre variabilele aleatoare.
În contextul în care se presupune că între două variabile aleatoare există o anu-
mită relaţie de cauzalitate, numită relaţie de dependenţă funcţională, valorile uneia
dintre cele două variabile aleatoare apar ca fiind transformări, după reguli de
transformare unice şi exacte, ale valorilor celeilalte variabile. Dacă între două va-
riabile aleatoare există o relaţie de acest tip, atunci această relaţie se numeşte
relaţie deterministă sau relaţie exactă, chiar dacă variabilele angrenate într-o astfel
de relaţie au natură de variabile aleatoare.
În condiţiile în care între două variabile aleatoare există o relaţie de tip deter-
minist, realizările uneia dintre cele două variabile aleatoare pot fi determinate în
mod direct și exact , pe baza cunoaşterii realizărilor celeilalte variabile aleatoare.
Astfel, dacă se ştie că între variabilele aleatoare Y şi X există o relaţie deterministă
de forma , iar variabila aleatoare X ia valoarea x, atunci, cu siguranță,
variabila aleatoare Y va lua valoarea . Mai mult decât atât, dacă între două
variabile aleatoare există o relaţie de tip determinist, atunci raportul de determinaţie
R2 are valoarea egală cu unitatea, fapt care evidenţiază existenţa unei legături per-
fecte între cele două variabile aleatoare.
Din cauza rigidităţii lor, relaţiile de tip determinist nu întrunesc condiţiile nece-
sare pentru a fi modelate cu ajutorul modelelor de tip econometric, astfel încât ele
prezintă un interes redus din punct de vedere al econometriei.
În cele mai multe situaţii economice reale, relaţia de cauzalitate dintre două
fenomene economice se manifestă în aşa manieră încât, unor niveluri bine deter-
minate ale fenomenului de tip cauză, le corespund mai multe niveluri posibile ale
fenomenului efect. Acest comportament de tip multivoc se datorează în principiu
faptului că, pe lângă fenomenul sau fenomenele de tip cauză semnificativă, feno-
menul efect poate fi influenţat şi de numeroase alte fenomene, care au o natură
accidentală și neobservabilă, a căror influenţă are un caracter aleator şi este relativ
nesemnificativă, în raport cu influenţa exercitată de fenomenul sau de fenomenele
cauză. Relaţiile ce corespund acestui tip de comportament se numesc relaţii sto-
hastice sau statistice, şi sunt de forma:

unde ε este o variabilă aleatoare neobservabilă, care sintetizează influenţele


factorilor aleatori, cu natură accidentală şi nesemnificativă, precum și influențele
erorilor de măsurare asociate cu fenomenul efect.
După cum se poate observa din forma relaţiei precedente, relaţiile de depen-
denţă stohastică au natura unor relaţii deterministe distorsionate sau perturbate, în
care distorsionarea sau perturbarea sunt cuantificate prin prezen ța în model a
variabilei aleatoare ε. Din acest punct de vedere, relaţiile de dependenţă stohastică
apar ca fiind relaţii care au o natură aproximativă, spre deosebire de relaţiile deter-
ministe, care sunt relaţii cu natură exactă.
În cazul în care între o variabilă aleatoare de tip efect Y şi mai multe variabile
aleatoare de tip cauză , există o relaţie de tip stohastic, adică o relaţie
de forma:

raportul de determinaţie multiplă R2 are valoarea strict mai mică decât unitatea, ca
semn al faptului că variabilitatea variabilei efect Y nu se formează doar sub
influenţa factorilor semnificativi, ci și sub influenţa factorilor accidentali.
Prin felul particular în care se manifestă, relaţiile de cauzalitate dintre feno-
menele şi procesele din economie au natura unor relaţii stohastice. Din aceste
motiv, modelele econometrice, indiferent de natura şi forma lor, vizează în exclu-
sivitate descrierea relaţiilor cauzale de tip stohastic.

• c. Relaţii spaţiale şi relaţii temporale


Relaţiile de cauzalitate dintre fenomenele economice, se manifestă sub forma a
două categorii distincte de sensuri: sensul temporal şi sensul spaţial.
Relaţiile de cauzalitate spaţiale sunt relaţii care se manifestă într-o manieră de
strictă autonomie sau independenţă în raport cu evoluţia timpului, respectiv relaţii
care se manifestă la nivelul acelor colectivităţi care includ unităţi observaţionale cu
natură diferită de cea a momentelor sau intervalelor de timp, cum ar fi unităţile
observaţionale reprezentate de obiecte, indivizi, firme, zone geografice etc.
Specificul relaţiilor de cauzalitate spaţiale este determinat de faptul că varia-
bilitatea fenomenului efect, de-a lungul elementelor colectivităţii, este strict inde-
pendentă de timp, ea fiind determinată, în mod exclusiv, de variabilitatea pe care o
înregistrează fenomenele cauză, de-a lungul aceloraşi unităţi observaţionale. De
exemplu, relaţia de cauzalitate dintre consum şi venit, în care mărimea consumului
unei familii este influenţată, în mod direct şi semnificativ, de mărimea venitului
respectivei familii, este o relaţie de cauzalitate spaţială, în care consumul este
fenomenul de tip efect, iar venitul este fenomenul de tip cauză. Diferenţele dintre
consumurile unor familii diferite sunt determinate atât de diferenţele dintre
veniturile familiilor respective, cât şi de diferenţele induse de influenţa unor factori
cu caracter accidental, aleator, cu precizarea că influenţa factorilor accidentali
asupra consumului este presupusă a fi relativ nesemnificativă, în comparație cu
influenţa venitului. Influenţele induse de factori accidentali, cum ar fi, de exemplu,
obiectivele urmărite în viitor, nivelul de instruire, comportamentul anterior în do-
meniul consumului etc., sunt cele care determină comportamentul diferit şi impre-
dictibil pe care îl au în consum familiile cu venituri diferite.
În principiu, relaţiile de cauzalitate spaţiale apar în analizele econometrice care
vizează date de tip profil sau de tip secvenţă, iar modelele econometrice utilizate
pentru descrierea acestor relaţii se numesc modele de regresie și sunt de forma:
(23.1)
Relaţiile de cauzalitate temporale sunt relaţii a căror manifestare este semni-
ficativ influenţată, în mod implicit sau explicit, de evoluţia timpului, respectiv rela-
ţii dintre fenomene care se manifestă şi sunt observate în timp, adică la nivelul
colectivităţilor care includ unităţi observaţionale cu natură temporală, de tipul
momentelor sau intervalelor de timp, cum ar fi unităţile observaţionale reprezentate
de zile, săptămâni, luni, trimestre, ani etc.
Într-o relaţie de cauzalitate temporală, variabilitatea fenomenului efect este
privită ca manifestându-se de-a lungul unor momente sau intervale de timp şi este
presupusă a se forma atât ca urmare a variabilităţii înregistrate în timp de o serie de
fenomene de tip cauză, cât şi ca urmare a influenţei pe care o exercită timpul. De
exemplu, legătura cauzală dintre evoluţia în timp a produsului intern brut şi
evoluţia în timp a capitalului fix dintr-o economie, este o legătură cauzală de tip
temporal.
Influenţa pe care o exercită timpul în contextul relaţiilor de cauzalitate tempo-
rale poate fi de natură explicită, atunci când timpul apare în relaţia de cauzalitate ca
un factor cauzal distinct, sau de natură implicită, atunci când influenţa timpului
este exercitată fie prin intermediul unor factori cauzali, observabili sau neobser-
vabili, care depind de timp, fie prin intermediul unor factori cauzali reprezentaţi de
stări anterioare ale fenomenului efect, fie prin intermediul unor fenomene cauză cu
natură sezonieră.
Legăturile de cauzalitate temporale apar în investigaţiile econometrice care
vizează date de tip cronologic sau de tip serii de timp. Modelele econometrice
utilizate pentru descrierea relaţiilor temporale sunt modele de tip serii de timp, care
au forma generală:

,
unde descrie factori semnificativiși observabili, descrie factori obser-
vabili cu natură sezonieră, iar descrie factori neobservabili, numiţi şocuri sau
inovaţii.
În situaţiile în care mulţimea factorilor cauzali angrenaţi în relaţiile de cauza-
litate temporale include doar timpul, factori cauzali observabili şi factori sezonieri,
modelele utilizate pentru descrierea acestor relaţii capătă forma generală:
,
astfel încât aceste modele pot fi perfect asimilate modelelor de regresie clasice.
• d. Relaţii liniare şi relaţii neliniare
Din punct de vedere al formei lor, respectiv al modului în care fenomenele de
tip efect reacţionează la variaţiile înregistrate de fenomenele de tip cauză, relațiile
sau legăturile dintre fenomene pot să fie de două feluri: relații de tip liniar şi relații
de tip neliniar.
Relaţiile de tip liniar corespund situaţiilor în care variaţiile unuia dintre feno-
mene tind să manifeste o proporţionalitate constantă, directă sau inversă, în raport
cu variaţiile celuilalt fenomen. Relaţiile de tip neliniar corespund situaţiilor în care
raportul dintre variaţiile celor două fenomene nu mai este constant, modificându-se
continuu în timp sau în spaţiu, în diferite sensuri. Relaţiile sau legăturile de tip
neliniar apar în mod frecvent în domeniul economic, ele fiind rezultatul direct al
complexităţii interacţiunilor care se manifestă între fenomenele sau procesele din
acest domeniu.
Măsurarea intensităţii şi tipului relațiilor dintre fenomenele economice se face
în mod diferit, în funcţie de natura liniară sau neliniară a acestora. În cazul relațiilor
de tip liniar măsurarea intensităţii şi tipului legături se poate face cu ajutorul coefi-
cienţilor de corelaţie simplă, în timp ce în cazul relațiilor de tip neliniar, măsurarea
intensităţii şi tipului relației este ceva mai dificilă şi se poate face numai în con-
textul analizei de regresie, prin intermediul raportului de determinaţie R2 .
În funcţie de natura liniară sau neliniară a relaţiilor economice pe care le
modelează, modelele econometrice sunt de două tipuri: modele liniare şi modele
neliniare. Această clasificare a modelelor econometrice corespunde modului con-
cret în care variabilele care definesc fenomene de tip cauză intervin în cadrul mo-
delului econometric. În acest context, de exemplu, un model econometric de forma:

apare ca fiind un model liniar, în timp ce modelul econometric de forma:

apare ca fiind un model neliniar. Cu toate acestea, în econometrie, liniaritatea sau


neliniaritatea unui model econometric sunt judecate nu în raport cu variabilele
cauzale, ci în raport cu parametrii modelului. Din această perspectivă, modelul
precedent este un model liniar, în timp ce modelul:
,
este un model neliniar.

Factori semnificativi şi factori accidentali în modelarea econometrică


Obiectivul general al analizei econometrice este acela de a descrie şi de a ex-
plica relaţiile de cauzalitate, adică mecanismele de formare a nivelului, variabili-
tăţii sau evoluţiei unor fenomene de tip efect, ca rezultat al influenţei unei multi-
tudini de factori sau de cauze. Natura foarte diferită pe care o au cauzele care deter-
mină un anumit efect face ca aceste mecanisme să nu fie strict deterministe, ci să
aibă un pronunţat caracter stohastic.
De cele mai multe ori, în manifestarea unei relaţii de cauzalitate intervin
numeroşi factori cauzali, a căror influenţă asupra fenomenului efect este mai mult
sau mai puţin semnificativă, mai mult sau mai puţin stabilă. Din acest punct de
vedere, factorii care influenţează, în contextul unui mecanism cauzal, un anumit
fenomen efect, pot fi clasificați în două categorii: factori semnificativi şi factori
accidentali sau factori cu influenţă aleatoare.
Fiecare dintre cele două categorii de factori are importanţa şi semnificaţia sa în
contextul analizei econometrice, pentru fiecare categorie de factori utilizându-se
modalităţi statistico-matematice diferite de includere a acestora în modelele econo-
metrice. În cadrul modelării econometrice, cea mai mare importanţă o au factorii
semnificativi, a căror influenţă asupra fenomenelor efect are un caracter general,
semnificativ şi stabil, fiind considerată a fi determinantă pentru evoluţia feno-
menelor efect.
Factorii semnificativi sunt factorii a căror influenţă asupra manifestării unui
fenomen efect este caracterizată prin consistenţă şi prin repetabilitate sau, altfel
spus, prin influenţă cu caracter relevant şi sistematic.
Influenţa factorilor semnificativi asupra fenomenului efect diferă de la o enti-
tate individuală a colectivităţii la alta, în funcţie de valorile înregistrate de factorii
respectivi la nivelul acestor entităţi. Această influenţă se exercită în mod identic
numai la nivelul acelor entităţi observaționale, cărora le corespund valori identice
ale factorilor semnificativi.
Proprietatea pe care o au factorii semnificativi de a-şi exercita influenţele în
mod repetabil, trebuie privită atât în contextul sensului temporal, cât şi în contextul
sensului spaţial ale manifestării relaţiilor de cauzalitate. În contextul sensului tem-
poral, caracterul de repetabilitate a influenţei factorilor sistematici presupune, în
mod implicit, existenţa şi manifestarea factorilor semnificativi pe o perioadă mai
îndelungată. În contextul sensului spaţial, repetabilitatea se referă la existenţa şi
manifestarea factorilor sistematici într-o manieră care se regăseşte multiplicată la
nivelul tuturor elementelor unei colectivităţi.
O ipoteză fundamentală referitoare la factorii semnificativi, este aceea conform
căreia factorii semnificativi au o natură observabilă, ceea ce înseamnă că nive-
lurile şi evoluţiile acestora pot fi supuse unui proces de observare şi de măsurare.
Deşi din punct de vedere teoretic se poate considera că valorile posibile ale
fiecăruia dintre factorii semnificativi reprezintă realizări ale unei variabile alea-
toare, în analiza de regresie se consideră, în mod uzual, că variabilele explicative ce
cuantifică factorii semnificativi sunt variabile deterministe, de tip nestohastic, ale
căror valori sunt certe şi cunoscute aprioric.
În cadrul econometriei, influenţa cumulată a factorilor semnificativi este cuan-
tificată prin intermediul funcţiei de regresie, funcţie ale cărei argumente se referă
în mod explicit la factorii semnificativi şi care include câte un argument separat
pentru fiecare factor de influenţă considerat a fi semnificativ. Aceasta înseamnă că
factorii semnificativi sunt incluşi în structura modelelor de regresie în mod
individual, sub o formă explicită şi distinctă, prin intermediul unor variabile numite
variabile explicative sau regresori. Din acest punct de vedere, se poate spune că,
totdeauna, un model de regresie include un număr de variabile explicative egal cu
numărul de factori semnificativi.
Considerând, de exemplu, cazul legăturii dintre consumul familiilor şi venitul
acestora, diferenţele dintre veniturile unor familii, se vor concretiza în diferenţe
corespunzătoare între consumuri. În mod invers, în ipoteza conform căreia mări-
mea consumului este considerată a fi determinată în mod exclusiv de mărimea
venitului, pentru familiile cu venituri egale, este de aşteptat să existe consumuri
egale. Conţinutul acestei afirmaţii stă la baza ideii conform căreia influenţa facto-
rilor semnificativi determină formarea nivelului mediu al fenomenului efect, iar
abaterile nivelurilor individuale faţă de acest nivel mediu sunt determinate de
influenţa factorilor cu natură accidentală.
Influenţa factorilor semnificativi determină aşa-numita tendinţă centrală sau
sistematică a evoluţiei fenomenului efect şi defineşte partea stabilă şi robustă a
acestei evoluţii. În contextul modelelor econometrice, această parte este sintetizată
prin intermediul unei mărimi cu natură de medie, considerându-se în acest fel că
influenţa factorilor semnificativi determină formarea unui anumit nivel al fenome-
nului efect, care este un nivel mediu sau o valoare aşteptată. Această valoare poate
fi interpretată ca reprezentând acel nivel teoretic al fenomenului efect, care rezultă
din influenţa exclusivă a factorilor semnificativi.
Ca rezultat al presupunerii de mai sus, funcţia care cuantifică influenţa facto-
rilor semnificativi, adică funcţia de regresie, este considerată a fi o funcţie care
descrie nu valorile individuale ale fenomenului efect, ci nivelul mediu sau valoarea
aşteptată a acestuia, respectiv:
,
unde reprezintă funcţia de regresie. În acest context, menţionăm faptul că, în
econometrie, prin intermediul funcţiei de regresie este modelată valoarea aşteptată
a variabilei asociate cu fenomenul efect.
Factorii accidentali sunt factorii a căror influenţă asupra fenomenului efect
este considerată a fi nesemnificativă şi întâmplătoare, având o pondere redusă în
formarea nivelului fenomenului efect, astfel încât influenţa acestor factori, face ca
manifestările individuale ale fenomenului efect să fie diferite, chiar în situația în
care factorii cu natură sistematică au acelaşi nivel. De asemenea, numărul factorilor
accidentali este considerat a fi foarte mare, iar influenţele acestora pot avea sensuri
contrarii, astfel încât, pe medie, aceste influenţe tind să se anihileze. Rezultă că
influenţa factorilor accidentali asupra fenomenului efect face ca manifestarea în
timp sau în spaţiu a acestuia să înregistreze o serie de abateri de la tendinţa sa
centrală, tendinţă determinată de influenţa factorilor semnificativi. Din acest motiv,
se consideră că influenţa factorilor aleatori asupra fenomenului efect are doar o
natură perturbatorie.
Natura întămplătoare a influenţelor pe care factorii accidentali le au asupra
formării nivelului fenomenului efect, precum şi tendinţa de anihilare reciprocă a
influenţelor acestor factori, conduce la ideea modelării influenţelor cumulate ale
acestor factori cu ajutorul unei variabile aleatoare speciale, numită termen eroare
sau perturbaţie și care are o serie de proprietăţi stohastice specifice. Una dintre
aceste proprietăţi este cea conform căreia, ca urmare a anihilării reciproce a influ-
ențelor factorilor accidentali, media acestei variabile aleatoare este nulă.
Influenţa factorilor accidentali asupra unui fenomen efect este cea care conferă
fenomenelor economice proprietatea de comportament impredictibil. Factorii acci-
dentali induc la nivelul fenomenului efect o serie de abateri, cu natură aleatoare şi
cu magnitudine redusă, ale manifestărilor individuale ale acestuia faţă de un presu-
pus comportament aşteptat (mediu) al său:

Spre deosebire de factorii semnificativi, factorii aleatori au caracter neobser-


vabil, astfel încât singurele informaţii care pot exista cu privire la aceşti factori,
sunt informaţiile referitoare la repartiţia statistică a influenței cumulate a acestora.
Mai mult decât atât, manifestarea factorilor aleatori şi exercitatea influenţei aces-
tora asupra fenomenului efect au o natură impredictibilă.
Datorită faptului că influenţele factorilor aleatori asupra fenomenului efect
sunt presupuse a fi accidentale şi neglijabile, includerea acestora în structura mode-
lelor econometrice se face la comun, prin intermediul unei singure variabile alea-
toare, care este perturbaţia sau termenul eroare şi care se notează uzual cu ε.
Aceasta înseamnă că funcţia de mai sus, este considerată a avea următoarea
formă particulară:
,
unde ε este variabila aleatoare care modelează influenţa comună a factorilor
accidentali asupra efectului.
În ciuda unei aparente lipse de importanţă în cadrul modelului econometric,
sugerată de faptul că ea cuantifică influenţa factorilor accidentali, cu influenţă
nesemnificativă, variabila perturbaţie ε are un rol fundamental în modelarea econo-
metrică. De exemplu, ipotezele fundamentale ale modelelor econometrice sunt
formulate, aproape exclusiv, în raport cu această variabilă sau în raport cu formele
condiţionate ale acesteia. De asemenea, reziduurile asociate cu variantele de selec-
ţie ale modelelor econometrice, care au natură de variabile aleatoare și care stau la
baza construirii multor teste statistice, sunt definite tot în raport cu această variabilă
aleatoare şi cu formele sale condiţionate.
Numărul şi natura factorilor accidentali care influenţează un fenomen efect
sunt strâns legate de particularităţile fiecărei entităţi informaţionale care intră în
alcătuirea unei colectivităţi. Aceasta înseamnă că, la nivelul individual al fiecărei
entităţi informaţionale, nivelul fenomenului efect se formează atât sub influenţa
factorilor semnificativi, cât şi sub influenţa unor factori accidentali care sunt speci-
fici respectivei entităţi informaţionale. Mai mult decât atât, chiar în condiţiile în
care influenţa factorilor sistematici este identică pentru mai multe entităţi informa-
ţionale, din cauza influenţei factorilor accidentali, manifestările particulare ale
fenomenului efect la nivelul acestor entităţi informaţionale vor fi diferite. În acest
fel, chiar pentru unități observaționale la care se înregistrează aceleaşi niveluri ale
factorilor sistematici, fenomenul efect poate să înregistreze valori individuale
diferite. Cu alte cuvinte, spre deosebire de factorii semnificativi, care sunt presu-
puşi a fi comuni tuturor unităţilor observaţionale la nivelul cărora se manifestă
legătura modelată, factorii accidentali sunt factori specifici fiecărei unităţi sau unui
număr redus de unităţi similare. Din acest motiv, atât numărul şi natura factorilor
accidentali, cât şi modul în care se exercită influenţa lor asupra fenomenului efect,
diferă, într-o măsură mai mare sau mai mică, de la o unitate observațională la alta
sau de la un grup de unităţi observaționale la altul.
Ca urmare a acţiunii factorilor cu natură aleatoare, la influenţe de mărime şi
sens identice ale factorilor semnificativi, nivelul fenomenului efect va lua valori
diferite de la o unitate observațională la alta sau de la un grup de unităţi observa-
ționale asemănătoare la altul, astfel încât, pentru fiecare combinaţie dată de niveluri
ale factorilor sistematici, există o întreagă mulţime de valori posibile ale nivelurilor
fenomenului efect. Deoarece valorile din această mulțime se formează sub influ-
enţa unor factori de natură aleatoare, putem vorbi de câte o distribuţie de proba-
bilitate a valorilor fenomenului efect, pentru fiecare combinaţie de niveluri ale
factorilor semnificativi.
Distribuţiile de probabilitate ale valorilor fenomenului efect, formate sub influ-
ența factorilor accidentali și diferențiate în funcție de valorile factorilor semnifi-
cativi, pot fi privite ca distribuţii condiţionate de probabilitate, pentru care condi-
ţionarea este exercitată de valorile înregistrate de factorii semnificativi.
Prezenţa influenţelor factorilor aleatori asupra fenomenului efect, influenţe
cuantificate prin intermediul unei singure variabile aleatoare ɛ, face ca relaţia de
cauzalitate descrisă cu ajutorul modelului de regresie să fie privită ca o relaţie de
natură statistică, iar modelul de regresie să aibă natură stohastică:

Având în vedere cele menționate anterior, nivelul fenomenului efect poate fi


descompus în două componente:
• componenta sistematică, determinată de influenţa factorilor cu natură semni-
ficativă, este sintetizată prin intermediul mediei şi este descrisă cu ajutorul
funcţiei de regresie, respectiv:
;
• componenta accidentală, care este rezultatul influenţei factorilor aleatori, este
reprezentată de abaterile față de medie și este sintetizată prin intermediul per-
turbației ε:
.
Ca urmare a existenţei celor două componente ale valorilor individuale ale
nivelului fenomenului efect, variabilitatea acestuia de-a lungul unităţilor colectivi-
tății poate fi descompusă, în mod corespunzător, astfel:
.
Această modalitate de descompunere a variabilităţii fenomenului efect expri-
mă rezultatul aşa-numitei teoreme de descompunere a varianţei, teoremă care oferă
justificarea teoretică pentru descompunerea sumei pătratelor abaterilor variabilei
dependente pe două componente: suma pătratelor abaterilor explicate de regresie
şi suma pătratelor abaterilor reziduale (sau neexplicate), componente care stau la
baza definirii raportului de determinaţie multiplă R2 .

Colectivitate, populaţie şi eşantion


Este foarte important ca în orice analiză econometrică să se facă o distincţie
foarte clară între conceptul empiric de colectivitate şi conceptul teoretic de po-
pulaţie statistică. Acesta din urmă constituie o generalizare a conceptului de colec-
tivitate şi are implicaţii teoretice de profunzime pentru logica econometrică.
Colectivitatea este un ansamblu de entităţi individuale, numite unităţi elemen-
tare, unităţi observaţionale, obiecte, indivizi, cazuri etc., care au o existenţă reală,
concretă, şi care au una sau mai multe proprietăţi empirice comune, numite
caracteristici sau atribute.
Populaţia statistică este un ansamblu de entităţi informaţionale abstracte,
virtuale, numite generic observaţii, constând din mulţimea tuturor valorilor posi-
bile, efective sau virtuale, pe care le pot lua caracteristicile elementelor unei colec-
tivităţi, ansamblu care reprezintă o generalizare a valorilor particulare ale respecti-
velor caracteristici. O populaţie statistică are natura unei mulţimi de valori, de
regulă reale, ale uneia sau mai multor variabile aleatoare, numite şi dimensiuni ale
populaţiei statistice, în funcţie de numărul de caracteristici de interes ale colec-
tivităţii pe care populaţia statistică o generalizează.
Orice caracteristică de interes a unei colectivităţi este generalizată la nivel de
populaţie statistică prin intermediul conceptului de variabilă aleatoare, care repre-
zintă o dimensiune a populaţiei statistice. Din acest punct de vedere, valorile efec-
tive ale caracteristicilor elementelor unei colectivităţi apar ca o submulţime a
valorilor populaţiei statistice. Mai mult decât atât, mulţimile de valori efective ale
caracteristicilor elementelor unei colectivităţi sunt totdeauna mulţimi finite, în timp
ce populaţiile statistice sunt, de cele mai multe ori, mulţimi infinite. De exemplu, în
cazul particular al consumului familiilor, deşi valorile individuale ale consumurilor
familiilor reprezintă o mulţime finită, cu un cardinal de ordinul milioanelor, din
punct de vedere al econometriei, consumul este privit ca fiind o variabilă aleatoare,
care ia valori într-un interval continuu de forma [cmin , cmax], interval care defineşte
populaţia statistică şi care are cardinalul egal cu puterea continuului, adică infinit.
Populaţiile statistice pot fi mulţimi finite numai în cazul particular în care
caracteristicile unităţilor care intră în alcătuirea colectivităţilor investigate sunt de
tip nominal (discret), adică au o mulţime finită de valori posibile.
În cazul în care elementele colectivităţii studiate au un număr de n carac-
teristici, cu valori de tip continuu (reale), populaţia statistică asociată are tot un
număr de n dimensiuni (variabile) şi poate fi privită ca reprezând o submulţime a
spaţiului Euclidian real n-dimensional, respectiv:
{Populaţie statistică} ⊆ ℝ×ℝ×...×ℝ = ℝn..
În această situație, populaţia statistică apare ca fiind mulţimea tuturor valorilor
posibile ale unui vector real, ale cărui elemente sunt reprezentate de n variabile
aleatoare reale, asociate cu cele n caracteristici de interes ale colectivităţii.
În cadrul figurii (23.1) este ilustrată ideea raportului în care se află colec-
tivitatea şi populaţia statistică asociată acesteia.

f1
f4
f3
f2 fi (R1)
f5 f6 c5 cN c3 c1 c4 c2 ci cN-1c6
cmin cmax
fN-1
fN

a. Colectivitate b. Populatie statistica


Figura 23.1: Raportul dintre colectivitate şi populaţie statistică
De regulă, datele disponibile pentru o analiză econometrică nu au un caracter
exhaustiv, ci un caracter parţial, ele reprezentând doar o submulţime a populaţiei
statistice, submulţime cunoscută sub numele de eşantion.
Eşantionul reprezintă o porţiune informaţională, o parte sau o submulţime a
populaţiei statistice, respectiv acea parte care este asociată doar cu acele unităţi ale
colectivităţii, de la care sunt colectate în mod efectiv datele de interes. Numărul de
observaţii dintr-un eşantion se numeşte volum al eşantionului şi se notează cu T.
Eşantionul este o entitate informaţională parţială, prin intermediul căruia se
urmăreşte cunoaşterea întregului din care acesta face parte, întreg reprezentat în
sens concret de colectivitatea investigată, iar în sens abstract de populaţia statistică.
Cel puţin din punct de vedere teoretic, eşantionul are menirea de a reprezenta
populaţia statistică vizată de analiză, de a reproduce într-o măsură cât mai mare
caracteristicile esenţiale ale acesteia. Proprietatea unui eşantion de a reproduce,
într-o anumită măsură, caracteristicile esenţiale ale populaţiei statistice la care se
referă, este cunoscută sub numele de reprezentativitate a eşantionului.
Există mai multe accepţiuni ale conceptului de eşantion: eşantionul fizic, care
reprezintă o simplă listă de unităţi extrase la întâmplare din colectivitatea supusă
studiului, de forma , eşantionul informaţional
sau de observaţii, care reprezintă o mulţime de valori numerice observate ale carac-
teristicii sau caracteristicilor colectivităţii, de formele:
sau ,
în funcţie de numărul de caracteristici de interes pe care le posedă unităţile colec-
tivităţii analizate, respectiv eşantionul aleator, care este o listă de variabile alea-
toare, identic şi independent distribuite (iid), de formele următoare:
sau .
Deoarece orice eşantion informaţional (de observaţii) poate fi privit ca repre-
zentând o realizare particulară a variabilelor din eşantionul aleator asociat, se poate
spune că eşantionul aleator constituie o generalizare a tuturor eşantioanelor infor-
maţionale de volum dat, motiv pentru care eşantionul aleator se mai numeşte şi
model de selecţie.
De regulă, variabilele aleatoare care intră în alcătuirea eşantionului aleator sunt
utilizate pentru definirea estimatorilor parametrilor modelelor econometrice, iar
datele care intră în alcătuirea eşantionului informaţional sunt utilizate pentru esti-
marea efectivă a parametrilor modelelor econometrice.
Justificarea teoretică a folosirii informaţiilor parţiale conţinute în eşantionul de
observaţii, pentru a caracteriza populaţia statistică din care provine eşantionul, este
asigurată de legea numerelor mari. În virtutea acestei legi, informaţiile din eşantion
pot fi utilizate în mod eficient pentru a obţine aproximări suficient de bune ale
valorilor parametrilor populaţiilor statistice şi modelelor econometrice. Calitatea
aproximărilor obținute cu ajutorul estimatorilor, depinde de proprietăţile calitative
pe care pot să le aibă sau nu estimatorii respectivi.

Parametri, estimatori şi estimaţii


Populaţiile statistice au o serie de proprietăţi şi caracteristici fundamentale,
sintetizabile şi exprimabile prin intermediul unor mărimi numerice bine deter-
minate şi importante din punct de vedere al cunoaşterii ştiinţifice, dar care nu sunt
cunoscute aprioric, nu pot fi observate în mod direct şi nu pot fi măsurate cu
precizie. Mărimile numerice care exprimă într-o manieră sintetizatoare aspecte şi
trăsături fundamentale ale populaţiilor statistice au natura unor constante şi sunt
cunoscute în statistică sub numele de parametri sau mărimi teoretice.
Parametrii sunt mărimi numerice cu valoare constantă şi necunoscută,
specifice populaţiilor statistice şi modelelor econometrice, care exprimă caracte-
ristici fundamentale şi de interes, a căror valoare nu poate fi obţinută pe calea
observării directe.
În econometrie apare în mod frecvent necesitatea de a obţine aproximaţii
pentru parametrii necunoscuţi ai populaţiilor statistice sau ai modelelor econo-
metrice. Procesul de obţinere a acestor aproximaţii se numeşte estimare, iar aproxi-
maţiile ca atare se numesc estimaţii.
În general, procesul de estimare a parametrilor presupune: • existenţa unei baze
informaţionale corespunzătoare, reprezentată de eşantionul de observaţii; • defini-
rea unor funcţii numite estimatori, ale căror valori servesc ca aproximări ale
parametrilor; • utilizarea unor metode şi tehnici de estimare adecvate, astfel încât,
prin evaluarea estimatorilor pe mulţimea de observaţii, se se obţină estimaţii care
să aproximeze cât mai bine valorile necunoscute ale parametrilor.
Estimatorii sau statisticile sunt funcţii definite în raport cu variabilele care
alcătuiesc eşantionul aleator, respectiv funcţii de forma:
,
unde este un estimator al unui parametru oarecare θ.
Fiind definiţi ca funcţii de T variabile aleatoare, estimatorii au natură de varia-
bile aleatoare, astfel încât are sens să se vorbească de distribuţie statistică a aces-
tora, care se numeşte distribuţie de selecţie. Ca exemple de estimatori mai impor-
tanţi şi mai frecvent întâlniţi în econometrie, putem menţiona: media de selecţie:

şi varianţa de selecţie:
,
care sunt estimatori pentru media şi varianţa unei populaţii statistice.
Ca funcţii de elementele eşantionului aleator, estimatorii pot fi evaluaţi în
raport cu orice eşantion dat de observaţii. Valoarea obţinută din evaluarea unui
estimator pe un eşantion particular de observaţii, se numeşte estimaţie.
Estimaţia este o valoare numerică, rezultată din evaluarea unui estimator pe
mulţimea de observaţii reprezentate de un eşantion, respectiv o valoare reală defi-
nită sub forma:
,
unde reprezintă valorile numerice din eşantionul de observaţii.
Calitatea estimaţiilor obţinute pentru anumiţi parametri, adică măsura în care
acestea reuşesc să aproximeze parametrii populaţiei, depinde de trei factori impor-
tanţi: calitatea datelor disponibile la nivel de eşantion, proprietăţile statistice ale
estimatorilor şi calitatea metodei de estimare utilizată.
Printre cele mai importante proprietăţi calitative ale estimatorilor, de care
depinde măsura în care aceştia pot aproxima valorile adevărate ale parametrilor,
menţionăm: nedeplasarea, consistenţa, liniaritatea şi eficienţa.

Caracteristici şi variabile
Econometria are ca scop modelarea legăturilor cauzale manifestate la nivelul
unor fenomene sau caracteristici pe care le posedă unită țile sau elementele unei
colectivităţi, numite generic unităţi observaţionale.
Din perspectiva informaţiei statistice, o colectivitate prezintă interes direct nu
din punct de vedere al elementelor sale ca atare, ci din punct de vedere al trăsă-
turilor, al proprietăţilor pe care le au aceste elemente. Proprietăţile specifice pe
care le pot avea elementele aparţinând unei colectivităţi oarecare, sunt numite
caracteristici sau atribute, fiecare caracteristică de interes a elementelor unei
colectivităţi, definind o dimensiune a colectivităţii respective.
Este important să precizăm că orice caracteristică luată în considerare în ana-
liza econometrică trebuie să fie comună tuturor unităţilor colectivităţii analizate,
existând doar diferenţe de valoare ale acestei caracteristici de la o unitate a colec-
tivităţii la alta. Aceste diferenţe definesc aşa-numita variabilitate a caracteristicii
respective, peste mulţimea de unităţi observaţionale.
Caracteristicile sau atributele unităţilor elementare ce alcătuiesc o anumită
colectivitate, sunt elemente ale unei realităţi date, de natură empirică. De regulă, în
activitatea ştiinţifică nu se operează cu elementele acestei realităţii ca atare, ci cu
simboluri, care sunt reprezentări abstracte ale realităţii. În econometrie reprezen-
tarea simbolică a caracteristicilor empirice ale elementelor unei colectivităţi, este
asigurată prin intermediul conceptului de variabilă (aleatoare).
În cadrul demersurilor ştiinţifice care au ca scop investigarea fenomenelor şi
proceselor din lumea reală, caracteristicile unităţilor unei colectivităţi sunt reflec-
tate prin intermediul conceptului de variabilă, tocmai pentru a sugera natura schim-
bătoare a acestora, variabilitatea lor în timp şi spaţiu.
Variabila reprezintă o abstractizare a mulţimii de valori posibile pe care le
poate înregistra o caracteristică, de-a lungul tuturor unităţilor unei colectivităţi.
Natura variabilelor implicate într-o analiză econometrică este determinată în
mod direct de natura caracteristicilor pe care le au obiectele supuse analizei. Din
acest punct de vedere, variabilele care intervin într-o analiză econometrică pot fi
structurate sub forma unor tipuri diferite, în funcţie de anumite criterii de diferen-
ţiere. Tipul variabilelor este foarte important, deoarece atât procedurile de analiză
econometrică, cât şi posibilităţile de interpretare a rezultatelor obţinute, sunt
substanţial diferite în raport cu natura variabilelor implicate în analiză.
Printre cele mai importante categorii de variabile întâlnite în econometrie se
numără variabilele de tip cantitativ şi calitativ, variabilele de tip discret şi conti-
nuu, variabilele endogene şi exogene etc. Clasificarea variabilelor în aceste catego-
rii, corespunde unor criterii specifice de clasificare, cum ar fi: natura valorilor
variabilelor, natura mulţimilor de valori ale variabilelor, rolul pe care îl au varia-
bilele în cadrul modelelor etc.
Ca şi caracteristicile unităților la care se referă, variabilele pot fi de împărţite,
în funcţie de natura valorilor pe care acestea le iau, în două mari categorii: varia-
bile calitative şi variabile cantitative.
Variabilele calitative sunt variabile care diferă prin tip, care se referă la
proprietăţi nenumerice ale unităţilor elementare aparţinând unei colectivităţi şi care
nu pot fi exprimate sub o formă numerică semnificativă. Valorile variabilelor de tip
calitativ se numesc alternative, variante, modalităţi sau categorii, motiv pentru
care variabilele calitative se mai numesc şi variabile categoriale. În funcţie de
numărul de valori posibile pe care le pot lua, variabilele categoriale sunt de două
tipuri: variabile bicategoriale şi variabile multicategoriale. Ca exemple de varia-
bile calitative putem menţiona: sexul, opţiunea cumpărătorului, opţiunea alegăto-
rului, profesia, starea civilă etc. Variabilele cantitative sunt variabile care diferă
prin mărime, care se referă la proprietăţi numerice ale unităţilor elementare dintr-o
colectivitate şi care sunt exprimate în unităţi numerice de lungime, de frecvenţă, de
volum, de greutate, de valoare etc. Ca exemple de variabile cantitative putem
menţiona: preţul unui produs, cheltuielile lunare ale unei familii, salariul mediu
lunar, venitul naţional, volumul fizic al producţiei etc.
Un alt criteriu de clasificare a variabilelor este cel al naturii mulţimii în care
acestea pot lua valori. Din acest punct de vedere, variabilele se împart în două
categorii: variabile de tip discret şi variabile de tip continuu.
Variabilele de tip discret sunt variabile care pot lua valori într-o mulţime
finită, indiferent de natura calitativă sau cantitativă a acestora. Variabilele de tip
discret pot să fie atât variabile calitative, cât şi variabile cantitative, cu condiţia ca
în cazul ultimelor, numărul de valori posibile să fie finit. Ca exemple de variabile
de tip discret putem menţiona: categoria de venit, nivelul de instruire, vârsta,
numărul de salariaţi, numărul de cumpărători, numărul de piese defecte, numărul
de firme falimentare, numărul de tranzacţii la bursă etc. Variabilele de tip continuu
sunt variabile numerice pentru care mulţimea de valori posibile este o mulț ime de
numere reale, care are puterea continuului.Ca exemple de variabile de tip continuu
putem menționa: masa monetară dintr-o economie, prețul unui bun economic, rata
inflației, rata șomajului, cursul de schimb al monedei naționale etc.
Un alt criteriu de clasificare a variabilelor este cel reprezentat de rolul acestora
în contextul relaţiilor de cauzalitate şi, implicit, în cadrul modelelor care descriu
relaţii de acest fel. Din acest punct de vedere, variabilele se împart în trei categorii:
variabile endogene, variabile exogene şi variabile fictive.
Variabilele endogene sunt variabile care exprimă fenomene de tip efect sau
rezultat, considerate a se forma sub influenţa unor alte fenomene şi apar în cadrul
modelelor econometrice ca variabile dependente. Variabilele exogene sunt varia-
bile care simbolizează fenomene de tip cauze, care, prin modul lor de manifestare,
determină comportamentul unui fenomen de tip efect. Atât variabilele endogene,
cât şi variabilele exogene, pot să fie variabile de tip calitativ sau variabile de tip
cantitativ. Variabilele fictive sunt variabile artificiale, care sunt utilizate în con-
strucția modelelor econometrice cu scopul de a asigura flexibilizarea modelelor sau
cu scopul de a cuantifica influențe de tip sezonier. De regulă, variabilele fictive
sunt variabile de tip binar, adică variabile care pot lua două valori posibile. În cazul
în care varibilele fictive sunt incluse într-un model cu scopul de a descrie sezo-
nalitatea, numărul acestora şi valorile lor posibile sunt determinate de numărul de
perioade din intervalul de ciclitate.
Variabilele pot fi clasificate şi în funcţie de tipul scalelor pe care sunt măsurate
valorile acestor variabile. Din acest punct de vedere, există patru tipuri de variabile,
respectiv variabile nominale sau categoriale, variabile ordinale, variabile de tip
interval şi variabile de tip raport, tipuri ce corespund scalelor nominală, ordinală,
interval sau raport.

§ 23.3 Baza informaţională utilizată în econometrie


Elementele care constituie intrările pentru orice metodă, tehnică sau procedură
econometrică, respectiv “materia primă” a econometriei, sunt reprezentate de
datele (primare) referitoare la starea şi evoluţia fenomenelor din economia reală.
Datele reprezintă expresii cantitative sau calitative ale manifestării unor feno-
mene din realitatea înconjurătoare, rezultate în urma unor procese de observare,
măsurare şi înregistrare specifice. Eterogenitatea fenomenelor economice şi a ma-
nifestării lor face ca datele referitoare la aceste fenomene să fie extrem de variate.
Conceptul de dată este totdeauna asociat cu fenomenele care au natură obser-
vabilă, adică cu fenomenele ale căror manifestări au un anumit grad de “vizibi-
litate” şi care pot fi supuse unor procese de măsurare adecvate. Fenomenul obser-
vabil este acel fenomen ale cărui manifestări directe sunt vizibile şi pot fi supuse
unui proces direct de măsurare. Concret, conceptul de fenomen observabil este
asociat cu ideea de caracteristică măsurabilă.
Datele pot fi privite ca reprezentând semnale sau mesaje provenite din rea-
litatea înconjurătoare, exprimate sub o formă numerică sau nenumerică, pe baza
cărora receptorul acestora îşi poate forma o anumită imagine despre respectiva
realitate şi poate ajunge la un anumit grad de cunoaştere a acelei realităţi. Imaginea
formată este cu atât mai fidelă în raport cu realitatea, cu cât cantitatea semnalelor
sau mesajelor este mai mare şi cu cât calitatea acestora este mai ridicată, respectiv
cu cât acestea sunt mai puţin afectate de erori, perturbaţii şi distorsiuni.
Datele se referă la diferite aspecte informaţionale legate de existenţa şi mani-
festarea fenomenelor şi proceselor reale, cunosc o mare varietate de tipuri şi pot fi
obţinute din surse diferite. Datele exprimă, într-o formă brută, o mulţime de stări şi
evoluţii concrete din realitatea economică investigată şi sunt rezultatul unui labo-
rios proces de observare, măsurare şi evaluare, proces în care intervin o serie de
norme, principii, metodologii şi instrumente.
Datele pot să difere în funcţie de mai mulţi factori, cum ar fi: sursa care le-a
generat, contextul în care sunt obținut e, tipul şi natura lor. În primul rând, indi-
ferent de varietatea lor, datele pot fi grupate în trei categorii fundamentale: date
cantitative, date calitative şi date mixte. Deşi datele calitative sunt de tip nenume-
ric, aceastea pot fi însă transformate şi exprimate sub formă numerică, cantitativă,
prin codificări adecvate.
Din punct de vedere al naturii contextului în care datele sunt obţinute, al
modului în care investigatorul controlează sau nu procesul de obţinere a datelor,
datele pot fi grupate în două categorii: date experimentale şi date observaţionale
sau date non-experimentale.
Datele experimentale sunt datele obţinute prin organizarea unor experimente
de tip controlat, desfăşurate în condiţii bine determinate şi prestabilite. Contextul
obţinerii datelor de tip experimental este restricţionat prin impunerea unor reguli
specifice. În general, organizarea unui experiment controlat presupune, în primul
rând, izolarea fenomenelor şi proceselor studiate, precum şi eliminarea, în cât mai
mare măsură, a influenţelor externe, cu natură accidentală, care nu prezintă interes
pentru analiză. Datele experimentale sunt caracteristice doar anumitor domenii de
cercetare, şi anume acelor domenii în care pot fi organizate experimente cu caracter
controlat. Spre deosebire de aceste domenii, în domeniul economic experimentarea
poate fi efectuată foarte rar şi numai în situaţii excepţionale.
Datele observaţionale, care se mai numesc şi date non-experimentale, sunt
datele obţinute prin “observarea” fenomenelor şi proceselor în mişcarea lor natu-
rală, liberă, fără impunerea unor restricţii și fără a se exercita un control de un
anumit fel asupra fenomenelor şi proceselor investigate. Obţinerea datelor de tip
non-experimental, reprezintă rezultatul observării pasive, constatării. Intervenţia
observatorului, a celui care face observarea şi măsurătorile, este de tip ex-post și
are loc după ce desfăşurarea fenomenelor şi proceselor reale a avut loc. Datele de
tip observaţional sau non-experimental sunt datele specifice domeniului economic,
domeniu în care organizarea de experimente este fie dificilă, fie imposibilă.
În funcţie de natura pe care o au, datele pot fi grupate în trei categorii: date de
tip profil, date de tip serii de timp şi date de tip panel. Datele de tip profil, numite
şi date spaţiale sau date de tip secvenţă, sunt date cu natură statică şi reprezintă
rezultate ale unor măsurători efectuate la un moment dat asupra caracteristicilor
mai multor unităţi ale colectivităţii studiate. Datele de tip serii de timp, numite şi
serii cronologice sau, pur şi simplu, serii de timp, reprezintă rezultate ale unor
măsurători efectuate asupra caracteristicilor unui singur element al colectivităţii
studiate, de-a lungul axei timpului, la mai multe momente sau intervale de timp
succesive. De cele mai multe ori, momentele sau intervalele de timp ale observării
sunt echidistante şi pot fi reprezentate de: zile, săptămâni, luni, trimestre, ani. Date-
le de tip panel, numite şi date longitudinale, reprezintă combinaţii sau mixturi ale
datelor de tip profil şi de tip serii de timp. Datele de tip panel sunt rezultate ale
măsurătorilor efectuate asupra caracteristicilor mai multor elemente ale unei colec-
tivităţi, la mai multe momente sau intervale succesive de timp.
Rezolvarea problemelor specifice demersului econometric, probleme legate de
estimarea parametrilor modelelor, de testarea semnificaţiei unor elemente specifice
ale modelelor sau de validarea calităţii modelelor, presupune existenţa unei baze
informaţionale adecvate, care să conţină toate informaţiile necesare.
Baza informaţională utilizată în analiza econometrică are natura unui eşantion
de observaţii şi este reprezentată de o mulţime de măsurători (observaţii) efectuate
asupra caracteristicilor unor unităţi obsevaţionale extrase din colectivitatea investi-
gată, pe baza unor principii riguroase de eşantionare. Din punct de vedere empiric,
baza informaţională utilizată în econometrie este reprezentată de eşantionul de
observaţii de volum T, eşantion care are următoarea structură generală:

Din punct de vedere teoretic, strict necesar pentru înţelegerea logicii modelării
econometrice şi pentru fundamentarea procedurilor de construire a estimatorilor
pentru parametrii modelelor econometrice, baza informaţională utilizată în econo-
metrie este privită și într-un sens generalizant, ca eşantion aleator de volum T,
eşantion care are următoarea structură generală:

unde cele T observaţii sunt presupuse a fi identic şi independent distribuite (iid), iar
elementele sale sunt variabile aleatoare.
În cazul special al modelelor de regresie multiplă, eşantionul de observaţii şi
eşantionul aleator sunt privite ca fiind structurate sub forma a câte două entităţi
informaţionale distincte, respectiv vectorul de observaţii ale variabilei dependente
Y şi matricea de observaţii ale variabilelor independente , adică:
Eşantion de observaţii: Eşantion aleator:

În cazul în care modelele de regresie includ un termen liber, matricea de obser-


vaţii X este extinsă cu o coloană suplimentară, corespunzătoare unei variabile inde-
pendente fictive, care are toate “observaţiile” egale cu unitatea, astfel încât formele
pe care le capătă această matrice în contextul celor două accepţiuni ale eşantio-
nului, sunt următoarele:

În afară de condiţia generală de reprezentativitate impusă pentru orice


eşantion, în scopul asigurării unei semnificaţii cât mai ridicate a rezultatelor
obţinute, este necesar ca volumul T al eşantionului de observaţii să fie suficient de
mare. Din acest punct de vedere, o condiţie esenţială referitoare la eşantionului de
observații este aceea ca volumul eşantionului să fie cel puţin egal cu numărul de
parametri ai modelului de regresie, respectiv:
.
În cazul analizei regresiei liniare, îndeplinirea acestei condiţii asigură posibili-
tatea estimării parametrilor, ea fiind asociată cu cerinţa ca matricea de observaţii X
să aibă rangul n, astfel încât matricea , utilizată în definirea estimatorilor
pentru parametrii modelului, să fie o matrice inversabilă.
Una dintre ipotezele importante ale modelării econometrice, este cea conform
căreia variabilele explicative , sunt variabile nestohastice, ceea ce în-
seamnă că numărul valorilor posibile ale acestor variabile este finit, iar respectivele
valori sunt fixate şi cunoscute aprioric, astfel încât acestea joacă rolul unor mărimi
care condiţionează (statistic) valorile variabilei dependente Y. În acest context, se
consideră că există un număr finit de combinaţii ale valorilor variabilelor indepen-
dente, iar pentru fiecare combinaţie dată, variabila dependentă poate lua o mulţime
de valori posibile, mulţime care are natura suportului unei distribuţii de proba-
bilitate. Această ipoteză este echivalentă cu presupunerea că valorile variabilelor
explicative apar în mod repetat și identic în toate eşantioanele posibile de volum T,
de la un eşantion la altul diferind doar valorile variabilei dependente.
În condiţiile introducerii ipotezei de condiţionare, adică a presupunerii că valo-
rile variabilelor independente sunt fixate şi cunoscute aprioric, baza informaţională
în sens generalizant este reprezentată de un eşantion aleator degenerat, de forma:
eşantion care poate fi reprezentat prin intermediul vectorului aleator Y şi matricii
de constante X următoare:

În accepţiunea sa empirică, de eşantion de observaţii, baza informaţională


disponibilă în analiza econometrică este utilizată în mod efectiv pentru estimarea
parametrilor modelelor econometrice şi pentru estimarea reziduurilor acestor
modele. În accepţiunea sa teoretică, de eşantion aleator, baza informaţională este
utilizată pentru definirea estimatorilor parametrilor din modelele econometrice,
pentru definirea și pentru verificarea proprietăţilor calitative ale estimatorilor şi
pentru construirea testelor de semnificaţie.

§ 23.4 Analiza regresiei şi modelul de regresie


Descrierea formalizată a relaţiilor de cauzalitate de tip spaţial, adică a relaţiilor
dintre un fenomen de tip efect şi o mulţime de fenomene de tip cauze, constituie
obiectul unui tip specific de modelare econometrică, cunoscut sub numele de
analiza regresiei.
Analiza regresiei are ca scop studierea naturii relaţiilor de cauzalitate care se
manifestă între diferite fenomene sau procese, precum şi identificarea formei
respectivelor relaţii, astfel încât aceste relații să poată fi reprezentate prin interme-
diul unui model matematic, numit model de regresie.
Termenul de regresie a fost utilizat pentru prima dată în lucrările statistici-
anului Francis Galton1 , în contextul cercetărilor efectuate de acesta cu privire la
legătura dintre înălţimea părinților şi înălţimea fiilor familiilor engleze. Ulterior
termenul de regresie a fost utilizat în lucrările lui Karl Pearson2 , care a fundamen-
tat multe dintre instrumentele statistico-matematice utilizate în analiza de regresie.
Elementul fundamental al analizei de regresie îl reprezintă modelul de regre-
sie, care este o structură funcţională complexă ce include: variabile, parametri,
forme funcţionale, restricţii şi ipoteze.
Modelul de regresie reprezintă o descriere formalizată şi esenţializată, de tip
statistico-matematic, a unei legături dintre un fenomen efect şi o mulţime de feno-
mene de tip cauze. Un model de regresie poate fi privit ca o structură formală
alcătuită din următoarele elemente:
• o variabilă aleatoare Y, care defineşte un fenomen de tip efect şi care se nu-
meşte variabilă dependentă, rezultativă, explicată, endogenă, regresand,
răspuns, criteriu sau efect;

1
Galton Francis (1822-1911), medic englez, a utorul a numeroase studii de statistică, psihologie,
antropologie etc.
2
Pearson Karl (1857-1936), statistician englez, profesor la King’s Colle ge din Londra, a avut numeroase şi
importante contribuţii teoretice la dezvoltarea statisticii moderene.
• o structură cauzală semnificativă şi observabilă, reprezentată de un ansamblu
de n variabile, stohastice sau nestohastice, notate cu şi numite va-
riabile independente, cauzale, explicative, exogene, regresori, predictori,
factori, covariaţii sau cauze;
• o structură cauzală nesemnificativă şi neobservabilă, reprezentată de o varia-
bilă aleatoare ɛ, numită perturbaţie sau termen eroare;
• o structură parametrică, reprezentată de coeficienţii sau parametrii mode-
lului, notaţi cu , ale căror valori sunt constante şi necunoscute;
• o formă funcţională, reprezentată de o funcţie reală f(.), de una sau mai multe
variabile, liniară sau neliniară, care descrie legătura funcţională dintre variabila
dependentă şi variabilele explicative şi care se numeşte funcţie de regresie;
• un set de ipoteze statistice, referitoare la perturbaţia ε şi care asigură validi-
tatea şi operaţionalitatea modelului de regresie.
Forma cea mai generală a unui model de regresie multiplă, este următoarea:
(23.1)
Atât variabila dependentă Y, cât şi variabilele independente sunt
considerate a fi variabile aleatoare observabile, adică variabile ale căror realizări
pot fi cunoscute pe calea observării directe, iar perturbaţia ε este o variabilă alea-
toare neobservabilă, cu proprietăți distribuționale speciale.
În funcţie de numărul de variabile independente incluse în mode-
lul de regresie (23.1), acesta se numeşte model de regresie simplă, în cazul în care
include o singură variabilă independentă, respectiv model de regresie multiplă, în
cazul în care include două sau mai multe variabile independente.
De asemenea, în funcţie de forma pe care o are funcţia de regresie f(.), în
raport cu parametrii , respectiv formă liniară sau formă neliniară, mo-
delul de regresie (23.1) se numeşte model de regresie liniar sau model de regresie
neliniar.

Condiţionarea statistică şi analiza regresiei


Deşi în general este accepată ideea că variabilele independente
sunt variabile stohastice, caz în care modelul de regresie are forma (23.1)și se
numeşte model de regresie cu regresori stohastici, în cele mai multe dintre situaţii
se presupune că aceste variabile au o natură deterministă, adică valorile acestora
sunt presupuse a fi fixate și cunoscute aprioric. În acest fel, se introduce
proprietatea de condiţionare statistică, care crează multiple posibilităţi de abordare
şi de interpretare econometrică. În acest context, valorile variabilei dependente Y
apar ca fiind condiţionate de valorile cunoscute ale variabilelor independente
, iar modelul (23.1) capătă forma:

(23.2)
formă cunoscută sub numele de model cu regresori nestohastici sau determinişti,
unde şi sunt versiunile con-
diţionate ale variabilei dependente Y şi perturbaţiei ε, pentru care valorile de con-
diţionare sunt reprezentate de combinaţia de valori .
În cadrul figurii (23.2) este ilustrată interpretarea pe care o are media condi-
ţionată în contextul analizei regresiei, pentru cazul particular al unei relaţii de tip
liniar şi al existenţei unei singure variabile independente.
Densit at ea de probabilit at
p(y/x)

condit ionat a a valorilor

E(y /x5)

E(y /x4)

E(y /x3)

-ei Dreapt a de regresie


E(y /x2)
a populat iei
E(y /x1 )

yi

x1 x2 x3 x4 x5 x

Figura 23.2: Ilustrarea grafică a interpretării mediei condiţionate în


analiza regresiei liniare simple

Deoarece baza informaţională disponibilă în analiza econometrică este presu-


pusă a include un număr total de T observaţii, în care observațiile variabilelor
independente au rolul de valori de condiţionare, există un număr de T versiuni
condiţionate ale variabilelor aleatoare Y şi ε, de formele:
,
numite variabile dependente condiţionate, respectiv perturbaţii condiţionate.
În această situaţie, se acceptă implicit ideea că funţia de regresie f(.) descrie
media condiţionată a variabilei aleatoare Y, şi nu valorile individiale ale acesteia.
Într-adevăr, presupunând că perturbaţia condiţionată
are proprietatea că este de medie nulă, adică:

unde este operatorul de medie, şi având în vedere că primul termen din partea
dreaptă a modelului (23.2) este strict determinist, prin aplicarea operatorului de
medie asupra celor doi membri ai modelului (23.2), vom obţine:
(23.3)
unde este o constantă, care reprezintă media varia-
bilei dependente condiţionate , numită şi medie condiţio-
nată a variabilei dependente Y.
Pe baza rezultatului anterior, modelul de regresie cu regresori nestohastici
poate fi rescris sub forma:

(23.4)
care evidenţiază atât faptul că funcţia de regresie descrie media condiţionată a
variabilei dependente Y, cât şi faptul că perturbaţiile condiţionate descriu abaterile
simple ale valorilor variabilei dependente condiţionate ,
faţă de media acesteia, deoarece perturbația condiționată poate fi scrisă sub forma:

O altă consecinţă importantă şi utilă a introducerii ipotezei de condiţionare,


este aceea că variabilele dependente condiţionate , au
distribuţiile de probabilitate de o formă identică cu cea a distribuţiilor de proba-
bilitate ale perturbaţiilor condiţionate . De exemplu, dacă
perturbaţia condiţionată este distribuită după legea nor-
mală, de medie nulă şi varianţă constantă , adică:
,
atunci și variabila dependentă condiţionată este distri-
buită tot după legea normală, cu media şi varian-
ţa , adică:
.
Aceasta înseamnă că orice ipoteză impusă asupra distribuţiilor de probabi-
litate ale perturbaţiilor condiţionate este perfect echivalentă cu o ipoteză impusă
asupra distribuţiilor de probabilitate ale variabilelor dependente condiţionate.
Relaţia (23.3) arată că media condiţionată a variabilei aleatoare Y este o funcţie
de valorile variabilelor aleatoare , ceea ce înseamnă că dacă renunţăm
la presupunerea că valorile acestor variabile aleatoare sunt cunoscute, media
condiţionată a variabilei aleatoare Y apare ca fiind o funcţie de variabilele aleatoare
, funcţie care în teoria probabilităţilor se numeşte regresie, adică ea
însăși este o variabilă aleatoare, de forma:

cu media şi varianţa date de relaţiile:

unde prima relaţie defineşte aşa-numita proprietate de iterativitate a mediei condi-


ţionate, reprezintă media necondiţionată a variabilei aleatoare Y, iar notaţia
evidenţiază faptul că operaţia de mediere este definită în raport cu distribuţia
de probabilitate multidimensională a variabilelor aleatoare .
Având în vedere un rezultat fundamental al teoriei probabilităţilor, cunoscut
sub numele de teorema de descompunere a varianţei totale, în conformitate cu care
varianţa totală (necondiţionată) a unei variabile aleatoare Y, poate fi scrisă ca fiind
suma dintre varianţa mediei condiţionate şi media varianţei condiţionate, respectiv:
, (23.5)
unde este o constantă numită varian ță condiționată, care
reprezintă varianţa variabilei dependente condiț ionate Y, definită de relația:
Ca şi în cazul mediei condiţionate, varianţa condiţionată poate fi privită ca
fiind o funcţie de variabilele aleatoare , de forma:
;
astfel încât și varianța condiționată are tot natură de variab ilă aleatoare. În teoria
probabilităților, varianța condiționată privită ca funcție de variabilele care condițio -
nează, este numită funcţie scedastică.
Dacă variabilele aleatoare sunt distribuite după legea de proba-
bilitate normală (n+1)-dimensională, atunci media condiţionată a variabilei alea-
toare Y este o funcţie liniară de variabilele aleatoare , respectiv:

funcţie a cărei reprezentare grafică se numeşte curbă de regresie. În aceeaşi


situaţie, varianţa condiţionată (funcţia scedastică) este constantă, respectiv:

Proprietatea de constanţă a varianţei condiţionate, este cunoscută în econo-


metrie sub numele de proprietate de homoscedasticitate.
Primul termen din descompunerea varianței (23.5) este o măsură a părţii din
varianţa totală a variabilei aleatoare Y, care poate fi atribuită influenţei factorilor
semnificativi , iar cel de-al doilea termen al descompunerii este o mă-
sură a părţii din varianţa totală a variabilei aleatoare Y, care care poate fi atribuită
influenţei factorilor accidentali. Pe baza descompunerii (23.5), poate fi construită
una dintre cele mai importante mărimi din econometrie, respectiv mărimea:

cunoscută sub numele de raport (coeficient) de determinaţie multiplă, care arată


proporţia din varianţa variabilei aleatoare Y, care poate fi explicată prin intermediul
influenţei factorilor semnificativi .
Rădăcina pătrată a raportului de determinaţie multiplă este cunoscută sub
numele de coeficient de corelaţie multiplă, care este o măsură a intensităţii legă-
turii dintre variabila aleatoare Y, pe de o parte, şi variabilele aleatoare ,
pe de altă parte, indiferent dacă respectiva legătură este de tip liniar sau neliniar.
Având în vedere avantajele oferite de introducerea ipotezei de condiţionare
statistică, în cele ce urmează ne vom referi doar la modelele de regresie cu regre-
sori determinişti, adică la modelele în care variabilele independente
sunt considerate a fi de tip determinist.

Estimarea parametrilor modelului de regresie


Cea mai importantă şi cea mai dificilă problemă care se pune în legătură cu
modelul de regresie de forma:

(23.7)
care se numeşte model teoretic sau model al populaţiei statistice, este aceea a
estimării parametrilor săi .
Presupunând că forma funcţiei de regresie f(.) este cunoscută şi că baza infor-
maţională disponibilă pentru estimarea parametrilor modelului este reprezentată de
eşantionul aleator (degenerat) având forma următoare:

unde , reprezintă variabilele dependente condiţionate, adică:

iar cele T linii ale matricii X definesc cele T niveluri de condiţionare pentru varia-
bila dependentă Y. Similar, cele T perturbaţii condiţionate, corespunzătoare celor T
niveluri de condiţionare reprezentate de valorile variabilelor , pot fi
notate sub forma:

iar modelul teoretic (23.7) poate fi scris la nivel de eșantion sub forma următoare:

În aceste condiţii, problema estimării parametrilor modelului de regresie teore-


tic (23.7) constă în utilizarea datelor disponibile pentru obținerea unor aproximări
cât mai bune pentru valorile necunoscute ale parametrilor , astfel
încât, pentru aceste aproximări, modelul să reproducă într-o măsură cât mai
adecvată relaţia de cauzalitate evidenţiată la nivelul datelor existente.
Utilizând notaţiile definite anterior şi notând cu , valorile necu-
noscute ale parametrilor , putem defini o formă de selecţie a mode-
lului teoretic de regresie (23.7), reprezentată de modelul:

unde mărimile se numesc estimatori ai parametrilor şi


au natură de variabile aleatoare, iar mărimile , sunt variabile alea-
toare numite reziduuri condiționate și au rolul de estimatori pentru perturbaţiile
condiţionate din modelul teoretic.
Modelul (23.10) se numește model estimator al modelului teoretic (23.7) și are
o importanță crucială în analiza de regresie.
În raport cu modelul estimator (23.10), problema estimării parametrilor mode-
lului de regresie (23.7), constă utilizarea eşantionului de observaţii pentru determi-
narea valorilor estimatorilor , valori care se numesc estimaţii şi care
sunt notate cu astfel încât suma pătratelor reziduurilor să fie minimă.
În acest scop, estimatorii sunt definiţi ca soluţii ale următoarei proble-
me de minimizare:
,
unde funcţia:
,
se numeşte suma pătratelor abaterilor sau suma pătratelor reziduurilor. Concret,
estimatorii parametrilor modelului de regresie (23.7) se determină ca soluţii ale
sistemului de ecuaţii:
numit şi sistem de ecuaţii normale, ceea ce înseamnă că estimatorii parametrilor
sunt funcţii de forma:

adică variabile aleatoare.


Estimatorii determinaţi după metoda descrisă anterior se numesc estimatori de
cele mai mici pătrate sau estimatori OLS (Ordinary Least Square), iar metoda de
estimare se numeşte metoda celor mai mici pătrate.
În cazul regresiei liniare şi cu condiţia ca toate ipotezele fundamentale ale
modelului de regresie liniară să fie îndeplinite, estimatorii de cele mai mici pătrate
au proprietatea că sunt nedeplasaţi, liniari şi consistenţi. În plus, dintre toţi esti-
matorii parametrilor unui model de regresie liniară, care au proprietatea că sunt
nedeplasaţi şi liniari, estimatorii de cele mai mici pătrate au varianţă minimă, adică
sunt eficienți, motiv pentru care se mai numesc şi estimatori BLUE (Best Linear
Unbiased Estimators).
Există şi alte metode de estimare a parametrilor modelelor de regresie, dintre
care menţionăm: metoda verosimilităţii maxime, metoda momentelor şi metoda
analizei Bayesiene. În general, metoda verosimilităţii maxime produce estimatori
eficienţi, dar deplasaţi, iar metoda momentelor produce estimatori consistenţi.

Modelul de regresie liniară multiplă


Deşi cele mai multe relaţii dintre fenomenele economice reale sunt de natură
neliniară, modelele econometrice utilizate cel mai frecvent pentru descrierea aces-
tor legături sunt modelele de tip liniar, adică modelele pentru care funcția de regre-
sie este liniară în raport cu parametrii.
Faptul că în cele mai multe aplicaţii econometrice, chiar în cele care au ca scop
modelarea unor fenomene cu comportament neliniar, sunt preferate modelele
liniare, este justificat, în principal, de existența dificultăţilor de natură teoretică şi
numerică ce apar în cazul modelelor de tip neliniar.
Spre deosebire de modelele de tip neliniar, modelele liniare dispun de o serie
de avantaje care fac utilizarea acestora simplă, comodă şi chiar eficientă, cum ar fi:
pentru modelele de tip liniar există un suport teoretic complet şi foarte bine
fundamentat din punct de vedere ştiinţific; algoritmii de estimare a modelelor de tip
liniar sunt foarte simpli şi există numeroase implementări software ale acestora;
pentru cazul liniar există numeroase teste de verificare a semnificaţiei rezultatelor
obţinute; interpretarea rezultatelor utilizării modelelor de tip liniar este simplă şi
naturală; în numeroase situaţii, aproximarea neliniarităţilor cu ajutorul modelelor
liniare este suficient de satisfăcătoare.
Caracteristica principală a modelului de regresie liniară (cu regresori determi-
nişti) constă în aceea că funcţia de regresie a modelului, privită însă în raport cu
parametrii modelului de regresie, este o funcţie liniară, respectiv o funcție de forma
următoare:
,
unde parametrul reprezintă termenul liber sau interceptul modelului de regresie.
În aceste condiţii, modelul teoretic de regresie liniară (cu regresori determinişti) are
următoarea formă generală:

.
Reprezentarea grafică a funcţiei de regresie din acest model de regresie liniară
se numeşte dreaptă de regresie a popula ției sau dreaptă de regresie teoretică.
În raport cu eşantionul aleator (degenerat) reprezentat de relaţiile (23.8), mode-
lul teoretic de regresie liniară are forma următoare:
(23.11)
unde reprezentă forma condiţionată a variabilei dependente Y, iar reprezintă
forma condiţionată a variabilei perturbaţie , forme corespunzătoare celui de-al t-
lea nivel de condiţionare , iar modelul estimator al modelului de
regresie liniară (23.11) are forma următoare:

unde reprezintă estimatorii parametrilor , iar repre-


zintă reziduul condi ționat, corespunzătoar celui de-al t-lea nivel de condiţionare al
variabilelor independente.
Ideea legăturii dintre modelul teoretic de regresie (al populaţiei) şi modelul
estimator (al eşantionului) al acestuia, este ilustrată în cadrul figurii (23.3), pentru
cazul particular al unui model de regresie liniară simplă, care include o singură
variabilă independentă.

Dreapta regresie populaţie

Dreapta regresie eşantion

- unităţi colectivitate
- unităţi eşantion

Variabila explicativă x
Figura 23.3: Ilustrarea grafică a legăturii dintre modelul teoretic
şi modelul estimator

Proprietatea conform căreia, sub ipoteza de medie nulă a perturbaţiei , funcţia


de regresie este o funcţie liniară, este echivalentă cu presupunerea că variabila
dependentă și variabilele independente sunt distribuite (simultan) după legea nor-
mală multidimensională.
Dacă vom face notaţiile următoare:

atunci modelul teoretic de regresie liniară multiplă şi modelul estimator al acestuia,


pot fi scrise sub formele matriciale următoare:

Pe baza modelului estimatorși u tilizând metoda celor mai mici pătrate, esti-
matorii pentru parametrii modelului de regresie liniară multiplă, în măsura în care
aceştia există, sunt definiţi de relaţia:

Ca variabile aleatoare, estimatorii de cele mai mici pătrate au mediile egale cu


valorile parametrilor pe care îi aproximează, adică:

şi matricea de covarianţă definită de relaţia:

unde reprezintă varianţa, constantă şi identică, a perturbaţiilor condiţionate. Mai


mult decât atât, dacă perturbaţiile condiţionate sunt distribuite după legea normală,
atunci şi estimatorii parametrilor sunt distribuiţi după legea normală (n+1)-dimen-
sională, respectiv:

Proprietatea de normalitate a estimatorilor este foarte utilă pentru construirea şi


utilizarea statisticilor t şi F, în scopul testării semnificaţiei statistice a parametrior
modelului de regresie liniară multiplă. Pe această bază, pot fi construite intervale
de încredere pentru parametrii modelului econometric. Astfel, intervalul de încre-
dere pentru cel de-al i-lea parametru al modelului de regresie liniară multiplă, este
de forma:

unde reprezintă estimatorul pentru abaterea standard a estimatorului , respec-


tiv rădăcina pătrată a celui de-al i-lea element de pe diagonala principală a matricii
estimator pentru matricea , reprezintă cuantila de ordinul 1 a
distribuţiei Student, corespunzătoare unui număr de T-n-1 grade de libertate,
iar reprezintă probabilitatea cu care se garantează apartenenţa la respectivul
interval de încredere.
Proprietatea de normalitate a estimatorilor este foarte utilă pentru construirea
şi utilizarea statisticilor t şi F, în scopul testării semnificaţiei statistice a parame-
trior modelului de regresie liniară multiplă. În condiţiile în care această proprietate
este verificată, se poate arăta că statistica:

este repartizată după legea Student, cu T-n-1 grade de libertate, respectiv:

Pe baza statisticii , evaluată în raport cu estimaţiile și , este testată o


ipoteză nulă de forma:
,
referitoare la semnificaţia statistică a parametrului . Procedura de testare bazată
pe testul t-Student, constă în următoarele: se stabileşte un prag de semnificaţie ,
de regulă egal cu 0,05 sau 0,01; se evaluează mărimea:

numită şi valoare calculată a testului t; se compară valoarea calculată cu


cuantila de ordinul a distribuţiei Student, corespunzătoare unui număr de T-
n-1 grade de libertate, notată .
În situaţia în care , se respinge ipoteza nulă , acceptân-
du-se ideea că parametrul diferă semnificativ de 0, ceea ce echivalează cu ideea
că variabila independentă poate fi considerată a având o influenţă semnificativă
asupra variabilei dependente Y. În cazul contrar, în care , se
acceptă ipoteza nulă , adică ideea că parametrul nu diferă semnificativ de 0.
În această situaţie, variabila independentă poate fi considerată ca fiind nesemni-
ficativă şi trebuie să se procedeze la o respecificare a modelului econometric, astfel
încât acesta să nu mai includă variabila independentă
Cel de-al doilea test de semnificaţie, cunoscut sub numele de testul F-Fisher,
este utilizat pentru testarea simultană a semnificaţiei statistice a tuturor para-
metrilor modelului de regresie liniară multiplă, cu excepţia parametrului intercept
, respectiv pentru testarea unei ipoteze nule de forma:

Logica testului F se bazează pe rezultatul furnizat de teorema de descompnere


a varianţei. În condiţiile în care funcţia de regresie descrie media condiţionată şi în
care este verificată ipoteza de homoscedasticitate a perturbaţiilor condiţionate, res-
pectiv ipoteza conform căreia , rezultatul (23.5) al acestei teoreme
poate fi scris sub forma relaţiei:

Considerând estimatorii pentru cele trei elemente ale acestei descompuneri,


vom obţine următoarea relaţie estimator a descompunerii varianţei:
unde , şi reprezintă estimatorii pentru varianţa variabilei
aleatoare Y, varianţa mediei condiţionate , respectiv varianţa
perturbaţiilor condiţionate, estimatori definiţi de relaţiile:
;

unde este variabila aleatoare definită de relația:

Pe baza acestor estimatori, relaţia estimator a descompunerii varianţei poate fi


rescrisă sub forma:
,
cunoscută sub numele de relaţie de descompunere a sumei pătratelor abaterilor.
Termenul din primul membru al acestei relaţii se numeşte suma totală a pătra-
telor abaterilor (SPT), iar cei doi termeni din cel de-al doilea membru se numesc
suma pătratelor abaterilor explicate de regresie (SPE), respectiv suma pătratelor
abaterilor reziduale sau neexplicate de regresie (SPR), astfel încât putem scrie:

Relaţia estimator a descompunerii varianţei totale a variabilei dependente Y


poate fi utilizată şi pentru construirea unui estimator al raportului de determinaţie
multiplă , pe baza relaţiei:

Estimatorul pentru raportul de determinaţie multiplă poate fi construit şi pe


baza relaţiei de descompunere a sumei totale a pătratelor abaterilor, sub forma:

Valoarea raportului de determinaţie multiplă este cu atât mai mare, cu cât


suma pătratelor abaterilor explicate de regresie este mai mare, respectiv suma
pătratelor abaterilor reziduale mai mică. Din acest motiv, un model econometric
poate fi considerat a fi cu atât mai bun, cu cât valoarea raportului de determinaţie
multiplă , va fi mai apropiată de 1. Se poate arăta că, în condiţiile în care ipoteza
nulă este adevărată, statistica:

este repartizată după legea de probabilitate Fisher, cu un număr de n, respectiv T-n-


1 grade de libertate, adică:

Procedura de testare bazată pe testul F-Fisher, constă în următoarele: se stabi-


leşte un prag de semnificaţie , de regulă egal cu 0,05 sau 0,01; pe baza modelului
estimat şi a datelor existente, se evaluează mărimea:
numită şi valoare calculată a testului F, unde:
;
se compară valoarea calculată cu cuantila de ordinul a distribuţiei
Fisher, corespunzătoare unui număr de n, respectiv T-n-1 grade de libertate, notată
cu . În situaţia în care , se respinge ipote-
za nulă , acceptându-se ideea că cel puţin unul dintre parametrii
diferă semnificativ de 0. În cazul contrar, în care , se
acceptă ipoteza nulă , adică ideea că niciunul dintre parametrii nu
diferă semnificativ de 0, fiind necesară respecificarea modelului econometric.
Deoarece X este o matrice de constante, iar Y este vectorul formelor condi-
ţionate ale variabilei aleatoare Y, elementele vectorului estimator b, respectiv esti-
matorii , au natură de variabile aleatoare, definite sub forma unor com-
binaţii liniare de variabilele dependente condiţionate .
Estimaţiile pentru parametrii modelului de regresie sunt obţinute prin evalua-
rea estimatorului b, în raport cu observaţiile disponibile pentru variabila depen-
dentă Y, respectiv:
(23.13)
unde .
Construcţia modelului de regresie liniară multiplă, se bazează pe o serie de
ipoteze privind mecanismul aleator care generează datele, numite ipoteze funda-
mentale ale modelului de regresie liniară. Impunerea acestor ipoteze vizează două
lucruri foarte importante: asigurarea posibilităţii de estimare a parametrilor mode-
lului, pe baza datelor existente, respectiv asigurarea contextului necesar pentru con-
struirea unor teste de semnificaţie pentru mărimile care intervin în model.
Ipotezele fundamentale ale modelului de regresie liniară multiplă, în varianta
sa generală, în care include termen liber şi regresori stohastici, sunt următoarele:
a. perturbaţiile condiţionate εt au mediile nule, respectiv:
;
b. perturbaţiile condiţionate εt sunt homoscedastice, adică au varianţă cons-
tantă, respectiv:
;
c. perturbaţiile condiţionate εt sunt necorelate două câte două (necorelare
serială), respectiv:
;
d. perturbaţiile condiţionate εt sunt distribuite după legea normală, respectiv:
;
e. perturbaţiile condiţionate εt sunt necorelate cu regresorii propriu-ziși,
respectiv:
;
f. matricea de observaţii X are rang complet, respectiv:
;
g. atunci când volumul eşantionului creşte nelimitat, matricea tinde
către o matrice finită şi nesingulară, respectiv:

. Îndeplinirea ipotezelor fundamentale ale modelului de regresie liniară multiplă


este importantă din punct de vedere al asigurării existenţei estimatorilor, cum este
cazul ipotezei (vi), al obţinerii de estimatori cu proprietăţi calitative adecvate, cum
este cazul ipotezelor (i), (ii), (iii), (v) şi (vii) și al creării posibilității de construire a
unor teste de semnificaţie (testul t sau testul F) , cum este cazul ipotezei (iv),
referitoare la normalitatea perturbaţiilor condiţionate.
Deoarece verificarea îndeplinirii celor mai multe dintre ipotezele fundamentale
ale modelului de regresie liniară se bazează pe reziduurile estimate, definite vecto-
rial de relaţia:

această verificare poate fi făcută numai după ce modelul a fost estimat.


Pentru verificarea îndeplinirii ipotezelor fundamentale ale modelului de regre-
sie multiplă sunt utilizate o serie de proceduri şi teste, cum ar fi testele Goldfeld-
Quandt, Gleisjer şi White, pentru verificarea îndeplinirii ipotezei de homosce-
dasticitate a pertubaţiilor condiţionate, testele Durbin-Watson şi Breusch-Godfrey,
pentru verificarea îndeplinirii ipotezei de necorelare a pertubaţiilor condiţionate,
testele Klein şi Farrar-Glauber pentru verificarea absenţei fenomenului de multi-
coliniaritate etc.
O procedură generalizată de definire a estimatorilor, în situaţia în care per-
turbaţiile condiţionate se dovedesc a nu verifica ipotezele de homoscedasticitate şi
de necorelare serială, adică ipotezele (ii) şi (iii), este cea cunoscută sub numele de
metoda celor mai mici pătrate generalizate. Estimatorii obţinuţi prin intermediul
acestei metode, numiţi şi estimatori Aitken, sunt definiţi de relaţia:

iar matricea de covarianță a acestora este definită de relația:

unde este matricea de covarianţă a perturbaţiilor condiţionate, care se estimează


pe baza reziduurilor estimate, utilizând proceduri speciale.
În toate cazurile în care una dintre ipoteze nu este îndeplinită, este necesar să
se facă o serie de corecţii asupra modelului de regresie, cu ajutorul unor proceduri
de corecţie specifice, astfel încât în urma aplicării acestor corecţii, să se asigure
îndeplinirea tuturor ipotezelor.
După ce modelul de regresie liniară multiplă a fost estimat şi testat din punct
de vedere al îndeplinirii ipotezelor fundamentale ale acestuia, urmează etapa de
verificare a calităţii modelului. Aprecierea calităţii unui model de regresie se
referă la acurateţea cu care acesta descrie relaţia de cauzalitate, aşa cum este ea
reflectată la nivelul datelor utilizate pentru estimarea modelului. În acest scop, sunt
utilizaţi o serie de indicatori statistici, dintre care menţionăm: statisticile t şi F,
raportul de determinaţie R2 , statisticile Akaike şi Schwarz etc.
Dacă în urma verificării calităţii sale, modelul econometric se dovedeşte a nu
îndeplini criteriile minime necesare calificării sale ca model valid, este necesar ca
întregul demers econometric să fie reluat, de la început, cu specificarea unei alte
forme a acestuia. Procesul de respecificare a modelului este reluat succesiv, până
când se ajunge la o formă a modelului care, după estimare şi verificarea îndeplinirii
ipotezelor, se dovedeşte a îndeplini şi criteriile de calitate minimale.

Predicţia cu ajutorul modelului de regresie


După ce modelul econometric a fost identificat, estimat şi validat, el poate fi
utilizat pentru efectuarea de predicţii privind manifestarea comportamentului feno-
menului efect, în alte condiţii decât cele reprezentate de valorile pe care le au
variabilele independente la nivelul eşantionului de observaţii.
În condiţiile în care o variabilă aleatoare Y este privită într-un context unidi-
mensional, reprezentat de distribuţia sa marginală, cea mai bună predicţie pentru
valorile acestei variabile aleatoare, predicţie pe care o vom nota cu , este repre-
zentată de media respectivei variabile aleatoare, adică:

Într-un context informaţional mai bogat, reprezentat de distribuţia multi-


dimensională (simultană) a variabilelor aleatoare şi în condiţiile în
care se presupune că se cunosc valorile variabilelor aleatoare , cea mai
bună predicţie pentru valorile variabilei aleatoare Y, este reprezentată de media
condiţionată a respectivei variabile aleatoare, dându-se valorile variabilelor alea-
toare , adică:

Într-adevăr, se poate arăta că predicţia bazată pe media condiţionată are o serie


de proprietăţi aproximante mai bune pentru valorile necunoscute ale variabilei
predictate Y, cum ar fi proprietatea de eroare medie pătratică minimă.
În cadrul specific al econometriei, problema predicţiei comportamentului
variabilei dependente Y, poate fi formulată sub forma următoare: presupunând că se
dispune de o informaţie suplimentară privind valorile celor n variabile indepen-
dente , informaţie reprezentată de valorile cunoscute
, care se numesc şi valori de predicţie şi care diferă de valorile din rândurile
matricii de observaţii , se cere să se determine o aproximaţie pentru
valoarea corespunzătoare a variabilei dependente Y, aproximare numită valoare
predictată.
Dacă vom presupune că relaţia dintre variabila dependentă Y şi variabilele
independente este descrisă de modelul teoretic:

atunci mulţimea de valori pe care le poate lua variabila aleatoare Y, dându-se valo-
rile de predicţie , poate fi privită ca fiind mulţimea valori-
lor variabilei condiţionate , al cărei comportament este descris de relaţia:
Am arătat anterior că, în condiţiile ipotezei de medie nulă a perturbaţiilor
condiţionate , funcţia de regresie (teoretică) descrie chiar
media condiţionată, ceea ce înseamnă că, din punct de vedere teoretic, valorile
necunoscute ale variabilei condiţionate pot fi aproximate cu ajutorul relaţiei:

Tot din punct de vedere teoretic, variabila aleatoare condiționată definită de


diferenţa:

descrie eroarea acestei aproximări. În condiţiile îndeplinirii ipotezelor de medie


nulă şi de homoscedasticitate, perturbaţia condiţionată este o variabilă alea-
toare, cu media şi varianţa date de relaţiile:

Din nefericire însă, deoarece parametrii sunt mărimi necunos-


cute, mărimea nu poate fi calculată în mod efectiv, astfel încât această mări-
me nu poate fi utilizată pentru predictarea valorilor variabilei condiţionate .
O modalitate efectivă de predictare a valorilor variabilei condiţionate , pe
baza mediei condiţionate, poate fi definită pornind de la forma modelului estima-
tor, în conformitate cu care valorile variabilei condiţionate , corespunzătoare
valorilor de predicţie , sunt descrise de relaţia:

În acest context, predicţia pentru valorile variabilei condiţionate , capătă


natura unei variabile aleatoare numită predicție și definită de relaţia:

Variabila predicţie apare ca având natura unui estimator pentru valorile


variabilei condiţionate , iar diferenţa:

care reprezintă tot o variabilă aleatoare, se numeşte eroare de predicţie. În calitatea


sa de reziduu, eroarea de predicţie are media nulă, respectiv , de
unde rezultă că:

Această proprietate evidenţiază faptul că, pe medie, predicţia bazată pe media


condiţionată este exactă, respectiv că această predicţie este nedeplasată. De aseme-
nea, în condiţiile în care estimatorii sunt obținuți cu ajutorul metodei
celor mai mici pătrate, varianţa erorii de predicţie este definită de relația:

măsoară gradul de “imprecizie” al predicţiei bazate pe media condiţionată și are


proprietatea că este minimală.
Prin evaluarea variabilei predicţie , în raport cu estimaţiile parametrilor
, se obţine valoarea predictată a variabilei condiţionate, respectiv
valoarea definită de relația:
În cazul modelului de regresie liniară multiplă, variabila predicţie şi va-
loarea predictată sunt definite de relaţiile:
,
iar eroarea de predicţie este definită de relaţia:

unde este vectorul valorilor de predicţie. Ca


urmare a faptului că:

media şi varianţa erorii de predicţie sunt următoarele:

Mai mult decât atât, dacă perturbaţiile condiţionate ,


sunt repartizate după legea normală, de medie nulă şi varianţă constantă , atunci
și eroarea de predicție este repartizată tot după legea normală, respectiv:

Pe această bază, pot fi construite intervale de încredere pentru valorile varia-


bilei predictate , intervale care sunt de forma:

unde reprezintă cuantila de ordinul a distribuţiei Student, cores-


punzătoare unui număr de T-n-1 grade de libertate, iar reprezintă proba-
bilitatea cu care se garantează apartenenţa valorilor variabilei la respectivul
interval de încredere.

§ 23.5 Analiza seriilor de timp


Analiza seriilor de timp este un alt capitol important al econometriei, care are
ca scop descrierea relaţiilor cauzale temporale dintre fenomenele economice. De-
mersul econometric întreprins în scopul descrierii relaţiilor cauzale temporale este
un demers complex şi dificil, care presupune parcurgerea mai multor etape.
Cea mai importantă şi consistentă modalitate de abordare în analiza seriilor de
timp este cea cunoscută sub numele de metodologia Box şi Jenkins. Conform aces-
tei metodologii, procesul econometric de analiză a seriilor de timp poate fi sinte-
tizat prin intermediul parcurgerii următoarelor etape: analiza grafică a seriei de
timp şi a autocorelogramelor acesteia; analiza sezonalităţii şi desezonalizarea
seriei de timp, în situaţia în care aceasta evidenţiază influenţe sezoniere, cu ajutorul
unor filtre de desezonalizare adecvate; verificarea staţionarităţii seriei de timp, cu
ajutorul testelor de tip ‘unit root’; staţionarizarea seriei de timp, în cazul în care
aceasta se dovedeşte a fi nestaţionară, utilizând metode adecvate de staţionarizare,
în funcţie de natura nestaţionarităţii; alegerea modelului adecvat pentru seria de
timp staţionarizată, precum şi a ordinului de întârziere corespunzător, pe baza
analizei autocorelogramelor (simplă şi parţială) şi pe baza unor statistici speciale,
cum ar fi statisticile Akaike şi Schwarz; estimarea parametrilor modelului ales;
verificarea îndeplinirii ipotezelor fundamentale şi validarea modelului, cu ajutorul
unor teste statistice şi unor indicatori de calitate adecvaţi; utilizarea modelului
pentru efectuarea de predicţii.
Baza informaţională pentru modelarea econometrică din acest domeniu, este
reprezentată de datele de tip cronologic, numite serii de timp, obţinute din obser-
varea evoluţiei în timp a fenomenelor economice. În general, datele de tip serii de
timp reprezintă mulţimi de valori reale, de forma:

numite serii de timp unidimensionale, unde indicii indexează momen-


te sau intervale de timp şi verifică relaţia . De cele mai multe ori,
în special în domeniul economic, aceşti indici sunt consideraţi a reprezenta numere
naturale, respectiv , astfel încât seria de timp precedentă
poate fi reprezentată sub forma . În situaţia în care datele au o
structură vectorială, formată din două sau mai multe serii de timp unidimensionale,
de forma:

respectiva structură vectorială se numeşte serie de timp multidimensională. Valori-


le numerice , specifice seriei unidimensionale, respectiv valorile nu-
merice speci-
fice seriei multidimensionale, pot fi privite ca descriind stările unui fenomen sau
unor fenomene economice la diferite momente succesive de timp şi pot fi con-
siderate ca fiind un eşantion special de observaţii, pentru care modelul de selecţie
este reprezentat tot de o listă de variabile aleatoare de forma: sau
, în funcţie de
tipul seriei de timp, dar a cărui natură este fundamental deosebită accepţiunea
clasică dată eşantionului de observaţii.
În accepţiunea clasică a modelului de selecţie, cunoscută sub numele de eşan-
tion aleator şi specifică mai ales regresiei, variabilele aleatoare din
modelul de selecţie, sunt presupuse a fi identic şi independent distribuite. În cazul
econometriei seriilor de timp, variabilele din modelul de selecţie nu
mai pot fi considerate nici independente şi, de cele mai multe ori, nici identic
distribuite, motiv pentru care lista de variabile aleatoare , se mai
numeşte şi eşantion non-aleator.
În numeroase situaţii, în analiza seriilor de timp se consideră că starea unui
fenomen la un moment dat t, simbolizată prin intermediul variabilei aleatoare
, este influenţată de stările anterioare ale aceluiaşi fenomen, simbolizate prin
intermediul variabilelor aleatoare , astfel încât variabilele din
modelul de selecţie apar ca fiind strict dependente. De fapt, proprie-
tatea de dependenţă a acestor variabile aleatoare este tocmai cea care oferă posibi-
litatea modelării comportamentului pe care îl au în timp fenomenele economice. Pe
baza acestei proprietăţi, comportamentul în timp al fenomenului Y poate fi descris,
de exemplu, cu ajutorul unui model de forma:

În ceea ce priveşte proprietatea de non-identic distribuire a variabilelor alea-


toare din modelul de selecţie specific analizei seriilor de timp, această proprietate
se referă la faptul că, cel puţin în principiu, fiecare variabilă aleatoare are
propria sa lege de probabilitate, adică:

unde atât forma f a legii de probabilitate, cât şi valorile parametrilor acestei legi,
depind de indicele t, care indexează timpul.
Proprietatea de non-identic distribuire a variabilelor aleatoare ,
ridică o serie de dificultăţi, teoretice şi practice, în domeniul modelării seriilor de
timp. În scopul atenuării sau eliminării acestor dificultăţi, apare necesitatea de a
impune o serie de restricţii asupra distribuţiilor de probabilitate ale variabilelor
aleatoare , cele mai multe dintre aceste restricţii fiind asociate cu con-
ceptul de staţionaritate.
Seria de timp reprezentată generic prin intermediul listei de variabile aleatoare
, poate fi privită ca fiind o subsecvenţă compactă şi reindexată,
dintr-o listă infinită de variabile aleatoare, de forma:

listă cunoscută sub numele generic de proces stohastic (discret). În acest fel, seria
de timp apare ca fiind o sub-secvenţă continuă şi observabilă a unui proces sto-
hastic, motiv pentru care baza teoretică a modelării seriilor de timp este reprezen-
tată de teoria proceselor stohastice.

Procese stohastice: definire, indicatori şi tipuri


Procesele stohastice sau procesele aleatoare sunt construcţii statistice specia-
le, reprezentate de mulţimi de variabile aleatoare, indexate cu indici reprezentând
momente sau intervale de timp. Pe baza conceptului de proces stohastic, pot fi
construite modele matematice adecvate pentru descrierea stărilor şi evoluţiilor
celor mai variate şi mai complexe fenomene din economie. Din acest punct de
vedere, procesul stohastic poate fi considerat ca reprezentând modelul cel mai
general pentru clase foarte variate de fenomene din economie, cum ar fi: produsul
intern brut, rata inflaţiei, rata şomajului, cursul de schimb al monedelor, cotaţiile
bursiere zilnice ale unui titlu de valoare etc.
Conceptul matematic de proces stohastic datează din perioada anilor 1930, cu
toate că o serie de elemente care ţin de logica proceselor stohastice au fost utilizate
şi anterior pentru modelarea unor fenomene cu caracter stohastic.
Înainte de anii 1930, cele mai multe utilizări ale conceptelor stohastice au fost
mai ales în domeniul modelelor din fizică. În ceea ce priveşte domeniul economic,
prima utilizare a conceptelor stohastice datează din anul 1900, când francezul
Bachelier a încercat să modeleze comportamentul preţurilor acţiunilor tranzacţio-
nate la bursa din Paris.
Considerând un câmp de probabilitate , o mulţime de variabile
aleatoare reale, definite pe mulţimea evenimentelor elementare � , precum şi o
mulţime T, numită mulţime de parametri sau mulţime de indici, se numeşte proces
stohastic, cu mulţimea de parametri T, orice aplicaţie de forma:

În modelarea fenomenelor reale, mulţimea de parametri T reprezintă timpul,


iar variabilele aleatoare din mulţimea descriu stările unui sistem dinamic sau
evolutiv la diferite momente de timp , stări notate sub forma
, în cazul continuu, sau sub forma , în cazul discret. Aceasta
înseamnă că stările unui sistem dinamic, la diferite momente de timp, sunt presu-
puse a nu fi perfect determinate, ci a avea o natură aleatoare. În cadrul figurii
următoare, este ilustrată grafic ideea asocierii dintre evoluţia în timp a unui
fenomen economic şi conceptul de proces stohastic.

Y
Densitate de
probabilitate

Y(t1)

Y(t0)

t0 t1 t2 t
Figura 23.4: Ilustrarea naturii stohastice a evoluţiei unui fenomen
economic

Mulţimea de parametri T poate să fie o mulţime de valori de tip continuu,


reprezentată de intervale ale dreptei reale ℝ, sau o mulţime numărabilă de valori de
tip discret, cum ar fi mulţimea numerelor întregi ,
sau mulţimea numerelor naturale . În cazul în care mulţimea T
este de tip continuu, procesul stohastic se numeşte proces stohastic continuu şi se
notează cu , iar în cazul în care mulţimea T este de tip discret, procesul sto-
hastic se numeşte proces stohastic discret sau lanţ stohastic şi se notează cu .
Prin natura lor, seriile de timp din domeniul economic sunt asociate cu procesele
stohastice de tip discret, astfel că în cele ce urmează ne vom referi doar la această
clasă de procese stohastice.
Ca mulţime de variabile aleatoare, un proces stohastic poate fi caracterizat
printr-o mulţime de indicatori numerici specifici, reprezentaţi de momentele varia-
bilelor aleatoare care îl compun, momente cum ar fi: media, varianţa, covarianţa și
corelaţia. Cea mai importantă caracteristică numerică a unui proces stohastic este
reprezentată de speranţa matematică sau de media procesului stohastic. Fiind dat
procesul stohastic , se numeşte medie sau speranţă matematică funcţia:

unde reprezintă densitatea de probabilitate a variabilei aleatoare .


O altă caracteristică numerică importantă a unui proces stohastic este repre-
zentată de varianţă, definită de funcţia:

Cea de-a treia caracteristică numerică importantă a unui proces stohastic este
reprezentată de covarianţă sau autocovarianţă, definită de funcţia:

numită şi funcţie de autocovarianţă, unde reprezintă densitatea de pro-


babilitate bidimensională a variabilelor aleatoare şi . După cum se poate
observa, pentru , covarianţa procesului stohastic coincide cu varianţa sa, res-
pectiv .
Din punct de vedere al modelării econometrice, cea mai importantă caracte-
ristică numerică a unui proces stohastic este reprezentată de corelaţie sau auto-
corelaţie, definită de funcţia:

unde diferenţa de indici , se numeşte ordin al corelaţiei sau autocorelaţiei.


În multe situaţii, funcţia de corelaţie a unui proces stohastic, mai este numită şi
funcţie de autocorelaţie a procesului stohastic.
Din felul în care sunt definite, rezultă că funcţia de autocovarianţă şi funcţia de
autocorelaţie sunt funcţii simetrice, respectiv:

În funcţie de deosebirile care pot exista între distribuţiile de probabilitate ale


variabilelor aleatoare care compun un proces stohastic, acesta din urmă poate fi de
două feluri: staţionar şi nestaţionar.
Procesul stohastic se numeşte strict (tare) staţionar, dacă distribuţiile
de probabilitate n-dimensionale ale oricărui n-uplu de variabile aleatoare
, sunt invariante la orice translatare a indicilor , adică dacă:
.
unde reprezintă densitatea de probabilitate n-dimensională.
În analiza econometrică a seriilor de timp, proprietatea de staţionaritate strictă
a proceselor stohastice este considerată a fi prea restrictivă în raport cu scopurile
concrete ale modelării din acest domeniu, astfel încât este utilizată o proprietate de
staţionaritate mai slabă, numită staţionaritate slabăsau de ordinul II. Procesul sto-
hastic se numeşte slab staţionar, staţionar în sens larg, staţionar de
ordinul II sau staţionar în covarianţă, dacă ele verifică următoarele condiţii:

Cu alte cuvinte, procesul stohastic se numeşte slab staţionar, dacă


media şi varianţa acestuia sunt constante, iar covarianţa nu depinde de indicii t şi t’,
ci doar de diferenţa . Un proces stohastic care nu este staţionar de ordinul II,
deci nici strict staţionar, se numeşte proces stohastic nestaţionar.
Cel mai important proces stohastic de tip staţionar (de ordinul II), este
reprezentat de procesul numit ‘zgomot alb’ (white noise). Procesul stohastic
, se numeşte ‘zgomot alb’ dacă variabilele aleatoare care îl compun sunt
identic distribuite şi verifică următoarele trei condiţii:

După cum se poate observa, procesul de tip ‘zgomot alb” verifică cele trei
condiţii de slabă staţionaritate. Mai mult decât atât, el are covarianţele, şi deci şi
corelaţiile, nule, motiv pentru care se mai numeşte şi proces fără memorie.
O variantă importantă a procesului aleator de tip ‘zgomot alb’ este cea cunos-
cută sub numele proces Gaussian. Procesul stohastic , se numeşte proces
Gaussian, dacă el este un proces de tip ‘zgomot alb’ şi, în plus, variabilele care îl
compun sunt repartizate după legea normală, respectiv:

În cadrul figurii următoare, sunt reprezentate 100 de observaţii, efectuate


asupra unui proces stohastic staţionar, de tip ‘zgomot alb’.
12

-4

Ca-8urmare a faptului că nu sunt autocorelate, procesele de tip ‘zgomot alb’ se mai numesc procese non-in

-12
10 20 30 40 50 60 70 80 90 100

Figura 23.5: Reprezentarea grafică a observaţiilor unui proces


stohastic de tip ‘zgomot alb’
Pentru a verifica dacă un anumit proces stohastic staţionar, are natură de ‘zgo-
mot alb’, sunt utilizate o serie de teste statistice, care vizează testarea semnifica-
ţiilor coeficienţilor de autocorelaţie de diferite ordine. Cele mai importante dintre
aceste teste sunt cele bazate pe statisticile Q ale lui Ljung-Box și Box-P ierce.
Cel mai important proces stohastic de tip nestaţionar, este reprezentat de pro-
cesul numit ‘mers aleator’ sau ‘mers la întâmplare’ (random walk). Procesul
stohastic , se numeşte ‘mers aleator simplu’, dacă variabilele aleatoare
care îl compun sunt legate între ele prin relaţia de recurenţă:

respectiv ‘mers aleator cu derivă’, dacă variabilele aleatoare care îl compun sunt
legate între ele prin relaţia de recurenţă:

unde defineşte un proces aleator de tip ‘zgomot alb’, iar c este o constantă.
Se poate arăta că media procesului de tip ‘mers aleator simplu’ este constantă,
deci nu depinde de timp, însă varianţa acestuia depinde de timp, respectiv:

Procesele stohastice de tip ‘mers aleator’ se mai numesc şi procese cu ‘rădă-


cină unitate’ (‘unit root’) sau procese cu trend de tip stohastic. În cadrul figurii
următoare, sunt reprezentate 100 de observaţii, efectuate asupra unui proces stohas-
tic nestaţionar, de tip ‘mers aleator simplu’.

70

60

50

40

30

20

10

0
10 20 30 40 50 60 70 80 90 100
Figura 23.6: Reprezentarea grafică a observaţiilor unui
proces stohastic de tip ‘mers aleator simplu’

Împărţirea proceselor stohastice pe cele două categorii, staţionare (slab) şi


nestaţionare, este extrem de importantă pentru întregul demers întreprins în
contextul modelării seriilor de timp.
Baza teoretică pentru modelarea seriilor de timp este reprezentată de un
rezultat important din teoria proceselor stohastice, cunoscut sub numele de teorema
de descompunere Wold (1938), care asigură premisele teoretice necesare pentru
construirea unei reprezentări formalizate pentru procesele stohastice, reprezentare
care este chiar modelul econometric. Din nefericire însă, teorema oferă baza
teoretica doar pentru reprezentarea proceselor stohastice slab staţionare. Conform
acestei teoreme, orice proces stohastic slab staţionar, admite o reprezentare
formalizată, de tip medie mobilă (MA-Moving Average). Astfel, dacă este
un proces stohastic slab staţionar, atunci el poate fi reprezentat sub forma:
,
numită reprezentare de tip medie mobilă infinită (MA(∞)), unde este o mărime
deterministă, sunt variabile aleatoare numite şocuri, inovaţii sau perturbaţii,
având natura proceselor stohastice de tip ‘zgomot alb’, cu mediile, varianţele şi
covarianţele verificând condiţiile:

iar sunt parametri ai reprezentării, care verifică următoarele condiţii:


R,
Variabila aleatoare se numeşte inovaţie curentă sau inovaţie contemporană
şi are acelaşi rol cu cel pe care îl au perturbaţiile în modelele econometrice, iar
variabilele aleatoare , se numesc inovaţii trecute sau inovaţii
istorice şi au rol de “factori explicativi”.
Utilizând un operator specific proceselor stohastice, respectiv operatorul de
întârziere L, definit sub forma:
,
decompunerea Wold poate fi rescrisă sub forma:
,
sau sub forma:

unde:

se numeşte polinom de întârziere de grad infinit.


Posibilitatea efectivă de reprezentare sau de modelare a proceselor stohastice
staţionare, care rezultă din teorema de descompunere Wold, se referă la faptul că
orice astfel de proces stohastic poate fi “aproximat” prin trunchierea reprezentării
Wold, sub forma următoare:

formă care poate fi considerată a reprezenta un model econometric operaţional al


procesului stohastic respectiv şi care se numeşte medie mobilă de ordinul p. Utili-
zând polinomul de întârzieri, reprezentarea anterioară poate fi rescrisă sub forma:

unde:
Din nefericire însă, utilizarea acestui rezultat fundamental este foarte limitată,
deoarece în cele mai multe dintre situaţii fenomenele din economia reală au evo-
luţii pentru care nu se verifică decât foarte rar proprietatea de staţionaritate, nici
măcar în varianta slabă a acesteia. Din acest motiv, pentru a putea descrie în mod
adecvat evoluţiile de acest tip, apare necesitatea ca procesele stohastice sau seriile
de timp să fie supuse unor operaţii preliminare de staţionarizare, în urma cărora se
obţin procese stohastice sau serii de timp sta ționare .
După cum se poate observa, deşi descompunerea Wold asigură existenţa unui
model econometric pentru orice proces stohastic slab staţionar, forma acestui
model apare ca fiind oarecum nenaturală. Această lipsa de naturaleţe este dată de
faptul că, într-un astfel de model, variabila dependentă este explicată prin inter-
mediul unor factori care par relativ “ciudaţi”, reprezentaţi de şocurile sau ino-
vaţiile , care definesc un proces de tip ‘zgomot alb’ şi care au o natură
neobservabilă. Cu toate acestea, în anumite condiţii se poate trece de la repre-
zentarea Wold de tip medie mobilă, la o altă reprezentare a procesului stohastic
staţionar, cu mult mai naturală, care este reprezentarea de tip autoregresiv.

Clase de modele pentru serii de timp unidimensionale


Există mai multe modalităţi de reprezentare sau modele pentru procesele
stohastice sau pentru seriile de timp, dintre care cele mai importante sunt
următoarele:

a. Reprezentarea de tip medie mobilă (MA)


Un proces stohastic admite o reprezentare de tip medie mobilă de
ordinul p (numit ordin de întârziere), notată cu şi numită model de tip
medie mobilă de ordinul p, dacă şi numai dacă el poate fi scris sub forma:

unde , iar celelalte elemente au semnificaţiile prezentate anterior. Folo-


sind scrierea bazată pe polinomul de întârzieri, reprezentarea capătă forma
condensată următoare:

unde:

se numeşte polinom de întârzieri al reprezentării de tip medie mobilă.


Aşa cum am menţionat anterior, existenţa acestei reprezentări este garantată
de rezultatul teoremei lui Wold. De fapt, se poate arăta că orice proces stohastic
care admite o astfel de reprezentare este un proces stohastic staţionar. Mai mult
decât atât, se poate arăta că dacă toate rădăcinile polinomului de întârzieri
au modulul strict mai mare decât unitatea, atunci se poate trece de la repre-
zentarea de tip , la o reprezentare de tip autoregresiv . Această pro-
prietate este cunoscută sub numele de proprietate de inversabilitate a reprezentării
de tip medie mobilă.
b. Reprezentarea de tip autoregresiv (AR)
Un proces stohastic admite o reprezentare de tip autoregresiv de
ordinul q (numit ordin de întârziere), notată cu şi numită model autore-
gresiv de ordinul q, dacă şi numai dacă el poate fi scris sub forma:

Folosind scrierea bazată pe polinomul de întârzieri, reprezentarea


capătă forma condensată următoare:

unde:

se numeşte polinom de întârzieri al reprezentării de tip autoregresiv.


Un proces aleator care admite o reprezentare de tip autoregresiv, poate fi
staţionar sau nestaţionar, în funcţie de natura rădăcinilor polinomului său de
întârzieri. Astfel, dacă toate rădăcinile polinomului de întârzieri au modulul
strict mai mare decât unitatea, procesul respectiv este staționar. De asemenea,
indiferent de natura rădăcinilor polinomului de întârzieri , se poate trece de la
reprezentarea de tip autoregresiv, la reprezentarea de tip medie mobilă, ceea ce
înseamnă că un astfel de proces este totdeauna inversabil.

c. Reprezentarea de tip autoregresiv-medie mobilă (ARMA)


Un proces stohastic admite o reprezentare mixtă de tip autore-
gresiv-medie mobilă de ordinele q şi p, notată cu şi numită model
(mixt) autoregresiv-medie mobilă de ordinele q şi p, dacă şi numai dacă el poate fi
scris sub forma:

Folosind scrierea bazată pe polinoamele de întârzieri ale celor două repre-


zentări anterioare, reprezentarea capătă forma condensată următoare:

unde şi sunt polinoamele de întârzieri corespunzătoare.

Staţionarizarea seriilor de timp


Aşa cum am menţionat anterior, teorema de descompunere Wold asigură fun-
damentarea posibilităţilor de modelare doar pentru procesele aleatoare de tip staţio-
nar, procese care pot fi modelate cu ajutorul modelelor econometrice aparţinând
oricăreia dintre cele trei clase de modele menţionate anterior. În cazul în care seria
de timp, concretizată prin datele disponibile pentru analiză, evidenţiază existenţa
unui proces aleator nestaţionar, apare necesitatea staţionarizării procesului stohastic
sau seriei de timp, cu ajutorul unor metode specifice.
Metodele de staţionarizare a seriilor de timp nestaţionare diferă în funcţie de
natura nestaţionarităţii respectivelor serii de timp. De obicei, nestaţionaritatea pe
care o poate evidenţia o serie de timp, este determinată de două cauze importante:
existenţa unui trend de tip determinist, respectiv existenţa unui trend stohastic.
Procesele stohastice nestaţionare din motive de existenţă a unui trend deter-
minist se numesc procese de tip TS (Trend Stationary) şi includ o componentă care
poate fi descrisă cu ajutorul unei funcţii de timp, de regulă o funcţie polinomială,
pe care o vom nota cu . Totdeauna, staţionarizarea proceselor stohastice sau
seriilor de timp de tip TS se face prin metoda cunoscută sub numele de detrendare,
care constă în operaţia de eliminare a trendului estimat din elementele seriei de
timp. Teoretic, dacă seria de timp este reprezentată de lista de variabile aleatoare
, operaţia de detrendare este descrisă de relaţia:

unde reprezintă un element generic al seriei de timp detrendate.


Procesele stohastice nestaţionare din motive de existenţă a unui trend stohas-
tic, se numesc procese de tip DS (Diferency Stationary), procese integrate sau
procese cu rădăcină unitate (‘unit root’) şi includ o componentă de natura proce-
sului de tip ‘mers aleator’. Totdeauna, staţionarizarea seriilor de timp de tip DS, se
face prin metoda cunoscută sub numele de diferenţiere şi bazată pe operatorul de
diferenţă Δ, definit sub forma:
.
Pentru staţionarizarea unei serii de timp nestaţionare, pot fi necesare mai
multe operaţii succesive de diferenţiere. Numărul de operaţii de diferenţiere nece-
sar pentru a staţionariza o serie de timp nestaţionară se numeşte ordin de integrare
al seriei de timp. Astfel, dacă seria de timp este o serie nestaţionară de tip DS,
însă poate fi staţionarizată prin efectuarea unui număr de d diferenţieri succesive,
atunci ea se numeşte serie de timp integrată de ordinul d şi se notează sub forma:
.
În acest context, este evident că dacă seria de timp este staţionară, atunci ea
este integrată de ordinul d=0, adică . De asemenea, dacă seria de timp
este integrată de ordinul d, adică , atunci:

Studiile econometrice efectuate până în prezent evidenţiază faptul că evoluţiile


în timp ale celor mai multe dintre fenomenele economice, au natura unor procese
integrate de ordinul 1 şi cel mult 2, ceea ce înseamnă că staţionaritatea acestora
este obţinută după cel mult două diferenţieri.
Având în vedere că procesele stohastice care admit o reprezentare de tip
sunt procese staţionare, problema existenţei unor procese de tip DS sau cu
‘rădăcină unitate’ apare numai în legătură cu procesele stohastice care admit repre-
zentări în care apare o componentă autoregresivă, cum ar fi procesele de tip
şi . De fapt, problema existenţei rădăcinilor unitate vizează
polinomul de întârzieri asociat acestor reprezentări.
Dacă polinomul de întârzieri dintr-o astfel de reprezentare a unui proces
stohastic are una sau mai multe rădăcini egale cu unitatea, atunci procesul este de
tip DS sau cu ‘rădăcină unitate’, iar ordinul său de integrare este dat de numărul
rădăcinilor egale cu unitatea. De exemplu, procesul stohastic de tip ‘mers aleator
simplu’, care are o reprezentare de tip , respectiv:
este un proces nestaţionar, a cărui nestaţionaritate este determinată de existenţa
unui trend de tip stohastic. Aceasta înseamnă că ‘mersul aleator simplu’ este un
proces de tip DS sau cu o ‘rădăcină unitate’, care poate fi staţionarizat printr-o
singură diferenţiere, adică . Într-adevăr, din rescrierea reprezentării acestui
proces sub forma:

rezultă că diferenţa de ordinul întâi a acestuia este staţionară, deoarece variabila


aleatoare defineşte un proces de tip ‘zgomot alb’, care este un proces staţionar.
Mai mult decât atât, utilizând operatorul de întârziere L, obţinem următoarea repre-
zentare a procesului ‘mers aleator simplu’:

pentru care polinomul de întârzieri este de forma , adică de gradul


întâi şi cu rădăcina egală cu unitatea.
Deoarece metoda de staţionarizare a unei serii de timp este strict dependentă
de natura nestaţionarităţii respectivei serii, cea mai importantă şi mai dificilă pro-
blemă a staţionarizării unei serii de timp este legată de modul în care poate fi
detectat tipul de nestaţionaritate, respectiv natura TS sau DS a seriei de timp.
Un rol fundamental în detectarea tipului de nonstaţionaritate a unei serii de
timp, respectiv în stabilirea naturii TS sau DS a acesteia, îl au aşa-numitele teste de
tip ‘rădăcină unitate’ sau ‘unit root’, cele mai reprezentative dintre acestea fiind de
testele Dickey-Fuller, Phillips-Perron și KPSS.
O altă clasă de reprezentări sau modele econometrice pentru seriile de timp
unidimensionale este cea specifică proceselor de tip DS integrate de ordinul d, care
după un număr de d diferenţieri devin staţionare şi admit o reprezentare de tip
. Modelele din această categorie sunt cunoscute sub numele de modele
şi au forma generală:

Pentru situaţia în care procesele din categoria precedentă includ şi o compo-


nentă sezonieră, există o altă clasă de modele econometrice, cunoscută sub numele
de modele şi care au reprezentarea generală:

unde s reprezintă periodicitatea sezonalităţii, care ia valorile 4, 12, 52 etc., pentru


sezonalitate trimestrială, lunară sau săptămânală, iar reprezintă operatorul
de diferenţiere sezonieră, a cărui utilizare are ca scop desezonalizarea seriei de
timp respective.
După ce seria de timp a fost staţionarizată, urmează etapa de alegere a mode-
lului econometric adecvat, dintr-una din clasele de modele specifice, etapă cunos-
cută sub numele de identificare a modelului.

Identificarea modelelor pentru seriile de timp unidimenionale


Seria de timp staţionarizată, prin detrendare - în cazul seriilor de timp de tip
TS, sau prin diferenţiere de un anumit ordin - în cazul seriilor de timp de tip DS,
poate fi modelată cu ajutorul unui model de tip , în
funcţie de proprietăţile numerice pe care aceasta le evidenţiază.
Cele mai importante și eficiente instrumente care pot fi utilizate pentru alege-
rea modelului econometric adecvat pentru o serie de timp staţionară sunt repre-
zentate de graficele estimaţiilor funcţiilor de autocorelaţie simplă şi parţială, cu-
noscute sub numele de autocorelograma simplă şi autocorelorama parţială. Esti-
maţiile pentru funcţia de autocorelaţie simplă pot fi calculate pe baza relaţiei:

unde k se numeşte ordinul coeficientului de autocorelaţie estimat,


reprezintă valorile observate ale seriei de timp, iar reprezintă media aritmetică a
acestor observaţii. Calculul estimaţiilor pentru funcţia de autocorelaţie parţială se
bazează pe estimarea unui model autoregresiv de forma:
,
Pornind de la varianta estimată a acestui model autoregresiv, estimaţia pentru
coeficientul corelaţie parţială de ordinul k se poate determina ca estimaţie a
coeficientului de autocorelaţie simplă dintre variabila aleatoare de tip reziduu
, pe de o parte, şi variabila aleatoare
, pe de altă parte, respectiv ca estimație definită sub forma:

Identificarea modelului econometric adecvat pentru o serie de timp, cu ajutorul


autocorelogramelor simplă şi parţială, se bazează pe următoarele idei:
• dacă autocorelograma simplă evidenţiază o descreştere rapidă, de tip
sinusoidal sau de tip exponenţial, a valorilor estimaţiilor coeficienţilor de autoco-
relaţie simplă , atunci modelul este de tip , cu ordinul de
întârziere q dat de numărul de coeficienţi de corelaţie parţială pentru care esti-
maţiile sugerează o semnificaţie statistică diferită de 0;
• dacă autocorelograma parţială evidenţiază o descreştere rapidă, de tip
sinusoidal sau de tip exponenţial, a valorilor estimaţiilor coeficienţilor de autoco-
relaţie parţială , atunci modelul este de tip , cu ordinul de
întârziere p dat de numărul de coeficienţi de corelaţie parţială pentru care esti-
maţiile sugerează o semnificaţie statistică diferită de 0;
• dacă autocorelograma simplă şi autocorelograma parţială evidenţiază o
descreştere rapidă, de tip sinusoidal sau de tip exponenţial, atât a valorilor esti-
maţiilor coeficienţilor de autocorelaţie simplă , cât şi a valorilor
estimaţiilor coeficienţilor de autocorelaţie parţială , atunci mode-
lul este de tip , iar ordinele de întârziere p şi q pot fi determinate pe
baza valorilor statisticilor Akaike şi Schwarz.
Pentru determinarea ordinelor corespunzătoare de întârziere ale modelelor de
tip , se poate proceda în felul următor: se estimea-
ză modelele respective pentru ordine succesive de întârziere, începând de la ordinul
1 şi până la un ordin suficient de mare; se calculează valorile statisticilor Akaike şi
Schwarz; se alege modelul cu ordinul de întârziere pentru care valorile acestor
statistici sunt cele mai mici.
Estimarea parametrilor modelelor pentru seriile de timp unidimensionale,
poate fi făcută cu ajutorul metodei celor mai mici pătrate sau metodei verosi-
milităţii maxime, în cazul modelelor de tip , sau cu ajutorul unor proceduri
de estimare speciale, în cazul modelelor de tip .
După ce modelul econometric al o seriei de timp a fost identificat, estimat şi
validat, acesta urmează a fi utilizat pentru efectuarea de predicţii, referitoare la
evoluţia viitoare a fenomenului economic reprezentat de variabila dependentă. În
cazul specific al modelelor de tip , cu forma generală:

efectuarea predicţiilor este bazată tot pe media condiţionată a variabilei depen-


dente, ca şi în cazul regresiei liniare multiple, cu menţiunea că valorile de condi-
ţionare sunt reprezate de valorile cunoscute ale stărilor anterioare ale variabilei
dependente. De exemplu, presupunând că T reprezintă momentul curent sau
“prezentul” şi că se cunosc realizările ,
unde , predicţia pentru valorile variabilei condiţionate este repre-
zentată de variabila aleatoare , ca estimator pentru valorile variabilei condi-
ţionate , definită de relaţia:

unde sunt estimatorii pentru parametrii . De asemenea,


eroarea de predicţie este definită de variabila aleatoare:

iar varianţa acesteia şi intervalul de încredere pentru predicţie se determină într-o


manieră similară cu cea din contextul regresiei liniare multiple.

Clase de modele pentru serii de timp multidimensionale


Abordarea econometrică unidimensională a seriilor de timp, bazată pe clasele
de modele de tip , este o abordare are o natură
excesiv simplificatorie şi nestructurală, în care evoluţia unui fenomen de tip efect,
este privită în mod izolat, fără a lua în considerare legăturile sale cu alte fenomene
de tip efect şi fără a ţine seama de o serie de restricţionări determinate de evoluţia
economică de ansamblu. De exemplu, în modelarea econometrică unidimensională
a comportamentului unui anumit tip de piaţă, cele două fenomene specifice acestei
pieţe, cererea (D) şi oferta (S), sunt privite şi descrise în mod izolat, prin modele
econometrice de forma:

fără a lua în considerare restricţionarea pe care tendinţa generală a pieţelor către


echilibrul dintre cerere şi ofertă, o impune asupra evoluţiei celor două fenomene,
astfel încât .
Faptul că evoluţia unor fenomene economice de tip efect este restricţionată de
manifestarea unor multiple condiţionări şi legături cu alte fenomene de tip efect,
necesită un alt tip de abordare econometrică, de natură structurală, care să ia în
considerare, într-o manieră de simultaneitate, comportamentul mai multor fenome-
ne de tip efect, între care se manifestă respectivele condiţionări şi legături.
Modelele econometrice pe care se bazează o astfel de abordare, sunt modele cu
natură multidimensională, vectorială sau structurală, respectiv sisteme de modele,
care includ descrieri simultane ale comportamentului “legat” al mai multor varia-
bile dependente.
Dintre cele mai cunoscute clase de modele econometrice de tip multidimen-
sional, menţionăm:
• modelele cu ecuaţii simultane, care sunt modele n-dimensionale de forma:
(23.15)
cunoscută sub numele de formă structurală, unde Y este vectorul n-dimensional al
variabilelor endogene , X este vectorul m-dimensional al variabilelor
exogene , unele dintre aceste variabile putând fi forme “întârziate” ale
variabilelor dependente, de tipul , este vecto-
rul n-dimensional al perturbaţiilor , iar A şi B sunt matrici de parametri
ai modelului, de dimensiune , respectiv ; o altă formă a modelului cu
ecuaţii simultane, utilizabilă în procedurile de estimare, este următoarea:
, (23.16)
cunoscută şi sub numele de formă redusă a modelului cu ecuaţii simultane.
• modelele de tip Vectori Autoregresivi (VAR), care sunt modele n-dimen-
sionale, generalizări ale modelelor autoregresive unidimensionale, de forma:

numită model VAR n-dimensional de ordinul q şi notată , unde este


vectorul n-dimensional al variabilelor endogene, sunt vectorii
n-dimensionali ai variabilelor exogene, care reprezintă variante “întârziate” ale
variabilelor endogene, este vectorul n-dimensional al perturbaţiilor “contem-
porane”, iar sunt matrici de parametri ai modelului, de dimen-
siune ;
• modelele de tip Vectori Medie Mobilă (VMA), care sunt modele n-dimen-
sionale, generalizări ale modelelor de tip medie mobilă unidimensionale, de forma:

numită model VMA n-dimensional de ordinul p şi notată , unde este


vectorul n-dimensional al variabilelor endogene, sunt vectorii n-
dimensionali ai inovaţiilor sau şocurilor trecute, cu rol de variabile exogene, este
vectorul n-dimensional al perturbaţiilor “contemporane”, iar
sunt matrici de parametri ai modelului, de dimensiune ;
• modelele de tip Vectori cu Corecţie de Erori (VECM), care sunt modele n-
dimensionale, cu natură de modele de tip VAR restricţionate, de forma:

numită model VECM n-dimensional de ordinul p şi notată , unde


∆ este operatorul n-dimensional de diferenţă de ordinul întâi, termenul ,
defineşte aşa-numitele relaţii de cointegrare sau relaţii de echilibru pe termen
lung, este o matrice de parametri, de dimensiune , numită matrice de cointe-
grare, sunt alte matrici de parametri ai modelului, de dimensiu-
ne , iar celelalte elementele componente au semnificaţii similare cu cele de la
modelul de tip VAR.
Modelarea structurală a fenomenelor economice, cu ajutorul modelelor econo-
metrice multidimensionale, se confruntă cu o serie de dificultăţi teoretice şi prac-
tice, mai ales în cazul special al modelelor cu ecuaţii simultane. În contextul
modelelor de acest tip, cea mai importantă dificultate este legată de aşa-numita
proprietate de identificabilitate a acestor modele.
Concret, problema identificabilităţii unui model cu ecuaţii simultane, se referă
la faptul că nu există totdeauna posibilitatea de a reconstitui toate estimaţiile para-
metrilor din forma structurală (23.15) a modelului, pornind de la estimaţiile
obţinute pentru forma redusă (23.16) a acestui model. Din acest punct de vedere,
modelele cu ecuaţii simultane pot fi de trei tipuri: subidentificate, identificate şi
supraidentificate. Exceptând modelele subidentificate, care nu pot fi estimate,
celelalte două categorii de modele cu ecua ții simultane pot fi estima te cu ajutorul
unor metode de estimare specifice.
În afara metodelor de estimare menţionate anterior pentru clasele de modele
unidimensionale, pentru estimarea claselor de modele multidimensionale ante-
rioare, sunt utilizate şi o serie de metode specifice, cum ar fi metoda indirectă a
celor mai mici pătrate – utilizată în cazul modelelor cu țiiecua simultane
identificate sau metoda celor mai mici în două faze – utilizată în cazul modelelor
cu ecuații simultane identificate și supraidentificate.

Bibliografie

[ 1] Bourbonnais R. (2009), Économétrie, 7e Édition, Dunod, Paris, 2009


[ 2] Bourbonnais R., Terraza M. (2008), Analyse des Séries Temporelles: Appli-
cations à l'économie et à la gestion, 2e Édition, Dunod, Paris, 2008
[ 3] Box G. E. P., Jenkins G. M. (1970), Time Series Analysis. Forecasting and
Control, Holden Day Inc., San Francisco, USA, 1970
[ 4] Clements M. P., Hendry, D. F. (1998), Forecasting Economic Time Series,
Cambridge University Press, Cambridge, 1998
[ 5] Davidson, R., MacKinnon J. G. (2004), Econometric Theory and Methods,
Oxford University Press, Oxford, 2004
[ 6] Enders, Walter, (2004), Applied Econometric Time Series, 2nd edition, John
Wiley & Sons Inc, 2004
[ 7] Engle R. F., Granger C. W. J. (1987), Co-integration and Error Correction:
Representation, Estimation and Testing, Econometrica, Volume 55, Issue 2,
Pages 251-276, 1987
[ 8] Gouriéroux, C., Monfort A. (1995), Statistics and Econometric Models,
Volumes 1 and 2, Cambridge University Press, Cambridge, U.K. 1995
[ 9] Granger C.W.J. (1978), Forecasting Economic Time Series, Academic
Press, New York, 1978
[10] Greene, William H., (2007), Econometric Analysis, 6th Edition, Prentice-Hall
International, New Jersey, USA, 2007
[11] Gujarati D. N. (1998), Essentials of Econometrics, Mc Graw-Hill, New
York, 1998
[12] Hamilton J. D. (1994), Time Series Analysis, Princeton University Press,
1994
Johnston J. (1984), Econometric Methods, 2nd Edition, McGraw-Hill Book Inc.,
New York, 1984
[13] Intriligator M., Bodkin R., Hsiao C. (2007), Econometric Models
Techniques and Applications, 2nd Edition, Prentice-Hall International Inc., New
Jersey, USA, 1996
[14] Maddala, G. S. (2001), Introduction to econometrics, 3rd Edition, John
Wiley & Sons, Chichester, England, 2001
[15] Pindyck R. S., Rubinfeld D. L. (1998), Econometric Models and Economic
Forecasts, 4th edition, McGraw-Hill Publishing, New York, USA, 1998
[16] Ruxanda Gh., Botezatu A. (2008), Spurious Regression and Cointegration.
Numerical example: Romania's M2 Money Demand, Journal for Economic
Forecasting, no. 3/2008, The Institute for Economic Forecasting, Bucharest, 2008
[17] Ruxanda Gh. (1997), An interpretation of the regression techniques, în
Computer Science, Editura INFOREC Printing House, Bucharest, Romania, 1997
[18] Ruxanda Gh. (2006), Measuring the stochastic dependence relationships
strength, în Economic Computation and Economic Cybernetics Studies and
Research, nr. 3-4/2006, Vol. 41, ASE, Bucharest, 2006
[19] Ruxanda Gh. (1998), Problems of interdependences measures, Economic
Computation and Economic Cybernetics Studies and Research, nr. 1-4/1998, Anul
XXXII, ASE, Bucharest, 1998;
[20] Thomas R. L. (1997), Modern Econometrics, Addison Wesley, Longman
Limited, Essex, England, 1997
[21] Wooldridge J. M. (2000), Introductory Econometrics: A Modern Approach,
3rd Edition, South-Western College, 2006