Sunteți pe pagina 1din 242

1 Introducere: Ce este econometria ?

1.1 Scurt istoric privind apariţia şi dezvoltarea econometriei

Un moment important în constituirea şi dezvoltarea Econometriei ca


disciplină economică de frontieră, apărută în domeniile de interferenţă ale
teoriei economice, statisticii şi matematicii, se consideră anul 1930
(29 decembrie), când s-a înfiinţat la Cleveland Societatea de Econometrie
(Econometric Society), avându-i ca iniţiatori pe: Irving Fischer – preşedinte,
L. V. Bortkiewicz, R. Frisch, H. Hotelling, L. Schumpeter, N. Wiener şi
alţii.
Un rol deosebit în dezvoltarea şi popularizarea econometriei l-a avut
revista acestei societăţi, „Econometrica”, care apare trimestrial, începând
din ianuarie 1933.
Etimologic, termenul de econometrie provine din cuvintele greceşti:
eikonomia (economie) şi metren (măsură). El a fost introdus (1926) de către
Ragnar Frisch, economist şi statistician norvegian, prin analogie cu termenul
„biometrie”, folosit de Fr. Galton şi K. Pearson la sfârşitul secolului XIX,
care desemna cercetările biologice ce utilizau metodele statisticii
matematice.
Dar nu cei care au introdus termenul şi au înfiinţat Societatea de
Econometrie au şi „inventat” această disciplină.
Sub aspect istoric, studierea cantitativă a fenomenelor economice
este mult mai veche. Printre precursorii econometriei moderne pot fi citaţi:
F. Quesnay, W. Petty, Gregory King, A. Cournot, Leon Walras, E. Engel, A.
Marshall, R. A. Fisher, K. Pearson şi alţii.
În perioada contemporană, contribuţii importante la dezvoltarea
econometriei au fost aduse de:
- în domeniul analizei economice a cererii: M. Friedman,
T. Haavelmo, R. Stone, H. Wald, ş.a.;
- în domeniul funcţiilor de producţie: C. W. Cobb, P. H. Douglas,
K. J. Arrow, G. Tintner;
- în domeniul modelelor macroeconomice: A. S. Goldberger,
O. Onicescu, L. V. Kantarevici, L. R. Klein, J. Tinbergen, H. Theil 1;
- în domeniul metodelor de analiză a datelor sau al econometriei
„fără modele”: T. W. Anderson, J. P. Benzécri, H. Hotelling, R. A. Fisher şi
alţii.
În momentul actual, impulsionată puternic de revoluţia tehnico-
ştiinţifică – cu realizări de vârf în domeniul calculatoarelor electronice –
econometria a devenit un instrument metodologic de bază, indispensabil
teoriei şi practicii economice pentru investigarea riguroasă a fenomenelor şi
proceselor economice.

1.2 Definiţiile econometriei

Dezvoltarea rapidă a econometriei a generat formularea mai multor


definiţii cu privire la domeniul acestei discipline economice. Totuşi, marea
majoritate a acestora poate fi încadrată în următoarele trei grupe:
a) definiţia istorică;
b) definiţia restrictivă;
c) definiţia extinsă.
a) Definiţia istorică a econometriei a fost formulată de R. Frisch în
primul număr al revistei „Econometrica”, în ianuarie 1933: „experienţa a
arătat că fiecare din următoarele trei puncte de vedere, al statisticii, al
teoriei economice şi al matematicii, este o condiţie necesară, dar nu şi
suficientă, pentru o înţelegere efectivă a realităţilor cantitative din economia

1
Numele scrise cu italice îi desemnează pe laureaţii Premiului Nobel în economie.
modernă; unificarea lor este aceea care asigură eficienţa. Econometria este
tocmai această unificare”.
Conform acestei definiţii, susţinătorii ei consideră că prin
econometrie se înţelege studierea fenomenelor economice pe baza datelor
statistice cu ajutorul modelelor matematicii.
b) Definiţia restrictivă propusă de Cowles Commission for
Research in Economics (Chicago, 1940-1950), consideră că nu există
econometrie dacă investigarea fenomenelor economice nu se face cu
ajutorul modelelor aleatoare (stochastice).
Susţinătorii acestei definiţii, L. R. Klein, E. Malinvaud, G. Rottier,
includ în domeniul econometriei numai cercetările economice care
utilizează metodele inducţiei statistice – teoria estimaţiei, verificarea
ipotezelor statistice – la verificarea relaţiilor cantitative formulate în teoria
economică cu privire la fenomenele sau procesele economice cercetate.
Conform acestor definiţii, un studiu econometric presupune:
- existenţa prealabilă a unei teorii economice privind fenomenul,
procesul sau sistemul economic cercetat, pe baza căreia se construieşte
modelul economic, care reprezintă formalizarea ipotezelor teoriei
economice cu privire la fenomenul, procesul sau sistemul investigat;
- posibilitatea aplicării metodelor inducţiei statistice la verificarea
ipotezelor teoriei economice; construirea modelului econometric şi
rezolvarea acestuia.
Această definiţie restrictivă exclude din domeniul econometriei
cercetările economice care nu se fundamentează pe:
- o teorie economică – implicită sau explicită privind modelul
econometric al fenomenului, procesului sau sistemului studiat;
- o interpretare aleatoare a modelului respectiv.
Astfel, analiza seriilor cronologice, modelul lui Leontief (B.L.R.) ca
şi statistica economică (care se fundamentează pe metoda balanţelor) nu
intră în sfera de cuprindere a econometriei: prima, deoarece existenţa unei
teorii economice nu este necesară, iar ultimele două, fiindcă nu permit
aplicarea metodelor inducţiei statistice.
c) Definiţia extinsă a econometriei, promovată de economiştii din
ţările anglo-saxone, ţine seama de puternica dezvoltare, apărută după 1950,
a metodelor cercetării operaţionale: teoria optimului, teoria stocurilor, teoria
grafelor, teoria deciziilor, teoria jocurilor, etc.
Prin econometrie, în sensul larg al termenului, se înţelege
econometria, definită în mod restrictiv, adică, include domeniile menţionate
atunci când ea este înţeleasă în sens restrictiv, la care se adaugă metodele
cercetării operaţionale. În prezent, în domeniul econometriei se includ şi
tehnicile moderne de analiză a datelor sau analiza marilor tabele.
Deoarece încă nu s-a cristalizat o concepţie unitară privind
„frontierele” econometriei, în manualele sau tratatele de econometrie,
autorii, de regulă, îşi menţionează concepţia pe baza căreia şi-au structurat
lucrările.
În ţara noastră, atât în literatura de specialitate, deşi rareori se fac
precizări exprese, cât şi prin structura planurilor de învăţământ de la
facultăţile economice, econometria este concepută şi aplicată ca metodă
generală de investigare cantitativă a fenomenelor şi proceselor economice –
adică, în accepţiunea largă a termenului.
Un domeniu mai puţin abordat, atât teoretic, cât şi practic, îl
constituie metodele econometriei, în sensul restrictiv al termenului,
respectiv modelele aleatoare (stochastice).
Modelele deterministe, utilizate în mod curent şi de multă vreme în
teoria şi practica economică din ţara noastră, sunt de multe ori inadecvate
pentru a explica şi, mai ales, pentru a prognoza pertinent evoluţia
fenomenelor, proceselor sau sistemelor economice, elemente dinamice prin
natura lor.
De asemenea, în studiile mult mai recente, se insistă asupra faptului
că studiul seriilor de timp privind evoluţia fenomenelor economice nu poate
fi independent de teoria economică. Se au în vedere, în acest sens, nu atât
determinarea şi extragerea econometrică a tendinţei, cât şi aspectele legate
de efectul întârziat în timp, propagarea impulsului unor variabile exogene
asupra variabilei prognozate, natura oscilaţiilor de diferite frecvenţe etc.
Acestea sunt motivele care au determinat ca modelele dinamice – bazate pe
analiza evoluţiei în timp a fenomenelor economice – să-şi găsească locul în
arsenalul modelelor econometrice prezentate în acest curs.

1.3 Noţiuni şi concepte fundamentale ale econometriei

Metoda modelelor sau metoda modelării reprezintă principalul


instrument de investigare econometrică a fenomenelor econometrice.
Dar, modelarea sau metoda modelelor nu constituie o noutate în
ştiinţa economică. Tabloul economic al economistului fiziocrat F. Quesnay
(1738), legile lui Engel (1857), coeficientul de elasticitate formulat de
Marshall (1890) reprezintă momente istorice de la care cercetarea
economică trece de la etapa descriptivă la etapa de explicare formală a
cauzelor şi formelor de manifestare ale fenomenelor economice.
În general, MODELUL reprezintă un instrument de cercetare
ştiinţifică, o imagine convenţională, homomorfă, simplificată a obiectului
supus cercetării.
Fiind o construcţie abstractă, în care se neglijează proprietăţile
neesenţiale, modelul este mai accesibil investigaţiei întreprinse de subiect,
aceasta fiind una din explicaţiile multiplelor utilizări pe care modelul le are
în epoca contemporană.
Utilizat în economie, modelul - imagine abstractă, formală a unui
fenomen, proces sau sistem economic – se construieşte în concordanţă cu
teoria economică, rezultând modelul economic.
Modelul economic, reproducând în mod simbolic teoria economică a
obiectivului investigat, prin transformarea sa în model econometric, devine
un obiect supus cercetării şi experimentării (verificării), de la care se obţin
informaţii noi privind comportamentul fenomenului respectiv.
În acest mod, reprezentările econometrice, spre deosebire de
modelele economice care explică structura fenomenului sau procesului
economic de pe poziţia teoriei economice, au întotdeauna o finalitate
practică, operaţională, ele devenind instrumente de control şi dirijare, de
simulare şi de previziune a fenomenelor economice.
VARIABILELE care formează structura unui sistem econometric,
după natura lor, pot fi:
a) variabile economice;
b) variabila eroare (aleatoare), u;
c) c) variabila timp, t.
a) Variabilele economice, de regulă, se împart în variabile explicate,

rezultative sau ENDOGENE, Yi , i  1, n , şi variabile explicative, factoriale

sau EXOGENE, Xj, j  1, k , independente de variabilele endogene Yi ;


(n = numărul variabilelor rezultative; k = numărul variabilelor factoriale). În
cazul modelelor de simulare sau de prognoză, variabilele Xj se mai împart în
variabile exogene predeterminate (variabile de stare a sistemului –
capacitatea de producţie a unei întreprinderi, sau cu
lag – xt-1, yt-1) şi variabile instrumentale sau de comandă economică
(dobânda, impozitul pe profit etc.)
b) Variabila ALEATOARE, u, sintetizează ansamblul variabilelor,
cu excepţia variabilelor Xj, care influenţează variabila endogenă Yi, dar care
nu sunt specificate în modelul econometric. Aceste variabile (factori), pe
baza ipotezelor teoriei economice, sunt considerate factori întâmplători
(neesenţiali), spre deosebire de variabilele Xj, care reprezintă factorii
determinanţi (esenţiali) ai variabilei Yi.
De asemenea, variabila eroare reprezintă eventualele erori de măsură
– erori întâmplătoare şi nu sistematice – conţinute de datele statistice privind
variabilele economice.
Pe baza acestor premise economice se acceptă că variabila aleatoare
„u” urmează o lege de probabilitate L(u), în acest scop formulându-se o
serie de ipoteze statistice cu privire la natura distribuţiei acestei variabile,
ipoteze statistice care vor trebui testate cu teste statistice adecvate fiecărei
ipoteze.
c) Variabila TIMP, t, se introduce în anumite modele econometrice
ca variabilă explicativă a fenomenului endogen Yi, imprimându-se acestora
un atribut dinamic, spre deosebire de modelele statice.
Deşi timpul nu poate fi interpretat ca variabilă concretă (economică),
se recurge la această variabilă explicativă (fictivă) din două motive:
- în primul rând, timpul, ca variabilă econometrică, permite
identificarea unor regularităţi într-un proces evolutiv, ceea ce constituie un
prim pas spre specificarea precisă a unor variabile care acţionează în timp;
- în al doilea rând, el reprezintă măsura artificială a acelor variabile
care acţionează asupra variabilei Y care, fiind de natură calitativă, nu pot fi
cuantificate şi, ca atare, nici specificate în modelul econometric. Un
exemplu cunoscut în acest sens îl constituie funcţia de producţie Cobb-
Douglas cu progres tehnic autonom:

Q = A Kα Lβ ect ·u (1.3.1)

unde:
Q = volumul fizic al producţiei;
K = capitalul;
L = forţa de muncă;
e = numărul natural;
t = timpul;
u = variabilă aleatoare;
A, α, β şi = parametrii funcţiei, c reprezentând măsura econometrică a
c
influenţei progresului tehnic asupra volumului producţiei.

Sursa de date - Variabilele economice se introduc într-un model


econometric cu valorile lor reale sau empirice (yi = y1, y2,…, yn; xi = x1, x2,…,
xn; n = numărul unităţilor observate). Aceste valori ale variabilelor unui
model se pot obţine pe două căi: fie pe baza sistemului informaţional
statistic (banca de date), fie prin efectuarea de observări statistice special
organizate – de tipul anchetelor statistice.
O problemă fundamentală care se ridică în această etapă o reprezintă
calitatea datelor statistice, respectiv autenticitatea şi veridicitatea acestora.
Dacă un model economic se construieşte cu date false sau afectate de erori
de măsură, el va căpăta aceste deficienţe, fiind compromis sub aspect
operaţional.
Deoarece problema autenticităţii datelor economice ţine de domeniul
statisticii economice, ne vom rezuma numai a aminti că datele statistice care
privesc variabilele economice specificate în model trebuie să fie culese fără
erori sistematice de observare şi de prelucrare, îndeplinind condiţiile de
omogenitate. Omogenitatea datelor presupune:
- colectarea lor de la unităţi statistice omogene;
- reprezentarea aceloraşi definiţii şi metodologii de calcul cu privire
la sfera de cuprindere ale acestora în timp sau în spaţiu;
- descrierea evoluţiei fenomenelor într-un interval de timp în care nu
s-au produs modificări fundamentale privind condiţiile de desfăşurare a
procesului analizat;
- exprimarea variabilelor în aceleaşi unităţi de măsură, condiţie care
se referă, în mod special, la evaluarea indicatorilor economici în preţuri
comparabile sau preţuri reale.
„Materia primă” pentru calcule economice o constituie seriile
cronologice (serii de timp sau serii dinamice), mai rar seriile teritoriale, ale
variabilelor economice respective, preluate sau construite pe baza băncii de
date statistice existente.
O serie cronologică se construieşte prin observarea variabilelor Y şi
X pe perioade egale de timp (t = 1,2,.., T, t reprezentând luni, trimestre, ani)
la aceeaşi unitate economică:

t 1 2 ... T
xt x1 x2 ... xT
yt y1 y2 ... yT

În comparaţie cu aceasta, o serie de spaţiu rezultă prin observarea


variabilelor Y şi X într-o anumită perioadă de timp - lună, trimestru,
semestru, an - la un anumit număr de unităţi socio-economice omogene,

i  1, n , n = numărul unităţilor de acelaşi profil, ce aparţin aceluiaşi sector


economic etc. O astfel de serie se prezintă, de regulă, sub următoarea formă:

xi x1 x2 ... xn
yi y1 y2 ... yn
Într-un model econometric, un fenomen economic X={xi}, i  1, n
poate fi introdus cu următoarele valori:
1) Valori reale sau empirice, xi = (x1, x2,.., xn), valori exprimate în
unităţi de măsură specifice naturii fenomenului X, ele fiind mărimi concrete
şi pozitive, deci aparţin sistemului numerelor raţionale. Vectorul valorilor
lui X, xi = (x1, x2,.., xn), poate fi definit prin doi parametri:

- media aritmetică a variabilei X


1 n
x  M (x ) 
n x (1.3.2)
i i 1

- abaterea medie pătratică a variabilei X


1n
x   M  n(xi (1.3.3)
x
2 (x ix ) 2

 2  M (x 2 ). fiind dispersia
)
2
1
variabilei.
x

De obicei, se consideră că variabila X urmează o distribuţie normală


de medie x şi de abatere medie pătratică σx : L(x) = N( x ,σx).

2) Valorile centrate : x*  x  x
i i

Aceste valori sunt tot mărimi concrete, dar ele aparţin sistemului
numerelor reale având atât valori pozitive cât şi negative.
Se poate demonstra uşor că aceste valori centrate au media egală cu
zero, iar dispersia lor este egală cu dispersia valorilor reale:

1
M (x *)   (x
n i x)0 (1.3.4)
1
M[(x*)2]  (x*)2 
1 x )2  M (x
2 (1.3.5)
(x )
i
n n
3) Valori centrate şi normate sau abateri standard: x** xi  x .
i 
x
Media şi dispersia acestor valori este:
1 x x
M (x ** )   i 0 (1.3.6)
M 1  ⎛⎜ x
n ** ) 2 ] x
[( 
x
(1.3.7)
x⎞  x2 1
2
⎟ i
n ⎝  x ⎠2 x
În plus faţă de aceste două proprietăţi L( x** ) = N(0;1)2, abaterile
standard sunt mărimi abstracte (adimensionale). Aceste calităţi conduc, atât
la diminuarea calculelor statistice cu aceste valori, cât şi la efectuarea de
comparaţii între distribuţiile mai multor fenomene economice de naturi
diferite.
Un model econometric poate fi format dintr-o singură relaţie sau
dintr-un sistem de relaţii statistice. Aceste relaţii pot fi: relaţii de identitate
sau deterministe, relaţii de comportament, relaţii tehnologice şi relaţii
instituţionale.
Relaţiile de identitate sunt de tipul ecuaţiilor de balanţă folosite în
„Sistemul de balanţe ale economiei naţionale”
Relaţiile de comportament sunt acele ecuaţii stochastice care
reflectă şi modelează un proces de luare a deciziei, care încearcă să descrie
răspunsul variabilei endogene Y, sub forma deciziei, la un set de valori ale
variabilelor exogene. De exemplu, într-un model macroeconomic, relaţiile
de comportament se referă la dependenţe privind consumul, investiţiile,
importul şi exportul, sistemul de preţuri, cererea monetară, etc.
Relaţiile tehnologice descriu atât imperativele de ordin tehnologic
privind producţia cât şi relaţiile tehnico-economice existente în producţie,
forţa de muncă şi fondurile de producţie ale unei unităţi, ale unei ramuri sau

1
2
Relaţia L(x**) = N(0;1) se citeşte: variabila x**  (xi  x) urmează legea de
x
probabilitate normală având media egală cu zero iar abaterea medie pătratică este egală
cu unu (legea normală, centrată şi redusă).
ale economiei naţionale. Aceste relaţii tehnologice sunt reprezentate de
cunoscutele funcţii de producţie de diferite tipuri.
Relaţiile instituţionale sunt folosite pentru a explica în mod
determinist sau stochastic fenomenele care sunt determinate fie de lege, fie
de tradiţie sau fie de obiceiuri. Din rândul acestora fac parte, de exemplu,
ecuaţiile care explică stabilirea impozitelor sau a cotizaţiilor în funcţie de
venit.
Tipologia modelelor econometrice este extrem de vastă. Totuşi, un
model econometric poate fi construit prin intermediul unei singure ecuaţii
de comportament, tehnologice sau instituţionale, sau cu ajutorul unui sistem
de ecuaţii de genul celor patru relaţii, menţionate mai sus, denumite modele
cu ecuaţii multiple.
Testele statistice3 sunt instrumente de lucru indispensabile
investigaţiei econometrice. Necesitatea utilizării acestora este determinată
de faptul că demersul econometric constă într-o înşiruire logică de ipoteze
privind semnificaţia variabilelor exogene, a calităţii estimaţiilor obţinute, a
gradului de performanţă a modelelor construite. Acceptarea sau
respiungerea ipotezelor formulate în econometrie se poate face cu ajutorul
mai multor teste, cele mai uzuale fiind: testul χ2, testul t, testul F etc.
Pe lângă aceste teste statistice, în practica curentă, în diverse
domenii, se foloseşte frecvent un test denumit „testul erorii”. În general,
aplicarea acestui test presupune compararea a două valori:

0 = valoarea observată sau estimată;


T = valoarea teoretică, aşteptată sau prognozată.

Pe baza celor două valori se definesc:


- eroarea absolută, e a  0 T ;

- eroarea relativă, e r  0 T 100 .

3
Vezi – ipoteză statistică, test, eroare de gradul 1 şi gradul 2, prag de semnificaţie, nivel de
semnificaţie – Dicţionar statistic-economic, D.C.S., Bucureşti, 1969.
Se construiesc cele două ipoteze:
H0: 0 ≈ T;
H1: 0≠ T.

Stabilindu-se arbitrar o valoare absolută (Ea) sau relativă (Er)4 de


echivalare a celor două valori, (0) şi (T), regula de (alegere) decizie a celor
două ipoteze este următoarea:
 este acceptată ipoteza H0 dacă E a  e a sau Er  e r  cele două

valori, (0) şi (T), sunt echivalente, adică diferenţele dintre ele sunt
întâmplătoare şi nu sistematice;
 este acceptată ipoteza H1 dacă E a  e a sau Er  e r  cele două

valori, (0) şi (T), diferă semnificativ şi nu pot fi considerate ca echivalente,


respectiv extrase din aceeaşi urnă sau dintr-o colectivitate omogenă.
Acest test al erorii este utilizat în mod curent în domeniul analizei
statistico-economice a variaţiei în timp şi/sau în spaţiu a unui fenomen
economic, dar poate fi aplicat şi în domeniul econometriei, dar cu
discernământ şi nu în mod excesiv.

1.4 Locul şi rolul econometriei în sistemul ştiinţelor economice

Apariţia şi rapida afirmare a econometriei trebuie înţeleasă şi


explicată prin prisma raportului dialectic dintre teorie şi practică, a
conexiunii inverse pozitive ce se manifestă între elementele acestui raport.
Dezvoltarea continuă şi dinamică a forţelor de producţie sub
impactul progresului ştiinţific şi tehnic modifică condiţiile şi
interdependenţele din producţie, repartiţie, circulaţie şi consum, ceea ce, pe
plan teoretic şi practic, creează probleme dificile privind explicarea şi
dirijarea evoluţiei fenomenelor economico-sociale către anumiţi indicatori
ţintă, formulaţi şi urmăriţi de o anumită politică economică.

4
Un astfel de test şi criteriu de decizie se utilizează în comerţul cu produse îmbuteliate sau
ambalate pentru care, de regulă, criteriul de decizie este de  5 % din volumul sau
greutatea, T, a ambalajului.
Necesitatea elaborării unor instrumente de investigare şi de sporire
a eficienţei metodelor de organizare, dirijare şi conducere a economiei, pe
de o parte, şi succesele metodelor statistico-matematice în alte domenii ale
ştiinţei – fizică, chimie, astronomie etc. – pe de altă parte, au determinat
adoptarea de către ştiinţele economice a acestor metode.
Econometria s-a format şi se dezvoltă nu în urma unui proces de
diversificare a ştiinţei economice, ci prin integrarea dintre teoria
economică, matematică şi statistică.
În cadrul aceastei triade, teorie economică - matematică – statistică,
locul central îl ocupă teoria economică. Deşi penetrarea ştiinţei economice
de către metodele statistico-matematice reprezintă un progres calitativ, nu
trebuie uitat faptul că fenomenele economice, pe lângă componenta lor
cuantificabilă, conţin aspecte care nu pot fi reprezentate prin cantitate.
Aceste particularităţi ale fenomenelor economice constituie, în general,
limitele econometriei în sistemul ştiinţelor economice.
De remarcat că raporturile econometriei cu ştiinţele economice nu
sunt numai de dependenţă.
Într-adevăr, un model econometric nu se poate elabora dacă nu s-a
constituit o teorie economică a obiectului cercetat. Similitudinea sa formală
cu obiectul economic investigat depinde de nivelul de abstractizare a teoriei,
de definirea univocă şi operaţională a noţiunilor şi categoriilor economice,
de scopurile urmărite de teoria economică - scopuri euristice sau de dirijare
privind obiectul studiat.
Modelul astfel construit reprezintă o verigă intermediară între teorie
şi realitate. El reprezintă o cale de confruntare a teoriei cu practica,
singurul mod de experimentare pe baza căruia ştiinţa economică îşi poate
fundamenta ipotezele, din moment ce obiectul său de cercetare poate fi
numai observat, nu şi izolat şi cercetat în laborator.
Prin această experimentare, mijlocită de modelul econometric,
ştiinţele economice validează, renunţă sau elaborează metode noi, îşi
confruntă problemele de semantică şi semiotică economică, îmbogăţindu-şi
în felul acesta sistemul de informaţii privind structura şi evoluţia obiectului
economic.
În prezent, tipologia metodelor econometrice utilizate de ştiinţele
economice este extrem de vastă. Folosirea din ce în ce mai amplă a acestor
modele la investigarea fenomenelor economice se datorează progreselor
însemnate făcute în domeniul metodelor de estimare a parametrilor
modelelor şi al testelor de verificare pe care se fundamentează acestea şi, nu
în ultimul rând, al utilizării calculatoarelor electronice care permit
rezolvarea operativă a celor mai complexe modele econometrice.
Particularizând legăturile econometriei cu unele dintre disciplinele
economice, este necesar să subliniem corespondenţa dintre modelarea
econometrică şi previziune. Previziunea macro sau microeconomică
reprezintă un domeniu care utilizează în mare măsură rezultatele simulării
şi, mai ales, ale predicţiei econometrice. Activitatea de previziune a
economiei este aceea care „oferă” o serie de elemente utile elaborării
modelului privind, îndeosebi, etapa de specificare a acestuia. În această
etapă, previziunea defineşte variabilele endogene (rezultative) şi pachetul
variabilelor exogene corespunzătoare obiectivelor urmărite în funcţie de
informaţiile statistice existente. Econometria, la rândul ei, contribuie la
obţinerea variantelor economice, oferind informaţii cu privire la
comportamentul variabilelor endogene în diverse alternative de acţionare a
pârghiilor economice. În acest fel, previziunii economice i se oferă o
perspectivă în legătură cu ceea ce s-ar putea întâmpla în viitor, fie şi în linii
mari, în raport cu diferitele variante ale politicii economice care ar putea fi
aplicate.
Menţionăm, de asemenea, legătura econometriei cu sistemul
financiar-contabil, domeniu în care modelarea pătrunde tot mai mult – vezi
modelele ARCH. De asemenea, trebuie remarcat faptul că, la elaborarea
modelelor econometrice, se recomandă, cu o tot mai mare insistenţă,
introducerea relaţiilor financiar-bancare, ca fiind deosebit de semnificative
pentru descrierea mecanismelor economice.
Domeniul cooperării economice internaţionale, ca, de altfel, şi cel
privind comerţul interior, domeniu în care previziunile sunt greu de realizat,
altfel decât cu ajutorul metodelor statistice, reprezintă, de asemenea,
sectoare ale economiei ce pot beneficia de rezultatele econometriei în ceea
ce priveşte planificarea şi eficientizarea activităţilor desfăşurate. Este
totodată necesar să subliniem frecvenţa tot mai mare a aplicării metodelor
econometrice în lucrări din domeniul biologiei, medicinei, demografiei şi, în
special, în domeniul marketingului, managementului sau viitorologiei.
În concluzie, se poate reţine ideea că metoda econometriei este
metoda modelării sau metoda modelelor. Modelul econometric – expresie
formală, inductivă a unei legităţi economice – reprezintă un mijloc de
cunoaştere a unui obiect economic, iar modelarea econometrică este o
metodă care conduce la obţinerea de cunoştiinţe sau informaţii noi privind
starea, structura (conexiunile dintre elemente) şi evoluţia unui proces sau
sistem economic.
2 Principalele tipuri de modele
econometrice utilizate în economie

2.1 
şi interdependenţelor dintre fenomenele economice

Teoria economică studiază fenomenele şi procesele economice


pornind de la premisa că acestea nu se desfăşoară la întâmplare ci pe baza
unor legi proprii, relativ stabile şi relativ repetabile, specifice naturii acestor
fenomene.
Deoarece fenomenele din economie sunt, în general, cuantificabile,
legile economice pot fi descrise sub forma unor legături cantitative (a unor
determinări numerice) între aceste fenomene. Acest fapt face posibilă
utilizarea statisticii şi matematicii de către teoria economică.
În plus, succesele deosebite obţinute de astronomie prin utilizarea
metodelor statistico-matematice – descoperirea planetei Neptun, în 1846, ca
urmare a calculelor efectuate de astronomul francez Urbain de Verrier
(1811-1877) sau a planetei Pluton, în 1930, în urma calculelor efectuate în
1915 de astronomul american Percival Lowell (1855-1916) etc. – au convins
economiştii de utilitatea şi necesitatea adoptării acestor metode, adoptare
justificată de cel puţin două motive:
1) Atât fenomenele astronomice, cât şi fenomenele economice nu pot fi
decât observate; ele nu pot fi nici izolate din mediul real şi nici reproduse în
laborator, pentru a fi cercetate în cursul unor experienţe controlate.
2) În economie acţionează anumite legi asemănătoare prin formularea
lor cu legile ce se manifestă în alte domenii ale ştiinţei – fizică, chimie,
astronomie etc. Istoria doctrinelor (gândirii) economice relevă următoarele
exemple în acest sens, cum ar fi:
- legea lui Malthus – în lume, producţia agricolă creşte în progresie
aritmetică, iar populaţia în progresie geometrică;
- legile lui Engel1 – atunci când venitul naţional creşte într-o ţară
dezvoltată:
a) cheltuielile alimentare cresc într-o proporţie mai mică;
b) cheltuielile pentru îmbrăcăminte cresc în aceeaşi proporţie;
c) cheltuielile pentru bunuri de folosinţă îndelungată cresc într-o
proporţie mai mare;
- legea lui Pareto descrie polarizarea veniturilor, respectiv un număr
tot mai mare de locuitori au venituri mici, iar un număr tot mai mic
de locuitori au venituri foarte mari:

A
y
xa

unde:
x = venitul familiilor;
y = numărul familiilor al căror venit este mai mare sau egal cu venitul
x k ; y  N x  x k ;
A, a = parametrii funcţiei.
Faptul că o serie din aceste formulări au fost criticate, reformulate
sau dezvoltate de teoria economică interesează mai puţin în cazul de faţă.
Trebuie apreciată intenţia autorilor de a oferi descrieri riguroase, lipsite de
ambiguităţi, cu posibilităţi operaţionale privind explicarea, reglarea şi
dirijarea funcţionării mecanismelor economice.
Existenţa obiectivă a acestor legături (legi economice, relativ stabile
şi relativ repetabile) dintre fenomenele şi procesele ce formează un sistem
economic, reprezintă suportul teoretic pe care econometria îşi
fundamentează reflectarea formală a acestora. Aceste legături pot fi descrise
cu ajutorul metodelor statistico-matematice.

1
Legile lui Engel au fost formularizate
xc de Törnquist prin intermediul următoarelor modele:
xc
a) y  a  u ; b) y  a  u ; c) y  ax u;
x
xb xb xb
unde: y = cheltuielile familiilor; x = venitul familiilor; a, b ,c = parametrii modelelor;
u = variabila aleatoare
În domeniul economic, deşi există o mare diversitate de modelele,
modelarea acestora la orice nivel – micro sau macroeconomic – se pot
interpreta cu ajutorul următoarei scheme:

X{ S
}Y
F igu r a 2.1.1

unde:
Y = (yi) - volumul ieşirilor din sistem, i  1, n ;
X = (xj) - factorii calitativi şi cantitativi care influenţează ieşirile yi,
j  1, m ;
S = structura sistemului prin intermediul căreia factorii xj determină
ieşirile yi.
Dacă ne referim la un proces de producţie, de exemplu, analiza
economică efectuată pe baza schemei de mai sus, evidenţiază faptul că
indicatorii de rezultate yi=Qi – volumul producţiei globale, marfă sau nete –
depind atât de volumul şi natura factorilor de producţie, respectiv volumul şi
calitatea obiectelor muncii (M), volumul şi nivelul tehnic al mijloacelor de
muncă (K), numărul, experienţa şi nivelul de instruire al forţei de muncă (L),
cât şi de modul lor de interacţiune în cadrul structurii tehnice, organizatorice
a procesului de producţie.
Cunoaşterea legităţii de variaţie în timp sau în spaţiu a unui indicator
de efect economic în funcţie de variaţia factorilor cuantificabili se poate face
folosind două modele de lucru:
a) Primul, cel mai frecvent utilizat şi în prezent, îl constituie modelul
determinist, care reflectă legătura funcţională dintre elementele de intrare şi
de ieşire ale sistemului – variabilele exogene şi variabilele endogene. Pe
baza definiţiilor formulate de teoria economică cu privire la elementele
obiectului respectiv, statistica economică, utilizând metode proprii, exprimă,
printr-un sistem de indicatori, elementele cuantificabile ale sistemului
economic. Pe baza parametrilor de performanţă ai sistemului (sau ai
indicatorilor de eficienţă a factorilor de producţie) se construiesc modele
econometrice deterministe între efecte şi eforturi, explicându-se variaţia
variabilelor factoriale şi a indicatorilor de performanţă sau de eficienţă ale
acestora.
Astfel, în cazul unui proces de producţie, se definesc:
Q
- consumul specific c 
 Q = cM (2.1.1)
M
Q
- productivitatea muncii w 
 Q = wL (2.1.2)
L
Q
- eficienţa fondurilor fixe e 
 Q = e K (2.1.3)
K
Pe baza modelelor deterministe (2.1.1), (2.1.2) şi (2.1.3), de
exemplu, prin operaţii simple, se pot obţine modele deterministe ce conţin
trei şi patru factori.
Astfel, pe baza relaţiilor (2.1.2) şi (2.1.3) se obţine:
wLeK
K
we
L
we 
f
K reprezintă înzestrarea tehnică a muncii.
unde: f 
L

Relaţia (2.1.2) devine:


Q LefL 
w

În cazul unui ansamblu de i unităţi sau ramuri economice relaţia


(2.1.5) se însumează:  Q   e  f  L . Această relaţie, înmulţită cu
ii ii i i

termenul L L , se transformă în:


i i
L
Q  e  f  i     L  e  f  g 
L
i
i
i
i
L
i
 i i i i i
i i i i
i

unde: gi  Li  reprezintă structura forţei de muncă.


Li
i
Modelul (2.1.6) reflectă dependenţa deterministă dintre efectul
economic Q şi cele trei grupe de factori utilizate de analiza economică:
factori calitativi, structurali şi cantitativi.
În general, un model determinist se exprimă prin relaţia:

y = f(x), sau y = f(x1, x2,…) (2.1.7)

Modelele deterministe se utilizează curent în practica economică la


analiza pe factori a variaţiei, în timp sau spaţiu, a multor fenomene
economice. În acest scop, modelul determinist reprezintă suportul teoretic al
aplicării metodei indicilor – teritoriali sau dinamici – metodă ale cărei
avantaje şi limite sunt bine cunoscute economiştilor.
b) Al doilea model de lucru este reprezentat de modelul econometric –
în sensul definirii restrictive a econometriei – care, fundamentându-se pe
metoda regresiei (metodă specifică statisticii), descrie legătura statistică
sau stochastică dintre intrările sistemului – factorii de influenţă X – şi
ieşirile acestuia – variabilele rezultative Y cu ajutorul unui model aleator:

Y = f(X) + U (2.1.8)

Acest procedeu se bazează pe principiul cutiei negre, principiu


cibernetic, care, în economie, se foloseşte atunci când descrierea formală a
structurii sistemului este inaccesibilă din cauza imposibilităţii obţinerii
informaţiilor necesare, sau când obţinerea acestor informaţii ar necesita
cheltuieli excesive, care nu se justifică prin aportul în cunoaştere pe care îl
realizează.
Spre deosebire de modelul determinist (2.1.7), acceptat fără rezerve
de teoria şi practica economică, modelul econometric (2.1.8) introduce în
schema de descriere a legităţii de manifestare a unui fenomen sau proces
economic şi o variabilă aleatoare sau întâmplătoare (U).
Aparent, această modalitate de formalizare a legăturilor dintre
fenomenele economice ar contrazice teoria economică – fenomenele nu se
produc la întâmplare, ci pe baza unor legi proprii, inerente lor – aşa cum s-a
afirmat la începutul acestui capitol. Această interpretare este inexactă.
Acceptarea introducerii variabilei aleatoare în vederea explicării legităţii de
variaţie a unui fenomen economic concret este cerută de unul din motivele
de mai jos:
- apariţia şi variaţia, în timp sau spaţiu, a unui fenomen economic
este determinată de un sistem numeros de factori, calitativi şi cantitativi.
Imposibilitatea cuantificării anumitor factori precum şi dificultăţile ridicate
de rezolvarea unor modele cu multe variabile factoriale conduc la o
specificare formală incompletă din punct de vedere economic a obiectului
investigat. Această specificare formală incompletă este corectată şi
vizualizată cu ajutorul variabilei aleatoare (U).
- legătura cauză-efect nu poate fi cercetată în mod nemijlocit în
laborator, aşa cum procedează ştiinţele tehnice, deoarece obiectul economic
investigat nu poate fi izolat, extras din mediul economic, ci numai observat
prin intermediul datelor statistice. Pe baza acestora, prin intermediul unui
model statistico-matematic, legătura obiectivă este estimată, aproximată,
prin mijlocirea informaţiei statistice.
- de foarte multe ori, datele statistice provin din observări selective
(seriile cronologice având, de asemenea, această particularitate), din sondaje
aleatoare, care imprimă tuturor indicatorilor cercetaţi pe baza lor această
particularitate statistică.
Pentru a justifica concret necesitatea folosirii variabilei aleatoare (U)
în cadrul unui model econometric, cât şi datorită unor inadvertenţe ce se
întâlnesc în practică datorită utilizării unor modele de regresie în locul
modelelor economice deterministe, va fi abordată succint această problemă.
De foarte multe ori, se studiază legătura dintre un indicator al
producţiei (Q) şi productivitatea muncii (w), sau dintre productivitatea şi
înzestrarea tehnică a muncii (f) cu ajutorul unei funcţii, de regulă, de forma:
Q = a + bw, sau w = a + bf.
Teoria economică a formulat dependenţa dintre variabilele de mai
sus prin intermediul modelelor deterministe, Q = wL şi, respectiv, W = ef.
În comparaţie cu acestea, modelele Q = a + bw şi w = a + bf sunt afectate
de erori de specificare şi de identificare. Eroarea de specificare este
reprezentată atât de neglijarea factorului L – forţa de muncă, sau a eficienţei
fondurilor fixe, cât şi de faptul că parametrii modelelor vor fi calculaţi prin
estimaţii statistice, ca să nu mai amintim de faptul că, de cele mai multe ori,
datele statistice provin dintr-un sondaj. Vizualizarea şi interpretarea corectă
a legăturii dintre variabilele respective impune specificarea variabilelor
aleatoare în cadrul modelelor econometrice.
Referitor la eroarea de identificare, aceasta constă în alegerea greşită
a funcţiei matematice. Funcţia Q = a + bw arată că, dacă w = 0, atunci Q =
a, ceea ce reprezintă o aberaţie economică. În astfel de situaţii modelul va
trebui să fie de forma: y = bx + u.

2.2 


În momentul actual, tipologia modelelor econometrice este extrem


de diversificată, totuşi, în funcţie de anumite criterii de clasificare, ele se pot
încadra în câteva tipuri sau clase principale.



Împărţirea modelelor în aceste două clase este făcută, aşa cum


indică şi denumirea lor, în funcţie de numărul variabilelor factoriale
folosite în vederea explicării, simulării sau prognozei variabilelor
dependente.
Modelul unifactorial y = f(x) + u este folosit în mod frecvent la
modelarea fenomenelor economice datorită avantajelor pe care le prezintă:
simplitate, operativitate şi cost redus pentru obţinerea lui. Utilizarea unui
astfel de model se fundamentează pe ipoteza că în rândul factorilor
variabilei rezultative y există un factor determinant x, ceilalţi factori, cu
excepţia acestuia, fie au o influenţă întâmplătoare, aceştia fiind specificaţi în
model prin intermediul variaţiei reziduale u, fie au fost invariabili în
perioada analizată şi, ca atare, nu are sens specificarea lor în model.
Dacă ipoteza de mai sus nu poate fi acceptată, caz frecvent în
domeniul economic, se construieşte un model multifactorial de forma y =
f(x1, x2,…, xn) + u, j  1, n , unde k = numărul variabilelor factoriale.
Modelul multifactorial, eliminând deficienţa modelului unifactorial,
transformă însă avantajele acestuia în dezavantaje. Din acest motiv, se
recomandă ca, în practică, să nu se folosească un model cu mai mult de trei
sau patru variabile factoriale.
Toate modelele econometrice folosite până în prezent pot fi
încadrate într- una dintre aceste clase. Din categoria modelelor unifactoriale
demne de menţionat sunt:
 legea cererii – C = f(p) + u, unde: C = volumul cererii unui
produs, iar p = preţul unitar al produsului;
 legea ofertei – O = f(p) + u, unde: O = volumul ofertei;
 modelul consumului – Ci = f(V) + u, unde: Ci = consumul unui
produs i, iar V = venitul unei familii;
 modelul cheltuielilor de producţie (Ch) în funcţie de volumul
producţiei (Q) –Ch = f(Q) + u;
 modelul legii impozitului (I) pe venit (V) – I = f(V) + u, variabila
aleatoare u semnificând abaterea de la dependenţa funcţională a impozitului
pe venitul salariaţilor, ca urmare a unor măsuri de politică socială.
Structural, modelele multifactoriale sunt de o mare diversitate. Ca
regulă generală, ele se construiesc prin dezvoltarea modelului unifactorial al
variabilei explicate y. Pe lângă variabila factorială iniţială x1, se introduc fie
alte variabile exogene x2, x3,…, xk, fie valori decalate ale acestora xt, xt-1,…,
xt-h.



Clasa acestor modele este definită de forma legăturii dintre variabila


rezultativă şi variabilele factoriale. Sub formă generală, un model liniar
multifactorial se prezintă astfel: y = b0 + b1x1 + b2x2 +…+ u. Modelele
neliniare se identifică cu ajutorul funcţiilor neliniare, cum ar fi: funcţia
exponenţială, hiperbolă, funcţia logistică, parabolă etc.
Deoarece cele două grupe de modele posedă particularităţi specifice,
ne vom referi la câteva dintre ele, pornind de la un caz concret, care, de
altfel, a şi generat relevarea acestora.
Astfel, analiza legăturii dintre consumul unui anumit produs şi
venitul unei familii se poate face cu ajutorul unor modele de forma:

C = a + bV + u – model liniar (2.2.1)

C = aVb u – model neliniar (2.2.2)

Acest model poate fi transformat prin logaritmare într-un model


liniar, între logaritmii celor două variabile existând relaţia:
log C = log a + b log V + log u (2.2.3)

unde:
C = cheltuielile medii de consum pe o familie;
V = venitul mediu pe o familie.

S-a constatat însă că modelul liniar (2.2.1) prezintă câteva


neajunsuri. Primul se referă la faptul că anumite elemente de consum nu se
modifică în mod liniar cu evoluţia veniturilor familiei – unele prezintă un
anumit nivel de saturaţie, produsele alimentare, în special, iar altele au o
existenţă pasageră. Al doilea neajuns îl constituie coeficientul de elasticitate,
care este variabil şi diferit de coeficientul de regresie.
Se ştie că, în cazul unui model liniar, coeficientul de regresie este
reprezentat de parametrii variabilelor factoriale. Semnul coeficientului
indică sensul legăturii: b>0  legătură directă, b<0  legătură inversă, iar
mărimea lui este măsura variaţiei lui y la o modificare cu o unitate a
variabilei factoriale. Coeficientul de elasticitate se defineşte astfel:

c 
dC a
: d 1 
e
C V  a  bV
V
Acesta diferă şi el în raport cu parametrul b. Pentru un nivel al lui
"C" dat, ce depinde de mărimea venitului. Dacă a>0 şi b>0 atunci ce<1.
Deoarece, în practică, era de dorit să se dispună de o elasticitate
constantă a consumului sau a cererii în raport cu venitul familiei sau cu
preţul produsului, s-a recurs la modelul (2.2.2).
În acest caz, cei doi coeficienţi sunt egali - b = ce - şi constanţi
pentru un anumit element de consum, semnul şi mărimea lor oferind
informaţii necesare analizei economice a raportului cerere-ofertă în sensul
următor:
- dacă b<0 – cererea sau consumul produsului respectiv tinde să
dispară de pe piaţă sau din consumul populaţiei;
- dacă 0<b<1 – cererea sau consumul produsului tinde spre un
anumit prag de saturaţie;
- dacă b>1 – cererea sau consumul produsului nu sunt satisfăcute
sau nu admit un nivel de saturaţie.



Aceste modele rezultă în urma clasificării modelelor econometrice în


raport cu sfera lor de cuprindere. Includerea unui anumit model în clasa
modelelor parţiale sau globale este relativă. Referindu-ne concret la
modelarea consumului populaţiei, modelul consumului alimentar al
populaţiei este un model parţial în raport cu modelul global al consumului
total al populaţiei – acesta rezultând din agregarea consumurilor:
alimentar, nealimentar şi de servicii. În acelaşi timp, consumul alimentar al
populaţiei apare ca un model global (agregat) în raport cu modelele parţiale
ale consumului pe grupe omogene de consumatori etc2.
Explicaţiile de mai sus au urmărit să justifice ideea că orice descriere
econometrică trebuie să se fundamenteze pe o concepţie economică,
explicită sau implicită, a fenomenului studiat. Un model econometric care

2
Ne referim la grupe omogene de consumatori după mărimea veniturilor, pe categorii
socio-profesionale, pe medii de provenienţă etc.
nu respectă această condiţie reprezintă o simplă speculaţie matematică, fără
valoare teoretică sau practică pentru ştiinţa economică.
Clasificarea modelelor econometrice în cele două tipuri permite însă
discuţia problemei privind agregarea modelelor parţiale sau, invers, despre
semnificaţia modelului global în raport cu modelele parţiale.
Această problemă va fi abordată în mod concret, în cazul modelării
consumului populaţiei, deoarece se vor putea formula observaţii pertinente,
care rămân valabile pentru orice altă situaţie.
Fie modelul:

yit = ai + bi xit + uit ( i  1, m , t  1, n ) (2.2.5)

unde:
y = consumul:
x = venitul grupei i în anul t.

Acest model reprezintă modelul parţial al grupei omogene i de


consumatori, într-o perioadă de n ani. Însumând cele i modele parţiale
(2.2.5) se obţine modelul agregat al acestora:

y
it i     bi x  ui 
ai it i ti
i

Dacă se introduc notaţiile:


y
it i Y t = consumul total al populaţiei în momentul t;
x
it i X = veniturile populaţiei în momentul t;
t

  a şi uit  ut .
ai i
i

Modelul agregat devine:

Y t  a  bi x  ut 
it
i
Modelul global al consumului populaţiei, construit în aceeaşi
perioadă de timp t, în funcţie de veniturile populaţiei este de forma:

Y t  a  bX t  u
t 
 x it
Dacă termenul bi x it din relaţia (2.2.7) se înmulţeşte cu i
i x ,
it i
modelul agregat devine:

bi x it bi x it
Yt a i x
it u  a  i
 X t u 
t t
 x it x
it i
ii
Comparând modelul agregat (2.2.9), rezultat prin însumarea
modelelor parţiale, cu modelul global (2.2.8) se deduce că:

bi x it
i
b 
x
it i
adică parametrul b din modelul global – coeficientul de regresie al
consumului total în raport cu veniturile populaţiei – rezultă ca o medie
aritmetică a coeficienţilor parţiali de regresie, ponderaţi cu veniturile
consumatorilor din grupa i, xit.
O altă relaţie ce se poate deduce între coeficientul global al regresiei,
b, şi cei parţiali, bi, se referă la estimatorul acestuia, bˆ.
Din modelul (2.2.8), prin aplicarea M.C.M.M.P., estimatorul lui b
este egal cu:


 Y t Y X t  X 
bˆ  t 
 X  2

Xt
t
unde:
1
Y   Y - nivelul mediu anual al consumului populaţiei în
t
n t

perioada t  1, n ;

1
X Xt
- nivelul mediu anual al venitului populaţiei.
n t

Se calculează media lui Y pe baza modelului (2.2.7), se însumează


după t şi se împarte la n:
⎛1
Y  a  
b i ⎜ nn x ⎞
 a  b x
it 
it ⎟ i i
⎝ 1 ⎠ i

unde:
x x1 n - reprezintă media veniturilor grupei i de consumatori în
i  it
n 1
tperioada t.

Scăzând din modelul (2.2.7) modelul (2.2.12) se obţine relaţia:

Yt 
Y   bi xit  bi xi  bi xit  xi  
i i i

care se introduce în relaţia (2.2.11), obţinându-se următoarea relaţie a


coeficientului global de regresie:



bi  x it  x i X t  X
⎢ ⎥⎦

 
bˆ  i ⎣ t 
 X
2

Xt 
t


 x it  xi X t  X 
Termenul t
 qˆi
  2
nu reprezintă altceva decât
XtX
t

estimatorul coeficientului de regresie a veniturilor consumatorilor din grupa


i în funcţie de veniturile populaţiei, estimat pe baza funcţiei de regresie:
x it   qˆi X t
pˆ i
Ştiind că  x  X t , rezultă că:   0 şi 1.
it
i
pˆ i  qˆ i
i i
Revenind la relaţia (2.2.13) se deduce că :

bˆ  
bi i  
qˆi
adică coeficientul global de regresie este egal cu suma produselor dintre
coeficienţii parţiali de regresie ai consumului în funcţie de venit, pe grupe
omogene de consumatori şi coeficienţii de regresie ai acestor venituri în
funcţie de veniturile populaţiei.
Rezultatele obţinute mai sus se pot generaliza uşor, ele rămânând
valabile în orice situaţie în care se discută raportul dintre un model parţial şi
modelul global al unei variabile rezultative y în funcţie de una sau mai multe
variabile factoriale x, între care există o relaţie de dependenţă liniară. În
cazul dependenţelor neliniare, după liniarizarea acestora, formulele de mai
sus vor căpăta particularităţi specifice.
În final, discuţia raportului modele parţiale-modele globale permite
formularea următoarelor concluzii:
- agregarea modelelor parţiale nu conduce la obţinerea modelului
global al variabilei respective;
- modelul global rezultă ca o medie a modelelor parţiale;
- în plan transversal, respectiv în profil teritorial, de exemplu, sau
ca explicaţie istorică a dependenţei dintre două sau mai multe fenomene
economice, modelul global se poate estima pe baza modelelor parţiale, dacă
se acceptă ca semnificativă valoarea coeficientului global de regresie- vezi
relaţia (2.2.10)3.
- în scopuri de prognoză, modelul global nu conduce la rezultate
semnificative decât dacă coeficientul global de regresie rămâne stabil.
Din relaţia (2.2.14) se deduce că această condiţie se realizează în
următoarele situaţii:
- bi = b i  1, m - coeficienţii parţiali de regresie sunt constanţi
şi egali cu coeficientul global de regeresie;
- qˆ  constant în orizontul de prognoză, ceea ce presupune o
i
creştere proporţională între nivelul variabilei factoriale pe ansamblul
unităţilor statistice şi nivelul acestei variabile, centralizate pe grupele
colectivităţii.



Un model econometric static este acela în care dependenţa


variabilelor endogene „y” faţă de valorile variabilelor exogene „xj” se
realizează în aceeaşi perioadă de timp:

y = f (x1t,…,xjt,…,xkt) + ut ; t  1, n, j  1, k 

Spre deosebire de acestea, modelele econometrice dinamice se


definesc prin următoarele tipuri:
a) Introducerea în pachetul de variabile explicative „xj”, în mod
explicit, a variabilei timp:

yt = f(x1t, x2t, t) + ut (2.2.16)

Un astfel de model se justifică atunci când:


- printre factorii importanţi de influenţă ai variabilei y se află şi
factori de natură calitativă, a căror influenţă nu poate fi reflectată de modelul
econometric datorită lipsei unei măsuri statice adecvate, de exemplu,

3
Coeficientul global de regresie, fiind media aritmetică ponderată a coeficienţilor parţiali bi
-relaţia (2.2.10) – se pune problema reprezentativităţii acestuia.
influenţa preferinţelor sau gusturilor populaţiei asupra consumului sau
influenţa progresului tehnic în funcţiile de producţie.
- poate fi acceptată ipoteza unui efect inerţial în evoluţia
fenomenului y, ipoteză care, în domeniul fenomenelor economice, poate fi
acceptată datorită masei sociale care le generează şi de care beneficiază.
b) modele autoregresive – când în pachetul de variabile explicative
„xj” se introduce şi variabila explicată „y”, dar cu valori decalate:
yt-1, yt-2,…, yt-k, reprezentând un model autoregresiv de ordinul „k”:

yt = f(xt, yt-k) + ut (2.2.17)

c) model cu decalaj în care variabila factorială „x” îşi exercită


influenţa asupra variaţiei variabilei „y ” pe mai multe perioade de timp:

y = f(xt,…,xt-1,…,xt-k) + ut ;
t 1, n, j 1, k , k 
t

unde: k = lungimea perioadei de decalaj (lag).

Exemple:

Kt = f(It,…,It-1,…,It-k) + ut (2.2.19)

unde:
Kt = fondurile fixe puse în funcţiune în perioada t;
It = investiţiile efectuate în perioada t-k,…, t.

Qt = f(It,…,It-1,…,It-k) + ut (2.2.20)

unde:
Qt = producţia medie la ha;
It = cantitatea de îngrăşăminte la ha.

Aceste tipuri de modele (a + b + c) se utilizează, în special, la


prognoza fenomenelor economice. Dacă primele modele – tipul (a + b) nu
ridică dificultăţi privind identificarea, estimarea şi verificarea acestora, ele
fiind de genul modelelor econometrice multifactoriale, modelele dinamice
cu decalaj prezintă câteva dificultăţi.
Prima se referă la mărimea decalajului „k” – cu cât acesta este mai
mare, cu atât se pierd mai multe valori ale variabilelor, neajuns ce impune
construirea unei serii lungi de date a fenomenelor analizate, pe când în
economie se lucrează, de obicei, cu eşantioane de volum mic.
A doua dificultate o reprezintă existenţa fenomenului de
multicolinearitate între valorile decalate ale variabilei exogene –
covxt , x t k   0, ()t  1, n, k – multicolinearitate care conduce la
t
b
obţinerea de estimatori nesemnificativi: j 2.
sb
j



Alături de aceste tipuri de modele econometrice se mai pot construi


şi modele cu o singură ecuaţie şi modele cu ecuaţii multiple.
Din categoria modelelor cu singură ecuaţie fac parte toate modelele
prezentate mai sus.
Modelele econometrice cu ecuaţii multiple sunt formate dintr-un
sistem de ecuaţii. Acestea se pot prezenta sub două forme: sub formă
structurală şi sub formă redusă sau canonică.
Un model econometric sub formă structurală reprezintă transpunerea
formală – printr-un sistem de ecuaţii – a procesului economic. Forma
generală a acestui model este următoarea:

Y1 + b12Y2 +... + b1nYn + c11X1 + c12X2 +... + c1mXm = U1


b21Y1 + Y2 +... + b2nYn + c21X1 + c22X2 +...+ c2mXm = U2 (2.2.21)
....................................................................................
bn1Y1 + bn2Y2 +...+ Yn + cn1X1 + cn2X2+... + cnmXm = Un

unde:
Yi (i = 1,.., n) – variabile explicate sau endogene;
Xj (j = 1,.., m) – variabile explicative sau exogene.

Rezolvarea unui model econometric presupune estimarea


parametrilor bij şi cij cu ajutorul unei anumite metode stochastice de estimare
a acestora.
Dintre metodele folosite la estimarea parametrilor unui model
econometric, menţionăm:
 metoda celor mai mici pătrate (M.C.M.M.P.) într-o singură
treaptă (M. Wald);
 M.C.M.M.P. în două trepte (H. Theil);
 M.C.M.M.P. în trei trepte (A. Zellner);
 metoda verosimilităţii maxime cu informaţie limitată (Anderson-
Rubin).
Deoarece aplicarea unei metode de estimare a parametrilor unui
model sub formă structurală conduce la obţinerea de estimaţii deplasate ale
parametrilor bij şi cij, modelul econometric sub această formă trebuie
transformat sub formă redusă sau canonică.
Un model econometric este sub formă redusă sau canonică dacă
fiecare variabilă endogenă este exprimată numai în funcţie de variabilele
exogene.




Tipologia modelelor econometrice este foarte vastă, totuşi acestea


pot fi împărţite în două mari grupe: modele euristice sau raţionale şi modele
decizionale sau operaţionale.
Modelele euristice sau raţionale sunt folosite în special de teoria
economică pentru a explica pe o cale mai simplă un sistem complex de
dependenţe şi interdependenţe ce se manifestă în domeniul economic.
Modelul teoretic reprezintă de fapt o formă simplificată a modelului real
deoarece în cadrul acestuia nu pot fi incluşi toţi factorii.
Modelele decizionale sau operaţionale se utilizează în special în
practica economică, ele fiind folosite la fundamentarea unor decizii de
politică economică (simulare) şi la prognoza fenomenelor economice.
Evident că diferenţa dintre aceste două modele nu este absolută,
adică un model raţional sau teoretic poate fi utilizat ca un model operaţional
dacă pot fi acceptate anumite ipoteze.
Un exemplu de model econometric ce poate fi folosit atât în scopuri
euristice cât şi în scopuri operaţionale îl reprezintă modelul econometric
utilizat la descrierea preţului de echilibru.
Pe baza teoriei economice, a definirii unei pieţe libere şi a
conceptului de homo economicus (fiinţă raţională, comportamente logice)
modelul utilizat la descrierea formării preţului de echilibru este:

P = f (C) + u (2.2.22)
P = f (O) + z (2.2.23)

În situaţia preţului de echilibru: C = O (2.2.24)


Pe cale logică se deduce că relaţia dintre preţ şi cerere este de formă
inversă şi că o astfel de relaţie poate fi descrisă cu ajutorul unei funcţii
monoton descrescătoare, liniară sau putere.
Funcţie liniară: P = a + b C; b < 0 (2.2.25)
Funcţie putere: P = a C (2.2.26)  ln P = ln a + b ln C (2.2.27)
b

În mod analog se poate deduce că legea ofertei poate fi descrisă cu


ajutorul aceloraşi funcţii:
Funcţie liniară: P =  +  O (2.2.28)
Funcţie putere: P =  O => ln O = ln  +  ln O

(2.2.29)
Aceasta înseamnă că legea ofertei şi a cererii poate fi descrisă fie cu
ajutorul unei drepte, fie pe baza unei scări logaritmice:

P ln P

0 C,O 0 ln C, ln O
Figura 2.2.1. Dreaptă Figura 2.2.2. Scară logaritmică
Este cunoscut faptul că explicarea formării preţului de echilibru se
face pe baza unui grafic de forma:

P C1
O0
C0
E1
P1* O1
* E0
P0 *
P2

0 O0*=C0*O1*=C1* O2*=C2* C, O

Figura 2.2.3

Interpretând modificarea preţului de echilibru descris cu ajutorul


unei funcţii liniare putem constata că, în cazul în care cererea se modifică
(creşte), iar oferta rămâne constantă, această modificare presupune: fie o
deplasare paralelă cu prima dreaptă, fie dreapta pivotează din punctul de
intersecţie cu axa Oy.
În primul caz : P = a + b C  P’ = a1 + b C (2.2.30), iar în al doilea
caz se modifică panta dreptei, distanţa faţă de origine rămânând constantă:
P”=a+ b1C (2.2.31).
În practică, cele două situaţii apar când au loc compensări – primul
caz -, respectiv când au loc indexări – al doilea caz.
În mod analog se procedează şi în cazul modificării ofertei sau a
modificării simultane a cererii şi ofertei.
În plus, descrierea legii cererii cu ajutorul unei funcţii matematice
permite definirea riguroasă a unor concepte economice cum ar fi:
coeficientul marginal şi coeficientul de elasticitate.
Astfel, în cazul unei drepte, coeficientul marginal este de forma:

P
cm b
C cmct 
iar coeficientul de elasticitate este de forma:

ce  P C  
Pa  1  ce   
bC 0,1
a
P C a  bC ab abC
C
în acest caz existând o elasticitate rigidă.
În general, teoria economică utilizează cu predilecţie funcţia putere
pentru a explica formarea preţului de echilibru referitor la legea cererii:
P = a C b  ln P = ln a + b ln C
Această funcţie prezintă proprietatea că, panta dreptei, respectiv
coeficientul marginal, este egal cu coeficientul de
 ln P
elasticitate: cm  ce  b (2.2.34) rezultând coeficientul de
 ln C
elasticitate a preţului în funcţie de cerere, atunci când legea cererii poate fi
descrisă cu ajutorul funcţiei putere sau a celei exponenţiale: P = e a + b ln C
(2.2.35).
Acest model raţional sau euristic poate fi utilizat ca model
operaţional, respectiv în vederea calculării preţului de echilibru, dacă pot fi
acceptate câteva ipoteze cum ar fi:
- se cunoaşte numărul cumpărătorilor şi cel al vânzătorilor;
- se cunosc opţiunile ferme ale acestora privind cantitatea cerută sau
oferită spre vânzare, precum şi preţul de cumpărare şi de vânzare, respectiv
preferinţele cumpărătorilor şi vânzătorilor au un caracter cert şi nu aleator.
Aceste ipoteze se verifică în general pe piaţa bursieră unde, de
regulă, preţul de echilibru al unei acţiuni sau produs (marfă) se calculează
cu ajutorul modelului econometric următor:
- să admitem că pentru ziua H se cunosc următoarele date referitoare
la preţul de cumpărare şi volumul cererii de acţiuni precum şi preţul de
vânzare şi volumul ofertei acestora.
Tabel 2.2.1
Oferta (buc) 1000 1500 1000 500 1200 2000 2000

Preţ (lei/buc) 1800 1750 1780 1600 1700 1650 1800

Tabel 2.2.2
Cerere (buc) 2000 3000 2000 500 200 1300
Preţ (lei/buc) 1600 1700 1800 1725 1620 1750

Descrierea econometrică a formării preţului de echilibru se


realizează cu ajutorul modelului:
P = f (C) +
u P = f (O)
+ z C = O.
Pentru identificarea legii cererii şi a ofertei vor trebui construite
seriile statistice şi se va efectua reprezentarea grafică a acestora.
Construirea seriilor statistice se face pe baza următorului
raţionament:
- dacă un cumpărător achiziţionează o cantitate de acţiuni la un anumit
preţ, el va cumpăra cu atât mai mult cu cât preţul va fi mai mic;
- dacă un ofertant îşi vinde acţiunile la un anumit preţ, el le va vinde
cu atât mai mult cu cât preţul va fi mai mare.
Rezultă astfel următoarele serii statistice, construite în urma ordonării
preţurilor anunţate de cumpărători şi ofertanţi:

Tabel 2.2.3
Oferta (buc) Preţul (lei/buc) Cererea (buc)

500 1600 9000


500 1620 7000
2500 1650 6800
4300 1680 6800
5500 1700 6800
5500 1725 3800
7000 1750 3300
8000 1780 2000
9000 1800 2000
C, O
1.85

1.8
P = f(O)
1.75
P = f(C)

1.7
Linear (P = f(C))

1.65
Linear (P = f(O))

1.6

1.55
012345678910 P
Figura 2.2.4 Formarea preţului de echilibru

În urma reprezentării grafice se observă că legile cererii şi ale ofertei


pot fi aproximate cu două funcţii liniare de forma:
1. Legea cererii: P = a + b C + z (2.2.25)
2. Legea ofertei: P=  + O + u (2.2.28)

În vederea estimării parametrilor a, b, ,  se aplică metoda celor


mai mici pătrate fiecărui model în parte, rezultând astfel estimatorii
parametrilor aˆ , bˆ , , ˆ .
- ˆ
Volumul de echilibru se calculează astfel:
O 
C abCO  O*C* 
a

b
iar preţul de echilibru va fi:
P*  
a b ba
 a  b


b 
Un astfel de model operaţional se foloseşte la estimarea cursului
valutar (fixingul bancar) şi la estimarea preţurilor acţiunilor pe pieţele
de capital.
De asemenea, acesta poate fi adaptat şi la analiza cererii şi
ofertei oricărui bun sau serviciu de consum dacă ipotezele menţionate
mai sus pot fi acceptate.
3 Modelul unifactorial

3.1 Specificarea şi definirea modelului unifactorial

Specificarea unui model econometric se face pe baza teoriei


economice a fenomenului observat şi constă în precizarea variabilei
endogene şi a variabilei exogene.
Un model unifactorial se prezintă astfel:

y = f (x) + u (3.1.1)
unde:
y = (y 1 , y 2 , K , y n ) - variabila endogenă sau rezultativă;
x = (x 1 , x 2 , K , x n ) - variabila exogenă sau factorială sau cauzală;

u= (u1 , u 2 , K , u n ) - variabila reziduală, aleatoare sau eroare.

Relaţia (3.1.1) reprezintă o ipoteză construită pe baza teoriei


economice şi presupune că fenomenul economic y este rezultatul acţiunii
unui complex de factori: fenomenul economic x este factorul principal,
esenţial, ce determină fenomenul y, restul factorilor fiind consideraţi
neesenţiali, cu acţiune întâmplătoare, ei fiind specificaţi în modelul
econometric cu ajutorul variabilei aleatoare u. Ca orice ipoteză teoretică, ea
poate fi adevărată sau falsă – x este sau nu este factorul hotărâtor al
fenomenului y – iar validarea sau invalidarea unei astfel de ipoteze se face în
urma unui „experiment” statistic.
Modele econometrice

Teoria economică a folosit şi foloseşte în numeroase cazuri modelul


unifactorial pentru a fundamenta şi descrie mecanismul de formare şi de
manifestare a legilor economice. În acest sens, pot fi menţionate:
- legea cererii C = f(P) + u ; f’(P) < 0  cererea (C) unui anumit
produs creşte sau se reduce, dacă preţul (P) acestuia se micşorează sau se
măreşte;
- legea ofertei O = g(P) + u ; g’(P) > 0  oferta (O) unui produs
creşte sau se diminuează, dacă preţul (P) acestuia se măreşte sau scade;
- funcţia de producţie a cheltuielilor totale ale unei firme: Ch =
f(Q) + u; f’(Q) > 0  cheltuielile de producţie cresc sau scad, dacă volumul
producţiei creşte sau scade (în situaţia în care productivitatea rămâne
constantă);
- legile consumului – formulate de Engel şi descrise de funcţiile lui
Tornqvist – consideră venitul (V) consumatorului ca principal factor al
consumului (C) unui produs sau grupe de produse C = f(V) + u; f’(V)>0.
De asemenea, foarte multe analize economice utilizează modelul
unifactorial pentru a explica şi prospecta dependenţa dintre două fenomene,
cum ar fi:
- corelaţia dintre creşterea preţurilor şi creşterea salariilor;
- corelaţia dintre creşterea preţurilor şi rata şomajului – curba lui
Philips;
- corelaţia dintre creşterea salariilor şi productivitatea muncii etc.

3.2 Identificarea modelului unifactorial

Identificarea modelului constă în alegerea unei funcţii (sau a unui


grup de funcţii) matematice, cu ajutorul căreia se urmăreşte să se descrie (să
se aproximeze) valorile variabilei endogene y numai în funcţie de variaţia
variabilei exogene x. Funcţiile matematice care se pot utiliza în acest sens –
funcţii liniare sau neliniare – sunt numeroase şi de forme diverse, printre
acestea figurând şi cele prezentate în continuare.
Modelul unifactorial

y
y
a
a,b >0 b>0

a<0, b>0

b<0
a a>0, b<0

0
x 0 x
-a

1. Funcţia liniară 2. Funcţia semilogaritmică

y=a+bx+u y = a + b log x + u

y y
b>1

b=1

b>0
nivel de saturaţie
0 < b <1 a
b<0

b<0

0
x 0 x

3. Funcţia putere şi funcţia logaritmică 4. Funcţia inversă (hiperbola)


b
y = axb + u y=a+x +u
log y = log a + b log x + u sau log y = a + b log x + u
Modele econometrice

y y
yM

b>0

exp nivel de saturaţie


( a)
b, c >0 b, c >0
b<0

0 x 0 b b x
2,3026c − 1 2,3026 c

5. Funcţia loginversă 6. Funcţia log-loginversă

b b
log y = a + x + u log y = a + x + c log x + u

y a<0
c>0
yM b>0
a, c > 0,
b<0

a, c < 0,
ym b>0

0 b x
−2 c

7. Parabola de gradul II
2
y = a + bx + cx + u
Modelul unifactorial

y a, c > 0,
b<0
yM

a, c < 0,
ym b>0
0 b x
−2 ,3026
e 2c

8. Parabola logaritmică y
= a + b log x + c(log x)2 + u

III
y

a II
Nivel de saturaţie II

aI
Nivel de I
saturaţie

0 C x

9. Funcţiile lui Tornquist


x
I.y=a + u; a,b > 0
x+b
x − c
II . y = a x + b + u; a,c > 0; b > −c ; x ≥ c
x − c
III . y = ax x + b + u; a,c > 0; b > −c ; x ≥ c
Modele econometrice

y
a > 0, b > 0
yM

a > 0, b < 0

0 b x
− 1 + 2 ,3026

e a
10. Funcţia lui Konius
y = x (a + b log x ) + u

y
(3) (1)
c Nivel de saturaţie (2) (1) y =
c
a+bx
+u

b>0 b<0 1+e


(2) y = c +u
1 + e a + b logx
b<0 c
(3) y = a+
b +u
1+ e x
0 x

11. Funcţia logistică

Alegerea unei anumite funcţii matematice ca funcţie de regresie a


unui model econometric – Y = f(x) – se face pe baza valorilor reale sau
empirice ale celor două fenomene economice, sistematizate, fie în serii
spaţiale (yi, xi,), i = 1, n , n = numărul unităţilor statistice omogene la care s-
au înregistrat, într-o anumită perioadă de timp, valorile celor două fenomene
y şi x, fie în serii de timp (yt, xt ), t = 1, n , n = numărul perioadelor
Modelul unifactorial

de timp în care s-au înregistrat valorile celor două fenomene y şi x la aceeaşi


unitate statistică.
Dispunând de o serie statistică privind variaţia, în timp sau în spaţiu,
a celor două variabile economice (vezi tabelul 3.2.1), problema identificării
constă în a alege o funcţie matematică, Yt = f(xt), cu ajutorul căreia,
cunoscând valorile fenomenului economic xt, să se aproximeze (să se
estimeze) cât mai bine (cu erori cât mai mici) valorile empirice ale
fenomenului yt = (y 1, y2, _ _ _, yn) prin valorile teoretice.

Tabelul 3.2.1

y −y
xt yt
ce = t −1 ⋅ t y
x y
t t−1
cmi = t −1
x −x i y x −x
t t −1 t −1 t t −1

x1 y1 -- --
x2 y2 y −y x y −y
2
2 1

= cm2 ce2 = 1


1

x2 − x1 y1 x2 − x1
M M M M

x y −y
n n yn n−1 x y −y
x −x = cmn cen = yn−1 ⋅ x n − x n−1
n n−1 n−1 n n−1

Această operaţie se poate face, în general, utilizând următoarele


procedee de lucru:
a) procedeul grafic;
b) procedeul conservării ariilor;
c) procedeul calculelor algebrice.
Modele econometrice

a) Procedeul grafic constă în construirea corelogramei dintre cele


două variabile:

ymax

y1
S
0
L x

Figura 3.2.1

La construirea corelogramei, scala pe cele două axe, Oy şi Ox,


trebuie să se calculeze pe baza următoarei reguli:
x
A max −x1
Ox : 1 cm ≈ x =
L L
y
Ay max −y1
Oy : 1 cm ≈ L = L

adică variaţia fiecărei variabile, exprimată prin amplitudinea acesteia, Ax şi


Ay, este reprezentată printr-un un segment de dreaptă având aceeaşi lungime,
L, pe cele două axe. În acest mod, intensitatea legăturii dintre cele două
variabile, exprimată prin amplitudinea acestora, nu este viciată de grafic –
prin aplatizarea sau alungirea acestuia.
Prin unirea cu segmente de dreaptă a punctelor N(xt, yt) se obţine
graficul punctelor empirice – vezi Figura 3.2.1. În funcţie de forma
graficului punctelor empirice se alege o funcţie matematică al cărei grafic
aproximează cel mai bine graficul punctelor empirice.
Modelul unifactorial

În urma acestei operaţii se va alege:


- funcţia liniară: Yt = a + b xt – dacă curba empirică poate fi
aproximată cu o dreaptă;
- funcţia putere: Yt = a xtb – dacă curba empirică poate fi
aproximată cu curba acestei funcţii;
sau
ln Yt =ln a + b ln xt – dacă curba empirică poate fi aproximată cu o
dreaptă pe un grafic dublu logaritmic;

ln y

0 ln x

- funcţia exponenţială: Yt = ea+bxt - dacă curba empirică poate fi


aproximată cu graficul acestei funcţii,
sau
ln Yt = a + b xt – dacă curba empirică poate fi aproximată cu o
dreaptă pe un grafic semilogaritmic;

ln y

0 x

Y
e t = a b xt  Yt = ln a + b ln xt
Modele econometrice

0 ln x

b) Procedeul conservării ariilor continuă procedeul grafic şi constă


în a compara suprafaţa curbei empirice „S” – vezi figura 3.2.1 – cu
suprafeţele teoretice Sj, ale celor h, j = 1, h , funcţii matematice: j = 1 
funcţia liniară, j = 2  funcţia putere etc.
Suprafaţa aferentă curbei empirice „S” se va calcula prin însumarea
suprafeţelor trapezelor al căror număr, (n-1), depinde de numărul punctelor
empirice N(xt, yt), t = 1, n , iar suprafeţele teoretice ale funcţiilor
matematice, acceptate în urma vizualizării curbei empirice, se vor calcula cu
ajutorul formulei:
x
max ()

S j = ∫ f j x dx
x1

În final, alegerea celei mai adecvate funcţii de regresie se poate face


cu ajutorul următoarei reguli:

min S − S j
j Sj

c) Procedeul calculelor algebrice se fundamentează pe proprietăţile


pe care le posedă funcţiile matematice y = f(x) privind următorii indicatori:

- Cm = ∂y – viteza de variaţie absolută a funcţiei sau coeficientul


∂x
marginal;
f (x )
- y= – viteza medie de variaţie a funcţiei (valoarea medie);
x
Modelul unifactorial

- Ce = ∂y : ∂x = ∂ ln y – viteza de variaţie relativă a funcţiei sau


y x ∂ ln x
coeficientul de elasticitate.
În acest sens, vom exemplifica proprietăţile acestor indicatori pentru
câteva categorii de funcţii de regresie.
Deoarece x şi y descriu fenomene economice valorile lor trebuie să
fie pozitive. Deci funcţiile de regresie sunt definite pe intervalul [0;+∞]
→[0;+∞]. Variabila y reprezintă variabila efect, iar variabila x variabila
cauză.

1. y = a + bx

În cazul în care parametrul b este pozitiv se spune că există o


dependenţă directă între cauză şi efect, iar când parametrul b este negativ se
spune că există o dependenţă inversă între cauză şi efect.
Parametrul a reprezintă valoarea efectului atunci când cauza este
egală cu zero.
Parametrii a şi b nu pot fi în acelaşi timp negativi deoarece s-ar
obţine pentru y doar valori negative.
În funcţie de valorile parametrilor a şi b există trei cazuri:

y y y
a, b≥ 0 a<0 a>0
b>0 b<0
a
a

x x x
a a

− b − b
Modele econometrice

Cm Cm
b<0
b>0

′b x
1. a) Cm = y x = b x b
În cazul în care b>0, la o creştere cu o unitate a lui x îi va corespunde
o creştere cu b unităţi a lui y. În cazul în care b>0, la o creştere cu o unitate a
lui x îi va corespunde o scădere cu b unităţi a lui y.

y
y
b
y a b
1. b) y = x = b + x
x x
a<0, b>0
a>0, b>0

y
y
lim y = b ;
x →∞
lim y = ∞ , pentru a> 0
x →0 x x
lim y = −∞ , pentru a< 0 b b
x →0
a>0, b<0
a<0, b<0

În cazul în care cauza este maximă, aceasta tinde spre infinit, efectul
mediu fiind egal cu b. Atunci când cauza tinde către zero, iar parametrul a
este pozitiv, efectul mediu (efectul pe fiecare unitate de cauză) va tinde să
fie maxim, spre infinit, iar dacă parametrul a este negativ, efectul mediu
tinde să fie minim, spre minus infinit.
Modelul unifactorial

Ce

′ x bx
1. c) ⋅
Ce = y x =
y a + bx
lim Ce = 0 ; lim Ce = 1
x →0 x →∞

Coeficientul de elasticitate exprimă cu câte procente se modifică


efectul atunci când cauza se modifică cu un procent. Se observă că, la o
modificare cu un procent a cauzei, pentru valori mici ale acesteia, tinzând
către zero, efectul nu se modifică cu nici un procent. În cazul valorilor mari
ale cauzei, modificarea cu un procent a acesteia implică o modificare cu un
procent a efectului. Indiferent de valorile cauzei, unei modificări de un
procent a acesteia îi vor corespunde modificări ale efectului cuprinse între
zero şi unu.

b
2. y = a + x ; a, b>0
y lim y = +∞
x →0
x >0
lim y = a
a x →∞

x
b
y′=− <0 ⇒ y este
2
x
descrescător
Modele econometrice

b
2. a) Cm = −
2
x
Cm

x lim Cm = −∞ ; lim Cm = 0
x →0 x →∞
x >0

(-1) 2b
3
(Cm) x = (− b)⋅ (x 2 )2 ⋅ 2x =x ⇒
Cm e crescător pe (0, +∞)

Deci, la creşteri ale cauzei, efectul scade. Pentru valori mici ale
cauzei modificările efectului sunt foarte mari, tinzând spre infinit, iar pentru
valori foarte mari ale cauzei, modificările efectului, ca urmare a modificării
cauzei, tind spre zero. Cu cât valorile cauzei sunt mai mari, cu atât efectul
variază mai puţin la variaţiile cauzei.

a b
2. b) y = +
2
x x
y lim y = +∞ lim y = 0
x →0 x →∞
x >0

a b 1 ax+b

2 2
( y )x′ =− x2 − (x ) ⋅2x=− x2
x

Deoarece x>0, a, b>0 ( y )x′ < 0
x descrescător
⇒ y

În cazul în care cauza tinde spre infinit, efectul mediu, adică efectul
pe unitatea de cauză este zero. Atunci când cauza tinde către zero, efectul pe
fiecare unitate de cauză tinde spre infinit. Efectul mediu este descrescător,
deci, cu cât cauza este mai mare, efectul pe unitatea de cauză este mai mic.
Modelul unifactorial

′ x b
=−
2. c) Ce = y x ⋅ y ax + b
Ce

lim Ce = −1
x x →0
x >0

-1 lim Ce = 0
x →∞
−1 ab
(Ce)x′ = ( −b) ⋅ 2 ⋅a= 2 > 0⇒
(ax + b) (ax + b)
Ce este crescător

Se observă că, la o modificare cu un procent a cauzei, pentru valori


mici ale acesteia, tinzând către zero, efectul se modifică (scade) cu un
procent. În cazul valorilor mari ale cauzei, modificarea cu un procent a
acesteia nu implică nici o modificare a efectului. Indiferent de valorile
cauzei, la modificări (creşteri) cu un procent ale acesteia le corespund
modificări (scăderi) ale efectului cuprinse între zero şi unu. Cu cât valorile
cauzei sunt mai mari, cu atât modificările relative ale efectului sunt mai
mici.

2
3. y = a + bx + cx , a, b şi c nu sunt toţi egali cu zero.
Graficul acestei funcţii depinde de parametrii a, b şi c. De exemplu,
pentru a>0, b<0, c>0 se obţine următorul grafic:

y b

y x = 2cx +b =0 ⇒x = − 2
c
′′
yx = 2c > 0 ⇒ x corespunde
x2
x1 b lui y minim
a −
2c b ∆
x min y − ;−
2c 4c


4c

3. a) Cm = y x′ = 2cx + b
Modele econometrice

Dacă c este negativ, atunci Cm este descrescător, deci variaţiile


efectului ca răspuns la variaţia cauzei sunt din ce în ce mai mici. Dacă b este
pozitiv, înseamnă că, pentru o cauză mai mică decât –b/2c, efectul creşte ca
urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c efectul scade
ca urmare a creşterii cauzei. Dacă b este negativ, efectul va scădea ca
urmare a creşterii cauzei.
În cazul în care c este pozitiv, Cm este crescător, deci variaţiile
efectului ca urmare a variaţiilor cauzei sunt din ce în ce mai mari. Dacă b
este negativ, înseamnă că, pentru o cauză mai mică decât –b/2c efectul scade
ca urmare a creşterii cauzei. Pentru o cauză mai mare decât –b/2c, efectul
creşte ca urmare a creşterii cauzei. Dacă b este pozitiv, efectul va creşte ca
urmare a creşterii cauzei.

Cm
b>0
c>0
b<0

x
b
− 2c

3. b) y =
a + bx
2
+ cx
x
- pentru a, c>0:
lim y = +∞
x →∞
y
lim y = +a = +∞
x →0 0
x >0

cx 2 − a x ≥0 = a
⇒x
b + 2 ac ( y )x ′ = x 2 1,2 c
x
a (y)
a = 2 ac + b
c
c
Modelul unifactorial

a
x
0 + c +∞
------------- 0 + + + + + + +
(y)′x
y | +∞ b + 2 ac +∞

2
Ce x bx + 2cx
2
2 3.c) Ce = y ′ ⋅ y = a + bx + cx
lim Ce = 2
x →∞
0 lim Ce = 0
x x →0

b
4. y = ax , a>0 deoarece y trebuie să fie pozitiv, iar fucţia putere este
o funcţie pozitivă şi b≠1, deoarece altfel s-ar obţine o funcţie liniară.

b-1
4. a) Cm = abx ⇒ grafic similar cu cel al funcţiei iniţiale
y b −1
4. b) y = x = a ⋅ x ⇒ grafic similar cu cel al funcţiei iniţiale
x x
b −1
4. c) Ce = y ⋅ y = a ⋅b ⋅ x . a⋅xb = b
Modele econometrice

Ce
b>0
b

x
b<0
b

Dacă b este cuprins între zero şi unu, atunci cauza variază în acelaşi
sens cu efectul, dar coeficientul marginal fiind descrescător, înseamnă că
variaţiile efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe
unitatea de cauză este cu atât mai mic cu cât cauza este mai mare. Totuşi,
dacă există o variaţie de un procent a cauzei, efectul va varia cu b procente,
indiferent de mărimea cauzei.
Dacă b este mai mic decât unu, atunci cauza variază în sens invers
efectului. Coeficientul marginal fiind descrescător, înseamnă că variaţiile
efectului sunt din ce în ce mai mici. De asemenea, şi efectul pe unitatea de
cauză este cu atât mai mic cu cât cauza este mai mare. Dacă există o variaţie
de un procent a cauzei, efectul va varia cu b procente, indiferent de mărimea
cauzei.
Dacă b este mai mare decât unu, atunci cauza variază în acelaşi sens
cu efectul. Coeficientul marginal fiind crescător, înseamnă că variaţiile
efectului sunt din ce în ce mai mari. De asemenea, şi efectul pe unitatea de
cauză este cu atât mai mare cu cât cauza este mai mare. Dacă există o
variaţie de un procent a cauzei, efectul va varia cu b procente, indiferent de
mărimea cauzei.
Prin compararea proprietăţilor indicatorilor teoretici ai funcţiilor de
regresie – variaţie continuă – cu indicatorii empirici – variaţie discretă – ai
celor două variabile, calculaţi pe baza seriei statistice –
ce x
−y y −y −x
cm i = y t t −1
; i =
t t −1 t
:
t −1
– se va putea alege acea
−x y x
xt t −1 t −1 t −1

funcţie de regresie ai cărei indicatori au proprietăţi apropiate cu indicatorii


empirici.
Modelul unifactorial

De exemplu, dacă coeficienţii marginali ai variabilei y în raport de


variabila x, calculaţi pe baza seriei statistice sunt aproximativ egali:
−y
y2−y1 y3−y2 yn n −1
x −x
x2−x1 ≈ x3−x2 ≈K≈ n n −1 ≈ ct ∀ t = 1, n; se va alege
b
funcţia liniară - Yt = a + b xt, sau funcţia putere - Yt = axt - în cazul în care
coeficienţii empirici de elasticitate vor fi aproximativ egali:
x y −y
x1 y2−y1 x2 y3−y2 n −1 n n −1

y x −x
y 1 ⋅ x 2 − x 1 ≈ y 2 ⋅ x 3 − x 2 ≈ K ≈ n −1 ⋅ n n −1

De reţinut că, în economia reală, datele statistice relevă corelaţii


diverse şi contradictorii, care nu pot fi descrise cu o singură funcţie
matematică. În astfel de cazuri se recomandă ca identificarea modelului
econometric să se facă cu ajutorul mai multor funcţii de regresie, urmând ca,
în final – în etapa de verificare a modelului –, să se decidă asupra unei
singure forme a modelului.

3.3 Estimarea parametrilor unui model econometric unifactorial

Parametrii unui model econometric sunt reprezentaţi de coeficienţii


funcţiei de regresie acceptată în etapa de identificare a acestuia. Aceşti
parametrii fiind necunoscuţi, ei vor trebui estimaţi (aproximaţi) pe baza
datelor experimentale sistematizate în seriile statistice ale celor două
variabile y şi x, prin valorile yt, xt, t = 1, n .
Funcţiile de regresie ale unui model econometric unifactorial pot fi
funcţii linare, Y= a + bx, sau funcţii neliniare, ca de exemplu:
b
- funcţia putere – Yt = a xt ;
a+bx
- funcţia exponenţială – Yt = e t;
2
- funcţia de gradul doi – Yt = a + bxt + cxt ;
c
- funcţia logistică –Y t = .
1+ e a+bxt
Modele econometrice

Deoarece, în numeroase cazuri, funcţiile neliniare (curbilinii) pot fi


liniarizate, estimarea parametrilor unui model econometric se va axa numai
pe cazul modelelor liniare. Liniarizarea unui model neliniar se poate face
prin mai multe procedee, cum ar fi: logaritmarea modelului econometric,
schimbări de variabilă, stabilirea arbitrară a valorii unor parametri etc.
De exemplu:

Liniarizarea prin logaritmare b

1) Fie modelul neliniar exprimat prin funcţia putere – yt = a xt ut.

ln yt = ln a +b ln xt + ln ut,
sau
* * *
y t = A + b xt + ut
unde: *

yt = ln yt;
*

xt = ln xt;

a+bx
2) Cazul modelului neliniar exponenţial – yt = e t ut
Prin logaritmare acesta devine:
* *
ln yt = a + b xt + ln ut  yt = a + b xt + ut

Liniarizarea prin schimbare de variabile


2 k
Fie modelul neliniar – yt = b0 + b1x + b2xt + _ _ _ + bkxt + ut
2 k
Notând cu: x1t = xt; x2t = xt ;…, xkt = xt , se obţine modelul liniar
multifactorial:
yt = b0 + b1 x1t + b2 x2t + … + bk xkt + ut

Liniarizarea prin fixarea arbitrară a valorii unor parametri


Acest model poate fi aplicat atunci când, pe baza unei analize
economice a fenomenelor studiate, se poate evalua valoarea unui parametru.
Modelul unifactorial

De exemplu, funcţia logistică se pretează foarte bine la descrierea evoluţiei


consumului (y) unui anumit produs în funcţie de venitul consumatorului (x).
Dar, consumul unui anumit produs are anumite limite raţionale, respectiv un
nivel de saturaţie, nivel estimat prin parametrul „e” al funcţiei logistice.
Stabilind valoarea parametrului prin constanta „c” – acest lucru se poate
face, fie prin calcule statistice de specialitate, fie prin preluarea valorii
acestuia de la o ţară dezvoltată unde consumul acelui produs s-a stabilizat –
funcţia logistică se poate transforma într-o funcţie liniară:

c c a+bx c
=
yt = + a+bx t ⇒ − 1e t ⇒ ln − 1 = a + bx t ⇒
y y
1e t t

* ∗ c
y
yt = a + b xt, unde: t = ln −1
y
t

Revenind la problema estimării parametrilor unui model


econometric, aceştia pot fi calculaţi cu ajutorul mai multor metode cum ar fi:

a) metoda punctelor empirice (M.P.E.);


b) metoda punctelor medii (M.P.M.);
c) metoda celor mai mici pătrate (M.C.M.M.P.);
d) metoda celor mai mici pătrate generalizată;
e) metoda verosimilităţii maxime (M.V.M) cu informaţie limitată
sau completă.
Metodele a) şi b) se folosesc atunci când nu se urmăreşte o rigoare
statistică a calculelor, datorită simplităţii şi rapidităţii calculelor, sau când
aplicarea M.C.M.M.P. este anevoioasă, necesitând calcule complicate.
Metodele d) şi e) au mai mult valoare teoretică deoarece, în
economie, ipotezele pe care se fundamentează pot fi acceptate cu multă
reţinere, în plus, calculele complicate pe care le solicită, măresc mult costul
estimării parametrilor, fără a genera o creştere pe măsură a preciziei
estimaţiilor.
Modele econometrice

Estimarea parametrilor unui model liniar unifactorial presupune:


- existenţa seriei statistice a celor două variabile economice

Tabelul 3.3.1
x y x 2 xy ˆ uˆ (uˆt )
2

t t t t t yˆ t = aˆ + bx t t = y t − yˆ t
x y x
2
x y
ˆ
yˆ 1 = aˆ + bx 1
ˆ =y1 − ˆ
u
1
y
1 (uˆ )
2
1 1 1 1 1 1
| | | | | | |

|| || || || || || ||
2
x y x x y ˆ ˆ =yn −ˆ 2
u
n n n n n yˆ n = aˆ + bx n | n yn (uˆn )
2
Σ xt Σ yt Σ xt2 Σ xt yt ∑ yˆ ∑uˆ = 0 ∑ (uˆ )
t t t

- modelul econometric liniar:


yt = a + bxt + ut (3.3.1)
yˆ ˆ
t = aˆ + bx t (3.3.2)

t = y t − yˆ t (3.3.3)
unde:
yt ,
xt a, = valorile empirice ale variabilelor;
b = parametrii modelului;
ˆ
ˆ
= estimaţiile parametrilor modelului;
a, b
ut = variabila eroare;

uˆt = estimaţia lui ut.

- utilizarea unei metode de estimare pentru a calcula estimatorii


parametrilor modelului.

În acest sens ne referim la:


a) Metoda punctelor empirice (M.P.E.) - constă în alegerea unui
număr de puncte empirice, M(xt, yt), egal cu numărul parametrilor
modelului. Coordonatele acestor puncte se introduc în funcţia de regresie a
modelului şi va rezulta un sistem de ecuaţii egal cu numărul acestora. De
Modelul unifactorial

exemplu, în cazul modelului liniar -vezi relaţia (3.3.1) - vor trebui alese
două puncte. Fie acestea, M3(x3, y3) şi M8(x8, y8):

ˆ y3 x3 1 y3
=ˆ+
y3 a bx3 y8 x8 ˆ 1 y8

y ˆ
= aˆ + bx
⇒ aˆ = 1 x 3
; b= 1 x3
8 8 1 x8 1 x8

De regulă, alegerea punctelor empirice se face, fie pe baza


reprezentării grafice a celor două serii statistice, în sensul că acestea ar
trebui să fie foarte aproape de dreapta virtual trasată sau să fie intersectate
de aceasta, fie prin aprecierea că aceste puncte sunt reprezentative pentru
caracterizarea variaţiilor celor două fenomene şi nu sunt rezultatul unor
condiţii speciale.

b) Metoda punctelor medii (M.P.M.) – presupune ca cele două serii


statistice să fie împărţite într-un număr de subserii egal cu numărul
estimatorilor. Pentru fiecare subserie se vor calcula mediile aritmetice ale
celor două variabile. Aceste valori medii se vor introduce în funcţia de
regresie şi se va continua procedura ca în cazul M.P.E. Dacă numărul
termenilor seriilor statistice nu este divizibil cu numărul parametrilor, se va
renunţa la un număr de termeni – cei mai îndepărtaţi în timp sau de media
celor două variabile. De exemplu, în cazul modelului liniar, numărul
parametrilor este egal cu doi. Dacă seriile de timp ale celor două variabile se
referă la nouă perioade, t = 1,9 , se va renunţa la valorile primei perioade,
respectiv la x1 şi y1. În acest caz, cele două serii vor fi:

x x x4 x x = 1(x 2 + x 3 + x 4 + x 5 )
2 3
5 ⇒ 4 ;
1

y
5
1
y 1 = ( y 2 + y3 + y4 + y5)
y y y
2 3 4 4
Modele econometrice

1(x +x +x +x )
x 6 x 7 x8 x x2 = 6 7 8 9
9 ⇒ 4
y 2 =1 ( y6 + y7 + y8 + y9)
y
9
y y y
6 7 8 4

Prin introducerea acestor valori în relaţia (3.3.2) rezultă:

y 1 x1 1 y 1
ˆ ˆ
aˆ + b x1 = y 1 ⇒ aˆ = y 2 x2 ; b = 1 y 2
ˆ =y
aˆ + bx 1 x1 1 x 1

2 2 1 x
2 1 x 2

c) Metoda celor mai mici pătrate (M.C.M.M.P.) – este tehnica de


lucru cea mai des folosită la estimarea parametrilor unui model econometric.
Utilizarea acestei metode porneşte de la următoarele relaţii:

yt = a + bxt + ut
ˆ
yˆ t = aˆ + bx t
ˆ
uˆt = y t − yˆ t = y t − aˆ − bx t

unde:
yt, xt = valorile reale ale celor două fenomene economice existente în
seriile statistice ale acestora;

t = valorile teoretice ale variabilei y, obţinute numai în funcţie de
valorile factorului esenţial xt şi de valorile estimatorilor
ˆ ˆ
parametrilor a şi b, respectiv a şi b ;
uˆt = estimaţiile valorilor variabile reziduale ut.

Practic, M.C.M.M.P. constă în a minimiza funcţia:

ˆ n
( )
F a,b
ˆ = min ∑ ( y t − ˆ yt)
2 = min ∑ n(y t −ˆ−ˆa bx t
2
)
(3.3.4)
t =1 t =1
Modelul unifactorial

adică a minimiza suma pătratelor distanţelor, faţă de axa OY, dintre valorile
reale, yt, şi valorile teoretice, yˆ t .
Condiţia de minim a funcţiei (3.3.4) rezultă din:

ˆ n
∂F (aˆ , b)
=0⇒ ∑2(yt −ˆ −
ˆ
− = 0⇒ ∑(yt − ˆ−
ˆbx ) =
0 (3.3.5)
a bxt )( 1) a
∂aˆ
t

t =1
ˆ n
∂F(aˆ,b) ˆ ˆ 2
− − =
= ⇒ − ˆ− = ⇒
ˆ 0 ∑ ( a bx t )( 0 ∑(y x
) 0 (3.3.6)

− ˆ
2 yt xt ) t t ax t bx t

∂b t=1

sistem de ecuaţii ce devine în final:

ˆ n n
naˆ +b⋅∑xt =∑yt

t =1 t =1 (3.3.7)
n

aˆ ⋅ ∑ x t + b ⋅ˆ∑ x t
2
=∑ y t xt

t =1

din care se vor calcula valorile estimatorilor:


- estimaţia parametrului a
ˆ ˆ ∑yt ˆ
n aˆ + b ∑ x t = ∑yt * 1n ⇔ aˆ + b ∑nx t = n ⇔ aˆ = y − b x (3.3.8)

- estimaţia parametrului b

n ∑y t ∑y t xt − x* y
(3.3.9)
ˆ ∑xt ∑yt xt n ∑y t xt − ∑ y t ∑xt n
b= n ∑xt = n ∑x 2 − (∑x )2 = ∑x
2
t

2 2
∑xt ∑xt t t n −x

- dispersia variabilei x

2 ∑ (x t − x )2 (
∑ x t2 − 2x t x + x 2
) ∑ x t2 ∑xt 2
σ
= − 2x +x =
x = n = n n n
Modele econometrice

2 2
∑x ∑x
2
= n − x2
t t

= n − 2x + x 2

∑ y t x t − x* y
ˆ n
2
⇒b= σ
x

- covarianţa dintre variabilele y şi x


∑ (x − −
t x )( y t − y ) = ∑ (x t y t − x t y x y t + x ⋅ y ) = ∑ x t y t −
cov ( y , x )= n n
n ∑x i y
− ∑xt ∑y t ∑xt y t − −x ⋅ y
tn
y −x n +x ⋅ y = y ⋅x − x ⋅ y +x ⋅ y =
n n
(3.3.10)
)(y
ˆ cov ( y , x ) ∑ (x t − x t −y )
⇒b= =
σ2x ∑ (x t − x ) 2
- coeficientul de corelaţie liniară a celor două variabile

σ σ
cov(y , x ) x y
ˆ ˆ
r(y , x ) = r(x , y ) = σ x σ y ⇒ r(y , x ) = b ⋅ σ y ⇒b = r(y , x )⋅ σ x (3.3.11)
unde: σy, σx = abaterile medii pătratice ale variabilelor y şi x.

Sistemul de ecuaţii, format din relaţiile (3.3.5) şi (3.3.6), rezultat în


urma aplicării M.C.M.M.P., poartă numele şi de sistem de ecuaţii normale.
Acest sistem de ecuaţii posedă câteva proprietăţi cum ar fi:
Din ecuaţia (3.3.5) se deduce că:

(
1) ∑ y t − ˆ − ˆ a bx t )
= ∑ut
ˆ =0⇒ M (ut )
ˆ = 0 – variabila aleatoare ut
t t
este de sumă nulă şi, evident, de medie zero;
Modelul unifactorial

ˆ
(
2) ∑ y t −ˆ − a bx t )
=∑ ( y t − ˆ yt)
= 0⇒ ∑ y t = ∑yt
ˆ – suma
t t t t

valorilor empirice ( ∑ y t ) este egală cu suma informaţiilor teoretice ( ∑ yˆ t )


t t

– principiul conservării informaţiilor.

Din rezolvarea sistemului de ecuaţii rezultă că:

ˆ – dreapta de regresie, ˆ
3) aˆ = y − bx yˆ t = aˆ + bx t , trasată pe baza
M.C.M.M.P., trece prin punctul M (x , y ) – vezi figura 3.3.1; )
(x
t −x
∑ ( y t − y )(x t − x ) ∑ [( y t − y )(x t − x )]⋅
(x t − x )
t = =

)2 ]
ˆ
4) b = ∑ (x t − x )2 ∑ (x t − x )2
y −y
⋅ (x
[
t

∑ t −x)
2 ∑ bt (x t − x
t
x
t
−x
t ⇒ panta dreptei de regresie,
= =
∑ (x
2
∑ (x t − x ) t −x )2
t
ˆ
yˆt = aˆ + bxt , este o medie aritmetică a pantelor dreptelor ce pot fi trasate
y
prin punctele M (x , y ) şi M t (x t , y t ) , respectiv bt = t − y , ponderate
xt − x
2
cu pătratul abaterilor, (x t − x ) , variabilei factoriale x – vezi figura 3.3.1.
Modele econometrice

y − y
b = 2

y 2 x2 − x yˆ = a + bx
yn
y − y
b = 1

1 x1 − x
M
y

y
M2
2

y M
1
1
x1 x2 x xn x
0

Figura 3.3.1

b
b= 1 (x1 − x )2 + b2 ( x2 − x )2 + K + bn (xn − x )2

( x1 − x )2 + ( x2 − x )2 + K + ( xn − x )2
După estimarea parametrilor a şi b prinvalorile a ˆ se vor
ˆ
şi b

yˆ ˆ
putea calcula valorile teoretice ale fenomenului explicat y, t = aˆ + bx t , şi
apoi estimaţiile variabilei aleatoare u, prin uˆt = y t − yˆ t (vezi tabelul 3.3.1,
coloanele 5 şi 6).

3.4 Verificarea modelului econometric

Întrucât modelul econometric, în etapele de specificare, identificare


şi estimare, se fundamentează pe acceptarea unor ipoteze de lucru, cât şi pe
date experimentale de sondaj, este necesar ca, înainte de utilizarea sa ca
instrument pertinent scopului urmărit, acesta să fie verificat (testat, filtrat).
În această etapă se pune problema similitudinii dintre modelul economic
real, descris de seriile statistice ale fenomenelor analizate, şi modelul
teoretic, de natură econometrică, construit şi rezolvat.
Modelul unifactorial

În economie, spre deosebire de domeniul tehnic, de exemplu, nu


putem vorbi de o similitudine absolută între modelul teoretic şi modelul real
(cum poate să existe între macheta unei clădiri şi clădirea construită), ci de o
similitudine statistică între cele două modele, în sensul că modelul
econometric posedă şi descrie în mare (în medie) principalele caracteristici
ale modelului economic real.
Practic, acceptarea econometrică a modelului teoretic ca model
similar, ca aproximaţie statistică echivalentă cu modelul real, presupune:
3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea
parametrilor unui model econometric
3.4.2 Verificarea semnificaţiei estimatorilor pararametrilor
modelului econometric
3.4.3 Verificarea similitudinii modelului econometric

3.4.1 Verificarea ipotezelor pe care se fundamentează estimarea


parametrilor unui model econometric

În general, estimatorul sau estimaţia este o aproximaţie a unei


dimensiuni privind un anumit fenomen. Această dimensiune (volum,
suprafaţă, valoare etc.) exactă, stabilă şi repetabilă, adică constantă,
reprezintă parametrul (măsura) unei caracteristici, al unei însuşiri a unităţilor
statistice.
Statistica calculează parametrii caracteristicilor unităţilor statistice
ale unei populaţii în urma unei observări totale asupra colectivităţii
statistice. Dacă datele privind valorile caracteristicilor provin dintr-o
observare selectivă (sondaj), indicatorii calculaţi din aceste date reprezintă
estimaţiile statistice ale parametrilor, adică ale indicatorilor care s-ar fi
obţinut din prelucrarea datelor provenite dintr-o observare totală. Dar
statistica nu foloseşte orice fel de aproximaţii, de estimaţii ale parametrilor,
1
ci numai estimaţii de maximă verosimilitate .

1 Vezi teorema 2 şi 3.
Modele econometrice

Din acest motiv, estimarea parametrilor unui model econometric se


fundamentează pe câteva ipoteze pe care trebuie să le posede modelul
econometric – yt = a + bxt + ut.
Aceste ipoteze se referă la:
I1: Cele două variabile yt şi xt sunt observate fără erori de măsură. ut
este o variabilă aleatoare, iar variabila xt este un fenomen cu
valori predeterminate => variabila explicată yt este la rândul ei o
variabilă aleatoare;
I2: Variabila aleatoare ut este de medie nulă, M(ut) = 0, şi de
2 2 2 2
dispersie constantă, D (u1) = D (u2 ) = K = D (un ) = σ u , ∀ t = 1,n .
Ipoteza I2 presupune că erorile ut sunt homoscedastice şi nu
2 2 2 2
heteroscedastice D ( u1 ) ≠ D ( u2 ) ≠K≠ D ( un ) ≠σu ;
I3: Valorile variabilei reziduale sunt independente (nu sunt corelate),
adică nu există fenomenul de autocorelare a erorilor:
0, i ≠ j ⇒ erorile sunt independente
cov( u i ,u j ) =
≠ 0, i ≠ j ⇒ erorile sunt autocorelate
I4: Variabila aleatoare ut urmează distribuţia normală, de medie zero
şi de abatere medie pătratică constantă şi egală cu
2
σ u = σu = ct , respectiv L(ut) = N(0, σu)

Dacă aceste ipoteze pot fi acceptate, iar estimarea parametrilor


modelului liniar unifactorial – yt = a + bxt + ut – , atunci se pot demonstra
următoarele:
Se efectuează o selecţie de volum n, adică se observă valorile
caracteristicii x şi, pentru fiecare valoare observată, valorile caracteristicii y
/ x=xt = yt . Se obţine astfel selecţia: (xt,yt)t=1,….,n. Pe baza acestei selecţii
se estimează parametrii a şi b din modelul de regresie liniară -yt =a+bxt+ut..
Modelul unifactorial

Parametrii a şi b pot fi estimaţi prin:


- metoda celor mai mici pătrate prin care se minimizează suma
pătratelor erorilor, adică funcţia:

n 2 n
ˆ 2
( )
F a,b
ˆˆ = min ∑ut
ˆ = min ∑ (y t − ˆ− a bx t )

t =1 t =1

- metoda verosimilităţii maxime prin care se maximizează funcţia


de verosimilitate, adică:

L ( y t ;a,b ) = f (y 1 )⋅ f (y 2 )⋅ ... ⋅ f (y n ); t = 1, n , unde f


este
repartiţia caracteristicii y.

Teorema 1
Dacă variabila reziduală ut este repartizată normal, având media
egală cu zero şi abaterea medie pătratică σu, atunci metoda verosimilităţii
maxime este echivalentă cu
metoda celor mai mici pătrate. y = a + bx + u , u este repartizată N(0, σu),
Demonstraţie
În cazul modelului liniar
ceea ce este echivalent cu y repartizată N(a+bx, σ).
Funcţia de verosimilitate a caracteristicii y este:
ˆ
ˆ = ⋅ ⋅ ⋅
..
(
L y t ; a,b ) f (y1 1 ) f (yˆ
− −ˆ −
2 ) . f (y n )
− 1
−ˆ−ˆ 2

(y (y )⇒
2

ˆ ˆ = 1 2σ 2
1 a bx1 ) ⋅ ⋅ 1 2σ 2 n a bx n

e e
(
L y t ; a,b ) 2πσ ... 2πσ
1 n −
1
2 ∑n ( y t − aˆ − bˆ x t )2
⇒ ˆ ˆ = ⋅ 2σ t=1

(
L yt;a ,b ) 2πσ e
Modele econometrice

Metoda verosimilităţii maxime presupune maximizarea funcţiei de


verosimilitate:
n n 2
ˆ ˆ ⇔ ˆ ˆ = 1 − 1 − ˆ− ˆ
max 2 ∑(y t bxt )
max L( yt , a,b)
a,b
max ln L( yt , a,b)
a,b a,b
ln
2π σ 2σ a

t=1

n
1
Deoarece σ este constant, ln
= k = constant.
2πσ

n ˆ
n 2 n 2
max ln 1 − 1 − ˆ −ˆ + − 1 − ˆ− =
a,b
2 ∑(y t ) = max 2σ
2π σ 2σ a bxt
k a,b 2 ∑(y t
a bxt )

t=1 t=1
=k+ − ˆ ˆ
1 n −ˆ− 2 = + − 1 ˆ
min (y t a bxt ) k ( )
min F a,b

2σ 2 a,b 2σ 2 a,b
t=1

În concluzie, a determina maximul funcţiei de verosimilitate este


echivalent cu a determina minimul sumei pătratelor erorilor.

Observaţie
Se ştie că estimatorii de verosimilitate maximă sunt estimatori
nedeplasaţi, consistenţi şi eficienţi, adică:
ˆ
- M ( aˆ ) = a, M ( b ) = b (estimatorii sunt nedeplasaţi);
p ˆ p
- aˆ→ a, b→ b (estimatorii sunt consistenţi);
- orice alt estimator pentru a şi b are dispersia mai mare decât ˆ
ˆ

dispersia lui a şi b (estimatorii sunt eficienţi).


În cazul repartiţiei normale a variabilei reziduale, estimatorii obţinuţi
prin metoda celor mai mici pătrate sunt nedeplasaţi, consistenţi şi eficienţi.
În consecinţă, aceşti estimatori pot fi consideraţi drept cei mai buni în
procesul de decizie sau de modelare econometrică.
Modelul unifactorial

Teorema 2
Dacă variabila reziduală este repartizată normal, având media egală

2
2 ˆ σ
u
cu zero şi dispersia σu = ct. , atunci b este repartizat N b , n 2
.
∑ (x t − x )
t =1

Demonstraţie
∑ y t (xt − x )− y ∑(xt − x )
n n
n n

ˆ
∑(y t − y )(x t − x )
t =1 t =1
(
∑ y t xt − x ) n
b=
= t =1 n
( − )2 =t =1n = ∑α t y
n
( − )2 t

∑xt x ∑xt x ∑ (x t − x )2 t =1
t =1 t =1 t =1

unde:
x
t −x
αt = n

∑ (x t −x )2
t =1

ut ~ N (0,σ u )⇒ y t ~ N (a + bx t ,σ u ), t = 1, … , n

ˆ
În concluzie, b fiind combinaţie liniară de variabile aleatoare
repartizate normal, este şi el repartizat normal.

ˆ n n n n
M ( b ) = ∑αt M ( y t ) = ∑αt ( a + bxt ) = ∑αt a + ∑bαt x t
t =1 t =1 t =1 t =1

2 ˆ n 2 2 (y 2 n 2
D ( b ) = ∑αt D t) =σu ∑αt
t =1 t =1

Se calculează:
n n
(xt − x) =0
∑α t = ∑ n
t =1
t =1 ∑ (xt − x ) 2
t =1
Modele econometrice

n n n n 2
− 2x
2
∑xt − x ∑xt ∑xt 2 ∑xt + nx
n
∑α x
t t
n
(
= ∑ x t − x xt =t =1
n
) n
t =1 = t =1
n
t =1 =1
t =1 t =1 ∑ x ( t − x )2 ∑(x t − x )2 ∑ (x t − x )2
t =1 t =1 t =1

n 2 n (x t −x ) 2 1
∑α t
=∑ 2 = n
t =1 t =1 n

2 ∑(x t − x )2
(x t −x ) t =1
t =1

Deci:
= ˆ
M(b) b
2
2 ˆ σu
D (b)= n
∑ (x t −x )2
t =1

Teorema 3
Dacă variabila reziduală este repartizată normal, având media egală
2
cu zero şi dispersia σu = ct. , atunci aˆ este repartizat

2
N a, σ
2
⋅1 + x .
u n n
∑ x t−x) ( 2

t =1

Demonstraţie
n
∑yt
ˆ t =1 n n 1 n
aˆ = y − b x = n − x ∑α t y t = ∑n − xα t y t =∑ β t y t
t =1 t =1 t =1

unde:
1
β t = n − x αt , t =1,…., n
ut ~ N (0,σ u )⇒ y t ~ N (a + bx t ,σ u ), t = 1, … , n
Modelul unifactorial

În concluzie, aˆ fiind combinaţie liniară de variabile aleatoare


repartizate normal, este şi el repartizat normal.

n βt M ( y t n n βt a + n
M ( aˆ ) = ∑ ) = ∑ βt ( a + bx t ) = ∑ ∑bβt x t
t =1 t =1 t =1 t =1
2 2 2
n D (yt )=σu n 2
2
D ( aˆ ) = ∑ βt ∑ βt
t =1 t =1

Se calculează:
n
n n 1
∑ βt =∑
−xα
t t =1 n t

n n 1
∑ βtxt = ∑ −x
t
=
1 t=1 n
n 2 n 1 2

β
− xα
t =∑ t =
t t =1 n
t =1

M ( aˆ ) = a

1
2
D 2
( aˆ ) = σ u +
n
n ∑

t =1

Teorema 4
Da este fixat, iar variabila reziduală este repartizată normal,

x0

având media egală cu zero şi dispersia σu

1
repar
2
tizat Na + bx ,σ
0 u n
Modele econometrice

Demonstraţie
n
∑yt n
ˆ ˆ t =1

yˆ = aˆ + bx 0 = y + b (x 0 − x ) = + (x x )∑α y =
+ (x

n − x )α y
1
=∑

n 0 t =1 t t
0 tt n

t =1 n = ∑γ t y t
t =1

unde:
1
γ t = n + (x 0 − x )αt , t = 1, …, n
ut ~ N (0 ,σ u )⇒ y t ~ N (a + bx t ,σ u ), t = 1, … , n

Deci, yˆ fiind combinaţie liniară de variabile aleatoare repartizate


normal, este şi el repartizat normal.
∧ n n n n
M ( y ) = ∑βt M ( y t ) = ∑γt ( a +bxt ) = ∑γt a + ∑bγt xt
t =1 t =1 t =1 t =1

n ˆ = n −ˆ − ˆ 2
ˆ ˆ = min ∑( y t 2 min ∑(y t
( )
F a,b yt) a bxt )
t =1 t =1

Se calculează:
∑γ=∑1
n n
t 0
t =1 ∑γ
x t =1 n
=∑
1
+ (x − x )α x = x +

n n 0
t t

t =1 t =1 n
2
n 2 n 1
∑γ = ∑ +( x −x)α
t 0 t

t =1 t =1 n
t =1
Modelul unifactorial

Deci:
M ( yˆ ) = a + bx 0

1 (x 0
−x )2
D 2 ( yˆ ) = σ 2 +
n
u n
(x 2

∑ t −x)

t =1

Teorema 5
Dacă variabila reziduală este repartizată normal, având media egală
2
cu zero şi dispersia σu = ct. , atunci eroarea previziunii, uˆt = y t − yˆ t ,
2
2 1 (x t − x )
1 .
t = 1, .., n, este repartizată N 0,σu −n −n 2
∑ (x t −x)
t =1

Demonstraţie
ˆ
uˆt = y t − yˆ t = y t − aˆ − bx t
unde:
a ˆ
ˆ , b sunt repartizaţi normal

ut ~ N (0 ,σ u )⇒ y t ~ N (a + bx t ,σ u ), t = 1, … , n
În concluzie, uˆt fiind combinaţie liniară de variabile aleatoare
repartizate normal, este şi ea repartizată normal.

ˆ
ˆ= −ˆ= −ˆ+ =+−−= M( ut ) M( y t y t ) M( y t ) M( a bxt ) a bxt a bxt 0
D2(uˆt )= M(uˆt 2 )− M(uˆt )2 = M(uˆt 2 ) = M((yt − yˆt )2 )= M(yt2 )− 2M(yt yˆt )+ M(yˆt 2 )

M ( yt2 ) = D 2 ( yt ) + M ( yt ) 2 = σ u2 + (a + bxt ) 2

1 (xt−x)
2
+ (a +bxt )
2 2 2 2
M ( yˆ t ) = D ( yˆ t ) + M ( yˆ t ) = σu2 n+ n
− 2
∑( x t x)
t =1
Modele econometrice

ˆ ˆ ˆ
M(yt yˆt ) = M((a + bxt + ut )(aˆ + bxt )) = M ((a + bxt )((aˆ + bxt )) + M(ut (aˆ + bxt ))
2 ˆ
= (a + bxt ) + M(ut (aˆ + bxt ))
M ˆ ˆ ˆ ))
(u t
( aˆ + bx t )) = M ( u t (y−bx + bx t

ˆ n yk ⇒
b= ∑α k

k =1

ˆ + n α =
M ( ut ( a bx t
ˆ + )) = M u
t y
−x n

αkyk xt ∑ k
y
k

k =1 k =1
n n
= M ( ut y ) − M ( x ∑α k y k ut ) + M ( x t ∑α k y k ut )
1
k =1 1 1
k =1
2 2
M(uy)= M(∑y u) = M(u )= σ

t n k =1 k t n t n u

(deoarece erorile sunt necorelate între ele)


n n n

M ( x ∑αk yk ut ) = xM (∑αk yk ut ) = x∑αk M ( yk ut )


k =1 k =1 k =1

n n n

M (xt ∑αk yk ut ) = xt M (∑αk yk ut ) = xt ∑αk M ( yk u t )


k =1 k =1 k =1

n n

∑αk M ( ykut ) = ∑αk M ((a + bxk + uk )ut ) =


k =1 k =1
n n n

= ∑αk M ((a + bxk )ut ) + ∑αk M (ukut ) = ∑αk (a + bxk )M (ut ) + αt M (utut )
k =1 k =1 k =1

(x x) M ( ut ( aˆ + bx t )) = n σ u +
= t − σ2
∑(xt − x)2n

t =1

Deci:
ˆ 1 2
2
(xt −x)
n
2
∑( x t − x )
t =1
Modelul unifactorial

Din relaţiile anterioare rezultă că:

2
2 2 2 2
D ( uˆt ) = σ u + ( a + bx t ) + σ u (xt −x)
⋅1 +
2
+ ( a + bx t )
n n 2
∑( x t −x) −
t =1
2
−2σ
2 1 + (xt −x) − 2( a
2

2 1 (xt −x)
n
u n
∑( x t −x) + bx ) 2 =σ2 1 − −
t =1 t u n n −x) 2
∑( x t
t =1

Teorema 6
Dacă variabila reziduală este repartizată normal, având media egală
n ∧
cu zero şi dispersia σu = ct. , atunci
2 1 ∑ut 2
este un estimator
n − 2 t =1
2
nedeplasat pentru dispersia variabilei reziduale σu .

Demonstraţie
Trebuie demonstrat că:

1 n 2
M ∑uˆ 2 =σ
n − 2 t =1 t u

Folosind teorema anterioară rezultă că:

1 n 1 n 1 n
2
M ∑uˆ 2= ∑M ( uˆ 2) = ∑D ( uˆ ) =
n −2 t =1 t n −2 t =1 t n −2 t =1 t
n 2
2 ∑( xt − x )
1 n 1 ( xt − x ) 2 1 t =1
⋅σ
2 u = n −2 n −1− n 2
∑ 1−
= n −2 t =1 n− n −x)
∑( xt ∑( xt − x )
2 2
⋅σu =σu
Modele econometrice

Teorema 7
Dacă variabila reziduală este repartizată normal, având media egală cu
2
zero şi dispersia σu = ct. , atunci eroarea previziunii uˆ n +τ = y n +τ − yˆ n +τ ,

este repartizată N 0,σ


2
1+
1
+
(x n +τ − x )2 , pentru orice τ.
n
u n
∑ xt ( −x)
2

t =1

Demonstraţie
Se reia demonstraţia teoremei 5, unde t se înlocuieşte cu τ+n şi,
deoarece τ+n este mai mare ca n, pentru orice k = 1,.., n, M (uk un+τ ) = 0 ,
n

rezultă că: ∑αk M ( ykun+τ ) = 0 şi M (un+τ y) = 0 .


k =1
ˆ+ˆ =

Deci M ( u n +τ ( a bx n +τ )) 0

În final, rezultă că:

x
− ) 2

2 2 2 2 1 ( n +τ x 2

D (uˆ
n +τ
)=σ
u
+ (a + bx n +τ ) +σ u 1+ n + n (x t 2
+ (a + bx n +τ ) −

∑ −x)
t =1

) 2

− 2(a + bx
2
) =σ
2
1+
1
+
(x n


x
n+τ u n 2
n ∑ (x t − x )
t =1
Demonstraţia pentru normalitate şi valoarea medie este identică cu
cea de la teorema 5.
Deoarece, cele patru ipoteze, I1, I2, I3 şi I4, au fost acceptate a priori
în etapa de estimare a parametrilor, în această etapă urmează ca ele să fie
testate, iar eventualele abateri de la cerinţele lor să fie corectate prin
utilizarea unor proceduri econometrice adecvate fiecărei abateri.
Modelul unifactorial

De regulă, în cazul unui număr mare al observaţiilor efectuate


t = 1, n , n → α , ipoteza de normalitate a variabilei eroare ut se acceptă
fără rezerve.

Verificarea ipotezelor de fundamentare a M.C.M.M.P.

I1 Variabilele x şi y nu sunt afectate de erori de măsură.


Aceast ă ipoteză se poate verifica cu regula celor trei sigma, regulă
care constă în verificarea următoarelor relaţii:
x t ∈ (x ± 3σ x ) ⇔ x − 3σ x < x t < x + 3σ x
( )
y t ∈ y ± 3σ y ⇔ y − 3σ y < y t < y + 3σ y

unde:
x −x
σ x = ∑( t n )2
y −y 2
σ y = ∑( t n )

Dacă valorile acestor variabile aparţin intervalelor xt ∈(x ± 3σ x ) şi


( )
y t ∈ y ± 3σ y , ipoteza de mai sus poate fi acceptată fără rezerve.
Această ipoteză, referitoare la calitatea datelor înregistrate, se
consideră rezolvată în etapa de prelucrare a datelor observate statistic sau,
cel mai târziu, în etapa de identificare a modelului.

I2 Ipoteza de homoscedasticitate a variabilei reziduale –


Variabila aleatoare (reziduală) u este de medie nulă M (uˆ ) = 0 , iar
2
dispersia ei s ˆ este constantă şi independentă de X.
u
Pe baza acestei ipoteze se poate admite că legătura dintre Y şi X este
relativ stabilă. Contrariul acestei ipoteze este heteroscedasticitatea.
În cazul modelului liniar yt = a + bxt + ut , reziduurile
ˆ
uˆt = y t − yˆ t = y t − aˆ − bx t sunt homoscedastice dacă dispersiile lor sunt
constante şi egale cu dispersiile teoretice, pentru orice t şi sunt independente
de variabila exogenă x.
Modele econometrice

su2ˆ = M (uˆt )2 = σ u2 , (∀)t = 1, n

Contrariul homoscedasticităţii este heteroscedasticitatea, care


înseamnă că erorile nu au dispersiile egale ci diferite:
2 2 2 2
M ( u1 ) ≠ M ( u 2 ) ≠ ... ≠ M ( u n ) ≠ σ u .
Dacă dispersiile nu mai sunt egale, estimatorii rămân nedeplasaţi, dar
nu mai sunt eficace, M.C.M.M.P. conducând la o subestimare a parametrilor
modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate
acestuia.
Depistarea heteroscedasticităţii se poate realiza prin mai multe
procedee:
I2.1) Procedeul grafic - care constă în construirea corelogramei
privind valorile variabilei factoriale x şi ale variabilei reziduale u. Dacă, pe
măsura creşterii (scăderii) valorilor variabilei factoriale x, se observă o
creştere (scădere) a valorilor variabilei reziduale u, înseamnă că cele două
variabile sunt corelate şi nu independente.

uˆ uˆ

x x

Figura 3.4.1 Corelare pozitivă Figura 3.4.2 Corelare negativă

I2.2) Procedeul dispersiilor variabilei reziduale


Acest procedeu se poate aplica atunci când se dispune de serii lungi
de date. În acest caz, seria valorilor variabilei reziduale se împarte în două
sau mai multe grupe, pentru fiecare grupă calculându-se dispersiiile
corespunzătoare ( sˆ2 ,sˆ2 ,... ). Dacă se acceptă ipoteza că dispersiile acestor
u1 u2

grupe nu diferă semnificativ, se acceptă ipoteza de homoscedasticitate şi se


utilizează testul Fisher-Snedecor.
Modelul unifactorial

- dacă s2 ≈ s2 , atunci se acceptă ipoteza I2;


u u
1 2
2
≠ s , atunci se respinge ipoteza I2.
- dacă s2

u1 u2

Testul Fisher-Snedecor constă în calcularea raportului dintre cele


două dispersii (dispersia având valoarea cea mai mare fiind plasată la
numărător; iar dacă numărul de termeni ai seriei este impar se recomandă
eliminarea termenului din mijlocul seriei, astfel încât să se ajungă la
subeşantioane egale):

n/2 2 n −k −1
2 ∑u1 /
su 2 (3.4.1)
F = 1 = t =1
c s 2 n n−k−1
u2 ∑ u 22 / 2
t = n +1
2

- dacă Fc > F n−k −1 n−k −1 , atunci ipoteza de homoscedasticitate este


α; ;
2 2

infirmată, deci erorile sunt heteroscedastice, eliminarea acestui fenomen


făcându-se cu ajutorul metodei regresiei ponderate;
- dacă Fc ≤ F n−k −1 n−k −1 atunci se acceptă ipoteza de
α; ;
2 2

homoscedasticitate.

I2.3) Calculul coeficientului de corelaţie liniară simplă


r cov(u , x ) ∑(u t −u )(xt − x ) = ∑ut (xt − x ) (3.4.2)
u/x = =
σu σ x n σuσ x n σ uσ x
- dacă valoarea coeficientului de corelaţie liniară este aproximativ
egală cu zero – ru/x ≅ 0, atunci se acceptă ipoteza de homoscedasticitate,
variabilele u şi x fiind independente;
- dacă valoarea coeficientului de corelaţie liniară este diferită de
zero – ru/x ≠ 0, atunci se respinge ipoteza de homoscedasticitate.
Modele econometrice

I2.4) Acceptarea sau respingerea ipotezei de homoscedasticitate se


mai poate realiza şi cu ajutorul metodei analizei variaţiei.
Cele două restricţii enunţate mai sus se realizează dacă variabila
reziduală u şi variabila explicativă x sunt independente. Pe această premisă
se fundamentează utilizarea metodei analizei variaţiei la acceptarea sau
respingerea ipotezei de homoscedasticitate.
Metoda analizei variaţiei porneşte de la relaţia:

y t − y = y t − yˆ t + yˆ t − y

(yt −y )2 = ( y t − yˆ t + yˆ t −y )2
n n
− (3.4.3)
∑( y t y ) 2 = ∑[( yˆ t − y ) +( y t − yˆ t )]2
t =1 t =1
n n n n n
(3.4.4)
2 2 2
∑( yt − y ) = ∑[( yˆt − y )+(yt −yˆt ))] = ∑( yˆt − y ) + ∑(yt −yˆt )2 +2∑( yˆt −y )(yt −yˆt )
t =1 t =1 t =1 t =1 t =1

Dar yt = a + bxt + ut ;


ˆ y = aˆ ˆ
yˆ t = aˆ + bx t + bx
uˆt = y t − yˆ t
n
ˆ ˆ ˆ ˆ =
⇒ 2∑ (Yt − y )( yt − Yt ) = 2∑ (aˆ + bxt − aˆ − bx )uˆt
t =1

ˆ n 2n ˆ
= 2b ∑ ( xt − x ) ut n = b cov( ut , xt )

Dacă împărţim relaţia (3.4.4) la n ⇒ ˆ σ 0


2

2 2

=σx uˆ + 2 b cov(u, x)

Pentru ca egalitatea să se verifice este necesar ca:


cov(u, x) = 0 (b ≠ 0) Acceptarea ipotezei I2 pe baza analizei variaţiei constă
în efectuarea următoarelor calcule:
Modelul unifactorial

2 - dacă A=B+C, atunci variabilele ut şi xt


∑(y − y ) =A
t
ˆ
sunt independente şi se acceptă I2;
∑(Y t − y )2 =B
ˆ 2 - dacă A≠B+C atunci ut şi xt sunt
∑(y t −Y t ) =C
corelate şi se respinge I2

Dacă se constată existenţa fenomenului de heteroscedasticitate,


acesta trebuie eliminat deoarece prezenţa lui determină subestimarea
parametrilor modelului şi obţinerea de valori viciate, fiind afectată calitatea
estimatorilor, aceştia nemaifiind eficienţi (dispersie minimă).

I2.5) Estimarea unei matrici a covarianţelor corespunzătoare


estimatorilor parametrilor modelului1 adecvată aplicării M.C.M.M.P. în
cazul unui model conţinând erori heteroscedastice.
Heteroscedasticitatea erorilor implică faptul că dispersiile
corespunzătoare erorilor nu mai sunt egale, ci diferite, caz în care estimatorii
parametrilor modelului rămân nedeplasaţi, dar nu mai sunt eficace. Astfel,
aplicarea M.C.M.M.P. va conduce la o subestimare a parametrilor
modelului, influenţând sensibil şi calitatea diferitelor teste statistice aplicate
modelului.
În cazul unui model multifactorial, vectorul estimatorilor
parametrilor modelului se calculează, matriceal, cu ajutorul relaţiei:
ˆ ′ −1 ′
B=(XX) ⋅ (X Y ). Matricea varianţelor şi covarianţelor corespunzătoare
2 ′ −1 2
acestuia este de forma: V (B) = σ u ⋅(XX) . Acest mod de calcul al
matricei varianţelor şi covarianţelor este valabil doar în cazul în care
aplicarea M.C.M.M.P. conduce la obţinerea de estimatori eficienţi,
convergenţi şi nedeplasaţi, deci ipotezele corespunzătoare acestei metode au
fost verificate în prealabil. În cazul unor erori heteroscedastice, a căror
formă este, în general, necunoscută, este posibil, ca prin aplicarea metodei
regresiei ponderate în vederea eliminării heteroscedasticităţii erorilor, să nu
se obţină estimatori consistenţi. White a arătat că este posibil să se calculeze

1 Conform Wiliam H. Greene, Econometric Analysis, 2d ed., Macmillan, New York,


1993, p. 384-392
Modele econometrice

un estimator adecvat al matricei covarianţelor corespunzătoare estimatorilor


parametrilor modelului, chiar dacă există o relaţie de dependenţă între
erorile heteroscedatice şi variabilele exogene incluse în model, pe care a
denumit-o matricea covarianţelor estimatorilor consistenţi heteroscedastici
(HCCME), de forma:

n ′ −1 n 2
′ ′ −1 (3.4.5)
VW (B) = (XX) ∑ut xt xt
n−k
(XX)

t1

unde:
n = numărul de observaţii;
k = numărul regresorilor;
ut = variabila reziduală.
Prin aplicarea acestei matrici, estimaţiile punctuale ale parametrilor
nu vor suferi modificări, ci doar abaterile standard corespunzătoare
parametrilor. Utilizarea acestei matrici va permite observarea mai rapidă a
prezenţei fenomenului de heteroscedasticitate a erorilor. Astfel, abaterile
standard vor putea fi mai mari sau mai mici comparativ cu cele obţinute în
cazul modelului iniţial, iar valorile mai mici înregistrate de testul Student, t,
vor semnaliza faptul că estimatorii parametrilor sunt nesemnificativi, deci
posibila prezenţă a erorilor heteroscedastice.

I2.6) Testul Goldfeld-Quandt3


Acest test se poate aplica atunci când se dispune de serii lungi de
date şi când una dintre variabile reprezintă cauza heteroscedasticităţii (între
dispersia variabilei reziduale heteroscedastică şi variabila exogenă există o
relaţie de dependenţă pozitivă), şi presupune parcurgerea următoarelor
etape:
• ordonarea crescătoare a observaţiilor în funcţie de variabila
exogenă x;

2 vezi demonstraţie op. cit., p.182


3 Conform D. N. Gujarati, Basic Econometrics, 3rd ed., New York, Mc Graw-Hill, 1995, p
374-375.
Modelul unifactorial

• eliminarea a c observaţii centrale, c fiind specificat a priori. În


privinţa numărului de observaţii omise, c, au fost emise diverse opinii. În
cazul unui model unifactorial, Goldfeld şi Quandt, în urma efectuării
experimentelor Monte-Carlo, au propus ca c să fie aproximativ egal cu 8 în
cazul în care mărimea eşantionului este de aproximativ 30 de observaţii şi
16, dacă eşantionul cuprinde 60 de observaţii. Judge şi colaboratorii săi
menţionează faptul că, în cazul în care c=4 pentru n=30 şi c=10 pentru
n≈60, se obţin rezultate mai bune. În general, se consideră că c trebuie să
reprezinte o treime sau un sfert din numărul total de observaţii.
• efectuarea de regresii aplicând M.C.M.M.P. asupra celor două
sub-eşantioane de dimensiune (n-c)/2 şi calcularea sumei pătratelor erorilor
pentru fiecare subeşantion în parte;

• calcularea raportului dintre sumele pătratelor erorilor sau


dispersiilor acestora, corespunzătoare celor două subeşantioane (suma
pătratelor erorilor având valoarea cea mai mare fiind plasată la numărător):

( n−c )/ 2 2 ( n − c)
*
su2 ∑ u
1
/
2
− (k + 1)

F = 2
1

=
t =1

n (3.4.6)
s
u2 ∑ 2 (n − c)
u2 / − (k + 1)

t=
( n−c ) +1
2
2

unde: k = numărul variabilelor exogene.

Presupunând că erorile sunt normal distribuite, atunci raportul F


(n − c) *

urmează o distribuţie F cu v1 = v2 = − (k + 1) grade de


libertate. 2
-dacă F* >F ( n−c) ( n−c) , atunci ipoteza
α; −( k+1) ; −(k+1)
2 2
de
homoscedasticitate este infirmată, deci erorile sunt heteroscedastice;
Modele econometrice

-dacă F* ≤F ( n−c) ( n−c) ipoteza de homoscedasticitate


α; −( k+1) ; −(k+1)
2 2

este acceptată.

I2.7) Testul Park4


Testul propus de Park se bazează pe existenţa unei relaţii de
dependenţă între dispersia corespunzătoare erorilor heteroscedastice şi
variabila exogenă x de forma:
σ 2 2 b ω
=σ x e t
(3.4.7)
utt

Acest model neliniar poate fi transformat într-un model liniar prin


logaritmare:
2 2
lnσ = lnσ + b ln x + ω (3.4.8)
ut t t

unde:
ωt = variabila reziduală, ce verifică ipotezele
corespunzătoare M.C.M.M.P.

Ca urmare a faptului că valoarea dispersiei erorilor heteroscedastice


este necunoscută, aceasta a fost înlocuită cu pătratul erorilor, uˆi2 , în cadrul
modelului liniarizat prin logaritmare:
2
ln uˆ 2 = lnσ + b ln x + ω = β + b ln x + ω (3.4.9)
t t t t t

În situaţia în care parametrul b corespunzător variabilei exogene este


nesemnificativ ipoteza de homoscedasticitate a erorilor este verificată, cazul
contrar indicând existenţa heteroscedasticităţii.
I2.8) Testul Glejser5
Acest test se bazează pe bazează pe relaţia dintre erorile estimate în
urma aplicării M.C.M.M.P. asupra modelului iniţial şi variabila explicativă,
presupusă a fi cauza heteroscedasticităţii.

4 cf. op. cit., p. 369-370


5 cf. op. cit., p. 371-372
Modelul unifactorial

Testul Glejser prezintă o serie de puncte comune cu testul precedent,


respectiv, după calcularea erorilor în urma aplicării M.C.M.M.P., valoarea
absolută a acestora este regresată în funcţie de valorile variabilei exogene
utilizându-se în acest scop următoarele forme de exprimare corespunzătoare
celor două variabile:

I. uˆt = a + bxt + ωt

2 2 2
În această situaţie heteroscedasticitatea este de tipul: σ ut = λ xt , caz
în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi
y a
împărţite la x , rezultând astfel un model de forma: t
= 1 + b + ut
i 1
xt xt xt

II. uˆt = a + b xt + ωt
2 2
În această situaţie heteroscedasticitatea este de tipul: σ ui = λ xt , caz
în care va fi aplicată regresia ponderată asupra datelor iniţiale, care vor fi
împărţite la xt , rezultând astfel un model de forma:
a u
yt = 1 + b x t + t .
1

xt xt xt
1
III. uˆt = a + b + ωt
xt
2 2 −2
=
În această situaţie heteroscedasticitatea este de tipul: σ ui λ xt .
1
IV. uˆt = a + b + ωt
xt

V. uˆt = a + bxt + ωt

VI. uˆt = a + bxt2 + ωt


Modele econometrice

Verificarea homoscedasticităţii erorilor presupune, ca şi în cazul


testului precedent, verificarea semnificaţiei parametrului corespunzător
variabilei exogene. Aplicarea acestui test conduce la rezultate semnificative
în cazul unor eşantioane de dimensiuni mari, iar, în cazul celor de
dimensiuni mici, este pur teoretică, aşa cum menţionează însuşi autorul.
De menţionat faptul că ultimele două modele nu pot fi estimate cu
ajutorul M.C.M.M.P.
6
I2.9) Testul Breusch-Pagan-Godfrey (BPG)
Acest test are în vedere modelul multifactorial liniar de forma:

yi = b0 + b1 x1t + b2 x2t + …+ bk x kt + ut (3.4.10)


plecând de la ipoteza potrivit căreia dispersia corespunzătoare erorilor
heteroscedastice este dependentă de o serie de variabile factoriale zi. În locul
acestor variabile pot fi utilizate câteva sau toate variabilele exogene ce
intervin în modelul iniţial. Se presupune, de asemenea, că între dispersia
corespunzătoare erorilor heteroscedastice şi variabilele factoriale zi există o
relaţie de dependenţă liniară, respectiv:

σ
= β0 + β1 z1t + β2 z2t + K + βm zmt
ut (3.4.11)
Verificarea homoscedasticităţii dispersiei presupune verificarea
ipotezei nulităţii parametrilor corespunzători variabilelor factoriale, caz în
care σ 2 = β = ct.
ut 0

Aplicarea acestui test constă în:


- calculul valorilor variabilei reziduale prin aplicarea M.C.M.M.P.
asupra modelului iniţial;
- calculul estimatorului de maximă verosimilitate corespunzător

dispersiei variabilei reziduale homoscedastice: σˆ 2 = ∑ t2 ;
u
t n

6 cf. op. cit., p. 377-378


Modelul unifactorial

uˆ 2
construirea unei variabile de forma: θt = t şi regresarea σˆ 2
ut

acesteia în funcţie de variabilele factoriale zt, ce pot fi înlocuite cu


variabilele exogene xi din modelul original, respectiv:

θt = β 0 + β1 x1t + β 2 x2t + K + β m xmt + ωt (3.4.12)

unde:
ωt = variabila reziduală.
- calculul sumei pătratelor explicată de model, notată cu SSR, şi
SSR
calculul unei variabile H de forma: H = 2.

Presupunând că erorile sunt normal distribuite, şi că ne aflăm în situaţia


unui eşantion de volum mare, variabila H este asimptotic distribuită sub forma
unui χ α2 ;v , pentru care numărul gradelor de libertate este egal cu:
v = m −1, unde m = numărul parametrilor modelului, respectiv: H~ χ α2 ;v .
Dacă H > χ α2 ;v , erorile sunt heteroscedastice, în caz contrar, sunt
homoscedastice.

I2.10) Testul White7


Aplicarea testului White în cazul modelului unifactorial presupune
parcurgerea următoarelor etape:
- estimarea parametrilor modelului iniţial şi calculul valorilor
estimate ale variabilei reziduale, u;
- construirea unei regresii auxiliare, bazată pe prespunerea
existenţei unei relaţii de dependenţă între pătratul valorilor erorii, variabila
exogenă inclusă în modelul iniţial şi pătratul valorilor acesteia:

uˆt2 = α 0 + α1 xt + α 2 xt2 + ωt (3.4.13)

7 cf. op. cit., p. 379


Modele econometrice

2
şi calcularea coeficientului de determinare, R , corespunzător acestei regresii
auxiliare;
- verificarea semnificaţiei parametrilor modelului nou construit, iar
dacă unul dintre aceştia este semnificativ diferit de zero, atunci ipoteza de
heteroscedasticitate a erorilor este acceptată.
Există două variante de aplicare a testului White:
- utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza
nulităţii parametrilor, respectiv: H0: α0 = α1 = α2 = 0 ;
Dacă ipoteza nulă, potrivit căreia rezultatele estimării sunt
nesemnificative ( Fc ≤ Fα ;v1 ;v2 ), este acceptată, atunci ipoteza de
homoscedasticitate se verifică, cazul contrar semnificând prezenţa
heteroscedasticităţii erorilor.

- utilizarea testului LM, calculat ca produs între numărul de


observaţii corespunzătoare modelului, n, şi coeficientul de determinare, R2,
corespunzător acestei regresii auxiliare. În general, testul LM este
asimptotic distribuit sub forma unui χ α2 ;v , pentru care numărul gradelor de
libertate este egal cu: v = k , unde k = numărul variabilelor exogene,
respectiv:

LM = n ⋅ R2 ~ χ α2 ;v (3.4.14)

Dacă LM > χα2 ;v , erorile sunt heteroscedastice, în caz contrar, sunt


homoscedastice, respectiv ipoteza nulităţii parametrilor, α0 = α1 = α2 = 0 ,
este acceptată.

Eliminarea fenomenului de heteroscedasticitate se poate realiza


prin următoarele procedee:

a) Construirea modelului pe baza abaterilor centrate ale variabilelor


Fie yt = a + bxt + ut (3.4.15)
Modelul unifactorial

ˆ
yˆ t = aˆ + bx t (3.4.16)
y = a + bx + u (3.4.17)
________________
(3.4.15) – (3.4.17) ⇒ y t − y = b (x t − x ) + ut (3.4.18)
=b +
y* = y t − y y* x * u t
Notând cu: t

x =x −x

t

yˆ =bx
t

* * ˆ *

t t t t

Estimarea parametrului b presupune minimizarea funcţiei:

n n
ˆ = *
− ˆ * )2 = min ∑(y *
− bˆ x*t )2
F (b ) min ∑( y t yt t
t =1 t =1

şi calculul derivatei parţiale a funcţiei:

ˆ * ˆ * *

F'(b) = 0 ⇒ 2 ∑(yt − b xt )⋅ (− x )= 0⇔ ∑ut (xt − x) = 0 ⇒ cov(ut , xt ) = 0


t

b) Metoda regresiei ponderate


Fie modelul iniţial yt = a + bxt + ut
Heteroscedasticitatea presupune M (ut )2 ≠ σ u2 , ceea ce înseamnă:
σ 2 =λσ2
u11 u

σ 2 =λσ2
u2 2 u

……………. (3.4.19)
σ 2 =λσ2
unn u

unde:
λt este un coeficient de ponderare.

Estimarea parametrilor modelului presupune minimizarea funcţiei:


ˆ n 1 ˆ 2
min F (aˆ,b) = min ∑ 2 ( yt − aˆ − bxt )

t =1 σu
Modele econometrice

ˆ n 1 ˆ 2
Conform relaţiei (3.4.19): min F (aˆ,b) = min ∑ ( yt − aˆ − bxt ) (3.4.20)
t =1 λt
În relaţia (3.4.20) cantităţileσ u2 şi λt sunt, în general, necunoscute.
S-a constatat însă că, în practică, abaterile standard, σ ut , sunt aproximativ
proporţionale cu valorile variabilei exogene x, adică:

σu = σu x1
1
σ
= σ u x2 u2

…………… (3.4.21)
=σ x
σ un u n

Corelând relaţiile (3.4.19) şi (3.4.21), rezultă că relaţia (3.4.20)


devine:

ˆ 1 n 1 ˆ 2

minF(aˆ,b) = σu2 min t xt
2
(yt − aˆ −bxt ) (3.4.22)
2
n ˆ n 2
1 yt − aˆ −bxt 1 yt 1 ˆ
∑ 2
= min = min − aˆ −b

σ2 σ ∑x x
u t=1 xt u t=1 t t

Dar relaţia (3.4.22) este echivalentă cu aplicarea M.C.M.M.P.


modelului iniţial, după ce, în prealabil, a fost împărţit la xt:

yt 1 ut
yt = a + bxt + ut |: xt ⇒ = a xt + b + xt
xt
2 2
minF( aˆ,b) =min∑
ˆ
n u t =min∑
n y t
−aˆ 1 −b
ˆ
(3.4.23)
t=1xt t=1 xt xt
Modelul unifactorial
ˆ ˆ

Calculând derivatele parţiale în raport cu a şi b ale funcţiilor (3.4.22)


şi (3.4.23) şi anulându-le se ajunge la acelaşi sistem de ecuaţii pe baza
căruia se determină cei doi estimatori:

1 ˆ 1 yt
x
F '(aˆ) = 0 aˆ∑ 2 + b∑ t =
∑ 2 (3.4.24)
⇒ xt xt
ˆ
F '(b) = 0 ⇒ 1 ˆ
y
a
ˆ
∑ + nb = ∑ xt t
xt

∑ 1 ∑ yt − ∑ 1 ∑ yt
2 2
ˆ xt xt xt xt
b = 2
1 1 (3.4.25)
n −
∑2 ∑
x x
⇒ t t

∑ yt 2 ∑ x1
xt ˆ t
aˆ = −b
1 1
∑x 2 ∑x 2

t t

Un caz concret de utilizare a acestei metode o constituie situaţia în


care se urmăreşte modelarea investiţiilor unor intreprinderi de dimensiuni
diferite în funcţie de capital, cifra de afaceri şi venit: I = f (K, CA, V) + u.
O altă metodă constă în segmentarea eşantionului în subcolectivităţi
omogene din punct de vedere al nivelelor factorilor, urmată de o
respecificare a modelului pentru fiecare segment în parte.
În mod curent, acest procedeu se utilizează la estimarea parametrilor
unui model econometric privind cererea sau consumul populaţiei faţă de un
produs de folosinţă curentă, deoarece s-a constatat că dispersia
corespunzătoare consumului creşte pe măsura creşterii nivelului venitului.
I3 Valorile variabilei reziduale u sunt necorelate, respectiv nu
există fenomenul de autocorelare a erorilor.

cov(ut ,uk ) = M (ut ,uk ) = 0 (∀)t, k = 1, n ,t < k


Modele econometrice

Deoarece aplicaţiile practice au arătat că acest fenomen e frecvent în


special în cazul seriilor cronologice interdependente, verificarea acestuia
este necesară, mai ales în cazul calculelor de prognoză.
M.C.M.M.P., în cazul existenţei fenomenului de autocorelaţie, M (ut
,uk ) ≠ 0 , nu mai permite obţinerea de estimatori eficienţi, aceştia
prezentând totodată distorsiuni de la valorile reale. Se păstrează însă
calitatea acestora de a fi consistenţi, fapt ce impune introducerea în calcul a
unor serii de date suficient de lungi (eşantion de valori cât mai mare).
Autocorelarea erorilor se datorează analizei în timp a legăturii dintre
variabile, respectiv a unui efect inerţial în evoluţia variabilelor sau o altă
cauză ar constitui – o eroare de specificare a modelului, respectiv omiterea
unei variabile explicative, xt, cu influenţă puternică asupra variabilei
endogene y.
Depistarea autocorelării erorilor se poate face utilizând următoarele
procedee:

1) Procedeul grafic – se realizează corelograma între valorile


estimate ale variabilei endogene yˆt şi valorile variabilei reziduale uˆt .

uˆt

yˆ t

Figura 3.4.3

Grafic, autocorelaţia erorilor se manifestă fie printr-un număr foarte


mic sau foarte mare de schimbări ale semnului variabilei aleatoare, fie ca
urmare a unor schimbări simetrice (o oscilaţie regulată a valorilor variabilei
reziduale faţă de valorile lui yˆ ).
Modelul unifactorial

2) Calculul coeficientului de autocorelaţie de ordinul 1

n n
∑uˆt uˆt −1 ∑uˆt uˆt −1
t =2
r= =t =2n (3.4.26)
n 1
1 −
2
∑ uˆt2 ∑uˆt −1
t =1 t =2

Acesta este definit în intervalul [− 1; 1], având următoarea


semnificaţie:

− 1, autocorelaţie strict
negativă r( 1) = 0, independenţă
+ 1, autocorelaţie strict pozitivă

3) Testul Durbin-Watson constă în calcularea valorii:

n
∑ (uˆ t − uˆt −1 )2
t =2
d= n (3.4.27)
∑uˆt 2
t =1

Această valoare empirică, „d”, se compară cu două valori teoretice,


d1 şi d2, preluate din tabelul distribuţiei Durbin-Watson (vezi Anexa 3) în
funcţie de un prag de semnificaţie α, arbitrar ales, (α = 0,05 sau α = 0,01),
de numărul de variabile exogene (k) şi de valorile observate (n, n ≥ 15) .

Regula de decizie a aplicării testului se prezintă în tabelul următor:

0 < d < d1 d1 ≤ d ≤ d2 d2 < d< 4-d2 4-d2 ≤ d ≤ 4-d1 4-d1 < d <4
Autocorelare Indecizie Erorile sunt Indecizie Autocorelare
pozitivă ← independente → negativă

Cei doi autori, acceptând ipoteza de normalitate a variabilei


reziduale, au demonstrat că distribuţia variabilei aleatoare d este cuprinsă
Modele econometrice

între două distribuţii limită, d1 şi d2, ale căror mărimi depind de pragul de
semnificaţie (α), de numărul de variabile exogene (k) şi de numărul de
valori observate (n, n ≥ 15).
Dezvoltând relaţia lui d, aceasta devine:

n n n
+ uˆ
∑uˆt 2 ∑ t −1 2 − 2∑uˆt uˆt −1
t =2 t =2 t =2
d= n

∑uˆt 2
t =1

n n n

Pentru un n suficient de mare, cele trei sume, ∑uˆt 2 , ∑ uˆt2−1 , ∑uˆt 2


,
t =2 t =2 t =1

fiind aproximativ egale, relaţia lui d va fi egală cu:

∑uˆt uˆt −1n

d = 2 − 2 t =2 −
n1

∑uˆt2
t =1

∑ uˆt uˆt −1n

Se notează cu: r = t =2n−1 coeficientul de autocorelaţie de ordinul


1

∑uˆt 2

t =1

1 a reziduurilor ut.

(
⇒ d = 2 1 − r (1) ⇒ r (1) = 1 −
d ) (3.4.28)
2
⇒ d ∈[0,4]
Modelul unifactorial

cu semnificaţia:

− 1 ⇒ autocorelare strict negativă 4



↑ ⇒ indecizie
r1 = 0 ⇒ independen ţă ⇒d= 2

↓ ⇒ indecizie
0

1 ⇒ autocorelare strict poziti vă


4) Un alt procedeu de verificare a ipotezei de independenţă a erorilor
8
constă în aplicarea testului Breusch-Godfrey , acest test fiind utilizat în
vederea depistării unei autocorelaţii de ordin superior. Ca urmare a
presupunerii existenţei unei autocorelaţii de ordin superior se construieşte
următorul model:

u =r u +r u +K+r u +z
t 1 t −1 2 t −2 p t−p t (3.4.29)
unde:
zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi
coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt
simultan egali cu zero, fapt ce implică non-existenţa fenomenului de
autocorelaţie a erorilor.
În vederea utilizării testului sunt estimate valorile variabilei
reziduale ut, obţinute în urma aplicării M.C.M.M.P. asupra modelului iniţial.
Variabila reziduală ut este regresată apoi în funcţie de variabilele exogene
iniţiale ale modelului şi de valorile sale decalate, respectiv ut-1, ut-2, …, ut-p.
În cazul acestei regresii este calculată valoarea coeficientului de determinare
2
R şi a unei variabile de forma:

2
BG = (n-p)·R (3.4.30)

8 cf. op. cit., p. 425


Modele econometrice

Presupunând că ne aflăm în situaţia unui eşantion de volum mare,


2
variabila BG este asimptotic distribuită sub forma unui χ α ;v , pentru care
numărul gradelor de libertate este egal cu: v = p , unde p = mărimea
decalajului , respectiv: BG~ χ α2 ;v .
Dacă BG > χ α2 ;v , ipoteza nulă este respinsă, ceea ce presupune că
există cel puţin un coeficient de autocorelaţie nenul.
În general, autocorelaţia erorilor este provocată de două cauze:
• fie că variabila endogenă y se autocorelează în evoluţia sa (ca
urmare a unui efect inerţial) generând o autocorelare în timp a erorilor;
• fie datorită omiterii unei variabile exogene x, cu influenţă
semnificativă asupra lui y, adică a unei erori de specificare a modelului
econometric.

Eliminarea fenomenului de autocorelare a variabilei reziduale ut


– în cazul depistării sale – se fundamentează pe evitarea cauzelor care îl
generează.
O modalitate directă de a evita consecinţele statistice pe care le
generează acest fenomen o constituie utilizarea următoarelor procedee:
a) Aplicarea M.C.M.M.P. generalizate în vederea estimării
parametrilor modelului care, în cazul autocorelării reziduurilor, permite
obţinerea de estimatori nedeplasaţi, consistenţi şi eficienţi. Această metodă
este recomandată în situaţia în care numărul variabilelor cauzale este
superior lui unu (modele multifactoriale). Estimatorii modelului se obţin
ˆ −1 −1 −1
astfel: B =( X'V X ) ( X'V Y ) unde V = matricea varianţelor şi
covarianţelor reziduurilor.

b) Un alt procedeu este următorul:


Fie modelul liniar unifactorial: y t = a + bx t + ut . Se estimează
parametrii acestuia, a şi b, cu ajutorul M.C.M.M.P. Se calculează valorile
ˆ
ajustate ale variabilei endogene - yˆ t = aˆ + bx t şi reziduurile -
ˆ
uˆt = y t − yˆ t = y t − aˆ − bx t (3.4.31) şi se aplică testul “d”. Dacă ipoteza de
Modelul unifactorial

independenţă a variabilelor reziduale, I3, nu poate fi acceptată ( r1 ≠ 0 ,


r = 1− d ), aceasta presupune o autocorelare de ordinul întâi a erorilor,
1
2
respectiv:

uˆt = r(1) uˆt −1 + zt (3.4.32)

unde:
zt este variabila aleatoare ce verifică ipotezele I2, I3 şi I4.

Ştiind că:
ˆ = −ˆ = −ˆ−ˆ

u (3.4.33)
y y y a bx
t −1 t −1 t −1 t −1 t −1

Înlocuind relaţiile (3.4.31)şi (3.4.33) în relaţia (3.4.32) se obţine:


ˆ ˆ
yt − aˆ − bxt = r(1) ( yt −1 − aˆ − bxt −1 ) + zt
ˆ
yt − r(1) yt −1 = aˆ (1 − r(1) ) + b(xt − r(1) xt −1) + zt (3.4.34)
În ecuaţia (3.4.34) variabilele yt şi xt sunt cunoscute, iar valoarea
coeficientului de autocorelaţie se va calcula cu relaţia:
n

t=2
∑u u t t−1
r = −
(1) n1

∑ut2
t =1

Se introduce valorile acestuia în relaţia (3.4.34) şi se vor estima


ˆ
parametrii a şi b prin aplicarea din nou a M.C.M.M.P. Fie ˆα şi β
estimaţiile parametrilor a şi b, calculate pe baza diferenţelor de ordinul întâi
ale variabilelor y şi x.

Se ajunge astfel la modelul:

( yt − r(1) yt −1 ) = α (1 − r(1) ) + β (xt − r(1) xt −1 ) (3.4.35)


Modele econometrice

unde:
( yt − r(1) yt −1 ) reprezintă diferenţele teoretice (ajustate) de ordinul întâi
ale variabilei endogene y, calculate pe baza funcţiei de
regresie (3.4.34).

c) Procedeul prin baleiaj (Hildreth-Lu)


Dacă există corelaţie se ajunge la relaţia:

ˆ * *

yt − r(1) yt −1 = aˆ 0 (1 − r(1) ) + b0 (xt − r(1) xt −1 ) + zt ⇒ yt = a1 + b1 xt + zt


Procedeul prin baleiaj constă în atribuirea de valori lui r(1) în
intervalul [0,1] ⇒ autocorelare pozitivă, sau în intervalul [-1,0] ⇒
autocorelare negativă.

De exemplu, în cazul unei autocorelări pozitive, i se atribuie lui r(1)


următoarele valori:
2
r(1) = 0,1 ⇒ ∑zt = 1,75;
r(1) = 0,2 ⇒ ∑zt2 = 2,75;
2
r(1) = 0,3 ⇒ ∑zt = 3,75.

Deci minimul se situează în intervalul [0,2; 0,3].


Se dau apoi valori lui r = 0,21; 0,22;…0,27 , oprindu-ne la valoarea
pentru care se obţine min ∑zt2. Pentru această valoare se păstrează
ˆ
ˆ

estimatorii a şi b obţinuţi în acest caz.

d) Procedeul iterativ al lui D. Cochran şi C. Orcutt


Se consideră modelul yt = a +bxt +ut . Se estimează parametrii
modelului, se aplică testul D-W, se calculează coeficientul de autocorelaţie
de ordinul întâi şi se înlocuieşte valoarea sa în ecuaţia iniţială, (3.4.34),
* *
obţinându-se modelul - y t = a1 + b1x t + z t . În cazul acestui model se
verifică dacă s-a eliminat sau nu autocorelaţia erorilor. În caz contrar, se
continuă procedeul până când se atinge acest deziderat.
Modelul unifactorial

e) Procedeul Durbin

ˆ ˆ
( yt−1 − aˆ − bx t−1 ) + zt
=r
yt − aˆ − bxt (1)

Se calculează r(1), se introduce în relaţia (3.4.34) şi rezultă estimatorii


ˆ
parametrilor, ˆ . Această metodă dă rezultate bune numai în cazul a1 , b1
existenţei unei autocorelaţii de ordinul întâi şi este aplicabilă în cazul în se
lucrează cu un număr mare de date.

f) Uneori, eliminarea autocorelaţiei se poate realiza şi prin


construirea modelului pe baza diferenţelor de ordinul întâi ale
variabilelor:

yt − yt −1 = a + b(xt − xt −1 ) + zt ⇒ yt* = a + bxt* + zt

g) Pentru eliminarea autocorelaţiei se poate construi un model nou în


care se introduce o variabilă fictivă suplimentară. Această metodă
porneşte de la ideea că variabila reziduală u nu este influenţată numai de
factori aleatori, ci există cel puţin un factor sistematic care provoacă
autocorelaţia.
I4 Legea de probabilitate a variabilei reziduale ut este legea
normală, de medie nulă şi abatere medie pătratică σu, ut → Ν(0,σu).
Se ştie că, dacă erorile urmează legea normală de medie zero şi de
abatere medie pătratică su$ (consecinţa ipotezelor I1, I 2, I 3), atunci are loc
relaţia:

P ( uˆt ≤ tα suˆ )= 1 − α

Pe baza acestei relaţii, în funcţie de diferite praguri de semnificaţie


α , din tabela distribuţiei normale sau a distribuţiei Student se vor prelua
valorile corespunzătoare lui tα .
Verificarea ipotezei de normalitate se poate face pe baza unui grafic
în cadrul căruia pe axa Ox se vor reprezenta valorile ajustate ale variabilei y
Modele econometrice

- yˆ t , iar pe axa Oy se vor trece valorile variabilei reziduale -ut . Dacă valorile
empirice ale variabilei reziduale se înscriu în banda ± tα ⋅ suˆ , cu un
anumit prag de semnificaţie α , ipoteza de normalitate a variabilei reziduale
poate fi acceptată cu acest prag de semnificaţie – vezi figura 3.4.4:

u
+tα ⋅su

0 yˆ

−tα ⋅su

Figura 3.4.4

O altă modalitate de verificare a ipotezei de normalitate a erorilor o


constituie testul Jarque-Berra9, care este şi el un test asimptotic (valabil în
cazul unui eşantion de volum mare), ce urmează o distribuţie hi pătrat cu un
număr al gradelor de libertate egal cu 2, având următoarea formă:
2
S (K − 3)2 2
JB = n 6 + 24

α;2 (3.4.36)

unde:
n = numărul de observaţii;

S = coeficientul de asimetrie (skewness), ce măsoară simetria distribuţiei


erorilor în jurul mediei acestora, care este egală cu zero, având
următoarea relaţie de calcul:

1 ∑n ( y −y )3
t

(3.4.37)
S = n t =1
σ3
9cf. EViews, User Guide, Version 2.0, QMS Quantitative Micro Software, Irvine,
California, 1995, p. 140-141
Modelul unifactorial

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce măsoară


boltirea distribuţiei (cât de „ascuţită” sau de aplatizată este distribuţia
comparativ cu distribuţia normală), având următoarea relaţie de calcul:

1 ∑n ( y −
t y ) 4
n t =1
K= (3.4.38)
σ4

Testul Jarque-Berra se bazează pe ipoteza că distribuţia normală are


un coeficient de asimetrie egal cu zero, S = 0, şi un coeficient de aplatizare
egal cu trei, K = 3.
Dacă probabilitatea, p(JB), corespunzătoare valorii calculate a
testului este suficient de scăzută, atunci ipoteza de normalitate a erorilor este
respinsă, în timp ce, în caz contrar, pentru un nivel suficient de ridicat al
probabilităţii ipoteza de normalitate a erorilor este acceptată, sau dacă JB >
χ α2 ;2 , atunci ipoteza de normalitate a erorilor este respinsă.

3.4.2. Verificarea semnificaţiei estimatorilor


parametrilor modelului econometric

Dacă cele patru ipoteze pot fi acceptate, se poate demonstra (vezi


Teorema 1) că M.C.M.M.P. este echivalentă cu M.V.M. (metoda
verosimilităţii maxime) şi, deci, estimatorii obţinuţi în acest caz sunt
nedeplasaţi, convergenţi şi eficienţi.
De asemenea (vezi Teorema 2 şi 3), cei doi estimatori, ˆ ˆ , sunt a şi b
variabile aleatoare repartizate normal:

L( aˆ ) = N ( a,saˆ ˆ
) ; L( b ) = N ( b , s ˆ )
b
Modele econometrice

unde:

s 1 x
aˆ = su2 +
2
= abaterea medie pătratică a estimatorului aˆ ;
n 2
∑ (x t − x )
t

2
sˆ= su ˆ
= abaterea medie pătratică a estimatorului b ;

(x
b ∑t − x )2
t

∑( y t − yˆ t ) 2
2 2
su = 1 ∑( uˆt ) = t = dispersia variabilei reziduale (vezi
n−2 t n−2
teorema 6)

Verificarea semnificaţiei estimatorilor constă în a accepta, sau a


respinge, una din cele două ipoteze:

a=0
H0:
b=0
a≠0
H1 :

b≠0
ˆ
Testul adecvat acestui scop, aˆ şi b fiind variabile normale, este
ˆ
testul “t”. Prin centrarea şi normarea estimaţiilor aˆ şi b , în cazul ipotezei
H : L(aˆ )=N(0, s ˆ ˆ s ˆ ), se obţin valorile calculate:
) şi L(b )=N(0,
0 a b
aˆ − ˆ
t cal1 = 0 şi t 2 =b − 0 . Aceste valori calculate sau empirice se compară
s cal
aˆ sˆ
b
cu valoarea teoretică:
• tα = variabilă normală, dacă t = 1, n , n>30, preluată din tabela
distribuţiei normale, în funcţie de o valoare arbitrar aleasă a probabilităţii
Modelul unifactorial

„p“ sau a pragului de semnificaţie „α”, p+ α = 1; aceste valori, de regulă


fiind: p = 0,9 => α = 0,1; p = 0,95 => α = 0,05; p = 0,99 => α = 0,01;
• - tα;n-(k+1) = variabilă Student, dacă t = 1, n , n≤30, preluată din
tabela distribuţiei Student, în funcţie de valoarea stabilită pentru α şi de
numărul gradelor de libertate, n-(k+1); n = numărul observaţiilor; k =
numărul variabilelor exogene xj, j = 1, k (k+1 = numărul parametrilor
modelului econometric).
Pe baza celor două valori, tcal şi tα;v , regula de decizie a testului este:
ˆ
1
tcal =s a
≤ tα ;v

• dacă => se acceptă H => estimatorii nu sunt
ˆ 0
2 b
t ≤t
cal = α ;v

b
semnificativ diferiţi de zero, se renunţă la ei şi la model => se revine la
prima etapă cu o nouă specificare;

= saˆ
1
tcal > tα ;v

• dacă => se acceptă H => modelul a fost corect
ˆ 1
2 b
>t
α ;v
t
cal =

b

specificat, identificat şi estimat şi se continuă discuţia econometrică;


ˆ
1 ≤ tα ;v
tcal =s a


• dacă ˆ => se reţine modelul y = f(x) + u = bx + u şi
t
2 b
cal =
sˆ >t
α ;v
b
se continuă discuţia econometrică.

În practică, deoarece t0,05 > 2, economiştii acceptă ipoteza H1 -


estimatorii sunt semnificativi dacă:
ˆ
a
1 s
tcal = aˆ ≥2
ˆ
b
2 s
tcal = ˆ ≥2
b
Modele econometrice

ˆ
În acelaşi timp, ştiind că aˆ şi b sunt repartizaţi normal, se poate
estima intervalul de încredere al parametrilor acestora:
ˆ− t ⋅ s ≤ ≤ˆ+t ⋅ s = = −α
P(a α ;v aˆ a a α ;v aˆ ) p 1
ˆ − tα ; v ⋅ s ˆ −α
P(b ˆ ≤ b ≤ b + tα ;v ⋅ s ˆ )= p = 1
b b

Parametrii a şi b vor fi consideraţi semnificativ diferiţi de zero dacă:


t s
(
P a = aˆ ± α ;v ⋅ aˆ > 0 = p = 1 − α )
(
P b = ˆ α ;v
b±t
)
⋅ s ˆ > 0 = p = 1− α
b

3.4.3 Verificarea similitudinii modelului econometric


ˆ
Modelul econometric, yˆ t = aˆ + bx t , este expresia formală a
modelului economic real, yt = f(xt) + ut = a + bxt + ut, conceput pe baza
teoriei economice şi rezultat pe baza unui singur experiment, unui singur
sondaj statistic.
Ca atare, în această etapă se urmăreşte să se verifice:
1) dacă ipoteza de pornire – x = principalul factor de influenţă a
fenomenului y – este corectă sau nu;
2) dacă legitatea economică dintre cele două variabile este de forma
- y = a + bx;
3) dacă rezultatele obţinute pot fi considerate sistematice – în sensul
că se vor obţine aproape aceleaşi rezultate dacă se va repeta
experienţa cu alte sondaje, de volum şi structură (alte unităţi
statistice) diferite – sau întâmplătoare, adică rezultate diferite
pentru sondaje diferite.
În general, scopurile urmărite în această etapă se rezolvă cu ajutorul
metodei analizei variaţiei, cunoscută şi sub numele de metoda ANOVA.
Metoda analizei variaţiei porneşte de la identitatea:

y t − y = y t − yˆ t + yˆ t − y → (yt − y)2 = (yt − yˆt + yˆt − y)2

n n

∑(yt − y) 2 =∑[(y t
ˆ − + −ˆ
y) (yt y )] t
2
(3.4.3)
t=1 t=1
Modelul unifactorial

10
unde :
yt = valorile reale ale fenomenului y;
yˆ t = valorile teoretice ale fenomenului y;
ˆ
yˆ t = aˆ + bx t
=1 ˆ ˆ
=1 ˆ =1 ˆ + =ˆ +
y n ∑ y t n ∑ y t n ∑ (a bx t ) a bx
Prin ridicarea la pătrat a binomului din partea dreaptă a relaţiei
(3.4.3) rezultă:
n n n n

∑(yt − y ) 2
==∑(yˆt − y ) + ∑(yt − yˆt ) + 2∑(yˆt − y)(yt − yˆt ) 2 2
(3.4.4)
t=1 t=1 t=1 t=1

Termenii relaţiei (3.4.4) se definesc prin:


n

V02 = ∑( yt − y)2 = variaţia totală a variabilei y provocată de toţi


t=1

factorii săi de influenţă;


2
Vx
= n ˆ −
∑ ( yt
2
y)
= variaţia fenomenului y provocată numai de variaţia
t =1

factorului x, considerat factorul principal al variabilei y, adică variaţia lui y


explicată de modelul econometric;
n 2
2=
Vu ∑( yt
−ˆ yt ) = variaţia reziduală, sau variaţia fenomenului y

t =1
generată de către factorii nespecificaţi în model, aceşti factori fiind
consideraţi – în etapa de specificare – drept factori cu influenţă
întâmplătoare, neesenţiali pentru a explica variaţia fenomenului y;

10 Relaţia (3.4.3) rămâne valabilă în toate cazurile de modele liniare sau liniarizabile.
În cazul acestora din urmă, se va ţine cont de semnificaţia simbolurilor. De exemplu:
b
- modelul putere: yt = a xt ut => ln yt = ln a +b ln xt + ln ut,
*
În acest caz, semnificaţiile simbolurilor vor fi: y * = ln y ; yˆ = ln yˆ t ;
t t t
1 1ˆ *

y = n ∑ ln y t = n ∑ ln yˆ t ;u t = ln yt - lny t ; ln u ,=> y * =
a+bx
- modelul exponenţial yt = e t u t => ln y =a+bx + ln y ;
t t t t t
*
yˆ t = ln yˆ t ; y = media geometrică a termenilor.
Modele econometrice

n
ˆ ˆ ˆ ˆ
2∑( yˆt − y)( yt − yˆt ) = 2∑(aˆ + bxt − aˆ − bx)uˆt = 2b∑(xt − x) ut n = 2n b cov(ut , xt ) = 0
t=1

cov (xt, ut) = 0, adică xt şi ut sunt variabile independente. Această condiţie se


realizează dacă erorile sunt homoscedastice ( vezi ipoteza I2).
De regulă, rezultatele aplicării metodei ANOVA se prezintă într-un
tabel de forma:
Tabelul 3.4.1
Sursa de Măsura Numărul Dispersii Valoarea testului „F”
gradelor de F
variaţie variaţiei libertate corectate Fc α ; v1 ;v2
2 2
Varianţa 2 n 2 2 Vx s y/x
explicată de V
x = ∑( yˆt − y) k=1 s
y/x = k Fc = 2
s
model t=1 uˆ
2
Varianţa n 2 Vu
s
reziduală Vu =
2
∑( yt − yˆt ) 2
n − k −1 uˆ = n − k −1 -
t=1
Varianţa n

totală V0 =
2
∑( yt − y )2 n−1 - -
t=1
.

Pe baza datelor din tabel se pot testa următoarele ipoteze:


H 0 : s y2 / x = su2 => cele două dispersii sunt aproximativ egale,
adică influenţa factorului x nu diferă de influenţa factorilor întâmplători;
2 2
H1 : s y /x ≠ su => influenţa factorului x şi a factorilor întâmplători
– măsurată prin cele două dispersii – diferă semnificativ şi, deci, se poate
trece la discuţia similitudinii, a verosimilităţii modelului teoretic în raport cu
modelul real.
După cum se ştie, testarea semnificaţiei dintre două dispersii se face
cu ajutorul distribuţiei teoretice Fisher-Snedecor, respectiv cu testul „F”.
Cunoscând cele două valori:
2 2 2
= sy /x = Vx : Vu
F = valoarea calculată a variabilei „F”
cal 2
su k n − k −1
pe baza rezultatelor modelului econometric;
F
α,v ,v = valoarea teoretică a variabilei „F”, preluată din tabela
1 2
repartiţiei Fisher – Snedecor, în funcţie de un prag de semnificaţie α
Modelul unifactorial

(α = 0,1 sau α = 0,05 sau α = 0,01) şi de numărul gradelor de libertate v1 =


k; v2 = n-k-1;

Regula de decizie este următoarea:


- se acceptă H0 şi se respinge H1 dacă:

F F
cal≤ α,v1,v2

- se acceptă H1 şi se respinge H0 dacă:

F >F
cal α,v1,v2

Dacă se acceptă H1 şi dacă variabila u este independentă de


fenomenul x, cov(x,u)=0, atunci ecuaţia analizei variaţiei este:

2 2 2
V 0 =V x +V u (3.4.39)

ecuaţie care, prin împărţirea la V02 , se transformă în:

2
V 2 V 2 V V2
1= x
+ u
⇒100 = x
⋅100 + u
⋅100 (3.4.40)
2 2 2 2
V0 V0 V0 V0
V 2

2 = 2
x

Termenul R y /x V0 se numeşte coeficient de determinare şi are


următoarele semnificaţii:

0 ⇒ y ≠ f (x) + u ⇒ x nu este factor (cauza) al fenomenulu i y;


}⇒ y = f (x) + u ⇒ x este factor al variabile i y, dar nu este factor esential;
R y2 / x = 0,5
}⇒ y = f (x) + u ⇒ x este un factor esential al fenomenulu i y;
1 ⇒ y = f (x) ⇒ x este singurul factor de influenta a fenomenulu i y.
Modele econometrice

Pe baza afirmaţiilor de mai sus, se deduce uşor că un model


2
econometric este cu atât mai performant cu cât valoarea lui Ry /x se
apropie mai mult de unu, respectiv cu cât se apropie mai mult de 100(%).
Statistic, intensitatea legăturii dintre cele două variabile se măsoară
cu ajutorul indicatorului Ry / x , denumit raport de corelaţie:

2
2
V2 V
R = Ry /x = x = 1− u

V 02 V 02

0 ⇒ x şi y sunt independente

= 0,5
R
}⇒ corelatie puternică
1 ⇒ corelatie deterministă - y este corelat strict cu x

În cazul unei legături liniare între cele două variabile – y = a + bx +


u, ln y = ln a + b ln x + ln u, ln y = a + bx + ln u, estimatorii parametrilor
fiind obţinuţi cu ajutorul M.C.M.M.P., se poate demonstra că raportul de
corelaţie, Ry / x , este egal cu coeficientul de corelaţie liniară, ry / x :

∑( yˆt −y )2 ˆ + bxˆ − ˆ − bxˆ )


2
ˆ2 − 2
t =1 ∑b ( x t x)
R = ∑( y t − y) 2 = ∑(a t
∑( y t − y )
a
= ∑( y t − y )
yx n 2 2

t=1

x σ
ˆ ∑( t − x )2 ˆ x
Ry x =b =b
y
∑( t − y )2 σy
ˆ
naˆ + b∑ xt = ∑ yt

∑t ˆ ∑ t ∑ tt 2

aˆ x+b x = yx
Modelul unifactorial

y y x
n ∑ t ∑ t t −x
x y x = n∑ yt xt − ∑( xt ∑) yt n
ˆ ∑ t ∑ t t ⋅y=
x x
b = n ∑ t
n∑ xt2 − ∑ xt 2
∑ t2 −x
x 2

∑ t ∑ xt2 n

x
∑( t


x
)2

∑ ( x t2

− 2xt

x
+

x
2 )

∑ xt2
x
∑ t

2
− 2x
+x
σx
=
=
=

=
n

n
n

n
∑ xt2
∑ xt2
2

2
=
− 2x
+x
=

−x

y x
∑ t t

−x
⋅y

ˆ
n
⇒b
=
σ
2
x

cov( y, x) =
∑( x t −
x
)(yt


y
)
=
∑( x t y t − x t
y

x
yt +
x

y
)

x y
∑ t t

x
∑ t

y
∑ t

n
=

−−y

−x
+x⋅y=
n

x y
∑ t t
x
∑ t

y
t

−y⋅x−x⋅
y+x⋅y
=

−x⋅y

n
⇒ b$ = cov( y , x)
σ 2x

cov( y, x) cov(y, x) σ x ˆ σx
r
y/x
=
σσ = σ2 ⋅σ y = b ⋅σ y = Ry x
x y x

De asemenea, testarea semnificaţiei unui model econometric se poate


face tot cu testul „F”, dar, pornind de la valoarea raportului de corelaţie, Ry /
2
x , sau a coeficientului de determinare, Ry /x :

sy
2
/x V 2 V2 R2 n−k−1
F = = x
: u
= ⋅
cal
2 2
su k n − k −1 1−R k
Modele econometrice

Astfel:

- dacă F = n − k − 1⋅ R 2 ≤ F ⇒R =0⇒
2
cal k 1−R α ;v 1 =k ;v 2 =n −k −1 y / x

se renunţă la modelul econometric obţinut;


F = 2
>F ⇒R
- dacă cal n − k −1 ⋅ R
α ;v =k;v =n−k −1 y/x ≠0⇒ se trece la
2
k 1− R 12

2 2 2
discuţia econometrică a ecuaţiei analizei variaţiei – V 0 =V x +V u – vezi
relaţia (3.4.25).

3.5 Utilizarea modelului econometric unifactorial

În practica economică, un model econometric se utilizează pentru


explicarea variaţiei fenomenului rezultativ y în raport de variaţia factorului
său x, pentru estimarea valorilor probabile ale fenomenului y (simularea
acestuia) în funcţie de posibilele valori pe care economic le poate înregistra
factorul x, şi, în final, prognoza fenomenului y în funcţie de valorile
fenomenului x, pe intervalul de prognoză v, v = 1, 2, ..., h.
Pentru a permite ca utilizatorii să verifice proprietăţile
(performanţele) unui model econometric obţinut, acesta trebuie prezentat cu
următoarele informaţii:
ˆ
ˆ = ˆ+
yt a bxt ; R
(s
aˆ )(sˆ) d
b
s

Dispunând de aceste informaţii se poate testa:


- independenţa erorilor  testul „d” – Durbin – Watson;
- semnificaţia estimatorilor  testul „t”;
- similitudinea modelului  testul „F”.
În anumite cazuri, când s-au estimat două modele pentru spaţii
diferite (două judeţe, sau două pieţe diferite) sau pentru perioade de timp
diferite, ale aceloraşi două fenomene y şi x, de exemplu: M1 : y = a1 + b1x şi
Modelul unifactorial

M 2 : y = a2 + b2 x , se poate testa ipoteza omogenităţii sau stabilităţii relative a


legităţii dintre cele două fenomene:

H 0 : b1 = b2 ⇒ cele două modele sunt relativ omogene, sau legătura


este relativ stabilă în timp;
H1 : b1 ≠ b2 ⇒ cele două modele nu sunt omogene (legătura nu este
relativ stabilă).

Astfel,

b1 − b2
- dacă:t cal = 2 2 ≤ t α ⇒ se acceptă H0;
sb + sb
1 2

b1 − b2
- dacă: t cal = > t α ⇒ se acceptă H1.
s b 2 + s b2
1 2

De reţinut că ipoteza H0 este folosită în special în domeniul


prognozei, deoarece acceptarea ei presupune existenţa unei legături relativ
stabile în timp, premisă ce justifică previziunea fenomenului y pe baza
valorilor viitoare ale fenomenului x. În acelaşi timp, în toate cele trei direcţii
în care poate fi folosit un model econometric, valorile fenomenului
yˆ ˆ
pot fi estimate, fie pe baza estimaţiei punctuale, t = aˆ + bx t , fie pe baza
unui interval de încredere:

ˆ − ⋅ ≤ ≤ˆ + ⋅ = = −α
s s
(
P y t tα yˆ t y t y t tα yˆ t p 1 )
(3.5.1)
De regulă, prognoza fenomenului y dacă se cunosc valorile variabilei
factoriale x pentru momentul (n+v) se realizează pe baza unui interval de
încredere, deoarece y este o variabilă aleatoare normală de medie yˆ n +v şi

de abatere medie pătratică s yˆ n + v (vezi ipotezele I1 şi I4 ale M.C.M.M.P.):


Modele econometrice

ˆ − ⋅ ≤ ≤ˆ + ⋅ = = −α
t s y y t s
(
P y n +v α yˆ n +v n +v n +v α yˆ n +v ) p 1 (3.5.2)
unde:
y n +v = valoarea reală a variabilei y în momentul de prognoză ( n + v );
yˆn + v = estimaţia punctuală a valorii de prognoză pentru variabila y,
care se calculează cu ajutorul relaţiei:
= ˆ
ˆ ˆ +
y bx
n+v a n+v (3.5.3)
s yˆ n + v = abaterea medie pătratică a erorii de previziune, calculată cu
relaţia:

s yˆ = s
2
=
2
+
1
+
( xn + v − x )2 (3.5.4)
su⋅ 1
n+v yˆ n n
∑( xt − x )2
n+v

t=1

Din relaţia de mai sus rezultă că eroarea de previziune ( s yˆ n + v ) este

cu atât mai mică cu cât numărul de observaţii va fi mai mare, cu cât valorile
variabilelor în momentul de prognoză (n+v) vor fi mai apropiate de media
lor, cu cât dispersia variabilei exogene x va fi mai mare şi cu cât dispersia
2
variabilei reziduale ( su ) este mai mică, iar aceasta va fi cu atât mai mică
cu cât modelul econometric va explica o parte tot mai mare din variaţia

variabilei prognozate yˆ , sau cu cât raportul de corelaţie ( R y x ) va avea o


valoare mai apropiată de unu.
Aprecierea prognozei unui fenomen y pe baza unui model
ˆ
econometric, yˆ t = aˆ + bx t , se poate face cu ajutorul a două noţiuni,
siguranţa prognozei şi precizia prognozei, noţiuni care se află în relaţie
invers proporţională.
Modelul unifactorial

Siguranţa prognozei este dată de probabilitatea (p) cu care este


estimat intervalul de încredere, iar precizia prognozei de relaţia:

y t ⋅s
- eroarea absolută: e a = n +v − yˆ n +v = α yˆ n +v (3.5.5)

- eroarea relativă: e r (%) = e a ⋅ 100 = t α ⋅ s yˆ n +v ⋅100 (3.5.6)


yˆ yˆ
n +v n +v

Dar, dacă p1 rezultă că siguranţa prognozei creşte, iar dacă t α


rezultă că eroarea creşte, iar precizia se diminuează. Din acest motiv,
estimarea valorilor probabile ale fenomenului y se face pe baza unor valori
prestabilite privind siguranţa şi precizia prognozei. De exemplu, se poate
preciza că prognozele vor trebui acceptate cu o probabilitate dată, p = 0,95
=> α = 0,05, iar eroarea de prognoză – pe un anumit orizont al prognozei –
trebuie să fie:

t α ⋅ s yˆ
e r (%) =
n +v
yˆ ⋅100 ≤ E (%) E(%) = 5, 10,...
n +v

Analiza capacităţii de prognoză a unui model poate fi realizată pe


baza indicatorilor statistici propuşi de H. Theil (Pindyck, Rubinfeld, 1981,
p. 364-366). Aceşti indicatori sunt calculaţi pe baza următoarelor relaţii:
• coeficientul Theil

1 n 2
∑( yˆt − yt )
T= n t =1 (3.5.7)
n n
1 ∑ yˆ 2 1 ∑ yt 2
t +
n t =1 n t =1
ale cărui valori sunt cuprinse în intervalul [0, 1].

Semnificaţia acestui indicator este invers proporţională cu mărimea


lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu
atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice

• ponderea abaterii

(y
ˆ− y
2
) (y
ˆ− 2
y )
A
T = 1 n ∑( yˆ
t
2
− yt )
= σ 2u (3.5.8)
n t =1

unde:
yˆ = media valorilor teoretice ale variabilei endogene;
y = media valorilor reale ale variabilei endogene;
σu2 = dispersia variabilei reziduale necorectată cu numărul gradelor de

libertate.

Interpretarea acestui indicator, care evidenţiază existenţa unor erori


sistematice, este aceea că, în cazul ideal 11, valoarea sa este egală cu zero,
aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii
serii de timp.
• ponderea dispersiei

σ 1 n ˆ −ˆ 2 − 1 n ( y t − y )2 2
( yˆ −σy ) 2
∑(y

n t =1
t yt ) ∑

n t =1
D
T = =
t t

1n 2 σ2
∑( yˆt − yt ) u (3.5.9)
n t =1

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă
a celor două serii, respectiv seria ajustată şi seria empirică a variabilei
endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi,
respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce
o valoare apropiată de unu exprimă o eroare de specificare a modelului.

11 Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu
ajutorul metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind
discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda
grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial

• ponderea covarianţei

σ
C
2(1 − r)σ yˆt yt
T = 1n 2
(3.5.10)
∑( yˆt − yt )
n
t =1

unde:
r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei
endogene, yˆt , şi cea reală, yt.
n

∑(
y
t
ˆ −ˆ )(y
y t
− y)
t =1 (3.5.11)
r=
nσ σ
yˆt yt

Se poate observa uşor că semnificaţia acestui indicator este analogă


cu a celor menţionaţi anterior.
De altfel cei patru indicatori se regăsesc în următoarea ecuaţie
propusă de Theil:

1n 2 2 2
ˆ − yt )
= ˆ− y) +σ −σ yt ) + 2(1 − σσ yt (3.5.12)
n ∑(yt ( y ( yˆt r
) yˆt
t =1

a cărei interpretare se realizează prin intermediul semnificaţiei acestor


indicatori.
În cazul în care modelul econometric se utilizează în special la
prognoza fenomenelor economice este necesară verificarea stabilităţii în
timp a legităţii de evoluţie a fenomenului analizat în funcţie de evoluţia
factorilor săi. Acest lucru se poate realiza cu ajutorul testului Chow, care se
aplică astfel:
- fie modelul unifactorial iniţial:

n
1, 2 2
- y0t = a + b x0t + u0t (t = n ); V u 0 =∑u0 t (3.5.13)
t=1
Modele econometrice

pe care îl împărţim în două modele:

n1
2 2 (3.5.14)
- y1t = a1 + b1 xt + u1t (t = 1, n 1 ); V u 1 =∑u1 t
t=1

n
2 2 (3.5.15)
y2t = a2 + b2 xt + u2t (t = n1 +1,n ); V u = ∑
u2 t
2 t = n 1 +1

n
n 1 n
2 2 2
∑u t = ∑u 1t + ∑u 22t 2
⇔V u =V u2 +V u 1 2
(3.5.16)
t =1 t=1 t = n 1 +1
n = n 1 + n 2, n = numărul de observaţii.

Testarea ipotezei de stabilitate constă în alegerea uneia din


următoarele ipoteze:
V 2 ≅V 2
H0: Dacă rezultă că legitatea de evoluţie a fenomenului
u
u0
este stabilă în timp, iar modelul poate fi utilizat în vederea efectuării
prognozei;
V 2 ≠V 2
H1: Dacă rezultă că legitatea de evoluţie a fenomenului
u
u0
nu este stabilă în timp, iar modelul nu va putea fi utilizat în vederea
efectuării prognozei.

Aplicarea testului Fisher-Snedecor constă în:

2 2
Vu 0
−V u n − 2 ( k + 1)
- dacă F c = ⋅ ≤F α;v 1 ;v 2 (3.5.17)
V 2u k+1

se alege ipoteza H0, în caz contrar se alege ipoteza H1 ( numărul gradelor de


libertate este: v1= k + 1, v2 = n – 2 ( k + 1 ), k = numărul variabilelor
exogene).
Modelul unifactorial

Exemplu de aplicare a modelului unifactorial

Se cunosc următoarele date privind consumul final real al


gospodăriilor populaţiei şi PIB-ul real în România, în perioada 1990-2003,
exprimate în preţuri comparabile (1990=100).

Tabelul 3.5.1
Consumul final real al
PIB
gospodăriilor populaţiei
Anul (mild.lei preţuri comparabile)
(mild.lei preţuri comparabile)
(1990=100)
(1990=100)
0 1 2
1990 557,7 857,9
1991 467,4 746,8
1992 432,1 681
1993 435,9 691,3
1994 447,3 718,2
1995 505,3 769,3
1996 545,7 799,5
1997 525,7 750,7
1998 586,2 714,8
1999 579,8 706,1
2000 582,3 720,7
2001 610,7 761,7
2002 629,1 799,1
2003 673,7 838,3
Notă: Ambii indicatori sunt calculaţi conform metodologiei de calcul a Sistemului European al
Conturilor Economiei Integrate - SEC 1979. Consumul final al populaţiei a fost deflaţionat cu ajutorul
deflatorului consumului final al populaţiei exprimat în preţuri constante (1990 = 100), datele
provenind de la Ministerul Prognozei şi Dezvoltării, iar PIB-ul a fost deflaţionat cu ajutorul
deflatorului PIB exprimat în preţuri constante (1990 = 100), obţinut în urma prelucrării datelor din
Raportul Anual BNR.
Sursa: Date prelucrate pe baza Anuarului Statistic al României 2003, INS, Bucureşti, 2004-CD,
* *
Raportului Anual 2000, BNR, Bucureşti, 2001, p. 6 -7 , Raportului Anual 2002 BNR, Bucureşti,
* *
2003, p. 4 -5 , Comunicatului de Presă al INS nr.11/26.02.2004.

Se cere:
a) Să se construiască modelul econometric ce descrie legătura dintre
cele două variabile şi să se interpreteze semnificaţia parametrilor modelului;
Modele econometrice

b) Să se estimeze parametrii modelului şi să se verifice semnificaţia


acestora;
c) Ştiind că în anul 2004, valoarea PIB-ului real 12 a fost egală cu
907,8 mild lei preţuri comparabile (1990=100), să se estimeze valoarea
consumului final real al gospodăriilor populaţiei în anul 2004 şi să se
verifice capacitatea de prognoză a modelului utilizat.

Rezolvare:

a) Notând cu y = consumul final real al gospodăriilor populaţiei;


x = PIB-ul real;
modelul econometric va fi de forma: y = f (x) + u .
Pentru alegerea funcţiei matematice f (x) se recurge la reprezentarea
grafică a celor două şiruri de valori.

y
670
650
630
610
590
570
550
530
510
490
470
450 x
430
670 685 700 715 730 745 760 775 790 805 820 835 850
Figura 2.3.1. Legătura dintre consumul final real al gospodăriilor populaţiei şi PIB-ul
real al României

12 Valoare estimată pe baza informaţiilor furnizate în cadrul Comunicatului de Presă


al INS nr. 12/11.03.2005, privind principalii indicatori conjuncturali în anul 2004 şi luna
ianuarie 2005
Modelul unifactorial

Deoarece graficul punctelor empirice indică faptul că distribuţia


poate fi aproximată cu o dreaptă, modelul econometric devine:

yt = a + bxt + ut ; t = 1,14

Semnificaţia economică a celor doi parametrii a şi b , ţinând cont de


semnificaţia celor două variabile (y - consumul final real al gospodăriilor
populaţiei şi x - PIB-ul real) este:
- parametrul a reprezintă în acest caz autoconsumul, deoarece
pentru x = 0 ⇒ y = a ;
- parametrul b reprezintă panta dreptei sau coeficientul de regresie al
consumului în funcţie de PIB, care măsoară creşterea consumului dacă PIB-
ul se modifică cu un miliard de lei.
b) Estimarea parametrilor modelului econometric de la punctul a) se
face cu ajutorul M.C.M.M.P.:

14 14
ˆ
= min ∑( yt − ˆ = min ∑(yt − ˆ − ˆ 2
ˆ 2
( )
F a,b yt ) a bxt )
t =1 t =1
$
F ′( a$ ) = 0 ⇒ na$ + b ∑ xt = ∑ yt
$ $ 2= y x
F ′( b
ˆ+
)
= 0⇒ a$∑ xt + b∑ xt ∑ t t
ˆ=

14a 10555,4b 7578,9


⇒ ˆ = 5744734 ,07
10555,4aˆ + 7996163 ,14b

(vezi tabelul 3.5.2., coloanele 2, 3, 4, 5).


Modele econometrice

Tabelul 3.5.2
2 uˆ 2
Nr. Anul xt yt x x t yt t −1 uˆ uˆt uˆt −1
crt. t t −1

0 1 2 3 4 5 6 7 8
1 1990 857,9 557,7 735992,41 478450,83 - - -
2 1991 746,8 467,4 557710,24 349054,32 -67,6095 4571.0382 4608,8583
3 1992 681 432,1 463761,00 294260,10 -68,1688 4646.9914 3430,1977
4 1993 691,3 435,9 477895,69 301337,67 -50,3191 2532.0160 2759,4477
5 1994 718,2 447,3 515811,24 321250,86 -54,8389 3007.3080 3573,7049
6 1995 769,3 505,3 591822,49 388727,29 -65,1673 4246.7772 3156,9084
7 1996 799,5 545,7 639200,25 436287,15 -48,4431 2346.7374 1571,3535
8 1997 750,7 525,7 563550,49 394642,99 -32,4371 1052.1637 422,3000
9 1998 714,8 586,2 510939,04 419015,76 -13,0191 169.4958 -995,6848
10 1999 706,1 579,8 498577,21 409396,78 76,4790 5849.0429 5897,0252
11 2000 720,7 582,3 519408,49 419663,61 77,1064 5945.4012 5228,8438
12 2001 761,7 610,7 580186,89 465170,19 67,8133 4598.6481 4278,7321
13 2002 799,1 629,1 638560,81 502713,81 63,0957 3981.0719 3235,9296
14 2003 838,3 673,7 702746,89 564762,71 51,2860 2630.2565 3293,7103
Total 10555,4 7578,9 7996163,14 5744734,07 - 45576,9481 40461,3270

Tabelul 3.5.2 (continuare)


* *
y =y− * y =y− xt* = xt −
t t xt = xt − t t − 0,9016xt −1
− 0,8878yt −1 − 0,8878xt −1 − 0,9016yt −1
9 10 11 12
- - - -
-27,7030 -14,8081 -35,4029 -26,6527
17,1616 18,0219 10,7085 7,7112
52,2995 86,7364 46,3337 77,3342
60,3260 104,4925 54,3078 94,9481
108,2056 131,7118 102,0299 121,7959
97,1156 116,5473 90,1392 105,9260
41,2501 40,9370 33,7159 29,8987
119,5053 48,3596 112,2472 37,9951
59,3959 71,5302 51,3025 61,6613
67,5776 93,8537 59,5726 84,1049
93,7582 121,8924 85,7186 111,9420
86,9458 122,8943 78,5142 112,3779
115,2111 128,8921 106,5254 117,8593
891,0494 1071,0611 795,7127 936,9018
Modelul unifactorial

Utilizând pachetul de programe EViews în vederea estimării


parametrilor modelului au fost obţinute următoarele rezultate:

Dependent Variable: Y
Method: Least Squares
Sample: 1990 2003
Included observations: 14
Std. t- Semnif.
Variable Coefficient Semnif. ind. Error Semnif. ind. Statistic ind. Prob.
s t ˆ
C -67,6561 aˆ 250,0188 aˆ -0,2706 aˆ 0,7913 p(a)
X 0,8077 ˆ 0,3308 sˆ 2,4416 tˆ 0,0311 ˆ ()
p b

b b b

R-squared 0,3319 R2 Mean dependent var 541,35 y


Adjusted 0,2762 R2 S.D. dependent var 75,6474 sy
R-squared c
S.E. of s
regression 64,3567 uˆ Akaike info criterion 11,2983 AIC
Sum ∑( yt − yˆt )2 =
squared 49701,46 = ∑uˆt2 Schwarz criterion 11,3896 SC
resid
Log
likelihood -77,0883 L F-statistic 5,9615 Fc
Durbin-
Watson 0,1969 d Prob(F-statistic) 0,0311 p(F)
stat

Semnificaţia indicatorilor necunoscuţi pe care-i calculează pachetul


de programe EViews este următoarea:
(ˆ) ˆ ˆ
= probabilitatea asociată parametrului â, respectiv b . O

pa , p (b )
valoare cât mai apropiată de zero a acestei probabilităţi va indica o
semnificaţie ridicată a parametrului respectiv, în caz contrar, aceasta
confirmând, împreună cu testul t, faptul că parametrul respectiv este
nesemnificativ.
Rc2 = coeficientul de deteminare corectat sau ajustat. Acesta este
utilizat în vederea evidenţierii numărului de variabile factoriale cuprinse în
model, precum şi a numărului de observaţii pe baza cărora au fost estimaţi
parametrii modelului. În cazul unui model multifactorial acesta va înregistra
Modele econometrice

valori inferioare coeficientului de deteminaţie. Expresia acestui indicator


este următoarea:

n −1
Rc2 =1 − n − k ⋅(1 − R )
2

L= logaritmul funcţiei de verosimilitate (presupunând că erorile sunt


normal distribuite), funcţie ce este determinată ţinând seama de valorile
estimate ale parametrilor. Relaţia de calcul a acestui indicator, utilizată de
către pachetul de programe EViews, este următoarea:

2
L= n1 + ln(2π )+ ln ∑uˆt
2 n

unde:
∑ uˆt2 = suma pătratelor erorilor;
k = numărul variabilelor exogene;
n = numărul de observaţii.
Acest indicator este utilizat în vederea elaborării unor teste statistice
destinate depistării variabilelor omise dintr-un model econometric, precum
şi a unor teste destinate depistării variabilelor redundante dintr-un model
econometric, ca, de exemplu, testul LR sau raportul verosimilităţilor
(Likelihood Ratio).
y = media variabilei dependente sau endogene, având următoarea
relaţie de calcul:
y
n

∑ t

y= t =1

n
Modelul unifactorial

sy = abaterea medie pătratică (standard) corespunzătoare variabilei


dependente, a cărei relaţie de calcul este următoarea:

∑n ( y t − y)2
s = t =1
y n −1

AIC = criteriul Akaike este utilizat în cazul comparării a două sau


mai multe modele econometrice. Relaţia de calcul a acestuia, utilizată de
către pachetul de programe EViews, este următoarea:
2 L 2 k
AIC = − n + n
Regula de decizie utilizată în cazul aplicării acestui test este aceea
potrivit căreia este ales acel model econometric pentru care s-a obţinut
valoarea cea mai mică corespunzătoare acestui indicator.
SC = criteriul Schwartz este, de asemenea, utilizat pentru a compara
două sau mai multe modele econometrice. Relaţia de calcul a acestuia,
utilizată de către pachetul de programe EViews, este următoarea:

SC = − 2L + k ln n
n n

Şi în acest caz, este ales acel model econometric pentru care s-a
obţinut valoarea cea mai mică corespunzătoare acestui indicator.
p(F) = probabilitatea asociată statisticii F. O valoare cât mai
apropiată de zero a acestei probabilităţi va indica o semnificaţie ridicată a
rezultatelor estimării, respectiv a modelului.
Pe baza estimatorilor parametrilor au fost calculate valorile estimate
ale variabilei y, yˆt = −67,6561 + 0,8077xt şi ale variabilei reziduale, uˆt = yt
− yˆt . Valorile acestora sunt prezentate în cadrul tabelului 3.5.3 (utilizând
pachetul de programe EViews).
Modele econometrice

Tabelul 3.5.3
Actual Fitted Residual Residual Plot
yt yˆt uˆt = yt − yˆt (graficul reziduurilor)

557,7 625,3095 -67,6095 | * | .|


467,4 535,5688 -68,1688 | *. | .|
432,1 482,4191 -50,3191 | .* | .|
435,9 490,7389 -54,8389 | .* | .|
447,3 512,4673 -65,1673 | * | .|
505,3 553,7431 -48,4431 | .* | .|
545,7 578,1371 -32,4371 |. * | .|
525,7 538,7191 -13,0191 |. *| .|
586,2 509,7210 76,4790 |. | . *|
579,8 502,6936 77,1064 |. | . *|
582,3 514,4867 67,8133 |. | * |
610,7 547,6043 63,0957 |. | * |
629,1 577,8140 51,2860 |. | *. |
673,7 609,4776 64,2224 |. | * |

- dispersia variabilei reziduale

s2 = ∑( yt − yˆt )2 = 49701,4613 = 4141,7884


uˆ n − k −1 14−2

unde:
k = numărul variabilelor exogene.
(vezi tabelul afişat de programul EViews)
- abaterea medie pătratică a variabilei reziduale, suˆ :

s = ∑( yt − yˆt )2 = 4141,7884 = 64,3567



n − k −1
(vezi tabelul afişat de programul EViews)

- abaterile medii pătratice ale celor doi estimatori:

2 1 x 2
s = s +∑ = 250,0188

n
aˆ uˆ ( xt − x )2
Modelul unifactorial

s2
sˆ = ∑( xt −

x
) = 0,3308
b 2

(vezi tabelul afişat de programul EViews)

- raportul de corelaţie:

14 14 )
2

∑( yt − yˆt )2 ∑( yt − yˆt
2 t=1 = 1− t=1

R= R = 1− 14 2 sy2 ⋅ (n −1)
∑( yt − y)
t=1

R= 1− 49701,4613 = 0,3319 = 0,5761


74392,875
(vezi tabelul afişat de programul EViews)

- variabila Durbin-Watson, d:

14

∑(uˆ t − uˆt −1 )2
d= t =2 = 9784,7173 = 0,20
14

∑uˆt2 49701,4613
t =1

(vezi tabelul afişat de programul EViews)

Astfel, modelul estimat devine:


yˆt = −67,6561 + 0,8077 xt ; R = 0,576
(250,0188) (0,3308) d = 0,20
suˆ = 64,3567
Verificarea semnificaţiei modelului necesită:
- verificarea ipotezei de independenţă a erorilor;
- verificarea ipotezei de homoscedasticitate a erorilor;
- verificarea semnificaţiei estimatorilor;
- verificarea semnificaţiei raportului de corelaţie.
Modele econometrice

Verificarea ipotezei de independenţă a erorilor, care presupune


cov(u t , ut −1 ) = 0 , se realizează cu ajutorul testului Durbin-Watson,
constând în calcularea variabilei d şi compararea sa cu două valori teoretice
d1 şi d 2 (d1 = 1,08;d2 = 1,36), preluate din tabela distribuţiei Durbin-Watson
în funcţie de un prag de semnificaţie α (α = 0,05), de numărul variabilelor
explicative k (k = 1) şi de numărul observaţiilor n (n ≥ 15) . Observaţie:
tabela Durbin-Watson este construită pentru un număr de observaţii n ≥ 15;
pentru valori inferioare se va lucra cu valorile calculate pentru n = 15 .
adică d1 = 1,08,d2 = 1,36 .
Deoarece valoarea calculată d = 0,2 este cuprinsă în intervalul
0 < d = 0,2 < d1 = 1,08 , aceasta indică existenţa unei autocorelări pozitive.
Din acest motiv, nu mai are sens testarea celorlalte ipoteze, a semnificaţiei
estimatorilor şi a raportului de corelaţie, estimatorii nemaifiind eficienţi,
deci se impune mai întâi eliminarea fenomenului de autocorelaţie a erorilor.
Un alt procedeu de verificare a ipotezei de independenţă a erorilor
constă în aplicarea testului Breusch-Godfrey, acest test fiind utilizat în
vederea depistării unei autocorelaţii de ordin superior. Ca urmare a
presupunerii existenţei unei autocorelaţii de ordin superior se construieşte
următorul model:

ut = r1ut −1 + r2ut −2 + K + rp ut − p + zt

unde:
zt = variabilă reziduală de medie zero şi dispersie constantă.

Ipoteza nulă care stă la baza testului este aceea potrivit căreia toţi
coeficienţii corespunzători valorilor decalate ale variabilei reziduale sunt
simultan egali cu zero, fapt ce implică non-existenţa fenomenului de
autocorelaţie a erorilor.
În vederea aplicării testului sunt estimate valorile variabilei reziduale
ut în urma aplicării M.C.M.M.P. asupra modelului iniţial. Variabila
Modelul unifactorial

reziduală ut este regresată apoi în funcţie de variabilele exogene iniţiale ale


modelului şi de valorile decalate ale sale, respectiv ut-1, ut-2,…, ut-p. În cazul
acestei regresii este calculată valoarea coeficientului de determinare R2 şi a
unei variabile de forma: BG = (n-p) R2. Presupunând că ne aflăm în situaţia
unui eşantion de volum mare, variabila BG este asimptotic distribuită sub
forma unui χ α2 ;v , pentru care numărul gradelor de libertate este egal cu:
v = p , unde p = mărimea decalajului , respectiv: BG~ χ α2 ;v .

Dacă BG > χ α2 ;v , ipoteza nulă este respinsă, ceea ce presupune că


există cel puţin un coeficient de autocorelaţie nenul.

Aplicarea testului Breusch-Godfrey s-a realizat utilizând pachetul de


programe EViews (presupunând ca mărimea decalajului este p = 2):

Breusch-Godfrey Serial Correlation LM Test:


F-statistic 16,6537 Probability 0,0007
Obs*R-squared 10,7673 Probability 0,0046

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Variable Coefficient Std. Error t-Statistic Prob.
C 166,6378 146,9445 1,1340 0,2832
X -0,2158 0,1935 -1,1154 0,2908
RESID(-1) 1,0098 0,2999 3,3669 0,0072
RESID(-2) -0,0880 0,3298 -0,2667 0,7951
R-squared 0,7691 Mean dependent var -3,45E-14
Adjusted R-squared 0,6998 S.D. dependent var 61,8319
S.E. of regression 33,8769 Akaike info criterion 10,1183
Sum squared resid 11476,43 Schwarz criterion 10,3009
Log likelihood -66,8281 F-statistic 11,1025
Durbin-Watson stat 1,4994 Prob(F-statistic) 0,0016
Modele econometrice

În cazul utilizării pachetului de programe EViews există două


variante de aplicare a testului Breusch-Godfrey:
- utilizarea testului Fisher–Snedecor aplicat în vederea verificării
existenţei unor variabile absente (omise) în model, având următoarea relaţie
de calcul:
2
= R p
Fc
(1 − R2 ) (n − m)

unde:
p = numărul de variabile noi adăugate în model, respectiv ut-1, ut-2,…, ut-
p;

m = numărul total de parametri corespunzători noului model.

Dacă Fc < Fα ;v1 ;v2 , unde v1 = p şi v2 = n-m, ipoteza conform căreia


estimatorii corespunzători noilor parametri adăugaţi în model sunt nuli este
verificată, respectiv, în cazul nostru, fenomenul de autocorelare a erorilor nu
este prezent, cazul contrar implicând existenţa cel puţin a unei autocorelaţii
de ordinul întâi. Cum Fc = 16,6537 > F0,05;2;10 = 4,10 , rezultă că noul model
este incorect specificat, indicând astfel prezenţa unei autocorelaţii de ordinul
întâi.
- utilizarea testului LM, calculat ca produs între numărul de observaţii
2
corespunzătoare modelului, n, şi coeficientul de determinare, R , corespunzător
acestei regresii auxiliare. În general, testul LM este asimptotic distribuit sub
forma unui χα2 ;v , pentru care numărul gradelor de libertate este
egal cu: v = p , unde p = mărimea decalajului, respectiv:

LM = n ⋅ R2 ~ χ α2 ;v

Dacă LM > χ α2 ;v , erorile sunt autocorelate, în caz contrar, sunt

independente, respectiv ipoteza nulităţii parametrilor, r1 = r2 = 0 , este


Modelul unifactorial

acceptată. Se constată astfel că pachetul de programe nu utilizează relaţia


2
clasică de calcul a testului Breusch-Godfrey, respectiv: BG = (n-p)·R .
2
Deoarece LM = 10,7673 > χ 0,05;2 = 5,99147
, aceasta implică existenţa

a cel puţin unei autocorelaţii de ordinul întâi, ce poate fi remarcată şi pe


baza semnificaţiei parametrului corespunzător valorii decalate cu o perioadă
a variabilei reziduale. 2
În cazul calculării în varianta 0,05;2 clasică a testului Breusch-
Godfrey,
respectiv: BG = 12 ⋅ 0,7691 = 9,2291 > χ = 5,99147 , se ajunge la aceleaşi

concluzii menţionate anterior.


Eliminarea fenomenului de autocorelare a erorilor presupune
efectuarea următoarelor operaţii:
- erorile fiind corelate, adică:

u =r u +z
t ( 1) t −1 t (1)
se va estima valoarea coeficientului de autocorelaţie de ordinul 1:

14
uˆ uˆ
∑ t t −1

r
(1 )
= t =2 14
= 40461,327 = 0,89
∑uˆt2−1 45576,9481
t =2

(vezi tabelul 2.3.2., coloanele 6, 7, 8)

- ştiind că:
yt = a + bxt + ut ⇒ ut = yt − a − bxt
y = a + bx + u ⇒ u = y − a − bx
t−1 t −1 t −1 t −1 t −1 t −1

expresiile obţinute pentru ut şi ut −1 vor fi înlocuite în relaţia (1) şi se obţine:


y t − a − bxt = r( 1) ( yt − 1 − a − bxt −1 ) + zt
y −r y =a 1−r
t ( 1) t−1 ( (1) ) + b(x t
−r x
( 1) t −1 )+z
t
Modele econometrice

Notând cu: y t* = yt − r( 1) yt −1

x t* = xt − r( 1) xt −1
a =a 1−r
1 ( ( 1) )
b1 = b

se obţine:
* * ˆ *
*
(2)
yt = a1 + b1 xt + zt ⇒ yˆt = aˆ1 + b1 xt
$ se aplică M.C.M.M.P.:
În vederea estimării parametrilor a$1 şi b1
14
ˆ ˆ = ,b1 )
* − ˆ − ˆ *
min ∑(yt
b x
2
1 t )
(
F a1 a1
t =2
$
F ′( a1 ) = 0 ⇒ ( n − 1)a$1 + b 1 ∑ xt* = ∑ yt*
* $ * 2 * *

= yx
F ′( b1 ) = 0 ⇒ a$1 ∑ xt + b1 ∑ xt ) ∑ t t (
În urma aplicării programului EViews, rezultatele estimării noului
modelului au fost următoarele:

*
Dependent Variable: yt
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 9,5845 15,4322 0,6211 0,5472

xt* 0,7156 0,1645 4,3505 0,0012


R-squared 0,6324 Mean dependent var 68,5423
Adjusted R-squared 0,5990 S.D. dependent var 42,0350
S.E. of regression 26,6176 Akaike info criterion 9,5417
Sum squared resid 7793,4860 Schwarz criterion 9,6286
Log likelihood -60,0208 F-statistic 18,9270
Durbin-Watson stat 1,7216 Prob(F-statistic) 0,0012
Modelul unifactorial

Ca şi în cazul modelului iniţial se vor calcula valorile estimate ale


variabilei yt* , ⇒ yˆt* = 9,5845 + 0,7156 xt* şi ale variabilei reziduale, zˆt = yt*
− yˆt* . Valorile acestora sunt prezentate în cadrul tabelului 3.5.4 (utilizând
pachetul de programe EViews).

Tabelul 3.5.4
Actual Fitted Residual Residual Plot
* * zˆt = yt* − yˆt* (graficul reziduurilor)
yt yˆt
-27,7030 -1,0121 -26,6909 | * | . |
17,1616 22,4810 -5,3194 | . *| . |
52,2995 71,6530 -19,3535 | .* | . |
60,3260 84,3593 -24,0332 | * | . |
108,2056 103,8374 4,3682 | . |* . |
97,1156 92,9857 4,1299 | . |* . |
41,2501 38,8790 2,3711 | . * . |
119,5053 44,1907 75,3147 | . | . *|
59,3959 60,7715 -1,3755 | . * . |
67,5776 76,7461 -9,1686 | .*| . |
93,7582 96,8106 -3,0525 | .*| . |
86,9458 97,5276 -10,5818 | .*| . |
115,2111 101,8196 13,3914 | . |*. |

Pe baza calculelor prezentate mai sus rezultă modelul:


* *
yˆ = 9,5845 + 0,7156 x ; R′ = 0,795
t t

(15,4322) (0,1645) d′ = 1,72 (3)


szˆ = 26,6176

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de


autocorelaţie a fost eliminat - pentru un prag de semnificaţie
α = 0,05, k = 1, n = 13 ≅ 15 valorile teoretice ale variabilei Durbin-Watson
sunt d1 = 1,08, d2 = 1,36 . În comparaţie cu acestea, valoarea empirică
d′ = 1,72 se situează astfel: d2 = 1,36 < d′ = 1,72 < 4 − d2 = 2,64 , ceea ce
indică fenomenul de independenţă a erorilor, deci fenomenul de
autocorelaţie a fost eliminat.
Modele
econometrice

Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui


model se va realiza cu ajutorul testului White. Utilizând programul EViews
au fost obţinute următoarele rezultate:
White Heteroskedasticity Test:

F-statistic 0,8259 Probability 0,4656


Obs*R-squared 1,8430 Probability 0,3979

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 927,8680 1016,2720 0,9130 0,3827
*
xt 18,3437 32,0687 0,5720 0,5799

xt*2 -0,2090 0,2342 -0,8925 0,3931


R-squared 0,1418 Mean dependent var 599,4989
Adjusted R-squared -0,0299 S.D. dependent var 1542,118
S.E. of regression 1564,9870 Akaike info criterion 17,7483
Sum squared resid 24491851 Schwarz criterion 17,8787
Log likelihood -112,3641 F-statistic 0,8259
Durbin-Watson stat 2,7426 Prob(F-statistic) 0,4656

Fc = 0,8259 < F0,05;2;10 = 4,10 Analizând 2 rezultatele afişate de


programul 0,05;2
EViews se
constată că
şi LM = 1,843 < χ = 5,99147 , iar

estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de

≥t
semnificaţie α = 0,05 ( t0,05;10 = 2,228 ), deci
α ;( n−1)−k −1
ipoteza de homoscedasticitate se verifică.
Estimatorii modelului sunt semnificativ diferiţi de zero dacă:

t = 1

aˆ1
saˆ1
Modelul unifactorial

t = 9,5845 = 0,6211
15,4322
aˆ1

ˆ
b1 ≥ tα ;( n−1)−k −1
tˆ =
s
b1 ˆ

b1

t ˆ = 0,7156 = 4,3505
0,1645
b1

Lucrând cu un prag de semnificaţie α (α = 0,05), din tabela


distribuţiei Student se preia valoarea t0,05;11 = 2,201 . Comparând această
valoare cu valorile calculate pentru cei doi estimatori, se constată că:
- taˆ1 = 0,6211 < t0,05;11 = 2,201 ⇒ parametrul a$1 nu este
semnificativ diferit de zero;
$
- t ˆ = 4,3505 > t0.05;11 = 2,201 ⇒ parametrul b1 este semnificativ
b1

diferit de zero.
Raportul de corelaţie este semnificativ diferit de zero dacă se verifică
inegalitatea: Fc ≥ Fα ; v1 ;v2 , unde valoarea empirică a variabilei
Fisher-Snedecor este:

2
F = ((n −1)− 2) R = 11* 0,3319 = 5,9615
c 2
1− R 1 − 0,3319
Din tabela distribuţiei Fisher-Snedeckor, cu un prag de semnificaţie
de 5% şi în funcţie de numărul gradelor de libertate v 1 = k = 1 şi
v2 = (n −1)− k −1 = 11 se preia valoarea teoretică F0,05;1;11 = 4,84 . Se
constată că Fc = 5,9615 > F0,05;1;11 = 4,84 , deci pentru un prag de
semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ
diferită de zero.
Modele
econometrice

În concluzie, modelul yˆt* = 9,5845 + 0,7156 xt* poate fi apreciat ca


reprezentativ pentru descrierea dependenţei dintre consumul final real al
gospodăriilor populaţiei şi PIB-ul real.

O altă variantă a metodei de eliminare a fenomenului de autocorelare


a erorilor prezentate mai sus constă în determinarea coeficientului de
autocorelaţie de ordinul 1 pe baza variabilei Durbin-Watson, d, pentru a
facilita utilizarea pachetului de programe EViews în vederea eliminării
autocorelaţiei erorilor (utilizând programul autocorelaţie.prg):

d 0, 20
r(1 ) = 1 − 2 = 1 − 2 = 0,90

Rezultatele estimării modelului (2), utilizând pachetul de programe


EViews3, sunt următoarele:

Dependent Variable: DY
Method: Least Squares
Sample(adjusted): 1991 2003
Included observations: 13 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
C 10,1602 13,8505 0,7336 0,4786
DX 0,7083 0,1628 4,3506 0,0012
R-squared 0,6325 Mean dependent var 61,2087
Adjusted R-squared 0,5990 S.D. dependent var 41,9044
S.E. of regression 26,5346 Akaike info criterion 9,5354

3Pentru a elimina autocorelaţia erorilor cu ajutorul pachetului de programe EViews a fost


utilizat următorul program (conform http://www.cip.dauphine.fr/bourbonnaise/eco.html)
denumit autocorelatie.prg:
Estimarea directa a coeficientului de autocorelatie notat cu rau plecand de la statistica DW'
Equation eq1.ls y c x
genr res = resid
scalar rau1=1-@dw/2
genr dy=y-rau1*y(-1) 'Se genereaza qvasi-diferentele.'
genr dx=x-rau1*x(-1)
equation eqm1.ls dy c dx 'Régresie denumita eqm1'
scalar am1=c(1)/(1-rau1) 'Coef de reg.'
Modelul unifactorial

Sum squared resid 7744,9060 Schwarz criterion 9,6223


Log likelihood -59,9802 F-statistic 18,9279
Durbin-Watson stat 1,75 Prob(F-statistic) 0,0012

Valorile estimate ale variabilei yt* şi ale variabilei reziduale,


* *
zˆt = yt − yˆt sunt prezentate în cadrul tabelului 3.5.5 (utilizând pachetul de
programe EViews).

Tabelul 3.5.5
Actual Fitted Residual Residual Plot
yt* yˆt* zˆt = yt* − yˆt* (graficul reziduurilor)
-35,2893 -8,5948 -26,6945 | * | . |
10,8036 15,7300 -4,9263 | . *| . |
46,4217 65,0361 -18,6144 | .* | . |
54,3965 77,5139 -23,1174 | * | . |
102,1210 96,5348 5,5862 | . |* . |
90,2420 85,3011 4,9410 | . |* . |
33,8270 31,4535 2,3735 | . * . |
112,3543 37,1813 75,1730 | . | . *|
51,4219 53,9395 -2,5176 | . * . |
59,6906 69,8356 -10,1449 | .*| . |
85,8372 89,5554 -3,7182 | .*| . |
78,6385 89,8700 -11,2314 | .*| . |
106,6535 93,7580 12,8955 | . |*. |

Pe baza calculelor prezentate mai sus rezultă modelul:

yˆt* = 10,1602 + 0,7083 xt* ; R′ = 0,795


(13,8505) (0,1628) d ′ = 1,75 (4)
szˆ = 26,5346

Utilizând testul Durbin-Watson pentru a verifica dacă fenomenul de


autocorelaţie a fost eliminat - pentru un prag de semnificaţie α = 0,05, k = 1,
n = 13 ≅ 15 valorile teoretice ale variabilei Durbin-Watson
Modele econometrice

sunt d1 = 1,08, d2 = 1,36 . În comparaţie cu acestea, valoarea empirică


d ′ = 1,75 se situează astfel: d2 = 1,36 < d ′ = 1,75 < 4 − d2 = 2,64 , ceea ce
indică fenomenul de independenţă a erorilor, deci fenomenul de
autocorelaţie a fost eliminat.
Verificarea ipotezei de homoscedasticitate a erorilor în cazul acestui
model se va realiza cu ajutorul testului White. Utilizând programul EViews
au fost obţinute următoarele rezultate:

White Heteroskedasticity Test:


F-statistic 0,8302 Probability 0,4639
Obs*R-squared 1,8512 Probability 0,3963

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Sample: 1991 2003
Included observations: 13
Variable Coefficient Std. Error t-Statistic Prob.
C 1108,2070 824,2150 1,3446 0,2085

xt* 13,6436 26,6751 0,5115 0,6201


2
x*
t -0,2067 0,2293 -0,9013 0,3886
R-squared 0,1424 Mean dependent var 595,7620
Adjusted R-squared -0,0291 S.D. dependent var 1535,4140
S.E. of regression 1557,6090 Akaike info criterion 17,7389
Sum squared resid 24261469,0 Schwarz criterion 17,8692
Log likelihood -112,3026 F-statistic 0,8302
Durbin-Watson stat 2,7474 Prob(F-statistic) 0,4639

Analizând rezultatele afişate de programul EViews se constată că


F = 0,8302 < F = 4,10 şi LM = 1,8512 < χ 2 = 5,99147 , iar
c 0,05;2;10 0,05;2
estimatorii parametrilor modelului sunt nesemnificativi pentru un prag de
semnificaţie α = 0,05 ( t0,05;10 = 2,228 ), deci ipoteza de homoscedasticitate se
verifică.
Modelul unifactorial

Pentru a verifica semnificaţia estimatorilor parametrilor modelului,


lucrând cu un prag de semnificaţie α (α = 0,05), din tabela distribuţiei
Student se preia valoarea t0,05;11 = 2,201 . Comparând această valoare cu
valorile calculate pentru cei doi estimatori, se constată că:
- t aˆ1 = 0,7336 < t0,05;11 = 2,201 ⇒ parametrul a$1 nu este
semnificativ diferit de zero;
- t ˆ = 4,3506 > t0.05;11 = 2,201 ⇒ parametrul $ este semnificativ
b
1
b1

diferit de zero.
Pentru a verifica semnificaţia raportului de corelaţie, din tabela
distribuţiei Fisher-Snedecor, cu un prag de semnificaţie de 5% şi în funcţie
de numărul gradelor de libertate v 1 = k = 1 şi v2 = (n −1)− k −1 = 11 se
preia valoarea teoretică F0,05;1;11 = 4,84 . Se constată că Fc = 18,9279 >
F0,05;1;11 = 4,84 , deci pentru un prag de semnificaţie de 5%, valoarea
raportului de corelaţie este semnificativ diferită de zero.
În concluzie, şi acest model, yˆt* = 10,1602 + 0,7083 xt* , poate fi
apreciat ca reprezentativ pentru descrierea dependenţei dintre consumul
final real al gospodăriilor populaţiei şi PIB-ul real.
c) Analiza capacităţii de prognoză a modelului privind dependenţa
dintre dintre consumul final real al gospodăriilor populaţiei şi PIB-ul real în
România în perioada 1981-2003 poate fi realizată pe baza indicatorilor
statistici propuşi de H. Theil.
Aceşti indicatori, adaptaţi modelui supus analizei, au fost calculaţi pe
baza următoarelor relaţii:
• coeficientul Theil

1 ∑n ( yˆ t
* − yt* )2
T= n t =1
n n
1 1
∑ yˆt + ∑ yt* 2
*2
n t =1 n t =1

ale cărui valori sunt cuprinse în intervalul [0, 1].


Semnificaţia acestui indicator este invers proporţională cu mărimea
lui, respectiv cu cât valoarea acestuia este mai mică, tinzând către zero, cu
atât capacitatea de prognoză a modelului este mai bună.
Modele econometrice

• ponderea abaterii
2 2
* *
yˆ −y *

*
−y
A
T = = 2
ˆ −
* σ
1 n * 2
z
y
∑( t yt )
n t =1

unde:
yˆ* = media valorilor teoretice ale variabilei endogene;
y* = media valorilor reale ale variabilei endogene;
σz2 = dispersia variabilei reziduale necorectată cu numărul gradelor de
libertate.
Interpretarea acestui indicator, care evidenţiază existenţa unor erori
sistematice, este aceea că, în cazul ideal∗, valoarea sa este egală cu zero,
aceasta tinzând către unu în cazul unor erori de estimare de-a lungul întregii
serii de timp.
• ponderea dispersiei
n 2 n 2 2
1 * * 1 * *
yˆ − yˆ − y −y

D
(σ *
yˆt
−σ *
y
t
)2 n

t=1 t n ∑
t=1 t

2
T = = σz
*
1 n ˆ − * 2
∑ (yt yt )
n t =1

care este definită tot în intervalul [0, 1], aceasta măsurând evoluţia oscilantă
a celor două serii, respectiv seria ajustată şi seria empirică a variabilei
endogene. Acest indicator are aceeaşi semnificaţie ca şi cei precedenţi,
respectiv o valoare scăzută indică o capacitate bună de prognoză, în timp ce
o valoare apropiată de unu exprimă o eroare de specificare a modelului.
• ponderea covarianţei

C
2(1 − r)σ yˆt* σ yt*
T = *
1 n ˆ − * 2
n ∑( y t yt )
t =1

∗Demn de menţionat este faptul că, în cazul estimării parametrilor unui model statistic cu ajutorul
metodei celor mai mici pătrate, valoarea acestui indicator este egală cu zero, acesta fiind
discriminant numai în cazul utilizării altor procedee de estimare cum ar fi, de exemplu, metoda
grafică, metoda punctelor empirice sau metoda punctelor medii.
Modelul unifactorial

unde:
r = coeficientul de corelaţie liniară dintre valoarea estimată a variabilei
endogene, yˆt* , şi cea reală, yt* :

∑n (yˆt * − yˆ* )(y t* − y* )


r = t =1
nσ *σ *
yˆt yt

Se poate observa uşor că semnificaţia acestui indicator este analogă


cu a celor menţionaţi anterior.
De altfel cei patru indicatori se regăsesc în următoarea ecuaţie
propusă de Theil:
2
1 n * 2 2
ˆ*−y = ˆ* − y
*

y
∑( t
t
)
(y
) +σ yˆ * −σ y*
+ 2(1 − σ *σ y *
r)

n
t
t t t
t =1

a cărei interpretare se realizează prin intermediul semnificaţiei acestor


indicatori.
În urma calculelor efectuate cu ajutorul pachetului de programe
EViews în vederea testării capacităţii de prognoză a modelului privind
dependenţa dintre dintre consumul final real al gospodăriilor populaţiei şi
PIB-ul real în perioada 1981-2003 au rezultat următoarele informaţii:
Rezultatele testării capacităţii de prognoză a modelului privind
dependenţa dintre consumul final real al gospodăriilor populaţiei şi PIB-
ul real în România în perioada 1981-2003

Tabelul 3.5.6
Denumirea indicatorului Simbolul indicatorului Valoarea indicatorului
0 1 2
Coeficientul Theil T 0,1577
A
Ponderea abaterii T 0,0000
D
Ponderea dispersiei T 0,1140
C
Ponderea covarianţei T 0,8860

În urma analizei rezultatelor obţinute se constată că modelul posedă


o bună capacitate de prognoză, ca urmare a valorilor mici înregistrate în
cazul coeficientului Theil, a ponderii abaterii şi a covarianţei şi, deci, poate
Modele econometrice

fi acceptat în vederea realizării unei prognoze a consumului final real al


gospodăriilor populaţiei.
Astfel, dacă valoarea PIB-ului real în anul 2004 a fost egală cu 907,8
mild. lei preţuri comparabile (1990=100), atunci:

x2004* = 907,8 − 838,3 ⋅ 0,89 = 163,6272 mild. lei preţuri comparabile


Valoarea estimată a consumului final real al gospodăriilor populaţiei
în anul 2004, utilizând rezultatele estimării obţinute în cazul modelului (3)
este egală cu:

* ˆ *
yˆ 2004 = aˆ 1 b1 x2004 = 9,5845 + 0,7156 ⋅163,6272 = 126,676 mild.lei
+
preţuri comparabile
Pe baza ipotezei formulate la punctele precedente, consumul final
real al gospodăriilor populaţiei, y*, urmează o distribuţie normală (sau
distribuţia Student, dacă n ≤ 30 ), de medie yˆ2004* şi de abatere medie

* = ˆ* ).
(y
* *

pătratică syˆ2004 , L(y ) ,s


N 2004 yˆ 2004

Pentru x2004* = 163,6272 ⇒ yˆ2004* = 126,676

2 1 (x 2004 − x
* * 2
)
1 (163,6272− 82,3893) 2

= + +

s =
yˆ2004* sz 1+ *x * 2 708,4988⋅ 1+ 13 26186,7452
x
n′ ∑( t )
s *
= 30,6848
yˆ2004

Estimarea consumului final real al gospodăriilor populaţiei, pe baza


unui interval de încredere, se calculează cu relaţia:

* *
ˆ − ≤ * ≤ ˆ + = α
(
* *

ts y y ts
P y
2004 α yˆ
2004 1 2004 2004 α yˆ
2004
)
Pentru α = 0,05 şi v = n − k −1 = 11, din tabela distribuţiei Student se
preia valoarea variabilei tα ;v = t0,05;11 = 2,201.
Modelul unifactorial
Deci, cu un prag de semnificaţie de 0,05 sau cu o probabilitate egală
cu 0,95, valoarea estimată a consumului final real al gospodăriilor populaţiei
României în anul 2004 va fi cuprinsă în intervalul:

P(y2004* ∈ [126,676 ± 2,201⋅ 30,6848])= 1 − 0,05


= 0,95 P(y2004* ∈ [59,14;194,21])= 0,95
4 Modelul multifactorial

4.1 Specificarea şi definirea modelului multifactorial

Sub formă generală, un model explicativ multifactorial se defineşte


prin următoarea relaţie:

y = f (x j ) + u (4.1.1)

unde:
y = variabila endogenă, dependentă sau explicată;
x j = variabilele exogene, independente sau explicative;
j = 1, k , k = numărul variabilelor exogene;
u = variabila reziduală sau aleatoare sau eroare;
f (xj) = funcţia de regresie cu ajutorul căreia vor fi estimate
(aproximate) valorile variabilei y, determinate numai de influenţa factorilor
xj, consideraţi esenţiali, principali, hotărâtori, exceptând influenţa celorlalţi
factori ai fenomenului y, care sunt consideraţi factori neesenţiali,
nesemnificativi de explicare a apariţiei şi a evoluţiei în timp şi în spaţiu a
fenomenului y, aceştia find trataţi separat cu ajutorul variabilei reziduale u.
Modelul econometric (4.1.1) trebuie interpretat ca o expresie formală
a metodei econometrice de investigare a unui obiect economic:

Realitatea (y) = Teoria [f (x j )] + Întâmplarea (u)


Modele econometrice

Ca regulă generală şi fundamentală, specificarea unui model


econometric se face pe baza teoriei economice. Fenomenul economic y se
precizează pe baza conceptelor, definiţiilor şi a relaţiilor cauză-efect
elaborate de către aceasta şi se acceptă fenomenul xj ca factor esenţial, sau
se respinge şi se trece în categoria factorilor întâmplători prin intermediul
variabilei aleatoare u.
Dimensiunea pachetului de variabile explicative xj depinde însă şi de
banca de date statistice a variabilelor respective, de cantitatea şi de calitatea
acestora.
În economie, modelele multifactoriale au o arie vastă de aplicare,
acestea putând fi utilizate în mai multe situaţii şi sub diverse forme, ca, de
exemplu:

a) modelarea consumului

C = f (V, P, N) + u (4.1.2)

unde:
C = consumul unui produs sau grupe de
produse; V = venitul pe familie;
P = preţul produsului sau indicele preţurilor grupei de
produse; N = numărul membrilor unei familii.

b) funcţia de producţie Cobb-Douglas

Q = f (K, L,) + u (4.1.3)

unde:
Q = volumul (valoarea producţiei);
K = capitalul;
L = forţa de muncă.
Modelul multifactorial

c) modelarea evoluţiei preţurilor

I p = f (I v, I cv, I m) + u (4.1.4)

unde:
p
I = indicele preţurilor;
v
I = indicele veniturilor (salariilor) consumatorilor;
cv
I = indicele cursului valutar;
m
I = indicele masei monetare.

4.2 Identificarea modelului multifactorial

Ca şi în cazul modelului unifactorial, identificarea econometrică


constă în alegerea unei funcţii matematice în vederea descrierii legăturii, a
relaţiei dintre variabila endogenă y şi factorii săi de influenţă, x1, x2, …, xj,
…, xk. Această alegere se face în concordanţă cu seriile statistice (serii de
spaţiu sau de timp ale variabilei y şi ale variabilelor xj) ale acestor variabile,
preluate dintr-o bază de date sau construite în urma unor observări statistice
special organizate.
Astfel, dacă se dispune de următoarele informaţii:

x1t x2t … xkt yt


x11 x21 … xk1 y1
x12 x22 … xk2 y2
. . . .
. . … . .
. . . .
x1n x2n … xkn yn

unde:
t = 1, n , n = numărul termenilor seriilor statistice;
j = 1, k , k = numărul variabilelor exogene.
Modele econometrice

Identificarea presupune ca, pe baza datelor experimentale, yt şi xjt, să


se găsească o funcţie matematică, Yt = f (xjt), cu ajutorul căreia să se
estimeze valorile variabilei y numai pe baza valorilor variabilelor xjt.
Spre deosebire de cazul unifactorial, unde procedeul grafic sau
calculele algebrice ofereau informaţii relativ corecte pentru identificarea
funcţiei de regresie, în cazul modelelor multifactoriale acest lucru rămâne
valabil doar în cazul în care se va lucra cu serii bidimensionale: yt, x1t ; yt,
x2t; yt, xjt ; …; yt, xkt.
Un alt mod de alegere a funcţiei de regresie multifactoriale constă
utilizarea, estimarea, verificarea şi compararea mai multor tipuri de funcţii
de regresie şi de a decide în final – vezi coeficienţii de performanţă ai unui
model multifactorial liniar – care este cel mai performant model în raport cu
datele experimentale.
De regulă, în economie, principalele funcţii de regresie
multifactoriale sunt de forma:
- funcţia liniară

Y t = b 0 + b 1 x 1t + b 2 x 2t + …b k x kt (4.2.1)

- funcţia liniară dublu logaritmică

b b bk
Y t = b0 ⋅ x 1 t1 ⋅ x 2 t2 ⋅K ⋅ x kt (4.2.2)
⇒lnY t = lnb0 + b1 lnx1t +b2 lnx 2t +K+ bk lnx kt (4.2.3)

- funcţia liniară semilogaritmică

b +b x +b x +K+b x
Yt =e 0 1 1t 2 2t k kt (4.2.4)
⇒ lnY t = b0 + b1x 1t + b2 x 2t + K + bk x kt (4.2.5)
Modelul multifactorial

sau
x x 2t x kt
Y t = b0 ⋅ b1 1t ⋅ b2 ⋅K ⋅ bk (4.2.6)
⇒lnYt =lnb0 +lnb1 ⋅ x1t +lnb2 ⋅ x2t +K+ lnbk ⋅ xkt (4.2.7)
⇒ lnY t = β0 + β1x 1t + β2 x 2t + K + β k x kt (4.2.8)

unde:
β0 = ln b0 ;
M
1,
β j = lnb j , j = k
De reţinut că, atât în etapa de specificare a modelului, cât şi în etapa
de identificare, soluţiile acceptate:
- xj – principalii factori de influenţă ai fenomenului y;
1,
( )
- Y t = f x jt = b0 + b1x 1t + b2 x 2t + K + b j x jt ; j = k ,t = 1, n
- relaţia de dependenţă;
- nu sunt altceva decât simple ipoteze de lucru.
Validarea sau infirmarea acestora va constitui, de altfel, principalul
obiectiv al etapei de verificare econometrică a modelului.

4.3 Estimarea parametrilor modelului multifactorial

Estimarea parametrilor modelului se face în urma etapei de


identificare a acestuia. Deoarece marea majoritate a modelelor econometrice
pot fi liniarizate, un model multifactorial, în formă generală, se prezintă
astfel:

y t = b 0 x 0t + b 1 x 1t + b 2 x 2t + …+ b j x jt + …+ b k x kt + u t (4.3.1)

unde:
t = 1, n , n = numărul termenilor seriilor statistice;
j = 1, k , k = numărul variabilelor exogene,
Modele econometrice

ceea ce analitic devine:

y 1 = b 0 + b1 x 11 + b 2 x 12 +…+ bk x1k + u1
y =b
2 0 + b1 x 21 + b 2 x 22 +…+ bk x 2k + u 2 (4.3.2)
.........................................................................

y n = b 0 + b n xn1 + b 2 xn2 +…+ bk x nk + un


unde:
x 0 = (1, 1, …,1) reprezintă variabila ce se ataşează termenului liber, ale
cărei valori x t 0 sunt egale cu unitatea ∀ t = 1, n .

Definind cu:
y
1
y 2
= 1,
Y = vectorul coloană al variabilei endogene (y t ) t n de
M
y
n
dimensiune (n, 1);

1 x 11KKKx 1 k
1 x 21KKKx 2 k
X = 1 x 31KKKx 3 k matricea variabilelor exogene
KKKKKKKK
1
x n 1KKKx n k
(xj) j = 0, k de dimensiune (n, k + 1);

b
0
b 1

B= b 2 vectorul coloană al parametrilor (b j) j= 0, k de


M

b
n
dimensiune (k + 1, 1);
Modelul multifactorial

u
1

u2
U = u 3 vectorul coloană al variabilei aleatoare (u t ) t = 1, n de M

u
n

dimensiune (n, 1).

Relaţia (4.3.1), sub formă matriceală, devine:

Y=X·B+U (4.3.3)

Relaţia (4.3.3) se mai poate scrie astfel:

y 1 x 11KK x 1k
1

y 1 x 21KK x 2 k
2
= ⋅
KKKKKKK
M
1 x KK x
n n1 nk

( × 1) n × ( k + 1)(k
n
b u1
0
b 1 u2
+
M M (4.3.4)
b u
k n

+1)×1 (n × 1)

Funcţia de regresie corespunzătoare modelului, scrisă sub forma unei


ecuaţii matriceale, este:

ˆ ˆ
Y =X ⋅B (4.3.5)
Reziduurile û t (estimaţiile variabilei aleatoare u) se definesc astfel:

ˆ ˆ ˆ
U =Y −Y =Y −X ⋅B (4.3.6)

unde:
ˆ
Y = valorile estimate (ajustate) ale variabilei Y.
Modele econometrice

În cazul unui model multifactorial parametrii pot fi estimaţi prin


intermediul mai multor metode cum ar fi: metoda punctelor empirice,
metoda punctelor medii, metoda celor mai mici pătrate (M.C.M.M.P.),
metoda verosimilităţii maxime etc.
Metoda punctelor empirice şi metoda punctelor medii sunt folosite în
cazul modelelor în care aplicarea metodei celor mai mici pătrate este
anevoioasă, necesitând calcule complicate, de regulă pentru funcţiile
neliniare (funcţia logistică).
Metoda celor mai mici pătrate este metoda cel mai des utilizată. În
cazul unui model multifactorial aplicarea acesteia presupune minimizarea
funcţiei:

$ $ $ $ ′
F (B ) = min ∑n ut2 = minU ′U = min(Y − Y )2 = min(Y − XB )2 = min( Y − XB ) ( Y − XB$) =
t −1

= ′ − $′ ′ + $
′ ′ $ (4.3.7)
min Y Y ( 2B (X Y) B (X X)B)
ˆ
care implică calculul derivatei funcţiei în raport cu estimatorul B şi
anularea acesteia:

∂F B ( $) = ⇒− ′ + ′ $= (4.3.8)
$ 0 2(X Y) 2(X X)B 0
∂B

′ $ = ′ (4.3.9)
(X X)B XY

În cazul în care matricea (X’X) admite inversă, prin înmulţirea la


–1
stânga a ecuaţiei matriceale (4.3.9) cu (X’X) rezultă că:
′ −1 ′ $= ′ −1 ′
(X X) (X X)B (X X) (X Y) (4.3.10)
Estimatorii parametrilor se calculează astfel cu ajutorul relaţiei:

1
ˆ
−1
ˆ
B=(XX)
′ (XY)=
′ b2
(4.3.11)
M

ˆ
b
k
Modelul multifactorial

Estimarea parametrilor unui model econometric multifactorial liniar


se poate face şi pe baza matricei varianţelor şi covarianţelor şi a matricei
coeficienţilor de corelaţie liniară simpli.
Fie modelul:

yt = b0 + b1 x1t + b2 x2t + ut (4.3.12)

Se însumează (4.3.12) şi se împarte la n obţinându-se ecuaţia:


+b
y = b0 + b1 x 1 2 x 2 (4.3.13)
Se scade ecuaţia (4.3.13) din (4.3.12) şi rezultă:
y t − y = b1 ( x1t − x 1 ) + b2 (x2t −x 2 ) + ut (4.3.14)

Se notează cu:
*
y =y −y
t t
*
x =x −x
1t 1t 1
*
x =x −x
2t 2t 2

Modelul (4.3.14), construit pe baza abaterilor centrate (standard) ale


variabilelor, devine:
+ +
* * *
y =bx b x u (4.3.15)
t 1 1t 2 2t t

Valorile ajustate ale variabilei endogene se calculează cu ajutorul


relaţiei:
*
ˆ ˆ * ˆ *
=b x +b x
Yt 1 1t 2 2t (4.3.16)
Estimarea parametrilor acestui model se realizează cu ajutorul
M.C.M.M.P.:
2
* * * * *
ˆ ˆ ˆ )=min∑(yt ˆ ˆ (4.3.17)
F(b1,b2)=min∑(yt −Yt −b1x1t −b2x2t )
t t
Modele econometrice

Minimul acestei funcţii este dat de calculul derivatelor parţiale în


raport cu parametrii modelului:

ˆ ˆ ) ˆ * 2 ˆ * * * *
= ∑y t x 1t
(
∂F b ,b
1 2

∂(b ) =0⇒b1∑(x 1t ) +b2 ∑x2t x1t

(
ˆ

∂ ˆ 1ˆ 2
(4.3.18)
F(b ,b ) ) *
= ∑y t x 2t
*
( )
1 2 ˆ * * ˆ *
=0⇒b1∑x1t x2t +b2 ∑ x 2t
∂ b2

Fiecare din ecuaţiile sistemului de ecuaţii (4.3.18) se împarte la n:

x − x
ˆ ∑( 1t x 1 )2 ˆ∑( 1t −x 1 )(x2t − x 2 ) = ∑(yt − y )(x1t − x 1 )
b
1 +b2
n n
n 2
ˆ ∑(x1t −x 1 )(x2t −x ) 2 ˆ ∑(x2t − x 2 ) ∑( yt − y )(x2t − x 2 )
b
1 +b2 =

n n n

În final, sistemul de ecuaţii se prezintă astfel:

ˆ ˆ
b1σ x cov( x1 , x2 ) = cov(y, x1 )
2
+ b2 (4.3.19)
b cov( x , x )+ b σ = cov(y, x )
ˆ 1 ˆ 2

x
1 1 2 2 2 2

Estimatorii parametrilor se vor calcula astfel:

ˆ =
b1
cov( y, x1 ) cov(x1 , x2 )
cov( y, x ) σ2
2 x2

,
σ 2
x
cov( x x 1 2
)
cov( x 1, 2 σ2
x x
1 2
Modelul multifactorial

ˆ=
b2
σ2 x
cov(y, x 1
)
,
cov( x 1x
1 2
) cov(y, x 2 )
,
σ2 x
cov( x x 1 2
)
cov( x 1, x )
2
σ2
1 x2

Termenul liber, b0 , poate fi estimat din relaţia (4.3.13), după calculul


estimatorilor parametrilor b1 şi b2 , astfel:

$ $ $
b 0 = y − b1x1 − b2 x2
Matricea varianţelor şi covarianţelor se defineşte astfel:

cov(y, x1 ) cov(y, x2 )
2
σy
V = cov( x , y) σ2 1
cov(x , x 2 ) x 1

cov( x , y) cov(x 1 , x ) σ2
2 2 1 x2

sau, în cazul general:

cov(y, x1 ) cov(y, x2 )
2
σy ...
cov( x , y) 1
σ2 x
cov(x , x 2 )1
...
, ...
V = cov( x 2 , y) cov(x 1 x ) σ2
2 1 x2 ...
... ... ...
...
, ,
cov( x , y) cov(x x ) cov(x x )
k k 1 k 2

unde:
n
(
∑ y *t
2
)
2 t =1
σy = este dispersia variabilei y;
n
n
(j
2 (
* 2
∑ x jt )
σ = t =1 este dispersia variabilei x jt
(4.3.20)

cov(y, xk )
cov(x1 , xk )
cov(x2 , xk ) (4.3.21)
...
2

σ
xk

= 1, n );
Modele econometrice

(
cov y , x j =
∑ ( y t − y ) x jt − x ) = ∑ y t x jt
) ( * *

n n

ˆ ˆ
Dispunând de matricea V, estimatorii b j = b y / x j se calculează cu
ajutorul relaţiei:
V
ˆ ˆ j +1 yx j
b V
y / x j = bj = (−1) yy , j = 1, k (4.3.22)

unde:
Vyx j = determinantul matricei varianţelor şi covarianţelor din care se
elimină linia y şi coloana x j ;

Vyy = determinantul matricei varianţelor şi covarianţelor din care se


elimină linia y şi coloana y.

Raportul de corelaţie multiplă poate fi exprimat cu ajutorul matricei


varianţelor şi covarianţelor astfel:

R = 1−
y/xj V ⋅1 (4.3.23)
V 2
σy yy

Estimarea parametrilor modelului cu ajutorul matricei coeficienţilor


de corelaţie liniară presupune efectuarea următoarelor operaţii:
σ σ
y xj

σ
- se înmulţeşte relaţia (4.3.15) cu σ y şi xj

+
σ y yt −y =bσ ( x1t − x 1 )+b σ (x2t −x 2 ) u (4.3.24)
σ
y
1 x σ
x
2 x σ
x
t
1 2
1 2
Modelul multifactorial

- abaterile standard normate se notează cu:

y** = y t −y
t
σy
x jt − x j
x**jt =
σ
xj

- relaţia (4.3.24) devine:

σ y yt** = b1σ x1 x1*t* + b2σ x2 x2**t + ut (4.3.25)

- funcţia de regresie corespunzătoare este următoarea:

ˆ ** ˆ ** ˆ **
(4.3.26)
Y =b σ x +b σ x
t 1 x1 1t 2 x2 2t

- se estimează parametrii modelului, bj , j = 1,2 cu ajutorul


M.C.M.M.P., care presupune minimizarea funcţiei:

ˆ n ** ˆ ** 2 n ** ˆ **
−b σ x
F (b j )= min ∑ (σ y y t −Y t ) = min ∑ (σ y y t 1 x1 1t
t =1 t =1
2
ˆ **
σ x
− b2 x2 2t )

F (b
ˆ
)
j
ˆ =0
(
∂ bj )
ˆ
b σ
** 2 ˆ ∑ x ** x ** (** ** )
1 x1 ∑ (x 1t ) + b2 σx 2 1t 2t )= σ y ∑ (y t
x
1t


ˆ
t
** ** ˆ σx
t
**
2
t
**
) (4.3.27)
x x
b1σx 1 ∑ x 1t 2t + b2 2 ∑ (x 2t ) = σ y ∑ (y t **
2t

t t t

* *
Se ştie că: r = ∑y t x
*
tj = ∑ y t x *tj şi r= 1.
y xtj nσ *σ * 2 2 xj/xj

y xj * ) *

(
∑ yt ( )
∑ x tj
Modele econometrice

În acest caz, sistemul de ecuaţii normale (4.3.27) devine:

ˆ σ ˆ σ r = σ y ry x
b
1 x 2 x +b
x
ˆ σ 1rx r (4.3.28)
x

ˆ2 1 2
= σy yx 1
b 1 x x +b 2 x
σ

1 1 2 2 2

Matricea coeficienţilor de corelaţie liniară simplă a variabilelor se


defineşte:
r r
1 yx1 yx2
r
R = rx y 1 1
xx
1
2
(4.3.29)
r y r x
x
1 x

2 2 1

sau, în cazul general:

1 r r ... r ... r
yx1 yx2 yx j yxk
r r r
rx y 1 xx ... xx ... xx
R= 1 1 2 1j 1 k (4.3.30)
... ... ... ... ... ... ...
r r r ... r ... 1
xk y x k x1 xk x2 xk x j

$
Dispunând de această matrice estimatorii
$ = se calculează pe
b b
baza relaţiei următoare: y/xj j

Ryx σ
ˆ = ˆ = (− )j+1 j ⋅ y
(4.3.31)
by / x bj1
j Ryy σ x j

unde:
Ryx j = determinantul matricei R din care s-a eliminat linia y şi coloana

xj;
Ryy = determinantul matricei R din care s-a eliminat linia y şi coloana
y.

Cu ajutorul acestei matrici se pot calcula:


Modelul multifactorial

- coeficienţii de corelaţie parţiali

j +1 R
ry / x = (− 1) yx 1 (4.3.32)
1 /x2 R R
yy xx
12

j +1 R
ry / x = (− 1) yx 2 (4.3.33)
2 / x1 R R
yy xx
12

- raportul de corelaţie multiplă

R
R (4.3.34)
y/xj =R
yy

4.4 Ipoteze pentru estimarea parametrilor

Aplicarea M.C.M.M.P. în cazul unui model multifactorial se


fundamentează pe câteva ipoteze şi anume:
I1: Variabilele y, x1,…, xk nu sunt afectate de erori de măsură.
I2: Variabila aleatoare (reziduală) U este de medie nulă M(u1)=
M(u2) = …= M(un) = 0 iar dispersia ei σ2u este constantă şi independentă de
variabilele exogene Xj - ipoteza de homoscedasticitate.
I3: Valorile variabilei reziduale U sunt independente, respectiv nu
există fenomenul de autocorelare a erorilor, cov (u 1, u n) = 0, ∀t , t = 1, n .
I4: Legea de probabilitate a variabilei reziduale este legea normală de
medie zero şi de abatere medie pătratică σ u.
În afara acestor ipoteze care sunt aceleaşi şi în cazul unui model
unifactorial, există o ipoteză specifică modelului multifactorial şi anume -
I5: Variabilele exogene Xj sunt independente între ele, formând un sistem de
vectori liniari independenţi. În caz contrar apare fenomenul de
Modele econometrice

multicoliniaritate care implică imposibilitatea calculării matricii inverse


–1
(X’X) , precum şi a estimării parametrilor.
Dacă ipotezele I1,…,I5 există, atunci se pot demonstra următoarele:
ˆ
ˆ= −

- ut yt Yt , estimaţiile variabilei reziduale U

unde:
yt = valorile empirice ale variabilei endogene Y;
ˆ
Yt = valorile teoretice ale variabilei endogene calculată pe baza
funcţiei
ˆ= ˆ ˆ=ˆ+ˆ + +ˆ

de regresie - Y X B sau Yt b0 b1 x1t ... bk xkt


∑ut2

- σ u2 = n − k −1 = estimaţia dispersiei σ u2 a variabilei reziduale u,


n fiind numărul de observaţii, iar k = numărul variabilelor explicative;
2 2
- s ˆ = su ⋅c ij (4.4.1) estimaţiile dispersiilor parametrilor (b j ) j =0,k ;
bj

unde:
cij = elementul (j+1) situat pe diagonala principală a matricei inverse
(X’X)-1, j = 0, k .

- media condiţionată a variabilei Y în funcţie de valorile factorilor Xj


ˆ
la momentul t, este egală cu Yt :

ˆ ˆ ˆ ˆ (4.4.2)
M (Y ) =Y
t/Xj = b0 + b1x 1 + ... + bk x k
t
- dispersia condiţionată a variabilei Y (eroarea de estimare a acesteia) se
calculează cu ajutorul relaţiei:
2
sy = M ( y t −Y t )
ˆ 2 2
= su
' −1
[1+ X t (X' X ) X t (4.4.3) ]
t/xj

unde:
Modelul multifactorial

1
x
1t

X = x este vectorul coloană al valorilor variabilelor factoriale Xj, în


t 2t
M
x
kt

momentul t, de dimensiune (1, k + 1), iar X t′ = transpusa matricei Xt.

4.5 Verificarea semnificaţiei modelului

Verificarea semnificaţiei modelului presupune: verificarea ipotezelor


de aplicare a M.C.M.M.P., verificarea semnificaţiei estimatorilor, a
verosimilităţii modelului şi a semnificaţiei raportului de corelaţie.
În această etapă este necesară verificarea < a posteriori > a ipotezelor
de aplicare a M.C.M.M.P. deoarece, în general, estimarea parametrilor se
efectuează în urma acceptării apriorice a valabilităţii ipotezelor enunţate.
ˆ

Verificarea ipotezelor I1, I2, I3 şi I4, ca şi testarea estimatorilor bj , a


modelului şi a raportului de corelaţie Ry / x j se face după aceleaşi principii
prezentate în cazul regresiei unifactoriale.
Verificarea ipotezei I5 presupune ca variabilele exogene să formeze
un sistem de vectori liniari independenţi, respectiv variabilele exogene să nu
fie corelate.
Opusul acestui fenomen îl reprezintă multicoliniaritatea variabilelor
exogene, care este un fenomen foarte frecvent în domeniul economic,
datorită multiplelor relaţii de dependenţă şi interdependenţă dintre
fenomenele economice. În acest scop se impune o abordare econometrică în
scopul depistării şi eliminării acestuia.
Depistarea fenomenului de multicolinearitate se poate face cu
ajutorul mai multor procedee cum ar fi:
- reprezentarea grafică a seriilor de valori corespunzătoare variabilelor
explicative (vezi Figura 4.5.1). În cazul în care se constată
Modele
econometrice

analogii în evoluţie, acestea indică existenţa unei corelaţii suficient de


intense între variabilele respective.

xj

x2

x1

t
Figura 4.5.1

- calculul determinantului matricei X`X, D(X`X), în sensul că, pe măsură ce se


apropie de zero, acesta indică o intercorelare din ce în ce mai strânsă. Dacă
D(X`X) < 0,1 se consideră că fenomenul de multicoliniaritate este prezent.
- calculul mărimii coeficientului de determinare (R2). Această valoare este
comparată cu mărimea aceluiaşi coeficient obţinut în condiţiile în care una
dintre variabilele factoriale a fost omisă din model. În cazul în care
valorile coeficienţilor sunt apropiate ca mărime se poate considera că
variabila omisă este coliniară cu celelalte variabile factoriale. Absenţa
acestei variabile din model ar fi de dorit întrucât ar conduce la diminuarea
multicoliniarităţii fară a afecta semnificativ gradul de determinare a
factorilor asupra variabilei efect.
- testele statistice Student, t- utilizat în vederea verificării semnificaţiei
parametrilor modelului, şi Fisher-Snedecor, F- utilizat în vederea
verificării semnificaţiei modelului. În cazul în care testul F semnalează
semnificaţie, iar testul t, aplicat aceluiaşi model, semnalează nesemnificaţii
în rândul parametrilor, acest lucru reprezintă un indiciu că
multicoliniaritatea este prezentă.
Efectele multicoliniarităţii sunt proporţionale cu intensitatea
prezenţei acesteia în rândul variabilelor explicative. Valorile estimatorilor
parametrilor modelului sunt afectate, având drept consecinţă deformarea
acestor valori într-o asemenea măsură, încât devine neinteligibilă influenţa
Modelul multifactorial

separată a variabilelor explicative asupra variabilei efect. Multicoliniaritatea


afectează, de asemenea, şi gradul de determinare a factorilor asupra
variabilei efect, în sensul diminuării sale.
Atenuarea multicoliniarităţii poate fi realizată astfel:
- datorită faptului că seriile de date privind variabila efect şi factorii săi
determinanţi sunt alcătuite, de cele mai multe ori, dintr-un număr redus de
termeni (n < 10), se recomandă includerea de termeni suplimentari (n >
15), astfel încât, eventualele analogii, datorate hazardului, să fie, pe cât
posibil, eliminate;
- în situaţia în care două variabile cauzale sunt intens corelate (una dintre
ele este coliniară cu cealaltă), se poate renunţa la una dintre ele,
considerându-se că variabila omisă este exprimată de cea reţinută în
model;
- dacă datele sunt prezentate sub formă de serii cronologice, se pot calcula
(1)
diferenţele de ordinul 1 - ∆ = yt – yt-1 – sau pot fi logaritmate valorile lui
Yt, Xj în scopul atenuării coliniarităţii cauzate de prezenţa trendului în
cadrul seriilor de date;
- utilizarea de serii de date formate în optică transversală (serii sincrone)
poate constitui o modalitate de diminuare sau chiar de eliminare a
interdependenţei factorilor Această situaţie este valabilă în cazul în care
observarea se referă la un eşantion statistic de întreprinderi, judeţe, familii
etc. Ca urmare a faptului că datele sunt culese pentru aceeaşi perioadă de
timp, pe baza aceleaşi metodologii, dar în condiţii diferite de manifestare a
factorilor, există şanse mai mari ca ipoteza privind independenţa factorilor
să fie regăsită în setul de date.
Eliminarea fenomenului de multicoliniaritate poate fi realizată cu
ajutorul următoarelor procedee:
1. Metode apriorice - sunt utilizate în vederea selectării şi ordonării
introducerii în model a variabilelor explicative. Una dintre aceste metode
este metoda regresiei iterative care constă în:
Modele
econometrice

- calculul matricei coeficienţilor de corelaţie liniară


corespunzători variabilelor exogene. Această matrice rezultă în
urma eliminării liniei y şi coloanei y din matricea coeficienţilor
de corelaţie liniară corespunzătoare modelului, respectiv:

1
r
x1 y

R = r
y/xj x 2y
...

r
xk
y
r r ... r
yx 1 yx 2 yx k
r r
1 x1 x 2 ... x1 x k
r r
x 2 x1 1 ... x2xk (4.5.1)
... ... ... ...

r r
x k x1 xkx2 ... 1
Pe baza acestei matrice se fundamentează metoda regresiei pas cu
pas. Prima operaţie constă în depistarea fenomenului de coliniaritate dintre
variabilele exogene. Dacă în matricea coeficienţilor de corelaţie există două
variabile explicative al căror coeficient de corelaţie liniară indică o corelaţie
puternică, pozitivă sau negativă, se recomandă de la început renunţarea la
una dintre aceste variabile. Se va reţine acea variabilă pentru care există
prezumţia că nu este afectată de erori, renunţarea făcându-se din punct de
vedere statistic şi economic.
A doua operaţie constă în aplicarea metodei regresiei pas cu pas.
Aceasta poate fi folosită în două maniere: ascendent şi descendent.
Metoda regresiei pas cu pas ascendentă porneşte de la analiza
coeficienţilor de corelaţie ryx j . Condiţia ca prima variabilă să fie introdusă
în model este dată de relaţia:

:
max r ⇒ M yˆ = aˆ + aˆx (4.5.2)
j yxj 1 1 0 1 1
⇒ = +
Fie r = max r y a +ax u (4.5.3)
yx 1 j yx j 1 0 1 1 1

2,
Se calculează coeficienţii de corelaţie parţială ru x j , unde j = k .
1
Modelul multifactorial

La pasul 2 se introduce variabila x care prezintă cea mai puternică


corelaţie cu u1 , respectiv max ru 1 x j .
j

Fie x2 variabila nouă ce va fi introdusă în model:

y2 = a2 + a3 x1 + a4 x2 + u2 (4.5.4)

3,
Se calculează ru2 x j ( j = k ) şi se introduce în model variabila cea
mai puternic corelată cu u2 şi se continuă procedeul.
Toate aceste modele obţinute pe parcurs se testează cu ajutorul
testelor cunoscute, „t ” şi „F ”, urmărindu-se şi verificarea condiţiei :
2
R <R2 <...< R 2 (4.5.5), adică are loc o creştere
yx 1 y x 1x 2 y x 1x 2 ...x k
2
progresivă a coeficientului de determinare R .

Metoda regresiei pas cu pas descendentă presupune construirea


modelului:
= +
y a + a x a x + ... + a x + u ; R 2
0 1 1 2 2 k k y x1...x k
(
s
a0
) ( )
s
a1 (
s
a2 ) ( s
ak ) (4.5.6)

pentru care se calculează abaterile corespunzătoare parametrilor. Vor fi


eliminate din model acele variabile pentru care se realizează condiţia :
s | aˆ j |
aˆ j
≤ tα ;n−k −1 ⇒ aˆ j ≅ (4.5.7)
0.

După ce se elimină variabilele pentru care se verifică condiţia


respectivă se construieşte modelul numai în funcţie de variabilele rămase,
considerate ca având o influenţă semnificativă, conform pasului 1.
Fie a2 ≅ 0 ⇒ se elimină variabila x2. Se construieşte modelul:

y= 0+ a x 1+ 3x 3 + ... + a k x k + 2 2 (4.5.8)
; R
a a u
1 y x1,x 3,...,x k
Modele econometrice

Se compară cei doi coeficienţi de determinare şi trebuie să rezulte că


ei sunt aproximativ egali. Eliminarea variabilei x2 nu diminuează cu nimic
gradul de performanţă al modelului.
2. O altă categorie de metode care poate fi folosite la selecţia
variabilelor factoriale sunt metodele aposteriorice, care constau în
construirea de modele econometrice cu toate variabilele explicative şi
acceptarea acestora ca variabile exogene semnificative numai după
verificarea testelor statistice care validează această ipoteză. Aceste
metode se bazează pe definirea şi interpretarea gradului de performanţă
al modelului. Astfel, coeficienţii de performanţă globală se calculează cu
V 2
2 u j (4.5.9), iar coeficienţii de performanţă
ajutorul relaţiei: R j / 0 = 1 −
2
V0
V 2
2 u
parţială cu relaţia: R j +1/ j = 1 − 2 j +1 (4.5.10).
V
uj
În acest sens se construieşte modelul:

0 0
M 0 : y t = y + u 0 ⇒ u 0 = y t − y , pentru care se calculează
2
variaţia explicată de variabila reziduală - V 0 =V u = ∑ y t − y
2
( 0
)2
0

M1

M
M
q

M
M
k
1 1 ˆ ˆ
: yt = b0 + b1x 1t + u1t ⇒Y t = b0
+b x
1 1t ⇒
ˆ1
2
(
V u = ∑ y t −Y t
1
)2
1
ˆq
: yt
q 2
( q
= b0 + ... + bq x qt + uqt ⇒ V u = ∑ y t −Y t )2 (4.5.11)
q

k 2 k k 2

ˆ
: y t = b0 + ... + bk x kt + u kt ⇒ V uk = ∑ y t −Y t( )
unde:
j = 0, 1, …q, …, k; k = numărul variabilelor exogene
Modelul multifactorial

t = 1, n , n = numărul observaţiilor.

Pe baza acestui model se pot defini următoarele noţiuni:


a) coeficienţii de performanţă globală ai unui model format din 1,2,
…, q,…, k variabile explicative în raport cu modelul iniţial M0
Vu 2
2 0

R0 / 0 =1 − 2
=0
V0
V2
2
R =1− u1
1/ 0 V2
0

M 2 (4.5.12)
V
2 uq

R q/ 0 =1 − 2
V0
M
V2
2 uk
R
k/0 = 1− V 2
0

b) coeficienţii de performanţă parţială ai unui model Mq+1 faţă de


Mq
V2 −V 2 V 2u
R 2 = 1− uq u
q +1
= 1− q +1
(4.5.13)
q+1/ q V2 V2

uq uq

Această relaţie poate fi folosită în cazul regulei de acceptare a


introducerii sau excluderii variabilei xq+1.

V2 u
2 q

M q : R q = 1− V 2
0
2
V
u
M 2
q +1

q +1 : Rq +1 = 1 − 2 (4.5.14)
V0
Modele econometrice

Variabila xq+1 este semnificativă dacă: Rq2+1 > Rq2 ⇔ Rq +1 > Rq ⇔


V2 < V 2 (4.5.15)
u
q +1 uq

Această regulă are o deficienţă deoarece a fost construită pe baza


raportului de corelaţie, R, care a fost calculat cu ajutorul relaţiei:

n ˆ 2 n ˆ 2
∑ (Y t −y) ∑( y t −Y t )
R = t =1 = 1− t =1 (4.5.16)
y xj n n
(y −
(y −
∑ t y )2 ∑ t y )2
t =1 t =1

Acesta nu ţine seama de două neajunsuri care apar în cazul


modelului multifactorial, respectiv de numărul de observaţii pe baza cărora
au fost estimaţi parametrii modelului şi de numărul variabilelor factoriale
ale modelului.

Pentru eliminarea acestor vicii ale raportului de corelaţie clasic,


acesta se înlocuieşte cu raportul de corelaţie ajustat (corectat) a cărui relaţie
de calcul este următoarea:

Ra= 1−
n−1
n−k
⋅ 1−R
2
( ) (4.5.17)

OBS. Numărul observaţiilor trebuie să fie mai mare decât numărul


parametrilor modelului, n ≥ k + 1 .
De asemenea, se observă că, în cazul unui model unifactorial (k = 1),
cele două raporturi de corelaţie sunt egale. În cazul în care
k>1⇒Ra>Ry xj .
O altă problemă care se ridică este aceea privind alegerea celui mai
bun model multifactorial din grupul modelelor posibile construite în funcţie
de factorii explicativi.
Modelul multifactorial

Rezolvarea acestei probleme permite atât alegerea celui mai bun


model cât şi eliminarea multicoliniarităţii.
Un model multifactorial este de forma:

y = f ( x1, …xj, …xk ) + u

Pe baza celor xk variabile factoriale se pot construi următoarele


modele caracterizate prin suma pătratelor abaterilor ∑u 2k sau prin
raporturile de corelaţie R y ( xj ):
2 R
- M 1: y = f (x1) + u1 ; Σ u 1 ; y x1

2 R
- M 2: y = f (x1 , x2 ) + u 2 ; Σ u 2 ; y x2
M
2
- M j: y = f (x1, …xj ) + u j ; Σ u j ; R y xj (4.5.18)
M
2
- M k: y = f (x1, …xk ) + u k ; Σ u k ; R y xk

În mod logic, introducerea unei variabile factoriale într-un model


econometric este justificată dacă:
2 2 2 2
- Σ u 1 > Σ u 2 > K> Σ u j > K> Σ u k (4.5.19)
−R <R < K< R <K<R
y x1 y x2 y xj y xk

Pe baza celor două relaţii, alegerea celui mai bun model econometric
se poate face pe baza următoarelor restricţii:

min u
2
j (j = 1,
- fie j ∑ k ) (4.5.20)
x
max R y j

- fie j

unde:
k = numărul variabilelor explicative (exogene).
Modele econometrice

Aceste două restricţii trebuie completate de următoarele calcule:

În cazul în care diferenţele dintre sumele pătratelor erorilor sau


dintre raporturile de corelaţie ajustate (corectate) a două modele cu un
număr diferit de variabile exogene, respectiv M k şi M q (q ≠ k, k > q) nu
sunt evidente, acceptarea unuia dintre modele se poate realiza cu ajutorul
testului Fisher – Snedecor care constă în verificarea inegalităţii:
2 2 2 2
V −V V −V
-dacă F = xq xk ⋅ n−k −1 = u q uk ⋅ n−k −1≥F (4.5.21)
2
c V u k k −q V 2u k k −q α;v 1;v 2

rezultă că între cele două modele există diferenţe semnificative, iar cel mai
bun model va fi ales în conformitate cu restricţiile menţionate anterior.

- dacă F c < F α ;v 1 ; v 2 , atunci diferenţele dintre cele două modele


nu sunt semnificative, rezultă că se alege modelul cu numărul de variabile
explicative cel mai mic.

În vederea aplicării acestui test se definesc următoarele mărimi:


n
2 2
-Vu k = ∑ u 1 t reprezintă suma pătratelor erorilor corespunzătoare
t=1

modelului M k ;
n
2 2
-Vu q = ∑ u 2 t reprezintă suma pătratelor erorilor corespunzătoare
t=1
modelului M q ;
- t = 1, n , n = numărul observaţiilor;
- j = 0, 1, … ,q, …, k; k = numărul variabilelor exogene;
- v1= k – q , v2= n–k–1, v1 şi v2= numărul gradelor de libertate.
Modelul multifactorial

4.6 Simulare şi prognoză

Dacă în urma etapei de verificare a semnificaţiei modelului au fost


satisfăcute condiţiile cerute de testele şi ipotezele prezentate mai sus, atunci
se poate afirma faptul că modelul este corect specificat, identificat şi estimat
şi, ca atare, poate fi utilizat la prognoza şi simularea fenomenului analizat.
În cazul unui model multifactorial, dacă se cunosc valorile
variabilelor factoriale Xj pentru momentul (n+v), prognoza variabilei
endogene se realizează pe baza unui interval de încredere, deoarece Y este o
ˆ *
variabilă aleatoare normală de medie Y n +v şi de abatere medie pătratică

sYˆn*+v (vezi ipotezele H1 şi H4 ale M.C.M.M.P.):

ˆ*
P[Yn+v − tα;v ⋅ s ˆ*
ˆ*
≤ yn+v ≤ Yn+v + tα;v ⋅ s ˆ*
]=1−α (4.6.1)
Y Y
n+v n+v

unde:
y n +v = valoarea reală a variabilei y în momentul de prognoză ( n + v );
ˆ∗
Y
n+v = estimaţia punctuală a valorii de prognoză pentru variabila y, care
se calculează cu ajutorul relaţiei:

ˆ ˆ ˆ ˆ ˆ
Y + b ⋅x + b ⋅x ⋅x
=b0 n +v1 n +v ,1 2 n +v ,2 + K + b k n +v , k (4.6.2)
Sub formă matriceală, relaţia de mai sus devine:
ˆ* ˆ ′ −1 ′ ) (4.6.3)
Y =X
′ ′

n +v v B = X v (XX) (X Y
unde:
1
x
n +v , 1

X = x
v n +v , 2 = vectorul coloană a valorilor de prognoză ale

M
x
n +v , k
variabilelor x j pentru momentul ( n + v ).
Modele econometrice

tα;v = variabila aleatoare Student (sau variabila normală z , dacă


n>30), preluată din tabelul distribuţiei respective, în funcţie de pragul de
semnificaţie α şi de numărul gradelor de libertate v = n –k - 1;

s
ˆ∗
Y
= s
2

ˆ
2
[ '
(
= s u ⋅ 1+ X v ⋅ X X
'
)−1⋅ X v ] (4.6.4) reprezintă
n +v Y n +v

abaterea de prognoză a variabilei endogene Y, care exprimă eroarea de


previziune.
Eroarea de previziune ( ˆ ∗ ) este cu atât mai mică cu cât numărul
s Y n +v

de observaţii va fi mai mare, cu cât valorile variabilelor în momentul de


prognoză (n+v) vor fi mai apropiate de media lor, cu cât dispersiile
variabilelor exogene Xj vor fi mai mari şi cu cât dispersia variabilei
2
reziduale (s u ) este mai mică.
2
Dispersia variabilei reziduale (s u ) va fi cu atât mai mică cu cât
modelul econometric va explica o parte tot mai mare din variaţia variabilei
prognozate Y, sau cu cât raportul de corelaţie ( R y x j ) va avea o valoare

mai apropiată de 1.

Exemplu de rezolvare a unui model liniar multifactorial


2
Un întreprinzător cumpără un magazin având o suprafaţă de 230 m
într-un cartier în care locuiesc în jur de 6400 de familii. O societate de
consultanţă de management comercial îl informează că cifra de afaceri a
magazinelor cu profilul respectiv depinde liniar de suprafaţa comercială a
magazinului şi de numărul familiilor din cartierul respectiv care, de regulă,
cumpără de la magazinul cel mai apropiat. În acest sens, îi pune la dispoziţie
informaţiile referitoare la aceşti indicatori, înregistrate la 13 magazine având
acelaşi profil:

Tabelul
4.6.1
Nr. de familii (sute) 70 35 55 25 28 43 15 33 23 4 45 20 56
Supr. comercială (zeci
m2) 21 26 14 10 12 20 5 28 9 6 10 8 36
Cifra de afaceri (mil.
lei) 198 209 197 156 85 187 43 211 120 62 176 117 273
Modelul multifactorial

Se cere:
a) Pe baza datelor problemei, ţinând cont de semnificaţia economică
a fenomenelor observate, să se construiască modelele econometrice cu
ajutorul cărora poate fi studiată dependenţa dintre fenomenele respective;
b) Să se estimeze parametrii modelelor construite la punctul a);
c) Din cele trei modele utilizate pentru descrierea dependenţei cifrei
de afaceri de cei doi factori, să se aleagă cel mai bun model;
d) Să se estimeze cifra de afaceri pe care o poate obţine
întreprinzătorul dacă va cumpăra magazinul respectiv;
e) Ştiind că, pentru funcţionarea magazinului, cheltuielile lunare sunt
în jur de 200 mil.lei, estimaţi care este riscul ca întreprinzătorul să obţină un
profit mai mic sau egal cu 10%;
f) Să se arate şi alte modalităţi de rezolvare a modelului
multifactorial - pe baza matricei coeficienţilor de corelaţie şi a matricei
varianţelor şi covarianţelor.

Rezolvare :
a) Descrierea econometrică a legăturii dintre cele trei variabile, y -
cifra de afaceri. x1 - numărul de familii şi x2 - suprafaţa comercială, se poate
face cu ajutorul a trei modele:
1.1. Modelul unifactorial: y t = f (x1t ) + u1t explică variaţia cifrei de
afaceri pe seama numărului de familii;
1.2. Modelul unifactorial: y t = f (x2t ) + u2t explică variaţia cifrei de
afaceri pe seama suprafaţei comerciale;
1.3. Modelul multifactorial: y t = f (x1t , x2t ) + u3t explică variaţia
cifrei de afaceri pe seama ambilor factori.
Identificarea funcţiilor de regresie a primelor două modele se
realizează cu ajutorul reprezentării grafice a variabilei y în funcţie de
celelalte două variabile factoriale x1 , respectiv x2 .
Modele
econometrice

y
300

250

200

150

100

50

0
x
0 10 20 30 40 50 60 70 80 1

Figura 4.6.1

y
300

250

200

150

100

50

0 x2
0 5 10 15 20 25 30 35 40

Figura 4.6.2

Deoarece graficele de mai sus arată că legătura dintre y şi x1 ,


respectiv y şi x2 poate fi aproximată cu o dreaptă, modelele de mai sus
devin:

1. y t = a1 + b1x1t + u1t
2. y t = a2 + b2 x2t + u2t
3. yt = a3 + b3 x1t + c3 x2t + u3t
Modelul multifactorial

Modelul (3) este un model multifactorial liniar deoarece y, fiind


corelat liniar cu x1 , respectiv cu x2 , se deduce uşor că va fi corelat liniar şi
în raport cu ambii factori.

b) Estimarea parametrilor celor trei modele


1. Model econometric privind dependenţa dintre cifra de afaceri şi
numărul de familii
Estimarea parametrilor modelului y t = a1 + b1x1t + u1t se va face pe
cu ajutorul pachetului de programe EXCEL baza următoarelor serii
statistice, prezentate în Tabelul 4.6.2:

Tabelul
4.6.2
x Y u
Nr. 1t yt t
1
= 56,9101 u1t = yt − Yt 1
1t −1 (u1t − u1t −1 )2 u12t
crt. + 2,8632x1t
0 1 2 3 4 5 6 7
1 70 198 257,3345 -59,3345 - - 3520,5821
2 35 209 157,1223 51,8777 -59,3345 12368,1567 2691,2980
3 55 197 214,3864 -17,3864 51,8777 4797,5187 302,2869
4 25 156 128,4902 27,5098 -17,3864 2015,6673 756,7882
5 28 85 137,0798 -52,0798 27,5098 6334,5074 2712,3093
6 43 187 180,0279 6,9721 -52,0798 3487,1278 48,6098
7 15 43 99,8582 -56,8582 6,9721 4074,2980 3232,8499
8 33 211 151,3959 59,6041 -56,8582 13563,4649 3552,6528
9 23 120 122,7638 -2,7638 59,6041 3889,7598 7,6386
10 4 62 68,3629 -6,3629 -2,7638 12,9534 40,4863
11 45 176 185,7543 -9,7543 -6,3629 11,5019 95,1471
12 20 117 114,1742 2,8258 -9,7543 158,2603 7,9852
13 56 273 217,2496 55,7504 2,8258 2801,0111 3108,1063
To 20076,740
t 452 2034 2034 0 - 53514,2273 5
Modele econometrice

SUMMARY OUTPUT
Regression Semnif.
Statistics ind.
Multiple R 0,7917 =R
R Square 0,6268 =R2
Adjusted R
Square 0,5928 = R c2
=s
Standard Error 42,7219 uˆ 1

Observations 13 =n

ANOVA
df SS MS F
33712,490 33712,490
Regression 1
Residual 11
=k 3 = ∑ Yt1 − y
=n−k−1 20076,7405 (
= ∑ yt
( − Yt 1
)2
)
3 = sy2/ x 18,4710 Fc
1825,1582 =s
uˆ 1 - -

2 2

53789,230
Total 12 =n−1 8 = ∑ (y t − y )2 - - - -

Coefficient Standard
Variable s t Stat
Error
termen 56,9101 ˆ 26,0181 s aˆ1 2,1873 t c
liber a1 aˆ1
t
x 2,8632 ˆ 0,6662 sˆ 4,2978 cˆ
1t b1 b1 b1

Estimatorii modelului sunt semnificativ diferiţi de zero dacă:

ˆ
aˆ b
1

t = 1 ≥t şi t = ≥t
c
aˆ α ;n− k −1 cˆ α ;n−k −1
s
aˆ sˆ
b
1 1

1 b1

Deoarece:

= saˆ1 = 56,9101 = 2,1873 < t


t 0,05;11 = 2,2010 → parametrul aˆ nu
c aˆ 1
1 26,0181
este semnificativ diferit de zero.
ˆ 2,8632 ˆ
b1
s >t
tc = ˆ = 0,6662 = 4,2978 0,05;11 = 2,2010 → parametrul b1 este
b
1

semnificativ diferit de zero.


Modelul multifactorial

Testul Fisher-Snedecor indică faptul că rezultatele obţinute sunt


semnificative, cu un prag de semnificaţie de 5%, Fc = 18,471 > F0,05;1;11 =
4,84 .
Raportul de corelaţie este semnificativ diferit de zero dacă se verifică
relaţia:
2
F = (n − 2) R >F
c 1− R2 α ;v1 ;v2

F =11⋅ 0,6268 = 18,471


c
1 − 0,6268
În funcţie de un prag de semnificaţie α = 0,05 şi de numărul
gradelor de libertate v 1 = k = 1 şi v 2 = n − k − 1 = 13 − 2 = 11 se preia
valoarea teoretică F0,05;1;11 = 4,84 .
Se constată că Fc = 18,471 > F0,05;1;11 = 4,84 , deci pentru un prag de
semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ
diferită de zero.
În vederea verificării ipotezei de independenţă a erorilor se
calculează valoarea variabilei Durbin-Watson:
= 53514,2273 =
d 2,67
20076,7405
Pentru un prag de semnificaţie α = 0,05 , din tabela distribuţiei
Durbin-Watson se preiau valorile pentru cazul n = 15, k = 1 - numărul
variabilelor explicative d1 = 1,08 şi d2 = 1,36 .
Cum 4 − d2 = 2,64 ≤ d = 2,67 ≤ 4 − d1 = 2,92 , rezultă indecizie
tinzând spre autocorelare negativă.
Pe baza datelor de mai sus, modelul devine:
Y 1 = 56,9101 + 2,8632x ; R = 0,7917
t 1t

(26,0181) (0,6662) d = 2,67


suˆ1 = 42,7219

2) Model econometric privind dependenţa dintre cifra de afaceri şi


suprafaţa comercială
Modele
econometrice

+u
Estimarea parametrilor modelului y t = a2 + b2 x2t 2t se va face pe
baza următoarei serii statistice, prezentate în Tabelul 4.6.3:
Tabelul 4.6.3
( −
x u
Nr. 2t yt
t
2
Y = 61,384 u2t = yt − Yt 2 t −1 u 2t
u 2t −1
)2 u 22 t

crt.
+ 6,0293x2t
0 1 2 3 4 5 6 7
1 21 198 187,9994 10,0006 - - 100,0111
2 26 209 218,1460 -9,1460 10,0006 366,5896 83,6489
3 14 197 145,7943 51,2057 -9,1460 3642,3240 2622,0232
4 10 156 121,6771 34,3229 51,2057 285,0282 1178,0627
5 12 85 133,7357 -48,7357 34,3229 6898,7330 2375,1678
-
6 20 187 181,9701 5,0299 48,7357 2890,7347 25,2995
7 5 43 91,5306 -48,5306 5,0299 2868,7178 2355,2146
-
8 28 211 230,2046 -19,2046 48,5306 860,0123 368,8161
-
9 9 120 115,6478 4,3522 19,2046 554,9233 18,9419
10 6 62 97,5599 -35,5599 4,3522 1592,9743 1264,5035
-
11 10 176 121,6771 54,3229 35,5599 8078,9136 2950,9794
12 8 117 109,6185 7,3815 54,3229 2203,4939 54,4870
13 36 273 278,4390 -5,4390 7,3815 164,3668 29,5831
13426,738
Total 205 2034 2034 0 - 30406,8116 7

În urma folosirii programului EXCEL s-au obţinut următoarele


rezultate:

SUMMARY OUTPUT
Regression Statistics Semnif. ind.
Multiple R 0,8662 =R
R Square 0,7504 =R2
Adjusted R Square 0,7277 = Rc2
=s
Standard Error 34,9373 uˆ2

Observations 13 =n
Modelul multifactorial

ANOVA
S
df S MS F
=
Regressio = 40362,492 40362,492 33,067
n 1
Residual 11
k=n−k−1
0 13426,7387 (
∑(Yt
= ∑ yt
2
− Yt 2 )
−y ) 2 0 = sy2/ x
1220,6126 =s
4
u ˆ2
Fc - -

2 2

=n− = ∑ (y
Total 12 1 53789,2308 t −y )2 - - - -

Coefficient Standard
Variable s Error t Stat
s c
termen 61,3840 ˆ 19,1642 aˆ 3,2031 t aˆ2
a2

liber 2

t
x2t 6,0293 ˆ 1,0485 sˆ 5,7504 c
b2 b2 ˆ
b 2

Deoarece:
t aˆ2 = 61,384 = 3,2031 > t0,05;11 = 2,2010
c = sa 19,1642ˆ2
aˆ2

ˆ
t b2 6,0293

b2
= sˆ = 1,0485 = 5,7504 > t 0,05;11 = 2,2010
b2
$
rezultă că ambii estimatori, a$ 2 şi b2 , sunt semnificativ diferiţi de zero, cu
un prag de semnificaţie α = 0,05 .
Testul Fisher-Snedecor indică faptul că rezultatele obţinute sunt
semnificative. cu un prag de semnificaţie de 5%.
Fc = 33,0674 > F0,05;1;11 = 4,84 .
Se verifică, de asemenea, semnificaţia raportului de corelaţie:

2
F = (n − 2) R = 11* 0,7504 = 33,0674
c 2
1− R 1 − 0,7504
Se constată că Fc = 33,0674 > F0,05;1;11 = 4,84 , deci pentru un prag
de semnificaţie de 5%, valoarea raportului de corelaţie este semnificativ
diferită de zero.
Modele econometrice

În vederea verificării ipotezei de independenţă a erorilor se


calculează valoarea variabilei Durbin-Watson:

= 30406,8116 =
d 2,26
13426,7387

Pentru un prag de semnificaţieα = 0,05 , din tabela distribuţiei


Durbin-Watson se preiau valorile (pentru cazul n = 15 , k = 1 - numărul
variabilelor explicative) d1 = 1,08 şi d2 = 1,36 .
d = 2,26 > d = 1,36
Cum c 2 rezultă că erorile sunt independente.
d
= 2,26 < 4 − d2 = 2,64c

Pe baza datelor de mai sus, modelul devine:

Y 2 = 61,384 + 6,0293x ; R = 0,8662


t 2t

(19,1642) (1,0485) d = 2,26


suˆ2 = 34,9373

3) Model econometric multifactorial privind dependenţa cifrei de


afaceri de suprafaţa comercială şi de numărul de familii
Estimarea parametrilor unui model multifactorial yt = a3 + b3 x1t + c3
x2t + u3t necesită efectuarea următoarelor calcule:
- obţinerea sistemului de ecuaţii normale prin aplicarea M.C.M.M.P.
care constă în:

ˆ ˆ ˆ =
13
(y −ˆ − ˆ −ˆ
2

(
F a3 ,b3 ,c 3 )
min ∑ t a3 bx
3 1t c 3x 2t )

t =1

Minimul acestei funcţii este dat de calculul derivatelor parţiale în


raport cu parametrii modelului:
ˆ
′ ˆ = 0 ⇒ 2∑ yt − ˆ −
F (a3 )
−ˆ − =0 ( a3 b x
3 1t c3 x2t )( 1)
t
Modelul multifactorial

ˆ

( )
F b3
(
= 0⇒ 2∑ y t − ˆ − ˆ
t
a3 bx
3 1t
−ˆ c 3x 2t )(
− x 1t ) = 0

′ˆ = ⇒ 2∑ (y −ˆ − ˆ −ˆ − =

F (c 3 )
0 t a3 bx
3 1t c x )(
3 2t
x 2t ) 0
t
După efectuarea calculelor rezultă următorul sistem de ecuaţii:

ˆ
naˆ3 + b 3 ∑ x 1t + cˆ3 ∑ x 2t = ∑ y t
ˆ 2

3 ∑ x 1t + b 3 ∑ x 1 t + cˆ3 ∑ x 1t x 2t = ∑ x 1t y t
ˆ 2

3 ∑ x 2t + b 3 ∑ x 1t x 2t + cˆ3 ∑ x 2 t = ∑ x 2t y t

Valorile estimatorilor rezultă în urma rezolvării sistemului de ecuaţii


ale cărui necunoscute sunt cei trei parametrii a 3 , b3 , c3 , iar valorile
termenilor sistemului de ecuaţii se obţin pe baza tabelului 4.6.4, coloanele 1,
2, 3, 4, 5, 6, 7, 8:

Tabelul
4.6.4
Y 3 = 37,5023
x x x y x y x x 2 2
t

Nr. 1t 2t yt 1t t 2t t 1t 2t x x +1,4963x u 3t = y − Y 3
crt. 1t 2t 1t t t

+ 4,2446x2t
0 1 2 3 4 5 6 7 8 9 10
1 70 21 198 13860 4158 1470 4900 441 231,3796 -33,3796
2 35 26 209 7315 5434 910 1225 676 200,2326 8,7674
3 55 14 197 10835 2758 770 3025 196 179,2229 17,7771
4 25 10 156 3900 1560 250 625 100 117,3557 38,6443
5 28 12 85 2380 1020 336 784 144 130,3339 -45,3339
6 43 20 187 8041 3740 860 1849 400 186,7352 0,2648
7 15 5 43 645 215 75 225 25 81,1697 -38,1697
8 33 28 211 6963 5908 924 1089 784 205,7293 5,2707
9 23 9 120 2760 1080 207 529 81 110,1185 9,8815
10 4 6 62 248 372 24 16 36 68,9552 -6,9552
11 45 10 176 7920 1760 450 2025 100 147,2815 28,7185
12 20 8 117 2340 936 160 400 64 101,3851 15,6149
13 56 36 273 15288 9828 2016 3186 1296 274,1009 -1,1009
Total 452 205 2034 82495 38769 8452 19828 4343 2034 0
Modele econometrice

Estimarea parametrului a$ 3 :

y x x
∑ t ∑ ∑ 1t 2t 2034 452 205
x y
∑ 1t t ∑ x1 t ∑ x x
2
1t 2t 82495 19828 8452
x y x x
aˆ = ∑ 2t t ∑ ∑ x22t
1t 2t = 38769 8452 4343
x x 13 452 205
3
n ∑ 1t ∑ 2t
x x x
∑ 1t ∑ x1 t ∑ 2
1t 2t 452 19828 8452
x x x
∑ 2t ∑ ∑ x22t
1t 2t 205 8452 4343
aˆ3 = 37,5023
ˆ = 1,4963
În mod analog se obţin valorile celorlalţi doi parametrii: b3
şi cˆ3 = 4,2446 .
O cale mai rapidă de estimare a parametrilor se realizează utilizând
calculul matriceal, sistemul de ecuaţii de mai sus devenind:

$
(X ′X)B = (X ′Y)

Înmulţind la stânga expresia cu (X ′X )−1 obţinem:


(XX) (XX)B= (XX) −1 (X Y)
′ −1 ′ ˆ ′ ′

Rezultă că:
a$ 3
$ =b $
= (X ′X) (X ′Y)
−1
B 3

c$3
Modelul multifactorial

unde matricile sunt de forma:

1 70 21 198 uˆ
1
ˆ
1 35 26 209 u 2

1 55 14 197 3
1 25 10 156 M

1 28 12 85 M
M
1 43 20 187

X = 115 5 Y = 43 U= M
M
1 33 28 211
1 23 9 120 M
M

1 4 6 62
1 45 10 176 M
1 20 8 117
M
1 56 36 273 uˆ13

Se calculează matricile:

13 452 205
(XX)=
′ 452 19828 8452

205 8452 4343


2034
(X ′Y ) = 82495
38769
X ′X = 36557768

14676700 −230376 −244436


(X ′X) ∗
= −230376 14434 −17216

−244436 −17216 53460


Modele econometrice

14676700 − 230376 − 244436


′ −1 1
(XX) = − 230376 14434 −17216
36557768
− 244436 −17216 53460

0,40147 − 0,00630 − 0,00669


(XX)
′ −1 = − 0,0063 0,00039 − 0,00047

− 0,00669 − 0,00047 0,00146


Calculând produsul:

aˆ3 37,5023
ˆ −1 ˆ
B = ( X X ) (X Y ) = b3
′ ′ = 1,4963

cˆ 4,2446
3

Valorile teoretice ale cifrei de afaceri rezultă deci din relaţia:

Yt3 = 37,5023 + 1,4963x1t + 4,2446x2t

Calculul celorlalţi indicatori ai modelului multifactorial se va face


utilizând următoarele relaţii:

s2 = 1 n ( y − Y )2 3 = ∑uˆ3t2 - estimaţia dispersiei (σ 2 ) a


uˆ 3 ∑ t t u3
n − k − 1 t =1 n− k − 1
variabilei reziduale u3
2 2
c
s ˆ = su ˆ ij - estimaţiile dispersiilor parametrilor a 3 , b3 , c3 ,
ˆ ˆ
(a3 ,b3 ,c3 ) 3
unde:
cij = elementul situat pe diagonala principală a matricei inverse

(X ′X)−1;
Modelul multifactorial

2
0,40147 s
aˆ3
2 2
s ˆ = su ⋅ 0,00039 = s 2ˆ
ˆ
ˆ
b
(a3 ,b3 ,c3 ) 3 3

0,00146 s
2

cˆ3

∑( y t3 − y )2 ∑ (y t − Yt 3 )2
R= = 1− - raportul de corelaţie
y
∑( − y ) t 2 ∑( y t −y )2
n
∑ (uˆ 3t − uˆ3t −1 )
2
t =2
d = n - valoarea variabilei Durbin-Watson calculată
2
∑uˆ3t
t =1
în vederea testării ipotezei de independenţă a erorilor.
Verificarea semnificaţiei acesteia se face cu ajutorul tabelei Durbin-
Watson, din care se extrag valorile d1 = 0 ,95 şi d2 = 1,54 în funcţie de un
prag de semnifica-ţieα = 0,05, de numărul variabilelor exogene k = 2 şi de
numărul observaţiilor n = 13 (n = 15).
Rezolvarea modelului s-a realizat cu ajutorul programului EXCEL,
conducând la afişarea următoarelor rezultate:

SUMMARY OUTPUT
Regression
Statistics Semnif. ind.
Multiple R 0,9251 =R
R Square 0,8558 =R2
Adjusted R Square 0,8270 = Rc2
=s
Standard Error 27,85 uˆ3

Observations 13 =n
Modele econometrice

ANOVA
M
df SS S F

Regressio 46033,016 =∑ Y( 23016,508 29,674


n 2 =k 6 t
3
−y )2 3 = sy2/ x 9 Fc
2 2
=s
Residual 10 =n−k−1 7756,2142 =∑(yt −Yt 3 ) 775,6214 u ˆ3 - -
53789,230 −
Total 12 =n−1 8 = ∑(y t y )2 - - - -
Variabl Standard
e Coefficients Error t Stat
s c
termen liber 37,5023 ˆ 17,6461
a3
aˆ 2,1252 t aˆ 3

s t
x1t 1,4963 ˆ 0,5534 ˆ 2,7039 cˆ
b
3 b3 b3

t
s
x2t 4,2446 ˆ 1,0650 cˆ 3,9856 c
c3 3 cˆ3

Standar
Variable Mean value d
deviatio
n
σ
familii 34,769 x1 18,512 x
1

supr. com. 15,769 x 2 9,619 σ


x2

CA 156,462 y 66,951 σy

În urma testării semnificaţiei parametrilor s-a constatat că:


t
caˆ3 =
2,1252 < t 0,05;10 = 2,228 rezultă că parametrul a$ 3 nu este
semnificativ diferit de zero;
$
tc ˆ = 2,7039 > t0,05;10 = 2,228 rezultă că parametrul b3 este
b
3

semnificativ diferit de zero;


t
ccˆ = 3,9856 > t 0,05;10 = 2,228 rezultă că parametrul c$3 este
3
semnificativ diferit de zero.
Comparând valoarea calculată a variabilei Durbin-Watson d c = 2,17
d
cu cele două valori tabelate se observă că c = 2,17 > d 2 = 1,54 şi
d
c = 2,17 < 4 − d 2 = 2,36 , deci erorile sunt independente.
Modelul multifactorial

Deoarece Fc = 29,6749 > F0,05;2;10 = 4,1 rezultă că valoarea raportului


de corelaţie este semnificativ diferită de zero, cu un prag de semnificaţie de
0,05.
Utilizând ecuaţia analizei variaţiei:

∑ ( yt − y)2 = ∑( yt − Yt )2 + ∑(Yt 3 3 − y)2


∑(Yt − y)
3 2

⋅100 din
rezultă că modelul econometric explică 85,58 % ∑( yt − y )

variaţia totală a cifrei de afaceri.

În concluzie, putem afirma că modelul este corect specificat, adică


variabilele x1t şi x2 t sunt factori semnificativi ai cifrei de afaceri, deoarece
estimatorii lor sunt semnifi-cativ diferiţi de zero şi corect identificaţi,
deoarece modelul explică cea mai mare parte din variaţia cifrei de afaceri.
$
b3 c$3
>t ; s >t
De asemenea, relaţiile sb$ α ,n − k −1 c$3 α ;n − k −1 indică şi faptul că
3

cele două variabile x1t şi x2 t nu sunt corelate liniar. Dacă acestea ar fi fost
corelate liniar (puternic) atunci unul dintre estimatori ar fi fost
nesemnificativ, ceea ce înseamnă că una dintre cele două variabile trebuie
eliminată din model.
$
Prin utilizarea unui model liniar multifactorial, cei doi estimatori b3
şi c$3 reprezintă coeficienţii de regresie (coeficienţii marginali sau
∂y , ∂y ), ceea ce înseamnă că la o modificare de ±100 a numărului de
∂x 1 ∂x 2
familii, cifra de afaceri a magazinului va suferi o modificare de ±1,4963 mil.
2
lei, iar dacă suprafaţa comercială se va modifica cu ±10m , cifra de afaceri
va suporta o modificare de ±4,2446 mil. lei.
Modele econometrice

Ca atare, modelul care descrie legătura dintre fenomenele analizate


este:
Y 3 = 37,5023 + 1,4963x + 4,2446x ; R = 0,9251
t 1t 2t

(17,6461) (0,5534) (1,065) d = 2,17


suˆ3 = 27,85

c) Alegerea celui mai bun model econometric din cele trei modele
analizate se va face pe baza tabelului de mai jos, în raport cu modelul iniţial
(M0):

Tabelul
4.6.5
Coeficienţii de
performanţă
Simbolul Variaţia Coeficienţii
performanţă de parţială
modelului Structura modelului neexplicată de 2 V 2 2
V
(
Ml l = 0,3 ) model R
j/0 = 1 − Vu 2 R2 =1− u
j +1

V 2
0 j+1/ j
uj
2 2 2
V V
u0 = V0 2 u0
M
0 = + =1− 2

(l = 0) yt y u0 = ∑( yt − y)2 V0 -
= 53789,2308 R
0/0 =0
2
2 R =
yt = a1 + b1x1t + u1t 2 1 1/ 0
1
M1 Y = 56,9101 + 2,8632x
V =
∑ yt − Yt =1− 20076,7405 R2 = 0,6268
( l = 1) t 1t =u120076,7405 53789,2308 1/ 0
(26,0181) (0,6662) = 0,6268

2
yt = a2 + b2 x2t + u2t 2 2 2 R2 / 0 =
2 V = 2
M2 Y = 61,384 + 6,0293x u2 ∑ y − Y
t t 13426,7387 R = 0,3312
( l = 2) t 2t = 13426,7387 =1− 53789,2308 2 /1
(19,1642) (1,0485) = 0,7504

V2
R2 =1− u =

R2 3/1 2
2 = Vw
yt = a3 + b3x1t + c3x2t + u3t 2 3 3/ 0
775,2142 = 0,6137

M3 V =
3 y − Y
Yt = 37,5023 + 1,4963x1t + 4,2446x2t u3 t t =1− 53789,2308 V2
(l = 3) (17,6461) (0,5534) (1,065)
= 7756,2142 2
R
u

= 0,8858 3/ 2 = 1 − 2 =
Vz
= 0,4223

Notă: j = 0 ,1, ... , q, ... , k ; k = numărul variabilelor exogene;


t = 1, n; n = numărul observaţiilor;
l = 0, m; m = numărul modelelor construite ( m = 3 ).
Modelul multifactorial

În cazul modelelor cu acelaşi număr de variabile exogene, cel mai


bun este dat de restricţia : max R 2 . Pe baza acestui criteriu se observă că:
j
j
2
R2 = 0,7504 > R = 0,6268 , respectiv modelul M explică mai bine
2/0 1/ 0 2

variaţia cifrei de afaceri (y) în funcţie de suprafaţa comercială ( x2 ), în


comparaţie cu modelul M1 , care utilizează ca variabilă exogenă numărul de
familii ( x1 ).
În cazul în care se compară două modele al căror număr de variabile
exogene este diferit (de exemplu modelul M 2 cu M 3 ) alegerea celui mai
bun model se face cu ajutorul testului Fisher-Snedecor.
Utilizarea acestui test în acest caz constă în:
- calcularea valorii empirice a variabilei Fc

2 2 2 2 2 2 2 2
V −V V −V −V +V V
xk xq uk V0 uk 0 uq : uk

Fc = : = k−q n−k−1
k−q n − k− 1
2 2 2
V −V V
uq uk uk
Fc = :
k −q n − k− 1
2
Vu − Vu2 Vu2
F= 2 3 : 3

c
2 − 1 13−2−1
F =13426,7387 − 7756,2142 : 7756,2142 = 7,3109
c
2−1 10
- preluarea din tabela distribuţiei Fisher-Snedecor a valorii teoretice
a variabilei F în funcţie de un prag de semnificaţie α şi de numărul gradelor
de libertate v 1 = k − q , v2 = n − k −1, respectiv pentru
α = 0,05; F0,05;1;10 = 4,96 .
Deoarece Fc = 7,3109 > F0,05;1;10 = 4,96 , prin introducerea variabilei
x1 în modelul M 3 creşte gradul de performanţă al acestui model în raport cu
modelul M 2 , în acelaşi timp influenţa acestei variabile asupra variabilei y
este semnificativă.
Modele
econometrice

Ca atare, modelul care explică cel mai bine variaţia cifrei de afaceri
este modelul M 3 :
Y 3 = 37,5023 + 1,4963x + 4,2446x ; R = 0,9251
t 1t 2t

(17,6461) (0,5534) (1,065) d = 2,17


suˆ 3 = 27,85

c) Deoarece s-a constatat că modelul M 3 explică cel mai bine variaţia cifrei
de afaceri, acesta va fi utilizat în vederea estimării valorilor probabile ale
cifrei de afaceri pentru întreprinzătorul respectiv. În acest caz, dacă x 0 =
1, x1 = 64, x2 = 23, în medie, cifra de afaceri este egală
∗ $
Y = a$ x +b x + c$ x
n +v 3 n+ v, 0 3 n +v,1 3 n +v ,2

unde:
Yn∗+ v = estimaţia punctuală a valorii de prognoză pentru variabila y;
yn + v = valoarea reală a variabilei y în momentul de prognoză
( n + v ).
Sub formă matriceală, relaţia anterioară devine:
$
Yn∗+ v = X v′B = X v′ ( X ′X )−1 X ′Y
unde:
1
X = x - reprezintă matricea coloană a valorilor de prognoză ale
v xn+v,1

n+v,2

variabilelor x j ( j = 0,2 ) pentru momentul ( n + v ).


Yn∗+ v = 37,5023 *1 + 1,4963 * 64 + 4,2446 * 23 = 230,89 ≈ 231 mil. lei.
În vederea estimării intervalului de încredere pentru această valoare
probabilă este necesară calcularea dispersiei acestei valori cu ajutorul
relaţiei:
sY
2

n+v
2 ′ ′
= su [1 + X v (X X )
−1 Xv ]
Modelul multifactorial

0,040147 − 0,0063 − 0,00669 1


2
s ∗ = 775,6214 1 +(1 64 23) − 0,0063 0,00039 − 0,00047 64 = 1001,84
Y
n+v

− 0,00669 − 0,00047 0,00146 23


sYn∗+ v = 31,65
Intervalul de încredere a prognozei cifrei de afaceri, estimat cu un
prag de semnificaţie α = 0,05, pentru care valoarea lui tα , preluată din tabela
distribuţiei Student, este t 0,05;10 = 2,228 se va calcula cu ajutorul relaţiei:

[
P Yn∗+v − tα sYn +v ≤ yn+v ≤ Yn∗+v + tα sYn +v = 1−α
∗ ∗ ]
P [231 − 2,228* 31,65 ≤ y n +v ≤ 231 + 2,228* 31,65]= 1 − 0,05 =
0,95 P[160 ≤ yn +v ≤ 301] = 0,95

În concluzie, cu un prag de semnificaţie de 5%, cifra de afaceri a


întreprinzătorului respectiv va fi cuprinsă între 160 şi 301 milioane lei.

e) Ştiind că rata profitului rp ( ) este egală cu:


CA−CT
r =
p( 0 0 ) CT * 100 ⇒ CA = rp CT + CT ⇒ CA = CT 1 + rp ( )
unde:
CA = cifra de afaceri (y);
CT = cheltuieli totale.
Pe baza datelor problemei rezultă că antreprenorul, pentru a obţine
un profit mai mic sau egal cu 10 % trebuie să realizeze o cifră de afaceri de
cel mult 220 mil. lei ( CA = 200(1 + 0,1) = 220 ).
Utilizând modelul econometric M 3 rezultă că cifra de afaceri a
acestor magazine urmează o distribuţie normală, de medie Y = 231 mil. lei şi
de abatere medie pătratică sY = 31,43 mil. lei şi ca atare:

220− Y(64;23)
P(Y ≤ 220) = P t ≤ = P(t ≤ −0,35) = P(t ≥ 0,35) = 0,3632
31,43
Modele econometrice

În concluzie, antreprenorul are 36,32% şanse de a nu realiza un


profit de 10%, aceasta reprezentând riscul său de a nu-şi realiza dezideratul
propus în urma cumpărării magazinului respectiv.

f) Estimarea parametrilor unui model econometric multifactorial


liniar pe baza matricei varianţelor şi covarianţelor şi a matricei coeficienţilor
de corelaţie liniară simpli
Fie modelul:

yt = b0 + b1 x1t + b2 x2t + ut (1)

Se însumează (1) şi se împarte la n obţinându-se ecuaţia:

y = b0 + b1 x 1 + b2 x 2 (2)

Se scade ecuaţia (2) din (1) şi rezultă:


y t − y = b1 ( x1t − x 1 ) + b2 (x2t −x 2 ) + ut (3)

Notăm cu:
y t∗ = yt − y
x∗ =x −x
1t 1t 1

Modelul (3) construit pe baza abaterilor centrate ale variabilelor


devine:
yt* = b1 x1*t + b2 x2*t + ut
În acest caz, matricea varianţelor şi covarianţelor modelului se
defineşte astfel:
σ2 cov(yx1 )
yy
V = cov( x1 y) σ 2x x
1 1

cov( x y) cov(x2 x1 )
2

cov(yx2 )
cov(x x )
21 2

σ
x2 x2
Modelul multifactorial

unde:
13

∑ ( yt∗ )2
t =1
σ 2y =
n

∑13 (x tj∗ )2 este dispersia variabilei y;


t =1
σ x2 j = este dispersia variabilei xtj ( j = 1,2 );
n )(xtj − )

) = ∑( y t = ∑ y t xtj
∗ ∗
−y x
(
cov y , x j
n n
x1 = 34,7692 ≈ 34,77
x2 = 15,7692 ≈ 15,77
y = 156,4615 ≈ 156,46

Tabelul
4.6.6
=
Nr. x* = x 1t − x 1 x* x 2t −x 2 y* =yt −y x* y * x* y* x * x*
1 2 1 2 1
t t t t t t 2t t 2t
crt.
0 1 2 3 4 5 6
1 35,23 5,23 41,54 1463,4542 217,2542 184,2529
2 0,23 10,23 52,54 12,0842 537,4842 2,3529
3 20,23 -1,77 40,54 820,1242 -71,7558 -35,8071
4 -9,77 -5,77 -0,46 4,4942 2,6542 56,3729
5 -6,77 -3,77 -71,46 483,7842 269,4042 25,5229
6 8,23 4,23 30,54 251,3442 129,1842 34,8129
7 -19,77 -10,77 -113,46 2243,1042 1221,9642 212,9229
8 -1,77 12,23 54,54 -96,5358 667,0242 -21,6471
9 -11,77 -6,77 -36,46 429,1342 246,8342 79,6829
10 -30,77 -9,77 -94,46 2906,5342 922,8742 300,6229
11 10,23 -5,77 19,54 199,8942 -112,7458 -59,0271
12 -14,77 -7,77 -39,46 582,8242 306,6042 114,7629
13 21,23 20,23 116,54 2474,1442 2357,6042 429,4829

Total -0,01 -0,01 0,02 11774,3846 6694,3846 1324,3077


6694,384
= (σ y ) = 66,951 = 4482,44
2 2
cov( yx2 ) 6
2
σ yy ; = 13 = 514,95
1324,307
= (σ = cov( x1 x2 ) 7 = 101,87
σ x2 x x )2 18,5122 = 342,69 ; = 13

1 1 1

11774384
= (σ = 92,53 cov( yx1 ) 6
σx
2
x x ) 2
2
= 9,619 ; =
13
= 905,72

2 2 2
Modele econometrice

4482,44 905,72 514,95

V= 905,72 342,69 101,87

514,95 101,87 92,53


ˆ ˆ se calculează cu
=b
Dispunând de matricea V, estimatorii bj y/xj

ajutorul relaţiei:
V
ˆ ˆ j +1 yx j
b V
y / x j = bj = (−1) yy , j = 1, k

unde:
V
= determinantul matricei varianţelor şi covarianţelor din care
yx j

se elimină linia y şi coloana x j ;


Vyy = determinantul matricei varianţelor şi covarianţelor din care se
elimină linia y şi coloana y.
905,72 101,87
31348,315
ˆ 2 514,95 92,53 1
= = 1,4696
b1 (−1) = 21331,608
342,69 101,87 8
101,87 92,53
905,72 342,69

ˆ 3 514,95 101,87 84202,5191
=
= 3,9473
b
2 = (−1) 21331,6088 − 21331,6088
$
Estimatorul b 0 se calculează din relaţia (2):
= 156,462 − 1,4696 * 34,769 − 3,9473
ˆ ˆ ˆ ˆ *15,769
b0 = y − b1 x1 − b2 x2 ⇒ b0
ˆ =
b0 43,12
Matricea coeficienţilor de corelaţie liniară simplă a variabilelor pe
baza relaţiei (3) se defineşte:
1 r yx r yx
1 2
r
R = rx y 1 xx

r
1
r 1
1 2

x2 y x2 x1
Modelul multifactorial

unde:

ry∗ x∗ =
∑ yt∗ xtj∗ = ∑ yt∗ xtj∗
nσ ∗ σ ∗ ∗
2
∑(y )∑
t
∗ 2
(xtj )
tj
y xj

1
0,791
R= 7
0,866
2
0,7917 0,8662
1 0,6198 , calculată cu ajutorul programului CBS.

0,6198 1
$ $
b
Cu ajutorul acestei matrici, estimatorii y/xj = bj se pot calcula
astfel:
R
ˆ ˆ j+1 yx j σy
x j = b j = (−
b R σ
y/ 1) yy xj

unde:
Ryx j = determinantul matricei R din care s-a eliminat linia y şi coloana
xj;
Ryy = determinantul matricei R din care s-a eliminat linia y şi coloana y.
0,7917 0,6198
66,95
ˆ 2 0,8662 1 1
= =
1,4965
b1 (−1) 1 0,6198 * 18,51
0,6198 1 2

0,7917 1
ˆ 3 0,8662 0,6198 66,951
=
* 4,2442
b2 = (−1) 0,6158 9,619
În mod analog, estimatorul $ se calculează din relaţia (2):

b0
ˆ=

b2 37,5034
Notă: Ca urmare a numeroaselor înmulţiri şi rotunjiri au apărut mici
abateri între valorile estimatorilor obţinuţi la punctul b) în comparaţie cu cele
obţinute la punctul f).

S-ar putea să vă placă și