Documente Academic
Documente Profesional
Documente Cultură
Econometrie Abordări
Econometrie Abordări
C U P RI N S
Introducere...................................................................................................................................... 2
1. Analiza regresional. Generaliti ............................................................................................. 3
2. Metoda celor mai mici ptrate................................................................................................... 8
3. Metoda celor mai mici ptrate, exemplu realizat ....................................................................... 9
4. Evaluarea semnificaiei ecuaiei de regresie liniar i a coeficienilor ei ............................... 11
5. Modelul de regresie liniar multifactorial................................................................................ 17
6. Multicoliniaritatea i atenuarea ei ............................................................................................ 22
7. Remedierea multicolinearitii ................................................................................................. 24
8. Corelarea n serie (autocorelarea) ........................................................................................... 28
9. Consecinele corelrii n serie .................................................................................................. 31
10. Eteroschedasticitatea .............................................................................................................. 36
11. Remedierea eteroschedasticiti ............................................................................................. 41
12. Specificaia: alegerea variabilelor independente relevante .................................................... 45
13. Specificaia ecuaiei de regresie: alegerea formei funcionale ............................................... 52
14. Date economice ...................................................................................................................... 59
15. Siseme de ecuaii econometrice ............................................................................................. 63
16. Problema de identificare a modelului sub forma sa redus.................................................... 68
R E F E R I N E ........................................................................................................................ 74
A N E X E .................................................................................................................................... 75
Introducere
Materialul prezentat n continuare a servit ca baz a prelegerilor inute pe parcursul ctorva
ani pentru studenii i masteranzii de diferite specialiti (matematic i informatic, relaii
internaionale, management). Obiectivele propuse se refer la expunerea materialului n aa mod
ca studenii s obin nsuiri practice la utilizarea reuit a instrumentarului de evaluare
cantitativ a proceselor i fenomenelor economice. Accentele au fost puse pe una din abordrile
econometrice, i anume, pe analiza regresionala, ea fiind mai frecvent utilizat n cercetrile
economice i la modelarea activitii economice la diverse nivelt.
O atenie special se pune pe punctarea etapelor ce preced realizarea unei regresii,
ncepnd de la fundamentarea teoretic a evenimentului cercetat, stabilirea variabilei dependente
i a variabilei (variabilelor) relevante independene, alegerea formei funcionale potrivite, i, n
sfirit, colectarea datelor de ncredere, ca apoi sa fie verificate ipotezele care asigur aplicarea
metodei celor mai mici ptrate. n cazul n care una sau mai multe ipoteze sunt violate, s se
determine metoda de estimare a coeficienilor ecuaiei de regresie aprobate.
Atunci, cnd se trag concluzii de rigoare privind metoda de utilizat, se purcede la lansarea
ecuaiei de regresie, folosind Softul specializat, cum ar fi Eviewes, sau, in lipsa acestuia, se
activeaz utilita Data Anayses din Excell, care ofer posibilitatea lansrii modulului
Regression. Dup lansarea ecuaiei de regresie se efectueaz analiza rezultatelor obinute n
vederea semnificaiei att ecuaiei n ntregime, ct i a fierrei variabile independente n parte.
Se confrunt statisticile Fiser si Durbin-Watson, t-statistile calculate cu acelea tabelare
corespunztoare gradului de libertate corespunztor i nivelului de semnificaie selectat. n cazul
n care se confirm ipotezele respective de luare a deciziilor se trece, n caz de necesitate, la
etapa de previziune. Se calculeaz intervalele de ncredere pentru pronosticul punctifer i se
stabilete valoarea prognozat pentru variabila dependent n funcie de valoarea variabilei sau
variabilelor independente examinate.
Se propun procedee de eliminare a fenomenelor de multicoliniaritate, autocorelare n serie i
eteroscedasticitate, care pot fi realizate de sinestttor, fra ca s se apeleze la ajutorul Softu-lui
specializat.
i la finele cursului se examineaz sisteme de ecuaii econometrice care ntr-un mod mai
adecvat descriu procesele i fenomenele economice. Se cerceteaz problema de identificare a
sistemului de ecuaii econometrice simultane. O atenie separat se acord sistemului de ecuaii
simultane cu identiti, care foarte frecvent se ntlnete la modelarea proceselor economice.
Acest curs de lecii este susinut de lucrri practice ce se refer la estimarea ecuaiilor de
regresie pentru funcia de producere i pentru cererea la bunuri i servicii de import. La fel snt
prezentate exemple de soluionat pentru lichidarea fenomenelor de multicolinearitate,
autoregresie, eteroscedasticitate.
Snt prezentate referine bibliografice care au constituit baza acestui curs i au servit ca surs
de date, exemple, materiale ilustrative.
ajuta n luarea acestei decizii. n acest mod econometria poate fi utilizat nu numai pentru
previziune, dar i pentru analiza politicilor.
1.2. Abordri econometrice de alternativ
Pentru obinerea unui tablou mai reuit al abordrii posibile vom puncta etapele necesare
de efectuat pentru orice investigaie cantitativ:
a) specificarea modelului sau relaiei de studiat;
b) colectarea datelor necesare pentru estimarea modelului;
c) estimarea modelului cu ajutorul datelor.
Etapele ) i b) sunt similare n investigaiile cantitative iar tehnicile utilizate la etapa c) estimarea modelului difer de la o disciplin la alt disciplin. Alegerea tehnicilor pentru
evaluarea modelului, n baza unui set de date specifice, de regul, se refer la arta
econometric. Exist diferite abordri alternative pentru evaluarea unei i aceeai ecuaii, i
fiecare abordare poate oferi rezultate ce difer unul de altul.
n continuare ne vom referi la abordarea ce ine de analiza regresional. ns important e ca
fiecare econometrician s contientizeze: regresia este numai una din tehnicile folosite n
estimarea econometric.
1.3. Ce este analiza regresional?
Analiza regresional este utilizat pentru efectuarea estimrilor cantitative a relaiilor
economice care n prealabil aveau loc doar din punct de vedere pur teoretic. Pentru prezicerea
direciei schimbrilor este necesar de cunoscut teoria economic i caracteristicile generale a
produsului n examinare (de exemplu, dependena volumului de vnzri a discurilor floppy n
funcie de pre). Iar pentru prezicerea schimbrilor n cantitate, sunt necesare un set de date i o
metod de estimare a relaiei propuse. n econometrie cea mai frecvent utilizat metod de
estimare a acestor relaii este analiza regresional.
1.4.
(1.3)
4
este cel mai simplu model de regresie de o singur variabil. Prin ecuaia (3) se afirm c
variabila dependent (endogen) Y este o funcie linear de o singur variabil independent
(exogen) X. Modelul este de o singur ecuaie deoarece nu mai sunt alte ecuaii pentru Y ca
funcie de X (sau de alte variabile). Modelul este liniar deoarece sub forma sa grafic reprezint
o linie dreapt, dar nu o curb.
0 , 1
sunt coeficienii (sau parametrii) care determin coordonatele liniei drepte n
orice punct. 0 este constant sau termenul de intersecie, el indic valoarea lui Y pentru X egal
cu zero. 1 este coeficientul de nclinaie, i el indic valora cu care se va schimba Y, cnd X se
schimb cu o unitate. Coeficientul unghiular 1 demonstreaz reacia (rspunsul) lui Y fa de
schimbrile n X. Pentru a explica i a prezice schimbrile n variabila dependent, ce e
obiectivul major n evaluarea relaiilor comportamentale, accentul principal se pune pe
coeficientul de nclinaie cum ar fi 1 . Pe desen, de exemplu, dac X o avut s creasc de la X1
pn la X2, valoare lui Y conform ecuaiei (3) va crete de la Y1 la Y2. n modelele de regresie
liniar rspunsul valorilor pronosticate Y la schimbrile n X este determinat de o constant,
egal cu coeficientul de nclinaie: 1 = (Y2 Y1 ) / ( X 2 X 1 ) =
Y = 0 + 1 X
Y = 0 + 1 X
Y
.
X
X1
X2
Este necesar s se fac distincie dintre ecuaiile liniare n variabile i ecuaiile liniare n
parametri (coeficieni), deoarece regresia liniar trebuie s fie liniar n coeficieni, ns nu
neaprat liniar n variabile. Ecuaia Y = 0 + 1 X este liniar n variabile, grafic reprezentnd o
linie dreapt, n timp ce ecuaia Y = 0 + 1 X 2 nu este liniar n variabile, deoarece reprezint
grafic o curb ptratic dar nu o linie dreapt.
Ecuaia este liniar fa de coeficieni (parametri) numai n cazul dac parametrii apar sub
forma ceea mai simpl ei sunt ridicai la putere (nu mai mare dect unu), nu se nmulesc i nu
se mpart la ali coeficieni i nu fac parte din careva funcii (cum ar fi log sau exp). Ecuaia (3)
este liniar n coeficieni, dar Y = 0 + X nu este liniar n coeficieni 0 , 1 , deoarece nu
exist o transformare a ecuaiei care s-o aduc la forma liniar. n general, din toate ecuaiile
posibile cu o singur variabil explicativ, numai funcia sub form general
f (Y ) = 0 + 1 f ( X ) este liniar n coeficieni 0 , 1 .
Toate cele expuse sunt importante deoarece la aplicarea tehnicii regresiei liniare ecuaia
necesit s fie liniar n coeficieni. Analiza regresional liniar poate fi aplicat la ecuaii care
nu sunt liniare n variabile, dar pot fi prezentate n aa mod ca s fie liniare n coeficieni.
1
omiterii variabilelor explicative (X1, X2, X3,), i chiar dac aceste variabile vor fi introduse n
model, Y continue s fie influenat de schimbri care pur i simplu nu pot fi explicate cu ajutorul
modelului. Probabil aceste schimbri pot parveni din surse, cum ar fi: 1) influene omise, 2)
erori de msurare, 3) form funcional incorect sau 4) pur i simplu din cauza unor
evenimente aleatoare i complectament imprevizibile.
Econometricienii admit existena unei atare variaii eseniale inexplicabile(erori) prin
introducerea explicit a unui termen stocastic (aleator) n modelul de regresie. Termenul erorii
stocastice este un termen, care se include n ecuaia de regresie pentru a reflecta toate
schimbrile n Y ce nu pot fi explicate prin variabila X. Termenul de eroare, de regul, este notat
prin dei i alte simboluri (cum ar fi u sau v) se utilizeaz frecvent. Includerea termenului de
eroare stocastic (sau eroare de specificaie) n ecuaia (3) rezult cu ecuaia de regresie tipic
Y = 0 + 1 X +
(1.4)
Ecuaia (4) este compus din dou componente: componenta determinist i componenta
stocastic. Expesia 0 + 1 X se numete component determinist, deoarece ea indic valoarea
lui Y care este determinat de valorile date a lui X, care se presupun a fi nonstocastice. Aceasta
component determinist poate fi prezentat i ca valoarea ateptat a lui Y n conformitate cu X
dat, valoarea medie a Y-or asociat cu o valoare distinct a lui X. Partea determinist a ecuaiei
poate fi notat prin
E (Y / X ) = 0 + 1 X
(1.5)
Spre regret, n realitate valoarea observat a lui Y e puin probabil s fie egal cu valoarea
determinist ateptat E (Y / X ) . Ca rezultat elementul stocastic necesit a fi inclus n ecuaie
Y = E (Y / X ) + = 0 + 1 X +
(1.6)
Eroarea de specificaie este cauzat cel puin de patru surse, care produc schimbri n
variabila Y diferite de acelea determinate de variabila X.
Multe influene minore sunt omise din ecuaie (de exemplu, din cauza inutilitii datelor).
Este, de fapt, imposibil de a evita erori de msurare cel puin ntr-o variabil din ecuaie.
Ecuaia teoretic specificat trebuie s aib alt form funcional diferit de aceea aleas
pentru regresie. De exemplu, ecuaia specificat trebuie s fie neliniar n variabile pentru
regresia liniar (sau vice-versa).
Toate ncercrile de a generaliza comportamentul uman trebuie s conin careva cantiti
de variaii impevizibile sau pur i simplu aleatoare.
1.7. Extinderea notaiilor
Vom extinde notaiile ca s includem referine la un numr de observaii stabilit i ca s
avem posibilitatea de a introduce mai multe variabile independente. Atunci unica ecuaie de
regresie linear poate fi scris sub form Yi = 0 + 1 X i + i (i=1,2,,n), unde
Yi - observaia i a variabilei dependente;
X i - observaia i a variabilei independente;
i - observaia i a erorii specificate;
0 , 1
- parametrii regresiei;
n - numrul de observaii.
Y1 = 0 + 1 X 1 + 1 ,
Y2 = 0 + 1 X 2 + 2 ,
Y3 = 0 + 1 X 3 + 3 ,
----------------------Yn = 0 + 1 X n + n .
6
cazul
mai
multor
variabile
independente
ecuaia
de
regresie
ea
forma
Yi = 0 + m X mi + i , (i=1,2,,n),
m =1
Ys . O alt cale de a exprima ecuaia de regresie estimat const n combinarea ecuaiilor (2) i
)
)
(3) i obinerea expresiei Yi = 0 + 1 X i + u i .
u
min
0, 1
i =1
2
i
= min ( y i 0 1 xi ) .
0 , 1
i =1
u i2 / 0 = 2 ( y i 0 1 xi ) = 0.
i =1
u / 1 = 2 1 xi2 xi y i + 0 xi = 0.
2
i
i =1
y
i =1
n
(2.1)
i =1
) n
) n 2
x
y
=
x
+
i i 0 i 1 xi .
i =1
i =1
(2.2)
i =1
(2.3)
x y = x (Y X ) + x
i =1
i =1
i =1
2
i
n
n
xi y i xi Y
n
n
) n 2 n
) i =1
i =1
i =1
i =1
xi2 xi X
i =1
i =1
numrtorul la n:
XY XY
1 =
X X
2
Cov( X , Y )
, 0 = Y X
2
X
Cov ( X , Y )
X2
(2.4)
2 u i2
i =1
2 u i2 2 u i2
2
i
i =1
f 0, i = 0,1 ;
i =1
0 1
2
0
u
i =1
2
i
1 0
i =1
1 0
u
i =1
2 u i2
= xi
i =1
i =1
2
0
f0
(2.5)
2
i
12
2 u i2
=n
2 u i2
i =1
12
= xi2
i =1
0 = Y 1 X ; 1 =
Cov( X , Y )
) YX Y X
; Cov( X , Y ) = YX XY ; X2 = X 2 X 2 ; 1 = 2
.
X X2
X2
Parametrul 1 se numete coeficient de regresie. Valoarea lui denot valoarea medie cu care
se schimb variabila de explicat atunci cnd variabila explicativ se schimb cu o unitate.
Parametru 0 denot valoarea lui Y cnd X = 0 . Atunci cnd valoarea explicativ nu poate
primi valoarea 0 explicaia precedent este lipsit de sens. Parametru 0 poate s nu aib nici un
sens economic. ncercarea de interpretare economic a parametrului 0 , mai ales atunci cnd el
e mai mic dect 0, 1 <0 poate aduce la situaie absurd.
Este posibil s interpretm numai semnul pe lng parametrul 0 . Dac 0 > 0 , atunci
schimbarea relativ a variabilei de explicat se petrece cu ritmuri mai reduse dect schimbarea
relativ a factorului. Cu alte cuvinte variaia rezultatului este mai mic dect variaia factorului
9
coeficientul de variaie dup factorul X este mai mare dect coeficientul de variaie pentru
variabila de explicat Y : V X f VY . Vom demonstra acest fapt (fenomen) pornind de la comparaia
schimbrilor relative a variabilelor de explicat Y i explicative - X :
1 dX 0 + 1 X
dY dX
dY
Y
p
p ;
p
; 1 X p 0 + 1 X 0 p 0 .
Y
dX
dX
Vom examina un fenomen. Un grup de ntreprinderi care produc acelai produs sunt supuse
analizei din punct de vedere a cheltuielilor de producere conform funciei Y = 0 + 1 X + .
Informaia necesar pentru evaluarea parametrilor 0 , 1 vom prezenta-o sub forma de tabel.
Rezultatele obinute n baza efecturii cercetrilor confirm c numrul observaiilor n
necesit a fi de 6-7 ori mai mare dect numrul parametrilor pe lng variabilele independente
(explicative) X .
Volum de
Chelt.
ntrepr. prod.
(mii de
prod.
unit.) (X)
(mln. lei)
(Y)
1
1
30
2
2
70
3
4
150
4
3
100
5
5
170
6
3
100
7
4
150
22,00
770,00
Y*X
X2
30
140
600
300
850
300
600
2820,00
)
YX
Y2
1
4
16
9
25
9
16
80,00
900
4900
22500
10000
28900
10000
22500
99700,00
31,6
67,9
141,6
104,7
178,4
104,7
141,6
770,50
n
+
X
=
Yi
0
1
i
i =1
i =1
,
7
7
7
2
X i + 1 X i = X i Yi
0
i =1
i =1
i =1
0 = Y 1 X ;
1 =
YX Y X
X2 X2
7 0 + 22 1 = 770
22 0 + 80 1 = 2820
Valorile estimate ale variabilei de explicat sunt prezentate n ultima coloan. Parametrul
0 este lipsit de careva sens economic.
Relaia 0 >0 corespunde faptului c variabila dependent se schimb cu ritmuri mai mari
dect variabila independent VY f V X . 0 <0 reflect faptul c variabila independent se schimb
cu ritmuri mai mari dect schimbarea variabilei dependente V X f VY .
Dac vom exprima variabilele X i Y prin devieri de la nivelul mediu, atunci linia regreresiei
)
pe grafic va trece prin origine Y = Y Y ; X = X X ; Y = 1 X . Estimarea coeficientului de
regresie nu se va schimba..
Estimarea coeficienilor ecuaiei de regresie poate fi obinut ntr-un mod mai simplu, fara a
ne adresa la M.C.M.M.P. Estimaia de alternativ a coeficientului 1 poate fi obinut pornind
10
170 30
= 35 . Aceast mrime este aproximativ ntruct nu se ine cont de
5 1
ceea mai mare parte din informaia statistic accesibil. Ea se bazeaz numai pe valorile
variabilelor de mrime maxim sau minim.
De regul, ecuaia de regresie este urmat de coeficientul de corelaie liniar ce
caracterizeaz ct de puternic este dependena liniar ntre X i Y - rXY . Exist mai multe
modificri ale formulei pentru coeficientul de corelaie liniar. Una dintre ele se prezint aici.
cov( X , Y )
cov( X , Y )
rXY = 1 X =
, 1 =
; e cunoscut faptul, c coeficientul liniar de corelaie se
Y
X Y
X2
modific n diapazonul 1 p rXY p 1
Dac coeficientul 1 < 0, 1 rXY 0 i invers, dac 1 > 0 , 0 rXY 1
Pentru datele tabelului, valoarea lui este de rXY = 0,991 , deci e foarte aproape de 1, ceea ce
nseamn c ntre X i Y exista o legtura liniar puternic, cheltuielile pentru producere sunt
puternic dependente de volumul de producie.
Este necesar s se in cont de faptul c coeficientul liniar de corelaie evalueaz msura
legturii puternice ntre indicii examinai sub forma liniar. Apropierea valorii coeficientului de
regresie ctre 0 nu nseamn inexistena legturii ntre indici. Dac modelul va fi specificat n alt
mod, legtura dintre indici poate s se adevereasc destul de strns.
Pentru evaluarea calitii funciei liniare alese se calculeaz ptratul coeficientului linear de
2
corelaie RYX
care se numete coeficient de determinaie - coeficientul de determinaie
caracterizeaz cota dispersiei variabilei de explicat Y care este lmurit de regresie n dispersia
total a variabilei de explicat:
)
2)
2
2
RYX
= Y 2 . Respectiv, mrimea 1 RYX
caracterizeaz cota dispersie Y , explicat de restul
Y
factorilor, care nu se examineaz n model.
2
= 0,982 . Prin urmare ecuaia de regresie explic 98,2% din
n exemplul examinat RYX
dispersia indiciului rezultativ, dar pe seam altor factori revine numai 1,8% din dispersia total.
Mrimea coeficientului de determinaie servete ca unul din criteriile care evalueaz calitatea
modelului liniar. Cu ct este mai mare cota variaiei explicat de regresie, cu att, respectiv, este
mai mic influena altor factori i deci modelul liniar bine aproximeaz datele iniiale i poate fi
utilizat pentru pronosticarea valorilor variabilei rezultative (de explicat).
4. Evaluarea semnificaiei ecuaiei de regresie liniar i a coeficienilor ei
Dup ce a fost estimat ecuaia linear de regresie se efectueaz evaluarea semnificaiei atta
ecuaiei n ntregime, ct i a fiecrui parametrii separat.
Evaluarea semnificaiei ecuaiei de regresie n ntregime se produce cu ajutorul F-criteriului
Fier, formulnd n prealabil ipoteza dependenei direct proporionale H 0 : { 0 = 0 } i ipoteza
0
independenei variabilelor, H 0 : { 1 = 0 } contra H 1 : 0
- ipoteza dependenei lineare
1 0
specificate.
n scopul testrii validitii modelului se analizeaz descompunerea sumei ptratelor
devierilor a variabilei Y de la medie n dou componente: prima, explicat de regresie i a doua
neexplicat de regresie:
11
(Y
n
i =1
(Y
n
i =1
n
Y ) =
n
i =1
Y ) =
n
i =1
)
Yi Y
) + (
2
i =1
)
(Yi Y ) + u i
)
Yi Yi
) = (
2
i =1
)
Yi Y
) + u + (Y) Y )u
2
i =1
i =1
n
n
)
)
)
) )
u i = 0 Yi = Yi Y = Y = 2 Yi Y u i = 2 Yi Yi u i = 0 .
i =1
i =1
i =1
i =1
i =1
)
Y =Y
n
Suma ptratelor devierilor observaiilor variabilei dependente (de explicat) de la valoarea lor
medie Y este cauzat de mai multe evenimente: de variabila explicativ i de ali factori. Dac
variabila
explicativ nu influeneaz rezultatul, atunci linia regresiei este paralel axei OX i
)
Y = Y , iar toat dispersia variabilei de explicat este cauzat de ali factori. n cazul cnd ali
factori nu influeneaz variabila de explicat, atunci Y este legat funcional de X i suma
ptratelor rezidualelor este egal cu 0. Prin urmare, suma ptratelor devierilor explicate de
regresie, coincide cu suma total. ntruct nu toate punctele cmpului de corelare se afl pe linia
de regresie, de fiecare dat are loc dispersarea lor cauzat att de variabila explicativ X (de
regresie), ct i de ali factori (neexplicabili de regresie). Linia de regresie este bun pentru
previziune, evident atunci, cnd suma ptratelor devierilor cauzat de regresia va fi cu mult mai
mare dect suma ptratelor rezidualelor, atunci ecuaia de regresie este semnificativ i variabila
explicativ X influeneaz esenial variabila de explicat Y . n aceast caz coeficientul de
2
determinaie RYX
se va apropia de 1.
Orice sum a ptratelor devierilor este legat de gradele de libertate a indiciului independent
de variaie. Gradele de libertate sunt dependente de numrul de observaii n i de numrul
parametrilor definii n conformitate cu ele. Referitor la problema n cauz gradele de libertate
trebuie
s
demonstreze,
cte
devieri
independente
din
n
posibile [(Y1 Y ), (Y2 Y ),..., (Yn1 Y )] , sunt necesare pentru formarea sumei ptratelor. Astfel,
pentru suma ptratelor
(Y
i =1
Y )2
(Y
i =1
devieri, dar devierea a cincea poate fi determinat, dat fiind cunoscute 4 precedente.
)
(Y
i =1
Y ) 2 se folosesc
)
)
)
)
valorile variabilei dependente Yi calculate n conformitate cu ecuaia de regresie Yi = 0 + 1 X i .
2
)2 n
)
2
La utilizarea regresiei liniare este adevrat egalitatea (Yi Y ) = 1 (X i X )
i =1
care
i =1
poate
cov( X , Y )
2
rXY = 1 X =
rXY
= 12 X2 , de aici rezult c (Yi Y ) 2 = 12 (X i X ) .
Y
XY
Y
i =1
i =1
Fiind dat numrul observaiilor pentru X i Y suma ptratelor devierilor variabilei
independente de la medie depinde numai de o singura constant coeficientul de regresie 1 i
deci suma examinat are numai un grad de libertate. La aceiai concluzie vom ajunge dac vom
)
)
)
examina ecuaia Yi = 0 + 1 X i . Parametrul 0 = Y 1 X , substituind aceast valoare n ecuaia
)
observaii pentru X i Y , valoarea estimat a lui Y n ecuaia liniar de regresie este funcie de
un singur parametru coeficientul de regresie. Respectiv i suma ptratelor devierilor variabilei
independente (factor) are numai un singur grad de libertate.
Numrul gradelor de libertate a sumei ptratelor devierilor totale este egal cu numrul
gradelor de libertate pentru sum ptratelor devierilor explicate de regresie i numrul gradelor
de libertate ale sumei ptratelor devierilor rezidualilor. Numrul gradelor de libertate al sumei
ptratelor rezidualelor n regresia liniar este egal cu (n 2) . Numrul gradelor de libertate
pentru suma total a ptratelor devierilor este determinat de numrul observaiilor n, i,
deoarece, se utilizeaz valoarea medie calculat n baza observaiilor, pierdem un grad de
libertate, deci avem (n 1) grade de libertate.
Aadar, avem dou egaliti:
n
n
)
2
2
(
Y
Y
)
=
(
Y
Y
)
+
i
i
(Yi Yi )2
n
i =1
(n 1) =
i =1
i =1
1
+ (n 2) .
mprind fiecare sum a ptratelor la gradele de libertate ce-i corespund, vom obine
ptratul devierilor medii, sau dispersia la un grad de libertate.
Y2) = (Yi Y )/ 1 ; u2 = Yi Yi / (n 2 );
n
i =1
i =1
Y2 = (Yi Y ) / (n 1)
n
i =1
(Y
i =1
Y ) 2 = Yi 2 nY 2 = 15000 ;
Y2) =
i =1
2
)2 n
)
2
(Yi Y ) = 1 (X i X ) = 14735 ;
n
i =1
n
u2 =
i =1
)
(Yi Yi ) 2 = 265 ;
F=1435/53=278;
F =0, 01 = 16.26 ;
15000
;
6
265
= 53 ;
5
F = 0, 005 = 6.61 ,
i =1
)
v
(Yi Yi ) 2 = 1 R 2 Y2 / (n 2) , atunci
n
i =1
F=
R (n 2)
.
(1 R/ 2 )
i =1
13
formula:
(Y
n
))
i =1
)
Yi
(X
n
i =1
) /(n 2)
2
X)
S2
(X
n
i =1
X)
(t ) ) 2 = ( ) 1 ) 2 = 1
)
1
(Y
)
2
Yi Y
) 2
Yi Yi / (n 2)
)2
) 2
Yi / (n 2)
)
Y2)
= )2 = F .
i
(X
X)
12 (X i X )
)
(
) / (n 2)
Y
14
)
(Y Y )
X i2
(n 2)
n (X i X )
/) =
0
i =1
i =1
i =1
S 2 X i2
i =1
n ( X i X )
n
i =1
de determinaie R =
R
1 R2
n 2 . Aceasta
1+ R
pentru evalua
1 R
pentru valoarea Y * , Yx Y) Y * Yx + Y) .
p
ntru construirea formulei pentru eroarea standard Y) vom apela la ecuaia de regresie
X
)
)
)
)
)
)
Yx p = 0 + 1 X p . Substituind 0 cu formula pentru calcularea lui 0 = Y 1 X , vom obine
)
)
)
)
Y X = Y 1 X + 1 X = Y + (X X ) . De aici rezult c eroarea standard pentru Y Y)X depinde de
)
2
)
)
)
eroarea Y i eroarea coeficientului de regresie 1 , deci Y2)X = Y2 + 2)1 (X X ) .
)2
2
n
(X
n
i =1
X)
. Considerm c valoarea
15
Y2) =
Xk
S (X k X )
S
+ n
2
n
(X i X )
2
i =1
))
Respectiv, Y
Xk
2
(
Xk X )
2 1
=S
+ n
.
n
2
(X i X )
i =1
(X X )
(X X )
2
1
=S
+
n
i =1
valoarea medie prognozat a lui Y X , fiind dat valoarea X k , caracterizeaz eroarea amplasrii
)
liniei de regresie. Valoarea erorii standard Y) atinge minimul atunci cnd X k = X i crete cu
Xk
diferena dintre X k i X , cu att este mai mare eroarea Y) . n baza ei fiind evaluat
Xk
)
previziunea valorii medii Y , pentru valoarea X k dat. Pot fi ateptate previziuni mai reuite
dac punctul X k se afl n centrul regiunii de observare i nu este cazul s ateptm rezultate de
previziune bune la ndeprtarea a punctului X k de la punctul X . n caz c valoarea X k se afl
n afar valorilor observate a lui X , folosite la determinarea liniei de regresie, rezultatele
previziunii se nrutesc pe msura deplasrii X k de la regiunea valorilor observate pentru
variabila explicativ X .
Y
)
)
Y X k + t )1 Y)X
)
) )
Y = 0 + 1 X
X
k
)
)
Y X k t )1 Y)X
Xk
Xk
hiperbole situate pe ambele pri de la linia de regresie. Dou hiperbole pe ambele pri de la
)
linia de regresie determin intervalele de ncredere de 95% pentru valoarea medie a lui Y
pentru X dat.
)
ns valorile observate a lui Y variaz n jurul valorii medii a lui Y . Valorile individuale a
)
lui Y pot fi dispersate de la Y n limita valorii erorii aleatoare u , dispersia ei fiind evaluat ca
dispersia rezidual pentru un grad de libertate u2 . Deaceea eroarea valorii individuale
16
prognozate pentru Y necesit includerea nu numai a erorii standard Y) , dar i a erorii aleatoare
))
u u . Eroarea medie Y
))
Xk
1
= S 1+ +
n
Xk
)
a valorii individuale Y prognozat este:
(X X )
(X X )
Xk
i =1
Efectund previziunea n baza ecuaiei de regresie este necesar s inem cont de faptul c
valoarea prognozat depinde nu numai de eroarea standard a valorii individuale Y , dar i de
precizia previziunii valorii variabilei exogene X . Valoarea ei poate fi definit n baza aplicrii
altor modele, reieind din situaia concret i analiznd dinamica acestui factor. Formula
)
considerat pentru eroarea medie ( Y) ) a valorii individuale Y poate fi folosit pentru evaluarea
Xk
semnificaiei devierii valorii prognozate prin ecuaia de regresie i valorii ipotetice naintate n
baza evoluiei evenimentelor.
tY) ( X k )
)
(
Y(
=
Yhipot
;
))
Xk )
Y(
Xk
s = 1, k . Cum a mai fost menionat termenul 0 se va include n ecuaia de regresie, dar n baza
)
)
)
)
)
Y2 = 0 + 1 X 21 + 2 X 22 + ... + k X 2 k
.
)
)
)
)
)
Yk = 0 + 1 X k1 + 2 X k 2 + ... + k X kk
.
)
)
)
)
)
Yn = 0 + 1 X n1 + 2 X n 2 + ... + k X nk ,
Atunci modelul liniar de regresie multipl poate fi nscris sub forma vectorial Y = X + , Y vectorul coloan al variabilei endogene de dimensiunea (n ) , X - matricea de dimensiunea (n (k + 1)) , - vectorul de dimensiunea (k + 1) , - vectorul de dimensiunea (n ) .
)
y1
o
1
y1
u1
1 x11 L x1k
)
y
u
)
y2
2
1
2
Y=
, X = 1 x 21 L x 2 k , =
, =
, i = 1, n; j = 0, k , Y =
, u = u 2
M
yn
M
k
Y
Y
Y
1 =
; 2 =
Lk =
;
X 1
X 2
X k
1 x n1 L x nk
M
n
)
)
)
Y = X , u = Y Y .
M
)
yn
M
u n
De exemplu, funcia de consum n cele mai multe cazuri este examinat ca un model de
forma: C = f (Y , P, M , Z ) ; unde C - consumul; Y - venitul; P - indicile costului de via; M banii n numerar; Z - active lichide,
C
p 1 . Regresia multipl este utilizat pe larg la
Y
18
(u u ) = min (Y X ) (Y X ) = S ( ) ,
u = min
min
)T
i =1
2
i
( ) = (Y Y ) 2 (X Y ) + ) (X) X )) .
Pentru minimizarea funcionalului S ( ) , n conformitate cu condiiile necesare de existen a
i
'
extremumului, efectum derivarea lui n raport cu s , s = 0,1,..., k i apoi egalm cu zero expresia
obinut:
)
)
)
)
1
S ( )
) = 0; 2(X T Y ) + 2(X T X ) = 0 (X T X ) = (X T Y ) = (X T X ) (X T Y ).
Notaii convenionale
Valorile adevrate, dar neobservate
Estimate
Denumirea
Simbolul
Denumirea
Simbolul
)
coef.de regresie estimat k
coef.de regresie
k
)
Valoarea ateptat a E ( k )
coef. estimat
Variaia termenului 2 sau VAR( i )
Variaia estimat a S 2 sau ) 2
de eroare
termenului de eroare
)
Devierea standard a
Devierea standard a S sau
termenului de eroare
termenului de eroare
estimat
)
)
)
Variaia coeficienilor 2 ( k ) sau VAR( k ) Variaia estimat a S 2 ( k ) sau
estimai
coeficienilor estimai
) )
2 ( k )
Devierea standard de ) sau ( k )
la coef.estimai
Termenul
erorii i
stocastice
)
(u u )
T
n k 1
19
)
( yi Y )
n
R2 =
i =1
(y
i =1
Y )
= 1
)
( yi y i )
i =1
(y
i =1
u2
) 2
rYX X L X = 1 2 , unde u2 = ( y i yi )
Y
dispersia total.
1
5.4.
Y )
este
Y
i =1
n
)
) n
) n
) n
= n 0 + 1 X 1i + 2 X 2i + L + k X ki
i =1
i =1
i =1
) n
X
Y
=
X
+
X
X
+
X
X
+
+
L
1i i 0 1i 1 1i 1i 2 1i 2i
k X 1i X ki
i =1
i =1
i =1
i =1
i =1
) n
) n
) n
) n
X
Y
=
X
+
X
X
+
X
X
+
L
+
2i i 0 2i 1 2i 1i 2 2i 2i
k X 2 i X ki
n
i =1
i =1
i =1
i =1
i =1
L L L L L L L L L L L L L L L L
n
) n
) n
) n
) n
X kiYi = 0 X ki + 1 Xk 2i X 1i + 2 X ki X 2i + L + k X ki X ki
i =1
i =1
X 1i
i =1
X 1i
i =1
i =1
i =1
i =1
X 1i X 1i
i =1
X X
i =1
i =1
i =1
X 2i L X ki
2i
i =1
i =1
i =1
X 1i X 2i L X 1i X ki
n
2i
X 1i
X
i =1
2i
X 2i L X 2i X ki
i =1
L L L L L L L L L L L
n
X ki
i =1
X ki X 1i
i =1
i =1
i =1
X ki X 2i L X ki X ki
20
Y X X
i =1
i =1
X 1i X 1i
i =1
i =1
i =1
Yi X 2i
X 2i X 1i
i =1
i =1
i =1
X 1i X 2i L X 1i X ki
i =1
L X ki
2i
Yi X 1i
)
0
1i
X 2i X 2i L X 2i X ki
i =1
i =1
s = s / , s = 0, k .
i =1
L L L L L L L L L L L
n
Y X X
i =1
ki
ki
i =1
X 1i
i =1
ki
X 2i L X ki X ki
i =1
Judecnd n mod analogic, precum i n cazul modelului liniar de regresie simpl, obinem c
variaia total este egal cu variaia explicat plus variaia reziduurilor:
(Y
n
i =1
2
n
)
Y ) = Yi Yi
i =1
) + (Y) Y )
2
i =1
de Variaia
abaterilor
sumei
2
n
Explicate de
)
VE = ( y i Y ) = Y2)
regresie
Reziduale
n 1
VT = ( y i Y ) = Y2
R =
i =1
n
Y )2
Y )
(Y
i =1
1 R =
(y
i =1
n
(y
i =1
i =1
Y =
n
)
Y ) 2 yi yi ) 2
i =1
(Y
i =1
(y
Y )2
Y )
R = 1
2
= 1
)
yi ) 2
(Y
Y )2
i =1
n
i =1
)
yi ) 2
,
(y
(y
i =1
)
y i ) 2 /( n k 1)
(y
i =1
Y ) 2 /(n 1)
i =1
k
)
Yi Yi
i =1
(y
(Y
Y2) =
i =1
n
i =1
n
)2
n k 1
)
VR = ( y i y i ) = u2
Total
Y2) =
i =1
n
(Y
i =1
Y )
(n k 1)
(n 1)
u2
= 1 2 ;
Y
2
= 1 ) u2
Y
; r = 1 u2 / Y2 .
21
(Y
i =1
Fcalc =
Y )2
(k )
)
(Yi Yi ) 2
n
i =1
(Y
i =1
Y ) 2 (n k 1)
)
(Yi Yi ) 2 k
n
i =1
(n k 1)
R2 / k
=
.
1 R 2 / (n k 1)
6. Multicoliniaritatea i atenuarea ei
Spre deosebire de modelul unifactorial, n cazul modelului multifactorial, ipoteza I1 presupune
independena variabilelor explicative. Ne respectarea ei produce fenomenul de
multicoliniaritate, caz n care o variabil endogen este explicat de mai multe variabile
explicative.
Frecvena relativ ridicat a coliniaritii dintre variabilele explicative se datoreaz
gradului sporit de interdependen din economie.
Existena multicoliniaritii este semnalat de:
a) analogiile n evoluia variabilelor explicative;
b) apropierea de zero a determinantului X T X ;
c) mrimea coeficientului de determinaie multipl (R 2 ) , care aproape coincide cu
mrimea lui n cazul n care una dintre variabilele cauzale este omis;
d) contrazicere n verificarea testelor i anume: testul F aplicat valorilor teoretice este
semnificativ, iar testul t aplicat parametrilor de regresie semnaleaz nesemnificaii n
rndul parametrilor.
/Xj
la prima etap, reinnd k variabile exogene liniar independente fiind posibil estimarea celor
( k + 1 ) parametri se poate trece la etapa n care se continu operaia de selecie a variabililor
exogene X i . n acest sens exist mai multe procedee.
22
M
)
)
)
) )
)
M ( j ) : Yi = 0 + 1 X i ,1 + L + j X i , j + ui j = Yi j + ui j
M
)
)
)
)
) )
)
M (k ) : = 0 + 1 X i ,1 + L + j X i , j + L + k X i , k + uik = Yi k + uik
Este cunoscut c, variaia total a variabilei Y este egal cu suma variaiei, explicat de regresie,
a modelului M ( j ) i variaia rezidual Y2 = Y2) + u)2 .
j
u)2
acestor relaii se pot formula criterii de selecie a modelului optim. M (r ) din grupul de modele
n
M ( j ) , i anume = max
2
r
i =1
)
Yi j Y
n
)j 2
2
2
sau R = max R , sau r = min Yi Yi , gradul
j
j
i =1
2
r
)
)
)
)
)
M k : Yi = 0 + 1 X i ,1 + L + r X i , r + L + k X i ,k + u ik . Apoi se testeaz semnificaia estimatorilor
)
j cu ajutorul testului t cu pragul de semnificaie i (n (k + 1)) grade de libertate. Dac
)
j
)
)
t ,(n (k +1)) , atunci j este semnificativ diferit de zero , n caz contrar j este
( )
)
( )
( )
2
Xi / X j
rX 1 / X 3
L rX 1 / X k
1 rX 2 / X 3
L rX 2 / X k
1 rX 1 / X 2
D=
rX 2 / X 1
L L L L L L L
rX k / X 1 rX k / X 2 L rX r/ X k 1 1
Dac valoarea determinantului tinde spre zero, riscul multicolinearitii e mare. De exemplu,
pentru un model de 2 variabile explicative, dac ambele serii sunt perfect corelate, atunci
determinantul
D=
determinantul D =
1 rX 1 / X 2
rX 2 / X1
1 rX 1 / X 2
rX 2 / X1
1 1
1 1
1 0
0 1
= 0,
= 1.
(0.0942)
0.496
0.453
R 2 = 0.835
consumul; Yd - venitul disponibil; LA - active lichide.
)
C i = 471.43 + 0.9714 * Ydi
t
(0.157)
=
6.187
)
C i = 199.44 + 0.08876 * LAi
R 2 = 0.861
(0.01443)
t
6.153
R 2 = 0.860
au deseori dou sau mai multe variabile n ecuaie care msoar n esen aceleai obiecte. n
acest caz, variabilele multicolineare nu sunt irelevante, deoarece fiecare dintre ele este mult
posibil rezonabil att teoretic ct i statistic. n schimb, variabilele pot fi numite inutile; numai
una din ele necesit s reprezinte influena asupra variabilei dependente care o demonstreaz
fiecare dintre ele. De exemplu, pentru funcia cererii agregate, nu va avea sens s se introduc
venitul disponibil i PIB deoarece ambii indicatori msoar acelai subiect: venitul. Puin mai
subtil este concluzia c populaia i venitul disponibil nu vor fi ambele incluse n atare funcie
agregat a cererii deoarece, din nou, ntradevr msoar acelai subiect: volumul pieei agregate.
Cu creterea populaiei va crete i venitul. Aruncarea variabilelor multicolineare inutile de
acest gen nu va face nimic dect se ridice gradul erorii de specificaie.
7.3. Transformarea variabilelor multicolineare
Deseori n ecuaiile care se confrunt cu consecine destul de serioase a multicolinearitii,
ca s autorizere consideraia aciunilor de remediere, toate variabilele sunt extrem de importante
din punct de vedere teoretic. n aa cazuri nici inaciunea, nici mai ales aruncarea variabilei nu
sunt de folos. Oricum, uneori pentru a scpa cel puin de unele multicolineariti este posibil
transformarea variabilelor din ecuaie. Dou din cele mai frecvente transformri sunt:
formarea unei combinaii lineare din variabilele multicolineare,
transformarea ecuaiei n diferene finite (sau logaritmi).
Tehnica formrii combinaiei liniare a dou sau mai multe variabile multicolineare const n:
) crearea unei variabile noi care este o funcie de variabile multicolineare;
b) folosirea variabilei obinute pentru a nlocui variabilele vechi n ecuaia de regresie.
De exemplu, dac variabilele X 1 i X 2 sunt puternic multicolineare, o nou variabila
X 3 = X 1 + X 2 (sau n caz general, orice conbinaie linear de felul X 3 = k1 X 1 + k 2 X 2 poate fi
substituit n modelul reestimat n locul ambelor variabile multicolineare. Aceast tehnic este
util atunci cnd ecuaia urmeaz a fi aplicat pentru date n afara celor observate, deoarece
atunci multicolinearitatea poate s nu existe sau poate s urmeze acelai ablon ca i nuntru
eantionului de date observate. Deseori, n ecuaiile pentru care consecinele multicolinearitii
sunt destul de severe, nct s justifice aplicarea aciunilor de remediere, toate variabilele sunt
extrem de importante din punct de vedere a motivaiei teoretice. Pentru aceste cazuri nici
inaciunea, nici eliminarea variabilelor nu sunt de folos. Oricum, uneori este posibil
transformarea variabilelor din ecuaie ntru reducerea multicolinearitii. Dezavantajul major al
acestei tehnici const n faptul c ambele variabile au acelai coeficient n ecuaia reestimat. De
exemplu, dac
)
)
)
)
X 3i = X 1i + X 2i Yi = 0 + 3 X 3i = 0 + 3 ( X 1i + X 2i ) + u i .
Necesit atenie includerea n combinaia linear a variabilelor care se ateapt s aib
coeficieni diferii (cum ar fi diferite semne) sau o diferen extrem de mare a valorilor (cum ar
fi mrimi de diferit ordin) fr a ajusta aceste devieri prin folosirea constantelor potrivite (k 3 ) n
ecuaia sub forma general ( X 3 = k1 X 1 + k 2 X 2 ). De exemplu, dac dou variabile multicolineare
sunt PIB i rata inflaiei, atunci o simpl sum poate inunda complet variaia inflaiei (depinde
de unitile de msur a variabilelor).
X 3i = GNPi + INFi = 3.250 * GNPi + 0.08 * INFi .
S vedem cum se va schimba X 3 atunci cnd IBP se dubleaz, tot cu atta se dubleaz i X 3 ,
dar dac INF se dubleaz, X 3 aproape deloc nu se schimb. n majoritatea combinaiilor liniare,
necesit a fi ntreprins un calcul grijuliu asupra valorilor medii coeficienilor ateptai a
variabilelor ce fac parte din combinaia liniar. Cu alte cuvinte, variabilele pot s se anuleze una
pe alta sau s se innundeze una pe alta dup mrime.
26
Pentru un exemplu de acest gen s formm o combinaie liniar dintre venitul disponibil i
activele lichide n funcia de consum i deci s relansm regresia cu combinaia liniar a
variabilelor explicative. Pentru a balansa ambele variabile, venitul disponibil poate fi nmulim
cu 10, obinnd: X 3i = 10(Ydi ) + LAi
Constantele n combinaiile liniare de acest fel se capt arbitrar, dar ele pot aciona relativ bine.
Cnd X 3 este folosit la nlocuirea ambelor variabile explicative i se estimeaz ecuaia de
regresie, obinem:
)
C i = 355.43 + 0.0467 * X 3i
(0.0073)
t = 6.362
R2 = 0.868
Oricum, pentru majoritatea aplicaiilor din economie i busines aceasta soluie nu este
posibil. Dup ce setul de date este completat cu date disponibile care par a fi comparabile, date
noi n general sunt greu de gsit sau ele sunt foarte scumpe.
Una din cile de majorare a eantionului de date const n comasarea irurilor temporare i
obinerea de date ncruciate. O astfel de combinaie a surselor de date, de regul, const n
completarea cu date ncruciate (de obicei lipsite de multicolinearitate) a seriilor temporare de
date multicolineare, astfel deminund multicolinearitatea n setul comun de date. Problema
major a acestei reuniuni const n interpretarea i folosirea estimrilor generale. Pn cnd sunt
motive de ncredere c modelul teoretic considerat este acelai n ambele abordri, parametrii
estimai obinui vor fi un fel de funcii asociate ai modelului adevrat n serii temporare i a
modelului adevrat ncruciat. n genere, aa combinaie a diferitor tipuri de date nu este
recomandabil ca modalitate n reducerea multicolinearitii. n majoritatea cazurilor
dificultile unei interpretri necunoscute sunt mai grave dect consecinele cunoscute ale
multicolinearitii.
7.5. Alegerea unui remediu corect
Nu exist o soluie unic n problema cum se va face alegerea remediului contra
multicolinearitii; o ajustare contra multicolinearitii care poate fi de folos pentru o ecuaie,
este nepotrivit pentru o alt ecuaie.
8. Corelarea n serie (autocorelarea)
Corelarea n serie numit tot odat i autocorelare, poate s existe n orice cercetri de
investigare n care ordinul observaiilor are careva semnificaie. De aceea cel mai frecvent
autocorelarea apare n setul de date cu serii temporare. n esen din corelarea n serie rezult
c termenul erorii stocastice dintr-o perioad depinde n mod simetric de termenul de eroare
stocastice din alt perioad. i deoarece seriile temporare de date se folosesc n multe aplicaii
econometrice, este important de a nelege corelarea n serie i consecinele ei pentru estimatorii
M.C.M.M.P.
Se va ntreprinde o ncercare de a rspunde la ntrebrile:
Care este esena problemei?
Care sunt consecinele problemei?
Ct de periculoas este problema?
Ce remedii exista pentru c problema s fie soluionat?
8.1. Corelarea n serie perfect i imperfect
Corelarea observaiilor termenului de eroare ntre ele pe parcursul timpului se numete
corelare n serie. n acest compartiment se va discuta descrierea caracterului (naturei) a corelrii
n serie i deosebirea dintre dou forme a fenomenului, corelare n serie perfect i
imperfect.
8.1.1. Corelarea n serie perfect
Corelarea n serie perfect apare atunci cnd sunt sfidate ipotezele clasice referitor la faptul
c observaiile termenului de eroare nu sunt corelate ntr-o ecuaie specificat corect. Vom
aminti c ipoteza clasic afirm c: E ( i , j ) = 0, (i j ) . Dac valoarea ateptat a produsului
oarecror dou observaii arbitrare ai termenului de eroare nu este egal cu 0, atunci se va
spune c termenul de eroare este corelat n serie. Atunci cnd econometricienii folosesc
termenul corelarea n serie fr nici o modificare, ei se refer la corelarea n serie perfect.
Cel mai frecvent ntlnit tip de corelare n serie se refer la corelarea n serie de ordinul nti,
n care observaia curent a termenului de eroare este o funcie de observaia precedent a
termenului de eroare:
28
t = t 1 + u t ,
(8.1)
unde t este termenul de eroare din ecuaia examinat, - este parametru ce descrie relaia
funcional ntre observaiile termenului de eroare; u t - este termenul de eroare clasic (necorelat
n serie). Forma funcional (8.1.1.1) este aa numita schem Marcovian de ordinul nti i
este coeficientul de autocorelare de ordinul nti. Un astfel mod de corelare n serie se
caracterizeaz prin faptul c una din valorile observaiilor a termenului de eroare afecteaz
direct urmtoarea valoare observat a termenului de eroare. Mrimea coeficientului indic ct
de strns este corelarea n serie n ecuaie. Dac este egal cu zero, atunci nu exist corelare
n serie (deoarece t este egal cu u t termenul de eroare clasic). Dac dup valoarea absolut
nu este mai mare dect unul, valoarea precedent a termenului de eroare devine mai important
n determinarea valorii curente a termenului de eroare i un nivel nalt de corelare n serie exist.
mai mare dect unul dup valoarea absolut nu este rezonabil deoarece implic tendina
creterii continue n timp pentru termenul de eroare dup valoarea absolut. Prin urmare, se va
stabili 1 p p 1 . Semnul indic caracterul corelrii n serie n ecuaie. Valoarea pozitiv
contribuie la faptul c termenul de eroare va avea tendina pe viitor s-i pstreze semnul pozitiv
de la o perioad la alta. Aa o tendin nseamn c n caz c t se ntmpl s aib ans de a
obine valori mari ntr-o perioad de timp, urmtoarele observaii vor tinde sa rein o poriune
din valorile originale mari i vor avea acelai semn ca i observaia original. De exemplu, n
modele cu serii temporare un oc extrem de mare n economie ntr-o perioad de timp poate s
continue i n cteva perioade ce vor urma. Dac aceasta se ntmpl, atunci termenul de eroare
va tinde s rmn pozitiv pentru un numr de observaii, apoi negativ pentru altele cteva, apoi
din nou pozitiv. Acest fenomen se numete corelare n serie pozitiv.
Valoarea negativ implic tendina schimbrii semnului termenului de eroare n
observaiile consecutive de la negativ la pozitiv i invers. Acest fenomen se numete corelare n
serie negativ i implic un fel de cicluri (asemntoare cu micarea pendulului) n urma
desenrii perturbaiilor stocastice. Corelarea n serie negativ de ordinul nti se caracterizeaz
prin faptul c termenul de eroare tinde s aib semn opus de la o observaie la alta.
De exemplu, corelarea n serie poate s existe n termenul de eroare a ecuaiei semianuale a
cererii pentru careva obiecte sezoniere (cum ar fi luminie de Crciun) care nu au variabile
dummy (fictive) sezoniere. Oricum, n majoritatea aplicaiilor cu serii temporare corelarea n
serie negativ se ntlnete mai rar dect corelarea n serie pozitiv.
Corelarea n serie poate lua multe alte forme ce difer de aceea de ordinul nti. De exemplu,
n modelul trimestrial, termenul de eroare a observaiei n trimestrul curent poate fi funcional
relatat la observaiile termenului de eroare n acelai trimestru al anului precedent:
t = t 4 + u t .
(8.2)
La fel este posibil c termenul de eroare n ecuaie s fie funcie de mai multe observaii
precedente a termenului de eroare: t = 1 t 1 + 2 t 2 + ut , aa o formulare este numit corelare
n serie de ordinul doi.
noi omitem o variabil relevant sau utilizm o form funcional incorect, atunci o parte din
efectul omis care nu poate fi reprezentat de variabilele explicative rmase trebuie s fie absorbit
de ctre termenul de eroare. Termenul de eroare pentru ecuaia specificat incorect, prin urmare,
include efectul a mai multor variabile omise i/ori o parte din efectul a diferenei dintre forma
funcional proprie i alta aleas de cercettor. Acest termen de eroare nou poate fi corelat n
serie chiar dac nu este acel adevrat. n acest caz corelarea n serie e cauzat de alegerea
specificaiei de ctre cercettor i nu de termenul de eroare perfect asociat cu specificarea
corect.
Remediile pentru corelarea n serie depind de tipul de corelare: perfect sau imperfect. Nu
este surpriz, c cel mai bun remediu pentru corelarea n serie imperfect, de obicei va fi acela
de nu a ntreprinde ncercri ntru omiterea variabilelor din ecuaie. i, prin urmare, majoritatea
econometricienilor ncearc s se ncredineze c au obinut specificaia ceea mai bun posibil
nainte de a petrece o mulime de timp necjndu-se cu corelarea n serie imperfect.
Pentru a vedea cum omiterea variabilei poate cauza corelarea n serie a termenului de eroare,
s admitem c ecuaia adevrat este:
Yt = 0 + 1 X 1t + 2 X 2t + t ,
(8.3)
unde t este termenul de eroare clasic. Dac X 2 va fi omis accidental din ecuaie (sau datele
pentru X 2 nu sunt disponibile), atunci Yt = 0 + 1 X 1t + t* , unde t* = 2 X 2t + t . Deci termenul
de eroare care va fi folosit n cazul omiterii variabilei nu este termenul clasic de eroare t . n
schimb el este o funcie de variabila independent X 2 . Prin urmare, termenul nou de eroare t*
poate fi corelat n serie chiar i atunci cnd termenul adevrat de eroare t nu este corelat. n
special, termenul nou de eroare t* va tinde spre a fi corelat n serie atunci cnd:
variabila X 2 este singur corelat n serie (acest fapt este destul de probabil n seriile
temporare);
mrimea t este mic n comparaie cu mrimea 2 X 2t .
Aceste tendine se produc, dac exist una sau mai multe variabile omise. Vom meniona
primul fapt: eroarea t* apare cu valoarea diferit de zero deoarece exista corelare n serie
imperfect, estimaia M.C.M.M.P. a termenului liber 0 va fi ajustat la aceast problem. Doi:
deoarece corelarea n serie imperfect implic erori de specificare de tipul variabilelor omise,
corelarea n serie imperfect probabil poate fi asociat cu coeficieni estimai deplasai. Att
deplasrile ct i corelarea n serie imperfect vor dispare odat cu corectarea erorii de
specificare.
Vom examina cererea pentru pete pentru a demonstra cum variabilele omise pot cauza
corelare n serie n termenul de eroare a ecuaie incorect specificate:
Ft = 0 + 1 RPt + 2 ln Ydt + 3 Dt + t ,
(8.4)
aici Ft este consumul de pete pe un cap de locuitor ntr-un an t , RPt este preul relativ a petelui
fa de carnea de vit n anul t , Ydt este venitul disponibil real pe un cap de locuitor n anul t ,
Dt este variabila dummy, egal cu zero pn la decizia Papei i cu o unitate dup , i t termenul clasic de eroare (necorelat n serie). Admitem ca ecuaia (8.4) este de o specificaie
corect. Ce se va ntmpla cu ecuaia n cauz dac variabila venitul disponibil va fi omis
*
Ft = 0 + 1 RPt + 3 Dt + t ?
Cel mai evident efect va fi acela c coeficienii estimai pe lng RPt i Dt vor fi deplasai pe
msura corelrii RPt i Dt cu Ydt . Efectul secundar va fi acela c termenul de eroare acuma va
include o parte considerabil din efectul eliminat al venitului disponibil asupra consumului de
pete, faptul ca t* este egal cu t + 2 ln Ydt . Este rezonabil de ateptat c venitul disponibil (prin
urmare i log lui) poate urma un ablon moderat de corelare n serie:
30
(8.5)
de ce este probabil? Vom privi graficul Ydt n timp. Observm c creterea continu a venitului
disponibil n timp l determin i pe log Ydt s acioneze n mod autocorelat sau corelat n serie.
Dar, dac venitul disponibil este corelat n serie (i dac impactul lui nu este relativ mai mic
dect t ), atunci t* este, mult probabil, s fie la fel corelat n serie, ce poate fi exprimat ca:
t* = t*1 + u t , unde reprezint coeficientul de corelare n serie, dar u t este termenul de eroare
clasic. Acest exemplu ne-a demonstrat ca ntr-adevr este posibil ca variabila eliminat s
introduc corelare n serie imperfect n ecuaie.
Un alt tip rspndit de corelare n serie este acela, cauzat de forma funcional incorect. n
aceast situaie alegerea incorect a formei funcionale poate cauza corelarea n serie a
termenului de eroare. S admitem c ecuaia adevrat este prezentat sub forma logaritmic
complet:
ln Yt = 0 + 1 ln X 1t + t
(8.6)
dar n locul ei este lansat regresia liniar: Yt = 0 + 1 X 1t + t * . Termenul nou de eroare t*
acuma este o funcie de termenul adevrat de eroare t i de la diferena ntre forma liniar i
forma n log complet. Din figura . observm c aceste diferene urmeaz compartimente
moderat autoregresive. Diferenele pozitive tind a fi urmate de diferene pozitive i diferene
negative tind a fi urmate de diferene negative. Prin urmare, folosirea formei liniare atunci cnd
una neliniar este mai potrivit de obicei rezult cu corelare n serie pozitiv imperfect.
9. Consecinele corelrii n serie
Consecinele corelrii n serie sunt complet diferite dup caracter de consecinele ale
problemelor discutate anterior. Variabilele omise, variabilele irelevante i multicolinearitatea
toate au indicii externi care pot fi recunoscui complet. Fiecare problem schimb coeficienii
estimai i erorile standard ntr-un mod concret, i analizarea acestor schimbri deseori ofer
destul informaie ca problema s fie soluionat. Cum vom vedea, corelarea n serie i mai mult
probabil s aib simptoame interne i afecteaz ecuaia estimat pe o cale care nu este uor de
observat prin examinare numai a rezultatelor ca atare.
Exist consecine majore a corelrii n serie:
Corelarea n serie perfect nu cauzeaz deplasri n coeficienii estimai;
Corelarea n serie contribuie la creterea varianelor distribuiilor .
Corelarea n serie induce M.C.M.M.P. s subestimeze varianele (i erorile standarde) a
coeficienilor.
9.1. Sinteza consecinelor corelrii n seri
Existena n ecuaie corelrii n serie a termenului de eroare violeaz ipoteza clasic prin
urmare estimarile ecuaiei cu M.C.M.M.P. au de suportat cel puin trei consecine.
9.1.1. Corelarea n serie perfect nu cauzeaz deplasri n coeficieni
S ne amintim c ceea mai important proprietate a tehnicii de estimare prin M.C.M.M.P.
const n faptul c estimatorii liniari nedeplasai au o varian minim. Dac erorile sunt
corelate n serie, una din ipotezele teoremei Gauss-Marcov este violat i anume ea cauzeaz
deplasri n coeficienii estimai. S admitem c este cunoscut faptul c termenul de eroare n
ecuaia ce urmeaz
Yt = 0 + 1 X 1t + 2 X 2t + t
(9.1.1)
este supus corelrii perfecte n serie de ordinul nti:
t = t 4 + u t ,
(9.1.2)
31
aici u t este termenul erorii clasice (necorelat n serie). Dac ecuaia (9.1) este corect specificat
i este estimat cu M.C.M.M.P., atunci estimaiile coeficienilor obinui vor fi nedeplasate:
)
)
E ( 1 ) = 1 ; E ( 2 ) = 2 . Corelarea perfect n serie nu introduce deplasri n procedura de
estimare. Aceasta concluzie este just att pentru corelarea pozitiv n serie ct i corelarea
negativ n serie de ordinul unu. Dac corelarea n serie este imperfect, oricum deplasrile pot
fi introduse prin utilizarea specificaiei incorecte.
Lipsa deplasrilor nu nseamn cu necesitate c estimaiile M.C.M.M.P. ale coeficienilor
ecuaiei corelate n serie vor fi strns apropiate de valorile adevrate ale coeficienilor, deoarece
o singur estimaie observat n realitate poate parveni dintr-un numr mare al valorilor posibile.
Plus la aceasta, eroarea standard a acestor estimaii va fi la sigur majorat de corelarea n serie.
)
Aceast majorare va spori probabilitatea divierii suficiente a valorii de la valoarea adevrat
)
. n acest caz valorile nedeplasate cu o distribuie s sunt centrate n jurul valorii adevrate .
)
grafic rezult cu faptul c distribuia s din ecuaia corelat se regsete n jurul coeficienilor
adevrai, dar este mai plat dect distribuia din ecuaia fr corelare n serie.
9.1.3. Corelarea n serie cauzeaz M.C.M.M.P. s subestimeze variana (i erorile standard) a
coeficienilor
)
Dac corelarea n serie mrete varianele (la fel i erorile standard) a s , atunci putem
presupune c ( s ) obinut prin M.C.M.M.P. tot va crete, ns nu de fiecare dat. n schimb
) )
32
n special, tendina M.C.M.M.P. de a subestima ( s ) va contribui la supraestimarea t statisticilor ale coeficienilor estimai, ntruct:
)
(
H )
t= ) ) .
(9.1.3)
( )
) )
Dac ( ) prea mic cauzeaz t - valoare mare pentru un coeficient distinct, atunci este mult
probabil c ipoteza nul va fi respins H 0 : ( = 0) , n timp ce ea este adevrat. n esen,
M.C.M.M.P. produce confuzie n vederea semnificaiei rezultatului concret. Corelarea n serie
nu numai majoreaz devierile standard, dar deseori conduce la concluzii greite care fac dificil
acapararea acestei creteri de M.C.M.M.P.
) )
9.2.Testul Durbin-Watson
Cel mai larg utilizat test pentru depistarea corelrii n serie este d - testul Durbin-Watson.
9.2.1. Statistica Durbin-Watson
Statistica Durbin-Watson d este calculat prin examinarea reziduurilor ale estimaiei
concrete a ecuaiei, i se folosete pentru determinarea faptului existenei corelrii n serie de
ordinul nti n termenul de eroare inclus n ecuaie. Este important ca d - statistica DurbinWatson s se foloseasc numai atunci cnd ipotezele care fundamenteaz acest fenomen sunt de
fa:
Modelul de regresie include termenul de intersecie (termenul liber).
Corelarea n serie de ordinul nti exist: t = t 1 + ut , unde este coeficientul corelrii
n
t =2
t =2
d = (u t u t 1 ) / u t2 ,
t =2
(9.2.1)
t =1
aici u t sunt reziduurile obinute prin M.C.M.M.P. Vom meniona c numrtorul are cu o
observaie mai puin dect numitorul, deoarece o observaie necesit a fi utilizat pentru
calcularea u t 1 . d - statistica Durbin-Watson este egal cu zero atunci cnd exist corelaie n
serie pozitiv extrem, este egal cu doi dac nu exist corelaie n serie i este egal cu 4 dac
exist corelaie n serie negativ extrem. Vom demonstra aceasta, prin a introduce datele
reziduurelor respective n ecuaia (9.8).
d = 0. Corelarea n serie pozitiv extrem. n acest caz, u t = u t 1 , deci (u t u t 1 ) = 0 i d = 0,
( = 1 ).
d 4. Corelare n serie negativ extrem. n acest caz, u t = u t 1 i (u t u t 1 ) = 2u t .
Substituind n ecuaia (9.8), obinem d =
(2ut )2
2
t
d 4 , = 1 .
n reziduuri deoarece corelarea n serie negativ, dup cum a fost meninut mai sus, este foarte
greu de explicat teoretic n analiza economic sau de busines. Existena ei nseamn c corelarea
n serie imperfect probabil c este cauzat de eroarea de specificare. Doi, uneori testul DurbinWatson este neconcludent. n timp ce regula de luarea a deciziei de fiecare dat are numai
regiuni de acceptare sau de respingere, testul Durbin-Watson are a treia posibilitate, numit
regiune neconcludent.
n aceste circumstane, utilizarea d - testului Durbin-Watson este aproape similar
utilizrii t - testului sau F - testului. Pentru a testa corelarea n serie pozitiv sunt necesare
urmtoarele etape:
1. Obinem reziduurile M.C.M.M.P. din ecuaia supus testrii i calculm d - statistica cu
ajutorul formulei (9.8).
2. Determinm volumul eantionului i numrul variabilelor explicative i apoi consultm
tabelele statisticilor pentru a gsi valoarile critice: d U - maximal i d L - minimal respectiv.
3. Dat fiind anunat ipoteza H 0 : 0 , care infirm corelarea n serie pozitiv i ipotezele
unidirecionale H A : f 0 (exist corelare n serie pozitiv).
Ceea mai potrivit regula de luarea a deciziei este:
dac d p d L se respinge ipoteza H 0 :
dac d f dU nu se respinge ipoteza H 0 :
dac d L d dU ipoteza H 0 : nu e convingtoare.
n unele circumstane cel potrivit va fi testul bidirecional. n acest caz vor fi utilizate numai
etapele 1 i 2 dar etapa 3 nu va fi utilizat.
Dat fiind anunate ipotezele bilaterale de alternativ:
H 0 : = 0 (nu-i corelare n serie)
H A : 0 (este corelare n serie),
ceea mai potrivit regula de luare a deciziei va fi:
dac d p d L se respinge H 0 :
dac d f 4 d L se respinge H 0 :
dac 4 dU f d f dU nu se respinge H 0 : ,
n celelalte cazuri H 0 : nu e concludent
9.3. Estimarea modelelor cu autocorelarea erorilor
Corelarea n serie de ordinul nti presupune c valoarea termenului de eroare n momentul
t t depinde de valoarea termenului de eroare n momentul t 1 t 1 . Prin urmare exist un
model de regresie de forma:
t = 0 + 1 t 1 + u t ,
unde 0 , 1 sunt parametrii ecuaiei de regresie. n conformitate cu formulele M.C.M.M.P.
avem: 0 = t 1 t 1 ; 1 =
ecuaii
cu
t t 1 t t 1
t = 0 t = t 1 = 0 . Atunci avem
0 = 0 , iar
1 =
t t 1
2
t 1
t =2
n
t 1
care este
t 1
t =2
coeficientul de autocorelare a reziduurilor de ordinul unu. Deci, avem: t = 1 t 1 + u t , u t termenul erorii stocastice clasic. Vom nota c 1 p 1 . innd cont de ultima relaie, obinem:
34
Yt = 0 + 1 X 1t + 1 t 1 + u t .
(9.3.1)
Vom considera abordarea de baz Yt = 0 + 1 X 1t + t la estimarea parametrilor ecuaiei de
regresie n cazul cnd are loc autocorelarea reziduurilor. nscriem modelul de regresie enunat
pentru t = t 1 :
Yt 1 = 0 + 1 X 1t 1 + t 1 ,
(9.3.2)
vom nmuli ambele pri ale ecuaiei (9.3.2) la 1 ,
1 Yt 1 = 1 0 + 1 1 X 1t 1 + 1 t 1 ,
(9.3.3)
i vom extrage (9.3.2) din (9.3.1) dup ce obinem:
Yt 1 Yt 1 = 0 1 0 + 1 X 1t 1 1 X 1t 1 + t 1 t 1
(9.3.4)
sau Yt = 0 + 1 X 1t + u t ,
(9.3.5)
n (9.3.5)
Y/ t = Yt 1 Yt 1
(9.3.6)
X t = X t 1 X t 1
(9.3.7)
ut = t 1 t 1
(9.3.8)
0 = 0 (1 1 )
(9.3.9)
Deoarece u t este termen de eroare stocastic necorelat, pentru estimarea parametrilor ecuaiei
(9.3.5) se aplic M.C.M.M.P. simpl.
n concluzie, atunci cnd erorile ecuaiei iniiale sunt autocorelate, pentru estimarea parametrilor
ecuaiei de regresie se utilizeaz M.C.M.M.P.G. i este necesar s se ndeplineasc urmtoarele
condiii:
s se transforme variabilele Yt i X t la forma (9.3.6)-( 9.3.7),
s se aplicice M.C.M.M.P. la ecuaia (9.3.5) entru estimarea parametrilor 0 , 1 ,
s se calculeze parametrul 0 / (1 1 ) = 0 ,
s se nscrie ecuaia iniial.
M.C.M.M.P.G. este o analogie a metodei diferenelor finite. Numai c se scade din Yt i X t
nu valoarea deplin a Yt 1 (sau X t 1 ), dar numai careva parte din ele - r1 Yt 1 sau r1 X t 1 . Atunci
cnd r1 = 1 , aceasta metod este metoda diferenelor finite de ordinul 1, ntruct Yt = Yt Yt 1 ;
X t = X t X t 1
(9.3.10)
(9.3.11)
Deoarece,
0 = 0 (1 (1) ) = 2 0
(9.3.12)
avem
Yt + Yt 1 = 2 0 + ( X t + X t 1 ) + u t
(9.3.13)
i
(Yt + Yt 1 ) / 2 = 0 + ( X t + X t 1 ) / 2 + u t / 2
(9.3.14)
n esen, n modelul (9.3.14) se determin mediile a dou perioade pentru fiecare serie i
apoi pentru datele medii obinute cu ajutorul M.C.M.M.P.G. se estimeaz parametrii 0 , 1 .
Problema principal const n determinarea estimaiei r1 , ca s putem aplica aceasta
metod. Exist o mulime de procedee pentru determinarea acestei estimri. ns abordarea de
baz o constituie evaluarea acestui coeficient nemijlocit din estimrile obinute pentru ecuaia
iniial de regresie r1 = 1 d / 2 , d este testul Durbin-Watson.
35
Ipoteze unilaterale
H0 : 0
(ipoteza H 0 se respinge);
4 d U f d f d U ( ipoteza H 0 se accept) n restul cazurilor exist domeniul de incertitudine.
O transformare grijulie a variabilelor ntru corectarea eteroschedasticitii, dei nu evita
corelarea fals, datorat valorilor mari, uneori poate fi o abordare reuit n soluionarea acestor
probleme. De notat totui, c nu fiecare variabil n ecuaie este tratat n acelai mod (spre
deosebire de M.C.M.M.P.G. ponderat). Fiecare variabil n modelul cu date ncruciate poate fi
examinat n vederea transformrilor posibile care se vor solda cu interpretri semnificative i
complete a ecuaiei de regresie.
10. Eteroschedasticitatea
Eteroschedasticitatea este rezultatul violrii ipotezei clasice referitor la faptul c observaiile
termenului de eroare au o varian constant (fac parte dintr-o populaie cu o varian
constant). Ipoteza varianei constante pentru diferite observaii a termenului de eroare
(moschedasticitatea) nu este de fiecare dat una realist. De exemplu, n modelul care msoar
nlimea, s comparm eroarea cu un inch (2.54 sm) la msurarea nlimii unui juctor de
basket i eroarea cu un inch la msurarea nlimii oricelului. E mult probabil c termenul de
eroare asociat cu nlimea basketbolistului va parveni din distribuia cu o varian mai mare
dect aceea asociat cu nlimea oricelului. Cum se va demonstra, distincia dintre
eteroschedasticitate i omoschedasticitate este important deoarece M.C.M.M.P. aplicat la
modelele eteroschedastice, nu mai este estimator de o varian minim (rmnnd totui
nedeplasat).
Deseori eteroschedasticitatea apare atunci cnd datele sunt de aa natur c exist o
diferen mare dintre valorea ceea mai mare observat i valoarea ceea mai mic observat.
Devierea mare ntre mrimile observaiilor n populaie contribuie la probabilitatea sporit ca
distribuia termenului de eroare s aib pentru observaiile mai mari o varian mai mare, n
timp ce distribuia termenului de eroare pentru observaiile mici are o varian mic.
Poate fi uor obinut o diferen mare ntre cele mai mici i cele mai mari valori ale
variabilelor n mulimea de date ncruciate. Vom aminti c n modelele cu date ncruciate
variabilele sunt observate n acelai timp, dar pentru diferite obiecte (de exemplu, persoane,
state, regiuni etc). Deoarece modelele ncruciate deseori includ observaii de diferite mrimi n
acelai exemplu, eteroschedasticitatea este greu de evitat n tematicile economice studiate
ncruciat.
Punerea accentului pe modelele ncruciate nu nseamn c eteroschedasticitatea este
imposibil n modelele cu serii temporare i nici nu se exclude posibilitatea c variabilele omise
36
pot cauza eteroschedasticitate imperfect n orice tipuri de date. Oricum la mod general,
eteroschedasticitatea cu probabilitate mai mare poate avea loc n modelele cu date ncruciate
dect n modelele cu serii temporare.
n acest context, se va ncerca s dea rspunsul la cteva ntrebri ce in de
eteroschedasticitate, care au fost oglindite pentru multicolinearitate i corelare n serie.
1. Care este esena problemei?
2. Care sunt consecinele problemei?
3. Cum problema se depisteaz?
4. Ce remedii pentru aa problem sunt disponibile?
10.1. Eteroschedasticitatea perfect i imperfect
Eteroschedasticitatea perfect este aceea care poate fi cauzat de termenul de eroare a
ecuaiei specificate corect, n timp ce eteroschedasticitatea imperfect este cauzat de eroarea de
specificaie cum ar fi variabilele omise.
10.1.1. Eteroschedasticitatea perfect.
Eteroschedasticitatea perfect s refer la eteroschedasticitatea care este funcie ce depinde
de termenul de eroare a ecuaiei de regresie corect specificat. Utilizarea cuvntului
eteroschedasticitate fr modificri (cum ar fi perfect sau imperfect) implic
eteroschedasticitatea perfect.
Aa tip de eteroschedasticitate apare atunci cnd n ecuaia specificat corect ipoteza clasic
care presupune c varianele termenului de eroare sunt constante, este violat. Vom reaminti, c
ipoteza presupune c:
VAR( i ) = 2 , (i = 1,2, L , n )
(10.1.1)
Dac aceasta presupunere are loc, toate observaiile ale termenului de eroare pot fi
imaginate dat fiind prezentate printr-o distribuie asemntoare cu valoarea medie zero i
variana 2 . Acest 2 nu se schimb de la observaie la alta a termenului de eroare; aceasta
proprietate se numete omoschedasticitate.
n cazul eteroschedasticitii, variana termenului de eroare nu este constant, n schimb,
variana distribuiei termenului de eroare depinde exact de observaia n discuie:
VAR( i ) = i2 , (i = 1,2, L , n ) .
(10.1.2)
De menionat c diferena dintre (10.1) i (10.2) const n prezena indicelui " i" pe lng 2 ,
care denot faptul ca variana termenului de eroare n condiii de eteroschedasticitate se
schimb n dependen de observaie n loc s fie constant pentru orice observaie.
Alt cale de a ilustra eteroschedasticitatea const n prezentarea grafic a mulimei n care unele
observaii a termenului de eroare au distribuii mai plate dect altele. Cea mai simpl situaie e
aceea pentru care observaiile termenului de eroare pot fi grupate numai n dou distribuii
diferite, lat i ngust. Aceasta versiune simpl a problemei poate fi numit
eteroschedasticitate discret. n acest caz ambele distribuii vor fi centrate n jurul punctului
zero, ns una va avea o varian mai mare dect alta.
Eteroschedasticitatea ea forme mult mai complexe, oricum: numrul diverselor modele cu
eteroschedasticitate practic nu este limitat, chiar analiza unui procent mic din aceste alternative
este o sarcin grea. n continuare se vor examina principiile generale ale eteroschedasticitii,
concentrndu-se asupra celor mai frecvent specificate modele de eteroschedasticitate perfect.
Ceea ce nu nseamn c econometricienii se axeaz numai pe un tip de eteroschedasticitate.
Vom examina un model cu eteroschedasticitate, n care variana termenului de eroare este
relatat la variabila exogen Z i . Pentru ecuaia de regresie tipic:
Yi = 0 + 1 X 1i + 2 X 2i + i ,
(10.1.3)
variana termenului de eroare clasic i n condiiile propuse va fi egal cu:
VAR( i ) = 2 Z i2 ,
(10.1.4)
37
aici variabila Z i poate fi egal sau nu poate fi egal cu una din variabilele X s din ecuaie.
Variabila Z i se numete factor de proporionalitate deoarece variana termenului de eroare se
schimb proporional cu ptratul de Z i . Cu ct este mai mare Z i , cu att este mai mare variana
distribuiei termenului de eroare pentru observaia " i" . Pot fi n diferite distribuii, cte una
pentru fiecare observaie. n funcie de numrul valorilor distincte pe care le ea variabila Z i pot
fi prezentate observaiile termenului de eroare .
Ce reprezint n realitate factorul de proporionalitate Z i ? Cum este posibil ca o variabil
exogen, cum ar fi Z i , s schimbe ntreaga distribuie a termenului de eroare? S ne adresm la
funcia care relateaz consumul gospodriilor la venitul lor. Cheltuielile gospodriilor populaiei
cu venit mic este imposibil s varieze dup valoarea absolut ca i cheltuielile gospodriilor
populaiei cu venit mare, deoarece schimbarea cu 10% n cheltuieli pentru familiile cu venit
mare atrage mai muli bani dect schimbarea cu 10% a acelor cu venit mic. Pe lng aceasta,
cota parte din bugetul familiilor cu venit mic care trebuie s fie cheltuit pentru necesiti este
mult mai mare dect aceea din bugetul familiilor cu venit mare. n cazul dat Yi va reprezinta
cheltuielile de consum dar factorul de proporionalitate Z i va oglindi venitul gospodriilor
populaiei. Dac venitul gospodriilor populaiei crete, atunci i variana termenului de eroare
n ecuaie deasemenea va fi de natura s explice cheltuielile respective.
Acest exemplu ne demonstreaz faptul c eteroschedasticitatea e mult probabil s apar n
modele cu date ncruciate, deoarece exist o variaie mare n valorile variabilei dependente
incluse. Bunoar, abaterile exogene care pentru familiile cu venit mic se arat a fi
semnificative, pentru familiile cu venit mare pot s par minuscule.
n acelai timp, eteroschedasticitatea poate s apar n modelele cu serii de date temporare
cel puin n dou situaii care difer de acelea din modelele cu date ncruciate cu un numr
mare de variaii n valorile variabilei dependente:
Eteroschedasticitatea poate s apar n modelele cu date sub form de serii temporare cu
schimbri mari n variabila dependent (rata de schimbare a variabilei dependente este
mare). Dac are loc o cretere extrem de mare n industrie, atunci e mult probabil ca
variana termenului de eroare s creasc n aceiai msur. ns atare fenomen nu are loc
n seriile de timp cu o rat joas de schimbare.
Eteroschedasticitatea poate s apar n orice model, cu serii de date temporare n care
calitatea datelor colectate se schimb dramatic. Cum numai tehnica de colectare a datelor
devine mai bun, variana termenului de eroare va diminua, deoarece erorile de msurare
iau parte din termenul de eroare. Atunci cnd erorile de msurare se micoreaz, se
micoreaz i variana termenului de eroare.
10.1.2. Eteroschedasticitatea imperfect
Eteroschedasticitatea cauzat de erori de specificare, cum ar fi variabilele omise, se refer c
eteroschedasticitatea imperfect. n acelai timp forma funcional improprie puin probabil s
cauzeze eteroschedasticitatea imperfect, pe cnd ea produce corelaria n serie imperfect, cele
dou concepte fiind similare sub mai multe aspecte.
Variabila omis e posibil s conduc la eteroschedasticitatea termenului de eroare deoarece
o parte din efectul omis nu este reprezentat nici de o variabilel explicativ prezent n ecuaie,
deci este incorporat de termenul de eroare. Dac acest fenomen are o componen
eteroschedastic, termenul de eroare a ecuaiei respecificate poate fi eteroschedastic chiar dac
termenul de eroare al ecuaiei adevrate nu este. Aceasta distincie este important deoarece n
condiiile eteroschedasticitii imperfecte remediul corect consta n ncercarea de a gsi variabila
eliminat i de a o include n ecuaia de regresie. Deci nainte de a purcede la depistarea sau a
remedierea eteroschedasticitii perfecte este important s existe sigurana specificaiei corect.
38
GDP
0
-
)
)
VAR ** ( s ) = f ( Z 2 ) VAR( s ) ,
(10.2.2)
)
unde VAR ** ( s ) este variana cu eteroschedasticitate; f ( Z 2 ) indic o funcie pozitiv de
Z , factorul de proporionalitate care cauzeaz eteroschedasticitatea n ecuaia (10.7),
)
iar VAR( s ) este variana fr eteroschedasticitate. Dac ipoteza clasic cu privire le
omis nu este corelat cu nici una dintre variabilele incluse n ecuaie (ceea ce este aproape
nevirosimil).
n general, atunci cnd unele din ipotezele clasice nu sunt respectate, nu are loc teorema
Gauss-Marcov, i estimaiile nu sunt BLUE). Ceea ce nseamn c estimatorii liniari nu mai
sunt nedeplasai i de varian minim (aceeai varian pentru toi estimatorii liniari
nedeplasai) sau nu se ndeplinesc concomitent ambele ipoteze. Estimarea ecuaiei (12.2) n timp
ce atunci este adevrat ecuaia (12.1), cauzeaz deplasri n estimaiile ecuaiei (12.2). Ceea ce
)
nseamn c: E ( 1 ) 1 .
(12.3)
)
Deci, lipsa variabilei X 2 din ecuaie conduce la deplasarea valorii ateptate a coeficientului 1 de
la valoarea sa adevrat. Dac variabilele X 1 i X 2 sunt corelate i variabila X 2 este omis din
ecuaie, atunci M.C.M.M.P. va atribui variabilei X 1 o varian eventual cauzat de X 2 , ce se
)
soldeaz cu estimri deplasate pentru 1 .
Pentru a demonstra faptul c variabila omis poate cauza estimri deplasate, vom
examina funcia de producere care exprim venitul ( Y ) ca funcie dependent de la cantitatea
utilizat de munc ( X 1 ) i de capital ( X 2 ). Fie c din careva considerente dac lipsesc datele
pentru capital i variabila ( X 2 ) va fi omis din model. Aceasta eliminare, cu certitudine, va
deplasa estimatorul coeficientului de pe lng variabila munc deoarece este evident c munca i
capitalul sunt corelai (creterea n capital, de regul, necesit cel puin cteva brae de munc
spre utilizare i vice versa). Prin urmare, M.C.M.M.P. va atribui muncii o cretere a volumului
de producie de fapt cauzat de capital. Deci deplasarea va fi o funcie de 2 i coeficientul de
corelaie dintre capital i munc
)
E ( 1 ) = 1 + 2 f (r12 )
(12.4)
)
Rezult c valoarea ateptat a coeficientului de pe lng variabila inclus ( 1 ), atunci cnd
variabila important ( X 2 ) este omis, este egal cu valoarea sa adevrat plus coeficientul
adevrat de pe lng variabila exclus nmulit cu o funcie dependent de coeficientul de
corelaie simpl dintre variabila inclus i aceea exclus:
) valoarea adevrat 2 este zero (deci deplasarea nu exist, ceea ce nseamn c variabila X 2
nu este important n model); sau b) r12 este zero (variabilele X 1 i X 2 sunt perfect incorelate).
Valoarea termenului 2 f (r12 ) determin cantitatea deplasrii de specificaie introdus n
estimaia 1 prin eliminarea X 2 . Dac variabila inclus i aceea exclus sunt necorelate, nu
exist deplasri, ns n realitate, aproape de fiecare dat, careva corelaie (fie chiar aleatoare)
dintre oricare dou variabile exist i atunci deplasrile sunt cauzate frecvent de omiterea
variabilei importante.
12.2.1. Un exemplu deplasrilor de specificaie.
)
Fie c Yt = 0,605 0,45PC t + 0,12 PBt + 12,2 ln YDt
(0,07) (0,05)
(11,2)
t=
-6,4
-2,5
10,6
R 2 = 0,984; n = 35 (anuale 1950 1984 )
Yt consumul de pasare;
PCt cos tul unui kg de carne de pasare;
PBt cos tul unui kg de carne de vita ;
ln YDt venitului disponibil pe cap de locuitor (log aritmnatural ).
(0,06)
(0,42)
46
t=
-5,6
2
R = 0,981; n = 35
36,0
( )
)
E PC = PD f (rPC , PD ) = ( )(+ ) = ( ) .
Tehnic dat va funciona bine atunci, i numai atunci, cnd numai o singur variabil este
omis din ecuaie. n cazul omiterii concomitente a mai multor variabile, impactul asupra
coeficienilor din ecuaie este greu de specificat.
12.4. Variabile irelevante (neimportante)
Ce se va ntmpla dac n ecuaie se introduce o variabil care nu-i aparine? Acest caz,
variabilelor neimportante, este unul invers la acel al variabilelor omise, i poate fi analizat
47
(1 r )
12
( )
)
2
)
VAR 1 = u2 ( X 1i X 1 ) .
Deci, chiar dac variabilele neimportante nu cauzeaz deplasri, ele cauzeaz probleme pentru
regresie, deoarece reduc precizia regresiei.
Tabel. Sumar al impactului variabilelor omise sau a variabilelor neincluse (neimportante)
asupra restului coeficienilor
Efectul asupra coef. Variabila omis
estimai
Deplasri
Da*
Creterea
sau Descrete*
descreterea varianei
Variabila
neimportant
Nu
Crete*
introdus
contribuie la majorarea R 2 , innd cont de faptul c prima variabil deja este introdus n
ecuaie. Procedeul iterativ continue pn cnd variabila ce va urma a fi introdus n ecuaie nu
izbutete s ating careva cretere n R 2 . Contribuia fiecrei variabile independente presupune
o cretere n R 2 cauzat de includerea ei n ecuaia de regresie.
Spre regret, orice corelare ntre variabilele independente face aceast procedur dificil. n
procesul de evaluare a corelaiei ntre variabile este greu de separat impactul unei variabile de
la impactul altei variabile. Ca rezultat, n prezena multicolinearitii este imposibil de
determinat contribuia individual a fiecrei variabile suficient pentru a afirma c una din ele
este mai important i deci necesit a fi inclus n primul rnd, i mai ru, nu este o justificare
teoretic pentru a alegere combinaia variabilelor specificate.
Din cauza acestor probleme, deseori se evit procedeul iterativ. Primejdia cea mai mare este
c coeficienii obinui pot fi deplasai, valorile t - calculate nu urmeaz pe viitor repartiia
valorilor t - tabelare, variabilele importante pot fi excluse din cauza aranjamentului (ordinea
n care a avut loc selecia), semnele coeficienilor estimai la fazele intermediare sau finale a
procedeului pot s difere de la semnele preconizate. Utilizarea procedeului iterativ este o
anumit ignoran fa de faptul ce variabile vor fi introduse.
12.4.6. Cutrile succesive ale specificaiei
Din orgoliu majoritatea econometricienilor, evita explorarea datelor i metoda iterativ de
specificare a variabilelor. n schimb, se prefer specificarea ecuaiei prin estimarea ecuaiei
iniiale i apoi eliminarea sau adugarea consecutiv a variabilelor (sau schimbarea formei
funcionale) pn cnd o ecuaie verosimil cu statistici bune este obinut. Aflndu-se n faa
situaie cnd cunoaterea sigur (n baza teoriei) a unor variabile relevante, aparent este o
practic general acceptat, cnd necunoscnd sunt sau nu sunt relevante variabilele adugate, se
recurge la verificarea R 2 i a t - testelor pentru toate variabilele (pn la i dup selecie).
ntradevr, uor se demonstreaz, c o atare cutare este cautare a neadevrului. Dup cum se
va constata, exist o diferen enorm n abordarea cutrii de specificaie succesiv i
abordarea care va fi recomandat. Cutarea succesiv a specificaiei este o tehnic care permite
cercettorul s estimeze un numr secret de regresii apoi s prezinte alegerea final (bazat pe o
mulime de ateptri nespecificate n vederea semnelor i semnificaiei coeficienilor) ultima
fiind prezentat ca o specificaie estimat. Aa o metod stabilete greit veridicitatea statistic a
rezultatelor regresiei din dou motive.
1) Semnificaia statistic a rezultatelor este supraestimat deoarece estimaiile regresiei
precedente sunt ignorate.
2) Mulimea motivaiilor utilizat la alegerea dintre rezultatele diferitor regresii este secret.
Nu e posibil, sub nici o form, s se cunoasc: ofer sau nu rezultate regresiilor efectuate
semne opuse sau coeficieni semnificativi pentru variabilele importante.
Spre regret, nu exist o metod universal acceptat pentru a dirija cutrile succesive, n
primul rnd deaceea c testul potrivit la o etap a procedeului depinde de testele care au fost
ndeplinite anterior i deaceea c testele este foarte greu de inventat. O modalitate de
mbuntire const n reducerea gradelor de libertate n ecuaia final cu unul pentru fiecare
ncercare alternativ de specificare. Acest procedeu este departe de a fi exact, dar impune o
penalitate explicit pentru cutrile de specificare.
n general, se recomand de a menine numrul regresiilor estimate ct se poate de mic; de a
se concentra la considerente teoretice atunci cnd se selecteaz variabilele, formele funcionale
i de a dezvlui toate specificaiile investigate. Deci, se recomand de a combina economia
(folosirea teoriei i analizei pentru limitarea numrului de specificaii estimate) cu dezvluirea
(informarea referitor la toate ecuaiile estimate).
i totui, aceasta este o alt fa a istoriei. Unii cercettori simt c modelul meninut , dac
va fi o ans, va demonstra directi cele mai bune rezultate statistice (inclusiv semnele i
50
coeficienii) care cel mai bine se potrivesc cu specificaiile adevrate. Problema acestei
psihologii este aceia c elementul de ans este, n mod normal, foarte puternic pentru orice
aplicaie. Plus la aceasta persoanele rezonabile adesea nu sunt de acord cu faptul cum arat
modelul adevrat. Prin urmare, diferii cercettori vor examina aceleai seturi de date i vor
veni cu modele mai bune extrem de diferite. Deoarece aceasta poate s se ntmple,
diferena dintre un econometrician bun i prost nu este att de clar cum se pare. Att timp ct
se manifest un respect sntos fa de pericolul cutrilor de specificare, e mult probabil s se
procedeze ntr-un mod rezonabil.
Concluziile obinute sunt absolut clare: cel mai important lucru n specificarea ecuaiei va fi
fcut nainte de orice ncercare de estimare a ecuaiei la calculator. ntruct o perfeciune nu este
rezonabil, vor fi perioade cnd specificaii adiionale va fi necesar de estimat. Oricum aceste
estimaii noi necesit a fi temeinic fundamentale teoretic i explicit luate n vedere atunci cnd
se va testa semnificaia i se vor totaliza rezultatele. n aa mod va fi redus pericolul estimrilor
statistice incorecte.
12.4.7. Impactul cutrilor succesive de specificare
S prezentm un exemplu prin care se va demonstra c eliminarea variabilelor din model n
baza t -testului introduce deplasri sistematice n ecuaia estimat. Fie c modelul ipotetic
pentru o variabil independent distinct este:
Yi = 0 + 1 X 1i + 2 X 2i + i
(12.7)
S admitem pe viitor c, n baza teoriei, exist certitudine c variabila independent X 1 aparine
ecuaiei, iar variabila independent X 2 nu aparine ecuaiei. Rmne s se determine n vederea
includerii variabilei X 2 n ecuaie; muli cercettori experimentai utilizeaz numai testul t ,
care indic c coeficientul 2 este semnificativ diferit de 0, prin urmare, ei pstreaz variabila
independent X 2 n ecuaie, obinnd forma (11.17) ca model final. n caz ce testul t nu
indic diferena semnificativ de o, aceti cercettorii exclud variabila X 2 din ecuaie i
considera Y ca funcie de o singur variabil X 1 .
Dou tipuri de erori pot fi introduse pornind de la o atare abordare. Prima, variabila X 2
poate fi pstrat n ecuaie atunci cnd ea nu aparine ei, ns greal de acest gen nu va schimba
valoarea ateptat a lui 1 . A doua, variabila X 2 poate fi aruncat din ecuaie dei trebuie s
aparin ei i atunci coeficientul estimat pentru X 1 va fi deplasat de valoarea 2 n msura n
care variabilele X 1 i X 2 sunt corelate. Cu alte cuvinte, coeficientul 1 va fi deplasat atta timp
ct variabila X 2 , care trebuie s aparin ecuaiei, va fi eliminat din ea, i variabila X 2 va fi
eliminat de fiecare dat cnd coeficientul estimat va fi semnificativ diferit de 0. Atunci,
)
valoarea ateptat a lui 1 nu va fi egal cu valoarea teoretic 1 , i va avea deplasri
)
sistematice n ecuaia examinat: E ( 1 ) = 1 + 2 f (rX / X )P 1 . Unde P indic probabilitatea
1
semnificaiei testului t . Aceasta este la fel cazul cnd t - testul calculat pentru 1 nu mai
urmeaz repartiia t tabelar . Cu alte cuvinte, t - testul calculat este deplasat prin cutarea
succesiv de specificaie.
ntruct, majoritatea cercettorilor consider un numr de variabile diferite naintea stabilirii
modelului final, cel care are ncredere n t - testul calculat se confrunt cu aceast problem
sistematic. Deci, practica eliminrii potenialelor variabile independente pur i simplu din
motivul c t - testul calculat indic c coeficientul estimat nu este semnificativ diferit de 0 va
cauza deplasri sistematice n coeficienii estimai (i t - testele lor) pe lng variabilele
rmase.
51
Y
Y
X
Y X i
Y / Y
=
= i i dar nu coeficienii unghiulari sunt constani n acest model.
Y
X i Y
X i / X i
52
ln Y
Y / Y
= EY , X k .
=
ln X k X k / X k
Dat fiind constani coeficienii de regresie, ecuaia logaritmic complet satisface condiia ca
modelul sa conin elasticiti constante. Modul de interpretare a parametrilor k n ecuaia
logaritmic complet ine de faptul c la schimbarea variabilelei X k cu un %, restul variabilelor
fiind meninute constante, Y se va schimba cu k %. n situaia cnd elasticitile sunt
constante, coeficienii de nclinaie nu mai sunt constani.
Desenul din stnga demonstreaz conceptul economic al funciei de producere-curbele de
indiferen. Izocuantele funciei de producere demonstreaz diferite combinaii posibile ai
factorilor X 1 capitalul i X 2 munca, care pot fi utilizate pentru a fabrica un volum anumit de
producie. Atare funcie logaritmic complet de producere se numete funcie de producere de
tip Cobb-Douglas. Desenul din dreapta demonstreaz relaiile dintre Y i X 1 care exist, dac
X 2 se menine constant sau nu a fost inclus n model. De menionat, c n acest caz nclinaia
curbei depinde de semnul i mrimea coeficientului 1 .
nainte de a utiliza modelul logaritmic complet, este necesar s se verifice toate observaiile
ca ele s nu conin valori de 0. Modelul logaritmic complet poate fi utilizat numai n cazul cnd
toate variabilele primesc valori pozitive. Variabilele dummy, care pot lua valori 0, nu vor fi
percepute chiar dac vor fi introduse n ecuaie.
Y
= 1 / X 1 sau 1 = Y /(X 1 / X 1 ) , fapt care
X 1
poate fi demonstrat prin calcule. Cu alte cuvinte, dac valoarea se vaschimb cu 1%, atunci
valoarea Y se va schimba cu 1 / 100 , valoarea X 2 rmnnd intact (valoarea lui X 1 trebuie s
fie pozitiv pentru a fi posibil operaia logaritmrii). Elasticitatea variabilei Y n respect cu
53
Y X 1 1
=
, i descrete odat cu creterea lui Y . Pe desenul ce
X 1 Y
Y
urmeaz este prezentat relaia dintre Y i X 1 , X 2 fiind meninut constant. De notat c n
cazul cnd 1 f 0 , impactul schimbrilor n X 1 asupra lui Y se afl n declin odat cu creterea
lui X 1 . n concluzie, form semilogaritmic se va fi folosit atunci, cnd se presupus o relaie
descresctoare dintre Y i X 1 .
variabila X 1 ea forma: EY / X =
1
n economie i busines aplicarea acestei forme semilogaritmice este ntlnit foarte frecvent.
De exemplu, majoritatea funciilor de consum dup un anumit nivel de venit manifest o
cretere cu rat descresctoare. Aceste, aa numite curbe Engel, tind s devin plate deoarece
atunci cnd venitul crete esenial, un procent mic din venit este ndreptat spre consum i un
procent mai mare merge pentru acumulri. Atunci consumul crete cu o rat descresctoare.
Dac Y este consumul al unui bun, i X 1 este venitul disponibil, ( X 2 fiind meninut n locul
restului variabilelor independente), atunci utilizarea formei semilogaritmice este justificat de
fiecare dat cnd rata creterii unui bun se ateapt a fi n declin atunci cnd venitul disponibil
va crete.
Alt exemplu se refer la varianta funciei semilogaritmice care se obine prin logaritmarea
variabilei dependente Y , variabilele independente rmnnd sub forma linear:
ln Yi = 0 + 1 X 1i + 2 X 2i + i . n acest model nici coeficientul unghiularnu este constant, nici
elasticitate nu sunt constante. Dac variabila independent X 1 se va schimb cu o unitate, atunci
variabila dependent Y se va schimba cu 1 / 100% , variabila independent X 2 meninndu-se
constant.
Y
Y
= 1 + 2 2 X 1 , iar n respect cu variabila X 2 este
= 3 . De menionat c primul
X 1
X 2
coeficient unghiular depinde de valorile variabilei X 1 , iar al doilea coeficient este constant. n
cazul unei funcii de cost, Y fiind costul mediu a produciei, i X 1 fiind nivelul de producie al
firmei, atunci dac firma are o curb de cost cu punct de a (cum ar fi n figura din stng), e
posibil ca 1 s fie negativ iar 2 s fie pozitiv , pictat n desenul ce urmeaz.
Un alt exemplu, se consider modelul veniturilor anuale ale angajailor n funcie de vrsta
fiecrui angajat i de un alt factor ce stimuleaz productivitatea, cum ar fi educaia. Care va fi
impactul ateptat al vrstei asupra venitului? De regul, cu vrsta un tnr lucrtor (el sau ea)
ctig mai mult. Oricum, dincolo de acest punct de vedere, cu vrsta n foarte multe cazuri
ctigurile nu cresc deloc, dar cu apropierea vrstei de pensionare se ateapt c ctigul va
ncepe s descreasc. Ca rezultat, relaia logic dintre ctiguri i vrst poate s arate ceva
asemntor cu desenul din partea dreapt din figura de mai jos. Ctigurile vor crete pn la un
nivel anumit, apoi cu naintarea n vrst vor descrete. Aa o relaie teoretic poate fi modelat
cu ajutorul ecuaiei ptratice: Z i = 0 + 1Vi + 2Vi 2 + L + i . Care se ateapt a fi semnele pentru
) )
55
Y
Y
unghiulare sunt:
= 12 ;
= 2 ; coeficientul unghiular pentru variabila independent
X 1
X1
X 2
+ t .
Estimarea acestei ecuaii prin metoda celor mai mici ptrate ofer urmtoarea ecuaie:
Wt = 0.00679 + 0.1842(1 / U t ) ; R 2 = 0.397
(0.0590)
t =3.20
13.7 Probleme care apar odat cu alegerea formei funcionale incorecte
Ceea mai bun cale de a selecta pentru modelul de regresie o form funcional corect
const n alegerea specificaiei care n cel mai reuit mod se potrivete teoriei ce st la
fundamentarea ecuaiei. n majoritatea cazurilor forma liniar va fi o form adecvat. Iar pentru
majoritatea cazurilor rmase, bunul simi a demonstra o alegere concret dintre formele simple
de alternativ prezentate mai jos.
Ecuaia
Coeficientul Elasticitatea
unghiular
Y X
Y
=
Liniar
Yi = o + 1 X i + i
Log complet
ln Yi = o + 1 ln X i + i
Semilog ( ln X )
Yi = o + 1 ln X i + i
Semilog ( ln Y )
Polinomial
Invers
=
X Y
Xi
Yi
ln Yi = o + 1 X i + i
1
1
Xi
1Yi
Yi = o + 1 X i + 2 X i2 + i
1 + 2 X i
1
Yi = o + 1
Xi
1
1 2
Xi
X2
+ 2 2 i
Yi
1
1
X i Yi
+ i
Yi
Xi
1
Yi
1 X i
Xi
Yi
Oricum, din cnd n cnd, apar circumstane n care modelul din considerente logice este
neliniar n variabile, ns forma exact a acestei neliniariti este greu de conceput. n aa caz,
forma liniar nu este corect, i chiar alegerea dintre diverse forme neliniare nu poate fi fcut
n baza teoriei economice. Oricum, tocmai n aceste cazuri, rmne s ne achitm (n termenii
nelegerii relaiei adevrate) pentru evitarea alegerii formei funcionale numai n baza
aproximrii reuite. Se pot da dou rspunsuri la aceast problem:
1. R 2 este greu de comparat atunci cnd variabilele dependente sunt transformate.
2. Forma funcional incorect poate prezenta o aproximare rezonabil a observaiilor, dar are
potenial mare de a produce erori n pronosticare, cnd se efectueaz previziunea n afara
regiunii observabile.
57
[Y
=1
) 2
anti ln(ln Yi )
[Y
Y ]
R 2 i
prin altul R 2 = 1 (1 R 2 )
(n 1) , de unde rezult c
(n k 1)
intact atunci cnd se introduce o variabil adiional n ecuaie, depinde de faptul dac se
mbuntete aproximaia cauzat de includerea variabilei noi n depirea pierderii gradelor de
libertate.
n concluzie, avertizarea e urmtoarea: de fiecare dat trebuie de inut cont de faptul c
calitatea potrivirii ecuaiei estimate este numai una din msurile ce contribuie la calitatea
58
Date cruciate, pentru care pentru n momentul de timp fixat se cerceteaz diferite
obiecte.
Date de panou, care reprezint date de chestionare, date experimentale i constituie cele
mai veridice date.
14.2 Surse de date economice
Anuare statistice ale republicii Moldova.
Buletine statistice trimestriale, Chiinu
Evoluia social-economic a Republicii Moldova, MER, Chiinu
Buletine ale Bncii Naionale din Moldova.
Tendine n economia Moldovei.
International Financial Statistics pub
International Monetary Fun.
Piaa financiar, revist Chiinu
World Economic Outlook
www.IREX.RU/PUBLICATIONS/POLEMICA/5/ARTY.HTM
www.WEFA.com
www.CIRS-md.org
www.met.dnt.md
http://ecfor.rssi.ru
http://www.inf.org/external/country/index.htm
14.3.1 Variabile proxy sau variabile delegate
Variabilele proxy se utilizeaz pentru substituirea variabilelor teoretice necesare atunci
cnd datele pentru variabilele respective sunt incomplete sau n genere lipsesc. De exemplu,
valoarea investiiilor nete este o variabil care nu se evalueaz ntr-un numr relativ mare de
ri. Prin urmare, cercettorul poate folosi valorile investiiilor brute ca variabil proxy n
condiiile n care se presupune c valoarea investiiilor brute este direct proporional valorii
investiiilor nete. Proporionalitatea este tot ce e necesar, deoarece analiza regresional este n
primul rnd o relaie dintre schimbri n valorile variabilelor dect schimbri n nivelul absolut a
variabilelor.
n general variabila proxy este o variabil delegat bun, atunci cnd schimbrile ei
relativ bine reflect schimbrile n variabila teoretic corect.
Datele lipsesc sau sunt incomplete:
Date ncruciate: lipsesc careva date din una sau mai multe observaii, atunci acestea
observaii pot fi eliminate.
Serii temporale: lipsesc date pentru careva perioade de timp, atunci se estimeaz datele
omise prin interpolare, folosind media datelor adiacente.
Datele sunt trimestriale, dar sunt disponibile numai date anuale, atunci se interpoleaz datele
trimestriale. n orice caz interpolarea poate fi justificat atunci cnd schimbarea variabilei
este lent i neted.
Atunci cnd datele lipsesc complet problema se agraveaz. Omiterea variabilelor relevante
creeaz deplasri. De fapt, un proiect regresional reuit poate fi stopat din cauza datelor
inadecvate. n multe cazuri chiar i o tehnic regresional simpl nu poate fi aplicat deoarece
informaia este ironat. Uneori ea este msurat cu attea erori nct utilizatorul numai formeaz
tabele i construete grafice pentru a trage concluzii. Printre altele, aceste tabele i grafice
servesc ca material auxiliar de folos la fundamentarea ecuaiei de regresie.
14.3.2 Utilizarea ntrzierei n timp n Economie i Econometrie
60
Majoritatea regresiilor studiate sunt instantanee dup natura lor. Cu alte cuvinte, ele includ
valorile variabilelor dependent i independente n aceiai perioad de timp:
Yt = 0 + 1 X 1t + 2 X 2t + t , indicele t se refer la puncte distincte n timp, i atunci cnd toate
variabilele au acelai indice, ecuaia este instantanee n timp. Dar nu toate situaiile n economie
sau busines implic relaii instantanee n timp ntre variabila dependent i variabilele
independente. n multe cazuri este necesar de a oferi posibilitatea ca s treac ceva timp ntre
schimbrile n variabila independent i schimbarea rezultativ n variabila dependent. Durata
acestui timp dintre cauz i efect se numete lag. Multe ecuaii econometrice includ una sau mai
multe variabile independente cu ntrzieri n timp cum ar fi X t 1 , unde indicele t 1 indic c
observaia X t 1 s refer la perioada de timp ce preced momentul de timp t , cum ar fi n
ecuaia ce urmeaz:
Yt = o + 1 X 1t 1 + 2 X 2t + t . Orice schimbare pe piaa agricol, cum ar fi creterea n pre care
fermierul poate s-o ctige pentru promovarea produsului, are un efect ntrziat asupra ofertei
produsului, Cantitatea oferitt=f(Pret-1, etc). Similar, multe teorii macroeconomice au o
structur explicit ntrziat ncorporat n ele. Durata n timp dintre deciziile luate cu privire la
aa politici macroeconomice (ca cheltuieli guvernamentale sau creterea n oferta de mijloace
bneti) i impactul acestora asupra Produsului Intern Brut, angajarea n serviciu sau preuri, de
regul, se msoar n ani. Creterea ofertei de bani stimuleaz Produsului Intern Brut n partea
simulrii investiiilor, dar investiiile nu pot crete peste noapte deoarece deciziile necesit a fi
luate, planurile necesit a fi formate, lucrtori adiionali necesit a fi angajai i aa mai departe.
ntradevr, cum a notat economistul Milton Friedman, odat estimate schimbrile n politica
monetar iau de la 6 pn la 30 de luni pentru a fi complet plsate n economie.
Dac este formulat ipoteza pentru un lag simplu, apar dificulti n folosirea lagului n
ecuaiile econometrice. Variabila cu ntrziere n timp este introdus n ecuaia econometric ca
i o alt variabil independent. De exemplu, ecuaia ofertei de bumbac are o form de:
C t = F ( PC t 1 , PFt ) = 0 + 1 PC t 1 + 2 PFt + t ,
(*)
unde
Ct
- ofertei de bumbac n anul t ;
PC t 1 - preul bumbacului n anul t 1 ;
PFt - costul muncii de fermier n anul t .
Semnificaia coeficientului de regresie pentru variabilele cu ntrziere nu-i aceiai ca pentru
variabilele fr ntrziere. Coeficientul estimat pe lng variabil cu ntrziere msoar
schimbrile n valoarea Y din anul curent atribuit la schimbarea cu o singur unitate n
valoarea variabilei X din anul trecut (fiind pstrate constante valorile pentru altele variabile
independente X s n ecuaie). Deci parametrul 1 msoar (n ecuaia *) numrul unitilor de
bumbac care vor fi produse n plus n anul curent n urma schimbrii cu o unitate a preurilor la
bumbac n anul trecut, preul muncii fermierului rmnnd ne schimbat.
14.3.3 Variabile dummy
Unele din variabile (de exemplu - genul) pot fi explicate numai n mod calitativ. Aa
variabile n cele mai multe cazuri sunt calificate ca variabile binare sau variabile dummy.
Variabilele dummy iau valori de 1 sau 0 n dependen de faptul ndeplinirii sau ne
ndeplinirii al anumitei condiii.
Ca s ilustrm aceasta, vom presupune c Yi reprezint salariul nvtorului i colar i
nivelul lui de pregtire depinde n primul rnd de gradul obinut i de experiena de nvtor.
Toi nvtorii au B., A. , dar unei din ei au M . A. i atunci, ecuaia care reprezint relaia dintre
ctigul nvtorului i gradul obinut de el poate avea forma:
Yi = 0 + 1 X 1i + 2 X 2i + i , unde
61
modul urmtor.
1) dac nvtorul are numai gradul de B., A. , X 1 = 0 i E Yi X = 0 + 2 X 2i
i
Comparnd aceste dou situaii tragem concluzia c 1 reprezint ctigul mediu adiional
obinut de nvtorul care are gradul de master n raport cu ctigul nvtorului care are numai
de gradul de bacalavr, ambii avnd aceiai experien de munc. Abilitatea de a postula semnul
coeficientului de regresie este esenial n analiza regresional. Astfel variabila dummy este
numit variabil dummy de intersecie deoarece ea n realitate schimb punctul de intersecie
a regresiei n dependen de faptul dac are nvtorul gradul de master sau nu.
O formulare de alternativ a modelului de regresie va fi dac vom defini X 1i ca:
0, daca invatatorul "i" are . .
X 1i =
1, in caz contrar
Aceste condiii schimb politica. n acest caz 1 va fi interpretat ca diferena dintre ctigul
mediu al nvtorului cu gradul de B., A. i acel nvtor care are gradul de M . A. , i semnul se
presupune a fi negativ. Deoarece coeficientul 1 a variabilei definite vine cu semnul invers, el
va avea aceiai amplitud absolut ca i 1 pentru variabila original. Sensul const n aceia c
aceti doi coeficieni msoar exact acelai eveniment (dar n direcii opuse). n acest sens
definiia variabilelor dummy este arbitrar. ns, odat ce ele au fost definite, o singur
interpretare poate fi prezentat.
E de menionat, c n acest exemplu s-a folosit o singur variabil dummy chiar dac au
existat dou condiii. Aceasta se ntmpl din cauza c condiiile se construiesc n baza unei
singuri variabile. Evenimentul nu este prezentat explicit de variabila dummy, condiia omis
formeaz baza cu care condiia inclus se compar. Astfel, n situaiile duale (de felul M . A. i
B., A. ), numai o singur variabil dummy se include fiind independent; coeficientul este
interpretat ca efectul condiiei incluse n raport cu condiia omis. Dac a treia condiie (cum ar
fi existena Ph.D) va fi inclus, atunci numai dou variabile vor fi folosite.
Y
Yi = 0 + 1 + 2 X 2i
M . A.
Yi = 0 + 2 X 2i
0 + 1
0
B. A.
X2
62
in trimestru II
in celelalte
in trimestru III
in celelalte
....................................................
yn = an1 x1 + an 2 x2 + K + anm xm + n.
Numrul factorilor xi n fiecare ecuaie poate s varieze n raport cu numrul limit. Modelul ce
de valorile teoretice n limita unei valori de eroare stocastic, n fiecare ecuaie este prezent
valoarea erorii stocastice.
n consecin, sistemul de ecuaii independente cu trei variabile dependente i patru variabile
independente (patru factori) ia forma:
y1 = a01 + a11 x1 + a12 x2 + a13 x3 + a14 x4 + 1,
....................................................
yn = bn1 y1 + bn 2 y2 + K + bnm 1 ym + an1 x1 + an 2 x2 + K + anm xm + n.
n acest sistem variabila dependent y include n fiecare ecuaie ulterioar n calitate de factori
toate variabilele dependente din ecuaiile anterioare, la fel i mulimea factorilor x . Ca exemplu
unui atare sistem poate servi modelul de productivitate al muncii i modelul de randament al
fondurilor fixe sub forma ce urmeaz:
y1 = a11 x1 + a12 x2 + a13 x3 + 1,
...............................................................................................
yn = bn1 y1 + bn 2 y2 + K + bnn 1 yn 1 + an1 x1 + an 2 x2 + K + anm xm + n.
unde y1 este ritmul de schimbare al salariului lunar; y2 este ritmul de modificare al preurilor;
x1 este procentul neangajailor n cmpul muncii; x2 este ritmul de schimbare a capitalului fix;
x3 este ritmul de modificare al preurilor de import la materia prim.
15.2. Formele structural i redus ale sistemului de ecuaii simultane
Sistemul de ecuaii comune, simultane (sau forma structural a modelului) de regul este
constituit din variabile endogene i exogene.
Variabilele endogene se noteaz prin y n sistemul de ecuaii examinat anterior. Acestea sunt
variabile dependente i numrul lor este egal cu numrul ecuaiilor din sistem.
Variabilele exogene se noteaz, de regul, prin x . Acestea sunt variabile predeterminate, care
influeneaz variabilele dependente, ns care nu depind de cele din urm.
Ceea mai simpl form structural a modelului se exprim ca:
y1 = b12 y2 + a11 x1 + 1,
y2 = b21 y1 + a22 x2 + 2 ,
unde y sunt variabile endogene; x sunt variabile exogene.
Clasificarea variabilelor n endogene i exogene depinde de conceptul teoretic adoptat n
model. Variabilele economice pot fi interpretate ca variabile endogene ntr-un model, dar n alte
modele aceleai variabile se vor produce ca variabile exogene. n calitate de variabile exogene
pot fi considerate valorile variabilelor endogene pentru perioada precedent de timp (variabile
ntrziate). Deci, consumul anului curent ( yt ) este posibil s depind nu numai de factori
economici, dar i de consumul n anul precedent ( yt 1 ). Variabile extraeconomice (cum ar fi,
condiiile climaterice) iau parte din sistem n calitate de variabile exogene.
Modelul sub forma sa structural permite evidenierea impactului oaricrei variabile
exogene asupra variabilelei endogene. Este oportun ca n calitate de variabile exogene s fie
selectate variabilele, care pot fi tratate ca instrumente de control. Modificndu-le i ghidndu-le,
avem posibilitatea s obinem anticipat valorile obiectiv ale variabilelor endogene. Modelul sub
forma sa structural ncorporeaz pe lng variabilele endogene i cele exogene coeficienii ais
bik , care se numesc coeficieni structurali ai modelului. Toate variabilele modelului sunt
exprimate n devieri de la valorile medii, nct prin variabila x se subnelege x x , dar prin
variabila y - respectiv y y , prin urmare terminul liber lipsete din fiecare ecuaie.
Folosirea M.C.M.M.P. pentru estimarea coeficienilor structurali, conform teoriei, de regul,
ne ofer, valori deplasate i neconsistente. Deaceea pentru determunarea coeficienilor
structurali ale modelului, modelul se transform ntr-o form, numit forma redus a modelului.
Forma redus a modelului reprezint un sistem de ecuaii neliniar n raport cu coeficienii de pe
lng variabilele endogene i exogene din modelul sub forma sa structural:
)
y1 = 11 x1 + 12 x2 + K + 1m xm,
y) = x + x + K + x ,
2
21 1
22 2
2m m
....................................................
y)n = n1 x1 + n 2 x2 + K + nm xm ,
formei structurale, exprimnd coeficienii formei reduse a modelului ij prin coeficienii formei
structurale a modelului ais bik . n scopul simplitii n model nu este inclus termenul erorii
stocastice. Pentru modelul structural sub forma:
)
y1 = b12 y2 + a11 x1
y1 = 11 x1 + 12 x2 ,
forma redus se prezint ca:
)
y2 = b21 y1 + a22 x2 ,
y2 = 21 x1 + 22 x2 ,
Din prima ecuaie a modelului structural y2 pooate fi exprimat n felul urmtor: y2 =
y1 a11 x1
.
b12
y2 = y1 a11 x1 b12
y2 = b21 y1 + a22 x2 ,
y1 a11 x1
= b21 y1 + a22 x2 , i atunci y1 b12b21 y1 = a11 x1 + b12 a22 x2 sau
b12
y1 = a11 x1 /(1 b12b21 ) + b12 a22 x2 /(1 b12b21 ) .
Deci, prima ecuaie din forma structural este prezentat ca ecuaie a formei de model redus:
y1 = 11 x1 + 12 x2 . Din ecuaia dat urmeaz, c coeficienii formei reduse a modelului sunt relaii
neliniare n raport cu coeficienii formei structurale a modelului, deci 11 = a11 /(1 b12b21 ) ,
12 = b12 a22 /(1 b12b21 ) .
Prin analogie putem demonstra, c coeficienii din ai doilea ecuaie ( 21 , 22 ) ai formei
reduse a modelului la fel se afl ntr-o relaie neliniar fa de coeficienii formei structurale a
modelului. n acest scop vom exprima variabila y1 din a doua ecuaie structural ca
y2 a22 x2
sau, dac nscriem aceasta expresie n partea stng a primei ecuaii din forma
b21
structural a modelului, obinem ( y2 a22 x2 ) / b21 = b12 y2 + a11 x1 .
a b
a22
De unde avem y2 = 11 21 x1 +
x2 , ceea ce corespunde ecuaiei din forma redus a
1 b21b12
1 b21b12
modelului: y2 = 21 x1 + 22 x2 deci 21 = a11b21 /(1 b21b12 ) 22 = a22 /(1 b21b12 ) .
y1 =
y = c + x,
parametrii dependenei liniare ai variabilei endogene c de variabila endogen y . Estimrile lor
ecuaii
va
c = A0 + A1 x
.
y = B0 + B1 x
alctui:
x = ( y B0 ) / B1 , c = A0 + A1 ( y B0 ) / B1
c = A0 A1B0 / B1 + A1 y / B1 = a + by , a = A0 A1B0 / B1 , b = A1 / B1 .
Din el putem obine valorile variabilei endogene c prin valorile variabilei exogene x .
Calculnd coeficienii modelului ( A0,A1,B0,B1 ), putem trece la coeficienii modelului sub forma sa
structural a, b , substituind n prima ecuaie a modelului sub forma sa redus expresia pentru x
din a doua ecuaie a modelului sub forma sa redus. Forma redus a modelului, dei permite s
obinem valorile variabilei endogene prin valorile variabilei exogene, n sens analitic este
67
inferioar modelului sub forma sa structural, deoarece n ea lipsesc legturile dintre variabilele
endogene.
16. Problema de identificare a modelului sub forma sa redus
Odat cu trecerea de la modelul sub forma sa redus la modelul sub forma sa structural,
cercettorul se confrunt cu problema de identificare. Identificarea nu e altceva dect
corespunderea univoc dintre forma redus i forma structural a modelului.
Vom examina problema de identificare pentru cazul sistemului de ecuaii cu dou variabile
endogene. Fie c modelul sub forma sa structural este exprimat ca:
y1 =b12 y2 + a11 x1 + a12 x2 + K + a1m xm,
unde y1 i y2 sunt variabile dependente simultane.
x1 K 2 m xm .
b21 b21
b21
Atunci n sistem avem dou ecuaii pentru o singur variabil endogen y1 cu acelai set de
variabile
exogene
dar
cu
coeficieni
diferii
pe
lng
ele:
Existena a dou variante de calcul pentru coeficienii structurali ai aceluiai model ine de
identificarea incomplet a celei din urm. Modelul sub forma sa structural complet coninnd
n fiecare ecuaie din sistem n variabile endogene i m variabile exogene, este constituit
din n(n 1 + m) parametri. Deci, cu n = 2 i m = 3 , prezentarea complet a modelului sub forma
y1 =b12 y2 + a11 x1 + a12 x2 + a13 x3,
. Observm, c modelul conine opt
y
=
b
y
+
a
x
+
a
x
+
a
x
,
2
21
1
21
1
22
2
23
3
sa structural easte:
y2 = 21 x1 + 22 x2 + 23 x3
ase coeficieni ai modelului redus este necesar s determinm opt coeficieni structurali ai
modelului structural, ceea ce, n mod natural, nu poate conduce la o soluie unic. Modelul
structural complet conine mai muli parametri dect modelul redus. Respectiv n(n 1 + m)
parametri ai modelului structural nu pot fi determinai n mod univoc cu ajutorul nm parametri ai
modelului redus.
Pentru a obine soluia unic posibil pentru modelul structural este necesr s presupunem,
c unii dintre coeficienii modelului, demonstrnd o relaie insuficient a factorilor cu variabila
endogen din partea stng a sistemului, sunt egali cu zero. n aa mod se va micora numrul
coeficienilor structurali din model. Deci, dac vom admite, c n modelul examinat
a13 = 0 , a21 = 0 , modelul structural se va prezenta ca:
y1 =b12 y2 + a11 x1 + a12 x2,
. n acest model numrul coeficienilor structurali nu depete numrul
y
=
b
y
+
a
x
+
a
x
21 1
22 2
23 3
2
coeficienilor din modelul redus, care este egal cu 6. Micorarea numrului coeficienilor
structurali din model este posibil i n alt mod: de exemplu prin egalarea unor coeficieni ntre
68
ei, deci prin admiterea, c impactul lor asupra variabilei endogene este acelai. Asupra
coeficienilor structurali pot fi aplicate restricii de felul bij + aij = 0 .
De pe poziia de identificare modelele structurale pot fi mprite n trei categorii:
modele ce pot fi identificate;
modele ce nu pot fi identificate;
modele ce sunt supraidentificate.
Modelul poate fi identificat, dac toi coeficienii structurali sunt determinai n mod inivoc, deci
numrul de parametri din modelul structural este egal cu numrul de parametri din modelul
redus. n acest caz coeficienii structurali din model sunt evaluai prin parametrii modelului
redus i este posibil de identificat modelul. Modelul structural cu dou variabile endogene i trei
variabile exogene, examinat anterior, care conine ase coeficieni structurali reprezint un
model identificat.
Modelul nu poate fi identificat, dac numrul coeficienilor redui e mai mic dect numrul
coeficienilor structurali, prin urmare coeficienii structurali nu pot fi estimai cu ajutorul
coeficienilor modelului sub forma sa redus. Modelul structural complet, care conine n
variabile endogene i m variabile exogene (predeterminate) n fiecare din ecuaiile sistemului,
nu poate fi identificat.
Modelul este supraidentificat, dac numrul coeficienilor redui e mai mare dect numrul
coeficienilor structurali. n acest caz cu ajutorul coeficienilor modelului sub forma sa redus
pot fi obinute dou sau mai multe valori pentru un singur coeficient structural. n atare model
numrul coeficienilor structurali e mai mic dect numrul coeficienilor modelului sub forma sa
redus. Deci, dac n modelul structural complet se admite c unii coeficieni iau valori nule
a13 = 0 , a21 = 0 , dar i a22 = 0 , atunci sistemul de ecuaii devine supraidentificat:
y1 =b12 y2 + a11 x1 + a12 x2,
. n acest sistem cinci coeficieni structurali nu pot fi determinai univoc
y2 = b21 y1 + a23 x3
folosind ase coeficieni din modelul sub forma sa redus. Modelul supraidentificat, spre
deosebire de modelul, care nu poate fi identificat, practic poate fi soluionat, ins necesit
procedee speciale pentru calcularea parametrilor.
Modelul structural este un sistem de ecuaii simultane, n care orice ecuaie necesit a fi
verificat privind subiectul de identificare. Modelul se consider identificabil, dac fiecare
ecuaie din acest sistem poate fi identificat. n cazul n care cel puin o ecuaie, care face parte
din sistem, nu poate fi identificat, i atunci modelul integral se consider imposibil de
identificat. Modelul supraidentificat conine cel puin o ecuaie, care este supraidentificat.
ndeplinirea condiiilor de identificare ale modelului se verific pentru fiecare ecuaie din
sistem. Pentru ca ecuaia s fie identificat este necesar ca numrul variabilelor predeterminate,
care nu fac parte din ecuaie ns este prezent n sistem, s fie egal cu numrul variabilelor
endogene, prezente n ecuaia examinat, fr una.
Dac s notm numrul variabilelor endogene n ecuaia j prin H , iar numrul variabilelor
exogene, care fac parte din sistem, ns nu sunt incluse n ecuaia n examinare, prin D atunci
condiia de identificare a modelului va lua forma urmtoarei reguli:
D + 1 = H - ecuaia poate fi identificat;
D + 1 < H - ecuaia nu poate fi identificat;
D + 1 > H - ecuaia este supraidentificat.
Admitem, c se consider urmtorul sistem de ecuaii simultane:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
Prima ecuaie este exact identificat deoarece n ea sunt prezente trei variabile endogene y1 , y2 , y3 , deci H = 3 , i dou variabile exogene - x1 , x2 , numrul variabilelor exogene absente
este egal cu doi - x3 i x4 , D = 2 . Rezult c se ndeplinete egalitatea: D + 1 = H , .. 2 + 1 = 3 ,
ceea ce nseamn prezena ecuaiei identificabile.
n a doua ecuaie din sistem H = 2 ( y1 i y2 ) i D = 1 ( x4 ). Are loc egalitatea D + 1 = H ,
1 + 1 = 2 . Prin urmare, a doua ecuaie este identificabil.
Din a treia ecuaie desprindem, c H = 3 ( y1 , y2 , y3 ) ir D = 2 ( x1 , x2 ), deci, n conformitate
cu regula de calcul D + 1 = H , i aceasta ecuaie este identificabil. n aa mod este identificabil
sistemul integral.
S admitem c n modelul examinat a21 = 0 , a33 = 0 , atunci sistemul ea forma:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
Prima ecuaie din acest sistem nu s-a modificat. Sistemul continuie s conin trei variabile
endogene i patru variabile exogene, deaceea pentru aceast ecuaie D = 2 i H = 3 i ea este
identificabil. A doua ecuaie d dovad de H = 2 i D = 2 ( x1 , x4 ), i regula de calcul ne ofer
2 + 1 > 2 . Prin urmare aceast ecuaie este supraidentificat. La fel se adeverete c este
supraidentificat i a treia ecuaie, n care H = 3 ( y1 , y2 , y3 ) i D = 3 ( x1 , x2 , x3 ), deci regula de
calcul demonstreaz inegalitatea: 3 + 1 > 3 sau D + 1 > H . Modelul integral este supraidentificat.
S presupunem, c ultima ecuaie din sistemul cu trei variabile endogene ea forma:
y3 = b31 y1 + b32 y2 + a31 x1 + a32 x2 + a34 x4, deci spre deosebire de ecuaia precedent n ea au fost
incluse nc dou variabile exogene, care fac parte din sistem x1 , x2 . n acest caz ecuaia devine
neidentificabil deoarece cu H = 3 i D = 1 , D + 1 < H , ir 1 + 1 < 3 . n pofida faptului, c prima
ecuaie este identificat, a doua ecuaie este supraidentificat, de aici rezult c modelul se
consider neidentificat, deci nu are soluie statistic.
Pentru estimarea coeficienilor modelului structural este necesar ca sistemul de ecuaii s fie
posibil de identificat sau acest sistem de ecuaii s fie supraidentificat.
Regula de calcul considerat reprezint o condiie necesar ns nu i suficient pentru ca
sistemul de ecuaii s fie posibil de identificat. O condiie mai perfect se determin n cazul n
care asupra coeficienilor matricei formate din parametrii modelului structural se aplic unele
condiii. Ecuaia poate fi identificat, dac n baza variabilelor endogene i exogene, care nu fac
parte din ecuaie, poate fi obinut o matrice din coeficienii ei pe lng alte ecuaii din sistem,
determinantul creia nu este egal cu zero iar rangul matricei nu e mai mic dect numrul
variabilelor endogene din sistem fr una.
Oportunitatea verificrii condiiei de identificare a modelului prin determinantul matricei
formate din coeficieni pe lng variabilele ce lipsesc n ecuaia examinat, dar care sunt
prezente n alte ecuaii ai sistemului, se explic prin faptul c e posibil situaia, pentru care
regula de calcul este ndeplinit, ns determinantul matricei pe lng coeficienii numii este
egal cu zero. n acest caz are loc numai condiia necesar pentru a fi identificat ecuaia
examinat, n timp ce condiia suficient este violat.
S considerm urmtorul model structural:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
y2 = b21 y1 + a22 x2 + a23 x3 + a24 x4 , Vom verifica fiecare ecuaie din sistem n vederea ndeplinirii
y = b y + b y + a x + a x .
31 1
32 2
31 1
32 2
3
condiiei necesare i condiiei suficiente pentru a fi identificat ecuaia. Pentru prima ecuaie are
loc: H = 3 ( y1 , y2 , y3 ) i D = 2 ( x3 , x4 lipsesc, atunci D + 1 = H i condiia necesar de
identificare este satisfcut, prin urmare, ecuaia este exact identificat. Pentru verificarea
70
condiiei suficiente se va completa urmtorul tabel, format din coeficienii pe lng variabilele
care nu fac parte din prima ecuaie. Determinantul acestei matrice este egal cu zero, detA=0.
Ecuaii
Variabile
2
3
x3
x4
a23
a24
0
0
n a doua ecuaie avem: H = 2 ( y1 , y2 ) i D = 1 ( x1 lipsete), regula de calcul confirm
faptul, c ecuaia este posibil de identificat ( D + 1 = H ). Este ndeplinit i condiia suficient
pentru a fi identificat ecuaia n cauz. Coeficienii de pe lng variabilele, care nu fac parte din
a doua ecuaie formeaz urmtoarea matrice:
Ecuaii
Variabile
y3
x1
2
b13
a11
3
-1
a 31
n conformitate cu acest tabel, det A 0 , rangul matricei este egal cu 2, ceea ce corespunde
urmtorului criteriu: rangul matricei formate din coeficieni trebuie s fie nu mai mic dect
numrul variabilelor endogene fr una, deci a doua ecuaie poate fi exact identificat.
A treia ecuaie din sistem conine 2 variabile endogene i dou variabile exogene, care nu
aparin ecuaiei i H = 3 D = 2 , deci n conformitate cu condiia necesar aceast ecuaie este
exact identificat ( D + 1 = H ). O concluzie contrar obinem verificnd condiia suficient de
identificare. S alctuim tabelul coeficienilor de pe lng variabilele, care nu aparin acestei
ecuaii, din care conchidem c det A = 0 :
Ecuaii
Variabile
x3
x4
2
0
0
3
a24
a23
Din tabel observm c se violeaz condiia suficient de identificare, prin urmare ecuaia nu
poate fi identificat. i atunci modelul structural examinat nu poate fi identificat n ansamblu,
deoarece, dat fiind satisfcut condiia necesar, este violat condiia suficient.
Deseori n modelele econometrice odat cu ecuaiile, parametrii crora necesit a fi estimai
statistic, se folosesc identiti de balan cu participarea variabilelor din model, coeficienii de
pe lng aceste variabile sunt egali cu 1 . Pentru acest caz, nectnd la faptul c nsui
identitile nu necesit verificare n privina identitii, n verificarea ecuaiilor structurale din
sistem aceste identiti particip.
De exemplu, s parcurgem la examinarea modelului econometric ce descrie economia unei
ri:
y1 = A01 +b13 y3 + b14 y4 + 1
y = A + b y + a x + ,
2
02
23 3
21 1
2
,
y4 = y1 + y2 + x2
unde y1 sunt cheltuielile de consum final pentru anul curent; y2 sunt investiiile brute n anul
curent; y3 sunt cheltuielile pentru salarizare n anul curent; y4 este venitul brut pentru anul
curent; x1 este venitul brut pentru anul precedent; x2 sunt cheltuielile guvernamentale n anul
curent; A0i este termenii liber din ecuaia i ; i este eroarea stocastic din ecuaia i . Din acest
model fac parte patru variabile endogene ( y1 , y2 , y3 , y4 ), de menionat c una dintre ele, y4
este definit cu ajutorul unei identiti. i atunci, soluia statistic este necesar numai pentru
71
primele trei ecuaii ai modelului, care este necesar de verificat n vederea identificrii. Modelul
conine dou variabile predeterminate, una dintre care x2 este exogen iar alta este ntrziat x1 .
La soluionarea practic a problemei n baza informaiei statistice pentru un ir de ani sau n
baza unei totaliti de regiuni pentru un singur an n ecuaiile pentru variabilele endogene y1 ,
y2 , y3 , de regul, particip termenul liber A0i , i = 1,3 , valoarea cruia cumuleaz impactul
factorilor care nu au fost inclui n model i nu are nici o influen asupra problemei de
identificare a modelului.
Deoarece datele reale referitor la variabilele endogene y1 , y2 , y3 pot s difere de la acele
teoretice, postulate n model, este oportun ca n model s se introduc componenta aleatoare
pentru fiecare ecuaie din model, cu excepia identitilor. Componenta aleatoare (devierile),
notate ca i nu influeneaz soluionarea problemei de identificare a modelului.
n modelul econometric examinat prima ecuaie din sistem poate fi identificat deoarece
pentru ea H = 3 , D = 2 i are loc condiia necesar de identificare ( D + 1 = H ). Plus la aceasta,
este veridic i condiia suficient de identificare, n aa fel c rangul matricei respective este
egal cu 3 , iar determinantul ei nu este egal cu zero det A 0 .
Ecuaii
y2
x1
x2
2
-1
0
a21
0
3
0
a31
4
1
0
1
La fel i a doua ecuaie din sistem este exact identificat deoarece are loc: H = 2 D = 1 , deci
se realizeaz regula de calcul ( D + 1 = H ), n acelai timp are loc i condiia suficient de
identificare, i anume: rangul matricei examinate este egal cu 3 , dr determinantul ei nu este
egal cu zero: det A = b34 :
Ecuaii
y1
y4
x2
0
1
-1
b14
3
0
0
b34
4
1
-1
1
n mod analogic se identific i a treia ecuaie din sistem deoarece H = 2 D = 1 , deci se
ndeplinete regula de calcul ( D + 1 = H ), n acelai timp se ndeplinete i condiia suficient de
identificare, care constat c rangul matricei este egal cu 3 , ir determinantul ei nu este egal cu
zero: det A = 1 .
Ecuaii
y1
y2
x2
Ecuaii
1
2
4
-1
0
1
0
-1
1
0
0
1
73
REFERINE
1. . ., . . :
. , , 1998.
2. . . , , 1980.
3. . -
. . . , , 2001, 343 .
4. dr. Nicos Economou. An Estimation of the Potential Output and the Output Gap of the
Moldovan Economy.Chisinau, MER, TACIS. Moldovan Economic Trends, 2002, q.4.,
pp.85-93.
5. . . , , 1976.
6. .
, . . , - ,
. . , , . . .
, , 2005, 353 .
7. dr. Apostolos Papaphilippou. An Econometric Estimation of the Import Demand in
Moldova. Chisinau, MER, TACIS. Moldovan Economic Trends, 2001, q.3., pp.93-99.
8. Ion Prachi, Alexandru Brail, Natalia icanu. Econometrie Aplicat. A.S.E.M.,
Chiinu, 1999, 172 p.
9. Pecican E., Econometrie. Editura All, Bucureti, 1994.
10. Schatteles T. Metode econometrice moderne, Universitas, Chiinu, 1992.
11. A. H. Studenmund. Using Econometrics (second edition). Washington. HarperCollins
Publishers Inc. 1992, 662 p.
12. . . , , 1978.
13. . . . , ,
1977.
14. Zaman C. Econometrie, Bucureti, 1998.
74
ANEXE
LUCRAREA DE LABORATOR Nr. 1
EVALUAREA ECONOMETRIC A FUNCIEI CERERII PENTRU IMPORT
Etapa I. Regresia static
S se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat sub
forma logaritmic complet:
lnMt = 0 + 1lnYt+ 2lnPt, unde
(1),
Mt importurile reale trimestriale, exprimate n $ SUA,
Yt produsul intern brut trimestrial, exprimat n $ SUA,
Pt preul relativ trimestrial, care este raportul dintre indicele preului mondial pentru import i
indicele preului de consum Pt=et*Pt*M/IPCt.
Pt*M indicele preului mondial pentru import, date trimestriale;
et - rata de schimb normat la valoarea primului trimestru 1996;
IPCt indicele preului de consum, date trimestriale.
S fie:
a) consultat teoria cu privire la prezentarea analitic a cererii pentru import;
b) specificat modelul;
c) examinate semnele fiecrui coeficient a modelului specificat;
d) selectate datele necesare pentru efectuarea analizei regresionale;
e) folosit metoda celor mai mici ptrate la estimarea i evaluarea formei funcionale propuse
(statisticele Stiudent, coeficienii de determinaie, statistica Fier);
f) documentate rezultatele.
S se introduc variabila binar Dummyt ce va lua n consideraie consecinele crizei
financiare din Russia, anul 1998, care ia forma:
Dummyt = 1 IIItr. 1998, IVtr. 1998, Itr. 1999, IItr. 1999 ,
0 pentru trimestrele rmase.
n continuare s fie examinat n calitate de funcie cererii pentru importa forma
semilogaritmic ce urmeaz:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Dummyt
(2),
S fie executate punctele a)-f) de mai sus.
Etapa II. Regresia dinamic
S se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat sub forma
semilogaritmic cu ntrziere n timp:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Mt-1
(3),
S fie executate punctele a)-f) de mai sus.
i, n final, s se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat
sub forma semilogaritmic cu ntrziere n timp i cu variabila binar Dummyt:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Mt-1 + 3Dummyt
(4).
Trimestrul I al anului 1996 va fi trimestru de baz. n baza ratei de schimb se vor recalcula
datele pentru Produsul Intern Brut real. La calcularea Indicelui Preului de Consum se vor folosi
datele pentru inflaia trimestrial. Valorile indicatorilor reali se calculeaz n baza IPC.
Mt$real=Mt$nom./IPC; Yt$real=Yt$nom./IPC. IPCt=k=tr.bnIPCk*(1+infl.k+1/100).
Datele pot fi selectate de pe www.statistica.md .
75
(ln Y
ln Yt
i trendul
corespunztor ln Yt* . [(ln Yt *+1 ln Yt * ) (ln Yt* ln *t 1 )] reprezint funcia de penalitate care
penalizeaz ptratul devieilor de la rata de cretere a componentelor trendului; factorul ce
prezint ponderea i care controleaz ct de neted este linia trendului obinut.
2
1995
6480
1996
7798
1997
8917
1998
9122
1999
12322
2000
16020
2001
19052
2002
22556
2003
27297
0,3
0,24
0,12
0,08
0,39
0,31
0,10
0,05
0,012
14450
16138
14743
24702
30926
33598
34325
35827
37782
2800
3623
4153
4689
5207
7108
9322
12729
18508
6574
7879
8026
11126
13150
15941
18336
21802
26824
76
Yt = Yt0 c t + A c l
l =t0
1995
1996
1997
1998
1999
2000
2001
2002
2003
PIBtnomlefec
6480
7798
8917
9122
12322
16020
19052
22556
27297
0,3
0,24
0,12
0,08
0,39
0,31
0,10
0,05
0,12
Anii
2004
2005
2006
2007
2008
2009
2010
2011
2012
0,075
0,075
0,075
0,07
0,065
0,06
0,055
0,05
0,05
t
De.PIB2001
PIBtrealefec
De.PIB2001
PIBtnominefect
PIBtprevez
1995-2002.
2. S se calculeze PIB pentru anii 2004-2012 n conformitate cu formula:
Yt = (1 + g ) t Yt
0
s
. Aici v este determinat de principiul de
vs
accelerare, adic I t = v (Yt Yt 1 ) , Yt este produsul intern brut n anul t , iar Yt 1 este produsul
intern brut n anul t 1 , s este norma acumulrilor, s = 1 c , aici c este nclinaia la limit spre
consum, Yt este produsul intern brut n anul t 0 .
0
Etapa IV. Evaluarea salariului nominal i real n baza funciei de producere Cobb-
Douglas.
1. Dat fiind determinai coeficienii funciei de producere Yt = K 1 L n lucrarea precedent,
calculai salariul real ca wt = Yt / Lt = K 1 L 1 , iar salariul nominal wt nom = wt Defl.PIBt ,
Defl.PIBt calculai recent.
2. Pstrnd ritmul de cretere al forei de munc i ritmul de cretere al capitalului, indicat
anterior, ritmul de cretere al produsului intern brut prognoza, determinai salariul real i acel
nominal prognozate.
Tabelul 2. Date istorice
INDICATORII PRINCIPALI
MACROECONOMICI
Produsul intern brut (PIB)
mil.lei
Consumul final:
mil.lei
Formarea brut de capital:
mil.lei
Investiii n capital fix:
mil.lei
1995
1996
1997
1998
1999
2000
2001
2002
6480
7798
8917
9122
12322
16020
19052
22556
5371
7356
8681
9203
11090
16503
19263
23289
1612
1891
2123
2360
2820
3836
4436
4886
844,8
987,4
1202,2
1444,4
1591,8
1759,3
2315,1
2804,2
78
Nr.
Volum
ul Xi
4,6
4,6
4,7
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
5,2
5,4
5,6
5,8
5,9
6,3
6,5
6,8
7,4
7,6
7,1
4,8
5
5,1
5,4
5,5
5,6
6,3
6,3
6,4
7,2
7,4
7,5
8,2
8,4
8,8
4
4
6
6
6
8
8
8
10
10
10
2
2
2
4
4
4
6
6
6
8
8
8
10
10
10
Yiestim.
ui
ui*ui
ln(ui*ui)
ln(Zi)
Yi/Xi
Total
Media
79
Consumul
Yt
84,4
Venitul
Xt
88,0
91,9
94,0
99,2
100,0
104,0
106,0
109,0
110,0
117,8
119,0
7
8
9
10
11
12
13
14
15
16
17
18
Total
Media
122,9
130,0
138,7
149,1
158,0
167,5
177,8
186,6
195,7
208,6
221,5
232,1
127,0
135,0
143,0
155,0
167,0
177,0
186,0
197,0
211,0
228,0
239,0
252,0
Anul
DW*2
dU
1,39
Ytestim
ut
ut*ut
ut-ut-1
ut*ut-1
ut-1*ut-1
Y*t
X*t
Y*testim
u*t
(u*t)
u*t-u*t-1
dL
1,16
Yt-ro*Yt-1=b0+b1*(Xt-ro*Xt-1)
Yt=b0+b1*Xt+ro*Yt-1-b1*ro*Xt-1
1. S se lanseze ecuaia de regresie. S se calculeze statistica DW =Sum(ut-ut1)^2/Sum(ut)^2. S se atrag atenia c suma cu termenul ntrziat conine cu un termen
mai puin.
2. S se afle valorile tabelare pentru dU = DW(N;k;0,05) dL = DW(N;k;0,05), (N este
numrul de observaii, k este numrul variabilelor independente) i s se compare cu
statistica DW calculat.
) n caz cnd DW < dU, termenul rezidual este autocorelat,
S se calculeze ro=Sum(ut*ut-1)/Sum((ut-1))2,
S se efectueze transformarea variabilelor conform formulelor *1=(1-ro)1/2*1; *t=YtYt-1*ro;
X*1=(1-ro)1/2*X1; X*t=Xt-Xt-1*ro.
3. S se estimeze ecuaia de regresie transformat.
4. S se recalculeze statistica DW =Sum(ut-ut-1)^2/Sum(ut)^2. S se execute etapa 2.
b) n caz cnd DW < dU, termenul rezidual nu este autocorelat.
80
X2
X1
X3
X4
74,3
1,0
29,0
15,0
52,0
2
3
4
72,5
83,8
93,1
1,0
1,0
2,0
31,0
40,0
54,0
22,0
23,0
18,0
44,0
34,0
22,0
5
6
102,7
78,5
3,0
7,0
71,0
26,0
17,0
6,0
6,0
60,0
95,9
7,0
52,0
6,0
33,0
109,4
10,0
68,0
8,0
12,0
104,3
11,0
56,0
8,0
20,0
10
11
12
87,6
109,2
113,3
11,0
11,0
11,0
31,0
55,0
66,0
8,0
9,0
9,0
47,0
22,0
12,0
13
115,9
21,0
47,0
4,0
26,0
SumXi
1. S
1,0
29,0
72,5
83,8
93,1
1,0
1,0
2,0
31,0
40,0
54,0
44,0
34,0
22,0
102,7
78,5
3,0
7,0
71,0
26,0
6,0
60,0
95,9
109,4
7,0
10,0
52,0
68,0
33,0
12,0
104,3
11,0
56,0
87,6
109,2
113,3
11,0
11,0
11,0
31,0
55,0
66,0
47,0
22,0
12,0
115,9
21,0
47,0
26,0
X1
X2
X4
tbi
Fi
FL
tbi
Fi
FL
i=
i=
Fi
Fi
<
Fitabel
5,32
<
Fitabel
5,12
<
Fitabel
Y = b0 + b1*X1 + b2*X2
sigma(bi^)
tbi
Fi
Fi
4,96
FL
81