Econometrie Abordări

E C O N O M E T R I E (Abordri speciale)
C U P RI N S
Introducere...................................................................................................................................... 2
1. Analiza regresional. Generaliti ............................................................................................. 3
2. Metoda celor mai mici ptrate................................................................................................... 8
3. Metoda celor mai mici ptrate, exemplu realizat ....................................................................... 9
4. Evaluarea semnificaiei ecuaiei de regresie liniar i a coeficienilor ei ............................... 11
5. Modelul de regresie liniar multifactorial................................................................................ 17
6. Multicoliniaritatea i atenuarea ei ............................................................................................ 22
7. Remedierea multicolinearitii ................................................................................................. 24
8. Corelarea n serie (autocorelarea) ........................................................................................... 28
9. Consecinele corelrii n serie .................................................................................................. 31
10. Eteroschedasticitatea .............................................................................................................. 36
11. Remedierea eteroschedasticiti ............................................................................................. 41
12. Specificaia: alegerea variabilelor independente relevante .................................................... 45
13. Specificaia ecuaiei de regresie: alegerea formei funcionale ............................................... 52
14. Date economice ...................................................................................................................... 59
15. Siseme de ecuaii econometrice ............................................................................................. 63
16. Problema de identificare a modelului sub forma sa redus.................................................... 68
R E F E R I N E ........................................................................................................................ 74
A N E X E .................................................................................................................................... 75
Introducere
Materialul prezentat n continuare a servit ca baz a prelegerilor inute pe parcursul ctorva
ani pentru studenii i masteranzii de diferite specialiti (matematic i informatic, relaii
internaionale, management). Obiectivele propuse se refer la expunerea materialului n aa mod
ca studenii s obin nsuiri practice la utilizarea reuit a instrumentarului de evaluare
cantitativ a proceselor i fenomenelor economice. Accentele au fost puse pe una din abordrile
econometrice, i anume, pe analiza regresionala, ea fiind mai frecvent utilizat n cercetrile
economice i la modelarea activitii economice la diverse nivelt.
O atenie special se pune pe punctarea etapelor ce preced realizarea unei regresii,
ncepnd de la fundamentarea teoretic a evenimentului cercetat, stabilirea variabilei dependente
i a variabilei (variabilelor) relevante independene, alegerea formei funcionale potrivite, i, n
sfirit, colectarea datelor de ncredere, ca apoi sa fie verificate ipotezele care asigur aplicarea
metodei celor mai mici ptrate. n cazul n care una sau mai multe ipoteze sunt violate, s se
determine metoda de estimare a coeficienilor ecuaiei de regresie aprobate.
Atunci, cnd se trag concluzii de rigoare privind metoda de utilizat, se purcede la lansarea
ecuaiei de regresie, folosind Softul specializat, cum ar fi Eviewes, sau, in lipsa acestuia, se
activeaz utilita Data Anayses din Excell, care ofer posibilitatea lansrii modulului
Regression. Dup lansarea ecuaiei de regresie se efectueaz analiza rezultatelor obinute n
vederea semnificaiei att ecuaiei n ntregime, ct i a fierrei variabile independente n parte.
Se confrunt statisticile Fiser si Durbin-Watson, t-statistile calculate cu acelea tabelare
corespunztoare gradului de libertate corespunztor i nivelului de semnificaie selectat. n cazul
n care se confirm ipotezele respective de luare a deciziilor se trece, n caz de necesitate, la
etapa de previziune. Se calculeaz intervalele de ncredere pentru pronosticul punctifer i se
stabilete valoarea prognozat pentru variabila dependent n funcie de valoarea variabilei sau
variabilelor independente examinate.
Se propun procedee de eliminare a fenomenelor de multicoliniaritate, autocorelare n serie i
eteroscedasticitate, care pot fi realizate de sinestttor, fra ca s se apeleze la ajutorul Softu-lui
specializat.
i la finele cursului se examineaz sisteme de ecuaii econometrice care ntr-un mod mai
adecvat descriu procesele i fenomenele economice. Se cerceteaz problema de identificare a
sistemului de ecuaii econometrice simultane. O atenie separat se acord sistemului de ecuaii
simultane cu identiti, care foarte frecvent se ntlnete la modelarea proceselor economice.
Acest curs de lecii este susinut de lucrri practice ce se refer la estimarea ecuaiilor de
regresie pentru funcia de producere i pentru cererea la bunuri i servicii de import. La fel snt
prezentate exemple de soluionat pentru lichidarea fenomenelor de multicolinearitate,
autoregresie, eteroscedasticitate.
Snt prezentate referine bibliografice care au constituit baza acestui curs i au servit ca surs
de date, exemple, materiale ilustrative.
1. Analiza regresional. Generaliti

1.1. Econometria: definiia i utilizarea.
Econometria poate fi definit ca analiza cantitativ a fenomenelor economice reale.
Profesionitii n domeniu definesc econometria sub forma unui set de tehnici fascinante care
permit msurarea i analiza fenomenelor economice i previziunea tendinelor economice pe
viitor. Econometria constituie o definiie formal i un coninut vast. Econometria, literal,
nseamn msurri economice i ea se ocup de msurarea cantitativ i de analiza economiei
reale i a fenomenelor ce in de busines. Ea reprezint o tentativ de a msura economia real i
de a construi un pod deasupra prpstiei ce desparte teoria economic i activitatea de busines
real. Econometria ne permite s examinm datele ce caracterizeaz firmele din lumea real i
s comsurm aciunile acestor firme cu ali factori, cum ar fi aciunile consumatorilor i a
guvernelor.
Econometria are trei direcii de baz de utilizare:
1. descrierea economiei reale;
2. testarea ipotezelor referitor la teoria economic;
3. pronosticarea activitii economice pe viitor.
Cea mai simpl direcie de utilizare a econometriei este descrierea. Econometria ne permite
s evalum activitatea economic; ea ne permite s introducem numere n ecuaii care n
prealabil conineau numai simboluri abstracte. De exemplu, cererea consumatorului pentru un
anumit bun poate fi prezentat ca o relaie dintre cantitatea cerut (C), preul bunului (P), preul
bunurilor de substituie (Ps) i venitul disponibil (Yd). Pentru majoritatea bunurilor relaia dintre
consum i venitul disponibil se presupune a fi pozitiv, deoarece creterea venitului disponibil
se asociaz cu creterea consumului de bunuri. Econometria ne permite s estimm aceast
relaie n baza consumului, venitului disponibil i preurilor nregistrate n trecut.
Cu alte cuvinte, o relaie funcional
C = f(P, Ps, Yd)
(1.1)
Se transform ntr-o relaie explicativ de felul:
(1.2)
C = -60,5-0,45*P+0,12*Ps+12,2* Yd.
Aceast prezentare ne ofer un tablou mult mai specific i descriptiv. S comparm ecuaiile
(1) i (2). Expresia (1) ne comunic: consumul se ateapt s creasc odat cu creterea
venitului disponibil. n timp ce ecuaia (2) ne permite s ateptm o cretere de o cantitate
specific de 12,2 uniti la fiecare unitate de cretere a venitului disponibil. Cifra 12,2 se
numete coeficientul regresiei estimat. i abilitatea econometriei de a aprecia acest coeficient
este valoarea ei.
Al doilea, i probabil cel mai uzual mod de utilizare a econometriei, este testarea ipotezelor.
De exemplu, putem testa, va fi bunul examinat un bun normal (pentru care cererea crete odat
cu creterea venitului disponibil). La prima vedere, se pare c aceasta ipotez poate fi susinut
ntruct semnul coeficientului este pozitiv, ns semnificaia statistic a acestei estimri
urmeaz a fi investigat nainte de a justifica o atare concluzie. Folosirea econometriei n
testarea ipotezelor este, probabil, ceea mai important funcie.
A treia, i ceea mai dificil modalitate de utilizare a econometriei, este pronosticarea sau
previziunea: ce e probabil s se ntmple n trimestrul urmtor, n anul viitor ori mai departe pe
viitor. De exemplu, economitii folosesc modelele econometrice pentru a face previziuni pentru
aa variabile ca: volumul vnzrilor, volumul veniturilor, Produsul Intern Brut, rata inflaiei etc.
Precizia acestor previziuni depinde n ceea mai mare msur de gradul cu care trecutul
dirijeaz viitorul. De exemplu, vom presupune c preedentile companiei, care propune
produsul modelat n ecuaia (1), dorete s decid majorarea preurilor sau pstrarea lor la
acelai nivel. El va pronostica volumul vnzrilor cu i fr creterea preurilor ceea ce l va
3
ajuta n luarea acestei decizii. n acest mod econometria poate fi utilizat nu numai pentru
previziune, dar i pentru analiza politicilor.
1.2. Abordri econometrice de alternativ
Pentru obinerea unui tablou mai reuit al abordrii posibile vom puncta etapele necesare
de efectuat pentru orice investigaie cantitativ:
a) specificarea modelului sau relaiei de studiat;
b) colectarea datelor necesare pentru estimarea modelului;
c) estimarea modelului cu ajutorul datelor.
Etapele ) i b) sunt similare n investigaiile cantitative iar tehnicile utilizate la etapa c) estimarea modelului difer de la o disciplin la alt disciplin. Alegerea tehnicilor pentru
evaluarea modelului, n baza unui set de date specifice, de regul, se refer la arta
econometric. Exist diferite abordri alternative pentru evaluarea unei i aceeai ecuaii, i
fiecare abordare poate oferi rezultate ce difer unul de altul.
n continuare ne vom referi la abordarea ce ine de analiza regresional. ns important e ca
fiecare econometrician s contientizeze: regresia este numai una din tehnicile folosite n
estimarea econometric.
1.3. Ce este analiza regresional?
Analiza regresional este utilizat pentru efectuarea estimrilor cantitative a relaiilor
economice care n prealabil aveau loc doar din punct de vedere pur teoretic. Pentru prezicerea
direciei schimbrilor este necesar de cunoscut teoria economic i caracteristicile generale a
produsului n examinare (de exemplu, dependena volumului de vnzri a discurilor floppy n
funcie de pre). Iar pentru prezicerea schimbrilor n cantitate, sunt necesare un set de date i o
metod de estimare a relaiei propuse. n econometrie cea mai frecvent utilizat metod de
estimare a acestor relaii este analiza regresional.
1.4.
Variabile dependente, variabile independente, justificare

Analiza regresional este o tehnic (o metod) statistic care ncearc s explice
schimbrile unei variabile, variabile dependent (de explicat) ca funcie de schimbrile altei
variabile sau set de variabile, aa numite variabile independente (sau explicative), prin
evaluarea unei singure ecuaii, cum ar fi C = f(P,Ps,Yd). Aici C este variabil dependent (de
explicat), ir P,Ps,Yd variabile independente (explicative). Analiza regresional este un
instrument bine venit pentru economiti deoarece majoritatea afirmaiilor economice pot fi
formulate ntr-o form funcional dintr-o singur ecuaie.
n economie i busines majoritatea afirmaiilor sunt de genul cauz efect: dac preul
bunurilor crete cu o unitate, atunci volumul cererii descrete n mediu cu cteva uniti n
dependen de elasticitatea cererii fa de pre. Prin analogie, dac volumul capitalului utilizat
crete cu o unitate, atunci volumul de producie va crete cu cteva uniti, n funcie de aa
numit productivitate marginal a capitalului. Afirmaiile de acest gen stabilesc relaii de tip
dac atunci, cauzale care postuleaz logic c schimbrile n variabila dependent sunt cauzate
de schimbrile ntr-un numr specificat de variabile independente.
ntruct multe relaii economice sunt dup natura sa cauzale, rezultatul regresiei nu poate
conta pe semnificaia lor, nu poate confirma cauzalitatea. Analiza regresional poate efectua
testarea semnificaiei estimrii relaiilor cantitative. Fundamentarea cauzalitii relaiilor
economice trebuie s includ un suport teoretic solid i un bun sim.
1.5. Modelul liniar de regresie de o singur ecuaie
Y = 0 + 1 X
(1.3)
4
este cel mai simplu model de regresie de o singur variabil. Prin ecuaia (3) se afirm c
variabila dependent (endogen) Y este o funcie linear de o singur variabil independent
(exogen) X. Modelul este de o singur ecuaie deoarece nu mai sunt alte ecuaii pentru Y ca
funcie de X (sau de alte variabile). Modelul este liniar deoarece sub forma sa grafic reprezint
o linie dreapt, dar nu o curb.
0 , 1
sunt coeficienii (sau parametrii) care determin coordonatele liniei drepte n
orice punct. 0 este constant sau termenul de intersecie, el indic valoarea lui Y pentru X egal
cu zero. 1 este coeficientul de nclinaie, i el indic valora cu care se va schimba Y, cnd X se
schimb cu o unitate. Coeficientul unghiular 1 demonstreaz reacia (rspunsul) lui Y fa de
schimbrile n X. Pentru a explica i a prezice schimbrile n variabila dependent, ce e
obiectivul major n evaluarea relaiilor comportamentale, accentul principal se pune pe
coeficientul de nclinaie cum ar fi 1 . Pe desen, de exemplu, dac X o avut s creasc de la X1
pn la X2, valoare lui Y conform ecuaiei (3) va crete de la Y1 la Y2. n modelele de regresie
liniar rspunsul valorilor pronosticate Y la schimbrile n X este determinat de o constant,
egal cu coeficientul de nclinaie: 1 = (Y2 Y1 ) / ( X 2 X 1 ) =
Y = 0 + 1 X
Y = 0 + 1 X
Y
.
X
X1
X2
Este necesar s se fac distincie dintre ecuaiile liniare n variabile i ecuaiile liniare n
parametri (coeficieni), deoarece regresia liniar trebuie s fie liniar n coeficieni, ns nu
neaprat liniar n variabile. Ecuaia Y = 0 + 1 X este liniar n variabile, grafic reprezentnd o
linie dreapt, n timp ce ecuaia Y = 0 + 1 X 2 nu este liniar n variabile, deoarece reprezint
grafic o curb ptratic dar nu o linie dreapt.
Ecuaia este liniar fa de coeficieni (parametri) numai n cazul dac parametrii apar sub
forma ceea mai simpl ei sunt ridicai la putere (nu mai mare dect unu), nu se nmulesc i nu
se mpart la ali coeficieni i nu fac parte din careva funcii (cum ar fi log sau exp). Ecuaia (3)
este liniar n coeficieni, dar Y = 0 + X nu este liniar n coeficieni 0 , 1 , deoarece nu
exist o transformare a ecuaiei care s-o aduc la forma liniar. n general, din toate ecuaiile
posibile cu o singur variabil explicativ, numai funcia sub form general
f (Y ) = 0 + 1 f ( X ) este liniar n coeficieni 0 , 1 .
Toate cele expuse sunt importante deoarece la aplicarea tehnicii regresiei liniare ecuaia
necesit s fie liniar n coeficieni. Analiza regresional liniar poate fi aplicat la ecuaii care
nu sunt liniare n variabile, dar pot fi prezentate n aa mod ca s fie liniare n coeficieni.
1
1.6. Termenul erorii stocastice. Eroarea de specificaie

Schimbrile n variabila Y pot fi cauzate nu numai de schimbri n variabila independent X
dar i de schimbri ce parvin din alte surse. Aceste schimbri adiionale apar parial n urma
5
omiterii variabilelor explicative (X1, X2, X3,), i chiar dac aceste variabile vor fi introduse n
model, Y continue s fie influenat de schimbri care pur i simplu nu pot fi explicate cu ajutorul
modelului. Probabil aceste schimbri pot parveni din surse, cum ar fi: 1) influene omise, 2)
erori de msurare, 3) form funcional incorect sau 4) pur i simplu din cauza unor
evenimente aleatoare i complectament imprevizibile.
Econometricienii admit existena unei atare variaii eseniale inexplicabile(erori) prin
introducerea explicit a unui termen stocastic (aleator) n modelul de regresie. Termenul erorii
stocastice este un termen, care se include n ecuaia de regresie pentru a reflecta toate
schimbrile n Y ce nu pot fi explicate prin variabila X. Termenul de eroare, de regul, este notat
prin dei i alte simboluri (cum ar fi u sau v) se utilizeaz frecvent. Includerea termenului de
eroare stocastic (sau eroare de specificaie) n ecuaia (3) rezult cu ecuaia de regresie tipic
Y = 0 + 1 X +
(1.4)
Ecuaia (4) este compus din dou componente: componenta determinist i componenta
stocastic. Expesia 0 + 1 X se numete component determinist, deoarece ea indic valoarea
lui Y care este determinat de valorile date a lui X, care se presupun a fi nonstocastice. Aceasta
component determinist poate fi prezentat i ca valoarea ateptat a lui Y n conformitate cu X
dat, valoarea medie a Y-or asociat cu o valoare distinct a lui X. Partea determinist a ecuaiei
poate fi notat prin
E (Y / X ) = 0 + 1 X
(1.5)
Spre regret, n realitate valoarea observat a lui Y e puin probabil s fie egal cu valoarea
determinist ateptat E (Y / X ) . Ca rezultat elementul stocastic necesit a fi inclus n ecuaie
Y = E (Y / X ) + = 0 + 1 X +
(1.6)
Eroarea de specificaie este cauzat cel puin de patru surse, care produc schimbri n
variabila Y diferite de acelea determinate de variabila X.
Multe influene minore sunt omise din ecuaie (de exemplu, din cauza inutilitii datelor).
Este, de fapt, imposibil de a evita erori de msurare cel puin ntr-o variabil din ecuaie.
Ecuaia teoretic specificat trebuie s aib alt form funcional diferit de aceea aleas
pentru regresie. De exemplu, ecuaia specificat trebuie s fie neliniar n variabile pentru
regresia liniar (sau vice-versa).
Toate ncercrile de a generaliza comportamentul uman trebuie s conin careva cantiti
de variaii impevizibile sau pur i simplu aleatoare.
1.7. Extinderea notaiilor
Vom extinde notaiile ca s includem referine la un numr de observaii stabilit i ca s
avem posibilitatea de a introduce mai multe variabile independente. Atunci unica ecuaie de
regresie linear poate fi scris sub form Yi = 0 + 1 X i + i (i=1,2,,n), unde
Yi - observaia i a variabilei dependente;
X i - observaia i a variabilei independente;
i - observaia i a erorii specificate;
0 , 1
- parametrii regresiei;
n - numrul de observaii.
Y1 = 0 + 1 X 1 + 1 ,
Y2 = 0 + 1 X 2 + 2 ,
Y3 = 0 + 1 X 3 + 3 ,
----------------------Yn = 0 + 1 X n + n .
6
cazul
mai
multor
variabile
independente
ecuaia
de
regresie
ea
forma
Yi = 0 + m X mi + i , (i=1,2,,n),
m =1
Yi - observaia i a variabilei dependente;

X mi - observaia i a variabilei independente m ;
i - observaia i a erorii specificate;
0 , m - parametrii regresiei, (m=1,2,....k);

n - numrul de observaii,
k - numrul de variabile independente.
1.8. Ecuaia regresiei evaluat

Odat ce s-a decis specificaia ecuaiei, ea trebuie evaluat, este necesar s se determine
parametrii. Aceasta versiune a ecuaiei de regresie adevrat se numete ecuaie de regresie
estimat i se obine din observaiile Ys , X s . n timp ce ecuaia adevrat este pur teoretic n
natur
Yi = 0 + 1 X i + i (i=1,2,,n).
(1.7)
Ecuaia de regresie estimat conine numere reale n ea
)
Yi = 103,4+6,38X
(1.8)
Valorile observate a lui X i Y se folosesc la determinarea parametrilor estimai 103,4 i 6,38.
)
Aceti parametri s-au folosit la determinarea Yi - valorilor estimate a lui Yi .
Vom cerceta diferena dintre ecuaia de regresie adevrat i ecuaia de regresie estimat.
n primul rnd, coeficienii teoretici ai ecuaiei de regresie 0 , 1 n ecuaia (7) se nlocuiesc cu
coeficienii estimai de tipul 103,4 i 6,38 din ecuaia (8). Nu e posibil s cunoatem valorile
parametrilor ecuaiei de regresie adevrat, de aceea n locul lor se calculeaz estimrile
acestor coeficieni folosind datele cunoscute referitor la observaiile variabilelor dependent i
) )
independent. Parametrii de regresie estimai, notai prin 0 , 1 , reprezint o aproximaie
empiric reuit, obinut din datele observaiilor Ys , X s .
)
n expresia Yi = 0 + 1 X i : pentru fiecare set de observaii se vor calcula diferite seturi de

)
parametri de regresie estimai. Yi reprezint valorile estimate a lui Yi pentru observaia i i sunt
calculate prin intermediul ecuaiei de regresie estimat.
)
Diferena dintre valorile estimate a variabilei dependente ( Yi ) i valoarea real a variabilei
dependente ( Yi ) este definit drept rezidual
)
Yi Yi = u i
(1.9)
Vom nota distincia dintre variabila rezidual u i i eroarea de specificaie i = Yi E (Yi / X i ) .
(1.10)
Variabila rezidual este diferena dintre valorile Yi observate i cele estimate prin ecuaia de
)
regresie Yi , n timp ce eroarea de specificaie (stocastic) este diferena dintre Yi observat i
ecuaia de regresie adevrat (valoarea ateptat a variabilei Y). Cu alte cuvinte eroarea
stocastic este o valoare teoretic care nici odat nu poate fi observat ns variabila rezidual
este o valoare real care se calculeaz pentru fiecare observaie de fiecare dat cnd regresia este
lansat. ntradevr, majoritatea tehnicilor regresionale nu numai evideniaz reziduurile, dar
selecteaz acele valori 0 , 1 , care le asigur un nivel ct e posibil de mic. Cu ct e mai mic
)
valoarea variabilei reziduale cu att mai apropiate vor fi valorile estimate Ys de acelea observate
Ys . O alt cale de a exprima ecuaia de regresie estimat const n combinarea ecuaiilor (2) i
)
)
(3) i obinerea expresiei Yi = 0 + 1 X i + u i .
2. Metoda celor mai mici ptrate

2.1 Estimarea modelului liniar simplu (de dou variabile) folosind metoda celor mai mici
ptrate.
Ipoteze
Modelul este linear n raport cu k , (k=0,1), i ,(i=1,,n).
Valorile X i sunt considerate fr erori de observaie sau de msurri permanente.
Termenul erorii stocastice i este normal distribuit de media nul E ( i ) = 0 , (i=1,,n) (n
medie modelul este bine specificat).
Perturbaia este omoscedastic: E ( i2 ) = i2 = = const , variaia erorilor i2 este constant (cu
alte cuvinte termenul erorii stocastice este independent de evoluia variabilei explicative,
ceea ce nseamn ca dispersiile calculate pentru diverse segmente de X i , nu difer ntre ele).
E ( i , j ) = 0, i, j = 1,2...., n, i j. Valorile erorilor stocastice nu sunt autocorelate (sunt
independente ntre ele). Valorile consecutive ale erorilor stocastice nu depind una de alta.
E ( xi , i ) = 0 . Valorile erorii stocastice sunt independente de variabila explicativ.
Aadar, n urma observaiilor statistice, avem serii de observaii. Problema const n
determinarea parametrilor.
Metoda celor mai mici ptrate (M.C.M.M.P.), n condiiile verificrii ipotezelor enunate,
asigur obinerea estimatorilor de maxim verosimilitate, nedeplasai, concordai i eficieni (cu
dispersia minima).
)
Estimaiile sunt nedeplasate. Aceasata nseamn c E ( k ) = k , (k = 0,1) , prin urmare,
estimaiile coeficienilor, obinute cu ajutorul metodei celor mai mici ptrate (M.C.M.M.P.),
sunt centrate nj jurul mulimii de valori ai coeficienilor adevrai.
Estimaiile sunt efective. Dispersia coeficienilor evaluai n jurul valorilor adevrate ale
coeficienilor este cea mai compact distribuie, care este posibil n condiiile dispersiilor
nedeplasate. Nici una din metodele liniare existente de estimare a coeficienilor nu asigur o
dispersie mai mic pentru fiecare din coeficienii estimai dect M.C.M.M.P. Estimaiile sunt
de natur BLUE - Best Linear Unbiased Estimators (Teorema Gauss-Marcov).
Estimaiile sunt concordate. Ceea ce nseamn, c mrind pn la infinit numrul de
observaii, obinem estimri care tind spre valorile adevrate ale coeficienilor de regresie.
Odat cu creterea numrului de observaii, dispersia devine mai mic, i fiecare estimaie
tinde spre ceea adevrat.
)
)
)
Estimaiile sunt de o veridicitate maxim. s este normal distribuit, N ( ,VAR[ ])
Pentru estimarea parametrilor vom aplica metoda celor mai mici ptrate, care se exprim n
modul ce urmeaz:
n
u
min

0, 1
i =1
2
i
= min ( y i 0 1 xi ) .
0 , 1
i =1
Condiiile de ordinul nti (condiii necesare) se nscriu ca:

n
u i2 / 0 = 2 ( y i 0 1 xi ) = 0.
i =1
u / 1 = 2 1 xi2 xi y i + 0 xi = 0.
2
i
i =1
De unde rezult sistema de ecuaii normale:

)
) n
= n 0 + 1 x i ,
y
i =1
n
(2.1)
i =1
) n
) n 2
x
y
=
x
+
i i 0 i 1 xi .
i =1
i =1
(2.2)
i =1
mprind (1) la n i rezolvnd n raport cu 0 , obinem 0 = Y 1 X
(2.3)
x y = x (Y X ) + x
substituind aceast exspresie n (2) l putem afla pe 1 ,
i =1
i =1
i =1
2
i
n
n
xi y i xi Y
n
n
) n 2 n
) i =1
, vom mpri numitorul i

xi y i xi Y = 1 xi xi X , de unde 1 = n
i =1
i =1
i =1
xi2 xi X
i =1
i =1
numrtorul la n:
XY XY
1 =
X X
2
Cov( X , Y )
, 0 = Y X
2
X
Cov ( X , Y )
X2
(2.4)
Aadar, am obinut parametrii 0 , 1 , care sunt estimatorii pentru 0 , 1 . Condiia suficient

pentru existena minimului functionalului este:
n
2 u i2
i =1
2 u i2 2 u i2
2
i
i =1
f 0, i = 0,1 ;
i =1
0 1
2
0
u
i =1
2
i
1 0
i =1
1 0
u
i =1
2 u i2
= xi
i =1
i =1
2
0
f0
(2.5)
2
i
12
2 u i2
=n
2 u i2
i =1
12
= xi2
i =1
3. Metoda celor mai mici ptrate, exemplu realizat

)
0 = Y 1 X ; 1 =
Cov( X , Y )
) YX Y X
; Cov( X , Y ) = YX XY ; X2 = X 2 X 2 ; 1 = 2
.
X X2
X2
Parametrul 1 se numete coeficient de regresie. Valoarea lui denot valoarea medie cu care
se schimb variabila de explicat atunci cnd variabila explicativ se schimb cu o unitate.
Parametru 0 denot valoarea lui Y cnd X = 0 . Atunci cnd valoarea explicativ nu poate
primi valoarea 0 explicaia precedent este lipsit de sens. Parametru 0 poate s nu aib nici un
sens economic. ncercarea de interpretare economic a parametrului 0 , mai ales atunci cnd el
e mai mic dect 0, 1 <0 poate aduce la situaie absurd.
Este posibil s interpretm numai semnul pe lng parametrul 0 . Dac 0 > 0 , atunci
schimbarea relativ a variabilei de explicat se petrece cu ritmuri mai reduse dect schimbarea
relativ a factorului. Cu alte cuvinte variaia rezultatului este mai mic dect variaia factorului
9
coeficientul de variaie dup factorul X este mai mare dect coeficientul de variaie pentru
variabila de explicat Y : V X f VY . Vom demonstra acest fapt (fenomen) pornind de la comparaia
schimbrilor relative a variabilelor de explicat Y i explicative - X :
1 dX 0 + 1 X
dY dX
dY
Y
p
p ;
p
; 1 X p 0 + 1 X 0 p 0 .
Y
dX
dX
Vom examina un fenomen. Un grup de ntreprinderi care produc acelai produs sunt supuse
analizei din punct de vedere a cheltuielilor de producere conform funciei Y = 0 + 1 X + .
Informaia necesar pentru evaluarea parametrilor 0 , 1 vom prezenta-o sub forma de tabel.
Rezultatele obinute n baza efecturii cercetrilor confirm c numrul observaiilor n
necesit a fi de 6-7 ori mai mare dect numrul parametrilor pe lng variabilele independente
(explicative) X .
Volum de
Chelt.
ntrepr. prod.
(mii de
prod.
unit.) (X)
(mln. lei)
(Y)
1
1
30
2
2
70
3
4
150
4
3
100
5
5
170
6
3
100
7
4
150
22,00
770,00
Y*X
X2
30
140
600
300
850
300
600
2820,00
)
YX
Y2
1
4
16
9
25
9
16
80,00
900
4900
22500
10000
28900
10000
22500
99700,00
31,6
67,9
141,6
104,7
178,4
104,7
141,6
770,50
Vom nscrie sistemul de ecuaii normale:

7
7
n
+
X
=
Yi
0
1
i
i =1
i =1
,
7
7
7
2
X i + 1 X i = X i Yi
0
i =1
i =1
i =1
0 = Y 1 X ;
1 =
YX Y X
X2 X2
7 0 + 22 1 = 770
22 0 + 80 1 = 2820
; 0 = 5,79; 1 = 36,84; Y = 5,79 + 36,84 X .
Valorile estimate ale variabilei de explicat sunt prezentate n ultima coloan. Parametrul
0 este lipsit de careva sens economic.
X = 3,14; X = 1,25;V X = 39,8%; Y = 110; Y = 46,29;VY = 42,1%.V X = X ;VY = Y .

X
Relaia 0 >0 corespunde faptului c variabila dependent se schimb cu ritmuri mai mari
dect variabila independent VY f V X . 0 <0 reflect faptul c variabila independent se schimb
cu ritmuri mai mari dect schimbarea variabilei dependente V X f VY .
Dac vom exprima variabilele X i Y prin devieri de la nivelul mediu, atunci linia regreresiei
)
pe grafic va trece prin origine Y = Y Y ; X = X X ; Y = 1 X . Estimarea coeficientului de
regresie nu se va schimba..
Estimarea coeficienilor ecuaiei de regresie poate fi obinut ntr-un mod mai simplu, fara a
ne adresa la M.C.M.M.P. Estimaia de alternativ a coeficientului 1 poate fi obinut pornind
10
de la sensul acestui coeficient: schimbarea variabilei dependente Y = Yn Y1 se confrunt cu

schimbarea variabilei independente X n = X n X 1 .
n exemplul examinat o atare estimaie de alternativ a parametrului
1 va constitui 1 =
170 30
= 35 . Aceast mrime este aproximativ ntruct nu se ine cont de
5 1
ceea mai mare parte din informaia statistic accesibil. Ea se bazeaz numai pe valorile
variabilelor de mrime maxim sau minim.
De regul, ecuaia de regresie este urmat de coeficientul de corelaie liniar ce
caracterizeaz ct de puternic este dependena liniar ntre X i Y - rXY . Exist mai multe
modificri ale formulei pentru coeficientul de corelaie liniar. Una dintre ele se prezint aici.
cov( X , Y )
cov( X , Y )
rXY = 1 X =
, 1 =
; e cunoscut faptul, c coeficientul liniar de corelaie se
Y
X Y
X2
modific n diapazonul 1 p rXY p 1
Dac coeficientul 1 < 0, 1 rXY 0 i invers, dac 1 > 0 , 0 rXY 1
Pentru datele tabelului, valoarea lui este de rXY = 0,991 , deci e foarte aproape de 1, ceea ce
nseamn c ntre X i Y exista o legtura liniar puternic, cheltuielile pentru producere sunt
puternic dependente de volumul de producie.
Este necesar s se in cont de faptul c coeficientul liniar de corelaie evalueaz msura
legturii puternice ntre indicii examinai sub forma liniar. Apropierea valorii coeficientului de
regresie ctre 0 nu nseamn inexistena legturii ntre indici. Dac modelul va fi specificat n alt
mod, legtura dintre indici poate s se adevereasc destul de strns.
Pentru evaluarea calitii funciei liniare alese se calculeaz ptratul coeficientului linear de
2
corelaie RYX
care se numete coeficient de determinaie - coeficientul de determinaie
caracterizeaz cota dispersiei variabilei de explicat Y care este lmurit de regresie n dispersia
total a variabilei de explicat:
)
2)
2
2
RYX
= Y 2 . Respectiv, mrimea 1 RYX
caracterizeaz cota dispersie Y , explicat de restul
Y
factorilor, care nu se examineaz n model.
2
= 0,982 . Prin urmare ecuaia de regresie explic 98,2% din
n exemplul examinat RYX
dispersia indiciului rezultativ, dar pe seam altor factori revine numai 1,8% din dispersia total.
Mrimea coeficientului de determinaie servete ca unul din criteriile care evalueaz calitatea
modelului liniar. Cu ct este mai mare cota variaiei explicat de regresie, cu att, respectiv, este
mai mic influena altor factori i deci modelul liniar bine aproximeaz datele iniiale i poate fi
utilizat pentru pronosticarea valorilor variabilei rezultative (de explicat).
4. Evaluarea semnificaiei ecuaiei de regresie liniar i a coeficienilor ei
Dup ce a fost estimat ecuaia linear de regresie se efectueaz evaluarea semnificaiei atta
ecuaiei n ntregime, ct i a fiecrui parametrii separat.
Evaluarea semnificaiei ecuaiei de regresie n ntregime se produce cu ajutorul F-criteriului
Fier, formulnd n prealabil ipoteza dependenei direct proporionale H 0 : { 0 = 0 } i ipoteza
0
independenei variabilelor, H 0 : { 1 = 0 } contra H 1 : 0
- ipoteza dependenei lineare
1 0
specificate.
n scopul testrii validitii modelului se analizeaz descompunerea sumei ptratelor
devierilor a variabilei Y de la medie n dou componente: prima, explicat de regresie i a doua
neexplicat de regresie:
11
(Y
n
i =1
(Y
n
i =1
n
Y ) =
n
i =1
Y ) =
n
i =1
)
Yi Y
) + (
2
i =1
)
(Yi Y ) + u i
)
Yi Yi
) = (
2
i =1
)
Yi Y
) + u + (Y) Y )u
2
i =1
i =1
n
n
)
)
)
) )
u i = 0 Yi = Yi Y = Y = 2 Yi Y u i = 2 Yi Yi u i = 0 .
i =1
i =1
i =1
i =1
i =1
)
Y =Y
n
Suma ptratelor devierilor observaiilor variabilei dependente (de explicat) de la valoarea lor
medie Y este cauzat de mai multe evenimente: de variabila explicativ i de ali factori. Dac
variabila
explicativ nu influeneaz rezultatul, atunci linia regresiei este paralel axei OX i
)
Y = Y , iar toat dispersia variabilei de explicat este cauzat de ali factori. n cazul cnd ali
factori nu influeneaz variabila de explicat, atunci Y este legat funcional de X i suma
ptratelor rezidualelor este egal cu 0. Prin urmare, suma ptratelor devierilor explicate de
regresie, coincide cu suma total. ntruct nu toate punctele cmpului de corelare se afl pe linia
de regresie, de fiecare dat are loc dispersarea lor cauzat att de variabila explicativ X (de
regresie), ct i de ali factori (neexplicabili de regresie). Linia de regresie este bun pentru
previziune, evident atunci, cnd suma ptratelor devierilor cauzat de regresia va fi cu mult mai
mare dect suma ptratelor rezidualelor, atunci ecuaia de regresie este semnificativ i variabila
explicativ X influeneaz esenial variabila de explicat Y . n aceast caz coeficientul de
2
determinaie RYX
se va apropia de 1.
Orice sum a ptratelor devierilor este legat de gradele de libertate a indiciului independent
de variaie. Gradele de libertate sunt dependente de numrul de observaii n i de numrul
parametrilor definii n conformitate cu ele. Referitor la problema n cauz gradele de libertate
trebuie
s
demonstreze,
cte
devieri
independente
din
n
posibile [(Y1 Y ), (Y2 Y ),..., (Yn1 Y )] , sunt necesare pentru formarea sumei ptratelor. Astfel,
pentru suma ptratelor
(Y
i =1
Y )2
sunt necesare (n 1) devieri independente, deoarece din
totalitatea de n uniti dup calcularea mediei variaz independent numai (n 1) de devieri.

De exemplu, avem un ir de valori 1,2,3,4,5. Valoarea medie ale lor este egal cu 3, n devieri
de la medie sunt: -2; -1; 0; 1; 2. Deoarece
(Y
i =1
Y ) =0, independendent variaz numai 4
devieri, dar devierea a cincea poate fi determinat, dat fiind cunoscute 4 precedente.
)
Pentru calcularea sumei ptratelor devierilor explicate de regresie
(Y
i =1
Y ) 2 se folosesc
)
)
)
)
valorile variabilei dependente Yi calculate n conformitate cu ecuaia de regresie Yi = 0 + 1 X i .
2
)2 n
)
2
La utilizarea regresiei liniare este adevrat egalitatea (Yi Y ) = 1 (X i X )
i =1
care
i =1
poate
fi confirmat,dac apelm la formula coeficientului liniar de corelaie

2
) n
)
2
cov( X , Y )
2
rXY = 1 X =
rXY
= 12 X2 , de aici rezult c (Yi Y ) 2 = 12 (X i X ) .
Y
XY
Y
i =1
i =1
Fiind dat numrul observaiilor pentru X i Y suma ptratelor devierilor variabilei
independente de la medie depinde numai de o singura constant coeficientul de regresie 1 i
deci suma examinat are numai un grad de libertate. La aceiai concluzie vom ajunge dac vom
)
)
)
examina ecuaia Yi = 0 + 1 X i . Parametrul 0 = Y 1 X , substituind aceast valoare n ecuaia
)
de regresie obinem Yi = Y 1 X + 1 X i = Y 1 (X i X ).Deci, rezult ca fiind date n

12
observaii pentru X i Y , valoarea estimat a lui Y n ecuaia liniar de regresie este funcie de
un singur parametru coeficientul de regresie. Respectiv i suma ptratelor devierilor variabilei
independente (factor) are numai un singur grad de libertate.
Numrul gradelor de libertate a sumei ptratelor devierilor totale este egal cu numrul
gradelor de libertate pentru sum ptratelor devierilor explicate de regresie i numrul gradelor
de libertate ale sumei ptratelor devierilor rezidualilor. Numrul gradelor de libertate al sumei
ptratelor rezidualelor n regresia liniar este egal cu (n 2) . Numrul gradelor de libertate
pentru suma total a ptratelor devierilor este determinat de numrul observaiilor n, i,
deoarece, se utilizeaz valoarea medie calculat n baza observaiilor, pierdem un grad de
libertate, deci avem (n 1) grade de libertate.
Aadar, avem dou egaliti:
n
n
)
2
2
(
Y
Y
)
=
(
Y
Y
)
+
i
i
(Yi Yi )2
n
i =1
(n 1) =
i =1
i =1
1
+ (n 2) .
mprind fiecare sum a ptratelor la gradele de libertate ce-i corespund, vom obine
ptratul devierilor medii, sau dispersia la un grad de libertate.
Y2) = (Yi Y )/ 1 ; u2 = Yi Yi / (n 2 );
n
i =1
i =1
Y2 = (Yi Y ) / (n 1)
n
i =1
Determinarea dispersiilor racordate la grad de libertate ofer posibilitatea de a efectua

comparaii ntre ele. Examinnd raportul dintre dispersia explicat de regresie i dispersia
)
Y2)
rezidual racordate la un grad de libertate, obinem F criteriul: F = ) 2 , F criteriul de
u
) 2) ) 2
verificare a ipotezei dependenei liniare a variaiilor. H 0 : Y = u . Dac ipoteza H 0 este
)
adevrat, atunci dispersiile nu difer. Pentru respingerea ipotezei H 0 este necesar ca Y2) f u2
(de cteva ori). Savantul englez Snedecor a elaborat tabele pentru valorile critice a F
criteriului n raport cu diferite nivele de semnificaie a ipotezei H 0 i diferite grade de libertate.
)
Valoarea tabelar a F criteriului este valoarea maxim a raportului dintre dispersiile Y2) , u2 ,
care poate avea loc la dispersarea aleatoare fiind dat probabilitatea existenei ipotezei H 0 .
Valoarea calculat a raportului este veridic, dac ea este mai mare dect valoarea tabelar. n
acest caz ipoteza H 0 se respinge i se trage concluzia c: Fefect f Ftab i se confirm ipoteza H 1 .
Dac Fefect p Ftab , probabilitatea validrii ipotezei H 0 este mai mare dect nivelul indicat (de
exemplu, 0,05) i ea nu poate fi respins. n acest caz, ecuaia de regresie se consider
nesemnificativ, prin urmare, nu se respinge ipoteza H 0 .
n exemplul examinat:
n
(Y
i =1
Y ) 2 = Yi 2 nY 2 = 15000 ;
Y2) =
i =1
2
)2 n
)
2
(Yi Y ) = 1 (X i X ) = 14735 ;
n
i =1
n
u2 =
i =1
)
(Yi Yi ) 2 = 265 ;
F=1435/53=278;
F =0, 01 = 16.26 ;
F fact = 278 f Fnfd = 6.61 ;
15000
;
6
265
= 53 ;
5
F = 0, 005 = 6.61 ,
i =1
F fact = 278 f Fnfd = 16.26 .

n
)
)
Criteriul Fier este strns legat cu coeficientul de determinaie. R 2 , (Yi Y ) 2 = R 2 Y2 1 ,
)
v
(Yi Yi ) 2 = 1 R 2 Y2 / (n 2) , atunci
n
i =1
F=
R (n 2)
.
(1 R/ 2 )
i =1
13
Estimarea semnificaiei ecuaiei de regresie, de regul, se prezint sub forma tabelului

analizei dispersionale.
Surse
de
Grade
Suma
Dispersia la
F - criteriu
variaie
de libertate ptratelor
un
grad
de
fact
tabel
devierilor
libertate
.
=0.0
5
Total
n-1
15 000
2 500
Explicat
1
14 375
14 375
278
6.61
de regresie
Rezidual
n-2
235
53
n regresia liniar se analizeaz nu numai semnificaia ecuaiei n ntregime dar i
semnificaia separat a parametrilor. n acest scop se determin i eroarea standard pentru
) )
fiecare parametru: ) , ) . Eroarea standard a coeficientului de regresie este definit dup
0
formula:
(Y
n
))
i =1
)
Yi
(X
n
i =1
) /(n 2)
2
X)
S2
(X
n
i =1
X)
Valoarea erorii standard n comun cu t distribuia Student la (n 2) grade de libertate se

)
aplic la verificarea semnificaiei coeficientului de regresie 1 i pentru calcularea intervalelor
de ncredere.
Pentru estimarea semnificaiei coeficientului de regresie, valoarea lui se compara cu eroarea
)
1
standard, cu alte cuvinte se determin valoarea efectiv a t criteriul Student: t ) = ) , care se
)
1
compar cu valoarea tabelar pentru riscul erorii ( ) (nivelul de semnificaie) i (n 2) grade de

libertate.
Acelai rezultat l obinem cnd extragem rdcina ptrat din F criteriul, i
anume, t ) = F . Vom demonstra c R2( = F .
1
(t ) ) 2 = ( ) 1 ) 2 = 1
)
1
(Y
)
2
Yi Y
) 2
Yi Yi / (n 2)
)2
) 2
Yi / (n 2)
)
Y2)
= )2 = F .
i
(X
X)
12 (X i X )
)
(
) / (n 2)
Y
Intervalul de ncredere pentru coeficientul de regresie se determin ca 1 ttab ) , este egal

1
cu valoarea coeficientului estimativ valoarea coeficientului Student table nmulit cu ) .

1
ntruct coeficientul de regresie n investigaiile econometrice are o explicaie economic

clar, intervalele de ncredere pentru el nu trebuie s conin rezultate contradictorii, de exemplu
)
10 1 40 . Ceea ce nseamn c valoarea adevrat a coeficientului de regresie conine
simultan valori pozitive i negative i chiar 0, ce nu poate avea loc.
)
Eroarea standard a parametrului 0 se determin prin formula:
14
)
(Y Y )
X i2
(n 2)
n (X i X )
/) =
0
i =1
i =1
i =1
S 2 X i2
i =1
n ( X i X )
n
i =1
Evaluarea semnificaiei se efectueaz la fel ca i pentru 1 , t ) = ) 1 , valoarea t-criteriului

)
)
calculat se compar cu valoarea tabelar la (n 2) grade de libertate i nivelul de semnificaie

( ) .
Semnificaia coeficientului de determinaie R se definete n baza valorii erorii coeficientul
1 R2
.
n2
de determinaie R =
Valoarea efectiv a t-criteriului student se determin ca: t R =
R
1 R2
n 2 . Aceasta
formul ne mrturisete, c n regresia liniar fa de variabile t R2 = F , deoarece s-a notat ca

R2
F=
, plus la aceasta, t 2)1 = F , t R2 = t 2)1 .
2
(1 R ) (n 2 )
Deci verificarea ipotezei semnificaiei a coeficienilor de regresie i de determinaie

echivaleaz cu verificarea ipotezei referitor la validitatea modelului liniar de regresie.
Formula examinat pentru estimarea coeficientului de corelare este recomandat pentru
aplicare la un numr mare de observaii i dac r difer mult de +1 sau 1. n caz contrar
distribuia estimaiilor difer de la aceea normal sau Student, deoarece coeficientul de corelare
1
2
1+ R
pentru evalua
1 R
este limitat de valorile 1 i +1. Fisher a introdus o variabil z = ln(

semnificaia R .
4.1. Intervalele de previziune pentru modelul liniar de regresie
n calcule previzionale conform ecuaiei de regresie se determin valoarea Y p sub form de

)
previziune punctifer Yi pentru X p = X k , substituind n ecuaia de regresie Yk = 0 + 1 X k

valoarea respectiv a lui X . Dar previziunea punctifer este evident nereal. De aceea ea este
) )
completat cu calculele erorii standard pentru Y p , Y) i cu estimaia intervalului de previziune
)
pentru valoarea Y * , Yx Y) Y * Yx + Y) .
p
ntru construirea formulei pentru eroarea standard Y) vom apela la ecuaia de regresie
X
)
)
)
)
)
)
Yx p = 0 + 1 X p . Substituind 0 cu formula pentru calcularea lui 0 = Y 1 X , vom obine
)
)
)
)
Y X = Y 1 X + 1 X = Y + (X X ) . De aici rezult c eroarea standard pentru Y Y)X depinde de
)
2
)
)
)
eroarea Y i eroarea coeficientului de regresie 1 , deci Y2)X = Y2 + 2)1 (X X ) .
)2
Din teoria selectrii este cunoscut faptul c Y =
2
n
rezidual pentru un grad de libertate S 2 , obinem: Y2 =

)
de regresie este determinat prin formula 2) =

1
, folosind n calitate de 2 dispersia

S2
. Eroarea standard a coeficientului
n
S2
(X
n
i =1
X)
. Considerm c valoarea
15
prognozat X p = X k , atunci n conformitate cu ecuaia de regresie obinem urmtoarea formul

)
pentru eroarea standard a valorii Y X prognozat:

k
Y2) =
Xk
S (X k X )
S
+ n
2
n
(X i X )
2
i =1
))
Respectiv, Y
Xk
2
(
Xk X )
2 1
=S
+ n
.
n
2
(X i X )
i =1
(X X )
(X X )
2
1
=S
+
n
. Formula considerat a erorii standard pentru
i =1
valoarea medie prognozat a lui Y X , fiind dat valoarea X k , caracterizeaz eroarea amplasrii
)
liniei de regresie. Valoarea erorii standard Y) atinge minimul atunci cnd X k = X i crete cu
Xk
ndeprtarea punctului X k de la X n orice direcie. Cu alte cuvinte, cu ct este mai mare

)
diferena dintre X k i X , cu att este mai mare eroarea Y) . n baza ei fiind evaluat
Xk
)
previziunea valorii medii Y , pentru valoarea X k dat. Pot fi ateptate previziuni mai reuite
dac punctul X k se afl n centrul regiunii de observare i nu este cazul s ateptm rezultate de
previziune bune la ndeprtarea a punctului X k de la punctul X . n caz c valoarea X k se afl
n afar valorilor observate a lui X , folosite la determinarea liniei de regresie, rezultatele
previziunii se nrutesc pe msura deplasrii X k de la regiunea valorilor observate pentru
variabila explicativ X .
Y
)
)
Y X k + t )1 Y)X
)
) )
Y = 0 + 1 X
X
k
)
)
Y X k t )1 Y)X
Xk
Pentru valoarea prognozat a lui YX , intervalele de ncredere de 95% pentru X k dat se

)
definesc prin expresia: YX t) Y) . Pe grafic frontierile de ncredere pentru Y reprezint dou

k
Xk
hiperbole situate pe ambele pri de la linia de regresie. Dou hiperbole pe ambele pri de la
)
linia de regresie determin intervalele de ncredere de 95% pentru valoarea medie a lui Y
pentru X dat.
)
ns valorile observate a lui Y variaz n jurul valorii medii a lui Y . Valorile individuale a
)
lui Y pot fi dispersate de la Y n limita valorii erorii aleatoare u , dispersia ei fiind evaluat ca
dispersia rezidual pentru un grad de libertate u2 . Deaceea eroarea valorii individuale
16
prognozate pentru Y necesit includerea nu numai a erorii standard Y) , dar i a erorii aleatoare
))
u u . Eroarea medie Y
))
Xk
1
= S 1+ +
n
Xk
)
a valorii individuale Y prognozat este:
(X X )
(X X )
Xk
i =1
Efectund previziunea n baza ecuaiei de regresie este necesar s inem cont de faptul c
valoarea prognozat depinde nu numai de eroarea standard a valorii individuale Y , dar i de
precizia previziunii valorii variabilei exogene X . Valoarea ei poate fi definit n baza aplicrii
altor modele, reieind din situaia concret i analiznd dinamica acestui factor. Formula
)
considerat pentru eroarea medie ( Y) ) a valorii individuale Y poate fi folosit pentru evaluarea
Xk
semnificaiei devierii valorii prognozate prin ecuaia de regresie i valorii ipotetice naintate n
baza evoluiei evenimentelor.
tY) ( X k )
)
(
Y(
=
Yhipot
;
))
Xk )
Y(
Xk
tcalcY( X ) f ttab (0,05; n 2 ) .

k
5. Modelul de regresie liniar multifactorial

5.1. Crearea i specificarea modelului liniar de regresie genera
S examinm cazul cnd, cu siguran, mai multe variabile independente pot n plin msur
s explice comportamentul unei variabile dependente. Cazurile cnd comportamentul variabilei
dependente poate fi explicat de o singur variabila independent sunt rar ntlnite n realitate.
Cererea pentru un careva produs este, cu certitudine, influenat de preuri, ns aceast
explicaie nu este una complet, deoarece reclama, venitul agregat, preurile produselor de
substituie, pieele internaionale, calitatea serviciilor comerciale, diverse capricii a
cumprtorilor, schimbarea preferinelor consumatorilor - toate sunt importante n modelarea
real. Prin urmare, se simte necesitatea vital de a trece de la modelul regresional de dou
variabile la modelele de regresie cu mai multe variabile.
Modelul liniar de regresie generalizat cu k variabile independente poate fi prezentat sub
forma unei ecuaii:
Yi = 0 + 1 X 1i + 2 X 2i + ... + k X ki + i ,
(5.1)
unde i = 1, n indic numrul observaiilor, X 1i indic observaia i a variabilei X 1 , n timp ce X 2i
indic observaia i a variabilei X 2 , k - numrul variabilelor independente, i - termenul erorii
stocastice.
Ceea mai mare deosebire dintre modelul de regresie de o singur variabil i modelul de
regresie cu mai multe variabile (multifactorial) const n interpretarea coeficienilor adiionali
de nclinaie. Aceti coeficieni, deseori denumii coeficieni de regresie pariali, deoarece
coeficienii regresiei multiple corespund derivatelor pariate dup variabilele independente
respective. Coeficienii sunt definii cu scopul de a permite cercettorului de a distinge impactul
unei sau altuia variabile independente. i anume, coeficientul regresiei multifactoriale indic
schimbarea n variabila dependent examinat n timp ce restul variabilelor independente din
ecuaie se menin constante.
Ultima fraz subliniat constituie momentul-cheie n nelegerea regresiei multiple.
Coeficientul 1 msoar impactul asupra lui Y a creterii de o unitate n X 1 meninnd
constante variabilele X 2 , X 3 ,..., X k , dar nu este constant nici una din variabilele relevante omise
din ecuaie (cum ar fi X k +1 ). Coeficientul 0 este valoarea lui Y pentru toi X s = 0 i s = 0 ,
17
s = 1, k . Cum a mai fost menionat termenul 0 se va include n ecuaia de regresie, dar n baza
lui nu nu pot fi trase concluzii. Fie c:

)
)
)
)
)
Y1 = 0 + 1 X 11 + 2 X 12 + ... + k X 1k
)
)
)
)
)
Y2 = 0 + 1 X 21 + 2 X 22 + ... + k X 2 k
.
)
)
)
)
)
Yk = 0 + 1 X k1 + 2 X k 2 + ... + k X kk
.
)
)
)
)
)
Yn = 0 + 1 X n1 + 2 X n 2 + ... + k X nk ,
Atunci modelul liniar de regresie multipl poate fi nscris sub forma vectorial Y = X + , Y vectorul coloan al variabilei endogene de dimensiunea (n ) , X - matricea de dimensiunea (n (k + 1)) , - vectorul de dimensiunea (k + 1) , - vectorul de dimensiunea (n ) .
)
y1
o
1
y1
u1
1 x11 L x1k
)
y

u
)
y2
2
1
2
Y=
, X = 1 x 21 L x 2 k , =
, =
, i = 1, n; j = 0, k , Y =
, u = u 2
M

yn
M

k
Y
Y
Y
1 =
; 2 =
Lk =
;
X 1
X 2
X k
1 x n1 L x nk
M

n
)
)
)
Y = X , u = Y Y .
M
)
yn
M

u n
De exemplu, funcia de consum n cele mai multe cazuri este examinat ca un model de
forma: C = f (Y , P, M , Z ) ; unde C - consumul; Y - venitul; P - indicile costului de via; M banii n numerar; Z - active lichide,
C
p 1 . Regresia multipl este utilizat pe larg la
Y
soluionarea problemelor cererii, venitului pe aciuni, la studierea cheltuielilor de producere, n

calcule macroeconomice. n prezent regresia multipl este una din cele mai rspndite metode
n econometrie. Scopul de baz a regresiei multiple const n definirea modelului de regresie
multipl, fiind determinat influena fiecrei variabile independente n parte i influena lor n
comun asupra variabilei dependente.
5.2. Ipoteze clasice, M.C.M.M.P.
Ipotezele clasice necesit a fi indeplinite pentru ca estimatorii obinui prin metoda celor
mai mici ptrate s fie cei mai buni disponibili.
Termenul de eroare care satisface ipotezelor anunate n continuare se numete termen
normal de eroare de tip clasic.
1. Valorile variabilelor X ij , i = 1, n; j = 1, k sunt observate fr erori constante de
msurare.
2. Termenul de eroare i este de media nul E ( i ) = 0 (sau variabila este de media
nul ( 1 + 2 + L + n ) / n = 0 i normal distribuit).
3. Variaia erorilor este constant pentru fiecare i , VAR( i ) = 2 = 2 = const .
4. Valorile observate ale termenului de eroare nu sunt corelate (are loc independena
erorilor E ( i j ) = 0; i, j = 1, n; i j , nu sunt corelaii n serie).
5. Erorile sunt independente de variabilele explicative. COV (X ij , i ) = 0; E (X ij i ) = 0 .
6. Absena coliniaritii ntre variabilele explicative implic o matrice (X T X ) regular i

asigur existena matricei inverse (X T X ) .
1
7. Matricea (X T X ) / n este o matrice finit ne singular.

1
18
8. Relaia n f k , n 6(7) k necesit ca numrul de observaii s fie superior numrului

de variabile explicative.
n cazul respectrii ipotezelor enunate, estimarea parametrilor j se face, de regul, cu
ajutorul M.C.M.M.P. care const n minimizarea sumei ptratelor devierilor valorilor variabilei
dependente estimate de la valorile variabilei dependente teoretice.
(u u ) = min (Y X ) (Y X ) = S ( ) ,
u = min
min
)T
i =1
2
i
( ) = (Y Y ) 2 (X Y ) + ) (X) X )) .
Pentru minimizarea funcionalului S ( ) , n conformitate cu condiiile necesare de existen a
i
'
extremumului, efectum derivarea lui n raport cu s , s = 0,1,..., k i apoi egalm cu zero expresia
obinut:
)
)
)
)
1
S ( )
) = 0; 2(X T Y ) + 2(X T X ) = 0 (X T X ) = (X T Y ) = (X T X ) (X T Y ).
5.3. Estimarea parametrilor modelului i proprietile lor

)
1. Estimatorul este un estimator BLUE (Best Linear Unbiased Estimator), adic cel
)
mai bun estimator liniar nedeplasat E ( ) = .
)
2. Estimatorul liniar nedeplasat are dispersia minim.
)
)
3. Estimatorul este consistent: .
n
4. Estimatorul este normal distribuii N ( ,VAR( )) .

)
Notaii convenionale
Valorile adevrate, dar neobservate
Estimate
Denumirea
Simbolul
Denumirea
Simbolul
)
coef.de regresie estimat k
coef.de regresie
k
)
Valoarea ateptat a E ( k )
coef. estimat
Variaia termenului 2 sau VAR( i )
Variaia estimat a S 2 sau ) 2
de eroare
termenului de eroare
)
Devierea standard a
Devierea standard a S sau
estimat
)
)
)
Variaia coeficienilor 2 ( k ) sau VAR( k ) Variaia estimat a S 2 ( k ) sau
estimai
coeficienilor estimai
) )
2 ( k )
Devierea standard de ) sau ( k )
la coef.estimai
Termenul
erorii i
stocastice
)
Eroarea standard a ) ) sau SE ( k )

coeficienilor estimai
Reziduale(estimarea
ui
erorii n sens informal)
)
Matricea varianei i covarianei coeficienilor de regresie ea forma: ) = u2 (X T X ) , iar

1
dispersia rezidual este u2 = (uTu), dar aceea racordat la un grad de libertate e u2 =

)
(u u )
T
n k 1
19
Estimatorul matricei varianei i covarianei coeficienilor de regresie este ) = u2 (X T X ) .

)
Aceste valori depind de unitatea de msur, de aceea se prefer utilizarea coeficientului de

determinaie R 2 i a coeficientului de corelaie multipl r .
2
)
( yi Y )
n
R2 =
i =1
(y
i =1
Y )
= 1
)
( yi y i )
i =1
(y
i =1
u2
) 2
rYX X L X = 1 2 , unde u2 = ( y i yi )
Y
dispersia total.
1
5.4.
Y )
este dispersia rezidual Y2 = ( y i Y )
este
Verificarea modelului cu ajutorul testelor

Sistemul de ecuaii normale pentru regresia multipl este urmtorul:
Y
i =1
n
)
) n
) n
) n
= n 0 + 1 X 1i + 2 X 2i + L + k X ki
i =1
i =1
i =1
) n
X
Y
=
X
+
X
X
+
X
X
+
+
L
1i i 0 1i 1 1i 1i 2 1i 2i
k X 1i X ki
i =1
i =1
i =1
i =1
i =1
) n
) n
) n
) n
X
Y
=
X
+
X
X
+
X
X
+
L
+
2i i 0 2i 1 2i 1i 2 2i 2i
k X 2 i X ki
n
i =1
i =1
i =1
i =1
i =1
L L L L L L L L L L L L L L L L
n
) n
) n
) n
) n
X kiYi = 0 X ki + 1 Xk 2i X 1i + 2 X ki X 2i + L + k X ki X ki
i =1
i =1
X 1i
i =1
X 1i
i =1
i =1
i =1
i =1
X 1i X 1i
i =1
X X
i =1
i =1
i =1
X 2i L X ki
2i
i =1
i =1
i =1
X 1i X 2i L X 1i X ki
n
2i
X 1i
X
i =1
2i
X 2i L X 2i X ki
i =1
L L L L L L L L L L L
n
X ki
i =1
X ki X 1i
i =1
i =1
i =1
X ki X 2i L X ki X ki
20
Y X X
i =1
i =1
X 1i X 1i
i =1
i =1
i =1
Yi X 2i
X 2i X 1i
i =1
i =1
i =1
i =1
L X ki
2i
Yi X 1i
)
0
1i
i =1
i =1
s = s / , s = 0, k .
i =1
L L L L L L L L L L L
n
Y X X
i =1
ki
ki
i =1
X 1i
i =1
ki
X 2i L X ki X ki
i =1
Judecnd n mod analogic, precum i n cazul modelului liniar de regresie simpl, obinem c
variaia total este egal cu variaia explicat plus variaia reziduurilor:
(Y
n
i =1
2
n
)
Y ) = Yi Yi
i =1
) + (Y) Y )
2
i =1
Aceste valori depind de unitatea de msur, de aceea se prefer utilizarea coeficientului de

determinaie R 2 i a coeficientului de corelaie multipl r .
Pentru a aplica testul Fier vom alctui urmtorul tabel al analizei de variane.
Sursele
variaie
de Variaia
abaterilor
sumei
ptratelor Gradul de Estimatori ai dispersiei n

libertate
raport cu gradele de
libertate
2
n
Explicate de
)
VE = ( y i Y ) = Y2)
regresie
Reziduale
n 1
VT = ( y i Y ) = Y2
R =
i =1
n
Y )2
Y )
(Y
i =1
1 R =
(y
i =1
n
(y
i =1
i =1
Y =
n
)
Y ) 2 yi yi ) 2
i =1
(Y
i =1
(y
Y )2
Y )
R = 1
2
= 1
)
yi ) 2
(Y
Y )2
i =1
n
i =1
)
yi ) 2
,
(y
(y
i =1
)
y i ) 2 /( n k 1)
(y
i =1
Y ) 2 /(n 1)
i =1
k
)
Yi Yi
i =1
(y
(Y
Y2) =
i =1
n
i =1
n
)2
n k 1
)
VR = ( y i y i ) = u2
Total
Y2) =
i =1
n
(Y
i =1
Y )
(n k 1)
(n 1)
u2
= 1 2 ;
Y
2
= 1 ) u2
Y
; r = 1 u2 / Y2 .
R - msoar gradul de variant a lui Y explicat prin regresia Y pe X .
21
(Y
i =1
Fcalc =
Y )2
(k )
)
(Yi Yi ) 2
n
i =1
(Y
i =1
Y ) 2 (n k 1)
)
(Yi Yi ) 2 k
n
i =1
(n k 1)
Regula de decizie pentru un prag de semnificaie I 0 pentru 0 este acceptat, dac

Fcfkc p Ftab = F1 ;(k 1,n k ) i este acceptat I 1 i respins I 0 , dac Fcfkc f Ftab = F1 ;(k 1,n k ) .
Fcfkc
R2 / k
=
.
1 R 2 / (n k 1)
6. Multicoliniaritatea i atenuarea ei
Spre deosebire de modelul unifactorial, n cazul modelului multifactorial, ipoteza I1 presupune
independena variabilelor explicative. Ne respectarea ei produce fenomenul de
multicoliniaritate, caz n care o variabil endogen este explicat de mai multe variabile
explicative.
Frecvena relativ ridicat a coliniaritii dintre variabilele explicative se datoreaz
gradului sporit de interdependen din economie.
Existena multicoliniaritii este semnalat de:
a) analogiile n evoluia variabilelor explicative;
b) apropierea de zero a determinantului X T X ;
c) mrimea coeficientului de determinaie multipl (R 2 ) , care aproape coincide cu
mrimea lui n cazul n care una dintre variabilele cauzale este omis;
d) contrazicere n verificarea testelor i anume: testul F aplicat valorilor teoretice este
semnificativ, iar testul t aplicat parametrilor de regresie semnaleaz nesemnificaii n
rndul parametrilor.
6.1. Atenuarea multicoliniaritii. Procedee de selecie a variabilelor exogene n cazul unui

model multifactorial.
1. Dac seriile de date sunt formate dintr-un numr redus de termeni (n < 10), atunci se
recomand includerea de termeni suplimentari ca (n > 15), astfel nct analogiile
ntmpltoare s fie, pe ct posibil, eliminate.
2. n cazul corelrii intense a 2 variabile exogene, se renun la una din ele, considerndu-se c
variabila omis este exprimat de ctre ceea reinut n model.
3. Dac datele sunt prezentate sub form de serii cronologice, se poate proceda la calculul
diferenelor de ordinul nti ( = Yi Yi 1 ) sau la logaritmarea valorilor Yi , X 1i , X 2i ,L, X ni n
scopul atenurii colinearitii, prilejuite de prezena trendului n date.
Eliminarea fenomenului de colinearitate implic calcularea coeficienilor de corelaie dintre
variabilele exogene rX / X i rY / X coeficienii de corelaie liniar dintre variabila de explicat Y
i
i variabilele sale explicative X i . Dac rX
/Xj
1, i j , va trebui ca una din cele dou variabile
s fie eliminat din rndul variabililor exogene.

Criteriul de excludere/includere a 2 variabile exogene care-s corelate liniar. Dac
rY / X f rY / X , se exclude X j i se reine X i , n caz contrar se exclude X i i se reine X j . Astfel,
i
la prima etap, reinnd k variabile exogene liniar independente fiind posibil estimarea celor
( k + 1 ) parametri se poate trece la etapa n care se continu operaia de selecie a variabililor
exogene X i . n acest sens exist mai multe procedee.
22
6.1.1. Primul procedeu

n model se introduc cele k variabile exogene, ordinea de includere fiind dat de mrimea
coeficienilor de corelaie a variabilei Y n raport cu factorii si rY / X f rY / X f rY / X f L rY / X ,
n aa fel se obin k modele:
)
)
) ) )
M (1) : Yi = 0 + 1 X i ,1 + ui1 = Yi1 + ui1
1
M
)
)
)
) )
)
M ( j ) : Yi = 0 + 1 X i ,1 + L + j X i , j + ui j = Yi j + ui j
M
)
)
)
)
) )
)
M (k ) : = 0 + 1 X i ,1 + L + j X i , j + L + k X i , k + uik = Yi k + uik
Este cunoscut c, variaia total a variabilei Y este egal cu suma variaiei, explicat de regresie,
a modelului M ( j ) i variaia rezidual Y2 = Y2) + u)2 .
j
Din relaia precedent uor se obine coeficientul de determinaie, care ea forma de R = 1

2
j
u)2
i msoar ponderea n variaia total a variaiei variabilei dependente Yi , explicat de model.

Ru2 = 1 R 2j este cota parte a variaiei, ne explicate de regresia M ( j ) , n variaia total. n baza
2
Y
acestor relaii se pot formula criterii de selecie a modelului optim. M (r ) din grupul de modele
n
M ( j ) , i anume = max
2
r
i =1
)
Yi j Y
n
)j 2
2
2
sau R = max R , sau r = min Yi Yi , gradul
j
j
i =1
2
r
de semnificaie a acestor indicatori, fiind verificat anterior prin testul F .

6.1.2. Al doilea procedeu
Al doilea procedeu pornete de la premisa c cei ( k + 1 ) factori de influen ai variabilei de
1
explicat Y sunt liniar independeni. n aceste condiii matricea (X T X ) exist i cu ajutorul ei
)
se estimeaz parametrii ( j ) i dispersiile acestora, obinundu-se:
)
)
)
)
)
M k : Yi = 0 + 1 X i ,1 + L + r X i , r + L + k X i ,k + u ik . Apoi se testeaz semnificaia estimatorilor
)
j cu ajutorul testului t cu pragul de semnificaie i (n (k + 1)) grade de libertate. Dac
)
j
)
)
t ,(n (k +1)) , atunci j este semnificativ diferit de zero , n caz contrar j este
( )
)
( )
( )
nesemnificativ diferit de zero.

)
)
Presupunnd c ( j ) difer de zero pentru j = 0,1,L, r i ( j ) nu difer semnificativ de
zero pentru j = r + 1,L, k , ceea ce nsemn c variabilele (X j ), j f r nu influeneaz
semnificativ variabila Y i pot fi excluse, astfel modelul va fi construit n baza variabilelor
exogene (X j ), j r .
6.1.3. Al treilea procedeu: Teste ce determin multicolinearitatea
Testul Klein
Acest test este bazat pe comparaia coeficientului de determinaie R 2 pentru modelul cu k
)
)
)
variabile exogene: Y = 0 + 1 X 1 + L + k X k + u i coeficienilor de corelaie simpl rX2 / X
i
dintre variabilele explicative pentru i j . Dac R p r

2
Y
2
Xi / X j
, exista pericolul multicolinearitii.
Testul Farrar i Glauber

Etapa 1. Calculm determinantul matricei coeficienilor de corelaie
23
rX 1 / X 3
L rX 1 / X k
1 rX 2 / X 3
L rX 2 / X k
1 rX 1 / X 2
D=
rX 2 / X 1
L L L L L L L
rX k / X 1 rX k / X 2 L rX r/ X k 1 1
Dac valoarea determinantului tinde spre zero, riscul multicolinearitii e mare. De exemplu,
pentru un model de 2 variabile explicative, dac ambele serii sunt perfect corelate, atunci
determinantul
D=
determinantul D =
1 rX 1 / X 2
rX 2 / X1
1 rX 1 / X 2
rX 2 / X1
1 1
1 1
1 0
0 1
= 0,
iar n cazul cnd seriile sunt ortogonale
= 1.
Etapa 2. Efectum un test 2 , verificnd urmtoare ipotezele:

I 0 : D = 1 (seriile sunt ortogonale)
I 1 : D p 1 (seriile sunt dependente)
Valoarea empiric 2 calculat pentru un eantion de n observaii i K variabile
explicative
( K = k +1,
dac
se
include
termenul
constant)
este
2
2
2
calc = [n 1 1 / 6(2 * k + 5)] * Ln( D) . Dac calc tabel cu k*(k-1)/2 grade de libertate i
un prag de semnificaie , atunci ipoteza I 0 este respins, are loc prezumia
multicolinearitii. Dac 2 calc f 2tabel se accept ipoteza de ortogonalitate.
7. Remedierea multicolinearitii
Ce poate fi ntreprins ntru reducerea consecinelor care multicolinearitatea sever le
produce asupra ecuaiei n examinare? Nu este un rspuns univoc deoarece
multicolinearitatea este un fenomen care se schimb de la un set de date la altul, chiar dac
ecuaia specificat de regresie este aceiai.
7.1. Nu se fac nimic
La prima etap cnd multicolinearitatea puternic este depistat este necesar de decis
dac n genere trebuie de fcut ceva. Dup cum s-a observat, orice remediu contra
multicolinearitii produce oveli de anumit gen i, deseori se ntmpl c de a nu face
nimic este o aciune corect!
Argumente majore n favoarea consideraiei serioase de a nu face nimic este acelea c
multicolinearitatea n ecuaie nu ntotdeauna reduce t-statisticile suficient ntratt ca ele s
)
devin nesemnificative sau s modifice n mare msur coeficienii s ca ei s difere
semnificativ de la acei ateptai. Cu alte cuvinte, simpla existena a multicolinearitii nu
ntotdeauna nseamn ceva. De exemplu, fie c coeficientul simplu de corelaie ntre dou
variabile explicative este egal cu 0,97, fiecare din ele avnd t- statistica individual
semnificativ la pragul 95% de ncredere. n aa caz nici un remediu nu are rost. n cazul
multicolinearitii severe cel mai simplu remediu const n eliminarea a unei sau a mai
multor variabile din ecuaie. Spre nefericire, eliminarea variabilei multicolineare, care
conform teoriei aparine ecuaiei de regresie, este o operaie destul de periculoas, deoarece
ecuaia modificat va fi supus deplasrilor de specificaie. Dac se elimin o atare variabil
atunci intenionat se creeaz deplasri n estimri. Deaceea econometricienii experimentai n
cele mai multe cazuri vor pstra variabilele multicolineare n ecuaie nectnd la diminuarea
potenial a t-statisticilor.
24
Ultimul argument ntru susinerea dezideratului de nu a ntreprinde nici o msur pentru a

combate multicolinearitatea este unul teoretic care se aplic la orice ecuaie. De fiecare dat
cnd regresia se relanseaz, noi ne asumm riscul de a descoperi o specificaie care se
potrivete, dat fiind ntmpltoare pentru un set de date distinct, dar nu de aceea c ea este
adevrat. Mrirea numrului ncercrilor mrete ansele de a obine rezultate
ntmpltoare. Deci, specificaia consecutiv este bine venit atunci cnd exist
multicolinearitate sever, deoarece n acest caz estimarea coeficienilor este un procedeu
sensibil la modificri de specificare. n concluzie, deseori este mai bine s pstrm ecuaia
neajustat, nfruntnd tot felul de multicolinearitate, dns nu multicolinearitate extrem.
Oricum acest remediu greu se accept de cercettorii nceptori atunci cnd ei se confrunt
cu regresia final, ultima avnd t-statistici nesemnificative. n comparaie cu alternativa
posibil a deplasrilor cauzate de omiterea variabilei importante ori rezultatelor
ntmpltoare, t-statisticile joase se par a fi o problem minor.
7.2. Eliminarea unei sau mai multor variabile multicolineare
Probabil c cela mai sigur cale a salva ecuaia de multicolinearitate semnificativ const
n aruncarea tuturor variabilelor multicolineare. Multicolinearitatea este cauzat de corelarea
dintre variabilele explicative; ecuaia n lipsa variabilelor multicolineare nu mai este supus
corelrii i toate problemele legate de multicolinearitate sunt sistate. Coeficienii variabilelor
pstrate msoar aproape tot impactul comun asupra variabilei dependente a variabilelor
explicative multicolineare excluse.
Ca s demonstrm cum funcioneaz aceast metod vom examina urmtorul exemplu:
)
C i = 367.83 + 0.5113 * Ydi + 0.0427 * LAi
(1.0307)
(0.0942)
0.496
0.453
R 2 = 0.835
consumul; Yd - venitul disponibil; LA - active lichide.
)
C i = 471.43 + 0.9714 * Ydi
t
(0.157)
=
6.187
)
C i = 199.44 + 0.08876 * LAi
R 2 = 0.861
(0.01443)
t
6.153
R 2 = 0.860
De notat, c eliminarea unei din variabilele multicolineare exclude att multicolinearitatea

ntre dou variabile explicative ct i majoreaz t-statisticile pe lng coeficienii variabilelor
pstrate. Prin aruncarea Yd , se majoreaz t LA de la 0.453 pn la 6.153, n acelai timp
aruncarea variabilei schimb valoarea coeficientului rmas (deoarece variabila aruncat nu se
mai menine constanta), aa schimbri dramatice nu sunt de exepie.
Fie c se dorete eliminarea unei variabile, cum se decide care variabil s se arunce? n
cazul multicolinearitii severe nu importa care variabil va fi aruncat. Este lipsit de sens
alegerea variabilei pentru aruncare n pofida faptului c ea este cea mai potrivit sau c este de o
semnificaie sporit (sau are semnul ateptat) n ecuaia original. Din contra, fundamentarea
teoretic a modelului va servi drept temei pentru luarea deciziilor n acest sens. n exemplu
prezentat exist un suport teoretic ntru susinerea ipotezei c venitul disponibil determin
consumul dar nu activele lichide.
n multe cazuri, simpla soluie aruncarea unei din variabilele multicolineare este una bun. De
exemplu, unii din cercettorii neexperimentai includ prea multe variabile explicative n
ecuaiile de regresie nedorit s se confrunte cu deplasrile n variabilele rmase. Prin urmare, ei
25
au deseori dou sau mai multe variabile n ecuaie care msoar n esen aceleai obiecte. n
acest caz, variabilele multicolineare nu sunt irelevante, deoarece fiecare dintre ele este mult
posibil rezonabil att teoretic ct i statistic. n schimb, variabilele pot fi numite inutile; numai
una din ele necesit s reprezinte influena asupra variabilei dependente care o demonstreaz
fiecare dintre ele. De exemplu, pentru funcia cererii agregate, nu va avea sens s se introduc
venitul disponibil i PIB deoarece ambii indicatori msoar acelai subiect: venitul. Puin mai
subtil este concluzia c populaia i venitul disponibil nu vor fi ambele incluse n atare funcie
agregat a cererii deoarece, din nou, ntradevr msoar acelai subiect: volumul pieei agregate.
Cu creterea populaiei va crete i venitul. Aruncarea variabilelor multicolineare inutile de
acest gen nu va face nimic dect se ridice gradul erorii de specificaie.
7.3. Transformarea variabilelor multicolineare
Deseori n ecuaiile care se confrunt cu consecine destul de serioase a multicolinearitii,
ca s autorizere consideraia aciunilor de remediere, toate variabilele sunt extrem de importante
din punct de vedere teoretic. n aa cazuri nici inaciunea, nici mai ales aruncarea variabilei nu
sunt de folos. Oricum, uneori pentru a scpa cel puin de unele multicolineariti este posibil
transformarea variabilelor din ecuaie. Dou din cele mai frecvente transformri sunt:
formarea unei combinaii lineare din variabilele multicolineare,
transformarea ecuaiei n diferene finite (sau logaritmi).
Tehnica formrii combinaiei liniare a dou sau mai multe variabile multicolineare const n:
) crearea unei variabile noi care este o funcie de variabile multicolineare;
b) folosirea variabilei obinute pentru a nlocui variabilele vechi n ecuaia de regresie.
De exemplu, dac variabilele X 1 i X 2 sunt puternic multicolineare, o nou variabila
X 3 = X 1 + X 2 (sau n caz general, orice conbinaie linear de felul X 3 = k1 X 1 + k 2 X 2 poate fi
substituit n modelul reestimat n locul ambelor variabile multicolineare. Aceast tehnic este
util atunci cnd ecuaia urmeaz a fi aplicat pentru date n afara celor observate, deoarece
atunci multicolinearitatea poate s nu existe sau poate s urmeze acelai ablon ca i nuntru
eantionului de date observate. Deseori, n ecuaiile pentru care consecinele multicolinearitii
sunt destul de severe, nct s justifice aplicarea aciunilor de remediere, toate variabilele sunt
extrem de importante din punct de vedere a motivaiei teoretice. Pentru aceste cazuri nici
inaciunea, nici eliminarea variabilelor nu sunt de folos. Oricum, uneori este posibil
transformarea variabilelor din ecuaie ntru reducerea multicolinearitii. Dezavantajul major al
acestei tehnici const n faptul c ambele variabile au acelai coeficient n ecuaia reestimat. De
exemplu, dac
)
)
)
)
X 3i = X 1i + X 2i Yi = 0 + 3 X 3i = 0 + 3 ( X 1i + X 2i ) + u i .
Necesit atenie includerea n combinaia linear a variabilelor care se ateapt s aib
coeficieni diferii (cum ar fi diferite semne) sau o diferen extrem de mare a valorilor (cum ar
fi mrimi de diferit ordin) fr a ajusta aceste devieri prin folosirea constantelor potrivite (k 3 ) n
ecuaia sub forma general ( X 3 = k1 X 1 + k 2 X 2 ). De exemplu, dac dou variabile multicolineare
sunt PIB i rata inflaiei, atunci o simpl sum poate inunda complet variaia inflaiei (depinde
de unitile de msur a variabilelor).
X 3i = GNPi + INFi = 3.250 * GNPi + 0.08 * INFi .
S vedem cum se va schimba X 3 atunci cnd IBP se dubleaz, tot cu atta se dubleaz i X 3 ,
dar dac INF se dubleaz, X 3 aproape deloc nu se schimb. n majoritatea combinaiilor liniare,
necesit a fi ntreprins un calcul grijuliu asupra valorilor medii coeficienilor ateptai a
variabilelor ce fac parte din combinaia liniar. Cu alte cuvinte, variabilele pot s se anuleze una
pe alta sau s se innundeze una pe alta dup mrime.
26
Pentru un exemplu de acest gen s formm o combinaie liniar dintre venitul disponibil i
activele lichide n funcia de consum i deci s relansm regresia cu combinaia liniar a
variabilelor explicative. Pentru a balansa ambele variabile, venitul disponibil poate fi nmulim
cu 10, obinnd: X 3i = 10(Ydi ) + LAi
Constantele n combinaiile liniare de acest fel se capt arbitrar, dar ele pot aciona relativ bine.
Cnd X 3 este folosit la nlocuirea ambelor variabile explicative i se estimeaz ecuaia de
regresie, obinem:
)
C i = 355.43 + 0.0467 * X 3i
(0.0073)
t = 6.362
R2 = 0.868
Comparnd rezultatele precedente, observm c din nou eliminarea multicolinearitii

semnificativ ridic t-statistica variabilei explicative, n timp ce are un efect mic asupra
semnificaiei ecuaiei. Este interesant c coeficientul estimat poate fi calculat din estimrile
precedente a ecuaiei ca combinaie liniar.
Al doilea fel de transformri care poate fi luat n consideraie ca un posibil remediu contra
multicolinearitii severe const n schimbarea formei funcionale a ecuaiei. S vedem cum
transformarea ecuaiei n diferene finite de ordinul nti va diminua gradul de multicolinearitate
n eantionul de date (s-ar putea discuta pe marjinea transformrilor n log sau alte forme
funcionale dar ele sunt efectuate conform aceluiai principiu). Diferenele de ordinul nti nu
sunt alt ceva dect schimbarea n variabila din perioada precedent i perioada curent (care se
refer ca delta sau ) X t = X t X t 1 .
Dac ecuaia (sau mai multe variabile n ecuaie) sunt transformate de la specificarea
normal la specificarea n diferene de ordinul nti este destul de clar c gradul de
multicolinearitate se va reduce esenial pentru dou motive. Primul, orice schimbare n definiia
variabilelor (cu excepia simplei schimbri liniare) va reduce gradul de multicolinearitate. Al
doilea, multicolinearitatea are loc cel mai frecvent (dei bineneles nu exclusiv) n seriile
temporale de date, pentru care diferenele de ordinul nti sunt extrem de puin asemntoare cu
deplasrile permanente ascendente pentru agregatele din care ele sunt calculate. De exemplu,
PIB crete numai cu 5-6%% anual, iar schimbrile n PIB (diferenele de ordinul nti) pot
fluctua auster. Prin urmare, transformarea ntregii ecuaii sau a unei pri ai ecuaiei n diferene
prin specificare este n stare s reduc posibilitatea multicolinearitii n modelul cu serii
temporare.
n timp ce multicolinearitatea sever uneori poate fi diminuat prin trecerea la specificarea
ecuaiei n diferene de ordinul nti (sau la alte specificri), schimbarea formei funcionale a
ecuaiei pur i simplu pentru evitarea multicolinearitii deseori este n stare s aduc posibile
complicaii teoretice. De exemplu, modelarea stocurilor nu este de aceiai natur ca i
modelarea schimbrilor n stocurile de capital, care reprezint investiiile, chiar dac o ecuaie
deriv din alta. Dac scopul principal al lansrii regresiei const n modelarea diferenelor de
ordinul nti, atunci modelul poate fi specificat n aa mod. Pe lng aceasta , la calcularea
diferenelor de ordinul nti, gradul de libertate va fi redus cu o unitate.
7.4. Majorarea numrului de observaii.
Alt cale de a trata multicolinearitatea const n ncercarea de a mri volumul setului de
observaii n aa mod ca s se reduc nivelul multicolinearitii.
Ideea ce st la baz majorrii volumului de observaii n model const n faptul c un
eantion de date mai mare (deseori necesitnd o nou colectare de date) va permite estimri mai
exacte, n acelai timp un set mai mare de date, n mod normal, va reduce ntr-un fel sau altul
variaiile coeficienilor estimai diminund impactul multicolinearitii chiar dac gradul de
multicolinearitate rmne acelai.
27
Oricum, pentru majoritatea aplicaiilor din economie i busines aceasta soluie nu este
posibil. Dup ce setul de date este completat cu date disponibile care par a fi comparabile, date
noi n general sunt greu de gsit sau ele sunt foarte scumpe.
Una din cile de majorare a eantionului de date const n comasarea irurilor temporare i
obinerea de date ncruciate. O astfel de combinaie a surselor de date, de regul, const n
completarea cu date ncruciate (de obicei lipsite de multicolinearitate) a seriilor temporare de
date multicolineare, astfel deminund multicolinearitatea n setul comun de date. Problema
major a acestei reuniuni const n interpretarea i folosirea estimrilor generale. Pn cnd sunt
motive de ncredere c modelul teoretic considerat este acelai n ambele abordri, parametrii
estimai obinui vor fi un fel de funcii asociate ai modelului adevrat n serii temporare i a
modelului adevrat ncruciat. n genere, aa combinaie a diferitor tipuri de date nu este
recomandabil ca modalitate n reducerea multicolinearitii. n majoritatea cazurilor
dificultile unei interpretri necunoscute sunt mai grave dect consecinele cunoscute ale
multicolinearitii.
7.5. Alegerea unui remediu corect
Nu exist o soluie unic n problema cum se va face alegerea remediului contra
multicolinearitii; o ajustare contra multicolinearitii care poate fi de folos pentru o ecuaie,
este nepotrivit pentru o alt ecuaie.
8. Corelarea n serie (autocorelarea)
Corelarea n serie numit tot odat i autocorelare, poate s existe n orice cercetri de
investigare n care ordinul observaiilor are careva semnificaie. De aceea cel mai frecvent
autocorelarea apare n setul de date cu serii temporare. n esen din corelarea n serie rezult
c termenul erorii stocastice dintr-o perioad depinde n mod simetric de termenul de eroare
stocastice din alt perioad. i deoarece seriile temporare de date se folosesc n multe aplicaii
econometrice, este important de a nelege corelarea n serie i consecinele ei pentru estimatorii
M.C.M.M.P.
Se va ntreprinde o ncercare de a rspunde la ntrebrile:
Care este esena problemei?
Care sunt consecinele problemei?
Ct de periculoas este problema?
Ce remedii exista pentru c problema s fie soluionat?
8.1. Corelarea n serie perfect i imperfect
Corelarea observaiilor termenului de eroare ntre ele pe parcursul timpului se numete
corelare n serie. n acest compartiment se va discuta descrierea caracterului (naturei) a corelrii
n serie i deosebirea dintre dou forme a fenomenului, corelare n serie perfect i
imperfect.
8.1.1. Corelarea n serie perfect
Corelarea n serie perfect apare atunci cnd sunt sfidate ipotezele clasice referitor la faptul
c observaiile termenului de eroare nu sunt corelate ntr-o ecuaie specificat corect. Vom
aminti c ipoteza clasic afirm c: E ( i , j ) = 0, (i j ) . Dac valoarea ateptat a produsului
oarecror dou observaii arbitrare ai termenului de eroare nu este egal cu 0, atunci se va
spune c termenul de eroare este corelat n serie. Atunci cnd econometricienii folosesc
termenul corelarea n serie fr nici o modificare, ei se refer la corelarea n serie perfect.
Cel mai frecvent ntlnit tip de corelare n serie se refer la corelarea n serie de ordinul nti,
n care observaia curent a termenului de eroare este o funcie de observaia precedent a
termenului de eroare:
28
t = t 1 + u t ,
(8.1)
unde t este termenul de eroare din ecuaia examinat, - este parametru ce descrie relaia
funcional ntre observaiile termenului de eroare; u t - este termenul de eroare clasic (necorelat
n serie). Forma funcional (8.1.1.1) este aa numita schem Marcovian de ordinul nti i
este coeficientul de autocorelare de ordinul nti. Un astfel mod de corelare n serie se
caracterizeaz prin faptul c una din valorile observaiilor a termenului de eroare afecteaz
direct urmtoarea valoare observat a termenului de eroare. Mrimea coeficientului indic ct
de strns este corelarea n serie n ecuaie. Dac este egal cu zero, atunci nu exist corelare
n serie (deoarece t este egal cu u t termenul de eroare clasic). Dac dup valoarea absolut
nu este mai mare dect unul, valoarea precedent a termenului de eroare devine mai important
n determinarea valorii curente a termenului de eroare i un nivel nalt de corelare n serie exist.
mai mare dect unul dup valoarea absolut nu este rezonabil deoarece implic tendina
creterii continue n timp pentru termenul de eroare dup valoarea absolut. Prin urmare, se va
stabili 1 p p 1 . Semnul indic caracterul corelrii n serie n ecuaie. Valoarea pozitiv
contribuie la faptul c termenul de eroare va avea tendina pe viitor s-i pstreze semnul pozitiv
de la o perioad la alta. Aa o tendin nseamn c n caz c t se ntmpl s aib ans de a
obine valori mari ntr-o perioad de timp, urmtoarele observaii vor tinde sa rein o poriune
din valorile originale mari i vor avea acelai semn ca i observaia original. De exemplu, n
modele cu serii temporare un oc extrem de mare n economie ntr-o perioad de timp poate s
continue i n cteva perioade ce vor urma. Dac aceasta se ntmpl, atunci termenul de eroare
va tinde s rmn pozitiv pentru un numr de observaii, apoi negativ pentru altele cteva, apoi
din nou pozitiv. Acest fenomen se numete corelare n serie pozitiv.
Valoarea negativ implic tendina schimbrii semnului termenului de eroare n
observaiile consecutive de la negativ la pozitiv i invers. Acest fenomen se numete corelare n
serie negativ i implic un fel de cicluri (asemntoare cu micarea pendulului) n urma
desenrii perturbaiilor stocastice. Corelarea n serie negativ de ordinul nti se caracterizeaz
prin faptul c termenul de eroare tinde s aib semn opus de la o observaie la alta.
De exemplu, corelarea n serie poate s existe n termenul de eroare a ecuaiei semianuale a
cererii pentru careva obiecte sezoniere (cum ar fi luminie de Crciun) care nu au variabile
dummy (fictive) sezoniere. Oricum, n majoritatea aplicaiilor cu serii temporare corelarea n
serie negativ se ntlnete mai rar dect corelarea n serie pozitiv.
Corelarea n serie poate lua multe alte forme ce difer de aceea de ordinul nti. De exemplu,
n modelul trimestrial, termenul de eroare a observaiei n trimestrul curent poate fi funcional
relatat la observaiile termenului de eroare n acelai trimestru al anului precedent:
t = t 4 + u t .
(8.2)
La fel este posibil c termenul de eroare n ecuaie s fie funcie de mai multe observaii
precedente a termenului de eroare: t = 1 t 1 + 2 t 2 + ut , aa o formulare este numit corelare
n serie de ordinul doi.
8.1.2. Corelarea n serie imperfect

Prin corelarea n serie imperfect se subnelege corelarea n serie care este cauzat de
eroarea de specificare cum ar fi variabile omise sau form funcional incorect. n timp ce
corelarea n serie perfect este cauzat de distribuia fundamental a termenului de eroare n
specificaia adevrat a ecuaiei, care nu poate fi schimbat, corelarea n serie imperfect este
cauzat de eroarea de specificare care deseori poate fi corectat.
Cum se ntmpl c eroarea de specificare cauzeaz corelare n serie? Vom aminti c
termenul de eroare poate fi tratat drept efect de la omiterea variabilelor, nelinearitatea, erori de
msurare i pur i simplu abateri stocastice a variabilei dependente. Aceasta nseamn c, dac
29
noi omitem o variabil relevant sau utilizm o form funcional incorect, atunci o parte din
efectul omis care nu poate fi reprezentat de variabilele explicative rmase trebuie s fie absorbit
de ctre termenul de eroare. Termenul de eroare pentru ecuaia specificat incorect, prin urmare,
include efectul a mai multor variabile omise i/ori o parte din efectul a diferenei dintre forma
funcional proprie i alta aleas de cercettor. Acest termen de eroare nou poate fi corelat n
serie chiar dac nu este acel adevrat. n acest caz corelarea n serie e cauzat de alegerea
specificaiei de ctre cercettor i nu de termenul de eroare perfect asociat cu specificarea
corect.
Remediile pentru corelarea n serie depind de tipul de corelare: perfect sau imperfect. Nu
este surpriz, c cel mai bun remediu pentru corelarea n serie imperfect, de obicei va fi acela
de nu a ntreprinde ncercri ntru omiterea variabilelor din ecuaie. i, prin urmare, majoritatea
econometricienilor ncearc s se ncredineze c au obinut specificaia ceea mai bun posibil
nainte de a petrece o mulime de timp necjndu-se cu corelarea n serie imperfect.
Pentru a vedea cum omiterea variabilei poate cauza corelarea n serie a termenului de eroare,
s admitem c ecuaia adevrat este:
Yt = 0 + 1 X 1t + 2 X 2t + t ,
(8.3)
unde t este termenul de eroare clasic. Dac X 2 va fi omis accidental din ecuaie (sau datele
pentru X 2 nu sunt disponibile), atunci Yt = 0 + 1 X 1t + t* , unde t* = 2 X 2t + t . Deci termenul
de eroare care va fi folosit n cazul omiterii variabilei nu este termenul clasic de eroare t . n
schimb el este o funcie de variabila independent X 2 . Prin urmare, termenul nou de eroare t*
poate fi corelat n serie chiar i atunci cnd termenul adevrat de eroare t nu este corelat. n
special, termenul nou de eroare t* va tinde spre a fi corelat n serie atunci cnd:
variabila X 2 este singur corelat n serie (acest fapt este destul de probabil n seriile
temporare);
mrimea t este mic n comparaie cu mrimea 2 X 2t .
Aceste tendine se produc, dac exist una sau mai multe variabile omise. Vom meniona
primul fapt: eroarea t* apare cu valoarea diferit de zero deoarece exista corelare n serie
imperfect, estimaia M.C.M.M.P. a termenului liber 0 va fi ajustat la aceast problem. Doi:
deoarece corelarea n serie imperfect implic erori de specificare de tipul variabilelor omise,
corelarea n serie imperfect probabil poate fi asociat cu coeficieni estimai deplasai. Att
deplasrile ct i corelarea n serie imperfect vor dispare odat cu corectarea erorii de
specificare.
Vom examina cererea pentru pete pentru a demonstra cum variabilele omise pot cauza
corelare n serie n termenul de eroare a ecuaie incorect specificate:
Ft = 0 + 1 RPt + 2 ln Ydt + 3 Dt + t ,
(8.4)
aici Ft este consumul de pete pe un cap de locuitor ntr-un an t , RPt este preul relativ a petelui
fa de carnea de vit n anul t , Ydt este venitul disponibil real pe un cap de locuitor n anul t ,
Dt este variabila dummy, egal cu zero pn la decizia Papei i cu o unitate dup , i t termenul clasic de eroare (necorelat n serie). Admitem ca ecuaia (8.4) este de o specificaie
corect. Ce se va ntmpla cu ecuaia n cauz dac variabila venitul disponibil va fi omis
*
Ft = 0 + 1 RPt + 3 Dt + t ?
Cel mai evident efect va fi acela c coeficienii estimai pe lng RPt i Dt vor fi deplasai pe
msura corelrii RPt i Dt cu Ydt . Efectul secundar va fi acela c termenul de eroare acuma va
include o parte considerabil din efectul eliminat al venitului disponibil asupra consumului de
pete, faptul ca t* este egal cu t + 2 ln Ydt . Este rezonabil de ateptat c venitul disponibil (prin
urmare i log lui) poate urma un ablon moderat de corelare n serie:
30
ln Ydt = f (ln Ydt 1 ) + u t
(8.5)
de ce este probabil? Vom privi graficul Ydt n timp. Observm c creterea continu a venitului
disponibil n timp l determin i pe log Ydt s acioneze n mod autocorelat sau corelat n serie.
Dar, dac venitul disponibil este corelat n serie (i dac impactul lui nu este relativ mai mic
dect t ), atunci t* este, mult probabil, s fie la fel corelat n serie, ce poate fi exprimat ca:
t* = t*1 + u t , unde reprezint coeficientul de corelare n serie, dar u t este termenul de eroare
clasic. Acest exemplu ne-a demonstrat ca ntr-adevr este posibil ca variabila eliminat s
introduc corelare n serie imperfect n ecuaie.
Un alt tip rspndit de corelare n serie este acela, cauzat de forma funcional incorect. n
aceast situaie alegerea incorect a formei funcionale poate cauza corelarea n serie a
termenului de eroare. S admitem c ecuaia adevrat este prezentat sub forma logaritmic
complet:
ln Yt = 0 + 1 ln X 1t + t
(8.6)
dar n locul ei este lansat regresia liniar: Yt = 0 + 1 X 1t + t * . Termenul nou de eroare t*
acuma este o funcie de termenul adevrat de eroare t i de la diferena ntre forma liniar i
forma n log complet. Din figura . observm c aceste diferene urmeaz compartimente
moderat autoregresive. Diferenele pozitive tind a fi urmate de diferene pozitive i diferene
negative tind a fi urmate de diferene negative. Prin urmare, folosirea formei liniare atunci cnd
una neliniar este mai potrivit de obicei rezult cu corelare n serie pozitiv imperfect.
9. Consecinele corelrii n serie
Consecinele corelrii n serie sunt complet diferite dup caracter de consecinele ale
problemelor discutate anterior. Variabilele omise, variabilele irelevante i multicolinearitatea
toate au indicii externi care pot fi recunoscui complet. Fiecare problem schimb coeficienii
estimai i erorile standard ntr-un mod concret, i analizarea acestor schimbri deseori ofer
destul informaie ca problema s fie soluionat. Cum vom vedea, corelarea n serie i mai mult
probabil s aib simptoame interne i afecteaz ecuaia estimat pe o cale care nu este uor de
observat prin examinare numai a rezultatelor ca atare.
Exist consecine majore a corelrii n serie:
Corelarea n serie perfect nu cauzeaz deplasri n coeficienii estimai;
Corelarea n serie contribuie la creterea varianelor distribuiilor .
Corelarea n serie induce M.C.M.M.P. s subestimeze varianele (i erorile standarde) a
coeficienilor.
9.1. Sinteza consecinelor corelrii n seri
Existena n ecuaie corelrii n serie a termenului de eroare violeaz ipoteza clasic prin
urmare estimarile ecuaiei cu M.C.M.M.P. au de suportat cel puin trei consecine.
9.1.1. Corelarea n serie perfect nu cauzeaz deplasri n coeficieni
S ne amintim c ceea mai important proprietate a tehnicii de estimare prin M.C.M.M.P.
const n faptul c estimatorii liniari nedeplasai au o varian minim. Dac erorile sunt
corelate n serie, una din ipotezele teoremei Gauss-Marcov este violat i anume ea cauzeaz
deplasri n coeficienii estimai. S admitem c este cunoscut faptul c termenul de eroare n
ecuaia ce urmeaz
Yt = 0 + 1 X 1t + 2 X 2t + t
(9.1.1)
este supus corelrii perfecte n serie de ordinul nti:
t = t 4 + u t ,
(9.1.2)
31
aici u t este termenul erorii clasice (necorelat n serie). Dac ecuaia (9.1) este corect specificat
i este estimat cu M.C.M.M.P., atunci estimaiile coeficienilor obinui vor fi nedeplasate:
)
)
E ( 1 ) = 1 ; E ( 2 ) = 2 . Corelarea perfect n serie nu introduce deplasri n procedura de
estimare. Aceasta concluzie este just att pentru corelarea pozitiv n serie ct i corelarea
negativ n serie de ordinul unu. Dac corelarea n serie este imperfect, oricum deplasrile pot
fi introduse prin utilizarea specificaiei incorecte.
Lipsa deplasrilor nu nseamn cu necesitate c estimaiile M.C.M.M.P. ale coeficienilor
ecuaiei corelate n serie vor fi strns apropiate de valorile adevrate ale coeficienilor, deoarece
o singur estimaie observat n realitate poate parveni dintr-un numr mare al valorilor posibile.
Plus la aceasta, eroarea standard a acestor estimaii va fi la sigur majorat de corelarea n serie.
)
Aceast majorare va spori probabilitatea divierii suficiente a valorii de la valoarea adevrat
)
. n acest caz valorile nedeplasate cu o distribuie s sunt centrate n jurul valorii adevrate .
)
9.1.2. Corelarea n serie mrete varianele distribuiilor

n timp ce violarea ipotezei clasice nu cauzeaz deplasri, ea poate afecta principala
concluzie a teoremei Gauss-Marcov, aceea a varianei minime. n special atunci, cnd ipoteza
)
clasic este violat, este cu neputin de a dovedi c estimaiile M.C.M.M.P. s au o varian
minim. Prin urmare, termenul de eroare este corelat n serie atunci, cnd M.C.M.M.P. nu mai
ofer varian minim a coeficienilor estimai.
Termenul de eroare corelat n serie impune variabila dependent s fluctueze n acelai mod
n care procedeul de estimare a M.C.M.M.P. o atribuie variabilelor independente. Deci, este
mult probabil c M.C.M.M.P. nu ofer estimri adevrate pentru n faa corelrii n serie
)
cauzat de balansare, s rmnnd nedeplasate deoarece supraestimarea este tot att de
probabil ca subestimarea; oricum aceste erori majoreaz variana distribuiei estimaiilor,
sporind mrimea cu care orice estimaie e probabil s difere de la valoarea adevrat . ntradevr, poate fi demonstrat c n cazul cnd termenul de eroare este distribuit n felul
)
t = t 1 + ut , atunci variana s este funcie de . Cu ct este mai mare cu att este mai
)
mare variana s . Efectul corelaiei n serie asupra distribuiei coeficienilor n demonstraia sa

)
grafic rezult cu faptul c distribuia s din ecuaia corelat se regsete n jurul coeficienilor
adevrai, dar este mai plat dect distribuia din ecuaia fr corelare n serie.
9.1.3. Corelarea n serie cauzeaz M.C.M.M.P. s subestimeze variana (i erorile standard) a
coeficienilor
)
Dac corelarea n serie mrete varianele (la fel i erorile standard) a s , atunci putem
presupune c ( s ) obinut prin M.C.M.M.P. tot va crete, ns nu de fiecare dat. n schimb
) )
aceste variane ( s ) au tendina de a fi destul de mici. Prin urmare, corelarea n serie

majoreaz devierile standard a coeficienilor estimai, dar n aa mod care nu este evideniat de
estimaiile M.C.M.M.P.
M.C.M.M.P. are tendina de a subestima erorile standard a coeficienilor ecuaiei corelate n
serie, deoarece corelarea n serie rezult din compartimentul de observaii care permit o
aproximare mai bun dect aceea pe care observaiile ecuaiei necorelate n serie pot s-o
)
justifice. Aproximaia mai bune rezult nu numai din subestimaiile erorilor standard ale s , dar
i din erorile standard a reziduurilor, nct nici pe t - statistici, nici pe F - statistic nu se poate
baza n prezena corelrii n serie perfecte.
) )
32
n special, tendina M.C.M.M.P. de a subestima ( s ) va contribui la supraestimarea t statisticilor ale coeficienilor estimai, ntruct:
)
(
H )
t= ) ) .
(9.1.3)
( )
) )
Dac ( ) prea mic cauzeaz t - valoare mare pentru un coeficient distinct, atunci este mult
probabil c ipoteza nul va fi respins H 0 : ( = 0) , n timp ce ea este adevrat. n esen,
M.C.M.M.P. produce confuzie n vederea semnificaiei rezultatului concret. Corelarea n serie
nu numai majoreaz devierile standard, dar deseori conduce la concluzii greite care fac dificil
acapararea acestei creteri de M.C.M.M.P.
) )
9.2.Testul Durbin-Watson
Cel mai larg utilizat test pentru depistarea corelrii n serie este d - testul Durbin-Watson.
9.2.1. Statistica Durbin-Watson
Statistica Durbin-Watson d este calculat prin examinarea reziduurilor ale estimaiei
concrete a ecuaiei, i se folosete pentru determinarea faptului existenei corelrii n serie de
ordinul nti n termenul de eroare inclus n ecuaie. Este important ca d - statistica DurbinWatson s se foloseasc numai atunci cnd ipotezele care fundamenteaz acest fenomen sunt de
fa:
Modelul de regresie include termenul de intersecie (termenul liber).
Corelarea n serie de ordinul nti exist: t = t 1 + ut , unde este coeficientul corelrii
n
t =2
t =2
n serie i u t este termenul erorii clasice (necorelat n serie), = u t u t 1 / u t21 .

Modelul de regresie nu trebuie s conin variabile ntrziate dependente n calitate de
variabile independente (n acest caz d - statistica este deplasat spre 2, dar poate fi folosit
testul n Durbin Watson sau altele).
Ecuaia pentru d - statistica Durbin-Watson pentru T observaii este urmtoarea:
T
d = (u t u t 1 ) / u t2 ,
t =2
(9.2.1)
t =1
aici u t sunt reziduurile obinute prin M.C.M.M.P. Vom meniona c numrtorul are cu o
observaie mai puin dect numitorul, deoarece o observaie necesit a fi utilizat pentru
calcularea u t 1 . d - statistica Durbin-Watson este egal cu zero atunci cnd exist corelaie n
serie pozitiv extrem, este egal cu doi dac nu exist corelaie n serie i este egal cu 4 dac
exist corelaie n serie negativ extrem. Vom demonstra aceasta, prin a introduce datele
reziduurelor respective n ecuaia (9.8).
d = 0. Corelarea n serie pozitiv extrem. n acest caz, u t = u t 1 , deci (u t u t 1 ) = 0 i d = 0,
( = 1 ).
d 4. Corelare n serie negativ extrem. n acest caz, u t = u t 1 i (u t u t 1 ) = 2u t .
Substituind n ecuaia (9.8), obinem d =
(2ut )2
2
t
d 4 , = 1 .
Nu exista corelare n serie: d 2 , = 0 .

9.2.2. Utilizarea d - testului Durbin-Watson
Testul Durbin-Watson nu este frecvent utilizat din dou motive. Primul, econometricienii
aproape niciodat nu testeaz ipoteza unidirecional zero a existenei corelrii n serie negative
33
n reziduuri deoarece corelarea n serie negativ, dup cum a fost meninut mai sus, este foarte
greu de explicat teoretic n analiza economic sau de busines. Existena ei nseamn c corelarea
n serie imperfect probabil c este cauzat de eroarea de specificare. Doi, uneori testul DurbinWatson este neconcludent. n timp ce regula de luarea a deciziei de fiecare dat are numai
regiuni de acceptare sau de respingere, testul Durbin-Watson are a treia posibilitate, numit
regiune neconcludent.
n aceste circumstane, utilizarea d - testului Durbin-Watson este aproape similar
utilizrii t - testului sau F - testului. Pentru a testa corelarea n serie pozitiv sunt necesare
urmtoarele etape:
1. Obinem reziduurile M.C.M.M.P. din ecuaia supus testrii i calculm d - statistica cu
ajutorul formulei (9.8).
2. Determinm volumul eantionului i numrul variabilelor explicative i apoi consultm
tabelele statisticilor pentru a gsi valoarile critice: d U - maximal i d L - minimal respectiv.
3. Dat fiind anunat ipoteza H 0 : 0 , care infirm corelarea n serie pozitiv i ipotezele
unidirecionale H A : f 0 (exist corelare n serie pozitiv).
Ceea mai potrivit regula de luarea a deciziei este:
dac d p d L se respinge ipoteza H 0 :
dac d f dU nu se respinge ipoteza H 0 :
dac d L d dU ipoteza H 0 : nu e convingtoare.
n unele circumstane cel potrivit va fi testul bidirecional. n acest caz vor fi utilizate numai
etapele 1 i 2 dar etapa 3 nu va fi utilizat.
Dat fiind anunate ipotezele bilaterale de alternativ:
H 0 : = 0 (nu-i corelare n serie)
H A : 0 (este corelare n serie),
ceea mai potrivit regula de luare a deciziei va fi:
dac d p d L se respinge H 0 :
dac d f 4 d L se respinge H 0 :
dac 4 dU f d f dU nu se respinge H 0 : ,
n celelalte cazuri H 0 : nu e concludent
9.3. Estimarea modelelor cu autocorelarea erorilor
Corelarea n serie de ordinul nti presupune c valoarea termenului de eroare n momentul
t t depinde de valoarea termenului de eroare n momentul t 1 t 1 . Prin urmare exist un
model de regresie de forma:
t = 0 + 1 t 1 + u t ,
unde 0 , 1 sunt parametrii ecuaiei de regresie. n conformitate cu formulele M.C.M.M.P.
avem: 0 = t 1 t 1 ; 1 =
ecuaii
cu
t t 1 t t 1
, t = t 1 = 0 , deoarece t sunt reziduurile obinute din

t21 t21
M.C.M.M.P. i conform ipotezelor ntru funcionarea M.C.M.M.P.
n
t = 0 t = t 1 = 0 . Atunci avem
0 = 0 , iar
1 =
t t 1
2
t 1

t =2
n
t 1
care este
t 1
t =2
coeficientul de autocorelare a reziduurilor de ordinul unu. Deci, avem: t = 1 t 1 + u t , u t termenul erorii stocastice clasic. Vom nota c 1 p 1 . innd cont de ultima relaie, obinem:
34
Yt = 0 + 1 X 1t + 1 t 1 + u t .
(9.3.1)
Vom considera abordarea de baz Yt = 0 + 1 X 1t + t la estimarea parametrilor ecuaiei de
regresie n cazul cnd are loc autocorelarea reziduurilor. nscriem modelul de regresie enunat
pentru t = t 1 :
Yt 1 = 0 + 1 X 1t 1 + t 1 ,
(9.3.2)
vom nmuli ambele pri ale ecuaiei (9.3.2) la 1 ,
1 Yt 1 = 1 0 + 1 1 X 1t 1 + 1 t 1 ,
(9.3.3)
i vom extrage (9.3.2) din (9.3.1) dup ce obinem:
Yt 1 Yt 1 = 0 1 0 + 1 X 1t 1 1 X 1t 1 + t 1 t 1
(9.3.4)
sau Yt = 0 + 1 X 1t + u t ,
(9.3.5)
n (9.3.5)
Y/ t = Yt 1 Yt 1
(9.3.6)
X t = X t 1 X t 1
(9.3.7)
ut = t 1 t 1
(9.3.8)
0 = 0 (1 1 )
(9.3.9)
Deoarece u t este termen de eroare stocastic necorelat, pentru estimarea parametrilor ecuaiei
(9.3.5) se aplic M.C.M.M.P. simpl.
n concluzie, atunci cnd erorile ecuaiei iniiale sunt autocorelate, pentru estimarea parametrilor
ecuaiei de regresie se utilizeaz M.C.M.M.P.G. i este necesar s se ndeplineasc urmtoarele
condiii:
s se transforme variabilele Yt i X t la forma (9.3.6)-( 9.3.7),
s se aplicice M.C.M.M.P. la ecuaia (9.3.5) entru estimarea parametrilor 0 , 1 ,
s se calculeze parametrul 0 / (1 1 ) = 0 ,
s se nscrie ecuaia iniial.
M.C.M.M.P.G. este o analogie a metodei diferenelor finite. Numai c se scade din Yt i X t
nu valoarea deplin a Yt 1 (sau X t 1 ), dar numai careva parte din ele - r1 Yt 1 sau r1 X t 1 . Atunci
cnd r1 = 1 , aceasta metod este metoda diferenelor finite de ordinul 1, ntruct Yt = Yt Yt 1 ;
X t = X t X t 1
n concluzie, dac valoarea d - testului Durbin-Watson se apropie de 0, aplicarea metodei

diferenelor finite de ordinul nti este destul de motivat. Dac r1 = 1 , termenul de eroare este
corelat negativ n serie, atunci metoda expus se modific n felul urmtor.
Y/ t = Yt (1)Yt 1 = Yt + Yt 1
X t = X t (1) X t 1 = X t + X t 1
(9.3.10)
(9.3.11)
Deoarece,
0 = 0 (1 (1) ) = 2 0
(9.3.12)
avem
Yt + Yt 1 = 2 0 + ( X t + X t 1 ) + u t
(9.3.13)
i
(Yt + Yt 1 ) / 2 = 0 + ( X t + X t 1 ) / 2 + u t / 2
(9.3.14)
n esen, n modelul (9.3.14) se determin mediile a dou perioade pentru fiecare serie i
apoi pentru datele medii obinute cu ajutorul M.C.M.M.P.G. se estimeaz parametrii 0 , 1 .
Problema principal const n determinarea estimaiei r1 , ca s putem aplica aceasta
metod. Exist o mulime de procedee pentru determinarea acestei estimri. ns abordarea de
baz o constituie evaluarea acestui coeficient nemijlocit din estimrile obinute pentru ecuaia
iniial de regresie r1 = 1 d / 2 , d este testul Durbin-Watson.
35
Ipoteze unilaterale
H0 : 0
(lipsete autocorelarea variabilelor reziduale);

H A : f 0 (autocorelarea variabilelor reziduale are loc);
d p dL
(ipoteza H 0 se respinge);
d L d d U (domeniul de incertitudine);
d f dU
(ipoteza H 0 se accept).
Ipoteze bilaterale de alternativ
H 0 : = 0 (lipsete autocorelarea variabilelor reziduale);
H A : 0 (autocorelarea variabilelor reziduale are loc);

d p dL
d f 4 dL
4 d U f d f d U ( ipoteza H 0 se accept) n restul cazurilor exist domeniul de incertitudine.
O transformare grijulie a variabilelor ntru corectarea eteroschedasticitii, dei nu evita
corelarea fals, datorat valorilor mari, uneori poate fi o abordare reuit n soluionarea acestor
probleme. De notat totui, c nu fiecare variabil n ecuaie este tratat n acelai mod (spre
deosebire de M.C.M.M.P.G. ponderat). Fiecare variabil n modelul cu date ncruciate poate fi
examinat n vederea transformrilor posibile care se vor solda cu interpretri semnificative i
complete a ecuaiei de regresie.
10. Eteroschedasticitatea
Eteroschedasticitatea este rezultatul violrii ipotezei clasice referitor la faptul c observaiile
termenului de eroare au o varian constant (fac parte dintr-o populaie cu o varian
constant). Ipoteza varianei constante pentru diferite observaii a termenului de eroare
(moschedasticitatea) nu este de fiecare dat una realist. De exemplu, n modelul care msoar
nlimea, s comparm eroarea cu un inch (2.54 sm) la msurarea nlimii unui juctor de
basket i eroarea cu un inch la msurarea nlimii oricelului. E mult probabil c termenul de
eroare asociat cu nlimea basketbolistului va parveni din distribuia cu o varian mai mare
dect aceea asociat cu nlimea oricelului. Cum se va demonstra, distincia dintre
eteroschedasticitate i omoschedasticitate este important deoarece M.C.M.M.P. aplicat la
modelele eteroschedastice, nu mai este estimator de o varian minim (rmnnd totui
nedeplasat).
Deseori eteroschedasticitatea apare atunci cnd datele sunt de aa natur c exist o
diferen mare dintre valorea ceea mai mare observat i valoarea ceea mai mic observat.
Devierea mare ntre mrimile observaiilor n populaie contribuie la probabilitatea sporit ca
distribuia termenului de eroare s aib pentru observaiile mai mari o varian mai mare, n
timp ce distribuia termenului de eroare pentru observaiile mici are o varian mic.
Poate fi uor obinut o diferen mare ntre cele mai mici i cele mai mari valori ale
variabilelor n mulimea de date ncruciate. Vom aminti c n modelele cu date ncruciate
variabilele sunt observate n acelai timp, dar pentru diferite obiecte (de exemplu, persoane,
state, regiuni etc). Deoarece modelele ncruciate deseori includ observaii de diferite mrimi n
acelai exemplu, eteroschedasticitatea este greu de evitat n tematicile economice studiate
ncruciat.
Punerea accentului pe modelele ncruciate nu nseamn c eteroschedasticitatea este
imposibil n modelele cu serii temporare i nici nu se exclude posibilitatea c variabilele omise
36
pot cauza eteroschedasticitate imperfect n orice tipuri de date. Oricum la mod general,
eteroschedasticitatea cu probabilitate mai mare poate avea loc n modelele cu date ncruciate
dect n modelele cu serii temporare.
n acest context, se va ncerca s dea rspunsul la cteva ntrebri ce in de
eteroschedasticitate, care au fost oglindite pentru multicolinearitate i corelare n serie.
1. Care este esena problemei?
2. Care sunt consecinele problemei?
3. Cum problema se depisteaz?
4. Ce remedii pentru aa problem sunt disponibile?
10.1. Eteroschedasticitatea perfect i imperfect
Eteroschedasticitatea perfect este aceea care poate fi cauzat de termenul de eroare a
ecuaiei specificate corect, n timp ce eteroschedasticitatea imperfect este cauzat de eroarea de
specificaie cum ar fi variabilele omise.
10.1.1. Eteroschedasticitatea perfect.
Eteroschedasticitatea perfect s refer la eteroschedasticitatea care este funcie ce depinde
de termenul de eroare a ecuaiei de regresie corect specificat. Utilizarea cuvntului
eteroschedasticitate fr modificri (cum ar fi perfect sau imperfect) implic
eteroschedasticitatea perfect.
Aa tip de eteroschedasticitate apare atunci cnd n ecuaia specificat corect ipoteza clasic
care presupune c varianele termenului de eroare sunt constante, este violat. Vom reaminti, c
ipoteza presupune c:
VAR( i ) = 2 , (i = 1,2, L , n )
(10.1.1)
Dac aceasta presupunere are loc, toate observaiile ale termenului de eroare pot fi
imaginate dat fiind prezentate printr-o distribuie asemntoare cu valoarea medie zero i
variana 2 . Acest 2 nu se schimb de la observaie la alta a termenului de eroare; aceasta
proprietate se numete omoschedasticitate.
n cazul eteroschedasticitii, variana termenului de eroare nu este constant, n schimb,
variana distribuiei termenului de eroare depinde exact de observaia n discuie:
VAR( i ) = i2 , (i = 1,2, L , n ) .
(10.1.2)
De menionat c diferena dintre (10.1) i (10.2) const n prezena indicelui " i" pe lng 2 ,
care denot faptul ca variana termenului de eroare n condiii de eteroschedasticitate se
schimb n dependen de observaie n loc s fie constant pentru orice observaie.
Alt cale de a ilustra eteroschedasticitatea const n prezentarea grafic a mulimei n care unele
observaii a termenului de eroare au distribuii mai plate dect altele. Cea mai simpl situaie e
aceea pentru care observaiile termenului de eroare pot fi grupate numai n dou distribuii
diferite, lat i ngust. Aceasta versiune simpl a problemei poate fi numit
eteroschedasticitate discret. n acest caz ambele distribuii vor fi centrate n jurul punctului
zero, ns una va avea o varian mai mare dect alta.
Eteroschedasticitatea ea forme mult mai complexe, oricum: numrul diverselor modele cu
eteroschedasticitate practic nu este limitat, chiar analiza unui procent mic din aceste alternative
este o sarcin grea. n continuare se vor examina principiile generale ale eteroschedasticitii,
concentrndu-se asupra celor mai frecvent specificate modele de eteroschedasticitate perfect.
Ceea ce nu nseamn c econometricienii se axeaz numai pe un tip de eteroschedasticitate.
Vom examina un model cu eteroschedasticitate, n care variana termenului de eroare este
relatat la variabila exogen Z i . Pentru ecuaia de regresie tipic:
Yi = 0 + 1 X 1i + 2 X 2i + i ,
(10.1.3)
variana termenului de eroare clasic i n condiiile propuse va fi egal cu:
VAR( i ) = 2 Z i2 ,
(10.1.4)
37
aici variabila Z i poate fi egal sau nu poate fi egal cu una din variabilele X s din ecuaie.
Variabila Z i se numete factor de proporionalitate deoarece variana termenului de eroare se
schimb proporional cu ptratul de Z i . Cu ct este mai mare Z i , cu att este mai mare variana
distribuiei termenului de eroare pentru observaia " i" . Pot fi n diferite distribuii, cte una
pentru fiecare observaie. n funcie de numrul valorilor distincte pe care le ea variabila Z i pot
fi prezentate observaiile termenului de eroare .
Ce reprezint n realitate factorul de proporionalitate Z i ? Cum este posibil ca o variabil
exogen, cum ar fi Z i , s schimbe ntreaga distribuie a termenului de eroare? S ne adresm la
funcia care relateaz consumul gospodriilor la venitul lor. Cheltuielile gospodriilor populaiei
cu venit mic este imposibil s varieze dup valoarea absolut ca i cheltuielile gospodriilor
populaiei cu venit mare, deoarece schimbarea cu 10% n cheltuieli pentru familiile cu venit
mare atrage mai muli bani dect schimbarea cu 10% a acelor cu venit mic. Pe lng aceasta,
cota parte din bugetul familiilor cu venit mic care trebuie s fie cheltuit pentru necesiti este
mult mai mare dect aceea din bugetul familiilor cu venit mare. n cazul dat Yi va reprezinta
cheltuielile de consum dar factorul de proporionalitate Z i va oglindi venitul gospodriilor
populaiei. Dac venitul gospodriilor populaiei crete, atunci i variana termenului de eroare
n ecuaie deasemenea va fi de natura s explice cheltuielile respective.
Acest exemplu ne demonstreaz faptul c eteroschedasticitatea e mult probabil s apar n
modele cu date ncruciate, deoarece exist o variaie mare n valorile variabilei dependente
incluse. Bunoar, abaterile exogene care pentru familiile cu venit mic se arat a fi
semnificative, pentru familiile cu venit mare pot s par minuscule.
n acelai timp, eteroschedasticitatea poate s apar n modelele cu serii de date temporare
cel puin n dou situaii care difer de acelea din modelele cu date ncruciate cu un numr
mare de variaii n valorile variabilei dependente:
Eteroschedasticitatea poate s apar n modelele cu date sub form de serii temporare cu
schimbri mari n variabila dependent (rata de schimbare a variabilei dependente este
mare). Dac are loc o cretere extrem de mare n industrie, atunci e mult probabil ca
variana termenului de eroare s creasc n aceiai msur. ns atare fenomen nu are loc
n seriile de timp cu o rat joas de schimbare.
Eteroschedasticitatea poate s apar n orice model, cu serii de date temporare n care
calitatea datelor colectate se schimb dramatic. Cum numai tehnica de colectare a datelor
devine mai bun, variana termenului de eroare va diminua, deoarece erorile de msurare
iau parte din termenul de eroare. Atunci cnd erorile de msurare se micoreaz, se
micoreaz i variana termenului de eroare.
10.1.2. Eteroschedasticitatea imperfect
Eteroschedasticitatea cauzat de erori de specificare, cum ar fi variabilele omise, se refer c
eteroschedasticitatea imperfect. n acelai timp forma funcional improprie puin probabil s
cauzeze eteroschedasticitatea imperfect, pe cnd ea produce corelaria n serie imperfect, cele
dou concepte fiind similare sub mai multe aspecte.
Variabila omis e posibil s conduc la eteroschedasticitatea termenului de eroare deoarece
o parte din efectul omis nu este reprezentat nici de o variabilel explicativ prezent n ecuaie,
deci este incorporat de termenul de eroare. Dac acest fenomen are o componen
eteroschedastic, termenul de eroare a ecuaiei respecificate poate fi eteroschedastic chiar dac
termenul de eroare al ecuaiei adevrate nu este. Aceasta distincie este important deoarece n
condiiile eteroschedasticitii imperfecte remediul corect consta n ncercarea de a gsi variabila
eliminat i de a o include n ecuaia de regresie. Deci nainte de a purcede la depistarea sau a
remedierea eteroschedasticitii perfecte este important s existe sigurana specificaiei corect.
38
De exemplu, s considerm un studiu ncruciat al importurilor n anul 1990 al unui numr

de naiuni de diferit mrime. Pentru simplitate, se presupune c cel mai bun model a
importurilor pentru naiuni n abordarea ncruciat include o relaie pozitiv referitor la PIB-ul
respectiv i o relaie pozitiv privind preul relativ (care include impactul ratei de schimb) ntre
aceste ri i restul lumii. n aceste circumstane modelul adevrat va fi urmtorul:
M i = f ( PIB + , PR + ) = 0 + 1PIBi + 2 PRi + i ,
(10.1.5)
unde M i sunt importurile (n $) a naiunii is ; PIBi este produsul intern brut (n $) a naiunii is ;
PRi este raportul dintre preul domestic al mrfurilor normal comercializate (convertit n $ cu
ajutorul ratei de schimb) i preurile mondiale ale acestor bunuri (msurate n $) pentru naiunea
i s ; i este termenul erorii clasice.
Acum s admitem c ecuaia este lansat fr PIB , atunci ecuaia va lua forma:
*
M i = 0 i + 2 PRi + i , unde termenul de eroare a ecuaie respecificate, * , este funcie de la
PIB , variabila aruncat i termenul noneteroschedastic de eroare : i = 0 + 1PIBi .
*
n msura n care preul relativ nu acioneaz ca o variabil proxy (de nlocuit) fa de

PIB , termenul de eroare nu incorporeaz efectul variabilei omise. Dac acest nou efect are o
varian mai mare pentru valorile PIB mai mari, ce pare a fi probabil, termenul nou de eroare
* , este eteroschedastic. Impactul acestui efect n acelai timp depinde de mrimea 1PIBi ,
componenta comparabil cu valoarea absolut a componentei tipice i . Cu ct este mai mare
cota parte a variabilei omise n i * , cu att e mai probabilitatea prezenei eteroschedasticitii
imperfecte. Deci, termenului de eroare i * prezentat grafic n raport cu PIB , apare n figura de
mai jos. Observm c, valorii mai mari ai PIB -ui i corespunde variana mai mare a termenului
de eroare.
+
*
GDP
0
-
10.2. Consecinele eteroschedasticitii

Fie c s-a stabilit eteroschedasticitatea termenului de eroare din ecuaie este, atunci ce
impact ar avea acest fenomen asupra estimaiilor coeficienilor? Consecine ale
eteroschedasticitii n linii mari sunt aproape identice cu acelea ale corelrii n serie, dei
aceste dou probleme sunt complet diferite.
n cazul cnd termenul de eroare al ecuaiei este eteroschedastic, exist trei consecine
majore:
Eteroschedasticitatea perfect nu cauzeaz deplasri n estimrile coeficienilor cu
metoda celor mai mici ptrate. Deci, putem afirma c o ecuaie corect specificat care
conine eteroschedasticitate perfect are urmtoarele proprieti: E ( s ) = s , s . Ecuaia
cu eteroschedasticitate imperfect cauzat de variabilele omise, cu siguran, va avea o
posibil deplasare de specificare.
)
Eteroschedasticitatea mrete variana distribuiilor s . Dac termenul de eroare n
ecuaie este eteroschedastic n funcie de factorul de proporionalitate Z :
VAR( i ) = 2 Z i2 ,
(10.2.1)
39
atunci variana s este funcie de Z :
)
)
VAR ** ( s ) = f ( Z 2 ) VAR( s ) ,
(10.2.2)
)
unde VAR ** ( s ) este variana cu eteroschedasticitate; f ( Z 2 ) indic o funcie pozitiv de
Z , factorul de proporionalitate care cauzeaz eteroschedasticitatea n ecuaia (10.7),
)
iar VAR( s ) este variana fr eteroschedasticitate. Dac ipoteza clasic cu privire le
eteroschedasticitate este violat, atunci nu poate fi dovedit existena varianei minime

din teorema Gauss-Marcov. Eteroschedasticitatea conduce la faptul c M.C.M.M.P.
subestimeaz varianele (i erorile standard) ale coeficienilor.
)
Eteroschedasticitatea produce creterea varianelor s ntr-un mod care nu este perceput
de estimaiile M.C.M.M.P., deci aceast metod aproape de fiecare dat subestimeaz
aceste variane. Prin urmare, nici t - statisticile, nici F - statistica nu pot fi de ncredere
n faa eteroschedasticitii incorecte. Rezult c M.C.M.M.P. se soldeaz cu t - valori
majorate, care pot fi obinute dac termenul de eroare a fost eteroschedastic, n unele
cazuri provocnd cercettorii s resping ipoteza nul atunci cnd ea n-ar trebui s fie
respins.
Eteroschedasticitatea cauzeaz un segment specific de consecine deoarece Z i variana
distribuiei termenului de eroare crete, n aa mod c se mrete probabilitatea apariiei
observaiilor ale termenului de eroare majore (dup valoarea absolut). Dac din ntmplare
segmentul acestor observaii este pozitiv, dac una din variabilele independente este suficient
)
mai mare dect media, estimaiile s , obinute cu M.C.M.M.P. pentru aceasta variabil vor
tinde spre a fi mai mari n comparaie cu valoarea adevarat. Pe de alt parte, dac segmentul
acestor valori mari ale observaiilor termenului de eroare se ntmpl a fi negativ cnd una din
)
variabilele X s este suficient mai mic dect media, atunci estimaiile s obinute prin
M.C.M.M.P. pentru acest variabil au tendina de a fi mai mici dect acelea adevrate.
Deoarece termenul de eroare totui se presupune a fi independent de toate variabilele
explicative, supraestimrile sunt tot att de probabile ca i subestimrile iar estimatorul
M.C.M.M.P. n prezena eteroschedasticitii rmne nedeplasat. Oricum, eteroschedasticitatea
)
)
contribuie la faptul c s se ndeprteaz de la valorile adevrate, deci variana distribuiei s
crete.
10.3. Testarea eteroschedasticitii
Nu toi econometricienii utilizeaz aceleai teste pentru depistarea eteroschedasticitii,
deoarece eteroschedasticitatea ea diferite forme i manifestarea ei exact n ecuaia examinat
aproape de fiecare dat este necunoscut. Abordarea problemei cu ajutorul factorul de
proporionalitate Z i este numai una din multe specificaii ai formelor de eteroschedasticitate.
Prin urmare, nu exist o nelegere universal asupra metodei de testare a eteroschedasticitii;
manualele de econometrie nscriu mai mult de opt metode diferite pentru o atare testare.
Vom prezenta patru teste diferite pentru depistarea de eteroschedasticitate. Primul sw va
considera testul Park.
10.3.1 Testul Park
Fie VAR( i ) = 2 Z i2 , unde i este termenul de eroare n ecuaia supus estimrii, 2 variana termenului de eroare omoschedastic i Z i este factorul de proporionalitate. Testul Park
este un procedeu formal care ncearc s testeze reziduurile n vederea eteroschedasticitii n
acelai mod n care d - statistica Durbin Watson testeaz reziduurile n vederea corelrii n
serie. Testul Park conine trei etape principale. La prima etap ecuaia de regresie este estimat
cu ajutorul M.C.M.M.P. i sunt calculate reziduurile. La etapa a doua se efectueaz logaritmarea
ptratelor rezidualelor, care reprezint o variabil dependent ntr-o nou ecuaie de regresie cu
40
unica variabil explicitativ - factorul de proporionalitate Z . n sfrit, la a treia etap,

rezultatele obinute de la lansarea regresiei adiionale sunt testate n vederea existenei ai
eteroschedasticitii.
Oricum, nu e necesar s se lanseze testul Park pentru fiecare ecuaie estimat. nainte de a
folosi testul Park, este o idee bun de a verifica urmtoarele probleme.
Exist oare erori de specificare evidente? Dac ecuaia estimat este suspectat n
vederea variabilelor omise sau a fost relansat din cauza specificrii, testul Park va fi
amnat pn cnd specificaia este pe ct e posibil bun.
Este afectat de eteroschedasticitate subiectul cercetrilor deseori? Nu numai studiul
modelelor de regresie cu date ncruciate este ceea mai potrivit surs a
eteroschedasticitii (de exemplu, este mai mult suspect dect altele modelul cu variane
majore n valorile variabilei dependente).
n sfrit, prezentarea grafic a reziduurilor demonstreaz careva dovezi n favoarea
eteroschedasticitii? Uneori putem economisi mult timp construind graficul reziduurilor
n funcie de factorul potenial de proporionalitate Z . Graficul deseori ne demonstreaz
este probabil sau nu eteroschedasticitatea fr a fi aplicat testul Park.
Atunci cnd exist unele motive pentru suspectarea eteroschedasticitii cel mai potrivit
este s se lanseze testul Park. Deoarece testul Park nu se lanseaz automat de pachetele
computerizate de regresie, este necesar a cunoate cum se lanseaz testul desinestattor:
Etapa I: La prima etapa estimm ecuaia cu M.C.M.M.P. i apoi obinem rezidualele din
)
)
)
estimaii: u i = Yi 0 1 X 1i 2 X 2i .
Etapa II: Folosind reziduurile calculate pentru a alctui variabila dependent pentru regresia
adiional. Testul Park n special sugerat s lansai urmtoarea ecuaie de regresie n log
complei: ln(u i2 ) = 0 + 1 ln(Z i ) + vi , unde u i sunt reziduurile din prima ecuaie; Z i este ceea mai
bun selecie pentru posibilul factor de proporionalitate; vi este termenul de eroare clasic
(omoschedastic).
Etapa III: Cu ajutorul t -testului se testeaz semnificaia coeficienului de pe lng ln(Z ) din
ecuaia adiional. Ultima etap const n testarea semnificaiei ln(Z ) cu ajutorul t-statisticei
ntru explicaia ln(u 2 ) din ecuaie. Dac coeficientul de pe lng ln(Z ) este semnificativ diferit
de zero, se confirm existena segmentului eteroschedastic n reziduuri n respect cu Z ; n caz
contrar, eteroschedasticitatea relatat la acest Z distinct nu este susinut. Oricum, exist
posibilitatea confirmrii c termenul specific de eroare a ecuaiei este omoschedastic.
Testul Park nu este uor de utilizat. Problema major const n identificarea factorului de
proporionalitate Z . Dei Z adeseori este o variabil explicativ n ecuaia de regresie de
origine, acest fapt nu este garantat de fiecare dat. Un Z particular poate fi ales pentru testul
Park numai dup investigarea tipului de eteroschedasticitate potenial n ecuaie. Un Z bun
este o variabil care e probabil s se schimbe odat cu variana termenului de eroare.
De exemplu, n modelul ncruciat a rilor sau regiunilor, un Z bun va fi unul care msoar
volumul observaiilor n raport cu variabila dependent n examinare. Atunci cnd este greu de
specificat cel mai bun Z pentru o ecuaie particular, este deseori bine venit s distingem Z
bun de la Z prost.
11. Remedierea eteroschedasticiti
Se vor prezint cteva remidii contra eteroschedasticitii, totodat se va atrage atenia c
exist situaii n care problema poate fi lsat neajustat. De arta econometriei ine nvarea de
a distinge o situaie de alta.
Primul pas n ncercarea de a scpa ecuaia de eteroschedasticitate const n a ncerca de a
percepe este perfect sau imperfect eteroschedasticitatea. Dac eteroschedasticitatea se
41
confirm a fi imperfect, atunci se determin variabilele omise care cauzeaz

eteroschedasticitatea imperfect ca apoi ele s fie incluse n ecuaie. Dac eteroschedasticitatea
este perfect, se consider dou remedii generalizate.
1. Utilizarea M.C.M.M.P. ponderate.
Dac eteroschedasticitatea este perfect se va considera M.C.M.M.P. ponderat (o form
generalizat a M.C.M.M.P.). mprind toi termenii ecuaiei la factorul de proporionalitate Z
(sau la o funcie de Z ), care pare a fi relatat la eteroschedasticitate. Dup mprire, se
reestimeaz ecuaia cu variabil dependent ajustat i variabilele independente ajustate.
2. Redefinirea variabilelor.
Efectul eteroschedasticitii reziduurilor deseori poate fi eliminat prin redefinirea variabilelor.
Aceasta este o abordare direct pentru corectarea eteroschedasticitii n timp ce abordarea
metodei ponderate este indirect. Redefinirea variabilelor se va baza pe teoria respectiv i
recentrarea ecuaiei la comportamentul de baz care necesit a fi explicat.
Deci, primul lucru care necesit a fi fcut, dac testul Park indic posibilitatea apariiei
eteroschedasticitii const n examinarea minuioas a ecuaiei n vederea erorilor de
specificare. Dei nu se va include niciodat variabila explicativ dintr-un simplu motiv c testul
Park indic posibilitatea eteroschedasticitii, se cuvine o meditare riguroas prin specificrile
ecuaiei. Dac remeditarea v permite s descoperii o variabil care va trebui s fie n ecuaia
de regresie de la bun nceput, atunci aceasta variabil necesit a fi introdus n ecuaie. Oricum,
dac nu exist erori de specificare evidente, atunci eteroschedasticitatea probabil c este
fireasc, i unul din remedii poate fi aplicat.
11.1. Metoda celor mai mici ptrate ponderat
S examinm o ecuaie cu eteroschedasticitate perfect cauzat de factorul de proporionalitate
Z:
Yi = 0 + 1 X 1i + 2 X 2i + i ,
(11.1)
unde variana termenului de eroare n loc s fie constant este de felul:
VAR( i ) = i2 = 2 Z i2 ,
(11.2)
unde Z i este factorul de proporionalitate, 2 este variana constant a erorii clasice
(omoschedastice) i . Dat fiind c eteroschedasticitatea perfect exist, ecuaia (11.1) este
urmtoarea:
Yi = 0 + 1 X 1i + 2 X 2i + Z i u i .
(11.3)
2 2
Termenul de eroare n ecuaia (11.3) Z i u i este eteroschedastic deoarece Z i este variana care
nu e constant. Cum putem ajusta ecuaia (11.3) ca ea s devin omoschedastic? Cea mai
uoar metod const n mprirea ecuaiei n ntregime la factorul de proporionalitate Z i , prin
urmare obinnd termenul de eroare u i care are o varian constant 2 . Ecuaia obinut
satisface ipotezelor clasice, i lansarea regresiei pentru ecuaia nou mai mult nu va fi suspectat
n vederea prezenei termenului de eroare eteroschedastic. Acest remediu generalizat contra
eteroschedasticitii este numit M.C.M.M.P. ponderat, care de fapt este o versiunea
M.C.M.M.P.
M.C.M.M.P. ponderat implic mprirea ecuaiei examinate n ntregime la oricare
variabil care ar transforma termenul de eroare n unul omoschedastic i apoi relansarea
regresiei cu variabilele transformate. Dat fiind forma general de eteroschedasticitate (11.2),
procedeul const din trei etape:
1. mprim ecuaia (11.3) la factorul de proporionalitate Z i i obinem:
Yi / Z i = 0 / Z i + 1 X 1i / Z i + 2 X i / Z i + u i
(11.4)
termenul de eroare u i n ecuaia (11.4) este omoschedastic.
2. Recalculm datele pentru variabile conform ecuaiei (11.4).
42
3. Estimm ecuaia (11.4) cu M.C.M.M.P.

La aplicarea M.C.M.M.P. ponderat se obin estimaiile ecuaiei transformate, care pot fi
complect neltoare, deoarece detaliile exacte cu privire la complectarea acestei regresii depind
de faptul dac factorul de proporionalitate Z i este i el variabila explicativ n ecuaia (11.1).
Dac Z i nu este variabil explicativ n ecuaia (11.1), atunci regresia lansat la etapa a 3-a va fi
urmtoarea:
Yi / Z i = 0 / Z i + 1 X 1i / Z i + 2 X i / Z i + u i .
(11.5)
De notat c acest ecuaie nu are termenul liber. ns, dup cum a fost menionat anterior,
omiterea termenului constant scoate n eviden efectul constant al variabilei omise,
neliniaritatea i erorile de msurare asupra altor coeficieni estimai. Pentru a evita situaia n
care elementul constant foreaz schimbrile n estimaiile coeficientului unghiular, o abordare
alternativ const n adugarea termenului constant n ecuaia (11.5) nainte ca ecuaia s fie
estimat. Deci, cnd Z i nu este identic cu una din variabilele X s n ecuaia iniial, atunci este
bine venit ca urmtoarea specificaie s fie lansat la etapa a 3 cu M.C.M.M.P. ponderat:
Yi / Z i = 0 + 0 / Z i + 1 X 1i / Z i + 2 X i / Z i + u i .
(11.6)
Dac Z este o variabil explicativ n ecuaia (11.6), atunci nu este nevoie ca termenul constant
s fie adugat n ecuaie, deoarece unu deja exist. S revenim la ecuaia (10.12). Dac Z = X 1
(sau dac Z = X 2 ), atunci unul din coeficienii unghiulari devine termen constant n ecuaia
(11.7)
transformat deoarece X 1 / Z = 1 . Yi / Z i = 0 / Z i + + 2 X i / Z i + u i
n cazul n care este folosit aceasta form a M.C.M.M.P. ponderate, oricum, coeficienii
)
obinui n urma estimrii ecuaiei (11.6) necesit a fi interpretai foarte grijuliu. Vom nota c 1
acum este termenul de intersecie a ecuaiei (11.6) chiar dac el este coeficient unghiular n
ecuaia (11.1). Prin urmare, dac suntem cointeresai n estimarea coeficientului de pe lng
variabila X 1 n ecuaia (11.1), va trebui s examinm termenul de intersecie n ecuaia (11.6).
)
)
Calculatorul va afia 0 ca coeficient unghiular i 1 ca termen constant atunci cnd n
realitate sunt estimai coeficienii opui n ecuaia (11.1).
Exist trei probleme majore n utilizarea M.C.M.M.P. ponderate:
1. Sarcina de identificare a factorului de proporionalitate este, cum a fost accentuat, foarte
dificil.
2. Forma funcional care relateaz factorul Z i la variana termenului de eroare a ecuaiei
iniiale n general poate s nu fie funcie ptrat n ecuaia (11.2). Atunci cnd sunt aplicate
alte relaii funcionale, sunt necesare alte transformri.
3. Uneori M.C.M.M.P. ponderat se aplic la ecuaia cu eteroschedasticitate imperfect. n aa
cazuri, poate fi demonstrat c estimaiile suport o mic reducere n deplasri atunci cnd
este omis o variabil, i estimaiile sunt inferioare celor care sunt obinute din ecuaia corect
specificat.
11.1.2. O abordare direct: Redefinirea variabilelor
O alt abordare ntru eliminarea eteroschedasticitii din ecuaie const n reintoarcerea la
teoria de baz corespunztoare ecuaiei i redefinirea variabilelor n aa mod ca
eteroschedasticitatea s fie evitat. Redefinirea variabilelor deseori este util pentru c permite
ecuaiei estimate s se concentreze asupra aspectului comportamental a relaiei. O atare
remeditare este un proces dificil i descurajtor deoarece apelarea la el ignor toat munca
anterioar. Oricum, odat ce partea teoretic a fost revzut, abordrile de alternativ
descoperite posibilile ci pentru evitarea problemelor care la nceput preau de nedepit.
Spre nefericire, este dificil s se specifice procedee pentru o situaie mai general dect
remedierea complet a proiectului de investigare, se va prezenta un exemplu non numeric
privind cele relatate. Abordarea direct de redefinire a variabilelor va fi comparat cu metoda
43
mult mai formalizat M.C.M.M.P. ponderat. S examinm modelul cu date ncruciate a

cheltuielilor totale a guvernelor din diferite orae. Din punct de vedere logic variabilele pentru
examinare n o atare analiz sunt: 1) venitul agregat; 2) populaia i 3) salariul mediu n fiecare
ora. Cu ct mai mare va fi venitul rezidenelor oraului i a businesului, cu att mai mari vor fi
cheltuielile guvernului orenesc. n acest caz este foarte clar c oraele mari au venituri mari i
respectiv cheltuieli mari (n valoare absolut) dect oraele mici.
Aproximarea acestei funcii cu linia de regresie la fel ne ofer o pondere exagerat pentru
oraele mari de oarece n caz contrar ele vor contribui la valori mari a ptratelor reziduurilor.
Aceasta este aa deoarece M.C.M.M.P. minimizeaz suma ptratelor reziduurilor, i deoarece
reziduurile pentru oraele mari este posibil s fie mai mari pur i simplu din cauza mrimei
oraului, estimaiile regresionale vor fi n special sensibile la reziduurile oraelor mari. Acest
fenomen deseori este numit corelare fals datorit mrimii.
n plus, reziduurile pot indica eteroschedasticitatea. Remediu pentru un atare fel de
eteroschedasticitate nu const n utilizarea automat a M.C.M.M.P. ponderate i nici n
aruncarea observaiilor referitor la oraele mari. Are sens s se considere reformularea
modelului pe o cale care va face reduceri la scara factorului (mrimea oraului) i va accentua
comportamentul corespunztor. n acest caz, cheltuielile pe cap de locuitor, va fi o variabila
explicativ logic. O atare transformare este prezentat n figura ce va urma. Forma ecuaiei
transformate plaseaz New York i Los Angeles pe aceiai scar ca i Pasadena sau New
Bruswick i astfel le ofer lor aceiai pondere n estimare. Dac variabila explicativ nu s va
produce a fi funcie de mrimea oraului, n orice caz, ea nu va necesita s fie ajustat la un cap
de locuitor. Dac ecuaia include salariul mediu a lucrtorilor din ora, de exemplu, el nu va fi
mprit la populaie n ecuaia transformat.
Vom nota, c transformarea n careva sens este similar M.C.M.M.P. ponderate. Diferena
const n aceea c nu exist un termen n ecuaie reciproc la populaie (cum este n M.C.M.M.P.
ponderat) i nu toate variabilele explicative se mpart la populaie. Din ecuaia iniial,
EXPi = 0 + 1 POPi + 2 INC i + 3WAGE i + i
(11.8)
versiune celor mai mici ptrate ponderat va fi
EXPi / POPi = 1 + 0 / POPi + 2 INC i / POPi + 3WAGE i / POPi + u i
(11.9)
atunci cnd ecuaia direct transformat va lua forma:
EXPi / POPi = 0 + 1 INC i / POPi + 2WAGE i + u i
(11.10)
Cum putem observa, M.C.M.M.P. ponderat (11.8) mprit n ntregime la populaie,
atunci cnd n aceea, transformat conform teoriei, sunt mprite la populaie numai variabilele
de cheltuieli i venit. n timp ce ecuaia (11.9) direct transformat ntradevr soluioneaz
eteroschedasticitatea potenial din model, aa o soluie va fi considerat ntmpltoare ntru
beneficiul remedierii ecuaiei pe o cale care se concentreaz pe faptul examinrii
comportamentului de baz.
De notat, ca este posibil ca ecuaia (11.9) reformulat s posede eteroschedasticitate;
variana termenului de eroare poate fi mai mare pentru observaiile care au valorile mai mari pe
cap de locuitor cum ar fi cheltuieli i venituri dect pentru acelea observrii care au valori mai
mici pe cap de locuitor a cheltuielilor i veniturilor. Deci este legitimat suspectarea i testarea
eteroschedasticitii chiar i n aceasta ecuaie transformat. O atare eteroschedasticitate n
ecuaia transformat nu este verosimila totui, deoarece va fi o mic variaie n mrimele normal
asociate cu eteroschedasticitatea.
O transformare grijulie a variabilelor ntru corectarea eteroschedasticitii n timp ce
totodat nu evita, corelarea fals, datorat mrimii, poate uneori s fie o abordare reuit n
soluionarea acestor probleme. De notat totui, c nu fiecare variabil n ecuaie este tratat n
acelai mod (spre deosebire de M.C.M.M.P. ponderat). Fiecare variabil n modelul cu date
ncruciate poate fi examinai n vederea transformrilor posibile care se vor solda cu
interpretri semnificative i complete a ecuaiei de regresie.
44
12. Specificaia: alegerea variabilelor independente relevante

12.1. Variabilele omise
nainte de a estima ecuaia de regresie ea necesit a fi specificat complet. Specificarea
ecuaiei econometrice const din trei etape: 1) alegerea corect a variabilelor independente, 2)
alegerea formei funcionale corecte, 3) alegerea formei corecte a termenului stocastic de eroare.
Specificarea erorii rezult din efectuarea incorect a unei din etapele menionate.
Ne vom opri la prima etap alegerea variabilelor independente. Cercettorul hotrte care
variabile independente vor fi incluse n ecuaie i aceasta reprezint att momentul slab ct i
momentul forte n economie. Momentul forte l constituie faptul c ecuaia fiind formulat poate
fi folosit pentru previziunea obietivelor necesare individuale, iar momentul slab se refer la
posibilitatea estimrii a mai multor specificaii pn cnd va fi gsit una care susine poziia
naintat n defavoarea altor indicatori care o dezaprob. Ulterior sarcina principal va ine de
demonstrarea modului de selecie al variabilelor pentru ecuaia de regresie fr a comite erori ce
rezult din alegerea nereuit.
Primul considerent n deciderea apartenenei variabilei ecuaiei const n fundamentarea ei n
baza teoriei economice corespunztoare. Dac rspunsul este de forma unui da ambiguu,
atunci variabila va fi introdus n ecuaie definitiv atunci cnd va avea o semnificaie statistic.
Ne includerea variabilei relevante n ecuaie conduce la majorarea deplasrilor estimaiilor
rmase, ns includerea unei variabile ne importante contribuie la majorarea varianei
coeficienilor estimai.
Fie c la prima specificaie a ecuaiei examinate din diverse motive nu s-a inclus o variabil
independent important. Sau, admitem c nu au fost posibil de gsit datele necesare (sau datele
colectate s-au dovedit a fi incomplete) pentru una dintre variabilele exogene relevante. n
ambele situaii rezultatul este acelai: variabila defenit ca o variabil de explicat important a
fost omis, a rmas n afara ecuaiei de regresie. De fiecare dat cnd exist o variabil omis,
interpretarea i utilizarea ecuaiei estimate devine suspect, cum ar fi preul n ecuaia pentru
cerereceea ce nu numai a mpiedica estimarea coeficientului de regresie pentru pre dar, cu
siguran, a cauza deplasri n estimaiile coeficienilor pe lng variabilele din ecuaie.
Deplasarea cauzat de eliminarea variabilei relevante din ecuaie se numete deplasare de
specificaie (mai rar, deplasarea variabilei omise). ntr-o ecuaie cu mai multe variabile,
)
coeficientul k reprezint schimbarea n variabila dependent Y , cauzat de schimbarea cu o
unitate n variabila independent X k , dat fiind restul variabilelor din ecuaie neschimbate.
Omiterea variabilei cauzeaz deplasri,: ea poate schimba valoarea ateptat a coeficienilor
estimai de la valoarea adevrat a coeficienilor.
12.1.2. Urmrile omiterii variabilelor
Fie c modelul de regresie adevrat este urmtorul:
Yi = 0 + 1 X 1i + 2 X 2i + i ,
(12.1)
unde i - este termenul de eroare clasic.
Dac a fost omis o variabil independent important, ecuaia devine:
Yi = 0 + 1 X 1i + i* , i* = X 2i + i .
(12.2)
Termenul de eroare nu este independent de variabila de explicat X 1i atta timp, ct
variabilele X 1i i X 2i sunt corelate ntruct odat cu schimbarea variabilei X 2i se schimb i
variabila X 1i i i* , (cu alte cuvinte, nu sunt respectate ipotezele clasice referitor la
independena variabilelor de explicat fa de de termenul de eroare), deci pn cnd variabila
45
omis nu este corelat cu nici una dintre variabilele incluse n ecuaie (ceea ce este aproape
nevirosimil).
n general, atunci cnd unele din ipotezele clasice nu sunt respectate, nu are loc teorema
Gauss-Marcov, i estimaiile nu sunt BLUE). Ceea ce nseamn c estimatorii liniari nu mai
sunt nedeplasai i de varian minim (aceeai varian pentru toi estimatorii liniari
nedeplasai) sau nu se ndeplinesc concomitent ambele ipoteze. Estimarea ecuaiei (12.2) n timp
ce atunci este adevrat ecuaia (12.1), cauzeaz deplasri n estimaiile ecuaiei (12.2). Ceea ce
)
nseamn c: E ( 1 ) 1 .
(12.3)
)
Deci, lipsa variabilei X 2 din ecuaie conduce la deplasarea valorii ateptate a coeficientului 1 de
la valoarea sa adevrat. Dac variabilele X 1 i X 2 sunt corelate i variabila X 2 este omis din
ecuaie, atunci M.C.M.M.P. va atribui variabilei X 1 o varian eventual cauzat de X 2 , ce se
)
soldeaz cu estimri deplasate pentru 1 .
Pentru a demonstra faptul c variabila omis poate cauza estimri deplasate, vom
examina funcia de producere care exprim venitul ( Y ) ca funcie dependent de la cantitatea
utilizat de munc ( X 1 ) i de capital ( X 2 ). Fie c din careva considerente dac lipsesc datele
pentru capital i variabila ( X 2 ) va fi omis din model. Aceasta eliminare, cu certitudine, va
deplasa estimatorul coeficientului de pe lng variabila munc deoarece este evident c munca i
capitalul sunt corelai (creterea n capital, de regul, necesit cel puin cteva brae de munc
spre utilizare i vice versa). Prin urmare, M.C.M.M.P. va atribui muncii o cretere a volumului
de producie de fapt cauzat de capital. Deci deplasarea va fi o funcie de 2 i coeficientul de
corelaie dintre capital i munc
)
E ( 1 ) = 1 + 2 f (r12 )
(12.4)
)
Rezult c valoarea ateptat a coeficientului de pe lng variabila inclus ( 1 ), atunci cnd
variabila important ( X 2 ) este omis, este egal cu valoarea sa adevrat plus coeficientul
adevrat de pe lng variabila exclus nmulit cu o funcie dependent de coeficientul de
corelaie simpl dintre variabila inclus i aceea exclus:
) valoarea adevrat 2 este zero (deci deplasarea nu exist, ceea ce nseamn c variabila X 2
nu este important n model); sau b) r12 este zero (variabilele X 1 i X 2 sunt perfect incorelate).
Valoarea termenului 2 f (r12 ) determin cantitatea deplasrii de specificaie introdus n
estimaia 1 prin eliminarea X 2 . Dac variabila inclus i aceea exclus sunt necorelate, nu
exist deplasri, ns n realitate, aproape de fiecare dat, careva corelaie (fie chiar aleatoare)
dintre oricare dou variabile exist i atunci deplasrile sunt cauzate frecvent de omiterea
variabilei importante.
12.2.1. Un exemplu deplasrilor de specificaie.
)
Fie c Yt = 0,605 0,45PC t + 0,12 PBt + 12,2 ln YDt
(0,07) (0,05)
(11,2)
t=
-6,4
-2,5
10,6
R 2 = 0,984; n = 35 (anuale 1950 1984 )
Yt consumul de pasare;
PCt cos tul unui kg de carne de pasare;
PBt cos tul unui kg de carne de vita ;
ln YDt venitului disponibil pe cap de locuitor (log aritmnatural ).
Dac estimm aceasta ecuaie fr preul de substituire, obinem:

)
Yt = 80,7 0,34 PC t + 15,0 ln YDt
(0,06)
(0,42)
46
t=
-5,6
2
R = 0,981; n = 35
36,0
12.3. Corectarea variabilelor omise

Teoretic soluionarea problemei deplasrilor de specificaie se reduce la introducerea
variabilei omise n ecuaie. Spre regret, aceasta este mult mai uor de pronunat dect de
executat.
n primul rnd, deplasarea variabilelor omise este greu de depistat. Atunci cnd unii indici ai
deplasrii de specificaie se exprim explicit (cum ar fi, semnul coeficientului estimat este opus
celui care se presupune a fi), alii nu sunt clari. Cel mai reuit indiciu de relevan a variabilei
omise const n fundamentarea teoretic corect a modelului. Ce variabile necesit a fi incluse?
Ce semne se ateapt? Se cunosc unele informaii referitor intervalele n care se vor afla
coeficienii? Posibil c accidental a fost eliminat o variabil care, cu certitudine, se consider
important sub aspect teoretic. Ceea mai bun cale de a evita omiterea variabilelor importante
const examinarea cu precauie a ecuaiei nainte de a introduce datele n calculator.
A doua surs de complexitate const n problema alegerii variabilei cu care va fi
suplimentat ecuaia odat ce s-au depistat deplasri urmate de variabilele omise. Simultan n
ecuaie pot fi adugate toate variabilele importante posibile ce conduce la pierderea preciziei de
estimare, sau pot fi testate mai multe variabile i meninut aceea cu statistici mai bune n
vederea reducerii deplasrilor. ns tehnica majorrii numrului de variabile cu scopul selectrii
celor mai reuite rezultate de regresie nu este una reuit deoarece variabila care n cel mai bun
mod corecteaz deplasrile de specificaie poate contribui n mai mare msur la schimbare
dect la obinerea soluiei adevrate a problemei. n aa circumstane o ecuaie stabilit poate
oferi rezultate statistice superbe pentru un set de date n examinare, dar aceste rezultate ele
devin teribile cnd sunt aplicate la alte seturi de date, deoarece ele nu descriu caracteristicile
populaiei adevrate.
Includerea unei variabile adiionale n ecuaie nu asigur cu siguran lichidarea deplasrilor
variabilelor omise. Fie c semnul variabilei omise difer de cel ateptat, atunci el nu poate fi
schimbat n direcia dorit prin aruncarea variabilei care are valoarea testului t a coeficientului
estimat mai mic (dup valoare absolut) dect t - valoarea a coeficientului estimat cu un semn
nedorit. Mai mult dect att, semnul n genere nu poate fi schimbat chiar dac variabila care va
fi eliminat are o valoare de t foarte mare.
Dac coeficientul estimat semnificativ difer de la ateptrile noastre (att dup semn ct i
dup amplitud), atunci, la sigur, n model exist unele deplasri de specificaie. Dei este
adevrat c un set de date prost sau o teorie presupus slab pot la fel s ofere semne sau
amplitude semnificative, ns aceste evenimente pot fi uneori eliminate.
O tehnic corect pentru reducerea numrului variabilelor omise const n examinarea
direciei deplasrilor cauzate de omiterea variabilei din ecuaie. Dac va fi demonstrat c semnul
deplasrii ateptate este n direcia opus n raport cu aceea observat, atunci variabila poate fi
eliminat din ecuaie. Direcia deplasrii ateptate poate fi determinat din:
)
)
E ( 1 ) = 2 f (r12 ), E ( PB ) = PB f (rPC , PB ) = (+ ) (+ ) = (+ );
( )
)
E PC = PD f (rPC , PD ) = ( )(+ ) = ( ) .
Tehnic dat va funciona bine atunci, i numai atunci, cnd numai o singur variabil este
omis din ecuaie. n cazul omiterii concomitente a mai multor variabile, impactul asupra
coeficienilor din ecuaie este greu de specificat.
12.4. Variabile irelevante (neimportante)
Ce se va ntmpla dac n ecuaie se introduce o variabil care nu-i aparine? Acest caz,
variabilelor neimportante, este unul invers la acel al variabilelor omise, i poate fi analizat
47
folosind modelul elaborat n paragraful precedent. Acest model cu variabile neimportante

conine mai multe variabile n ecuaia de estimat dect n ecuaia adevrat.
Includerea variabilei n ecuaia, creia ea nu-i aparine, nu cauzeaz deplasri, dar contribuie
la creterea varianei coeficienilor estimai inclui.
12.4.1. Impactul variabilelor neimportante
Regresia adevrat specificat este:
Yi = 0 + 1 X 1i + i
(12.5),
dar cercettorul din careva motive a inclus o variabil n plus:
Yi = 0 + 1 X 1i + 2 X 2i + i** , i** = i 2 X 2i
(12.6).
O atare greal nu va cauza deplasri, dac coeficientul adevrat al variabilei neimportante este
)
0. n acest caz, i** = i i i este nedeplasat n (11.8), atunci cnd 2 =0.
Includerea variabilei neimportante va majora variana coeficienilor estimai, prin urmare ea
va tinde s diminueze magnitudinea absolut a t -testelor. La fel variabilele neimportante vor
contribui la diminuarea R 2 , (dar nu R 2 ) . n modelul cu Y i X 1 , X 2 , variana estimatorului 1
obinut prin M.C.M.M.P. este:
)
)
u2
(X 1i X 1 )2 , dac r12 0
VAR( 1 ) =
2
(1 r )
12
iar atunci cnd r12 =0 ea este:
( )
)
2
)
VAR 1 = u2 ( X 1i X 1 ) .
Deci, chiar dac variabilele neimportante nu cauzeaz deplasri, ele cauzeaz probleme pentru
regresie, deoarece reduc precizia regresiei.
Tabel. Sumar al impactului variabilelor omise sau a variabilelor neincluse (neimportante)
asupra restului coeficienilor
Efectul asupra coef. Variabila omis
estimai
Deplasri
Da*
Creterea
sau Descrete*
descreterea varianei
Variabila
neimportant
Nu
Crete*
introdus
12.4.2. Efectuarea alegerii corecte de specificaie

Vor fi examinate 4 criterii de validare cu privire la luarea deciziilor n vederea apartenentei
variabilei ecuaiei.
1) Teoria: variabila este introdus n ecuaie fr ambiguiti i teoretic fundamentat?
2) t -testul: coeficientul estimat difer semnificativ de 0?
3) R 2 : se nbuntete aproximarea ecuaiei (ajustat la gradele de libertate) atunci cnd o
variabil se adaug la ecuaie?
4) Deplasri: se schimb semnificativ ali coeficieni atunci cnd o variabil este inclus n
ecuaie?
Dac toate criteriile enunate sunt confirmate, variabila aparine ecuaiei; dac nici unul din
ele nu este just, variabila este neimportant i poate fi, cu siguran, exclus din ecuaie. Atunci
cnd o variabil important este inclus n ecuaie, includerea ei e mult probabil s contribuie la
creterea R 2 , la schimbarea altor coeficieni, meninnd valoarea t -testului semnificativ. Pe de
alt parte, dac o variabil neimportant este introdus n ecuaie, ea va reduce R 2 , avnd o
48
valoare a t -testului nesemnificativ, i, prin urmare, un impact mic asupra coeficienilor de pe

lng restul variabilelor.
Deseori cele patru criterii nu se acord. Aceasta se ntmpl atunci cnd sau variabila are un
t -test nesemnificativ, sau variabila, fiind comparativ necorelat cu variabilele prezente n
ecuaie, are un efect mic asupra coeficienilor estimai. Cum de procedat n asemenea
circumstane?
Singura, i cea mai important, justificare n determinarea importanei variabilei este
fundamentarea teoretic. Nu cantitatea evidenei statistice servete drept dovad n favoarea
neimportantei variabilei, motivaia teoretic confirm aceast necesitate. Uneori, n lipsa unei
alternative mai bune, o variabil important din punctul de vedere teoretic rmne n afara
ecuaiei, n aa cazuri este limitat utilitatea ecuaiei.
12.4.3. Cutri de specificaie
Una din poziiile slabe ale econometriei este posibilitatea manipulrii exagerate cu seriile de
date pentru a obine diferite rezultate, specificnd diferite ecuaii de regresie, pn cnd nu se
obin estimaii cu proprietile cutate.
Dei problema nu este deloc uoar, are sens de a face o ncercare spre minimizarea
numrului de ecuaii estimate i a se baza mai mult pe teorie dect pe aproximarea statistic
frecvent la alegerea variabilelor. Se va demonstra aceasta prin examinarea a trei, cel mai
uzuale, tehnici incorecte pentru specificarea ecuaiei de regresie.
12.4.4. Explorarea datelor cu scopul maximizrii R 2
Cu siguran, ceea mai proast cale de specificare este ncercarea de a formula simultan o
serie de regresii i de a alege ecuaia care n cel mai reuit mod corespunde rezultatelor pe care
se dorete de a obine. n aa situaie, se ncearc estimarea practic a tuturor combinaiilor
posibile ale variabilelor independente de alternativ i selectarea lor se va efectua n baza
rezultatelor obinute.
Practica dat de estimare simultan a unui numr de combinaii de variabile independente i
selectarea celei mai bune dintre ele nu ine cont de numrul specificaiilor examinate de la prima
pn la ultima.
Dac s simplificm, n cazul cnd cele 95% de ncredere, obinute n urma regresiilor
consecutive, nu sunt ocazionale i au fost lansate mai mult dect 20 de regresii, ct de mult
ncredere putem avea n rezultatele obinute? ntre timp, meninnd regresia cu testul t nalt i
ignornd aceea cu testul t mic, obinem un test exagerat pentru estimarea semnificaiei
coeficienilor.
Mai mult dect att, aa explorare de date i pescuirea grabei n obinerea statisticilor
necesare pentru ecuaia de regresie final este o metod n esen lipsit de etica cercettorilor
empirice. Acest procedeu include nu numai combinaii de alternativ a variabilelor
independente, dar i un numr mare de forme funcionale, structuri de lag, tot ce ne ofer o
tehnic avansat de estimare, i atunci crete extraordinar ansa de a obine rezultate necesare,
ns rezultatul final nu va fi unul de valoare. Cercettorul nu caut dovezi tiinifice de a susine
ipotezele iniiale; din contra, ateptrile anterioare sunt impuse datelor ntr-un mod care este n
esen greit.
12.4.5. Procedee regresionale iterative
Regresia iterativ implic utilizarea produselor program pentru alegerea variabilei
independente folosite la estimarea ecuaiei specificate. Programul de calculator ofer o lista de
variabile independente n baza lor fiind apoi dup etape construiet ecuaia. n primul rnd se
alege variabila de explicat, care de una singur explic o mare parte din variana de la valoarea
medie a variabilei dependente. n calitate de a doua variabil se alege aceia, care cel mai mult
49
contribuie la majorarea R 2 , innd cont de faptul c prima variabil deja este introdus n
ecuaie. Procedeul iterativ continue pn cnd variabila ce va urma a fi introdus n ecuaie nu
izbutete s ating careva cretere n R 2 . Contribuia fiecrei variabile independente presupune
o cretere n R 2 cauzat de includerea ei n ecuaia de regresie.
Spre regret, orice corelare ntre variabilele independente face aceast procedur dificil. n
procesul de evaluare a corelaiei ntre variabile este greu de separat impactul unei variabile de
la impactul altei variabile. Ca rezultat, n prezena multicolinearitii este imposibil de
determinat contribuia individual a fiecrei variabile suficient pentru a afirma c una din ele
este mai important i deci necesit a fi inclus n primul rnd, i mai ru, nu este o justificare
teoretic pentru a alegere combinaia variabilelor specificate.
Din cauza acestor probleme, deseori se evit procedeul iterativ. Primejdia cea mai mare este
c coeficienii obinui pot fi deplasai, valorile t - calculate nu urmeaz pe viitor repartiia
valorilor t - tabelare, variabilele importante pot fi excluse din cauza aranjamentului (ordinea
n care a avut loc selecia), semnele coeficienilor estimai la fazele intermediare sau finale a
procedeului pot s difere de la semnele preconizate. Utilizarea procedeului iterativ este o
anumit ignoran fa de faptul ce variabile vor fi introduse.
12.4.6. Cutrile succesive ale specificaiei
Din orgoliu majoritatea econometricienilor, evita explorarea datelor i metoda iterativ de
specificare a variabilelor. n schimb, se prefer specificarea ecuaiei prin estimarea ecuaiei
iniiale i apoi eliminarea sau adugarea consecutiv a variabilelor (sau schimbarea formei
funcionale) pn cnd o ecuaie verosimil cu statistici bune este obinut. Aflndu-se n faa
situaie cnd cunoaterea sigur (n baza teoriei) a unor variabile relevante, aparent este o
practic general acceptat, cnd necunoscnd sunt sau nu sunt relevante variabilele adugate, se
recurge la verificarea R 2 i a t - testelor pentru toate variabilele (pn la i dup selecie).
ntradevr, uor se demonstreaz, c o atare cutare este cautare a neadevrului. Dup cum se
va constata, exist o diferen enorm n abordarea cutrii de specificaie succesiv i
abordarea care va fi recomandat. Cutarea succesiv a specificaiei este o tehnic care permite
cercettorul s estimeze un numr secret de regresii apoi s prezinte alegerea final (bazat pe o
mulime de ateptri nespecificate n vederea semnelor i semnificaiei coeficienilor) ultima
fiind prezentat ca o specificaie estimat. Aa o metod stabilete greit veridicitatea statistic a
rezultatelor regresiei din dou motive.
1) Semnificaia statistic a rezultatelor este supraestimat deoarece estimaiile regresiei
precedente sunt ignorate.
2) Mulimea motivaiilor utilizat la alegerea dintre rezultatele diferitor regresii este secret.
Nu e posibil, sub nici o form, s se cunoasc: ofer sau nu rezultate regresiilor efectuate
semne opuse sau coeficieni semnificativi pentru variabilele importante.
Spre regret, nu exist o metod universal acceptat pentru a dirija cutrile succesive, n
primul rnd deaceea c testul potrivit la o etap a procedeului depinde de testele care au fost
ndeplinite anterior i deaceea c testele este foarte greu de inventat. O modalitate de
mbuntire const n reducerea gradelor de libertate n ecuaia final cu unul pentru fiecare
ncercare alternativ de specificare. Acest procedeu este departe de a fi exact, dar impune o
penalitate explicit pentru cutrile de specificare.
n general, se recomand de a menine numrul regresiilor estimate ct se poate de mic; de a
se concentra la considerente teoretice atunci cnd se selecteaz variabilele, formele funcionale
i de a dezvlui toate specificaiile investigate. Deci, se recomand de a combina economia
(folosirea teoriei i analizei pentru limitarea numrului de specificaii estimate) cu dezvluirea
(informarea referitor la toate ecuaiile estimate).
i totui, aceasta este o alt fa a istoriei. Unii cercettori simt c modelul meninut , dac
va fi o ans, va demonstra directi cele mai bune rezultate statistice (inclusiv semnele i
50
coeficienii) care cel mai bine se potrivesc cu specificaiile adevrate. Problema acestei
psihologii este aceia c elementul de ans este, n mod normal, foarte puternic pentru orice
aplicaie. Plus la aceasta persoanele rezonabile adesea nu sunt de acord cu faptul cum arat
modelul adevrat. Prin urmare, diferii cercettori vor examina aceleai seturi de date i vor
veni cu modele mai bune extrem de diferite. Deoarece aceasta poate s se ntmple,
diferena dintre un econometrician bun i prost nu este att de clar cum se pare. Att timp ct
se manifest un respect sntos fa de pericolul cutrilor de specificare, e mult probabil s se
procedeze ntr-un mod rezonabil.
Concluziile obinute sunt absolut clare: cel mai important lucru n specificarea ecuaiei va fi
fcut nainte de orice ncercare de estimare a ecuaiei la calculator. ntruct o perfeciune nu este
rezonabil, vor fi perioade cnd specificaii adiionale va fi necesar de estimat. Oricum aceste
estimaii noi necesit a fi temeinic fundamentale teoretic i explicit luate n vedere atunci cnd
se va testa semnificaia i se vor totaliza rezultatele. n aa mod va fi redus pericolul estimrilor
statistice incorecte.
12.4.7. Impactul cutrilor succesive de specificare
S prezentm un exemplu prin care se va demonstra c eliminarea variabilelor din model n
baza t -testului introduce deplasri sistematice n ecuaia estimat. Fie c modelul ipotetic
pentru o variabil independent distinct este:
Yi = 0 + 1 X 1i + 2 X 2i + i
(12.7)
S admitem pe viitor c, n baza teoriei, exist certitudine c variabila independent X 1 aparine
ecuaiei, iar variabila independent X 2 nu aparine ecuaiei. Rmne s se determine n vederea
includerii variabilei X 2 n ecuaie; muli cercettori experimentai utilizeaz numai testul t ,
care indic c coeficientul 2 este semnificativ diferit de 0, prin urmare, ei pstreaz variabila
independent X 2 n ecuaie, obinnd forma (11.17) ca model final. n caz ce testul t nu
indic diferena semnificativ de o, aceti cercettorii exclud variabila X 2 din ecuaie i
considera Y ca funcie de o singur variabil X 1 .
Dou tipuri de erori pot fi introduse pornind de la o atare abordare. Prima, variabila X 2
poate fi pstrat n ecuaie atunci cnd ea nu aparine ei, ns greal de acest gen nu va schimba
valoarea ateptat a lui 1 . A doua, variabila X 2 poate fi aruncat din ecuaie dei trebuie s
aparin ei i atunci coeficientul estimat pentru X 1 va fi deplasat de valoarea 2 n msura n
care variabilele X 1 i X 2 sunt corelate. Cu alte cuvinte, coeficientul 1 va fi deplasat atta timp
ct variabila X 2 , care trebuie s aparin ecuaiei, va fi eliminat din ea, i variabila X 2 va fi
eliminat de fiecare dat cnd coeficientul estimat va fi semnificativ diferit de 0. Atunci,
)
valoarea ateptat a lui 1 nu va fi egal cu valoarea teoretic 1 , i va avea deplasri
)
sistematice n ecuaia examinat: E ( 1 ) = 1 + 2 f (rX / X )P 1 . Unde P indic probabilitatea
1
semnificaiei testului t . Aceasta este la fel cazul cnd t - testul calculat pentru 1 nu mai
urmeaz repartiia t tabelar . Cu alte cuvinte, t - testul calculat este deplasat prin cutarea
succesiv de specificaie.
ntruct, majoritatea cercettorilor consider un numr de variabile diferite naintea stabilirii
modelului final, cel care are ncredere n t - testul calculat se confrunt cu aceast problem
sistematic. Deci, practica eliminrii potenialelor variabile independente pur i simplu din
motivul c t - testul calculat indic c coeficientul estimat nu este semnificativ diferit de 0 va
cauza deplasri sistematice n coeficienii estimai (i t - testele lor) pe lng variabilele
rmase.
51
13. Specificaia ecuaiei de regresie: alegerea formei funcionale

13.1 Forme funcionale alternative
Alegerea formei funcionale pentru ecuaia de regresie este o parte vital n specificarea
ecuaiei de regresie. M.C.M.M.P. la utilizarea sa necesit ca ecuaia examinat s fie linear n
conformitate, cu coeficienii, dar exist o varietate de forme funcionale care sunt liniare n
coeficieni n timp ce nu sunt liniare fa de variabile. Se vor prezenta n detalii cele mai
frecvent utilizate forme funcionale n scopul de a ajuta utilizatorul n dezvoltarea abilitii de a
alege corect una din ele la specificarea ecuaiei.
Alegerea formei funcionale, aproape de fiecare dat, se va baza pe teoria economica sau de
busines fundamental i numai rareori pe aceea form funcional care furnizeaz o previziune
mai bun. Relaia logic dintre variabila dependent i variabilele independente n examinare se
va compara cu proprietile diferitor forme funcionale, i numai aceea, care n modul cel mai
reuit oglindete teoria va fi aleas. n continuare, cele mai des utilizate forme funcionale vor fi
caracterizate n termeni grafici, ecuaii i exemple pentru a face comparaie ntre ele.
13.2 Forma liniar
Modelul liniar de regresie, se bazeaz pe ipoteza c coeficienii unghiulari din relaia ce
caracterizeaz variabila dependent i cele independente sunt constani i are loc relaia
Y
Y
= i , i = 1,2,..., k . Dat fiind constant coeficientul unghiular, elasticitatea variabilei Y

X i X i
n respect cu variabila X (schimbarea n procente n variabila dependent cauzat de
schimbarea cu un procent n variabila independent, restul variabilelor din ecuaie rmnnd

Y X i
Y / Y
X
=
= i i . Dac relaia, ce se presupune a fi
X i Y
X i / X i
Y
dintre variabila dependent Y i variabila independent, X este de aa natur c coeficientul
constante) nu este constant: EY , X =

i
unghiular (de nclinaie) al relaiei se presupune a fi constant, atunci se va folosi forma

funcional liniar.
Spre regret, teoria n mai multe cazuri indic numai semnul relaiei, dar nu i forma
funcional. Forma liniar se va fi utilizat de fiecare dat cnd exist un oarecare minim de
teorie, care poate fi utilizat la fundamentarea acestei forme, pn cnd nu se vor gsi dovezi
stricte c aceast form nu este potrivit. Este posibil utilizarea modelului liniar att timp ct
teoria, bunul sim sau experiena nu justific folosirea unei alte forme funcionale. Deoarece
acest model efectiv se utilizeaz apriori, la el uneori se refer ca la o form funcional default
implicit.
13.3 Forma exponenial sau forma logaritmic complet
Ceea mai rspndit form funcional (neliniar n variabile, dar liniar n coeficieni) este
forma logaritmic complet. Forma logaritmic complet este des utilizat la specificarea
ecuaiei
de
regresie.
Spre
deosebire
de
modelul
liniar,
elasticitile
EY , X i =
X
Y X i
Y / Y
=
= i i dar nu coeficienii unghiulari sunt constani n acest model.
Y
X i Y
X i / X i
Dac se presupune c elasticitile sunt constante, atunci rezult c EY , X = i = const . Forma

i
funcional exponenial Y = e X X 2 e este aceea care satisface ipoteza conform creia

elasticitile sunt constante.
Aplicnd la ecuaia menionat transformarea n logaritmi, prin logaritmarea ambelor pri a
ecuaiei obinem ecuaia ecuaia liniar n logaritmi, care se numete form funcional
logaritmic complet.
ln Y = 0 + 1 ln X 1 + 2 ln X 2 + ,
1
52
ln Y - logaritmul natural de la Y . n ecuaia logaritmic complet, coeficienii individuali de
regresie, de exemplu k , pot fi interpretai ca elasticiti, deoarece

k =
ln Y
Y / Y
= EY , X k .
=
ln X k X k / X k
Dat fiind constani coeficienii de regresie, ecuaia logaritmic complet satisface condiia ca
modelul sa conin elasticiti constante. Modul de interpretare a parametrilor k n ecuaia
logaritmic complet ine de faptul c la schimbarea variabilelei X k cu un %, restul variabilelor
fiind meninute constante, Y se va schimba cu k %. n situaia cnd elasticitile sunt
constante, coeficienii de nclinaie nu mai sunt constani.
Desenul din stnga demonstreaz conceptul economic al funciei de producere-curbele de
indiferen. Izocuantele funciei de producere demonstreaz diferite combinaii posibile ai
factorilor X 1 capitalul i X 2 munca, care pot fi utilizate pentru a fabrica un volum anumit de
producie. Atare funcie logaritmic complet de producere se numete funcie de producere de
tip Cobb-Douglas. Desenul din dreapta demonstreaz relaiile dintre Y i X 1 care exist, dac
X 2 se menine constant sau nu a fost inclus n model. De menionat, c n acest caz nclinaia
curbei depinde de semnul i mrimea coeficientului 1 .
nainte de a utiliza modelul logaritmic complet, este necesar s se verifice toate observaiile
ca ele s nu conin valori de 0. Modelul logaritmic complet poate fi utilizat numai n cazul cnd
toate variabilele primesc valori pozitive. Variabilele dummy, care pot lua valori 0, nu vor fi
percepute chiar dac vor fi introduse n ecuaie.
13.4 Form semilogaritmic

Form semilogaritmic este o variant a ecuaiei logaritmice complete n care unele, dar nu
toate variabilele (dependent i independente), sunt exprimate n termeni de logaritmi. De
exemplu, Yi = o + 1 ln X 1i + 2 X 2i + i . n acest caz, sensul economic al coeficienilor
unghiulari este diferit, n timp ce variabila X 2 este n dependen liniar fa de Y , variabila X 1
este n dependen neliniar fa de Y . n special,
Y
= 1 / X 1 sau 1 = Y /(X 1 / X 1 ) , fapt care
X 1
poate fi demonstrat prin calcule. Cu alte cuvinte, dac valoarea se vaschimb cu 1%, atunci
valoarea Y se va schimba cu 1 / 100 , valoarea X 2 rmnnd intact (valoarea lui X 1 trebuie s
fie pozitiv pentru a fi posibil operaia logaritmrii). Elasticitatea variabilei Y n respect cu
53
Y X 1 1
=
, i descrete odat cu creterea lui Y . Pe desenul ce
X 1 Y
Y
urmeaz este prezentat relaia dintre Y i X 1 , X 2 fiind meninut constant. De notat c n
cazul cnd 1 f 0 , impactul schimbrilor n X 1 asupra lui Y se afl n declin odat cu creterea
lui X 1 . n concluzie, form semilogaritmic se va fi folosit atunci, cnd se presupus o relaie
descresctoare dintre Y i X 1 .
variabila X 1 ea forma: EY / X =
1
n economie i busines aplicarea acestei forme semilogaritmice este ntlnit foarte frecvent.
De exemplu, majoritatea funciilor de consum dup un anumit nivel de venit manifest o
cretere cu rat descresctoare. Aceste, aa numite curbe Engel, tind s devin plate deoarece
atunci cnd venitul crete esenial, un procent mic din venit este ndreptat spre consum i un
procent mai mare merge pentru acumulri. Atunci consumul crete cu o rat descresctoare.
Dac Y este consumul al unui bun, i X 1 este venitul disponibil, ( X 2 fiind meninut n locul
restului variabilelor independente), atunci utilizarea formei semilogaritmice este justificat de
fiecare dat cnd rata creterii unui bun se ateapt a fi n declin atunci cnd venitul disponibil
va crete.
Alt exemplu se refer la varianta funciei semilogaritmice care se obine prin logaritmarea
variabilei dependente Y , variabilele independente rmnnd sub forma linear:
ln Yi = 0 + 1 X 1i + 2 X 2i + i . n acest model nici coeficientul unghiularnu este constant, nici
elasticitate nu sunt constante. Dac variabila independent X 1 se va schimb cu o unitate, atunci
variabila dependent Y se va schimba cu 1 / 100% , variabila independent X 2 meninndu-se
constant.
13.5 Forme polinomiale

n majoritatea funciilor de cost coeficientul unghiular al curbei de cost se schimb n acelai
mod cum se schimb volumul. Dac se ateapt c coeficientul unghiular al relaiei s depind
de nivelul variaiei insui, atunci se va considera modelul polinomial. Forma funcional
polinomial exprim variabila dependent Y ca funcie de variabilele independente, unele dintre
care sunt ridicate la putere mai mare dect unul. De exemplu, n polinomul de gradul 2
(ptratic), mcar una din variabilele independente este ridicat la ptrat:
Yi = 0 + 1 X 1i + 2 ( X 1i ) 2 + 3 X 2i + i . Astfel de model ntradevr poate s produc
coeficientul unghiular care se schimb odat cu schimbarea variabilei independente. n ecuaia
examinat unghiul de nclinaie a variabilei Y n respect cu variabila X 1 este:
54
Y
Y
= 1 + 2 2 X 1 , iar n respect cu variabila X 2 este
= 3 . De menionat c primul
X 1
X 2
coeficient unghiular depinde de valorile variabilei X 1 , iar al doilea coeficient este constant. n
cazul unei funcii de cost, Y fiind costul mediu a produciei, i X 1 fiind nivelul de producie al
firmei, atunci dac firma are o curb de cost cu punct de a (cum ar fi n figura din stng), e
posibil ca 1 s fie negativ iar 2 s fie pozitiv , pictat n desenul ce urmeaz.
Un alt exemplu, se consider modelul veniturilor anuale ale angajailor n funcie de vrsta
fiecrui angajat i de un alt factor ce stimuleaz productivitatea, cum ar fi educaia. Care va fi
impactul ateptat al vrstei asupra venitului? De regul, cu vrsta un tnr lucrtor (el sau ea)
ctig mai mult. Oricum, dincolo de acest punct de vedere, cu vrsta n foarte multe cazuri
ctigurile nu cresc deloc, dar cu apropierea vrstei de pensionare se ateapt c ctigul va
ncepe s descreasc. Ca rezultat, relaia logic dintre ctiguri i vrst poate s arate ceva
asemntor cu desenul din partea dreapt din figura de mai jos. Ctigurile vor crete pn la un
nivel anumit, apoi cu naintarea n vrst vor descrete. Aa o relaie teoretic poate fi modelat
cu ajutorul ecuaiei ptratice: Z i = 0 + 1Vi + 2Vi 2 + L + i . Care se ateapt a fi semnele pentru
) )
1 , 2 ? Cu ct este mai n vrst salariatul cu att diferena dintre V i V 2 va crete vertiginos,

ntruct V 2 va fi foarte mare. Prin urmare, coeficientul pe lng V va fi mai important pentru o
vrsta mai mic dect pentru o vrst mai majorat. Din contra, coeficientul pe lng V 2 va fi
mai important la o vrst mai majorat. Deoarece se preconizeaz c impactul vrstei este n
)
)
cretere apoi descrete, e de ateptat n acest caz ca 1 s fie pozitiv, iar 2 s fie negativ (restul
coeficienilor avnd aceleai semne). Anume acest fenomen este exact acla care a fost observat
de muli cercettori n domeniul economiei muncii.
Spre regret, nu toate polinoamele pot fi utilizate ca curbe-mijloace de prognozare. n
realitate, orice n observaii pot fi aproximate exact (toate reziduurile fiind egale cu 0) printr-o
curb de regresie sub form de polinom de gradul (n 1) (avnd ca variabilele independente
X , X 2 , X 3 ,L, X n 1 ). n acest caz regresia se transform ntr-o taftologie matematic dar nu
relaie statistic i ne ofer un tablou fals al realitii. n concluzie, folosirea polinoamelor de
grad nalt n analiza regresional va fi evitat atta timp ct teoria corespunztoare nu e
elaborat pentru aceste forme funcionale.
n regresia polinomial interpretarea coeficienilor specifici devine dificil, i ecuaia poate
produce efecte nedorite pentru domeniu speciale ale variabilei X . De exemplu, coeficientul
individual pentru polinomul de ordinul 3 poate fi pozitiv pentru un domeniu al variabilei X ,
apoi negativ pentru alt domeni ce va urma, i apoi din nou pozitiv. Utilizarea polinoamelor de
ordin nalt va fi inoportun atta timp ct nu exist o teorie special ntru susinerea acestui tip
de relaii. Chiar i polinomul de gradul doi, cum este acela din ecuaia examinat, impune un
coeficient unghiular simetric ( nclinaia, sau invers nclinaie) care n unele cazuri poate
s nu fie rezonabil. Deci, n orice prob cnd se folosete ecuaia polinomial de regresie este
necesar o atitudine de precauie, aste necesar certitudinea c forma funcional atinge acele
obiective care sunt susinute din punct de vedere teoretic i nu altele.
55
13.6. Forma invers (hiperbola)

Forma funcional invers exprim variabila dependent Y ca o funcie invers de una sau
mai multe variabile independente (n cazul examinat numai de o singur variabil independent
1
X 1 ): Yi = 0 + 1
X 1i
+ 2 X 2i + i , forma funcional invers se va utiliza atunci cnd impactul
ei asupra unei variabile dependente se ateapt a fi aproape de 0, n timp ce variabila

independent crete i eventual se apropie de infinit. Vom nota, c n asemenea circumstane,
odat cu creterea variabilei independente X 1 , impactul ei asupra variabilei dependente Y
descrete.
n ecuaia examinat variabila independent X 1 nu poate lua valori de 0, deoarece atunci
prin mprire la zero se obine valoarea de infinit, sau o valoare nedeterminat. Coeficienii
Y
Y
unghiulare sunt:
= 12 ;
= 2 ; coeficientul unghiular pentru variabila independent
X 1
X1
X 2
X 1 se ncadreaz n dou categorii, fiecare din ele fiind oglindite pe desen:
1. Atunci cnd 1 f 0 , coeficientul unghiular n respect cu variabila X 1 este negativ i descrete

dup valoarea absolut odat cu creterea variabilei X 1 . Ca rezultat, relaia dintre Y i X 1
(variabila X 2 fiind constant) se apropie de 0 + 2 X 2 atunci cnd X 1 crete.
1
2. Atunci cnd 1 p 0 , curba intersecteaz axa X 1 n punctul
( 0 + 2 X 2 ) , i coeficientul
unghiular este ascendent, apropiindu-se spre o linie orizontal (numit asimptot), apropiat
de valorile coeficientul unghiular i n cazul cnd 1 f 0 .
Forma funcional invers se aplic n mai multe domenii din teoria economic i din viaa
real. De exemplu, s examinm curba Philips, o relaie neliniar dintre rata neangajailor n
56
cmpul muncii i schimbarea salariului n procente; cu siguran, schimbrile procentuale n

salariu ( W ) se vor reflecta negativ asupra ratei neangajailor n cmpul muncii ( U ), majornd
nivelul de neangajai; creterea ratei neangajailor va contribui pe viitor la reducerea nivelului
creterii salariului din cauze instituionale i alte cauze. Aa o ipotez poate fi testat cu ajutorul
1
Ut
formei funcionale inverse: Wt = 0 + 1
+ t .
Estimarea acestei ecuaii prin metoda celor mai mici ptrate ofer urmtoarea ecuaie:
Wt = 0.00679 + 0.1842(1 / U t ) ; R 2 = 0.397
(0.0590)
t =3.20
13.7 Probleme care apar odat cu alegerea formei funcionale incorecte
Ceea mai bun cale de a selecta pentru modelul de regresie o form funcional corect
const n alegerea specificaiei care n cel mai reuit mod se potrivete teoriei ce st la
fundamentarea ecuaiei. n majoritatea cazurilor forma liniar va fi o form adecvat. Iar pentru
majoritatea cazurilor rmase, bunul simi a demonstra o alegere concret dintre formele simple
de alternativ prezentate mai jos.
Sumarul formelor funcionale alternative

Forma funcional
Ecuaia
Coeficientul Elasticitatea
unghiular
Y X
Y
=
Liniar
Yi = o + 1 X i + i
Log complet
ln Yi = o + 1 ln X i + i
Semilog ( ln X )
Yi = o + 1 ln X i + i
Semilog ( ln Y )
Polinomial
Invers
=

X Y
Xi
Yi
ln Yi = o + 1 X i + i
1
1
Xi
1Yi
Yi = o + 1 X i + 2 X i2 + i
1 + 2 X i
1
Yi = o + 1
Xi
1
1 2
Xi
X2
+ 2 2 i
Yi
1
1
X i Yi
+ i
Yi
Xi
1
Yi
1 X i
Xi
Yi
Oricum, din cnd n cnd, apar circumstane n care modelul din considerente logice este
neliniar n variabile, ns forma exact a acestei neliniariti este greu de conceput. n aa caz,
forma liniar nu este corect, i chiar alegerea dintre diverse forme neliniare nu poate fi fcut
n baza teoriei economice. Oricum, tocmai n aceste cazuri, rmne s ne achitm (n termenii
nelegerii relaiei adevrate) pentru evitarea alegerii formei funcionale numai n baza
aproximrii reuite. Se pot da dou rspunsuri la aceast problem:
1. R 2 este greu de comparat atunci cnd variabilele dependente sunt transformate.
2. Forma funcional incorect poate prezenta o aproximare rezonabil a observaiilor, dar are
potenial mare de a produce erori n pronosticare, cnd se efectueaz previziunea n afara
regiunii observabile.
57
13.7.1 R 2 este dificil de comparat cnd variabila dependent Y este transformat

Atunci cnd variabila dependent este transformat de la versiunea sa liniar, R 2 nu poate fi
folosit pentru compararea aproximrii ecuaiei neliniare cu acea liniar de origine. Problema
dat, n majoritatea cazurilor, nu este important deoarece n analiza regresional aplicat
accentul se pune de regul pe estimarea coeficienilor. Oricum, dac R 2 (sau R 2 ) totui se
folosete pentru comparaia a dou aproximri pentru forme funcionale distincte, atunci aceasta
devine esenial deoarece acest gol a comparabilitii va fi memorat. Fie ca se face tentativa de a
compara ecuaia liniar Y = o + 1 X 1 + 2 X 2 + cu versiunea ei n semilogaritmi:
ln Yi = o + 1 ln X i + i . Vom meniona c unica diferen dintre aceste dou ecuaii const n
forma prezentrii pentru variabila dependent. Coeficientul de determinaie R 2 pentru ecuaia
respectiv nu poate fi utilizat pentru comparaia aproximaiilor a dou ecuaii din cauza c
suma total a devierilor ptratelor (TSS) a variabilei dependente de la valoarea medie este
distinct pentru aceste dou formulri. Deci coeficientul de determinaie R 2 nu poate fi
comparat ntruct variabilele dependente sunt diferite. Nu exist motiv pentru care dou
variabile dependente distincte s aib devierea de la valoarea medie identic sau comparabil.
Deoarece (TSS) este diferit, coeficientul de determinaie R 2 (sau coeficientul de determinaie
R 2 ajustat) nu pot fi comparai.
Calea de a evita aceast problem const n crearea quazi- R 2 prin transformarea
valorilor pronosticate a variabilei dependente nelineare ntr-o form care este n mod direct
comparabil cu variabila de origine dependent. Aceasta variabil dependent transformat este
apoi folosit la calcularea quazi- R 2 . n esen, quazi- R 2 este R 2 care permite comparaia
aproximrilor ecuaiei obinute prin forme funcionale distincte, transformnd valorile
pronosticate ale unei variabile dependente n forma funcional a altei variabile dependente.
Pentru exemplul expus ar nsemna executarea urmtorilor etape:
)
) Estimarea ecuaiei ln Yi = o + 1 ln X i + i i determinarea ln Y pr
)
b) Transformarea ln Y pr prin antilogaritmare anti ln(ln Yi ) = Yi .

) Calcularea quazi- R 2 sau (quazi- R 2 ) folosind valorile calculate noi ale antilogaritmilor
)
drept Yi pentru a obine reziduurile necesare n ecuaia pentru R 2 . quazi- R 2
[Y
=1
) 2
anti ln(ln Yi )
[Y
Y ]
. Acest quazi- R 2 pentru ecuaia n logaritmi este n mod direct
comparabil cu R 2 tradiional pentru ecuaia liniar.

13.7.2 Un exemplu al folosirii incorecte de R 2 (coeficient de determinaie ajustat)
Pentru ncorporarea impactului schimbrilor n numrul tuturor variabilelor independente
este necesar de utilizat R 2 , care reprezint coeficientul de determinaie ajustat la numrul
gradelor de libertate: R 2 = 1
u /(n k 1) . De menionat, c numai diferena dintre

(Y Y )/(n 1)
2
i
R 2 i
ajustat la gradul de libertate este n continuare pierdut la calculele de estimare a

coeficientului de nclinaie. Este cunoscut faptul c coeficieni de determinaie se exprim unul
R
prin altul R 2 = 1 (1 R 2 )
(n 1) , de unde rezult c
(n k 1)
R 2 va crete, va descrete sau va rmne
intact atunci cnd se introduce o variabil adiional n ecuaie, depinde de faptul dac se
mbuntete aproximaia cauzat de includerea variabilei noi n depirea pierderii gradelor de
libertate.
n concluzie, avertizarea e urmtoarea: de fiecare dat trebuie de inut cont de faptul c
calitatea potrivirii ecuaiei estimate este numai una din msurile ce contribuie la calitatea
58
regresiei n ansamblu. Cum a fost menionat anterior, gradul de estimare a coeficienilor n

conformitate cu teoria economic i ateptrile preconizate cu privire la aceti coeficieni sunt la
fel de importante ca i potrivirea regresiei. De exemplu, o ecuaie estimat cu o potrivire bun n
raport cu ecuaia de regresie teoretic, dar cu semne confuze pentru coeficienii estimai poate
oferi previziuni neverosimile i n acest sens nu va fi o ecuaie reuit. Ali factori, cum ar fi
relevana teoretic i utilitatea, la fel joac un rol important.
Din cele exspuse tragem concluzii c o potrivire mai bun pentru ecuaia estimat este o
soluie din cele mai bune. ns, muli cercettori nceptori presupun c dac R 2 (sau R 2 , r )
sunt buni, atunci ceea mai bun cale de a mbunti calitatea ecuaiei este atingerea valorii
maxime pentru unul din coeficienii nominalizai.
Probabil c examinarea unui exemplu de abuz este cel mai bun exemplu de vizualizare a
pericolului ncorporat n maximizarea R 2 , fr de a ine cont de sensul economic sau
semnificaia statistic a ecuaiei.
14. Date economice
Orice analiz cantitativ necesit a fi precedat de colectarea, organizarea i introducerea
datelor n calculator. Uzual aceast munc este ingrat i ocup mult timp, deoarece este greu de
gsit datele, exist diferen dintre datele teoretice i cele empirice, este sporit probabilitatea
erorilor tipografice i dactilografice. Atunci cnd sunt cunoscute sursele de informaie i datele
sunt corect definite, n pofida pierderii de timp la meditarea asupra naturei datelor i colectrii
lor, e mai mic probabilitatea comiterii greelilor la utilizarea sau interpretarea rezultatelor
regresiei respective,.
14.1 Datele de cutat
Cnd se alege tema pentru cercetare n primul rnd trebuie s existe certitudinea c este
posibil de le gsit datele pentru variabila dependent i toate variabilele independente relevante.
n orice caz, verificarea disponibilitii nseamn deciderea asupra specificaiei variabilelor ce
vor fi incluse n studiu. Jumtate din timp care cercettorii nceptorii l petrec colectnd datele
este irosit n cutarea variabilelor incorecte din surse greite. Cteva minute de meditaie asupra
naturii datelor de cutat vor salva ore de nemulumire pe viitor.
De exemplu, fie c variabila dependent este cantitatea televizoarelor solicitate ntr-un an,
atunci i majoritatea variabilelor independente la fel vor fi msurate anual. Va fi nepotrivit sau
pur i simplu greit s fie definite preurile TV ca preuri pentru o lun distinct. Mai bine
neles va fi preul mediu pe parcursul unui an fiind raportat la numrul TV vndute ntr-o lun.
Dac variabila dependent include toate televizoarele vndute, indiferent de marc, atunci preul
cel mai potrivit va fi preul agregat format n baz preurilor ale tuturor claselor de TV. i totui
calcularea unei atare variabile nu este bine venit.
Datele statistice utilizate n analiza regresional reprezint o verig de legtur ntre
modelarea economic teoretic i economia real, care necesit a fi perceput prin intermediul
acestei verigi. Majoritatea proceselor i fenomenelor economice poate exact msurat,
prezentat de valori numerice. Datele cantitative pot fi obinute din Anuare Statistice fiind
posibil utilizarea lor direct sau o prelucrare adiional este necar nainte ca ele s fie folosite.
tiinele economice i sociale foarte des au de a face cu fenomene cantitative de tip
dihotomic. Toate evenimentele care se caracterizeaz de fenomenul dihotomic pot fi prezentate
cu ajutorul variabilelor dummy.
Dtale statistice pot fi de natura ce va urma:
Date temporale, n care obiectul de cercetare este ficsat i este supus examinrii n diferite
momente de timp.
59
Date cruciate, pentru care pentru n momentul de timp fixat se cerceteaz diferite
obiecte.
Date de panou, care reprezint date de chestionare, date experimentale i constituie cele
mai veridice date.
14.2 Surse de date economice
Anuare statistice ale republicii Moldova.
Buletine statistice trimestriale, Chiinu
Evoluia social-economic a Republicii Moldova, MER, Chiinu
Buletine ale Bncii Naionale din Moldova.
Tendine n economia Moldovei.
International Financial Statistics pub
International Monetary Fun.
Piaa financiar, revist Chiinu
World Economic Outlook
www.IREX.RU/PUBLICATIONS/POLEMICA/5/ARTY.HTM
www.WEFA.com
www.CIRS-md.org
www.met.dnt.md
http://ecfor.rssi.ru
http://www.inf.org/external/country/index.htm
14.3.1 Variabile proxy sau variabile delegate
Variabilele proxy se utilizeaz pentru substituirea variabilelor teoretice necesare atunci
cnd datele pentru variabilele respective sunt incomplete sau n genere lipsesc. De exemplu,
valoarea investiiilor nete este o variabil care nu se evalueaz ntr-un numr relativ mare de
ri. Prin urmare, cercettorul poate folosi valorile investiiilor brute ca variabil proxy n
condiiile n care se presupune c valoarea investiiilor brute este direct proporional valorii
investiiilor nete. Proporionalitatea este tot ce e necesar, deoarece analiza regresional este n
primul rnd o relaie dintre schimbri n valorile variabilelor dect schimbri n nivelul absolut a
variabilelor.
n general variabila proxy este o variabil delegat bun, atunci cnd schimbrile ei
relativ bine reflect schimbrile n variabila teoretic corect.
Datele lipsesc sau sunt incomplete:
Date ncruciate: lipsesc careva date din una sau mai multe observaii, atunci acestea
observaii pot fi eliminate.
Serii temporale: lipsesc date pentru careva perioade de timp, atunci se estimeaz datele
omise prin interpolare, folosind media datelor adiacente.
Datele sunt trimestriale, dar sunt disponibile numai date anuale, atunci se interpoleaz datele
trimestriale. n orice caz interpolarea poate fi justificat atunci cnd schimbarea variabilei
este lent i neted.
Atunci cnd datele lipsesc complet problema se agraveaz. Omiterea variabilelor relevante
creeaz deplasri. De fapt, un proiect regresional reuit poate fi stopat din cauza datelor
inadecvate. n multe cazuri chiar i o tehnic regresional simpl nu poate fi aplicat deoarece
informaia este ironat. Uneori ea este msurat cu attea erori nct utilizatorul numai formeaz
tabele i construete grafice pentru a trage concluzii. Printre altele, aceste tabele i grafice
servesc ca material auxiliar de folos la fundamentarea ecuaiei de regresie.
14.3.2 Utilizarea ntrzierei n timp n Economie i Econometrie
60
Majoritatea regresiilor studiate sunt instantanee dup natura lor. Cu alte cuvinte, ele includ
valorile variabilelor dependent i independente n aceiai perioad de timp:
Yt = 0 + 1 X 1t + 2 X 2t + t , indicele t se refer la puncte distincte n timp, i atunci cnd toate
variabilele au acelai indice, ecuaia este instantanee n timp. Dar nu toate situaiile n economie
sau busines implic relaii instantanee n timp ntre variabila dependent i variabilele
independente. n multe cazuri este necesar de a oferi posibilitatea ca s treac ceva timp ntre
schimbrile n variabila independent i schimbarea rezultativ n variabila dependent. Durata
acestui timp dintre cauz i efect se numete lag. Multe ecuaii econometrice includ una sau mai
multe variabile independente cu ntrzieri n timp cum ar fi X t 1 , unde indicele t 1 indic c
observaia X t 1 s refer la perioada de timp ce preced momentul de timp t , cum ar fi n
ecuaia ce urmeaz:
Yt = o + 1 X 1t 1 + 2 X 2t + t . Orice schimbare pe piaa agricol, cum ar fi creterea n pre care
fermierul poate s-o ctige pentru promovarea produsului, are un efect ntrziat asupra ofertei
produsului, Cantitatea oferitt=f(Pret-1, etc). Similar, multe teorii macroeconomice au o
structur explicit ntrziat ncorporat n ele. Durata n timp dintre deciziile luate cu privire la
aa politici macroeconomice (ca cheltuieli guvernamentale sau creterea n oferta de mijloace
bneti) i impactul acestora asupra Produsului Intern Brut, angajarea n serviciu sau preuri, de
regul, se msoar n ani. Creterea ofertei de bani stimuleaz Produsului Intern Brut n partea
simulrii investiiilor, dar investiiile nu pot crete peste noapte deoarece deciziile necesit a fi
luate, planurile necesit a fi formate, lucrtori adiionali necesit a fi angajai i aa mai departe.
ntradevr, cum a notat economistul Milton Friedman, odat estimate schimbrile n politica
monetar iau de la 6 pn la 30 de luni pentru a fi complet plsate n economie.
Dac este formulat ipoteza pentru un lag simplu, apar dificulti n folosirea lagului n
ecuaiile econometrice. Variabila cu ntrziere n timp este introdus n ecuaia econometric ca
i o alt variabil independent. De exemplu, ecuaia ofertei de bumbac are o form de:
C t = F ( PC t 1 , PFt ) = 0 + 1 PC t 1 + 2 PFt + t ,
(*)
unde
Ct
- ofertei de bumbac n anul t ;
PC t 1 - preul bumbacului n anul t 1 ;
PFt - costul muncii de fermier n anul t .
Semnificaia coeficientului de regresie pentru variabilele cu ntrziere nu-i aceiai ca pentru
variabilele fr ntrziere. Coeficientul estimat pe lng variabil cu ntrziere msoar
schimbrile n valoarea Y din anul curent atribuit la schimbarea cu o singur unitate n
valoarea variabilei X din anul trecut (fiind pstrate constante valorile pentru altele variabile
independente X s n ecuaie). Deci parametrul 1 msoar (n ecuaia *) numrul unitilor de
bumbac care vor fi produse n plus n anul curent n urma schimbrii cu o unitate a preurilor la
bumbac n anul trecut, preul muncii fermierului rmnnd ne schimbat.
14.3.3 Variabile dummy
Unele din variabile (de exemplu - genul) pot fi explicate numai n mod calitativ. Aa
variabile n cele mai multe cazuri sunt calificate ca variabile binare sau variabile dummy.
Variabilele dummy iau valori de 1 sau 0 n dependen de faptul ndeplinirii sau ne
ndeplinirii al anumitei condiii.
Ca s ilustrm aceasta, vom presupune c Yi reprezint salariul nvtorului i colar i
nivelul lui de pregtire depinde n primul rnd de gradul obinut i de experiena de nvtor.
Toi nvtorii au B., A. , dar unei din ei au M . A. i atunci, ecuaia care reprezint relaia dintre
ctigul nvtorului i gradul obinut de el poate avea forma:
Yi = 0 + 1 X 1i + 2 X 2i + i , unde
61
1, daca invatatorul "i" are . .

X 1i =
0, in caz contrar
X 2i - numrul de ani lucrai ca nvtor pentru lectorul i . Variabila X 1 ia numai dou valori 0 i
1, i deci X 1 se numete variabil dummy sau pur i simplu dummy. n cazul dat variabila
dummy reprezint condiia existenei gradului M . A. .
Coeficientul de regresie ce corespunde variabilei X 1 n aceast ecuaie este interpretat n
modul urmtor.
1) dac nvtorul are numai gradul de B., A. , X 1 = 0 i E Yi X = 0 + 2 X 2i
i
2) dac nvtorul are i gradul de M . A. , X 1 = 1 i E Yi X = 0 + 1 + 2 X 2i

i
Comparnd aceste dou situaii tragem concluzia c 1 reprezint ctigul mediu adiional
obinut de nvtorul care are gradul de master n raport cu ctigul nvtorului care are numai
de gradul de bacalavr, ambii avnd aceiai experien de munc. Abilitatea de a postula semnul
coeficientului de regresie este esenial n analiza regresional. Astfel variabila dummy este
numit variabil dummy de intersecie deoarece ea n realitate schimb punctul de intersecie
a regresiei n dependen de faptul dac are nvtorul gradul de master sau nu.
O formulare de alternativ a modelului de regresie va fi dac vom defini X 1i ca:
0, daca invatatorul "i" are . .
X 1i =
1, in caz contrar
Aceste condiii schimb politica. n acest caz 1 va fi interpretat ca diferena dintre ctigul
mediu al nvtorului cu gradul de B., A. i acel nvtor care are gradul de M . A. , i semnul se
presupune a fi negativ. Deoarece coeficientul 1 a variabilei definite vine cu semnul invers, el
va avea aceiai amplitud absolut ca i 1 pentru variabila original. Sensul const n aceia c
aceti doi coeficieni msoar exact acelai eveniment (dar n direcii opuse). n acest sens
definiia variabilelor dummy este arbitrar. ns, odat ce ele au fost definite, o singur
interpretare poate fi prezentat.
E de menionat, c n acest exemplu s-a folosit o singur variabil dummy chiar dac au
existat dou condiii. Aceasta se ntmpl din cauza c condiiile se construiesc n baza unei
singuri variabile. Evenimentul nu este prezentat explicit de variabila dummy, condiia omis
formeaz baza cu care condiia inclus se compar. Astfel, n situaiile duale (de felul M . A. i
B., A. ), numai o singur variabil dummy se include fiind independent; coeficientul este
interpretat ca efectul condiiei incluse n raport cu condiia omis. Dac a treia condiie (cum ar
fi existena Ph.D) va fi inclus, atunci numai dou variabile vor fi folosite.
Y
Yi = 0 + 1 + 2 X 2i
M . A.
Yi = 0 + 2 X 2i
0 + 1
0
B. A.
X2
62
nceptorii deseori greesc cnd includ variabile dummy n conformitate cu numrul

condiiilor, ns aa model este inutil deoarece variabila dummy adaug constante, care sunt
perfect multicolineare cu termenul de intersecie care deja este n ecuaie. Multicolinearitatea
perfect este definit ca o relaie liniar ntre o parte sau toate variabilele explicative. Aceasta se
ntmpl deoarece suma variabilelor dummy este egal cu o unitate pentru toate observaiile
care au fost executate. Programele de regresie, utilizate la calculator, n acest caz nu vor
prezenta nici un rezultat.
Variabila dummy, care are o singur observaie cu valoarea 1, restul observaiilor avnd
valoare 0 (sau viceversa) va fi evitat. Aa aciune de o dat dummy, pur i simplu elimina
aceast observaie din setul de date, evaluarea artificial determinnd coeficientul pentru
variabila dummy egal cu valoarea rezidual pentru aceasta observaie. Aceiai estimaie poate
fi obinut pentru restul coeficienilor, dac observaia va fi exclus, dar excluderea observaiei
este pur i simplu de fiecare dat mai potrivit.
Uneori variabilele dummy se utilizeaz n calculele variaiilor sezoniere pentru datele n
modele cu iruri temporale. De exemplu, dac
1 in I trimestru
X 1t =
0 in celelalte
1
X 2t =
0
1
X 3t =
0
in trimestru II
in celelalte
in trimestru III
in celelalte
atunci Yt = 0 + 1 X 1t + 2 X 2t + 3 X 3t + 4 X 4t + t , unde X 4 - este variabila independent

diferit de dummy, i t este indicele observaiilor trimestriale. Vom nota c numai trei
variabile dummy sunt necesare pentru prezentarea a patru anotimpuri. n aceast formulare 1
indic cu ct valoarea ateptat pentru Y n primul trimestru difer de valoarea ateptat a lui Y
n trimestrul patru, condiia omis. 2 i 3 pot fi interpretate similar.
Procedeul poate fi aplicat numai n cazul cnd Y i X 4 nu sunt ajustate sezonier nainte
de estimare. Includerea variabilelor dummy conform anotimpului desezoniarizeaz
variabila Y , la fel ca i alte variabile independente care nu sunt ajustate dup anotimp.
14.4 Etapele n regresia aplicativ
Trecerea n revist a literaturei de specialitate
Specificarea modelului: selectarea variabilei independente i a formei funcionale
Lansarea ipotezelor referitor la semnul preconizat pentru coeficieni
Colectarea datelor
Estimarea i evaluarea ecuaiei
Oformarea rezultatelor
15. Siseme de ecuaii econometrice
15.1. Noiuni generale privind sisteme de ecuaii folosite n econometrie
n tiinele sociale obiectul de cercetare statistic este prezentat de sisteme complexe.
Evaluarea stricteei legturilor dintre variabile, construirea ecuaiilor de regresie izolate nu este
suficient pentru descrierea acestor sisteme i pentru explicarea mecanismului de funcionare
ale lor. Atunci, cnd pentru calcule economice se recurge la utilizarea ecuaiilor de regresie
separete, n majoritatea cazurilor se presupune c factorii pot fi schimbai independent unul de
63
altul. ns, aceast ipotez se adeverete a fi foarte aproximativ, deoarece n realitate

schimbarea unei variabile, de regul, nu poate avea loc n situaia cnd modificarea altor
variabile rmne intact. Schimbarea ei va implica modificri n ntregul sistem de indicatori
independeni. Prin urmare, fiecare ecuaie de regresie multipl examinat separat nu este n
stare s caracterizeze influena real a unor indicatori asupra variaiei variabilei rezultante.
Anume din acest motiv, n ultimile decenii n cercetrile economice, biometrice i sociologice
un loc principal la ocupet problema descrierii structurii legturilor dintre variabile cu ajutorul
sistemelor de ecuaii simultane, care se mai numesc i sisteme de ecuaii structurale. De
exemplu, cnd se studiaz modelul cererii dat fiind o relaie dintre pre i cantitatea bunurilor
consumate, concomitent, n scopuri de prognozare, este necesar s se cerceteze i modelul de
ofert al bunurilor, n care la fel se studiaz legtura dintre cantitatea i costul bunurilor oferite.
Ceea ce permite s se ating echilibru ntre cerere i ofert. Atunci cnd se estimeaz
eficacitatea de producere nu e corect s se conduc numai de modelul rentabilitii. El necesit a
fi completat cu modelul de productivitate a muncii, precum i cu modelul preului de cost al
unei uniti de produs.
Atunci cnd trecem la de la cercetri la nivelul micro la calcule macroeconomice, utilizarea
sistemelor de ecuaii simultane este o necesitate stringent. Modelul de funcionare al economiei
naionale este un sistem de ecuaii ce include funcii de consum; de investiii, de salarizare,
identiti cu privire la venituri etc. Fiind indicatori agregai, indicatorii macroeconomici, cel mai
frecvent sunt interdependeni. Spre exemplu, cheltuielile pentru consumul final n economie
depind de Produsul Intern Brut. n timp ce mrimea Produsului Intern Brut se consider ca
funcie de investiii.
n cercetrile econometrice sistemele de ecuaii pot fi alctuite n mod diferit. E posibil s se
formeze un sistem de ecuaii independente, n care fiecare variabil dependent ( y ) se
examineaz ca funcie ce depinde de acelai set de factori-variabile independente ( x ):
y1 = a11 x1 + a12 x2 + K + a1m xm + 1,
y = a x + a x +K+ a x + ,
2
21 1
22 2
2m m
2
....................................................
yn = an1 x1 + an 2 x2 + K + anm xm + n.
Numrul factorilor xi n fiecare ecuaie poate s varieze n raport cu numrul limit. Modelul ce
urmeaz reprezint un atare exemplu:

y1 = f ( x1 , x2 , x3 , x4 , x5 )
y2 = f ( x1 , x3 , x4 , x5 )
y3 = f ( x2 , x3 , x5 )
y4 = f ( x3 , x4 , x5 )
Poate fi considerat un sistem de ecuaii independente cu o singura deosebire, numrul factorilor

se modific de la o ecuaie la alta care fac parte din sistem. Lipsa unuia sau altuia factor n
ecuaia din sistem poate fi explicat sau ca consecina unui raionament economic ce motiveaz
prezena lui n sistem, sau din motivul c acest factor nu influeneaz semnificativ asupra
variabilei dependente (nu este semnificativ valoare criteriului Student - t sau nu este
semnificativ valoarea criteriului Fier - F ).
Fiecare ecuaie din sistemul de ecuaii independente poate fi examinat de sinestttor.
Pentru determinarea parametrilor acestei ecuaii se folosete M.C.M.M.P. n esen, fiecare
ecuaie din acest sistem este o ecuaie de regresie. Deoarece nu exist certitudinea, c factorii
inclii n ecuaii complectamente explic variabilele dependente, n ecuaie este obligatorie
prezena termenului liber a0 . i ntruct valorile actuale ale variabilei dependente se deosebesc
64
de valorile teoretice n limita unei valori de eroare stocastic, n fiecare ecuaie este prezent
valoarea erorii stocastice.
n consecin, sistemul de ecuaii independente cu trei variabile dependente i patru variabile
independente (patru factori) ia forma:
y1 = a01 + a11 x1 + a12 x2 + a13 x3 + a14 x4 + 1,
y2 = a02 + a21 x1 + a22 x2 + a23 x3 + a24 x4 + 2 ,

y = a + a x + a x + a x + a x + .
03
31 1
32 2
33 3
34 4
3
3
ns, dac variabila dependent y dintr-o ecuaie face parte n calitate de factor x n alt ecuaie,
atunci recurgem la formarea unui sistem recursiv de ecuaii:
y1 = a11 x1 + a12 x2 + K + a1m xm + 1,
y2 = b21 y1 + a21 x1 + a22 x2 + K + a2 m xm + 2 ,
y3 = b31 y1 + b32 y2 + a31 x1 + a32 x2 + K + a3m xm + 3,
....................................................
yn = bn1 y1 + bn 2 y2 + K + bnm 1 ym + an1 x1 + an 2 x2 + K + anm xm + n.
n acest sistem variabila dependent y include n fiecare ecuaie ulterioar n calitate de factori
toate variabilele dependente din ecuaiile anterioare, la fel i mulimea factorilor x . Ca exemplu
unui atare sistem poate servi modelul de productivitate al muncii i modelul de randament al
fondurilor fixe sub forma ce urmeaz:
y1 = a11 x1 + a12 x2 + a13 x3 + 1,
y2 = b21 y1 + a21 x1 + a22 x2 + a23 x3 + 2 ,

unde y1 este productivitatea muncii; y2 este randamentul fondurilor fixe; x1 este nzestrarea
muncii cu fonduri; x2 este nzestrarea muncii cu energie electric; x3 este nivelul de calificare al
forei de munc.
Ca i n sistemul anterior, fiecare ecuaie poate fi examinat separat, iar parametrii acestei
ecuaii pot fi determinai cu ajutorul M.C.M.M.P.
Sistem de ecuaii simultane este cel mai frecvent utilizat n cercetrile econometrice. n
acest sistem unele i aceleai variabile dependente n unele ecuaii se regsesc n partea stng a
ecuaiei n timp ce n altele se regsesc n partea dreapt:
y1 =b12 y2 + b13 y3 + K + b1n yn + a11 x1 + a12 x2 + K + a1m xm + 1,
y = b y + b y +K+ b y + a x + a x +K+ a x + ,
2
21 1
23 3
2n n
21 1
22 2
2m m
2
...............................................................................................
yn = bn1 y1 + bn 2 y2 + K + bnn 1 yn 1 + an1 x1 + an 2 x2 + K + anm xm + n.
Acest sistem de ecuaii interidependente a primit denumirea de sistem de ecuaii comune,

sau sistem de ecuaii simultane. Prin aceast definiie se scoate n relief, c n sistemul examinat
unele i aceleai variabile y simultan se consider ca dependente n unele ecuaii i ca
independente n alte ecuaii. n econometrie acest sistem de ecuaii se mai numete i ca model
sub form structural. Spre deosebire de sistemele anterioare fiecare ecuaie din sistemul de
ecuaii simultane nu poate fi cercetat de sinestttor, i pentru determinarea parametrilor din
model nu poate fi utilizat M.C.M.M.P. tradiional. n acest scop se utilizeaz metode speciale
de evaluare.
Drept exemplu de sistem de ecuaii simultane poate servi modelul dinamic pentru pre i
salariu de felul urmtor:
y1 = b12 y2 + a11 x1 + 1,
y2 = b21 y1 + a22 x2 + a23 x3 + 2 ,

65
unde y1 este ritmul de schimbare al salariului lunar; y2 este ritmul de modificare al preurilor;
x1 este procentul neangajailor n cmpul muncii; x2 este ritmul de schimbare a capitalului fix;
x3 este ritmul de modificare al preurilor de import la materia prim.
15.2. Formele structural i redus ale sistemului de ecuaii simultane
Sistemul de ecuaii comune, simultane (sau forma structural a modelului) de regul este
constituit din variabile endogene i exogene.
Variabilele endogene se noteaz prin y n sistemul de ecuaii examinat anterior. Acestea sunt
variabile dependente i numrul lor este egal cu numrul ecuaiilor din sistem.
Variabilele exogene se noteaz, de regul, prin x . Acestea sunt variabile predeterminate, care
influeneaz variabilele dependente, ns care nu depind de cele din urm.
Ceea mai simpl form structural a modelului se exprim ca:
y1 = b12 y2 + a11 x1 + 1,
y2 = b21 y1 + a22 x2 + 2 ,
unde y sunt variabile endogene; x sunt variabile exogene.
Clasificarea variabilelor n endogene i exogene depinde de conceptul teoretic adoptat n
model. Variabilele economice pot fi interpretate ca variabile endogene ntr-un model, dar n alte
modele aceleai variabile se vor produce ca variabile exogene. n calitate de variabile exogene
pot fi considerate valorile variabilelor endogene pentru perioada precedent de timp (variabile
ntrziate). Deci, consumul anului curent ( yt ) este posibil s depind nu numai de factori
economici, dar i de consumul n anul precedent ( yt 1 ). Variabile extraeconomice (cum ar fi,
condiiile climaterice) iau parte din sistem n calitate de variabile exogene.
Modelul sub forma sa structural permite evidenierea impactului oaricrei variabile
exogene asupra variabilelei endogene. Este oportun ca n calitate de variabile exogene s fie
selectate variabilele, care pot fi tratate ca instrumente de control. Modificndu-le i ghidndu-le,
avem posibilitatea s obinem anticipat valorile obiectiv ale variabilelor endogene. Modelul sub
forma sa structural ncorporeaz pe lng variabilele endogene i cele exogene coeficienii ais
bik , care se numesc coeficieni structurali ai modelului. Toate variabilele modelului sunt
exprimate n devieri de la valorile medii, nct prin variabila x se subnelege x x , dar prin
variabila y - respectiv y y , prin urmare terminul liber lipsete din fiecare ecuaie.
Folosirea M.C.M.M.P. pentru estimarea coeficienilor structurali, conform teoriei, de regul,
ne ofer, valori deplasate i neconsistente. Deaceea pentru determunarea coeficienilor
structurali ale modelului, modelul se transform ntr-o form, numit forma redus a modelului.
Forma redus a modelului reprezint un sistem de ecuaii neliniar n raport cu coeficienii de pe
lng variabilele endogene i exogene din modelul sub forma sa structural:
)
y1 = 11 x1 + 12 x2 + K + 1m xm,
y) = x + x + K + x ,
2
21 1
22 2
2m m
....................................................
y)n = n1 x1 + n 2 x2 + K + nm xm ,
unde ij sunt coeficienii modelului sub forma sa redus

Dup aspectul su modelul sub forma sa redus nici ntr-un fel nu se deosebete de la
sistemul de ecuaii independente, la care deja poate fi aplicat M.C.M.M.P. Prin aplicarea
M.C.M.M.P. putem estima coeficienii , poi cu ajutorul lor s evalum valorile variabilelor
endogene prin valorile variabilelor exogene.
Coeficienii formei reduse a modelului reprezint funcii neliniare n raport cu coeficienii
formei structurale a modelului. S examinm acest deziderat n baza unui exemplu simplu al
66
formei structurale, exprimnd coeficienii formei reduse a modelului ij prin coeficienii formei
structurale a modelului ais bik . n scopul simplitii n model nu este inclus termenul erorii
stocastice. Pentru modelul structural sub forma:
)
y1 = b12 y2 + a11 x1
y1 = 11 x1 + 12 x2 ,
forma redus se prezint ca:
)
y2 = b21 y1 + a22 x2 ,
y2 = 21 x1 + 22 x2 ,
Din prima ecuaie a modelului structural y2 pooate fi exprimat n felul urmtor: y2 =
y1 a11 x1
.
b12
y2 = y1 a11 x1 b12
y2 = b21 y1 + a22 x2 ,
Prin urmare sistemul de ecuaii simultane va fi prezentat ca:
y1 a11 x1
= b21 y1 + a22 x2 , i atunci y1 b12b21 y1 = a11 x1 + b12 a22 x2 sau
b12
y1 = a11 x1 /(1 b12b21 ) + b12 a22 x2 /(1 b12b21 ) .
Din el obinem egalitatea
Deci, prima ecuaie din forma structural este prezentat ca ecuaie a formei de model redus:
y1 = 11 x1 + 12 x2 . Din ecuaia dat urmeaz, c coeficienii formei reduse a modelului sunt relaii
neliniare n raport cu coeficienii formei structurale a modelului, deci 11 = a11 /(1 b12b21 ) ,
12 = b12 a22 /(1 b12b21 ) .
Prin analogie putem demonstra, c coeficienii din ai doilea ecuaie ( 21 , 22 ) ai formei
reduse a modelului la fel se afl ntr-o relaie neliniar fa de coeficienii formei structurale a
modelului. n acest scop vom exprima variabila y1 din a doua ecuaie structural ca
y2 a22 x2
sau, dac nscriem aceasta expresie n partea stng a primei ecuaii din forma
b21
structural a modelului, obinem ( y2 a22 x2 ) / b21 = b12 y2 + a11 x1 .
a b
a22
De unde avem y2 = 11 21 x1 +
x2 , ceea ce corespunde ecuaiei din forma redus a
1 b21b12
1 b21b12
modelului: y2 = 21 x1 + 22 x2 deci 21 = a11b21 /(1 b21b12 ) 22 = a22 /(1 b21b12 ) .
y1 =
ns n modelele econometrice, de regul, sunt incluse nu numai ecuaii, ce exprim legturile

ntre variabile separate i tendinele de evoluie a evenimentului, dar i diverse identiti. Aa
doar, n anul 1947, cercetnd dependena liniar a consumului ( c ) de la venitul ( y ), . Havelmo
a propus s fie considerat simultan i identitatea de venit. n acest caz modelul se prezint ca:
c = a + by
unde x sunt investiiile n capitalul fix i n stocurile de export i import, a, b sunt
y = c + x,
parametrii dependenei liniare ai variabilei endogene c de variabila endogen y . Estimrile lor
trebuie s in cont de identitatea de venit n deosebire de estimrile parametrilor n regresia

liniar obinuit.
Acest model conine dou variabile endogene c , y i o variabil exogen x . Sistemul redus
de
ecuaii
va
c = A0 + A1 x
.
y = B0 + B1 x
alctui:
x = ( y B0 ) / B1 , c = A0 + A1 ( y B0 ) / B1
c = A0 A1B0 / B1 + A1 y / B1 = a + by , a = A0 A1B0 / B1 , b = A1 / B1 .
Din el putem obine valorile variabilei endogene c prin valorile variabilei exogene x .
Calculnd coeficienii modelului ( A0,A1,B0,B1 ), putem trece la coeficienii modelului sub forma sa
structural a, b , substituind n prima ecuaie a modelului sub forma sa redus expresia pentru x
din a doua ecuaie a modelului sub forma sa redus. Forma redus a modelului, dei permite s
obinem valorile variabilei endogene prin valorile variabilei exogene, n sens analitic este
67
inferioar modelului sub forma sa structural, deoarece n ea lipsesc legturile dintre variabilele
endogene.
16. Problema de identificare a modelului sub forma sa redus
Odat cu trecerea de la modelul sub forma sa redus la modelul sub forma sa structural,
cercettorul se confrunt cu problema de identificare. Identificarea nu e altceva dect
corespunderea univoc dintre forma redus i forma structural a modelului.
Vom examina problema de identificare pentru cazul sistemului de ecuaii cu dou variabile
endogene. Fie c modelul sub forma sa structural este exprimat ca:
y1 =b12 y2 + a11 x1 + a12 x2 + K + a1m xm,
unde y1 i y2 sunt variabile dependente simultane.
y2 = b21 y1 + a21 x1 + a22 x2 + K + a2 m xm ,

y2 a21
a
x1 K 2 m xm .
b21 b21
b21
Atunci n sistem avem dou ecuaii pentru o singur variabil endogen y1 cu acelai set de
Din a doua ecuaie putem exprima y1 prin urmtoarea formul: y1 =
variabile
exogene
dar
cu
coeficieni
diferii
pe
lng
ele:
y1 =b12 y2 + a11 x1 + a12 x2 + K + a1m xm,

.
y1 = y2 / b21 a21 x1 / b21 a22 x2 / b21 K a2 m xm / b21
Existena a dou variante de calcul pentru coeficienii structurali ai aceluiai model ine de
identificarea incomplet a celei din urm. Modelul sub forma sa structural complet coninnd
n fiecare ecuaie din sistem n variabile endogene i m variabile exogene, este constituit
din n(n 1 + m) parametri. Deci, cu n = 2 i m = 3 , prezentarea complet a modelului sub forma
y1 =b12 y2 + a11 x1 + a12 x2 + a13 x3,
. Observm, c modelul conine opt
y
=
b
y
+
a
x
+
a
x
+
a
x
,
2
21
1
21
1
22
2
23
3
sa structural easte:
coeficieni structurali, ce corespunde expresiei n(n 1 + m) .

Modelul complet sub forma sa redus conine nm parametri. Ceea ce pentru ultimul
exemplu nseamn existena a ase coeficieni ai modelului sub forma sa redus. Acest fapt
poate fi confirmat dac ne adresm la modelul sub forma sa redus, care se exprima n felul
urmtor:
y1 = 11 x1 + 12 x2 + 13 x3 ,
. ntradevr, acest model conine ase coeficieni ij . n baza acestor
y2 = 21 x1 + 22 x2 + 23 x3
ase coeficieni ai modelului redus este necesar s determinm opt coeficieni structurali ai
modelului structural, ceea ce, n mod natural, nu poate conduce la o soluie unic. Modelul
structural complet conine mai muli parametri dect modelul redus. Respectiv n(n 1 + m)
parametri ai modelului structural nu pot fi determinai n mod univoc cu ajutorul nm parametri ai
modelului redus.
Pentru a obine soluia unic posibil pentru modelul structural este necesr s presupunem,
c unii dintre coeficienii modelului, demonstrnd o relaie insuficient a factorilor cu variabila
endogen din partea stng a sistemului, sunt egali cu zero. n aa mod se va micora numrul
coeficienilor structurali din model. Deci, dac vom admite, c n modelul examinat
a13 = 0 , a21 = 0 , modelul structural se va prezenta ca:
y1 =b12 y2 + a11 x1 + a12 x2,
. n acest model numrul coeficienilor structurali nu depete numrul
y
=
b
y
+
a
x
+
a
x
21 1
22 2
23 3
2
coeficienilor din modelul redus, care este egal cu 6. Micorarea numrului coeficienilor
structurali din model este posibil i n alt mod: de exemplu prin egalarea unor coeficieni ntre
68
ei, deci prin admiterea, c impactul lor asupra variabilei endogene este acelai. Asupra
coeficienilor structurali pot fi aplicate restricii de felul bij + aij = 0 .
De pe poziia de identificare modelele structurale pot fi mprite n trei categorii:
modele ce pot fi identificate;
modele ce nu pot fi identificate;
modele ce sunt supraidentificate.
Modelul poate fi identificat, dac toi coeficienii structurali sunt determinai n mod inivoc, deci
numrul de parametri din modelul structural este egal cu numrul de parametri din modelul
redus. n acest caz coeficienii structurali din model sunt evaluai prin parametrii modelului
redus i este posibil de identificat modelul. Modelul structural cu dou variabile endogene i trei
variabile exogene, examinat anterior, care conine ase coeficieni structurali reprezint un
model identificat.
Modelul nu poate fi identificat, dac numrul coeficienilor redui e mai mic dect numrul
coeficienilor structurali, prin urmare coeficienii structurali nu pot fi estimai cu ajutorul
coeficienilor modelului sub forma sa redus. Modelul structural complet, care conine n
variabile endogene i m variabile exogene (predeterminate) n fiecare din ecuaiile sistemului,
nu poate fi identificat.
Modelul este supraidentificat, dac numrul coeficienilor redui e mai mare dect numrul
coeficienilor structurali. n acest caz cu ajutorul coeficienilor modelului sub forma sa redus
pot fi obinute dou sau mai multe valori pentru un singur coeficient structural. n atare model
numrul coeficienilor structurali e mai mic dect numrul coeficienilor modelului sub forma sa
redus. Deci, dac n modelul structural complet se admite c unii coeficieni iau valori nule
a13 = 0 , a21 = 0 , dar i a22 = 0 , atunci sistemul de ecuaii devine supraidentificat:
y1 =b12 y2 + a11 x1 + a12 x2,
. n acest sistem cinci coeficieni structurali nu pot fi determinai univoc
y2 = b21 y1 + a23 x3
folosind ase coeficieni din modelul sub forma sa redus. Modelul supraidentificat, spre
deosebire de modelul, care nu poate fi identificat, practic poate fi soluionat, ins necesit
procedee speciale pentru calcularea parametrilor.
Modelul structural este un sistem de ecuaii simultane, n care orice ecuaie necesit a fi
verificat privind subiectul de identificare. Modelul se consider identificabil, dac fiecare
ecuaie din acest sistem poate fi identificat. n cazul n care cel puin o ecuaie, care face parte
din sistem, nu poate fi identificat, i atunci modelul integral se consider imposibil de
identificat. Modelul supraidentificat conine cel puin o ecuaie, care este supraidentificat.
ndeplinirea condiiilor de identificare ale modelului se verific pentru fiecare ecuaie din
sistem. Pentru ca ecuaia s fie identificat este necesar ca numrul variabilelor predeterminate,
care nu fac parte din ecuaie ns este prezent n sistem, s fie egal cu numrul variabilelor
endogene, prezente n ecuaia examinat, fr una.
Dac s notm numrul variabilelor endogene n ecuaia j prin H , iar numrul variabilelor
exogene, care fac parte din sistem, ns nu sunt incluse n ecuaia n examinare, prin D atunci
condiia de identificare a modelului va lua forma urmtoarei reguli:
D + 1 = H - ecuaia poate fi identificat;
D + 1 < H - ecuaia nu poate fi identificat;
D + 1 > H - ecuaia este supraidentificat.
Admitem, c se consider urmtorul sistem de ecuaii simultane:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
y2 = b21 y1 + a21 x1 + a22 x2 + a23 x3 ,

y = b y + b y + a x + a x .
31 1
32 2
33 3
34 4
3
69
Prima ecuaie este exact identificat deoarece n ea sunt prezente trei variabile endogene y1 , y2 , y3 , deci H = 3 , i dou variabile exogene - x1 , x2 , numrul variabilelor exogene absente
este egal cu doi - x3 i x4 , D = 2 . Rezult c se ndeplinete egalitatea: D + 1 = H , .. 2 + 1 = 3 ,
ceea ce nseamn prezena ecuaiei identificabile.
n a doua ecuaie din sistem H = 2 ( y1 i y2 ) i D = 1 ( x4 ). Are loc egalitatea D + 1 = H ,
1 + 1 = 2 . Prin urmare, a doua ecuaie este identificabil.
Din a treia ecuaie desprindem, c H = 3 ( y1 , y2 , y3 ) ir D = 2 ( x1 , x2 ), deci, n conformitate
cu regula de calcul D + 1 = H , i aceasta ecuaie este identificabil. n aa mod este identificabil
sistemul integral.
S admitem c n modelul examinat a21 = 0 , a33 = 0 , atunci sistemul ea forma:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
y2 = b21 y1 + a22 x2 + a23 x3 ,

y = b y + b y + a x .
31 1
32 2
34 4
3
Prima ecuaie din acest sistem nu s-a modificat. Sistemul continuie s conin trei variabile
endogene i patru variabile exogene, deaceea pentru aceast ecuaie D = 2 i H = 3 i ea este
identificabil. A doua ecuaie d dovad de H = 2 i D = 2 ( x1 , x4 ), i regula de calcul ne ofer
2 + 1 > 2 . Prin urmare aceast ecuaie este supraidentificat. La fel se adeverete c este
supraidentificat i a treia ecuaie, n care H = 3 ( y1 , y2 , y3 ) i D = 3 ( x1 , x2 , x3 ), deci regula de
calcul demonstreaz inegalitatea: 3 + 1 > 3 sau D + 1 > H . Modelul integral este supraidentificat.
S presupunem, c ultima ecuaie din sistemul cu trei variabile endogene ea forma:
y3 = b31 y1 + b32 y2 + a31 x1 + a32 x2 + a34 x4, deci spre deosebire de ecuaia precedent n ea au fost
incluse nc dou variabile exogene, care fac parte din sistem x1 , x2 . n acest caz ecuaia devine
neidentificabil deoarece cu H = 3 i D = 1 , D + 1 < H , ir 1 + 1 < 3 . n pofida faptului, c prima
ecuaie este identificat, a doua ecuaie este supraidentificat, de aici rezult c modelul se
consider neidentificat, deci nu are soluie statistic.
Pentru estimarea coeficienilor modelului structural este necesar ca sistemul de ecuaii s fie
posibil de identificat sau acest sistem de ecuaii s fie supraidentificat.
Regula de calcul considerat reprezint o condiie necesar ns nu i suficient pentru ca
sistemul de ecuaii s fie posibil de identificat. O condiie mai perfect se determin n cazul n
care asupra coeficienilor matricei formate din parametrii modelului structural se aplic unele
condiii. Ecuaia poate fi identificat, dac n baza variabilelor endogene i exogene, care nu fac
parte din ecuaie, poate fi obinut o matrice din coeficienii ei pe lng alte ecuaii din sistem,
determinantul creia nu este egal cu zero iar rangul matricei nu e mai mic dect numrul
variabilelor endogene din sistem fr una.
Oportunitatea verificrii condiiei de identificare a modelului prin determinantul matricei
formate din coeficieni pe lng variabilele ce lipsesc n ecuaia examinat, dar care sunt
prezente n alte ecuaii ai sistemului, se explic prin faptul c e posibil situaia, pentru care
regula de calcul este ndeplinit, ns determinantul matricei pe lng coeficienii numii este
egal cu zero. n acest caz are loc numai condiia necesar pentru a fi identificat ecuaia
examinat, n timp ce condiia suficient este violat.
S considerm urmtorul model structural:
y1 =b12 y2 + b13 y3 + a11 x1 + a12 x2,
y2 = b21 y1 + a22 x2 + a23 x3 + a24 x4 , Vom verifica fiecare ecuaie din sistem n vederea ndeplinirii
y = b y + b y + a x + a x .
31 1
32 2
31 1
32 2
3
condiiei necesare i condiiei suficiente pentru a fi identificat ecuaia. Pentru prima ecuaie are
loc: H = 3 ( y1 , y2 , y3 ) i D = 2 ( x3 , x4 lipsesc, atunci D + 1 = H i condiia necesar de
identificare este satisfcut, prin urmare, ecuaia este exact identificat. Pentru verificarea
70
condiiei suficiente se va completa urmtorul tabel, format din coeficienii pe lng variabilele
care nu fac parte din prima ecuaie. Determinantul acestei matrice este egal cu zero, detA=0.
Ecuaii
Variabile
2
3
x3
x4
a23
a24
0
0
n a doua ecuaie avem: H = 2 ( y1 , y2 ) i D = 1 ( x1 lipsete), regula de calcul confirm
faptul, c ecuaia este posibil de identificat ( D + 1 = H ). Este ndeplinit i condiia suficient
pentru a fi identificat ecuaia n cauz. Coeficienii de pe lng variabilele, care nu fac parte din
a doua ecuaie formeaz urmtoarea matrice:
Ecuaii
Variabile
y3
x1
2
b13
a11
3
-1
a 31
n conformitate cu acest tabel, det A 0 , rangul matricei este egal cu 2, ceea ce corespunde
urmtorului criteriu: rangul matricei formate din coeficieni trebuie s fie nu mai mic dect
numrul variabilelor endogene fr una, deci a doua ecuaie poate fi exact identificat.
A treia ecuaie din sistem conine 2 variabile endogene i dou variabile exogene, care nu
aparin ecuaiei i H = 3 D = 2 , deci n conformitate cu condiia necesar aceast ecuaie este
exact identificat ( D + 1 = H ). O concluzie contrar obinem verificnd condiia suficient de
identificare. S alctuim tabelul coeficienilor de pe lng variabilele, care nu aparin acestei
ecuaii, din care conchidem c det A = 0 :
Ecuaii
Variabile
x3
x4
2
0
0
3
a24
a23
Din tabel observm c se violeaz condiia suficient de identificare, prin urmare ecuaia nu
poate fi identificat. i atunci modelul structural examinat nu poate fi identificat n ansamblu,
deoarece, dat fiind satisfcut condiia necesar, este violat condiia suficient.
Deseori n modelele econometrice odat cu ecuaiile, parametrii crora necesit a fi estimai
statistic, se folosesc identiti de balan cu participarea variabilelor din model, coeficienii de
pe lng aceste variabile sunt egali cu 1 . Pentru acest caz, nectnd la faptul c nsui
identitile nu necesit verificare n privina identitii, n verificarea ecuaiilor structurale din
sistem aceste identiti particip.
De exemplu, s parcurgem la examinarea modelului econometric ce descrie economia unei
ri:
y1 = A01 +b13 y3 + b14 y4 + 1
y = A + b y + a x + ,
2
02
23 3
21 1
2
,
y3 = A03 + b34 y4 + a31 x1 + 3
y4 = y1 + y2 + x2
unde y1 sunt cheltuielile de consum final pentru anul curent; y2 sunt investiiile brute n anul
curent; y3 sunt cheltuielile pentru salarizare n anul curent; y4 este venitul brut pentru anul
curent; x1 este venitul brut pentru anul precedent; x2 sunt cheltuielile guvernamentale n anul
curent; A0i este termenii liber din ecuaia i ; i este eroarea stocastic din ecuaia i . Din acest
model fac parte patru variabile endogene ( y1 , y2 , y3 , y4 ), de menionat c una dintre ele, y4
este definit cu ajutorul unei identiti. i atunci, soluia statistic este necesar numai pentru
71
primele trei ecuaii ai modelului, care este necesar de verificat n vederea identificrii. Modelul
conine dou variabile predeterminate, una dintre care x2 este exogen iar alta este ntrziat x1 .
La soluionarea practic a problemei n baza informaiei statistice pentru un ir de ani sau n
baza unei totaliti de regiuni pentru un singur an n ecuaiile pentru variabilele endogene y1 ,
y2 , y3 , de regul, particip termenul liber A0i , i = 1,3 , valoarea cruia cumuleaz impactul
factorilor care nu au fost inclui n model i nu are nici o influen asupra problemei de
identificare a modelului.
Deoarece datele reale referitor la variabilele endogene y1 , y2 , y3 pot s difere de la acele
teoretice, postulate n model, este oportun ca n model s se introduc componenta aleatoare
pentru fiecare ecuaie din model, cu excepia identitilor. Componenta aleatoare (devierile),
notate ca i nu influeneaz soluionarea problemei de identificare a modelului.
n modelul econometric examinat prima ecuaie din sistem poate fi identificat deoarece
pentru ea H = 3 , D = 2 i are loc condiia necesar de identificare ( D + 1 = H ). Plus la aceasta,
este veridic i condiia suficient de identificare, n aa fel c rangul matricei respective este
egal cu 3 , iar determinantul ei nu este egal cu zero det A 0 .
Ecuaii
y2
x1
x2
2
-1
0
a21
0
3
0
a31
4
1
0
1
La fel i a doua ecuaie din sistem este exact identificat deoarece are loc: H = 2 D = 1 , deci
se realizeaz regula de calcul ( D + 1 = H ), n acelai timp are loc i condiia suficient de
identificare, i anume: rangul matricei examinate este egal cu 3 , dr determinantul ei nu este
egal cu zero: det A = b34 :
Ecuaii
y1
y4
x2
0
1
-1
b14
3
0
0
b34
4
1
-1
1
n mod analogic se identific i a treia ecuaie din sistem deoarece H = 2 D = 1 , deci se
ndeplinete regula de calcul ( D + 1 = H ), n acelai timp se ndeplinete i condiia suficient de
identificare, care constat c rangul matricei este egal cu 3 , ir determinantul ei nu este egal cu
zero: det A = 1 .
Ecuaii
y1
y2
x2
Ecuaii
1
2
4
-1
0
1
0
-1
1
0
0
1
Identificarea ecuaiilor este un procedeu suficient de complicat i nu poate fi limitat la

examinarea situaiilor expuse anterior. Coeficienii structurali ai modelului pot fi supui unor
restricii adiionale, de exemplu pentru funcia de producere poate fi lansat ipoteza, c suma
elasticitilor s fie egal cu zero. Pot fi aplicate restricii asupra dispersiilor i covariaiilor
valorilor reziduale.
Coeficienii modelului structural pot fi estimai aplicnd diferite metode n dependen de
tipul sistemului de ecuaii simultane. Cele mai uzuale i mai bine cunoscute din literatura de
specialitate sunt urmtoarele metode de estimare a coeficienilor structurali din model:
metoda celor mai mici ptrete indirect;
metoda celor mai mici ptrate n dou trepte;
metoda celor mai mici ptrate n trei trepte;
72
metoda de maxim veridicitate cu informaie complet;

metoda de maxim veridicitate cu informaie incomplet.
Metoda celor mai mici ptrate indirect M.C.M.M.P.I. se aplic pentru sistemul simultan de
ecuaii, care poate fi identificat, iar metoda celor mai mici ptrate n dou trepte
M.C.M.M.P.D.T. se folosete pentru estimarea coeficienilor modelului supraidentificat.
Metodele rmase de estimare se utilizeaz i la estimarea sistemelor de ecuaii simultane
supraidentificate.
Metoda de maxim veridicitate se consider ceea mai generalizat metod de estimare,
rezultatele obinute cu ajutorul ei, dat fiind factorii distribuii normal, coincid cu acelea obinute
prin intermediul M.C.M.M.P. ns, n cazul cnd numrul ecuaiilor din sistem este foarte mare,
aceast metoda conduce la procedee de calcul foarte sofisticate. Deaceea n calitate de
alternativ se utilizeaz metoda de maxim veridicitate cu informaie incomplet (metoda celui
mai mic raport dispersional).
Spre deosebira de metoda de maxim veridicitate cu informaie complet n aceast
modificaie sunt scoase restriciile asupra parametrilor, care se refer la funcionarea sistemului
n ntregime. Ceea ce conduce la o soluie mai simpl, ns volumul de calcul rmne suficient
de nalt. Nectnd la popularitatea sporit a acestei metode n mijlocul anilor 60, ea a fost
practic nlocuit cu metoda celor mai mici ptrate n dou trepte M.C.M.M.P.D.T. fiind mult
mai simpl.
Metoda celor mai mici ptrate n trei trepte M.C.M.M.P.T.T. este o extensiune a
M.C.M.M.P.D.T. Aceast metod de estimare poate fi aplicat pentru toate tipurile de ecuaii
ale modelului structural. ns, n cazul cnd exist restricii asupra parametrilor, mai eficient se
adeverete M.C.M.M.P.D.T.
73
REFERINE
1. . ., . . :
. , , 1998.
2. . . , , 1980.
3. . -
. . . , , 2001, 343 .
4. dr. Nicos Economou. An Estimation of the Potential Output and the Output Gap of the
Moldovan Economy.Chisinau, MER, TACIS. Moldovan Economic Trends, 2002, q.4.,
pp.85-93.
5. . . , , 1976.
6. .
, . . , - ,
. . , , . . .
, , 2005, 353 .
7. dr. Apostolos Papaphilippou. An Econometric Estimation of the Import Demand in
Moldova. Chisinau, MER, TACIS. Moldovan Economic Trends, 2001, q.3., pp.93-99.
8. Ion Prachi, Alexandru Brail, Natalia icanu. Econometrie Aplicat. A.S.E.M.,
Chiinu, 1999, 172 p.
9. Pecican E., Econometrie. Editura All, Bucureti, 1994.
10. Schatteles T. Metode econometrice moderne, Universitas, Chiinu, 1992.
11. A. H. Studenmund. Using Econometrics (second edition). Washington. HarperCollins
Publishers Inc. 1992, 662 p.
12. . . , , 1978.
13. . . . , ,
1977.
14. Zaman C. Econometrie, Bucureti, 1998.
74
ANEXE
LUCRAREA DE LABORATOR Nr. 1
EVALUAREA ECONOMETRIC A FUNCIEI CERERII PENTRU IMPORT
Etapa I. Regresia static
S se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat sub
forma logaritmic complet:
lnMt = 0 + 1lnYt+ 2lnPt, unde
(1),
Mt importurile reale trimestriale, exprimate n $ SUA,
Yt produsul intern brut trimestrial, exprimat n $ SUA,
Pt preul relativ trimestrial, care este raportul dintre indicele preului mondial pentru import i
indicele preului de consum Pt=et*Pt*M/IPCt.
Pt*M indicele preului mondial pentru import, date trimestriale;
et - rata de schimb normat la valoarea primului trimestru 1996;
IPCt indicele preului de consum, date trimestriale.
S fie:
a) consultat teoria cu privire la prezentarea analitic a cererii pentru import;
b) specificat modelul;
c) examinate semnele fiecrui coeficient a modelului specificat;
d) selectate datele necesare pentru efectuarea analizei regresionale;
e) folosit metoda celor mai mici ptrate la estimarea i evaluarea formei funcionale propuse
(statisticele Stiudent, coeficienii de determinaie, statistica Fier);
f) documentate rezultatele.
S se introduc variabila binar Dummyt ce va lua n consideraie consecinele crizei
financiare din Russia, anul 1998, care ia forma:
Dummyt = 1 IIItr. 1998, IVtr. 1998, Itr. 1999, IItr. 1999 ,
0 pentru trimestrele rmase.
n continuare s fie examinat n calitate de funcie cererii pentru importa forma
semilogaritmic ce urmeaz:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Dummyt
(2),
S fie executate punctele a)-f) de mai sus.
Etapa II. Regresia dinamic
S se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat sub forma
semilogaritmic cu ntrziere n timp:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Mt-1
(3),
S fie executate punctele a)-f) de mai sus.
i, n final, s se estimeze coeficienii de regresie pentru funcia cererii la import, prezentat
sub forma semilogaritmic cu ntrziere n timp i cu variabila binar Dummyt:
lnMt = 0 + 1lnYt+ 2lnPt+ 3Mt-1 + 3Dummyt
(4).
Trimestrul I al anului 1996 va fi trimestru de baz. n baza ratei de schimb se vor recalcula
datele pentru Produsul Intern Brut real. La calcularea Indicelui Preului de Consum se vor folosi
datele pentru inflaia trimestrial. Valorile indicatorilor reali se calculeaz n baza IPC.
Mt$real=Mt$nom./IPC; Yt$real=Yt$nom./IPC. IPCt=k=tr.bnIPCk*(1+infl.k+1/100).
Datele pot fi selectate de pe www.statistica.md .
75

ESTIMAREA POTENIALULUI ECONOPMIC AL MOLDOVEI
Etapa I. Aplicarea filtrului Hodric-Prescot
S se estimeze trendul care reprezint PIB real potenial n baza filtrului Hodrick-Prescott
(HP). Aceasta se obine prin determinarea trendului ce corespunde PIB real potenial care
minimizeaz simultan media ponderat dintre trendul estimat i valorile PIB real observat n
orice moment de timp i rata schimbrii dintre trendul estimat n orice moment de timp. Aceasta
se obine prin minimizarea funciei obiectiv ce urmeaz:
2
2
(1),
(ln Yt ln Yt* ) + [(ln Yt*+1 ln Yt* ) (ln Yt* ln *t 1 )]
unde ln Yt i ln Yt* sunt logaritmele PIB real i trendului estimat respectiv.
(ln Y
ln Yt* ) este suma ptratelor devierilor dintre actualul PIB 2
ln Yt
i trendul
corespunztor ln Yt* . [(ln Yt *+1 ln Yt * ) (ln Yt* ln *t 1 )] reprezint funcia de penalitate care
penalizeaz ptratul devieilor de la rata de cretere a componentelor trendului; factorul ce
prezint ponderea i care controleaz ct de neted este linia trendului obinut.
2
Utiliznd programul Eviews s se estimeze trendul PIB-ului potenial pentru =10;30;100.

Yt produsul intern brut anual, exprimat n MDL pentru anii 1995-2002. Datele le gsii pe situl :
http://www.statistica.md.
Rezultatele s fie prezentate att grafic ct si prin tabele.

Etapa II. Abordarea problemei prin utilizarea funciei de producere
S se estimeze coeficienii de regresie pentru funcia de producie de tip Cobb-Gouglas cu
rentabilitatea la scar constant i factorii de producere munca N t i capitalul K t utilizai:
1. Yt = K 1 N sub forma logaritmic ln Yt = 1 ln K t + 2 ln N t
2. S se estimeze funcia de producere sub forma logaritmic complet pentru valorile PIBtreal
efectiv i PIBtreal potenial.
3. Toi indicatorii ce fac parte din calcule s fie calculai n termeni reali.
4. n baza funciilor de producere estimate s se efectueze pronosticul pentru anii 2005-2010,
dat fiind rata creterii capitalului utilizat de 5%,10%,15%,20% i 25% anual respectiv; iar
rata creterii muncii de 10% anual.
5. Rezultatele s fie prezentate att sub form de tabele ct i sub form grafic.
Tab.1 Date istorice cu privire la subiectul studiat
Anii
PIBtnominalefec
PIBtrealefect
Inflatiat
Defl.PIB1995
Ktnominal
Ktreal
Ltnominal
Ltreal
PIBtpotnom
PIBtpotreal
1995
6480
1996
7798
1997
8917
1998
9122
1999
12322
2000
16020
2001
19052
2002
22556
2003
27297
0,3
0,24
0,12
0,08
0,39
0,31
0,10
0,05
0,012
14450
16138
14743
24702
30926
33598
34325
35827
37782
2800
3623
4153
4689
5207
7108
9322
12729
18508
6574
7879
8026
11126
13150
15941
18336
21802
26824
76
LUCRAREA DE LABORATOR Nr. 3-4

EVALUAREA PRODUSULUI INTERN BRUT DIN PARTEA CERERII
Etapa I. Prezentarea funciei de consum sub forma funciei de PIB
S se estimeze consumul ca:
C t = cYt 1 + C 0
(1),
unde C t - consumul n anul t , Yt 1 - produsul intern brut n anul t 1 , C 0 - consumul iniial iar
2003
nclinaia la limit spre consum, c = ( C t / Yt ) / 9 .

1995
Produsul intern brut n anul t se calculeaz n conformitate cu formula:

Yt = C t + I t = cYt 1 + C 0 + I t
(2),
aici I t - investiiile brute n anul t , admitem c I t = I 0 , C 0 = const .
1. Utiliznd datele istorice pentru ultimii ani, estimai coeficientul - nclinaia la limit spre
consum.
2. Determinai valoarea I 0 ca valoarea investiiilor nominale n anul de baz.
Datele le putei gsi pe situl : http://www.statistica.md.
Etapa II. Calculai PIB n anul t
6. Estimai produsul intern brut n anul curent t folosind expresia:
l = t 1
Yt = Yt0 c t + A c l
l =t0
aici A = C 0 + I 0 sunt cheltuielile independente. Consumul iniial se determin ca C 0 = 0 ,

investiiile iniiale se presupun s fie egale cu: I 0 = I t , t 0 = 2003 - anul iniial, iar t k = 2008 ,
t k = 2012 .
7. Selectnd anul 2001 drept an de baz, recalculai Yt n preurile anului 2001, presupunnd
c, ncepnd cu anul 2005, inflaia va lua valori din tabelul ataat mai jos, iar n 2004 inflaia
primete valoare de 7,5% .
0
Tabelul1. Date istorice

Anii
1995
1996
1997
1998
1999
2000
2001
2002
2003
PIBtnomlefec
6480
7798
8917
9122
12322
16020
19052
22556
27297
0,3
0,24
0,12
0,08
0,39
0,31
0,10
0,05
0,12
Anii
2004
2005
2006
2007
2008
2009
2010
2011
2012
0,075
0,075
0,075
0,07
0,065
0,06
0,055
0,05
0,05
t
De.PIB2001
PIBtrealefec
De.PIB2001
PIBtnominefect
PIBtprevez
Etapa III. Evaluarea creterii economice n baza modelului Domar i Harrod-Domar

77
1. S se calculeze PIB pentru anii 2004-2012 n conformitate cu formula:

Yt = (1 + s ) t Yt
unde sporirea produciei pentru o unitate de investiii, iar s este norma acumulrilor,
s = 1 c , aici s este nclinaia la limit spre consum, Yt este produsul intern brut n anul t 0 .
0
Folosii valoarea de c , calculat anterior la calcularea s ; calculai = max( I t / Yt ) pentru anii

t
1995-2002.
2. S se calculeze PIB pentru anii 2004-2012 n conformitate cu formula:
Yt = (1 + g ) t Yt
0
s
. Aici v este determinat de principiul de
vs
accelerare, adic I t = v (Yt Yt 1 ) , Yt este produsul intern brut n anul t , iar Yt 1 este produsul
unde ritmul garantat de cretere este g =
intern brut n anul t 1 , s este norma acumulrilor, s = 1 c , aici c este nclinaia la limit spre
consum, Yt este produsul intern brut n anul t 0 .
0
Calculai v = max I t /(Yt Yt 1 ) pentru anii 1995-2002.

t
Etapa IV. Evaluarea salariului nominal i real n baza funciei de producere Cobb-
Douglas.
1. Dat fiind determinai coeficienii funciei de producere Yt = K 1 L n lucrarea precedent,
calculai salariul real ca wt = Yt / Lt = K 1 L 1 , iar salariul nominal wt nom = wt Defl.PIBt ,
Defl.PIBt calculai recent.
2. Pstrnd ritmul de cretere al forei de munc i ritmul de cretere al capitalului, indicat
anterior, ritmul de cretere al produsului intern brut prognoza, determinai salariul real i acel
nominal prognozate.
Tabelul 2. Date istorice
INDICATORII PRINCIPALI
MACROECONOMICI
Produsul intern brut (PIB)
mil.lei
Consumul final:
mil.lei
Formarea brut de capital:
mil.lei
Investiii n capital fix:
mil.lei
1995
1996
1997
1998
1999
2000
2001
2002
6480
7798
8917
9122
12322
16020
19052
22556
5371
7356
8681
9203
11090
16503
19263
23289
1612
1891
2123
2360
2820
3836
4436
4886
844,8
987,4
1202,2
1444,4
1591,8
1759,3
2315,1
2804,2
78

LICHIDAREA FENOMENULUI DE ETEROSCEDASTICITATE
Preul
Yi (lei)
Nr.
Volum
ul Xi
4,6
4,6
4,7
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
5,2
5,4
5,6
5,8
5,9
6,3
6,5
6,8
7,4
7,6
7,1
4,8
5
5,1
5,4
5,5
5,6
6,3
6,3
6,4
7,2
7,4
7,5
8,2
8,4
8,8
4
4
6
6
6
8
8
8
10
10
10
2
2
2
4
4
4
6
6
6
8
8
8
10
10
10
Yiestim.
ui
ui*ui
ln(ui*ui)
ln(Zi)
Yi/Xi
Total
Media
1. S se lanseze ecuaia de regresie. S se declare variabila X drept factor de proporionalitate.

S se aplice testul Park pentru a depista fenomenul de eteroscedasticitate.
2. S se calculeze ln((ui)2) i ln(Zi), dL i s se lanseze o nou regresie.
3. S se compare t-statistica variabilei Z calculat cu t(30-2;,0,05).
a) dac tcalc > ttabel(30-2;,0,05), termenul de eroare este eteroscedastic,
b) dac tcalc< ttabel(30-2;,0,05), termenul de eroare nu este eteroscedastic.
S se efectueze transformrile variabilelor *i=Yi/Xi; X*i=1/Xi.
4. S se estimeze ecuaia de regresie transformat. S se verifice semnificaia coeficientului de
determinaie, coeficientului de corelaie, t-statisticile, F-statistica.

Y = bo + b1*X

Y* = Y/X = bo* 1/X + b1
Y = bo + b1*X
79

LICHIDAREA FENOMENULUI DE AUTOCORELARE N SERIE
Consumul
Yt
84,4
Venitul
Xt
88,0
91,9
94,0
99,2
100,0
104,0
106,0
109,0
110,0
117,8
119,0
7
8
9
10
11
12
13
14
15
16
17
18
Total
Media
122,9
130,0
138,7
149,1
158,0
167,5
177,8
186,6
195,7
208,6
221,5
232,1
127,0
135,0
143,0
155,0
167,0
177,0
186,0
197,0
211,0
228,0
239,0
252,0
Anul
DW*2
dU
1,39
Ytestim
ut
ut*ut
ut-ut-1
ut*ut-1
ut-1*ut-1
Y*t
X*t
Y*testim
u*t
(u*t)
u*t-u*t-1
dL
1,16
Yt-ro*Yt-1=b0+b1*(Xt-ro*Xt-1)
Yt=b0+b1*Xt+ro*Yt-1-b1*ro*Xt-1
1. S se lanseze ecuaia de regresie. S se calculeze statistica DW =Sum(ut-ut1)^2/Sum(ut)^2. S se atrag atenia c suma cu termenul ntrziat conine cu un termen
mai puin.
2. S se afle valorile tabelare pentru dU = DW(N;k;0,05) dL = DW(N;k;0,05), (N este
numrul de observaii, k este numrul variabilelor independente) i s se compare cu
statistica DW calculat.
) n caz cnd DW < dU, termenul rezidual este autocorelat,
S se calculeze ro=Sum(ut*ut-1)/Sum((ut-1))2,
S se efectueze transformarea variabilelor conform formulelor *1=(1-ro)1/2*1; *t=YtYt-1*ro;
X*1=(1-ro)1/2*X1; X*t=Xt-Xt-1*ro.
3. S se estimeze ecuaia de regresie transformat.
4. S se recalculeze statistica DW =Sum(ut-ut-1)^2/Sum(ut)^2. S se execute etapa 2.
b) n caz cnd DW < dU, termenul rezidual nu este autocorelat.
80

LICHIDAREA FENOMENULUI DE MULTICOLINEARITATE
Nr.
X2
X1
X3
X4
74,3
1,0
29,0
15,0
52,0
2
3
4
72,5
83,8
93,1
1,0
1,0
2,0
31,0
40,0
54,0
22,0
23,0
18,0
44,0
34,0
22,0
5
6
102,7
78,5
3,0
7,0
71,0
26,0
17,0
6,0
6,0
60,0
95,9
7,0
52,0
6,0
33,0
109,4
10,0
68,0
8,0
12,0
104,3
11,0
56,0
8,0
20,0
10
11
12
87,6
109,2
113,3
11,0
11,0
11,0
31,0
55,0
66,0
8,0
9,0
9,0
47,0
22,0
12,0
13
115,9
21,0
47,0
4,0
26,0
SumXi
1. S
se ncredineze c ecuaia de regresie este supus fenomenului de multicolinearitate. S se

calculeze suma celor patru variabile pentru fiecare observaie.
2. S se lanseze ecuaia de regresie. S se calculeze t- statisticile bi=bi/sigma(BI).
3. S se determine valoarea minim Fi, egal cu FL=min(Fi), i s se comparen cu valoarea
tabelar
F(1;n-m1;alfa) unde: n este numrul observaiilor, m este numrul variabilelor independente alfa
este nivelul de semnificaie de 0,05).
4.S se calculeze valoarea criterului particular Fi=(tbi)2. Sunt posibile variante:
a) FL < F0, variabila independent se exclude din ecuaie. S se treac la etap 5.
b) FL > F0, n acest caz modelul obinut este acel corect.
5. S se estimeze ecuaia de regresie n funcie de variabilele independente pstrate.S se
ndeplineasc etapele 1-4.
74,3
1,0
29,0
Y = bo + b1*X1 + b2*X2 + b3*X3 - b4*X4

52,0 sigma(bi)
72,5
83,8
93,1
1,0
1,0
2,0
31,0
40,0
54,0
44,0
34,0
22,0
102,7
78,5
3,0
7,0
71,0
26,0
6,0
60,0
95,9
109,4
7,0
10,0
52,0
68,0
33,0
12,0
104,3
11,0
56,0
Y = bo + b1*X1 + b2*X2 -b3*X4

20,0 sigma(bi^)
87,6
109,2
113,3
11,0
11,0
11,0
31,0
55,0
66,0
47,0
22,0
12,0
115,9
21,0
47,0
26,0
X1
X2
X4
tbi
Fi
FL
tbi
Fi
FL
i=
i=
Fi
Fi
<
Fitabel
5,32
<
Fitabel
5,12
<
Fitabel
Y = b0 + b1*X1 + b2*X2
sigma(bi^)
tbi
Fi
Fi
4,96
FL
81

Econometrie Abordări

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Econometrie Abordări

Încărcat de

Drepturi de autor:

Formate disponibile

E C O N O M E T R I E (Abordri speciale)

1. Analiza regresional. Generaliti

Variabile dependente, variabile independente, justificare

1.6. Termenul erorii stocastice. Eroarea de specificaie

Yi - observaia i a variabilei dependente;

0 , m - parametrii regresiei, (m=1,2,....k);

1.8. Ecuaia regresiei evaluat

n expresia Yi = 0 + 1 X i : pentru fiecare set de observaii se vor calcula diferite seturi de

2. Metoda celor mai mici ptrate

Condiiile de ordinul nti (condiii necesare) se nscriu ca:

De unde rezult sistema de ecuaii normale:

mprind (1) la n i rezolvnd n raport cu 0 , obinem 0 = Y 1 X

substituind aceast exspresie n (2) l putem afla pe 1 ,

, vom mpri numitorul i

Aadar, am obinut parametrii 0 , 1 , care sunt estimatorii pentru 0 , 1 . Condiia suficient

3. Metoda celor mai mici ptrate, exemplu realizat

Vom nscrie sistemul de ecuaii normale:

; 0 = 5,79; 1 = 36,84; Y = 5,79 + 36,84 X .

X = 3,14; X = 1,25;V X = 39,8%; Y = 110; Y = 46,29;VY = 42,1%.V X = X ;VY = Y .

de la sensul acestui coeficient: schimbarea variabilei dependente Y = Yn Y1 se confrunt cu

sunt necesare (n 1) devieri independente, deoarece din

totalitatea de n uniti dup calcularea mediei variaz independent numai (n 1) de devieri.

Y ) =0, independendent variaz numai 4

Pentru calcularea sumei ptratelor devierilor explicate de regresie

fi confirmat,dac apelm la formula coeficientului liniar de corelaie

de regresie obinem Yi = Y 1 X + 1 X i = Y 1 (X i X ).Deci, rezult ca fiind date n

Determinarea dispersiilor racordate la grad de libertate ofer posibilitatea de a efectua

F fact = 278 f Fnfd = 6.61 ;

F fact = 278 f Fnfd = 16.26 .

Estimarea semnificaiei ecuaiei de regresie, de regul, se prezint sub forma tabelului

Valoarea erorii standard n comun cu t distribuia Student la (n 2) grade de libertate se

compar cu valoarea tabelar pentru riscul erorii ( ) (nivelul de semnificaie) i (n 2) grade de

Intervalul de ncredere pentru coeficientul de regresie se determin ca 1 ttab ) , este egal

cu valoarea coeficientului estimativ valoarea coeficientului Student table nmulit cu ) .

ntruct coeficientul de regresie n investigaiile econometrice are o explicaie economic

Evaluarea semnificaiei se efectueaz la fel ca i pentru 1 , t ) = ) 1 , valoarea t-criteriului

calculat se compar cu valoarea tabelar la (n 2) grade de libertate i nivelul de semnificaie

Valoarea efectiv a t-criteriului student se determin ca: t R =

formul ne mrturisete, c n regresia liniar fa de variabile t R2 = F , deoarece s-a notat ca

Deci verificarea ipotezei semnificaiei a coeficienilor de regresie i de determinaie

este limitat de valorile 1 i +1. Fisher a introdus o variabil z = ln(

n calcule previzionale conform ecuaiei de regresie se determin valoarea Y p sub form de

previziune punctifer Yi pentru X p = X k , substituind n ecuaia de regresie Yk = 0 + 1 X k

Din teoria selectrii este cunoscut faptul c Y =

rezidual pentru un grad de libertate S 2 , obinem: Y2 =

de regresie este determinat prin formula 2) =

, folosind n calitate de 2 dispersia

prognozat X p = X k , atunci n conformitate cu ecuaia de regresie obinem urmtoarea formul

pentru eroarea standard a valorii Y X prognozat:

. Formula considerat a erorii standard pentru

ndeprtarea punctului X k de la X n orice direcie. Cu alte cuvinte, cu ct este mai mare

Pentru valoarea prognozat a lui YX , intervalele de ncredere de 95% pentru X k dat se

definesc prin expresia: YX t) Y) . Pe grafic frontierile de ncredere pentru Y reprezint dou

tcalcY( X ) f ttab (0,05; n 2 ) .

5. Modelul de regresie liniar multifactorial

lui nu nu pot fi trase concluzii. Fie c:

soluionarea problemelor cererii, venitului pe aciuni, la studierea cheltuielilor de producere, n

6. Absena coliniaritii ntre variabilele explicative implic o matrice (X T X ) regular i

7. Matricea (X T X ) / n este o matrice finit ne singular.

8. Relaia n f k , n 6(7) k necesit ca numrul de observaii s fie superior numrului

5.3. Estimarea parametrilor modelului i proprietile lor

4. Estimatorul este normal distribuii N ( ,VAR( )) .

Eroarea standard a ) ) sau SE ( k )