Sunteți pe pagina 1din 247

Constantin ANGHELACHE

Constantin MITRU
(coordonatori)
Constantin Silviu ANGHELACHE Cristina Andreea MITRU
Ctlin DEATCU

Mdlina DUMBRAV

Alexandru MANOLE

Econometrie. Teorie i studii


de caz

Redactor: Prof. univ. dr. Constantin ANGHELACHE


Coperta: Marian TONCIU

Revizie text: Prof. univ. dr. Constantin ANGHELACHE


Tehnoredactare: Lector univ. drd. Alexandru MANOLE

Descrierea CIP a Bibliotecii Naionale a Romniei


ELEMENTE DE ECONOMETRIE: NOTE DE CURS: PENTRU UZ
INTERN
Constantin Anghelache, Constantin Mitru, Cristina
Andreea Mitru, Bucureti: Editura Artifex 2006
Bibliogr.
ISBN (10) 973-7631-16-1
ISBN (13) 978-973-7631-16-9
I.
Anghelache, Constantin
II.
Mitru, Constantin
III.
Mitru, Cristina Andreea
330.43(075.8)

Constantin ANGHELACHE

Constantin MITRU

Constantin Silviu ANGHELACHE Cristina Andreea MITRU

Alexandru MANOLE

Elemente de econometrie
- note de curs -

pentru uz intern
EDITURA ARTIFEX
BUCURETI 2006

ISBN (10) 973-7631-16-1;


ISBN (13) 978-973-7631-16-9
Copyright Editura ARTIFEX, 2006

Autorii poart ntreaga rspundere, fa de editur i


tere persoane, pentru coninutul lucrrii

EDITURA ARTIFEX
Calea Plevnei nr. 47-48
Sector 1
Bucureti

Cuprins
Cuvnt nainte ......8
Capitolul 1
Noiuni introductive..................................................................9
1.1. Aspecte generale.............................................................9
1.2. Concepte utilizate n econometrie.................................13
Capitolul 2
Inferena statistic..................................................................17
2.1. Concepte de baz privind inferena statistic.................17
2.2. Distribuia mediilor de eantion....................................19
2.3. Estimarea mediei unei populaii....................................21
2.3.1. Estimri punctuale..................................................21
2.3.2. Intervale de ncredere.............................................25
2.4. Verificarea ipotezelor referitoare la media
populaiei..............................................................................29
2.4.1. Teste bilaterale........................................................35
2.4.2. Tipuri de eroare......................................................37
2.5. Alte cteva teste statistice importante i
distribuiile lor......................................................................42
2.5.1. Gradul de libertate..................................................43
2.5.2. Distribuia 2..........................................................44
2.5.3. Distribuia t.............................................................48
Capitolul 3
Regresia liniar simpl...........................................................51
3.1. Domenii de aplicare.......................................................51
3.2. Modele liniare de regresie rezultate din
transformri de modele neliniare..........................................57
3.3. Prezentarea modelului liniar de regresie........................58
3.4. Estimarea (determinarea) parametrilor
modelului liniar....................................................................63
3.4.1. Utilizarea metodei celor mai mici ptrate n
estimarea parametrilor......................................................63
3.4.2. Utilizarea metodei verosimilitii maxime n
estimarea parametrilor......................................................68
3.5. Proprietile dreptei de regresie.....................................71
3.6. Coeficientul liniar de corelaie.......................................81

3.7. Analiza i interpretarea variabilei reziduale...................88


Capitolul 4
Estimatori si metode de estimare...........................................92
4.1. Estimatori pentru eantioane mici..................................93
4.1.1. Estimator nedeplasat...............................................93
4.1.2. Eficiena..................................................................95
4.1.3. Estimatorul BLUE liniar nedeplasat i eficient.....98
4.1.4. Eroarea medie ptratic..........................................99
4.2. Metode de estimare......................................................101
4.2.1. Metoda momentelor..............................................101
4.2.2. Metoda celor mai mici ptrate..............................103
4.2.3. Estimarea probabilitii maxime...........................104
4.2.4. Cazul general........................................................107
4.2.5. Exemplu cu o variabil discontinu......................108
4.2.6. Exemplu cu o variabil continu...........................111
4.2.7. Exemplu cu doi parametri.....................................113
Capitolul 5
Unele precizri privind modelul clasic al regresiei
cu dou variabile...................................................................116
5.1. Ipotezele modelului clasic al regresiei de
dou variabile.....................................................................116
5.1.1. Ipoteze cu privire la variabila explicativ.............117
5.1.2. Ipoteze cu privire la factor rezidual......................119
5.2. Proprietile estimatorilor OLS....................................122
5.2.1. Liniaritatea............................................................123
5.2.2. Nedeplasarea........................................................124
5.2.3. Compatibilitatea...................................................125
5.2.4. Cea mai bun nedeplasare liniar.........................127
5.2.5. Eficiena (eficiena asimptotic)..........................128
5.2.6. Normalitatea.........................................................129
5.2.7. Estimarea probabilitii maxime...........................130
5.3. Unele aspecte privind regresia neliniar.....................131
Capitolul 6
Inferena statistic n regresia simpl.................................134
6.1. Aspecte privind testarea semnificaiei modelului
de regresie...........................................................................134

6.2. Compararea modelelor de regresie..............................141


6.3. Verificarea normalitii reziduului...............................143
6.4. Predicia prin modelul de regresie...............................145
6.5. Metoda lui W.F. Sharpe (alegerea portofoliului)..........150
6.6. Metoda regresiei globale..............................................153
Capitolul 7
Modelul clasic al regresiei multiple....................................158
7.1. Metoda celor mai mici ptrate (OLS) n
regresia multipl.................................................................159
7.1.1. Determinaia n regresia multipl.........................170
7.1.2. Utilizarea criteriului Akaike.................................173
7.2. Ipotezele clasice n regresia multipl...........................175
7.2.1. Ipoteze cu privire la variabilele factoriale............175
7.2.2. Ipoteze referitoare la variabila rezdual................178
7.3. Proprietile estimatorilor OLS....................................179
7.3.1. Liniaritatea............................................................180
7.3.2. Nedeplasarea........................................................180
7.3.3. Compatibilitatea...................................................182
7.3.4. Cel mai bun estimator liniar nedeplasat................182
7.3.5. Alte proprieti......................................................186
7.4. Inferena n regresia multipl.......................................189
Capitolul 8
Regresia neliniar.................................................................192
8.1. Aspecte generale..........................................................192
8.2. Modele liniarizabile prin logaritmare..........................192
8.3. Aspecte privind modelul hiperbolic.............................197
8.4. Unele aspecte privind modelul parabolic.....................198
8.5. Elemente privind funciile de tip polinominal.............200
8.6. Despre modelul multiplicativ......................................204
Capitolul 9
Autocorelarea i heteroscedasticitatea................................213
9.1. Unele aspecte privind autocorelarea erorilor...............213
9.2. Aspecte eseniale privind heteroscedasticitatea...........221
Bibliografie.233

Cuvnt nainte
Lucrarea Elemente de econometrie se adreseaz
studenilor din anul II, toate specializrile, de la
Universitatea ARTIFEX Bucureti, fiind scris n
conformitate cu programa analitic a cursului de
Econometrie. La realizaera acestui curs s-au utilizat, cu
adaptarea necesar, o serie de materiale scrise de autori
romni i/sau strini n acest domeniu.
n principal, s-au preluat o serie de aspecte din
lucrarea Modern Econometrics an introduction, a
autorului englez Thomas R.L., aprut n Editura Financial
Times Prentice Hall, ISBN 0-201-87694-9, n anul 1997
Lucrrile i alte materiale care au stat la baza
acestor note de curs sunt menionate n bibliografia selectiv
prezentat la sfritul crii. Materialul publicat este de uz
intern, destinat, n exclusivitate studiului studenilor de la
Universitatea ARTIFEX Bucureti
Pentru nsuirea temeinic a cunotinelor de
specialitate se recomand studenilor s parcurg i
culegerea de probleme Econometrie - studii de caz,
aprut n Editura Artifex, precum i principalele lucrri
cuprinse n bibliografie.
Autorii

Capitolul 1
Noiuni introductive
1.1. Aspecte generale
Econometria a fost definit ca fiind aplicarea
statisticii matematice la datele economice n scopul
constituirii unui suport practic pentru modelele construite
prin matematici economice i al obinerii unor estimri
numerice (Samuelson et al., 1954, pg. 141-6). Prin prisma
unei abordri mai succinte (Johnston, 1984, p 5), rezult c
principala sarcin a econometriei const n a introduce
substan practic n structurile teoretice.
Teoria economic previzioneaz diferite corelaii ntre
variabile. De exemplu, o curb a cererii, o funcie de
producie, o funcie de consum.
De regul, un specialist n econometrie
este preocupat de urmtoarele aspecte:
(a)
msurarea unor corelaii i estimarea
parametrilor pe care acestea le implic;
(b)
verificarea ideilor teoretice reprezentate
de astfel de corelaii;
(c)
utilizarea
acestor
corelaii
pentru
previziuni sau prognoze cantitative.

Capitolul 1 Noiuni introductive

11

Econometria presupune utilizarea concomitent a


elementelor de matematic economic, statistic economic
i inferen statistic. Matematicile economice exprim
teoriile i ideile tiinelor economice n model matematic.
Aceste forme matematice sunt calitative i nu cantitative
respectiv, nu preiau ecuaiile din matematicile economice
pentru ca, prin confruntarea acestora cu datele economice, s
ncerce s utilizeze tehnicile inferenei statistice pentru a
conferi acestor ecuaii o form cantitativ.
Teoria monetar presupune c, n cadrul unei
economii, cererea agregat pentru bani poate depinde de o
variabil de scal, cum ar fi venitul naional sau avuia
naional precum i de variabila reprezentat de rata dobnzii,
reprezentnd costul oportunitii deinerii de bani. Aceasta se
exprim sub forma:
M = f(Y,r)

(1.1.)

unde M, cerea pentru bani i Y, variabila de scal, sunt


definite n termeni reali iar r reprezint rata dobnzii.
Corelaia ntre valorile M i Y este independent de
nivelul general de pre. O cretere la nivelul variabilei de
scal ar trebui s conduc la o cretere a cererii de bani n
timp ce o cretere a ratei dobnzii ar trebui s conduc la o
scdere a valorii M.
n al doilea rnd, teoria nu ne spune nimic despre
forma precis a funciei definit prin ecuaiei (1.1.). Este
puin probabil ca forma funciei definit prin ecuaiei (1.1.)
s fie de o form linear simpl, respectiv:
M = +Y + r,

> 0,

<0

(1.2)

12

Elemente de econometrie

n schimb, ar putea s fie de o form convenabil a


elasticitii:
M = AY r ,
> 0, < 0
(1.3)
Exist multe alte forme de funcii nonlineare care sunt
n egal msur compatibile cu situaiile economice.
Teoria ne pune la dispoziie informaii calitative cu
privire la modul n care Y i r influeneaz cererea de bani.
De exemplu, s presupunem c se nregistreaz o cretere de
5% a variabilei de scal Y. Teoria sugereaz c aceasta va
conduce la o cretere a cererii de bani fr a ne spune ns
care va fi aceast cretere. Deci, nu ne ofer nici o informaie
cantitativ. Informaiile cantitative cu privire la elasticitile
i , din (1.3) sunt importante pentru stabilirea politicii de
urmat.
n teorie ne referim, n general, la ceea ce economitii
denumesc perspectiva pe termen lung. Aceasta nseamn c
nregistrm o poziie de echilibru. De exemplu, n condiii de
echilibru, cererea i oferta de bani pot fi considerate ca fiind
egale. ntr-un astfel de context, utilizarea seriilor de date
referitoare la oferta de bani pentru a reprezenta cererea de
bani ar putea fi considerat a fi justificat. Totui, piaa
monetar este foarte rar n echilibru. Dar, n condiii de
dezechilibru, mai este justificat utilizarea datelor observate
referitoare la oferta de bani pentru a reprezenta cererea de
bani n ecuaii cum sunt cele definite prin (1.1), (1.2) i (1.3) .
Datele economice se refer mai degrab la procesul de
ajustare dect la poziiile succesive de echilibru.
ntr-o oarecare msur, econometria ncearc s ofere
rspunsuri la ntrebrile de mai sus, lsate de teoria
economic fr rspuns. n particular, econometria ncearc
s stabileasc estimrile numerice ale parametrilor din astfel

Capitolul 1 Noiuni introductive

13

de ecuaii, cum ar fi (1.2.) i (1.3.), viznd s testeze unele


dintre ipotezele formulate de teorie. De exemplu, am vzut
mai sus c teoria monetarist implic faptul c funciile
cererii de bani, ca cea redat prin ecuaia (1.1.), sunt
independente fa de nivelul preului general. Pentru a
verifica aceast ipotez teoretic, abordarea econometric va
consta n generalizarea ecuaiilor de genul (1.2.) i (1.3.)
pentru a permite manifestarea efectelor de pre. De exemplu,
(1.2.) ar putea fi transformat n relaia:
M = + Y +r + P,

(1.4.)

n care P reprezint nivelul general al preului. Dac


= 0, atunci nivelul de pre nu are nici un efect asupra cererii
de bani. Tehnicile statistice utilizate pentru a estima
parametrii i pot fi de asemenea utilizate pentru obinerea
unei estimri pentru . Dac acesta rezult a fi semnificativ
mai mare dect zero, atunci ipoteza teoretic este contrazis.
Pn n acest moment, modul n care am scris
ecuaiile sugereaz caracterul exact sau determinant al
corelaiilor economice. Totui, virtual, acest aspect nu se
ntlnete niciodat deoarece comportamentul agenilor
economici nu este pe deplin previzibil. Acesta este motivul
pentru care n econometrie se introduce o perturbare
(reziduu)aleatorie n ecuaiile (1.2.). n consecin, (1.2.)
devine:
M = + Y +r + ,

(1.5.)

n care reprezint termenul de perturbare, care ar


putea fi pozitiv sau negativ. Includerea lui n ecuaia (1.5.)
nseamn c aceleai niveluri date pentru Y i r nu vor

14

Elemente de econometrie

conduce ntotdeauna la aceeai valoare pentru cererea de


bani, M. Va exista o anumit variaie aleatorie, care depinde
de mrimea i semnul rezidualului.
Existena perturbrii evideniat de (1.5.) semnific
faptul c este dificil de msurat cu exactitate parametri cum
ar fi , i . Aceasta este i explicaia faptului c ne-am
referit anterior la utilizarea tehnicilor inferenei statistice
pentru a oferi estimri ale parametrilor.
1.2. Concepte utilizate n econometrie
Dup cum am vzut, econometria combin teoria
economic cu matematicile i inferena statistic. n ceea ce
privete matematica, se presupune existena unor cunotine
de algebr i calcul diferenial de baz.
nelegerea diferitelor concepte privind calculul
probabilitilor i inferena statistic este de dorit pentru orice
proces de studiere a econometriei care s merite efortul.
Mai familiare sunt regresia de dou variabile i cele
mai mici ptrate. De exemplu, s presupunem c am fi
interesai de corelaia dintre venitul la nivel de gospodrie, Y,
i cheltuielile respectivei gospodrii pentru bunuri de
consum, C. Vom lua n consideraie ipoteza unei funcii de
consum lineare, de forma:
C = +Y +

(1.6.)

n care i sunt parametri pe care vrem s i


estimm. De exemplu, reprezint nclinaia marginal
pentru consum iar este perturbare/variabila rezidual.
S presupunem c deinem datele referitoare la
veniturile i consumul unui numr de 10 gospodrii. Aceste

Capitolul 1 Noiuni introductive

15

date pot fi reprezentate prin 10 puncte ntr-un grafic de


corelaie, ca cel din Figura 1.1

Figura 1.1. Grafic de corelaie venituri consum


Coordonatele fiecrui punct se refer la veniturile i
consumul unei gospodrii. Analiza regresiei de dou variabile
presupune trasarea unei linii drepte ntr-un astfel de grafic de
corelaie. La rndul ei, aceast dreapt ofer valorile estimate
pentru parametrii i . Cea mai cunoscut metod de a
estima o astfel de dreapt este metoda celor mai mici ptrate,
prin care dreapta este astfel aleas nct s minimizeze suma
ptratelor distanelor verticale de la puncte la linie.
Econometria generalizeaz proceduri de genul celei
prezentate.

16

Elemente de econometrie

Ar trebui ca estimrile pentru parametrii i din


ecuaia (1.5.) s fie ct mai aproape de valorile reale. n acest
sens avem n vedere valoarea estimatorilor i varietatea
metodelor de estimare.
De regul, corelaiile economice presupun mai mult
dect cele dou variabile din ecuaia (1.6.). De exemplu,
ecuaiile referitoare la cererea de bani (1.1.), (1.2.) i (1.3.)
implic trei variabile.
S presupunem c ne-am confrunta cu problema
estimrii parametrilor unei corelaii ca cea exprimat prin
(1.2.). n acest caz, parametru variabilei de scal, , msoar
efectul asupra cererii de bani al creterii cu o unitate a
variabilei de scal
Y, n ipoteza c rata dobnzii, r, este
meninut constant. Ideal, pentru a estima valoarea , am
prefera s recurgem la un experiment de laborator n cadrul
cruia s meninem constant rata dobnzii, r, dar s facem
ca variabila de scal, Y, s varieze. ntr-o astfel de situaie,
trebuie s inem seama de corelaia:
M = ( + r) +Y

(1.7)

n care ( + r) este constant. Revenim la corelaiile


de dou variabile i am putea observa efectul asupra valorii
M, produs de o unitate ceteris paribus de modificare a valorii
Y. Prin trasarea unei diagrame de puncte de dispersie pentru
M n raport cu Y, obinem estimri pentru parametrul .
Pentru a obine o estimare a parametrului corespunztor, rata
dobnzii, y, ar fi necesar un al doilea experiment n cadrul
cruia am menine constanta variabila de scal Y, fcnd s
varieze rata dobnzii.
Abordarea de mai sus ar putea fi fezabil n tiinele
cu caracter tehnic. Din pcate, n cadrul tiinelor economice,

Capitolul 1 Noiuni introductive

17

experimentele, dac exist, sunt rare. Trebuie s ne


descurcm cu date non-experimentale n cazul crora, de
regul, toate variabilele de interes variaz simultan.
n acest context, vom introduce modelul clasic al
regresiei multiple. Acesta reprezint o extensie a modelului
regresiei de dou variabile, n care este generalizat metoda
celor mai mici ptrate, pentru a permite luarea n calcul a trei
sau mai multe variabile. Regresia multipl reprezint
substitutul experimentului de laborator din tiinele exacte.
Virtual, toate analizele econometrice implic, ntr-o form
sau alta, regresia multipl.
Din pcate, prezumiile modelului clasic al regresiei
multiple sunt mai degrab restrictive. Rezult c unele dintre
aceste prezumii se dovedesc uneori a nu fi valabile atunci
cnd sunt aplicate unor date economice tipice.

Capitolul
2
Inferena statistic
2.1. Concepte de baz privind inferena statistic
Ori de cte ori dorim s observm sau s investigm
un fenomen sau o variabil, exist dou tipuri fundamentale
de surse de date pe care ar trebui s le utilizm. n primul
rnd, ar trebui s avem acces la populaie (colectivitate
definit n sens statistic). nelegem prin aceasta s avem
acces la toate observaiile posibile, trecute, prezente i
viitoare, cu privire la variabila de interes. De exemplu, dac
variabila noastr ar fi ctigurile din luna martie 2005
realizate de un muncitor adult de sex masculin din industria
siderurgic i am avea acces la un studiu complet referitor la
aceste ctiguri, am putea s emitem ipoteze privind
populaia ce face obiectul observaiilor referitoare la aceast
variabil.
Din pcate, nu avem acces la populaie. Am avea
nevoie de un studiu complet cu privire la ctigurile din
industria siderurgic dar acesta nu exist.
Eantionul reprezint cel de al doilea tip de surse de
date cu care ne-am putea ntlni. Pe baza eantionului de care
dispunem, trebuie s deducem fapte n legtur cu populaia
din care s-a prelevat eantionul. Acest proces este cunoscut
sub denumirea de inferen statistic.
Ca problem tipic n inferena statistic, s
presupunem c n 2004, ctigurile n industria siderurgic
au fost complet monitorizate, astfel nct tim c media

Capitolul 2 Inferena statistic

19

acestora a fost de 600 RON Acum suntem n luna martie


2005 i dorim s stabilim dac media ctigurilor a crescut
fa de anul precedent. Nu avem acces la studiul pentru acest
martie i avem timp s intervievm numai 100 de muncitori.
Rezult c acest eantion de 100 de muncitori a nregistrat
ctiguri medii lunare de 650 RON Putem oare deduce, n
baza dovezii dat de acest eantion, c media ctigurilor
lunare a crescut pentru ntreaga industrie, n ansamblu ?
Este clar c dac media ctigurilor eantionului ar fi
fost de 650 RON, am fi putut aprecia c s-a nregistrat o
cretere a ctigurilor la nivelul acestei industrii. Dac media
eantionului ar fi fost de numai 600 RON, am fi concluzionat
c respectivele ctiguri nu au crescut. Dar am obinut o
medie a eantionului de 650 RON Ce putem deduce de aici ?
Problema deduciei devine o problem de a decide cu ct
trebuie s depeasc media eantionului media din anul
precedent a industriei sau a populaiei, nainte de a putea
afirma c se nregistreaz o cretere a ctigurilor.
n ansamblul tuturor problemelor legate de inferena
statistic, una major este cea denumit variabilitatea
eantionrii. nelegem prin aceasta c diferitele eantioane
vor conduce la rezultate diferite. De exemplu, dac n martie
2005 am lua un al doilea eantion de 100 de muncitori
siderurgi, acesta ar putea nregistra o medie a ctigurilor
diferit de cea a primului eantion prelevat. De o manier
similar, un al treilea eantion ar putea conduce la o alt
valoare a ctigurilor medii. Este clar c exist pericolul c
rspunsul la care ajungem cu privire la ctigurile respectivei
industrii va depinde foarte mult de eantionul pe care lucrm
de fapt.

20

Elemente de econometrie

Din fericire, cu condiia de a preleva eantionul de o


anumit manier, variabilitatea de selecie urmeaz un model
sistematic. Aceste eantioane trebuie s fie aleatorii.
Despre un eantion de mrimea n se spune c este
aleatoriu, atunci cnd orice combinaie de n uniti
ale unei populaii are anse egale de a intra n
eantionul care este prelevat.
Prelevarea unui eantion aleatoriu este o problem
esenial. De exemplu, prelevarea unui eantion aleatoriu de
100 de muncitori din industria siderurgic ar implica, n
primul rnd, obinerea unei liste complete a muncitorilor din
respectiva industrie. Urmtorul pas const n alocarea unui
numr fiecrui muncitor de pe list i, apoi, stabilirea unui
procedeu pentru a selecta 100 de numere din aceast list.
Vom ignora, totui, unele aspecte i vom presupune c toate
eantioanele cu care lucrm au fost extrase aleatoriu.
2.2. Distribuia mediilor de eantion
Distribuia mediilor de selecie are media , i
dispersia 2 . Aceasta nseamn E(X) = i Var(X) = 2.
Dispersia este pur i simplu o msur a gradului n care
ctigurile muncitorilor individuali sunt dispersate sau
mprtiate n raport cu media lor, .
i 2 sunt cunoscute sub denumirea de parametri
ai populaiei. Acetia sunt cantiti fixe dar, de regul,
necunoscute.
Am notat media populaiei i variaia cu aceleai
simboluri ca i n cazul utilizrii mediei i variaiei unei
distribuii probabilistice. Aceasta se datoreaz faptului c, n

Capitolul 2 Inferena statistic

21

condiiile unei populaii att de mari, putem interpreta


frecvena relativ cu care survine un anumit nivel de ctiguri
ca fiind o probabilitate. Populaia poate fi considerat a fi
analoag cu o distribuie probabilistic pentru variabila X.
S presupunem c din populaia respectiv se extrage
un eantion aleatoriu de n muncitori. Aceasta se exprim sub
forma:

Xi
n

(2.1)

n care Xi reprezint ctigurile muncitorului i din


cadrul eantionului iar suma acoper toate valorile i.
Un singur eantion extras din populaie ar putea
reprezenta o medie de eantion, de exemplu, X = 600 RON
Totui, dup cum am menionat mai sus, diferitele eantioane
conduc la rezultate diferite, astfel c un al doilea eantion ar
putea s indice X = 658 RON, un al treilea X = 670 RON,
un al patrulea, X = 658 RON etc. Imaginai-v o situaie n
care foarte multe, poate mii de eantioane, toate de aceeai
mrime, n, au fost extrase din aceast singur populaie. n
astfel de condiii ar putea deveni posibil s se construiasc o
distribuie de frecvene relative pentru X , media unui
eantion aleatoriu de mrime n. De exemplu, o medie de X
= 667 RON poate aprea cu o frecven relativ de 0,18.
Deoarece s-au extras foarte multe eantioane, astfel de
frecvene relative pot fi interpretate ca probabiliti astfel c
am putea afirma, de exemplu, c Pr ( X = 665) = 0,18. n
acest mod, este posibil s se construiasc o distribuie de
probabilitate pentru X . Aceasta ar putea s arate, de
exemplu, aproximativ ca ilustraia din Figura 2.1.

22

Elemente de econometrie

x
Figura 2.1. Distribuia mediei de selecie
Distribuia probabilistic pentru X este cunoscut
sub denumirea de distribuie a mediei de selecie pentru un
eantion aleatoriu de mrime n. Distribuiile de selecie de
acest fel au o importan crucial n inferena statistic.
Desigur, n practic, distribuiile de selecie sunt
rareori construite de o manier empiric, ca n cele de mai
sus. n mod normal, avem evidena unui singur eantion i nu
se practic extragerea a foarte multe eantioane.
2.3. Estimarea mediei unei populaii
Dac un parametru al populaiei este necunoscut
exist dou modaliti prin care acesta poate fi estimat. n
primul rnd, putem estima respectivul parametru printr-o
singur valoare (estimare punctual) sau, n al doilea rnd,
putem specifica un interval n cadrul cruia suntem siguri c
se gsete parametrul real.
2.3.1. Estimri punctuale

Acestea sunt estimri exprimate printr-o singur


valoare. De exemplu, am putea estima media ctigurilor

Capitolul 2 Inferena statistic

23

lunare ale populaiei de lucrtori n siderurgie ca fiind de 680


RON sau 720 RON De fapt, modalitatea evident de a
estima o medie necunoscut a populaiei, , const n a
cunoate media eantionului X . Exist un avantaj din
utilizarea estimatorului X . tim c E( X ) = . Aceasta
nseamn c tim c, dac am fi extras foarte multe
eantioane din populaie, am fi putut obine o distribuie de
selecie asemntoare celei din Figura 2.2 (a) i n medie,
am fi obinut a valoare egal cu valoarea real dar
necunoscut a lui . Dei n practic extragem numai un
eantion, este important s apreciem c nu exist nici o eroare
sistematic sau interferen n procedura de estimare.
Deoarece E( X ) = , se spune c X este un
estimator punctual nedeplasat pentru .

Figura 2.2.a Distribuia de selecie pentru medii

24

Elemente de econometrie

De asemenea, vor exista situaii cnd dorim s


estimm o dispersie a populaiei, 2. Estimarea punctual
evident pentru 2 este aceeai cu dispersie dat de formula:

Xi X
v
n
2

(2.4)

De exemplu, avnd datele cu privire la ctigurile


lunare ale unui eantion aleatoriu format din n muncitori din
siderurgie, folosim pur i simplu expresia aferent dispersiei
unui set de n numere. Problema const n aceea c, similar lui
X , valorile pentru eantioane diferite for fi i ele diferite i
se poate demonstra c:
Ev 2

n 1 2
2
n

(2.5)

Aceasta nseamn c distribuia de selecie pentru 2


arat aproximativ ca n Figura 2.2.b. i n acest caz, dac s-ar
fi extras foarte multe eantioane atunci n medie v2 ne-ar
fi dat o valoare mai degrab mai mic dect valoarea real a
lui 2. Astfel, n acest caz, exist o tendin sistematic spre
eroare iar despre v2 se spune c este un estimator punctual
deplasat pentru 2.

Capitolul 2 Inferena statistic

25

Figura 2.2.b Distribuia de selecie pentru 2


Pentru a depi aceast problem a interferenei, 2
este, n mod normal, estimat prin relaia:

Xi X
s
n 1
2

(2.6)

Aceasta datorit faptului c s2 = [n/(n 1)]v2, astfel


c:

n 2 n n 1 2
2
v

1
n

1
n

E s 2 E

(utiliznd (2.5))
Astfel, s2 devine o estimare punctual nedeplasat
pentru 2

26

Elemente de econometrie

2.3.2. Intervale de ncredere

Uneori se va pune problema c un singur numr, sau


estimare punctual, pentru un parametru nu este suficient.
Este posibil s vrem s specificm ntr-un fel i nivelul de
ncredere care se regsete n estimarea noastr. Una dintre
cile pentru a realiza acest lucru const n a ncerca s gsim
un interval de valori n cadrul cruia suntem convini n
proporie de 95% c se regsete respectivul parametru.
Abordm aceast problem considernd media populaiei, ,
n felul urmtor:
S presupunem c dorim s gsim un interval de
valori cuprinse ntre X + E i X - E, astfel nct, nainte de
a extrage eantionul, exist o probabilitate de 0,95 ca
intervalul stabilit n cele din urm s includ parametrul
necunoscut .
Deoarece X , respectiv eantionul mediei, este un
estimator nedeplasat al parametrului , a-l plasa n centrul
intervalului pe care l cutm capt sens. E este pur i
simplu o expresie, sau formul, pe care trebuie s o gsim.
Dac eantionul este mare, atunci tim din teoria
referitoare la limita central c X , este N(, 2/n). Prin
urmare, putem spune c:
Z

/ n

urmeaz

distribuie

N(0,1)
(2.7)

Utilizarea tabelelor
distribuiei
reprezentarea grafic 2.3.a indic faptul c:
Pr(-1,96 < Z < 1,96) = 0,95

normale
(2.8)

Capitolul 2 Inferena statistic

27

Utiliznd relaia (2.7) pentru substituirea lui Z n


relaia (2.8) ajungem la expresia:

X
Pr 1,96
1,96 0,95
/ n

(2.9)

Figura 2.3.a Intervale de ncredere pentru z=1,96


Relaia (2.9) se mai scrie:


Pr X 1,96
X 1,96
0,95
n
n

(2.10)
Examinnd (2.10) constatm c am gsit exact ceea ce
cutam: un interval care s garanteze cu probabilitatea de
0,95 c va conine valoarea necunoscut . Expresia E pe
care am cutat-o este de fapt egal cu 1,96 / n .
Intervalul pe care l-am obinut este denumit, n mod
normal, intervalul de ncredere de 95% pentru .
Singura problem n legtur cu acest interval const
n aceea c E = 1,96 / n depinde de valoarea care, ca i

28

Elemente de econometrie

, este o necunoscut. n practic, atunci cnd se calculeaz


un interval de ncredere, trebuie s fie nlocuit prin s,
abaterea standard a eantionului, obinut prin utilizarea
ecuaiei (2.6) pentru a obinere o estimare nedeplasat. Prin
urmare, intervalul mare de ncredere, 95%, al eantionului se
poate rescrie sub forma X E , sau:
X 1,96

(2.11)

Desigur, este posibil s dorim s fim mai mult de


95% confideni asupra faptului c intervalul nostru va
conine valoarea . Pentru a modifica nivelul de ncredere,
folosim valoarea corespunztoare din tabelul distribuiei
normale standardizate. De exemplu, Figura 2.3.b indic
faptul c, pentru a garanta un interval de ncredere 99%,
nlocuim valoarea de 1,96 cu 2,58 i obinem:
X 2,58

s
n

(2.12)

Odat stabilite expresiile de baz, intervalele de


ncredere sunt foarte uor de calculat. De exemplu, dac n
cazul muncitorului nostru din industria siderurgic, un
eantion de mrimea n = 80 ar trebui s conduc la o medie a
ctigurilor X 574 RON, cu s = 94, atunci , substituirea n
relaia (2.11) conduce la un interval de ncredere 95% egal
cu:
574 1,96

94
80

574 20,6

Capitolul 2 Inferena statistic

29

Prin urmare, intervalul urmrit este cuprins ntre


553,4 i 594,6.
Dei intervalele de ncredere sunt uor de calculat,
acestea sunt mult mai nesigure dect se poate imagina, atunci
cnd se pune problema interpretrii lor. Se impune
reamintirea faptului c media populaiei, , dei necunoscut,
reprezint o constant fix. Prin urmare, trebuie s se
gseasc fie n intervalul 553,4 594,6 pe care l-am calculat,
fie n afara acestuia. Dac se regsete n cadrul intervalului,
exist probabilitatea de o unitate de a o gsi acolo. Dac se
afl n afara intervalului, probabilitatea de a se regsi n
interiorul intervalului trebuie s fie zero. Prin urmare, nu
putem spune c exist o probabilitate de 0,95 ca aceasta s se
regseasc n intervalul 553,4 594,6! Deci, ce semnificaie
are calculaia noastr ?
Cheia acestei probleme rezid n a ne aminti c
diferitele eantioane vor conduce la diferite medii X i la
diferite abateri standard, s. Prin urmare, diferitele eantioane
vor prezenta, prin substituire n (2.11) diferite intervale de
ncredere. Dac s-ar extrage foarte multe eantioane, 95%
dintre aceste intervale ar conine necunoscuta , dar 5% nu ar
conine-o. Intervalele difer de la eantion la eantion dar
este fix.
Dup cum vom vedea, adesea calculm intervale de
ncredere pentru parametrii ai populaiei, alii dect media .
Totui, procesul este ntotdeauna similar cu cel prezentat mai
sus.
Abaterea standard a distribuiei de selecie a unui
estimator este cunoscut sub denumirea de eroare standard
a estimrii.
De exemplu, eroarea standard a estimrii pentru X
s
este X s / n , respectiv abaterea standard a distribuiei sale

30

Elemente de econometrie

de selecie. La o estimare punctual nedeplasat dat i, cu


condiia ca distribuia sa de selecie s fie simetric,
intervalele de ncredere sunt de forma:
Estimare
punctual (valoare
standard a estimrii)

critic)(eroarea
(2.13)

Valoarea critic din (2.13) este luat din tabelele de


valori de distribuie, cum ar fi tabelul distribuiei normale
standardizate. De exemplu, n (2.11) i (2.12) estimarea
punctual este X , valoarea critic se preia din tabelul
distribuiei normale standardizate iar eroarea standard este
s/ n .
2.4. Verificarea ipotezelor referitoare la media populaiei
Vor exista situaii cnd, n loc de a dori s estimm un
parametru al populaie, am putea fi interesai s stabilim dac
acest parametru ia sau nu o anumit valoare. La nceputul
acestui capitol, cu titlu de exemplu de problem tipic de
inferen, am considerat situaia n care media ctigurilor
muncitorilor din siderurgie, realizate n prima lun a unui an
era cunoscut ca avnd valoarea de 540 RON Un an mai
trziu, n aceeai lun, ne-am confruntat cu problema legat
de cum am putea decide, numai pe baza unui eantion de 100
de muncitori, dac s-a nregistrat sau nu o cretere a mediei
ctigurilor populaiei n anul care a trecut. Pentru a soluiona
aceast problem, ncepem prin a formula dou ipoteze.
n primul rnd, formulm aa-numita ipotez nul,
conform creia media ctigurilor populaiei nu a crescut n
anul precedent.

Capitolul 2 Inferena statistic

31

Aceasta presupune c este n continuare egal cu 540


RON O ipotez nul este notat, de regul, prin H 0. Astfel,
avem:
Ipoteza nul H0 : = 540
ctigurilor)

(nici o modificare a
(2.14)

A se reine c valoarea la care se refer (2.14) este


media populaiei n anul iniial considerat.
n faza urmtoare formulm ipoteza alternativ,
notat prin HA care acoper toate alternativele rezonabile la
cea nul H0. ntruct anii considerai au fost inflaioniti, vom
face abstracie, pentru moment, de posibilitatea ca
respectivele ctiguri s fi sczut i adoptm ca alternativ,
ipoteza c acestea au crescut:
Ipoteza alternativ HA:
ctigurilor)

> 540

(cretere a
(2.15)

Problema devine astfel una de a alege ntre H 0 i HA,


respectiv ntre ipoteza nul i cea alternativ. Trebuie s
facem acest lucru pe baza informaiilor date de un eantion de
mrime n = 100.
Odat eantionul extras, vom cunoate valoarea
mediei eantionului, X . Este evident c a respinge ipoteza
nul H0, conform creia ctigurile nu au crescut, capt sens
dac se dovedete c X are o valoare mai mare dect
valoarea din anul precedent, de 540 RON. O ntrebare
important n context se refer la ct de mare trebuie s fie

32

Elemente de econometrie

X nainte de a respinge H0 i de a accepta alternativa HA,


conform creia ctigurile populaiei au crescut.
Un instrument de care dispunem pentru a soluiona
aceast problem este Teorema Limita Central. ntruct
eantionul nostru este unul relativ mare, tim c distribuia
mediilor de selecie pentru X urmeaz o distribuie normal,
N(,2/n).

Cantitatea ( X - 540/ / n este cunoscut sub


denumirea de test statistic (TS). Punctul crucial referitor la
acest test statistic este dat de faptul c are o distribuie
N(0,1) numai atunci cnd ipoteza nul H0 este adevrat.
Dac H0 nu este adevrat ci fals, atunci (2.16) nu se
va verifica, deoarece nu va lua alt valoare dect 540 RON.
Dup cum se poate observa n Figura 2.4, distribuia
normal standardizat, sau N(0,1) este centrat n jurul valorii
zero. Dac ipoteza nul este adevrat, n condiii H0 exist o
mare probabilitate ca TS s ia o valoare n jurul valorii zero.
Dac ar lua o valoare diferit de zero, atunci vom fi nclinai
s ne ndoim de faptul c H 0 este adevrat. Dac H0 este
fals, nu exist nici un motiv pentru care TS nu ar trebui s ia
o valoare deprtat de zero. Prin urmare, testul statistic ofer
un mijloc de testare a msurii n care H0 este adevrat.

Capitolul 2 Inferena statistic

33

Figura 2.4. Distribuia testului statistic


A se observa c TS se bazeaz pe diferena dintre X
i valoarea de 540 RON care apare n cadrul H 0. Cu ct este
mai mare msura n care media eantionului depete 540
RON, cu att mai mare (mai relevant) va fi testul statistic. Cu
ct TS este mai semnificativ, cu att vom fi mai nclinai s
respingem H0 n favoarea lui HA i s afirmm c veniturile
populaiei au crescut.
S presupunem c eantionul nostru de 100 de
muncitori este extras iar TS = X 540 / / n . S
presupunem c TS > 1,64. Numrul 1,64 nu a fost ales de o
manier arbitrar. Dup cum se poate vedea din Figura 2.4,
aria de sub curba standardului normal de la dreapta valorii
1,64 este egal cu 0,05.
Este TS > 1,64 suficient de mare pentru a ne face s
avem dubii cu privire ipoteza nul H0 care afirm c nu au
crescut ctigurile? Dac TS > 1,64, trebuie s alegem una
din dou posibiliti.
n primul rnd, am putea continua s susinem c H0
este adevrat. Totui, dac adoptm aceast poziie, trebuie
s acceptm faptul c a survenit ceva mai degrab neobinuit.
Dac H0 este adevrat, atunci (2.16) este valabil iar curbele
din Figura 2.5 reprezint distribuia unui test statistic. Dac
aceasta este situaia, atunci probabilitatea de a obine a
valoare TS mai mare de 1,64 este de numai 0,05, respectiv 1
la 20. Majoritatea oamenilor ar privi producerea unui
eveniment care are numai o ans de 1 la 20 de a se ntmpla
ca pe ceva mai degrab ciudat.
Ca alternativ, dac TS > 1,64, am putea respinge H0
susinnd n schimb c HA este adevrat iar ctigurile au
crescut. Dac ipoteza alternativ este adevrat, conform H A,

34

Elemente de econometrie

nu exist nici un motiv pentru care Figura 2.4 ar trebui s


reprezinte distribuia testului statistic. TS ar putea fi
distribuit n jurul valorii 1,5 sau 2, situaie n care nu ar fi
nimic neobinuit n a obine TS > 1,64. Dac respingem H0 n
favoarea lui HA, trebuie s ne amintim c va rmne n
continuare o mic probabilitate, de pn la 0,05, ca H0 s fie
de fapt adevrat. Aceasta nseamn c, dac respingem H0 i
susinem creterea ctigurilor, exist o probabilitate, poate
numai de 0,05, c am greit n acest sens.
Atunci cnd un statistician obine o valoare mai mare
de 1,64 pentru testul statistic, n mod normal afirm c
respinge ipoteza nul de 0,05 nivel de semnificaie. Acesta
este numai un jargon statistic pentru respingerea lui H 0 ,
admindu-se c exist o probabilitate infim, de 0,05, care s
ateste c s-a procedat greit. Nivelul de semnificaie
reprezint probabilitatea unei erori atunci cnd se respinge
H0. n mod normal, probabilitatea unui astfel de tip de eroare
este reprezentat prin simbolul . Aceasta conduce la relaia:
Nivel de semnificaie = Pr (se respinge H 0 cnd H0 este
adevrat)
Pentru ca cele de mai sus s fie absolut clare, vom
considera de o manier uor diferit ce anume este implicat
atunci cnd respingem H0 dac TS > 1,64. Din (2.16)
rezult c dac TS > 1,64 atunci:
X 540 1,64 /

(2.17)

Astfel, respingem H0 dac X depete un anumit


nivel critic dat de partea din dreapta a ecuaiei (2.17). Dat
fiind o estimare , acest numr ar putea fi calculat. ns dac

Capitolul 2 Inferena statistic

35

H0 este adevrat, atunci X este N(540, 2/n) iar


probabilitatea ca (2.17) s se produc poate fi uor calculat
sub forma:

Pr X 540 1,64 / n Pr Z 1,64 0,05

Astfel, dac H0 este adevrat, exist o probabilitate


de numai 0,05 de a obine o valoare X care s depeasc
valoarea critic din (3.17). Totui, chiar dac obinem o astfel
de valoare, considerm aceasta o ntmplare puin probabil
de a fi respins H0 la nivelul de semnificaie 0,05.
Nu este nimic special n mod deosebit n legtur cu
numrul 1,64 sau cu un nivel de semnificaie de 0,05.
Alternativ, am putea decide s respingem H0 i s meninem
afirmaia conform creia ctigurile au crescut n condiiile n
care TS > 2,33. Problema n legtur cu numrul 2,33 const
n aceea c aria de la dreapta acestuia de sub curba
distribuiei normale standardizat din Figura 2.4. este de 0,01.
Urmnd un acelai raionament ca mai sus, pentru o valoare
TS > 2,33, putem fie s acceptm H0 ca fiind adevrat, dar
s susinem c un eveniment cu o probabilitate att de redus,
ca cea de 0,01 s-a produs totui, fie s respingem H 0. Totui,
dac respingem H0, trebuie s ne amintim c exist n
continuare o probabilitate de eroare, dei acum aceasta este
de numai 0,01. Deci, dac TS > 2,33, respingem H0 la
nivelul de semnificaie de 0,01.
Introducerea unor numere n procesul de testare
(verificare) a ipotezelor presupune ca eantionul nostru de
100 de muncitori s se dovedeasc a avea o medie a
ctigurilor X = 564RON, cu o abatere standard a
eantionului de s = 75. Substituind n testul statistic (2.16) i
utiliznd s n locul necunoscutei , rezult :

36

TS

564 540
75 / 100

Elemente de econometrie

3,2

Astfel, testul statistic depete nu numai valoarea de


1,64 ci i pe cea de 2,33. Prin urmare, putem respinge ipoteza
nul (conform creia ctigurile au rmas neschimbate
comparativ cu ultimul an) att la nivelul de semnificaie de
0,05 ct i la cel de 0.01.
2.4.1. Teste bilaterale

n exemplul de mai sus am eliminat posibilitatea c


veniturile ar fi putut s scad. S presupunem c nu am
eliminat aceast posibilitate i am dorit s verificm dac
media ctigurilor s-a modificat. Putem proceda recurgnd la
aceeai ipotez nul ca n situaia anterioar. Totui, ipoteza
alternativ, care acoper toate celelalte posibiliti rezonabile
trebuie s fie n acest caz aceea conform creia media
ctigurilor s-a modificat n raport cu valoarea de 540 RON
din anul precedent. Aceasta nseamn c acum avem:
Ipoteza nul H0 : = 540 (nici o modificare a
ctigurilor)
Ipoteza alternativ HA: 540 (modificare a
ctigurilor)
Odat eantionul extras, capt sens s respingem H0,
respectiv ipoteza conform creia media ctigurilor populaiei
este n continuare egal cu 540 RON, att n cazul n care
media eantionului X este cu mult mai mare dect 540
RON, ct i n cazul n care X este cu mult mai mic dect
540 RON S ne amintim c, n cazul precedent, am respins

Capitolul 2 Inferena statistic

37

ipoteza H0 numai atunci cnd X era cu mult mai mare dect


540RON Acest lucru a fost justificat de faptul c, n cazul
precedent, a trebuit s eliminm posibilitatea
s se
nregistreze ctiguri n scdere.
Interpretnd criteriile noastre revizuite pentru
respingerea lui H0 n termeni de test statistic (2.16), observm
acum c ar trebui s respingem H0 i s susinem c
respectivele ctiguri s-au modificat, att n cazul n care TS
este cu mult mai mare dect zero (foarte pozitiv), ct i n
cazul n care TS este cu mult mai mic dect zero (foarte
negativ). Ct de pozitiv sau ct de negativ trebuie s fie testul
statistic este stabilit din nou prin raportare la tabelele de
distribuiei normale standardizate. De exemplu, din
examinarea Figurii 2.5 rezult c dac adoptm un nivel de
semnificaie de 0,05, atunci ar trebui s respingem H 0 i s
susinem modificarea ctigurilor, att n cazul n care testul
statistic este mai negativ dect -1,96, ct i n cazul n care
acesta este mai pozitiv dect +1,96.

Figura 2.5. Distribuia absolut a testului statistic


Putem reformula decizia noastr, sau criteriul de
verificare pentru acest test bilateral n termeni de valoare
absolut a testului statistic, scriind:
se respinge H0 la nivelul de semnificaie 0,05 dac |
TS| > 1,96

38

Elemente de econometrie

De o manier similar, din analiza figurii 2.5 rezult


c:
se respinge H0 la nivelul de semnificaie 0,01 dac |
TS| > 2,58
n cel de al doilea caz probabilitatea de eroare de 0,01
este egal distribuit ntre cele dou extreme ale distribuiei
distribuiei normale standardizate.
2.4.2. Tipuri de eroare

n exemplul i analiza de mai sus se afl, n mod


implicit i o decizie sau criteriu de verificare de forma:
Se respinge H0 dac |TS| > k dar se accept H 0 dac |
TS| < k
(2.18)
Valoarea k este preluat din tabelele distribuiei
normale standardizate i va depinde de nivelul de
semnificaie acceptat i de msura n care testul este unul cu o
extrem sau unul cu dou extreme. Respingerea lui H0
implic automat acceptarea alternativei HA, n timp ce
acceptarea lui H0 implic respingerea lui HA.
n condiiile unui criteriu de decizie (2.18) dat, exist
dou tipuri de erori pe care le-am putea face atunci cnd
procedm la efectuarea unei verificri.
Este clar c, dac acceptm H0 cnd aceasta este
adevrat sau respingem H0 cnd aceasta este fals,
nu comitem nici o eroare. Dac ns respingem H 0
cnd aceasta este adevrat, comitem o eroare de

Capitolul 2 Inferena statistic

39

tip I. Probabilitatea de a comite acest tip de eroare


este de fapt nivelul de semnificaie al testului. Pe de
alt parte, dac acceptm H0 cnd aceasta este fals,
comitem o eroare de tip II.
La modul ideal, ne-ar place s fim n msur s optm
pentru acea valoare k din criteriul de test (2.18) care s
conduc la valori ct mai mici posibile att pentru Pr(eroare
de tip I), respectiv Pr(eroare de tip II). Din pcate, acest lucru
este foarte rar posibil datorit urmtoarelor motive.
n primul rnd rezult c dac facem ca valoarea k
s varieze n baza criteriului (2.18), cu ct facem ca valoarea
Pr(eroare de tip I) s fie mai mic, cu att devine mai mare
Pr(eroare de tip II) i vice versa. Nu este posibil, n mod
normal s facem ca ambele probabiliti s fie foarte mici n
acelai timp. Pentru a nelege acest lucru, s revenim la
exemplul nostru cu muncitorii din siderurgie, unde am avut
ipotezele nul i alternativ.
H0 : = 540 ,

HA: 540

Criteriul de decizie (2.18) implic respingerea lui H 0


dac
TS

X 540

/ n

este fie > k, fie < - k

Putem rescrie acest lucru sub forma:

40

Se respinge H 0 dac X >540+


k
n

Elemente de econometrie

k
n

sau dac X < 540-

(2.19)
Valoarea k depinde, ca de regul, de nivelul de
semnificaie ales.
Cunoatem faptul c n condiiile H0, = 540 astfel c
media eantionului X este N(540, 2/n). Aceast distribuie
este prezentat sub forma curbei din stnga din Figura 2.6,
centrat n jurul valorii X = 540. Punctele R i R din Figura
2.6 se situeaz la nivelul 540 - k n i, respectiv, 540 + k
n , pe axa X . Criteriul nostru de decizie (2.19) este de
aa manier nct, dac media eantionului X ia o valoare
la stnga lui R sau la dreapta lui R, respingem H 0.
Probabilitatea unei erori de tip I, respectiv respingerea lui H 0
atunci cnd este adevrat iar curba din partea stng
reprezint distribuia lui X , este egal cu suma ariilor de
sub curb la stnga fa de R i la dreapta lui R. Prin urmare,
aceasta este egal cu de dou ori aria care se desfoar la
dreapta lui R.

Capitolul 2 Inferena statistic

41

Figura 2.6. Distribuia mediei de selecie


Acum s presupunem c HA i nu H0 este adevrat.
HA implic tocmai faptul c 540 dar ne permite s lum
cazul particular n care =560. Dac = 560 , atunci media
eantionului, X , este N(560, 2 /n). Aceast distribuie este
prezentat prin curba din dreapta din Figura 2.6. ntruct
aceasta prezint o aceeai variaie ca i prima curb, ns o
medie mai mare, forma sa este identic cu a primei curbe ns
se deplaseaz spre dreapta de-a lungul axei X .
n condiiile criteriului nostru de decizie acceptm H0
dac X ia o valoare cuprins ntre R i R. Totui, dac este
mai degrab adevrat HA dect H0 atunci distribuia lui X
este dat de curba din dreapta. Deoarece, dac HA este
adevrat, probabilitatea de a accepta n mod incorect H 0 este
dat de aria punctat de sub curba din dreapta la stnga lui R.
Prin urmare, aceast arie punctat reprezint probabilitatea
unei erori de tip II, respectiv, probabilitatea de a accepta H0
atunci cnd H0 este fals.
Acum este posibil s vedem de ce reducerea lui
Pr(eroare de tip I) face ca Pr(eroare de tip II) s creasc i
vice-versa. Dac facem ca valoarea k s varieze n cadrul
criteriului nostru de decizie (2.19) (respectiv, modificm
nivelul de semnificaie), aceasta face ca punctele R i, mai
important dect acsta, R din Figura 2.6 s se deplaseze. Dac
mrim valoarea k i R este deplasat ctre dreapta atunci aria
umbrit de sub curba din stnga este redus aceasta implicnd
o diminuarea a Pr(eroare de tip I). ns o deplasare a lui R
spre dreapta face ca aria punctat de sub curba din dreapta s
se mreasc i, prin aceasta, face ca Pr(eroare de tip II) s se
reduc, crescnd simultan Pr(eroare de tip I).

42

Elemente de econometrie

Mai exist i o a doua problem n legtur cu


criteriul de verificare de forma (2.18) i (2.19). n Figura 2.7
am presupus c atunci cnd este adevrat H A mai degrab
dect H0, = 560. ns HA afirm numai c 540. S
presupunem, n schimb c HA este adevrat dar = 550.
Curba din dreapta din Figura 2.6 se va afla acum mult mai
aproape de curba din stnga. n consecin, cu R ntr-o poziie
dat, aceasta nseamn c pentru o valoare Pr(eroare de tip I),
va exista o valoare mai mare Pr(eroare de tip II).
n general, pentru o valoare dat Pr(eroare de tip I), ar
trebui s fie clar faptul c Pr(eroare de tip II) va depinde de
poziia celei de a doua curbe i, prin urmare, de valoarea luat
de atunci cnd H0 este fals. ns cu ipoteze de genul celor
de mai sus, dac H0 este fals, nu vom cunoate valoare lui .
HA nu precizeaz aceast valoare ea afirm mai degrab c
540. Astfel, n general, nu putem cunoate probabilitatea
unei erori de tip II.
Apoi, mai exist dou probleme legate de criteriile de
verificare de forma (2.18) i (2.19). Prima const n aceea c
nu putem cunoate probabilitatea unei erori de tip II. Cea de a
doua se refer la faptul c, cu ct facem ca probilitate unei
erori de tip I s fie mai mic, cu att mai mare devine
probabilitatea unei erori de tip II.
n principiu, este posibil s evitm cea de a doua
dintre aceste probleme prin creterea dimensiunii
eantionului. n general, acest lucru va reduce Pr(eroare de tip
II) pentru o valoare Pr(eroare de tip I) dat. n termenii
Figurii 2.6, creterea dimensiunii eantionului conduce la o
rspndire mai mic n ambele distribuii prezentate.

Capitolul 2 Inferena statistic

43

2.5. Alte cteva teste statistice importante i distribuiile


lor
Pn n prezent am introdus conceptele de inferen
statistic aproape exclusiv n contextul mediei populaiei.
Totui, sunt frecvente ocaziile n care dorim s facem
deducii cu privire la ali parametri ai populaiei un
exemplu evident este variaia dispersiei 2. n plus, dup cum
vom vedea, inferena statistic are un rol important n analiza
regresiilor. De asemenea, am limitat analiza la eantioane
mari. n tiinele economice trebuie s operm frecvent cu
eantioane mai mici dect cele pe care le-am avut n vedere
pn acum.
nainte de a aborda problemele de mai sus, trebuie s
ne ocupm de distribuiile/densitile probabilistice, aceste
funcii implicnd conceptul de grade de libertate.

2.5.1. Gradul de libertate

S considerm n variabile aleatorii continue: X1, X2, X3......Xn


n
2
i suma ptratelor i 1 X i . Gradele de libertate
reprezint un concept asociat unor astfel de sume de ptrate.
De exemplu, s presupunem c n = 5 i c exist 2
restricii lineare pe variabilele X. Acestea ar putea fi X1 + X2
+ X3 = 0 i 2X4 + 3X5 = 8. Dac selectm valorile pentru trei
dintre variabilele X, n condiii restriciilor date, valorile celei
de a doua restricii, X5 trebuie s ia valoarea 2. Atunci cnd
selectm valorile pentru Xs se afirm c dispunem de numai
trei grade de libertate ntruct numai trei astfel de valori pot fi
selecionate independent de celelalte. Se mai afirm c suma
asociat a ptratelor are trei grade de libertate.

44

Elemente de econometrie

n general, dac avem n variabile i r restricii, vom


avea n r grade de libertate. Atunci i despre suma ptratelor
i X i2 se poate afirma c are n r grade de libertate.
Pentru exemplificare, s presupunem c avem o
populaie de X valori din care extragem un eantion de
mrime n , constnd din valorile X1, X2, X3......Xn. Presupunem
2
apoi c am calculat suma ptratelor in1 X 1 X .
Deoarece

X
i

X 0 , exist o singur restricie pentru

cele n variabile X i X . Astfel, despre suma i X i X


se spune c are n 1 grade de libertate.
S presupunem, totui, c media populaiei, , este
2
cunoscut i c, n loc s calculm i X i X , calculm
2

X .
motiv pentru care X
suma ptratelor

Deoarece nu exist nici un

ar trebui s fie egal cu zero,


nu exist restricii pentru cele n variabile X i , astfel nct
2
suma ptratelor i X i dispune de toate cele n
grade de libertate.
nlocuirea parametrului al unei populaii cu
estimarea eantionului su, X , n suma ptratelor de mai sus
conduce la pierderea unui grad de libertate. Ori de cte ori
trebuie s nlocuim un parametru al unei populaii prin
estimarea eantionului su pentru a calcula o sum de ptrate,
vom constata c aceasta implic formualrea unei restricii
pentru variabilele care sunt ridicate la ptrat i nsumate.
Aceasta conduce la diminuarea cu unu a gradelor de libertate
asociate sumei ptratelor. n cazul de mai sus, nlocuirea lui
prin X implic impunerea restriciei i X i X 0 pe
variabilele care trebuie ridicate la ptrat i nsumate.
i

Capitolul 2 Inferena statistic

45

Avnd n vedere cele de mai sus, putem afirma c


numrul de grade de libertate (g.l.) asociate sumei
ptratelor este dat de numrul de observri utilizate
pentru a calcula suma ptratelor minus numrul
parametrilor care trebuie nlocuii prin estimaiile
pe baza eantioanelor.
2.5.2. Distribuia 2

Dac Z1, Z2, Z3......Zn sunt toate variabile


distribuite
independent
distribuiei
normale
standardizate sau N(0,1), atunci despre suma
n
2
ptratelor i 1 Z i se spune c are o distribuie 2
cu n grade de libertate.
Gradele de libertate asociate distribuiei sunt date de
suma ptratelor. Deoarece variabilele Z sunt independente,
aceast sum a ptratelor dispune de totalitatea n a gradelor
de libertate. O variabil 2 cu n grade de libertate este scris
2
sub forma n .
Forma distribuiilor 2 selectate pentru diferite grade
de libertate este prezentat n Figura 2.7.

46

Elemente de econometrie

Figura 2.7. Distribuia 2


Ariile de sub curb pot fi interpretate ca fiind
probabiliti iar densitile probabilistice pot fi msurate pe
axa vertical. Deoarece suma ptratelor nu poate fi niciodat
negativ, distribuiile se afl ntotdeauna n cuadrantul
pozitiv. Distribuiile sunt non-simetrice i au extremiti lungi
n partea dreapt.
2
Media unei distribuii n poate fi derivat cu
uurin, pentru toate valorile i, rezultnd:

2
2
Var (Zi) = E Z i - E Z i

(prin definiie)

2
= E Z i (deoarece fiecare variabil Zi are o

medie de zero)
Dar toate variabilele Zi sunt N(0,1) i, prin urmare
toate prezint o variaie de o unitate. Astfel, ajungem la
2
egalitatea E Z i = 1 pentru toate valorile i.

Capitolul 2 Inferena statistic

47

Media distribuiei n este egal cu gradul su de


libertate. Datorit acestui fapt, cu ct numrul de grade de
libertate asociate distribuiei este mai mic, cu att mai
aproape de axa vertical se va afla vrful su din Figura 2.7.
O utilizare a distribuiei n2 const n elaborarea de
inferene n legtur cu variaia, 2 . S presupunem c avem
un eantion de n observri, X1, X2, X3......Xn
dintr-o
distribuie N(, 2). Rezult c:
2

Xi
are o distribuie N(0,1) pentru toate valorile i.

(2.21)

Din (2.21) rezult c:


2

X
i i prezint o distribuie 2 cu n g.l.

(2.22)
deoarece reprezint suma ptratelor pentru n variabile
distribuiei normale standardizate care vor fi distribuite
independent dac eantionul valorilor X este aleatoriu.
Prin urmare, utiliznd (2.22), obinem:
s 2 n 1
2

prezint o distribuie 2 cu n-1

g.l.

(2.23)
Acum avem n 1 grade de libertate, deoarece trecnd
de la suma ptratelor din (2.23) la cea din (2.24) am nlocuit
parametrul prin estimarea eantionului su, X .

48

Elemente de econometrie

Ceea ce implic (2.24) este c, dac extragem multe


eantioane de mrimea n din populaia N(, 2), atunci vom
obine o distribuie de selecie de valori pentru s2. Aa cum se
evideniaz valori diferite pentru X , diferitele eantioane
vor conduce la valori diferite i pentru s2. Dac am calculat
pentru fiecare eantion s2 = (n-1)/2 , atunci distribuia de
selecie a acestui indicator statistic va fi distribuia 2 cu n
1 grade de libertate.
O caracteristic important a distribuiilor 2 este
dat de teorema conform creia:
Dac u i v sunt dou distribuii 2
independente avnd u i respectiv v grade de
libertate, atunci u2 + v2 vor avea o distribuie 2
cu u + v grade de libertate.
Celor dou distribuii 2 independente le
corespunde o distribuie 2 iar gradul de libertate
asociat acestei noi distribuii este egal cu suma
gradelor de libertate asociate distribuiilor
originale.
2

Distribuia 2 este format preluarea sumei i Z i a


n variabile distribuiei normale standardizate. Dac toate
aceste variabile sunt independente una de cealalt, atunci
distribuia obinut prezint n grade de libertate. Dac, totui,
numai r dintre variabilele distribuiei normale standardizate
sunt independente , cu celelalte variabile depinznd de aceste
2
r , atunci suma ptratelor i Z i va avea numai r grade de
libertate. Astfel, i distribuia 2 astfel format va avea numai
r grade de libertate.
2

Capitolul 2 Inferena statistic

49

2.5.3. Distribuia t

Dac Z1, Z2, Z3......Zn sunt toate variabile de


distribuiei normale standardizate distribuite
independent, atunci despre mrimea

Z0
n

2
i

(2.25)

/n

i 1

se spune c prezint o distribuie t cu n grade de


libertate.
Se poate observa c n interiorul rdcinii ptrate de la
n
2
numitorul din (3.26) avem l / n i 1 Z i care reprezint o
variabil 2 mprit la gradele sale de libertate. Prin urmare,
o definiie alternativ pentru t este ca aceasta reprezint
raportul dintre o variabil de distribuiei normale
standardizate i rdcina ptrat a unei variabile
independente 2 care a fost mprit la gradele sale de
libertate. A se reine faptil c distribuia t i obine gradele
de libertate din distribuia 2 care apare la numitorul su.
Forma unei distribuii t este ilustrat n Figura 2.8.

50

Elemente de econometrie

Figura 2.8. Distribuia t


Aceasta nseamn c ariile de sub curb pot fi privite
ca nite probabiliti, cu densiti probabilistice msurate pe
axa vertical. Forma este foarte asemntoare cu cea a
distribuiei distribuiei normale standardizate, fiind simetric
n jurul lui zero dar cu o probabilitate ceva mai mare de a lua
valorile extreme.
Forma precis a distribuiei t depinde de n, de gradele
sale de libertate. Poate fi demonstrat c pe msur ce n
forma tinde spre cea a distribuiei distribuiei normale
standardizate. De fapt, pentru scopuri practice, pentru n >
50, diferenele dintre cele dou distribuii pot fi ignorate.
Dei eantioanele sunt mici, distribuia de selecie a
mediei X este n continuare N(, 2 ). Dac valoarea ar fi
cunoscut, am putea n continuare s aplicm un test statistic.
Deviaia standard a variabilei, , este, totui,
cunoscut de regul i trebuie nlocuit cu deviaia standard a
lui s. n cazul eantioanelor mici, nu exist nici un motiv

Capitolul 2 Inferena statistic

51

pentru care X / n ar trebui s fie o variabil


distribuiei normale standardizate. Totui, vom demonstra
acum c, cu condiia ca populaia s fie normal distribuit,
X
s/

are o distribuie t cu n 1 g.l.

(2.26)

Capitolul 3
Regresia liniar simpl
3.1. Domenii de aplicare
n practica analizei economice modelul liniar de
regresie are numeroase aplicaii. Vom preciza pentru nceput
cteva aplicaii ale acestuia:
funcia de consum din modelul lui Keynes
este:
C t a b Yt
(3.1)
unde:
Ct este consumul pentru un an
Yt este venitul pentru aceeai perioad
a,b sunt parametrii modelului de regresie
relaia liniar care exist ntre pregtirea
profesional i venitul obinut;
dependena liniar ntre gradul de dezvoltare a
unei ri i gradul de corupie din aceast ar:
H i a b CRi ,
(3.2)
unde:
Hi este indicele dezvoltrii umane nregistrat de o
ar,
CRi nivelul corupiei, ce se exprim printr-un
numr cu o zecimal din intervalul [1,10]. Nivelul
cel mai sczut al corupiei este n cazul n care
indicele este egal cu 10.
Cu privire la modelul liniar de regresie sunt necesare
urmtoarele precizri:

Capitolul 3 Regresia liniar simpl

53

identificarea celor dou variabile folosite


pentru definirea modelului notate:
Y = simbolul pentru variabila
rezultativ. Seria de date se noteaz
prin ( yi ) i 1, n ;
X = simbolul pentru variabila
explicativ sau factorial definit de
seria ( xi ) i 1, n

Cu cei doi parametri se definete o dependen


determinist ntre cele dou variabile:
(3.3)
Y= b + aX
Cei doi parametri sunt estimai prin intermediul
seriilor de date constituite pentru cele dou variabile.
Estimatorii celor doi parametri se definesc prin b i a .
Parametrii modelului sunt stabilii ntr-o manier stocastic,
pe baza estimatorilor:

definirea variabilei reziduale. Notm


variabila rezidual prin . Aceasta este repartizat normal,
avnd media 0 i dispersia constant. Variabila rezidual este
inclus model deoarece:
- n economie nu se ntlnete ntotdeauna o
dependen liniar funcional ntre dou
variabile, ci una de tip probabilist;
- seriile de date sunt afectate de erori de
msurare cu influen asupra estimrii celor
doi parametri;
- seriile de date se stabilesc prin observri
asupra unor eantioane.

54

Elemente de econometrie

utilizarea modelului de regresie. Dup natura


seriilor de date, sunt dou domenii de utilizare a modelului
liniar de regresie:
- n analiza dependenei dintre dou variabile, n
cazul n care seriile de date sunt nregistrate la
nivelul unitilor statistice ale populaiei
pentru o perioad sau un moment, folosind
notaia:
y i b a xi i ,
(3.4)
unde:
yi este caracteristica rezultativ (explicat),
xi caracteristica factorial (explicativ);
- pentru evidenierea dependenei dintre dou
variabile ntr-un anumit orizont de timp sunt
folosite seriile de timp.
utilizarea setului de ipoteze. Pentru estimarea
parametrilor i utilizarea modelului de regresie sunt utilizate
o serie de ipoteze:
- I1: seriile de date nu sunt afectate de erori de
msur;
- I2: variabila rezidual are media 0;
- I3: dispersia variabilei reziduale este invariant
n timp, adic are proprietatea de
homoscedasticitate;
- I4: reziduurile nu sunt autocorelate;
- I5: variabila factorial (explicativ) nu este
corelat cu variabila rezidual;
- I6: t N (0, 2 ) .
Pentru testarea acestor ipoteze sunt folosite o serie de
teste statistice.

Capitolul 3 Regresia liniar simpl

55

n cazul n care dependena liniar este regsit n


urma efecturii de transformri asupra celor dou variabile,
vom spune c modelul de regresie este liniar n raport cu
parametrii acestuia.
De exemplu, modelul Y = b + alnX este neliniar n
raport cu variabila factorial, dar este un model liniar n
raport cu cei doi parametri. n schimb, modelul de regresie Y
= b + ln aX este liniar n raport cu variabila factorial, dar nu
este liniar n raport cu cei doi parametri, a i b, ci n raport cu
b i lna.
Pentru elucidarea acestor aspecte vom lua exemplul
dependenei dintre venitul disponibil i consumul populaiei
care este de tip liniar, (coeficientul pantei este pozitiv 1). De
asemenea, modelul liniar pentru studierea dependenei dintre
rata de economisire i rata investiiei dintr-o ar ntr-un
orizont de timp. ntr-un studiu efectuat de ctre Feldstein i
Horioka asupra unui numr de 21 de ri n perioada 20002005, s-a stabilit urmtorul model liniar de regresie:
y iI 0,035 0,887 y iE , R2 = 0,91
n cadrul modelului de mai sus s-au folosit
urmtoarele notaii:
- yiI reprezint ponderea medie a investiiilor n PIB
n perioada 2000-2005 pentru fiecare ar inclus n eantion;
E
- yi cuantific ponderea medie a economiilor
populaiei n PIB pentru fiecare ar.
Raportul de corelaie demonstreaz c ntre cele dou
serii exist o dependen puternic. n literatura economic
se gsesc i alte modele liniare de regresie, n analizele la
nivel microeconomic sau macroeconomic.
1

Dornbusch, R., Fischer, S., Macroeconomics, 2005

56

Elemente de econometrie

n tabelul urmtor sunt prezentate valorile PIB


real/locuitor i ale salariului mediu real din perioada 19922005, nregistrate n cazul Romniei. Cei doi indicatori sunt
exprimai n preurile anului 1985.
Anul
PIB real/locuitor
Salariul real/locuitor
(X), mii RON
(Y), RON
1992
35,892
2819
1993
36,517
2841
1994
36,617
2858
1995
36,325
2877
1996
34,093
3018
1997
32,093
2933
1998
27,952
2193
1999
25,924
1973
2000
26,349
1787
2001
27,406
1777
2002
29,420
1955
2003
30,672
2045
2004
28,635
1629
2005
26,588
1897

Capitolul 3 Regresia liniar simpl

57

Figura 3.1. Corelaii dintre PIB/locuitor i salariul mediu


real
Graficul prezentat evideniaz o dependen liniar
ntre cele dou variabile. Salariul mediu pe economie este
direct corelat cu performanele economiei, msurate prin
nivelul PIB/locuitor. Dependena dintre cele dou variabile
este stochastic. Vom scrie modelul liniar de regresie.
Considerarea variabilei reziduale n cadrul acestui model este
inevitabil, deoarece nivelul salariului mediu din economie
este o mrime determinat n mod cert de performanele
generale ale economiei, precum i de ali factori, care sunt
cuantificai prin termenul rezidual. Ali factori care
influeneaz salariul mediu pot fi: nivelul de instruire, vrsta
persoanei, regiunea, profesia, domeniul etc.

58

Elemente de econometrie

3.2. Modele liniare de regresie rezultate din transformri


de modele neliniare
Exist diverse modele unifactoriale neliniare, care
sunt liniarizate prin transformri ce sunt aplicate variabilelor
modelului de regresie. Astfel de modele neliniare
transformate n modele liniare sunt:
b
- y i a xi se transform ntr-un model liniar prin
logaritmarea celor doi termeni ai egalitii de mai sus:
log y i log a b log xi
(3.5)
Rezult un model liniar n raport cu variabilele
log yi i log xi .
- Modelul exponenial sau modelul log definit prin
relaia:
yi = a * bx
(3.6)
se liniarizeaz prin logaritmare, rezultnd modelul
liniar:
log y i log a xi log b
(3.7)
Utilizarea modelului se recomand cnd punctele
( x i , log y i ) i 1, n sunt n jurul unei drepte.
O serie de modele neliniare nu pot fi scrise sub forma
unor modele liniare prin aplicarea unor transformri
elementare.
n alte cazuri, pentru estimarea parametrilor se
folosesc alte tehnici de estimare. Neputnd fi liniarizat prin
transformri elementare, estimarea parametrilor se face prin
metode numerice.

Capitolul 3 Regresia liniar simpl

59

3.3. Prezentarea modelului liniar de regresie


Estimarea modelului liniar de regresie, se face pe baza
seriilor de date pentru cele dou caracteristici. Acestea sunt
reprezentate prin vectorii:

x1
x
2

.
x
.
.

x n

pentru

caracteristica

explicativ

(factorial).

y1
y
2

.
y
.
.

y n
(rezultativ).

pentru

caracteristica

explicat

60

Elemente de econometrie

Un model liniar de regresie presupune cunoaterea:


- metodelor folosite pentru estimarea celor doi
parametri;
- metodelor
utilizate
pentru
testarea
proprietilor estimatorilor modelului de
regresie;
- principalelor aspecte privind folosirea
modelului de regresie n efectuarea de
previziuni.
n definirea regresie liniare sunt considerate o
serie de ipoteze. Lund n considerare relaia yi = a * bxi se
observ c valoarea estimat a variabilei rezultative,
estimatorilor parametrilor modelului i proprietile acestora
depind de caracteristicile variabilei independente i
proprietile variabilei reziduale. Cele patru ipoteze se refer
la variabilele ce definesc modelul de regresie, precum i la
variabila rezidual.
a) Seriile de date nu sunt afectate de erori de
nregistrare
Ipoteza postuleaz caracteristicile seriilor de valori ce
sunt folosite pentru estimarea parametrilor. Plecm de la
faptul c estimarea parametrilor se realizeaz pe baza unui
eantion de valori ( xi , y i ) i 1, n , ce reprezint valori pentru
cele dou variabile. Stabilirea funciei analitice folosite
pentru analiza dependenei dintre cele dou variabile are la
baz un numr mare de observaii statistice, astfel nct
estimarea parametrilor se fundamenteaz pe legea numerelor
mari. Considerm c valorile pentru cele dou variabile nu
sunt afectate de erori semnificative de msur care s
distorsioneze calitatea estimatorilor parametrilor.

Capitolul 3 Regresia liniar simpl

61

n cazul modelului clasic de regresie se consider c


valorile caracteristicii factoriale sunt deterministe (valori
fixate). Valorile caracteristicii rezultative sunt stocastice.
Aceast proprietate este important n definirea i
stabilirea proprietilor modelului liniar de regresie. Vom
spune c valorile caracteristicii factoriale sunt nestocastice
dac fiecrei valori a acestei caracteristici i corespunde o
familie de valori ale caracteristicii rezultative. Se calculeaz,
pentru fiecare valoare xi a caracteristicii factoriale, o medie a
familiei caracteristicii rezultative i se determin seria de
valori E Y X xi , i 1, n .
Pentru fiecare valoare fixat
a caracteristicii
factoriale, variabila rezidual este de medie zero, respectiv:
E i X xi 0 , pentru orice i
(3.8)
Pe baza acestei afirmaii rezult c ceilali factori
nenregistrai, cu excepia caracteristicii factoriale, nu au o
influen sistematic asupra mediei caracteristicii rezultative.
Dac ipoteza este satisfcut de modelul liniar de regresie,
putem scrie:
E Y X xi b axi
(3.9)
b) Ipoteza de homoscedasticitate - dispersia
reziduului este constant
Aceast proprietate arat c distribuiile condiionale
(yi/x=xi) au aceeai dispersie, reprezentat prin egalitatea
urmtoare:
var i X xi 2 , este constant pentru orice i.
(3.10)
Dac variabilele reziduale nu satisfac aceast
proprietate, vom spune c modelul de regresie este
heteroscedastic i variabilele reziduale au variane diferite:

62

var i X xi i2 .

Elemente de econometrie

(3.11)

c) Lipsa corelrii reziduurilor


Aceast proprietate exprim faptul c ntre termenii
reziduali nu se manifest fenomenul de covarian. Aceast
proprietate poate fi scris sub forma:
cov( i , j ) 0 , pentru orice i j .
(3.12)
Dac variabila rezidual ndeplinete ipotezele b i
c, rezult relaia:

0, i j

cov( i , j )

,i j
2

(3.13)

O situaie diferit este atunci cnd variabila rezidual


prezint o autocorelaie de ordinul nti, adic:
t t 1 u t .
(3.14)
unde ut este zgomot alb.
d) Necorelarea variabilei reziduale cu variabila
independent.
n cazul cnd aceast ipotez este ndeplinit, putem
scrie:
cov( X , j ) 0 , pentru orice j, ceea ce nseamn c o
cretere a valorilor variabilei factoriale nu duce automat la un
spor al valorilor variabilei reziduale.

Capitolul 3 Regresia liniar simpl

63

Valorile reziduale sunt distribuite dup o repartiie


2
normal, de medie 0 i dispersie x . Pentru variabila
rezidual vom scrie atunci c i N (0, 2 ) .
Modelul liniar de regresie se prezint n graficul 3.2.:

y i b axi

p(
)
y

x1

x2
y

Figura 3.2. Modelul clasic liniar de regresie


Pe baza ipotezelor prezentate definim modelul liniar
de regresie printr-una din cele dou forme echivalente:
a) y i b a xi i , i = 1,..,n
Ipotezele sunt formulate asupra variabilei reziduale:

64

Elemente de econometrie

E i 0

0, i j

,i j

cov i , j

N 0, 2

(3.15)

b) y i b a xi i , i = 1,..,n
Ipotezele sunt formulate asupra variabilei rezultative:

E y i X x i b a xi

0, i j

cov yi, yj

,i j
y N b a x 2
i
i

(3.16)

Cnd ntre cele dou variabile exist o dependen


liniar, folosind serii de date (yi,xi), i 1, n , valorile
variabilei rezultative sunt estimate prin relaia:
y i b axi .
(3.17)
iar seria reziduurilor se estimeaz utiliznd formula:

Capitolul 3 Regresia liniar simpl

65

ei y i y i y i (b axi ) .

(3.18)
Apreciem c seria reziduurilor satisface egalitatea:
n

e
i 1

0.

(3.19)

3.4. Estimarea (determinarea) parametrilor modelului


liniar
3.4.1. Utilizarea metodei celor mai mici ptrate n estimarea
parametrilor

Valorile caracteristicii rezultative sunt estimate


folosind relaia:
y i b axi ,

(3.20)

unde a i b sunt estimatorii parametrilor dreptei de


regresie.
Valorile reale ale caracteristicii rezultative sunt egale
cu estimaia obinut cu ajutorul modelului de regresie,
corectat cu eroarea rezidual, adic:
y i y i ei
(3.21)
Estimarea parametrilor are la baz
condiia ca suma ptratelor diferenelor dintre
valoarea real i cea estimat prin modelul de
regresie s fie minim:
n
(3.22)
, b min ei2
min

a ,b

min

a , b

a ,b

yi b axi

66

Elemente de econometrie

Condiiile de optim ale funciei conduc la urmtoarele


ecuaii:

a, b

a 2 yi b ax x 0
a, b
2 yi b ax i 0
i
b
i

(3.23)
Ecuaiile sunt stabilite aplicnd metoda momentelor.
Cele dou ecuaii se obin dup cum urmeaz:
- prima ecuaie rezult din condiia E i 0 ,
definind egalitatea:
1
ei 0 sau
n i

0;

(3.24)

a doua ecuaie a sistemului de ecuaii se


stabilete plecnd de la ipoteza de necorelare a
seriilor valorilor variabilei factoriale cu cea a
valorilor variabilei reziduale ( cov X , 0 ),
avnd egalitatea:

1
xi ei 0 .
n i

(3.25)

n vederea determinrii celor doi estimatori se rezolv


sistemul liniar de ecuaii:

Capitolul 3 Regresia liniar simpl


nb a

67

x y

xi b a

x y
i

(3.26)

Testarea dac soluia sistemului ndeplinete condiiile


de ordinul al doilea se face prin determinarea derivatelor de
ordinul al doilea ale funciei:

2 (a , b) / ab
=
2 (a , b) / b 2

) / a
2 ( a
, b
2

2 ( a
) / a
2
, b
b

2 x i

2 x i2
i

2 x i
i

2n

(3.27)
Matricea astfel definit are dou proprieti:
- este pozitiv definit;
- determinantul matricei este pozitiv:

4n xi2 4
i

xi

4n

(x

x)2 0 .

(3.28)

Relaiile de calcul ale celor doi estimatori, a i b ,


rezult din rezolvarea sistemul liniar de ecuaii.
Coeficientului pantei dreptei de regresie se obine din
relaia:
n

x y
i 1
n

x
i 1

2
i

nx y

nx

x
i 1

x yi y

x
i 1

.
2

68

wi

Elemente de econometrie

xi x
n

xi x

(3.29)

i 1

Estimatorul pantei dreptei de regresie este o


combinaie liniar a valorilor caracteristicii rezultative:
n

a wi y i .
i 1

(3.30)

Seria de valori wi i 1,n are proprietile:


n
n
1
w

i n
xi x 0 ;
Proprietatea a: i 1
2 i 1
xi x
i 1

Proprietatea b:
n
n
1
2
2

xi x 0

i
2
i 1
i 1
;
n
2
xi x
i 1

Proprietatea c:

i 1

i 1

wi xi wi xi x 1 .
(3.31)

Formula de calcul a estimatorului


termenului liber al dreptei de regresie se
determin prin rezolvarea sistemului de ecuaii
sau innd seama de faptul c dreapta de regresie
trece prin centrul norului de puncte, adic:
b a x y .

(3.32)

Estimatorul parametrului b se obine din relaia:


.
(3.33)

b y ax

Capitolul 3 Regresia liniar simpl

69

Astfel, pentru estimarea parametrilor modelului de


regresie s lum situaia n care:
Salariul mediu real=f(PIB real/locuitor)
Calculm prin metoda celor mai mici ptrate
2
mrimile: xi , y i , xi y i , x i
Sistemul liniar de ecuaii devine:

14b 434,482a 3260

434,482b1026595a 13706,19

Prin rezolvarea sistemului de ecuaii obinem cei doi


estimatori:
b 1277,8624 i a 115,2580 .
Funcia de regresie este acum definit:
y i 1277,8624 115,258 xi .
Calculele intermediare i seriile de date estimate
folosite n sistemul de ecuaii sunt cuprinse n tabelul
urmtor:
Anii

xi

yi

xiyi

xi2

i
y

1
2
3
4
5
6
7
8
9
10

35,892
36,517
36,617
36,325
34,093
32,093
27,952
25,924
26,349
27,406

2819
2841
2858
2877
3018
2933
2193
1973
1787
1777

101164
103737
104639
104494
102894
94115
61290
51154
47087
48690

1288,259
1333,506
1340,782
1319,472
1162,303
1029,944
781,3272
672,0616
694,2738
751,0730

28514,0
2931,0
2942,5
2908,8
2651,6
2421,1
1943,9
1710,1
1759,1
1880,9

-40,4710
-90,2578
-84,8109
-32,1626
366,5001
511,4994
248,8215
263,1102
27,9592
-104,2439

70

Anii
11
12
13
14
TOTAL

xi

yi

29,420
30,672
28,635
26,588
434,482

1955
2045
1629
1897
32600

xiyi
57524
62715
46652
50441
1036595

xi2
865,5274
940,7704
819,9827
706,9039
13706,1900

Elemente de econometrie

i
y
2113,0
2257,3
2022,6
2199,3
32600,2

i
-157,7342
-212,6428
-393,3979
-302,1692
0,0000

Utilizarea metodei celor mai mici ptrate are i unele


inconveniente, dintre care amintim:
- nu ofer rezultate acceptabile dac nu sunt
satisfcute ipotezele formulate;
- notnd prin a n , b n estimatorii determinai pe
baza seriei (xi, yi), i 1, n iar prin a n 1 , b n 1
pe cei evaluai pentru seria de valori (xi, yi),
i 1, n 1 , rezult c ntre cele dou perechi
de estimatori nu exist o relaie simpl de
recuren;
- estimatorii sunt distorsionai dac seriile de
date prezint schimbri majore, sub forma
rupturilor de nivel.
3.4.2. Utilizarea metodei verosimilitii maxime n estimarea
parametrilor

Aplicarea metodei celor mai mici ptrate a luat n


considerare o serie de ipoteze asupra variabilei reziduale i ,
care nu s-au referit la forma repartiiei variabile aleatorii i .
Metoda verosimilitii maxime are la baz tocmai
specificarea funciei de repartiie reziduale.
Considerm c variabila rezidual are proprietatea:

Capitolul 3 Regresia liniar simpl

i N 0, f i

71

i2
2 2

(3.34)

~
i de aici rezult yi N b , a~xi , ~ . Modelul de
regresie devine specificat cnd sunt determinai parametrii
~
~
~, b
a
i , .
Avem, aadar, relaia:

f ( yi / xi )

~ ~
( yi b a
xi ) 2
2 2

(3.35)

Pentru modelul liniar de regresie, funcia de


verosimilitate este dat de relaia:
n
~
a~, b , ~2 f ( y i / xi ) .
(3.36)

i 1

Utiliznd formula densitii de repartiie, funcia de


verosimilitate se poate scrie sub forma:
~
( yi b a~xi ) 2

(3.37)
2 2

i 1

~, b~, ~ 2
a

1
e
2

Relaiile de calcul pentru estimatorii parametrilor


modelului de regresie, i pentru cel al dispersiei variabilei
reziduale rezult din condiia:

~ ~2
~, b
max a
,
~ ~2
~
a , b ,

(3.38)

Scriem cele trei condiii de maximum al funciei de


verosimilitate:
l
l
l
0,
0,
0.
(3.39)
a
b
2

72

Elemente de econometrie

Mai simplu, determinarea formei estimatorilor se face


utiliznd condiiile de maximum pentru logaritmul funciei de
verosimilitate, adic:
n
1 n
L a, b, 2 ln l a, b, 2 ln(2 ) ln 2 2 ( y i b axi ) 2
2
2 i 1
.
(3.40)
Pe baza proprietii funciei logaritm, obinem:

~ ~2
~ ~2
~, b
~, b
max a
, max L a
,
~ ~2
~ ~2
~
~
a , b ,
a , b ,

(3.41)

Constatm c i prin metoda verosimilitii maxime


acelai set de estimatori pentru parametrii modelului ca n
cazul aplicrii metodei celor mai mici ptrate.
n cazul utilizrii metodei verosimilitii maxime se
obine direct i estimatorul dispersiei variabilei reziduale.
Expresia acestui estimator rezult din condiia

log ~2
0.
~2

Dup efectuarea calculelor se obine ecuaia pentru


determinarea formulei limitei estimatorului varianei
variabilei reziduale, respectiv:

log ~2 n 1 1 1
~2 ~4
2 2
~2

(y
i 1

~
b a~xi ) 2 0 .

(3.42)

innd seama de formula de calcul a erorilor de


ajustare, dispersia variabilei reziduale se calculeaz pe baza
formulei:
1
~ ei2 .
(3.43)
n i

Capitolul 3 Regresia liniar simpl

73

3.5. Proprietile dreptei de regresie


Relaii ntre parametrii dreptelor reciproce
Considerm dreapta de regresie definit pe baza
relaiei:
d1 : y i = b + axi
Definim dreapta de regresie reciproc d2 utiliznd
relaia:
xi = b + ayi .
Determinarea formulei estimatorului coeficientului
pantei dreptei de regresie se face pe baza relaiei:
a

cov( x, y )
var( x)

(3.44)

Egalitatea rezult din relaia de calcul a estimatorului


dac se mpart numrtorul i numitorul la volumul
eantionului. Pe baza relaiei de mai sus, rezult c
estimatorul i covariana calculat pentru cele dou variabile
au acelai semn, stabilind c.
- ntre parametrii pantelor de regresie exist relaia:
a
var( y )

.
a'
var( x )

(3.45)

- Cele dou drepte, n acelai plan, se intersecteaz n


centrul de greutate al norului de puncte, deci cele dou drepte
trec prin punctul G x , y .
Afirmaia se poate demonstra dac vom ine seama de
faptul c pentru fiecare model de regresie sunt valabile
egalitile:
- pentru modelul de regresie definit de d1 :
n

(y
i 1

b axi ) 0 ;

74

Elemente de econometrie

pentru al doilea model de regresie, definit prin


n

d1 :

(x
i 1

b'a ' y i ) 0 .

Dac mprim la n termenii celor dou egaliti, care


trece prin punctul G x , y , obinem sistemul:

ax b y ( d 1 )

a ' y b' x (d 2 )

(3.46)

Valoarea (mrimea) unghiului format de cele dou


drepte arat intensitatea legturii dintre cele dou variabile.
Cum dreptele coincid n cazul legturii reciproce dintre cele
dou variabile, rezult c, cu ct mrimea unghiului dintre
acestea este mai mic, cu att legtura liniar reciproc dintre
cele dou caracteristici este mai puternic.
y

d2
d1

x
Figura 3.3. Unghiul format din dreptele d1 i d2

Capitolul 3 Regresia liniar simpl

75

Obinem apoi formulele de calcul pentru termenii


liberi ai celor dou drepte dac se cunosc cei doi coeficieni
ai pantelor de regresie: b y ax i b' x a ' y .
n final, din ecuaiile celor dou drepte i din relaiile
de mai sus obinem formele pentru cele dou drepte de
regresie:
cov( x, y )
( xi x ) ,
var( x)
cov( x, y )
xi x
( yi y ) .
var( y )

yi y

(3.47)

Din ecuaia dreptei d2, x = b + ay, determinm


ecuaia

1
b'
x , care definete dreapta care se
a'
a'

reprezint n acelai plan cu dreapta d1.


Unghiul format prin intersecia dreptelor reprezentate
n acelai plan are tangenta calculat pe baza relaiei:
1
a
1 aa '
tg a '

1
a ' a
1 a
a'

(3.48)

- Semnul coeficienilor pantelor din modelul de


regresie i modelul reciproc de regresie coincid.
Semnul parametrului pantei de regresie exprim
sensul dependenei dintre cele dou variabile. n raport cu
semnul estimatorului parametrului a, distingem:
- dac a >0, dependena ntre cele dou
variabile este direct;
- dac estimaia parametrului a este egal cu
zero, ntre cele dou variabile nu exist o
dependen liniar;

76

Elemente de econometrie

dac coeficientul pantei de regresie este a <0,


atunci ntre cele dou variabile se manifest o
dependen liniar invers.
Semnul coeficientului pantei dreptei de regresie
coincide cu cel al semnului varianei calculate pentru cele
dou variabile.
- Estimatorul coeficientului pantei dreptei de regresie
determinat prin aplicare metodei celor mai mici ptrate este
un estimator nedeplasat i de dispersie minim. Deci, pentru
estimatorul a sunt valabile egalitile:
-

E (a ) a

var(a )

2
n

x
i 1

(3.49)

Pentru a demonstra cele dou relaii, lund n


considerare relaia de calcul a estimatorului, se observ c
acesta este o combinaie liniar a seriei de valori y1, y2, ,
y1n. Vom folosi cele trei proprieti ale seriei de valori
( wi ) i 1,n

Vom scrie relaia echivalent a estimatorului:


(3.50)
Evidenierea ipotezei c estimatorul obinut n urma
aplicrii metodei celor mai mici ptrate este nedeplasat, se
aplic operatorul de medie termenilor egalitii. Dac
E ( i ) 0 , pentru orice i, se obin progresiv egalitile:
E (a ) E (a) E ( wi i ) a wi E ( i ) a
(3.51)
i

Evidenierea celei de-a doua egaliti din cadrul


proprietii b se realizeaz prin calculul dispersiei
estimatorului considernd relaia:

Capitolul 3 Regresia liniar simpl

77

var(a) E (a a) 2 var( wi i ) E(( wi ) 2 E ( wi2 i2 wi w j i j )


i

i, j
i j

w E ( ) wi w j E i j
2
i

2
i

i, j
i j

(3.52)
Pe baza ipotezei d (variabilele reziduale nu sunt
corelate), i a ipotezei homoscedasticitii variabilelor
reziduale, rezult:

2
var(a ) w w
i
i
( xi x )
2
i

2
i

(3.53)

Din ultima relaie, rezult c disperia estimatorului


este cu att mai mic cu ct dispersia caracteristici factoriale
este mai mare.
Teorema Gauss-Markov se poate demonstra
considernd estimatorul a * definit ca o combinaie liniar a
seriei de valori nregistrate pentru caracteristica rezultativ.
Rezult egalitatea: a * ai y i . Este evident c ponderile
combinaiei liniare din ultima relaie coincid cu cele ale seriei
( wi ) i 1,n . Deoarece y i b axi i , pentru toi indicii i,
rezult:
a* b ai ai xi ai i
(3.54)
i

Dar a doua restricie a estimatorului a * se refer la


faptul c este nedeplasat, rezult dou proprieti ce sunt
satisfcute de sistemul de ponderi ( a i ) i 1, n , respectiv:
-

a x

0.

Pe baza acestor egaliti, rezult c estimatorul se


obine prin urmtoarea relaie:
a* a ai i .
(3.55)
i

78

Elemente de econometrie

Din relaia (3.55) se obine dispersia noului estimator:


var(a * ) 2 ai2
(3.56)
i

Comparm dispersiile celor doi estimatori nedeplasai


ce sunt exprimai ca funcii liniare ale valorilor variabilei
rezultative. Observm c ntre seriile de ponderi ale celor doi
estimatori sunt verificate relaiile ai = wi + di pentru orice i.
nlocuind apoi ai n ultima relaie, obinem:
var(a* ) 2 ( wi2 d i2 2 wi d i ) .
(3.57)
i

Demonstrm c a treia sum din ultima relaie este


nul, innd seama de proprietile sistemului de ponderi ale
primului estimator i de restriciile impuse sistemului de
ponderi pentru cel de-al doilea estimator. Se obine rezultatul
urmtor:
i xi ai
1
i wi d i i wi (ai wi ) ( x x ) 2 ( x x ) 2 0 .
i
i
i

(3.58)
Din acest rezultat deriv inegalitatea ntre varianele
celor doi estimatori:
var(a* ) 2 wi2 2 (ai wi ) 2 var(a* )
(3.59)
i
i
- n cazul n care variabila rezidual
repartiia normal, estimatorul urmeaz i el o
1

normal, de medie a i abatere standard


.
n x
Am notat prin x abaterea standard a
factoriale, iar reprezint abaterea standard a
reziduale.

urmeaz
repartiie

variabilei
variabilei

Capitolul 3 Regresia liniar simpl

79

Cea mai bun estimaie a dreptei de regresie se obine


prin reducerea pe ct posibil a abaterii standard a
estimatorului pantei de regresie. Reducerea acestei mrimi
are la baz posibilitatea de a scrie indicatorul sub forma:

1
a .
(3.60)
n x
Aadar, abaterea standard este direct proporional cu
dispersia observaiilor y1, y2, , y1n n jurul dreptei de
regresie i invers proporional cu numrul de observaii i
dispersia valorilor x1, x2, , x1n.
Cu ct valorile variabilei factoriale sunt mai
dispersate, cu att precizia estimrii este mai mare (gradul
de dispersare a seriei valorilor caracteristicii exogene este
msurat prin abaterea medie standard a seriei).
Estimatorul termenului liber al dreptei de regresie
obinut prin aplicarea metodei celor mai mici ptrate este un
estimator nedeplasat i de dispersie minim.
Se definesc urmtoarele dou relaii:
E (b) b i

var(b)

2
x2
1 2 .
n
x

(3.61)

Norul de puncte determin posibilitatea de a scrie


egalitile:
1
1
1
b y ax y i ax (b axi i ) ax b a a x i
n i
n i
n i

(3.62)

80

Elemente de econometrie

Din relaia (3.62) rezult c abaterea dintre parametru


i estimator se exprim ca o combinaie liniar de variabile
reziduale:
1
1

b b x wi i i wi x i C i i
n i
n
i
i
i

(3.63)
Ponderile combinaiei liniare sunt C i wi x

1
.
n

Pentru a demonstra proprietile estimatorului


termenului liber al modelului liniar de regresie considerm
proprietile seriei de valori (C i ) i 1, n , respectiv:
-

C
i

x wi 1 1 ;
i

1
;
n
x2 n 1
C

;
- i
n
x2
i
- cov(C i , i ) 0 .

- E (C i )

(3.64)

Demonstrm c estimatorul termenului liber al


modelului de regresie este nedeplasat, pornind de la faptul c
ipotezele b i f ale modelului liniar de regresie, se aplic
operatorul de medie, rezultnd c E (b b) 0 , ce se poate
scrie sub forma:
E (b) b
(3.65)
Pentru calculul dispersiei vom ine seama de faptul c
estimatorul este nedeplasat i se obine relaia:
var(b) E (b b) 2 E ( C i i ) 2
i

(3.66)

Capitolul 3 Regresia liniar simpl

81

Considernd ipotezele b i f ale modelului liniar


de regresie, rezult forma de prezentare a dispersiei acestui
estimator:

var(b) E

Ci i
i

x2
2
2 1

i n S
i
xx

2 E

(3.67)
Acest estimator satisface teorema Gauss-Markov, ce
se poate demonstra ca i n cazul determinrii estimatorului
coeficientului pantei de regresie.
- Matricea de covarian a estimatorilor modelului
liniar de regresie a i b este reprezentat prin:

a ,b

S xx
var(a ) cov(a , b)
2

x
cov(b, a ) var(b)

S xx

x
S xx
1 x2

n S xx

(3.68)
Definirea matricei de covarian a estimatorilor are n
vedere relaiile:
cov(a , a ) var(a ), cov(b, b) var(b), cov(a , b) cov(b, a )

.
Formula de calcul a covarianei celor doi estimatori
ine seam de ipotezele modelului clasic de regresie,
rezultnd:
cov(a , b) E ( a a )(b b) 2 E wi i C i i 2 wi C i

2
1

2 wi wi x 2 x wi2
n
n

wi
i

2 x
S xx

82

Elemente de econometrie

(3.69)
- Estimatorul a converge n probabilitate ctre
parametrul a. n mod similar, estimatorul termenului liber
al modelului clasic de regresie, b , tinde n probabilitate
ctre b. Afirmaiile sunt evidente dac avem n vedere c:
2
var(a ) 2 n 0
n n
(3.70)
2
2

x
var(b) 1 2 n 0
n x
Covariana lui a i y , pentru xi fixat,
este nul:

(3.71)
cov a , y cov
w y , y
w cov y , y

.
Dar

2
1
1
cov( y i , y ) cov y i , y j cov( y i , y j ) ,
n j
n
j n

ntruct yi i yj sunt variabile independente, dac i j. vom


avea atunci, lund n considerare proprietile seriei de valori
( wi ) i 1,n , urmtoarele egaliti:
y2 y2
cov a , y wi

(3.72)
wi 0 .
n
n i
i

3.6. Coeficientul liniar de corelaie


Vom examina, prin intermediul coeficientului liniar de
corelaie, dac ntre variabilele modelului de regresie exist o
dependen liniar semnificativ. Considerm c avem un
eantion de forma ( x i , y i ) i 1, n . Prin coeficientul liniar de

Capitolul 3 Regresia liniar simpl

83

corelaie vom pune n eviden prezena sau absena legturii


liniare dintre cele dou variabile ale modelului de regresie,
sensul legturii, precum i intensitatea acesteia.
Pentru a studia caracteristicile dependenei liniare
dintre dou se utilizeaz covariana. Aceast msur se
utilizeaz mai rar deoarece prezint dou neajunsuri majore:
- covariana nu este un indicator normalizat.
Nencadrndu-se ntr-un anumit interval de
valori, indicatorul nu va furniza informaii
exacte pentru caracterizarea intensitii
dependenei;
- depinde de unitile de msur ale celor dou
variabile i satisface relaia:
x y cov( x, y ) y x .
(3.73)
De aceea, un indicator care s nlture cele dou
inconveniente trebuie s plece de la domeniul de valori al
covarianei:
x y cov( x, y ) y x .
(3.74)
Dac mprim termenii inegalitii prin y x ,
rezult:
1

cov( x, y )

1.
(3.75)
y x
Am obinut astfel un nou indicator ce depinde de
unitile de msur ale celor dou variabile, fiind i o msur
statistic normalizat denumit coeficient liniar de corelaie,
introdus n statistic de K. Pearson. Indicatorul se calculeaz
prin relaia:
i ( xi x )( y i y )
(3.76)
r
n x y

84

Elemente de econometrie

Coeficientul liniar de corelaie este eficient pentru


msurarea intensitii dependenei dintre variabile numai
dac este de tip liniar.
n continuare vor fi prezentate proprietile
coeficientului liniar de corelaie, stabilind relaiile de calcul
pentru estimatorii parametrilor modelului liniar de regresie n
funcie de valoarea acestuia. Rezumativ putem evidenia:
a) coeficientul liniar de corelaie este o msur
simetric, verificndu-se egalitatea r(x,y) = r(y,x).
b) este invariant la transformarea datelor i
schimbarea originii i unitii seriilor de date.
Dac dispunem de seriile de date ( x i , y i ) i 1, n i
(u i , vi ) i 1, n , ce satisfac relaiile ui = b + axi i vi = c + dyi ,
cu a, d R* , atunci coeficienii liniari de corelaie calculai
pentru cele dou serii sunt egali.
Considernd i proprietile covarianei i ale
dispersiei, rezult:
r

cov(u , v) ad cov( x, y )

r ( x, y ) .
u v
a x d v

(3.77)

Analiza modelului de regresie se poate face i prin


yi y
xi x
utilizarea transformrilor u i
i vi
.
y
x
c) Estimatorul coeficientului pantei dreptei de regresie
se calculeaz pe baza relaiei:
y
a r
(3.78)
x
Pentru dreapta reciproc x i b' a ' y i , vom utiliza relaia:

a ' r x .
(3.79)
y

Capitolul 3 Regresia liniar simpl

85

Constatm c a i r au acelai semn putnd distinge


trei cazuri:
- dac r > 0, atunci a > 0, dependena dintre
cele dou variabile este direct;
- cnd r = 0 i a = 0, i nu avem dependene
liniare ntre variabile (modelul de regresie
coincide cu o dreapt paralel cu axa ox);
- cnd r > 0, estimatorul pantei dreptei de
regresie va avea o valoare negativ;
dependena fiind invers.
d) Dac variabilele modelului liniar de regresie sunt
liniar independente, atunci valoarea coeficientului liniar de
corelaie este zero.
Reciproca nu este ntotdeauna adevrat, deoarece
valoarea nul a coeficientului liniar de corelaie calculat
pentru variabilele modelului nu implic n mod automat i
independena variabilelor.
Prima parte a afirmaieise deduce din egalitatea:
y x
r2.
r
a a ' r
(3.80)

x
y

Variabilele sunt independente dac dreptele de


regresie reciproce sunt perpendiculare. Va rezulta c cei doi
coeficieni satisfac egalitatea a a ' = 0. Deci, n cazul n care
variabilele sunt liniar independente, r = 0.
e) Coeficientul liniar de corelaie nu este msur
tranzitiv.
Astfel, dac x este o variabil y, iar la rndul su y este
corelat cu z, nu implic n mod obligatoriu c ntre x i z
exist o dependen linear.
f) Pentru dou variabile se verific relaia r2 = 1
dac i variabilele X i Y sunt corelate funcional.

86

de

Elemente de econometrie

Prima parte a afirmaiei se demonstreaz innd seama


y x
2
relaia a a ' r r r , cnd vom obine

x
y

egalitatea a a ' 1 . Din aceast egalitate rezult c cele dou


drepte reciproce sunt paralele, fiind corelate funcional.
Reciproca acestei afirmaii se demonstreaz dac considerm
c cele dou variabile sunt independente. Dreptele de regresie
reciproce sunt paralele i satisfac relaia r2 = 1.
Cu ct r2 este mai mare, cu att intensitatea
dependenei liniare dintre cele dou variabile este mai
puternic. Valoarea coeficientului liniar de corelaie este
invers proporional cu unghiul dintre cele dou drepte
reciproce de regresie.
g) Cnd variabilele X i Y sunt liniar
independente, atunci coeficientul liniar de
corelaie i raportul de determinare satisfac
egalitatea:
(3.81)
y i y 2

S
R2 i
a 2 xx r 2 .
2
S yy
yi y
i

Valoarea coeficientului
interpreteaz pe baza relaiei:
r2

liniar

de

corelaie

S /n
SPE
SPR
1
1
.
SPT
SPT
S yy / n

se

(3.82)

2
unde am notat SPE y i y , cuantific acea parte a
i

dispersiei seriei explicate prin intermediul variabilei de


regresie;

2
SPR y i yi reprezint
i

acea

parte

dispersiei explicat prin aciunea altor factori dect a

Capitolul 3 Regresia liniar simpl

87

2
variabilei factoriale X; SPR y i y msoar aciunea
i

tuturor factorilor ce determin variaia seriei pentru variabila


Y.
Proprietatea nu este reciproc. Dac dependena dintre
dou variabile este liniar i dac pentru msurarea
intensitii dependenei se calculeaz ambii indicatori, atunci
acetia verific relaia de ordine:
0 r 2 R2 1

Dac seria de date se prezint sub forma unui tabel cu


dub intrare, ( xi , y j , nij ) ij 1,n , coeficientul de corelaie se
calculeaz din relaia:
r

(x

x )( y i y ) nij

i, j

n x y

(3.83)

Avnd seria de valori ( x i , y i ) i 1, n , realizrile


unui cuplu de variabile (X,Y) distribuite normal, atunci r
reprezint pentru fiecare serie de valori, realizrile variabilei
aleatorii .
n cazul n care cele dou variabile sunt liniar independente,
= 0, iar relaia:
t

1 2

n 2 t n2 .

(3.84)

unde tn-2 este distribuia Student cu n-2 grade de libertate.


Pentru interpretarea valorilor coeficientului liniar de
corelaie obinut pentru o serie de valori avem n vedere:
- utilizarea indicatorului pentru msurarea intensitii
dependenei dintre cele dou variabile se va baza pe
dimensiunea eantionului care trebuie s fie suficient de
mare. Dac variabilele modelului sunt independente,

88

Elemente de econometrie

pentru un volum al eantionului mai mare ca 100,


variabila este distribuit normal:

1
N 0,

n 1

(3.85)

- pentru a fi o msur semnificativ a intensitii


dependenei, indicatorul se calculeaz numai dac
punctele ( x i , y i ) i 1, n sunt dispuse de-a lungul unei
drepte.
- coeficientul liniar de corelaie este calculat pentru un
eantion de valori, iar semnificaia acestuia va fi apreciat
numai n context probabilistic. Limitele extreme ale
intervalului de valori sunt determinate de: volumul
eantionului i probabilitatea de garantare a rezultatelor.
Apar urmtoarele dou situaii:
Dac pragul de semnificaie este 5% , i avem
patru dimensiuni ale eantionului, putem aprecia astfel:
Cnd seria de date este de volum redus (n = 20),
coeficientul liniar de corelaie difer semnificativ de zero
dac r 0,46 ; dac volumul eantionului crete la 40,
rezult c r 0,32 ; cnd n = 50, valoarea limit se
micoreaz, rezultnd r 0,28 ; dac n = 100, avem
condiia r 0,20 .
Dac vom micora probabilitatea de garantare a
rezultatelor, la nivelul 10% , pentru aceast valoare a
pragului de semnificaie analiza pe cele patru dimensiuni ale
eantionului conduce la: pentru eantioanele de volum redus,
n = 20, este satisfcut condiia r 0,39 ; cnd n = 40,
r 0, 27 ; dac n = 50, r 0,24 ; dac volumul n = 100,
valoarea se reduce, satisfcnd relaia r 0,17 .
n concluzie, putem aprecia c pe msur ce volumul
eantionului crete, pentru un prag de semnificaie stabilit,
valoarea critic a coeficientului liniar de corelaie scade i

Capitolul 3 Regresia liniar simpl

89

valoarea critic a indicatorului, n cazul n care volumul


eantionului este stabilit, crete pe msur ce pragul de
semnificaie scade.
n cazul n care = 0, repartiia variabilei este
dificil de stabilit. n acest caz, pe msur ce valoarea lui se
ndeprteaz de zero, dispersia variabilei scade, iar repartiia
se ndeprteaz tot mai mult de o repartiie simetric.
n acest caz, caracteristicile variabilei sunt:
2 2

1 2
i var( R ) 1
E ( R ) 1
(3.86)
2n

n 1

n cazul n care seria de date este suficient de mare (n


> 25),
Z

1 1
1 1
1
.
lg
N lg
;
2 1
n3
2 1

(3.87)

Folosind coeficientul liniar de corelaie, vom spune c


variabilele modelului de regresie sunt liniar independente,
dac t p

r
n 2 t n2 .
1 r

Se calculeaz mrimea:
tp

r
1 r2

n2

(3.88)

Pentru testul bilateral se respinge ipoteza nul dac


este ndeplinit egalitatea t r t / 2 . n cazul testului
unilateral > 0 se respinge ipoteza nul dac t r t , iar
pentru < 0 se accept H1, dac t r t . Valoarea t se va
citi din tabelul repartiiei Student n condiiile stabilirii
pragului de semnificaie i pentru n-2 grade de libertate.

90

Elemente de econometrie

3.7. Analiza i interpretarea variabilei reziduale


n modelul liniar de regresie, i reprezint variabila
rezidual, iar ei sau i msoar ecartul dintre valoarea real
yi i valoarea ajustat prin modelul de regresie. Definim
ei y i y i .
Pentru a stabili o estimaie pentru cei doi parametri ai
dreptei de regresie vom determina o estimaie pentru
dispersia variabilei reziduale, cu urmtoarele proprieti:
- Pentru seria ecarturilor, suma termenilor acesteia
este egal cu zero. Vom scrie n acest caz urmtoarea
egalitate: i 0 .
i

Vom ine seama de formula de calcul a ecartului, de


formula estimatorului termenului liber i de faptul c suma
ecarturilor termenilor unei serii n raport cu media este zero,
rezultnd:

y
i

b a xi y i y a xi x 0
i

(3.89)
Proprietatea nu este valabil pentru seria variabilelor
reziduale, ci numai n cazul n care este ndeplinit ipoteza
E ( i ) 0 pentru toi indicii i.
Vom exprima ecartul unei valori fa de valoarea
ajustat n funcie de variabila rezidual, rezultnd egalitile:
ei y i y i (b b) (a a ) xi i
(3.90)

ax i

a
x
Considernd relaiile
,
a a wi i , obinem:
i

ei i ( xi x ) wi i .
i

(3.91)

Capitolul 3 Regresia liniar simpl

91

- Dispersia variabilei reziduale pentru modelul clasic


de regresie (parametrii sunt estimai prin metoda celor mai
mici ptrate) este estimat prin relaia:
2

1
ei2 .
n2 i

(3.92)

Vom lua n consideraie ipotezele ce stau la baza


modelului clasic de regresie: E ( i ) 0 , var( i ) 2 ,
cov( i , j ) 0, i j i cov( X , i ) 0 pentru toi indicii i.
Calculnd ei2 i aplicnd operatorul de medie, rezult pentru
fiecare indice i egalitatea:
2

E (ei2 ) 2 2 ( xi x ) 2 wk2 2 E i ( xi x ) wk k
n
k
k

2
2 ( xi x ) 2
n

1
k

2 2 xi x wi ( xi x ) wk ( xi x ) wi
n
k

.
(3.93)
Utiliznd operatorul de nsumare, innd seama de
proprietile seriei ( wi ) i 1,n , obinem:
E ( ei ) ( n 2) 2 .
(3.94)
i
Determinm estimatorul variaiei reziduale, ce se
ei2

compar cu estimatorul a 2 i
, estimator nedeplasat.
n
- Pentru modelul liniar de regresie, mrimea
dispersiei seriei ecarturilor (ei ) i 1, n este cu att mai mare cu
ct seria valorilor caracteristicii rezultative este mai mare, dar
mai mic dac dependena dintre cele dou caracteristici este
mai puternic.

92

Elemente de econometrie

ntre dispersia seriei ecarturilor, a valorilor


caracteristicii endogene i coeficientul liniar de corelaie se
verific egalitatea:
e2 (1 r 2 ) y2 .
(3.95)
Vom demonstra ultima relaie innd seam de faptul
c, n cazul n care ntre cele dou variabile dependena este
liniar, r 2
1 r2

SPE
, unde SPT = SPR + SPE. Deoarece
SPT

SPR
i din formula de calcul a dispersiei variabilei
SPT

reziduale obinem:

1 r
2

2
y

SPR SPT
2
SPT n

(3.96)

S-a calculat dispersia ecarturilor prin formula:


2

1
ei2 .

n i

(3.97)

- Din ipoteza de normalitate a reziduului, rezult:

n 2 xn22

(3.98)

Se poate determina un interval de ncredere pentru


dispersia variabilei reziduale dac se fixeaz un prag de
semnificaie , intervalul de ncredere fiind:
2
2
n 2 2 2 n 2 2 .
(3.99)

2
1
2
i 2 sunt valori furnizate de repartiia

2 pentru n-2

grade de libertate i un prag de semnificaie stabilit.


Prin reprezentarea grafic a punctelor de coordonate
( y i , ei ) i 1, n , putem verifica empiric dac este ndeplinit
ipoteza de homoscedasticitate. Prin reprezentarea grafic a
seriei de date apar dou cazuri: dac punctele definesc un nor
2
1

Capitolul 3 Regresia liniar simpl

93

de puncte, atunci nu este satisfcut ipoteza de


homoscedasticitate; iar cnd punctele sunt dispuse sub forma
unei benzi orizontale, ipoteza este valabil pentru seria de
date ( x i , y i ) i 1, n .

Capitolul 4
Estimatori si metode de
estimare
n precedentele capitole am subliniat faptul c
parametrii populaiei erau necunoscui. Am vzut c pot fi
estimai cu dou modaliti: estimatorul punctual i intervalul
de ncredere. Exist multe situaii n care precizarea unui
anumit interval pentru un parametru necunoscut nu este
suficient i se impune calculul unor estimri punctuale.
Atunci cnd selectm un estimator punctual, considerm c
estimarea obinut este, ntr-un anumit sens, o estimare
bun. Odat definit ceea ce nelegem printr-un estimator
bun, apare o problem legat de cum ar trebui s
identificm astfel de estimatori
n vederea considerrii unor proprieti ale
estimatorilor, vom considera mai multe valori pentru o
variabil aleatorie, X. Valorile X sunt definite prin distribuii
probabilistice. S presupunem c respectiva populaie deine,
printre caracteristicile sale, i parametrul . poate fi, de
exemplu, media populaiei sau dispersia populaiei.
S presupunem c trebuie s fie estimat dintr-un
eantion aleatoriu de n observri asupra lui X , pe care l
reprezentm sub forma (X1, X2, X3......Xn). Prin urmare, Xi
reprezint observarea i. Vom utiliza simbolul ca
estimator al lui adevrat. Un astfel de estimator se va reda
printr-o expresie sau formul care implic unele sau toate
valorile Xi. Aceasta nseamn c va fi o funcie a observrilor,
respectiv:

Capitolul 4 Estimatori i metode de estimare

95

^ ^

X1, X 2 , X 3. . X n
De exemplu, dac

(4.1)
^

ar fi media populaiei, atunci

un posibil estimator ar fi media eantionului, care este o


funcie a tuturor valorilor Xi. Aceasta nseamn :
X

X 1 X 2 X 3 ........ X n
n

Atunci cnd ne referim la relaii de genul celei din


(4.1) cu titlul de estimatori, dei de fapt nu facem dect s
substituim valorile de eantion n astfel de formule, este
denumit estimator numrul unitar pe care l obinem astfel.
Este important de reinut faptul c toi estimatorii ca
cel dat de (4.1) vor avea distribuii de selecie. Dac sunt
extrase mai multe astfel de eantioane, obinem o distribuie
de valori pentru
^

-E(

, cu propia sa medie E(

) i dispersie E[

)].

4.1. Estimatori pentru eantioane mici


Proprietile estimatorilor se pot grupa, n
funcie de mrimea eantionului, n dou categorii:
estimatori pentru eantioane mici i estimatori
pentru eantioane mari, sau asimptotice.

96

Elemente de econometrie

4.1.1. Estimator nedeplasat

Prima proprietate de mic eantion pe care am dori s


o dein estimatorii este aceea de a fi eantion nedeplasat. Am
abordat acest aspect anterior n legtur cu media i variaia
populaiei.
n general, se spune c un estimator

este

un estimator nedeplasat al parametrului dac:


E(

(4.2)

)=

Figura 4.1. Estimatorul nedeplasat


Dac un estimator ca cel dat de (4.2) nu este adevrat
atunci este definit ca fiind un estimator deplasat. Diferena

Capitolul 4 Estimatori i metode de estimare

dintre E(

97

) i este cunoscut sub denumirea de deplasare

(bias). Aceasta se exprim astfel:


Bias (

Dac

) = E(

(4.3)

tinde s se situeze peste n medie n

cazul mai multor eantioane, atunci deplasarea este pozitiv.


Dac

tinde s se situeze sub n medie n cazul mai

multor eantioane, atunci deplasarea este negativ.


Am ntlnit anterior exemple de estimatori deplasai i
nedeplasai. S ne amintim c media eantionului, X este un
estimator nedeplasat pentru media populaiei, , deoarece E(
2
X ) = . Totui, dispersia eantionului, v , este un estimator
deplasat pentru dispersia populaiei, 2 , deoarece E(v2) 2 .
n acest caz deplasarea a fost negativ deoarece v2 tinde s
se situeze sub valoarea 2.
n practic nu extragem dect un eantion. Dac am fi
extras mai multe eantioane am fi obinut, n medie,
rspunsul corect. Chiar dac estimatorul nostru este
nedeplasat, pentru unicul eantion pe care l-am extras exist,
prin urmare, o probabilitate de a obine a valoare a

undeva

departe de adevratul .
Este de preferat un estimator care n afar de a fi
nedeplasat, s prezinte i o dispersie mic, adic dispersia
distribuiei de selecie s fie ct mai mic posibil.

98

Elemente de econometrie

4.1.2. Eficiena

Despre un estimator

se spune c este un

estimator eficient al parametrului dac (a) este


nedeplasat, respectiv E(

) = i (b) nu exist nici

un alt estimator nedeplasat al lui care s prezinte o


dispersie mai mic.
Pentru stabilirea unui estimator eficient, trebuie s
minimizm probabilitatea de a obine o estimare diferit de
adevratul . De reinut faptul c, nainte de a putea fi
eficient, un estimator trebuie s fie nedeplasat. Din acest
motiv, un estimator eficient mai este uneori denumit i cel
mai bun estimator nedeplasat.
Demonstrarea eficienei unui estimator nedeplasat
implic verificarea dispersiei sale care trebuie s fie minim
n raport cu dispersiile tuturor celorlali estimatori
nedeplasai. Din punct de vedere matematic, aceasta
reprezint o sarcin cu mult mai grea i, din acest motiv,
cuvntul eficien este utilizat i n sens relativ. De
exemplu, media eantionului, X reprezint un estimator
nedeplasat al mediei populaiei, . Un estimator nedeplasat
alternativ pentru este:
X

1
XL XS
2

n care XL i XS reprezint cea mai mare, respectiv cea


mai mic observare din cadrul eantionului extras. Dac sunt
extrase multe eantioane, se constat c variaia lui X este

Capitolul 4 Estimatori i metode de estimare

mai mic dect variaia lui


sunt ilustrate n Figura 4.2)

99

(distribuiile lor de selecie

Figura 4.2. Distribuia de selecie


Prin urmare, se spune despre X c este relativ mai
eficient dect X . Prin aceasta, apreciem c dac estimm
valoarea lui prin X , va exista o probabilitate mai mic de
a obine o estimare la mare distan de dect n cazul n
care am fi recurs la utilizarea estimatorului X .
Dificultatea de a gsi acel estimator eficient se refer
la faptul c, frecvent, se limiteaz pentru eficien la un
subset al tuturor estimatorilor nedeplasai. Aceasta se
datoreaz faptului c, de regul, este mult mai uor s gseti
cel mai eficient estimator printre toi estimatorii liniari
nedeplasai.
Un estimator liniar este acel estimator care poate fi
exprimat printr-o funcie liniar. Aceasta nseamn c are
forma urmtoare:

100

Elemente de econometrie

= a1X1 + a2X2 + a3X3 + .........anXn

(4.4)

n care valorile a sunt valori constante. De exemplu,


media eantionului, X reprezint un estimator liniar al
mediei populaiei, deoarece poate fi exprimat sub forma:
X

1
1
1
1
X 1 X 2 X 3 ....... X n
n
n
n
n

Nu exist nici un motiv pentru care un estimator liniar


ar trebui s fie cu necesitate un estimator bun, indiferent de
sens. Deoarece valorile a din (4.4) ar putea lua orice valori,
un astfel de estimator ar putea s fie serios deplasat. Totui,
avantajul prezentat de estimatorii liniari const n aceea c,
din punct de vedere matematic, este mult mai uor de lucrat
cu acetia dect cu estimatorii non-liniari.
4.1.3. Estimatorul BLUE liniar nedeplasat i eficient

Despre un estimator

se spune c este cel

mai bun estimator (BLUE) al parametrului dac


(a) este un estimator liniar, (b) este nedeplasat i (c)
nu exist nici un alt estimator nedeplasat care s
prezinte o dispersie mai mic.
Un BLUE nu este cu necesitate cel mai bun
estimator, deoarece este posibil s mai existe ali estimatori
non-liniari cu o variaie mai mic dect cea aferent unui
BLUE. n multe situaii, estimatorul eficient se poate dovedi
att de dificil de gsit nct trebuie s acceptm un BLUE.
Dac se ntmpl ca estimatorul eficient s fie un estimator

Capitolul 4 Estimatori i metode de estimare

101

liniar, atunci estimatorul BLUE i estimatorul eficient vor fi


identici.
4.1.4. Eroarea medie ptratic

Pn acum am definit trei proprieti pe care am


prefera s le posede estimatorii notri. n esen, n-am
preocupat de dou aspecte ale estimatorilor: variaia lor, care
preferm s fie mic, i dac sunt sau nu nedeplasai. S
presupunem c nu este posibil s gsim un estimator care s
fie nedeplasat i s aib, n acelai timp, o variaie mic. S
lum, de exemplu, cele dou distribuii de selecie
reprezentate n Figura 4.3.

Figura 4.3. Distribuia de selecie


Estimatorul

reprezint estimatorul eficient pentru

. Prin urmare, este nedeplasat dar poate s aib o variaie

102

mare. Estimatorul

Elemente de econometrie

este (uor) deplasat dar prezint o

variaie mult mai mic. Pe care dintre aceti estimatori ar


trebui s-l preferm ? Este adevrat c, n timp ce
nedeplasat,

este

tinde permanent s supra-estimeze parametrul

(adic prezint o uoar influen pozitiv). Constatm c


ariile de sub curbele din Figura 4.3 sunt probabilistice. De
aceea, pentru unicul eantion extras suntem de departe mult
mai n msur s obinem o estimare departe de adevratul
dac utilizm

n acest punct s definim eroare ptratului mediei


unui estimator. Ca i variaia, eroarea ptratului mediei se
raporteaz la dispersia distribuiei de selecie a unui
estimator. n timp ce variaia msoar dispersia n jurul unei
valori previzionate a estimatorului, eroarea ptratului mediei
msoar dispersia n jurul valorii reale a parametrului care
este estimat.
Eroarea medie ptratic (MSE) este
definit ca fiind:
MSE (

) = E(

ntruct Var (

(4.5)

- )2

) = E[

- E(

)] , variaia i MSE

vor avea aceeai valoare numai dac E(

) = . Altfel spus,

Capitolul 4 Estimatori i metode de estimare

103

numai dac estimatorul este nedeplasat. n caz contrar,


corelaia dintre MSE i variaia poate fi prezentat sub forma:
MSE (

) = Var (

) + [Bias (

)]

(4.6)

n care bias-ul este dat de (4.3). Astfel, MSE


reprezint suma dintre variaie i ptratul influenei.
Din (4.6) deducem c MSE ne ofer o cale de
formalizare i compensarea ntre varianta de a avea o
influen mic i cea de a avea o variaie mic. Pe ct posibil,
selectm estimatorul cu cea mai mic eroare a ptratului
mediei. n acest fel, putem evita posibilitatea de a ne
confrunta fie cu o influen prea mare, fie cu o variaie prea
mare. De asemenea, ntruct MSE reprezint ptratul
diferenei medii dintre valoarea unui estimator i valoarea
real a parametrului, minimizarea sa reprezint o preocupare.
Cnd doi estimatori sunt nedeplasai atunci, ntruct variaiile
i MSE-urile sunt identice, a alege estimatorul cu cea mai
mic MSE echivaleaz cu selectarea celui mai eficient
estimator.
n abordarea proprietilor nu am fcut nici o referire
la dimensiunile
eantionului
extras. Dimensiunile
eantionului ar fi putut fi
4.2. Metode de estimare
Pn n acest moment am alocat mai mult spaiu
descrierii proprietilor pe care am prefera s le aib
estimatorii fr ca, virtual, s nu spunem ceva despre cum
obinem aceti estimatori. Exist trei metode de baz pentru
obinerea estimatorilor, pe care le vom aborda n continuare.

104

Elemente de econometrie

4.2.1. Metoda momentelor

Dac avem o mulime de valori pentru o


variabil aleatorie X, atunci cantitatea E(Xr) este
cunoscut ca fiind al r-lea moment al populaiei
din preajma lui zero.
De exemplu, E(X), media populaiei, este primul
moment centrat, n timp ce E(X2) este al doilea moment
centrat i aa mai departe.
Dac media populaiei E(X)=, atunci cantitatea E(X
)r este cunoscut sub denumirea ca fiind r-lea moment al
populaiei din preajma mediei. De exemplu, dispersia
populaiei, E(X )2 este de asemenea cunoscut ca fiind al
doilea moment n preajma mediei.
Fiind dat un eantion de observri (X1, X2,X3,.......Xn),
definim al r-lea moment al eantionului din preajma lui
r
zero prin X i / n . Media eantionului X X i / n este
primul moment al eantionului centrat .
n cadrul metodei momentelor, estimm pur i simplu
momentele populaiei din preajma lui zero i a mediei, prin
momentele corespunztoare ale eantionului. De exemplu,
estimm media populaiei prin media eantionului, X , i
variaia populaiei prin variaia eantionului, v2, conform
definiiei de mai sus.
Este posibil s se demonstreze c:
n condiii foarte generale, momentele
eantionului reprezint estimatori compatibili ai
momentelor corespunztoare ale populaiei.
Momentele eantionului nu sunt cu necesitate
estimatori nedeplasai.

Capitolul 4 Estimatori i metode de estimare

105

n acest punct trebuie s remarcm faptul c, aa cum


o variaie de eantion este un estimator compatibil al variaiei
populaiei, tot aa se poate demonstra c o co-variaie a
eantionului X i X Y Y i / n este un estimator
compatibil al co-variaiei populaiei E X E X Y Y .
4.2.2. Metoda celor mai mici ptrate

Am recurs deja la aceast metod de estimare n


capitolul referitor la regresia de dou variabile. Aceasta este o
metod general de estimare a momentelor populaiei
centrat .
S considerm al r-lea moment al populaiei centrat ,
E(Xr), care se scrie, n general, sub forma r.
n cazul metodei celor mai mici ptrate estimm
valoarea r prin selectarea acelei valori care minimizeaz
2
suma ptratelor X ir r .
De exemplu, selectm o valoare astfel nct s
minimizm
S=

(4.12)

Pentru a minimiza (4.12) trebuie s facem calculul


diferenial n legtur cu i s stabilim resultanta ....? egal
cu zero. Aceasta conduce la relaiile:
dS
2 X i 0 sau
d

n 0

(4.13)

106

Elemente de econometrie

Calculul din (4.13) pentru ne conduce la estimatorul


celor mai mici ptrate, desemnat prin
^

Calculm

, sub forma:

/n

apoi

derivata
de
gradul
doi
i aa mai departe. Estimatorul
celor mai mici ptrate al populaiei este media eantionului.
Nu poate fi vorba de certitudine cu privire la faptul c
metoda celor mai mici ptrate va conduce la estimatori care
s posede proprietile discutate anterior. Proprietile
estimatorilor celor mai mici ptrate trebuie s fie investigate
pentru fiecare caz n parte.
d 2 S / d 2 2 1 2n 0

4.2.3. Estimarea probabilitii maxime

O metod de estimare utilizat n econometrie este


metoda probabilitii maxime.
Pentru o nelegere intuitiv a acestei metode,
presupunem c avem o populaie de muncitori ntr-o industrie
care sunt fie n favoarea, fie contra unei aciuni industriale
ntr-o anumit problem. Dorim s estimm proporia a
acelor muncitori care sunt n favoarea respectivei aciuni. S
presupunem c extragem un eantion aleatoriu de 17
muncitori din respectiva industrie i constatm c numai 2
dintre acetia sunt n favoarea aciunii.
n lumina acestei dovezi dat de eantion, vom
considera valori posibile pentru proporia n cadrul
populaiei. Pare extrem de puin probabil ca o valoare = 0,8
(80% n favoarea aciunii), s fi condus la evidena
eantionului respectiv. Pare tot puin probabil ca valoarea =

Capitolul 4 Estimatori i metode de estimare

107

0,5 s fie putut conduce la o astfel de situaie. Este evident c


o valoare = 0,1 prezint de departe cea mai mare
probabilitate de a fi generat rezultatul eantionului
menionat mai sus. n termeni cureni, estimatorul
probabilitii maxime al valorii este acea valoare care este
cea mai probabil sau prezint probabilitatea maxim de
a genera rezultatul dat de eantion, respectiv 2 din 17
muncitori care sunt n favoarea aciunii industriale. Aceast
valoare a lui care are cea mai mare probabilitate de a
genera eantionul este cea pe care am obinut-o de fapt.
ntruct muncitorii din cadrul populaiei sunt fie
pentru, fie mpotriva unei aciuni industriale, numrul de
muncitori din cadrul eantionului nostru care sunt n favoarea
acestei aciuni trebuie s aib o distribuie binomil.
Substituind n = 17 i X = 2 (numrul celor n favoarea
aciunii) n (2.7) obinem:
Pr = Pr(2 muncitori n favoare n eantionul de 17) =
136()2(1- )15
(4.14)
Ceea ce ne spune (4.14) este faptul c probabilitatea
de a obine eantionul pe care l-am obinut depinde de
proporia necunoscut, , a populaiei. De exemplu, dac =
0,8, atunci (4.14) conduce la probabilitatea de Pr = 0,285 x
10-8. Aceasta nu face dect s verifice ceea ce am sugerat mai
sus faptul c este foarte puin probabil ca eantionul nostru
s fi putut fi generat de o populaie avnd = 0,8.
De o manier similar, dac = 0,5, (4.14) conduce
la probabilitatea Pr = 0,00104, o valoare ceva mai mare dect
cea pentru = 0,8 dar n continuare foarte mic. n schimb,
dac = 0,1, (4.14) conduce la o probabilitate mult mai
mare, rspectiv Pr = 0,280. Aceasta verific nc una dintre

108

Elemente de econometrie

sugestiile de mai sus aceea conform creia o valoare =


0,1 are de departe o probabilitate mult mai mare de a genera
eantionul dat.
MLE reprezint acea valoare care minimizeaz
probabilitatea obinut din (4.14). Funcia (4.14) este
prezentat grafic n Figura 4.4. Se poate observa c
probabilitatea maxim (Pr maxim) survine de fapt atunci
cnd ia o valoare uor mai mare dect 0,1.

Figura 4.4. Funcia MLE


Pentru a gsi valoarea exact a lui care s
maximizeze (4.14), respectiv, valoarea exact a MLE,
calculm diferenialul lui Pr n raport cu i stabilim
derivata rezultant egal cu zero. Aceasta nseamn c,
utiliznd regula pentru produse de difereniale, obinem:

Capitolul 4 Estimatori i metode de estimare

109

d Pr
15
14
136 2 1 15 2 1 0
d

Rezult c:
1

14

21 15 0

(4.15)

Ecuaia (4.15) poate fi acum soluionat pentru a se


gsi acea valoare care maximizeaz (4.14). Astfel,
~
desemnnd MLE pentru prin , avem:
~

2
0,118
17

n loc s verificm condiia de ordin secund pentru un


maximum, putem observa din Figura 4.4 c o valoare de
0,118 maximizeaz de fapt (4.14) n loc de a o minimiza.
Astfel, valoarea care este cel mai probabil s fi
generat rezultatul eantionului nostru (2 din 17 muncitori n
favoarea unei aciuni industriale) este 2/17 sau 0,118.
Reinem faptul c maximul estimrii probabilitii cu privire
la proporia populaiei se dovedete a fi proporia
eantionului, respectiv, proporia eantionului care este n
favoarea unei aciuni industriale.
4.2.4. Cazul general

n general, MLE este determinat prin derivarea, mai


nti, a unei funcii de probabilitate. Aceasta este pur i
simplu o expresie matematic pentru probabilitatea de
obinere a rezultatului unui eantion dat. n cazul considerat,
funcia de probabilitate a fost dat de (4.14).

110

Elemente de econometrie

n mod normal, rezultatul unui eantion va consta din


n observri cunoscute, pe care le vom nota cu (X1,
X2,X3,.......Xn). Dac populaia este caracterizat printr-un
singur parametru , atunci probabilitatea L, de a obine un
eantion dat depinde, n primul rnd, de valoarea i, n al
doilea rnd, de observrile exacte din cadrul eantionului.
MLE aferent parametrului este acea
valoarea a lui care maximizeaz funcia de
probabilitate.

(4.16)

ntruct valorile Xi sunt constante cunoscute, odat


stabilit forma algebric precis pentru (4.16), se poate
recurge apoi la calculul diferenial pentru a se obine acea
valoare care maximizeaz L.
Cel mai adesea, populaiile vor poseda mai muli
parametri. Probabilitatea de a obine un eantion dat va
depinde n acest caz de valorile tuturor paremetrilor i
observrilor pe eantionul dat. n aceast situaie funcia de
probabilitate ia o form mai general, respectiv:
L = L(1, 2, ..... m, X1, X2,.......Xn),

(4.17)

n care exist m parametri n total. MLE-urile aferente


parametrilor m pot fi stabilite prin calculul diferenial parial
aplicat (4.17) n raport cu fiecare valoare pe rnd i, apoi,
prin stabilirea tuturor derivatelor pariale obinute la zero.

Capitolul 4 Estimatori i metode de estimare

111

4.2.5. Exemplu cu o variabil discontinu

S presupunem c populaia noastr cuprinde valorile


unei variabile discontinue X care prezint distribuia
probabilistic geometric. Aceasta nseamn:
p(X) = (1 )X,

0<<1

(4.18)

Ne situm n cazul unei variante n care populaia este


caracterizat printr-un singur parametru, . Dorim s stabilim
MLE aferent parametrului . S presupunem c avem un
eantion de n observri aleatorii asupra lui X , pe care le
scriem sub forma (X1, X2,X3,.......Xn). Utiliznd (4.18),
probabilitatea de a obine observaia i n cadrul eantionului
este dat de formula:
p(Xi) = (1 ) X i

i = 1, 2, 3,

,n

(4.19)

Pentru un eantion aleatoriu, cele n observri vor fi,


toate, valori independente. Prin urmare, putem scrie
probabilitatea obinerii celor n observri sub forma:
L =p(X1)p(X2)p(X3)...........p(Xn)
sau, utiliznd (4.19):

L 1 X 1 1 X 2 1 X 3 ...... 1 X n

(4.20)

Ecuaia (4.20) este cea care ofer funcia de


probabilitate n acest caz. Valoarea MLE pentru este acea
valoare a lui care maximizeaz (4.20).

112

Elemente de econometrie

Valorile Xi sunt valori cunoscute. Condiia de prim


ordin pentru un L maxim este prin urmare dL/d = 0.
Aplicarea calculului diferenial pentru L, aa cum se prezint,
este anevoioas i, de aceea, este util ca n prealabil s
stabilim logaritmul lui L. Acesta este de forma:
l=ln(L)= ln 1 X 1 ln ln1 X 2 ln
+

ln1 X 3 ln ........... ln1 X n


(4.21)

ntruct cu ct l =ln(L) este mai mare, cu att mai


mare este i L, valoarea lui care maximizeaz (4.21) trebuie
s maximizeze i (4.20), respectiv funcia de probabilitate.
Prin urmare, putem s stabilim valoarea MLE pentru

prin maximizarea
(4.21), aa-numita funcie de
probabilitate logaritmic.
Aceasta se dovedete a fi o sarcin mai puin
anevoioas dect maximizarea funciei de probabilitate
originale.
Pentru a maximiza (4.21) se calculeaz diferenialul
n raport cu i se stabilete derivata rezultat la zero. Astfel:
dl
n
Xi 0

d
1

sau
n 1 X i

(4.22)

Capitolul 4 Estimatori i metode de estimare

113

Ecuaia (4.22) poate fi folosit acum pentru


soluionarea problemei legat de stabilirea MLE pentru ,
~
notat prin :
~

X
nX
i

X
1 X

(4.23)

unde X este media eantionului.


Ecuaia (4.23) poate prea un estimator ciudat pentru
parametrul . Totui, se poate demonstra c media distribuiei
geometrice (4.19) este E(X) = /(1 ). Prin re-aranjare se
obine valoarea adevrat a parametrului , sub forma:

E X
1 E X

(4.24)

Acum se poate observa c expresia pentru MLE


(4.23) este analogul relaiei populaiei (4.24).
4.2.6. Exemplu cu o variabil continu

Dac o variabil aleatorie, X, este o variabil


continu, atunci este mai indicat ca distribuia sa
probabilistic p(X) s fie denumit funcie a densitii
probabilistice.
S presupunem c avem o mulime de valori pentru o
variabil continu, X, care este dat de distribuia
exponenial negativ. Aceasta nseamn:
p(X) = e-X

(4.25)

114

Elemente de econometrie

i n acest caz dorim s stabilim valoarea MLE pentru


parametrul . Dac din aceast populaie se extrage un
eantion aleatoriu de mrime n, atunci, ca i n cazul
variabilelor discontinui, putem considera o funcie de
probabilitate pentru observrile de eantion, Xi :
L=p(X1)p(X2)p(X3)...........p(Xn)

(4.26)

ntruct acum lucrm cu o variabil continu, nu


putem considera c (4.25) ne ofer probabilitatea obinerii
celor n valori ale eantionului. n schimb, (4.26) ne indic
densitatea probabilistic din preajma acestor valori de
eantion. Aceast densitate probabilistic depinde n
continuare de valoarea parametrului i, prin urmare, a alege
acea valoare care o maximizeaz capt sens. Aceasta
nseamn c MLE pentru continu s fie definit ca acea
valoare care maximizeaz funcia de probabilitate.
Utiliznd ecuaia (4.25) pentru substituire n (4.26)
forma exact a funciei de probabilitate n acest caz devine.

L = e X 1 e X 2 eX 3 ...... e X n

i de aceast dat este mai convenabil s se lucreze n


termeni de funcie logaritmic de probabilitate:

l ln L ln X 1 ln X 2 ln X 3 ..... ln X

sau
l n ln X i

(4.27)

Capitolul 4 Estimatori i metode de estimare

115

Ca i n cazul exemplului precedent, maximizarea lui


l echivaleaz cu maximizarea lui L. Prin urmare, MLE
pentru poate fi obinut prin calcularea diferenialului n
raport cu i stabilirea derivatei rezultat la zero. Aceasta
conduce la:
dl
n
Xi 0
d

(4.28)

Soluionnd (4.28) pentru , obinem MLE sub forma:

n
1

Xi X

(4.29)

unde X este media eantionului.


4.2.7. Exemplu cu doi parametri

Toate exemplele de probabilitate maxim pe care leam luat n consideraie pn acum au implicat numai un
singur parametru al populaiei. Totui, dup cum indic
(4.17), metoda poate fi utilizat pentru estimarea mai multor
parametri simultan.
Ca exemplu de estimare simultan pentru 2 parametri,
s presupunem c avem o populaie distribuit normal, de
valori X, cu media i variaia 2. Se urmrete stabilirea
MLE pentru i 2.
ntruct ln(e) = 1, aceasta nseamn c:

ln p X ln 2 2

0 , 5

0,5 X

/ 2

116

Elemente de econometrie

= 0,5 ln 2 0,5 ln 2 0,5 X 2 / 2


(4.30)
Funcia de probabilitate pentru un eantion aleatoriu
de n observri asupra lui X are, ca de obicei, forma (4.26).
Prin urmare, funcia logaritmic de probabilitate are forma:
l ln L ln p X i

(4.31)

Utiliznd (4.30), rezult:

l 0,5 ln 2 0,5 ln 2 0,5 X i / 2


0,5n ln 2 0,5n ln

0,51 / X
2

(4.32)

n condiiile observrilor de eantion date, l este o


funcie de doi parametri, i 2.
Pentru a maximiza probabilitatea logaritmic,
recurgem prin urmare la difereniale pariale (4.32) n raport
cu i 2 i stabilim derivatele obinute:
l
1
2

(4.33)
i

Capitolul 4 Estimatori i metode de estimare

l
0,5n 0,5
2 4 Xi 0
2

117

(4.34)

Ecuaiile (4.33) i (4.34) reprezint dou ecuaii


pentru cele dou necunoscute, i 2, care pot fi soluionate
pentru stabilirea MLE. n primul rnd, ntruct 2 trebuie s
fie diferit de zero, din (4.33) obinem:
X i 0 sau X i n 0
Soluionnd aceast ecuaie pentru obinem MLE
sub forma:
~

Xi / n X

(4.35)

Astfel, estimatorul probabilitii maxime a mediei


unei populaii, , este media eantionului, X .
Pentru a soluiona 2, nmulim (4.34) cu 24
obinnd:
n 2 X i 0
2

tim c X , i rezult c MLE pentru 2 are


forma:
~ 2

v2

(4.36)

Capitolul 5
Unele precizri privind modelul
clasic al regresiei cu dou
variabile
n prezentarea anterioar am avut n vedere utilizarea
estimatorilor celor mai mici ptrate regulate (OLS = ordinary
least squares) n analiza regresiei de dou variabile. Am
sublniat faptul c estimrile obinute prin metoda celor mai
mici ptrate regulate din orice set de date sunt specifice
respectivului set de date. Eantioane diferite vor conduce la
estimri diferite. Aceasta nseamn c estimatorii OLS sunt
afectai de variabilitatea eantionrii i dein distribuii de
selecie. Subliniem nc o dat faptul c nu exist nici o
garanie n sensul c estimatorii OLS i distribuiile lor de
selecie vor prezenta vreuna dintre proprietile dorite. Nu
exist nici un motiv pentru care estimatorii OLS ar trebui s
fie cu necesitate, de exemplu, nedeplasai sau compatibili.
Situaia ar fi diferit dac se poate demonstra c anumite
condiii se susin.
5.1. Ipotezele modelului clasic al regresiei de dou
variabile
Modelul clasic al regresiei de dou variabile s-a
dezvoltat la nceputul secolului trecut pentru a fi utilizat n
tiinele fizice. Dup cum vom vedea, multe dintre ipotezele
pe care este cldit sunt neadecvate atunci cnd se lucreaz cu
date privind tiinele sociale.

Capitolul 5 Unele precizri privind modelul clasic

119

Modelul clasic de referin reprezint o corelaie n


care variabila dependent, Y, este dependent liniar de
variabila explicativ, X, dar este influenat i de rezidualul
. Prin urmare, avem:
Yi = + Xi + i pentru toate valorile i

(5.1)

Cnd revenim la modelul clasic trebuie s recurgem la


o serie de ipoteze, n primul rnd referitoare la variabila
explicativ i, n al doilea rnd, referitoare la REZIDUU.
5.1.1. Ipoteze cu privire la variabila explicativ

n modelul clasic se pornete de la prezumia c


variabila explicativ:
Ipoteza A - este non-stochastic;
Ipoteza B - are valori care sunt fixe n eantioane
repetate;
Ipoteza C - este de o asemenea natur nct, pe
2
msur de n , variaia sa X i X / n x 2 / n Q ,
unde Q este o constant finit fix.
Aceste prezumii vor necesita unele explicaii. O
variabil stochastic este pur i simplu o variabil ale crei
valori sunt determinate de un mecanism ntmpltor i, de
aceea, fac obiectul unei distribuii probabilistice. Prin urmare,
o variabil non-stochastic are valori care nu sunt
determinate la ntmplare. n contextul modelului clasic,
aceasta presupune c valorile variabilei explicative X, sunt de
fapt determinate de un cercettor. Amintim c acest model a
fost dezvoltat pentru necesitile tiinelor exacte, acolo unde
experimentele de laborator sunt posibile. n astfel de condiii,
este rezonabil s se postuleze ca n cazul n care se
selecioneaz valorile pentru variabila X urmrete scopul

120

Elemente de econometrie

experimentului. Ipoteza A presupune c valorile variabilei X


au fost alese n acest fel. Desigur, n tiinele economice
sociale este dificil s se efectueze experimente de laborator.
n acest punct ar trebui s se observe c, chiar dac
variabila X este non-stochastic, nu acelai lucru este valabil
i pentru variabila Y. Se poate constata c valorile lui Y
depind nu numai de valorile lui X dar i de valorile
rezidualului. ntruct rezidualul este n afara posibilitii de
control, variabila Y este stochastic, extrgndu-i natura din
cea a rezidualului.
Ipoteza B se refer la ce s-ar fi ntmplat n situaia n
care s-ar fi extras mai multe eantioane. Se presupune c,
dac ar repeta experimentul, cercettorul ar alege exact
acelai set al valorilor X n fiecare mprejurare de acest fel.
Aceasta nseamn c n fiecare eantion extras valorile X
rmn neschimbate.
Faptul c valorile lui Y variaz de la eantion la
eantion nseamn c diferitele eantioane vor conduce n
continuare la valori diferite ale estimatorilor OLS. Prin
urmare, distribuiile de selecie pentru estimatorii OLS vor
exista n continuare dei ele trebuie privite ca survenind
atunci cnd sunt extrase multe eantioane cu acelai set de
valori X.
Relevana ipotezei C presupune c, dac dimensiunea
2
eantionului ar fi mrit, variaia xi / n nu ar crete
nelimitat. Este clar c, pe msur ce n crete, suma ptratelor
xi2 trebuie s creasc, ntruct avem mai multe valori
xi2 s de nsumat. Nu este nevoie ca acest lucru s fie adevrat
i pentru xi2 / n X i X / n , cu condiia
cercettorul s fie atent cu valorile X pe care le alege.
2

ca

Capitolul 5 Unele precizri privind modelul clasic

121

Multe variabile economice prezint trenduri


ascendente continue. n astfel de cazuri, pe msur ce
dimensiunea eantionului disponibil crete iar acesta include
tot mai multe perioade de timp, variaia lui X, respectiv
xi2 / n , crete la rndul su continuu, astfel nct ipoteza C
nu se confirm. Atunci, importana unor astfel de ipoteze
const n aceea c ele guverneaz variabilele factoriale care
manifest trenduri semnificative. Dup cum vom vedea, apar
probleme n a emite ipoteze n legtur cu acele corelaii n
cadrul crora variabila explicativ prezint un trend puternic.
5.1.2. Ipoteze cu privire la factor rezidual

n modelul clasic se pornete de la ideea c rezidualul


are urmtoarele proprieti:
(IIA) E(i) = 0 pentru toate valorile i ;
2
(IIB) Var(i) = E(i - Ei )2 = E i = 2 = constant
pentru toate valorile i ;
(IIC) Cov (i, j) = E(i - Ei ) (j Ej ) = E (i, j) = 0
pentru toate valorile i j;
(IID) Fiecare factor rezidual i este distribuit normal

Aceste ipoteze se pot nelege din Figura 5.1, n care


s-a trasat linia de regresie a populaiei, X6 reprezint valoarea
variabilei explicative, X, rezultat din cea de a asea
observare.
n condiiile ipotezelor IA i IB, X6 nu variaz de la
eantion la eantion.

122

Elemente de econometrie

Figura 5.1. Ipoteze privind factorul rezidual


Rezidualul reprezint distana vertical a unor astfel
de puncte de pe linia de regresie. Distana punctelor de pe
linia X6 n raport cu linia populaiei reprezint, prin urmare,
diferitele valori pentru 6 , respectiv rezidualul asociat celei de
a 6-a observri. Ipoteza IIA afirm c n cazul mai multor
eantioane extrase, media unor astfel de reziduale este zero.
Similar este de presupus c i media valorilor reziduale 3,
12 etc., asociate cu valorile fixe X3, X12 etc., este zero.
Aceast ipotez implic faptul c, pentru oricare dintre liniile
de valori fixe Xi, punctele obinute atunci cnd se extrag, n
mod repetat, eantioane, sunt uniform repartizate deasupra i
sub linia de regresie.
Ipoteza IIB precizeaz c variaia tuturor valorilor 6
care ar putea fi obinute dac s-ar extrage eantioane
repetate, este identic cu variaia tuturor valorilor 3 obinute
care, la rndul su este este identic cu variaia valorilor 12
etc. Aceast variaie constant este redat prin simbolul 2 .
Reamintim c variaia este o msur a dispersiei sau
mprtierii unei distribuii. Prin urmare, ipoteza IIB

Capitolul 5 Unele precizri privind modelul clasic

123

presupune c, atunci cnd se extrag multe eantioane,


dispersia punctelor din preajma liniei de regresie este aceeai
pentru fiecare dintre valorile X.
Atunci cnd valorile reziduale se ncadreaz n ipoteza
IIB, sunt denumite homoschedastice. Aceast ipotez nu este
ntotdeauna valabil pentru datele economice. Cnd este
vorba de o mare variaie a valorilor X, exist tendina ca, n
loc s rmn constante, variaia rezidualului s creasc pe
msur ce mrimea X crete. Atunci cnd variaia lor nu este
constant,
valorile
reziduale
sunt
denumite
heteroschedastice.
Ipoteza IIC afirm c ntre oricare dou reziduale
covariaia i, prin urmare, corelaia este zero. Atunci cnd
aceast ipotez se susine, valorile reziduale sunt denumite
non-autocorelate. Aceast prezumie presupune c, atunci
cnd se extrag eantioane repetate, nu exist nici o tendin ca
eantioanele cu, valori pozitive mari pentru 6 s prezinte, de
asemenea, valori mari pentru 3. Se elimin, de asemenea, i
corelaiile negative. Nu trebuie s existe tendina ca valorile
3 pozitive s fie asociate unor valori 12 negative.
Ipoteza IID afirm c valorile 6 care s-ar obine
dintr-o selecie repetat sunt distribuite normal n jurul
mediei lor, respectiv zero, situaie similar pentru toi ceilali
reziduali. Principala implicaie a acestei afirmaii este aceea
c probabilitatea de a obine reziduali mici este mult mai
mare dect aceea de a obine reziduali mari. Prin urmare
exist o probabilitate mai mare de a obine puncte apropiate
de linia de regresie dect probabilitatea de a obine puncte
ndeprtate de aceasta.

124

Elemente de econometrie

Ipotezele IIA - IID pot fi sintetizate n


afirmaia conform creia rezidualii i sunt normal
i independent distribuii cu o medie zero i o
variaie constant 2 . Aceasta nseamn c:
i este NID (0, 2) pentru toate valorile i

(5.2)

5.2. Proprietile estimatorilor OLS


Exceptnd ipotezele IIA i IID, toate ipotezele
referitoare la modelul clasic sunt neverosimile atunci cnd se
aplic datelor economice. Dac estimatorii OLS dispun de
proprietile amintite atunci este necesar ca mcar unele
dintre ipotezele clasice s fie valabile. Se impune s stabilim
o expresie alternativ pentru estimatorul OLS al pantei liniei
de regresie a populaiei, , respectiv:
^

x y x Y Y x Y
i i

i i

i i

ntruct Y xi 0 ?

unde:
wi

xi
pentru toate valorile i
xi2

(5.4)

De reinut c, deoarece

(5.5)

0 , iar xi X i X ,

Capitolul 5 Unele precizri privind modelul clasic

w X
i

w x
i

125

(5.6)

Prin substituie obinem:


^

wi X i i wi wi X i wi i

i apoi
^

wi i

(5.7)

Ecuaia reprezint o expresie alternativ pentru

ntruct aceast espresie implic un factor rezidual


necunoscut, ea este inutil pentru scopuri de calculaie ns
reprezint un aparent punct de pornire pentru o dezvoltare
teoretic ulterioar.
n continuare s lum n consideraie proprietile
estimatorilor OLS, concentrndu-ne asupra estimatorului de
pant,

, deoarece acesta prezint un interes mai mare dect

estimatorul intercept

5.2.1. Liniaritatea

Pentru ca estimatorii OLS s fie estimatori liniari, este


necesar a fi ndeplinite ipotezele IA i IB. Amintim c aceste
ipoteze presupun c trebuie s alegem valorile variabilei X i
c aceste valori sunt meninute fixe pentru eantioane
repetate. Prin urmare, valorile X pot fi considerate ca fiind
constante. Prin urmare, estimatorii OLS trebuie s fie numai
funcii lineare ale valorilor Y pentru a fi considerai estimatori

126

Elemente de econometrie

lineari. Se poate observa cu uurin c acest lucru este


valabil n condiiile date ale ipotezelor IA i IB. ntruct
valorile Xi pot fi considerate a fi constante, acelai lucru este
valabil i pentru valorile xi. Prin urmare, i valorile wi pot fi
considerate tot constante. Astfel, rezult c

este o funcie

liniar a lui Yi , respectiv a observrilor pe eantion. Nu este


dificil de demonstrat c, n condiiile acestor ipoteze, i
estimatorul OLS pentru este, de asemenea, un estimator
liniar.
Reamintim c un estimator liniar nu este cu necesitate
un bun estimator al parametrului care se estimeaz dar, din
punct de vedere matematic, cu estimatorii liniari se lucreaz
mai uor dect cu estimatorii non-liniari.
5.2.2. Nedeplasarea

Valoarea parametrilor distribuiei de selecie pentru


estimatorii OLS este egal cu valorile reale aferente lui i
. Dac ne concentrm atenia asupra ecuaiei lui

obinem:
^

w1 1 w2 2 w3 3 ... wn n

(5.8)

Pornind de la ipoteza c valorile wi pot fi considerate


constante i acestea pot fi neglijate i avem:

Capitolul 5 Unele precizri privind modelul clasic

127

^
E w1E1 w2 E 2 w3 E 3 . . wn E n

(5.9)

Conform ipotezei IIA, E(i) = 0, pentru toate valorile


i, rezult c:

^
E

Astfel,

(5.10)

este un estimator nedeplasat al lui .

Similar se poate demonstra c i estimatorul OLS

este un

estimator nedeplasat ale parametrului , adic: E .

5.2.3. Compatibilitatea

Pentru a demonstra c estimatorii OLS sunt


compatibili vom apela la ipotezee IA IC i IIA. Aceasta
presupune c, pe msur ce n , distribuiile lor de
selecie se concentreaz pe valorile reale ale parametrilor i
. Substituindu-l pe w1, obinem:

128

Elemente de econometrie

x x /n


x x /n
^

i i
2
i

i i
2
i

(5.11)

Dac avem n vedere limitele probabilistice, obinem:

xi i / n
xi i / n
^
pLim pLim pLim 2 pLim 2
x /n
x /n

i
i
(5.12)
Am utilizat proprietatea limitelor probabilistice
prezentat anterior i faptul c limita probabilistic a oricrei
constante este egal cu respectiva constant, rezultnd:

^ pLim xii / n
pLim 2
pLim xi / n

(5.13)

Considernd numrtorul celui de al doilea termen din


partea dreapt a ecuaiei, rezult:

Capitolul 5 Unele precizri privind modelul clasic

x
i

n
xi 0 )

X i
n

129

(n condiiile n care

Prin urmare,
xi i / n reprezint covariaia
eantionului ntre X i .
2
n numitorul din partea dreapt a relaiei, xi / n
reprezint variaia eantionului pentru valorile X.
n
condiiile date ale unui Xi non-stochastic, pentru a-i afla
2
limita probabilistic, trebuie s lum limita lui xi / n pe
msur ce mrimea eantionului, n, tinde ctre infinit. Dar,
avnd n vedere ipoteza IC, aceast limit este dat de
constanta fix Q.
Prin urmare, ecuaia se reduce la forma:

^ 0
pLim
Q
Prin urmare,

este un estimator compatibil. Aceasta

nseamn c, pe msur ce n , el converge probabilistic


spre valoarea real a lui . Se poate demonstra, de asemenea,

130

Elemente de econometrie

c pLim , astfel c estimatorul OLS,

, este un estimator

compatibil al parametrului intercept .


5.2.4. Cea mai bun nedeplasare liniar

Dup ce am demonstrat c, dac ipotezele clasice


referitoare la variabila explicativ i primele dou ipoteze
referitoare la factor rezidual sunt valabile, atunci estimatorii
OLS vor fi liniari i nedeplasai. Dup cum am reinut,
numai nedeplasarea nu este o proprietate asiguratorie.
Rezult c pentru a considera c estimatorii OLS sunt cei mai
buni estimatori liniari nedeplasai, vom recurge la ipotezele
clasice IIB i IIC. Aceasta nseamn c rezidualul trebuie s
prezinte o variaie constant i o covariaie zero.
O dovad a faptului c estimatorul OLS al
parametrului pantei, , este BLUE este dificil. Procedura de
urmat const n a reface estimarea, din punctul de pornire n
care se situa pentru a se obine efectiv valoarea BLUE a lui
, incorpornd pe rnd proprietile liniaritii, neinfluenrii
i ale variaiei minime.
Rezult c formula pentru estimatorul BLUE astfel
obinut este identic cu expresia aferent estimatorului OLS
pentru parametrul . Prin urmare, estimatorul OLS trebuie s
fie BLUE.
Unul dintre avantajele metodei de estimare a celui
mai bun estimator liniar nedeplasat const n aceea c, atunci
cnd se utilizeaz aceast metod obinem, ca un fel de subprodus, o expresie pentru variaia estimatorului avut n

Capitolul 5 Unele precizri privind modelul clasic

131

vedere. n cazul de fa, variaiile, scrise n mod normal sub


forma

2^

2^ , sunt urmtoarele:

^ 2
Var ^ 2
xi
2

(5.14)

^ 2 Xi
Var ^ 2
n xi

2 2

(5.15)

unde 2 este variaia rezidualului.


Reamintim faptul c n cazul eantionrii repetate
obinem distribuii de selecie pentru estimatorii OLS

.
Rdcinile ptrate ale dispersiilor i
2

cunoscute sub denumirea de erori standard pentru


respectiv,

sunt

i,

132

Elemente de econometrie

5.2.5. Eficiena (eficiena asimptotic)

Dac estimatorii OLS trebuie s aib o dispersie


minim, dintre toi estimatorii nedeplasai, liniari sau nonliniari, atunci se poate demonstra c ipoteza clasic IID
trebuie s se susin la rndul su.
Aceasta nseamn c, pentru ca estimatorii OLS s fie
eficieni, toate ipotezele clasice, inclusiv cea referitoare la
valorile reziduale normal distribuite, trebuie s se susin. A
dovedi acest lucru este dificil de realizat.
ntruct eficiena reprezint o proprietate a unui
eantion mic, estimatorii OLS trebuie s fie eficieni
indiferent de mrimea eantionului i s rmn ca atare pe
msur ce mrimea eantionului tinde spre infinit. Prin
urmare, acetia trebuie s fie i asimptotic eficieni. Astfel,
dac toate ipotezele clasice sunt valabile, estimatorii OLS
trebuie s aib nu numai proprietatea de mare eantion
referitoare la compatibilitate ci i pe aceea referitoare la
eficiena asimptotic. Acest lucru presupune c, dintre toi
estimatorii compatibili, estimatorii OLS sunt cei a cror
distribuie de selecie se concentreaz pe valorile i pe
msur ce dimensiunea eantionului devine mai mare.
5.2.6. Normalitatea

Ipoteza IID, conform creia valorile reziduale sunt


distribuite normal, implic faptul c distribuiile de selecie
pentru

sunt distribuii normale.

ntruct valorile Xi pot fi privite ca fiind constante


stabilite, aceast ecuaie implic faptul c fiecare valoare Yi
reprezint suma dintre o constant i un factor rezidual
distribuit normal. Prin adugarea unei constante la o variabil
normal distribuit nu se modific forma distribuiei

Capitolul 5 Unele precizri privind modelul clasic

133

respectivei variabile ci distribuia se deplaseaz de-a lungul


axei orizontale. Prin urmare, fiecare valoare Yi prezint o
distribuie normal. Dar estimatorii OLS sunt funcii lineare
ale lui Yi , avnd n vedere ipotezele IA i IB. Deoarece, aa
cum am artat anterior, orice funcie linear a variabilelor
normal distribuite va prezenta ea nsi o distribuie normal,
rezult c estimatorii OLS

asemenea, tot astfel de distribuii.


n condiiile n care

trebuie s aib, de

sunt nedeplasai i

prezint dispersiile date, putem afirma c, dac toate


ipotezele clasice se susin, atunci:

=>

unde
^

, 2

=>

(5.16)

, 2 ,
^

2^

(5.17)

2^

sunt dispersiile cunoscute.

sunt importante dac dorim s stabilim

limitele valorilor reale ale parametrilor regresiei populaiei,


i .

134

Elemente de econometrie

5.2.7. Estimarea probabilitii maxime

Odat fcut prezumia cu privire la faptul c valorile


reziduale sunt distribuite normal, devine posibil aplicarea
metodei probabilitii maxime pentru estimarea parametrilor
i ai regresiei. Se impune sublinierea a dou aspecte. n
primul rnd, estimarea probabilitilor maxime pentru i
se dovedesc a fi identice cu estimatorii OLS.
Astfel, n condiiile ipotezelor clasice, estimatorii
OLS sunt estimatori de probabilitate maxim.
Aceasta nseamn c din toate valorile posibile pe
care necunoscutele i le-ar putea lua, cele care par cel
mai mult a fi generat un anumit eantion sunt cele obinute
atunci cnd se calculeaz estimatorii OLS.
n al doilea rnd, metoda conduce la un estimator
pentru cellalt parametru din cadrul modelului clasic cu dou
variabile, respectiv dispersia rezidualului, 2 , estimator de
forma:

2
i

2
i

(5.18)

reprezint suma ptratelor valorilor reziduale

OLS. ntruct una dintre proprietile acestor reziduali const


n aceea c suma lor i, prin urmare, media lor este zero, de
fapt aceasta este dispersia valorilor reziduale. Aceasta este
logic deoarece, dac considerm rezidualii ca fiind acei
estimatori care corespund unor perturbri necunoscute, este
natural s estimm dispersia perturbrii prin dispersia
rezidualului. Din pcate, nu este nedeplasat.

Capitolul 5 Unele precizri privind modelul clasic

n n 2

135

(5.19)

5.3. Unele aspecte privind regresia neliniar


Anterior am precizat proprietile estimatorilor OLS
i am indicat acele ipoteze clasice necesare n cazul fiecrei
proprieti. Apoi am vzut cum putem elabora inferene n
legtur cu parametrii de regresie ai populaiei, pornind de la
premisa c ipotezele clasice se susin. Nu se poate afirma c
exist o reprezentare corect a corelaiei reale ce se stabilete
ntre X i Y. De exemplu, s presupunem c relaia real
dintre X i Y prezint o form non-liniar, astfel c ecuaia
regresiei ar fi de forma:
E(Y) = + ln (X)

(5.20)

Este clar c nu ne putem atepta ca estimatorii OLS


care se bazeaz pe o linie de regresie liniar, s ofere valori
sensibile pentru i . Similar, dac oricare dintre celelalte
corelaii non-liniare descrie adevrata corelaie a populaiei,
atunci i expresiile de calcul vor fi estimatori nevalabili. Mai
mult, nu ne putem atepta ca testul de verosimilitate s fie
valabil dac am definit greit linia regresiei ca fiind liniar.
Dac suntem siguri n legtur cu forma oricrei nonlineariti din cadrul corelaiei la nivelul populaiei i suntem
n msur ca, printr-o simpl transformare, s elimin nonlinearitatea, atunci i aici se pot aplica tehnicile normale.
Dac am fost n msur s decidem asupra unei forme dublunchis pentru curba Engel, atunci lucrnd n termeni de
variabile transformate X* = ln (X) i Y* = ln (Y), am putut s
covertim curba Engel ntr-o form linear i s calculm
ecuaia de regresie.

136

Elemente de econometrie

Dac suntem siguri n legtur cu specificaia nonliniar pe care am ales-o atunci, nu numai c putem estima
parametrii populaiei de o manier satisfctoare dar putem,
de asemenea, s elaborm inferene n ceea ce-i privete. De
exemplu, s presupunem c n cazul curbei Engel am fi dorit
s verificm ipoteza conform creia elasticitatea cheltuielilor
pentru produse alimentare n raport cu cheltuielile totale este
mai mic dect unitatea. Aceasta presupune verificarea
ipotezei nule H0 : = 1 n cadrul relaiei de dubl nchidere,
n comparaie cu alternativa HA. Pentru elasticitatea necesar
a fost

0,364 ,

astfel c din blocurile construciei de baz

calculate mai jos, am obinut:

1,107 0,364 2,694 0,126

s = 0,126/23=0,00549
Astfel, variaia estimat pentru

s 2^ 0,005

este:

49/7,403 = 0,000 742

Testul statistic este urmtorul:


^

1 0,364 1

23,55
s^
0,027

ntruct valoarea absolut a testului statistic depete


cu puin o valoare critic t ( cu n 2 = 23 g.l.) de t0,05 =
1,714, respingem ipoteza nul la nivelul de verosimilitate
0,05. Rezult c elasticitatea pentru produsele alimentare este
mai mic dect unitatea.

Capitolul 5 Unele precizri privind modelul clasic

137

Capitolul 6
Inferena statistic n
regresia simpl
n acest capitol vom prezenta cele mai semnificative
probleme legate de inferena statistic n cadrul modelului
simplu de regresie; cum sunt: testarea semnificaiei
parametrilor; definirea de intervale de ncredere; compararea
caracteristicilor a dou drepte de regresie; testarea
normalitii reziduului; predicia valorilor variabilei
rezultative; domenii de aplicare a regresiei simple; etc.
6.1. Aspecte privind testarea semnificaiei modelului de
regresie
Pentru testarea semnificaiei modelului liniar de
regresie sunt aplicate procedeele statistice: testul Student i
analiza variaiei.
n prezentarea celor dou procedee folosite pentru
testarea ipotezelor formulate asupra parametrilor modelului
de regresie facem precizrile:
- estimatorii parametrilor modelului liniar de regresie
sunt de dispersie minim n clasa estimatorilor nedeplasai;
- dac parametrii modelului sunt estimai prin metoda
celor mai mici ptrate, atunci dispersia reziduului se
estimeaz prin relaia:
2

1
n2

e
i 1

2
i

(6.1)

Capitolul 6 Inferena statistic n regresia simpl

139

Estimatorul varianei variabilei reziduale este un


estimator nedeplasat:
E 2 2
- variabila rezidual urmeaz o repartiie normal

N (0, 2 ) .
Pornind de la proprietile estimatorilor parametrilor
modelului liniar de regresie, estimatorii a i b sunt
combinaii liniare de variabile aleatorii repartizate normal.
Pentru definirea statisticilor sunt considerate
urmtoarele dou situaii:
dispesia variabilei reziduale este cunoscut.
innd seama de expresiile celor doi estimatori,
rezult c acetia satisfac urmtoarele dou proprieti:

a N a,

( xi x ) 2

(6.2)

1 x
b N b,

n
x2

Considernd proprietile repartiiei normale


rezultatele de mai sus, se obin urmtoarele rezultate:
a a

a
b b

a a

(x
i

b b

1
x2

n n x2

x) 2
N (0,1),
N (0,1).

(6.3)

Aceste rezultate sunt utile pentru testarea unor ipoteze


formulate asupra parametrilor, precum i pentru definirea

140

Elemente de econometrie

intervalelor de ncredere aferente. Acestea sunt prezentate


pentru cazul care urmeaz.
dispersia variabilei reziduale nu este
cunoscut.
Pentru a defini statisticile folosite pentru testarea
semnificaiei parametrilor modelelor liniare de regresie se
ine seama de:
- dac x i N (0,1), i 1,..., n , atunci
n

2
i

2n ;

i 1

dac x i N (0, ), i 1,..., n , atunci


z

i 1

xi

2n ;

dac x i N (0,1) iar z k2 , atunci


x
z/k

tk .

n aplicaiile practice nu cunoatem dispersia


variabilei reziduale, aceasta este estimat prin relaia (6.1).
Lund n consideraie relaia de calcul a statisticii Student i
folosind cele trei proprieti, se obin rezultatele:
- pentru coeficientul pantei dreptei de regresie:
Pentru a testa H0: a a , cu alternativa H0: a a , se
ine seama de faptul c:
a a

a a

(x

x) 2

a a x
e

n 2 t n2

(6.4)
-

pentru termenul liber

Capitolul 6 Inferena statistic n regresia simpl

141

Pentru a testa ipoteza nul H0: b b , cu alternativa:


H1: b b , se ine seama de faptul c:
b b

b b

x2

t n 2 .

(6.5)

xi x 2
i

Aceste dou rezultate sunt utile pentru testarea


semnificaiei i definirea intervalelor de ncredere pentru cei
doi parametri ai dreptei de regresie.

Testarea ipotezei nule cnd avem un prag de

semnificaie stabilit, dac

a
a

/ 2; n 2

, atunci se

respinge ipoteza nul. Acest test este folosit pentru a stabili


dac dependena liniar dintre cele dou caracteristici este
semnificativ. n acest caz se testeaz H0: a=0, cu alternativa
H1: a 0 . Se respinge ipoteza nul dac

t / 2; n 2

Definirea intervalului de ncredere: Pentru un


prag de semnificaie stabilit din tabelul repartiiei Student
se determin, pentru n-2 grade de libertate, valoarea
t / 2;n 2 .
Pentru fiecare parametru se definete cte un interval
de ncredere.
- Pentru parametrul a, intervalul de ncredere este:
a t / 2;n 2 a a a t / 2; n 2 a
(6.6)
- Pentru termenul liber se definete intervalul de
ncredere:

142

Elemente de econometrie

b t / 2; n 2 b b b t / 2;n 2 b

(6.7)
Pentru a testa dac dependena liniar dintre cele dou
variabile este semnificativ, deci dac valoarea coeficientului
pantei este diferit de zero, se recurge i la analiza dispersiei.
Testm separat fiecare parametru al modelului de
regresie sau vom recurge la un procedeu pentru testarea
simultan a acestora. ntruct cei doi estimatori, a i b , nu
sunt variabile aleatorii independente, se apreciaz c testarea
succesiv a celor doi parametri nu este tocmai corect. Se
recomand testarea simultan a celor doi parametri. Vom
defini ipoteza testului:
H 0 : a a 0 , b b0
H 1 : a a 0 , b b0

Dac notm cu
estimatorul matricei de
( a ,b )
covarian a estimatorilor parametrilor modelului liniar de
regresie, atunci definim:
Fa ,b

1
2 2

1 a a

2 b b

a a

b b

( a ,b )

2
2
n( a a ) 2n x( a a )(b b) (b b)

x
i

2
i

F2; n 2

(6.8)
Pentru testarea simultan a celor doi parametri, vom
nlocui n expresia lui Fa,b pe a,b prin a0, b0. Pentru un prag de
semnificaie stabilit se citete din tabelul repartiiei Fisher
Snedecor valoarea F ; 2;n 2 .
Dac este ndeplinit inegalitatea Fcalculat > Ftabelat,
atunci se respinge ipoteza nul, acceptnd c cel puin un
parametru difer semnificativ de valoarea specificat.

Capitolul 6 Inferena statistic n regresia simpl

143

Analiza dispersiei este un procedeu statistic de testare


a calitii modelului ce pleac de la descompunerea varianei
totale n dispersie datorat factorului de regresie i dispersie
datorat aciunii factorilor nenregistrai.
Definim notaiile:
n

SPT

(y

y) 2

reprezint suma ptratelor

i 1

termenilor seriei variabilei endogene;


n

SPE

( y

y) 2

cuantific suma ptratelor

i 1

abaterilor termenilor estimai;


n

SPR

(e )
i

reprezint

suma

ptratelor

i 1

erorilor de estimaie.
ntre cei trei termeni se verific egalitatea
SPT = SPE + SPR
(6.9)
Pentru fiecare termen din ultima egalitate se
determin numrul gradelor de libertate. Astfel, pentru cei
trei termeni acestea sunt egale cu n-1, n-2, 2-1.
Pentru a defini statistica testului se ine seama de
proprietatea variabilelor 2 , care arat astfel:
Dac x i z sunt dou variabile aleatorii independente
ce au repartiiile 2 cu k2 grade de libertate, atunci:
F

x / k1
z / k2

Fk1 ;k 2

Din proprietatea estimatorului a , rezult c:


a a

(a a )

12
(6.10)
2

i
Din proprietile variabilei reziduale se obine:
2
a

144

Elemente de econometrie

2
i

(6.11)

n2 2

Pentru a testa ipoteza nul H 0 : a a se definete:


( a a) 2
F

x2

ei2 /( n 2)

F (1, n 2)

(6.12)

Se testeaz ipoteza nul a=0, potrivit creia variabila


exogen nu influeneaz n mod semnificativ valorile
caracteristicii endogene. Relaia testului este:

x x
e /(n 2)

a 2

2
i

F (1, n 2)

(6.13)

Pentru a determina o form echivalent a ultimei


statistici se ine seama de faptul c, sub ipoteza nul a
independenei celor dou caracteristici, termenii egalitii
2
(6.9) au expresiile: SPE y i y a 2 xi x , iar
SPR

y i 2

.
Testul F se scrie sub forma echivalent:
F

SPE / 1
SPR /(n 2)

(6.14)

Din ultima relaie se deduce expresia statisticii F n


funcie de valoarea raportului de determinare R2:
F

R2
1 R 2

( n 2) .

(6.15)

Pentru a stabili dac dependena liniar dintre cele


dou variabile este semnificativ, se compar valoarea F

Capitolul 6 Inferena statistic n regresia simpl

145

evaluat pentru seriile de date constituite pentru cele dou


caracteristici cu valoarea tabelat a acestei statistici. Dac
este ndeplinit inegalitatea: F F1 ;(1;n 2 )
atunci se respinge ipoteza nul H0: a=0.
Pentru pragul de semnificaie se stabilete c ntre
cele dou variabile nu exist o dependen liniar
semnificativ.
Dac ntre cele dou variabile exist o dependen
liniar semnificativ, s-a demonstrat c R2 = r2. n aceste
condiii, relaia (6.15) devine:
r2
F
(n 2) t n2 2 .
2
1 r
Rezult o nou statistic pentru testarea dependenei
liniare dintre cele dou variabile:
t

r
1 r2

n 2 t n2 .

6.2. Compararea modelelor de regresie


n practic se pune problema de a stabili dac diverse
modele liniare de regresie, ai cror parametri au fost estimai
pentru datele nregistrate la nivelul diverselor populaii,
difer semnificativ.
Considerm disponibile seriile de date xi , y i i 1,n i
x' i , y ' i i 1,n ' pentru cele dou caracteristici statistice, n
cazul a dou populaii considerate.
Pe baza primei serii de valori s-au estimat parametrii
modelului liniar de regresie, precum i dispersia
coeficientului pantei:
- modelul liniar de regresie: y i b axi ;
- dispersia coeficientului pantei: a2 .

146

Elemente de econometrie

Pentru a doua populaie, procednd n mod


asemntor, se obin rezultatele urmtoare:
- dreapta de regresie estimat este y ' i b' a ' x' i
- dispersia coeficientului pantei este a2 '
Se pune problema de a stabili dac cele dou modele
de regresie au caracteristici diferite n raport cu coeficientul
pantei dreptei de regresie.
Pentru a testa dac cei doi coeficieni de regresie
difer semnificativ utilizm relaia:
(6.16)
t

a a '

a2 a2 '

Se definete variabila aleatorie d = a a pentru a


msura diferena dintre pantele celor dou drepte de regresie.
Pentru a stabili dac cele dou drepte au aceeai valoare a
pantelor de regresie definim:
- ipoteza nul a testului H0: d = 0, cu alternativa H1:
d0;
d

statistica testului: t .
d
Dac se ine seama de faptul c cei doi estimatori sunt
independeni, atunci statistica testului este:
t d / a2 a2 '
(6.17)
Pentru a testa ipoteza nul se stabilete un prag de
semnificaie . Din tabelul repartiiei Student se determin
valoarea tabelat t / 2 . Dac valoarea calculat prin (6.17)
este mai mare dect t / 2 atunci se respinge ipoteza nul. Se
accept c cei doi coeficieni difer semnificativ.
-

Capitolul 6 Inferena statistic n regresia simpl

147

6.3. Verificarea normalitii reziduului


Testele folosite pentru verificarea unor ipoteze
formulate asupra parametrilor modelului de regresie, precum
i pentru definirea intervalelor de ncredere pentru acetia i
pentru efectuarea de previziuni pornesc de la verificarea
ipotezei repartizrii normale a reziduului.
Relaiile folosite pentru testarea caracteristicilor
repartiiei reziduului sunt definite innd seama de asimetria
i aplatizarea repartiiei normale.
Pentru o variabil aleatorie ce este repartizat normal
valoarea coeficientului de asimetrie este zero, iar a celui de
aplatizare este trei.
Se consider modelul
liniar de regresie
y i b axi i , i 1,..., n , i seria reziduului estimat
ei i 1,n , cu ei yi (b axi ) . Pentru seria reziduului se
definesc doi indicatori folosii n statistica descriptiv pentru
analiza asimetriei i aplatizrii unei serii de distribuie:
- coeficientul de asimetrie

1
-

32
23

coeficientul de aplatizare

2 4
2
Pentru a defini testele statistice folosite pentru
verificarea repartizrii reziduului dup o distribuie normal
se utilizeaz urmtoarea proprietate a coeficienilor de
asimetrie i aplatizare:

148

Elemente de econometrie

Se consider variabila aleatorie X N ( m, x ) .


Coeficienii de asimetrie i aplatizare calculai pentru o serie
de date cu n valori, ce este definit pentru aceast variabil,
satisfac proprietile de mai jos:
2

11 / 2 N 0,

2 N 3,

6
,
n
24
n

Pentru a verifica ipoteza nul a repartizrii normale a


reziduului ei i 1, n se recurge la unul dintre testele:
- teste pentru verificarea asimetriei i aplatizrii
distribuiei reziduului estimat;
- testul Jarque Bera.
Pe baza seriei estimate se verific dac aceast
distribuie este normal repartizat. Folosind aceast serie, se
estimeaz cei doi coeficieni prin 11/ 2 , respectiv 2 .
Sub ipoteza nul, H0: 1 = 0, rezult:
1 / 2
S 1 N 0,1
.
6
n
Asemntor, dac se definete ipoteza nul asupra
celui de-al doilea coeficient sub forma H0:2=3, atunci:
3
K 2
N 0,1
24
n
Se accept ipoteza nul potrivit creia reziduul este
uniform repartizat, dac sunt ndeplinite simultan
inegalitile:

Capitolul 6 Inferena statistic n regresia simpl

S t

unde

149

i K t1 ,
2

este valoarea cuartilei repartiiei N(0,1)

pentru pragul de semnificaie .


Testul Jarque Bera permite verificarea simultan a
proprietilor de asimetrie i aplatizare ale seriei reziduurilor.
Testul este definit n raport cu cei doi coeficieni 11 / 2
i 2 , innd seama de repartiia estimatorilor acestora,
rezultnd:

1/ 2

J B 1

24

Sau sub forma echivalent:


J B

2 3

22 .

2
n
n
1
2 3
6
24

Pentru un prag de semnificaie se respinge ipoteza


nul a repartizrii normale a variabilei reziduale, dac este
ndeplinit inegalitatea:
J B 22;1 .
6.4. Predicia prin modelul de regresie

Pe baza seriei de date xi , y i i 1,n s-au estimat


parametrii dreptei de regresie. Se obine seria valorilor
estimate pentru variabila endogen prin intermediul relaiei:
y i b axi , i 1, n

n procesul de previziune, folosind modelul liniar de


regresie, se pune problema de a rezolva urmtoarele dou
probleme:

150

Elemente de econometrie

- efectuarea de previziuni punctuale sau prin


intervale de ncredere. Se recurge, pentru efectuarea
primei previziuni, la metoda punctual, iar n cel de-al
doilea caz, la previziunea printr-un interval de
ncredere;
- verificarea ncadrrii unor puncte n tendina
postulat de un model de regresie. Dac sunt
precizate valori pentru cele dou caracteristici ale
modelului de regresie, sub forma perechii (x0,y0), se
pune problema de a stabili dac acestea se ncadreaz
n trendul definit de modelul de regresie. Vom verifica
dac valoarea caracteristicii endogene se ncadreaz
n intervalul de previziune ce a fost definit pentru un
nivel al caracteristicii exogene i un prag de
semnificaie.
Vom efectua previziuni punctuale sau prin interval de
ncredere pentru o valoare a caracteristicii endogene y0 sau
pentru media acesteia, E(y0 ). Pentru fiecare caz n parte sunt
stabilite diverse formule de calcul pentru previziunea
punctual i cea prin interval de ncredere.
Pentru modelul liniar de regresie valoarea real a
caracteristicii endogene este specificat prin intermediul
relaiei:
y 0 b ax 0 0
(6.18)

unde 0 este realizarea unei repartiii normale de


medie zero i dispersie egal cu unu.
Valoarea punctual estimat prin modelul liniar de
regresie este definit prin relaia:
y 0 b ax 0

De regul, aceast valoare este utilizat pentru


definirea unui interval de ncredere. Pentru a defini intervalul
de ncredere, n condiiile n care se specific un nivel al

Capitolul 6 Inferena statistic n regresia simpl

151

pragului de semnificaie, se ine seama de faptul c, prin


utilizarea modelului liniar de regresie pentru definirea
previziunii punctuale, se comite o eroare de predicie egal
cu:
e0 y 0 y 0
(b b) ( a a ) x 0 0

(6.19)

Lund n considerare proprietile celor doi estimatori


ai parametrilor dreptei de regresie, vom prezenta n cele ce
urmeaz, principalele proprieti ale erorii de previziune.
Media erorii de previziune este egal cu zero. Se
definete egalitatea:
E(e0)=0
Rezultatul de mai sus este evident dac se aplic
operatorul de medie termenilor egalitii (6.19), lund n
considerare proprietile celor doi estimatori i ipoteza
formulat asupra variabilei reziduale.
Dispersia erorii de previziune comise n cazul n care
se dorete efectuarea unei previziuni pentru valoarea
caracteristicii endogene y0 este:

var e0

1
1
n

x x
x x

(6.20)

Pentru a obine expresia varianei erorii de previziune


se aplic dispersia termenilor egalitii (6.19). Se obin
rezultatele urmtoare:

152

Elemente de econometrie

var e0 E (e02 ) var(b) x 02 var(a ) var(e0 ) 2 x0 cov(a , b)

2x x
0

S xx

1
1
x
x 02

S
n
S
xx
xx

1
1
n

x x
x x

Pentru construirea unui interval de predicie pentru


valoarea variabilei endogene, n condiiile n care se fixeaz
un nivel al caracteristicii exogene, se ine seama de
urmtoarele dou rezultate:
y 0 y 0
N (0,1)

(6.21)
y 0 y 0
t n 2
p
Am notat prin p estimatorul abaterii medii standard
a erorii de previziune comise n cazul n care se efectueaz o
previziune pentru mrimea y0. Aceasta este calculat prin
relaia urmtoare:
1

x x
x x
2

(6.22)

Dac se fixeaz un anumit prag de semnificaie ,


atunci vom defini intervalul de predicie pentru y0:
y t / 2

1
1
n

x x
x x
2

y 0 y t / 2

1
1
n

x x
x x
2

(6.23)

Capitolul 6 Inferena statistic n regresia simpl

153

Pentru un prag de semnificaie stabilit, mrimea


intervalului de predicie este funcie de urmtoarele mrimi:
- valoarea caracteristicii exogene pentru care se
previzioneaz valoarea caracteristicii endogene.
2
Acest factor se cuantific prin termenul x0 x ;
- numrul de termeni ai seriei ce au fost folosii
pentru estimarea parametrilor modelului liniar de
regresie. Eroarea de previziune este invers
proporional cu n;
- calitatea modelului de regresie ce este cuantificat
prin dispersia variabilei reziduale;
- valoarea pragului de semnificaie.
n situaia n care se efectueaz o previziune asupra
valorii medii E(y0), n condiiile n care se stabilete o valoare
a caracteristicii exogene, dispersia erorii de previziune este:

1
var(e0 )
n

x x
x x

(6.24)

Pentru demonstrarea ultimei relaii se ine seama de


faptul c eroarea de previziune ce se comite n acest caz este:
e0 E ( y 0 ) y 0
(b b) (a a ) x 0 0

Aplicnd operatorul de medie termenilor egalitii de


mai sus, se obine formula (6.24).
6.5. Metoda lui W.F. Sharpe (alegerea portofoliului)
Aceast metod se mai regsete n teoria economic
sub numele de metoda beta. Aceast metod are o larg
utilizare n studiul riscului unei aciuni. n cadrul acestei
metode, riscul se identific prin variaia randamentului

154

Elemente de econometrie

acesteia. Astfel, cu ct randamentul portofoliului are un grad


mai mare de variaie, cu att riscul acestuia este mai mare. Se
va nota prin Rt randamentul total al unei aciuni la un moment
dat, iar prin it se noteaz variaia indicelui de la o perioad
la alta. Acesta este un element al modelului de regresie
Sharpe.
Pentru a alege funcia de regresie se reprezint grafic,
n sistemul cartezian de axe, punctele (Rt, it) pentru toate
perioadele t. se genereaz un nor de puncte ce st la baza
formrii dependenei dintre cele dou variabile.
Dac aceste puncte sunt aliniate de-a lungul unei
drepte, atunci dependena dintre cele dou variabile este
liniar:
Rt = + it+ t
(6.25)
unde:
- parametrul cuantific componenta din
randamentul total al aciunii independent de
variaia indicelui caracteristicii exogene din
modelul liniar de regresie;
- parametrul stabilete n ce msur modificarea
indicelui caracteristicii exogene cu un procent
determin creterea sau scderea randamentului
aciunii;
- t reprezint variabil rezidual a modelului liniar
de regresie, ce cuantific variaia aleatorie a
randamentului aciunii sub aciunea altor factori
dect cel nregistrat.
Prin intermediul acestui model, factorii ce acioneaz
asupra randamentului aciunilor sunt mprii n dou clase:
- factori macroeconomici, ce acioneaz, ntr-o
msur mai mare sau mai mic, asupra tuturor
aciunilor: rata inflaiei din economie, indicatorii

Capitolul 6 Inferena statistic n regresia simpl

155

de performan ai mediului economic sau ai


pieelor financiare etc. Dintre aceti factori este
ales cel n funcie de care definim modelul liniar
de regresie;
- factori microeconomici, ce acioneaz asupra
randamentului unei aciuni sau unui grup de
aciuni. Aceti factori sunt cuantificai n cadrul
modelului prin intermediul variabilei reziduale.
Pentru estimarea celor doi parametri ai dreptei de
regresie se recurge la metoda celor mai mici ptrate. Pentru
definirea estimatorilor se ine seama de faptul c variabila
rezidual (t) satisface urmtoarele ipoteze:
- fiecare variabil rezidual are sperana matematic
nul, deci E(t) = 0;
- variabilele t i t sunt necorelate, ntruct se
admite ipoteza de necorelare a riscurilor specifice
ale aciunilor din cadrul portofoliului, luate dou
cte dou;
- variabilele reziduale sunt distribuite normal:
t N (0, ), ()t 1, m .
n urma aplicrii metodei celor mai mici ptrate se
determin un estimator al coeficientului de volatilitate ()
prin relaia:
cov( Rt , i )


t t
(6.26)
2

unde:
- t este coeficientul liniar de corelaie calculat
pentru a msura dependena liniar dintre randamentul
aciunii i indicele pieei;
- t reprezint abaterea standard calculat n cazul
randamentului aciunii;

156

Elemente de econometrie

- este abaterea standard a indicelui pieei


financiare.
n funcie de valoarea parametrului , sunt identificate
urmtoarele tipuri de aciuni:
- dac < 0, atunci randamentul aciunii evolueaz
diferit n raport cu tendina general a pieei
financiare;
- n situaia n care (0,1) , atunci aciunea are o
volatilitate redus. n acest caz variaia
randamentului aciunii este mai redus n raport cu
modificarea indicelui pieei de la o perioad la
alta. Astfel, un exemplu de aciune puin volatil
este n cazul n care indicele pieei se modific cu
8%, n condiiile n care variaia randamentului
aciunii este de 5%;
- n cazul n care = 1 aciunea este neutr. Pentru
o aciune neutr randamentul se modific n
aceeai proporie cu indicele pieei financiare. De
exemplu, dac indicele pieei financiare
nregistreaz o variaie de 2%, atunci i
randamentul aciunii va nregistra aceeai cretere;
- dac > 1, atunci aciunile au o volatilitate
ridicat. Aciunile din aceast clas au o
sensibilitate ridicat la variaiile de ansamblu ale
pieei financiare. Aceste aciuni prezint un interes
sporit pentru speculatorii de pe pieele financiare.
n acest caz riscul aciunii este deosebit de mare.
De exemplu, la o variaie cu 3% a indicelui pieei,
pentru aciunile acestei clase se nregistreaz o
variaie a randamentului mai mare de 3%.
n practica financiar, rezultatele oferite de aceast
metod sunt privite cu rezerv, ntruct, n timp ce parametrul

Capitolul 6 Inferena statistic n regresia simpl

157

se calculeaz pe baza unei serii de date din trecut, riscul se


refer la o perioad viitoare.
6.6. Metoda regresiei globale
Aceast metod se fundamenteaz pe ipoteza c
randamentul unei aciuni oscileaz n raport cu variaia
randamentului global al pieei pe care se tranzacioneaz sau
n raport cu performanele de ansamblu ale mediului
economic.
Astfel, dac dependena este de tip liniar, atunci
ecuaia de regresie este:
Rij i iRP j ij , j 1, n
(6.27)
unde:
- RPj reprezint randamentul global al pieei la un
moment dat;
- i, i sunt parametrii modelului de regresie ce este
definit pentru aciunea Ai; Parametrul i, panta
dreptei de regresie, msoar n ce msur
oscilaiile nregistrate de piaa financiar sunt
resimite la nivelul aciunii Ai.
Pentru fiecare aciune, variabila rezidual ce
cuantific variaiile randamentului aciunii Ai sub influena
altor factori dect modificrile randamentului global al pieei,
satisface urmtoarele ipoteze:
- toate variabilele aleatorii ij sunt variabile care au
media egal cu zero. Astfel, E( ij )= 0 pentru toi indicii j;
- variabilele reziduale ce intervin n definirea
modelului liniar de regresie au proprietatea de
2
homoscedasticitate. Astfel, var( ij ) i pentru orice indice
j;

158

Elemente de econometrie

- variabilele reziduale ale modelului liniar de regresie


sunt liniar independente. n aceast situaie cov( ij , ik ) 0
pentru orice j k. vom spune c riscurile specifice ale
oricror dou aciuni sunt necorelate;
- oricare variabil rezidual nu este corelat cu
randamentul global al pieei: cov( ij , RP ) 0 pentru orice
indice j.
Pentru modelul de regresie definit pentru o anumit
aciune a portofoliului sunt stabilite o serie de proprieti.
Acestea sunt utile n interpretarea rezultatelor obinute prin
aplicarea modelului regresiei globale.
- Pentru fiecare aciune din cadrul unui portofoliu
se definete urmtoarea egalitate:
E ( Ri ) i i E ( RP)
(6.28)
Aceast proprietate arat c, pentru fiecare aciune,
dreapta de regresie trece prin centrul de greutate al norului de
puncte. Aceasta este de fapt o proprietate universal valabil
pentru orice model liniar de regresie.
- Dispersia oricrei aciuni se descompune n dou
componente, cea datorat aciunii factorului sistematic, pe de
o parte, i cea datorat factorilor aleatorii, pe de alt parte.
Aplicnd operatorul de dispersie termenilor egalitii
(6.27), se obine rezultatul urmtor:

var( Ri ) i2 E ( Ri j R i ) 2 E i ( RP j RP ) ( ij ij )
i2 2p 2i

(6.

29)
Ultimul termen al relaiei de mai sus pune n eviden
faptul c riscul total al unei aciuni se descompune n dou
componente: cea datorat riscului sistematic, pe de o parte, i
cea datorat riscului ce rezult din schimbri aleatorii. n
aceste condiii se scrie urmtoarea egalitate:

Capitolul 6 Inferena statistic n regresia simpl

159

i2 i2 2p 2i

(6.30)

Riscul total = riscul sistematic + riscul accidental


- Covariana randamentelor a dou aciuni oarecare
din cadrul portofoliului este o mrime influenat n mod
direct de doi factori: coeficienii modelelor liniare de regresie
ce sunt definite pentru dou aciuni i dispersia
randamentului total al pieei. Se calculeaz covariana
aciunilor unui portofoliu prin urmtoarea relaie:
2
kp
k p t2
(6.31)
Pentru a obine relaia (6.31) se ine seama de formula
de calcul a covarianei, de forma modelului liniar de regresie
i de ipotezele formulate asupra variabilei reziduale. n aceste
condiii se obin succesiv urmtoarele rezultate:
2
cov( R k , Rp ) kp
E[( R kj R k )( R pj R p )]

E[ k p ( RT j RT ) 2 ] E[ k ( RP j RP )( pj
E[ p ( kj k )( RP j RP )] E[( pj
k p

2
p

k 2p , RP

2
p k , RP

)]

)( kj k )]

2k ,p

Potrivit ipotezelor formulate mai nainte rezult c:


2k , RP

2p , RP 2kp 0

nlocuind aceste rezultate n formula covarianei se


obine relaia (6.31).
Pentru fiecare dreapt de regresie (6.28) parametrii
i , i sunt estimai prin metoda celor mai mici ptrate innd
seama de seria randamentelor aciunilor i ale pieei
financiare nregistrate ntr-o perioad trecut.
Se stabilesc n cele ce urmeaz relaiile de calcul ce
exist ntre parametrii modelului de regresie al fiecrei
aciuni, definit n funcie de caracteristica pieei financiare
sau a mediului economic, i parametrii modelelor de regresie

160

Elemente de econometrie

definite pentru un portofoliu. Se consider aciunile din


structura portofoliului ca fiind A1,,Am.
- Pentru randamentul mediu al portofoliului
caracterizat prin vectorul de structur f definim relaia:
E ( RT ) T T E ( RP )
n

i 1

i 1

unde T f i i , T f i i .
Aceast egalitate se deduce fr dificultate dac inem
seama de relaia (6.29) i de structura portofoliului. Lund n
considerare cele dou elemente, se obine pentru fiecare
aciune din portofoliu:
f i E ( Ri ) f i i f i i E ( RP) .
Pentru toate aciunile se adun aceste relaii. Apoi, din
formula de calcul a mediei aritmetice, se obine relaia de mai
sus.
- Riscul total al portofoliului, msurat prin dispersia
randamentului ntr-un orizont de timp, este constituit din
riscul sistematic, la care se adaug riscul aleatoriu ce se
manifest la nivelul pieei financiare.
innd seama de relaia de calcul a riscului
portofoliului i de relaiile (6.30) i (6.31) se obin rezultatele
urmtoare:

2
T

2
i

i 1

i 1

j 1

2
T

2
T

ij

i , j 1
i j
2
T

i 1

i 1

fi (

2
p

2
i

2
i )

i 1

i 1

.
Riscul portofoliului se descompune n cele dou
componente conform egalitii urmtoare:
T2 T2 T2

f
i 1

2i

(6.32)

i 1

i , j 1
i j

2
T

2
T

Capitolul 6 Inferena statistic n regresia simpl

161

Risc total = risc sistematic + risc aleatoriu


Pentru determinarea unui portofoliu optim n situaia
n care se specific un nivel al randamentului, se rezolv
urmtoarea problem de optimizare:

[min]( 2 )
T

f 1 ,..., f m

E ( RT )

f E(R )
i

(6.33)

i 1

f
i

i 1

Prin intermediul regresiei globale se reduce n mod


simitor numrul operaiilor ce sunt necesare pentru
calcularea randamentului global i riscului total.

Capitolul 7
Modelul clasic al regresiei
multiple
Situaia n care corelaiile economice implic numai
dou variabile se ntlnete foarte rar. Mai degrab ne
confruntm cu situaii n care o variabil dependent, Y,
poate depinde de o ntreag serie de variabile factoriale sau
regresori. De exemplu, cererea pentru o marf nu depinde
numai de preul acesteia ci i de preurile mrfurilor
substituente sau complementare, de nivelul general al
preurilor precum i de resursele consumatorilor. Astfel, n
practic, exist, n mod normal, corelaii de forma:
Y = 1 + 2 X2 + 3X3 + 4X4 +...+ kXk +

(7.1)

unde valorile Xj (j = 2, 3, ..., n) reprezint variabilele


factoriale, sau regresorii, valorile j (j = 1, 2, 3, ...,k)
reprezint prametrii de regresie iar reprezint factorul
factor rezidual.
Factorul rezidual reflect natura aleatorie a reaciei
umane i a oricror ali factori, alii dect Xj, care ar putea
influena variabila Y.
A se observa c n (7.1) am adoptat notaia uzual,
respectiv atribuind primului factor notaia X2, celui de al
doilea notaia X3 etc. De fapt, dup cum vom vedea, uneori
este convenabil ca parametrul s fie considerat acel
coeficient al unei variabile X1 a crui valoare este ntotdeauna

Capitolul 7 Modelul clasic al regresiei multiple

163

egal cu unitatea. Atunci devine posibil ca (7.1) s se rescrie


sub forma:
Y = 1X1+2X2 + 3X3 +...+ kXk +

(7.1a)

7.1. Metoda celor mai mici ptrate (OLS ) n regresia


multipl
Dac presupunem, ca i n cazul regresiei cu dou
variabile, c E() = 0, atunci, nlocuind n (7.1), pentru valori
date ale variabilelor X, rezult:
E(Y)=1 + 2 X2 + 3X3 + 4X4 +...+ kXk
(7.2)

Ecuaia (7.2) este cunoscut sub denumirea de


ecuaia de regresie multipl. Pentru moment, n mod
convenional, considerm c este de form liniar. Spre
deosebire de cazul regresiei cu dou variabile, nu putem
reprezenta aceast ecuaie printr-o diagram cu dou
dimensiuni.
J reprezint parametrii de regresie. Uneori mai sunt
denumii i coeficieni de regresie.
1 este o constant
(intercept) iar 2 , 3 etc., sunt parametri ai pantei
regresiei.
De reinut faptul c 4 , de exemplu, msoar efectele
asupra E(Y) produse de modificarea cu o unitate a lui X4 , n
condiiile n care toate celelalte variabile factoriale rmn
constante. Similar, 2 msoar efectele asupra E(Y) produse
de modificarea cu o unitate a lui X2 , n condiiile n care toate
celelalte variabile factoriale rmn constante.
Ordinary best squares

164

Econometrie Teorie i studii de caz

ntruct ecuaia regresiei populaiei este necunoscut,


aceasta trebuie estimat pe baza datelor unui eantion.
Presupunem c avem la dispoziie un eantion de n
observri, fiecare observare coninnd valori att pentru
variabila dependent Y ct i pentru fiecare dintre variabilele
factoriale X. Vom scrie valorile pentru observarea i sub
forma:
Yi , X2i , X3i , X4i ,..., Xki
Astfel, de exemplu, X37 reprezint valoarea lui X3 n
cea de a 7-a observare iar X24 reprezint valoarea luat de X2
n cea de a 4-a observare. De o manier similar, Y6
reprezint valoarea variabilei Y n cea de a 6-a observare etc.
n condiiile n care se presupune c datele
eantionului au fost generate prin corelaia populaiei (7.1),
fiecare obvservare trebuie s implice un set de valori care s
satisfac (7.1).
Prin urmare, putem scrie:
Yi = 1 + 2X2i + 3X3i + ...+ kXki + i
pentru toate valorile ,
(7.3)
unde i reprezint valoarea rezidualului pentru
cea de a i-a observare.
Este mai convenabil s rescriem (7.3) sub o form
matriceal simpl, respectiv:
Y = X +
(7.4)
unde putem utiliza forma vectorial (matriceal):

Capitolul 7 Modelul clasic al regresiei multiple

Y1

Y2
Y
3

165

1X 21 X 31 ... X k1

1X 22 X 32 ...X k 2

Y =

1
2

3

.
.

Yi

1X X ... X
23 33
k3

X =

.
.

1X 2i X 3i ...X ki

166

Econometrie Teorie i studii de caz

2

3

.
.

X este o matrice de forma n x k coninnd o coloane


cu valorile i apoi toate valorile eantionului de k 1, X
variabile. Astfel, cea de a patra coloan a lui X, de exemplu,
conine valorile lui X4 ale eantionului n, cea de a aptea
coloan conine valorile lui X7 i aa mai departe. este un
vector al coloanei k x 1 care conine parametrii j iar este
un vector al coloanei n x 1 care conine valorile rezidualului.
Presupunem c datele eantionului au fost utilizate
pentru estimarea ecuaiei de regresie.

Metoda de estimare rmne neprecizat i


presupunem c a fost estimat printr-o ecuaie
de regresie a eantionului , pe care o scriem
sub forma:

(7.5)

Capitolul 7 Modelul clasic al regresiei multiple

167

^^^ ^ ^

Y 12 X23X3 . k Xk
unde

reprezint estimatori pentru j iar

este cunoscut ca valoare previzionat a lui Y.


Dac lum a i-a observare a eantionului i nlocuim
valorile sale X n (7.5) atunci, ntruct

reprezint estimri

cunoscute, obinem o valoare previzionat pentru Y aferent


^
celei de a i-a observri, respectiv valoarea
. Ca i n cazul
i
regresiei cu dou variabile, obinem o valoare previzionat a
lui Y
pentru fiecare observare din cadrul eantionului.
Aceste valori pot fi scrise sub forma:

168

Econometrie Teorie i studii de caz

^^^ ^ ^

Y 12 X2i3X3i . ki Xki

(7.6)

, pentru toate valorile i


Valorile efective ale lui Y nu vor coincide
cu valorile previzionate ale lui Y i, ca i n
cazul regresiei cu dou variabile, diferenele
dintre acestea sunt cunoscute ca valori
reziduale.
^

Yi Yi ei

(7.7)

pentru toate valorile i

unde ei reprezint rezidualul corespunztor celei


de a i-a observri.
Ecuaia (7.7) este de fapt identic cu relaia aferent
regresiei cu dou variabile ns, la modul general nu am fost
n msur s ilustrm grafic ei. Utiliznd (7.6) putem rescrie
(7.7) sub forma:

Capitolul 7 Modelul clasic al regresiei multiple

169

^^ ^ ^

Yi =

12 X2i 3 X3i . ki Xki ei

(7.8)

pentru toate valorile i


Ecuaia (7.8) mai poate fi scris i sub form
matriceal astfel:
^

Y X e

(7.9)

unde X i Y sunt deja definite iar :

e1

e2

e
3

.

.

.

k

e .

e
n

170

Econometrie Teorie i studii de caz

Exist dou aspecte ce trebuie reinute referitor la


valorile reziduale. n primul rnd, indiferent de metoda
utilizat pentru a estima ecuaia regresiei (7.2), vom obine
astfel de valori reziduale cte una pentru fiecare dintre
observrile eantionului. n al doilea rnd, deoarece odat
(7.2) estimat,

devine cunoscut iar ecuaia (7.8) poate fi

utilizat pentru calcularea acestora. Ca i n cazul regresiei cu


dou variabile, valorile reziduale sunt cunoscute.
Cea mai cunoscut metod de estimare n cazul
regresiei multiple este metoda celor mai mici ptrate. Ca i n
cazul regresiei cu dou variabile, alegem funcia de regresie a
eantionului i minimizm suma ptratelor valorilor
reziduale.
Aceasta nseamn c selectm acele valori pentru

^ ^^ ^

1, 2 , 3 . k

din (7.5) care s minimizeze relaia:

^2


S e Yi Yi

2
i

(7.10)

Capitolul 7 Modelul clasic al regresiei multiple

unde

Yi

171

este dat de (7.6).

Minimizarea

ecuaiei

(7.10)

diferenialului lui S n raport cu fiecare

implic
^

calcularea

pe rnd. Aceasta

este complicat n termeni de algrebr obinuit astfel nct


este mai bine ca n aceast etap s lucrm n termeni
2
matriceali. Reinem c ei e' e . Astfel, utiliznd (7.9),
rezult urmtoarele relaii:


S e' Y X ' Y X

^ ^


Y' X'' Y X

^

^^ ^

'YY X'' Y Y'X X'' X

(7.11)

172

Econometrie Teorie i studii de caz

^ ^ ^

Y'Y 2 X'' Y X'' X


unde

ultimul

pas

este

posibil

deoarece

' X 'Y Y ' X sunt scalari.


Acum trebuie s calculm difereniala pentru (7.11) n
^

raport cu vectorul

i egalm rezultatul cu zero. O astfel de

matrice conduce la relaia:

S
^

2 X 'Y 2 X ' X 0

(7.12)

Ecuaia (7.12) reprezint un set de ecuaii k care se


pot scrise sub forma:
^

X ' X X 'Y
Ecuaiile

(7.13)
^

X ' X X 'Y sunt

ecuaii normale n cazul

regresiei multiple i sunt analoage cu ecuaiile aferente

Capitolul 7 Modelul clasic al regresiei multiple

173

regresiei cu dou variabile. Reinem c dac l substituim pe


Y din (7.13) utiliznd (7.9), obinem:

'XX ' XX e 'XX X'e

^ ^ ^

Prin urmare:
Xe = 0

(7.14)

Din definiiile pentru X i e se poate observa c (7.14)


presupune urmtoarele:

0 ,

e X
i

2i

0,

e X
i

3i

0,

e X
i

4i

0 etc.

(7.14a)

Astfel, una dintre proprietile metodei estimatorilor


OLS const n aceea c valorile reziduale care rezult satisfac
corelaiile (7.14a). Reamintim c exist o corelaie similar i
n cazul regresiei cu dou variabile.
Impunnd condiia ca matricea XX s fie nonsingular, ecuaiile normale (7.13) pot fi rezolvate pentru a
^

obine , respectiv vectorul pentru estimatorii uzuali ai celor


mai mici ptrate (OLS). Multiplicnd (7.13) cu (XX)-1
obinem:

174

X'X

Econometrie Teorie i studii de caz

X ' X ) X ' X X ' Y


1

Prin urmare:
^

X ' X X 'Y
1

(7.15)

Ecuaia (7.15), care este expresia estimatorilor OLS n


cazul regresiei multiple, este cea mai cunoscut formul din
econometrie.
Pentru a calcula vectorul

trebuie s parcugem

urmtoarele etape:
(i)
formm matricea k x k pentru XX
i matricea k x 1 pentru XY;
(ii)
formm matricea invers k x k
-1
pentru (XX) ;
(iii)
multiplicm matricea k x k pentru
-1
(XX) n matricea k x 1 pentru XY.
Etapa (iii) de mai sus conduce la vectorul k x 1 al
^

estimrilor OLS, .
Etapa (ii) implic cel mai mare efort de calculaie.
Chiar i cu numai dou variabile factoriale X, k = 3, ne
confruntm cu inversarea unui numr de 3 x 3 matrici. Pe
msur ce numrul variabilelor factoriale crete, dificultatea
calculului crete exponenial. Din aceast cauz, calcularea
expresiei (7.15) este n mod normal sarcina unui. Sunt

Capitolul 7 Modelul clasic al regresiei multiple

175

disponibile pachete de estimatori OLS gata calculai pe


computer.
Efortul de calcul implicat de obinerea estimatorilor
OLS poate fi diminuat dac lucrm n termeni de abatere a
variabilelor de la media lor. Dup cum vom vedea, rezult c
n loc de a rsturna o matrice k x k, aa cum este indicat n
etapa (ii) de mai sus, trebuie s rsturnm o matrice numai de
ordinul (k - 1) x (k 1).
S considerm din nou ecuaia (7.8). Dac nsumm
aceast ecuaie pentru toate valorile i i mprim rezultatul la
n, obinem:

^^ ^ ^

Y 1 2 X 2 3 X 3 . k X k e

(7.16)

Trebuie s reamintim faptul c una dintre proprietile


metodei OLS de estimare este aceea c ei i, prin
urmare, e , este egal cu zero. Aa dar, dac ndeprtm (7.16)
din (7.8), obinem:

^ ^

yi 2 x2i 3 x3i . k xki ei


pentru toate valorile i

(7.8a)

176

Econometrie Teorie i studii de caz

unde literele scrise cu minuscule reprezint abaterile


variabilelor de la mediile lor. Aceasta nseamn c
y i Yi Y iar x 2i X 2i X 2 etc.
Putem scrie

^^ ^ ^

12 X2i 3 X3i . ki Xki ei

Yi =

ntr-o form similar cu

Y X e , respectiv:
^

y =x +e

(7.9a)

n aceast variant definim matricele aferente lui


^

x i sub forma:

y,

Capitolul 7 Modelul clasic al regresiei multiple

y1

y2
y
3

x21 x31 x41 ...xk1

x22 x32 x42 ...xk 2

2
3

4

.
.

.
.

yn

177

x x x ...x
23 33 43 k 3

x=

......................

x2n x3n x4 n ...xkn

178

Econometrie Teorie i studii de caz

Ecuaia y = x + e difer de

Y X e

prin aceea c

valorile variabilelor sunt acum ntr-o form deviat,


coloanele unora dintre ele nu apare n matricea x, care este de
ordinul n x (k 1) iar

nu mai apare deloc n vectorul

care, acum, este de ordinul (k 1) x 1. vectorul e rmne ca


n definiia precedent.
Problema este c, ntruct definiia lui e rmne
neschimbat, suma ptratelor valorilor reziduale este n
continuare ee i, utiliznd (7.9a) poate fi exprimat ntr-o
form similar lui (7.11), excepie fcnd faptul c matricele
x i y nlocuiesc matricele X i Y.
Fcnd difereniala n raport cu vectorul

redefinit

conduce la o expresie similar lui (7.15), cu excepia faptului


c valorile variabilelor se prezint ntr-o form modificat.
^

Aceasta nseamn c: (xx)-1xy


Avantajul prezentat de
^

X ' X X 'Y
1

(xx)

-1

xy

fa de

const n aceea c matricea (xx) este de ordinul

(k 1) x (k 1) fa de k x k. Singura problem care se ridic


este aceea c noul vector

nu mai conine o valoare pentru

Capitolul 7 Modelul clasic al regresiei multiple

. Din moment ce

valoare pentru

179

este cunoscut, se poate obine o

1 prin re-aranjarea ecuaiei (7.16), pentru

e0:

^ ^ ^ ^

1 Y 2 X 2 3 X 3 . k X k

(7.17)

Sintetiznd, putem calcula estimatorii OLS prin dou


modaliti. Prima const n utilizarea (7.15) ns presupune
lucrul cu o matrice de ordinul k x k. Ca alternativ, putem
lucra n termeni de abateri de la mediile variabilelor, utiliznd
(7.15a), care necesit numai inversarea unei matrice de
ordinul (k 1) x (k 1). Aceast a doua metod mai necesit
i utilizarea ecuaiei (7.17) pentru a stabili valoarea

1.

7.1.1. Determinaia n regresia multipl

n abordarea aspectelor privind regresia cu dou


variabile am definit coeficientul de determinare, care msoar
proporia variaiei determinat de variabila explicativ X n
totalul variaiei variabilei Y.

180

Econometrie Teorie i studii de caz

O msurare similar a exactitii armonizrii poate fi


definit i pentru regresia multipl.
S considerm ecuaia (7.7). Prin eliminarea lui Y
din fiecare parte a ecuaiei obinem:
^

Yi Y Y i Y ei pentru fiecare valoare i

(7.18)

Astfel, dac msurm abaterile lui Y n jurul mediei


sale, Y , putem afirma c, pentru fiecare observare, abaterea
total a lui Y poate fi mprit ntr-o abatere explicabil,
^
, i o abatere rezidual, ei . Ecuaia (7.18) este identic
i
cu cea aferent regresiei cu dou variabile.
Ca i n cazul regresiei cu dou variabile, mai nti
ridicm la ptrat (7.18) i apoi procedm la nsumarea tuturor
observrilor.
Funcia de regresie devine:

Y Y

Capitolul 7 Modelul clasic al regresiei multiple

181


^ ^ ^
e ii YY ei X22 i3X3i . kiYX 1ei 2X2iei 3X3iei .


^ ^^^ ^ ^

(7.19)

k X ki ei Y ei 0
Astfel:

Y Y (Y
2

2
2

Y
)

i
i

(7.20)

sau
SST = SSE + SSR
Ecuaia (7.20) este identic cu cea aferent regresiei
cu dou variabile. Ea implic faptul c, pe ansamblul

182

Econometrie Teorie i studii de caz

msurtorilor, rezultatul msurrii variaiei totale a lui Y, SST,


poate fi din nou divizat ntr-o msurare a variaiei factoriale
a lui Y, SSE, i o variaie rezidual, SSR. Trebuie s
subliniem c (7.20) este valabil, ca i n cazul regresiei cu
dou variabile, numai dac metoda de estimare este OLS,
deoarece corelaia (7.14a) se susine numai pentru aceast
form de estimare.
Putem defini coeficientul de determinaie multipl,
R2, ca fiind proporia variaiei totale a lui Y ce poate fi
atribuit variaiilor tuturor variabilelor factoriale acionnd
concertat.
Avnd n vedere (7.20), aceasta nseamn:

R2

suma explicabil a ptratelor SSE

suma total a ptratelor


SST

Putem considera
variabile, astfel c:
R2 1

e
y

2
i
2
i

(7.21)

ca n cazul regresiei cu dou

(7.22)

Suma reziduurilor ptratelor din (7.22) poate fi apoi


calculat prin extindere, ceea ce, demonstrabil, se susine
pentru regresia multipl:

Capitolul 7 Modelul clasic al regresiei multiple

183

e y x y x y . x y

2 2
i i 2 2i i 3 3i i k ki i

(7.23)

7.1.2. Utilizarea criteriului Akaike

O alt metod care permite luarea n


consideraie a numrului de variabile factoriale
atunci cnd se stabilete valabilitatea armonizrii
este dat de criteriul Akaike de informare
(AIC). Acesta este definit astfel:

2
i

AIC = ln

(7.24)

2k

n acest caz nu vom fi preocupai de bazele teoretice


ale AIC, rezumndu-ne la a meniona c n acest caz criteriul
const n a include o variabil suplimentar numai n msura
n care aceasta conduce la diminuarea AIC. Ca i R 2 , AIC
2
depinde de suma rezidual a ptratelor, ei , i de numrul
de parametri care trebuie estimai, k. Totui, n cazul unei
2
scderi la nivelul ei , care survine atunci cnd se include
o variabil explicativ suplimentar, este posibil ca aceasta s
nu conduc cu necesitate i la scderea AIC. Variabila
suplimentar nseamn o cretere a lui k, respectiv a
numrului parametrilor care trebuie estimai, iar aceasta
conduce la creterea AIC. Prin urmare, AIC scade numai dac

184

Econometrie Teorie i studii de caz

scderea nregistrat de ei este suficient de mare pentru


a contracara efectul creterii lui k.
Pentru explificarea utilizrii, att a lui R 2 , ct i a lui
AIC, s revenim la ecuaiile consumului unei gospodrii,
pentru care am obinut deja valori pentru R 2 (neajustat),
respectiv 0,691 i 0,796.
Recurgnd la relaiile de calcul, obinem:
2

0,4901 / 23

= 1 - 1,587 / 24 0,678

4
49010
7,74

25
25

AIC = ln

Corelnd cu situaia adugrii unui factor suplimentar,


2
cum ar fi pachetul de titluri lichide, cu ei = 0,3234 x 105
2
i k = 3, fr modificarea lui y i i a lui n, se obine:
R

0,3234 / 22

= 1 - 1,587 / 24 0,778
6
32340
7,40

25
25

AIC = ln

Se poate observa c adugarea variabilei reprezentat


de pachetul de titluri lichide n ecuaia consumului
gospodriei face ca R 2 s creasc iar AIC s descreasc.
Printe modalitile de msurare a exactitii
armonizrii n raport cu includerea unor variabile factoriale

Capitolul 7 Modelul clasic al regresiei multiple

185

suplimentare se numr i criteriul Schwartz , precum i


criteriul Amemiya.
7.2. Ipotezele clasice n regresia multipl
Ca i n cazul regresiei cu dou variabile, OLS este de
departe cea mai popular i mai bine cunoscut metod de
estimare a parametrilor regresiei multiple. i n acest caz,
ns, este important s se sublinieze faptul c nu exist nici o
garanie cu privire la faptul c estimatorii OLS vor fi, ntr-un
sens sau altul, nite estimatori perfeci.
Ca i n cazul regresiei cu dou variabile, diferitele
eantioane vor conduce la estimri OLS diferite, astfel nct
fiecare valoare

va avea propria distribuie de eantionare.

Modelul clasic de referin pentru regresia multipl


este corelaia (7.1). Presupunem c aceast corelaie este cea
care a generat cele n observri ale eantionului, astfel ca
ecuaia (7.3) s se susin. Matricea echivalent ecuaiei (7.3)
este dat de (7.4). Ca i n cazul regresiei cu dou variabile,
prezumiile sunt fcute cu privire la variabilele factoriale i
reziduale.
7.2.1. Ipoteze cu privire la variabilele factoriale

Presupunem c fiecare dintre variabilele factoriale:


(IA) este non-stochastic;
(IB) are valori care sunt fixe n eantioane repetate;
(IC) este de o asemenea natur nct, pe msur de n
2
, variaia valorilor eantionului su (1/n) x ji Q j , (j
= 2, 3, ...,k) unde Qj sunt constante finite stabilite.

186

Econometrie Teorie i studii de caz

Similar regresiei cu dou variabile, variabila


dependent Y, care depinde de factor rezidual dar i de
variabilele X, este stochastic. Ipoteza IB implic faptul c,
dac se extrag eantioane repetate, acelai de valori pentru
variabilele X ar trebui s fie selectate n fiecare eantion.
Aceasta implic la rndul su c X, aa cum este definit mai
jos (7.4), poate fi tratat, din punct de vedere al procesului de
selecie, ca o matrice de constante stabilite. Vectorul Y al
valorilor eantionului va varia de la eantion la eantion dar,
ntruct conform (7.4) aceasta depinde nu numai de X ci i de
vectorul de valori reziduale, ,

, vectorul estimatorilor

OLS, care depinde att de X ct i de Y, va varia i el, prin


urmare , de la eantion la eantion. Astfel, n ciuda ipotezelor
IA i IB, estimatorii OLS vor prezenta n continuare
distribuii de selecie.
Ipoteza IC este o simpl extensie a ipotezei
corespunztoare aferent regresiei cu dou variabile i se
refer la variabilele factoriale care nregistreaz trenduri
categorice de-a lungul timpului. Semnificaia acestui fapt va
deveni mai clar ulterior dar, pentru moment, aceast ipotez
poate fi considerat ca reglementnd orice problem legat de
corelaii false.
n cazul modelului regresiei multiple mai exist i o a
patra ipotez referitoare la variabilele factoriale, care nu are
un echivalent n cadrul regresiei cu dou variabile. Aceasta
presupune c:
(ID) - nu exist nici o corelaie linear exact ntre
valorile eantionului aferent uneia sau mai multor variabile
explicative.

Capitolul 7 Modelul clasic al regresiei multiple

187

Prin ipoteza ID vrem s spunem c nu trebuie s fie


cazul ca, spre exemplu, X2i = 3 + 4X3i pentru toate valorile i
(aceasta nsemnnd c nu trebuie neaprat s fie cazul ca cea
de a doua coloan a matricei X s fie egal cu de trei plus
patru ori a treia coloan). Aceasta ar implica o corelaie
linear exact ntre valorile eantionului pentru X2 i X3. De o
manier similar, corelaii cum ar fi X3i = 5 2X4i + 3X2i,
care presupun trei sau mai multe variabile X sunt excluse.
Dac aceasta ar fi situaia, matricea invers, ( XX)-1
nu ar mai exista iar formula (7.15) aferent estimatorilor OLS
nu ar mai putea fi calculat. n realitate, ar fi imposibil de
soluionat ecuaiile normale (7.13) iar estimatorii OLS nu ar
mai exista pur i simplu. Este extrem de rar cazul n care
ipoteza ID se manifest n practic dar, dup cum vom
vedea, condiiile n care exist corelaii aproximativ lineare
ntre variabilele X nu sunt deloc neobinuite. Astfel de
corelaii pot avea consecine serioase.
Este util ca ipotezele IC i ID s se exprime n termeni
matriceali. Succint, aceasta se poate realiza prin a afirma c
avem nevoie ca matricea xx s nu fie singular i s fie
astfel nct pe msur ce n , (1/n)xx Q, unde Q este o
matrice (non-singular) de constante stabilite.
Pentru a vedea dac aceast afirmaie implic
ipotezele IC i ID, mai nti trebuie reinut c, dac trebuie s
existe corelaii lineare ntre coloanele matricei X, atunci nu
trebuie s existe astfel de corelaii ntre coloanele matricei
abaterilor de la medii, x. Astfel, ipoteza ID cere ca nu numai
matricea (XX)-1 s fie non-singular ci i matricea (xx)-1 s
fie la fel. Elementele matricei xx sunt prezentate n (7.18).
Se poate observa c elementele de pe diagonalele matricei
2
(1/n)xx sunt, prin urmare, variaiile eantionului (1/n) x ji
. n consecin, dac pe msur ce n , matricea (1/n)xx

188

Econometrie Teorie i studii de caz

Q, n care Q este o matrice fix, atunci ipoteza IC trebuie


s se susin. Valorile Qj din ipoteza IC sunt de fapt
elementele de diagonal din Q.
7.2.2. Ipoteze referitoare la variabila rezdual

Ipotezele referitoare la factorul factor rezidual din


modelul clasic al regresiei multiple sunt identice cu cele
emise n cazul regresiei cu dou variabile, i anume:
(IIA) E(i) = 0 pentru toate valorile i ;
2
(IIB) Var(i) = E(i - Ei )2 = E i = 2 = constant pentru
toate valorile i ;
(IIC) Cov (i, j) = E (i, j) = 0 pentru toate valorile i j;
(IID) Fiecare factor factor rezidual i este distribuit normal

Astfel, factorii reziduali sunt normal distribuii cu


medii zero i sunt homoschedastici i non-autocorelai.
ntruct sunt normal distribuii, avnd covariaii zero, aceasta
implic i faptul c trebuie s fie distribuii independent.
Este necesar s se sintetizeze ipotezele IIA IID n
termeni de matrice variaie covariaie:

Capitolul 7 Modelul clasic al regresiei multiple

189

E 12 )E 1 2 E ( 1 3 ...E 1 n

E 1 2 E E 2 3 ...E 2 n
2
2

E '

.
.

(7.25)

n1 E n 2 E n 3 ...E n2
E

ntruct fiecare factor rezidual are media zero,


elementele de diagonal din matricea simetric (7.25)
reprezint variaiile valorilor reziduale iar elementele din
afara diagonalei reprezint covariaiile valorilor reziduale.
Matricea (7.25) este matricea variaie covariaie.
Utiliznd ipotezele IIB i IIC, observm c modelul
clasic presupune c:
2 0

0 2

E '

0
0

0
0

0
0

2
0

...0

...0
2
In
...0
... 2

unde In este matricea n x n de identitate.

(7.26)

190

Econometrie Teorie i studii de caz

ntruct ipoteza IIA implic E() = 0, putem


reprezenta toate cele patru ipoteze referitoare la factorul
rezidual printr-o singur afirmaie, respectiv:
este NID(0, 2In)

(7.27)

Afirmaia (7.27) ar trebui interpretat n sensul c


vectorul valorilor reziduale, , este normal i independent cu
o medie egal cu vectorul nul 0 i o matrice variaiecovariaie 2In.
7.3. Proprietile estimatorilor OLS
Ca i n cazul regresiei cu doua variabile, proprietile
estimatorilor OLS depind foarte mult de care anume dintre
ipotezele clasice este valabil. De fapt, modelul urmat n
aceast seciune este foarte apropiat de cel cu dou variabile.
Presupunem c, pe ansamblu, ipoteza ID se susine deoarece,
n caz contrar, estimarea nu ar putea fi realizat. Tot ca n
cazul regresiei cu doua variabile ne vom concentra, n
principal, asupra estimatorilor parametrilor pantei j (j = 2, 3,
..., k), i mai puin asupra parametrului de intercept, 1. n
activitatea practic, parametrii pantei sunt, n mod normal, de
interes.
7.3.1. Liniaritatea

Vor fi considerate drept constante valorile stabilite n


condiiile acestor ipoteze, prin observri de eantion
nelegnd numai valorile Y.
Expresia
aferent estimatorilor OLS
(7.28)
conduce la:
^

(XX)-1XY

CY

Capitolul 7 Modelul clasic al regresiei multiple

191

unde, ntruct X este o matrice de constante


stabilite, C = (XX)-1X este, de asemenea, tot o
astfel de matrice.
Proprietatea de linearitate este indus de (7.28),
deoarece ecuaia poate fi rescris n termeni scalari, astfel:
^

j c j1Y1 c j 2Y2 c j3Y3 ... c jnYn

pentru toate valorile j

unde Yi reprezint observrile de eantion iar cji


reprezint constantele stabilite pentru rndul j al matriei k x
n C.
7.3.2. Nedeplasarea

Ipotezele IA, IB i IIA sunt suficiente pentru a


demonstra faptul c estimatorii OLS nu sunt deplasai.
Situaia este astfel identic cu cea din regresia cu dou
variabile, exceptnd faptul c acum avem mai mult dect un
singur factor non-stochastic. Introducnd (7.4) n (7.15)
avem:
^

(XX)

-1

X(X + )

= (XX)-1X
= + C

X + (XX)-1X = I + C

(7.29)

unde C este matricea constantelor stabilite. n termeni


scalari, (7.29) se exprim sub forma:

192

Econometrie Teorie i studii de caz

j j c j1 1 c j 2 2 ... c jn n

(7.29a)

pentru toate valorile j


unde cji reprezint tot rndul j al matriei C.
Eliminnd ateptrile din (7.29a), n condiiile n care
cji sunt constante, prin ipotezele IA i IB obinem:

^
E j j c j1E1 c j2 E 2 . . c jn E n

pentru toate

valorile j
Conform ipotezei IIA, E(i) = 0 pentru toate valorile
i. Astfel:

^ pentru toate valorile j


E j j

Prin urmare, estimatorii OLS,

(7.30)

j,

sunt nedeplasai.

Alternativ, putem lucra n termeni de algebr


matriceal i obinem:
^

E( ) = + CE()
j

(7.30a)

Capitolul 7 Modelul clasic al regresiei multiple

193

Ipoteza IIA poate fi scris i sub forma E() = 0. Prin


urmare, rezult:
^

E( ) =

(7.30b)

7.3.3. Compatibilitatea

Ipotezele IA, IB, IC i IIA sunt suficiente pentru a


dovedi compatibilitatea estimatorilor OLS ,

j.

Aceasta

nseamn c recurgem la toate ipotezele clasice referitoare la


variabilele factoriale i la prima dintre ipotezele referitoare la
factorul rezidual . Aceasta presupune c dac

sunt

compatibili atunci, pe msur ce mrimea eantionului, n


, acetia converg probabilistic spre valoarea real j.
Aceasta nseamn c distribuiile de selecie pentru

se

concentreaz pe j real. Astfel, p Lim ( ) = j pentru toate


j

valorile j.
7.3.4. Cel mai bun estimator liniar nedeplasat

Am vzut c, n condiiile ipotezelor IA i IB,


estimatorii OLS sunt att lineari ct i nedeplasai. Pentru ca
acetia s prezinte aceeai variaie minim a tuturor
estimatorilor lineari i nedeplasai, respectiv pentru a face
parte din categoria BLUE, este necesar ca i ipotezele clasice
IIB i IIC s fie valabile. Ca i n cazul regresiei cu dou

194

Econometrie Teorie i studii de caz

variabile, aceasta nseamn c factorii reziduali trebuie s fie


homoschedastici i non-autocorelai.
O demonstraie matriceal general cu privire la
caracteristicile BLUE n cazul regresiei multiple este n afara
scopului propus. Ne vom limita numai la gsirea expresiilor
pentru variaiile i covariaiile estimatorilor OLS. Dup cum
vom vedea, aceste expresii sunt importante dac dorim s
elaborm inferene n legtur cu parametrii regresiei
multiple.
S considerm matricea simetric k x k.


E '

^ ^

Capitolul 7 Modelul clasic al regresiei multiple

195

E E ...E
1
1 1 2 2 1 1 k k

E E 2 ...E
2
2
2
2
k
k
2 2 1 1

.
.

E
k
k
1
1

E '

Cov 1 , 2
Var 2

pentru toate valorile j, putem

Var 1
Cov 2 , 1

E ...E
2

ntruct j E j
scrie (7.31) sub forma:

(7.31)

Cov ,
k
1

Cov k , 2

... Cov 1 , k
... Cov 2 , k
.
.
...

Var k
(7.32)

Matricea (7.32) este cunoscut sub denumirea de


matrice variaie covariaie a vectorului , care, de
regul, se scrie sub forma Var ( ). De reinut faptul c, n
josul principalei sale diagonale, aceasta conine variaiile
vectorului j. Elementele din afara acestei diagonale

196

Econometrie Teorie i studii de caz

reprezint covariaiile dintre diferitele valori j care ar


rezulta n cazul extragerii mai multor eantioane. Este clar c,
dac trebuie s elaborm inferene referitor la valoarea real a
lui j se impune gsirea unei expresii pentru aceast matrice.
Din (7.29) avem:
- = C = (XX)-1X
Prin urmare, ntruct (XX)-1 este simetric,
E( - )( - ) = E[(XX)-1 X][ X(XX)-1]
= (XX)-1 X( )X(XX)-1
ntruct X
constante.

(7.33)

poate fi considerat o matrice de

Totui, E() reprezint matricea variaie-covariaie a


factorilor reziduali care, n condiiile ipotezelor IIB i IIC
este dat de (7.26) ca fiind egal cu 2In. Prin substituire n
(7.33), obinem:
Var( ) = E( - )( - ) = (XX)-1
(7.34)
X(2In)X(XX)-1
2
-1
-1
2
-1
= (XX) XX(XX) = (XX)
Ecuaia (7.34) este tocmai expresia pentru matricea
variaie-covariaie a vectorului OLS .
Vom scrie elementul din rndul i i coloana j din
matricea inversat (XX)-1 sub forma Xij. ntruct (XX)-1 este
simetric, vom avea Xji = Xij. Comparaia ntre (7.34) i (7.32)
ne indic faptul c variaia lui j , pe care o scriem sub
2
forma j

este dat de:

Capitolul 7 Modelul clasic al regresiei multiple

2j = Var ( j ) = 2Xjj , j = 1, 2, ..., k

197

(7.35)

Astfel, pentru a gsi variaia lui j , trebuie s


prelum elementul j de pe diagonala matricei (XX)-1 i s-l
nmulim cu variaia obinuit a valorilor reziduale, 2.
Rdcina ptrat pentru Var ( j ) este cunoscut sub numele
de eroare standard a lui j i este notat cu j .
Comparnd mai departe (7.34) i (7.32), rezult c:
Cov ( i , j ) = 2 Xij pentru toate valorile i j

(7.36)

Expresiile (7.35) i (7.36) sunt de o importan


considerabil pentru inferena n regresia multipl.
Este posibil s obinem expresii echivalente pentru
(7.35) i (7.36) dac lucrm n termeni de abateri ale
variabilelor de la mediile lor. Nu este necesar dect s lucrm
n termeni de matrice rsturnat (xx)-1 n loc de matricea
(XX)-1. O derivare complet s-ar dovedi repetitiv ns nu
este dificil de demonstrat c:
2j = Var ( j ) = 2xjj , j = 1, 2, ..., k

(7.35a)

i
Cov ( i , j ) = 2xij
(7.36a)
pentru toate valorile i j
unde xij este elementul din rndul (i 1) i coloana (j
1) a matricei (xx)-1. Expresiile (7.35a) i (7.36a)
sunt
alternative pentru (7.35) i (7.36), adesea utile n scopuri de

198

Econometrie Teorie i studii de caz

calcul. Trebuie reinut faptul c (7.35a) nu conduce la o


expresie pentru Var ( j ).
n cazul special al regresiei cu dou variabile, (xx)-1
2
din (7.18) nu este dect scalarul x 2 astfel nct x22= 1/
x22 . Astfel, (7.35a) ne conduce tocmai la :
Var ( 2 ) = 2/ x 2

Aceasta este identic cu expresia aferent variaiei


estimatorului OLS pentru panta parametrului din regresia cu
dou variabile.
7.3.5. Alte proprieti

Ca i n cazul regresiei cu dou variabile, dac trebuie


ca estimatorii OLS s fie, n principal, nu numai nedeplasai
ci i eficieni sau asimptotic eficieni, este necesar ca ipoteza
IID din modelul clasic s se susin aceasta nsemnnd c
valorile reziduale trebuie s fie normal distribuite. Prin
urmare, dac estimatorii OLS trebuie s aib aceste
proprieti, este necesar ca toate ipotezele clasice s fie
valabile. O dovad a proprietii de eficien este n afara
scopului pe care ni l-am propus. Reamintim doar c eficiena
presupune ca estimatorii OLS s aib variaia minim a
tuturor estimatorilor nedeplasai - nu numai a estimatorilor
lineari nedeplasai.
Normalitatea valorilor reziduale mai prezint alte
dou consecine importante pentru regresia OLS. n primul
rnd, aceasta nseamn c distribuiile de selecie ale
estimatorilor OLS vor fi distribuii normale. O demonstrare a
acestei afirmaii este analoag celei din cazul regresiei cu
dou variabile. Totui, rezult c, ntruct, n condiiile

Capitolul 7 Modelul clasic al regresiei multiple

199

tuturor ipotezelor clasice, fiecare j este nedeplasat, cu o


variaie dat de (7.35),
j este N(j, 2Xjj), j = 1, 2, 3, ..., k

(7.37)

O cunoatere exact a distribuiilor de selecie ale


estimatorilor OLS, respectiv j , este de o importan vital
pentru inferen.
Adesea este util ca (7.37) s fie exprimat n forma sa
alternativ, lucrnd n termeni de abateri ale variabilelor X de
la mediile lor. Utiliznd (7.35a) n loc de (7.35) vom obine:
j este N(j, 2xjj), j = 1, 2, 3, ..., k

(7.37a)

Cea de a doua consecin a prezumiei unor factori


reziduali normal distribuii este, ca i n cazul regresiei cu
dou variabile, aceea c estimatorii OLS devin estimatori de
probabilitate maxim. Ca i n cazul regresiei cu dou
variabile, MLE aferent lui 2 se dovedete a fi :
~ 2

2
i

(7.38)

unde ei este suma ptratelor factorilor reziduali.


Totui, ~ 2 se dovedete a fi un estimator deplasat al 2 real.
De fapt, se poate demonstra c, n cazul regresiei multiple:
2

2
E( ~ )

nk 2
2
n

(7.39)

200

Econometrie Teorie i studii de caz

Ecuaia (7.39) este o generalizare a rezultatului


regresiei cu dou variabile.
ntruct, n condiiile ipotezelor clasice, estimatorii
OLS i ML ai parametrilor j , sunt identici, n acest punct
poate prea c estimarea ML contribuie prea puin la analiza
noastr asupra ecuaiilor regresiei.
Estimarea de probabilitate maxim capt relevan
maxim atunci cnd ipotezele clasice sunt infirmate.
De exemplu, aceast metod este frecvent utilizat n
cazurile n care ecuaia regresiei este nonlinear. Mai este, de
asemenea, de mare importan atunci cnd ipotezele clasice
referitoare la variabilele factoriale i/sau cele referitoare la
reziduali sunt infirmate. Dup cum am vzut, dac ipotezele
clasice nu sunt valabile, atunci estimatorii OLS pierd unele,
sau chiar toate, dintre proprietile dorite. Se dovedete c, n
astfel de condiii, estimatorii OLS i estimatorii ML nu sunt
identici. ntr-o atare situaie, estimatorii ML prezint
avantajul c i menin n continuare proprietile, respectiv
compatibilitatea i eficiena asimptotic.
7.4. Inferena n regresia multipl
Cu condiia ca toate ipotezele clasice s fie valabile,
inferenele referitoare la parametrii pantei n regresia multipl
se pot baza pe rezultatul (7.37a), care implic faptul c,
pentru j = 1, 2, 3, ..., k,
j j
are o ditribuie N(0, 1)
j

(7.40)

Erorile standard j sunt date de (7.35a). Ne vom


concentra asupra parametrilor pantei care sunt de interes.

Capitolul 7 Modelul clasic al regresiei multiple

201

Inferena cu privire la parametrul 1 , trebuie s se bazeze pe


(7.37), cu j = 1.
Problema care se ridic n legtur cu (7.40) const n
j
aceea c erorile standard,
sunt
necunoscute,
2
deoarece i variaia valorilor reziduale, este necunoscut.
Aceasta rezult din (7.39), deoarece E(s2) = [n/(nk)]E( ~ 2 ) = 2. Suma rezidual a ptratelor se calculeaz cel
mai uor prin (7.23).
Estimrile nedeplasate ale variaiilor estimatorilor
OLS sunt, utiliznd (7.35a), urmtoarele:
s 2j s 2 x jj , j = 2, 3, ..., k

(7.41)

Atunci cnd nlocuim j n (7.40) prin estimatorii


lor nedeplasai, s j , ca n regresia cu dou variabile, trebuie
s schimbm distribuia t. Se poate demonstra c:

are o distribuie t, cu n k g.l.
s j

(7.42)

Inferena se poate baza pe (7.42). De exemplu, la un


interval de ncredere 95% pentru oricare valoare, j (j = 2,
3, ...,k) este:
j t 0 , 025 s j

(7.43)
valoarea lui t 0, 025 depinznd de n k, respectiv
numrul gradelor de libertate. Pentru a obine un interval
99% , se nlocuiete t 0, 025 cu t 0 , 005 .
Verificarea verosimilitii poate continua de-a lungul
liniilor similare celei stabilit n regresia cu dou variabile.

202

Econometrie Teorie i studii de caz

Pentru a testa ipoteza nul de genul H0 : j = 0 (j = 2,


3, ...,k), trebuie s afirmm c, n condiiile ipotezei nule,
(7.42) implic: j / s j prezint o distribuie t cu n k grade
de libertate
Prin urmare, putem utiliza j / s j ca test statistic i
respinge ipoteza nul conform creia variabila Xj nu
influeneaz variabila Y dac valoarea absolut a acestui test
statistic este suficient de mare. Ca i n cazul regresiei cu
dou variabile, testul statistic este adesea denumit
coeficientul t.

Capitolul 7 Modelul clasic al regresiei multiple

203

Capitolul 8
Regresia neliniar
8.1. Aspecte generale
Evoluia fenomenelor economice nu evolueaz dup
traiectorii liniare, putnd avea i traiectorii neliniare.
Analiza corelaiilor dintre variabilele economice se
poate face i dup funcii neliniare, care prin transformri
sunt liniarizate. Procedm astfel pentru prezentarea modelului
neliniar ntr-o form echivalent simpl i uor de interpretat
valorile parametrilor, sau pentru estimarea acestora.
Astfel, dac dependena dintre dou variabile este
x
reprezentat prin modelul neliniar de regresie, y i a i i , ,
prin logartimare, obinem modelul de regresie liniar
y i ln b ln a xi ln i .
n estimarea parametrilor unui model neliniar de
regresie procedm astfel:
- estimm parametrii aplicnd metoda celor mai
mici ptrate;
- prin transformri, liniarizm funcia neliniar,
apoi se estimeaz parametrii prin aplicarea metodei celor mai
mici ptrate;
- determinm parametrii prin metode numerice.
8.2. Modele liniarizabile prin logaritmare
Prezentm modelele semilogaritmic i cel dublu
logaritmic, ce se pot liniariza.

Capitolul 8 Regresia neliniar

205

Modelul dublu logaritmic poate fi fr termen liber


sau cu termen liber.
Modelul fr termen liber (log-log) este de
forma dependenei, respectiv:
(8.1)
y i axib i
n acest modelului a R iar b R . n funcie de
semnul parametrului b se stabilesc proprietile caracteristicii
rezultative. Dac acest parametru este pozitiv, caracteristica
rezultativ are o traiectorie cresctoare. Tendina
descresctoare a caracteristicii rezultative este evideniat,
prin modelul neliniar de regresie, de valoarea negativ a
exponentului caracteristicii rezultative.
Logaritmnd relaia (8.1) rezult modelul dublu
logaritmic
log yi = log a + blog xi + log i

(8.2)

Utiliznd substituiile
y i k log y i , xi log xi a log i , modelul liniar de

regresie devine:
y i a bxi i

Estimm cei doi parametri ai modelului iniar de


regresie i determinm parametrul a ce apare n modelul
neliniar de regresie:
a 10 a

Modelul cu termen liber (log-log) are n plus


un termen liber i se prezint sub forma
urmtoare:

(8.3)

206

Econometrie Teorie i studii de caz

yi a 0 axib i

n cazul acestui model nu mai este posibil aplicarea


procedeului anterior de liniarizare. Pentru estimarea
parametrilor, se aplic una dintre urmtoarele dou metode:
- cnd se specific o valoare a termenului liber al
modelului, atunci, utiliznd notaiile vi y i a 0 i u i xi ,
se va obine modelul de regresie (8.1). Pentru acesta se
estimeaz parametri, conform cazului modelului dublu
logaritmic;
- estimm apoi cei trei parametri ai modelulului (8.3)
prin metode numerice. Se poate recurge la transformarea
modelului ntr-unul liniar folosind dezvoltarea seriei Taylor.
Prezentm cteva proprieti ale parametrilor ce sunt
necesari pentru interpretarea parametrilor modelului i a
caracteristicilor variabilei factoriale n raport cu valorile
parametrilor. Interpretrile sunt realizate n contextul utilizrii
modelului (8.1). Pentru acest model precizm:
- dac b < 0, funcia log-log este descresctoare n
raport cu caracteristica factorial. n acest caz lim y i xi 0 .
x

y i xi a 0 ;
n situaia modelului cu termen liber, lim
x
- dac b > 0, funcia neliniar este cresctoare iar
lim y i xi ;
x
-

indiferent de semnul parametrului b, acesta este


egal cu elasticitatea variabilei rezultative calculat n raport
cu variabila factorial, adic:

Capitolul 8 Regresia neliniar

cnd

207

y i y i
:
;
xi xi

derivata

(8.4)
de

ordinul

al

doilea

este

yi
ab b 1 xib 2 , rezult: b 0,1 , funcia analitic
2
xi
este cresctoare i concav; b = 1, modelul de regresie se
reduce la modelul simplu liniar, fr termen liber; b > 1,
funcia este cresctoare i convex.
2

Modelul exponenial se utilizeaz n cazul n care


norul de puncte rezultat n urma reprezentrii grafice a seriei
de valori xi , y i i 1,n este orientat de-a lungul curbei unei
funcii exponeniale.
Modelul exponenial, cu paametrii a i b, este definit
prin relaia:

y i a b xi i , a, b R

(8.5)

Estimarea parametrilor modelului exponenial se face


prin transformri de date prin logaritmare, parcurgnd
etapele:
- prin logaritmarea termenilor egalitii se obine
modelul liniar de regresie:
ln y i ln a ln b xi ln i

Modelul

devine

liniar

(8.6)
prin

u i ln y i , i ln xi , a ln a i b b ;

substituirea

lui

208

Econometrie Teorie i studii de caz

- Estimm parametrii modelului liniar de regresie,


u i a b xi i folosind metoda celor mai mici ptrate;
obinem estimatorii a i b ;

- se determin estimatorii parametrilor modelului de


regresie neliniar:
a e a

i b e b

n final se calculeaz valorile ajustate pe baza


modelului neliniar de regresie estimat:

y i a b

xi

, i 1, n

Modelul exponenial se utilizeaz cnd valorile


variabilei rezultative cresc n progresie aritmetic iar valorile
variabilei factoriale cresc n progresie geometric.
Pentru a interpreta semnificaia parametrului b avem
n vedere c:
b

1 y

y x

(8.7)

Se observ c parametrul b definete rata de cretere a


caracteristicii rezultative n funcie de variabila factorial X.
n modelul exponenial deosebim situaiile:
- b este rata de cretere sau scdere a caracteristicii
Y n raport cu X;
- dac b > 1, evoluia caracteristicii Y este
cresctoare;
- cnd b 0,1 , caracteristica Y nregistreaz o
scdere n raport cu variabila X;

Capitolul 8 Regresia neliniar

209

- valorile caracteristicii Y sunt numai pozitive i


parametrul a satisface proprietatea de pozitivitate.
8.3. Aspecte privind modelul hiperbolic
Modelul reciproc de regresie este folosit i pentru a
studia dependena dintre rata omajului i rata inflaiei. Curba
de regresie construit n acest caz se numete curba Phillips.
Modelul reciproc de regresie, cu panta curbei
negativ, se folosete de regul pentru analiza dependenei
consumului unui produs de veniturile disponibile pentru
consum.
Valoarea b/a este abscisa punctului n care graficul
se intersecteaz cu axa Ox. Valoarea corespunde venitului
minim ce permite achiziionarea produsului solicitat pentru
consum.
Modelul reciproc are egalitatea:

yi a

b
i
xi

Interpretarea parametrilor modelului


(hiperbolic) se face astfel:
- calculm panta curbei dup relaia:

(8.8)
reciproc

y i / xi b / x i2

Funcia este descresctoare cnd parametrul b este


pozitiv i cresctoare dac b este negativ.
- indiferent de semnul parametrului b, pentru
modelul reciproc

210

Econometrie Teorie i studii de caz

lim y x a
x

Estimarea celor doi parametri se face parcurgnd


etapele:
- Parametrii a, b sunt estimai prin metoda celor mai

1
mici ptrate. Din condiia y i a b
x
i
i

= minim se

obine sistemul liniar de ecuaii:

n
1

na b x y i
i 1 i i 1

n
n
yi
1
1
a b

2

x
x
i 1 i
i 1 i
i 1 x i
n

Rezolvm sistemul
necunoscutele a i b .

liniar

de

ecuaii

- Calculm valorile ajustate y i a

avnd

b
, i seria
xi

erorilor de ajustare.
8.4. Unele aspecte privind modelul parabolic
Acest model se utilizeaz n cazul n care ritmul de
evoluie caracteristic urmeaz o funcie liniar, avnd

Capitolul 8 Regresia neliniar

211

coeficientul pantei egal cu constanta a. Punctele xi , y i i 1,n


sunt dispuse n jurul curbei descris de o parabol.
De exemplu, curba Laffer este reprezentat sub form
unei parabole i definete relaia dintre veniturile
guvernamentale i rata de impozitare. Precizm unele
caracteristici ale curbei Laffer:
- Veniturile statului = f (rata de impozitare);
- Curba Laffer se descompune n dou regiuni: regiunea
unui comportament normal, cuprins ntre 0 i acel nivel al
ratei de impozitare (t%) unde venitul statului este maxim;
regiunea cuprins ntre t% i 100% numit i zon
inadmisibil n care, la o cretere a ratei de impozitare, nu se
realizeaz o cretere corespunztoare a veniturilor statului.
- ntre venitul din impozitul pe inflaie i rata inflaiei
exist o dependen de tip parabolic. n acest caz, se constat
c exist un nivel al inflaiei pn la care se apreciaz c
statul i sporete profitul,dup care, o cretere a inflaiei
conduce la o diminuare a veniturilor statului.
Modelul parabolic de regresie ce este definit de
parametrii a, b, c R este
y i c bxi axi2 i

(8.9)

Fiind o funcie liniar n raport cu cei trei parametri,


a, b i c, pentru estimarea acestora se utilizeaz metoda celor
mai mici ptrate. Se pune condiia ca valoarea exoresiei

c bxi axi2

liniar de ecuaii:

s fie minim, rezultnd sistemul

212

i 1

i 1

Econometrie Teorie i studii de caz

nc b xi a x y i

i 1

i 1

2
i

i 1

c xi b x a x y i xi

2
i

i 1

3
i

i 1

i 1

i 1

i 1

3
4
2
c x b xi a xi y i xi

i 1

2
i

Din sistemul de ecuaii rezult seria valorilor ajustate


y i , i 1, n . Pentru a evalua calitatea modelului estimat se
determin seria reziduurilor i i 1,n , unde i y i y i .
8.5. Elemente privind funciile de tip polinominal
Un model de regresie neliniar este reprezentat adesea
prin intermediul funciilor polinomiale de un anumit ordin.
Dac funcia polinomial este de ordinul k, atunci
acesta este prezentat prin
y t 0 1 xt 2 xt2 ... k xtk t
(8.10)
unde variabilele reziduale satisfac ipotezele modelului
clasic de regresie iar xt t 1,n sunt valorile caracteristicii
pentru un numr de perioade.

Capitolul 8 Regresia neliniar

213

n acest caz, funcia (8.10) este neliniar n raport cu


variabilele factoriale dar este liniar n raport cu parametrii
modelului de regresie.
Pentru estimarea corect a parametrilor funciei
polinomiale trebuie s existe o relaie de multicoliniaritate
ntre variabilele X, X2, ...Xk. Alegerea gradului funciei
polinomiale se face innd seama de:
- multicoliniaritatea este frecvent n situaia n care
seria de date conine un numr redus de date;
- se recomand folosirea unor funcii polinomiale
ce au grad mai mic sau egal cu 4;
2
- notm cu Rk raportul de determinare calculat
pentru funcia polinomial de ordinul k. Dac dimensiunea
seriei de date este n, atunci Rn21 1 .
Din cele trei observaii, rezult c puterea de
predicie a funciei polinomiale scade n raport cu numrul
de parametri ce trebuie estimai.
Ca exemplu putem considera definirea costului unui
proces de producie (Y) n funcie de cantitatea produciei
realizate ntr-o anumit perioad (X):
yt 0 1 xt 2 xt2 3 xtk t

(8.11)

Considernd
ultimafuncie polinomial, definim
patru tipuri de costuri:
a) costul mediu al produciei pentru o perioad (ct):
ct

yt
1
0 1 2 xt 3 xt2 t
xt
xt

(8.12)

214

Econometrie Teorie i studii de caz

b) costul fix mediu al produciei, care este reprezentat


prin primul termen al relaiei (8.12) prin care definim costul
mediu:
cf t

yt
xt

c) costul variabil mediu, reprezentat prin al doilea


termen al relaiei (8.12):
cvt ct cf t 1 2 xt 3 xt2

(8.13)

d) costul marginal al produciei:


cmt

dy t
1 2 2 xt 3 3 xt2
dxt

(8.14)

Acetia sunt indicatori importani n caracterizarea


performanelor unui proces de producie.
n estimarea parametrilor modelului (8.10) vom
recurge la transformrile de date Z1 = X, Z2 = X2 . . . Zk = Xk,
rezultnd modelul liniar de regresie:
y t 0 1 z1t 2 z 2t ... k z kt t

(8.15)

n cazul modelului de regresie de tip polinomial va


trebui s determinm gradul polinomului i s stabilim dac
variabilele Z1, Z2, ...Zk sunt corelate n ansamblu sau dou

Capitolul 8 Regresia neliniar

215

cte dou i n ce msur multicoliniaritatea influeneaz


mrimea dispersiei estimatorilor.
Modelele de regresie neliniare continue pot fi
transformate prin seriile Taylor de ordinul k n modele
polinomiale de ordinul k iar, apoi, prin substituiri de
variabile, rezult modelul liniar (8.15).
Considerm c modelul neliniar de regresie este
definit prin funcia f x1t , x 2t , difereniabil de ordinul k
ntr-un punct (a, b) iar ordinea de calculare a derivatelor
pariale mixte pn la ordinul k nu este important, rezultnd:
- polinomul Taylor de ordinul k ataat funciei f(x1, x2)
n punctul (a, b) este definit prin relaia:
Pk x1 , x 2 f a, b

1 1
1
1
d f a, b d 2 f a, b ... d k f a, b ,
1!
2!
k!

(8.16)
unde

x1 a x 2 b f a, b ,
d 1 f a, b
x 2
x1

este difereniala de ordinul i pentru funcia


f x1 , x 2 n punctul (a,b);
- dac Rk x1 , x 2 reprezint restul de ordinul k al
seriei Taylor, atunci:
i 1, n

f x1 , x 2 Pk x1 , x 2 Rk x1 , x 2

(8.17)

- dac a = b = 0, din relaia (8.17) se obine formula


lui MacLaurin, care definete egalitatea:
f x1 , x 2 f 0,0 P1 x1 , x 2 P2 x1 , x 2 ... Pk x1 , x 2 R1 x1 , x 2 ,

(8.18)

216

Econometrie Teorie i studii de caz

unde Pp x1 , x 2 este un polinom de gradul p x1 i x2.


8.6. Despre modelul multiplicativ
Modelul multiplicativ, definit prin
intermediul variabilelor exogene X1, X2, . . . , Xk ,
este reprezentat prin relaia:

y t ax1t1 x 2t2 ...x kt k e t

(8.19)

unde t este o variabil rezidual ce are o


repartiie normal de medie zero i dispersie 2.

Modelul multiplicativ (8.19) se liniarizeaz prin


logaritmare. Se obine modelul echivalent:
ln y t ln 1 ln x1t 2 ln x 2t ... k ln x kt t

0 1 z1t 2 z 2t ... k z kt t

Caracteristica principal a acestui model este dat de


relaia care exist ntre coeficienii variabilelor exogene i
elasticiti. Fiecare parametru este egal cu un coeficient de
elasticitate, de forma:
ej

y t x jt

x jt y t

ln y t
j
ln x jt

Capitolul 8 Regresia neliniar

217

Un model multiplu neliniar este cel reprezentat prin


funcia de producie Cobb-Douglas, reprezentat printr-o
funcie de dou variabile care include i variabila timp.
Prima form de reprezentare sau funcia CobbDouglas fr progres tehnic. n acest caz, variabila timp nu
este inclus explicit n cadrul funciei. Funcia este definit
prin relaia:

Yt AK1 Lt e t

(8.20)

unde:
Yt
cuantific producia sau costul produciei;
Kt capitalul fix;
Lt fora de munc;
A,,- parametrii reali;
t - variabil rezidual.
A doua form de reprezentare sau funcia CobbDouglas cu progres tehnic, variabila timp fiind inclus
explicit n cadrul funciei, definit prin relaia:

Yt AK1 Lt e mt

(8.21)

Cei doi parametri, i , ofer informaii importante


asupra caracteristicilor procesului de producie, fiind
parametrii elasticitii pariale n raport cu fiecare factor al
procesului de producie.
Parametrul reprezint elasticitatea parial a
produciei n raport cu capitalul fix:

218

Econometrie Teorie i studii de caz

Yt K t
K t Yt
ln Yt

ln K t

eK

Parametrul exprim elasticitatea


produciei n raport cu capitalul uman:

parial

Yt Lt
Lt Yt
ln Yt

ln Lt
Elasticitatea scalei este egal cu suma celor dou
elasticiti:
eL

e = eL + eK = +
Pentru funcia de producie Cobb-Douglas,
elasticitatea scalei se calculeaz numai n raport cu cei doi
parametri, existnd trei situaii:
- proces de producie cu randament de scal
descresctor, cnd elasticitatea scalei este mai mic dect 1:
+<1
- proces de producie cu randament de scal
constant, elasticitatea scalei fiind unitar:
+=1
Dac cele dou intrri cresc, atunci i ieirile cresc n
aceeai proporie.

Capitolul 8 Regresia neliniar

219

- proces de producie cu randament de scal


cresctor, elasticitatea scalei fiind supraunitar:
+>1
Pentru a testa dac randamentul de scal al procesului
este constant, se definesc dou ipoteze:
H0: + = 1
H0: + 1
Pentru testarea ipotezei nule folosim testul Student,
respectiv:
t

1

1

2 2 cov ,

t n 3

Pentru un prag de semnificaie stabilit, dac


, atunci se accept ipoteza nul, potrivit
creia procesul este de randament de scal descresctor.
Se scrie funcia Cobb-Douglas sub forma echivalent
t calculat t tabelat

K
Yt
A t
Lt
Lt

et

(8.22)

220

Econometrie Teorie i studii de caz

Pentru definirea formei intensive a funcie de


producie Cobb-Douglas definim urmtoarele dou mrimi:
capitalul unitar pe unitatea de capital de munc, k t
productivitatea muncii, y t

Yt

Kt

Lt ;

Lt .

Se definete forma intensiv a funcie de producie


Cobb-Douglas prin relaia:

y t f k t Ak t e t

(8.23)

Se verific dac funcia de producie intensiv


ndeplinete urmtoarele perechi de proprieti:
1.

f " kt

f ' kt 0,

f ' k t i lim f ' k t 0


2. klim
k t
t 0
Pentru a estima parametrii modelului (8.21) se face
liniarizarea prin logaritmare i se estimeaz parametrii
funciei translog, folosind metodele:
- liniarizm funcia (8.21) prin logaritmare, obinnd un
model triplu logaritmic:
ln Yt ln A ln K t ln Lt t

(8.24)

Capitolul 8 Regresia neliniar

221

Parametrii modelului de regresie (8.24) se estimeaz


aplicnd metoda celor mai mici ptrate.
- utilizm funcia de producie Cobb-Douglas (8.21) printr-o
funcie translog:
ln Yt 0 1 ln K t 1 ln Lt

2 ln K t 2 ln Lt 1 ln K t ln Lt
2

(8.25)
Relaia (8.25) reprezint seria Taylor a funciei (8.24)
n punctul (1, 1).
Modelul neliniar reprezentat prin funcia de producie
CES este definit prin relaia de mai jos:

Yt K t 1 Lt

et

(8.26)

unde:
Yt
- variabila ce cuantific ieirile din cadrul
sistemului;
Kt
- capitalul fix;
Lt
- capitalul uman;
,,, - parametrii modelului;
t
- variabila rezidual ce are repartiia N(0, 2 )
Parametrii modelului CES au urmtoarele semnificaii
i domenii de valori:
> 0 reprezint pentru aceast funcie de
producie parametrul de eficien al procesului de producie;

222

0,1 este
procesului de producie;

Econometrie Teorie i studii de caz

parametru

de

distribuie

al

0 este parametrul de scal pentru proces;

1 este parametrul de substituie a celor doi


factori n cadrul procesului.
n cazul n care = 0, se obine funcia de producie
Cobb-Douglas.
Forma generalizat a funciei de producie CES
definit prin intermediul variabilelor factoriale
X1, X2, ..., Xn este:

(8.27)
Yt 1 X 1t 2 X 2t ... n X nt e
t

unde

i 1

Dac funcia incorporeaz progres tehnic, variabila


timp apare ntr-o manier explicit n cadrul modelului de
regresie. Funcia CES este reprezentat prin relaia:

Yt A K t 1 Lt

e mt t

Pentru funcia CES sunt valabile proprietile:


- Elasticitatea substituiei celor doi factori este
constant, aceasta fiind determinat de valoarea parametrului
de substituie, :
e

1
1

Capitolul 8 Regresia neliniar

223

- Randamentul scalei este stabilit n funcie de


valoarea parametrului , rezultnd: funcia de producie este
de randament de scal descresctor dac 0,1 ; pentru
= 1, funcia de producie are randament de scal constant;
dac > 1, dispunem de o funcie de producie de
randament de scal cresctor.
Pentru estimarea parametrilor funcie CES se aplic
algoritmii:
- Estimarea parametrilor folosind funcia de verosimilate,
presupune: logaritmarea funciei definit prin relaia (8.26),
rezultnd funcia de producie:

ln Yt ln lnK t 1 Lt t
(8.28);

scriem funcia de verosimilitate pentru funcia de producie


definit prin relaia (8.28); determinm cele patru estimaii
din condiiile de maximum al funciei de verosimilitate.
- Estimarea parametrilor folosind reprezentarea translog,
nseamn: se scrie funcia translog pentru (8.28) care este, de
fapt, un polinom de ordinul al doilea al acestei funcii n
punctul (1,1). Se obine atunci un model liniar n raport cu
parametrii modelului:
ln Yt 0 1 ln K t 1 ln Lt 11 ln K t ln Lt t
2

(8.29);
estimm parametrii modelului de regresie (8.28) aplicnd
MCMMP; determinm estimatorii modelului de regresie
(8.28) lund n considerare urmtoarele patru relaii definite
pentru parametrii CES i translog:

224

Econometrie Teorie i studii de caz

e
1 1

1
2 11
1
0

(8.30)

Capitolul 9
Autocorelarea i
heteroscedasticitatea
n utilizarea seriilor de date reale, nu de puine ori,
una sau mai multe ipoteze nu sunt respectate. Astfel, de
regul, nu sunt verificate ipotezele:
- variabilele reziduale sunt autocorelate;
- variabilele reziduale nu au dispersie constant;
- variabilele exogene nu sunt liniar independente;
- valorile variabilelor ce definesc modelul liniar de
regresie sunt afectate de erori de observare.
Acestea afecteaz calitatea estimatorilor i modelul
liniar de regresie n ansamblul su.
Metoda celor mai mici ptrate nu ofer cele mai bune
rezultate n procesul de estimare a parametrilor i de aceea se
recomand utilizarea i altor metode pentru estimarea
parametrilor.
9.1. Unele aspecte privind autocorelarea erorilor
n regresia clasic variabilele reziduale sunt
necorelate. De exemplu, pentru modelul liniar de regresie y =
X + , matricea de covarian a variabilelor reziduale este
definit prin:

226

cov 1 , 1

Econometrie Teorie i studii de caz

cov 2 , 1

cov 1 , 2

cov 2 , 2

...

cov 1 , n

...

...

...

...

cov n , `

... cov 2 , n

cov n , 2

... cov n , n

Dac reziduurile sunt autocorelate, atunci exist indici


i j astfel nct
cov i , j 0

Dac variabilele reziduale sunt de medie zero i de


dispersie constant, matricea de covarian este definit prin
intermediul coeficienilor liniari de corelaie:

1

2 1
...

n 1

1
1
...
n2

n 1
... n 2
... ...

...
1
...

unde k , k 1, n 1 reprezint coeficientul de


autocorelaie de ordinul k. Dac variabilele reziduale sunt
homoscedatice, coeficientul de autocorelaie de ordinul k se
determin prin relaia:

cov i , i k

var i var i k

k
,
0

k = 1,2, ..., n 1

n analiza autocorelrii reziduurilor trebuie s se


procedeze la: identificarea surselor de apariie a corelrii

Capitolul 9 Autocorelarea i heteroscedasticitatea

227

reziduurilor; stabilirea consecinelor pe care le genereaz


corelarea reziduurilor n estimarea parametrilor; investigarea
testelor statistice folosite n procesul de analiz a corelrii
reziduurilor; alegerea celei mai potrivite metode pentru
estimarea parametrilor.
Analiza autocorelrii valorilor reziduale este o etap
n analiza unei serii de timp. Pentru o serie atributiv, analiza
reziduului pentru depistarea autocorelrii se recomand n
situaia n care unitile sunt ordonate cresctor sau
descresctor n raport cu valorile unei caracteristici exogene.
Autocorelarea erorilor are urmtoarele surse:
- neincluderea uneia sau mai multor variabile
factoriale importante.
Dac variabila rezultativ este explicat prin dou
variabile factoriale, modelul de regresie este definit prin:
y i a bx1i cx 2i i

Dac este omis o a treia variabil factorial, notat


prin x3, variabilele reziduale sunt autocorelate. n aceste
condiii reziduul va fi explicitat prin intermediul variabilei
omise:
i x 3i u i ,

(9.1)
unde ui , i = 1, ..., n, sunt variabile reziduale ce
satisfac ipotezele modelului clasic de regresie.
- Modelul liniar de regresie nu exprim corect relaia
de dependen dintre variabila rezultativ i variabilele
factoriale, deoarece: modelul se exprim sub forma unei
combinaii liniare de variabile n condiiile n care o
specificare corect a modelului trebuie s fie exprimat

228

Econometrie Teorie i studii de caz

printr-o combinaie liniar de logaritmi de variabile exogene;


modelul este corect specificat dac se exprim sub forma unei
combinaii liniare de diferene de ordinul nti de valori
absolute sau relative; nu toate seriile de date valorice ce
corespund variabilelor incluse n model sunt exprimate n
valori nominale etc.
Pentru depistarea autocorelrii variabilelor reziduale
sunt folosite o serie de procedee statistice. Cel mai simplu
mijloc pentru detectarea autocorelrii este cel al reprezentrii
grafice a seriei valorilor reziduale. Se ntocmete graficul
i, ei i 1,n , unde
pentru seria reziduurilor estimate
n y i y i . O regularitate a graficului semnaleaz o corelare
a reziduului. Un astfel de mijloc de semnalare a autocorelrii
nu este potrivit n toate cazurile i de aceea, pentru
aprofundarea analizei sunt folosite teste statistice, dintre care
menionm:
Testul Durbin Watson este cel mai utilizat n
analiza autocorelrii variabilelor reziduale.
Prin acest test se detecteaz autocorelarea de ordinul
nti a reziduului estimat prin metoda celor mai mici ptrate.
Variabila rezidual satisface ecuaia unui proces
autoregresiv de ordinul nti dac
i i 1 u i
unde ui este un zgomot alb.

Se testeaz ipoteza nul Ho: = 0, ce corespunde


cazului n care reziduurile sunt necorelate, cu alternativa H1
= 0, pentru situaia n care reziduurile verific un proces
autoregresiv de orinul nti.

Capitolul 9 Autocorelarea i heteroscedasticitatea

229

Statistica testului este evaluat n raport cu seria


reziduurilor i, ei i 1,n , determinat n situaia n care
parametrii modelului de regresie sunt estimai prin metoda
celor mai mici ptrate. Statistica testului este definit prin:
n

DW

e
i 2

ei 1

e
i 1

(9.2)
2
i

ntre statistica testului Durbin-Watson i


estimatorul parametrului din modelul de
regresie (9.1) se verific relaia de mai jos:

(9.3)

DW 21

Pentru a demonstra relaia de mai nainte se ine


seama de expresia estimatorului parametrului :
n

e e
i 2
n

i i 1

e
i 2

(9.4)

2
i 1

Statistica testului se scrie succesiv sub urmtoarea


form:

230

DW

Econometrie Teorie i studii de caz

ei2 2 ei ei 1 ei21
i 2

i2
n

i 2

21 .

i 1

2
i

e e e
i 2

2
i

i 2

e
i 2

2
i

i i 1

Valoarea statisticii testului pentru un model de


regresie este inclus n intervalul [0, 4]. O valoare n
apropierea lui 2 scoate n eviden necorelarea valorilor
reziduale.
Valoarea acestei statistici este dificil de interpretat
ntruct aceasta depinde nu numai de seria valorilor reziduale,
ci i de numrul de variabile factoriale incluse n modelul de
regresie (p) , precum i de lungimea seriei de date (n). De
altfel, valoarea medie a statisticii depinde de cele dou
elemente:
E DW 2

2p
n p 1

ei ei 1
2 1 i 2
n

ei2

i 2

(9.5)

Valorile critice ale statisticii depind de numrul de


variabile factoriale din cadrul modelului (p) , de numrul de
observaii (n) i de pragul de semnificaie ales, (). Tabelele
de valori critice cuprind pentru elementele specificate cte o
pereche de valori dL i dU. n testarea ipotezei nule ntlnim
situaiile: valoarea statisticii este mai mic dect dL se
respinge ipoteza nul. Reziduurile prezint o autocorelare
pozitiv de ordinul nti; valoarea statisticii este mai mare

Capitolul 9 Autocorelarea i heteroscedasticitatea

231

dect 4 - dL se respinge ipoteza nul. Reziduurile prezint


o autocorelare negativ de ordinul nti; dU < DW < 4 - dU
se accept ipoteza nul a necorelrii printr-un proces
autoregresiv de ordinul nti al valorilor reziduale; dL > DW
> dU sau 4 - dU < DW < 4 - dL, testul Durbin-Watson nu este
concludent.
Prezentarea procesului de testare a autocorelrii
valorilor reziduale printr-un proces regresiv de ordinul nti
este cuprins n tabelul de mai jos:
Valoarea statisticii
1. 0 < DW < dL
2. dL < DW < dU
3. dU < DW < 4 dU
4. 4 dU < DW < 4 dL
5. 4 dL < DW < 4

Decizia testului
Se respinge H0 > 0
Indecizie
Se accept H0
Indecizie
Se respinge H0 < 0

Testul Durbin-Watson nu poate fi aplicat dect n


anumite condiii, cum sunt: modelul de regresie trebuie s
cuprind termen liber; matricea X trebuie s fie
nestocastic. Modelul de regresie nu trebuie s includ
printre variabilele factoriale variabila rezultativ cu decalaj.
n cazul n care modelul de regresie cuprinde printre
variabilele factoriale variabila rezultativ cu decalaj, pentru
testarea autocorelrii se utilizeaz testul Breusch-Godfrey sau
unele forme derivate ale testului Durbin-Watson; testul
Durbin-Watson nu are nici o relevan n cadrul modelelor
de regresie pentru serii de date atributive; acest test nu este
folosit dect pentru depistarea autocorelrii de ordinul nti-

232

Econometrie Teorie i studii de caz

Pentru testarea ipotezei nule considerm condiia ca


matricea X s nu fie stochastic. Tabelele cu valori critice
pentru aceast statistic sunt constituite n cele dou ipostaze:
modelul de regresie are sau nu un termen liber.
- Testul Breusch-Godfrey este utilizat pentru a
verifica dac rezidualul este reprezentat printr-un model
autoregresiv de ordinul r. Acest test se aplic n cazul n care
matricea X este stocastic, deci dac variabila se expliciteaz
n raport cu variabile cu decalaj.
Prin acest test se verific dac reziduul se reprezint
sub forma:
r

i j i j u j
j 1

unde u j este un zgomot alb.


Se testeaz ipoteza nul
H0: 1=...= r reziduul nu este corelat.
cu ipoteza alternativ:
H1: i admite o reprezentare autoregresiv de ordinul
r.
Sub ipoteza H1, modelul liniar de regresie se prezint
prin:
r

j 1

j 1

y i j ei j j x ji vi

a) Aplicarea acestui test se face astfel: se estimeaz


seria valorilor reziduale ei yi y i , unde parametrii
modelului liniar de regresie se estimeaz prin metoda celor

Capitolul 9 Autocorelarea i heteroscedasticitatea

233

mai mici ptrate; se estimeaz prin metoda celor mai mici


ptrate parametrii mdelului liniar de regresie:
r

j 1

j 1

ei j ei j j x ji vi ;

se testeaz ipoteza H0 formulat mai nainte, prin utilizarea


testului F sau LM (multiplicatorul Lagrange). n ultimul caz,
statistica testului este: LM nR 2 r2 , unde R 2 este
raportul de determinare calculat pentru modelul de regresie n
care reziduul admite o reprezentare autoregresiv de ordinul
r. Pentru un prag de semnificaie stabilit, dac valoarea
statisticii LM este superioar valorii critice a repartiiei 2, se
respinge ipoteza nul.
Dac reziduul prezint o autocorelare de un anumit
ordin, estimatorii parametrilor sunt nc nedeplasai i
consisteni, dar nu mai sunt eficieni. Pentru corectarea
influenei generate de autocorelarea erorilor sunt folosite o
serie de proceduri, cum sunt: metoda Cochrane-Orcutt de
estimare a parametrilor; metoda Durbin; metoda Hildreth
Lu; metoda generalizat a celor mai mici ptrate; metoda
verosimilitii maxime.
9.2. Aspecte eseniale privind heteroscedasticitatea
Cnd modelul liniar de regresie nu verific ipoteza de
homoscedasticitate, acesta are urmtoarea reprezentare:
y = X + ,

(9.6)

234

Econometrie Teorie i studii de caz

E 0
unde

w1
0
var 2
...

0
w2
...
0

... 0
... 0
... ...

... wn

Pentru acest model se ridic dou aspecte:


- cum se estimeaz cei n + p parametri ai modelului
liniar de regresie prin intermediul seriei de date cu n
componente ?
- care sunt consecinele pe care le genereaz
nerespectarea acestei ipoteze n procesul de estimare i
utilizare a modelului liniar de regresie ?
Pentru estimarea celor p parametri i n variane se
formulez o serie de ipoteze asupra variabilei reziduale.
Pentru estimarea matricei covarianelor reziduului, se
utilizeaz seria reziduurilor ce este estimat prin metoda celor
mai mici ptrate. Astfel, matricea covarianelor este estimat
prin:

e12 0

0 e22


... ...

0 0

... 0

... 0
... ...

... en2

De
multe
ori,
nerespectarea
ipotezei
homoscedasticitii se ntlnete n cazul folosirii datelor

Capitolul 9 Autocorelarea i heteroscedasticitatea

235

agregate. Se noteaz prin g numrul de grupe i prin ni, i =


1, ..., g, dimensiunea grupelor.
n urma determinrii mediilor pe grupe, se obine
seria de date ce este folosit pentru estimarea parametrilor
modelului liniar de regresie. Aceast serie are reprezentarea:

x
ji

j 1, p

, yi

(9.7)

i 1, g

Pe baza acestei serii de date se estimeaz parametrii


modelului de regresie:
(9.8)

y i xi

unde:

E 0,

1
n
1

2 0
iar var E ' ,
...

...

1
... 0

n2
... ... ...
1
0 ...

n g

Pentru a corecta heteroscedasticitatea se aplic una


strategiile:
- se estimeaz parametrii modelului prin metoda
celor mai mici ptrate generalizat;
- se transform modelul sub forma echivalent:
MY M X M

(9.9)

236

Econometrie Teorie i studii de caz

unde:

n1
0
M
...

...
...
...

0
0
...

...

n g

0
n2
...

Dac parametrii sunt obinui prin metoda celor mai


mici ptrate, obinem: media reziduului este zero; modelul
verific ipoteza de homoscedasticitate:
var(MM) = Mvar(M) = MM = 2 Ig
Rezultatele permit aplicarea metodei celor mai mici
ptrate modelului (9.9) pentru care estimatorii sunt:

X ' M ' M X

X ' M ' MY

Acetia corespund estimatorilor metodei celor mai


mici ptrate generalizate.
Dac heteroscedasticitatea este indus n cadrul
modelului prin intermediul unei variabile exigene ntr-o
manier multiplicativ, dispersia reziduului se definete prin:
i2 var i 2 x ji

(9.10)

unde este un scalar real iar Xj este o variabil


exogen ce determin modificarea varianie reziduului de la o
observaie la alta. n raport cu valoarea parametrului , sunt

Capitolul 9 Autocorelarea i heteroscedasticitatea

237

aplicate strategiile pentru eliminarea herescedasticitii i


estimarea parametrilor. Prezentm cteva cazuri particulare:
- n cazul n care = 0, se obine modelul care
verific ipoteza homoscedasticitii;
- Valoarea reziduului este proporional cu
valoarea unei variabile exogene, rezultnd:
i2 2 x 2ji , i 1, n

(9.11)

Obinem un model de regresie care verific ipoteza de


homoscedasticitate, mprind toi termenii modelului liniar
de regresie prin xji.
x pi
yi
x

1i 1 ...
p i
x ji x ji
x ji
x ji

(9.12)

Care se poate scrie sub forma echivalent:

y
y i* xi* i* , unde

*
i

yi
xij

x1i
x pi
,...,

x ji
x ji

i* i
x ji

*
i

(9.13)

Reziduul modelului
modelului clasic de regresie:

(9.12)

verific

ipotezele

238

E i*

Econometrie Teorie i studii de caz

1
E i 0;
x ji

var i*

1
var i 2 ;
x 2ji

cov i* , t*

1
cov i , t 0
x ji x jt

Pentru estimarea parametrilor se recurge la metoda


celor mai mici ptrate aplicat modelului transformat sau la
metoda celor mai mici ptrate generalizat aplicat modelului
iniial, n condiiile n care:

x 2j1

0
2

...

0
x 2j 2
...
0

0
... ...

... x 2jn
...
...

(9.14)

- Dispersia variabilei reziduale se reprezint prin


x ji , iar n aceast situaie, pentru obinerea unui
model care s verifice ipoteza homoscedasticitii, se mpart
toi termenii ce definesc modelul (9.6) prin x ji .
Se obine un model de regresie ce verific ipotezele
modelului clasic:
2
i

yi
x ji

x1i
x ji

1 ...

x pi
x ji

i
x ji

(9.15)

Capitolul 9 Autocorelarea i heteroscedasticitatea

239

- Dac dispersia este definit cu 0, modelul iniial


se transform ntr-un model MY = MX + M, care verific
ipoteza de homoscedasticitate.
Matricea M este definit prin:

x j11 / 2

0
M
...

0
x

1 / 2
j2

...
0

...
0

...
0
...
...

... x jn1 / 2

Utilizarea metodei celor mai mici ptrate pentru


estimarea parametrilor n situaia n care ipoteza de
homoscedasticitate nu se verific are consecine imediate
asupra calitii estimrii parametrilor modelului prin intervale
de ncredere, precum i asupra validrii unor ipoteze
formulate asupra acestui model de regresie. n aceste condiii,
dispersia reziduului este subestimat sau supra estimat.
Astfel, n aceast situaie, sunt validate ipoteze false sau, din
contr, sunt respinse ipoteze ce sunt corect formulate.
Pornind de la aceste afirmaii, se pune o prim problem,
aceea de a stabili n ce msur varianele variabilelor
reziduale stabilite n condiiile utilizrii metodei celor mai
mici ptrate se abat de la varianele estimate n condiiile unui
model homoscedastic. n al doilea rnd, trebuie identificate
testele statistice ce pot fi utilizate pentru verificarea
valabilitii ipotezei de homoscedasticitate.
2
Testul White are la baz explicitarea seriei ei i 1, n
n raport cu una sau mai multe variabile factoriale.

240

Econometrie Teorie i studii de caz

Astfel, se reprezint seria ptratelor reziduurilor n


raport cu valorile variabilelor exogene, cu ptratele lor sau cu
diverse combinaii de ordinul nti ale acestora. Modelul de
regresie este definit prin relaiile:
- n raport cu unele variabile factoriale i ptratele
acestora:
k

j 1

j 1

ei2 a j x ji b j x 2ji vi

(9.16)

- n raport cu unele variabile factoriale, ptratele


acestora i diverse combinaii de ordinul nti ale acestora.
Astfel, dac pentru explicarea varianei variabilei reziduale se
utilizeaz dou variabile factoriale, atunci se definete
modelul de regresie:
ei2 a1 x1i a 2 x 2i b1 x12i b2 x 22i c1 x1i x 2i vi

(9.17)
n ambele situaii, pentru a stabili dac ipoteza
homoscedastisticitii este valabil, se recurge la un test
Student sau la statistica LM.
n primul caz (9.17) definim ipotezele testului:
H0: a1 = ... = ak = b1 = ... = bk = 0 model
homoscedatic
H 1 : a 0 sau bi 0 model heteroscedatic

Capitolul 9 Autocorelarea i heteroscedasticitatea

241

Dac se respinge ipoteza nul, atunci trebuie corectat


heteroscedastisticitatea naintea testrii ipotezelor formulate
asupra modelului liniar de regresie.
La aplicarea statisticii LM avem n vedere proprietatea
asimptotic a acesteia:
LM nR 2 r2
unde:
n - dimensiunea seriei folosite pentru estimarea
parametrilor i reziduului
R2 - raportul de determinare evaluat pentru unul dintre
aceste modele
r - numrul de parametri din cadrul acestor modele

n utilizarea acestei proceduri de testare trebuie s se


in seama de faptul c o cretere exagerat a valorii lui r
duce implicit la diminuarea puterii testului.
Testul Goldfeld-Quandt se aplic n situaia n care o
singur variabil factorial esta cauza heteroscedastisticitii.
Pentru aplicarea acestei proceduri de testare se
parcurg etapele: se ordoneaz cresctor seria de date n raport
cu valorile caracteristicii exogene ce genereaz
heteroscedastisticitatea; sunt excluse din cadrul seriei un
numr de c valori centrale. Se obin dou subserii de valori:
n c
valori, iar a doua
2

prima, la nceputul seriei, cuprinde

n c

este constituit din ultimele


valori. Seria de date ce
2
corespunde variabilei exogene are urmtoarea reprezentare:

242

Econometrie Teorie i studii de caz

x , x ,..., x , x ,..., x
,x
,..., x
1 2 n1 n1 n1 c n1 c 1 n
prima subserie

valori excluse

a doua subserie

Valoarea lui c influeneaz n mod direct puterea


n
n
sau c .

3
4

testului. De regul, se recomand c

Folosind seriile de date pentru cele dou subgrupe


extreme, se estimeaz parametrii modelelor de regresie:
pentru prima subserie se definete modelul de regresie
y i a1 b1 xi i ,

i 1, n1 ,

cu

n1

SPR1 y i y i ; pentru a doua subgrup se definete un


i 1

model de regresie echivalent:


n c
1 ,cu
2

y i a 2 b2 xi i , i 1,

SPR2

nc
i
1
2

y i

se definete statistica testului

SPR2 / n2 p
F n1 p, n2 p
SPR1 / n1 p

S-a notat prin ni numrul de termeni din cadrul


fiecrei subserii.

Capitolul 9 Autocorelarea i heteroscedasticitatea

243

Testul Glesjer, presupune a se identifica una sau mai


multe funcii pentru explicitarea varianei reziduului.
Astfel, dispersia reziduului se expliciteaz prin

i2 f Z i vi

(9.18)

unde f este o funcie analitic, Z este un vector de


variabile exogene sau combinaii de variabile exogene ce
cauzeaz violarea ipotezei homoscedasticitii.
Testul
Glesjer
stabilete
dac
ipoteza
homoscedasticitii este valid pentru testarea semnificaiei
modelului de regresie (9.18). Aplicarea acestui test const n
parcurgerea etapelor urmtoare:
- se estimeaz, prin metoda celor mai mici ptrate, parametrii
i seria reziduului modelului liniar de regresie, y i xi i ;
- se expliciteaz seria reziduurilor printr-un model de regresie
definit n raport cu variabilele exogene ce genereaz
heteroscedasticitatea. n acest sens sunt utilizate diverse
strategii: se expliciteaz seria ptratelor reziduului printr-un
model de regresie constituit dup regulile definite n cadrul
testului White; se expliciteaz seriile ei i 1,n sau
ln ei i 1,n prin diverse metode de regresie liniar sau
neliniar. n raport cu caracteristicile modelului de regresie
folosit n acest sens, se precizeaz tipul heteroscedasticitii.
n tabelul urmtor sunt prezentate cteva cazuri
particulare de funcii de regresie. n toate
situaiile,
heteroscedasticitatea este explicitat printr-o singur variabil
exogen.
Modelul de regresie

Tipul
heteroscedasticitii

244

1.

ei a 0 a1 x ji u i

1/ 2
2. ei a 0 a1 x ji u i

3. ei a 0

a1
ui
x ji

Econometrie Teorie i studii de caz

i2 b0 b1 x 2ji vi
i2 b0 b1 x ji vi

i2 b0

b1
vi
x 2ji

Pentru testarea ipotezei nule se recurge la testul


Student sau Wald. n cazul testului Student, se accept
ipoteza nul n situaia n care parametrul ce corespunde
variabilei exogene nu difer semnificativ de zero. n situaia
alternativ, se alege acel model ce ofer cea mai corect
explicitare a variabilei reziduale.

Bibliografie
Anghelache, C.
Anghelache, C.
Anghelache, C. i
colaboratorii
Anghelache, C. i
colaboratorii
Anghelache, C. i
colaboratorii
(2007)
Anghelache, C.,
Capanu, I.
Andrei, T.
Bardsen, G. i
colaboratorii
(2005)
Biji, M., Biji,
M.E., Lilea, E.,
Anghelache, C.,
Capanu, I.,
Anghelache, C.
Capanu, I.,
Wagner, P., Mitru,
C.
Dobrescu, E.

Statistic teoretic i economic teorie


i aplicaii, Editura Economic, Bucureti,
2004
Sistemul European al Conturilor note de
curs, Editura ARTIFEX, Bucureti, 2004
Analiz
macroeconomic,
Editura
Economic, Bucureti, 2006
Econometrie studii de caz, Editura
ARTIFEX, Bucureti, 2006
Elemente de econometrie note de curs,
Editura ARTIFEX, Bucureti
Indicatori macroeconomici calcul i
analiz economic, Editura Economic,
Bucureti, 2003
Statistic
i
econometrie,
Editura
Economic, Bucureti, 2003
The Econometrics of Macroeconomic
Modelling, Oxford University Press
Tratat de statistic, Editura Economic,
Bucureti, 2002
Indicatori
economici
pentru
managementul micro i macroeconomic
calcul, prezentare, analiz, Editura
Economic, Bucureti, 2003
Sistemul
Conturilor
Naionale
i
Agregatemacroeconomice, Editura ALL,
Bucureti, 2004
Macromodels of the Romanian Transition

246

Dougherty, C.
(2007)
Gilbert, M.,
Kravis, I.
Isaic-Maniu, Al.,
Mitru, C.,
Voineagu, V.
Isaic-Maniu, Al.,
Antonescu, C.,
Korka, M.
Mitru, C.,
Voineagu, V.
Florea, I.,
Parpucea, I.
GeorgescuRoegen. N,
GeorgescuRoegen. N,
Sargent, T.
Thomas, R.L.
Tovissi, L.,
Scarlat, E.,
Tanadi, Al.
***

Econometrie Teorie i studii de caz

Economy, Editura Expert, Bucureti, 1996


Introduction to Econometrics, Oxford
University Press
An International Comparison of National
Product and Purchasing Power of
Currencies, OEEC, Paris, 1954
Macroeconomie
i
analiz
macroeconomic, Editura Constantin
Brncoveanu, Rm. Vlcea, 1995
Statistic General i economic, Editura
Constantin Brncoveanu, Rm. Vlcea,
1994
Statistic
inferenial,
Editura
Continental, Alba Iulia, 2000
Metoda Statistic, Ediia a II-a, Editura
Expert, bucureti, 1998
Legea entropiei i produsul economic,
Editura Politic, bucureti, 1979
Macroeconomic Theory, 2nd Edition,
Boston, Academic Press, 1999
Modern econometrics an introduction,
Editura Financial Times Prentice Hall,
1997
Metode i modele ale analizei economice
structurale,
Editura
tiinific
i
Enciclopedic, Bucureti, 1979
Scandinavian Journal of Statistics. Theory
and Applications, Volume 34, Nr. 1,

Capitolul 9 Autocorelarea i heteroscedasticitatea

***
***
***
***
***

247

March 2007, ISSN 0303-6898


Statistical Methodology, Volume 4, Issue
2, April 2007, ISSN 1572-3127
Journal of multivariate analysis, Volume
98, Number 3, March 2007, ISSN 0047259X
Stoochastic
processes
and
their
applications, VLume 117, Issue 4, Aprilie
2007, ISSN 0304-4149
Law, Probalbility and Risk, Volume 5,
Number 1, March 2006, ISSN 0957-4824
ISI Newsletter, Volume 31, Number 2(92)
2007

S-ar putea să vă placă și