Sunteți pe pagina 1din 238

Constantin ANGHELACHE Constantin MITRU

(coordonatori)
Constantin Silviu ANGHELACHE Cristina Andreea MITRU
Ctlin DEATCU Mdlina DUMBRAV
Alexandru MANOLE

Econometrie. Teorie
i studii de caz
Redactor: Prof. univ. dr. Constantin ANGHELACHE
Coperta: Marian TONCIU
Revizie text: Prof. univ. dr. Constantin ANGHELACHE
Tehnoredactare: Lector univ. drd. Alexandru MANOLE
Descrierea CIP a Bibliotecii Naionale a Romniei
ELEMENTE DE ECONOMETRIE: NOTE DE CURS: PENTRU UZ
INTERN
Constantin Anghelache, Constantin Mitru, Cristina
Andreea Mitru, Bucureti: Editura Artifex 2006
Bibliogr.
ISBN (10) 973-7631-16-1
ISBN (13) 978-973-7631-16-9
I. Anghelache, Constantin
II. Mitru, Constantin
III. Mitru, Cristina Andreea
330.43(075.8)
Constantin ANGHELACHE Constantin MITRU
Constantin Silviu ANGHELACHE Cristina Andreea MITRU
Alexandru MANOLE

Elemente de
econometrie
- note de curs -
pentru uz intern
EDITURA ARTIFEX
BUCURETI 2006
ISBN (10) 973-7631-16-1;
ISBN (13) 978-973-7631-16-9
Copyright Editura ARTIFEX, 2006
Autorii poart ntreaga rspundere, fa de editur i
tere persoane, pentru coninutul lucrrii
EDITURA ARTIFEX
Calea Plevnei nr. 47-48
Sector 1
Bucureti
Cuprins
Copyright Editura ARTIFEX, 2006.................................5
Autorii poart ntreaga rspundere, fa de editur i
tere persoane, pentru coninutul lucrrii..........................5
EDITURA ARTIFEX...........................................................5
Calea Plevnei nr. 47-48.........................................................5
Sector 1...................................................................................5
Bucureti................................................................................5
Cuprins ..................................................................................6
Cuvnt nainte.....................................................................10
Capitolul 1............................................................................11
Noiuni introductive............................................................11
1.1. Aspecte generale .....................................................11
1.2. Concepte utilizate n econometrie............................15
Capitolul 2..........................................................................19
Inferena statistic..............................................................19
2.1. Concepte de baz privind inferena statistic...........19
2.2. Distribuia mediilor de eantion ..............................21
2.3. Estimarea mediei unei populaii................................23
2.3.1. Estimri punctuale..............................................24
2.3.2. Intervale de ncredere.........................................27
2.4. Verificarea ipotezelor referitoare la media populaiei
...........................................................................................31
2.4.1. Teste bilaterale...................................................37
2.4.2. Tipuri de eroare..................................................39
2.5. Alte cteva teste statistice importante i distribuiile
lor......................................................................................44
2.5.1. Gradul de libertate .............................................45
2.5.2. Distribuia 2.....................................................46
2.5.3. Distribuia t........................................................50
Capitolul 3............................................................................53
Regresia liniar simpl.......................................................53
3.1. Domenii de aplicare..................................................53
3.2. Modele liniare de regresie rezultate din transformri
de modele neliniare...........................................................59
3.3. Prezentarea modelului liniar de regresie...................60
3.4. Estimarea (determinarea) parametrilor modelului
liniar..................................................................................65
3.4.1. Utilizarea metodei celor mai mici ptrate n
estimarea parametrilor...................................................65
3.4.2. Utilizarea metodei verosimilitii maxime n
estimarea parametrilor...................................................70
3.5. Proprietile dreptei de regresie................................73
3.6. Coeficientul liniar de corelaie..................................83
3.7. Analiza i interpretarea variabilei reziduale..............90
Capitolul 4............................................................................94
Estimatori si metode de estimare......................................94
4.1. Estimatori pentru eantioane mici.............................95
4.1.1. Estimator nedeplasat..........................................95
4.1.2. Eficiena..............................................................97
4.1.3. Estimatorul BLUE liniar nedeplasat i eficient
.....................................................................................100
4.1.4. Eroarea medie ptratic....................................101
4.2. Metode de estimare.................................................103
4.2.1. Metoda momentelor.........................................103
4.2.2. Metoda celor mai mici ptrate..........................105
4.2.3. Estimarea probabilitii maxime......................106
4.2.4. Cazul general....................................................109
4.2.5. Exemplu cu o variabil discontinu ................110
4.2.6. Exemplu cu o variabil continu......................113
4.2.7. Exemplu cu doi parametri................................115
Capitolul 5..........................................................................118
Unele precizri privind modelul clasic al regresiei cu
dou variabile....................................................................118
5.1. Ipotezele modelului clasic al regresiei de dou
variabile...........................................................................118
5.1.1. Ipoteze cu privire la variabila explicativ.........119
5.1.2. Ipoteze cu privire la factor rezidual .................121
5.2. Proprietile estimatorilor OLS................................124
5.2.1. Liniaritatea........................................................125
5.2.2. Nedeplasarea.....................................................126
5.2.3. Compatibilitatea................................................127
5.2.4. Cea mai bun nedeplasare liniar......................129
5.2.5. Eficiena (eficiena asimptotic)......................130
5.2.6. Normalitatea......................................................131
5.2.7. Estimarea probabilitii maxime.......................132
5.3. Unele aspecte privind regresia neliniar.................133
Capitolul 6..........................................................................136
Inferena statistic n .......................................................136
regresia simpl..................................................................136
6.1. Aspecte privind testarea semnificaiei modelului de
regresie............................................................................136
6.2. Compararea modelelor de regresie..........................143
6.3. Verificarea normalitii reziduului..........................145
6.4. Predicia prin modelul de regresie...........................148
6.5. Metoda lui W.F. Sharpe (alegerea portofoliului)....152
6.6. Metoda regresiei globale.........................................155
Capitolul 7..........................................................................161
Modelul clasic al regresiei multiple...............................161
7.1. Metoda celor mai mici ptrate (OLS) n regresia
multipl...........................................................................162
7.1.1. Determinaia n regresia multipl.....................173
7.1.2. Utilizarea criteriului Akaike ............................176
7.2. Ipotezele clasice n regresia multipl......................178
7.2.1. Ipoteze cu privire la variabilele factoriale........178
7.2.2. Ipoteze referitoare la variabila rezdual...........181
7.3. Proprietile estimatorilor OLS...............................182
7.3.1. Liniaritatea.......................................................183
7.3.2. Nedeplasarea....................................................184
7.3.3. Compatibilitatea...............................................185
7.3.4. Cel mai bun estimator liniar nedeplasat...........185
7.3.5. Alte proprieti.................................................189
7.4. Inferena n regresia multipl...................................192
Capitolul 8..........................................................................195
Regresia neliniar.............................................................195
8.1. Aspecte generale.....................................................195
8.2. Modele liniarizabile prin logaritmare......................195
8.3. Aspecte privind modelul hiperbolic........................200
8.4. Unele aspecte privind modelul parabolic................201
8.5. Elemente privind funciile de tip polinominal........203
8.6. Despre modelul multiplicativ..................................207
Capitolul 9..........................................................................216
Autocorelarea i heteroscedasticitatea ...........................216
9.1. Unele aspecte privind autocorelarea erorilor..........216
9.2. Aspecte eseniale privind heteroscedasticitatea......224
Bibliografie........................................................................236
Cuvnt nainte
Lucrarea Elemente de econometrie se adreseaz
studenilor din anul II, toate specializrile, de la
Universitatea ARTIFEX Bucureti, fiind scris n
conformitate cu programa analitic a cursului de
Econometrie. La realizaera acestui curs s-au utilizat, cu
adaptarea necesar, o serie de materiale scrise de autori
romni i/sau strini n acest domeniu.
n principal, s-au preluat o serie de aspecte din
lucrarea Modern Econometrics an introduction, a
autorului englez Thomas R.L., aprut n Editura Financial
Times Prentice Hall, ISBN 0-201-87694-9, n anul 1997
Lucrrile i alte materiale care au stat la baza
acestor note de curs sunt menionate n bibliografia selectiv
prezentat la sfritul crii. Materialul publicat este de uz
intern, destinat, n exclusivitate studiului studenilor de la
Universitatea ARTIFEX Bucureti
Pentru nsuirea temeinic a cunotinelor de
specialitate se recomand studenilor s parcurg i
culegerea de probleme Econometrie - studii de caz,
aprut n Editura Artifex, precum i principalele lucrri
cuprinse n bibliografie.
Autorii

Capitolul 1
No iuni introductive
1.1. Aspecte generale
Econometria a fost definit ca fiind aplicarea
statisticii matematice la datele economice n scopul
constituirii unui suport practic pentru modelele construite
prin matematici economice i al obinerii unor estimri
numerice (Samuelson et al., 1954, pg. 141-6). Prin prisma
unei abordri mai succinte (Johnston, 1984, p 5), rezult c
principala sarcin a econometriei const n a introduce
substan practic n structurile teoretice.
Teoria economic previzioneaz diferite corelaii ntre
variabile. De exemplu, o curb a cererii, o funcie de
producie, o funcie de consum.
De regul, un specialist n econometrie
este preocupat de urmtoarele aspecte:
(a) msurarea unor corelaii i estimarea
parametrilor pe care acestea le implic;
(b) verificarea ideilor teoretice reprezentate
de astfel de corelaii;
(c) utilizarea acestor corelaii pentru
previziuni sau prognoze cantitative.
Elemente de econometrie
Econometria presupune utilizarea concomitent a
elementelor de matematic economic, statistic economic
i inferen statistic. Matematicile economice exprim
teoriile i ideile tiinelor economice n model matematic.
Aceste forme matematice sunt calitative i nu cantitative
respectiv, nu preiau ecuaiile din matematicile economice
pentru ca, prin confruntarea acestora cu datele economice, s
ncerce s utilizeze tehnicile inferenei statistice pentru a
conferi acestor ecuaii o form cantitativ.
Teoria monetar presupune c, n cadrul unei
economii, cererea agregat pentru bani poate depinde de o
variabil de scal, cum ar fi venitul naional sau avuia
naional precum i de variabila reprezentat de rata dobnzii,
reprezentnd costul oportunitii deinerii de bani. Aceasta se
exprim sub forma:
M = f(Y,r) (1.1.)
unde M, cerea pentru bani i Y, variabila de scal, sunt
definite n termeni reali iar r reprezint rata dobnzii.
Corelaia ntre valorile M i Y este independent de
nivelul general de pre. O cretere la nivelul variabilei de
scal ar trebui s conduc la o cretere a cererii de bani n
timp ce o cretere a ratei dobnzii ar trebui s conduc la o
scdere a valorii M.
n al doilea rnd, teoria nu ne spune nimic despre
forma precis a funciei definit prin ecuaiei (1.1.). Este
puin probabil ca forma funciei definit prin ecuaiei (1.1.)
s fie de o form linear simpl, respectiv:
M = +Y + r, > 0, < 0 (1.2)
12
Capitolul 1 No iuni introductive
n schimb, ar putea s fie de o form convenabil a
elasticitii:
M = AY

r

,

> 0, < 0 (1.3)
Exist multe alte forme de funcii nonlineare care sunt
n egal msur compatibile cu situaiile economice.
Teoria ne pune la dispoziie informaii calitative cu
privire la modul n care Y i r influeneaz cererea de bani.
De exemplu, s presupunem c se nregistreaz o cretere de
5% a variabilei de scal Y. Teoria sugereaz c aceasta va
conduce la o cretere a cererii de bani fr a ne spune ns
care va fi aceast cretere. Deci, nu ne ofer nici o informaie
cantitativ. Informaiile cantitative cu privire la elasticitile
i , din (1.3) sunt importante pentru stabilirea politicii de
urmat.
n teorie ne referim, n general, la ceea ce economitii
denumesc perspectiva pe termen lung. Aceasta nseamn c
nregistrm o poziie de echilibru. De exemplu, n condiii de
echilibru, cererea i oferta de bani pot fi considerate ca fiind
egale. ntr-un astfel de context, utilizarea seriilor de date
referitoare la oferta de bani pentru a reprezenta cererea de
bani ar putea fi considerat a fi justificat. Totui, piaa
monetar este foarte rar n echilibru. Dar, n condiii de
dezechilibru, mai este justificat utilizarea datelor observate
referitoare la oferta de bani pentru a reprezenta cererea de
bani n ecuaii cum sunt cele definite prin (1.1), (1.2) i (1.3) .
Datele economice se refer mai degrab la procesul de
ajustare dect la poziiile succesive de echilibru.
ntr-o oarecare msur, econometria ncearc s ofere
rspunsuri la ntrebrile de mai sus, lsate de teoria
economic fr rspuns. n particular, econometria ncearc
s stabileasc estimrile numerice ale parametrilor din astfel
13
Elemente de econometrie
de ecuaii, cum ar fi (1.2.) i (1.3.), viznd s testeze unele
dintre ipotezele formulate de teorie. De exemplu, am vzut
mai sus c teoria monetarist implic faptul c funciile
cererii de bani, ca cea redat prin ecuaia (1.1.), sunt
independente fa de nivelul preului general. Pentru a
verifica aceast ipotez teoretic, abordarea econometric va
consta n generalizarea ecuaiilor de genul (1.2.) i (1.3.)
pentru a permite manifestarea efectelor de pre. De exemplu,
(1.2.) ar putea fi transformat n relaia:
M = + Y +r + P, (1.4.)
n care P reprezint nivelul general al preului. Dac
= 0, atunci nivelul de pre nu are nici un efect asupra cererii
de bani. Tehnicile statistice utilizate pentru a estima
parametrii i pot fi de asemenea utilizate pentru obinerea
unei estimri pentru . Dac acesta rezult a fi semnificativ
mai mare dect zero, atunci ipoteza teoretic este contrazis.
Pn n acest moment, modul n care am scris
ecuaiile sugereaz caracterul exact sau determinant al
corelaiilor economice. Totui, virtual, acest aspect nu se
ntlnete niciodat deoarece comportamentul agenilor
economici nu este pe deplin previzibil. Acesta este motivul
pentru care n econometrie se introduce o perturbare
(reziduu)aleatorie n ecuaiile (1.2.). n consecin, (1.2.)
devine:
M = + Y +r + , (1.5.)
n care reprezint termenul de perturbare, care ar
putea fi pozitiv sau negativ. Includerea lui n ecuaia (1.5.)
nseamn c aceleai niveluri date pentru Y i r nu vor
14
Capitolul 1 No iuni introductive
conduce ntotdeauna la aceeai valoare pentru cererea de
bani, M. Va exista o anumit variaie aleatorie, care depinde
de mrimea i semnul rezidualului.
Existena perturbrii evideniat de (1.5.) semnific
faptul c este dificil de msurat cu exactitate parametri cum
ar fi , i . Aceasta este i explicaia faptului c ne-am
referit anterior la utilizarea tehnicilor inferenei statistice
pentru a oferi estimri ale parametrilor.
1.2. Concepte utilizate n econometrie
Dup cum am vzut, econometria combin teoria
economic cu matematicile i inferena statistic. n ceea ce
privete matematica, se presupune existena unor cunotine
de algebr i calcul diferenial de baz.
nelegerea diferitelor concepte privind calculul
probabilitilor i inferena statistic este de dorit pentru orice
proces de studiere a econometriei care s merite efortul.
Mai familiare sunt regresia de dou variabile i cele
mai mici ptrate. De exemplu, s presupunem c am fi
interesai de corelaia dintre venitul la nivel de gospodrie, Y,
i cheltuielile respectivei gospodrii pentru bunuri de
consum, C. Vom lua n consideraie ipoteza unei funcii de
consum lineare, de forma:
C = +Y + (1.6.)
n care i sunt parametri pe care vrem s i
estimm. De exemplu, reprezint nclinaia marginal
pentru consum iar este perturbare/variabila rezidual.
S presupunem c deinem datele referitoare la
veniturile i consumul unui numr de 10 gospodrii. Aceste
15
Elemente de econometrie
date pot fi reprezentate prin 10 puncte ntr-un grafic de
corelaie, ca cel din Figura 1.1
Figura 1.1. Grafic de corelaie venituri consum
Coordonatele fiecrui punct se refer la veniturile i
consumul unei gospodrii. Analiza regresiei de dou variabile
presupune trasarea unei linii drepte ntr-un astfel de grafic de
corelaie. La rndul ei, aceast dreapt ofer valorile estimate
pentru parametrii i . Cea mai cunoscut metod de a
estima o astfel de dreapt este metoda celor mai mici ptrate,
prin care dreapta este astfel aleas nct s minimizeze suma
ptratelor distanelor verticale de la puncte la linie.
Econometria generalizeaz proceduri de genul celei
prezentate.
16
Capitolul 1 No iuni introductive
Ar trebui ca estimrile pentru parametrii i din
ecuaia (1.5.) s fie ct mai aproape de valorile reale. n acest
sens avem n vedere valoarea estimatorilor i varietatea
metodelor de estimare.
De regul, corelaiile economice presupun mai mult
dect cele dou variabile din ecuaia (1.6.). De exemplu,
ecuaiile referitoare la cererea de bani (1.1.), (1.2.) i (1.3.)
implic trei variabile.
S presupunem c ne-am confrunta cu problema
estimrii parametrilor unei corelaii ca cea exprimat prin
(1.2.). n acest caz, parametru variabilei de scal, , msoar
efectul asupra cererii de bani al creterii cu o unitate a
variabilei de scal Y, n ipoteza c rata dobnzii, r, este
meninut constant. Ideal, pentru a estima valoarea , am
prefera s recurgem la un experiment de laborator n cadrul
cruia s meninem constant rata dobnzii, r, dar s facem
ca variabila de scal, Y, s varieze. ntr-o astfel de situaie,
trebuie s inem seama de corelaia:
M = ( + r) +Y (1.7)
n care ( + r) este constant. Revenim la corelaiile
de dou variabile i am putea observa efectul asupra valorii
M, produs de o unitate ceteris paribus de modificare a valorii
Y. Prin trasarea unei diagrame de puncte de dispersie pentru
M n raport cu Y, obinem estimri pentru parametrul .
Pentru a obine o estimare a parametrului corespunztor, rata
dobnzii, y, ar fi necesar un al doilea experiment n cadrul
cruia am menine constanta variabila de scal Y, fcnd s
varieze rata dobnzii.
Abordarea de mai sus ar putea fi fezabil n tiinele
cu caracter tehnic. Din pcate, n cadrul tiinelor economice,
17
Elemente de econometrie
experimentele, dac exist, sunt rare. Trebuie s ne
descurcm cu date non-experimentale n cazul crora, de
regul, toate variabilele de interes variaz simultan.
n acest context, vom introduce modelul clasic al
regresiei multiple. Acesta reprezint o extensie a modelului
regresiei de dou variabile, n care este generalizat metoda
celor mai mici ptrate, pentru a permite luarea n calcul a trei
sau mai multe variabile. Regresia multipl reprezint
substitutul experimentului de laborator din tiinele exacte.
Virtual, toate analizele econometrice implic, ntr-o form
sau alta, regresia multipl.
Din pcate, prezumiile modelului clasic al regresiei
multiple sunt mai degrab restrictive. Rezult c unele dintre
aceste prezumii se dovedesc uneori a nu fi valabile atunci
cnd sunt aplicate unor date economice tipice.
18
Capitolul
2
Inferen a statistic
2.1. Concepte de baz privind inferen a
statistic
Ori de cte ori dorim s observm sau s investigm
un fenomen sau o variabil, exist dou tipuri fundamentale
de surse de date pe care ar trebui s le utilizm. n primul
rnd, ar trebui s avem acces la populaie (colectivitate
definit n sens statistic). nelegem prin aceasta s avem
acces la toate observaiile posibile, trecute, prezente i
viitoare, cu privire la variabila de interes. De exemplu, dac
variabila noastr ar fi ctigurile din luna martie 2005
realizate de un muncitor adult de sex masculin din industria
siderurgic i am avea acces la un studiu complet referitor la
aceste ctiguri, am putea s emitem ipoteze privind
populaia ce face obiectul observaiilor referitoare la aceast
variabil.
Din pcate, nu avem acces la populaie. Am avea
nevoie de un studiu complet cu privire la ctigurile din
industria siderurgic dar acesta nu exist.
Eantionul reprezint cel de al doilea tip de surse de
date cu care ne-am putea ntlni. Pe baza eantionului de care
dispunem, trebuie s deducem fapte n legtur cu populaia
din care s-a prelevat eantionul. Acest proces este cunoscut
sub denumirea de inferen statistic.
Elemente de econometrie
Ca problem tipic n inferena statistic, s
presupunem c n 2004, ctigurile n industria siderurgic
au fost complet monitorizate, astfel nct tim c media
acestora a fost de 600 RON Acum suntem n luna martie
2005 i dorim s stabilim dac media ctigurilor a crescut
fa de anul precedent. Nu avem acces la studiul pentru acest
martie i avem timp s intervievm numai 100 de muncitori.
Rezult c acest eantion de 100 de muncitori a nregistrat
ctiguri medii lunare de 650 RON Putem oare deduce, n
baza dovezii dat de acest eantion, c media ctigurilor
lunare a crescut pentru ntreaga industrie, n ansamblu ?
Este clar c dac media ctigurilor eantionului ar fi
fost de 650 RON, am fi putut aprecia c s-a nregistrat o
cretere a ctigurilor la nivelul acestei industrii. Dac media
eantionului ar fi fost de numai 600 RON, am fi concluzionat
c respectivele ctiguri nu au crescut. Dar am obinut o
medie a eantionului de 650 RON Ce putem deduce de aici ?
Problema deduciei devine o problem de a decide cu ct
trebuie s depeasc media eantionului media din anul
precedent a industriei sau a populaiei, nainte de a putea
afirma c se nregistreaz o cretere a ctigurilor.
n ansamblul tuturor problemelor legate de inferena
statistic, una major este cea denumit variabilitatea
eantionrii. nelegem prin aceasta c diferitele eantioane
vor conduce la rezultate diferite. De exemplu, dac n martie
2005 am lua un al doilea eantion de 100 de muncitori
siderurgi, acesta ar putea nregistra o medie a ctigurilor
diferit de cea a primului eantion prelevat. De o manier
similar, un al treilea eantion ar putea conduce la o alt
valoare a ctigurilor medii. Este clar c exist pericolul c
rspunsul la care ajungem cu privire la ctigurile respectivei
20
Capitolul 2 Inferen a statistic
industrii va depinde foarte mult de eantionul pe care lucrm
de fapt.
Din fericire, cu condiia de a preleva eantionul de o
anumit manier, variabilitatea de selecie urmeaz un model
sistematic. Aceste eantioane trebuie s fie aleatorii.
Despre un eantion de mrimea n se spune c este
aleatoriu, atunci cnd orice combinaie de n uniti
ale unei populaii are anse egale de a intra n
eantionul care este prelevat.
Prelevarea unui eantion aleatoriu este o problem
esenial. De exemplu, prelevarea unui eantion aleatoriu de
100 de muncitori din industria siderurgic ar implica, n
primul rnd, obinerea unei liste complete a muncitorilor din
respectiva industrie. Urmtorul pas const n alocarea unui
numr fiecrui muncitor de pe list i, apoi, stabilirea unui
procedeu pentru a selecta 100 de numere din aceast list.
Vom ignora, totui, unele aspecte i vom presupune c toate
eantioanele cu care lucrm au fost extrase aleatoriu.
2.2. Distribu ia mediilor de eantion
Distribuia mediilor de selecie are media , i
dispersia
2
. Aceasta nseamn E(X) = i Var(X) =
2
.
Dispersia este pur i simplu o msur a gradului n care
ctigurile muncitorilor individuali sunt dispersate sau
mprtiate n raport cu media lor, .
i
2
sunt cunoscute sub denumirea de parametri
ai populaiei. Acetia sunt cantiti fixe dar, de regul,
necunoscute.
21
Elemente de econometrie
Am notat media populaiei i variaia cu aceleai
simboluri ca i n cazul utilizrii mediei i variaiei unei
distribuii probabilistice. Aceasta se datoreaz faptului c, n
condiiile unei populaii att de mari, putem interpreta
frecvena relativ cu care survine un anumit nivel de ctiguri
ca fiind o probabilitate. Populaia poate fi considerat a fi
analoag cu o distribuie probabilistic pentru variabila X.
S presupunem c din populaia respectiv se extrage
un eantion aleatoriu de n muncitori. Aceasta se exprim sub
forma:
n
X
X
i

(2.1)
n care X
i
reprezint ctigurile muncitorului i din
cadrul eantionului iar suma acoper toate valorile i.
Un singur eantion extras din populaie ar putea
reprezenta o medie de eantion, de exemplu, X = 600 RON
Totui, dup cum am menionat mai sus, diferitele eantioane
conduc la rezultate diferite, astfel c un al doilea eantion ar
putea s indice
X
= 658 RON, un al treilea
X
= 670 RON,
un al patrulea,
X
= 658 RON etc. Imaginai-v o situaie n
care foarte multe, poate mii de eantioane, toate de aceeai
mrime, n, au fost extrase din aceast singur populaie. n
astfel de condiii ar putea deveni posibil s se construiasc o
distribuie de frecvene relative pentru
X
, media unui
eantion aleatoriu de mrime n. De exemplu, o medie de
X

= 667 RON poate aprea cu o frecven relativ de 0,18.
Deoarece s-au extras foarte multe eantioane, astfel de
frecvene relative pot fi interpretate ca probabiliti astfel c
am putea afirma, de exemplu, c Pr (
X
= 665) = 0,18. n
22
Capitolul 2 Inferen a statistic
acest mod, este posibil s se construiasc o distribuie de
probabilitate pentru
X
. Aceasta ar putea s arate, de
exemplu, aproximativ ca ilustraia din Figura 2.1.
Figura 2.1. Distribuia mediei de selecie
Distribuia probabilistic pentru
X
este cunoscut
sub denumirea de distribuie a mediei de selecie pentru un
eantion aleatoriu de mrime n. Distribuiile de selecie de
acest fel au o importan crucial n inferena statistic.
Desigur, n practic, distribuiile de selecie sunt
rareori construite de o manier empiric, ca n cele de mai
sus. n mod normal, avem evidena unui singur eantion i nu
se practic extragerea a foarte multe eantioane.
2.3. Estimarea mediei unei popula ii
Dac un parametru al populaiei este necunoscut
exist dou modaliti prin care acesta poate fi estimat. n
primul rnd, putem estima respectivul parametru printr-o
singur valoare (estimare punctual) sau, n al doilea rnd,
putem specifica un interval n cadrul cruia suntem siguri c
se gsete parametrul real.
23
y
x
Elemente de econometrie
2.3.1. Estim ri punctuale
Acestea sunt estimri exprimate printr-o singur
valoare. De exemplu, am putea estima media ctigurilor
lunare ale populaiei de lucrtori n siderurgie ca fiind de 680
RON sau 720 RON De fapt, modalitatea evident de a
estima o medie necunoscut a populaiei, , const n a
cunoate media eantionului
X
. Exist un avantaj din
utilizarea estimatorului
X
. tim c E(
X
) = . Aceasta
nseamn c tim c, dac am fi extras foarte multe
eantioane din populaie, am fi putut obine o distribuie de
selecie asemntoare celei din Figura 2.2 (a) i n medie,
am fi obinut a valoare egal cu valoarea real dar
necunoscut a lui . Dei n practic extragem numai un
eantion, este important s apreciem c nu exist nici o eroare
sistematic sau interferen n procedura de estimare.
Deoarece E(
X
) = , se spune c
X
este un
estimator punctual nedeplasat pentru .
24
Capitolul 2 Inferen a statistic
Figura 2.2.a Distribuia de selecie pentru medii
De asemenea, vor exista situaii cnd dorim s
estimm o dispersie a populaiei,
2
. Estimarea punctual
evident pentru
2
este aceeai cu dispersie dat de formula:
( )
2
2
n
X X
v
i

(2.4)
De exemplu, avnd datele cu privire la ctigurile
lunare ale unui eantion aleatoriu format din n muncitori din
siderurgie, folosim pur i simplu expresia aferent dispersiei
unui set de n numere. Problema const n aceea c, similar lui
X
, valorile pentru eantioane diferite for fi i ele diferite i
se poate demonstra c:
( )
2 2 2
1

n
n
v E
(2.5)
25
Elemente de econometrie
Aceasta nseamn c distribuia de selecie pentru
2
arat aproximativ ca n Figura 2.2.b. i n acest caz, dac s-ar
fi extras foarte multe eantioane atunci n medie v
2
ne-ar
fi dat o valoare mai degrab mai mic dect valoarea real a
lui
2
. Astfel, n acest caz, exist o tendin sistematic spre
eroare iar despre

v
2
se spune c este un estimator punctual
deplasat pentru
2
.
Figura 2.2.b Distribuia de selecie pentru
2
Pentru a depi aceast problem a interferenei,
2
este, n mod normal, estimat prin relaia:
( )
2
2
1

n
X X
s
i
(2.6)
Aceasta datorit faptului c s
2
= [n/(n 1)]v
2
, astfel
c:
26
Capitolul 2 Inferen a statistic
( )
2 2 2 2
1
1 1

,
_

,
_

,
_

n
n
n
n
v
n
n
E s E

(utiliznd (2.5))
Astfel, s
2
devine o estimare punctual nedeplasat
pentru
2
2.3.2. Intervale de ncredere
Uneori se va pune problema c un singur numr, sau
estimare punctual, pentru un parametru nu este suficient.
Este posibil s vrem s specificm ntr-un fel i nivelul de
ncredere care se regsete n estimarea noastr. Una dintre
cile pentru a realiza acest lucru const n a ncerca s gsim
un interval de valori n cadrul cruia suntem convini n
proporie de 95% c se regsete respectivul parametru.
Abordm aceast problem considernd media populaiei, ,
n felul urmtor:
S presupunem c dorim s gsim un interval de
valori cuprinse ntre
X
+ E i
X
- E, astfel nct, nainte de a
extrage eantionul, exist o probabilitate de 0,95 ca intervalul
stabilit n cele din urm s includ parametrul necunoscut .
Deoarece
X
, respectiv eantionul mediei, este un
estimator nedeplasat al parametrului , a-l plasa n centrul
intervalului pe care l cutm capt sens. E este pur i
simplu o expresie, sau formul, pe care trebuie s o gsim.
Dac eantionul este mare, atunci tim din teoria
referitoare la limita central c
X
, este N(,
2
/n). Prin
urmare, putem spune c:
27
Elemente de econometrie
n
X
Z
/

urmeaz o distribuie N(0,1)
(2.7)
Utilizarea tabelelor distribuiei normale i
reprezentarea grafic 2.3.a indic faptul c:
Pr(-1,96 < Z < 1,96) = 0,95 (2.8)
Utiliznd relaia (2.7) pentru substituirea lui Z n
relaia (2.8) ajungem la expresia:
95 , 0 96 , 1
/
96 , 1 Pr

,
_


n
X

(2.9)
Figura 2.3.a Intervale de ncredere pentru z=1,96
Relaia (2.9) se mai scrie:
95 , 0 96 , 1 96 , 1 Pr

,
_

> > +
n
X
n
X


(2.10)
28
Capitolul 2 Inferen a statistic
Examinnd (2.10) constatm c am gsit exact ceea ce
cutam: un interval care s garanteze cu probabilitatea de
0,95 c va conine valoarea necunoscut . Expresia E pe
care am cutat-o este de fapt egal cu n / 96 , 1 .
Intervalul pe care l-am obinut este denumit, n mod
normal, intervalul de ncredere de 95% pentru .
Singura problem n legtur cu acest interval const
n aceea c E = n / 96 , 1 depinde de valoarea care, ca i
, este o necunoscut. n practic, atunci cnd se calculeaz
un interval de ncredere, trebuie s fie nlocuit prin s,
abaterea standard a eantionului, obinut prin utilizarea
ecuaiei (2.6) pentru a obinere o estimare nedeplasat. Prin
urmare, intervalul mare de ncredere, 95%, al eantionului se
poate rescrie sub forma
E X t
, sau:
n
s
X 96 , 1 t
(2.11)
Desigur, este posibil s dorim s fim mai mult de
95% confideni asupra faptului c intervalul nostru va
conine valoarea . Pentru a modifica nivelul de ncredere,
folosim valoarea corespunztoare din tabelul distribuiei
normale standardizate. De exemplu, Figura 2.3.b indic
faptul c, pentru a garanta un interval de ncredere 99%,
nlocuim valoarea de 1,96 cu 2,58 i obinem:
n
s
X 58 , 2 t
(2.12)
29
Elemente de econometrie
Odat stabilite expresiile de baz, intervalele de
ncredere sunt foarte uor de calculat. De exemplu, dac n
cazul muncitorului nostru din industria siderurgic, un
eantion de mrimea n = 80 ar trebui s conduc la o medie a
ctigurilor
574 X
RON, cu s = 94, atunci , substituirea n
relaia (2.11) conduce la un interval de ncredere 95% egal
cu:
6 , 20 574
80
94
96 , 1 574 t t
Prin urmare, intervalul urmrit este cuprins ntre
553,4 i 594,6.
Dei intervalele de ncredere sunt uor de calculat,
acestea sunt mult mai nesigure dect se poate imagina, atunci
cnd se pune problema interpretrii lor. Se impune
reamintirea faptului c media populaiei, , dei necunoscut,
reprezint o constant fix. Prin urmare, trebuie s se
gseasc fie n intervalul 553,4 594,6 pe care l-am calculat,
fie n afara acestuia. Dac se regsete n cadrul intervalului,
exist probabilitatea de o unitate de a o gsi acolo. Dac se
afl n afara intervalului, probabilitatea de a se regsi n
interiorul intervalului trebuie s fie zero. Prin urmare, nu
putem spune c exist o probabilitate de 0,95 ca aceasta s se
regseasc n intervalul 553,4 594,6! Deci, ce semnificaie
are calculaia noastr ?
Cheia acestei probleme rezid n a ne aminti c
diferitele eantioane vor conduce la diferite medii
X
i la
diferite abateri standard, s. Prin urmare, diferitele eantioane
vor prezenta, prin substituire n (2.11) diferite intervale de
ncredere. Dac s-ar extrage foarte multe eantioane, 95%
dintre aceste intervale ar conine necunoscuta , dar 5% nu ar
30
Capitolul 2 Inferen a statistic
conine-o. Intervalele difer de la eantion la eantion dar
este fix.
Dup cum vom vedea, adesea calculm intervale de
ncredere pentru parametrii ai populaiei, alii dect media .
Totui, procesul este ntotdeauna similar cu cel prezentat mai
sus.
Abaterea standard a distribuiei de selecie a unui
estimator este cunoscut sub denumirea de eroare standard
a estimrii.
De exemplu, eroarea standard a estimrii pentru
X

este n s s
X
/ , respectiv abaterea standard a distribuiei
sale de selecie. La o estimare punctual nedeplasat dat i,
cu condiia ca distribuia sa de selecie s fie simetric,
intervalele de ncredere sunt de forma:
Estimare punctualt (valoare critic)(eroarea
standard a estimrii)
(2.13)
Valoarea critic din (2.13) este luat din tabelele de
valori de distribuie, cum ar fi tabelul distribuiei normale
standardizate. De exemplu, n (2.11) i (2.12) estimarea
punctual este
X
, valoarea critic se preia din tabelul
distribuiei normale standardizate iar eroarea standard este
n s / .
2.4. Verificarea ipotezelor referitoare
la media popula iei
Vor exista situaii cnd, n loc de a dori s estimm un
parametru al populaie, am putea fi interesai s stabilim dac
acest parametru ia sau nu o anumit valoare. La nceputul
31
Elemente de econometrie
acestui capitol, cu titlu de exemplu de problem tipic de
inferen, am considerat situaia n care media ctigurilor
muncitorilor din siderurgie, realizate n prima lun a unui an
era cunoscut ca avnd valoarea de 540 RON Un an mai
trziu, n aceeai lun, ne-am confruntat cu problema legat
de cum am putea decide, numai pe baza unui eantion de 100
de muncitori, dac s-a nregistrat sau nu o cretere a mediei
ctigurilor populaiei n anul care a trecut. Pentru a soluiona
aceast problem, ncepem prin a formula dou ipoteze.
n primul rnd, formulm aa-numita ipotez nul,
conform creia media ctigurilor populaiei nu a crescut n
anul precedent.
Aceasta presupune c este n continuare egal cu 540
RON O ipotez nul este notat, de regul, prin H
0
. Astfel,
avem:
Ipoteza nul H
0
: = 540 (nici o modificare a
ctigurilor)
(2.14)
A se reine c valoarea la care se refer (2.14) este
media populaiei n anul iniial considerat.
n faza urmtoare formulm ipoteza alternativ,
notat prin H
A
care acoper toate alternativele rezonabile la
cea nul H
0
. ntruct anii considerai au fost inflaioniti, vom
face abstracie, pentru moment, de posibilitatea ca
respectivele ctiguri s fi sczut i adoptm ca alternativ,
ipoteza c acestea au crescut:
32
Capitolul 2 Inferen a statistic
Ipoteza alternativ H
A
: > 540 (cretere a
ctigurilor)
(2.15)
Problema devine astfel una de a alege ntre H
0
i H
A,
respectiv ntre ipoteza nul i cea alternativ. Trebuie s
facem acest lucru pe baza informaiilor date de un eantion de
mrime n = 100.
Odat eantionul extras, vom cunoate valoarea
mediei eantionului,
X
. Este evident c a respinge ipoteza
nul H
0
, conform creia ctigurile nu au crescut,

capt sens
dac se dovedete c
X
are o valoare mai mare dect
valoarea din anul precedent, de 540 RON. O ntrebare
important n context se refer la ct de mare trebuie s fie
X
nainte de a respinge H
0
i de a accepta alternativa H
A
,
conform creia ctigurile populaiei au crescut.
Un instrument de care dispunem pentru a soluiona
aceast problem este Teorema Limita Central. ntruct
eantionul nostru este unul relativ mare, tim c distribuia
mediilor de selecie pentru
X
urmeaz o distribuie normal,
N(,
2
/n).
Cantitatea (
X
- 540/ ( ) n / este cunoscut sub
denumirea de test statistic (TS). Punctul crucial referitor la
acest test statistic este dat de faptul c are o distribuie
N(0,1) numai atunci cnd ipoteza nul H
0
este adevrat.
Dac H
0
nu este adevrat ci fals, atunci (2.16) nu se
va verifica, deoarece nu va lua alt valoare dect 540 RON.
Dup cum se poate observa n Figura 2.4, distribuia
normal standardizat, sau N(0,1) este centrat n jurul valorii
33
Elemente de econometrie
zero. Dac ipoteza nul este adevrat, n condiii H
0
exist o
mare probabilitate ca TS s ia o valoare n jurul valorii zero.
Dac ar lua o valoare diferit de zero, atunci vom fi nclinai
s ne ndoim de faptul c H
0
este adevrat. Dac H
0
este
fals, nu exist nici un motiv pentru care TS nu ar trebui s ia
o valoare deprtat de zero. Prin urmare, testul statistic ofer
un mijloc de testare a msurii n care H
0
este adevrat.
Figura 2.4. Distribuia testului statistic
A se observa c TS se bazeaz pe diferena dintre
X

i valoarea de 540 RON care apare n cadrul H
0
. Cu ct este
mai mare msura n care media eantionului depete 540
RON, cu att mai mare (mai relevant) va fi testul statistic. Cu
ct TS este mai semnificativ, cu att vom fi mai nclinai s
respingem H
0
n favoarea lui H
A
i s afirmm c veniturile
populaiei au crescut.
S presupunem c eantionul nostru de 100 de
muncitori este extras iar TS = ( ) ( ) n X / / 540 . S
presupunem c TS > 1,64. Numrul 1,64 nu a fost ales de o
manier arbitrar. Dup cum se poate vedea din Figura 2.4,
aria de sub curba standardului normal de la dreapta valorii
1,64 este egal cu 0,05.
Este TS > 1,64 suficient de mare pentru a ne face s
avem dubii cu privire ipoteza nul H
0
care afirm c nu au
34
Capitolul 2 Inferen a statistic
crescut ctigurile? Dac TS > 1,64, trebuie s alegem una
din dou posibiliti.
n primul rnd, am putea continua s susinem c H
0
este adevrat. Totui, dac adoptm aceast poziie, trebuie
s acceptm faptul c a survenit ceva mai degrab neobinuit.
Dac H
0
este adevrat, atunci (2.16) este valabil iar curbele
din Figura 2.5 reprezint distribuia unui test statistic. Dac
aceasta este situaia, atunci probabilitatea de a obine a
valoare TS mai mare de 1,64 este de numai 0,05, respectiv 1
la 20. Majoritatea oamenilor ar privi producerea unui
eveniment care are numai o ans de 1 la 20 de a se ntmpla
ca pe ceva mai degrab ciudat.
Ca alternativ, dac TS > 1,64, am putea respinge H
0
susinnd n schimb c H
A
este adevrat iar ctigurile au
crescut. Dac ipoteza alternativ este adevrat, conform H
A
,
nu exist nici un motiv pentru care Figura 2.4 ar trebui s
reprezinte distribuia testului statistic. TS ar putea fi
distribuit n jurul valorii 1,5 sau 2, situaie n care nu ar fi
nimic neobinuit n a obine TS > 1,64. Dac respingem H
0
n
favoarea lui H
A
, trebuie s ne amintim c va rmne n
continuare o mic probabilitate, de pn la 0,05, ca H
0
s fie
de fapt adevrat. Aceasta nseamn c, dac respingem H
0
i
susinem creterea ctigurilor, exist o probabilitate, poate
numai de 0,05, c am greit n acest sens.
Atunci cnd un statistician obine o valoare mai mare
de 1,64 pentru testul statistic, n mod normal afirm c
respinge ipoteza nul de 0,05 nivel de semnificaie. Acesta
este numai un jargon statistic pentru respingerea lui H
0
,
admindu-se c exist o probabilitate infim, de 0,05, care s
ateste c s-a procedat greit. Nivelul de semnificaie
reprezint probabilitatea unei erori atunci cnd se respinge
35
Elemente de econometrie
H
0
. n mod normal, probabilitatea unui astfel de tip de eroare
este reprezentat prin simbolul . Aceasta conduce la relaia:
Nivel de semnificaie = Pr (se respinge H
0
cnd H
0
este
adevrat)
Pentru ca cele de mai sus s fie absolut clare, vom
considera de o manier uor diferit ce anume este implicat
atunci cnd respingem H
0
dac TS > 1,64. Din (2.16)
rezult c dac TS > 1,64 atunci:
n X / 64 , 1 540 + > (2.17)
Astfel, respingem H
0
dac
X
depete un anumit
nivel critic dat de partea din dreapta a ecuaiei (2.17). Dat
fiind o estimare , acest numr ar putea fi calculat. ns dac
H
0
este adevrat, atunci
X
este N(540,
2
/n) iar
probabilitatea ca (2.17) s se produc poate fi uor calculat
sub forma:
( ) ( ) 05 , 0 64 , 1 Pr / 64 , 1 540 Pr > + > Z n X
Astfel, dac H
0
este adevrat, exist o probabilitate
de numai 0,05 de a obine o valoare
X
care s depeasc
valoarea critic din (3.17). Totui, chiar dac obinem o astfel
de valoare, considerm aceasta o ntmplare puin probabil
de a fi respins H
0
la nivelul de semnificaie 0,05.
Nu este nimic special n mod deosebit n legtur cu
numrul 1,64 sau cu un nivel de semnificaie de 0,05.
Alternativ, am putea decide s respingem H
0
i s meninem
afirmaia conform creia ctigurile au crescut n condiiile n
36
Capitolul 2 Inferen a statistic
care TS > 2,33. Problema n legtur cu numrul 2,33 const
n aceea c aria de la dreapta acestuia de sub curba
distribuiei normale standardizat din Figura 2.4. este de 0,01.
Urmnd un acelai raionament ca mai sus, pentru o valoare
TS > 2,33, putem fie s acceptm H
0
ca fiind adevrat, dar
s susinem c un eveniment cu o probabilitate att de redus,
ca cea de 0,01 s-a produs totui, fie s respingem H
0
. Totui,
dac respingem H
0,
trebuie s ne amintim c exist n
continuare o probabilitate de eroare, dei acum aceasta este
de numai 0,01. Deci, dac TS > 2,33, respingem H
0
la
nivelul de semnificaie de 0,01.
Introducerea unor numere n procesul de testare
(verificare) a ipotezelor presupune ca eantionul nostru de
100 de muncitori s se dovedeasc a avea o medie a
ctigurilor
X
= 564RON, cu o abatere standard a
eantionului de s = 75. Substituind n testul statistic (2.16) i
utiliznd s n locul necunoscutei , rezult :
2 , 3
100 / 75
540 564

TS
Astfel, testul statistic depete nu numai valoarea de
1,64 ci i pe cea de 2,33. Prin urmare, putem respinge ipoteza
nul (conform creia ctigurile au rmas neschimbate
comparativ cu ultimul an) att la nivelul de semnificaie de
0,05 ct i la cel de 0.01.
2.4.1. Teste bilaterale
n exemplul de mai sus am eliminat posibilitatea c
veniturile ar fi putut s scad. S presupunem c nu am
eliminat aceast posibilitate i am dorit s verificm dac
media ctigurilor s-a modificat. Putem proceda recurgnd la
37
Elemente de econometrie
aceeai ipotez nul ca n situaia anterioar. Totui, ipoteza
alternativ, care acoper toate celelalte posibiliti rezonabile
trebuie s fie n acest caz aceea conform creia media
ctigurilor s-a modificat n raport cu valoarea de 540 RON
din anul precedent. Aceasta nseamn c acum avem:
Ipoteza nul H
0
: = 540 (nici o modificare a
ctigurilor)
Ipoteza alternativ H
A
: 540 (modificare a
ctigurilor)
Odat eantionul extras, capt sens s respingem H
0
,
respectiv ipoteza conform creia media ctigurilor populaiei
este n continuare egal cu 540 RON, att n cazul n care
media eantionului
X
este cu mult mai mare dect 540 RON,
ct i n cazul n care
X
este cu mult mai mic dect 540
RON S ne amintim c, n cazul precedent, am respins
ipoteza H
0
numai atunci cnd
X
era cu mult mai mare dect
540RON Acest lucru a fost justificat de faptul c, n cazul
precedent, a trebuit s eliminm posibilitatea s se
nregistreze ctiguri n scdere.
Interpretnd criteriile noastre revizuite pentru
respingerea lui H
0
n termeni de test statistic (2.16), observm
acum c ar trebui s respingem H
0
i s susinem c
respectivele ctiguri s-au modificat, att n cazul n care TS
este cu mult mai mare dect zero (foarte pozitiv), ct i n
cazul n care TS este cu mult mai mic dect zero (foarte
negativ). Ct de pozitiv sau ct de negativ trebuie s fie testul
statistic este stabilit din nou prin raportare la tabelele de
distribuiei normale standardizate. De exemplu, din
examinarea Figurii 2.5 rezult c dac adoptm un nivel de
semnificaie de 0,05, atunci ar trebui s respingem H
0
i s
38
Capitolul 2 Inferen a statistic
susinem modificarea ctigurilor, att n cazul n care testul
statistic este mai negativ dect -1,96, ct i n cazul n care
acesta este mai pozitiv dect +1,96.

Figura 2.5. Distribuia absolut a testului statistic
Putem reformula decizia noastr, sau criteriul de
verificare pentru acest test bilateral n termeni de valoare
absolut a testului statistic, scriind:
se respinge H
0
la nivelul de semnificaie 0,05 dac |
TS| > 1,96
De o manier similar, din analiza figurii 2.5 rezult
c:
se respinge H
0
la nivelul de semnificaie 0,01 dac |
TS| > 2,58
n cel de al doilea caz probabilitatea de eroare de 0,01
este egal distribuit ntre cele dou extreme ale distribuiei
distribuiei normale standardizate.
2.4.2. Tipuri de eroare
n exemplul i analiza de mai sus se afl, n mod
implicit i o decizie sau criteriu de verificare de forma:
39
Elemente de econometrie
Se respinge H
0
dac |TS| > k dar se accept H
0
dac |
TS| < k
(2.18)
Valoarea k este preluat din tabelele distribuiei
normale standardizate i va depinde de nivelul de
semnificaie acceptat i de msura n care testul este unul cu o
extrem sau unul cu dou extreme. Respingerea lui H
0
implic automat acceptarea alternativei H
A
, n timp ce
acceptarea lui H
0
implic respingerea lui H
A.
n condiiile unui criteriu de decizie (2.18) dat, exist
dou tipuri de erori pe care le-am putea face atunci cnd
procedm la efectuarea unei verificri.
Este clar c, dac acceptm H
0
cnd aceasta este
adevrat sau respingem H
0
cnd aceasta este fals,
nu comitem nici o eroare. Dac ns respingem H
0
cnd aceasta este adevrat, comitem o eroare de
tip I. Probabilitatea de a comite acest tip de eroare
este de fapt nivelul de semnificaie al testului. Pe de
alt parte, dac acceptm H
0
cnd aceasta este fals,
comitem o eroare de tip II.
La modul ideal, ne-ar place s fim n msur s optm
pentru acea valoare k din criteriul de test (2.18) care s
conduc la valori ct mai mici posibile att pentru Pr(eroare
de tip I), respectiv Pr(eroare de tip II). Din pcate, acest lucru
este foarte rar posibil datorit urmtoarelor motive.
n primul rnd rezult c dac facem ca valoarea k
s varieze n baza criteriului (2.18), cu ct facem ca valoarea
Pr(eroare de tip I) s fie mai mic, cu att devine mai mare
Pr(eroare de tip II) i vice versa. Nu este posibil, n mod
40
Capitolul 2 Inferen a statistic
normal s facem ca ambele probabiliti s fie foarte mici n
acelai timp. Pentru a nelege acest lucru, s revenim la
exemplul nostru cu muncitorii din siderurgie, unde am avut
ipotezele nul i alternativ.

H
0
: = 540 , H
A
: 540
Criteriul de decizie (2.18) implic respingerea lui H
0
dac
n
X
TS
/
540

este fie > k, fie < - k


Putem rescrie acest lucru sub forma:
Se respinge H
0
dac
X
>540+
n
k
sau dac
X
< 540-
n
k
(2.19)

Valoarea k depinde, ca de regul, de nivelul de
semnificaie ales.
Cunoatem faptul c n condiiile H
0
, = 540 astfel c
media eantionului
X
este N(540,
2
/n). Aceast distribuie
este prezentat sub forma curbei din stnga din Figura 2.6,
centrat n jurul valorii
X
= 540. Punctele R i R din Figura
2.6 se situeaz la nivelul 540 - k n i, respectiv, 540 + k
n , pe axa
X
. Criteriul nostru de decizie (2.19) este de aa
41
Elemente de econometrie
manier nct, dac media eantionului
X
ia o valoare la
stnga lui R sau la dreapta lui R, respingem H
0
.
Probabilitatea unei erori de tip I, respectiv respingerea lui H
0
atunci cnd este adevrat iar curba din partea stng
reprezint distribuia lui
X
, este egal cu suma ariilor de sub
curb la stnga fa de R i la dreapta lui R. Prin urmare,
aceasta este egal cu de dou ori aria care se desfoar la
dreapta lui R.
Figura 2.6. Distribuia mediei de selecie
Acum s presupunem c H
A
i nu H
0
este adevrat.
H
A
implic tocmai faptul c 540 dar ne permite s lum
cazul particular n care =560. Dac = 560 , atunci media
eantionului,
X
, este N(560,
2
/n). Aceast distribuie este
prezentat prin curba din dreapta din Figura 2.6. ntruct
aceasta prezint o aceeai variaie ca i prima curb, ns o
medie mai mare, forma sa este identic cu a primei curbe ns
se deplaseaz spre dreapta de-a lungul axei
X
.
n condiiile criteriului nostru de decizie acceptm H
0
dac
X
ia o valoare cuprins ntre R i R. Totui, dac este
mai degrab adevrat H
A
dect H
0
atunci distribuia lui
X

este dat de curba din dreapta. Deoarece, dac H
A
este
42
Capitolul 2 Inferen a statistic
adevrat, probabilitatea de a accepta n mod incorect H
0
este
dat de aria punctat de sub curba din dreapta la stnga lui R.
Prin urmare, aceast arie punctat reprezint probabilitatea
unei erori de tip II, respectiv, probabilitatea de a accepta H
0
atunci cnd H
0
este fals.
Acum este posibil s vedem de ce reducerea lui
Pr(eroare de tip I) face ca Pr(eroare de tip II) s creasc i
vice-versa. Dac facem ca valoarea k s varieze n cadrul
criteriului nostru de decizie (2.19) (respectiv, modificm
nivelul de semnificaie), aceasta face ca punctele R i, mai
important dect acsta, R din Figura 2.6 s se deplaseze. Dac
mrim valoarea k i R este deplasat ctre dreapta atunci aria
umbrit de sub curba din stnga este redus aceasta implicnd
o diminuarea a Pr(eroare de tip I). ns o deplasare a lui R
spre dreapta face ca aria punctat de sub curba din dreapta s
se mreasc i, prin aceasta, face ca Pr(eroare de tip II) s se
reduc, crescnd simultan Pr(eroare de tip I).
Mai exist i o a doua problem n legtur cu
criteriul de verificare de forma (2.18) i (2.19). n Figura 2.7
am presupus c atunci cnd este adevrat H
A
mai degrab
dect H
0
, = 560. ns H
A
afirm numai c 540. S
presupunem, n schimb c H
A
este adevrat dar = 550.
Curba din dreapta din Figura 2.6 se va afla acum mult mai
aproape de curba din stnga. n consecin, cu R ntr-o poziie
dat, aceasta nseamn c pentru o valoare Pr(eroare de tip I),
va exista o valoare mai mare Pr(eroare de tip II).
n general, pentru o valoare dat Pr(eroare de tip I), ar
trebui s fie clar faptul c Pr(eroare de tip II) va depinde de
poziia celei de a doua curbe i, prin urmare, de valoarea luat
de atunci cnd H
0
este fals. ns cu ipoteze de genul celor
de mai sus, dac H
0
este fals, nu vom cunoate valoare lui .
H
A
nu precizeaz aceast valoare ea afirm mai degrab c
43
Elemente de econometrie
540. Astfel, n general, nu putem cunoate probabilitatea
unei erori de tip II.
Apoi, mai exist dou probleme legate de criteriile de
verificare de forma (2.18) i (2.19). Prima const n aceea c
nu putem cunoate probabilitatea unei erori de tip II. Cea de a
doua se refer la faptul c, cu ct facem ca probilitate unei
erori de tip I s fie mai mic, cu att mai mare devine
probabilitatea unei erori de tip II.
n principiu, este posibil s evitm cea de a doua
dintre aceste probleme prin creterea dimensiunii
eantionului. n general, acest lucru va reduce Pr(eroare de tip
II) pentru o valoare Pr(eroare de tip I) dat. n termenii
Figurii 2.6, creterea dimensiunii eantionului conduce la o
rspndire mai mic n ambele distribuii prezentate.
2.5. Alte cteva teste statistice
importante i distribu iile lor
Pn n prezent am introdus conceptele de inferen
statistic aproape exclusiv n contextul mediei populaiei.
Totui, sunt frecvente ocaziile n care dorim s facem
deducii cu privire la ali parametri ai populaiei un
exemplu evident este variaia dispersiei
2
. n plus, dup cum
vom vedea, inferena statistic are un rol important n analiza
regresiilor. De asemenea, am limitat analiza la eantioane
mari. n tiinele economice trebuie s operm frecvent cu
eantioane mai mici dect cele pe care le-am avut n vedere
pn acum.
nainte de a aborda problemele de mai sus, trebuie s
ne ocupm de distribuiile/densitile probabilistice, aceste
funcii implicnd conceptul de grade de libertate.
44
Capitolul 2 Inferen a statistic
2.5.1. Gradul de libertate

S considerm n variabile aleatorii continue: X
1
, X
2
, X
3
......X
n
i suma ptratelor
2
1 i
n
i
X

. Gradele de libertate reprezint
un concept asociat unor astfel de sume de ptrate.
De exemplu, s presupunem c n = 5 i c exist 2
restricii lineare pe variabilele X. Acestea ar putea fi X
1
+ X
2
+ X
3
= 0 i 2X
4
+ 3X
5
= 8. Dac selectm valorile pentru trei
dintre variabilele X, n condiii restriciilor date, valorile celei
de a doua restricii, X
5
trebuie s ia valoarea 2. Atunci cnd
selectm valorile pentru X
s
se afirm c dispunem de numai
trei grade de libertate ntruct numai trei astfel de valori pot fi
selecionate independent de celelalte. Se mai afirm c suma
asociat a ptratelor are trei grade de libertate.
n general, dac avem n variabile i r restricii, vom
avea n r grade de libertate. Atunci i despre suma ptratelor
2
i i
X

se poate afirma c are n r grade de libertate.


Pentru exemplificare, s presupunem c avem o
populaie de X valori din care extragem un eantion de
mrime n , constnd din valorile X
1
, X
2
, X
3
......X
n
. Presupunem
apoi c am calculat suma ptratelor ( )
2
1 1
X X
n
i


.
Deoarece ( ) 0

X X
i i
, exist o singur restricie pentru
cele n variabile X X
i
. Astfel, despre suma ( )
2
X X
i i


se spune c are n 1 grade de libertate.
S presupunem, totui, c media populaiei, , este
cunoscut i c, n loc s calculm ( )
2
X X
i i

, calculm
suma ptratelor ( )
2

i i
X . Deoarece nu exist nici un
motiv pentru care ( )
2

i i
X ar trebui s fie egal cu zero,
45
Elemente de econometrie
nu exist restricii pentru cele n variabile

i
X
, astfel nct
suma ptratelor ( )
2

i i
X dispune de toate cele n
grade de libertate.
nlocuirea parametrului al unei populaii cu
estimarea eantionului su,
X
, n suma ptratelor de mai sus
conduce la pierderea unui grad de libertate. Ori de cte ori
trebuie s nlocuim un parametru al unei populaii prin
estimarea eantionului su pentru a calcula o sum de ptrate,
vom constata c aceasta implic formualrea unei restricii
pentru variabilele care sunt ridicate la ptrat i nsumate.
Aceasta conduce la diminuarea cu unu a gradelor de libertate
asociate sumei ptratelor. n cazul de mai sus, nlocuirea lui
prin
X
implic impunerea restriciei ( ) 0

X X
i i
pe
variabilele care trebuie ridicate la ptrat i nsumate.
Avnd n vedere cele de mai sus, putem afirma c
numrul de grade de libertate (g.l.) asociate sumei
ptratelor este dat de numrul de observri utilizate
pentru a calcula suma ptratelor minus numrul
parametrilor care trebuie nlocuii prin estimaiile
pe baza eantioanelor.
2.5.2. Distribu ia
2
Dac Z
1
, Z
2
, Z
3
......Z
n
sunt toate variabile
distribuite independent distribuiei normale
standardizate sau N(0,1), atunci despre suma
ptratelor
2
1 i
n
i
Z

se spune c are o distribuie
2
cu n grade de libertate.
46
Capitolul 2 Inferen a statistic
Gradele de libertate asociate distribuiei sunt date de
suma ptratelor. Deoarece variabilele Z sunt independente,
aceast sum a ptratelor dispune de totalitatea n a gradelor
de libertate. O variabil
2
cu n grade de libertate este scris
sub forma
2
n
.
Forma distribuiilor
2
selectate pentru diferite grade
de libertate este prezentat n Figura 2.7.
Figura 2.7. Distribuia
2
Ariile de sub curb pot fi interpretate ca fiind
probabiliti iar densitile probabilistice pot fi msurate pe
axa vertical. Deoarece suma ptratelor nu poate fi niciodat
negativ, distribuiile se afl ntotdeauna n cuadrantul
pozitiv. Distribuiile sunt non-simetrice i au extremiti lungi
n partea dreapt.
Media unei distribuii
2
n
poate fi derivat cu
uurin, pentru toate valorile i, rezultnd:
Var (Z
i
) = E( )
2
i
Z - ( ) [ ]
2
i
Z E (prin definiie)
47
Elemente de econometrie
= ( )
2
i
Z E (deoarece fiecare variabil Z
i
are o
medie de zero)
Dar toate variabilele Z
i
sunt N(0,1) i, prin urmare
toate prezint o variaie de o unitate. Astfel, ajungem la
egalitatea ( )
2
i
Z E = 1 pentru toate valorile i.
Media distribuiei
2
n
este egal cu gradul su de
libertate. Datorit acestui fapt, cu ct numrul de grade de
libertate asociate distribuiei este mai mic, cu att mai
aproape de axa vertical se va afla vrful su din Figura 2.7.
O utilizare a distribuiei
2
n
const n elaborarea de
inferene n legtur cu variaia,
2
. S presupunem c avem
un eantion de n observri, X
1
, X
2
, X
3
......X
n
dintr-o
distribuie N(,
2
). Rezult c:


i
X
are o distribuie N(0,1) pentru toate valorile
i. (2.21)
Din (2.21) rezult c:
2


,
_


i
i
X

prezint o distribuie
2
cu n g.l.
(2.22)
deoarece reprezint suma ptratelor pentru n variabile
distribuiei normale standardizate care vor fi distribuite
independent dac eantionul valorilor X este aleatoriu.
Prin urmare, utiliznd (2.22), obinem:
48
Capitolul 2 Inferen a statistic
( )
2
2
1

n s
prezint o distribuie
2
cu n-1 g.l.
(2.23)
Acum avem n 1 grade de libertate, deoarece trecnd
de la suma ptratelor din (2.23) la cea din (2.24) am nlocuit
parametrul prin estimarea eantionului su,
X
.
Ceea ce implic (2.24) este c, dac extragem multe
eantioane de mrimea n din populaia N(,
2
), atunci vom
obine o distribuie de selecie de valori pentru s
2
. Aa cum se
evideniaz valori diferite pentru
X
, diferitele eantioane vor
conduce la valori diferite i pentru s
2
. Dac am calculat
pentru fiecare eantion s
2
= (n-1)/
2
, atunci distribuia de
selecie a acestui indicator statistic va fi distribuia
2
cu n
1 grade de libertate.
O caracteristic important a distribuiilor
2
este
dat de teorema conform creia:
Dac
2
u
i
2
v
sunt dou distribuii
2
independente avnd u i respectiv v grade de
libertate, atunci
2
u
+
2
v
vor avea o distribuie
2
cu
u + v grade de libertate.
Celor dou distribuii
2
independente le
corespunde o distribuie
2
iar gradul de libertate
asociat acestei noi distribuii este egal cu suma
gradelor de libertate asociate distribuiilor
originale.
49
Elemente de econometrie
Distribuia
2
este format preluarea sumei
2
i i
Z

a
n variabile distribuiei normale standardizate. Dac toate
aceste variabile sunt independente una de cealalt, atunci
distribuia obinut prezint n grade de libertate. Dac, totui,
numai r dintre variabilele distribuiei normale standardizate
sunt independente , cu celelalte variabile depinznd de aceste
r , atunci suma ptratelor
2
i i
Z

va avea numai r grade de


libertate. Astfel, i distribuia
2
astfel format va avea numai
r grade de libertate.
2.5.3. Distribu ia t
Dac Z
1
, Z
2
, Z
3
......Z
n
sunt toate variabile de
distribuiei normale standardizate distribuite
independent, atunci despre mrimea

n
i
i
n Z
Z
t
1
2
0
/

se spune c prezint o distribuie t cu n grade de
libertate.
(2.25)
Se poate observa c n interiorul rdcinii ptrate de la
numitorul din (3.26) avem
( )
2
1
/
i
n
i
Z n l

care reprezint o
variabil
2
mprit la gradele sale de libertate. Prin urmare,
o definiie alternativ pentru t este ca aceasta reprezint
raportul dintre o variabil de distribuiei normale
standardizate i rdcina ptrat a unei variabile
independente
2
care a fost mprit la gradele sale de
50
Capitolul 2 Inferen a statistic
libertate. A se reine faptil c distribuia t i obine gradele
de libertate din distribuia
2
care apare la numitorul su.
Forma unei distribuii t este ilustrat n Figura 2.8.
Figura 2.8. Distribuia t
Aceasta nseamn c ariile de sub curb pot fi privite
ca nite probabiliti, cu densiti probabilistice msurate pe
axa vertical. Forma este foarte asemntoare cu cea a
distribuiei distribuiei normale standardizate, fiind simetric
n jurul lui zero dar cu o probabilitate ceva mai mare de a lua
valorile extreme.
Forma precis a distribuiei t depinde de n, de gradele
sale de libertate. Poate fi demonstrat c pe msur ce n
forma tinde spre cea a distribuiei distribuiei normale
standardizate. De fapt, pentru scopuri practice, pentru n >
50, diferenele dintre cele dou distribuii pot fi ignorate.
51
Elemente de econometrie
Dei eantioanele sunt mici, distribuia de selecie a
mediei
X
este n continuare N(,
2
). Dac valoarea ar fi
cunoscut, am putea n continuare s aplicm un test statistic.
Deviaia standard a variabilei, , este, totui,
cunoscut de regul i trebuie nlocuit cu deviaia standard a
lui s. n cazul eantioanelor mici, nu exist nici un motiv
pentru care ( )( ) n X / ar trebui s fie o variabil
distribuiei normale standardizate. Totui, vom demonstra
acum c, cu condiia ca populaia s fie normal distribuit,
n s
X
/

are o distribuie t cu n 1 g.l. (2.26)
52
Capitolul 3
Regresia liniar simpl
3.1. Domenii de aplicare
n practica analizei economice modelul liniar de
regresie are numeroase aplicaii. Vom preciza pentru nceput
cteva aplicaii ale acestuia:
funcia de consum din modelul lui Keynes
este:
t t
Y b a C +
(3.1)
unde:
C
t
este consumul pentru un an
Y
t
este venitul pentru aceeai perioad
a,b sunt parametrii modelului de regresie
relaia liniar care exist ntre pregtirea
profesional i venitul obinut;
dependena liniar ntre gradul de dezvoltare a
unei ri i gradul de corupie din aceast ar:
i i
CR b a H +
, (3.2)
unde:
H
i
este indicele dezvoltrii umane nregistrat de o
ar,
CR
i
nivelul corupiei, ce se exprim printr-un
numr cu o zecimal din intervalul [1,10]. Nivelul
cel mai sczut al corupiei este n cazul n care
indicele este egal cu 10.
Elemente de econometrie
Cu privire la modelul liniar de regresie sunt necesare
urmtoarele precizri:
identificarea celor dou variabile folosite
pentru definirea modelului notate:
Y = simbolul pentru variabila
rezultativ. Seria de date se noteaz
prin
n i i
y
, 1
) (

;
X = simbolul pentru variabila
explicativ sau factorial definit de
seria
n i i
x
, 1
) (

Cu cei doi parametri se definete o dependen


determinist ntre cele dou variabile:
Y= b + aX
(3.3)
Cei doi parametri sunt estimai prin intermediul
seriilor de date constituite pentru cele dou variabile.
Estimatorii celor doi parametri se definesc prin
b

i a .
Parametrii modelului sunt stabilii ntr-o manier stocastic,
pe baza estimatorilor:
definirea variabilei reziduale. Notm variabila
rezidual prin

. Aceasta este repartizat normal, avnd


media 0 i dispersia constant. Variabila rezidual este
inclus model deoarece:
- n economie nu se ntlnete ntotdeauna o
dependen liniar funcional ntre dou
variabile, ci una de tip probabilist;
- seriile de date sunt afectate de erori de
msurare cu influen asupra estimrii celor
doi parametri;
54
Capitolul 3 Regresia liniar simpl
- seriile de date se stabilesc prin observri
asupra unor eantioane.
utilizarea modelului de regresie. Dup natura
seriilor de date, sunt dou domenii de utilizare a modelului
liniar de regresie:
- n analiza dependenei dintre dou variabile, n
cazul n care seriile de date sunt nregistrate la
nivelul unitilor statistice ale populaiei
pentru o perioad sau un moment, folosind
notaia:
i i i
x a b y + +
, (3.4)
unde:
y
i
este caracteristica rezultativ (explicat),
x
i
caracteristica factorial (explicativ);
- pentru evidenierea dependenei dintre dou
variabile ntr-un anumit orizont de timp sunt
folosite seriile de timp.
utilizarea setului de ipoteze. Pentru estimarea
parametrilor i utilizarea modelului de regresie sunt utilizate
o serie de ipoteze:
- I
1
: seriile de date nu sunt afectate de erori de
msur;
- I
2
: variabila rezidual are media 0;
- I
3
: dispersia variabilei reziduale este invariant
n timp, adic are proprietatea de
homoscedasticitate;
- I
4
: reziduurile nu sunt autocorelate;
- I
5
: variabila factorial (explicativ) nu este
corelat cu variabila rezidual;
- I
6
: ) , 0 (
2

N
t
.
Pentru testarea acestor ipoteze sunt folosite o serie de
teste statistice.
55
Elemente de econometrie
n cazul n care dependena liniar este regsit n
urma efecturii de transformri asupra celor dou variabile,
vom spune c modelul de regresie este liniar n raport cu
parametrii acestuia.
De exemplu, modelul Y = b + alnX este neliniar n
raport cu variabila factorial, dar este un model liniar n
raport cu cei doi parametri. n schimb, modelul de regresie Y
= b + ln aX este liniar n raport cu variabila factorial, dar nu
este liniar n raport cu cei doi parametri, a i b, ci n raport cu
b i lna.
Pentru elucidarea acestor aspecte vom lua exemplul
dependenei dintre venitul disponibil i consumul populaiei
care este de tip liniar, (coeficientul pantei este pozitiv
1
). De
asemenea, modelul liniar pentru studierea dependenei dintre
rata de economisire i rata investiiei dintr-o ar ntr-un
orizont de timp. ntr-un studiu efectuat de ctre Feldstein i
Horioka asupra unui numr de 21 de ri n perioada 2000-
2005, s-a stabilit urmtorul model liniar de regresie:
E
i
I
i
y y 887 , 0 035 , 0 + , R
2
= 0,91
n cadrul modelului de mai sus s-au folosit
urmtoarele notaii:
-
I
i
y reprezint ponderea medie a investiiilor n PIB
n perioada 2000-2005 pentru fiecare ar inclus n eantion;
-
E
i
y cuantific ponderea medie a economiilor
populaiei n PIB pentru fiecare ar.
Raportul de corelaie demonstreaz c ntre cele dou
serii exist o dependen puternic. n literatura economic
se gsesc i alte modele liniare de regresie, n analizele la
nivel microeconomic sau macroeconomic.
1
Dornbusch, R., Fischer, S., Macroeconomics, 2005
56
Capitolul 3 Regresia liniar simpl
n tabelul urmtor sunt prezentate valorile PIB
real/locuitor i ale salariului mediu real din perioada 1992-
2005, nregistrate n cazul Romniei. Cei doi indicatori sunt
exprimai n preurile anului 1985.
Anul PIB real/locuitor
(X), mii RON
Salariul real/locuitor
(Y), RON
1992 35,892 2819
1993 36,517 2841
1994 36,617 2858
1995 36,325 2877
1996 34,093 3018
1997 32,093 2933
1998 27,952 2193
1999 25,924 1973
2000 26,349 1787
2001 27,406 1777
2002 29,420 1955
2003 30,672 2045
2004 28,635 1629
2005 26,588 1897
57
Elemente de econometrie
1500
2000
2500
3000
3500
25 27 29 31 33 35 37 39
PIB/locuitor
Figura 3.1. Corelaii dintre PIB/locuitor i salariul mediu
real
Graficul prezentat evideniaz o dependen liniar
ntre cele dou variabile. Salariul mediu pe economie este
direct corelat cu performanele economiei, msurate prin
nivelul PIB/locuitor. Dependena dintre cele dou variabile
este stochastic. Vom scrie modelul liniar de regresie.
Considerarea variabilei reziduale n cadrul acestui model este
inevitabil, deoarece nivelul salariului mediu din economie
este o mrime determinat n mod cert de performanele
generale ale economiei, precum i de ali factori, care sunt
cuantificai prin termenul rezidual. Ali factori care
influeneaz salariul mediu pot fi: nivelul de instruire, vrsta
persoanei, regiunea, profesia, domeniul etc.
58
Capitolul 3 Regresia liniar simpl
3.2. Modele liniare de regresie
rezultate din transform ri de modele
neliniare
Exist diverse modele unifactoriale neliniare, care
sunt liniarizate prin transformri ce sunt aplicate variabilelor
modelului de regresie. Astfel de modele neliniare
transformate n modele liniare sunt:
-
b
i i
x a y se transform ntr-un model liniar prin
logaritmarea celor doi termeni ai egalitii de mai sus:
i i
x b a y log log log + (3.5)
Rezult un model liniar n raport cu variabilele
i
y log
i
i
x log
.
- Modelul exponenial sau modelul log definit prin
relaia:
y
i
= a * b
x
(3.6)
se liniarizeaz prin logaritmare, rezultnd modelul
liniar:
b x a y
i i
log log log + (3.7)
Utilizarea modelului se recomand cnd punctele
n i i i
y x
, 1
) log , (

sunt n jurul unei drepte.
O serie de modele neliniare nu pot fi scrise sub forma
unor modele liniare prin aplicarea unor transformri
elementare.
n alte cazuri, pentru estimarea parametrilor se
folosesc alte tehnici de estimare. Neputnd fi liniarizat prin
transformri elementare, estimarea parametrilor se face prin
metode numerice.
59
Elemente de econometrie
3.3. Prezentarea modelului liniar de
regresie
Estimarea modelului liniar de regresie, se face pe baza
seriilor de date pentru cele dou caracteristici. Acestea sunt
reprezentate prin vectorii:
1
1
1
1
1
1
1
1
]
1

n
x
x
x
x
.
.
.
2
1
pentru caracteristica explicativ (factorial).
1
1
1
1
1
1
1
1
]
1

n
y
y
y
y
.
.
.
2
1
pentru caracteristica explicat (rezultativ).
Un model liniar de regresie presupune cunoaterea:
- metodelor folosite pentru estimarea celor doi
parametri;
- metodelor utilizate pentru testarea
proprietilor estimatorilor modelului de
regresie;
- principalelor aspecte privind folosirea
modelului de regresie n efectuarea de
previziuni.
n definirea regresie liniare sunt considerate o
serie de ipoteze. Lund n considerare relaia y
i
= a * b
x
i
se
60
Capitolul 3 Regresia liniar simpl
observ c valoarea estimat a variabilei rezultative,
estimatorilor parametrilor modelului i proprietile acestora
depind de caracteristicile variabilei independente i
proprietile variabilei reziduale. Cele patru ipoteze se refer
la variabilele ce definesc modelul de regresie, precum i la
variabila rezidual.
a) Seriile de date nu sunt afectate de erori de
nregistrare
Ipoteza postuleaz caracteristicile seriilor de valori ce
sunt folosite pentru estimarea parametrilor. Plecm de la
faptul c estimarea parametrilor se realizeaz pe baza unui
eantion de valori
n i i i
y x
, 1
) , (

, ce reprezint valori pentru cele
dou variabile. Stabilirea funciei analitice folosite pentru
analiza dependenei dintre cele dou variabile are la baz un
numr mare de observaii statistice, astfel nct estimarea
parametrilor se fundamenteaz pe legea numerelor mari.
Considerm c valorile pentru cele dou variabile nu sunt
afectate de erori semnificative de msur care s
distorsioneze calitatea estimatorilor parametrilor.
n cazul modelului clasic de regresie se consider c
valorile caracteristicii factoriale sunt deterministe (valori
fixate). Valorile caracteristicii rezultative sunt stocastice.
Aceast proprietate este important n definirea i
stabilirea proprietilor modelului liniar de regresie. Vom
spune c valorile caracteristicii factoriale sunt nestocastice
dac fiecrei valori a acestei caracteristici i corespunde o
familie de valori ale caracteristicii rezultative. Se calculeaz,
pentru fiecare valoare x
i
a caracteristicii factoriale, o medie a
familiei caracteristicii rezultative i se determin seria de
valori
[ ] n i x X Y E
i
, 1 ,
.
61
Elemente de econometrie
Pentru fiecare valoare fixat a caracteristicii
factoriale, variabila rezidual este de medie zero, respectiv:
[ ] 0
i i
x X E
, pentru orice i (3.8)
Pe baza acestei afirmaii rezult c ceilali factori
nenregistrai, cu excepia caracteristicii factoriale, nu au o
influen sistematic asupra mediei caracteristicii rezultative.
Dac ipoteza este satisfcut de modelul liniar de regresie,
putem scrie:
[ ]
i i
ax b x X Y E +
(3.9)
b) Ipoteza de homoscedasticitate - dispersia
reziduului este constant
Aceast proprietate arat c distribuiile condiionale
(y
i
/x=x
i
) au aceeai dispersie, reprezentat prin egalitatea
urmtoare:
[ ]
2
var


i i
x X
, este constant pentru orice i.
(3.10)
Dac variabilele reziduale nu satisfac aceast
proprietate, vom spune c modelul de regresie este
heteroscedastic i variabilele reziduale au variane diferite:
[ ]
2
var
i i i
x X
. (3.11)
c) Lipsa corelrii reziduurilor
Aceast proprietate exprim faptul c ntre termenii
reziduali nu se manifest fenomenul de covarian. Aceast
proprietate poate fi scris sub forma:
0 ) , cov(
j i

, pentru orice
j i
.
(3.12)
Dac variabila rezidual ndeplinete ipotezele b i
c, rezult relaia:
62
Capitolul 3 Regresia liniar simpl

'

j i
j i
j i
,
, 0
) , cov(
2


(3.13)
O situaie diferit este atunci cnd
variabila rezidual prezint o autocorelaie de ordinul
nti, adic:
t t t
u +
1
. (3.14)
unde u
t
este zgomot alb.
d) Necorelarea variabilei reziduale cu variabila
independent.
n cazul cnd aceast ipotez este ndeplinit, putem
scrie:
0 ) , cov(
j
X
, pentru orice j, ceea ce nseamn c o
cretere a valorilor variabilei factoriale nu duce automat la un
spor al valorilor variabilei reziduale.
Valorile reziduale sunt distribuite dup o repartiie
normal, de medie 0 i dispersie
2
x
. Pentru variabila
rezidual vom scrie atunci c ) , 0 (
2
N
i
.
Modelul liniar de regresie se prezint n graficul 3.2.:
63
Elemente de econometrie
i i
ax b y +
Figura 3.2. Modelul clasic liniar de regresie
Pe baza ipotezelor prezentate definim modelul liniar
de regresie printr-una din cele dou forme echivalente:
a)
i i i
x a b y + +
, i = 1,..,n
Ipotezele sunt formulate asupra variabilei reziduale:
( )
( )
( )

'

'

2
2
, 0
,
, 0
, cov
0

N
j i
j i
E
i
j i
i
; (3.15)
b)
i i i
x a b y + +
, i = 1,..,n
Ipotezele sunt formulate asupra variabilei rezultative:
p(
)
x
1
x
2
y
y
64
Capitolul 3 Regresia liniar simpl
( )
( )
( )

'

'

+
2
2
,
, 0
, cov

i i
i i i
x a b N y
j i
j i
yj yi
x a b x X y E
. (3.16)
Cnd ntre cele dou variabile exist o dependen
liniar, folosind serii de date (y
i
,x
i
),
n i , 1
, valorile variabilei
rezultative sunt estimate prin relaia:
i i
x a b y

+ . (3.17)
iar seria reziduurilor se estimeaz utiliznd formula:
)

(
i i i i i
x a b y y y e + . (3.18)
Apreciem c seria reziduurilor satisface egalitatea:

n
i
i
e
1
0
. (3.19)
3.4. Estimarea (determinarea)
parametrilor modelului liniar
3.4.1. Utilizarea metodei celor mai mici
p trate n estimarea parametrilor
Valorile caracteristicii rezultative sunt estimate
folosind relaia:
i i
x a b y

+ ,
(3.20)
unde a i
b

sunt estimatorii parametrilor dreptei de


regresie.
Valorile reale ale caracteristicii rezultative sunt egale
cu estimaia obinut cu ajutorul modelului de regresie,
corectat cu eroarea rezidual, adic:
65
Elemente de econometrie
i i i
e y y +
(3.21)
Estimarea parametrilor are la baz
condiia ca suma ptratelor diferenelor dintre
valoarea real i cea estimat prin modelul de
regresie s fie minim:
( )
( )

n
i
i
b a
n
i
i
b a b a
x a b i y
e b a
2

,
2


min
min

, min
.
(3.22)
Condiiile de optim ale funciei conduc la urmtoarele
ecuaii:
( )
( )
( )
( )
( )
( )

'

i
i i
i
i
x x a b i y
a
b a
x a b i y
b
b a
0

2

,
0

,
(3.23)
Ecuaiile sunt stabilite aplicnd metoda momentelor.
Cele dou ecuaii se obin dup cum urmeaz:
- prima ecuaie rezult din condiia
( ) 0
i
E
,
definind egalitatea:


i
i
e
n
0
1
sau


i
i
e 0
; (3.24)
- a doua ecuaie a sistemului de ecuaii se
stabilete plecnd de la ipoteza de necorelare a
seriilor valorilor variabilei factoriale cu cea a
66
Capitolul 3 Regresia liniar simpl
valorilor variabilei reziduale ( ( ) 0 , cov X ),
avnd egalitatea:


i
i i
e x
n
0
1
. (3.25)
n vederea determinrii celor doi estimatori se rezolv
sistemul liniar de ecuaii:

'


,
_

+
,
_


,
_

+


i
i
i
i
i
i
i
i
i
i
y x a b x
y x a b n

. (3.26)
Testarea dac soluia sistemului ndeplinete
condiiile de ordinul al doilea se face prin determinarea
derivatelor de ordinul al doilea ale funciei:



2 2
2 2

/ )

, (
/ )

, (
b a b a
a b a

,
_


2 2
2

/ )

, (

/ )

, (
b b a
b a b a

i
i
i
i
x
x
2
2
2

,
_

n
x
i
i
2
2
.
(3.27)
Matricea astfel definit are dou proprieti:
- este pozitiv definit;
- determinantul matricei este pozitiv:
0 ) ( 4 4 4
2
2
2
>
1
]
1


,
_



i
i
i i
i
x x n xi x n . (3.28)
Relaiile de calcul ale celor doi estimatori, a i
b

,
rezult din rezolvarea sistemul liniar de ecuaii.
Coeficientului pantei dreptei de regresie se obine din
relaia:
67
Elemente de econometrie
( ) ( )
( )

n
i
i
n
i
i i
n
i
i
n
i
i i
x x
y y x x
x n x
y x n y x
a
1
2
1
1
2 2
1

.
( )

n
i
i
i
x xi
x x
w
1
2 . (3.29)
Estimatorul pantei dreptei de regresie este o
combinaie liniar a valorilor caracteristicii rezultative:

n
i
i i
y w a
1

. (3.30)
Seria de valori
( )
n i i
w
, 1
are proprietile:
Proprietatea a:
( )
( ) 0
1
1 1
1
2

n
i
i
n
i
n
i
i
i
x x
x x
w
;
Proprietatea b:

( )
( ) 0
1
1
2
1
2
1
2
2

1
]
1

n
i
i
n
i
n
i
i
i
x x
x x
w
;
Proprietatea c:
( ) 1
1 1



n
i
i i
n
i
i i
x x w x w
.
(3.31)
Formula de calcul a estimatorului
termenului liber al dreptei de regresie se
determin prin rezolvarea sistemului de ecuaii
sau innd seama de faptul c dreapta de regresie
trece prin centrul norului de puncte, adic:
y x a b +

.
(3.32)
68
Capitolul 3 Regresia liniar simpl
Estimatorul parametrului b se obine din relaia:
x a y b

. (3.33)
Astfel, pentru estimarea parametrilor modelului de
regresie s lum situaia n care:
Salariul mediu real=f(PIB real/locuitor)
Calculm prin metoda celor mai mici ptrate
mrimile:
i
x
,
i
y
,
i i
y x

2
i
x
Sistemul liniar de ecuaii devine:

'

+
+
19 , 13706 1026595

482 , 434
32600 482 , 434

14
a b
a b
.
Prin rezolvarea sistemului de ecuaii obinem cei doi
estimatori:
8624 , 1277

b i 2580 , 115 a .
Funcia de regresie este acum definit:
i i
x y 258 , 115 8624 , 1277 +
.
Calculele intermediare i seriile de date estimate
folosite n sistemul de ecuaii sunt cuprinse n tabelul
urmtor:
Anii xi yi xiyi 2
i
x
i
y
i

1 35,892 2819 101164 1288,259 28514,0 -40,4710


2 36,517 2841 103737 1333,506 2931,0 -90,2578
3 36,617 2858 104639 1340,782 2942,5 -84,8109
4 36,325 2877 104494 1319,472 2908,8 -32,1626
5 34,093 3018 102894 1162,303 2651,6 366,5001
6 32,093 2933 94115 1029,944 2421,1 511,4994
7 27,952 2193 61290 781,3272 1943,9 248,8215
8 25,924 1973 51154 672,0616 1710,1 263,1102
9 26,349 1787 47087 694,2738 1759,1 27,9592
10 27,406 1777 48690 751,0730 1880,9 -104,2439
11 29,420 1955 57524 865,5274 2113,0 -157,7342
12 30,672 2045 62715 940,7704 2257,3 -212,6428
69
Elemente de econometrie
Anii xi yi xiyi 2
i
x
i
y
i

13 28,635 1629 46652 819,9827 2022,6 -393,3979


14 26,588 1897 50441 706,9039 2199,3 -302,1692
TOTAL 434,482 32600 1036595 13706,1900 32600,2 0,0000
Utilizarea metodei celor mai mici ptrate are i unele
inconveniente, dintre care amintim:
- nu ofer rezultate acceptabile dac nu sunt
satisfcute ipotezele formulate;
- notnd prin
n n
b a

, estimatorii determinai pe
baza seriei (x
i
, y
i
), n i , 1 iar prin
1 1

,
+ + n n
b a pe
cei evaluai pentru seria de valori (x
i
, y
i
),
1 , 1 + n i , rezult c ntre cele dou perechi
de estimatori nu exist o relaie simpl de
recuren;
- estimatorii sunt distorsionai dac seriile de
date prezint schimbri majore, sub forma
rupturilor de nivel.
3.4.2. Utilizarea metodei verosimilit ii
maxime n estimarea parametrilor
Aplicarea metodei celor mai mici ptrate a luat n
considerare o serie de ipoteze asupra variabilei reziduale
i

,
care nu s-au referit la forma repartiiei variabile aleatorii
i

.
Metoda verosimilitii maxime are la baz tocmai
specificarea funciei de repartiie reziduale.
Considerm c variabila rezidual are proprietatea:
( ) ( )
2
2
2
2
1
, 0



i
e f N
i i

. (3.34)
70
Capitolul 3 Regresia liniar simpl
i de aici rezult ( )

~
,
~
,
~
i
x a b N yi . Modelul de
regresie devine specificat cnd sunt determinai parametrii
b a
~
,
~
i

,
~
.
Avem, aadar, relaia:
2
2
2
)
~
~
(
2
1
) / (

i
x a b yi
e x y f
i i

. (3.35)
Pentru modelul liniar de regresie, funcia de
verosimilitate este dat de relaia:
( )

n
i
i i
x y f b a
1
2
) / (
~
,
~
,
~


. (3.36)
Utiliznd formula densitii de repartiie, funcia de
verosimilitate se poate scrie sub forma:
( )
2
2
2
)
~
~
(
2
1
~
,
~
,
~
1
2

n
i
i
x a b yi
e b a
(3.37)
Relaiile de calcul pentru estimatorii parametrilor
modelului de regresie, i pentru cel al dispersiei variabilei
reziduale rezult din condiia:
( )
2 ~
,
~
,
~
2 ~
,
~
,
~
max

b a
b a

(3.38)
Scriem cele trei condiii de maximum al funciei de
verosimilitate:
0 , 0 , 0
2

l
b
l
a
l
. (3.39)
71
Elemente de econometrie
Mai simplu, determinarea formei estimatorilor se face
utiliznd condiiile de maximum pentru logaritmul funciei de
verosimilitate, adic:
( ) ( ) [ ]


n
i
i i
ax b y
n
b a l b a L
1
2
2
2 2 2
) (
2
1
ln ) 2 ln(
2
, , ln , ,


.
(3.40)
Pe baza proprietii funciei logaritm, obinem:
( ) ( )
2 2 ~
,
~
,
~
2 ~
,
~
,
~
max
~
,
~
,
~
2 ~
,
~
,
~
max

b a L
b a
b a
b a

. (3.41)
Constatm c i prin metoda verosimilitii maxime
acelai set de estimatori pentru parametrii modelului ca n
cazul aplicrii metodei celor mai mici ptrate.
n cazul utilizrii metodei verosimilitii maxime se
obine direct i estimatorul dispersiei variabilei reziduale.
Expresia acestui estimator rezult din condiia
( )
0
~
~
log
2
2


.
Dup efectuarea calculelor se obine ecuaia pentru
determinarea formulei limitei estimatorului varianei
variabilei reziduale, respectiv:
( )
0 )
~
~
(
~
1
2
1
~
1
2
~
~
log
1
2
4 2 2
2

n
i
i i
x a b y
n



. (3.42)
innd seama de formula de calcul a erorilor de
ajustare, dispersia variabilei reziduale se calculeaz pe baza
formulei:

i
i
e
n
2
1
~
. (3.43)
72
Capitolul 3 Regresia liniar simpl
3.5. Propriet ile dreptei de regresie
Relaii ntre parametrii dreptelor
reciproce
Considerm dreapta de regresie definit pe baza
relaiei:
d
1
: y
i
= b + ax
i
Definim dreapta de regresie reciproc d
2
utiliznd
relaia:
x
i
= b + ay
i
.
Determinarea formulei estimatorului coeficientului
pantei dreptei de regresie se face pe baza relaiei:
) var(
) , cov(
x
y x
a
(3.44)
Egalitatea rezult din relaia de calcul a estimatorului
dac se mpart numrtorul i numitorul la volumul
eantionului. Pe baza relaiei de mai sus, rezult c
estimatorul i covariana calculat pentru cele dou variabile
au acelai semn, stabilind c.
- ntre parametrii pantelor de regresie exist relaia:
) var(
) var(
' x
y
a
a

. (3.45)
- Cele dou drepte, n acelai plan, se intersecteaz n
centrul de greutate al norului de puncte, deci cele dou drepte
trec prin punctul ( ) y x G , .
Afirmaia se poate demonstra dac vom ine seama de
faptul c pentru fiecare model de regresie sunt valabile
egalitile:
- pentru modelul de regresie definit de d
1

:


n
i
i i
ax b y
1
0 ) (
;
73
Elemente de econometrie
- pentru al doilea model de regresie, definit prin
d
1

:


n
i
i i
y a b x
1
0 ) ' ' (
.
Dac mprim la n termenii celor dou egaliti, care
trece prin punctul ( ) y x G , , obinem sistemul:

'

+
+
) ( ' '
) (
2
1
d x b y a
d y b x a
(3.46)
Valoarea (mrimea) unghiului format de cele dou
drepte arat intensitatea legturii dintre cele dou variabile.
Cum dreptele coincid n cazul legturii reciproce dintre cele
dou variabile, rezult c, cu ct mrimea unghiului dintre
acestea este mai mic, cu att legtura liniar reciproc dintre
cele dou caracteristici este mai puternic.
Figura 3.3. Unghiul format din dreptele d
1
i d
2

y
x
d
2
d
1

x
74
Capitolul 3 Regresia liniar simpl
Obinem apoi formulele de calcul pentru termenii
liberi ai celor dou drepte dac se cunosc cei doi coeficieni
ai pantelor de regresie:
x a y b
i
y a x b ' '
.
n final, din ecuaiile celor dou drepte i din relaiile
de mai sus obinem formele pentru cele dou drepte de
regresie:
) (
) var(
) , cov(
x x
x
y x
y y
i i
+
,
) (
) var(
) , cov(
y y
y
y x
x x
i i
+
. (3.47)
Din ecuaia dreptei d
2
, x = b + ay, determinm
ecuaia
'
'
'
1
a
b
x
a
y , care definete dreapta care se reprezint
n acelai plan cu dreapta d
1
.
Unghiul format prin intersecia dreptelor reprezentate
n acelai plan are tangenta calculat pe baza relaiei:
a a
aa
a
a
a
a
tg
+

'
' 1
'
1
1
'
1

(3.48)
- Semnul coeficienilor pantelor din modelul de
regresie i modelul reciproc de regresie coincid.
Semnul parametrului pantei de regresie exprim
sensul dependenei dintre cele dou variabile. n raport cu
semnul estimatorului parametrului a, distingem:
- dac a >0, dependena ntre cele dou
variabile este direct;
- dac estimaia parametrului a este egal cu
zero, ntre cele dou variabile nu exist o
dependen liniar;
75
Elemente de econometrie
- dac coeficientul pantei de regresie este a <0,
atunci ntre cele dou variabile se manifest o
dependen liniar invers.
Semnul coeficientului pantei dreptei de regresie
coincide cu cel al semnului varianei calculate pentru cele
dou variabile.
- Estimatorul coeficientului pantei dreptei de regresie
determinat prin aplicare metodei celor mai mici ptrate este
un estimator nedeplasat i de dispersie minim. Deci, pentru
estimatorul a sunt valabile egalitile:
a a E ) (
( )

n
i
i
x x
a
1
2
2
) var(

. (3.49)
Pentru a demonstra cele dou relaii, lund n
considerare relaia de calcul a estimatorului, se observ c
acesta este o combinaie liniar a seriei de valori y
1
, y
2
, ,
y
1n
. Vom folosi cele trei proprieti ale seriei de valori
n i
i
w
, 1
) (


Vom scrie relaia echivalent a estimatorului:
(3.50)
Evidenierea ipotezei c estimatorul obinut n urma
aplicrii metodei celor mai mici ptrate este nedeplasat, se
aplic operatorul de medie termenilor egalitii. Dac
0 ) (
i
E
, pentru orice i, se obin progresiv egalitile:
a E w a w E a E a E
i
i
i i
i
i
+ +

) ( ) ( ) ( ) (
(3.51)
Evidenierea celei de-a doua egaliti din cadrul
proprietii b se realizeaz prin calculul dispersiei
estimatorului considernd relaia:
76
Capitolul 3 Regresia liniar simpl
( )
j i
j i
j i
j i
i
i i
j i
j i
j i
j i i
i
i
i
i i
i
i
E w w E w
w w w E w E w a a E a



+
+
,
2 2
,
2 2 2 2
) (
) ( ) (( ) var( ) ( ) var(
(3.52)
Pe baza ipotezei d (variabilele reziduale nu sunt
corelate), i a ipotezei homoscedasticitii variabilelor
reziduale, rezult:


i
i i
i
i
i
x x
w w a
) (
) var(
2
2 2 2 2


(3.53)
Din ultima relaie, rezult c disperia estimatorului
este cu att mai mic cu ct dispersia caracteristici factoriale
este mai mare.
Teorema Gauss-Markov se poate demonstra
considernd estimatorul
*
a definit ca o combinaie liniar a
seriei de valori nregistrate pentru caracteristica rezultativ.
Rezult egalitatea:

i i
y a a
*

. Este evident c ponderile


combinaiei liniare din ultima relaie coincid cu cele ale seriei
n i
i
w
, 1
) (

. Deoarece
i i i
ax b y + +
, pentru toi indicii i,
rezult:

+ +
i
i i
i
i i i
a x a a b a
*

(3.54)
Dar a doua restricie a estimatorului
*
a se refer la
faptul c este nedeplasat, rezult dou proprieti ce sunt
satisfcute de sistemul de ponderi
n i
i
a
, 1
) (

, respectiv:
-


i
i
a 0
-


i
i i
x a 0
.
77
Elemente de econometrie
Pe baza acestor egaliti, rezult c estimatorul se
obine prin urmtoarea relaie:

+
i
i i
a a a
*

. (3.55)
Din relaia (3.55) se obine dispersia noului estimator:

i
i
a a
2 2
*
) var(

(3.56)
Comparm dispersiile celor doi estimatori nedeplasai
ce sunt exprimai ca funcii liniare ale valorilor variabilei
rezultative. Observm c ntre seriile de ponderi ale celor doi
estimatori sunt verificate relaiile a
i
= w
i
+ d
i
pentru orice i.
nlocuind apoi a
i
n ultima relaie, obinem:
) 2 ( ) var(
2 2 2
*
+ +
i
i i
i
i
i
i
d w d w a

. (3.57)
Demonstrm c a treia sum din ultima relaie este
nul, innd seama de proprietile sistemului de ponderi ale
primului estimator i de restriciile impuse sistemului de
ponderi pentru cel de-al doilea estimator. Se obine rezultatul
urmtor:
0
) (
1
) (
) (
2 2


i
i
i
i
i
i i
i
i i i
i
i i
x x x x
a x
w a w d w
.
(3.58)
Din acest rezultat deriv inegalitatea ntre varianele
celor doi estimatori:
) var( ) ( ) var(
*
2 2 2 2
*
a w a w a
i
i i
i
i
+


(3.59)
- n cazul n care variabila rezidual urmeaz
repartiia normal, estimatorul urmeaz i el o repartiie
normal, de medie a i abatere standard
x
n

.
78
Capitolul 3 Regresia liniar simpl
Am notat prin
x

abaterea standard a variabilei


factoriale, iar

reprezint abaterea standard a variabilei


reziduale.
Cea mai bun estimaie a dreptei de regresie se obine
prin reducerea pe ct posibil a abaterii standard a
estimatorului pantei de regresie. Reducerea acestei mrimi
are la baz posibilitatea de a scrie indicatorul sub forma:
x
a
n


. (3.60)
Aadar, abaterea standard este direct proporional cu
dispersia observaiilor y
1
, y
2
, , y
1n
n jurul dreptei de
regresie i invers proporional cu numrul de observaii i
dispersia valorilor x
1
, x
2
, , x
1n
.
Cu ct valorile variabilei factoriale sunt mai
dispersate, cu att precizia estimrii este mai mare (gradul
de dispersare a seriei valorilor caracteristicii exogene este
msurat prin abaterea medie standard a seriei).
Estimatorul termenului liber al dreptei de regresie
obinut prin aplicarea metodei celor mai mici ptrate este
un estimator nedeplasat i de dispersie minim.
Se definesc urmtoarele dou relaii:
b b E )

( i

,
_

+
2
2 2
1 )

var(
x
x
n
b

. (3.61)
Norul de puncte determin posibilitatea de a scrie
egalitile:
79
Elemente de econometrie
( )

+ + + +
i
i
i
i i
i
i
n
x a a b x a ax b
n
x a y
n
x a y b
1
) (
1

(3.62)
Din relaia (3.62) rezult c abaterea dintre parametru
i estimator se exprim ca o combinaie liniar de variabile
reziduale:

,
_


i i i
i i i i i
i
i i
C
n
x w
n
w x b b
1 1

(3.63)
Ponderile combinaiei liniare sunt
n
x w C
i i
1
.
Pentru a demonstra proprietile estimatorului
termenului liber al modelului liniar de regresie considerm
proprietile seriei de valori
n i
i
C
, 1
) (

, respectiv:
-
1 1

i
i
i
i
w x C
;
-
n
C E
i
1
) ( ; (3.64)
-
n
n x
C
x
i
i
1
2
2
+

;
-
0 ) , cov(
i i
C
.
Demonstrm c estimatorul termenului liber al
modelului de regresie este nedeplasat, pornind de la faptul c
ipotezele b i f ale modelului liniar de regresie, se aplic
operatorul de medie, rezultnd c 0 )

( b b E , ce se poate
scrie sub forma:
b b E

) ( (3.65)
80
Capitolul 3 Regresia liniar simpl
Pentru calculul dispersiei vom ine seama de faptul c
estimatorul este nedeplasat i se obine relaia:
2 2
) ( )

( )

var(


i
i i
C E b b E b
(3.66)
Considernd ipotezele b i f ale modelului liniar
de regresie, rezult forma de prezentare a dispersiei acestui
estimator:

,
_

+
,
_


,
_


xx i
i
i
i i
S
x
n
C E C E b
2
2 2 2
2
1
)

var(


(3.67)
Acest estimator satisface teorema Gauss-Markov, ce
se poate demonstra ca i n cazul determinrii estimatorului
coeficientului pantei de regresie.
- Matricea de covarian a estimatorilor modelului
liniar de regresie a i
b

este reprezentat prin:


( )

,
_

,
_


xx xx
xx xx
b a
S
x
n S
x
S
x
S
b a b
b a a
2
2

,
1
1
)

var( ) ,

cov(
)

, cov( ) var(

.
(3.68)
Definirea matricei de covarian a estimatorilor are
n vedere relaiile:
) ,

cov( )

, cov( ),

var( )

cov( ), var( ) , cov( a b b a b b b a a a .


Formula de calcul a covarianei celor doi estimatori
ine seam de ipotezele modelului clasic de regresie,
rezultnd:
81
Elemente de econometrie
( )( ) [ ]
xx i
i
i
i i i
i i i i i i
S
x
w
n
w x
n
x w w
C w C w E b b a a E b a
2 2
2 2 2
2 2
1
)

)( ( )

, cov(

,
_





(3.69)
- Estimatorul a converge n probabilitate ctre
parametrul a. n mod similar, estimatorul termenului liber
al modelului clasic de regresie,
b

, tinde n probabilitate
ctre b. Afirmaiile sunt evidente dac avem n vedere c:
0 1 )

var(
0 ) var(
2
2 2
2
2

,
_

+



n
x
n
n
x
n
b
n
a

(3.70)
Covariana lui a i
y
, pentru x
i
fixat,
este nul:
( ) ( )


,
_

i
i i
i
i i
y y w y y w y a , cov , cov , cov
.
(3.71)
Dar

,
_

j
j i
j
j i i
n
y y
n
y
n
y y y
2
) , cov(
1 1
, cov ) , cov(

,
ntruct y
i
i y
j
sunt variabile independente, dac i j. vom
avea atunci, lund n considerare proprietile seriei de valori
n i
i
w
, 1
) (

, urmtoarele egaliti:
( ) 0 , cov
2 2


i
i
y
i
y
i
w
n n
w y a

. (3.72)
82
Capitolul 3 Regresia liniar simpl
3.6. Coeficientul liniar de corela ie
Vom examina, prin intermediul coeficientului liniar
de corelaie, dac ntre variabilele modelului de regresie
exist o dependen liniar semnificativ. Considerm c
avem un eantion de forma
n i
i i
y x
, 1
) , (

. Prin coeficientul
liniar de corelaie vom pune n eviden prezena sau absena
legturii liniare dintre cele dou variabile ale modelului de
regresie, sensul legturii, precum i intensitatea acesteia.
Pentru a studia caracteristicile
dependenei liniare dintre dou se utilizeaz
covariana. Aceast msur se utilizeaz mai rar
deoarece prezint dou neajunsuri majore:
- covariana nu este un indicator normalizat.
Nencadrndu-se ntr-un anumit interval de
valori, indicatorul nu va furniza informaii
exacte pentru caracterizarea intensitii
dependenei;
- depinde de unitile de msur ale celor dou
variabile i satisface relaia:
x y y x
y x ) , cov(
. (3.73)
De aceea, un indicator care s nlture cele dou
inconveniente trebuie s plece de la domeniul de valori al
covarianei:
x y y x
y x ) , cov(
. (3.74)
Dac mprim termenii inegalitii prin
x y

,
rezult:
1
) , cov(
1
x y
y x

. (3.75)
Am obinut astfel un nou indicator ce depinde de
unitile de msur ale celor dou variabile, fiind i o msur
83
Elemente de econometrie
statistic normalizat denumit coeficient liniar de corelaie,
introdus n statistic de K. Pearson. Indicatorul se calculeaz
prin relaia:
y x
i
i i
n
y y x x
r

) )( (
(3.76)
Coeficientul liniar de corelaie este eficient pentru
msurarea intensitii dependenei dintre variabile numai
dac este de tip liniar.
n continuare vor fi prezentate proprietile
coeficientului liniar de corelaie, stabilind relaiile de calcul
pentru estimatorii parametrilor modelului liniar de regresie n
funcie de valoarea acestuia. Rezumativ putem evidenia:
a) coeficientul liniar de corelaie este o msur
simetric, verificndu-se egalitatea r(x,y) = r(y,x).
b) este invariant la transformarea datelor i
schimbarea originii i unitii seriilor de date.
Dac dispunem de seriile de date
n i
i i
y x
, 1
) , (

i
n i
i i
v u
, 1
) , (

, ce satisfac relaiile u
i
= b + ax
i
i v
i
= c + dy
i
, cu
*
,
+
R d a , atunci coeficienii liniari de corelaie calculai
pentru cele dou serii sunt egali.
Considernd i proprietile covarianei i ale
dispersiei, rezult:
) , (
) , cov( ) , cov(
y x r
d a
y x ad v u
r
v x v u


. (3.77)
Analiza modelului de regresie se poate face i prin
utilizarea transformrilor
x
i
i
x x
u

i
y
i
i
y y
v

.
c) Estimatorul coeficientului pantei dreptei de regresie
se calculeaz pe baza relaiei:
84
Capitolul 3 Regresia liniar simpl
x
y
r a


(3.78)
Pentru dreapta reciproc
i i
y a b x ' '

+ , vom utiliza relaia:


y
x
r a

'
. (3.79)
Constatm c a i r au acelai semn putnd distinge
trei cazuri:
- dac r > 0, atunci a > 0, dependena dintre
cele dou variabile este direct;
- cnd r = 0 i a = 0, i nu avem dependene
liniare ntre variabile (modelul de regresie
coincide cu o dreapt paralel cu axa ox);
- cnd r > 0, estimatorul pantei dreptei de
regresie va avea o valoare negativ;
dependena fiind invers.
d) Dac variabilele modelului liniar de regresie sunt
liniar independente, atunci valoarea coeficientului liniar de
corelaie este zero.
Reciproca nu este ntotdeauna adevrat, deoarece
valoarea nul a coeficientului liniar de corelaie calculat
pentru variabilele modelului nu implic n mod automat i
independena variabilelor.
Prima parte a afirmaieise deduce din egalitatea:
2
' r r r a a
y
x
x
y

,
_

,
_

. (3.80)
Variabilele sunt independente dac dreptele de
regresie reciproce sunt perpendiculare. Va rezulta c cei doi
coeficieni satisfac egalitatea ' a a = 0. Deci, n cazul n care
variabilele sunt liniar independente, r = 0.
85
Elemente de econometrie
e) Coeficientul liniar de corelaie nu este msur
tranzitiv.
Astfel, dac x este o variabil y, iar la rndul su y este
corelat cu z, nu implic n mod obligatoriu c ntre x i z
exist o dependen linear.
f) Pentru dou variabile se verific relaia r
2
= 1
dac i variabilele X i Y sunt corelate funcional.
Prima parte a afirmaiei se demonstreaz innd seama
de relaia
2
' r r r a a
y
x
x
y

,
_

,
_

, cnd vom obine


egalitatea 1 ' a a . Din aceast egalitate rezult c cele dou
drepte reciproce sunt paralele, fiind corelate funcional.
Reciproca acestei afirmaii se demonstreaz dac considerm
c cele dou variabile sunt independente. Dreptele de regresie
reciproce sunt paralele i satisfac relaia r
2
= 1.
Cu ct r
2
este mai mare, cu att intensitatea
dependenei liniare dintre cele dou variabile este mai
puternic. Valoarea coeficientului liniar de corelaie este
invers proporional cu unghiul dintre cele dou drepte
reciproce de regresie.
g) Cnd variabilele X i Y sunt liniar
independente, atunci coeficientul liniar de
corelaie i raportul de determinare satisfac
egalitatea:
( )
( )
2 2
2
2
2

r
S
S
a
y y
y y
R
yy
xx
i
i
i
i

.
(3.81)
Valoarea coeficientului liniar de corelaie se
interpreteaz pe baza relaiei:
86
Capitolul 3 Regresia liniar simpl
n S
n S
SPT
SPR
SPT
SPE
r
yy
/
/
1 1
2

. (3.82)
unde am notat
( )


i
i
y y SPE
2

, cuantific acea parte a


dispersiei seriei explicate prin intermediul variabilei de
regresie;
( )


i
i
i y y SPR
2

reprezint acea parte a


dispersiei explicat prin aciunea altor factori dect a
variabilei factoriale X;
( )


i
i
y y SPR
2
msoar aciunea
tuturor factorilor ce determin variaia seriei pentru variabila
Y.
Proprietatea nu este reciproc. Dac dependena dintre
dou variabile este liniar i dac pentru msurarea
intensitii dependenei se calculeaz ambii indicatori, atunci
acetia verific relaia de ordine:
1 0
2 2
R r
Dac seria de date se prezint sub forma unui tabel cu
dub intrare,
n ij
ij j i
n y x
, 1
) , , (

, coeficientul de corelaie se
calculeaz din relaia:
y x
j i
ij i i
n
n y y x x
r

,
) )( (
(3.83)
Avnd seria de valori
n i
i i
y x
, 1
) , (

,
realizrile unui cuplu de variabile (X,Y) distribuite
normal, atunci r reprezint pentru fiecare serie de
valori, realizrile variabilei aleatorii .
n cazul n care cele dou variabile sunt liniar independente,
= 0, iar relaia:
87
Elemente de econometrie
2
2
2
1


n
t n t
. (3.84)
unde t
n-2
este distribuia Student cu n-2 grade de libertate.
Pentru interpretarea valorilor coeficientului liniar de
corelaie obinut pentru o serie de valori avem n vedere:
- utilizarea indicatorului pentru msurarea intensitii
dependenei dintre cele dou variabile se va baza pe
dimensiunea eantionului care trebuie s fie suficient de
mare. Dac variabilele modelului sunt independente,
pentru un volum al eantionului mai mare ca 100,
variabila este distribuit normal:

,
_


1
1
, 0
n
N
(3.85)
- pentru a fi o msur semnificativ a intensitii
dependenei, indicatorul se calculeaz numai dac
punctele
n i
i i
y x
, 1
) , (

sunt dispuse de-a lungul unei drepte.
- coeficientul liniar de corelaie este calculat pentru un
eantion de valori, iar semnificaia acestuia va fi apreciat
numai n context probabilistic. Limitele extreme ale
intervalului de valori sunt determinate de: volumul
eantionului i probabilitatea de garantare a rezultatelor.
Apar urmtoarele dou situaii:
Dac pragul de semnificaie este
% 5 , i avem patru dimensiuni ale eantionului,
putem aprecia astfel:
Cnd seria de date este de volum redus (n = 20),
coeficientul liniar de corelaie difer semnificativ de zero
dac
46 , 0 > r
; dac volumul eantionului crete la 40,
rezult c
32 , 0 > r
; cnd n = 50, valoarea limit se
88
Capitolul 3 Regresia liniar simpl
micoreaz, rezultnd
28 , 0 > r
; dac n = 100, avem condiia
20 , 0 > r
.
Dac vom micora probabilitatea de garantare a
rezultatelor, la nivelul % 10 , pentru aceast valoare a
pragului de semnificaie analiza pe cele patru dimensiuni ale
eantionului conduce la: pentru eantioanele de volum redus,
n = 20, este satisfcut condiia
39 , 0 > r
; cnd n = 40,
27 , 0 > r
; dac n = 50,
24 , 0 > r
; dac volumul n = 100,
valoarea se reduce, satisfcnd relaia
17 , 0 > r
.
n concluzie, putem aprecia c pe msur ce volumul
eantionului crete, pentru un prag de semnificaie stabilit,
valoarea critic a coeficientului liniar de corelaie scade i
valoarea critic a indicatorului, n cazul n care volumul
eantionului este stabilit, crete pe msur ce pragul de
semnificaie scade.
n cazul n care = 0, repartiia variabilei este
dificil de stabilit. n acest caz, pe msur ce valoarea lui se
ndeprteaz de zero, dispersia variabilei scade, iar repartiia
se ndeprteaz tot mai mult de o repartiie simetric.
n acest caz, caracteristicile variabilei sunt:

,
_



n
R E
2
1
1 ) (
2

i
( )
1
1
) var(
2
2

n
R

(3.86)
n cazul n care seria de date este suficient de mare (n
> 25),

,
_

3
1
;
1
1
lg
2
1
1
1
lg
2
1
n
N Z

. (3.87)
89
Elemente de econometrie
Folosind coeficientul liniar de corelaie, vom spune c
variabilele modelului de regresie sunt liniar independente,
dac
2
2
1

n p
t n
r
r
t .
Se calculeaz mrimea:
2
1
2

n
r
r
t
p (3.88)
Pentru testul bilateral se respinge ipoteza nul dac
este ndeplinit egalitatea
2 /
t t
r
>
. n cazul testului
unilateral > 0 se respinge ipoteza nul dac

t t
r
>
, iar
pentru < 0 se accept H
1
, dac

t t
r
<
. Valoarea

t
se
va citi din tabelul repartiiei Student n condiiile stabilirii
pragului de semnificaie i pentru n-2 grade de libertate.
3.7. Analiza i interpretarea variabilei
reziduale
n modelul liniar de regresie,
i

reprezint variabila
rezidual, iar e
i
sau
i

msoar ecartul dintre valoarea real


y
i
i valoarea ajustat prin modelul de regresie. Definim
i i i
y y e
.
Pentru a stabili o estimaie pentru cei doi parametri ai
dreptei de regresie vom determina o estimaie pentru
dispersia variabilei reziduale, cu urmtoarele proprieti:
- Pentru seria ecarturilor, suma termenilor acesteia
este egal cu zero. Vom scrie n acest caz urmtoarea
egalitate:


i
i
0
.
90
Capitolul 3 Regresia liniar simpl
Vom ine seama de formula de calcul a ecartului, de
formula estimatorului termenului liber i de faptul c suma
ecarturilor termenilor unei serii n raport cu media este zero,
rezultnd:
( ) ( ) ( ) 0



i
i
i
i
i
i i
i
i
x x a y y x a b y
(3.89)
Proprietatea nu este valabil pentru seria variabilelor
reziduale, ci numai n cazul n care este ndeplinit ipoteza
0 ) (
i
E
pentru toi indicii i.
Vom exprima ecartul unei valori fa de valoarea
ajustat n funcie de variabila rezidual, rezultnd egalitile:
i i i i i
x a a b b y y e + ) ( )

( (3.90)
Considernd relaiile x a y b

,
x a y b
i


i
i i
w a a
, obinem:


i
i i i i i
w x x e ) (
. (3.91)
- Dispersia variabilei reziduale pentru modelul clasic
de regresie (parametrii sunt estimai prin metoda celor mai
mici ptrate) este estimat prin relaia:

i
i
e
n
2 2
2
1

. (3.92)
Vom lua n consideraie ipotezele ce stau la baza
modelului clasic de regresie:
0 ) (
i
E
,
2
) var(


i
,
j i
j i
, 0 ) , cov(
i
0 ) , cov(
i
X
pentru toi indicii i.
Calculnd e
i
2
i aplicnd operatorul de medie, rezult pentru
fiecare indice i egalitatea:
91
Elemente de econometrie
( )
1
]
1

+ +

k
k k i i
k
k i i
w x x E w x x
n
e E

) ( 2 ) ( ) (
2 2 2
2
2 2
( )
( )
1
]
1

+ +

i i
k
k i i i
k
k
i
w x x w x x
n
w x x
x x
x x
n
) ( ) (
1
2
1
) (
2
2
2 2
2
2

.
(3.93)
Utiliznd operatorul de nsumare, innd seama de
proprietile seriei
n i
i
w
, 1
) (

, obinem:
2
) 2 ( ) (

n e E
i
i
. (3.94)
Determinm estimatorul variaiei reziduale, ce se
compar cu estimatorul
n
e
a
i
i

2
2

, estimator nedeplasat.
- Pentru modelul liniar de regresie, mrimea
dispersiei seriei ecarturilor
n i
i
e
, 1
) (

este cu att mai mare cu
ct seria valorilor caracteristicii rezultative este mai mare,
dar mai mic dac dependena dintre cele dou
caracteristici este mai puternic.
ntre dispersia seriei ecarturilor, a valorilor
caracteristicii endogene i coeficientul liniar de corelaie se
verific egalitatea:
2 2 2
) 1 (
y e
r
. (3.95)
Vom demonstra ultima relaie innd seam de faptul
c, n cazul n care ntre cele dou variabile dependena este
liniar,
SPT
SPE
r
2
, unde SPT = SPR + SPE. Deoarece
SPT
SPR
r
2
1 i din formula de calcul a dispersiei variabilei
reziduale obinem:
92
Capitolul 3 Regresia liniar simpl
( )
2 2 2
1


n
SPT
SPT
SPR
r
y
(3.96)
S-a calculat dispersia ecarturilor prin formula:

i
i
e
n
2 2
1

. (3.97)
- Din ipoteza de normalitate a reziduului, rezult:
( )
2
2
2
2
2


n
x n

(3.98)
Se poate determina un interval de ncredere pentru
dispersia variabilei reziduale dac se fixeaz un prag de
semnificaie

, intervalul de ncredere fiind:


( ) ( )
2
1
2
2
2
2
2

< < n n
. (3.99)
2
1
i
2
2
sunt valori furnizate de repartiia
2

pentru n-2 grade


de libertate i un prag de semnificaie

stabilit.
Prin reprezentarea grafic a punctelor de coordonate
n i
i i
e y
, 1
) , (

, putem verifica empiric dac este ndeplinit
ipoteza de homoscedasticitate. Prin reprezentarea grafic a
seriei de date apar dou cazuri: dac punctele definesc un nor
de puncte, atunci nu este satisfcut ipoteza de
homoscedasticitate; iar cnd punctele sunt dispuse sub forma
unei benzi orizontale, ipoteza este valabil pentru seria de
date
n i
i i
y x
, 1
) , (

.
93
Capitolul 4
Estimatori si metode
de estimare
n precedentele capitole am subliniat faptul c
parametrii populaiei erau necunoscui. Am vzut c pot fi
estimai cu dou modaliti: estimatorul punctual i intervalul
de ncredere. Exist multe situaii n care precizarea unui
anumit interval pentru un parametru necunoscut nu este
suficient i se impune calculul unor estimri punctuale.
Atunci cnd selectm un estimator punctual, considerm c
estimarea obinut este, ntr-un anumit sens, o estimare
bun. Odat definit ceea ce nelegem printr-un estimator
bun, apare o problem legat de cum ar trebui s
identificm astfel de estimatori
n vederea considerrii unor proprieti ale
estimatorilor, vom considera mai multe valori pentru o
variabil aleatorie, X. Valorile X sunt definite prin distribuii
probabilistice. S presupunem c respectiva populaie deine,
printre caracteristicile sale, i parametrul . poate fi, de
exemplu, media populaiei sau dispersia populaiei.
S presupunem c trebuie s fie estimat dintr-un
eantion aleatoriu de n observri asupra lui X , pe care l
reprezentm sub forma (X
1
, X
2
, X
3
......X
n
). Prin urmare, X
i
reprezint observarea i. Vom utiliza simbolul ca
estimator al lui adevrat. Un astfel de estimator se va reda
printr-o expresie sau formul care implic unele sau toate
valorile X
i
. Aceasta nseamn c va fi o funcie a observrilor,
respectiv:
Capitolul 4 Estimatori i metode de estimare
( )
n
X X X X .... , ,
3 2 1
^ ^

(4.1)
De exemplu, dac
^

ar fi media populaiei, atunci un


posibil estimator ar fi media eantionului, care este o funcie
a tuturor valorilor X
i
. Aceasta nseamn :
n
X X X X
X
n
+ + +

........
3 2 1
Atunci cnd ne referim la relaii de genul celei din
(4.1) cu titlul de estimatori, dei de fapt nu facem dect s
substituim valorile de eantion n astfel de formule, este
denumit estimator numrul unitar pe care l obinem astfel.
Este important de reinut faptul c toi estimatorii ca
cel dat de (4.1) vor avea distribuii de selecie. Dac sunt
extrase mai multe astfel de eantioane, obinem o distribuie
de valori pentru
^

, cu propia sa medie E(
^

) i dispersie E[
^

-E(
^

)].
4.1. Estimatori pentru eantioane mici
Proprietile estimatorilor se pot grupa, n
funcie de mrimea eantionului, n dou categorii:
estimatori pentru eantioane mici i estimatori
pentru eantioane mari, sau asimptotice.
4.1.1. Estimator nedeplasat
Prima proprietate de mic eantion pe care am dori s
o dein estimatorii este aceea de a fi eantion nedeplasat. Am
abordat acest aspect anterior n legtur cu media i variaia
populaiei.
95
Elemente de econometrie
n general, se spune c un estimator
^

este
un estimator nedeplasat al parametrului dac:
E(
^

) =
(4.2)
Figura 4.1. Estimatorul nedeplasat
Dac un estimator ca cel dat de (4.2) nu este adevrat
atunci este definit ca fiind un estimator deplasat. Diferena
dintre E(
^

) i este cunoscut sub denumirea de deplasare


(bias). Aceasta se exprim astfel:
Bias (
^

) = E(
^

) (4.3)
Dac
^

tinde s se situeze peste n medie n cazul


mai multor eantioane, atunci deplasarea este pozitiv. Dac
96
Capitolul 4 Estimatori i metode de estimare
^

tinde s se situeze sub n medie n cazul mai multor


eantioane, atunci deplasarea este negativ.
Am ntlnit anterior exemple de estimatori deplasai i
nedeplasai. S ne amintim c media eantionului,
X
este un
estimator nedeplasat pentru media populaiei, , deoarece E(
X
) = . Totui, dispersia eantionului, v
2
, este un estimator
deplasat pentru dispersia populaiei,
2
, deoarece E(v
2
)
2
.
n acest caz deplasarea a fost negativ deoarece v
2
tinde s
se situeze sub valoarea
2
.
n practic nu extragem dect un eantion. Dac am fi
extras mai multe eantioane am fi obinut, n medie,
rspunsul corect. Chiar dac estimatorul nostru este
nedeplasat, pentru unicul eantion pe care l-am extras exist,
prin urmare, o probabilitate de a obine a valoare a
^

undeva
departe de adevratul .
Este de preferat un estimator care n afar de a fi
nedeplasat, s prezinte i o dispersie mic, adic dispersia
distribuiei de selecie s fie ct mai mic posibil.
4.1.2. Eficien a
Despre un estimator
^

se spune c este un
estimator eficient al parametrului dac (a) este
nedeplasat, respectiv E(
^

) = i (b) nu exist nici


un alt estimator nedeplasat al lui care s prezinte
o dispersie mai mic.
Pentru stabilirea unui estimator eficient, trebuie s
minimizm probabilitatea de a obine o estimare diferit de
adevratul . De reinut faptul c, nainte de a putea fi
eficient, un estimator trebuie s fie nedeplasat. Din acest
97
Elemente de econometrie
motiv, un estimator eficient mai este uneori denumit i cel
mai bun estimator nedeplasat.
Demonstrarea eficienei unui estimator nedeplasat
implic verificarea dispersiei sale care trebuie s fie minim
n raport cu dispersiile tuturor celorlali estimatori
nedeplasai. Din punct de vedere matematic, aceasta
reprezint o sarcin cu mult mai grea i, din acest motiv,
cuvntul eficien este utilizat i n sens relativ. De
exemplu, media eantionului,
X
reprezint un estimator
nedeplasat al mediei populaiei, . Un estimator nedeplasat
alternativ pentru este:
( )
S L
X X X +
2
1
n care X
L
i X
S
reprezint cea mai mare, respectiv cea
mai mic observare din cadrul eantionului extras. Dac sunt
extrase multe eantioane, se constat c variaia lui
X
este
mai mic dect variaia lui
X
(distribuiile lor de selecie
sunt ilustrate n Figura 4.2)
98
Capitolul 4 Estimatori i metode de estimare
Figura 4.2. Distribuia de selecie
Prin urmare, se spune despre
X
c este relativ mai
eficient dect
X
. Prin aceasta, apreciem c dac estimm
valoarea lui prin
X
, va exista o probabilitate mai mic de
a obine o estimare la mare distan de dect n cazul n
care am fi recurs la utilizarea estimatorului
X
.
Dificultatea de a gsi acel estimator eficient se refer
la faptul c, frecvent, se limiteaz pentru eficien la un
subset al tuturor estimatorilor nedeplasai. Aceasta se
datoreaz faptului c, de regul, este mult mai uor s gseti
cel mai eficient estimator printre toi estimatorii liniari
nedeplasai.
Un estimator liniar este acel estimator care poate fi
exprimat printr-o funcie liniar. Aceasta nseamn c are
forma urmtoare:
^

= a
1
X
1
+ a
2
X
2
+ a
3
X
3
+ .........a
n
X
n
(4.4)
99
Elemente de econometrie
n care valorile a sunt valori constante. De exemplu,
media eantionului,
X
reprezint un estimator liniar al
mediei populaiei, deoarece poate fi exprimat sub forma:
n
X
n
X
n
X
n
X
n
X
1
.......
1 1 1
3 2 1
+ + +
Nu exist nici un motiv pentru care un estimator liniar
ar trebui s fie cu necesitate un estimator bun, indiferent de
sens. Deoarece valorile a din (4.4) ar putea lua orice valori,
un astfel de estimator ar putea s fie serios deplasat. Totui,
avantajul prezentat de estimatorii liniari const n aceea c,
din punct de vedere matematic, este mult mai uor de lucrat
cu acetia dect cu estimatorii non-liniari.
4.1.3. Estimatorul BLUE liniar nedeplasat
i eficient
Despre un estimator
^

se spune c este cel


mai bun estimator (BLUE) al parametrului dac
(a) este un estimator liniar, (b) este nedeplasat i (c)
nu exist nici un alt estimator nedeplasat care s
prezinte o dispersie mai mic.
Un BLUE nu este cu necesitate cel mai bun
estimator, deoarece este posibil s mai existe ali estimatori
non-liniari cu o variaie mai mic dect cea aferent unui
BLUE. n multe situaii, estimatorul eficient se poate dovedi
att de dificil de gsit nct trebuie s acceptm un BLUE.
Dac se ntmpl ca estimatorul eficient s fie un estimator
liniar, atunci estimatorul BLUE i estimatorul eficient vor fi
identici.
100
Capitolul 4 Estimatori i metode de estimare
4.1.4. Eroarea medie p tratic
Pn acum am definit trei proprieti pe care am
prefera s le posede estimatorii notri. n esen, n-am
preocupat de dou aspecte ale estimatorilor: variaia lor, care
preferm s fie mic, i dac sunt sau nu nedeplasai. S
presupunem c nu este posibil s gsim un estimator care s
fie nedeplasat i s aib, n acelai timp, o variaie mic. S
lum, de exemplu, cele dou distribuii de selecie
reprezentate n Figura 4.3.
Figura 4.3. Distribuia de selecie
Estimatorul
^

1
reprezint estimatorul eficient pentru
. Prin urmare, este nedeplasat dar poate s aib o variaie
mare. Estimatorul
^

2
este (uor) deplasat dar prezint o
variaie mult mai mic. Pe care dintre aceti estimatori ar
trebui s-l preferm ? Este adevrat c, n timp ce
^

1
este
101
Elemente de econometrie
nedeplasat,
^

2
tinde permanent s supra-estimeze parametrul
(adic prezint o uoar influen pozitiv). Constatm c
ariile de sub curbele din Figura 4.3 sunt probabilistice. De
aceea, pentru unicul eantion extras suntem de departe mult
mai n msur s obinem o estimare departe de adevratul
dac utilizm
^

2
.
n acest punct s definim eroare ptratului mediei
unui estimator. Ca i variaia, eroarea ptratului mediei se
raporteaz la dispersia distribuiei de selecie a unui
estimator. n timp ce variaia msoar dispersia n jurul unei
valori previzionate a estimatorului, eroarea ptratului mediei
msoar dispersia n jurul valorii reale a parametrului care
este estimat.
Eroarea medie ptratic (MSE) este
definit ca fiind:
MSE (
^

) = E(
^

- )
2
(4.5)
ntruct Var (
^

) = E[
^

- E(
^

)]
2
, variaia i MSE vor
avea aceeai valoare numai dac E(
^

) = . Altfel spus, numai


dac estimatorul este nedeplasat. n caz contrar, corelaia
dintre MSE i variaia poate fi prezentat sub forma:
MSE (
^

) = Var (
^

) + [Bias (
^

)]
2
(4.6)
n care bias-ul este dat de (4.3). Astfel, MSE
reprezint suma dintre variaie i ptratul influenei.
Din (4.6) deducem c MSE ne ofer o cale de
formalizare i compensarea ntre varianta de a avea o
102
Capitolul 4 Estimatori i metode de estimare
influen mic i cea de a avea o variaie mic. Pe ct posibil,
selectm estimatorul cu cea mai mic eroare a ptratului
mediei. n acest fel, putem evita posibilitatea de a ne
confrunta fie cu o influen prea mare, fie cu o variaie prea
mare. De asemenea, ntruct MSE reprezint ptratul
diferenei medii dintre valoarea unui estimator i valoarea
real a parametrului, minimizarea sa reprezint o preocupare.
Cnd doi estimatori sunt nedeplasai atunci, ntruct variaiile
i MSE-urile sunt identice, a alege estimatorul cu cea mai
mic MSE echivaleaz cu selectarea celui mai eficient
estimator.
n abordarea proprietilor nu am fcut nici o referire
la dimensiunile eantionului extras. Dimensiunile
eantionului ar fi putut fi
4.2. Metode de estimare
Pn n acest moment am alocat mai mult spaiu
descrierii proprietilor pe care am prefera s le aib
estimatorii fr ca, virtual, s nu spunem ceva despre cum
obinem aceti estimatori. Exist trei metode de baz pentru
obinerea estimatorilor, pe care le vom aborda n continuare.
4.2.1. Metoda momentelor
Dac avem o mulime de valori pentru o
variabil aleatorie X, atunci cantitatea E(X
r
) este
cunoscut ca fiind al r-lea moment al populaiei
din preajma lui zero.
De exemplu, E(X), media populaiei, este primul
moment centrat, n timp ce E(X
2
) este al doilea moment
centrat i aa mai departe.
103
Elemente de econometrie
Dac media populaiei E(X)=, atunci cantitatea E(X
)
r
este cunoscut sub denumirea ca fiind r-lea moment al
populaiei din preajma mediei. De exemplu, dispersia
populaiei, E(X )
2
este de asemenea cunoscut ca fiind al
doilea moment n preajma mediei.
Fiind dat un eantion de observri (X
1
, X
2
,X
3
,.......X
n
),
definim al r-lea moment al eantionului din preajma lui
zero prin
n X
r
i
/

. Media eantionului n X X
i
/

este
primul moment al eantionului centrat .
n cadrul metodei momentelor, estimm pur i simplu
momentele populaiei din preajma lui zero i a mediei, prin
momentele corespunztoare ale eantionului. De exemplu,
estimm media populaiei prin media eantionului,
X
, i
variaia populaiei prin variaia eantionului, v
2
, conform
definiiei de mai sus.
Este posibil s se demonstreze c:
n condiii foarte generale, momentele
eantionului reprezint estimatori compatibili ai
momentelor corespunztoare ale populaiei.
Momentele eantionului nu sunt cu necesitate
estimatori nedeplasai.
n acest punct trebuie s remarcm faptul c, aa cum
o variaie de eantion este un estimator compatibil al variaiei
populaiei, tot aa se poate demonstra c o co-variaie a
eantionului ( )( ) n Y Y X X i
i
/

este un estimator
compatibil al co-variaiei populaiei ( ) [ ] ( ) [ ] Y Y X E X E .
104
Capitolul 4 Estimatori i metode de estimare
4.2.2. Metoda celor mai mici p trate
Am recurs deja la aceast metod de estimare n
capitolul referitor la regresia de dou variabile. Aceasta este o
metod general de estimare a momentelor populaiei
centrat .
S considerm al r-lea moment al populaiei centrat ,
E(X
r
), care se scrie, n general, sub forma
r
.
n cazul metodei celor mai mici ptrate estimm
valoarea
r
prin selectarea acelei valori care minimizeaz
suma ptratelor ( )
2


r
r
i
X .
De exemplu, selectm o valoare astfel nct s
minimizm

S = ( )
2


i
X (4.12)
Pentru a minimiza (4.12) trebuie s facem calculul
diferenial n legtur cu i s stabilim resultanta ....? egal
cu zero. Aceasta conduce la relaiile:
( ) 0 2

i
X
d
dS
sau
0

n X
i
(4.13)
Calculul din (4.13) pentru ne conduce la estimatorul
celor mai mici ptrate, desemnat prin
^

, sub forma:
^

=
n X
i
/

105
Elemente de econometrie
Calculm apoi derivata de gradul doi
( ) 0 2 1 2 /
2 2
>

n d S d
i aa mai departe. Estimatorul
celor mai mici ptrate al populaiei este media eantionului.
Nu poate fi vorba de certitudine cu privire la faptul c
metoda celor mai mici ptrate va conduce la estimatori care
s posede proprietile discutate anterior. Proprietile
estimatorilor celor mai mici ptrate trebuie s fie investigate
pentru fiecare caz n parte.
4.2.3. Estimarea probabilit ii maxime
O metod de estimare utilizat n econometrie este
metoda probabilitii maxime.
Pentru o nelegere intuitiv a acestei metode,
presupunem c avem o populaie de muncitori ntr-o industrie
care sunt fie n favoarea, fie contra unei aciuni industriale
ntr-o anumit problem. Dorim s estimm proporia a
acelor muncitori care sunt n favoarea respectivei aciuni. S
presupunem c extragem un eantion aleatoriu de 17
muncitori din respectiva industrie i constatm c numai 2
dintre acetia sunt n favoarea aciunii.
n lumina acestei dovezi dat de eantion, vom
considera valori posibile pentru proporia n cadrul
populaiei. Pare extrem de puin probabil ca o valoare = 0,8
(80% n favoarea aciunii), s fi condus la evidena
eantionului respectiv. Pare tot puin probabil ca valoarea =
0,5 s fie putut conduce la o astfel de situaie. Este evident c
o valoare = 0,1 prezint de departe cea mai mare
probabilitate de a fi generat rezultatul eantionului
menionat mai sus. n termeni cureni, estimatorul
probabilitii maxime al valorii este acea valoare care este
cea mai probabil sau prezint probabilitatea maxim de
a genera rezultatul dat de eantion, respectiv 2 din 17
106
Capitolul 4 Estimatori i metode de estimare
muncitori care sunt n favoarea aciunii industriale. Aceast
valoare a lui care are cea mai mare probabilitate de a
genera eantionul este cea pe care am obinut-o de fapt.
ntruct muncitorii din cadrul populaiei sunt fie
pentru, fie mpotriva unei aciuni industriale, numrul de
muncitori din cadrul eantionului nostru care sunt n favoarea
acestei aciuni trebuie s aib o distribuie binomil.
Substituind n = 17 i X = 2 (numrul celor n favoarea
aciunii) n (2.7) obinem:
Pr = Pr(2 muncitori n favoare n eantionul de 17) =
136()
2
(1- )
15

(4.14)
Ceea ce ne spune (4.14) este faptul c probabilitatea
de a obine eantionul pe care l-am obinut depinde de
proporia necunoscut, , a populaiei. De exemplu, dac =
0,8, atunci (4.14) conduce la probabilitatea de Pr = 0,285 x
10
-8
. Aceasta nu face dect s verifice ceea ce am sugerat mai
sus faptul c este foarte puin probabil ca eantionul nostru
s fi putut fi generat de o populaie avnd = 0,8.
De o manier similar, dac = 0,5, (4.14) conduce
la probabilitatea Pr = 0,00104, o valoare ceva mai mare dect
cea pentru = 0,8 dar n continuare foarte mic. n schimb,
dac = 0,1, (4.14) conduce la o probabilitate mult mai
mare, rspectiv Pr = 0,280. Aceasta verific nc una dintre
sugestiile de mai sus aceea conform creia o valoare =
0,1 are de departe o probabilitate mult mai mare de a genera
eantionul dat.
MLE reprezint acea valoare care minimizeaz
probabilitatea obinut din (4.14). Funcia (4.14) este
prezentat grafic n Figura 4.4. Se poate observa c
107
Elemente de econometrie
probabilitatea maxim (Pr maxim) survine de fapt atunci
cnd ia o valoare uor mai mare dect 0,1.
Figura 4.4. Funcia MLE
Pentru a gsi valoarea exact a lui care s
maximizeze (4.14), respectiv, valoarea exact a MLE,
calculm diferenialul lui Pr n raport cu i stabilim
derivata rezultant egal cu zero. Aceasta nseamn c,
utiliznd regula pentru produse de difereniale, obinem:
( ) ( ) [ ] 0 1 15 1 2 136
Pr
14 2 15

d
d

Rezult c:
108
Capitolul 4 Estimatori i metode de estimare
( ) ( ) [ ] 0 15 1 2 1
14
(4.15)

Ecuaia (4.15) poate fi acum soluionat pentru a se
gsi acea valoare care maximizeaz (4.14). Astfel,
desemnnd MLE pentru prin
~

, avem:
118 , 0
17
2
~

n loc s verificm condiia de ordin secund pentru un
maximum, putem observa din Figura 4.4 c o valoare de
0,118 maximizeaz de fapt (4.14) n loc de a o minimiza.
Astfel, valoarea care este cel mai probabil s fi
generat rezultatul eantionului nostru (2 din 17 muncitori n
favoarea unei aciuni industriale) este 2/17 sau 0,118.
Reinem faptul c maximul estimrii probabilitii cu privire
la proporia populaiei se dovedete a fi proporia
eantionului, respectiv, proporia eantionului care este n
favoarea unei aciuni industriale.
4.2.4. Cazul general
n general, MLE este determinat prin derivarea, mai
nti, a unei funcii de probabilitate. Aceasta este pur i
simplu o expresie matematic pentru probabilitatea de
obinere a rezultatului unui eantion dat. n cazul considerat,
funcia de probabilitate a fost dat de (4.14).
n mod normal, rezultatul unui eantion va consta din
n observri cunoscute, pe care le vom nota cu (X
1
,
X
2
,X
3
,.......X
n
). Dac populaia este caracterizat printr-un
singur parametru , atunci probabilitatea L, de a obine un
109
Elemente de econometrie
eantion dat depinde, n primul rnd, de valoarea i, n al
doilea rnd, de observrile exacte din cadrul eantionului.
MLE aferent parametrului este acea
valoarea a lui care maximizeaz funcia de
probabilitate.
(4.16)
ntruct valorile X
i
sunt constante cunoscute, odat
stabilit forma algebric precis pentru (4.16), se poate
recurge apoi la calculul diferenial pentru a se obine acea
valoare care maximizeaz L.
Cel mai adesea, populaiile vor poseda mai muli
parametri. Probabilitatea de a obine un eantion dat va
depinde n acest caz de valorile tuturor paremetrilor i
observrilor pe eantionul dat. n aceast situaie funcia de
probabilitate ia o form mai general, respectiv:
L = L(
1
,
2
, .....
m
, X
1
, X
2
,.......X
n
), (4.17)
n care exist m parametri n total. MLE-urile aferente
parametrilor m pot fi stabilite prin calculul diferenial parial
aplicat (4.17) n raport cu fiecare valoare pe rnd i, apoi,
prin stabilirea tuturor derivatelor pariale obinute la zero.
4.2.5. Exemplu cu o variabil discontinu
S presupunem c populaia noastr cuprinde valorile
unei variabile discontinue X care prezint distribuia
probabilistic geometric. Aceasta nseamn:
p(X) = (1 )
X
, 0 < < 1 (4.18)
110
Capitolul 4 Estimatori i metode de estimare
Ne situm n cazul unei variante n care populaia este
caracterizat printr-un singur parametru, . Dorim s stabilim
MLE aferent parametrului . S presupunem c avem un
eantion de n observri aleatorii asupra lui X , pe care le
scriem sub forma (X
1
, X
2
,X
3
,.......X
n
). Utiliznd (4.18),
probabilitatea de a obine observaia i n cadrul eantionului
este dat de formula:
p(X
i
) = (1 )
i
X
i = 1, 2, 3, , n (4.19)
Pentru un eantion aleatoriu, cele n observri vor fi,
toate, valori independente. Prin urmare, putem scrie
probabilitatea obinerii celor n observri sub forma:
L =p(X
1
)p(X
2
)p(X
3
)...........p(X
n
)
sau, utiliznd (4.19):
( ) [ ] ( ) [ ] ( ) [ ] ( ) [ ]
n
X X X X
L 1 ...... 1 1 1
3 2 1
(4.20)
Ecuaia (4.20) este cea care ofer funcia de
probabilitate n acest caz. Valoarea MLE pentru este acea
valoare a lui care maximizeaz (4.20).
Valorile X
i
sunt valori cunoscute. Condiia de prim
ordin pentru un L maxim este prin urmare dL/d = 0.
Aplicarea calculului diferenial pentru L, aa cum se prezint,
este anevoioas i, de aceea, este util ca n prealabil s
stabilim logaritmul lui L. Acesta este de forma:
l=ln(L)= ( ) ( ) [ ] ( ) ( ) [ ] + + + + ln 1 ln ln 1 ln
2 1
X X
111
Elemente de econometrie
+
( ) ( ) [ ] ( ) ( ) [ ]
n
X X + + + + 1 ln . .......... ln 1 ln
3

(4.21)
ntruct cu ct l =ln(L) este mai mare, cu att mai
mare este i L, valoarea lui care maximizeaz (4.21) trebuie
s maximizeze i (4.20), respectiv funcia de probabilitate.
Prin urmare, putem s stabilim valoarea MLE
pentru prin maximizarea (4.21), aa-numita funcie de
probabilitate logaritmic.
Aceasta se dovedete a fi o sarcin mai puin
anevoioas dect maximizarea funciei de probabilitate
originale.
Pentru a maximiza (4.21) se calculeaz diferenialul
n raport cu i se stabilete derivata rezultat la zero. Astfel:
0
1
+




i
X
n
d
dl

sau
( )


i
X n 1
(4.22)
Ecuaia (4.22) poate fi folosit acum pentru
soluionarea problemei legat de stabilirea MLE pentru ,
notat prin
~

:
X
X
X n
X
i
i
+

1
~

(4.23)
112
Capitolul 4 Estimatori i metode de estimare
unde
X
este media eantionului.
Ecuaia (4.23) poate prea un estimator ciudat pentru
parametrul . Totui, se poate demonstra c media distribuiei
geometrice (4.19) este E(X) = /(1 ). Prin re-aranjare se
obine valoarea adevrat a parametrului , sub forma:
( )
( ) X E
X E
+

(4.24)
Acum se poate observa c expresia pentru MLE
(4.23) este analogul relaiei populaiei (4.24).
4.2.6. Exemplu cu o variabil continu
Dac o variabil aleatorie, X, este o variabil
continu, atunci este mai indicat ca distribuia sa
probabilistic p(X) s fie denumit funcie a densitii
probabilistice.
S presupunem c avem o mulime de valori pentru o
variabil continu, X, care este dat de distribuia
exponenial negativ. Aceasta nseamn:
p(X) = e
-X
(4.25)
i n acest caz dorim s stabilim valoarea MLE pentru
parametrul . Dac din aceast populaie se extrage un
eantion aleatoriu de mrime n, atunci, ca i n cazul
variabilelor discontinui, putem considera o funcie de
probabilitate pentru observrile de eantion, X
i
:
L=p(X
1
)p(X
2
)p(X
3
)...........p(X
n
) (4.26)
113
Elemente de econometrie
ntruct acum lucrm cu o variabil continu, nu
putem considera c (4.25) ne ofer probabilitatea obinerii
celor n valori ale eantionului. n schimb, (4.26) ne indic
densitatea probabilistic din preajma acestor valori de
eantion. Aceast densitate probabilistic depinde n
continuare de valoarea parametrului i, prin urmare, a alege
acea valoare care o maximizeaz capt sens. Aceasta
nseamn c MLE pentru continu s fie definit ca acea
valoare care maximizeaz funcia de probabilitate.
Utiliznd ecuaia (4.25) pentru substituire n (4.26)
forma exact a funciei de probabilitate n acest caz devine.
L = ( )( )( ) ( )
n
X X X X
e e e e

......
3 2 1
i de aceast dat este mai convenabil s se lucreze n
termeni de funcie logaritmic de probabilitate:
( ) ( ) [ ] [ ] [ ] ( ) [ ] ( ) [ ] X X X X L l + + + + ln ..... ln ln ln ln
3 2 1
sau
( )


i
X n l ln
(4.27)
Ca i n cazul exemplului precedent, maximizarea lui
l echivaleaz cu maximizarea lui L. Prin urmare, MLE
pentru poate fi obinut prin calcularea diferenialului n
raport cu i stabilirea derivatei rezultat la zero. Aceasta
conduce la:
114
Capitolul 4 Estimatori i metode de estimare
0
i
X
n
d
dl

(4.28)
Soluionnd (4.28) pentru , obinem MLE sub forma:
X X
n
i
1

(4.29)
unde
X
este media eantionului.
4.2.7. Exemplu cu doi parametri
Toate exemplele de probabilitate maxim pe care le-
am luat n consideraie pn acum au implicat numai un
singur parametru al populaiei. Totui, dup cum indic
(4.17), metoda poate fi utilizat pentru estimarea mai multor
parametri simultan.
Ca exemplu de estimare simultan pentru 2 parametri,
s presupunem c avem o populaie distribuit normal, de
valori X, cu media i variaia
2
. Se urmrete stabilirea
MLE pentru i
2
.
ntruct ln(e) = 1, aceasta nseamn c:
( ) [ ] ( ) [ ] ( )
2 2
5 , 0
2
/ 5 , 0 2 ln ln

X X p
=
( ) ( ) ( )
2 2 2
/ 5 , 0 ln 5 , 0 2 ln 5 , 0 X
(4.30)
Funcia de probabilitate pentru un eantion aleatoriu
de n observri asupra lui X are, ca de obicei, forma (4.26).
Prin urmare, funcia logaritmic de probabilitate are forma:
115
Elemente de econometrie
( ) ( ) [ ]


i
X p L l ln ln

(4.31)
Utiliznd (4.30), rezult:
( ) ( ) ( ) [ ]


2 2 2
/ 5 , 0 ln 5 , 0 2 ln 5 , 0
i
X l
= ( ) ( ) ( ) ( )
2
2 2
/ 1 5 , 0 ln 5 , 0 2 ln 5 , 0


i
X n n
(4.32)
n condiiile observrilor de eantion date, l este o
funcie de doi parametri, i
2
.
Pentru a maximiza probabilitatea logaritmic,
recurgem prin urmare la difereniale pariale (4.32) n raport
cu i
2
i stabilim derivatele obinute:
( ) ( ) ( ) 0
1
1
1
2


i i
X X
l

(4.33)
i
( ) 0
5 , 0 5 , 0
4 2 2
+



i
X
n l

(4.34)
Ecuaiile (4.33) i (4.34) reprezint dou ecuaii
pentru cele dou necunoscute, i
2
, care pot fi soluionate
pentru stabilirea MLE. n primul rnd, ntruct
2
trebuie s
fie diferit de zero, din (4.33) obinem:
116
Capitolul 4 Estimatori i metode de estimare
( ) 0


i
X
sau
0

n X
i
Soluionnd aceast ecuaie pentru obinem MLE
sub forma:
X n X
i

/
~

(4.35)
Astfel, estimatorul probabilitii maxime a mediei
unei populaii, , este media eantionului,
X
.
Pentru a soluiona
2
, nmulim (4.34) cu 2
4
obinnd:
( ) 0
2
2
+


i
X n
tim c
X
~

, i rezult c MLE pentru


2
are
forma:
( )
2
2
2
~
v
n
X X
i

(4.36)
117
Capitolul 5
Unele preciz ri privind
modelul clasic al
regresiei cu dou
variabile
n prezentarea anterioar am avut n vedere utilizarea
estimatorilor celor mai mici ptrate regulate (OLS = ordinary
least squares) n analiza regresiei de dou variabile. Am
sublniat faptul c estimrile obinute prin metoda celor mai
mici ptrate regulate din orice set de date sunt specifice
respectivului set de date. Eantioane diferite vor conduce la
estimri diferite. Aceasta nseamn c estimatorii OLS sunt
afectai de variabilitatea eantionrii i dein distribuii de
selecie. Subliniem nc o dat faptul c nu exist nici o
garanie n sensul c estimatorii OLS i distribuiile lor de
selecie vor prezenta vreuna dintre proprietile dorite. Nu
exist nici un motiv pentru care estimatorii OLS ar trebui s
fie cu necesitate, de exemplu, nedeplasai sau compatibili.
Situaia ar fi diferit dac se poate demonstra c anumite
condiii se susin.
5.1. Ipotezele modelului clasic al
regresiei de dou variabile
Modelul clasic al regresiei de dou variabile s-a
dezvoltat la nceputul secolului trecut pentru a fi utilizat n
tiinele fizice. Dup cum vom vedea, multe dintre ipotezele
Capitolul 5 Unele preciz ri privind modelul clasic
pe care este cldit sunt neadecvate atunci cnd se lucreaz cu
date privind tiinele sociale.
Modelul clasic de referin reprezint o corelaie n
care variabila dependent, Y, este dependent liniar de
variabila explicativ, X, dar este influenat i de rezidualul
. Prin urmare, avem:
Y
i
= + X
i
+
i
pentru toate valorile i (5.1)
Cnd revenim la modelul clasic trebuie s recurgem la
o serie de ipoteze, n primul rnd referitoare la variabila
explicativ i, n al doilea rnd, referitoare la REZIDUU.
5.1.1. Ipoteze cu privire la variabila
explicativ
n modelul clasic se pornete de la prezumia c
variabila explicativ:
Ipoteza A - este non-stochastic;
Ipoteza B - are valori care sunt fixe n eantioane
repetate;
Ipoteza C - este de o asemenea natur nct, pe
msur de n , variaia sa
( ) Q n x n X X
i


/ /
2
2
, unde Q este o constant
finit fix.
Aceste prezumii vor necesita unele explicaii. O
variabil stochastic este pur i simplu o variabil ale crei
valori sunt determinate de un mecanism ntmpltor i, de
aceea, fac obiectul unei distribuii probabilistice. Prin urmare,
o variabil non-stochastic are valori care nu sunt
determinate la ntmplare. n contextul modelului clasic,
aceasta presupune c valorile variabilei explicative X, sunt de
fapt determinate de un cercettor. Amintim c acest model a
119
Elemente de econometrie
fost dezvoltat pentru necesitile tiinelor exacte, acolo unde
experimentele de laborator sunt posibile. n astfel de condiii,
este rezonabil s se postuleze ca n cazul n care se
selecioneaz valorile pentru variabila X urmrete scopul
experimentului. Ipoteza A presupune c valorile variabilei X
au fost alese n acest fel. Desigur, n tiinele economice
sociale este dificil s se efectueze experimente de laborator.
n acest punct ar trebui s se observe c, chiar dac
variabila X este non-stochastic, nu acelai lucru este valabil
i pentru variabila Y. Se poate constata c valorile lui Y
depind nu numai de valorile lui X dar i de valorile
rezidualului. ntruct rezidualul este n afara posibilitii de
control, variabila Y este stochastic, extrgndu-i natura din
cea a rezidualului.
Ipoteza B se refer la ce s-ar fi ntmplat n situaia n
care s-ar fi extras mai multe eantioane. Se presupune c,
dac ar repeta experimentul, cercettorul ar alege exact
acelai set al valorilor X n fiecare mprejurare de acest fel.
Aceasta nseamn c n fiecare eantion extras valorile X
rmn neschimbate.
Faptul c valorile lui Y variaz de la eantion la
eantion nseamn c diferitele eantioane vor conduce n
continuare la valori diferite ale estimatorilor OLS. Prin
urmare, distribuiile de selecie pentru estimatorii OLS vor
exista n continuare dei ele trebuie privite ca survenind
atunci cnd sunt extrase multe eantioane cu acelai set de
valori X.
Relevana ipotezei C presupune c, dac dimensiunea
eantionului ar fi mrit, variaia
n x
i
/
2

nu ar crete
nelimitat. Este clar c, pe msur ce n crete, suma ptratelor

2
i
x
trebuie s creasc, ntruct avem mai multe valori s x
i
2

de nsumat. Nu este nevoie ca acest lucru s fie adevrat i
120
Capitolul 5 Unele preciz ri privind modelul clasic
pentru ( ) n X X n x
i i
/ /
2
2

, cu condiia ca cercettorul
s fie atent cu valorile X pe care le alege.
Multe variabile economice prezint trenduri
ascendente continue. n astfel de cazuri, pe msur ce
dimensiunea eantionului disponibil crete iar acesta include
tot mai multe perioade de timp, variaia lui X, respectiv
n x
i
/
2

, crete la rndul su continuu, astfel nct ipoteza C


nu se confirm. Atunci, importana unor astfel de ipoteze
const n aceea c ele guverneaz variabilele factoriale care
manifest trenduri semnificative. Dup cum vom vedea, apar
probleme n a emite ipoteze n legtur cu acele corelaii n
cadrul crora variabila explicativ prezint un trend puternic.
5.1.2. Ipoteze cu privire la factor rezidual
n modelul clasic se pornete de la ideea c
rezidualul are urmtoarele proprieti:
(IIA) E(
i
) = 0 pentru toate valorile i ;
(IIB) Var(
i
) = E(
i
-

E
i
)
2
= E( )
2
i
=
2
=
constant pentru toate valorile i ;
(IIC) Cov (
i
,
j
) = E(
i
-

E
i
) (
j


E
j
) = E (
i
,
j
) =
0 pentru toate valorile i j;
(IID) Fiecare factor rezidual
i
este distribuit
normal
Aceste ipoteze se pot nelege din Figura 5.1, n care
s-a trasat linia de regresie a populaiei, X
6
reprezint valoarea
variabilei explicative, X, rezultat din cea de a asea
observare.
n condiiile ipotezelor IA i IB, X
6
nu variaz de la
eantion la eantion.
121
Elemente de econometrie
Figura 5.1. Ipoteze privind factorul rezidual
Rezidualul reprezint distana vertical a unor astfel
de puncte de pe linia de regresie. Distana punctelor de pe
linia X
6
n raport cu linia populaiei reprezint, prin urmare,
diferitele valori pentru
6
, respectiv rezidualul asociat celei de
a 6-a observri. Ipoteza IIA afirm c n cazul mai multor
eantioane extrase, media unor astfel de reziduale este zero.
Similar este de presupus c i media valorilor reziduale
3
,

12
etc., asociate cu valorile fixe X
3
, X
12
etc., este zero.
Aceast ipotez implic faptul c, pentru oricare dintre liniile
de valori fixe X
i
, punctele obinute atunci cnd se extrag, n
mod repetat, eantioane, sunt uniform repartizate deasupra i
sub linia de regresie.
Ipoteza IIB precizeaz c variaia tuturor valorilor
6
care ar putea fi obinute dac s-ar extrage eantioane
repetate, este identic cu variaia tuturor valorilor
3
obinute
care, la rndul su este este identic cu variaia valorilor
12
etc. Aceast variaie constant este redat prin simbolul
2
.
Reamintim c variaia este o msur a dispersiei sau
122
Capitolul 5 Unele preciz ri privind modelul clasic
mprtierii unei distribuii. Prin urmare, ipoteza IIB
presupune c, atunci cnd se extrag multe eantioane,
dispersia punctelor din preajma liniei de regresie este aceeai
pentru fiecare dintre valorile X.
Atunci cnd valorile reziduale se ncadreaz n ipoteza
IIB, sunt denumite homoschedastice. Aceast ipotez nu este
ntotdeauna valabil pentru datele economice. Cnd este
vorba de o mare variaie a valorilor X, exist tendina ca, n
loc s rmn constante, variaia rezidualului s creasc pe
msur ce mrimea X crete. Atunci cnd variaia lor nu este
constant, valorile reziduale sunt denumite
heteroschedastice.
Ipoteza IIC afirm c ntre oricare dou reziduale
covariaia i, prin urmare, corelaia este zero. Atunci cnd
aceast ipotez se susine, valorile reziduale sunt denumite
non-autocorelate. Aceast prezumie presupune c, atunci
cnd se extrag eantioane repetate, nu exist nici o tendin ca
eantioanele cu, valori pozitive mari pentru
6
s prezinte, de
asemenea, valori mari pentru
3
. Se elimin, de asemenea, i
corelaiile negative. Nu trebuie s existe tendina ca valorile

3
pozitive s fie asociate unor valori
12
negative.
Ipoteza IID afirm c valorile
6
care s-ar obine
dintr-o selecie repetat sunt distribuite normal n jurul
mediei lor, respectiv zero, situaie similar pentru toi ceilali
reziduali. Principala implicaie a acestei afirmaii este aceea
c probabilitatea de a obine reziduali mici este mult mai
mare dect aceea de a obine reziduali mari. Prin urmare
exist o probabilitate mai mare de a obine puncte apropiate
de linia de regresie dect probabilitatea de a obine puncte
ndeprtate de aceasta.
123
Elemente de econometrie
Ipotezele IIA - IID pot fi sintetizate n
afirmaia conform creia rezidualii
i
sunt normal
i independent distribuii cu o medie zero i o
variaie constant
2
. Aceasta nseamn c:

i
este NID (0,
2
) pentru toate valorile i
(5.2)
5.2. Propriet ile estimatorilor OLS
Exceptnd ipotezele IIA i IID, toate ipotezele
referitoare la modelul clasic sunt neverosimile atunci cnd se
aplic datelor economice. Dac estimatorii OLS dispun de
proprietile amintite atunci este necesar ca mcar unele
dintre ipotezele clasice s fie valabile. Se impune s stabilim
o expresie alternativ pentru estimatorul OLS al pantei liniei
de regresie a populaiei, , respectiv:
( )


i i i i i i
Y x Y Y x y x
^
ntruct 0
i
x Y
?
unde:

2
i
i
i
x
x
w
pentru toate valorile i (5.4)
i

0
i
w
(5.5)
124
Capitolul 5 Unele preciz ri privind modelul clasic
De reinut c, deoarece
0
i
x
, iar X X x
i i
,
1
i i i i
x w X w
(5.6)
Prin substituie obinem:
( )
i i i i i i i i
w X w w X w

+ + + +
^
i apoi
i i
w

+
^
(5.7)
Ecuaia reprezint o expresie alternativ pentru
^

.
ntruct aceast espresie implic un factor rezidual
necunoscut, ea este inutil pentru scopuri de calculaie ns
reprezint un aparent punct de pornire pentru o dezvoltare
teoretic ulterioar.
n continuare s lum n consideraie proprietile
estimatorilor OLS, concentrndu-ne asupra estimatorului de
pant,
^

, deoarece acesta prezint un interes mai mare dect


estimatorul intercept
^

.
5.2.1. Liniaritatea
Pentru ca estimatorii OLS s fie estimatori liniari, este
necesar a fi ndeplinite ipotezele IA i IB. Amintim c aceste
ipoteze presupun c trebuie s alegem valorile variabilei X i
c aceste valori sunt meninute fixe pentru eantioane
repetate. Prin urmare, valorile X pot fi considerate ca fiind
constante. Prin urmare, estimatorii OLS trebuie s fie numai
funcii lineare ale valorilor Y pentru a fi considerai estimatori
lineari. Se poate observa cu uurin c acest lucru este
125
Elemente de econometrie
valabil n condiiile date ale ipotezelor IA i IB. ntruct
valorile X
i
pot fi considerate a fi constante, acelai lucru este
valabil i pentru valorile x
i
. Prin urmare, i valorile w
i
pot fi
considerate tot constante. Astfel, rezult c
^

este o funcie
liniar a lui Y
i
, respectiv a observrilor pe eantion. Nu este
dificil de demonstrat c, n condiiile acestor ipoteze, i
estimatorul OLS pentru este, de asemenea, un estimator
liniar.
Reamintim c un estimator liniar nu este cu necesitate
un bun estimator al parametrului care se estimeaz dar, din
punct de vedere matematic, cu estimatorii liniari se lucreaz
mai uor dect cu estimatorii non-liniari.
5.2.2. Nedeplasarea
Valoarea parametrilor distribuiei de selecie pentru
estimatorii OLS este egal cu valorile reale aferente lui i
. Dac ne concentrm atenia asupra ecuaiei lui
^

,
obinem:
n n
w w w w + + + + ...
3 3 2 2 1 1
^
(5.8)
Pornind de la ipoteza c valorile w
i
pot fi considerate
constante i acestea pot fi neglijate i avem:
n n
E w E w E w E w E + + + + +

,
_

...
3 3 2 2 1 1
^
(5.9)
Conform ipotezei IIA, E(
i
) = 0, pentru toate valorile
i, rezult c:
126
Capitolul 5 Unele preciz ri privind modelul clasic

,
_

^
E
(5.10)
Astfel,
^

este un estimator nedeplasat al lui .


Similar se poate demonstra c i estimatorul OLS
^

este un
estimator nedeplasat ale parametrului , adic:

,
_

^
E
.
5.2.3. Compatibilitatea
Pentru a demonstra c estimatorii OLS sunt
compatibili vom apela la ipotezee IA IC i IIA. Aceasta
presupune c, pe msur ce n , distribuiile lor de
selecie se concentreaz pe valorile reale ale parametrilor i
. Substituindu-l pe w
1
, obinem:

+ +
n x
n x
x
x
i
i i
i
i i
/
/
2 2
^


(5.11)
Dac avem n vedere limitele probabilistice, obinem:
( )

,
_

,
_

,
_

n x
n x
pLim
n x
n x
pLim pLim pLim
i
i i
i
i i
/
/
/
/
2 2
^


(5.12)
Am utilizat proprietatea limitelor probabilistice
prezentat anterior i faptul c limita probabilistic a oricrei
constante este egal cu respectiva constant, rezultnd:
127
Elemente de econometrie
( )
( )

,
_

n x pLim
n x pLim
pLim
i
i i
/
/
2
^


(5.13)
Considernd numrtorul celui de al doilea termen din
partea dreapt a ecuaiei, rezult:
( )( )
n
X X
n
x
i i i i


(n condiiile n care
0
i
x )
Prin urmare,
n x
i i
/

reprezint covariaia
eantionului ntre X i .
n numitorul din partea dreapt a relaiei,
n x
i
/
2


reprezint variaia eantionului pentru valorile X. n
condiiile date ale unui X
i
non-stochastic, pentru a-i afla
limita probabilistic, trebuie s lum limita lui
n x
i
/
2

pe
msur ce mrimea eantionului, n, tinde ctre infinit. Dar,
avnd n vedere ipoteza IC, aceast limit este dat de
constanta fix Q.
Prin urmare, ecuaia se reduce la forma:
+

,
_

Q
pLim
0
^

128
Capitolul 5 Unele preciz ri privind modelul clasic
Prin urmare,
^

este un estimator compatibil.


Aceasta nseamn c, pe msur ce n , el converge
probabilistic spre valoarea real a lui . Se poate
demonstra, de asemenea, c

,
_

^
pLim
, astfel c
estimatorul OLS,
^

, este un estimator compatibil al


parametrului intercept .
5.2.4. Cea mai bun nedeplasare liniar
Dup ce am demonstrat c, dac ipotezele clasice
referitoare la variabila explicativ i primele dou ipoteze
referitoare la factor rezidual sunt valabile, atunci estimatorii
OLS vor fi liniari i nedeplasai. Dup cum am reinut,
numai nedeplasarea nu este o proprietate asiguratorie.
Rezult c pentru a considera c estimatorii OLS sunt cei mai
buni estimatori liniari nedeplasai, vom recurge la ipotezele
clasice IIB i IIC. Aceasta nseamn c rezidualul trebuie s
prezinte o variaie constant i o covariaie zero.
O dovad a faptului c estimatorul OLS al
parametrului pantei, , este BLUE este dificil. Procedura de
urmat const n a reface estimarea, din punctul de pornire n
care se situa pentru a se obine efectiv valoarea BLUE a lui
, incorpornd pe rnd proprietile liniaritii, neinfluenrii
i ale variaiei minime.
Rezult c formula pentru estimatorul BLUE astfel
obinut este identic cu expresia aferent estimatorului OLS
pentru parametrul . Prin urmare, estimatorul OLS trebuie
s fie BLUE.
Unul dintre avantajele metodei de estimare a celui
mai bun estimator liniar nedeplasat const n aceea c, atunci
129
Elemente de econometrie
cnd se utilizeaz aceast metod obinem, ca un fel de sub-
produs, o expresie pentru variaia estimatorului avut n
vedere. n cazul de fa, variaiile, scrise n mod normal sub
forma
2
^

i
2
^

, sunt urmtoarele:

,
_

2
2
2
^
^
i
x
Var

(5.14)
i

,
_

2
2 2
2
^
^
i
i
x n
X
Var

(5.15)
unde
2
este variaia rezidualului.
Reamintim faptul c n cazul eantionrii repetate
obinem distribuii de selecie pentru estimatorii OLS
^

i
^

.
Rdcinile ptrate ale dispersiilor
2

i
^

sunt
cunoscute sub denumirea de erori standard pentru
^

i,
respectiv,
^

.
5.2.5. Eficien a (eficien a asimptotic )
Dac estimatorii OLS trebuie s aib o dispersie
minim, dintre toi estimatorii nedeplasai, liniari sau non-
liniari, atunci se poate demonstra c ipoteza clasic IID
trebuie s se susin la rndul su.
130
Capitolul 5 Unele preciz ri privind modelul clasic
Aceasta nseamn c, pentru ca estimatorii OLS s fie
eficieni, toate ipotezele clasice, inclusiv cea referitoare la
valorile reziduale normal distribuite, trebuie s se susin. A
dovedi acest lucru este dificil de realizat.
ntruct eficiena reprezint o proprietate a unui
eantion mic, estimatorii OLS trebuie s fie eficieni
indiferent de mrimea eantionului i s rmn ca atare pe
msur ce mrimea eantionului tinde spre infinit. Prin
urmare, acetia trebuie s fie i asimptotic eficieni. Astfel,
dac toate ipotezele clasice sunt valabile, estimatorii OLS
trebuie s aib nu numai proprietatea de mare eantion
referitoare la compatibilitate ci i pe aceea referitoare la
eficiena asimptotic. Acest lucru presupune c, dintre toi
estimatorii compatibili, estimatorii OLS sunt cei a cror
distribuie de selecie se concentreaz pe valorile i pe
msur ce dimensiunea eantionului devine mai mare.
5.2.6. Normalitatea
Ipoteza IID, conform creia valorile reziduale sunt
distribuite normal, implic faptul c distribuiile de selecie
pentru
^

i
^

sunt distribuii normale.


ntruct valorile X
i
pot fi privite ca fiind constante
stabilite, aceast ecuaie implic faptul c fiecare valoare Y
i
reprezint suma dintre o constant i un factor rezidual
distribuit normal. Prin adugarea unei constante la o variabil
normal distribuit nu se modific forma distribuiei
respectivei variabile ci distribuia se deplaseaz de-a lungul
axei orizontale. Prin urmare, fiecare valoare Y
i
prezint o
distribuie normal. Dar estimatorii OLS sunt funcii lineare
ale lui Y
i
, avnd n vedere ipotezele IA i IB. Deoarece, aa
cum am artat anterior, orice funcie linear a variabilelor
131
Elemente de econometrie
normal distribuite va prezenta ea nsi o distribuie normal,
rezult c estimatorii OLS
^

i
^

trebuie s aib, de
asemenea, tot astfel de distribuii.
n condiiile n care
^

i
^

sunt nedeplasai i
prezint dispersiile date, putem afirma c, dac toate
ipotezele clasice se susin, atunci:
^

=>
,
_

2
^
,


(5.16)
^

=>
,
_

2
^
,


, (5.17)
unde
2
^

i
2
^

sunt dispersiile cunoscute.


^

i
^

sunt importante dac dorim s stabilim


limitele valorilor reale ale parametrilor regresiei populaiei,
i .
5.2.7. Estimarea probabilit ii maxime
Odat fcut prezumia cu privire la faptul c valorile
reziduale sunt distribuite normal, devine posibil aplicarea
metodei probabilitii maxime pentru estimarea parametrilor
i ai regresiei. Se impune sublinierea a dou aspecte. n
primul rnd, estimarea probabilitilor maxime pentru i
se dovedesc a fi identice cu estimatorii OLS.
Astfel, n condiiile ipotezelor clasice, estimatorii
OLS sunt estimatori de probabilitate maxim.
132
Capitolul 5 Unele preciz ri privind modelul clasic
Aceasta nseamn c din toate valorile posibile pe
care necunoscutele i le-ar putea lua, cele care par cel
mai mult a fi generat un anumit eantion sunt cele obinute
atunci cnd se calculeaz estimatorii OLS.
n al doilea rnd, metoda conduce la un estimator
pentru cellalt parametru din cadrul modelului clasic cu dou
variabile, respectiv dispersia rezidualului,
2
, estimator de
forma:
n
e
i

2
2

(5.18)

2
i
e
reprezint suma ptratelor valorilor reziduale
OLS. ntruct una dintre proprietile acestor reziduali const
n aceea c suma lor i, prin urmare, media lor este zero, de
fapt aceasta este dispersia valorilor reziduale. Aceasta este
logic deoarece, dac considerm rezidualii ca fiind acei
estimatori care corespund unor perturbri necunoscute, este
natural s estimm dispersia perturbrii prin dispersia
rezidualului. Din pcate, nu este nedeplasat.
( )
2
2 2

n
n
E

(5.19)
5.3. Unele aspecte privind regresia
neliniar
Anterior am precizat proprietile estimatorilor OLS
i am indicat acele ipoteze clasice necesare n cazul fiecrei
proprieti. Apoi am vzut cum putem elabora inferene n
legtur cu parametrii de regresie ai populaiei, pornind de la
premisa c ipotezele clasice se susin. Nu se poate afirma c
133
Elemente de econometrie
exist o reprezentare corect a corelaiei reale ce se stabilete
ntre X i Y. De exemplu, s presupunem c relaia real
dintre X i Y prezint o form non-liniar, astfel c ecuaia
regresiei ar fi de forma:
E(Y) = + ln (X) (5.20)
Este clar c nu ne putem atepta ca estimatorii OLS
care se bazeaz pe o linie de regresie liniar, s ofere valori
sensibile pentru i . Similar, dac oricare dintre celelalte
corelaii non-liniare descrie adevrata corelaie a populaiei,
atunci i expresiile de calcul vor fi estimatori nevalabili. Mai
mult, nu ne putem atepta ca testul de verosimilitate s fie
valabil dac am definit greit linia regresiei ca fiind liniar.
Dac suntem siguri n legtur cu forma oricrei non-
lineariti din cadrul corelaiei la nivelul populaiei i suntem
n msur ca, printr-o simpl transformare, s elimin non-
linearitatea, atunci i aici se pot aplica tehnicile normale.
Dac am fost n msur s decidem asupra unei forme dublu-
nchis pentru curba Engel, atunci lucrnd n termeni de
variabile transformate X* = ln (X) i Y* = ln (Y), am putut s
covertim curba Engel ntr-o form linear i s calculm
ecuaia de regresie.
Dac suntem siguri n legtur cu specificaia non-
liniar pe care am ales-o atunci, nu numai c putem estima
parametrii populaiei de o manier satisfctoare dar putem,
de asemenea, s elaborm inferene n ceea ce-i privete. De
exemplu, s presupunem c n cazul curbei Engel am fi dorit
s verificm ipoteza conform creia elasticitatea cheltuielilor
pentru produse alimentare n raport cu cheltuielile totale este
mai mic dect unitatea. Aceasta presupune verificarea
ipotezei nule H
0
: = 1 n cadrul relaiei de dubl nchidere,
134
Capitolul 5 Unele preciz ri privind modelul clasic
n comparaie cu alternativa H
A
. Pentru elasticitatea necesar
a fost
364 , 0
^

, astfel c din blocurile construciei de baz
calculate mai jos, am obinut:
( ) 126 , 0 694 , 2 364 , 0 107 , 1


i
e
s
2
= 0,126/23=0,00549
Astfel, variaia estimat pentru
^

este:
005 , 0
2
^

s
49/7,403 = 0,000 742
Testul statistic este urmtorul:
55 , 23
027 , 0
1 364 , 0 1
^
^

s
ntruct valoarea absolut a testului statistic depete
cu puin o valoare critic t ( cu n 2 = 23 g.l.) de t
0,05
=
1,714, respingem ipoteza nul la nivelul de verosimilitate
0,05. Rezult c elasticitatea pentru produsele alimentare este
mai mic dect unitatea.
135
Capitolul 6
Inferen a statistic n
regresia simpl
n acest capitol vom prezenta cele mai semnificative
probleme legate de inferena statistic n cadrul modelului
simplu de regresie; cum sunt: testarea semnificaiei
parametrilor; definirea de intervale de ncredere; compararea
caracteristicilor a dou drepte de regresie; testarea
normalitii reziduului; predicia valorilor variabilei
rezultative; domenii de aplicare a regresiei simple; etc.
6.1. Aspecte privind testarea
semnifica iei modelului de regresie
Pentru testarea semnificaiei modelului liniar de
regresie sunt aplicate procedeele statistice: testul Student i
analiza variaiei.
n prezentarea celor dou procedee folosite pentru
testarea ipotezelor formulate asupra parametrilor modelului
de regresie facem precizrile:
- estimatorii parametrilor modelului liniar de regresie
sunt de dispersie minim n clasa estimatorilor nedeplasai;
- dac parametrii modelului sunt estimai prin metoda
celor mai mici ptrate, atunci dispersia reziduului se
estimeaz prin relaia:

n
i
i
e
n
1
2 2
2
1

(6.1)
Capitolul 6 Inferen a statistic n regresia simpl
Estimatorul varianei variabilei reziduale este un
estimator nedeplasat:
( )
2 2


E
- variabila rezidual urmeaz o repartiie normal
) , 0 (
2

N .
Pornind de la proprietile estimatorilor parametrilor
modelului liniar de regresie, estimatorii a
i b

sunt
combinaii liniare de variabile aleatorii repartizate normal.
Pentru definirea statisticilor sunt considerate
urmtoarele dou situaii:
dispesia variabilei reziduale este
cunoscut.
innd seama de expresiile celor doi estimatori,
rezult c acetia satisfac urmtoarele dou proprieti:
. 1 ,

,
) (
,
2
2 2
2
2

,
_

,
_

,
_

x
i
i
x
n
b N b
x x
a N a

(6.2)
Considernd proprietile repartiiei normale i
rezultatele de mai sus, se obin urmtoarele rezultate:
( )
( )
). 1 , 0 (
1

), 1 , 0 (
) (

2
2

N
n
x
n
b b b b
N
x x a a
a a
x
b
i
i
a

(6.3)
Aceste rezultate sunt utile pentru testarea unor ipoteze
formulate asupra parametrilor, precum i pentru definirea
137
Elemente de econometrie
intervalelor de ncredere aferente. Acestea sunt prezentate
pentru cazul care urmeaz.
dispersia variabilei reziduale nu este
cunoscut.
Pentru a defini statisticile folosite pentru testarea
semnificaiei parametrilor modelelor liniare de regresie se
ine seama de:
- dac
n i N x
i
,..., 1 ), 1 , 0 (
, atunci


n
i
n i
x z
1
2 2
;
- dac n i N x
i
,..., 1 ), , 0 (
2
, atunci

,
_

n
i
n
i
x
z
1
2
2
;

- dac
) 1 , 0 ( N x
i

iar
2
k
z , atunci
k
t
k z
x

/
.
n aplicaiile practice nu cunoatem dispersia
variabilei reziduale, aceasta este estimat prin relaia (6.1).
Lund n consideraie relaia de calcul a statisticii Student i
folosind cele trei proprieti, se obin rezultatele:
- pentru coeficientul pantei dreptei de regresie:
Pentru a testa H
0
: a a , cu alternativa H
0
: a a , se
ine seama de faptul c:
( )
( )
2
2

) (


n
e
x
i
i
a
t n
a a
x x a a
a a



(6.4)
- pentru termenul liber
138
Capitolul 6 Inferen a statistic n regresia simpl
Pentru a testa ipoteza nul H
0
: b b

, cu alternativa: H
1
:
b b

, se ine seama de faptul c:


( )
( )
.
1

2
2
2

n
i
i
b
t
x x
x
n
b b b b

(6.5)
Aceste dou rezultate sunt utile pentru testarea
semnificaiei i definirea intervalelor de ncredere pentru
cei doi parametri ai dreptei de regresie.
Testarea ipotezei nule cnd avem un prag de
semnificaie stabilit, dac 2 ; 2 /

>

n
a
t
a a

, atunci se respinge
ipoteza nul. Acest test este folosit pentru a stabili dac
dependena liniar dintre cele dou caracteristici este
semnificativ. n acest caz se testeaz H
0
: a=0, cu alternativa
H
1
:
0 a
. Se respinge ipoteza nul dac 2 ; 2 /

>
n
a
t
a

.
Definirea intervalului de ncredere: Pentru un
prag de semnificaie stabilit din tabelul repartiiei Student
se determin, pentru n-2 grade de libertate, valoarea
2 ; 2 / n
t
.
Pentru fiecare parametru se definete cte un interval
de ncredere.
- Pentru parametrul a, intervalul de ncredere este:
a n a n
t a a t a
2 ; 2 / 2 ; 2 /


+
(6.6)
- Pentru termenul liber se definete intervalul de
ncredere:
139
Elemente de econometrie
b n
b
n
t b b t b

2 ; 2 / 2 ; 2 /
+
(6.7)
Pentru a testa dac dependena liniar dintre cele dou
variabile este semnificativ, deci dac valoarea coeficientului
pantei este diferit de zero, se recurge i la analiza dispersiei.
Testm separat fiecare parametru al modelului de
regresie sau vom recurge la un procedeu pentru testarea
simultan a acestora. ntruct cei doi estimatori, a
i b

, nu
sunt variabile aleatorii independente, se apreciaz c testarea
succesiv a celor doi parametri nu este tocmai corect. Se
recomand testarea simultan a celor doi parametri. Vom
defini ipoteza testului:
0 0 0
, : b b a a H
0 0 1
, : b b a a H
Dac notm cu
)

, (

b a

estimatorul matricei de
covarian a estimatorilor parametrilor modelului liniar de
regresie, atunci definim:
2 ; 2
2 2 2
2
1
)

, (
1
,
)

( )

)( ( 2 ) (
2
1

2
1

1
1
]
1

+ +

,
_

,
_

,
_

n
i
i
b a
b a
F x b b b b a a x n a a n
b b
a a
b b
a a
F

(6.8)
Pentru testarea simultan a celor doi parametri, vom
nlocui n expresia lui F
a,b
pe a,b prin a
0
, b
0
. Pentru un prag de
semnificaie stabilit se citete din tabelul repartiiei Fisher
Snedecor valoarea
2 ; 2 ; n
F

.
Dac este ndeplinit inegalitatea F
calculat
> F
tabelat
,
atunci se respinge ipoteza nul, acceptnd c cel puin un
parametru difer semnificativ de valoarea specificat.
Analiza dispersiei este un procedeu statistic de testare
a calitii modelului ce pleac de la descompunerea varianei
140
Capitolul 6 Inferen a statistic n regresia simpl
totale n dispersie datorat factorului de regresie i dispersie
datorat aciunii factorilor nenregistrai.
Definim notaiile:
-


n
i
i
y y SPT
1
2
) (
reprezint suma ptratelor
termenilor seriei variabilei endogene;
-


n
i
i
y y SPE
1
2
) (
cuantific suma ptratelor
abaterilor termenilor estimai;
-

n
i
i
e SPR
1
2
) (
reprezint suma ptratelor erorilor
de estimaie.
ntre cei trei termeni se verific egalitatea
SPT = SPE + SPR (6.9)
Pentru fiecare termen din ultima egalitate se
determin numrul gradelor de libertate. Astfel, pentru cei
trei termeni acestea sunt egale cu n-1, n-2, 2-1.
Pentru a defini statistica testului se ine seama de
proprietatea variabilelor
2
, care arat astfel:
Dac x i z sunt dou variabile aleatorii independente
ce au repartiiile
2
cu k
2
grade de libertate, atunci:
2 1
;
2
1
/
/
k k
F
k z
k x
F
Din proprietatea estimatorului a
, rezult c:
( )
2
1
2 2
2
2

/
) (

,
_

x x
a a a a
i a
(6.10)
Din proprietile variabilei reziduale se obine:
141
Elemente de econometrie
2
2
2
2

n
i
i
e

(6.11)
Pentru a testa ipoteza nul
a a H :
0

se definete:
( )
) 2 , 1 (
) 2 /(
) (
2
2 2

n F
n e
x x a a
F
i
i
i
i
(6.12)
Se testeaz ipoteza nul a=0, potrivit creia variabila
exogen nu influeneaz n mod semnificativ valorile
caracteristicii endogene. Relaia testului este:
( )
) 2 , 1 (
) 2 /(

2
2 2

n F
n e
x x a
F
i
i
i
i
(6.13)
Pentru a determina o form echivalent a ultimei
statistici se ine seama de faptul c, sub ipoteza nul a
independenei celor dou caracteristici, termenii egalitii
(6.9) au expresiile:
( ) ( )

x xi a y y SPE
i
2 2

, iar
( )

i i
y y SPR
.
Testul F se scrie sub forma echivalent:
) 2 /(
1 /

n SPR
SPE
F
(6.14)
Din ultima relaie se deduce expresia statisticii F n
funcie de valoarea raportului de determinare R
2
:
) 2 (
1
2
2

n
R
R
F . (6.15)
Pentru a stabili dac dependena liniar dintre cele
dou variabile este semnificativ, se compar valoarea F
142
Capitolul 6 Inferen a statistic n regresia simpl
evaluat pentru seriile de date constituite pentru cele dou
caracteristici cu valoarea tabelat a acestei statistici. Dac
este ndeplinit inegalitatea:
) 2 ; 1 ( ; 1
>
n
F F

atunci se respinge ipoteza nul H
0
: a=0.
Pentru pragul de semnificaie se stabilete c ntre
cele dou variabile nu exist o dependen liniar
semnificativ.
Dac ntre cele dou variabile exist o dependen
liniar semnificativ, s-a demonstrat c R
2
= r
2
. n aceste
condiii, relaia (6.15) devine:
2
2
2
2
) 2 (
1

n
t n
r
r
F .
Rezult o nou statistic pentru testarea dependenei
liniare dintre cele dou variabile:
2
2
2
1

n
t n
r
r
t
.
6.2. Compararea modelelor de regresie
n practic se pune problema de a stabili dac diverse
modele liniare de regresie, ai cror parametri au fost estimai
pentru datele nregistrate la nivelul diverselor populaii,
difer semnificativ.
Considerm disponibile seriile de date
( )
n i i i
y x
, 1
,

i
( )
' , 1
' , '
n i i i
y x

pentru cele dou caracteristici statistice, n cazul
a dou populaii considerate.
Pe baza primei serii de valori s-au estimat parametrii
modelului liniar de regresie, precum i dispersia
coeficientului pantei:
- modelul liniar de regresie:
i i
x a b y

+ ;
143
Elemente de econometrie
- dispersia coeficientului pantei:
2

a
.
Pentru a doua populaie, procednd n mod
asemntor, se obin rezultatele urmtoare:
- dreapta de regresie estimat este
i i
x a b y ' ' '

' +
- dispersia coeficientului pantei este
2
'

Se pune problema de a stabili dac cele dou modele


de regresie au caracteristici diferite n raport cu coeficientul
pantei dreptei de regresie.
Pentru a testa dac cei doi coeficieni de regresie
difer semnificativ utilizm relaia:
2
'
2

'
a a
a a
t
+

(6.16)
Se definete variabila aleatorie d = a a pentru a
msura diferena dintre pantele celor dou drepte de regresie.
Pentru a stabili dac cele dou drepte au aceeai valoare a
pantelor de regresie definim:
- ipoteza nul a testului H
0
: d = 0, cu alternativa
H
1
: d 0 ;
- statistica testului:
d
d
t

.
Dac se ine seama de faptul c cei doi estimatori sunt
independeni, atunci statistica testului este:
2
'
2

a a
d t + (6.17)
Pentru a testa ipoteza nul se stabilete un prag de
semnificaie . Din tabelul repartiiei Student se determin
valoarea tabelat
2 /
t
. Dac valoarea calculat prin (6.17)
144
Capitolul 6 Inferen a statistic n regresia simpl
este mai mare dect
2 /
t
atunci se respinge ipoteza nul. Se
accept c cei doi coeficieni difer semnificativ.
6.3. Verificarea normalit ii reziduului
Testele folosite pentru verificarea unor ipoteze
formulate asupra parametrilor modelului de regresie, precum
i pentru definirea intervalelor de ncredere pentru acetia i
pentru efectuarea de previziuni pornesc de la verificarea
ipotezei repartizrii normale a reziduului.
Relaiile folosite pentru testarea caracteristicilor
repartiiei reziduului sunt definite innd seama de asimetria
i aplatizarea repartiiei normale.
Pentru o variabil aleatorie ce este repartizat normal
valoarea coeficientului de asimetrie este zero, iar a celui de
aplatizare este trei.
Se consider modelul liniar de regresie
n i ax b y
i i i
,..., 1 , + +
, i seria reziduului estimat
( )
n i i
e
, 1
, cu )

(
i i i
x a b y e + . Pentru seria reziduului se definesc
doi indicatori folosii n statistica descriptiv pentru analiza
asimetriei i aplatizrii unei serii de distribuie:
- coeficientul de asimetrie
3
2
2
3
1


- coeficientul de aplatizare
2
4
2


Pentru a defini testele statistice folosite pentru
verificarea repartizrii reziduului dup o distribuie normal
145
Elemente de econometrie
se utilizeaz urmtoarea proprietate a coeficienilor de
asimetrie i aplatizare:
Se consider variabila aleatorie ) , (
2
x
m N X .
Coeficienii de asimetrie i aplatizare calculai pentru o serie
de date cu n valori, ce este definit pentru aceast variabil,
satisfac proprietile de mai jos:

,
_

n
N
6
, 0

2 / 1
1

,
_

n
N
24
, 3

Pentru a verifica ipoteza nul a repartizrii normale a


reziduului
( )
n i i
e
, 1
se recurge la unul dintre testele:
- teste pentru verificarea asimetriei i aplatizrii
distribuiei reziduului estimat;
- testul Jarque Bera.
Pe baza seriei estimate se verific dac aceast
distribuie este normal repartizat. Folosind aceast serie, se
estimeaz cei doi coeficieni prin
2 / 1
1

, respectiv
2

.
Sub ipoteza nul, H
0
:
1
= 0, rezult:
( ) 1 , 0
6

2 / 1
1
N
n
S

.
Asemntor, dac se definete ipoteza nul asupra
celui de-al doilea coeficient sub forma H
0
:
2
=3, atunci:
( ) 1 , 0
24
3

2
N
n
K


146
Capitolul 6 Inferen a statistic n regresia simpl
Se accept ipoteza nul potrivit creia reziduul este
uniform repartizat, dac sunt ndeplinite simultan
inegalitile:
2
1

< t S
i
2
1

< t K
,
unde
2
1

t
este valoarea cuartilei repartiiei N(0,1)
pentru pragul de semnificaie .
Testul Jarque Bera permite verificarea simultan a
proprietilor de asimetrie i aplatizare ale seriei
reziduurilor.
Testul este definit n raport cu cei doi coeficieni
2 / 1
1


i
2

, innd seama de repartiia estimatorilor acestora,


rezultnd:
2
2
2
2
2
2 / 1
1
24
3

,
_

,
_


n n
B J .
Sau sub forma echivalent:
( )
2
2 1
3

24 6
+
n n
B J
Pentru un prag de semnificaie se respinge ipoteza
nul a repartizrii normale a variabilei reziduale, dac este
ndeplinit inegalitatea:
2
1 ; 2


> B J
.
147
Elemente de econometrie
6.4. Predic ia prin modelul de regresie
Pe baza seriei de date
( )
n i i i
y x
, 1
,

s-au estimat
parametrii dreptei de regresie. Se obine seria valorilor
estimate pentru variabila endogen prin intermediul relaiei:
n i x a b y
i i
, 1 ,

+
n procesul de previziune, folosind modelul liniar de
regresie, se pune problema de a rezolva urmtoarele dou
probleme:
- efectuarea de previziuni punctuale sau prin
intervale de ncredere. Se recurge, pentru efectuarea
primei previziuni, la metoda punctual, iar n cel de-al
doilea caz, la previziunea printr-un interval de
ncredere;
- verificarea ncadrrii unor puncte n tendina
postulat de un model de regresie. Dac sunt
precizate valori pentru cele dou caracteristici ale
modelului de regresie, sub forma perechii (x
0
,y
0
), se
pune problema de a stabili dac acestea se ncadreaz
n trendul definit de modelul de regresie. Vom
verifica dac valoarea caracteristicii endogene se
ncadreaz n intervalul de previziune ce a fost definit
pentru un nivel al caracteristicii exogene i un prag de
semnificaie.
Vom efectua previziuni punctuale sau prin interval de
ncredere pentru o valoare a caracteristicii endogene y
0
sau
pentru media acesteia, E(y
0
). Pentru fiecare caz n parte sunt
stabilite diverse formule de calcul pentru previziunea
punctual i cea prin interval de ncredere.
Pentru modelul liniar de regresie valoarea real a
caracteristicii endogene este specificat prin intermediul
relaiei:
148
Capitolul 6 Inferen a statistic n regresia simpl
0 0 0
+ + ax b y
(6.18)
unde
0

este realizarea unei repartiii normale de


medie zero i dispersie egal cu unu.
Valoarea punctual estimat prin modelul liniar de
regresie este definit prin relaia:
0 0

x a b y +
De regul, aceast valoare este utilizat pentru
definirea unui interval de ncredere. Pentru a defini intervalul
de ncredere, n condiiile n care se specific un nivel al
pragului de semnificaie, se ine seama de faptul c, prin
utilizarea modelului liniar de regresie pentru definirea
previziunii punctuale, se comite o eroare de predicie egal
cu:
0 0
0 0 0
) ( )

+ +

x a a b b
y y e
(6.19)
Lund n considerare proprietile celor doi estimatori
ai parametrilor dreptei de regresie, vom prezenta n cele ce
urmeaz, principalele proprieti ale erorii de previziune.
Media erorii de previziune este egal cu zero. Se
definete egalitatea:
E(e
0
)=0
Rezultatul de mai sus este evident dac se aplic
operatorul de medie termenilor egalitii (6.19), lund n
considerare proprietile celor doi estimatori i ipoteza
formulat asupra variabilei reziduale.
Dispersia erorii de previziune comise n cazul n care
se dorete efectuarea unei previziuni pentru valoarea
caracteristicii endogene y
0
este:
149
Elemente de econometrie
( )
( )
( )
1
1
1
]
1

+ +

i
i
x x
x x
n
e
2
2
0 2
0
1
1 var

(6.20)
Pentru a obine expresia varianei erorii de previziune
se aplic dispersia termenilor egalitii (6.19). Se obin
rezultatele urmtoare:
( )
( )
( )
1
1
1
]
1

+ +
1
1
]
1

,
_

+ +
+ + +

i
i
xx xx xx
x x
x x
n
S
x
x
S
x
n
x
S
b a x e a x b e E e
2
2
0 2
0
2
2
0
2
0
2
0
2
0 0
1
1
2
1 1
)

, cov( 0 2 ) var( ) var( )

var( ) ( var

Pentru construirea unui interval de predicie pentru


valoarea variabilei endogene, n condiiile n care se fixeaz
un nivel al caracteristicii exogene, se ine seama de
urmtoarele dou rezultate:
2
0 0
0 0

) 1 , 0 (

n
p
t
y y
N
y y

(6.21)
Am notat prin
p

estimatorul abaterii medii standard


a erorii de previziune comise n cazul n care se efectueaz o
previziune pentru mrimea y
0
. Aceasta este calculat prin
relaia urmtoare:
150
Capitolul 6 Inferen a statistic n regresia simpl
( )
( )

+ +
i
i
x x
x x
n
2
2
0
1
1


(6.22)
Dac se fixeaz un anumit prag de semnificaie ,
atunci vom defini intervalul de predicie pentru y
0
:
( )
( )
( )
( )

+ + + < <

+ +
i
i
i
i
x x
x x
n
t y y
x x
x x
n
t y
2
2
0
2 / 0
2
2
0
2 /
1
1
1
1


(6.23)
Pentru un prag de semnificaie stabilit, mrimea
intervalului de predicie este funcie de urmtoarele mrimi:
- valoarea caracteristicii exogene pentru care se
previzioneaz valoarea caracteristicii endogene.
Acest factor se cuantific prin termenul ( )
2
0
x x ;
- numrul de termeni ai seriei ce au fost folosii
pentru estimarea parametrilor modelului liniar de
regresie. Eroarea de previziune este invers
proporional cu n;
- calitatea modelului de regresie ce este cuantificat
prin dispersia variabilei reziduale;
- valoarea pragului de semnificaie.
n situaia n care se efectueaz o previziune asupra
valorii medii E(y
0
), n condiiile n care se stabilete o valoare
a caracteristicii exogene, dispersia erorii de previziune este:
( )
( )
1
1
1
]
1

i
i
x x
x x
n
e
2
2
0 2
0
1
) var(

(6.24)
Pentru demonstrarea ultimei relaii se ine seama de
faptul c eroarea de previziune ce se comite n acest caz este:
151
Elemente de econometrie
0 0
0 0 0
) ( )

(
) (
+ +

x a a b b
y y E e
Aplicnd operatorul de medie termenilor egalitii de
mai sus, se obine formula (6.24).
6.5. Metoda lui W.F. Sharpe (alegerea
portofoliului)
Aceast metod se mai regsete n teoria economic
sub numele de metoda beta. Aceast metod are o larg
utilizare n studiul riscului unei aciuni. n cadrul acestei
metode, riscul se identific prin variaia randamentului
acesteia. Astfel, cu ct randamentul portofoliului are un grad
mai mare de variaie, cu att riscul acestuia este mai mare. Se
va nota prin R
t
randamentul total al unei aciuni la un moment
dat, iar prin i
t
se noteaz variaia indicelui de la o perioad
la alta. Acesta este un element al modelului de regresie
Sharpe.
Pentru a alege funcia de regresie se reprezint
grafic, n sistemul cartezian de axe, punctele (R
t
, i
t
) pentru
toate perioadele t. se genereaz un nor de puncte ce st la
baza formrii dependenei dintre cele dou variabile.
Dac aceste puncte sunt aliniate de-a lungul unei
drepte, atunci dependena dintre cele dou variabile este
liniar:
Rt = + i
t
+
t
(6.25)
unde:
- parametrul cuantific componenta din
randamentul total al aciunii independent de
variaia indicelui caracteristicii exogene din
modelul liniar de regresie;
152
Capitolul 6 Inferen a statistic n regresia simpl
- parametrul stabilete n ce msur modificarea
indicelui caracteristicii exogene cu un procent
determin creterea sau scderea randamentului
aciunii;
-
t
reprezint variabil rezidual a modelului liniar
de regresie, ce cuantific variaia aleatorie a
randamentului aciunii sub aciunea altor factori
dect cel nregistrat.
Prin intermediul acestui model, factorii ce acioneaz
asupra randamentului aciunilor sunt mprii n dou clase:
- factori macroeconomici, ce acioneaz, ntr-o
msur mai mare sau mai mic, asupra tuturor
aciunilor: rata inflaiei din economie, indicatorii
de performan ai mediului economic sau ai
pieelor financiare etc. Dintre aceti factori este
ales cel n funcie de care definim modelul liniar
de regresie;
- factori microeconomici, ce acioneaz asupra
randamentului unei aciuni sau unui grup de
aciuni. Aceti factori sunt cuantificai n cadrul
modelului prin intermediul variabilei reziduale.
Pentru estimarea celor doi parametri ai dreptei de
regresie se recurge la metoda celor mai mici ptrate. Pentru
definirea estimatorilor se ine seama de faptul c variabila
rezidual (
t
) satisface urmtoarele ipoteze:
- fiecare variabil rezidual are sperana matematic
nul, deci E(
t
) = 0;
- variabilele
t
i
t
sunt necorelate, ntruct se
admite ipoteza de necorelare a riscurilor specifice
ale aciunilor din cadrul portofoliului, luate dou
cte dou;
153
Elemente de econometrie
- variabilele reziduale sunt distribuite normal:
m t N
t
, 1 ) ( ), , 0 (

.
n urma aplicrii metodei celor mai mici ptrate se
determin un estimator al coeficientului de volatilitate ()
prin relaia:

t
t
t
i R
2
) , cov(

(6.26)
unde:
-
t

este coeficientul liniar de corelaie calculat


pentru a msura dependena liniar dintre randamentul
aciunii i indicele pieei;
-
t

reprezint abaterea standard calculat n cazul


randamentului aciunii;
-

este abaterea standard a indicelui pieei


financiare.
n funcie de valoarea parametrului , sunt identificate
urmtoarele tipuri de aciuni:
- dac < 0, atunci randamentul aciunii evolueaz
diferit n raport cu tendina general a pieei
financiare;
- n situaia n care
) 1 , 0 (
, atunci aciunea are o
volatilitate redus. n acest caz variaia
randamentului aciunii este mai redus n raport cu
modificarea indicelui pieei de la o perioad la
alta. Astfel, un exemplu de aciune puin volatil
este n cazul n care indicele pieei se modific cu
8%, n condiiile n care variaia randamentului
aciunii este de 5%;
- n cazul n care = 1 aciunea este neutr. Pentru
o aciune neutr randamentul se modific n
154
Capitolul 6 Inferen a statistic n regresia simpl
aceeai proporie cu indicele pieei financiare. De
exemplu, dac indicele pieei financiare
nregistreaz o variaie de 2%, atunci i
randamentul aciunii va nregistra aceeai cretere;
- dac > 1, atunci aciunile au o volatilitate
ridicat. Aciunile din aceast clas au o
sensibilitate ridicat la variaiile de ansamblu ale
pieei financiare. Aceste aciuni prezint un interes
sporit pentru speculatorii de pe pieele financiare.
n acest caz riscul aciunii este deosebit de mare.
De exemplu, la o variaie cu 3% a indicelui pieei,
pentru aciunile acestei clase se nregistreaz o
variaie a randamentului mai mare de 3%.
n practica financiar, rezultatele oferite de aceast
metod sunt privite cu rezerv, ntruct, n timp ce parametrul
se calculeaz pe baza unei serii de date din trecut, riscul se
refer la o perioad viitoare.
6.6. Metoda regresiei globale
Aceast metod se fundamenteaz pe ipoteza c
randamentul unei aciuni oscileaz n raport cu variaia
randamentului global al pieei pe care se tranzacioneaz
sau n raport cu performanele de ansamblu ale mediului
economic.
Astfel, dac dependena este de tip liniar, atunci
ecuaia de regresie este:
n j iRP R
ij j i ij
, 1 , + +
(6.27)
unde:
- RP
j
reprezint randamentul global al pieei la un
moment dat;
-
i
,
i
sunt parametrii modelului de regresie ce este
definit pentru aciunea A
i
; Parametrul
i
, panta
155
Elemente de econometrie
dreptei de regresie, msoar n ce msur
oscilaiile nregistrate de piaa financiar sunt
resimite la nivelul aciunii A
i
.
Pentru fiecare aciune, variabila rezidual ce
cuantific variaiile randamentului aciunii A
i
sub influena
altor factori dect modificrile randamentului global al pieei,
satisface urmtoarele ipoteze:
- toate variabilele aleatorii ij

sunt variabile care au


media egal cu zero. Astfel, E( ij

)= 0 pentru toi indicii j;


- variabilele reziduale ce intervin n definirea
modelului liniar de regresie au proprietatea de
homoscedasticitate. Astfel,
2
) var(
i ij

pentru orice indice j;
- variabilele reziduale ale modelului liniar de regresie
sunt liniar independente. n aceast situaie
0 ) , cov(
ik ij

pentru orice j k. vom spune c riscurile specifice ale
oricror dou aciuni sunt necorelate;
- oricare variabil rezidual nu este corelat cu
randamentul global al pieei:
0 ) , cov( RP
ij

pentru orice
indice j.
Pentru modelul de regresie definit pentru o anumit
aciune a portofoliului sunt stabilite o serie de proprieti.
Acestea sunt utile n interpretarea rezultatelor obinute prin
aplicarea modelului regresiei globale.
- Pentru fiecare aciune din cadrul unui portofoliu
se definete urmtoarea egalitate:
) ( ) ( RP E R E
i i i
+
(6.28)
Aceast proprietate arat c, pentru fiecare aciune,
dreapta de regresie trece prin centrul de greutate al norului de
puncte. Aceasta este de fapt o proprietate universal valabil
pentru orice model liniar de regresie.
156
Capitolul 6 Inferen a statistic n regresia simpl
- Dispersia oricrei aciuni se descompune n dou
componente, cea datorat aciunii factorului sistematic, pe de
o parte, i cea datorat factorilor aleatorii, pe de alt parte.
Aplicnd operatorul de dispersie termenilor egalitii
(6.27), se obine rezultatul urmtor:
[ ]
2 2 2
2
2 2
) ( ) ( ) ( ) var(
i
p i
ij
ij j i
i
j i i i
RP RP E R R E R



+
+
(6.29)
Ultimul termen al relaiei de mai sus pune n eviden
faptul c riscul total al unei aciuni se descompune n dou
componente: cea datorat riscului sistematic, pe de o parte, i
cea datorat riscului ce rezult din schimbri aleatorii. n
aceste condiii se scrie urmtoarea egalitate:
2 2 2 2
i
p i i
+
(6.30)
Riscul total = riscul sistematic + riscul accidental
- Covariana randamentelor a dou aciuni oarecare
din cadrul portofoliului este o mrime influenat n mod
direct de doi factori: coeficienii modelelor liniare de regresie
ce sunt definite pentru dou aciuni i dispersia
randamentului total al pieei. Se calculeaz covariana
aciunilor unui portofoliu prin urmtoarea relaie:
2 2
t p k kp

(6.31)
Pentru a obine relaia (6.31) se ine seama de formula
de calcul a covarianei, de forma modelului liniar de regresie
i de ipotezele formulate asupra variabilei reziduale. n aceste
condiii se obin succesiv urmtoarele rezultate:
2
,
2
,
2
,
2
2
2
)] )( [( )] )( ( [
)] )( ( [ ] ) ( [
)] )( [( ) , cov(
p k RP k p RP p k p p k
k
kj
p
pj j
k
kj p
p
pj j k j p k
p
pj
k
kj kp k
E RP RP E
RP RP E RT RT E
R R R R E Rp R



+ + +
+
+ +

157
Elemente de econometrie
Potrivit ipotezelor formulate mai nainte rezult c:
0
2 2
,
2
,

p k RP p RP k

nlocuind aceste rezultate n formula covarianei se


obine relaia (6.31).
Pentru fiecare dreapt de regresie (6.28) parametrii
i i
, sunt estimai prin metoda celor mai mici ptrate innd
seama de seria randamentelor aciunilor i ale pieei
financiare nregistrate ntr-o perioad trecut.
Se stabilesc n cele ce urmeaz relaiile de calcul ce
exist ntre parametrii modelului de regresie al fiecrei
aciuni, definit n funcie de caracteristica pieei financiare
sau a mediului economic, i parametrii modelelor de regresie
definite pentru un portofoliu. Se consider aciunile din
structura portofoliului ca fiind A
1
,,A
m
.
- Pentru randamentul mediu al portofoliului
caracterizat prin vectorul de structur f definim relaia:
) ( ) ( RP E RT E
T T
+
unde



n
i
i i T
n
i
i i T
f f
1 1
,
.
Aceast egalitate se deduce fr dificultate dac inem
seama de relaia (6.29) i de structura portofoliului. Lund n
considerare cele dou elemente, se obine pentru fiecare
aciune din portofoliu:
) ( ) ( RP E f f R E f
i i i i i i
+
.
Pentru toate aciunile se adun aceste relaii. Apoi, din
formula de calcul a mediei aritmetice, se obine relaia de mai
sus.
- Riscul total al portofoliului, msurat prin dispersia
randamentului ntr-un orizont de timp, este constituit din
riscul sistematic, la care se adaug riscul aleatoriu ce se
manifest la nivelul pieei financiare.
158
Capitolul 6 Inferen a statistic n regresia simpl
innd seama de relaia de calcul a riscului
portofoliului i de relaiile (6.30) i (6.31) se obin rezultatele
urmtoare:


>

>

+
+

,
_

,
_

+
+ +
m
i
i i T T
j T
m
i
i
m
i
i i
m
i
i i
m
i
m
j
T j i j i
m
j i
j i
T j i j i
n
i
j i
j i
m
i
i i p ij j i i i T
f
j f f f f f
f f fi f f f
1
2 2 2 2
2
1 1 1
2 2
1 1
2
1 ,
2
1 1 , 1
2 2 2 2 2 2
) ( 2




.
Riscul portofoliului se descompune n cele dou
componente conform egalitii urmtoare:

+
m
i
i i T T T
f
1
2 2 2 2 2


(6.32)
Risc total = risc sistematic + risc aleatoriu
Pentru determinarea unui portofoliu optim n situaia
n care se specific un nivel al randamentului, se rezolv
urmtoarea problem de optimizare:

'

1
) ( ) (
,...,
) [min](
1
1
1
2
i
m
i
i i P
m
i
i i
m
T
f
f
R E f RT E
f f

(6.33)
159
Elemente de econometrie
Prin intermediul regresiei globale se reduce n mod
simitor numrul operaiilor ce sunt necesare pentru
calcularea randamentului global i riscului total.
160
Capitolul 7
Modelul clasic al
regresiei multiple
Situaia n care corelaiile economice implic numai
dou variabile se ntlnete foarte rar. Mai degrab ne
confruntm cu situaii n care o variabil dependent, Y,
poate depinde de o ntreag serie de variabile factoriale sau
regresori. De exemplu, cererea pentru o marf nu depinde
numai de preul acesteia ci i de preurile mrfurilor
substituente sau complementare, de nivelul general al
preurilor precum i de resursele consumatorilor. Astfel, n
practic, exist, n mod normal, corelaii de forma:
Y =
1
+
2
X
2
+
3
X
3
+
4
X
4
+...+
k
X
k
+ (7.1)

unde valorile X
j
(j = 2, 3, ..., n) reprezint variabilele
factoriale, sau regresorii, valorile
j
(j = 1, 2, 3, ...,k)
reprezint prametrii de regresie iar reprezint factorul
factor rezidual.
Factorul rezidual reflect natura aleatorie a reaciei
umane i a oricror ali factori, alii dect X
j
, care ar putea
influena variabila Y.
A se observa c n (7.1) am adoptat notaia uzual,
respectiv atribuind primului factor notaia X
2
, celui de al
doilea notaia X
3
etc. De fapt, dup cum vom vedea, uneori
este convenabil ca parametrul s fie considerat acel
Econometrie Teorie i studii de caz
coeficient al unei variabile X
1
a crui valoare este ntotdeauna
egal cu unitatea. Atunci devine posibil ca (7.1) s se rescrie
sub forma:
Y =
1
X
1
+
2
X
2
+
3
X
3
+...+
k
X
k
+ (7.1a)
7.1. Metoda celor mai mici p trate
(OLS

) n regresia multipl
Dac presupunem, ca i n cazul regresiei cu dou
variabile, c E() = 0, atunci, nlocuind n (7.1), pentru valori
date ale variabilelor X, rezult:
E(Y)=
1
+
2
X
2
+
3
X
3
+
4
X
4
+...+
k
X
k
(7.2)
Ecuaia (7.2) este cunoscut sub denumirea de
ecuaia de regresie multipl. Pentru moment, n mod
convenional, considerm c este de form liniar. Spre
deosebire de cazul regresiei cu dou variabile, nu putem
reprezenta aceast ecuaie printr-o diagram cu dou
dimensiuni.

J
reprezint parametrii de regresie. Uneori mai
sunt denumii i coeficieni de regresie.
1
este o
constant (intercept) iar
2
,
3
etc., sunt parametri ai
pantei regresiei.
De reinut faptul c
4
, de exemplu, msoar efectele
asupra E(Y) produse de modificarea cu o unitate a lui X
4
, n
condiiile n care toate celelalte variabile factoriale rmn
constante. Similar,
2
msoar efectele asupra E(Y) produse
de modificarea cu o unitate a lui X
2
, n condiiile n care toate
celelalte variabile factoriale rmn constante.

Ordinary best squares


162
Capitolul 7 Modelul clasic al regresiei multiple
ntruct ecuaia regresiei populaiei este necunoscut,
aceasta trebuie estimat pe baza datelor unui eantion.
Presupunem c avem la dispoziie un eantion de n
observri, fiecare observare coninnd valori att pentru
variabila dependent Y ct i pentru fiecare dintre variabilele
factoriale X. Vom scrie valorile pentru observarea i sub
forma:
Y
i
,

X
2i
, X
3i
, X
4i
,..., X
ki
Astfel, de exemplu, X
37
reprezint valoarea lui X
3
n
cea de a 7-a observare iar X
24
reprezint valoarea luat de X
2
n cea de a 4-a observare. De o manier similar, Y
6
reprezint valoarea variabilei Y n cea de a 6-a observare etc.
n condiiile n care se presupune c datele
eantionului au fost generate prin corelaia populaiei (7.1),
fiecare obvservare trebuie s implice un set de valori care s
satisfac (7.1).
Prin urmare, putem scrie:
Y
i
=
1
+
2
X
2i
+
3
X
3i
+ ...+
k
X
ki
+
i
pentru toate valorile ,
unde
i
reprezint valoarea rezidualului pentru
cea de a i-a observare.
(7.3)
Este mai convenabil s rescriem (7.3) sub o form
matriceal simpl, respectiv:
Y = X + (7.4)
unde putem utiliza forma vectorial (matriceal):
163
Econometrie Teorie i studii de caz
Y =
,
.
.
.
3
2
1

,
_

i
Y
Y
Y
Y
X =

,
_

ki i i
k
k
k
X X X
X X X
X X X
X X X
... 1
.
.
... 1
... 1
... 1
3 2
3 33 23
2 32 22
1 31 21
, =

,
_

.
.
.
3
2
1
,
=

,
_

.
.
.
3
2
1
X este o matrice de forma n x k coninnd o coloane
cu valorile i apoi toate valorile eantionului de k 1, X
variabile. Astfel, cea de a patra coloan a lui X, de exemplu,
conine valorile lui X
4
ale eantionului n, cea de a aptea
coloan conine valorile lui X
7
i aa mai departe. este un
vector al coloanei k x 1 care conine parametrii
j
iar este
un vector al coloanei n x 1 care conine valorile rezidualului.
Presupunem c datele eantionului au fost utilizate
pentru estimarea ecuaiei de regresie.
164
Capitolul 7 Modelul clasic al regresiei multiple
Metoda de estimare rmne neprecizat i
presupunem c a fost estimat printr-o ecuaie
de regresie a eantionului , pe care o scriem
sub forma:
k k
X X X Y
^
3 3
^
2
^
2 1
^ ^
... + + + +
,
unde
j
^

reprezint estimatori pentru


j
iar
^
Y

este cunoscut ca valoare previzionat a lui Y.
(7.5)

Dac lum a i-a observare a eantionului i nlocuim
valorile sale X n (7.5) atunci, ntruct
j
^

reprezint estimri
cunoscute, obinem o valoare previzionat pentru Y aferent
celei de a i-a observri, respectiv valoarea
i Y
^
. Ca i n cazul
regresiei cu dou variabile, obinem o valoare previzionat a
lui Y pentru fiecare observare din cadrul eantionului.
Aceste valori pot fi scrise sub forma:
ki ki i i
X X X Y
^
3 3
^
2
^
2 1
^ ^
... + + + +
(7.6)
, pentru toate valorile i
Valorile efective ale lui Y nu vor coincide
cu valorile previzionate ale lui Y i, ca i n
cazul regresiei cu dou variabile, diferenele
dintre acestea sunt cunoscute ca valori
reziduale.
i i i
e Y Y +
^
pentru toate valorile i
unde e
i
reprezint rezidualul corespunztor celei
de a i-a observri.
(7.7)
165
Econometrie Teorie i studii de caz
Ecuaia (7.7) este de fapt identic cu relaia aferent
regresiei cu dou variabile ns, la modul general nu am fost
n msur s ilustrm grafic e
i
. Utiliznd (7.6) putem rescrie
(7.7) sub forma:
Y
i
=
i ki ki i i
e X X X + + + + +
^
3 3
^
2
^
2 1
^
...
(7.8)
pentru toate valorile i
Ecuaia (7.8) mai poate fi scris i sub form
matriceal astfel:
e X Y +
^

(7.9)
unde X i Y sunt deja definite iar :

,
_

.
.
.

3
2
1
^
,

,
_

n
e
e
e
e
e
.
.
.
3
2
1
Exist dou aspecte ce trebuie reinute referitor la
valorile reziduale. n primul rnd, indiferent de metoda
utilizat pentru a estima ecuaia regresiei (7.2), vom obine
astfel de valori reziduale cte una pentru fiecare dintre
166
Capitolul 7 Modelul clasic al regresiei multiple
observrile eantionului. n al doilea rnd, deoarece odat
(7.2) estimat,
j
^

devine cunoscut iar ecuaia (7.8) poate fi


utilizat pentru calcularea acestora. Ca i n cazul regresiei cu
dou variabile, valorile reziduale sunt cunoscute.
Cea mai cunoscut metod de estimare n cazul
regresiei multiple este metoda celor mai mici ptrate. Ca i
n cazul regresiei cu dou variabile, alegem funcia de
regresie a eantionului i minimizm suma ptratelor
valorilor reziduale.
Aceasta nseamn c selectm acele valori pentru
k
^
3
^ ^
2 1
^
... , ,
din (7.5) care s minimizeze relaia:
2
^
2


,
_


i i i
Y Y e S (7.10)
unde
i Y
^
este dat de (7.6).
Minimizarea ecuaiei (7.10) implic calcularea
diferenialului lui S n raport cu fiecare
j
^

pe rnd.
Aceasta este complicat n termeni de algrebr obinuit astfel
nct este mai bine ca n aceast etap s lucrm n termeni
matriceali. Reinem c
e e e
i
'
2

. Astfel, utiliznd (7.9),


rezult urmtoarele relaii:
167
Econometrie Teorie i studii de caz

,
_

,
_


^ ^
' ' X Y X Y e e S
=

,
_

,
_

^ ^
' ' ' X Y X Y
=
^ ^ ^ ^
' ' ' ' ' ' X X X Y Y X Y Y +
=
^ ^ ^
' ' ' ' 2 ' X X Y X Y Y +

(7.11)
unde ultimul pas este posibil deoarece
^ ^
' ' ' X Y Y X
sunt scalari.
Acum trebuie s calculm difereniala pentru (7.11) n
raport cu vectorul
^

i egalm rezultatul cu zero. O astfel de


matrice conduce la relaia:
0 ' 2 ' 2
^
^
+

X X Y X
S
(7.12)
Ecuaia (7.12) reprezint un set de ecuaii k care se
pot scrise sub forma:
Y X X X ' '
^

(7.13)
Ecuaiile
Y X X X ' '
^

sunt ecuaii normale n cazul
regresiei multiple i sunt analoage cu ecuaiile aferente
regresiei cu dou variabile. Reinem c dac l substituim pe
Y din (7.13) utiliznd (7.9), obinem:
168
Capitolul 7 Modelul clasic al regresiei multiple
e X X X e X X X X ' ' ' '
^ ^ ^
+

,
_

+
Prin urmare:
Xe = 0 (7.14)
Din definiiile pentru X i e se poate observa c (7.14)
presupune urmtoarele:
0
i
e
,
0
2

i i
X e
,
, 0
3

i i
X e

0
4

i i
X e
etc.
(7.14a)
Astfel, una dintre proprietile metodei estimatorilor
OLS const n aceea c valorile reziduale care rezult satisfac
corelaiile (7.14a). Reamintim c exist o corelaie similar i
n cazul regresiei cu dou variabile.
Impunnd condiia ca matricea XX s fie non-
singular, ecuaiile normale (7.13) pot fi rezolvate pentru a
obine
^

, respectiv vectorul pentru estimatorii uzuali ai celor


mai mici ptrate (OLS). Multiplicnd (7.13) cu (XX)
-1
obinem:
( ) ( ) Y X X X X X X X ' ' ) ' '
1
^
1

Prin urmare:
( ) Y X X X ' '
1
^


(7.15)
169
Econometrie Teorie i studii de caz
Ecuaia (7.15), care este expresia estimatorilor OLS n
cazul regresiei multiple, este cea mai cunoscut formul din
econometrie.
Pentru a calcula vectorul
^

trebuie s parcugem
urmtoarele etape:
(i) formm matricea k x k pentru XX
i matricea k x 1 pentru XY;
(ii) formm matricea invers k x k
pentru (XX)
-1
;
(iii) multiplicm matricea k x k pentru
(XX)
-1
n matricea k x 1 pentru XY.
Etapa (iii) de mai sus conduce la vectorul k x 1 al
estimrilor OLS,
^

.
Etapa (ii) implic cel mai mare efort de calculaie.
Chiar i cu numai dou variabile factoriale X, k = 3, ne
confruntm cu inversarea unui numr de 3 x 3 matrici. Pe
msur ce numrul variabilelor factoriale crete, dificultatea
calculului crete exponenial. Din aceast cauz, calcularea
expresiei (7.15) este n mod normal sarcina unui. Sunt
disponibile pachete de estimatori OLS gata calculai pe
computer.
Efortul de calcul implicat de obinerea estimatorilor
OLS poate fi diminuat dac lucrm n termeni de abatere a
variabilelor de la media lor. Dup cum vom vedea, rezult c
n loc de a rsturna o matrice k x k, aa cum este indicat n
etapa (ii) de mai sus, trebuie s rsturnm o matrice numai de
ordinul (k - 1) x (k 1).
S considerm din nou ecuaia (7.8). Dac nsumm
aceast ecuaie pentru toate valorile i i mprim rezultatul la
n, obinem:
170
Capitolul 7 Modelul clasic al regresiei multiple
e X X X Y k
k
+ + + + +
^
3
3
^
2
^
2 1
^
...
(7.16)
Trebuie s reamintim faptul c una dintre proprietile
metodei OLS de estimare este aceea c
i
e
i, prin urmare,
e
, este egal cu zero. Aa dar, dac ndeprtm (7.16) din
(7.8), obinem:
i ki k i i i
e x x x y + + + +
^
3 3
^
2 2
^
...
(7.8a)
pentru toate valorile i
unde literele scrise cu minuscule reprezint abaterile
variabilelor de la mediile lor. Aceasta nseamn c
Y Y y
i i
iar 2
2 2
X X x
i i
etc.
Putem scrie
Y
i
=
i ki ki i i
e X X X + + + + +
^
3 3
^
2
^
2 1
^
...
ntr-o
form similar cu
e X Y +
^

, respectiv:
y = x
^

+ e (7.9a)
n aceast variant definim matricele aferente lui y ,
x i
^

sub forma:
171
Econometrie Teorie i studii de caz
y

,
_

n
y
y
y
y
.
.
.
3
2
1
, x =

,
_

kn n n n
k
k
k
x x x x
x x x x
x x x x
x x x x
...
.. .......... ..........
...
...
...
4 3 2
3 43 33 23
2 42 32 22
1 41 31 21
,
^

,
_

^
^
^
^
4
3
2
.
.
.
k

Ecuaia y = x
^

+ e difer de
e X Y +
^

prin aceea
c valorile variabilelor sunt acum ntr-o form deviat,
coloanele unora dintre ele nu apare n matricea x, care este de
ordinul n x (k 1) iar
1
^

nu mai apare deloc n vectorul


^


care, acum, este de ordinul (k 1) x 1. vectorul e rmne ca
n definiia precedent.
Problema este c, ntruct definiia lui e rmne
neschimbat, suma ptratelor valorilor reziduale este n
continuare ee i, utiliznd (7.9a) poate fi exprimat ntr-o
form similar lui (7.11), excepie fcnd faptul c matricele
x i y nlocuiesc matricele X i Y.
Fcnd difereniala n raport cu vectorul
^


redefinit conduce la o expresie similar lui (7.15), cu
excepia faptului c valorile variabilelor se prezint ntr-o
form modificat. Aceasta nseamn c:

^

(xx)
-1
xy
172
Capitolul 7 Modelul clasic al regresiei multiple
Avantajul prezentat de

(xx)
-1
xy fa de
( ) Y X X X ' '
1
^


const n aceea c matricea (xx) este de
ordinul (k 1) x (k 1) fa de k x k. Singura problem care
se ridic este aceea c noul vector
^

nu mai conine o
valoare pentru
1
^

. Din moment ce
^

este cunoscut, se poate


obine o valoare pentru
1
^

prin re-aranjarea ecuaiei (7.16),


pentru c
0 e
:
k
k
X X X Y
^
3
3
^
2
2
^
1
^
...
(7.17)
Sintetiznd, putem calcula estimatorii OLS prin dou
modaliti. Prima const n utilizarea (7.15) ns presupune
lucrul cu o matrice de ordinul k x k. Ca alternativ, putem
lucra n termeni de abateri de la mediile variabilelor, utiliznd
(7.15a), care necesit numai inversarea unei matrice de
ordinul (k 1) x (k 1). Aceast a doua metod mai necesit
i utilizarea ecuaiei (7.17) pentru a stabili valoarea
1
^

.
7.1.1. Determina ia n regresia multipl
n abordarea aspectelor privind regresia cu dou
variabile am definit coeficientul de determinare, care
msoar proporia variaiei determinat de variabila
explicativ X n totalul variaiei variabilei Y.
O msurare similar a exactitii armonizrii poate fi
definit i pentru regresia multipl.
S considerm ecuaia (7.7). Prin eliminarea lui
Y
din
fiecare parte a ecuaiei obinem:
173
Econometrie Teorie i studii de caz
i
i
i
e Y Y Y Y +
^
pentru fiecare valoare i (7.18)
Astfel, dac msurm abaterile lui Y n jurul mediei
sale,
Y
, putem afirma c, pentru fiecare observare, abaterea
total a lui Y poate fi mprit ntr-o abatere explicabil,
Y Y i
^
, i o abatere rezidual, e
i
. Ecuaia (7.18) este identic
cu cea aferent regresiei cu dou variabile.
Ca i n cazul regresiei cu dou variabile, mai nti
ridicm la ptrat (7.18) i apoi procedm la nsumarea tuturor
observrilor.
Funcia de regresie devine:

,
_

+ + + +

,
_


^ ^
3
^
3
^
2 2
^ ^
... Y X X X e Y Y e
ki i i i i i

=
+ + + +

...
3 3
^
2 2
^
1
^
i i i i i
e X e X e
0
^
+
i i ki k
e Y e X

(7.19)
Astfel:
( )

+
2 2
^
2
) (
i
i
i
e Y Y Y Y
(7.20)
sau
SST = SSE + SSR
174
Capitolul 7 Modelul clasic al regresiei multiple
Ecuaia (7.20) este identic cu cea aferent regresiei
cu dou variabile. Ea implic faptul c, pe ansamblul
msurtorilor, rezultatul msurrii variaiei totale a lui Y,
SST, poate fi din nou divizat ntr-o msurare a variaiei
factoriale a lui Y, SSE, i o variaie rezidual, SSR. Trebuie
s subliniem c (7.20) este valabil, ca i n cazul regresiei cu
dou variabile, numai dac metoda de estimare este OLS,
deoarece corelaia (7.14a) se susine numai pentru aceast
form de estimare.
Putem defini coeficientul de determinaie
multipl, R
2
, ca fiind proporia variaiei totale a lui Y ce
poate fi atribuit variaiilor tuturor variabilelor factoriale
acionnd concertat.
Avnd n vedere (7.20), aceasta nseamn:

2
R
SST
SSE

ptratelor a total suma


ptratelor a explicabil suma
(7.21)

Putem considera ca n cazul regresiei cu dou
variabile, astfel c:


2
2
2
1
i
i
y
e
R
(7.22)
Suma reziduurilor ptratelor din (7.22) poate fi apoi
calculat prin extindere, ceea ce, demonstrabil, se susine
pentru regresia multipl:
175
Econometrie Teorie i studii de caz
i ki k i i i i i i
y x y x y x y e


^
3 3
^
2 2
^
2 2
...
(7.23)
7.1.2. Utilizarea criteriului Akaike
O alt metod care permite luarea n
consideraie a numrului de variabile factoriale
atunci cnd se stabilete valabilitatea armonizrii
este dat de criteriul Akaike de informare
(AIC). Acesta este definit astfel:
AIC =
n
k
n
e
i
2
ln
2
+

,
_

(7.24)
n acest caz nu vom fi preocupai de bazele teoretice
ale AIC, rezumndu-ne la a meniona c n acest caz criteriul
const n a include o variabil suplimentar numai n msura
n care aceasta conduce la diminuarea AIC. Ca i
2
R
, AIC
depinde de suma rezidual a ptratelor,

2
i
e
, i de numrul
de parametri care trebuie estimai, k. Totui, n cazul unei
scderi la nivelul

2
i
e
, care survine atunci cnd se include o
variabil explicativ suplimentar, este posibil ca aceasta s
nu conduc cu necesitate i la scderea AIC. Variabila
suplimentar nseamn o cretere a lui k, respectiv a
numrului parametrilor care trebuie estimai, iar aceasta
conduce la creterea AIC. Prin urmare, AIC scade numai
dac scderea nregistrat de

2
i
e
este suficient de mare
pentru a contracara efectul creterii lui k.
Pentru explificarea utilizrii, att a lui
2
R
, ct i a lui
AIC, s revenim la ecuaiile consumului unei gospodrii,
176
Capitolul 7 Modelul clasic al regresiei multiple
pentru care am obinut deja valori pentru
2
R
(neajustat),
respectiv 0,691 i 0,796.
Recurgnd la relaiile de calcul, obinem:
2
R
= 1 -
678 , 0
24 / 587 , 1
23 / 4901 , 0

AIC =
74 , 7
25
4
25
49010
ln +

,
_

Corelnd cu situaia adugrii unui factor suplimentar,


cum ar fi pachetul de titluri lichide, cu

2
i
e
= 0,3234 x 10
5
i
k = 3, fr modificarea lui

2
i
y
i a lui n, se obine:
2
R
= 1 -
778 , 0
24 / 587 , 1
22 / 3234 , 0

AIC =
40 , 7
25
6
25
32340
ln +

,
_

Se poate observa c adugarea variabilei


reprezentat de pachetul de titluri lichide n ecuaia
consumului gospodriei face ca
2
R
s creasc iar AIC s
descreasc.
Printe modalitile de msurare a exactitii
armonizrii n raport cu includerea unor variabile factoriale
suplimentare se numr i criteriul Schwartz , precum i
criteriul Amemiya.
177
Econometrie Teorie i studii de caz
7.2. Ipotezele clasice n regresia
multipl
Ca i n cazul regresiei cu dou variabile, OLS este de
departe cea mai popular i mai bine cunoscut metod de
estimare a parametrilor regresiei multiple. i n acest caz,
ns, este important s se sublinieze faptul c nu exist nici o
garanie cu privire la faptul c estimatorii OLS vor fi, ntr-un
sens sau altul, nite estimatori perfeci.
Ca i n cazul regresiei cu dou variabile, diferitele
eantioane vor conduce la estimri OLS diferite, astfel nct
fiecare valoare
j
^

va avea propria distribuie de


eantionare.
Modelul clasic de referin pentru regresia multipl
este corelaia (7.1). Presupunem c aceast corelaie este cea
care a generat cele n observri ale eantionului, astfel ca
ecuaia (7.3) s se susin. Matricea echivalent ecuaiei (7.3)
este dat de (7.4). Ca i n cazul regresiei cu dou variabile,
prezumiile sunt fcute cu privire la variabilele factoriale i
reziduale.
7.2.1. Ipoteze cu privire la variabilele
factoriale
Presupunem c fiecare dintre variabilele factoriale:
(IA) este non-stochastic;
(IB) are valori care sunt fixe n eantioane repetate;
(IC) este de o asemenea natur nct, pe msur de n
, variaia valorilor eantionului su (1/n)
j
ji
Q x

2
, (j
= 2, 3, ...,k) unde Q
j
sunt constante finite stabilite.
178
Capitolul 7 Modelul clasic al regresiei multiple
Similar regresiei cu dou variabile, variabila
dependent Y, care depinde de factor rezidual dar i de
variabilele X, este stochastic. Ipoteza IB implic faptul c,
dac se extrag eantioane repetate, acelai de valori pentru
variabilele X ar trebui s fie selectate n fiecare eantion.
Aceasta implic la rndul su c X, aa cum este definit mai
jos (7.4), poate fi tratat, din punct de vedere al procesului de
selecie, ca o matrice de constante stabilite. Vectorul Y al
valorilor eantionului va varia de la eantion la eantion dar,
ntruct conform (7.4) aceasta depinde nu numai de X ci i de
vectorul de valori reziduale, ,
^

, vectorul estimatorilor
OLS, care depinde att de X ct i de Y, va varia i el, prin
urmare , de la eantion la eantion. Astfel, n ciuda ipotezelor
IA i IB, estimatorii OLS vor prezenta n continuare
distribuii de selecie.
Ipoteza IC este o simpl extensie a ipotezei
corespunztoare aferent regresiei cu dou variabile i se
refer la variabilele factoriale care nregistreaz trenduri
categorice de-a lungul timpului. Semnificaia acestui fapt va
deveni mai clar ulterior dar, pentru moment, aceast ipotez
poate fi considerat ca reglementnd orice problem legat de
corelaii false.
n cazul modelului regresiei multiple mai exist i o a
patra ipotez referitoare la variabilele factoriale, care nu are
un echivalent n cadrul regresiei cu dou variabile. Aceasta
presupune c:
(ID) - nu exist nici o corelaie linear exact ntre
valorile eantionului aferent uneia sau mai multor variabile
explicative.
179
Econometrie Teorie i studii de caz
Prin ipoteza ID vrem s spunem c nu trebuie s fie
cazul ca, spre exemplu, X
2i
= 3 + 4X
3i
pentru toate valorile i
(aceasta nsemnnd c nu trebuie neaprat s fie cazul ca cea
de a doua coloan a matricei X s fie egal cu de trei plus
patru ori a treia coloan). Aceasta ar implica o corelaie
linear exact ntre valorile eantionului pentru X
2
i X
3
. De o
manier similar, corelaii cum ar fi X
3i
= 5 2X
4i
+ 3X
2i,
care presupun trei sau mai multe variabile X sunt excluse.
Dac aceasta ar fi situaia, matricea invers, ( XX)
-1
nu ar mai exista iar formula (7.15) aferent estimatorilor OLS
nu ar mai putea fi calculat. n realitate, ar fi imposibil de
soluionat ecuaiile normale (7.13) iar estimatorii OLS nu ar
mai exista pur i simplu. Este extrem de rar cazul n care
ipoteza ID se manifest n practic dar, dup cum vom
vedea, condiiile n care exist corelaii aproximativ lineare
ntre variabilele X nu sunt deloc neobinuite. Astfel de
corelaii pot avea consecine serioase.
Este util ca ipotezele IC i ID s se exprime n
termeni matriceali. Succint, aceasta se poate realiza prin a
afirma c avem nevoie ca matricea xx s nu fie singular i
s fie astfel nct pe msur ce n , (1/n)xx Q, unde
Q este o matrice (non-singular) de constante stabilite.
Pentru a vedea dac aceast afirmaie implic
ipotezele IC i ID, mai nti trebuie reinut c, dac trebuie s
existe corelaii lineare ntre coloanele matricei X, atunci nu
trebuie s existe astfel de corelaii ntre coloanele matricei
abaterilor de la medii, x. Astfel, ipoteza ID cere ca nu numai
matricea (XX)
-1
s fie non-singular ci i matricea (xx)
-1
s
fie la fel. Elementele matricei xx sunt prezentate n (7.18).
Se poate observa c elementele de pe diagonalele matricei
(1/n)xx sunt, prin urmare, variaiile eantionului (1/n)
2
ji
x

.
180
Capitolul 7 Modelul clasic al regresiei multiple
n consecin, dac pe msur ce n , matricea (1/n)xx
Q, n care Q este o matrice fix, atunci ipoteza IC trebuie
s se susin. Valorile Q
j
din ipoteza IC sunt de fapt
elementele de diagonal din Q.
7.2.2. Ipoteze referitoare la variabila
rezdual
Ipotezele referitoare la factorul factor rezidual din
modelul clasic al regresiei multiple sunt identice cu cele
emise n cazul regresiei cu dou variabile, i anume:
(IIA) E(
i
) = 0 pentru toate valorile i ;
(IIB) Var(
i
) = E(
i
-

E
i
)
2
= E( )
2
i
=
2
= constant pentru
toate valorile i ;
(IIC) Cov (
i
,
j
) = E (
i
,
j
) = 0 pentru toate valorile i j;
(IID) Fiecare factor factor rezidual
i
este distribuit normal
Astfel, factorii reziduali sunt normal distribuii cu
medii zero i sunt homoschedastici i non-autocorelai.
ntruct sunt normal distribuii, avnd covariaii zero, aceasta
implic i faptul c trebuie s fie distribuii independent.
Este necesar s se sintetizeze ipotezele IIA IID n
termeni de matrice variaie covariaie:
( )
( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )

,
_

2
3 2 1
2 3 2
2
2 2 1
1 3 1 2 1
2
1
'
...
.
.
.
...
... ( )
n n n n
n
n
E E E E
E E E E
E E E E
E


(7.25)
181
Econometrie Teorie i studii de caz
ntruct fiecare factor rezidual are media zero,
elementele de diagonal din matricea simetric (7.25)
reprezint variaiile valorilor reziduale iar elementele din
afara diagonalei reprezint covariaiile valorilor reziduale.
Matricea (7.25) este matricea variaie covariaie.
Utiliznd ipotezele IIB i IIC, observm c modelul
clasic presupune c:
( )
n
I E
2
2
2
2
2
'
... 0 0 0
0 ... 0 0
0 ... 0 0
0 ... 0 0

,
_

(7.26)
unde I
n
este matricea n x n de identitate.
ntruct ipoteza IIA implic E() = 0, putem
reprezenta toate cele patru ipoteze referitoare la factorul
rezidual printr-o singur afirmaie, respectiv:
este NID(0,
2
I
n
) (7.27)
Afirmaia (7.27) ar trebui interpretat n sensul c
vectorul valorilor reziduale, , este normal i independent cu
o medie egal cu vectorul nul 0 i o matrice variaie-
covariaie
2
I
n
.
7.3. Propriet ile estimatorilor OLS
Ca i n cazul regresiei cu doua variabile, proprietile
estimatorilor OLS depind foarte mult de care anume dintre
ipotezele clasice este valabil. De fapt, modelul urmat n
aceast seciune este foarte apropiat de cel cu dou variabile.
Presupunem c, pe ansamblu, ipoteza ID se susine deoarece,
182
Capitolul 7 Modelul clasic al regresiei multiple
n caz contrar, estimarea nu ar putea fi realizat. Tot ca n
cazul regresiei cu doua variabile ne vom concentra, n
principal, asupra estimatorilor parametrilor pantei
j
(j = 2, 3,
..., k), i mai puin asupra parametrului de intercept,
1
. n
activitatea practic, parametrii pantei sunt, n mod normal, de
interes.
7.3.1. Liniaritatea
Vor fi considerate drept constante valorile stabilite n
condiiile acestor ipoteze, prin observri de eantion
nelegnd numai valorile Y.
Expresia aferent estimatorilor OLS
conduce la:

(XX)
-1
XY = CY
unde, ntruct X este o matrice de constante
stabilite, C = (XX)
-1
X este, de asemenea, tot o
astfel de matrice.
(7.28)
Proprietatea de linearitate este indus de (7.28),
deoarece ecuaia poate fi rescris n termeni scalari, astfel:
n jn j j j j
Y c Y c Y c Y c + + + + ...
3 3 2 2 1 1
^

pentru toate
valorile j
unde Y
i
reprezint observrile de eantion iar c
ji
reprezint constantele stabilite pentru rndul j al matriei k x
n C.
183
Econometrie Teorie i studii de caz
7.3.2. Nedeplasarea
Ipotezele IA, IB i IIA sunt suficiente pentru a
demonstra faptul c estimatorii OLS nu sunt deplasai.
Situaia este astfel identic cu cea din regresia cu dou
variabile, exceptnd faptul c acum avem mai mult dect un
singur factor non-stochastic. Introducnd (7.4) n (7.15)
avem:

(XX)
-1
X(X + )
= (XX)
-1
X X + (XX)
-1
X = I + C
= + C
(7.29)

unde C este matricea constantelor stabilite. n termeni
scalari, (7.29) se exprim sub forma:
n jn j j j j
c c c + + + + ...
2 2 1 1
^
(7.29a)
pentru toate valorile j
unde c
ji
reprezint tot rndul j al matriei C.
Eliminnd ateptrile din (7.29a), n condiiile n care
c
ji
sunt constante, prin ipotezele IA i IB obinem:
( ) ( ) ( )
n jn j j j j
E c E c E c E + + + +

,
_

...
2 2 1 1
^

pentru toate valorile j
Conform ipotezei IIA, E(
i
) = 0 pentru toate valorile
i. Astfel:
j j
E

,
_

^
pentru toate valorile j (7.30)
Prin urmare, estimatorii OLS,
j
^

, sunt nedeplasai.
184
Capitolul 7 Modelul clasic al regresiei multiple
Alternativ, putem lucra n termeni de algebr
matriceal i obinem:
E(
j
^

) = + CE() (7.30a)
Ipoteza IIA poate fi scris i sub forma E() = 0. Prin
urmare, rezult:
E(
j
^

) = (7.30b)
7.3.3. Compatibilitatea
Ipotezele IA, IB, IC i IIA sunt suficiente pentru a
dovedi compatibilitatea estimatorilor OLS ,
j
^

. Aceasta
nseamn c recurgem la toate ipotezele clasice referitoare la
variabilele factoriale i la prima dintre ipotezele referitoare la
factorul rezidual . Aceasta presupune c dac
j
^

sunt
compatibili atunci, pe msur ce mrimea eantionului, n
, acetia converg probabilistic spre valoarea real
j
.
Aceasta nseamn c distribuiile de selecie pentru
j
^

se
concentreaz pe
j
real. Astfel, p Lim (
j
^

) =
j
pentru toate
valorile j.
7.3.4. Cel mai bun estimator liniar
nedeplasat
Am vzut c, n condiiile ipotezelor IA i IB,
estimatorii OLS sunt att lineari ct i nedeplasai. Pentru ca
acetia s prezinte aceeai variaie minim a tuturor
estimatorilor lineari i nedeplasai, respectiv pentru a face
185
Econometrie Teorie i studii de caz
parte din categoria BLUE, este necesar ca i ipotezele clasice
IIB i IIC s fie valabile. Ca i n cazul regresiei cu dou
variabile, aceasta nseamn c factorii reziduali trebuie s fie
homoschedastici i non-autocorelai.
O demonstraie matriceal general cu privire la
caracteristicile BLUE n cazul regresiei multiple este n afara
scopului propus. Ne vom limita numai la gsirea expresiilor
pentru variaiile i covariaiile estimatorilor OLS. Dup cum
vom vedea, aceste expresii sunt importante dac dorim s
elaborm inferene n legtur cu parametrii regresiei
multiple.
S considerm matricea simetric k x k.
'
^ ^

,
_


,
_

E
=
( )( ) ( ) ( )( )
( )( ) ( )( ) ( )

,
_

,
_

,
_

,
_

,
_

,
_

2
2 2 1 1
2 2
2
2 2 1 1 2 2
1 1 2 2 1 1
2
1

...

.
.
.

...


...

k k k k k k
k k
k k
E E E
E E E
E E E



(7.31)
ntruct ( )
j j
E

pentru toate valorile j, putem


scrie (7.31) sub forma:
186
Capitolul 7 Modelul clasic al regresiei multiple
( )( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )

,
_


k k k
k
k
Var Cov Cov
Cov Var Cov
Cov Cov Var
E



...

,

,

.
. . .

...

,

...

,

'

2 1
2 2 1 2
1 2 1 1
(7.32)
Matricea (7.32) este cunoscut sub denumirea de
matrice variaie covariaie a vectorului

, care, de
regul, se scrie sub forma Var (

). De reinut faptul c, n
josul principalei sale diagonale, aceasta conine variaiile
vectorului

j
. Elementele din afara acestei diagonale
reprezint covariaiile dintre diferitele valori

j
care ar
rezulta n cazul extragerii mai multor eantioane. Este clar c,
dac trebuie s elaborm inferene referitor la valoarea real a
lui
j
se impune gsirea unei expresii pentru aceast matrice.
Din (7.29) avem:

- = C = (XX)
-1
X

Prin urmare, ntruct (XX)
-1
este simetric,
E(

- )(

- ) = E[(XX)
-1
X][ X(XX)
-1
]
= (XX)
-1
X( )X(XX)
-1
(7.33)

ntruct X poate fi considerat o matrice de
constante.
Totui, E() reprezint matricea variaie-covariaie a
factorilor reziduali care, n condiiile ipotezelor IIB i IIC
este dat de (7.26) ca fiind egal cu
2
In. Prin substituire n
(7.33), obinem:
187
Econometrie Teorie i studii de caz
Var(

) = E(

- )(

- ) = (XX)
-1
X(
2
In)X(XX)
-1
=
2
(XX)
-1
XX(XX)
-1
=
2
(XX)
-1
(7.34)

Ecuaia (7.34) este tocmai expresia pentru matricea
variaie-covariaie a vectorului OLS

.
Vom scrie elementul din rndul i i coloana j din
matricea inversat (XX)
-1
sub forma X
ij
. ntruct (XX)
-1
este
simetric, vom avea X
ji
= X
ij
. Comparaia ntre (7.34) i (7.32)
ne indic faptul c variaia lui
j

, pe care o scriem sub


forma
2

este dat de:



2

= Var (
j

) =
2
X
jj
, j = 1, 2, ..., k (7.35)
Astfel, pentru a gsi variaia lui
j

, trebuie s
prelum elementul j de pe diagonala matricei (XX)
-1
i s-l
nmulim cu variaia obinuit a valorilor reziduale,
2
.
Rdcina ptrat pentru Var (
j

) este cunoscut sub numele


de eroare standard a lui
j

i este notat cu
j

.
Comparnd mai departe (7.34) i (7.32), rezult c:
Cov (
j i

) =
2
X
ij
pentru toate valorile i j (7.36)
Expresiile (7.35) i (7.36) sunt de o importan
considerabil pentru inferena n regresia multipl.
Este posibil s obinem expresii echivalente pentru
(7.35) i (7.36) dac lucrm n termeni de abateri ale
variabilelor de la mediile lor. Nu este necesar dect s lucrm
188
Capitolul 7 Modelul clasic al regresiei multiple
n termeni de matrice rsturnat (xx)
-1
n loc de matricea
(XX)
-1
. O derivare complet s-ar dovedi repetitiv ns nu
este dificil de demonstrat c:
2

= Var (
j

) =
2
x
jj
, j = 1, 2, ..., k (7.35a)
i
Cov (
j i

) =
2
x
ij
(7.36a)
pentru toate valorile i j
unde x
ij
este elementul din rndul (i 1) i coloana (j
1) a matricei (xx)
-1
. Expresiile (7.35a) i (7.36a) sunt
alternative pentru (7.35) i (7.36), adesea utile n scopuri de
calcul. Trebuie reinut faptul c (7.35a) nu conduce la o
expresie pentru Var (
j

).
n cazul special al regresiei cu dou variabile, (xx)
-1
din (7.18) nu este dect scalarul

2
2
x
astfel nct x
22
= 1/

2
2
x
. Astfel, (7.35a) ne conduce tocmai la :
Var (
2

) =
2
/

2
2
x
Aceasta este identic cu expresia aferent variaiei
estimatorului OLS pentru panta parametrului din regresia cu
dou variabile.
7.3.5. Alte propriet i
Ca i n cazul regresiei cu dou variabile, dac trebuie
ca estimatorii OLS s fie, n principal, nu numai nedeplasai
ci i eficieni sau asimptotic eficieni, este necesar ca ipoteza
189
Econometrie Teorie i studii de caz
IID din modelul clasic s se susin aceasta nsemnnd c
valorile reziduale trebuie s fie normal distribuite. Prin
urmare, dac estimatorii OLS trebuie s aib aceste
proprieti, este necesar ca toate ipotezele clasice s fie
valabile. O dovad a proprietii de eficien este n afara
scopului pe care ni l-am propus. Reamintim doar c eficiena
presupune ca estimatorii OLS s aib variaia minim a
tuturor estimatorilor nedeplasai - nu numai a estimatorilor
lineari nedeplasai.
Normalitatea valorilor reziduale mai prezint alte
dou consecine importante pentru regresia OLS. n primul
rnd, aceasta nseamn c distribuiile de selecie ale
estimatorilor OLS vor fi distribuii normale. O demonstrare a
acestei afirmaii este analoag celei din cazul regresiei cu
dou variabile. Totui, rezult c, ntruct, n condiiile
tuturor ipotezelor clasice, fiecare
j

este nedeplasat, cu o
variaie dat de (7.35),
j

este N(
j
,
2
X
jj
), j = 1, 2, 3, ..., k (7.37)
O cunoatere exact a distribuiilor de selecie ale
estimatorilor OLS, respectiv
j

, este de o importan vital


pentru inferen.
Adesea este util ca (7.37) s fie exprimat n forma sa
alternativ, lucrnd n termeni de abateri ale variabilelor X de
la mediile lor. Utiliznd (7.35a) n loc de (7.35) vom obine:

j

este N(
j
,
2
x
jj
), j = 1, 2, 3, ..., k (7.37a)
190
Capitolul 7 Modelul clasic al regresiei multiple
Cea de a doua consecin a prezumiei unor factori
reziduali normal distribuii este, ca i n cazul regresiei cu
dou variabile, aceea c estimatorii OLS devin estimatori de
probabilitate maxim. Ca i n cazul regresiei cu dou
variabile, MLE aferent lui
2
se dovedete a fi :
n
e
i

2
2 ~

(7.38)
unde

2
i
e
este suma ptratelor factorilor reziduali.
Totui,
2 ~


se dovedete a fi un estimator deplasat al
2
real.
De fapt, se poate demonstra c, n cazul regresiei multiple:
E(
2 2 2
)
~

n
k n
(7.39)
Ecuaia (7.39) este o generalizare a rezultatului
regresiei cu dou variabile.
ntruct, n condiiile ipotezelor clasice, estimatorii
OLS i ML ai parametrilor
j

, sunt identici, n acest punct


poate prea c estimarea ML contribuie prea puin la analiza
noastr asupra ecuaiilor regresiei.
Estimarea de probabilitate maxim capt relevan
maxim atunci cnd ipotezele clasice sunt infirmate.
De exemplu, aceast metod este frecvent utilizat n
cazurile n care ecuaia regresiei este nonlinear. Mai este, de
asemenea, de mare importan atunci cnd ipotezele clasice
referitoare la variabilele factoriale i/sau cele referitoare la
reziduali sunt infirmate. Dup cum am vzut, dac ipotezele
clasice nu sunt valabile, atunci estimatorii OLS pierd unele,
191
Econometrie Teorie i studii de caz
sau chiar toate, dintre proprietile dorite. Se dovedete c, n
astfel de condiii, estimatorii OLS i estimatorii ML nu sunt
identici. ntr-o atare situaie, estimatorii ML prezint
avantajul c i menin n continuare proprietile, respectiv
compatibilitatea i eficiena asimptotic.
7.4. Inferen a n regresia multipl
Cu condiia ca toate ipotezele clasice s fie valabile,
inferenele referitoare la parametrii pantei n regresia multipl
se pot baza pe rezultatul (7.37a), care implic faptul c,
pentru j = 1, 2, 3, ..., k,
j
j j


are o ditribuie N(0, 1) (7.40)
Erorile standard
j

sunt date de (7.35a). Ne vom


concentra asupra parametrilor pantei care sunt de interes.
Inferena cu privire la parametrul
1
, trebuie s se bazeze pe
(7.37), cu j = 1.
Problema care se ridic n legtur cu (7.40) const n
aceea c erorile standard,
j

sunt necunoscute, deoarece


i variaia valorilor reziduale,
2
este necunoscut.
Aceasta rezult din (7.39), deoarece E(s
2
) = [n/(n-
k)]E(
2 ~
) =
2
. Suma rezidual a ptratelor se calculeaz cel
mai uor prin (7.23).
Estimrile nedeplasate ale variaiilor estimatorilor
OLS sunt, utiliznd (7.35a), urmtoarele:
jj
j
x s s
2 2

, j = 2, 3, ..., k (7.41)
192
Capitolul 7 Modelul clasic al regresiei multiple
Atunci cnd nlocuim
j

n (7.40) prin estimatorii


lor nedeplasai,
j
s

, ca n regresia cu dou variabile, trebuie


s schimbm distribuia t. Se poate demonstra c:
j
s


are o distribuie t, cu n k g.l. (7.42)
Inferena se poate baza pe (7.42). De exemplu, la un
interval de ncredere 95% pentru oricare valoare,
j
(j = 2,
3, ...,k) este:
j
j
s t

025 , 0

+
(7.43)
valoarea lui
025 , 0
t
depinznd de n k, respectiv
numrul gradelor de libertate. Pentru a obine un interval
99% , se nlocuiete
025 , 0
t
cu
005 , 0
t
.
Verificarea verosimilitii poate continua de-a lungul
liniilor similare celei stabilit n regresia cu dou variabile.
Pentru a testa ipoteza nul de genul H
0
:
j
= 0 (j = 2,
3, ...,k), trebuie s afirmm c, n condiiile ipotezei nule,
(7.42) implic:
j
j
s

prezint o distribuie t cu n k grade


de libertate
Prin urmare, putem utiliza
j
j
s

ca test statistic i
respinge ipoteza nul conform creia variabila X
j
nu
influeneaz variabila Y dac valoarea absolut a acestui test
statistic este suficient de mare. Ca i n cazul regresiei cu
193
Econometrie Teorie i studii de caz
dou variabile, testul statistic este adesea denumit
coeficientul t.
194
Capitolul 8
Regresia neliniar
8.1. Aspecte generale
Evoluia fenomenelor economice nu evolueaz dup
traiectorii liniare, putnd avea i traiectorii neliniare.
Analiza corelaiilor dintre variabilele economice se
poate face i dup funcii neliniare, care prin transformri
sunt liniarizate. Procedm astfel pentru prezentarea modelului
neliniar ntr-o form echivalent simpl i uor de interpretat
valorile parametrilor, sau pentru estimarea acestora.
Astfel, dac dependena dintre dou variabile este
reprezentat prin modelul neliniar de regresie,
i
x
i
i
a y , ,
prin logartimare, obinem modelul de regresie liniar
i i i
x a b y ln ln ln + +
.
n estimarea parametrilor unui model neliniar de
regresie procedm astfel:
- estimm parametrii aplicnd metoda celor mai
mici ptrate;
- prin transformri, liniarizm funcia neliniar,
apoi se estimeaz parametrii prin aplicarea metodei celor mai
mici ptrate;
- determinm parametrii prin metode numerice.
8.2. Modele liniarizabile prin
logaritmare
Prezentm modelele semilogaritmic i cel dublu
logaritmic, ce se pot liniariza.
Econometrie Teorie i studii de caz
Modelul dublu logaritmic poate fi fr termen liber
sau cu termen liber.
Modelul fr termen liber (log-log) este de
forma dependenei, respectiv:
i
b
i i
ax y
(8.1)
n acest modelului a


+
R iar R b . n funcie de
semnul parametrului b se stabilesc proprietile caracteristicii
rezultative. Dac acest parametru este pozitiv, caracteristica
rezultativ are o traiectorie cresctoare. Tendina
descresctoare a caracteristicii rezultative este evideniat,
prin modelul neliniar de regresie, de valoarea negativ a
exponentului caracteristicii rezultative.
Logaritmnd relaia (8.1) rezult modelul dublu
logaritmic
log y
i
= log a + blog x
i
+ log
i
(8.2)
Utiliznd substituiile

i i i i i
a x x y k y log log , log

, modelul liniar
de regresie devine:

+ +
i i i
bx a y
Estimm cei doi parametri ai modelului iniar de
regresie i determinm parametrul a ce apare n modelul
neliniar de regresie:

a
a

10
196
Capitolul 8 Regresia neliniar
Modelul cu termen liber (log-log) are n plus
un termen liber i se prezint sub forma
urmtoare:
i
b
i i
ax a y +
0
(8.3)
n cazul acestui model nu mai este posibil aplicarea
procedeului anterior de liniarizare. Pentru estimarea
parametrilor, se aplic una dintre urmtoarele dou metode:
- cnd se specific o valoare a termenului liber al
modelului, atunci, utiliznd notaiile
0
a y v
i i

i
i i
x u
,
se va obine modelul de regresie (8.1). Pentru acesta se
estimeaz parametri, conform cazului modelului dublu
logaritmic;
- estimm apoi cei trei parametri ai modelulului (8.3)
prin metode numerice. Se poate recurge la transformarea
modelului ntr-unul liniar folosind dezvoltarea seriei Taylor.
Prezentm cteva proprieti ale parametrilor ce sunt
necesari pentru interpretarea parametrilor modelului i a
caracteristicilor variabilei factoriale n raport cu valorile
parametrilor. Interpretrile sunt realizate n contextul
utilizrii modelului (8.1). Pentru acest model precizm:
- dac b < 0, funcia log-log este descresctoare n
raport cu caracteristica factorial. n acest caz
( ) 0 lim

i i
x
x y
.
n situaia modelului cu termen liber,
( )
0
lim a x y
i i
x


;
- dac b > 0, funcia neliniar este cresctoare iar
( )

i i
x
x y lim
;
- indiferent de semnul parametrului b, acesta este
egal cu elasticitatea variabilei rezultative calculat n raport
cu variabila factorial, adic:
197
Econometrie Teorie i studii de caz

i
i
x
y
b

:
i
i
x
y
; (8.4)
cnd derivata de ordinul al doilea este
( )
2
2
2
1

b
i
i
i
x b ab
x
y
, rezult: ( ) 1 , 0 b , funcia analitic este
cresctoare i concav; b = 1, modelul de regresie se reduce
la modelul simplu liniar, fr termen liber; b > 1, funcia este
cresctoare i convex.
Modelul exponenial se utilizeaz n cazul n care
norul de puncte rezultat n urma reprezentrii grafice a
seriei de valori
( )
n i i i
y x
, 1
,

este orientat de-a lungul curbei
unei funcii exponeniale.
Modelul exponenial, cu paametrii a i b, este definit
prin relaia:

+
R b a b a y
i
x
i
i
, , (8.5)
Estimarea parametrilor modelului exponenial se face
prin transformri de date prin logaritmare, parcurgnd
etapele:
- prin logaritmarea termenilor egalitii se obine
modelul liniar de regresie:

i i i
x b a y ln ln ln ln + +
(8.6)

Modelul devine liniar prin substituirea lui
a a x y u
i i i i
ln , ln , ln

i b b

;
198
Capitolul 8 Regresia neliniar
- Estimm parametrii modelului liniar de regresie,
i i i
x b a u + +

folosind metoda celor mai mici ptrate;
obinem estimatorii

a i

;
- se determin estimatorii parametrilor modelului de
regresie neliniar:

a
e a

b
e b

n final se calculeaz valorile ajustate pe baza


modelului neliniar de regresie estimat:

( ) n i b a y
i
x
i
, 1 ,


Modelul exponenial se utilizeaz cnd valorile
variabilei rezultative cresc n progresie aritmetic iar valorile
variabilei factoriale cresc n progresie geometric.
Pentru a interpreta semnificaia parametrului b avem
n vedere c:
x
y
y
b


1
(8.7)
Se observ c parametrul b definete rata de cretere a
caracteristicii rezultative n funcie de variabila factorial X.
n modelul exponenial deosebim situaiile:
- b este rata de cretere sau scdere a caracteristicii
Y n raport cu X;
- dac b > 1, evoluia caracteristicii Y este
cresctoare;
199
Econometrie Teorie i studii de caz
- cnd ( ) 1 , 0 b , caracteristica Y nregistreaz o
scdere n raport cu variabila X;
- valorile caracteristicii Y sunt numai pozitive i
parametrul a satisface proprietatea de pozitivitate.
8.3. Aspecte privind modelul hiperbolic
Modelul reciproc de regresie este folosit i pentru a
studia dependena dintre rata omajului i rata inflaiei. Curba
de regresie construit n acest caz se numete curba Phillips.
Modelul reciproc de regresie, cu panta curbei
negativ, se folosete de regul pentru analiza dependenei
consumului unui produs de veniturile disponibile pentru
consum.
Valoarea b/a este abscisa punctului n care graficul
se intersecteaz cu axa Ox. Valoarea corespunde venitului
minim ce permite achiziionarea produsului solicitat pentru
consum.
Modelul reciproc are egalitatea:
i
i
i
x
b
a y +

+
(8.8)
Interpretarea parametrilor modelului reciproc
(hiperbolic) se face astfel:
- calculm panta curbei dup relaia:

2
/ /
i i i
x b x y

Funcia este descresctoare cnd parametrul b este
pozitiv i cresctoare dac b este negativ.
200
Capitolul 8 Regresia neliniar
- indiferent de semnul parametrului b, pentru
modelul reciproc


( ) a x y
x


lim
Estimarea celor doi parametri se face parcurgnd
etapele:
- Parametrii a, b sunt estimai prin metoda celor mai
mici ptrate. Din condiia
2
1

,
_


i i
i
x
b a y = minim se
obine sistemul liniar de ecuaii:

'

+
+




n
i
n
i i
i
n
i
i i
n
i
n
i
i
i
x
y
x
b
x
a
y
x
b a n
1 1 1
2
1 1
1

Rezolvm sistemul liniar de ecuaii avnd


necunoscutele a i
b

.
- Calculm valorile ajustate
i
i
x
b
a y

+ , i seria
erorilor de ajustare.
8.4. Unele aspecte privind modelul
parabolic
Acest model se utilizeaz n cazul n care ritmul de
evoluie caracteristic urmeaz o funcie liniar, avnd
201
Econometrie Teorie i studii de caz
coeficientul pantei egal cu constanta a. Punctele
( )
n i i i
y x
, 1
,


sunt dispuse n jurul curbei descris de o parabol.
De exemplu, curba Laffer este reprezentat sub form
unei parabole i definete relaia dintre veniturile
guvernamentale i rata de impozitare. Precizm unele
caracteristici ale curbei Laffer:
- Veniturile statului = f (rata de impozitare);
- Curba Laffer se descompune n dou regiuni: regiunea
unui comportament normal, cuprins ntre 0 i acel nivel al
ratei de impozitare (t%) unde venitul statului este maxim;
regiunea cuprins ntre t% i 100% numit i zon
inadmisibil n care, la o cretere a ratei de impozitare, nu se
realizeaz o cretere corespunztoare a veniturilor statului.
- ntre venitul din impozitul pe inflaie i rata inflaiei
exist o dependen de tip parabolic. n acest caz, se constat
c exist un nivel al inflaiei pn la care se apreciaz c
statul i sporete profitul,dup care, o cretere a inflaiei
conduce la o diminuare a veniturilor statului.
Modelul parabolic de regresie ce este definit de
parametrii
R c b a , ,
este
i i i i
ax bx c y + + +
2
(8.9)
Fiind o funcie liniar n raport cu cei trei parametri,
a, b i c, pentru estimarea acestora se utilizeaz metoda celor
mai mici ptrate. Se pune condiia ca valoarea exoresiei
( )
2
2


i
i i i
x a x b c y
s fie minim, rezultnd sistemul
liniar de ecuaii:
202
Capitolul 8 Regresia neliniar

'

+ +
+ +
+ +






n
i
i
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i i
n
i
i
n
i
i
n
i
i
x y x a x b x c
x y x a x b x c
y x a x b c n
1
2
1 1
4
1
3 2
1 1 1
3
1
2
1 1
2
1

Din sistemul de ecuaii rezult seria valorilor ajustate


{ } n i y
i
, 1 , . Pentru a evalua calitatea modelului estimat se
determin seria reziduurilor
( )
n i i , 1

, unde
i i i
y y
.
8.5. Elemente privind func iile de tip
polinominal
Un model de regresie neliniar este reprezentat adesea
prin intermediul funciilor polinomiale de un anumit ordin.
Dac funcia polinomial este de ordinul k, atunci
acesta este prezentat prin

t
k
t k t t t
x x x y + + + + ...
2
2 1 0
(8.10)
unde variabilele reziduale satisfac ipotezele modelului
clasic de regresie iar
( )
n t t
x
, 1
sunt valorile caracteristicii
pentru un numr de perioade.
n acest caz, funcia (8.10) este neliniar n raport cu
variabilele factoriale dar este liniar n raport cu parametrii
modelului de regresie.
Pentru estimarea corect a parametrilor funciei
polinomiale trebuie s existe o relaie de multicoliniaritate
203
Econometrie Teorie i studii de caz
ntre variabilele X, X
2
, ...X
k
. Alegerea gradului funciei
polinomiale se face innd seama de:
- multicoliniaritatea este frecvent n situaia n care
seria de date conine un numr redus de date;
- se recomand folosirea unor funcii polinomiale
ce au grad mai mic sau egal cu 4;
- notm cu
2
k
R raportul de determinare calculat
pentru funcia polinomial de ordinul k. Dac dimensiunea
seriei de date este n, atunci 1
2
1

n
R .
Din cele trei observaii, rezult c puterea de
predicie a funciei polinomiale scade n raport cu numrul
de parametri ce trebuie estimai.
Ca exemplu putem considera definirea costului unui
proces de producie (Y) n funcie de cantitatea produciei
realizate ntr-o anumit perioad (X):
t
k
t t t t
x x x y + + + +
3
2
2 1 0
(8.11)
Considernd ultimafuncie polinomial, definim
patru tipuri de costuri:
a) costul mediu al produciei pentru o perioad (c
t
):
( )
t t t
t t
t
t
x x
x x
y
c + + + +
2
3 2 1 0
1
(8.12)
b) costul fix mediu al produciei, care este reprezentat
prin primul termen al relaiei (8.12) prin care definim costul
mediu:

204
Capitolul 8 Regresia neliniar

t
t
t
x
y
cf
c) costul variabil mediu, reprezentat prin al doilea
termen al relaiei (8.12):


2
3 2 1 t t t t t
x x cf c cv + + (8.13)
d) costul marginal al produciei:


2
3 2 1
3 2
t t
t
t
t
x x
dx
dy
cm + +
(8.14)
Acetia sunt indicatori importani n caracterizarea
performanelor unui proces de producie.
n estimarea parametrilor modelului (8.10) vom
recurge la transformrile de date Z
1
= X, Z
2
= X
2
. . . Z
k
= X
k
,
rezultnd modelul liniar de regresie:
t kt k t t t
z z z y + + + + + ...
2 2 1 1 0
(8.15)
n cazul modelului de regresie de tip polinomial va
trebui s determinm gradul polinomului i s stabilim dac
variabilele Z
1
, Z
2
, ...Z
k
sunt corelate n ansamblu sau dou
cte dou i n ce msur multicoliniaritatea influeneaz
mrimea dispersiei estimatorilor.
Modelele de regresie neliniare continue pot fi
transformate prin seriile Taylor de ordinul k n modele
205
Econometrie Teorie i studii de caz
polinomiale de ordinul k iar, apoi, prin substituiri de
variabile, rezult modelul liniar (8.15).
Considerm c modelul neliniar de regresie este
definit prin funcia
( )
t t
x x f
2 1
,
, difereniabil de ordinul k
ntr-un punct (a, b) iar ordinea de calculare a derivatelor
pariale mixte pn la ordinul k nu este important, rezultnd:
- polinomul Taylor de ordinul k ataat funciei f(x
1
, x
2
)
n punctul (a, b) este definit prin relaia:
( ) ( ) ( ) ( ) ( ), ,
!
1
... ,
! 2
1
,
! 1
1
, ,
2 1
2 1
b a f d
k
b a f d b a f d b a f x x P
k
k
+ + + +
(8.16)
unde
( ) ( ) ( ) ( ), , ,
2
2
1
1
1
b a f b x
x
a x
x
b a f d
1
]
1


n i , 1 este difereniala de ordinul i pentru funcia ( )
2 1
, x x f
n punctul (a,b);
- dac
( )
2 1
, x x R
k
reprezint restul de ordinul k al
seriei Taylor, atunci:

( ) ( ) ( )
2 1 2 1 2 1
, , , x x R x x P x x f
k k
+
(8.17)
- dac a = b = 0, din relaia (8.17) se obine formula
lui MacLaurin, care definete egalitatea:

( ) ( ) ( ) ( ) ( ) ( ), , , ... , , 0 , 0 ,
2 1 1 2 1 2 1 2 2 1 1 2 1
x x R x x P x x P x x P f x x f
k
+ + + + +
(8.18)
unde
( )
2 1
, x x P
p
este un polinom de gradul p x
1
i x
2
.
206
Capitolul 8 Regresia neliniar
8.6. Despre modelul multiplicativ
Modelul multiplicativ, definit prin
intermediul variabilelor exogene X
1
, X
2
, . . . , X
k
,
este reprezentat prin relaia:
t k
e x x ax y
kt t t t

...
2 1
2 1

unde
t

este o variabil rezidual ce are o


repartiie normal de medie zero i dispersie
2
.
(8.19)
Modelul multiplicativ (8.19) se liniarizeaz prin
logaritmare. Se obine modelul echivalent:
t kt k t t t
x x x y + + + + ln ... ln ln ln ln
2 2 1 1

t kt k t t
z z z + + + + + ...
2 2 1 1 0
Caracteristica principal a acestui model este dat de
relaia care exist ntre coeficienii variabilelor exogene i
elasticiti. Fiecare parametru este egal cu un coeficient de
elasticitate, de forma:
t
jt
jt
t
j
y
x
x
y
e

j
jt
t
x
y

ln
ln
207
Econometrie Teorie i studii de caz
Un model multiplu neliniar este cel reprezentat prin
funcia de producie Cobb-Douglas, reprezentat printr-o
funcie de dou variabile care include i variabila timp.
Prima form de reprezentare sau funcia Cobb-
Douglas fr progres tehnic. n acest caz, variabila timp nu
este inclus explicit n cadrul funciei. Funcia este definit
prin relaia:
t
e L AK Y
t t

1
(8.20)
unde:
Y
t
cuantific producia sau costul produciei;
K
t
capitalul fix;
L
t
fora de munc;
A,,- parametrii reali;

t
- variabil rezidual.
A doua form de reprezentare sau funcia Cobb-
Douglas cu progres tehnic, variabila timp fiind inclus
explicit n cadrul funciei, definit prin relaia:
t mt
t t
e L AK Y

+

1
(8.21)
Cei doi parametri, i , ofer informaii importante
asupra caracteristicilor procesului de producie, fiind
parametrii elasticitii pariale n raport cu fiecare factor al
procesului de producie.
Parametrul reprezint elasticitatea parial a
produciei n raport cu capitalul fix:
t
t
t
t
K
Y
K
K
Y
e

208
Capitolul 8 Regresia neliniar

t
t
K
Y
ln
ln
Parametrul exprim elasticitatea parial a
produciei n raport cu capitalul uman:
t
t
t
t
L
Y
L
L
Y
e

t
t
L
Y
ln
ln
Elasticitatea scalei este egal cu suma celor dou
elasticiti:
e = e
L
+ e
K
= +
Pentru funcia de producie Cobb-Douglas,
elasticitatea scalei se calculeaz numai n raport cu cei doi
parametri, existnd trei situaii:
- proces de producie cu randament de scal
descresctor, cnd elasticitatea scalei este mai mic dect 1:
+ < 1
- proces de producie cu randament de scal
constant, elasticitatea scalei fiind unitar:
+ = 1
Dac cele dou intrri cresc, atunci i ieirile cresc n
aceeai proporie.
209
Econometrie Teorie i studii de caz
- proces de producie cu randament de scal
cresctor, elasticitatea scalei fiind supraunitar:
+ > 1
Pentru a testa dac randamentul de scal al procesului
este constant, se definesc dou ipoteze:
H
0
: + = 1
H
0
: + 1
Pentru testarea ipotezei nule folosim testul Student,
respectiv:

+
+
t

( )
3
2

, cov
1

+ +
+

n
t

Pentru un prag de semnificaie stabilit, dac


tabelat calculat
t t <
, atunci se accept ipoteza nul, potrivit creia
procesul este de randament de scal descresctor.
Se scrie funcia Cobb-Douglas sub forma echivalent
t
e
L
K
A
L
Y
t
t
t
t

,
_

(8.22)
210
Capitolul 8 Regresia neliniar
Pentru definirea formei intensive a funcie de
producie Cobb-Douglas definim urmtoarele dou mrimi:
capitalul unitar pe unitatea de capital de munc,
t
t
t
L
K
k
;
productivitatea muncii,
t
t
t
L
Y
y
.
Se definete forma intensiv a funcie de producie
Cobb-Douglas prin relaia:
( )
t
e Ak k f y
t t t

(8.23)
Se verific dac funcia de producie intensiv
ndeplinete urmtoarele perechi de proprieti:
1.
( ) , 0 '
t
k f

( ) 0 "
t
k f
2.
( )

t
k
k f
t
' lim
0
i
( ) 0 ' lim

t
k
k f
t
Pentru a estima parametrii modelului (8.21) se face
liniarizarea prin logaritmare i se estimeaz parametrii
funciei translog, folosind metodele:
- liniarizm funcia (8.21) prin logaritmare, obinnd un
model triplu logaritmic:
t t t t
L K A Y + + + ln ln ln ln
(8.24)
Parametrii modelului de regresie (8.24) se estimeaz
aplicnd metoda celor mai mici ptrate.
211
Econometrie Teorie i studii de caz
- utilizm funcia de producie Cobb-Douglas (8.21) printr-o
funcie translog:
t t t
L K Y ln ln ln
1 1 0
+ +
( ) ( )
t t t t
L K L K ln ln ln ln
1
2
2
2
2
+ +
(8.25)
Relaia (8.25) reprezint seria Taylor a funciei (8.24)
n punctul (1, 1).
Modelul neliniar reprezentat prin funcia de producie
CES este definit prin relaia de mai jos:
( ) [ ]
t
e L K Y
t t t





+ 1 (8.26)
unde:
Y
t
- variabila ce cuantific ieirile din cadrul
sistemului;
K
t
- capitalul fix;
L
t
- capitalul uman;
,,, - parametrii modelului;

t
- variabila rezidual ce are repartiia N(0,
2

)
Parametrii modelului CES au urmtoarele semnificaii
i domenii de valori:
> 0 reprezint pentru aceast funcie de
producie parametrul de eficien al procesului de producie;

( ) 1 , 0
este parametru de distribuie al
procesului de producie;

0
este parametrul de scal pentru proces;
212
Capitolul 8 Regresia neliniar
1 este parametrul de substituie a celor doi
factori n cadrul procesului.
n cazul n care = 0, se obine funcia de producie
Cobb-Douglas.
Forma generalizat a funciei de producie CES
definit prin intermediul variabilelor factoriale
X
1
, X
2
, ..., X
n
este:
( )
t
e X X X Y
nt n t t t





+ + + ...
2 2 1 1

unde
1
1

n
i
i

(8.27)
Dac funcia incorporeaz progres tehnic, variabila
timp apare ntr-o manier explicit n cadrul modelului de
regresie. Funcia CES este reprezentat prin relaia:
( ) [ ]
t
mt
t t t
e L K A Y


+ 1
Pentru funcia CES sunt valabile proprietile:
- Elasticitatea substituiei celor doi factori este
constant, aceasta fiind determinat de valoarea parametrului
de substituie, :
+

1
1
e
- Randamentul scalei este stabilit n funcie de
valoarea parametrului , rezultnd: funcia de producie este
de randament de scal descresctor dac ( ) 1 , 0 ; pentru
= 1, funcia de producie are randament de scal constant;
213
Econometrie Teorie i studii de caz
dac > 1, dispunem de o funcie de producie de
randament de scal cresctor.
Pentru estimarea parametrilor funcie CES se aplic
algoritmii:
- Estimarea parametrilor folosind funcia de verosimilate,
presupune: logaritmarea funciei definit prin relaia (8.26),
rezultnd funcia de producie:
( ) [ ]
t t t t
L K Y


+ + +

1 ln ln ln (8.28);
scriem funcia de verosimilitate pentru funcia de producie
definit prin relaia (8.28); determinm cele patru estimaii
din condiiile de maximum al funciei de verosimilitate.
- Estimarea parametrilor folosind reprezentarea translog,
nseamn: se scrie funcia translog pentru (8.28) care este, de
fapt, un polinom de ordinul al doilea al acestei funcii n
punctul (1,1). Se obine atunci un model liniar n raport cu
parametrii modelului:

( )
t t t t t t
L K L K Y + + + +
2
11 1 1 0
ln ln ln ln ln
(8.29);
estimm parametrii modelului de regresie (8.28) aplicnd
MCMMP; determinm estimatorii modelului de regresie
(8.28) lund n considerare urmtoarele patru relaii definite
pentru parametrii CES i translog:
214
Capitolul 8 Regresia neliniar


1
2
1
11
1
1 1
0

+
e

(8.30)
215
Capitolul 9
Autocorelarea i
heteroscedasticitatea
n utilizarea seriilor de date reale, nu de puine ori,
una sau mai multe ipoteze nu sunt respectate. Astfel, de
regul, nu sunt verificate ipotezele:
- variabilele reziduale sunt autocorelate;
- variabilele reziduale nu au dispersie constant;
- variabilele exogene nu sunt liniar independente;
- valorile variabilelor ce definesc modelul liniar de
regresie sunt afectate de erori de observare.
Acestea afecteaz calitatea estimatorilor i modelul
liniar de regresie n ansamblul su.
Metoda celor mai mici ptrate nu ofer cele mai
bune rezultate n procesul de estimare a parametrilor i de
aceea se recomand utilizarea i altor metode pentru
estimarea parametrilor.
9.1. Unele aspecte privind
autocorelarea erorilor
n regresia clasic variabilele reziduale sunt
necorelate. De exemplu, pentru modelul liniar de regresie y =
X + , matricea de covarian a variabilelor reziduale este
definit prin:
Capitolul 9 Autocorelarea i heteroscedasticitatea
( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
n n n n
n
n




, cov ... , cov , cov
... ... ... ...
, cov ... , cov , cov
, cov ... , cov , cov
2 `
2 2 2 1 2
1 2 1 1 1
,

Dac reziduurile sunt autocorelate, atunci exist indici
i j astfel nct
( ) 0 , cov
j i

Dac variabilele reziduale sunt de medie zero i de
dispersie constant, matricea de covarian este definit prin
intermediul coeficienilor liniari de corelaie:
( )
1
1
1
1
]
1

1 ...
... ... ... ...
... 1
... 1
2 1
2 1
1 1
2
,
n n
n
n



unde
k

, 1 , 1 n k reprezint coeficientul de
autocorelaie de ordinul k. Dac variabilele reziduale sunt
homoscedatice, coeficientul de autocorelaie de ordinul k se
determin prin relaia:
( )
( ) ( )
,
var var
, cov
0

k
k i i
k i i
k

+
+
k = 1,2, ..., n 1
217
Econometrie Teorie i studii de caz
n analiza autocorelrii reziduurilor trebuie s se
procedeze la: identificarea surselor de apariie a corelrii
reziduurilor; stabilirea consecinelor pe care le genereaz
corelarea reziduurilor n estimarea parametrilor; investigarea
testelor statistice folosite n procesul de analiz a corelrii
reziduurilor; alegerea celei mai potrivite metode pentru
estimarea parametrilor.
Analiza autocorelrii valorilor reziduale este o etap
n analiza unei serii de timp. Pentru o serie atributiv, analiza
reziduului pentru depistarea autocorelrii se recomand n
situaia n care unitile sunt ordonate cresctor sau
descresctor n raport cu valorile unei caracteristici exogene.
Autocorelarea erorilor are urmtoarele surse:
- neincluderea uneia sau mai multor variabile
factoriale importante.
Dac variabila rezultativ este explicat prin dou
variabile factoriale, modelul de regresie este definit prin:
i i i i
cx bx a y + + +
2 1
Dac este omis o a treia variabil factorial, notat
prin x
3
, variabilele reziduale sunt autocorelate. n aceste
condiii reziduul va fi explicitat prin intermediul variabilei
omise:
,
3 i i i
u x + +
(9.1)
unde u
i
, i = 1, ..., n, sunt variabile reziduale ce
satisfac ipotezele modelului clasic de regresie.
- Modelul liniar de regresie nu exprim corect relaia
de dependen dintre variabila rezultativ i variabilele
factoriale, deoarece: modelul se exprim sub forma unei
218
Capitolul 9 Autocorelarea i heteroscedasticitatea
combinaii liniare de variabile n condiiile n care o
specificare corect a modelului trebuie s fie exprimat
printr-o combinaie liniar de logaritmi de variabile exogene;
modelul este corect specificat dac se exprim sub forma unei
combinaii liniare de diferene de ordinul nti de valori
absolute sau relative; nu toate seriile de date valorice ce
corespund variabilelor incluse n model sunt exprimate n
valori nominale etc.
Pentru depistarea autocorelrii variabilelor reziduale
sunt folosite o serie de procedee statistice. Cel mai simplu
mijloc pentru detectarea autocorelrii este cel al reprezentrii
grafice a seriei valorilor reziduale. Se ntocmete graficul
pentru seria reziduurilor estimate
( )
n i i
e i
, 1
,

, unde
i i
y y n
. O regularitate a graficului semnaleaz o corelare a
reziduului. Un astfel de mijloc de semnalare a autocorelrii
nu este potrivit n toate cazurile i de aceea, pentru
aprofundarea analizei sunt folosite teste statistice, dintre care
menionm:
Testul Durbin Watson este cel mai utilizat n
analiza autocorelrii variabilelor reziduale.
Prin acest test se detecteaz autocorelarea de ordinul
nti a reziduului estimat prin metoda celor mai mici ptrate.
Variabila rezidual satisface ecuaia unui proces
autoregresiv de ordinul nti dac
i i i
u +
1

unde
i
u
este un zgomot alb.
Se testeaz ipoteza nul H
o:
= 0, ce corespunde
cazului n care reziduurile sunt necorelate, cu alternativa H
1
219
Econometrie Teorie i studii de caz
= 0, pentru situaia n care reziduurile verific un proces
autoregresiv de orinul nti.
Statistica testului este evaluat n raport cu seria
reziduurilor
( )
n i i
e i
, 1
,

, determinat n situaia n care
parametrii modelului de regresie sunt estimai prin metoda
celor mai mici ptrate. Statistica testului este definit prin:
( )

n
i
i
n
i
i i
e
e e
DW
1
2
2
2
1
(9.2)
ntre statistica testului Durbin-Watson i
estimatorul parametrului din modelul de
regresie (9.1) se verific relaia de mai jos:
( ) 1 2 DW
(9.3)
Pentru a demonstra relaia de mai nainte se ine
seama de expresia estimatorului parametrului :

n
i
i
n
i
i i
e
e e
2
2
1
2
1

(9.4)
Statistica testului se scrie succesiv sub urmtoarea
form:
220
Capitolul 9 Autocorelarea i heteroscedasticitatea
( ). 1 2
1 2
2 2
2
2
2
1
2
2
2 2
1
2
1
2
2 2 2
2
1 1
2

,
_

,
_



n
i
i
n
i
i i
n
i
i
n
i
n
i
i i i
n
i
i
n
i
n
i
n
i
i i i i
e
e e
e
e e e
e
e e e e
DW
Valoarea statisticii testului pentru un model de
regresie este inclus n intervalul [0, 4]. O valoare n
apropierea lui 2 scoate n eviden necorelarea valorilor
reziduale.
Valoarea acestei statistici este dificil de interpretat
ntruct aceasta depinde nu numai de seria valorilor reziduale,
ci i de numrul de variabile factoriale incluse n modelul de
regresie (p) , precum i de lungimea seriei de date (n). De
altfel, valoarea medie a statisticii depinde de cele dou
elemente:
( )
( ) 1
2
2
+
+
p n
p
DW E
(9.5)
Valorile critice ale statisticii depind de numrul de
variabile factoriale din cadrul modelului (p) , de numrul de
observaii (n) i de pragul de semnificaie ales, (). Tabelele
de valori critice cuprind pentru elementele specificate cte o
pereche de valori d
L
i d
U
. n testarea ipotezei nule ntlnim
situaiile: valoarea statisticii este mai mic dect d
L


se
respinge ipoteza nul. Reziduurile prezint o autocorelare
pozitiv de ordinul nti; valoarea statisticii este mai mare
dect 4 - d
L

se respinge ipoteza nul. Reziduurile prezint


221
Econometrie Teorie i studii de caz
o autocorelare negativ de ordinul nti; d
U
< DW < 4 - d
U

se accept ipoteza nul a necorelrii printr-un proces


autoregresiv de ordinul nti al valorilor reziduale; d
L
> DW
> d
U
sau 4 - d
U
< DW < 4 - d
L
, testul Durbin-Watson nu este
concludent.
Prezentarea procesului de testare a autocorelrii
valorilor reziduale printr-un proces regresiv de ordinul nti
este cuprins n tabelul de mai jos:
Valoarea statisticii Decizia testului
1. 0 < DW < d
L Se respinge H
0


> 0
2. d
L
< DW < d
U
Indecizie
3. d
U
< DW < 4 d
U
Se accept H
0
4. 4 d
U
< DW < 4 d
L
Indecizie
5. 4 d
L
< DW < 4 Se respinge H
0


< 0
Testul Durbin-Watson nu poate fi aplicat dect n
anumite condiii, cum sunt: modelul de regresie trebuie s
cuprind termen liber; matricea X trebuie s fie
nestocastic. Modelul de regresie nu trebuie s includ
printre variabilele factoriale variabila rezultativ cu decalaj.
n cazul n care modelul de regresie cuprinde printre
variabilele factoriale variabila rezultativ cu decalaj, pentru
testarea autocorelrii se utilizeaz testul Breusch-Godfrey sau
unele forme derivate ale testului Durbin-Watson; testul
Durbin-Watson nu are nici o relevan n cadrul modelelor
de regresie pentru serii de date atributive; acest test nu este
folosit dect pentru depistarea autocorelrii de ordinul nti-
Pentru testarea ipotezei nule considerm condiia ca
matricea X s nu fie stochastic. Tabelele cu valori critice
222
Capitolul 9 Autocorelarea i heteroscedasticitatea
pentru aceast statistic sunt constituite n cele dou ipostaze:
modelul de regresie are sau nu un termen liber.
- Testul Breusch-Godfrey este utilizat pentru a
verifica dac rezidualul este reprezentat printr-un model
autoregresiv de ordinul r. Acest test se aplic n cazul n
care matricea X este stocastic, deci dac variabila se
expliciteaz n raport cu variabile cu decalaj.
Prin acest test se verific dac reziduul se reprezint
sub forma:
j j i
r
j
j i
u +


1
unde
j
u
este un zgomot alb.
Se testeaz ipoteza nul
H
0
:
1
=...=
r

reziduul nu este corelat.


cu ipoteza alternativ:
H
1
:
i
admite o reprezentare autoregresiv de ordinul
r.
Sub ipoteza H
1
, modelul liniar de regresie se prezint
prin:
i ji
p
j
j j i
r
j
j i
v x e y + +

1 1

a) Aplicarea acestui test se face astfel: se estimeaz
seria valorilor reziduale
i i i
y y e
, unde parametrii
modelului liniar de regresie se estimeaz prin metoda celor
mai mici ptrate; se estimeaz prin metoda celor mai mici
ptrate parametrii mdelului liniar de regresie:
223
Econometrie Teorie i studii de caz
i ji
p
j
j j i
r
j
j i
v x e e + +

1 1

;
se testeaz ipoteza H
0
formulat mai nainte, prin utilizarea
testului F sau LM (multiplicatorul Lagrange). n ultimul caz,
statistica testului este:
2 2
r
nR LM , unde
2
R
este
raportul de determinare calculat pentru modelul de regresie n
care reziduul admite o reprezentare autoregresiv de ordinul
r. Pentru un prag de semnificaie stabilit, dac valoarea
statisticii LM este superioar valorii critice a repartiiei
2
, se
respinge ipoteza nul.
Dac reziduul prezint o autocorelare de un anumit
ordin, estimatorii parametrilor sunt nc nedeplasai i
consisteni, dar nu mai sunt eficieni. Pentru corectarea
influenei generate de autocorelarea erorilor sunt folosite o
serie de proceduri, cum sunt: metoda Cochrane-Orcutt de
estimare a parametrilor; metoda Durbin; metoda Hildreth
Lu; metoda generalizat a celor mai mici ptrate; metoda
verosimilitii maxime.
9.2. Aspecte esen iale privind
heteroscedasticitatea
Cnd modelul liniar de regresie nu verific ipoteza de
homoscedasticitate, acesta are urmtoarea reprezentare:
y = X + ,
unde
( ) {
{ ( )
1
1
1
1
]
1

n
w
w
w
E
... 0 0
... ... ... ...
0 ... 0
0 ... 0
var
0
2
1
2


(9.6)
224
Capitolul 9 Autocorelarea i heteroscedasticitatea
Pentru acest model se ridic dou aspecte:
- cum se estimeaz cei n + p parametri ai modelului
liniar de regresie prin intermediul seriei de date cu n
componente ?
- care sunt consecinele pe care le genereaz
nerespectarea acestei ipoteze n procesul de estimare i
utilizare a modelului liniar de regresie ?
Pentru estimarea celor p parametri i n variane se
formulez o serie de ipoteze asupra variabilei reziduale.
Pentru estimarea matricei covarianelor reziduului, se
utilizeaz seria reziduurilor ce este estimat prin metoda celor
mai mici ptrate. Astfel, matricea covarianelor este estimat
prin:
1
1
1
1
1
]
1


2
2
2
2
1
... 0 0
... ... ... ...
0 ... 0
0 ... 0

n
e
e
e

De multe ori, nerespectarea ipotezei


homoscedasticitii se ntlnete n cazul folosirii datelor
agregate. Se noteaz prin g numrul de grupe i prin n
i
, i =
1, ..., g, dimensiunea grupelor.
n urma determinrii mediilor pe grupe, se obine
seria de date ce este folosit pentru estimarea parametrilor
modelului liniar de regresie. Aceast serie are reprezentarea:
( ) ( )
g i
i p j
ji y x
, 1
, 1
,

(9.7)
225
Econometrie Teorie i studii de caz
Pe baza acestei serii de date se estimeaz parametrii
modelului de regresie:

i
y
+
i
x
(9.8)
unde:
( ) , 0 E
iar
( ) ( )
1
1
1
1
1
1
1
1
]
1


g
n
n
n
E
1
... 0 0
... ... ... ...
0 ...
1
0
0 ... 0
1
, ' var
2
1
2



Pentru a corecta heteroscedasticitatea se aplic una
strategiile:
- se estimeaz parametrii modelului prin metoda
celor mai mici ptrate generalizat;
- se transform modelul sub forma echivalent:
M X M Y M + (9.9)

unde:

1
1
1
1
1
]
1

g
n
n
n
M
... 0 0
... ... ... ...
0 ... 0
0 ... 0
2
1
226
Capitolul 9 Autocorelarea i heteroscedasticitatea
Dac parametrii sunt obinui prin metoda celor mai
mici ptrate, obinem: media reziduului este zero; modelul
verific ipoteza de homoscedasticitate:
var(MM) = Mvar(M) = M

M =
2

I
g
Rezultatele permit aplicarea metodei celor mai mici
ptrate modelului (9.9) pentru care estimatorii sunt:
( ) MY M X X M M X ' ' ' '

1

Acetia corespund estimatorilor metodei celor mai
mici ptrate generalizate.
Dac heteroscedasticitatea este indus n cadrul
modelului prin intermediul unei variabile exigene ntr-o
manier multiplicativ, dispersia reziduului se definete prin:
( )


ji i i
x
2 2
var
(9.10)
unde este un scalar real iar X
j
este o variabil
exogen ce determin modificarea varianie reziduului de la o
observaie la alta. n raport cu valoarea parametrului , sunt
aplicate strategiile pentru eliminarea herescedasticitii i
estimarea parametrilor. Prezentm cteva cazuri particulare:
- n cazul n care = 0, se obine modelul care
verific ipoteza homoscedasticitii;
- Valoarea reziduului este proporional cu
valoarea unei variabile exogene, rezultnd:
227
Econometrie Teorie i studii de caz
n i x
ji i
, 1 ,
2 2 2


(9.11)
Obinem un model de regresie care verific ipoteza de
homoscedasticitate, mprind toi termenii modelului liniar
de regresie prin x
ji
.
ji
i
p
ji
pi
ji
i
ji
i
x x
x
x
x
x
y
+ + + ...
1
1
(9.12)
Care se poate scrie sub forma echivalent:
,
* * *
i i i
x y + unde
{
{
{
ji
i
i
ji
pi
ji
i
i
ij
i
i
x
x
x
x
x
x
x
y
y


1
1
]
1

*
1 *
*
,...,
(9.13)
Reziduul modelului (9.12) verific ipotezele
modelului clasic de regresie:
228
Capitolul 9 Autocorelarea i heteroscedasticitatea
( ) ( )
( ) ( )
( ) ( ) 0 , cov
1
, cov
; var
1
var
; 0
1
* *
2
2
*
*



t i
jt ji
t i
i
ji
i
i
ji
i
x x
x
E
x
E


Pentru estimarea parametrilor se recurge la metoda


celor mai mici ptrate aplicat modelului transformat sau la
metoda celor mai mici ptrate generalizat aplicat modelului
iniial, n condiiile n care:
1
1
1
1
1
]
1


2
2
2
2
1
2
... 0 0
... ... ... ...
0 ... 0
0 ... 0
jn
j
j
x
x
x


(9.14)
- Dispersia variabilei reziduale se reprezint prin
ji i
x
2 2


, iar n aceast situaie, pentru obinerea unui
model care s verifice ipoteza homoscedasticitii, se
mpart toi termenii ce definesc modelul (9.6) prin
ji
x
.
Se obine un model de regresie ce verific ipotezele
modelului clasic:
ji
i
p
ji
pi
ji
i
ji
i
x x
x
x
x
x
y
+ + + ...
1
1
(9.15)
229
Econometrie Teorie i studii de caz
- Dac dispersia este definit cu 0, modelul
iniial se transform ntr-un model MY = MX + M, care
verific ipoteza de homoscedasticitate.
Matricea M este definit prin:
1
1
1
1
1
]
1

2 / 1
2 / 1
2
2 / 1
1
... 0 0
... ... ... ...
0 ... 0
0 ... 0
jn
j
j
x
x
x
M
Utilizarea metodei celor mai mici ptrate pentru
estimarea parametrilor n situaia n care ipoteza de
homoscedasticitate nu se verific are consecine imediate
asupra calitii estimrii parametrilor modelului prin intervale
de ncredere, precum i asupra validrii unor ipoteze
formulate asupra acestui model de regresie. n aceste condiii,
dispersia reziduului este subestimat sau supra estimat.
Astfel, n aceast situaie, sunt validate ipoteze false sau, din
contr, sunt respinse ipoteze ce sunt corect formulate.
Pornind de la aceste afirmaii, se pune o prim problem,
aceea de a stabili n ce msur varianele variabilelor
reziduale stabilite n condiiile utilizrii metodei celor mai
mici ptrate se abat de la varianele estimate n condiiile unui
model homoscedastic. n al doilea rnd, trebuie identificate
testele statistice ce pot fi utilizate pentru verificarea
valabilitii ipotezei de homoscedasticitate.
Testul White are la baz explicitarea seriei
( )
n i i
e
, 1
2


n raport cu una sau mai multe variabile factoriale.
230
Capitolul 9 Autocorelarea i heteroscedasticitatea
Astfel, se reprezint seria ptratelor reziduurilor n
raport cu valorile variabilelor exogene, cu ptratele lor sau cu
diverse combinaii de ordinul nti ale acestora. Modelul de
regresie este definit prin relaiile:
- n raport cu unele variabile factoriale i ptratele
acestora:

i
k
j
ji j
k
j
ji j i
v x b x a e + +

1
2
1
2
(9.16)
- n raport cu unele variabile factoriale, ptratele
acestora i diverse combinaii de ordinul nti ale acestora.
Astfel, dac pentru explicarea varianei variabilei reziduale se
utilizeaz dou variabile factoriale, atunci se definete
modelul de regresie:
i i i i i i i i
v x x c x b x b x a x a e + + + + +
2 1 1
2
2 2
2
1 1 2 2 1 1
2
(9.17)
n ambele situaii, pentru a stabili dac ipoteza
homoscedastisticitii este valabil, se recurge la un test
Student sau la statistica LM.
n primul caz (9.17) definim ipotezele testului:
H
0
: a
1
= ... = a
k
= b
1
= ... = b
k
= 0

model
homoscedatic
0 :
1
a H
sau
0
i
b
model heteroscedatic
231
Econometrie Teorie i studii de caz
Dac se respinge ipoteza nul, atunci trebuie corectat
heteroscedastisticitatea naintea testrii ipotezelor formulate
asupra modelului liniar de regresie.
La aplicarea statisticii LM avem n vedere proprietatea
asimptotic a acesteia:
2 2
r
nR LM
unde:
n - dimensiunea seriei folosite pentru estimarea
parametrilor i reziduului
R
2
- raportul de determinare evaluat pentru unul dintre
aceste modele
r - numrul de parametri din cadrul acestor modele
n utilizarea acestei proceduri de testare trebuie s
se in seama de faptul c o cretere exagerat a valorii lui r
duce implicit la diminuarea puterii testului.
Testul Goldfeld-Quandt se aplic n situaia n
care o singur variabil factorial esta cauza
heteroscedastisticitii.
Pentru aplicarea acestei proceduri de testare se
parcurg etapele: se ordoneaz cresctor seria de date n raport
cu valorile caracteristicii exogene ce genereaz
heteroscedastisticitatea; sunt excluse din cadrul seriei un
numr de c valori centrale. Se obin dou subserii de valori:
prima, la nceputul seriei, cuprinde
1
]
1


2
c n
valori, iar a doua
este constituit din ultimele
1
]
1


2
c n
valori. Seria de date ce
corespunde variabilei exogene are urmtoarea reprezentare:
232
Capitolul 9 Autocorelarea i heteroscedasticitatea

subserie doua a
n c n
excluse valori
c n n
subserie prima
n
x x x x x x x ,..., , ,..., , ,..., ,
1 1 1 1 1 2 1 + + +
Valoarea lui c influeneaz n mod direct puterea
testului. De regul, se recomand
1
]
1

3
n
c
sau
1
]
1

4
n
c
.
Folosind seriile de date pentru cele dou subgrupe
extreme, se estimeaz parametrii modelelor de regresie:
pentru prima subserie se definete modelul de regresie

i i i
x b a y + +
1 1
,
1
, 1 n i , cu
( );
1
1
1


n
i
i i
y y SPR pentru a doua subgrup se definete un
model de regresie echivalent:
i i i
x b a y + +
2 2
,
1
2
, 1 +
1
]
1

c n
i
,cu
( )

+
1
]
1


n
c n
i
i i
y y SPR
1
2
2

se definete statistica testului



( )
( )
( ) p n p n F
p n SPR
p n SPR
G

2 1
1 1
2 2
,
/
/
S-a notat prin
i
n
numrul de termeni din cadrul
fiecrei subserii.
233
Econometrie Teorie i studii de caz
Testul Glesjer, presupune a se identifica una sau
mai multe funcii pentru explicitarea varianei reziduului.
Astfel, dispersia reziduului se expliciteaz prin
( )
i i i
v Z f +
2
(9.18)
unde f este o funcie analitic, Z este un vector de
variabile exogene sau combinaii de variabile exogene ce
cauzeaz violarea ipotezei homoscedasticitii.
Testul Glesjer stabilete dac ipoteza
homoscedasticitii este valid pentru testarea semnificaiei
modelului de regresie (9.18). Aplicarea acestui test const n
parcurgerea etapelor urmtoare:
- se estimeaz, prin metoda celor mai mici ptrate, parametrii
i seria reziduului modelului liniar de regresie,
i i i
x y +
;
- se expliciteaz seria reziduurilor printr-un model de regresie
definit n raport cu variabilele exogene ce genereaz
heteroscedasticitatea. n acest sens sunt utilizate diverse
strategii: se expliciteaz seria ptratelor reziduului printr-un
model de regresie constituit dup regulile definite n cadrul
testului White; se expliciteaz seriile
( )
n i
i
e
, 1
sau
( )
n i
i
e
, 1
ln


prin diverse metode de regresie liniar sau neliniar. n
raport cu caracteristicile modelului de regresie folosit n acest
sens, se precizeaz tipul heteroscedasticitii.
n tabelul urmtor sunt prezentate cteva cazuri
particulare de funcii de regresie. n toate situaiile,
heteroscedasticitatea este explicitat printr-o singur variabil
exogen.
234
Capitolul 9 Autocorelarea i heteroscedasticitatea
Modelul de regresie Tipul
heteroscedasticitii
1.
i ji i
u x a a e + +
1 0 i ji i
v x b b + +
2
1 0
2

2.
i ji i
u x a a e + +
2 / 1
1 0 i ji i
v x b b + +
1 0
2

3. i
ji
i
u
x
a
a e + +
1
0 i
ji
i
v
x
b
b + +
2
1
0
2

Pentru testarea ipotezei nule se recurge la testul


Student sau Wald. n cazul testului Student, se accept
ipoteza nul n situaia n care parametrul ce corespunde
variabilei exogene nu difer semnificativ de zero. n situaia
alternativ, se alege acel model ce ofer cea mai corect
explicitare a variabilei reziduale.
235
Bibliografie
Anghelache, C. Statistic teoretic i economic teorie
i aplicaii, Editura Economic, Bucureti,
2004
Anghelache, C. Sistemul European al Conturilor note de
curs, Editura ARTIFEX, Bucureti, 2004
Anghelache, C. i
colaboratorii
Analiz macroeconomic, Editura
Economic, Bucureti, 2006
Anghelache, C. i
colaboratorii
Econometrie studii de caz, Editura
ARTIFEX, Bucureti, 2006
Anghelache, C. i
colaboratorii
(2007)
Elemente de econometrie note de curs,
Editura ARTIFEX, Bucureti
Anghelache, C.,
Capanu, I.
Indicatori macroeconomici calcul i
analiz economic, Editura Economic,
Bucureti, 2003
Andrei, T. Statistic i econometrie, Editura
Economic, Bucureti, 2003
Bardsen, G. i
colaboratorii
(2005)
The Econometrics of Macroeconomic
Modelling, Oxford University Press
Biji, M., Biji,
M.E., Lilea, E.,
Anghelache, C.,
Tratat de statistic, Editura Economic,
Bucureti, 2002
Capanu, I.,
Anghelache, C.
Indicatori economici pentru
managementul micro i macroeconomic
calcul, prezentare, analiz, Editura
Economic, Bucureti, 2003
Capanu, I.,
Wagner, P.,
Mitru, C.
Sistemul Conturilor Naionale i
Agregatemacroeconomice, Editura ALL,
Bucureti, 2004
Capitolul 9 Autocorelarea i heteroscedasticitatea
Dobrescu, E. Macromodels of the Romanian Transition
Economy, Editura Expert, Bucureti, 1996
Dougherty, C.
(2007)
Introduction to Econometrics, Oxford
University Press
Gilbert, M.,
Kravis, I.
An International Comparison of National
Product and Purchasing Power of
Currencies, OEEC, Paris, 1954
Isaic-Maniu, Al.,
Mitru, C.,
Voineagu, V.
Macroeconomie i analiz
macroeconomic, Editura Constantin
Brncoveanu, Rm. Vlcea, 1995
Isaic-Maniu, Al.,
Antonescu, C.,
Korka, M.
Mitru, C.,
Voineagu, V.
Statistic General i economic, Editura
Constantin Brncoveanu, Rm. Vlcea,
1994
Florea, I.,
Parpucea, I.
Statistic inferenial, Editura
Continental, Alba Iulia, 2000
Georgescu-
Roegen. N,
Metoda Statistic, Ediia a II-a, Editura
Expert, bucureti, 1998
Georgescu-
Roegen. N,
Legea entropiei i produsul economic,
Editura Politic, bucureti, 1979
Sargent, T. Macroeconomic Theory, 2nd Edition,
Boston, Academic Press, 1999
Thomas, R.L. Modern econometrics an introduction,
Editura Financial Times Prentice Hall,
1997
Tovissi, L.,
Scarlat, E.,
Tanadi, Al.
Metode i modele ale analizei economice
structurale, Editura tiinific i
Enciclopedic, Bucureti, 1979
*** Scandinavian Journal of Statistics. Theory
237
Econometrie Teorie i studii de caz
and Applications, Volume 34, Nr. 1,
March 2007, ISSN 0303-6898
*** Statistical Methodology, Volume 4, Issue
2, April 2007, ISSN 1572-3127
*** Journal of multivariate analysis, Volume
98, Number 3, March 2007, ISSN 0047-
259X
*** Stoochastic processes and their
applications, VLume 117, Issue 4, Aprilie
2007, ISSN 0304-4149
*** Law, Probalbility and Risk, Volume 5,
Number 1, March 2006, ISSN 0957-4824
*** ISI Newsletter, Volume 31, Number 2(92)
2007
238

S-ar putea să vă placă și