Eco Zi 2010

1
ACADEMIA DE STUDII ECONOMICE

FACULTATEA DE ECONOMIE AGROALIMENTAR I A
MEDIULUI

Prof. univ. dr. MIRCEA GHEORGHI

Conf. univ.dr. SIMONA ROXANA PTRLGEANU

ECONOMETRIE

BUCURETI
-2008-

2
CUPRINS

Introducere 3
Capitolul I: Modele econometrice 4
1.1. Generaliti 4
1.2. Model aleator 4
1.3. Natura variabilelor care apar n model 4
1.4. Inducia statistic 5
1.5. Identificarea modelului 5
1.6. Previziunea variabilei endogene 5
1.7. Vocabular uzual 6
Capitolul II: Regresia simpl 10
2.1. Modelul liniar al regresiei simple 10
2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate 11
2.3. Proprietile estimatorilor 12
2.3.1. Covariana estimatorilor 15
2.3.2. Determinarea unui estimator nedeplasat pentru variana erorilor 16
2.3.3. Interpretarea geometric a metodei celor mai mici ptrate 18
2.3.4. Coeficientul de corelaie liniar 21
2.3.5. Distribuia de probabilitate a estimatorilor 22
2.4. Teste i intervale de ncredere 24
2.5. Previziunea cu modelul liniar 25
2.6. Experien de calcul 29
Capitolul III: Regresia multipl 34
3.1. Modelul liniar al regresiei multiple 34
3.2. Determinarea estimatorilor parametrilor 35
3.3. Proprietile estimatorilor 36
3.4. Determinarea unui estimator nedeplasat pentru variana reziduurilor 38
3.5. Teste i regiuni de ncredere 39
3.6. Previziunea variabilei endogene 41
3.7. Coeficientul de corelaie multipl. Analiza varianei 42
3.8. Experien de calcul 45
Capitolul IV: Studiul modelului liniar cnd ipotezele clasice asupra erorilor nu mai
sunt realizate
49
4.1. Ipoteza de independen a erorilor 49
4.1.1. Testarea ipotezei de independen a erorilor 52
4.1.2. Experien de calcul 55
4.2. Ipoteza de normalitate a erorilor 59
4.3. Ipoteza de heteroscedasticitate 60
4.4. Ipoteza de independen a erorilor n raport cu variabilele exogene 63
4.5. Ipoteza referitoare la faptul c variabilele sunt observate fr eroare 63
Bibliografie 68

3
INTRODUCERE

Dezvoltarea aparatului statistic furnizeaz economitilor tot mai multe date cifrice despre procesele i
fenomenele care au loc n timp i spaiu. Econometria este un mijloc de a exploata aceste date. Noiunea de econometrie
provine din termenii oikonomie (economie) i metron (msurare) i desemneaz totalitatea metodelor i tehnicilor de
msurare a fenomenelor i proceselor care au loc n domeniul economic. Primele lucrri econometrice au avut ca obiect
funciile consumului, care leag nivelul consumului de venitul disponibil (aceste funcii stau la baza teoriei keynesiene).
n decursul timpului, numeroi autori au ncercat definirea econometriei. Lucrarea ECONOMETRIA
PENTRU...ECONOMITI, a profesorului Eugen tefan Pecican, aprut la Editura Econmic n 2003, conine multe
referiri n acest sens, din care am selectat cteva.

Autori Referina
R. Frisch Econometria realizeaz mbinarea punctelor de vedere care se refer la teoria economic, statistic i
matematic cu privire la natura relaiilor cantitative din economie
P.A. Samuelson,
T.C. Koopmans,
J.R.N. Stone
Econometria reprezint o analiz de natur cantitativ a fenomenelor economice, bazat pe
dezvoltarea recent a teoriei culegerii i interpretrii datelor, n conexiune cu metodele de inferen
(inducie) statistic adecvate
Fr. Perroux Econometria este o economie de intenie tiinific
G.C. Chow Econometria este un domeniu n care se mbin arta i tiina de a utiliza metodele statistice n
vederea msurrii relaiilor economice
W. Griffits,
H. Carter,
G. Judge
Econometria este ansamblul metodelor de realizare a analizei datelor economice

Autorul lucrrii citate mai sus este de prerea c obiectul econometriei const n cunoaterea mecanismelor de
desfurare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natur
statistic sau matematic.
Definiiile date econometriei pun n eviden dou elemente: domeniul de studiu (economia, relaiile dintre
variabilele economice) i metodele utilizate (provenite din statistic i matematic). Econometria se orienteaz spre
construirea de modele econometrice care s reprezinte simplificat procesele sau fenomenele economice analizate i s
permit simulri ale acestora, n scopul nelegerii lor, pe de o parte, dar i s serveasc la realizarea de previziuni,
prognoze care s fundamenteze politicile economice, pe de alt parte.

4
CAPITOLUL I
MODELE ECONOMETRICE

1.1. Generaliti

Modelarea economic reprezint un proces de cunoatere mijlocit a realitii cu ajutorul unui instrument cu
caracteristici speciale: modelul. Sistemul real supus studiului este nlocuit prin modelul su, care este o reprezentare
simplificat a obiectului cercetat.
Modelul econometric este, de regul, o mulime de relaii numerice care permite reprezentarea simplificat a
procesului economic supus studiului (uneori chiar a ntregii economii). Modelele actuale comport adesea mai mult de
zece relaii (ecuaii). Validitatea unui model este testat prin confruntarea rezultatelor obinute cu observaiile statistice.
Pentru a studia un fenomen economic se ncearc reprezentarea lui prin comportamentul unei variabile. Aceast
variabil economic depinde, la rndul su de alte variabile de care este legat prin relaii matematice.
De exemplu, dac se studiaz cererea (C) i oferta (O) dintr-un anumit bun pe o pia, se tie c cererea i
oferta depind de preul (p) bunului respectiv. Putem scrie c variabilele C i O sunt funcii de variabila p i c la
echilibrul pieei, trebuie ca cererea s fie egal cu oferta. Se construiete astfel un model elementar de forma:

[1]
=
=
=
O C
p g O
p f C
) (
) (

Oferta i cererea dintr-un anumit bun depind i de alte variabile dect preul. Astfel, cererea dintr-un bun
alimentar depinde i de venitul disponibil, de preul unor produse analoage etc. La fel, dac este vorba despre un bun
agricol (gru,...) oferta depinde de preul anului precedent. Relaia stabilit ntre variabile n modelul econometric este
dat, de regul, la un anumit moment de timp t, caz n care variabilele apar indiciate:
[2]
=
=
=
t t
rt t t t t
nt t t t t
O C
x x x p g O
x x x p f C
) ,..., , , (
) ,..., , , (
2 1 1
2 1

n modelul [2] s-au introdus mai multe variabile care explic cererea i oferta dintr-un bun i s-a considerat
realizarea acestor variabile la momentul t sau t-1. Se observ c modelul comport mai multe relaii. Se zice c avem un
model cu ecuaii multiple. Evident, se va ncepe studiul cu un model mai simplu, cu o unic ecuaie.

1.2. Model aleator

S presupunem c se studiaz consumul (C
i
) dintr-un anumit bun de ctre o familie (i). ntre alte variabile,
consumul depinde de venitul disponibil al familiei (V
i
). Modelul econometric elementar const n a exprima C
i
n
funcie de V
i
. Desigur, ali factori dintre care unii sunt necunoscui determin de asemenea consumul familiei.
Condensm efectele acestor ali factori ntr-unul singur, aleator, notat
i
. Se obine astfel un model aleator:
[3]
i i i
V f C c + = ) (

Factorul aleator
i
este o variabil aleatoare care urmeaz o anumit lege de probabilitate, ce va trebui s fie
specificat prin ipotezele fcute asupra modelului. Cel mai frecvent, ipotezele se refer doar la momentele de ordinul I
i II ale variabilei aleatoare
i
. Urmeaz s ne asigurm c funcia f (sau clasa de funcii) aleas nu contrazice rezultatele
experienei. De exemplu, dac s-a ales f ca o funcie liniar (adic f(V
i
) = aV
i
+b), modelul econometric este:
[4]
i i i
b aV C c + + =

i variind pe i pentru diferitele familii studiate, ne vom asigura c relaia [4] este bine satisfcut. Se spune c testm
modelul. Dac rezultatul obinut este convenabil, se va trece la estimarea parametrilor a i b. Apoi, definind o regul
de previziune se va putea determina consumul C
i
dac se cunoate venitul V
i
.

1.3. Natura variabilelor care apar n model

ntr-un model econometric se disting dou tipuri de variabile:
-exogene. Sunt variabilele explicative ale variabilei studiate i se consider ca fiind date autonom. n modelul
[4] V
i
este variabila exogen (sau explicativ, independent). Venitul familiei V
i
explic n acest model

5
consumul familiei C
i
. Valoarea variabilei exogene pentru un i dat i pentru
i
precizat- permite determinarea
consumului C
i
.
-endogene. Sunt variabilele de explicat (sau dependente). C
i
este variabila endogen n modelul precedent. Se
poate remarca faptul c C
i
este acum o variabil aleatoare datorit lui
i
.
Distincia ntre natura variabilelor este foarte important i va trebui precizat ntotdeauna nainte de a studia
modelul. Cnd modelul econometric a cptat formularea matematic definitiv se spune c modelul a fost specificat.
Modelul [4] de mai sus este specificat. Se cunoate forma funciei f din expresia C
i
= f(V
i
) +
i
, adic f(V
i
) = aV
i
+b.
Adugarea variabilei exogene
i
d modelului formularea definitiv [4].
Mulimea parametrilor care definesc complet modelul econometric constituie structura acestuia. De
exemplu, dac a = 0,7 i b = 23 iar urmeaz o lege de probabilitate normal de medie (speran matematic) egal cu
zero i dispersie (varian) egal cu 5, atunci mulimea
a = 0,7; b= 23; o = 5 `
constituie structura modelului [4]. Scopul va fi acela ca, plecnd de la cuplurile (C
i
,V
i
) asociate diferitelor familii i, s
se determine structura adevrat a modelului. Cu alte cuvinte, plecnd de la un spaiu eantion definit de mulimea
cuplurilor (C
i
,V
i
) s se determine structura adevrat a modelului n spaiul cu trei dimensiuni al structurilor
a , b, o ` . Aici intervine induciastatistic.

1.4. Inducia statistic

Obiectul induciei statistice este de a determina o procedur care, pornind doar de la observaiile statistice de
care dispunem, s permit trecerea de la spaiul eantion la spaiul structurilor. Odat ce modelul a fost ales, se admite
c exist un triplet (a, b, o ) care permite reprezentarea exact a procesului prin care valorile variabilelor observate au
fost determinate. n cursul induciei statistice modelul nu se mai modific. Procedura aleas aa cum se va vedea n
continuare va consta n obinerea de estimatori pentru parametrii a i b care s permit determinarea celor mai bune
valori reale ale acestor parametri. Aceste valori se vor aprecia, n general, cu ajutorul unor intervale de ncredere
construite la un prag de semnificaie (o) dat. De exemplu, n modelul [4] se va gsi c ae[0,64;0,78] i be[20;27] cu o
probabilitate de 95% (s-a considerat o=5%). Se poate estima i abaterea medie ptratic (o) a variabilei aleatoare
i
. Se
va vedea rolul important jucat de aceast variabil aleatoare n modelul econometric.

1.5. Identificarea modelului

Considerm din nou modelul C
i
=aV
i
+b+
i
. S presupunem c procedura utilizat, pornind de la informaia
deinut, adic de la cuplurile (C
i
,V
i
), i=1,2,... nu conduce la o soluie unic, ci la dou structuri distincte:
s
0
=a
0
,b
0
,o
0
` , s
1
=a
1
,b
1
,o
1
`. Deorece legea de probabilitate pentru precizeaz i legea de probabilitate pentru C,
fiecare structur (innd cont de valorile exogenelor i de legea lui ) conduce la o lege de probabilitate pentru C.
Presupunem c structurile s
0
i s
1
conduc la aceeai lege de probabilitate pentru consumul C. Sunt posibile dou cazuri:
- s
0
i s
1
sunt distincte i nu putem alege ntre ele. Se spune c structurile considerate nu
sunt identificabile i, ca urmare, modelul nu este identificabil. Din aceast cauz nu
vom putea determina valorile parametrilor care figureaz n model;
- s
0
i s
1
nu sunt distincte, intersecia lor nu este vid. Acestea vor permite identificarea unei
pri a parametrilor modelului (cei care aparin interseciei). Se spune c cele dou
structuri sunt echivalente, dar nu permit o identificare complet a modelului.
Problema identificrii este important mai ales n cazul modelelor cu ecuaii multiple.

1.6. Previziunea variabilei endogene

Interesul unui model a crui structur a fost determinat const n a-l utiliza pentru previzionarea variabilelor
endogene ntr-o etap viitoare sau ntr-o circumstan dat, dac este vorba despre observaii luate la acelai moment-,
atunci cnd cele exogene au fost fixate. De exemplu, dac dorim s studiem evoluia importurilor (Y) n funcie de
produsul intern brut (X
1
) i de nivelul stocurilor (X
2
), modelul econometric este:
y
t
=a
1
x
1t
+a
2
x
2t
+b+
t
, t=1,2,...,T
unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X
1
i X
2
(observaiile fiind anuale)
permit determinarea parametrilor modelului. S presupunem c am gsit estimaiile punctuale:
=
=
=
6
6 , 0
14 , 0
2
1
b
a
a

6
Modelul estimat este:
6 6 , 0 14 , 0
2 1
+ + =
t t t
x x y
. Dac dorim s facem o previziune a importurilor
pentru anul 2007, trebuie s tim PIB-ul i nivelul stocurilor n anul 2007. Presupunnd c aceste variabile exogene sunt
x
1
=1030 i x
2
=12,7 vom avea ca previziune pentru y:
y
2007
=(0,14).1030+(0,6).(12,7)+6
sau, n general,
b x a x a y
p

2 2 1 1
+ + =
u u u
, unde este perioada de previziune.
Observaie. Asupra valorii previzionate trebuie s remarcm:
- valorile exogenelor x
1
, x
2
au fost alese arbitrar, eventual innd cont de evoluia lor trecut;
- specificarea modelului nu poate fi perfect, forma funciei alese pentru a explica evoluia lui y neputnd fi
suficient de precis;
- este posibil ca variabilele explicative (exogene) ale variabilei endogene (explicate), s nu mai intervin n
acelai mod ca n perioada 1990-2005, cnd s-a studiat legatura dintre ele. Este posibil s aib loc un oc, o
ruptur care s perturbe echilibrul dintre variabilele care explic fenomenul, la momentul previziunii.
Este evident c toate aceste cauze pot constitui surse de eroare a previziunii. Vom vedea care sunt metodele de a
minimiza eroarea de previziune.

Rezumatul capitolului I

Pentru construcia i utilizarea unui model econometric, se parcurg urmtoarele etape:
- specificarea modelului (gsirea formulrii matematice definitive a legturii dintre variabilele care descriu
fenomenul sau procesul economic studiat);
- estimarea parametrilor i testarea modelului cu ajutorul statisticilor (seriilor de date observate) deja
cunoscute;
- previziunea variabilei endogene.

1.7. Vocabular uzual

Dac suntei familiarizai cu statistica matematic, putei trece la capitolul II. n caz contrar, v reamintim aici
cteva noiuni de baz. Lectura acestui paragraf credem c v va incita s revedei cursul de Statistic matematic.

Nor de puncte Fiind dat o serie de date statistice n care valorile (x
i
,y
j
) apar efectiv de n
ij
ori putem
reprezenta ntr-un plan toate aceste valori prin puncte de coordonate (x
i
,y
j
) afectate de coeficienii n
ij
, obinndu-se
astfel un nor de puncte.
Ajustare Reprezentarea grafic a seriilor de date economice conduce frecvent la figuri puin lizibile i greu
de interpretat din cauza variaiilor pe termen scurt, numeroase i sensibile, dar fr o semnificaie important. Metodele
matematice numite de ajustare permit obinerea unei curbe simple, ct mai apropiat posibil de mulimea de puncte
furnizate de observaiile empirice disponibile.
Ajustare liniar Atunci cnd reprezentarea grafic a unei serii statistice duble d un nor de puncte de form
alungit, se ncearc obinerea unei aproximri bune a acestei serii cu ajutorul unei drepte, realizndu-se astfel o ajustare
liniar. Exist mai multe metode pentru gsirea acestei drepte:
- metoda grafic (se determin punctul mediu M ale crui coordonate sunt ( ) y x, i se traseaz dreapta care
pare a fi cea mai reprezentativ a seriei, determinnd ecuaia Y=aX+b. Aceast metod este ambigu pentru c nu ine
cont de ponderea fiecrui punct n norul de puncte);
- metoda lui Mayer (se regrupeaz punctele norului n dou submulimi crora li se determin punctele medii
M
1
i M
2
. Dreapta de ajustare este atunci dreapta care trece prin M
1
i M
2
);
- metoda celor mai mici ptrate (const n a face minim suma ptratelor distanelor de la punctele norului la o
dreapt de ecuaie Y=aX+b numit dreapt de regresie a lui Y n X. Se arat c panta (coeficientul director) acestei
drepte este a=cov(X,Y)/Var(X). Coeficientul b se obine scriind c dreapta de regresie trece prin punctul mediu:
X a Y b = . Procednd la fel se gsete dreapta de regresie de ecuaie X=a'Y+b' , cu a'=cov(X,Y)/Var(Y) i
Y a X b ' = ' . Cele dou drepte de regresie sunt, n general, distincte. Compararea lor permite msurarea nivelului
de corelaie al caracteristicilor X i Y. Corelaia se msoar cu coeficientul de corelaie =cov(X,Y)/o(X)o(Y). Se
constat c
2
=aa' i c variaz ntre 1 i 1.
2
msoar unghiul dintre cele dou drepte de regresie, care coincid dac
2
=1, adic 1 = . Caracteristicile X i Y sunt corelate maximal cnd este apropiat de 1).
n afara faptului de a da o reprezentare mai mult sau mai puin satisfctoare legturii dintre X i Y, importana
ajustrii liniare este de a permite previziuni statistice, asociind lui X o valoare probabil a lui Y prin relaia Y=aX+b.
Probabilitate Fiind dat o mulime finit O, numim probabilitate pe O orice aplicaie p a lui P(O)
mulimea prilor lui O - n intervalul [0,1| care verific trei condiii:

7
- p(A)>0, pentru Ae P(O)
- p(O)=1
- p(AB)= p(A)+ p(B), dac A,Be P(O), AB=u
O se numete univers (sau univers de probabiliti). O nzestrat cu probabilitatea p se numete spaiu
probabilizat. Orice parte a lui O este un eveniment. Un singleton (mulime ce conine un singur element) al lui O se
numete eveniment elementar sau eventualitate. O este evenimentul cert. u este evenimentul imposibil. A este
evenimentul complementar lui A n O (se numete eveniment contrar lui A). Dac AB=u, evenimentele A i B sunt
incompatibile.
Variabil aleatoare Dac O este un univers finit, numim variabil aleatoare orice aplicaie X: O R ( a
lui O n mulimea numerelor reale). Mulimea valorilor lui X, adic X(O) se numete universul imagine. Atenie!- o
variabil aleatoare nu este o variabil, ci o aplicaie! Se observ c nu este necesar s cunoatem o probabilitate pe O
pentru a defini o variabil aleatoare pe O.
Legea de probabilitate a unei variabile aleatoare Dac universul finit O este nzestrat cu o probabilitate p,
iar X este o variabil aleatoare definit pe O, numim lege de probabilitate a variabilei aleatoare X, aplicaia p
x
:
X(O)[0,1| care asociaz oricrui xeX(O) probabilitatea evenimentului mulimea antecedentelor lui x prin X.
Aceast mulime X
-1
(x) este notat (X=x). Legea de probabilitate a lui X, notat p
x
este definit prin p
x
: X(O)[0,1|, x
p(X=x). A studia o variabil aleatoare nseamn a-i descoperi legea sa de probabilitate.
Funcie de repartiie Dac universul finit O este nzestrat cu o probabilitate p, iar X este o variabil
aleatoare definit pe O, se asociaz acestei variabile aleatoare funcia F:R[0,1| definit prin F(x)=p(X<x) numit
funcie de repartiie a variabilei aleatoare X. Evenimentul (X<x) este imaginea intervalului ( ) x , prin funcia X.
Funcia de repartiie este o funcie n scar.
Sperana matematic Dac X este o variabil aleatoare definit pe universul finit O, nzestrat cu
probabilitatea p, universul imagine este o mulime finit i ia valorile x
i
, i=1,2,...,n. Legea de probabilitate a lui X
asociaz fiecrui x
i
probabilitatea p
i
=p(X=x
i
). Se numete speran matematic a variabilei aleatoare X, numrul real
=
=
n
i
i i
x p X E
1
) (

. E(X) este media n probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator
liniar.
Variana Dac X este o variabil aleatoare definit pe universul finit O, nzestrat cu probabilitatea p,
universul imagine este o mulime finit i ia valorile x
i
, i=1,2,...,n. Legea de probabilitate a lui X asociaz fiecrui x
i

probabilitatea p
i
=p(X=x
i
). Se numete varian a variabilei aleatoare X, numrul real pozitiv
=
=
n
i
i i
X E x p X Var
1
2
)) ( ( ) (
. Variana este media n probabilitate a ptratului distanelor de la x
i
la media lor.
Rdcina ptrat (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat o
x
.
Momente condiionate Se consider vectorul aleator ( )
2
: , R Y X O , cu repartiia
ij j i
p y Y x X P = = = ) , ( , , 0 >
ij
p
=
i j
ij
p 1 i variabila aleatoare condiionat (X/Y=y
j
) cu repartia
= = = =
i
ij j
j
ij
j i
p p
p
p
y Y x X P
.
.
, ) / ( . Momentul de ordinul k al variabilei aleatoare X condiionat de Y=y
j
este
momentul iniial de ordinul k al variabilei aleatoare condiionate (X/Y=y
j
):

= = = = = =
i i i
k
i ij
j j
ij
k
i j i
k
i j
k
x p
p p
p
x y Y x X P x y Y X M
.
1
.
) / ( ) / (

Similar se definete momentul de ordinul k al variabilei aleatoare Y condiionat de X=x
i
.
Pentru k=1 se obin mediile condiionate:

= = = =
j
ij j
i
i
i
j i i
j
j
p y
p
x X Y M p x
p
y Y X M
.
1
) / ( ,
.
1
) / (
Se pot defini variabilele aleatoare medii condiionate astfel:
- variabila aleatoare media lui X condiionat de Y, cu repartiia:
= >
|
|
.
|
\
| =
j
j j
j
j
p p
p
y Y X M
Y X M 1 . , 0 . ,
.
) / (
: ) / (
-variabila aleatoare media lui Y condiionat de X , cu repartiia:

8
= >
|
|
.
|
\
| =
i
i i
i
i
p p
p
x X Y M
X Y M 1 . , 0 . ,
.
) / (
: ) / (
Regresie Se numete regresia variabilei aleatoare X n raport cu Y, variabila aleatoare M(X/Y) cu mulimea
valorilor posibile: M(X/Y=y), . R xe
Similar, regresia variabilei aleatoare Y n raport cu X este: M(Y/X=x), . R ye
Dac M(X/Y)=aX+b sau M(Y/X)=cY+d se spune c regresia este liniar
Repartia normal Variabila aleatoare X urmeaz o repartiie normal de parametri m i (se mai scrie i
) , ( o m N X e ) dac densitatea ei de probabilitate (derivata funciei de repartiie) este:
),
2
) (
exp(
2
1
) (
2
2
o
t o
m x
x f

= , R x e , R me >0
Pentru m=0 i =1 se obine repartiia normal normat N(0,1), cu densitatea de probabilitate:

),
2
exp(
2
1
) (
2
x
x f =
t
, R x e
Se arat c parametri m i
2
sunt media (sperana matematic), respectiv dispersia (variana) variabilei aleatoare
) , ( o m N X e .
Repartiia
2
(hi-ptrat) cu n grade de libertate Variabila aleatoare X urmeaz legea de repartiie hi-ptrat
cu n grade de libertate (se mai scrie i ) (n H X e ) dac densitatea ei de repartiie este:

),
2
exp(
2 )
2
(
1
) (
1
2
2
x
x
n
x f
n
n

I
=

x>0,
*
N n e
Dac variabilele aleatoare
), 1 , 0 ( N X
i
e
i=1,2,...,n sunt independente, atunci variabila aleatoare
=
=
n
i
i
X Y
1
2
urmeaz legea de repartiie H(n).
Repartiia Student cu n grade de libertate S(n) Variabila aleatoare X urmeaz legea de repartiie Student
cu n grade de libertate dac densitatea ei de repartiie este:
, 1
2
1
,
2
1
) (
2
1
2
+
|
|
.
|
\
|
+
|
.
|
\
|
B
=
n
n
x
n
n
x f , R x e
*
N n e
Dac variabilele aleatoare ), 1 , 0 ( N X e
) (n H Y e
sunt independente, atunci variabila aleatoare
) (n S
n
Y
X
Z e = .
Repartiia Fisher-Snedecor F(n
1
,n
2
) Variabila aleatoare X urmeaz legea de repartiie Fisher-Snedecor cu
n
1
i n
2
grade de libertate dac densitatea ei de repartiie este:

, 1
2
,
2
) (
2
2
1
2 1
1
2
2
2
1
2 1
1
1
n n
n
n
x
n
n
n n
x
n
n
x f
+
|
|
.
|
\
|
+
|
.
|
\
|
B
|
|
.
|
\
|
=
x>0,
*
2 1
, N n n e

9
Dac variabilele aleatoare
) (
1 1
n H X e
i
) (
2 2
n H X e
sunt independente, atunci variabila
aleatoare ) , (
2 1
2
2
1
1
n n F
n
X
n
X
X e = .

10
CAPITOLUL II
REGRESIA SIMPL

Studiem, pentru nceput, cel mai simplu model econometric: o variabil endogen reprezint evoluia
fenomenului considerat i aceast evoluie este explicat printr-o singur variabil exogen.
n cadrul capitolului este prezentat metoda de estimare a parametrilor care intervin ntr-un model
econometric, se vor examina proprietile estimatorilor obinui i se vor generaliza rezultatele analizei pentru modele
mai complexe. ntr-o prima parte se va trata obinerea estimatorilor parametrilor modelului i proprietilor lor, iar ntr-
o a doua parte se d o interpretarea geometric a metodei utilizate, determinarea intervalelor de ncredere referitoare la
parametri i previziunea care poate fi fcut cu un astfel de model.

2.1. Modelul liniar al regresiei simple

Considerm modelul:
(1)
t t t
b ax y c + + =
, t=1, 2, ...,T
n care: Y reprezint o variabil endogen;
X o variabil exogen;
c o variabil aleatoare ale crei caracteristici vor fi precizate prin ipoteze.
Se dispune de T observaii asupra lui Y i X, adic T cupluri (x
t
, y
t
) care sunt realizri ale lui X i Y. a i b sunt
parametri reali necunoscui pe care dorim s-i estimm cu ajutorul observaiilor (x
t
, y
t
) cunoscute.

Ipoteze fundamentale
Pentru a putea obine rezultatele enunate la nceput, vom simplifica lucrurile impunnd o serie de ipoteze
restrictive asupra modelului. Ulterior, n alte capitole, se vor relaxa aceste restricii, discutnd implicaiile abandonrii
unora din aceste ipoteze asupra calitii estimatorilor.
I
1
:
x
t
i y
t
sunt mrimi numerice observate fr eroare;
X variabila explicativ se consider dat autonom n model;
Y variabila endogen este o variabil aleatoare, prin intermediul lui c.
I
2
:
a)- c urmeaz o lege de distribuie independent de timp, adic media i dispersia lui c nu depind de t:
( ) T t E
t
,..., 2 , 1 , 0 = = c
,
( )
2
c
o c =
t
Var
, cantitate finit, t .
Observaie:
S-au folosit aici, pentru medie i dispersie, notaiile ( ) - E , respectiv ( ) - Var , provenind de la sperana
matematic i variana unei variabile aleatoare. Se presupune c studenii au cunotine elementare despre teoria
probabilitilor i statistic matematic. Altfel, ele trebuie revzute!
b)- Realizrile lui c sunt independente de realizrile lui X n cursul timpului. Aceasta este ipoteza de
homoscedasticitate. n caz contrar, exist heteroscedasticitate.

11
c)- Independena erorilor (se va vedea pe parcurs c variabila aleatoare c reprezint erori sau reziduuri).
Dou erori relative la dou observaii diferite t i t sunt independente ntre ele, nsemnnd c au covariana nul:
( ) 0 , cov =
' t t
c c
, ceea ce implic
( ) 0 . =
' t t
E c c
.
Prin definiie, cov( =
'
) ,
t t
c c | | )) ( ))( ( (
t t t t
E E E
' '
c c c c i innd cont de a) rezult implicaia.
d)- Normalitatea erorilor. Presupunem c c urmeaz o lege de repartiie normal , cu media 0 i dispersia
2
c
o
,
ceea ce poate fi scris astfel:
( )
2
, 0
c
o c N e
.
I
3
:
Primele momente empirice ale variabilei X, pentru T foarte mare, sunt finite:
=

T
t
T
t
x x
T
1
0
1
(media empiric).
( )
=

T
t
T
t
s x x
T
1
2
2
1
(variana empiric).
Aceast ipotez va fi folosit pentru a preciza proprietile asimptotice ale estimatorilor parametrilor a i b.
Ipotezele I
1
, I
2
, I
3
pot prea foarte restrictive. Vom vedea ulterior ce consecine are abandonarea unora dintre
ele asupra proprietilor estimatorilor lui a i b.

2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate
Determinarea estimatorilor parametrilor a i b (notai cu
a
i b
) prin metoda celor mai mici ptrate

(MCMMP) se face punnd condiia ca suma ptratelor erorilor s fie minim, adic:
| | ( )

= =
= =
T
t
t t
T
t
t
b a b ax y
1
2
1
2
, c
.
Pentru ca ( ) b a, s fie minimal, trebuie ca:
1. condiii necesare: 0 =
c
c
a
, 0 =
c
c
b
.
2. condiii suficiente: 0
2
2
>
c
c
a
, 0
2
2 2
2
2
2
>
c
c
c c
c
c c
c
c
c
b a b
b a a

.
Calculm derivatele pariale ale funciei ( ) b a, .
( )( ) 0 2
1
= =
c
c
=
t
T
t
t t
x b ax y
a

( )( ) 0 1 2
1
= =
c
c
=
T
t
t t
b ax y
b

0 2
1
2
2
2
=
> =
c
c
T
t
t
x
a

12
T
b
2
2
2
=
c
c

=
=
c c
c
=
c c
c
T
t
t
x
a b b a
1
2 2
2

.
Atunci, condiiile de ordinul I (necesare) conduc la sistemul de ecuaii:
( )
=
=

= =
= = =
0
0
1
1 1
1 1
2
1
Tb x a y
x b x a y x
T
t
t
T
t
t
T
t
t
T
t
t
T
t
t t
,
iar condiiile suficiente (de ordinul II) sunt verificate.
Ecuaiile condiii de ordinul I (numite ecuaii normale, vezi justificarea geometric din partea a II-a), le
mprim la T, rezultnd:
=
=

= =
0
0
1 1
1
2
1
b x a y
x b x
T
a y x
T
T
t
t
T
t
t t
.
Din a doua ecuaie avem
x a y b =
i nlocuind n prima ecuaie:

( )( )
( )
=
2 2
2 2
2
1
1
x x
x x y y
x T x
x y T y x
x x
T
x y y x
T
a
t
t t
t
t t
t
t t
.
Am obinut estimatorii a i b
ai parametrilor a i b dai de relaiile:

( )
( )( )
( )
=

=
x a y b
x x
x x y y
a
t
t t

,
2
2

Observaie:
a este o variabil aleatoare pentru c e funcie de y
t
, iar b
este aleator pentru c e funcie de a .

2.3. Proprietile estimatorilor
Vom arta c estimatorii a i b
obinui prin metoda celor mai mici ptrate sunt nedeplasai i convergeni. n
demonstraie vom ine cont de ipotezele I
1
, I
2
, I
3
. Pentru a uura demonstrarea proprietilor enunate, transformm mai
nti expresiile (2) pentru a le exprima n funcie de parametrii a i b. Vom considera modelul (1)
t t t
b ax y c + + =
, t=1, 2, ...,T, nsumm dup toi t i mprim la T. Rezult:

+ + =
t t t
T
b x
T
a y
T
c
1 1 1
, adic

13
( ) c + + = b x a y 2
.
Scdem membru cu membru pe (2) din (1):
( ) ( ) c c + =
t t t
x x a y y
i nlocuim ( ) y y
t
n expresia lui a :
( ) ( ) | |( )
( )
( ) ( )( )
( )
( ) ( )
( )
( )
( )
+ =

+ =
=
+
=
+
=
2 2
2
2
2
x x
x x
a
x x
x x x x
a
x x
x x x x a
x x
x x x x a
a
t
t t
t
t t t
t
t t t
t
t t t
c c c
c c c c

(deoarece 0 ) ( ) ( = =

x x x x
t t
c c ).
Din expresia lui b
, avem c x a y b
= , adic b x a y
+ = , iar din (2) c + + = b x a y , astfel c prin

scdere rezult: ( ) c + = b b x a a
0 sau ( )x a a b b + =
c . Am obinut c:
( )
( )
+ =
2
x x
x x
a a
t
t t
c

( )x a a b b + =
c
.
a
i b
sunt estimatori nedeplasai pentru a i b.

Un estimator este nedeplasat dac media estimatorului este chiar parametrul estimat. Vom aplica
operatorul de medie E n relaiile gsite mai sus. Pentru comoditate, notm cu w
t
cantitatea:
( )
=
2
x x
x x
w
t
t
t
, astfel c
+ =
t t
w a a c

Rezult:
( ) ( ) ( ) a E w a E a E
t t
= + =

c
, pentru c E(a)=a i E(c
t
)=0.
( ) ( ) ( ) ( ) a a E x E b E b E + =
c

Avem c: E(b)=b,
( ) ( )

= =
|
.
|
\
|
= 0
1 1
t t
E
T T
E E c c c
i
( ) ( ) ( ) 0 = = = a a a E a E a a E
, deci
( ) b b E =
.
a
i b
sunt estimatori convergeni pentru a i b.

14
tiind c
( ) a a E =
i
( ) b b E =
, este suficient s artm c

( ) 0
T
a Var
i
( ) 0

T
b Var
pentru ca
a
i
b
s fie convergeni n probabilitate ctre a i b. Calculm variana

estimatorilor a
i
b
.
tim c
+ =
t t
w a a c
, adic
=
t t
w a a c
.
( ) ( ) ( )
( ) ( )

<
<
+ =
= |
.
|
\
|
+ = = =
'
' '
2 2
'
' '
2 2
2
2
2
2
t t
t t t t t t
t t
t t t t t t t t
E w w E w
w w w E w E a a E a Var
c c c
c c c c

Conform ipotezelor fundamentale,
( )
2 2
c
o c =
t
E i ( ) 0
'
=
t t
E c c , pentru ' t t = , rezultnd:
( )

= =
2
2 2 2
t t
w w a Var
c c
o o ,
dar
( ) ( )

=
|
|
.
|
\
|
=
2
2
2
2
1
x x x x
x x
w
t t
t
t
.
n final, dispersia estimatorului
a
este:

( )
( )

=
2
2
x x
a Var
t
c
o
.
Conform ipotezei I
3
, ( )
2
2 1
s x x
T
T
t

i avem c
( ) 0
2
2
=
T
Ts
a Var
c
o
.
Am obinut c
a a
P
T

( a este convergent n probabilitate ctre a).

Determinm acum dispersia estimatorului
b
:
( ) ( ) ( ) | | ( ) ( ) | |
( ) ( ) | | ( )
2
2 2
2
2
2 2 2
2
2

a a E x a a E x E
x a a a a x E x a a E b b E b Var
+ =
= + = = =
c c
c c c

Evalum, pe rnd, fiecare termen:

( )
( ) ( ) ( )
T T
T
Var
T
E
T
E
T
T
E
T
E E
t
t t
t t t
t t
t t t t
2
2
2
2
'
'
2
2
2
'
'
2
2
2
2
1 2 1
2
1 1
c c
o o
c c c c
c c c c c
= = = + =
=
(
|
.
|
\
|
+ =
(
=

<
<

(deoarece ( ) 0
'
=
t t
E c c ).

15
( ) | | ( )
( ) ( ) ( )

= = + =
=
(
+ =
(
|
.
|
\
|
=
<
<
t t t
t t
t t t t t
t t
t t t t t t t t
w
T
Var w
T
E w
T
E w
T
w w E
T
w
T
E a a E
2
'
'
2
'
'
2
1 1 1
1 1
c
o
c c c c
c c c c c c

dar
( ) ( )
( ) 0
1
2
1
2
1
=
= =
x x
x x x x
x x
w
t
t
T
t
t
t
T
t
t
,
adic ( ) | | 0 = a a E c .
Folosind aceste rezultate pariale, se obine:
( ) ( ) ( )
( )

+ = + = + =
2
2
2
2
2
2
2
2
2

x x
x
T
a Var x
T
a a E x
T
b Var
t
c c c c
o o o o

Dispersia estimatorului b
este:
(
(
+ =
2
2
2
) (
1
)
(
x x
x
T
b Var
t
c
o

Cum ns 0
1

T
T
i
( )
0
1 1
2 2
=
T
t
Ts
x x
rezult c
( ) 0

T
b Var
,
adic
b b
P
T

( b
converge n probabilitate ctre b) .

2.3.1. Covariana estimatorilor a i b

Calculm acum covariana estimatorilor pornind de la definiie:
( ) ( ) ( ) ( ) | | ( )( ) | |
( ) ( ) ( ) | | ( ) ( ) | |
( ) | | ( ) ( )
( )

= = =
= = =
= = =
2
2
2
2

, cov
x x
x
a Var x a a E x a a E
a a x a a E a a x a a E
b b a a E b E b a E a E b a
t
c
o
c
c c
.
Matricea de varian i covarian a lui a i b
, notat
( ) b a
,
O
este deci:

16
( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
( ) ( )
|
|
|
|
|
|
.
|
\
|
=
=
|
|
|
|
|
|
.
|
\
|
(
(
=
|
|
.
|
\
|
= O

2
2
2
2 2
2
2
2
2
2
2
2
2
2
2
,
1
1
1
cov
, cov
x x
x
T
x x
x
x x
x
x x
x x
x
T
x x
x
x x
x
x x
b Var a b
b a a Var
t t
t t
t t
t t
b a
c
c
c
c c
o
o
o
o o

Se remarc faptul c
( ) b a
,
O
conine pe
2
c
o , adic variana lui
t
c care este necunoscut. Se pune deci
problema de a obine o estimaie pentru
( ) b a
,
O
, adic o estimaie pentru
2
) (
c
o c =
t
Var
. Notm aceast
estimaie cu
2
c
o
.

2.3.2. Determinarea unui estimator nedeplasat pentru variana erorilor
Utiliznd estimatorii a i b
putem calcula estimaia variabilei endogene y

t
, notat
t
y (se mai numesc i valori
ajustate ale variabilei endogene):
b x a y
t t
+ =
.
Atunci diferena dintre y
t
i
t
y este un estimator pentru eroarea
t
c
. Notm
t t t
y y
= c
. Avem c
( ) ( ) b b x a a b x a b ax b x a y y y
t t t t t t t t t t
= + + = = =
c c c . Remarc:
deoarece a i b
converg n probabilitate ctre a i b, distribuia lui

t
c
converge n probabilitate ctre distribuia lui

t
c
(distribuie normal, conform I
2
).
tim c
( )x a a b b =
c
i nlocuind obinem:
( ) ( ) ( ) ( )( ) x x a a x a a x a a
t t t t t
= + = c c c c c .
iar prin ridicare la ptrat:
( ) ( )( )( ) ( ) ( )
2
2
2
2
2 x x a a x x a a
t t t t t
+ = c c c c c
.
nsumm dup t=1,2,...,T i mprim la T:
( ) ( ) ( )( ) ( ) ( )

+ =
2
2
2
2
1
1
2
1
1
x x
T
a a x x
T
a a
T T
t t t t t
c c c c c
.
Dar:
( )
( )
=
2
x x
x x
a a
t
t t
c
, i
( )( ) ( ) ( ) | | ( ) ( ) ( ) ( )

= = =
2
x x a a x x x x x x x x x x
t t t t t t t t t
c c c c c c

17
pentru c ( )
= 0 x x
t
c .
nlocuind, rezult:
( ) ( ) ( )

=
2
2
2
2
1
1
x x
T
a a
T T
t t t
c c c
.
Notm cu
( )
=
2
2
1
c c o
t
T
dispersia erorilor fa de media lor i cum ea este o variabil aleatoare, i
calculm media ( )
2
o E :
( ) ( ) ( )
( ) ( )
( ) ( )
|
.
|
\
|
= = =
=
(
|
.
|
\
|
+ =
(
(
|
.
|
\
|
= =
=
(
=
(
+ =
(
=

<
<
T T
E
T
E
T
T
E
T
E E E
T
T
E
T
E
T
E E
t t
t t t
t t
t t t t t
t t t t
1
1
2 1
2
1 1 1
1
2
1 1
2
2
2
'
'
2
2
2
2
'
'
2
2
2
2
2
2
2
2
2
2
2
2
2
c
c
c c
c c
o
o
o c c c o
c c c o c o c c
c c c c c c c c o

Aplicnd acum operatorul de medie n relaia:
( ) ( ) ( )

=
2
2
2
2
1
1
x x
T
a a
T T
t t t
c c c ,
i innd cont de expresia varianei estimatorului a , rezult:
( ) ( ) ( )
|
.
|
\
|
=
|
.
|
\
|
= =
|
.
|
\
|

T T T
x x
T
a Var E
T
E
t t
2
1
1
1
1

1
2
2
2
2
2 2
c
c
c
o
o
o o c .
Relaia gsit se poate scrie i astfel:
|
.
|
\
|
=

2 2
2
1
t
T
E c o
c
, aa c, notnd
=
2 2
2
1
t
T
c o
c
, am
obinut:
( )
2 2
c c
o o = E
, adic
2
c
o
este un estimator nedeplasat pentru
2
c
o
(variana erorilor).
Este de remarcat c modelul
t t t
b ax y c + + =
presupune estimarea a doi parametri (a i b), iar
numitorul lui
2
c
o
este T-2. (T-2) constituie numrul gradelor de libertate. Vom reveni ulterior asupra acestei
probleme.
n concluzie, pentru modelul liniar al regresiei simple, avem estimatorii:
( )( )
( )

=
2
x x
x x y y
a
t
t t

x a y b
=
2 2
2
1
t
T
c o
c

18
Estimatorul
2
c
o
permite s dm o estimaie a varianelor i covarianei parametrilor din model, deci o
estimaie a matricei
( ) b a
,
O
, notat
( ) b a
O
:

( )
( ) ( )
( ) ( )
|
|
.
|
\
|
= O
. .
. .
b Var b a
b a a Var
b a

, cov
, cov
,
, unde:

( )
( )

=
.
2
2
x x
a Var
t
c
o
,

( )
( )
(
(
+ =
.
2
2
2
1
x x
x
T
b Var
t
c
o
,

( ) ( ) a Var x b a
, cov
. .
=
.

2.3.3. Interpretarea geometric a metodei celor mai mici ptrate
Am determinat estimatorii a i b
ai parametrilor modelului utiliznd condiia necesar de existen a

minimului sumei ptratelor erorilor
2
t
c . Putem s dm o condiie necesar i suficient pentru ca
2
t
c s fie
minimal, cu ajutorul unei reprezentri grafice. Aceast condiie va consta n egalitatea cu zero a dou produse scalare
care redau ecuaiile normale.
Modelul
t t t
b ax y c + + =
se scrie sub form matriceal astfel:
c + + = bU aX Y
,
unde:
|
|
|
|
|
|
|
.
|
\
|
=
T
y
y
y
Y
.
.
.
2
1
,
|
|
|
|
|
|
|
.
|
\
|
=
T
x
x
x
X
.
.
.
2
1
,
|
|
|
|
|
|
|
.
|
\
|
=
1
.
.
.
1
1
U ,
|
|
|
|
|
|
|
.
|
\
|
=
T
c
c
c
c
.
.
.
2
1
.
n spaiul ortonormat
T
9 considerm vectorii Y, X, U i c.

19

Vectorul 0H=aX+bU aparine planului (L) determinat de vectorii X i U. Fie 0A=Y, 0B=X, 0C=U, HA=c.
Cantitatea
2 2
2
HA
t
= = c c este minimal dac HA este ortogonal pe (L), adic pe X i U. Aceast condiie se
traduce prin egalitatea cu zero a produsului scalar al vectorilor respectivi:
=
=
0 0
0 0
C HA
B HA
, sau
>= <
>= <
0 ,
0 ,
U bU aX Y
X bU aX Y
, adic
=
=

0
2
b T x a y
x b x a y x
t t
t t t t
.
Am regsit, deci, sistemul de ecuaii normale.
Notm Y
proiecia pe planul (L) a vectorului Y i cu c vectorul HA ortogonal la planul (L).

A efectua o regresie a variabilei Y asupra variabilei X n modelul
t t t
b ax y c + + =
revine, deci, la a
proiecta vectorul Y pe planul (L) din
T
9 determinat de X i U.

Observaie:
Considerm modelul
t t
b y c + = . O reprezentare analog celei dinainte este:

n scriere matricial, modelul este c + = bU Y , iar conform cu reprezentarea grafic, avem relaia
OA=OH+HA.
Y

(L)
A
B
C U
H
c
Y X
O
0
Y
A
U H

20
2
2
HA
t
= c este minimal dac H HA 0 (HA este perpendicular pe 0H), adic 0 = U HA sau
0 , >= < U bU Y sau
= 0 b T y
t
,
= = y y
T
b
t
1
i Y U y U b H = = =
0 . Msura algebric a
proieciei vectorului Y pe suportul vectorului U este y . Vom utiliza aceast observaie pentru a exprima ecuaia
varianei.

Ecuaia varianei

Relum reprezentarea geometric precedent i notm cu K proiecia lui A pe suportul vectorului U:

Evident, KH este perpendicular n K pe 0C. n triunghiul AKH, dreptunghic, avem:
( )
2 2 2
1 HA KH AK + =
.
tim c
b x a y
t t
+ =
i

+ = b x
T
a y
T
t t
1

1
, adic:
b x a y
+ =
. Dar i
b x a y
+ =
, rezultnd c
y y =
.
Deoarece: AK=0A-0K ( K A0 A dreptunghic n K)
HK=0H-0K ( HK 0 A dreptunghic n K),
rezult, folosind (1):
( ) ( ) ( )

+ =
2
2 2
2
t t t
y y y y c

rezidual
atea Variabilit
regresiei datorat
atea Variabilit
total
atea Variabilit
+ =

Aceasta este ecuaia varianei. Vom reveni asupra ei cnd vom aborda regresia multipl.

Y

(L)
A
B
C U
H
c
Y
X
K
Y
O

21
2.3.4. Coeficientul de corelaie liniar

Coeficientul de corelaie liniar ntre variabilele X i Y, notat , se calculeaz cu relaia:
( )( )
( ) ( )

=
2 2
x x y y
x x y y
t t
t t
.
n general,
( )
Y X
XY
Y X
o o
=
, cov
, unde
X
o i
Y
o sunt abaterile standard (radicalul dispersiei) ale variabilelor
X i Y.
tim c estimatorul parametrului a are expresia
( )( )
( )

=
2
x x
x x y y
a
t
t t
, astfel c putem scrie:
( )( )
( )
( )
( ) ( )
( )
( )

=
2
2
2 2
2
2
y y
x x a
x x y y
x x
x x
x x y y
t
t
t t
t
t
t t
. Am obinut o expresie a coeficientului
de corelaie n funcie de estimator, iar prin ridicare la ptrat:
( )
( )
=
2
2
2
2
y y
x x a
t
t
.
Un calcul imediat arat c:
( ) ( ) ( ) | | ( ) | | ( )

= = + + = =
2
2
2
2
2 2

x x a x x a b x a b x a y y y y
t t t t t
.
n acelai timp, ecuaia varianei conduce la: ( ) ( )

=
2
2 2

t t t
y y y y c , de unde:
( )
( )
( )
( ) ( )
=
2
2
2
2
2
2
2
2
1

y y y y
y y
y y
y y
t
t
t
t t
t
t
c c
.
Pe de alt parte, utiliznd figura geometric i notnd cu unghiul H K A
, avem
AK
KH
= o cos ,
( )
( )
= =
2
2
2
2
2
cos
y y
y y
AK
KH
t
t
o , adic
( )
= =
2
2
2 2
1 cos
y y
t
t
c
o
.
n mod necesar, 1 0
2
s s i 1 1 s s .
Cnd 0 = , nu exist o relaie de tip liniar b ax y
t t
+ = ntre y
t
i x
t
, adic a=0.
Cnd 1
2
= , y
t
este legat de x
t
printr-o relaie de forma b ax y
t t
+ = . 1 = implic a>0, iar
1 = implic a<0.
Cnd relaia dintre y
t
i x
t
nu este strict, adic b ax y
t t
+ ~ , atunci este apropiat de 1, semnul lui
fiind cel al lui a.

22
2.3.5. Distribuia de probabilitate a estimatorilor

Deoarece erorile c
t
t=1,2,...,T au o distribuie normal, de medie zero i dispersie
2
c
o , densitatea de
probabilitate a lui c
t
este:
( ) T t f
t
t
,..., 2 , 1 ,
2
1
exp
2
1
2
2
=
)
`
=
c c
o
c
t o
c .
Cum c
t
i c
t
sunt independente pentru ' t t = , densitatea de probabilitate a vectorului aleator (c
1
, c
2
, ..., c
T
) va fi
egal cu produsul densitilor de probabilitate relative la fiecare c
t
.
( ) ( )

)
|
|
.
|
\
|
=

2
2
2 1
2
1
exp
2
1
,..., , 1
c
c
o
c
t o
c c c
t
T
t
f

Dar,
b ax y
t t t
= c
i
( ) ( ) ( )
)
( ) (

b b x a a
b b x a a b x a y b b x a x a b ax y b ax y
t t
t t t t t t t t t
+ + =
= + + = + + =
c

(deoarece
t t t t t
y y b x a y c
= = ).
Evalum suma ptratelor erorilor:
( ) ( ) ( ) | |
( ) ( ) ( ) ( ) ( )( )
( ) ( ) ( ) ( ) ( ) | |
2
2
2
2
2
2 2 2
2
2
2
2

2 2

+ + =
(
+ + =
=
(
+ + + + + =
= + + = =
b b x a a b b x a a
x b b a a b b x a a b b x a a
b b x a a b ax y
t t t t
t t t t t t
t t t t t
c c
c c c
c c

( ( ) 0 2 =
t t
x a a c , ( ) 0
2 = b b
t
c pentru c aa cum arat reprezentarea grafic, vectorul c este ortogonal la
planul (L), prin urmare este perpendicular pe orice vector din acel plan, deci i pe X i U. Produsele scalare cu aceti
vectori vor fi nule, adic: 0 , >= < X c i 0 , >= < U c ).
ntr-o scriere matricial:
( ) ( ) | |
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
= +

b b
a a
T x T
x T x
b b
a a
b b x a a
t
t
2
'
2

( lasm studenilor plcerea de a verifica !).
nlocuind n (1) fiecare c
t
prin expresiile calculate mai sus, deducem densitatea de probabilitate a vectorului aleator
(y
1
,y
2
,...,y
T
):
( )
( )
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
=
=
|
|
.
|
\
|
=
b b
a a
T x T
x T x
b b
a a
b ax y
y y y
t
t
T
t t
T
t
2
1
exp
2
1
exp
2
1
2
1
exp
2
1
,..., ,
2
2
'
2
2
2
2
2 1
c c c
c c
o o
c
t o
o
t o

23
innd cont de matricea de varian i covarian a estimatorilor,
( ) b a
,
O , se arat uor c:
( )
1
,
2
2
1

O =
|
|
.
|
\
|
b a
t
T x T
x T x
c
o
i ( ) ( ) ( ) b a h g y y y
t
T
t
,
2
1
,..., ,
2 1

|
|
.
|
\
|
= c
t o
c
unde ( )
t
g c este densitatea de
probabilitate a lui
t
c , iar ( ) b a h
, cea a lui ( ) b a
, .
Cu aceste rezultate i fcnd apel la unele teoreme importante ale statisticii matematice, putem deduce
urmtoarele distribuii de probabilitate:
1. Deoarece
=
2 2
2
1
t
T
c o
c
, adic ( )
2 2
2
c
o c =
T
t
, variabila aleatoare definit de
raportul ( )
|
|
.
|
\
|
=

2
2 2
2
1
2
t
T c
o o
o
c c
c
urmeaz o repartiie _
2
(hi-ptrat) cu (T-2) grade de
libertate. (Vectorul c admite T-2 componente independente nenule distribuite dup T-2 legi
normale independente, cu media zero i abatere standard
c
o )
2. Folosind relaile de calcul stabilite anterior, rezult c
2
2
2

a
a
o
o
o
o
c
c
=

(am utilizat aici notaiile
) (
2
a Var
a
= o
i
) (
2
a r a V
a
= o
pentru variana estimatorului a , respectiv
pentru estimaia acesteia). Atunci variabila aleatoare definit de raportul
( )
2
2
a
a
T
o
o
urmeaz tot o repartiie

_
2
cu (T-2) grade de libertate.
3. Cuplul
( ) b a
,
urmeaz o repartiie normal bidimensional, astfel c variabilele aleatoare
definite mai jos au repartiiile urmtoare:
( ) 1 , 0
N
a a
a
e
o
;
( ) 2
T
a
S
a a
o
(repartiia Student cu (T-2) grade de libertate);

( ) 1 , 0
N
b b
b
e
o
;

( ) 2
T
b
S
b b
o
.
4. Expresia
( )

)
|
|
.
|
\
|
O
|
|
.
|
\
|
=

b b
a a
b b
a a
F
b a
2
1
1
,
'
este variabil aleatoare repartizat Fisher-
Snedecor, cu 2 i (T-2) grade de libertate.

24

2.4. Teste i intervale de ncredere

Pentru c exist tabele cu valorile legilor de probabilitate anterioare, putem determina intervale de ncredere
pentru parametrii a i b la un nivel de semnificaie o fixat.
o
o
o
=
)
`
t
a a
ob r P
a

o
t
este luat din tabela distribuiei Student cu (T-2) grade de libertate. Un calcul simplu conduce la intervalul
de ncredere pentru parametrul a, de forma:
a a
t a a t a

o o
o o
+ s s

ceea ce permite afirmaia c adevrata valoare a parametrului real a , se gsete n intervalul de valori
| |
a a
t a t a

; o o
o o
+
cu probabilitatea 1-.
Cnd se dorete testarea unei valori a
0
a parametrului a, este suficient, pentru a accepta aceast valoare cu
riscul o, s ne asigurm c:
o
o
t
a a
a
s
.
Altfel spus, este suficient ca a
0
s aparin intervalului de ncredere stabilit:
| |
a a
t a t a a
0
, o o
o o
+ e
.
De asemenea,
( ) { } o o = s 1 2 , 2 , T F F ob r P
.
( ) 2 , 2 , = T F F o
este ecuaia unei elipse cu centrul n ( ) b a w
, care definete astfel o regiune de ncredere

pentru cuplul ( ) b a, la nivelul de semnificaie o:

A a A
a
b
B

b

B
w

25
Proieciile acestei elipse pe axe determin, de asemenea, dou intervale de ncredere pentru a i b, centrate n
a i b
. Dar, este important de remarcat c, nivelul de semnificaie referitor la aceste intervale nu mai este nivelul o
asociat elipsei.
Dac se dorete testarea simultan a dou valori a
0
, b
0
alese apriori, este suficient s nlocuim a i b n expresia
F prin a
0
i b
0
.
Dac
( ) ( ) 2 , 2 , ,
0 0
s T F b a F o
se accept valorile, altfel ele vor fi respinse. Altfel spus, pentru a
accepta cuplul (a
0
, b
0
) la nivelul de semnificaie o este suficient ca punctul M
0
(a
0
,b
0
) s aparin elipsei de ncredere
asociat cuplului (a, b).

Observaii:
1. Expresia ( )
T
y y y ,..., ,
2 1
se descompune n doi factori (g i h). g se exprim doar n funcie de
t
c , adic n
funcie de y
t
, a , b
; h nu conine dect pe a , b
, a i b. Aceasta arat c, odat cunoscut o realizare a

cuplului ( ) b a
, , legea de probabilitate condiionat a lui y

t
(dat de factorul g) nu depinde dect de valorile
adevrate (dar necunoscute) ale parametrilor a i b. Se zice c ( ) b a
, sunt estimatori exhaustivi pentru a i b,

adic ei rezum toat informaia pe care eantionul o poate aduce despre a i b.
2. Cnd ipoteza de normalitate asupra erorilor
t
c este realizat, funcia de verosimilitate relativ la eantionul
( )
T
y y y ,..., ,
2 1
este chiar funcia ( )
T
y y y ,..., ,
2 1
. Pentru obinerea de estimatori ai lui a i b prin metoda
verosimilitii maxime, este suficient s maximizm expresia ( )
T
y y y ,..., ,
2 1
, adic s minimizm
( )

2
b ax y
t t
. Estimatorii ( ) b a
, obinui cu metoda celor mai mici ptrate coincid, deci, cu cei obinui
prin metoda verosimilitii maxime.
3. Atunci cnd ipoteza de normalitate a erorilor nu se realizeaz, se va arta c estimatorii a i b
obinui prin
metoda celor mai mici ptrate au variana minim printre toi estimatorii liniari centrai n a i b (se va da o
demonstraie pe cazul general).

2.5. Previziunea cu modelul liniar
Fie
u
x
realizarea variabilei exogene la momentul u. Valoarea previzionat pentru endogena Y va fi:
b x a y
P
+ =
u u
,
iar realizarea efectiv a lui Y este:
u u u
c + + = b ax y
.
Eroarea de previziune se poate exprima prin variabila aleatoare u u
y y e
P
P
=
.
( ) ( )
u u u u
c + = b b x a a y y
P
.

26
Se remarc imediat c ( ) 0 =
P
e E , iar variana erorii de previziune este:
( ) ( ) ( ) ( ) ( )
( )( ) | | ( ) | | ( ) | | b b E a a E x b b a a E x
E b b E a a E x y y E e Var
P
P
+
+ + + = =
2 2
2
2
2
2
2
u u u u
u u u u
c c
c

Ultimii doi termeni sunt nuli (s-a demonstrat anterior!) (c i a , ca i c i b
sunt necorelai).
Deci:
( ) ( ) ( ) ( ) ( ) b a x Var b Var a Var x e Var
P
, cov 2
2
u u u
c + + + = .
Notm variana erorii de previziune cu ( )
P
e Var =
2
u
i folosind relaiile de calcul anterioare, rezult:
( ) ( ) ( )
( )
( )
(
(
+ + =
=
+
(
(
+ +

2
2
2
2
2
2
2
2
2
2
2
2 2
1
1
2
1
x x
x x
T
x x
x x
x x
x T
T
x x
x
t
t t t
u
c
c u
c
c c
u u
o
o
o
o o

2
c
o este necunoscut, dar estimat prin
2
c
o i variana estimat a erorii de previziune este:

( )
( )
(
(
+ + =
2
2
2 2
1
1
x x
x x
T
t
u
c u
o

Aceast varian poate fi redus, pe de o parte prin creterea numrului de observaii (T), iar pe de alt parte,
prin alegerea lui
u
x astfel nct ( )
2
x x
u
s nu fie prea mare (adic fcnd o previziune pe termen scurt).
Deoarece erorile sunt normal distribuite, ( )
2
, 0
c
o c N
t
e atunci i ( ) N a a e i ( ) N b b e
(urmeaz legi
normale). Rezult urmtoarele distribuii de probabilitate pentru variabilele:

( ) 1 , 0 N
y y
P
e
u
u u
.

u
u u
y y
P
urmeaz o lege Student cu T-2 grade de libertate pentru c ( ) ( )

2
2
2
2
2
c
c
u
u
o
o
= T T .
n planul (x,y) trasm dreapta de ajustare b x a y
+ = . Fie ( )
P
y x P
u u
, punctul situat pe dreapta de ajustare.
Putem construi, avnd P ca centru i paralel cu axa 0y un interval de ncredere M
1
M
2
la nivelul de semnificaie o.
o
o
u
u u
=
<
2
t
y y
P
P
.

27
2
o
t fiind luat din tabela distribuiei Student. Pentru T dat,
u
ca funcie de ( )
2
x x
u
este minim pentru
x x =
u
. Punctele M
1
i M
2
sunt deci situate, cnd u variaz, pe dou arce de curb (vezi figura), care determin astfel
regiunea creia i aparine
u
y pentru
u
x dat, cu o probabilitate egal cu (1-o).

Observaii
1. O variabil aleatoare t este distribuit dup o lege Student cu T-2 grade de libertate dac expresia
2
2
T
t

este raportul dintre o variabil aleatoare distribuit
2
_ cu 1 grad de libertate i o alta distribuit
2
_ cu (T-2) grade de
libertate. Fie
a
a a
t
= . Atunci:

( )
( )
( )
( )
libertate de grade 2) - (T cu
libertate de grad un cu
T
a a
T
a a
T
t
2
a
a
a
a
_
_
o
o
o
o
2
2
2
2
2 2
2
=
.
2. O variabil aleatoare F este distribuit dup o lege Fisher-Snedecor cu n
1
i

n
2
grade de libertate dac
expresia
2
1
n
F n
este raportul dintre o variabil aleatoare distribuit
2
_ cu n
1
grade de libertate i o alta distribuit
2
_
cu n
2
grade de libertate.
Fie
( )
)
`
|
|
.
|
\
|
O
|
|
.
|
\
|
=

b b
a a
b b
a a
F
b a
'
2
1
1
,
.
Atunci:
M
1

M
2

P
x
u
x
x
y

P
y
u

y

b x a y
+ =

28

( )
( )
libertate de grade 2) - (T cu
libertate de grade doua cu
T
b b
a a
T x T
x T x
b b
a a
T
b b
a a
T x T
x T x
b b
a a
T
F
2
t
t
_
_
o
o
o
o
c
c
c
c
2
2
2
2
2
,
2
2
,
2
2
=
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|
=
=
|
|
.
|
\
|
|
|
.
|
\
|
|
|
.
|
\
|

pentru c ( ) b a
, urmeaz o lege normal bidimensional.

3. Jacobianul transformrii permite exprimarea densitii de probailitate a vectorului aleator ( )
T
y y y ,..., ,
2 1

pornind de la cea a lui ( )
T
c c c ,..., ,
2 1
. Cnd ( )
T
f c c c ,..., ,
2 1
este cunoscut, pentru a obine ( )
T
y y y ,..., ,
2 1
,
procedm astfel:
nlocuim
t
c prin expresia ei n funcie de
t
y ;
nmulim expresia obinut cu valoarea absolut a determinantului:
( )
( )
1
1 ... 0 0
... ... ... ...
0 ... 1 0
0 ... 0 1
...
... ... ... ...
...
...
2 1
2
2
2
1
2
1
2
1
1
1
= =
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
= =
T
T T T
T
T
y y y
y y y
y y y
y D
D
J
c c c
c c c
c c c
c

( ) ( ) ( ) ( ) ( ) J y y y f y y y
T T T
. ,..., , ,..., ,
2 2 1 1 2 1
c c c =

4. Am vzut c ( )

=
t t
w a a c ,
t
c i ( ) a a fiind distribuite normal. ( ) a a este o combinaie liniar
de
t
c . Deci:
( )
( ) 1 , 0
N
a a
a
e
o

( )
2
a
a a
o
este distribuit _
2
cu 1 grad de libertate pentru c este ptratul unei variabile aleatoare N(0,1).
( )
( ) 1 , 0
N
b b
b
e
o

( )
( ) 1
2
2
_
o
e
b
b b

Deoarece ( ) ( ) ( )

=
2
2
2
2
x x a a
t t t
c c c , prin mprirea la
2
c
o , obinem:
( )
( )
( )
=
2
2
2
2
2
2
2
x x
a a
t
t t
c c c
o o
c c
o
c

29
( )
2
) 1 (
2
) 1 (
2
) (
2
2
2
2
2
2

= = =

T T
t t
T
_ _ _
o
c
o
c
o
c c
c c c

( )
( )
( )
( )
( )
2
1
2
2
2
2

_
o
c
e
a Var
a a
x x
a a
t

Rezult c:
2
) 2 (
2
) 1 (
2
) 1 (
2
2

= =
T T
t
_ _ _
o
c
c
.

2.6. Experien de calcul

Pentru a studia cum variaz cheltuielile de ntreinere i reparaii ale unui utilaj agricol n funcie de vrsta
utilajului, s-au cules urmtoarele date:
Vrsta utilajului (x
t
)
n luni-
15 8 36 41 16 8 21 21
Cheltuieli anuale de ntreinere i reparaii (y
t
)
n RON-
48 43 77 89 50 40 56 62
Vrsta utilajului (x
t
)
n luni-
53 10 32 17 58 6 20
Cheltuieli anuale de ntreinere i reparaii (y
t
)
n RON-
100 47 71 58 102 35 60

Rezolvare:
Cutm s estimm parametrii unei regresii liniare nte variabilele X i Y, de forma
t t t
b ax y c + + =
,
presupunnd c sunt ndeplinite ipotezele fundamentale I
1
,I
2
,I
3
.
1. Pentru a calcula estimatorii, se folosesc relaiile de calcul stabilite anterior (n cadrul seminarului se vor
prezenta facilitile de calcul oferite de diferite pachete de programe dedicate). Elementele necesare calculului sunt date
n tabelul ce urmeaz:

30

t x
t
y
t
x
t
y
t
1 15 48 720 -9,1333 83,4177 -14,5333 211,218 225 2304 50,8544 -11,6789 136,396 -2,8544 8,1479
2 8 43 344 -16,1333 260,284 -19,5333 381,551 64 1849 41,9034 -20,6298 425,59 1,0965 1,2023
3 36 77 2772 11,8666 140,818 14,4666 209,284 1296 5929 77,7073 15,174 230,251 -0,7073 0,5003
4 41 89 3649 16,8666 284,484 26,4666 700,484 1681 7921 84,1008 21,5675 465,16 4,8991 24,0012
5 16 50 800 -8,1333 66,1511 -12,5333 157,084 256 2500 52,1331 -10,4002 108,164 -2,1331 4,5503
6 8 40 320 -16,1333 260,284 -22,5333 507,751 64 1600 41,9034 -20,6298 425,59 -1,9034 3,6232
7 21 56 1176 -3,1333 9,8177 -6,5333 42,6844 441 3136 58,5267 -4,0066 16,053 -2,5267 6,3842
8 21 62 1302 -3,1333 9,8177 -0,5333 0,2844 441 3844 58,5267 -4,0066 16,053 3,4732 12,0637
9 53 100 5300 28,8666 833,284 37,4666 1403,75 2809 10000 99,4454 36,912 1362,5 0,5545 0,3075
10 10 47 470 -14,1333 199,751 -15,5333 241,284 100 2209 44,4609 -18,0724 326,613 2,539 6,4469
11 32 71 2272 7,8666 61,8844 8,4666 71,6844 1024 5041 72,5925 10,0591 101,187 -1,5925 2,536
12 17 58 986 -7,1333 50,8844 -4,5333 20,5511 289 3364 53,4118 -9,1214 83,201 4,5881 21,0509
13 56 102 5916 33,8666 1146,95 39,4666 1557,62 3364 10404 105,8389 43,3056 1875,38 -3,8389 14,7375
14 6 35 210 -18,1333 328,818 -27,5333 758,084 36 1225 39,346 -23,1873 537,649 -4,346 18,8883
15 20 60 1200 -4,1333 17,0844 -2,5333 6,4177 400 3600 57,248 -5,2853 27,9347 2,7519 7,5734
362 938 27437 - 3753,73 - 6269,73 12490 64926 - - 6137,72 - 132,0144
x x
t

2
) ( x x
t
y y
t

2
) ( y y
t

2
t
x
2
t
y
67 , 31 28 , 1 + =
t t
x y
y y
2
) ( y y t t t
y y = c
2
t
c

31
Pe baza elementelor din tabelul de calcul, se determin:
-
=
= = =
T
t
t
x
T
x
1
133 , 24 362
15
1 1
=
= = =
T
t
t
y
T
y
1
533 , 62 938
15
1 1

-
( )( )
( )
28 , 1
) 133 , 24 ( 15 12490
) 533 , 62 )( 133 , 24 ( 15 27437
.
2 2 2 2
=
x T x
y x T y x
x x
x x y y
a
t
t t
t
t t
-
67 , 31 ) 133 , 24 ( 28 , 1 533 , 62
= = = x a y b

- coeficientul de corelaie liniar:
( )( )
( ) ( )
9894 , 0
733 , 3753 733 . 6269
) 533 , 62 )( 133 , 24 ( 15 27437
2 2
=
=

=

x x y y
x x y y
t t
t t

Valoarea apropiat de 1 a coeficientului de corelaie arat c ntre cele dou variabile studiate exist o
corelaie liniar.
Observaie: Am vzut c:
( )
( )
=
2
2
2
2
2
2
2
2
) (
) (
) (
) (
y y
y y
y y
x a x a
y y
x x a
t
t
t
t
t
t

Ptratul coeficientului de corelaie liniar este raportul dintre variabilitatea explicat prin model i
variabilitatea total.
- ecuaia de analiz a varianei:
variabilitatea total = variabilitatea explicat + variabilitatea rezidual
( ) ( )

+ =
2
2 2

t t t
y y y y c

6269,733 = 6137,719 + 132,014
n spaiul observaiilor, Y este cu att mai bine explicat prin modelul liniar, cu ct este mai aproape se
planul (L) generat de vectorii X i U (vectorul unitar), deci cu ct variabilitatea rezidual este mai mic fa
de variabilitatea empiric total. Aceasta face ca raportul dintre variabilitatea explicat prin model i
variabilitatea total, adic
2
, s fie apropiat de 1.
- estimaiile varianelor reziduurilor i ale estimatorilor:
15 , 10
2 15
0144 , 132
2
1
2 2
=
=
t
T
c o
c

( )
( )
; 0027 , 0
733 , 3753
15 , 10
2
2
= =
.
x x
a Var
t
c
o

052 , 0 0027 , 0
= =
a
o

( )
( )
25 , 2
733 , 3753
) 133 , 24 (
15
1
15 , 10
1
2
2
2
2
=
(
+ =
(
(
+ =
.
x x
x
T
b Var
t
c
o

32
5 , 1 25 , 2
= =
b
o

- calculul intervalelor de ncredere pentru estimatori:
Variabilele aleatoare
( )
a
a a
i
( )
b
b b
urmeaz fiecare o repartiie Student cu (T-2) grade de

libertate. Alegnd un nivel de semnificaie =0,05, putem extrage din tabelele repartiiei (astfel de tabele se
gsesc n majoritatea crilor de econometrie, sau de statistic matematic) valoarea t
tab
corespunztoare
numrului de grade de libertate i nivelului de semnificaie ales. n cazul nostru, pentru T-2=13 grade de
libertate i =5%, gsim t
tab
=2,16. Intervalele de ncredere vor fi:
| | = + e
a a
t a t a a

; o o
o o
[1,28-(2,16)(0,052) ; 1,28+(2,16)(0,052)]=
= [1,17 ; 1,39]
| |= + e
b b
t b t b b

o o
o o
[31,67 (2,16)(1,5) ; 31,67+(2,16)(1,5)]=
=[28,43 ; 34,91]
Prin urmare, putem afirma c valorile parametrilor reali a i b se gsesc n aceste intervale cu o
probabilitate de 95%.
Stabilim acum un interval de ncredere pentru estimatorul varianei erorilor. Am vzut c variabila
aleatoare
( )
|
|
.
|
\
|
=

2
2 2
2
1
2
t
T c
o o
o
c c
c
urmeaz o lege de repartiie hi-ptrat cu (T-2) grade de libertate.
n tabelele legii hi-ptrat vom gsi, pentru un nivel de semnificaie dat, dou valori: v
1
avnd
probabilitatea (1-/2) de a fi depit, respectiv v
2
avnd probabilitatea (/2) de a fi depit, astfel c

o
o
o
c
c
=
(
s s 1
) 2 ( Pr
2
2
2
1
v T v ob

Se obine astfel intervalul de ncredere:

(

e
1
2
2
2
2
) 2 (
;
) 2 (
v
T
v
T
c c
c
o o
o

pentru =0,05 i 13 grade de libertate extragem din tabel v
1
=5,01 i v
2
=24,7 rezultnd intervalul:
=
(

e
01 , 5
15 , 10 ) 2 15 (
;
7 , 24
15 , 10 ) 2 15 (
2
c
o
[5,34 ; 26,34]
- testm dac parametrii a i b ai modelului sunt semnificativ diferii de zero la pragul de semnificaie
=0,05.

33
Variabilele aleatoare
a
a
o
i
b
b
o
urmeaz legi de probabilitate Student cu (T-2) grade de libertate.
Aceste rapoarte se numesc i raportul t Student empiric (t
calculat
). Se accept ipoteza H
0
: (a=0) dac t
calculat
(luat n modul) este mai mic dect t
tabelat ,
altfel se accept ipoteza contrar H
1
:(a = 0). Acest lucru se poate
scrie:
tab
a
t
a
<
0
o
. Este exact acelai lucru cu a spune c 0 s aparin intervalului de ncredere
determinat pentru a. Cum e 0 [1,17 ; 1,39], acceptm ipoteza H
1
:(a = 0). La fel stau lucrurile i pentru b.
Prin urmare, a i b sunt semnificativ diferii de zero la pragul de semnificaie de 5%. Se spune c variabila
explicativ (exogen) X (vrsta utilajului) este contributiv.
- ne propunem acum s determinm o previziune a cheltuielilor de ntreinere i reparaii pentru un utilaj
de 4 ani (48 de luni). Notm cu
p
y
u cheltuielile de ntreinere i reparaii pentru un utilaj cu vrsta
u
x
. Avem c
11 , 93 67 , 31 48 . 28 , 1
= + = + = b x a y
P
u u

Ce eroare corespunde unei astfel de previziuni? tim c:
u u
y y e
P
p
=
, este o variabil aleatoare distribuit normal, cu media zero i variana estimat a
erorii de previziune:
( )
( )
366 , 12
733 , 3753
) 133 , 24 48 (
15
1
1 15 , 10
1
1
2
2
2
2 2
=
(

+ + =
(
(
+ + =
x x
x x
T
t
u
c u
o

5164 , 3 366 , 12
2
= = =
u u

Deoarece variabila aleatoare
u
u u
y y
P
este distribuit Student cu (T-2) grade de libertate, putem

determina un interval de ncredere pentru valoarea previzionat:
| | | | 66 , 100 ; 56 , 85 51840 , 3 )( 16 , 2 ( 11 , 93 ); 5164 , 3 )( 16 , 2 ( 11 , 93 ;
2 2
= + =
(
+ e
u o u u o u u
t y t y y
p p
Cu o probabilitate de 95%, valoarea adevrat a cheltuielilor de ntreinere i reparaii pentru un utilaj de 48
de luni se va afla n intervalul determinat.

34
CAPITOLUL III
REGRESIA MULTIPL

De multe ori, studiul unui fenomen economic necesit introducerea mai multor variabile
explicative. O variabil endogen se exprim, deci, n funcie de mai multe variabile exogene. Metodele de
regresie utilizate sunt n acest caz generalizri ale celor din capitolul anterior.

3.1. Modelul liniar al regresiei multiple

Considerm acum modelul:
(1) t pt p t t t
x a x a x a y c + + + + = ...
2 2 1 1 , t=1, 2, ...,T
n care: Y reprezint o variabil endogen;
X
1
, X
2
,..., X
p
sunt variabile exogene;
a
1
, a
2
,..., a
p
sunt parametri necunoscui care trebuie estimai.
Modelul nu conine o constant deoarece variabila X
p
poate fi considerat astfel ca x
pt
=1,
T t ,..., 2 , 1 = (se numete variabil auxiliar).
Folosind notaiile:
|
|
|
|
|
|
|
.
|
\
|
=
T
y
y
y
Y
.
.
.
2
1
,
|
|
|
|
|
.
|
\
|
=
pT T T
p
p
x x x
x x x
x x x
X
...
... ... ... ...
...
...
2 1
2 22 12
1 21 11
,
|
|
|
|
|
.
|
\
|
=
p
a
a
a
a
...
2
1
,
|
|
|
|
|
|
|
.
|
\
|
=
T
c
c
c
c
.
.
.
2
1

ecuaia (1) se scrie sub form matriceal:
(2)
c + = Xa Y
.

Ipoteze fundamentale
Ipotezele I
1
, I
2
din capitolul II rmn valabile: ceea ce era adevrat pentru x
t
este acum valabil
pentru x
it
, i=1,2,...,p.
Ipoteza I
3
referitoare la variabilele exogene se modific astfel:
a. absena coliniaritii variabilelor exogene:

35
Nu exist nici o mulime de p numere reale
i
, i=1,2,...,p astfel nct
0
1
=
=
p
i
it i
x
, t=1, 2, ...,T.
Matricea X de format (Txp) are n acest caz rangul p (T>p) i matricea (XX), unde X
este transpusa lui X, este nesingular, deci exist inversa ei (XX)
-1
.
b. Atunci cnd T , matricea ( ) X X
T
'
1
tinde ctre o matrice finit, nesingular.

3.2. Determinarea estimatorilor parametrilor

Pentru a scrie ecuaiile normale utilizm interpretarea geometric dat n capitolul II. Ne
propunem s minimizm expresia
=
=
T
t
t
U
1
2
c
.
Fie vectorii Y, X
1
, X
2
,...,X
p
n spaiul ortonormat
T
9 .

Vectorul
( )
|
|
|
|
|
.
|
\
|
=
p
p
a
a
a
X X X Xa
...
,..., ,
2
1
2 1
aparine subspaiului (L) generat de vectorii X
1
,
X
2
,...,X
p
. Cantitatea
2
2
= = c c
t
U va fi minim atunci cnd vectorul Xa Y = c este ortogonal
Y

(L)
A
X
p
X
1
H
c
Y
X
2
O

36
la subspaiul (L). Aceast condiie se traduce prin egalitatea cu zero a produselor scalare dintre vectorul
Xa Y i orice vector din subspaul (L),deci i X
1
,X
2
,...,X
p
:
>= <
>= <
>= <
0 , ...
..... ..........
0 , ...
0 , ...
2 2 1 1
2 2 2 1 1
1 2 2 1 1
p p p
p p
p p
X X a X a X a Y
X X a X a X a Y
X X a X a X a Y

Efectund produsele scalare, rezult sistemul de ecuaii:

Sau, cu notaiile
matriciale introduse:
XY=(XX)a , de unde rezult:
(3)
( ) Y X X X a ' '
1
=

3.3. Proprietile estimatorului a
Artm c a este un estimator nedeplasat al lui a i deducem expresia matricei de varian i
covarian
a
O
.
a. transformm expresia (3) nlocuind Y prin expresia lui n funcie de X:
(4)
( ) ( ) ( )
( ) ( ) ( ) ( ) c c
c
' ' ' ' ' '
' ' ' '
1 1 1
1 1
X X X a X X X a X X X X
Xa X X X Y X X X a

+ = + =
= + = =

Aplicnd operatorul de medie expresiei (4), rezult:
( ) ( ) ( ) c E X X X a a E ' '
1
+ =
.
Dar, ( ) 0 = c E conform I
2
, deci
( ) a a E =
, adic a este estimator nedeplasat pentru a.
b. Prin definiie:

( )( ) ( ) '
a a a a E
a
= O
.
|
|
|
|
|
.
|
\
|
|
|
|
|
|
.
|
\
|
=
|
|
|
|
|
.
|
\
|

p pt t pt t pt
pt t t t t
pt t t t t
t pt
t t
t t
a
a
a
x x x x x
x x x x x
x x x x x
y x
y x
y x
...
.
...
... ... ... ...
...
...
...
2
1
2
2 1
2
2
2 1 2
1 2 1
2
1
2
1

37
Din (4) rezult: ( ) c ' '
1
X X X a a

= i ( )
1
' ' ) (

= ' X X X a a c pentru c ( )
1
'

X X este o matrice
simetric. Atunci:
( )( ) ( ) ( )
1 1
' ' ' ' '

= X X X X X X a a a a cc
i
( ) ( ) ( )
1 1
' ' ' '

= O X X X E X X X
a
cc
.
ns
( )
c
cc O = ' E
este matricea de varian i covarian a lui c . tim c
( ) I E
2
'
c
o cc =
(I este
matricea unitate de ordinul T). Atunci rezult:
( ) ( ) ( ) ( )( ) ( )
1
2
1 1
2
1
2
1
' ' ' ' ' ' '

= = = O X X X X X X X X X X X X X X
a c c c
o o o
Se poate arta c dac ipoteza a) din I
3
rmne valabil cnd T , atunci a este estimator
convergent ctre a.
Propoziie. Estimatorul
( ) Y X X X a ' '
1
=
este cel mai bun estimator liniar nedeplasat al lui
a.
Pentru a arta aceast proprietate vom construi un estimator liniar pentru a care s aib variana
minim i el va fi identic cu cel obinut prin MCMMP. Fie a* un estimator liniar al lui a, adic a*=MY,
unde M este o matrice cu coeficieni constani de format (pxT). Estimatorul a* este nedeplasat dac:
( ) ( ) ( ) a Xa ME Y ME a E = + = = c *

adic ( ) ( ) ( ) ( ) ( )a MX ME a E MX a E = + = c * pentru c ( ) 0 = c E .
Pentru ca a* s fie nedeplasat, trebuie ca (MX)=I (matricea unitate de ordinul p).
Construim acum matricea de varian i covarian a lui a*:
( )( ) | | ' * *
*
a a a a E
a
= O

Dar, ( ) ( ) c c c M a M a MX Xa M MY a + = + = + = = * , deci c M a a = * ,
( ) ' ' ' * M a a c = i ( ) ( ) ' ' ' ' '
2
*
MM M ME M M E
a c
o cc cc = = = O . Pentru ca a* s fie de varian
minim, trebuie ca urma matricei (MM) s fie minim, sub restricia (MX)=I. Urma unei matrici este,
prin definiie, suma elementelor de pe diagonala principal. Notm U
r
(X) urma matricei X. U
r
este un
operator liniar (demonstrai!). Rezolvnd problema de extremum condiionat:
( )
= I MX r s
MM MinUr
. .
'

se obine soluia ( ) ' '
1
X X X M

= , adic ( ) Y X X X MY a ' ' *
1
= = . Am gsit c a a *= .
Un astfel de estimator se numete estimator BLUE (best liniar unbiaised estimator).

38
3.4. Determinarea unui estimator nedeplasat al varianei
2
c
o
Variana reziduurilor
2
c
o
fiind necunoscut, avem nevoie de un estimator al ei. Dac p este
numrul de coeficieni de estimat n model, se va arta c:
=
2 2
t
p T
c o
c
Avem c: c + = Xa Y ;
a X Y
= ;
a X Xa Y Y
+ = = c c ;
( ) a a X = c c
.
Dar: ( ) c ' '
1
X X X a a

= i ( ) c c c ' '
1
X X X X

=
( ) | |c c ' '
1
X X X X I

=
.
Notm: ( ) ' '
1
X X X X I

= I .
I este o matrice de format (TxT) cu proprietile I=I (simetric) i I
2
=I (idempotent de grad
2). Am obinut c c I = . Evalum acum
t
c , care sub form matriceal este:

=
+ = I = I I = =
i j i
j i ij i ii t
c c c c c c c c c c
2 2
' ' ' '
, unde
ij
este elementul matricii I situat la
intersecia liniei i cu coloana j.
Atunci, rezult c:
( ) ( ) ( )

=
+ =
i j i
j i ij i ii t
E E E c c c c
2 2
.
ns, ( ) 0 =
j i
E c c conform I
2
i
( ) ( ) ( ) I = = =

Ur E E
i
ii
i
i ii t
2 2 2 2
c c
o o c c
.
Artm c ( ) p T Ur = I .
( ) ( ) ( ) ( ) ( ) ( ) ' ' ' '
1 1
X X X X Ur I Ur X X X X I Ur Ur

= = I
( ) T I Ur =
( ) ( ) ( ) ( ) p X X X X Ur X X X X Ur = =
1 1
' ' ' '
(permutarea ntre ( )
1
'

X X X i ' X este posibil datorit formatului acestor matrici i proprietilor
operatorului U
r
.)
n final rezult:

39
( ) ( )
2 2
c
o c p T E
t
=
, ( )
(
=

2 2 2
1
t t
p T
E E
p T
c c o
c
, astfel c
=
2 2
t
p T
c o
c
este estimator nedeplasat al lui
2
c
o .
T este numrul de observaii, p este numrul de parametri de estimat i relaia gsit o
generalizeaz pe cea din capitolul II.

3.5. Teste i regiuni de ncredere

Ipoteza de normalitate a erorilor c
t
fiind ndeplinit, se pot generaliza rezultatele obinute la
regresia simpl. Deoarece ( ) c ' '
1
X X X a a

+ = , rezult c a este distribuit dup o lege normal n p
dimensiuni, cu media ( ) 0 = a E i dispersia ( )
1 2
'

= O X X
a c
o . Pentru un estimator
i
a dat, avem c:
(*)
i
a
i i
a a
urmeaz o lege normal redus N(0,1);

(**)
( )
2
2
2
2
c c
c
o
c
o
o

=
t
p T
este distribuit _
2
(hi-ptrat) cu (T-p) grade de libertate.
(***)
i
a
i i
a a
urmeaz o lege Student cu (T-p) grade de libertate.

Legea Student este utilizat n mod curent pentru a aprecia validitatea estimatorului unui
coeficient a
i
. De exemplu, dac se testeaz ipoteza (H
0
:a
i
=0) contra ipotezei (H
1
:a
i
= 0), pentru a accepta
H
1
trebuie ca
2
o
o
t
a
i
a
i
> , unde
2
o
t este valoarea tabelat a variabilei t repartizat Student, cu T-p grade
de libertate, iar o este pragul de semnificaie.

Observaie:
Pentru T>30 i o=0,05, 2
2
~
o
t . Deci, dac 2
>
i
a
i
a
o
se accept H
1
, adic ipoteza c variabila
X
i
are un coeficient a
i
semnificativ diferit de zero.
Mai general, cnd se pune problema de a ti dac un coeficient a
i
este diferit de o valoare
particular
0
i
a , se calculeaz raportul
i
a
i i
a a
t
= i se compar cu
2
o
t .

40
Dac t
calculat
>t
tabelat
concludem c
0
i i
a a = .

Considerm acum toi estimatorii
p
a a ,...,
1
:
(*) variabila aleatoare ( ) ( ) a a a a
a
O

'
1
este distribuit _
2
cu p grade de libertate;
(**) variabila aleatoare ( ) ( ) a a a a
p
F
a
O
'
=

1
1
urmeaz o lege Fisher-Snedecor cu p i (T-

p) grade de libertate.
La fel ca la regresia liniar simpl, rezultatele anterioare permit construirea de intervale de
ncredere relative la coeficienii a
i
, ca i a unui elipsoid de ncredere relativ la ansamblul coeficienilor n
spaiul
p
9 . Pentru a
i
, intervalul de ncredere, la pragul de seminificaie o este:

2
o o
o
t
a a
t
i
a
i i
s
s
2

o o
o o t a a t
i i
a i i a
s s

iar pentru ansamblul coeficienilor, ecuaia elipsoidului de ncredere este: F=F(o,p,T-p).
Aceleai principii conduc la determinarea de regiuni de ncredere relative la un numr oarecare de
coeficieni din model. Dac q este numrul coeficienilor reinui, n spaiul
q
9 , avem ecuaia
F
1
=F(o,q,T-p), unde:
( ) ( )
q q a q q
a a a a
q
F
q
O =

'
1
1
1
.
cu
q
a extras din vectorul a i
q
a
O extras din
a
O :
Dac dorim s testm, la pragul de semnificaie o, ipoteza (H
0
:a
q
=
) 0 (
q
a ) contra ipotezei
(H
1
:a
q
) 0 (
q
a = ), atunci dac:
( ) ( ) ( ) p T q F a a a a
q
q q a q q
q
s O

, ,
'
1
) 0 ( 1
) 0 (
o
se accept ipoteza H
0
( ( ) p T q F , , o se extrage din tabelele distribuiei Fisher-Snedecor).

2

o o
o o t a a t a
i i
a i i a i
+ s s
2
o
o
t
a a
i
a
i i
>

41
Observaie:
Se observ c valoarea tabelat F depinde de ( ) p T q , , o i nu de ( ) q T q , , o . Rezult c
expresia
( )
( )
2
2
p T
q
p T
qF
=
_
_
face s apar la numitor ( )
2
2
c
c
o
o
p T distribuit _
2
cu (T-p) grade de libertate.

3.6. Previziunea variabilei endogene

Dac presupunem cunoscute la un moment u valorile (x
1u
, x
2u
,..., x
pu
) atunci previziunea variabilei
endogene va fi:
u u u u p p
p
x a x a x a y ...
2 2 1 1
+ + + =
.
Eroarea de previziune va fi variabila aleatoare:
( ) ( )
u u u u u
c + + =
p p p
p
x a a x a a Y Y ...
1 1 1
.
Se constat c media erorii de previziune este zero:
( ) 0 =
u u
Y Y E
p
,
iar variana erorii de previziune este:
( ) ( ) | | ( ) ( )( )
(
+ + = =

< = j i
j i j j i i
p
i
i i i
p p
x x a a a a x a a E Y Y E Y Y Var
2
1
2 2
2
2
u u u u u u u u
c
deoarece
i
a i
u
c sunt necorelate (
i
a nu depind dect de
t
c ), t=1,2,...,T i T<u.
Deducem c:
( ) | | ( ) ( )
2
1
2
2
, cov 2
c u u u u u
o

< =
+ + =
j i
j i j i i
p
i
i
p
a a x x a Var x Y Y E
,
iar sub form matricial:
( ) | |
2
'
2
c u u u u
o + O = X X Y Y E
a
p
, adic:
( ) ( ) | | 1 '
1
' 2
+ =

u u c u u
o X X X X Y Y Var
p
,
unde:
( )
u u u u p
x x x X ,..., ,
2 1
'
=
.
Observaie:
Se arat c dac T este finit i c
t
sunt normal distribuite, atunci a este distribuit normal n p
dimensiuni. Dac ipotezele nu sunt ndeplinite, atunci cnd T , vectorul ( ) a a T urmeaz o
distribuie normal cu media egal cu zero.

42
3.7. Coeficientul de corelaie multipl R. Analiza varianei

i n acest caz, ecuaia varianei se scrie:
rezidual
atea Variabilit
ajustate valorilor
atea Variabilit
total
atea Variabilit
+ =

( ) ( )

+ =
2
2 2

t t t
y y y y c

Coeficientul de corelaie multipl R are definiia:
( )
( ) ( )
=
2
2
2
2
2
y y y y
y y
R
t
t
t
t
c
.
Din reprezentarea geometric fcut, rezult c
c
+ =Y Y
,
dar tim c
c
+ = a X Y
i
a X Y =
, rezultnd c:
( ) c + = a X X Y Y
, ceea ce arat
c vectorul rezidual c este acelai i pentru valorile (Y,X) i pentru valorile centrate fa de medie
( ) X X Y Y , . Cu alte cuvinte, dac efectum regresia pe ecuaia general, cu variabilele necentrate sau
o efectum cu variabilele centrate pe media lor, estimatorul a i vectorul rezidual c sunt aceeai.
Observaie:
Cnd se centreaz valorile X i Y, vectorul a nu conine ultimul estimator
p
a . Constanta
p
a
dispare cnd se centreaz variabilele. Considerarea modelului fr constante, cu variabilele necentrate pe
media lor, poate conduce la valori ale lui
2
R care ies din intervalul (0,1).

Expresia matricial a coeficientului de corelaie multipl este:
( ) ( )
( ) ( ) Y Y Y Y
Y Y Y Y
R

=
'
'
2
, dar ( ) ( )a X X Y Y
= .
( ) ( ) | | ( ) ( ) Y Y X X X X X X a =

' '
1
i coeficientul devine:
( ) ( )
( ) ( ) Y Y Y Y
Y Y X X a
R

=
'
' '
2
.
Coeficientul
2
R arat rolul jucat de toate variabilele exogene asupra evoluiei variabilei
endogene. El este cu att mai bun cu ct e mai apropiat de 1.
Dar, judecarea calitii unui model doar prin valoarea lui
2
R poate duce la erori grosiere. El
mascheaz uneori influena variabilelor exogene luate separat asupra variabilei endogene i nu poate s se

43
substituie studiului estimatorilor coeficienilor modelului. Ptratul coeficientului de corelaie multipl nu
ine cont nici de numrul de observaii (T) i nici de numrul variabilelor explicative (p). Ori, se poate
foarte bine ca, avnd aceleai observaii asupra variabilei endogene s considerm dou modele distincte, n
al doilea fcnd s apar un numr de variabile explicative noi. n aceast a doua regresie coeficientul de
corelaie multipl nu poate dect s creasc (pentru c variabilitatea explicat prin regresie crete).
O definire mai precis a lui
2
R , care ine cont de T i p este:
( )
2
2
1
1
1 R
p T
T
R
= .
2
R se numete coeficient de corelaie multipl corectat.
1. dac p=1, atunci
2
2
R R = ;
2. dac p>1, atunci
2
2
R R < ;
3.
2
R poate scdea prin introducerea n model a unei noi variabile exogene;
4.
2
R poate lua i valori negative, dac
1
1
2
<
T
p
R .

Analiza varianei

Atunci cnd studiem rolul jucat de exogene asupra evoluiei endogenei, ne putem ntreba care este
partea de variabilitate explicat de una sau mai multe variabile exogene.
Relum modelul iniial:
(1)
t pt p t t t
x a x a x a y c + + + + = ...
2 2 1 1
, t=1, 2, ...,T
i considerm q variabile printre cele p, pe care le indexm de la 1 la q:
(2)
t qt q t t t
x a x a x a y + + + + = ...
2 2 1 1
.
Variabilitatea ne-explicat de cele q exogene n modelul (1) este variabilitatea rezidual asociat
modelului (2).

Fie:
( )
2
2
2 2 1 1
... =
t
qt q t t t
x a x a x a y

Variabilitatea ne-explicat de cele p exogene din modelul (1) este:
( )
2
2
2 2 1 1
... c =
t
pt p t t t
x a x a x a y

44
Variabilitatea explicat de cele (p-q) exogene din modelul (1) atunci cnd a
1
,...,a
q
sunt estimai cu
modelul (2) este atunci:
2
2
2
c q =

tim c
2 2 2
0 0 HA H A + = , adic c c '
'
' + = Y Y Y Y .
Rezultatele se grupeaz, adesea, ntr-un tabel de analiz a varianei:
Sursa variabilitii Suma ptratelor
corespunztoare acestei surse
Numrul gradelor
de libertate
Media ptratelor
asociate
1. X: mulimea celor p exogene
p p
Y Y
'

p
p
Y Y
p p
'

2. c : mulimea reziduurilor
p p
Y Y Y Y
'
' ' = c c
T-p
p T
c c '

3. Y: variabil endogen
Y Y'
T
T
Y Y'

4. (p-q) variabile exogene dintre cele p
c c q q '
'
' =
p-q
q p
q q '

n figura anterioar avem:
p p
H Y 0
= este proiecia lui Y pe subspaiul (L) ai crui vectori generatori sunt X

1
,X
2
,...,X
p
.
q q
H Y 0
= este proiecia lui Y pe subspaiul generat de X

1
,X
2
,...,X
q
.

X
1
H
q
H
p
(L)
A
c
X
p
X
q
q
O

45
H
q
aparine lui (L) i triunghiul AH
p
H
q
este dreptunghic n H
p
.
Hq AH
q
0 i Hq H H
q p
0 , iar q este chiar
q p
H H .

3.8. Experien de calcul
Dispunem de observaiile din tabelul de mai jos i ne propunem s explicm variabile endogen Y
pornind de la variabilele exogene X
1
i X
2
, printr-un model liniar de forma:
c + + + =
3 2 2 1 1
a X a X a Y
, unde:
|
|
|
|
|
.
|
\
|
=
|
|
|
|
|
.
|
\
|
=
|
|
|
|
|
.
|
\
|
=
|
|
|
|
|
.
|
\
|
=
T T T T
x
x
x
X
x
x
x
X
y
y
y
Y
c
c
c
c
...
,
...
,
...
,
...
2
1
2
22
21
2
1
2 1
1 1
1
2
1

adic: c + = Xa Y , unde:
|
|
|
.
|
\
|
=
|
|
|
.
|
\
|
=
3
2
1
2 1
21 11
,
1
... ... ...
1
a
a
a
a
x x
x x
X
T T

t y
t
x
1t
x
2t

1 100 100 100
2 106 104 99
3 107 106 110
4 120 111 126
5 111 111 113
6 116 115 103
7 123 120 102
8 133 124 103
9 137 126 98
S observm c numrul de observaii (T=9) este mic, din raiuni de simplificare a calculelor.
Vom estima modelul, presupunnd c sunt ndeplinite ipotezele principale ale modelului liniar
general de regresie:
- ipoteze stochastice:
, ) . ( , 0 ) (
2
I E E
c
o c c c = ' =
(homoscedasticitate), adic:
0 ) . ( =
s t
E c c
, dac s t = i
, ) (
2 2
c
o c =
t
E
t.
- ipoteze structurale: dac numrul de variabile exogene veritabile este k, atunci p=k+1 este
numrul parametrilor de estimat. Trebuie ca rangul matricii X s fie egal cu p (p<T), iar matricea
( ) X X' , unde X' este transpusa lui X este nesingular, deci inversabil.

46
n exemplul nostru avem k=2 i p=3.
Atunci, ( ) Y X X X a ' ' =
1
este un estimator liniar nedeplasat i cu variana minimal (estimator BLUE).
Pentru a simplifica procedura de calcul vom centra variabilele modelului. Cu notaiile:
c c q = = = = , , ,
2 2 2 1 1 1
X X U X X U Y Y Z
,
unde:
= = = =
t
t
t t
t t
t
t
T
x
T
X x
T
X y
T
Y c c
1
,
1
,
1
,
1
2 2 1 1 ,
modelul se scrie:
q + + =
2 2 1 1
U a U a Z
, sau
q + =Ub Z
, unde
|
|
|
.
|
\
|
=
|
|
.
|
\
|
=
|
|
|
.
|
\
|

=
|
|
|
|
|
.
|
\
|
=
c c
c c
q
T T T
T
a
a
b
X x X x
X x X x
U
y y
y y
y y
Z ... , , ... ... ,
...
1
2
1
2 2 1 1
2 21 1 11
2
1

Deoarece
= = = = = =
t
t
t
t
x
T
X y
T
Y , 113 1017
9
1 1
, 117 1053
9
1 1
1 1
106 954
9
1 1
2 2
= = =

t
t
x
T
X
, valorile centrate ale variabilelor sunt:
t
Y Y Z =
1 1 1
X X U =
2 2 2
X X U =
1 -17 -13 -6
2 -11 -9 -7
3 -10 -7 +4
4 +3 -2 +20
5 -6 -2 +7
6 -1 +2 -3
7 +6 +7 -4
8 +16 +11 -3
9 +20 +13 -8

Pentru a calcula estimatorul
( ) Z U U U
a
a
b ' ' =
|
|
.
|
\
|
=
1
2
1
, avem nevoie de matricile:

47
|
|
.
|
\
|

=
|
|
.
|
\
|
=
|
|
|
.
|
\
|
|
|
.
|
\
|
= '

648 112
112 650
... ...
...
...
2
2 2 1
2 1
2
1
2 1
21 11
2 21
1 11
t t t
t t t
T T
T
T
u u u
u u u
u u
u u
u u
u u
U U
|
|
.
|
\
|
=
|
|
.
|
\
|
=
|
|
|
.
|
\
|
|
|
.
|
\
|
= '
72
872
...
...
...
2
1
1
2 21
1 11
t t
t t
T
T
T
z u
z u
z
z
u u
u u
Z U
( )
|
|
|
|
.
|
\
|
=
|
|
.
|
\
|

= '

408656
650
408656
112
408656
112
408656
648
648 112
112 650
1
1
U U
( )
|
|
.
|
\
|
=
|
|
.
|
\
|
|
|
|
|
.
|
\
|
= ' ' =
|
|
.
|
\
|
=

1244 , 0
3629 , 1
72
872
408656
650
408656
112
408656
112
408656
648
1
2
1
Z U U U
a
a
b

Pentru a determina estimatorul celui de al treilea parametru, a
3
, utilizm relaia:
3 2 2 1 1
a X a X a Y + + = , de unde:
1941 , 50 106 . 1244 , 0 113 . 3629 , 1 117
2 2 1 1 3
= = = X a X a Y a
Modelul estimat este: 1941 , 50 1244 , 0 3629 , 1
2 1
+ = = X X a X Y , iar reziduurile sunt:
1941 , 50 2 1244 , 0 1 3629 , 1
+ = = = X X Y a X Y Y Y c .
Cutm acum un estimator nedeplasat pentru variana reziduurilor. Am vzut c acest estimator este dat de
relaia:
=
2 2
t
p T
c o
c . Dar,
( ) ( ) b U Z Z Z Y Y Y Y Y Y

= = = = c , iar
( ) ( ) Z U b Z Z b U Z b U Z
t
' ' ' =
'
= ' =

2
c c c . Avem c:
|
|
.
|
\
|
= '
72
872
Z U
= = ' 1248
2
t
z Z Z i ( ) 5704 , 1179
72
872
1244 , 0 3629 , 1
=
|
|
.
|
\
|
= ' ' Z U b
= = 4296 , 68 5704 , 1179 1248

2
t
c
4049 , 11
3 9
4296 , 68
2 2
=
=
t
p T
c o
c

48
Matricea de varian i covarian a vectorului b
este:
( )
1
2

' = O U U
b
c
o
, iar o estimaie a ei se
obine nlocuind pe
2
c
o
cu
2
c
o
. Avem c:
( )
|
|
.
|
\
|
=
|
|
|
|
.
|
\
|
= ' = O

0181 , 0 0031 , 0
0031 , 0 0180 , 0
408656
650
408656
112
408656
112
408656
648
) 4049 , 11 (
1 2
U U
b
c
o

Coeficientul de corelaie multipl R
2
, are valoarea:
totala a iabilitate
reziduala a iabilitate
totala a iabilitate
licata a iabilitate
R
var
var
1
var
exp var
2
= =
Variabilitatea total = ( ) 1248
2 2
= =
t t
z y y
Variabilitatea rezidual =
= 4296 , 68
2
t
c
Variabilitatea explicat = Variabilitatea total Variabilitatea rezidual =
=1248 68,4296 = 1179,5704
9451 , 0
1248
5704 , 1179
2
= = R .
Tabelul de analiz a varianei (variabile centrate):
Sursa variabilitii Suma ptratelor
corespunztoare acestei surse
Numrul gradelor
de libertate
Media ptratelor
asociate
1.Variabila endogen centrat
=1248
2
t
z
T-1=8
2
1
1
t
z
T

2.Variabilele exogene centrate
= 5704 , 1179
2
t
z
k=2
1
t
z
k

3. Reziduurile
= 4296 , 68
2
t
c
T-k-1=6
1
1
t
k T
c

49
CAPITOLUL IV
STUDIUL MODELULUI LINIAR CND IPOTEZELE CLASICE ASUPRA ERORILOR
NU MAI SUNT REALIZATE

4.1. Ipoteza de independen a erorilor
S-a studiat anterior modelul liniar de regresie sub ipoteza c erorile sunt independente. n cazul n
care erorile c
t
sunt corelate, matricea de varian i covarian a erorilor O
c
nu se mai reduce la I
2
c
o , iar
estimatorii parametrilor modelului general Y=Xa+c, cu E(c
t
)=0, t=1,2,...,T i ( ) I E
2
'
c c
o cc = = O nu
mai posed aceleai proprieti ca n cazul erorilor independente.
Fie a vectorul estimatorilor parametrilor a. Estimatorul a trebuie s fie liniar n raport cu
variabilele endogene Y, adic MY a = , unde M este o matrice de coeficieni. Estimatorul a este
nedeplasat deoarece:
( ) ( ) | | ( ) MXa ME MXa M MXa E MY E a E = + = + = = c c
(pentru c ( ) 0 = c E ).
Pentru ca ( ) a a E = trebuie s impunem condiia MX=I, rezultnd c:
c c M a M MXa MY a + = + = =
Matricea de varian i covarian a estimatorilor (innd cont c c M a a = ) este:
| | | | | | M M M ME M M E M M E a a a a E
a
' O = ' ' = ' ' = ' = ' = O
c
c c c c c c ) ( ) ( ) ( ) (

Punnd condiia ca
a
O s fie minimal, sub restricia MX=I i rezolvnd aceast problem de extremum
condiionat, rezult c matricea M este de forma:
| |
1
1
1
O ' O ' =
c c
X X X M

Prin nlocuire i calcul se obine:
| | Y X X X MY a
1
1
1
O ' O ' = =
c c

| |
1
1
O ' = O X X
a c

Estimatorul a astfel obinut este un estimator liniar, nedeplasat i de dispersie minim. El a fost obinut
prin MCMMP generalizat. Se observ imediat c dac erorile sunt independente, adic
I
2
c c
o = O
, atunci
| | Y X X X a ' ' =
1
, adic regsim estimatorul obinut prin MCMMP

obinuit.

50
n cazul n care erorile sunt corelate, determinarea estimatorului a necesit cunoaterea matricei
de varian i covarian a erorilor
c
O
. n aplicaii, deoarece c
O
este necunoscut, se lucreaz cu
estimaia ei
c
O
, ceea ce nu antreneaz erori prea grave.

Corelarea erorilor
t
c poate mbrca diverse forme. Cel mai frecvent se studiaz cazul cnd
t t t
q c c + =
1
(se spune c erorile urmeaz un proces autoregresiv de ordinul nti).
Modelul liniar general Y=Xa+c, scris i sub forma:
(1)
t pt p t t t
x a x a x a y c + + + + = ...
2 2 1 1
, t=1, 2, ...,T
(n care
t t t
q c c + =
1
, iar asupra erorilor
t
q facem ipotezele cunoscute:
( ) 0 =
t
E q
,
( ) 0
2 1
=
t t
E q q
, pentru
2 1
t t =
i
( ) t Var
t
= ,
2
q
o q
), poate fi pus sub urmtoarea form:
- ecuaia (1) scris pentru t-1 este:
( ) ( ) ( ) ( ) 1 1 1 2 2 1 1 1 1
...

+ + + + =
t t p p t t t
x a x a x a y c
pe care o nmulim cu (presupunem
1 < ):
(2)
( ) ( ) ( ) ( ) 1 1 1 2 2 1 1 1 1
...

+ + + + =
t t p p t t t
x a x a x a y c

Prin scderea (1)-(2) obinem:
(3)
( )
( )
( )
( )
( )
( )
t t p pt p t t t t t t
x x a x x a x x a y y q + + + + =
1 1 2 2 2 1 1 1 1 1
...
Dac s-ar cunoate parametrul , atunci ecuaia (3) ar putea fi scris sub forma:
(4) t pt p t t t
u a u a u a z q + + + + = ...
2 2 1 1
unde:
1
=
t t t
y y z

( ) 1
=
t i it it
x x u
, i=1,2,...,p.

1
=
t t t
c c q

Deoarece, prin ipoteze, erorile
t
q sunt independente, se poate aplica MCMMP obinuit ecuaiei
(4) care va conduce la estimatorul
( )
p
a a a a ,..., ,
2 1
=
nedeplasat i de minim dispersie.
Dar, cum parametrul nu este cunoscut, pentru estimarea parametrilor unei ecuaii de regresie
atunci cnd erorile sunt corelate (sub forma unui proces autoregresiv de ordinul I,
t t t
q c c + =
1
,

51
staionar, adic media ( )
t
E c i dispersia ( )
t
Var c sunt independente de timp, iar 1 < ) se pot aplica
urmtoarele metode:
Metoda I:
1. Se aplic MCMMP obinuit ecuaiilor (1) fr a ine cont c erorile
t
c sunt corelate.
Se obine estimatorul
1
a al lui a i se determin valorile ajustate
1 1
a X Y = i
estimaiile erorilor
t t t
y y
1
= c .
2. Dm o estimare a parametrului aplicnd MCMMP obinuit ecuaiei
t t t
q c c + =
1

, obinnd
.
3. nlocuim cu
n ecuaia (3) i aplicm MCMMP obinuit acestei ecuaii. Se

obine estimatorul
a
pentru parametrul a.
Evident, pentru eantioane mici, estimatorul a nu prezint garanii c are proprietile dorite.
Metoda II:
Ecuaia (3) de mai nainte se poate scrie i sub forma:
(5)
( )
( ) ( )
( ) | |
t t p p t t pt p t t
x a x a y x a x a y q + + + = + +
1 1 1 1 1 1 1
... ...

Se aplic MCMMP obinuit ecuaiilor (3) i (5) astfel:
1. Dm o valoare iniial lui , de exemplu
0
=0 n ecuaia (3) i obinem o prim
estimaie a parametrilor
0
a .
2. nlocuim ( )
0 0
2
0
1 0
,..., ,
p
a a a a = n ecuaia (5) i efectund regresia, obinem o nou
valoare pentru , notat
1
.
3. nlocuim cu
1
n ecuaia (3) i efectum o nou regresie, obinnd estimatorul
( )
1 1
2
1
1 1
,..., ,
p
a a a a = .a.m.d.
4. Se opresc iteraiile dac valorile gsite n dou iteraii succesive nu difer dect printr-
un numr orict de mic dorit (se spune c estimatorii
i
a , i=1,2,... converg).
Metoda III (baleiaj):
Presupunem c 0 > , ia succesiv valorile:
{ } 1 ;...; 02 , 0 ; 01 , 0 ; 0 =
.

52
Aplicm MCMMP obinuit ecuaiei (3) pentru fiecare valoare a lui i calculm reziduurile
t
q
.
Se reine valoarea lui care d cea mai mic sum a ptratelor erorilor
t
t
2
q , creia i corespund
estimatorii
p
a a a ,..., ,
2 1
ai parametrilor.
***
Exist i alte proceduri de estimare a parametrilor n cazul cnd erorile sunt corelate.

4.1.1. Testarea ipotezei de independen a erorilor

Atunci cnd ipotezele fundamentale ale modelului liniar al regresiei nu sunt ndeplinite
proprietile estimatorilor parametrilor sufer. Astfel, sub ipoteza I
2
referitoare la distribuia erorilor i la
independena lor, estimatorii obinui sunt nedeplasai i au variana minimal. Dac erorile sunt corelate,
estimatorii rmn, n general, nedeplasai, dar matricea de varian i covarian a acestora nu mai este
I
2
c
o . Pentru a ne asigura de independena erorilor trebuie s efectum teste. Este vorba despre testul lui
Durbin i Watson.
Modelul liniar general al regresiei:
t pt p t t t
x a x a x a y c + + + + = ...
2 2 1 1
se poate scrie sub forma:
t t t
ax y c + =

unde:
( )
p
a a a a ,..., ,
2 1
=
i
|
|
|
|
|
.
|
\
|
=
pt
t
t
t
x
x
x
x
...
2
1
.
Se aplic MCMMP obinuit i se obine un estimator
( )
p
a a a a ,..., ,
2 1
=
, calculndu-se
valorile ajustate
t t
x a y =
i erorile estimate
t t t
y y
= c
.
Reziduurile estimate depind de irul erorilor
t
c i de irul valorilor exogene
t
x , deoarece:
( )
t t t t t
x a a y y c c + = =
.
Se consider variabila aleatoare, notat d
, numit i statistica Durbin-Watson definit prin

ecuaia:

53
( )
=
=

=
T
t
t
T
t
t t
d
1
2
2
2
1
c
c c
.
Durbin i Watson au determinat densitatea de probabilitate a variabilei aleatoare d
, notat ( ) d f

i au artat c oricare ar fi irul de exogene considerate, curbele reprezentative ale lui ( ) d f
oscileaz ntre
dou curbe limit ( )
i
d f
i ( )
s
d f
. Aceste funcii depind de numrul de observaii (T), de numrul de

variabile exogene veritabile ce figureaz n model (m) i de irul erorilor
t
c . Cele dou curbe limit
(reprezentate grafic n figur) sunt atinse pentru anumite iruri de exogene x
t
i sunt simetrice n raport cu
axa de abscis 2.

Scopul este de a ti dac erorile modelului sunt autocorelate. Cel mai frecvent se caut testarea
legturii erorilor printr-o relaie de forma
t t t
q c c + =
1
. Se spune c erorile urmeaz un proces
autoregresiv de ordinul nti.
Vrem s testm ipoteza I
0
: 0 = (absena autocorelaiei erorilor), contra ipotezei I
1
: 0 >
(erorile
t
c sunt autocorelate).
La un nivel de semnificaie o dat, Durbin i Watson au determinat dou valori, d
1
i d
2
, n funcie
de numrul de observaii (T) i de numrul de exogene veritabile (m) corespunztoare fiecreia din curbele
limit.
d
1
d
2
2 d
1
d
2

d

( ) d f

54
Se calculeaz statistica d
cu relaia dat i se observ c:

1. dac
1
d d < , atunci se accept I

1
;
2. dac
2 1
d d d < < , atunci exist ndoieli c legtura dintre erori este de forma
t t t
q c c + =
1
;
3. dac
2
d d > , atunci se accept I

0
.

n tabelul urmtor sunt date cteva valori uzuale pentru d
1
i d
2
n funcie de T i m, pentru nivelul
de semnificaie o=0,05:
Tabela D-W
T m=1 m=2 m=3 m=4 m=5
d
1
d
2
d
1
d
2
d
1
d
2
d
1
d
2
d
1
d
2

15 1,08 1,36 0,96 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78

Observaii:
1. n loc s testm 0 = contra 0 > , se poate testa I
0
: 0 = , contra I
1
: 0 = . Se obin
dou valori
'
1
d i
'
2
d simetrice n raport cu 2 i se constat c:
a. dac
1
d d < sau
'
2
d d > , atunci se accept I

1
;
b. dac
2 2
d d d s s sau
'
2
'
1
d d d s s , atunci exist ndoieli c erorile sunt corelate;

c. dac
'
1 2
d d d < < , atunci se accept I

0
.
2. Dac modelul studiat nu conine constanta, trebuie s determinm d
ca i cnd modelul ar
conine o constant.
3. Statistica Durbin-Watson aplicat pe un model care conine variabile endogene retardate este
deplasat ctre 2, ceea ce nseamn c erorile sunt mai puin corelate ntr-un proces autoregresiv, dect ntr-
un proces ordinar.

55
4.1.2. Experien de calcul
I. Se cunosc urmtoarele date referitoare la evoluia n timp a unei variabile economice (n preuri
constante):
t 1 2 3 4 5 6 7 8
y
t
662,3 669,4 912,7 935,2 1027,2 1145,0 1193,7 1224,1
t 9 10 11 12 13 14 15
y
t
1281,7 1426,3 1376,2 1327,8 1420,6 1933,9 2023,4
Pe aceast serie cronologic, utiliznd modelul
t t
b t a y c + + =
,s-a aplicat MCMMP,
obinndu-se estimatorii:
8657 , 81 = a ; 404 , 582
= b
De asemenea, s-a calculat variana estimatorilor i ecartul-tip al acestora: 94887 , 7
=
a
o ;
2721 , 72
=
b
o i valorile ajustate ale variabilei endogene 404 , 582 . 8657 , 81 + = t y
t
i ale
reziduurilor
t t t
y y = c :
t 1 2 3 4 5 6 7 8
t
y
664,2 746,1 828,0 909,8 991,7 1073,6 1155,5 1237,3
t 9 10 11 12 13 14 15
t
y
1319,2 1401,0 1482,9 1564,6 1646,6 1728,5 1810,4

t 1 2 3 4 5 6 7 8
t
c
-1,93 -76,79 +84,79 +25,35 +35,49 +71,44 +38,30 -13,25
t 9 10 11 12 13 14 15
t
c
-37,54 +25,25 -106,64 -237,01 -226,00 +205,42 +213,03
Ne propunem s cercetm o eventual autocorelare a erorilor.

Rezolvare:
Pentru a putea utiliza testul Durbin-Watson trebuie ca numrul de observaii T s fie suficient de
mare (n practic T>15), iar modelul s conin un termen constant.
Statistica Durbin-Watson definit de ecuaia
( )
=
=

=
T
t
t
T
t
t t
d
1
2
1
2
1
c
c c
conduce, conform datelor din
tabel, la: 156 , 1
79 , 229991
35 , 265867
= = d .

56
Durbin i Watson au artat c pentru un proces staionar (primele dou momente ale variabilei
aleatoare
t
c independente de timp), valoarea calculat a statisticii d
este cuprins ntre 0 i 4, cu absena

corelaiei n vecintatea lui 2. ntre aceste valori limit, tabela D-W furnizeaz, la pragul de seminificaie o,
diferite intervale de valori d
corespunztoare prezenei autocorelaiei pozitive sau negative, absenei

autocorelaiei i situaiilor de indecizie, astfel:
1. dac
1
0 d d < < , atunci erorile sunt pozitiv autocorelate;

2. dac
2 1
d d d < < , atunci exist ndoieli c erorile ar fi corelate;

3. dac
2 2
4
d d d < < , atunci erorile

t
c sunt independente;
4. dac
1 2
4
4 d d d < < , atunci exist ndoieli c erorile ar fi corelate;

5. dac d d
4
1
< , atunci erorile sunt negativ corelate.
n exemplul nostru, numrul de exogene veritabile n model este (m=1) i dispunem de T=15
observaii.
Tabela D-W furnizeaz valorile d
1
=1,08 i d
2
=1,36 la pragul de semnificaie o=0,05.
Deoarece
36 , 1 156 , 1
08 , 1
2 1
= < = < = d d d
, suntem ntr-o situaie de indecizie, nu
putem s spunem c erorile
t
c sunt corelate.
II. n tabelul urmtor sunt date, pentru perioada 1985-2002:
volumul investiiilor n agricultur, y
t
;
produsul intern brut agricol, x
1t
;
indicele volumului importurilor pentru agricultur, x
2t
.
Anul
t
Investiii n agricultur
y
t

Produsul intern brut agricol
x
1t

Indicele volumului importurilor pentru agricultur
x
2t

1985 85,2 563,8 90,6
1986 90,2 594,7 91,7
1987 96,6 635,7 92,9
1988 112,0 688,1 94,5
1989 124,5 753,0 97,2
1990 120,8 796,3 100,0
1991 131,5 868,5 104,2
1992 146,2 935,5 109,8
1993 140,8 982,4 116,3
1994 160,0 1063,4 121,3
1995 188,3 1171,1 125,3

57
Anul
t
Investiii n agricultur
y
t

Produsul intern brut agricol
x
1t

Indicele volumului importurilor pentru agricultur
x
2t

1996 220,0 1306,6 133,1
1997 214,6 1412,9 147,7
1998 190,9 1528,8 161,2
1999 243,0 1702,2 170,5
2000 303,3 1899,5 181,5
2001 351,5 2127,6 195,4
2002 386,2 2368,5 217,4
Se cere:
1. Determinarea legturii dintre investiii, PIB i volumul importurilor;
2. Testarea autocorelaiei erorilor;
3. Dac exist autocorelaie, cum se pot nltura efectele acesteia?
Rezolvare:
- Studierea legturii dintre variabilele economice amintite se poate efectua cu
modelul de regresie multipl:
t t t t
cx bx a y c + + + =
2 1

Aplicarea MCMMP conduce la urmtoarea estimare a modelului:
t t t
x x y
2 1
93 , 2 37 , 0 44 , 125 + =

Coeficientul de corelaie multipl are valoarea calculat: R
2
=0,98
2. Dup calcularea reziduurilor estimate,
t
c
, statistica Durbin-Watson este:

72 , 0
= d
.
Conform tabelei D-W, pentru =5%, T=18 observaii i m=2 variabile exogene veritabile, rezult:
d
1
=1,05>
72 , 0
= d
, ceea ce conduce la concluzia c erorile sunt corelate pozitiv.
3. Pentru a nltura efectele autocorelaiei erorilor, se procedeaz astfel:
- scriem dependena dintre variabile
(1) t t t t
cx bx a y c + + + =
2 1 , pentru momentul t-1:
(2)
1
) 1 ( 2 ) 1 ( 1
1

+ + + =
t t t t
cx bx a y c

- nmulim (2) cu i efectum scderea (1)-(2):
( ) ) ( ) ( ) ( 1
1 ) 1 ( 2 2 ) 1 ( 1 1 1
+ + + =
t t t t t t t t
x x c x x b a y y c c

58
- cutm o estimaie a coeficientului . Observm c este coeficientul
variabilei y
t-1
n relaia anterioar. Efectum o regresie cu MCMMP pe ultima
ecuaie, fr s inem cont de relaiile dintre coeficieni, adic pe ecuaia:
t t t t t t t
x a x a x a x a y a y q + + + + + + =
) 1 ( 2 4 2 3 ) 1 ( 1 2 1 1 1 0

unde a
0
=a(1- ) , a
1
=b, a
2
=-b, a
3
=c, a
4
=-c i
1
=
t t t
c c q
Efectund calculele, obinem:
) 1 ( 2 2 ) 1 ( 1 1 1
11 , 2 08 , 3 60 , 0 68 , 0 70 , 0 56 , 47

+ + + =
t t t t t t
x x x x y y
Estimaia gsit pentru coeficientul este
70 , 0 =

- cu ajutorul estimaiei gsite, transformm variabilele modelului iniial pentru o nou regresie:
Anul
1

=
t t t
y y z

) 1 ( 1 1 1

=
t t t
x x u

) 1 ( 2 2 2

=
t t t
x x u

1985 - - -
1986 30,56 200,04 28,28
1987 33,46 219,41 28,71
1988 44,38 243,11 29,47
1989 46,10 271,33 31,05
1990 33,68 269,70 31,96
1991 46,94 311,09 34,20
1992 54,15 327,55 36,86
1993 38,46 327,55 39,44
1994 61,44 375,72 39,89
1995 76,30 426,72 40,39
1996 88,19 486,83 45,39
1997 60,60 498,28 54,53
1998 40,68 539,77 57,81
1999 109,37 632,04 57,66
2000 133,20 707,96 62,15
2001 139,19 797,95 68,35
2002 140,15 879,18 80,62

Observaie:
Pentru a evita eliminarea primei valori din irul de observaii, prin trecerea la diferene, se pot
folosi transformrile:
2
1 1
1 = y z ,
2
1 1 1 1
1 = x u ,
2
1 2 21
1 = x u

59

- se aplic MCMMP ecuaiei:
t t t t
u a u a a z q + + + =
2 2 1 1 0
, i rezult:
t t t
u u z
2 1
99 , 0 24 , 0 19 , 7 + =

Coeficientul de corelaie multipl este acum R
2
=0,88 iar statistica Durbin-Watson
54 , 1
= d
.
Testul de independen conduce acum la concluzia c erorile sunt independente, deoarece:
4-d
2
=2,47>
d
=1,54>d
2
=1,53

4.2. Ipoteza de normalitate a erorilor

Unele proprieti ale estimatorilor nu depind de normalitatea erorilor. De exemplu, distribuiile
asimptotice ale estimatorilor necesit doar existena primelor dou momente (media i dispersia) ale
erorilor
t
c i nu n mod obligatoriu ca
t
c s urmeze o lege normal. Acest lucru nu este ns valabil pe
eantioane mici. Testarea ipotezelor i intervalele de ncredere nu mai au aceleai proprieti dac legea de
distribuie a erorilor nu este legea normal. Pentru a caracteriza deviaiile de la legea normal se utilizeaz
doi coeficieni:
a) coeficientul de asimetrie, calculat prin raportul:
2
3
1
c
o
=

unde:
3
este momentul centrat de ordinul 3. Dac 0
1
> , atunci seria de date este deplasat spre
dreapta fa de legea normal, iar dac 0
1
< , exist o deviere spre stnga.
b) coeficientul de aplatizare, calculat prin raportul:
3
2
4
2
=
c
o

O valoare pozitiv pentru
3
indic faptul c distribuia este mai puin aplatizat dect distribuia
normal, n timp ce o valoare 0
3
< caracterizeaz o distribuie mai aplatizat dect cea normal.
Aceste deviaii afecteaz testele i intervalele de ncredere ale estimatorilor. Studiul teoretic al
acestor deviaii este complex. Pentru a obine teste i intervale de ncredere mai robuste, n practic se
procedeaz astfel:

60
1. Se efectueaz o regresie cu metodele uzuale i se determin o estimaie a reziduurilor
t
c .
2. Se examineaz cele T reziduuri estimate i se repereaz cele a cror valoare absolut
este foarte mare.
3. Se elimin din seria de date observaiile corespunzatoare acestor erori foarte mari sau
se corecteaz aceste observaii astfel ca s se ajung la valori ct mai normale ale
erorilor.
4. Se efectueaz o nou regresie pe eantionul corectat. Proprietile estimatorilor
obinui vor depinde de regula adoptat n etapa anterioar. De exemplu, se poate
adopta regula de a respinge sau corecta observaiile corespunztoare reziduurilor a
cror valoare absolut
t
c este mai mare dect de trei ori media erorilor absolute.

4.3. Ipoteza de heteroscedasticitate
S presupunem, deci, c dei
t
c sunt independente, dispesia erorilor
2
t
c
o
variaz n funcie de
t. n acest caz, estimatorii obinui sunt nc nedeplasai. Dar, momentele centrate de ordinul doi nemaifiind
constante se comite o eroare de calcul a ecartului-tip al estimatorilor. Se poate evalua deplasarea n
estimaia lui
a
O
. Aceast deplasare depinde de natura i importana heteroscedasticitii, adic de irul
de valori
( )
t
x
t
,
2
c
o
. Deplasarea este nul dac sunt realizate relaiile urmtoare:
(1)
( ) 0
1
2
=
x x
T
t
t
t
c
o
;
(2)
( ) ( ) |
.
|
\
|
|
.
|
\
|
=

2
2
2
2
1 1
t
t
t
t
t
x x
T
x x
T
t t
c c
o o
.
Aceste relaiile sunt realizate atunci cnd nu exist nicio legtur sistematic ntre
2
t
c
o
i t
x
.
Homoscedasticitatea erorilor se admite n seriile cronologice atunci cnd ordinul de mrime al
variabilelor este apropiat pentru diverse observaii. Dar, n studiul datelor micro-economice, variabilele pot
avea ordine de mrime foarte diferite. Acest fapt conduce la erori de estimare importante pentru coeficienii
unui model econometric.

61
Dac putem evalua variana erorilor
2
t
c
o atunci, n loc s determinm parametrii din condiia ca
suma ptratelor erorilor s fie minim, acetia pot fi determinai din condiia ca
t
t
t
2
2
c
o
c
s fie minim.
Pentru modelul elementar
t t t
b ax y c + + =
, estimatorii a i b
vor fi cei care minimizeaz

expresia ( )

|
|
.
|
\
|
t
t t
b ax y
t
2
2
1
c
o
.
n cazul n care
2
t
c
o (dispersiile reziduurilor) variaz proporional cu valorile variabilei exogene,
se poate pune condiia ca
( )
2
2
2

|
|
.
|
\
|
=

t t t
t
t t
t t
x
b
a
x
y
x
b ax y
s fie minim.

Ne propunem s studiem legatura dintre volumul investiiilor i suprafaa cultivat. Pe un eantion
de 30 de ntreprinderi agricole s-au obinut urmtoarele date:
Suprafaa (ha) Cheltuielile de investiii (RON)
100 75,6 75,6 77,4 78,3 80,1 81
200 80,1 81,9 83,7 83,7 84,6 84,6
300 85,5 88,2 89,1 92,7 92,7 94,5
400 92,7 95,4 98,1 101,7 103,5 105,3
500 104,4 106,2 108,9 112,5 117,9 117,9
Aplicnd MCMMP pe ntregul eantion cu modelul elementar
t t t
b ax y c + + =
, obinem:
965 , 67 08145 , 0 + =
t t
x y
i
9 , 0
2
= R
.
Dorim s testm ipoteza de homoscedasticitate a erorilor. n acest scop efectum dou regresii
separate, una pe primele 12 observaii, alta pe ultimele 12 (valorile lui X fiind ordonate cresctor).
Fie SPE
1
i SPE
2
suma ptratelor erorilor relative la cele dou regresii.
Regresia lui Y n raport cu X pentru primele 12 observaii, conduce la:
( )
6 , 72 054 , 0
1
+ =
t t
x y
i
66 , 0
2
= R
;
14 , 49
1
= SPE
,
iar regresia pe ultimele 12 observaii d:
( )
45 , 54 1125 , 0
2
+ =
t t
x y
i
60 , 0
2
= R
; 695 , 250
2
= SPE .

62
n cazul n care erorile ar fi distribuite normal i homoscedastice, variabilele aleatoare
2
1
o
SPE
,
respectiv
2
2
o
SPE
ar trebui s urmeze fiecare o distribuie hi-ptrat cu (T-d-k-p) grade de libertate, unde T
este numrul de observaii, d este numrul de observaii omise (n cazul nostru d=6), k este numrul de
observaii luat n fiecare regresie separat, iar p este numrul parametrilor de estimat. n exemplul nostru T-
d-k-p=10. n aceste condiii, variabila aleatoare
1
2
10
1
10
1
SPE
SPE
are o distribuie Fisher cu 10 i respectiv 10
grade de libertate (F
10,10
). Cu datele calculate, obinem 01 , 51
14 , 49
695 , 250
1
2
= =
SPE
SPE
. Din tabelele
distribuiei Fischer-Snedecor, la pragul de semnificaie o=0,05 gasim F
tab
=2,97. Deoarece
F
calc
=51,01>F
tab
=2,97 se admite ipoteza de heteroscedasticitate a erorilor.
Dac presupunem acum c variana erorilor
2
t
c
o
este proporional cu ptratul valorilor
variabilei exogene, adic
2 2
t
x
t
o
c
= , fiind o constant nenul, atunci efectele heteroscedasticitii pot fi
corectate prin transformarea modelului. mprind fiecare termen al ecuaiei de regresie prin x
t
, rezult:
t
t
t t
t
x x
b
a
x
y c
+ + =

sau
t t t
bu a z q + + =
, unde:
t
t
t
x
y
z = ,
t
t
x
u
1
= i
t
t
t
x
c
q = .
Se observ c
( ) o
c
q
c
= =
|
|
.
|
\
|
=
2
2
1
t
t t
t
t
x x
Var Var
.
Prin urmare, modelul transformat are erorile
t
q homoscedastice, deoarece dispersia lor este
independent de timp. Efectund regresia pe modelul transformat, rezult:
u b z a
u T u
u z T u z
b
t
t t
2
2

Revenind n variabilele iniiale obinem:

63
=
|
|
.
|
\
|
|
|
.
|
\
|

=

t t t t
t
t t t
t t t t
t
t t
t
x T
b
x
y
T
a
x T x
x x
y
T x x
y
b
1 1
1 1 1
1 1 1
2 2

Efectund calculele, rezult:
44 , 70
= b
;
072 , 0 = a
;
99 , 0
2
= R
, adic:
t t
t
x x
y 44 , 70
072 , 0
+ =
sau
44 , 70 072 , 0 + =
t t
x y
.
S remarcm faptul c panta dreptei de regresie (dup corectarea heteroscedasticitii) este mai
mic dect cea obinut naintea corectrii.

4.4. Ipoteza de independen a erorilor n raport cu varibilele exogene

Se tie c sub aceast ipotez fundamental estimatorii obinui au proprieti optimale
(nedeplasai, cu varian minimal). Cnd ipoteza nu mai este satisfcut aceste proprieti nu mai sunt
valabile. Cu ct coeficientul de corelaie liniar ( ) dintre
t
c i
t
x este mai mare, cu att deplasarea
estimatorilor va fi mai mare. n astfel de cazuri este de preferat s se aleag un alt model econometric
pentru studierea legturii dintre variabile.
La fel trebuie procedat i atunci cnd se constat c variana erorilor nu este finit.

4.5. Ipoteza referitoare la faptul c variabilele modelului sunt observate fr eroare

Atunci cnd variabilele care apar n model nu sunt variabile observate fr eroare, va exista o
corelaie ntre reziduuri i exogenele din model.
n acest caz, pentru a obine estimatori convergeni, s-a dezvoltat o metod de estimare special,
numit metoda variabilelor instrumentale, pe care o prezentm mai jos.
Fie modelul liniar general:
t pt p t t t
x a x a x a y c + + + + = ...
2 2 1 1
, t=1, 2, ...,T,
care, cu notaiile obinuite, se scrie n forma matricial Y=Xa+c. Notm cu Y
~
i X
~
valorile reale
(necunoscute acum pentru c observaiile Y i X conin erori!) ale variabilelor din model.

64
Putem scrie c + = Y Y
~
, + = X X
~
, unde i sunt variabile aleatoare. Vom presupune c
i satisface ipotezele fundamentale (medie zero, varian finit, independente).
nlocuind X i Y prin expresiile lor, obinem modelul
q + = a X Y
~ ~
, unde
c q + = a
. Aceasta arat c n modelul iniial, Y=Xa+c , reziduurile c sunt corelate cu X prin
intermediul lui .
Presupunem acum c se cunosc alte p variabile exogene Z
i
, i=1,2,...,p necorelate cu , i q, deci
necorelate cu c.
Acest lucru nseamn c
( ) 0 = c
i
Z E
, i=1,2,...,p. Considerm modelul iniial Y=Xa+c scris
sub forma:
(1)
c + + + + =
p p
X a X a X a Y ...
2 2 1 1
,
unde
|
|
|
|
|
|
.
|
\
|
=
T
x
x
X
1
11
1
.
.
.
,
|
|
|
|
|
|
.
|
\
|
=
T
x
x
X
2
21
2
.
.
.
,...,
|
|
|
|
|
|
.
|
\
|
=
pT
p
p
x
x
X
.
.
.
1

nmulim, succesiv, ecuaia (1) cu Z
1
, Z
2
, ...Z
p
i aplicm operatorul de medie E fiecrei ecuaii. Se
obine sistemul:
(2)
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
+ + =
+ + =
+ + =
p p p p p
p p
p p
X Z E a X Z E a Y Z E
...
....
...
...
1 1
2 1 2 1 2
1 1 1 1 1

Metoda de estimare VI (variabilelor instrumentale) const n a lua ca estimatori ( )
p
a a ,...,
1
exact
soluiile sistemului de ecuaii (2), n care speranele matematice sunt nlocuite cu momentele empirice
corespunztoare:
( )

=
t
t it i
y z
T
Y Z E
1
, i=1,2,...,p
( )

=
t
jt it j i
x z
T
X Z E
1
, i,j=1,2,...,p
Dac notm:

65
|
|
|
.
|
\
|
=
pT T
p
z z
z z
Z
...
... ... ...
...
1
1 11
i
|
|
|
.
|
\
|
=
pT T
p
x x
x x
X
...
... ... ...
...
1
1 11
sistemul (2) transformat se scrie sub form
matricial:
( )a X Z Y Z ' ' =
, iar pentru c ( ) Y Z' este inversabil, obinem estimatorul:
( ) Y Z X Z a =

' '
1
.
S observm similitudinea cu estimatorii obinui prin MCMMP:
1. MCMMP obinuit:
( ) Y X X X a =

' '
1

2. MCMMP generalizat: ( ) ( ) Y X X X a O O =

1
1
1
' '
c c

3. metoda VI:
( ) Y Z X Z a =

' '
1
.
Se trece de la 1. la 2. nlocuind ' X prin
1
'

O
c
X .
Se trece de la 1. la 3. nlocuind ' X prin ' Z .
Cunoaterea primei formule permite exprimarea celorlalte dou.
Estimatorul a obinut prin metoda VI este un estimator deplasat pentru a, dar converge n
probabilitate ctre a pentru T suficient de mare.
Pentru a putea utiliza metoda VI trebuie gsite attea variabile instrumentale cte exogene conine
modelul. Aceste variabile instrumentale trebuie s fie necorelate cu reziduurile, dar puternic corelate cu
exogenele modelului. Aceste restricii limiteaz alegerea variabilelor instrumentale i, prin urmare, metoda
VI nu este o metod general de estimare.


Considerm o anchet pe bugetele de familie pentru a studia consumul dintr-un anumit produs.
Ancheta cuprinde un eantion de T familii. Facem urmtoarele notaii:
y
1t
: cheltuielile totale ale familiei t;
y
2t
: cheltuielile relative la produsul studiat;
V
t
: veniturile familiei t;
i scriem ecuaiile:
(1) t t t
V y
1 1
c + =

(2)
t t t
b aV y
2 2
c + + =

66
Ne propunem s exprimm cheltuielile relative la produsul studiat n funcie de cheltuielile totale.
Din ecuaia (1) avem c
t t t
y V
1 1
c =
i nlocuind n (2), rezult:
t t t t
a b ay y
1 2 1 2
c c + + =

sau, punnd
t t t
a
1 2
c c q =
:
(3)
t t t
b ay y q + + =
1 2
.
S observm c
t
q este corelat cu y
1t
prin intermediul lui c
1t
.
Vom estima a i b din ecuaia (3) introducnd o variabil instrumental.
Fie VD
t
venitul declarat de familia t. Este evident corelaia puternic dintre variabilele VD
t
i V
t
.
Dimpotriv, venitul declarat VD
t
nu este corelat cu
t t t
V y =
1 1
c
, care este ecartul ntre
cheltuielile totale i veniturile familiei t. Rezult c VD
t
nu va fi corelat cu
t
q . Utilizm venitul declarat ca
variabil instrumental.
Pentru simplificarea calculelor, centrm variabilele din model:
t t t
b ay y q + + =
1 2
, t=1,2,...,T

+ + =
t
t
t
t
t
t
T
b y
T
a y
T
q
1 1 1
1 2

q + + = b y a y
1 2

(4)
( ) ( ) q q + =
t t t
y y a y y
1 1 2 2

Dac aplicm MCMMP ecuaiei (4), obinem estimatorul:
(5).
( )( )
( )
2
1 1
2 2 1 1

=
t
t
t
t
t
y y
y y y y
a

Folosim ns metoda variabilelor instrumentale. Pentru aceasta, considerm variabila
instrumental centrat ( ) VD VD
t
. nmulind ecuaia (4) cu variabila instrumental centrat i aplicnd
operatorul de medie E, rezult:
( )( ) | | ( )( ) | | ( )( ) | | VD VD E VD VD y y aE VD VD y y E
t t t t t t
+ = q q
1 1 2 2
.

67
Dar, cum
t
q i VD
t
nu sunt corelate, nseamn c ( )( ) | | 0 = VD VD E
t t
q q , iar acum
nlocuind E cu media empiric, obinem:
( )( ) | | ( )( ) | | VD VD y y aE VD VD y y E
t t t t
=
1 1 2 2

( )( ) ( )( )
1 1 2 2
1 1
y y VD VD
T
a y y VD VD
T
t
t
t
t
t t
=

,
de unde:
( )( )
( )( )
1 1
2 2
y y VD VD
y y VD VD
a
t
t
t
t
t t

=
.
Am obinut practic estimatorul (5) n care variabila ( )
1 1
y y
t
s-a nlocuit cu variabila
instrumental ( ) VD VD
t
att la numrtor, ct i la numitor.

68
BIBLIOGRAFIE

1. Andrei, T. Statistic i econometrie, Editura Economic, Bucureti, 2004
2. Cenu, Ghe. (coord.) Matematici pentru economiti, Editura CISON, Bucureti, 2000
3. Chow, G. Econometrics, McGraw Hill, New York, 1989
4. Dobrescu, E. Tranziia n Romnia-Abordri econometrice, Editura Economic,
Bucureti, 2002
5. Gheroghi, M. Modelarea i simularea proceselor economice, Editura ASE,
Bucureti, 2001
6. Giraud, R. - Econometrie, Economica, 49 rue Hericart, Paris, 1990
7. Gourieroux, C. Statistique et Modeles Econometriques,
Monfort, A. Economica, Paris, 1989
8. Gujarati, R.N. Essentials of Econometrics, McGraw Hill, New York, 1998
9. Isaic-Maniu, Al. Statistica pentru managementul
Mitru, C. afacerilor, Editura Economic, 1995
Voineagu, V.
10. Malinvaud, E. Methodes statistiques de leconometrie, Dunod, Paris, 1978
11. Onicescu, O. Incertitudine i modelare economic
Botez, M. (Econometrie informaional), Editura tiinific i Enciclopedic,
Bucureti, 1985
12. Pecican, E.S. Econometria pentru ... economiti; Econometrie-teorie i aplicaii,
Editura Economic, Bucureti, 2003
13. Pecican, E.S. Econometrie, Editura All, Bucureti, 1994
14. Tanadi, Al. Econometrie, Editura A.S.E., 2001
15. Tanadi, Al. Econometrie proiect, Editura A.S.E.,
Creu, A. 2003
Peptan, E.
16. Tnsoiu, O. Modele econometrice, Editura A.S.E.,
Pecican, E.S. 2001
Iacob, A.
17. Tnsoiu, O. Econometrie-studii de caz, Editura A.S.E., 1998
18. Tnsoiu, O. Econometrie aplicat, Editura Arteticart,
Iacob, A. Bucureti, 1999
19. www.asecib.ase.ro/soft.htm

Eco Zi 2010

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Eco Zi 2010

Încărcat de

Drepturi de autor:

Formate disponibile

1

ACADEMIA DE STUDII ECONOMICE

) prin metoda celor mai mici ptrate

i nlocuind n prima ecuaie:

ai parametrilor a i b dai de relaiile:

este aleator pentru c e funcie de a .

+ = , iar din (2) c + + = b x a y , astfel c prin

sunt estimatori nedeplasai pentru a i b.

sunt estimatori convergeni pentru a i b.

, este suficient s artm c

s fie convergeni n probabilitate ctre a i b. Calculm variana

( a este convergent n probabilitate ctre a).

converge n probabilitate ctre b) .

putem calcula estimaia variabilei endogene y

converg n probabilitate ctre a i b, distribuia lui

converge n probabilitate ctre distribuia lui

ai parametrilor modelului utiliznd condiia necesar de existen a

proiecia pe planul (L) a vectorului Y i cu c vectorul HA ortogonal la planul (L).

urmeaz tot o repartiie

, care definete astfel o regiune de ncredere

, a i b. Aceasta arat c, odat cunoscut o realizare a

, , legea de probabilitate condiionat a lui y

, sunt estimatori exhaustivi pentru a i b,

urmeaz o lege Student cu T-2 grade de libertate pentru c ( ) ( )

, urmeaz o lege normal bidimensional.

urmeaz fiecare o repartiie Student cu (T-2) grade de

este distribuit Student cu (T-2) grade de libertate, putem

' ' ' '

' ' ' ' ' ' '

urmeaz o lege normal redus N(0,1);

urmeaz o lege Student cu (T-p) grade de libertate.

urmeaz o lege Fisher-Snedecor cu p i (T-

= este proiecia lui Y pe subspaiul (L) ai crui vectori generatori sunt X

= este proiecia lui Y pe subspaiul generat de X

, avem nevoie de matricile:

= = 4296 , 68 5704 , 1179 1248

, adic regsim estimatorul obinut prin MCMMP

, ceea ce nu antreneaz erori prea grave.

n ecuaia (3) i aplicm MCMMP obinuit acestei ecuaii. Se

, numit i statistica Durbin-Watson definit prin

. Aceste funcii depind de numrul de observaii (T), de numrul de

cu relaia dat i se observ c:

d d < , atunci se accept I

d d > , atunci se accept I

d d > , atunci se accept I

d d d s s , atunci exist ndoieli c erorile sunt corelate;

d d d < < , atunci se accept I

este cuprins ntre 0 i 4, cu absena

corespunztoare prezenei autocorelaiei pozitive sau negative, absenei

0 d d < < , atunci erorile sunt pozitiv autocorelate;

d d d < < , atunci exist ndoieli c erorile ar fi corelate;

d d d < < , atunci erorile

4 d d d < < , atunci exist ndoieli c erorile ar fi corelate;

, statistica Durbin-Watson este:

vor fi cei care minimizeaz

S-ar putea să vă placă și