Documente Academic
Documente Profesional
Documente Cultură
WWW - Aseonline.ro Suport Curs Econometrie
WWW - Aseonline.ro Suport Curs Econometrie
ECONOMETRIE
BUCURETI
-2008-
1
CUPRINS
Introducere 3
Capitolul I: Modele econometrice 4
1.1. Generaliti 4
1.2. Model aleator 4
1.3. Natura variabilelor care apar n model 4
1.4. Inducia statistic 5
1.5. Identificarea modelului 5
1.6. Previziunea variabilei endogene 5
1.7. Vocabular uzual 6
Capitolul II: Regresia simpl 10
2.1. Modelul liniar al regresiei simple 10
2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate 11
2.3. Proprietile estimatorilor 12
2.3.1. Covariana estimatorilor 15
2.3.2. Determinarea unui estimator nedeplasat pentru variana erorilor 16
2.3.3. Interpretarea geometric a metodei celor mai mici ptrate 18
2.3.4. Coeficientul de corelaie liniar 21
2.3.5. Distribuia de probabilitate a estimatorilor 22
2.4. Teste i intervale de ncredere 24
2.5. Previziunea cu modelul liniar 25
2.6. Experien de calcul 29
Capitolul III: Regresia multipl 34
3.1. Modelul liniar al regresiei multiple 34
3.2. Determinarea estimatorilor parametrilor 35
3.3. Proprietile estimatorilor 36
3.4. Determinarea unui estimator nedeplasat pentru variana reziduurilor 38
3.5. Teste i regiuni de ncredere 39
3.6. Previziunea variabilei endogene 41
3.7. Coeficientul de corelaie multipl. Analiza varianei 42
3.8. Experien de calcul 45
Capitolul IV: Studiul modelului liniar cnd ipotezele clasice asupra erorilor nu mai 49
sunt realizate
4.1. Ipoteza de independen a erorilor 49
4.1.1. Testarea ipotezei de independen a erorilor 52
4.1.2. Experien de calcul 55
4.2. Ipoteza de normalitate a erorilor 59
4.3. Ipoteza de heteroscedasticitate 60
4.3.1. Experien de calcul 61
4.4. Ipoteza de independen a erorilor n raport cu variabilele exogene 63
4.5. Ipoteza referitoare la faptul c variabilele sunt observate fr eroare 63
4.5.1. Experien de calcul 65
Bibliografie 68
2
INTRODUCERE
Dezvoltarea aparatului statistic furnizeaz economitilor tot mai multe date cifrice despre procesele i
fenomenele care au loc n timp i spaiu. Econometria este un mijloc de a exploata aceste date. Noiunea de econometrie
provine din termenii oikonomie (economie) i metron (msurare) i desemneaz totalitatea metodelor i tehnicilor de
msurare a fenomenelor i proceselor care au loc n domeniul economic. Primele lucrri econometrice au avut ca obiect
funciile consumului, care leag nivelul consumului de venitul disponibil (aceste funcii stau la baza teoriei keynesiene).
n decursul timpului, numeroi autori au ncercat definirea econometriei. Lucrarea ECONOMETRIA
PENTRU...ECONOMITI, a profesorului Eugen tefan Pecican, aprut la Editura Econmic n 2003, conine multe
referiri n acest sens, din care am selectat cteva.
Autori Referina
R. Frisch Econometria realizeaz mbinarea punctelor de vedere care se refer la teoria economic, statistic i
matematic cu privire la natura relaiilor cantitative din economie
P.A. Samuelson, Econometria reprezint o analiz de natur cantitativ a fenomenelor economice, bazat pe
T.C. Koopmans, dezvoltarea recent a teoriei culegerii i interpretrii datelor, n conexiune cu metodele de inferen
J.R.N. Stone (inducie) statistic adecvate
Fr. Perroux Econometria este o economie de intenie tiinific
G.C. Chow Econometria este un domeniu n care se mbin arta i tiina de a utiliza metodele statistice n
vederea msurrii relaiilor economice
W. Griffits, Econometria este ansamblul metodelor de realizare a analizei datelor economice
H. Carter,
G. Judge
Autorul lucrrii citate mai sus este de prerea c obiectul econometriei const n cunoaterea mecanismelor de
desfurare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natur
statistic sau matematic.
Definiiile date econometriei pun n eviden dou elemente: domeniul de studiu (economia, relaiile dintre
variabilele economice) i metodele utilizate (provenite din statistic i matematic). Econometria se orienteaz spre
construirea de modele econometrice care s reprezinte simplificat procesele sau fenomenele economice analizate i s
permit simulri ale acestora, n scopul nelegerii lor, pe de o parte, dar i s serveasc la realizarea de previziuni,
prognoze care s fundamenteze politicile economice, pe de alt parte.
3
CAPITOLUL I
MODELE ECONOMETRICE
1.1. Generaliti
Modelarea economic reprezint un proces de cunoatere mijlocit a realitii cu ajutorul unui instrument cu
caracteristici speciale: modelul. Sistemul real supus studiului este nlocuit prin modelul su, care este o reprezentare
simplificat a obiectului cercetat.
Modelul econometric este, de regul, o mulime de relaii numerice care permite reprezentarea simplificat a
procesului economic supus studiului (uneori chiar a ntregii economii). Modelele actuale comport adesea mai mult de
zece relaii (ecuaii). Validitatea unui model este testat prin confruntarea rezultatelor obinute cu observaiile statistice.
Pentru a studia un fenomen economic se ncearc reprezentarea lui prin comportamentul unei variabile. Aceast
variabil economic depinde, la rndul su de alte variabile de care este legat prin relaii matematice.
De exemplu, dac se studiaz cererea (C) i oferta (O) dintr-un anumit bun pe o pia, se tie c cererea i
oferta depind de preul (p) bunului respectiv. Putem scrie c variabilele C i O sunt funcii de variabila p i c la
echilibrul pieei, trebuie ca cererea s fie egal cu oferta. Se construiete astfel un model elementar de forma:
C f ( p )
[1] O g ( p )
C O
Oferta i cererea dintr-un anumit bun depind i de alte variabile dect preul. Astfel, cererea dintr-un bun
alimentar depinde i de venitul disponibil, de preul unor produse analoage etc. La fel, dac este vorba despre un bun
agricol (gru,...) oferta depinde de preul anului precedent. Relaia stabilit ntre variabile n modelul econometric este
dat, de regul, la un anumit moment de timp t, caz n care variabilele apar indiciate:
C t f ( p t , x1t , x 2t ,..., x nt )
[2] Ot g ( p t 1 , x1t , x 2 t ,..., x rt )
C t Ot
n modelul [2] s-au introdus mai multe variabile care explic cererea i oferta dintr-un bun i s-a considerat
realizarea acestor variabile la momentul t sau t-1. Se observ c modelul comport mai multe relaii. Se zice c avem un
model cu ecuaii multiple. Evident, se va ncepe studiul cu un model mai simplu, cu o unic ecuaie.
S presupunem c se studiaz consumul (Ci) dintr-un anumit bun de ctre o familie (i). ntre alte variabile,
consumul depinde de venitul disponibil al familiei (Vi). Modelul econometric elementar const n a exprima Ci n funcie
de Vi. Desigur, ali factori dintre care unii sunt necunoscui determin de asemenea consumul familiei. Condensm
efectele acestor ali factori ntr-unul singur, aleator, notat i. Se obine astfel un model aleator:
[3] C i f (Vi ) i
Factorul aleator i este o variabil aleatoare care urmeaz o anumit lege de probabilitate, ce va trebui s fie
specificat prin ipotezele fcute asupra modelului. Cel mai frecvent, ipotezele se refer doar la momentele de ordinul I
i II ale variabilei aleatoare i. Urmeaz s ne asigurm c funcia f (sau clasa de funcii) aleas nu contrazice rezultatele
experienei. De exemplu, dac s-a ales f ca o funcie liniar (adic f(Vi) = aVi+b), modelul econometric este:
[4] C i aVi b i
i variind pe i pentru diferitele familii studiate, ne vom asigura c relaia [4] este bine satisfcut. Se spune c testm
modelul. Dac rezultatul obinut este convenabil, se va trece la estimarea parametrilor a i b. Apoi, definind o regul
de previziune se va putea determina consumul Ci dac se cunoate venitul Vi.
4
Distincia ntre natura variabilelor este foarte important i va trebui precizat ntotdeauna nainte de a studia
modelul. Cnd modelul econometric a cptat formularea matematic definitiv se spune c modelul a fost specificat.
Modelul [4] de mai sus este specificat. Se cunoate forma funciei f din expresia Ci = f(Vi) + i , adic f(Vi) = aVi+b.
Adugarea variabilei exogene i d modelului formularea definitiv [4].
Mulimea parametrilor care definesc complet modelul econometric constituie structura acestuia. De
exemplu, dac a = 0,7 i b = 23 iar urmeaz o lege de probabilitate normal de medie (speran matematic) egal cu
zero i dispersie (varian) egal cu 5, atunci mulimea
a = 0,7; b= 23; = 5
constituie structura modelului [4]. Scopul va fi acela ca, plecnd de la cuplurile (Ci,Vi) asociate diferitelor familii i, s
se determine structura adevrat a modelului. Cu alte cuvinte, plecnd de la un spaiu eantion definit de mulimea
cuplurilor (Ci,Vi) s se determine structura adevrat a modelului n spaiul cu trei dimensiuni al structurilor
a , b, . Aici intervine induciastatistic.
Obiectul induciei statistice este de a determina o procedur care, pornind doar de la observaiile statistice de
care dispunem, s permit trecerea de la spaiul eantion la spaiul structurilor. Odat ce modelul a fost ales, se admite
c exist un triplet (a, b, ) care permite reprezentarea exact a procesului prin care valorile variabilelor observate au
fost determinate. n cursul induciei statistice modelul nu se mai modific. Procedura aleas aa cum se va vedea n
continuare va consta n obinerea de estimatori pentru parametrii a i b care s permit determinarea celor mai bune
valori reale ale acestor parametri. Aceste valori se vor aprecia, n general, cu ajutorul unor intervale de ncredere
construite la un prag de semnificaie () dat. De exemplu, n modelul [4] se va gsi c a[0,64;0,78] i b[20;27] cu o
probabilitate de 95% (s-a considerat =5%). Se poate estima i abaterea medie ptratic () a variabilei aleatoare i. Se
va vedea rolul important jucat de aceast variabil aleatoare n modelul econometric.
Considerm din nou modelul Ci=aVi+b+i. S presupunem c procedura utilizat, pornind de la informaia
deinut, adic de la cuplurile (Ci,Vi), i=1,2,... nu conduce la o soluie unic, ci la dou structuri distincte:
s0=a0,b0,0 , s1 =a1,b1,1. Deorece legea de probabilitate pentru precizeaz i legea de probabilitate pentru C,
fiecare structur (innd cont de valorile exogenelor i de legea lui ) conduce la o lege de probabilitate pentru C.
Presupunem c structurile s0 i s1 conduc la aceeai lege de probabilitate pentru consumul C. Sunt posibile dou cazuri:
- s0 i s1 sunt distincte i nu putem alege ntre ele. Se spune c structurile considerate nu sunt
identificabile i, ca urmare, modelul nu este identificabil. Din aceast cauz nu vom
putea determina valorile parametrilor care figureaz n model;
- s0 i s1 nu sunt distincte, intersecia lor nu este vid. Acestea vor permite identificarea unei
pri a parametrilor modelului (cei care aparin interseciei). Se spune c cele dou
structuri sunt echivalente, dar nu permit o identificare complet a modelului.
Problema identificrii este important mai ales n cazul modelelor cu ecuaii multiple.
Interesul unui model a crui structur a fost determinat const n a-l utiliza pentru previzionarea variabilelor
endogene ntr-o etap viitoare sau ntr-o circumstan dat, dac este vorba despre observaii luate la acelai moment-,
atunci cnd cele exogene au fost fixate. De exemplu, dac dorim s studiem evoluia importurilor (Y) n funcie de
produsul intern brut (X1) i de nivelul stocurilor (X2), modelul econometric este:
yt=a1x1t+a2x2t+b+t, t=1,2,...,T
unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X 1 i X2 (observaiile fiind anuale)
permit determinarea parametrilor modelului. S presupunem c am gsit estimaiile punctuale:
a1 0,14
a 2 0,6
b 6
Modelul estimat este: y t 0,14 x1t 0,6 x 2t 6 . Dac dorim s facem o previziune a importurilor pentru anul
2007, trebuie s tim PIB-ul i nivelul stocurilor n anul 2007. Presupunnd c aceste variabile exogene sunt x 1=1030 i
x2=12,7 vom avea ca previziune pentru y:
y2007=(0,14).1030+(0,6).(12,7)+6
sau, n general, yp a1 x1 a 2 x2 b , unde este perioada de previziune.
5
Observaie. Asupra valorii previzionate trebuie s remarcm:
- valorile exogenelor x1, x2 au fost alese arbitrar, eventual innd cont de evoluia lor trecut;
- specificarea modelului nu poate fi perfect, forma funciei alese pentru a explica evoluia lui y neputnd fi
suficient de precis;
- este posibil ca variabilele explicative (exogene) ale variabilei endogene (explicate), s nu mai intervin n
acelai mod ca n perioada 1990-2005, cnd s-a studiat legatura dintre ele. Este posibil s aib loc un oc, o
ruptur care s perturbe echilibrul dintre variabilele care explic fenomenul, la momentul previziunii.
Este evident c toate aceste cauze pot constitui surse de eroare a previziunii. Vom vedea care sunt metodele de a
minimiza eroarea de previziune.
Rezumatul capitolului I
Dac suntei familiarizai cu statistica matematic, putei trece la capitolul II. n caz contrar, v reamintim aici
cteva noiuni de baz. Lectura acestui paragraf credem c v va incita s revedei cursul de Statistic matematic.
Nor de puncte Fiind dat o serie de date statistice n care valorile (xi,yj) apar efectiv de nij ori putem
reprezenta ntr-un plan toate aceste valori prin puncte de coordonate (xi,yj) afectate de coeficienii nij , obinndu-se
astfel un nor de puncte.
Ajustare Reprezentarea grafic a seriilor de date economice conduce frecvent la figuri puin lizibile i greu
de interpretat din cauza variaiilor pe termen scurt, numeroase i sensibile, dar fr o semnificaie important. Metodele
matematice numite de ajustare permit obinerea unei curbe simple, ct mai apropiat posibil de mulimea de puncte
furnizate de observaiile empirice disponibile.
Ajustare liniar Atunci cnd reprezentarea grafic a unei serii statistice duble d un nor de puncte de form
alungit, se ncearc obinerea unei aproximri bune a acestei serii cu ajutorul unei drepte, realizndu-se astfel o ajustare
liniar. Exist mai multe metode pentru gsirea acestei drepte:
- metoda grafic (se determin punctul mediu M ale crui coordonate sunt x, y i se traseaz dreapta care
pare a fi cea mai reprezentativ a seriei, determinnd ecuaia Y=aX+b. Aceast metod este ambigu pentru c nu ine
cont de ponderea fiecrui punct n norul de puncte);
- metoda lui Mayer (se regrupeaz punctele norului n dou submulimi crora li se determin punctele medii
M1 i M2. Dreapta de ajustare este atunci dreapta care trece prin M1 i M2);
- metoda celor mai mici ptrate (const n a face minim suma ptratelor distanelor de la punctele norului la o
dreapt de ecuaie Y=aX+b numit dreapt de regresie a lui Y n X. Se arat c panta (coeficientul director) acestei
drepte este a=cov(X,Y)/Var(X). Coeficientul b se obine scriind c dreapta de regresie trece prin punctul mediu:
b Y aX . Procednd la fel se gsete dreapta de regresie de ecuaie X=aY+b , cu a=cov(X,Y)/Var(Y) i
b X a Y . Cele dou drepte de regresie sunt, n general, distincte. Compararea lor permite msurarea nivelului de
corelaie al caracteristicilor X i Y. Corelaia se msoar cu coeficientul de corelaie =cov(X,Y)/(X)(Y). Se constat
c 2=aa i c variaz ntre 1 i 1. 2 msoar unghiul dintre cele dou drepte de regresie, care coincid dac 2=1,
adic 1 . Caracteristicile X i Y sunt corelate maximal cnd este apropiat de 1).
n afara faptului de a da o reprezentare mai mult sau mai puin satisfctoare legturii dintre X i Y, importana
ajustrii liniare este de a permite previziuni statistice, asociind lui X o valoare probabil a lui Y prin relaia Y=aX+b.
Probabilitate Fiind dat o mulime finit , numim probabilitate pe orice aplicaie p a lui P()
mulimea prilor lui - n intervalul [0,1 care verific trei condiii:
- p(A)0, pentru A P()
- p()=1
- p(AB)= p(A)+ p(B), dac A,B P(), AB=
se numete univers (sau univers de probabiliti). nzestrat cu probabilitatea p se numete spaiu
probabilizat. Orice parte a lui este un eveniment. Un singleton (mulime ce conine un singur element) al lui se
numete eveniment elementar sau eventualitate. este evenimentul cert. este evenimentul imposibil. A este
evenimentul complementar lui A n (se numete eveniment contrar lui A). Dac AB=, evenimentele A i B sunt
incompatibile.
6
Variabil aleatoare Dac este un univers finit, numim variabil aleatoare orice aplicaie X: R ( a
lui n mulimea numerelor reale). Mulimea valorilor lui X, adic X() se numete universul imagine. Atenie!- o
variabil aleatoare nu este o variabil, ci o aplicaie! Se observ c nu este necesar s cunoatem o probabilitate pe
pentru a defini o variabil aleatoare pe .
Legea de probabilitate a unei variabile aleatoare Dac universul finit este nzestrat cu o probabilitate p,
iar X este o variabil aleatoare definit pe , numim lege de probabilitate a variabilei aleatoare X, aplicaia px:
X()[0,1 care asociaz oricrui xX() probabilitatea evenimentului mulimea antecedentelor lui x prin X.
Aceast mulime X-1(x) este notat (X=x). Legea de probabilitate a lui X, notat px este definit prin px: X()[0,1, x
p(X=x). A studia o variabil aleatoare nseamn a-i descoperi legea sa de probabilitate.
Funcie de repartiie Dac universul finit este nzestrat cu o probabilitate p, iar X este o variabil
aleatoare definit pe , se asociaz acestei variabile aleatoare funcia F:R[0,1 definit prin F(x)=p(Xx) numit
funcie de repartiie a variabilei aleatoare X. Evenimentul (Xx) este imaginea intervalului , x prin funcia X.
Funcia de repartiie este o funcie n scar.
Sperana matematic Dac X este o variabil aleatoare definit pe universul finit , nzestrat cu
probabilitatea p, universul imagine este o mulime finit i ia valorile xi, i=1,2,...,n. Legea de probabilitate a lui X
asociaz fiecrui xi probabilitatea pi=p(X=xi). Se numete speran matematic a variabilei aleatoare X, numrul real
n
E ( X ) pi xi . E(X) este media n probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator
i 1
liniar.
Variana Dac X este o variabil aleatoare definit pe universul finit , nzestrat cu probabilitatea p,
universul imagine este o mulime finit i ia valorile xi, i=1,2,...,n. Legea de probabilitate a lui X asociaz fiecrui xi
probabilitatea pi=p(X=xi). Se numete varian a variabilei aleatoare X, numrul real pozitiv
n
Var ( X ) pi ( xi E ( X )) 2 . Variana este media n probabilitate a ptratului distanelor de la xi la media lor.
i 1
Rdcina ptrat (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat x.
Momente condiionate Se consider vectorul aleator X , Y : R 2 , cu repartiia
P ( X xi , Y y j ) pij , p ij 0, pi j
ij 1 i variabila aleatoare condiionat (X/Y=y ) cu repartia
j
pij
P ( X xi / Y y j ) , p. j pij . Momentul de ordinul k al variabilei aleatoare X condiionat de Y=yj este
p. j i
Regresie Se numete regresia variabilei aleatoare X n raport cu Y, variabila aleatoare M(X/Y) cu mulimea
valorilor posibile: M(X/Y=y), x R.
Similar, regresia variabilei aleatoare Y n raport cu X este: M(Y/X=x), y R.
Dac M(X/Y)=aX+b sau M(Y/X)=cY+d se spune c regresia este liniar
Repartia normal Variabila aleatoare X urmeaz o repartiie normal de parametri m i (se mai scrie i
X N ( m, ) ) dac densitatea ei de probabilitate (derivata funciei de repartiie) este:
1 ( x m) 2
f ( x) exp( ), x R, m R, >0
2 2 2
Pentru m=0 i =1 se obine repartiia normal normat N(0,1), cu densitatea de probabilitate:
7
1 x2
f ( x) exp( ), x R,
2 2
Se arat c parametri m i 2 sunt media (sperana matematic), respectiv dispersia (variana) variabilei aleatoare
X N ( m, ) .
Repartiia 2 (hi-ptrat) cu n grade de libertate Variabila aleatoare X urmeaz legea de repartiie hi-ptrat
cu n grade de libertate (se mai scrie i X H (n) ) dac densitatea ei de repartiie este:
n
1 1 x
f ( x) n
x 2
exp( ),
n 2 x>0, n N *
( )2 2
2
n
Dac variabilele aleatoare X i N (0,1), i=1,2,...,n sunt independente, atunci variabila aleatoare Y X
i 1
i
2
n1
n1 2 n21 1
x n n
1 2
n n
f ( x) 2
2
, x>0, n1 , n 2 N
*
1 1 x
n n n2
1 , 2
2 2
Dac variabilele aleatoare X 1 H ( n1 ) i X 2 H ( n2 ) sunt independente, atunci variabila aleatoare
X1
n
X 1 F (n1 , n2 ) .
X2
n2
8
CAPITOLUL II
REGRESIA SIMPL
Studiem, pentru nceput, cel mai simplu model econometric: o variabil endogen reprezint evoluia
fenomenului considerat i aceast evoluie este explicat printr-o singur variabil exogen.
n cadrul capitolului este prezentat metoda de estimare a parametrilor care intervin ntr-un model
econometric, se vor examina proprietile estimatorilor obinui i se vor generaliza rezultatele analizei pentru modele
mai complexe. ntr-o prima parte se va trata obinerea estimatorilor parametrilor modelului i proprietilor lor, iar ntr-o
a doua parte se d o interpretarea geometric a metodei utilizate, determinarea intervalelor de ncredere referitoare la
parametri i previziunea care poate fi fcut cu un astfel de model.
Considerm modelul:
(1) yt axt b t , t=1, 2, ...,T
n care: Y reprezint o variabil endogen;
X o variabil exogen;
o variabil aleatoare ale crei caracteristici vor fi precizate prin ipoteze.
Se dispune de T observaii asupra lui Y i X, adic T cupluri (xt, yt) care sunt realizri ale lui X i Y. a i b sunt
parametri reali necunoscui pe care dorim s-i estimm cu ajutorul observaiilor (xt, yt) cunoscute.
Ipoteze fundamentale
Pentru a putea obine rezultatele enunate la nceput, vom simplifica lucrurile impunnd o serie de ipoteze
restrictive asupra modelului. Ulterior, n alte capitole, se vor relaxa aceste restricii, discutnd implicaiile abandonrii
unora din aceste ipoteze asupra calitii estimatorilor.
I1:
xt i yt sunt mrimi numerice observate fr eroare;
X variabila explicativ se consider dat autonom n model;
Y variabila endogen este o variabil aleatoare, prin intermediul lui .
I2:
a)- urmeaz o lege de distribuie independent de timp, adic media i dispersia lui nu depind de t:
E t 0, t 1,2,..., T ,
9
c)- Independena erorilor (se va vedea pe parcurs c variabila aleatoare reprezint erori sau reziduuri).
Dou erori relative la dou observaii diferite t i t sunt independente ntre ele, nsemnnd c au covariana nul:
d)- Normalitatea erorilor. Presupunem c urmeaz o lege de repartiie normal , cu media 0 i dispersia ,
2
1 T
xt T x0 (media empiric).
T t 1
1 T
T t 1
2
xt x T s 2 (variana empiric).
Aceast ipotez va fi folosit pentru a preciza proprietile asimptotice ale estimatorilor parametrilor a i b.
Ipotezele I1, I2, I3 pot prea foarte restrictive. Vom vedea ulterior ce consecine are abandonarea unora dintre
ele asupra proprietilor estimatorilor lui a i b.
2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate
Determinarea estimatorilor parametrilor a i b (notai cu a i b ) prin metoda celor mai mici ptrate
(MCMMP) se face punnd condiia ca suma ptratelor erorilor s fie minim, adic:
T T
yt axt b a, b .
2 2
t
t 1 t 1
1. condiii necesare: 0, 0.
a b
2 2
2 ab 0 .
0 , a
2
2. condiii suficiente:
a 2
2
2
ba b 2
Calculm derivatele pariale ale funciei a, b .
T
2 yt axt b xt 0
a t 1
T
2 yt axt b 1 0
b t 1
2 T
2 xt2 0
a 2
t 1
10
2
2T
b 2
2 2 T
2 x t .
ab ba t 1
T T T
xt yt a xt b xt 0
2
1 tT1 T t1 t1 ,
y a x Tb 0
t 1
t t1 t
iar condiiile suficiente (de ordinul II) sunt verificate.
Ecuaiile condiii de ordinul I (numite ecuaii normale, vezi justificarea geometric din partea a II-a), le
mprim la T, rezultnd:
1 T 1 T 2
xt y t a xt b x 0
T t 1 T t 1 .
y ax b 0
1
a T
xt yt y x
x y T y x y y x x .
t t t t
1
x Tx x x
2 2
xt x
2 2 2
t t
T
Am obinut estimatorii a i b ai parametrilor a i b dai de relaiile:
yt y xt x
a ,
2 xt x 2
b y a x
Observaie:
a este o variabil aleatoare pentru c e funcie de yt, iar b este aleator pentru c e funcie de a .
mai nti expresiile (2) pentru a le exprima n funcie de parametrii a i b. Vom considera modelul (1) yt axt b t
, t=1, 2, ...,T, nsumm dup toi t i mprim la T. Rezult:
11
1 1 1
T
yt a xt b t , adic
T T
2 y ax b .
yt y a xt x t
a x x x x a x x x
2
t t t t t t x
a
x x x x
2 2
t t
a
x x x x a x x
t t t t t
x x x x
2 2
t t
(deoarece (x t x) ( xt x ) 0 ).
Din expresia lui b , avem c b y a x , adic y a x b , iar din (2) y ax b , astfel c prin
a a
t xt x
x 2
t x
b b a a x .
xt x
wt , astfel c a a t wt
x 2
t x
Rezult:
E a E a wt E t a , pentru c E(a)=a i E(t)=0.
E b E b E xE a a
Avem c: E(b)=b, 1 1
E E t E t 0 i E a a E a E a a a 0 , deci
T T
E b b .
Var a E a a E wt t E wt2 t2 2 wt wt ' t t '
2 2
t t '
2
wt E t 2 wt wt ' E t t '
2
t t '
12
Conform ipotezelor fundamentale,
E t2 2 i E t t ' 0 , pentru t t ' , rezultnd:
Var a wt w
2 2 2 2
t ,
2
xt x 1
dar w
2 .
t
xt x 2
x t x 2
2
Var a
x 2 .
t x
2
Conform ipotezei I3,
1
T
t
x x
2
T
s 2
i
avem c
Var a 2 T 0 .
Ts
P
Am obinut c a T a ( a este convergent n probabilitate ctre a).
Var b E b b 2
E a a x 2
E 2 x a a a a x
2 2 2
E 2
2 xE a a x 2
E a a
2
2
1 1
E E t E 2 t 2 t t '
2 2
T T t t '
T 2 2
T
1 2
T t t '
T
1
2 E t2 2 E t t ' 2 Var t 2
T T
(deoarece E t t ' 0 ).
1
1 2
E a a E t wt t E wt t wt t t '
T T t t '
2
1 1 1
wt E t2 wt E t t ' wtVar t wt
T T t t ' T T
xt x
x
T T
1
w
x 0,
x x
dar t 2 2 t
t 1 t 1
t x t x
adic E a a 0 .
Folosind aceste rezultate pariale, se obine:
2
2 2 2
Var b x E a a x Var a
2 2 2 x 2
x 2
T T T t x
1 x
2
Var (b) 2
T ( xt x) 2
13
1 1
1
0 i 0 rezult c Var b 0 , adic P
x
Cum ns 2
Ts 2 T T b T b ( b
T T t x
cov a , b E a E a ) b E (b E a a b b
E a a x a a E a a x a a
2
.
E a a xE a a xVar a
2 x 2
x 2
t x
2 x 2
Var a cov a , b xt x
2
xt x
2
a ,b
cov b
, a Var b
x 2 1
2
x
2
xt x
2
T xt x 2
1 x
2
xt x 2
t 2
x x
2
x 1 x
xt x
2
T x x
t 2
Se remarc faptul c a ,b conine pe , adic variana lui t care este necunoscut. Se pune deci
2
problema de a obine o estimaie pentru a ,b , adic o estimaie pentru Var ( t ) . Notm aceast estimaie cu
2
2 .
t t a a xt a a x t a a xt x .
iar prin ridicare la ptrat:
t2 t 2
2 a a xt x t a a xt x .
2
2
14
nsumm dup t=1,2,...,T i mprim la T:
1
T
1
t2 T t 2
2 a a
1
T
2 1
xt x t a a T xt x 2
.
Dar: a a
x x , i
t t
x x
2
t
x t
x t t xt x xt x t xt x xt x a a xt x 2
pentru c xt x 0 .
nlocuind, rezult:
1
T
1
t2 t
T
2
a a
2 1
T
2
xt x .
Notm cu
2 1
T
t 2
dispersia erorilor fa de media lor i cum ea este o variabil aleatoare, i
calculm media E 2 :
1 2
1
T
2
1
E 2 E t E t2 2 t E t2
T T
2
1
2
1
1
E t2 E 2 E t 2 E 2 t2 2 t t '
T
2
T T t t '
2
1 2 1
2 2 E t2 2 E t t ' 2 2 1
T T t t ' T T
Aplicnd acum operatorul de medie n relaia:
1
T
1
t2 t
T
2
a a
2 1
T
2
xt x ,
i innd cont de expresia varianei estimatorului a , rezult:
1
2
1 1 2
E t2 E 2 Var a xt x 2 1 2 1 .
2
T T T T T
1 1
Relaia gsit se poate scrie i astfel: E
2
T 2
t2 , aa c, notnd 2
T 2
t2 , am obinut:
2 este T-2. (T-2) constituie numrul gradelor de libertate. Vom reveni ulterior asupra acestei probleme.
n concluzie, pentru modelul liniar al regresiei simple, avem estimatorii:
a
y y x x
t t
x x
2
t
b y a x
1
2
T 2
t2
15
Estimatorul permite s dm o estimaie a varianelor i covarianei parametrilor din model, deci o
2
Var a
cov a , b , unde:
a ,b
cov a , b
Var b
2
Var a
x 2 ,
t x
1
2
x
Var b 2 ,
2
T xt x
cov a , b x Var a .
minimal, cu ajutorul unei reprezentri grafice. Aceast condiie va consta n egalitatea cu zero a dou produse scalare
care redau ecuaiile normale.
Modelul yt axt b t se scrie sub form matriceal astfel: Y aX bU ,
y1 x1 1 1
y2 x2 1 2
. . .
.
unde: Y , X , U . , .
. . .
. . . .
y x 1
T T T
n spaiul ortonormat T considerm vectorii Y, X, U i .
B
Y X
Y H
U C
O
(L)
16
Vectorul 0H=aX+bU aparine planului (L) determinat de vectorii X i U. Fie 0A=Y, 0B=X, 0C=U, HA=.
2 2
Cantitatea t
2
HA este minimal dac HA este ortogonal pe (L), adic pe X i U. Aceast condiie se
HA 0B 0
traduce prin egalitatea cu zero a produsului scalar al vectorilor respectivi:
, sau
HA 0C 0
Y aX bU , X 0 xt yt a xt2 b xt 0
, adic .
Y aX bU ,U 0 yt a xt Tb 0
Am regsit, deci, sistemul de ecuaii normale.
Notm Y proiecia pe planul (L) a vectorului Y i cu vectorul HA ortogonal la planul (L).
A efectua o regresie a variabilei Y asupra variabilei X n modelul yt axt b t revine, deci, la a proiecta
Observaie:
Considerm modelul yt b t . O reprezentare analog celei dinainte este:
0
U H
n scriere matricial, modelul este Y bU , iar conform cu reprezentarea grafic, avem relaia
OA=OH+HA.
1
Y bU ,U 0 sau y t T b 0 , b
T
y t y i 0 H b U y U Y . Msura algebric a
proieciei vectorului Y pe suportul vectorului U este y . Vom utiliza aceast observaie pentru a exprima ecuaia
varianei.
Ecuaia varianei
17
Relum reprezentarea geometric precedent i notm cu K proiecia lui A pe suportul vectorului U:
B
X
Y
Y H
U C
O
(L) Y K
1 1
tim c y t axt b i
T
y t a xt b , adic: y a x b . Dar i y a x b , rezultnd c
T
y y
.
2 yt y
2 2
y t y t
2
Aceasta este ecuaia varianei. Vom reveni asupra ei cnd vom aborda regresia multipl.
y y x x
t t
.
y y x x
2 2
t t
cov X , Y
n general, XY , unde X i Y sunt abaterile standard (radicalul dispersiei) ale
X Y
variabilelor X i Y.
x x
2
t
18
y y x x x x x x
2 2
a t
t t t
. Am obinut o expresie a coeficientului de
x x y y x y y
2 2 2 2
t t t x t
.
y 2
t y
Un calcul imediat arat c:
y y ax a x
2
a 2 xt x
2 2 2 2
t y t y t b a x b t x .
y yt y
2 2
n acelai timp, ecuaia varianei conduce la: t y t
2
, de unde:
y y y
2 2
y 2 2
2
t
t t
1
t
.
y y y y y
2 2 2
t t t y
KH
H , avem cos
Pe de alt parte, utiliznd figura geometric i notnd cu unghiul AK ,
AK
KH
2
y y 2
cos 1
2 2 t
2
y
cos 2
t
, adic 2 .
y y
2 2
AK t
t y
n mod necesar, 0 2 1 i 1 1 .
Cnd 0 , nu exist o relaie de tip liniar yt axt b ntre yt i xt, adic a=0.
Cnd 2 1 , yt este legat de xt printr-o relaie de forma yt axt b . 1 implic a>0, iar
1 implic a<0.
Cnd relaia dintre yt i xt nu este strict, adic y t axt b , atunci este apropiat de 1, semnul lui
1 1 2
f t exp t2 , t 1,2,..., T .
2 2
Cum t i t sunt independente pentru t t ' , densitatea de probabilitate a vectorului aleator ( 1, 2, ..., T) va
fi egal cu produsul densitilor de probabilitate relative la fiecare t.
19
1 t
T
1 2
1 f 1 , 2 ,..., t
exp 2
2 2
Dar, t y t axt b i
yt axt b yt y t t ).
Evalum suma ptratelor erorilor:
y ax b a a x b b
2 2
2
t t t t t
a a x b b 2 a a x 2 b b 2 a a b b x
2 2
2 2
t t t
t t t
t2 a a xt b b
2
2 a a xt b b
t
2
( 2t a a xt 0 , 2t b b 0 pentru c aa cum arat reprezentarea grafic, vectorul este ortogonal la
planul (L), prin urmare este perpendicular pe orice vector din acel plan, deci i pe X i U. Produsele scalare cu aceti
vectori vor fi nule, adic: , X 0 i ,U 0 ).
ntr-o scriere matricial:
a xt2
a a x b b
'
2 a T x a a
b T x T b b
t
b
( lasm studenilor plcerea de a verifica !).
nlocuind n (1) fiecare t prin expresiile calculate mai sus, deducem densitatea de probabilitate a vectorului aleator
(y1,y2,...,yT):
1 y t axt b
T
1 2
y1 , y 2 ,..., yt
exp
2 2
2
1 t2
T
1
1 a a 1 xt
' 2
T x a a
exp
2
exp
2 2
2 b b 2 T x
T b b
innd cont de matricea de varian i covarian a estimatorilor, a ,b , se arat uor c:
xt2
T
T x
1
2
Tx T
a1,b i y1 , y 2 ,..., yt
1
2
g t h a , b unde g t este densitatea de
1
1. Deoarece
2
t2 , adic t
2
T 2 2 , variabila aleatoare definit de raportul
T 2
2 1
T 2 2 2 t2 urmeaz o repartiie 2 (hi-ptrat) cu (T-2) grade de libertate. (Vectorul
20
admite T-2 componente independente nenule distribuite dup T-2 legi normale independente,
cu media zero i abatere standard )
2 a2
2. Folosind relaile de calcul stabilite anterior, rezult c
2 a2
(am utilizat aici notaiile a Var ( a ) i a Va r ( a ) pentru variana estimatorului a , respectiv pentru
2 2
T 2 a2
2
estimaia acesteia). Atunci variabila aleatoare definit de raportul urmeaz tot o repartiie 2 cu (T-
a
2) grade de libertate.
3.
, b urmeaz o repartiie normal bidimensional, astfel c variabilele aleatoare definite
Cuplul a
a a
mai jos au repartiiile urmtoare: N 0,1 ;
a
a a
S T 2 (repartiia Student cu (T-2) grade de libertate);
a
b b
N 0,1 ;
b
b b
S T 2 .
b
1 a
'
a a 1 a
4. Expresia F este variabil aleatoare repartizat Fisher-
2 b b a ,b b b
Snedecor, cu 2 i (T-2) grade de libertate.
Pentru c exist tabele cu valorile legilor de probabilitate anterioare, putem determina intervale de ncredere
pentru parametrii a i b la un nivel de semnificaie fixat.
a a
Prob t 1
a
t este luat din tabela distribuiei Student cu (T-2) grade de libertate. Un calcul simplu conduce la intervalul
de ncredere pentru parametrul a, de forma:
a t a a a t a
ceea ce permite afirmaia c adevrata valoare a parametrului real a , se gsete n intervalul de valori
a t a ; a t a cu probabilitatea 1-.
Cnd se dorete testarea unei valori a0 a parametrului a, este suficient, pentru a accepta aceast valoare cu
riscul , s ne asigurm c:
21
a a0
t .
a
B
w
A A
Proieciile acestei elipse pe axe determin, de asemenea, dou intervale de ncredere pentru a i b, centrate n
a i b . Dar, este important de remarcat c, nivelul de semnificaie referitor la aceste intervale nu mai este nivelul
asociat elipsei.
Dac se dorete testarea simultan a dou valori a0, b0 alese apriori, este suficient s nlocuim a i b n expresia
F prin a0 i b0.
Dac F a0 , b0 F ,2, T 2 se accept valorile, altfel ele vor fi respinse. Altfel spus, pentru a accepta
cuplul (a0, b0) la nivelul de semnificaie este suficient ca punctul M0(a0,b0) s aparin elipsei de ncredere asociat
cuplului (a, b).
Observaii:
, b , legea de probabilitate condiionat a lui yt (dat de factorul g) nu depinde dect de
realizare a cuplului a
, b sunt estimatori exhaustivi
valorile adevrate (dar necunoscute) ale parametrilor a i b. Se zice c a
pentru a i b, adic ei rezum toat informaia pe care eantionul o poate aduce despre a i b.
2. Cnd ipoteza de normalitate asupra erorilor t este realizat, funcia de verosimilitate relativ la eantionul
y1 , y 2 ,..., yT este chiar funcia y1 , y 2 ,..., yT . Pentru obinerea de estimatori ai lui a i b prin
22
metoda verosimilitii maxime, este suficient s maximizm expresia y1 , y 2 ,..., yT , adic s
minimizm y t
axt b . Estimatorii a , b obinui cu metoda celor mai mici ptrate coincid, deci,
2
yP a x b ,
iar realizarea efectiv a lui Y este:
y ax b .
yP y a a x b b .
Se remarc imediat c E e P 0 , iar variana erorii de previziune este:
Var e P E yP y x2 E a a E b b E 2
2 2 2
2 x E a a b b 2 x E a a 2 E b b
Ultimii doi termeni sunt nuli (s-a demonstrat anterior!) ( i a , ca i i b sunt necorelai).
Deci:
Var eP x2Var a Var b Var 2 x cov a , b .
Notm variana erorii de previziune cu 2 Var e P i folosind relaiile de calcul anterioare, rezult:
2 Tx
2
2 2 x x 2
x
2 2
1 2
xt x
2
xt x
T 2
xt x 2
1
2 1
x x
2
T xt x 2
2 este necunoscut, dar estimat prin 2 i variana estimat a erorii de previziune este:
1
1
2
2 x x
2
T xt x 2
Aceast varian poate fi redus, pe de o parte prin creterea numrului de observaii (T), iar pe de alt parte,
23
yP y
N 0,1 .
yP y 2 2
urmeaz o lege Student cu T-2 grade de libertate pentru c T 2 T 2 .
2 2
n planul (x,y) trasm dreapta de ajustare y a x b . Fie
P x , yP punctul situat pe dreapta de ajustare.
Putem construi, avnd P ca centru i paralel cu axa 0y un interval de ncredere M1M2 la nivelul de semnificaie .
yP y
P t 1 .
2
t fiind luat din tabela distribuiei Student. Pentru T dat, ca funcie de
2
x x 2
este minim pentru
x x . Punctele M1 i M2 sunt deci situate, cnd variaz, pe dou arce de curb (vezi figura), care determin astfel
y
M2 y ax b
P
M1
Observaii
t2
1. O variabil aleatoare t este distribuit dup o lege Student cu T-2 grade de libertate dac expresia
T 2
este raportul dintre o variabil aleatoare distribuit 2 cu 1 grad de libertate i o alta distribuit 2 cu (T-2) grade de
a a
libertate. Fie t . Atunci:
a
a a 2
t2
a a 2 a2
2 cu un grad de libertate
.
T 2 T 2 a2
T 2 a2 2 cu (T - 2) grade de libertate
2
a
24
2. O variabil aleatoare F este distribuit dup o lege Fisher-Snedecor cu n1 i n2 grade de libertate dac
n1 F
expresia este raportul dintre o variabil aleatoare distribuit 2 cu n1 grade de libertate i o alta distribuit
n2
2 cu n2 grade de libertate.
1 a a 1 a a
Fie F ' .
2 b b a ,b b b
Atunci:
a a xt2 T x a a
,
b b
2F b b T x T
T 2 T 2
2
a a xt2 T x a a
,
b b T x T b b
2 2 cu doua grade de libertate
2
2 cu (T - 2) grade de libertate
T 2 2
, b urmeaz o lege normal bidimensional.
pentru c a
3. Jacobianul transformrii permite exprimarea densitii de probailitate a vectorului aleator
y1 , y 2 ,..., yT pornind de la cea a lui 1 , 2 ,..., T . Cnd f 1 , 2 ,..., T este cunoscut, pentru a obine
1 1 1
...
y1 y 2 yT 1 0 ... 0
2 2 2
D ... 0 1 ... 0
J y y 2 yT 1
D y 1 ... ... ... ...
... ... ... ...
T T T 0 0 ... 1
...
y1 y 2 yT
y1 , y2 ,..., yT f 1 y1 , 2 y2 ,..., T yT . J
liniar de t . Deci:
a a N 0,1
a
a a 2 este distribuit 2 cu 1 grad de libertate pentru c este ptratul unei variabile aleatoare N(0,1).
a2
25
b b N 0,1
b
b b 2
2 1
b2
Deoarece t
2
t 2
a a
2
x t 2
x , prin mprirea la , obinem:
2
2
a a 2
x
2
t t 2
t x
2
2
2
2 2
2
T
2 (2T ) (21) (2T 1)
t t
2 2
a a 2 a a 2 2
x x
2
Var a
t 1
2
Rezult c:
Pentru a studia cum variaz cheltuielile de ntreinere i reparaii ale unui utilaj agricol n funcie de vrsta
utilajului, s-au cules urmtoarele date:
Vrsta utilajului (xt) 15 8 36 41 16 8 21 21
n luni-
Cheltuieli anuale de ntreinere i reparaii (yt) 48 43 77 89 50 40 56 62
n RON-
Vrsta utilajului (xt) 53 10 32 17 58 6 20
n luni-
Cheltuieli anuale de ntreinere i reparaii (yt) 100 47 71 58 102 35 60
n RON-
Rezolvare:
Cutm s estimm parametrii unei regresii liniare nte variabilele X i Y, de forma yt axt b t ,
presupunnd c sunt ndeplinite ipotezele fundamentale I1,I2,I3.
1. Pentru a calcula estimatorii, se folosesc relaiile de calcul stabilite anterior (n cadrul seminarului se vor
prezenta facilitile de calcul oferite de diferite pachete de programe dedicate). Elementele necesare calculului sunt date
n tabelul ce urmeaz:
26
27
Pe baza elementelor din tabelul de calcul, se determin:
T T
1 1 1 1
- x
T
xt
t 1 15
362 24,133 y
T
y
t 1
t
15
938 62,533
- a
y y x x x y Tx. y 27437 15(24,133)(62,533) 1,28
t t t t
x x
-
x Tx
t
12490 15(24,133)
2 2
t
2 2
y y x x t t
27437 15( 24,133)(62,533)
0,9894
y y x x 6269.733 3753,733
2 2
t t
Valoarea apropiat de 1 a coeficientului de corelaie arat c ntre cele dou variabile studiate exist o
corelaie liniar.
Observaie: Am vzut c:
2
a 2 xt x 2
(ax t ax ) 2
( y t y ) 2
y (y y) 2 (y y)2
2
t y t t
Ptratul coeficientului de corelaie liniar este raportul dintre variabilitatea explicat prin model i
variabilitatea total.
- ecuaia de analiz a varianei:
variabilitatea total = variabilitatea explicat + variabilitatea rezidual
y y
2 2
t y t y t
2
2 10,15
Var a 0,0027; a 0,0027 0,052
x 2
x 3753,733
t
1 2
Var b 2
x
10,15
1 (24,133) 2
15 3753,733 2,25
2
T xt x
b 2,25 1,5
28
Variabilele aleatoare
a a
i
b b urmeaz fiecare o repartiie Student cu (T-2) grade de libertate.
a b
Alegnd un nivel de semnificaie =0,05, putem extrage din tabelele repartiiei (astfel de tabele se gsesc n
majoritatea crilor de econometrie, sau de statistic matematic) valoarea t tab corespunztoare numrului de
grade de libertate i nivelului de semnificaie ales. n cazul nostru, pentru T-2=13 grade de libertate i
=5%, gsim ttab=2,16. Intervalele de ncredere vor fi:
a a t a ; a t a [1,28-(2,16)(0,052) ; 1,28+(2,16)(0,052)]=
= [1,17 ; 1,39]
b b t b ; b t b [31,67 (2,16)(1,5) ; 31,67+(2,16)(1,5)]=
=[28,43 ; 34,91]
Prin urmare, putem afirma c valorile parametrilor reali a i b se gsesc n aceste intervale cu o
probabilitate de 95%.
Stabilim acum un interval de ncredere pentru estimatorul varianei erorilor. Am vzut c variabila aleatoare
2 1
T 2 2
2 t
2 urmeaz o lege de repartiie hi-ptrat cu (T-2) grade de libertate. n tabelele
legii hi-ptrat vom gsi, pentru un nivel de semnificaie dat, dou valori: v1 avnd probabilitatea (1-/2)
de a fi depit, respectiv v2 avnd probabilitatea (/2) de a fi depit, astfel c
2
Pr ob v1 (T 2) 2 v 2 1
Se obine astfel intervalul de ncredere:
(T 2) 2 (T 2) 2
2 ;
v2 v1
pentru =0,05 i 13 grade de libertate extragem din tabel v1=5,01 i v2=24,7 rezultnd intervalul:
29
a 0
t tab . Este exact acelai lucru cu a spune c 0 s aparin intervalului de ncredere determinat
a
pentru a. Cum 0 [1,17 ; 1,39], acceptm ipoteza H :(a 0). La fel stau lucrurile i pentru b. Prin
1
urmare, a i b sunt semnificativ diferii de zero la pragul de semnificaie de 5%. Se spune c variabila
explicativ (exogen) X (vrsta utilajului) este contributiv.
- ne propunem acum s determinm o previziune a cheltuielilor de ntreinere i reparaii pentru un utilaj
p
de 4 ani (48 de luni). Notm cu y cheltuielile de ntreinere i reparaii pentru un utilaj cu vrsta x .
1
2 2 1
x x
2
1 (48 24,133) 2
10,15 15 3753,733 12,366
1
T xt x
2
2 12,366 3,5164
yP y
Deoarece variabila aleatoare este distribuit Student cu (T-2) grade de libertate, putem
determina un interval de ncredere pentru valoarea previzionat:
; yp t 93,11 ( 2,16)(3,5164);93,11 ( 2,16)(3,51840 85,56;100,66
y yp t
2 2
Cu o probabilitate de 95%, valoarea adevrat a cheltuielilor de ntreinere i reparaii pentru un utilaj de 48
de luni se va afla n intervalul determinat.
30
CAPITOLUL III
REGRESIA MULTIPL
De multe ori, studiul unui fenomen economic necesit introducerea mai multor variabile
explicative. O variabil endogen se exprim, deci, n funcie de mai multe variabile exogene. Metodele de
regresie utilizate sunt n acest caz generalizri ale celor din capitolul anterior.
y1 1
y2 x11 x 21 ... x p1 a1 2
. x12 x 22 ... x p2 a
2 .
Y , X , a ,
. ... ... ... ... ...
.
. .
x1T x 2T ... x pT ap
y
T T
ecuaia (1) se scrie sub form matriceal:
(2) Y Xa .
Ipoteze fundamentale
Ipotezele I1, I2 din capitolul II rmn valabile: ceea ce era adevrat pentru xt este acum valabil
pentru xit, i=1,2,...,p.
Ipoteza I3 referitoare la variabilele exogene se modific astfel:
a. absena coliniaritii variabilelor exogene:
Nu exist nici o mulime de p numere reale i , i=1,2,...,p astfel nct
x
i 1
i it 0 , t=1, 2, ...,T.
31
Matricea X de format (Txp) are n acest caz rangul p (T>p) i matricea (XX), unde
X este transpusa lui X, este nesingular, deci exist inversa ei (XX)-1.
1
b. Atunci cnd T , matricea X ' X tinde ctre o matrice finit, nesingular.
T
Pentru a scrie ecuaiile normale utilizm interpretarea geometric dat n capitolul II. Ne
T
propunem s minimizm expresia U t2 .
t 1
Xp
Y
X2
Y H
O X1
(L)
a1
a2
Vectorul Xa X 1 , X 2 ,..., X p aparine subspaiului (L) generat de vectorii X1, X2,...,Xp.
...
a
p
(L). Aceast condiie se traduce prin egalitatea cu zero a produselor scalare dintre vectorul Y Xa i
orice vector din subspaul (L),deci i X1,X2,...,Xp:
32
Y a1 X 1 a2 X 2 ... a p X p , X 1 0
Y a1 X 1 a2 X 2 ... a p X p , X 2 0
...............
Y a1 X 1 a2 X 2 ... a p X p , X p 0
Efectund produsele scalare, rezult sistemul de ecuaii:
Sau, cu notaiile
matriciale introduse:
XY=(XX)a , de unde rezult:
covarian a .
a. transformm expresia (3) nlocuind Y prin expresia lui n funcie de X:
a X ' X X 'Y X ' X X ' Xa
1 1
(4)
X'X X ' X a X ' X 1 X ' aX'X
1 1
X '
Aplicnd operatorul de medie expresiei (4), rezult:
E a a X ' X X ' E .
1
33
Se poate arta c dac ipoteza a) din I 3 rmne valabil cnd T , atunci a este estimator
convergent ctre a.
Propoziie. Estimatorul a X ' X X ' Y este cel mai bun estimator liniar nedeplasat al lui a.
1
Pentru a arta aceast proprietate vom construi un estimator liniar pentru a care s aib variana
minim i el va fi identic cu cel obinut prin MCMMP. Fie a* un estimator liniar al lui a, adic a*=MY,
unde M este o matrice cu coeficieni constani de format (pxT). Estimatorul a* este nedeplasat dac:
Ea* MEY ME Xa a
adic
Ea* MX Ea ME MX a pentru c E 0 .
a* E a * a a * a '
Dar, a* MY M Xa MX a M a M , deci a * a M ,
a * a ' ' M ' i a* E M ' M ' ME ' M ' 2 MM ' . Pentru ca a* s fie de varian minim, trebuie
ca urma matricei (MM) s fie minim, sub restricia (MX)=I. Urma unei matrici este, prin definiie, suma
elementelor de pe diagonala principal. Notm Ur(X) urma matricei X. Ur este un operator liniar
(demonstrai!). Rezolvnd problema de extremum condiionat:
MinUr MM '
s.r.MX I
se obine soluia M X ' X X ' , adic a* MY X ' X X 'Y . Am gsit c a* a .
1 1
Variana reziduurilor fiind necunoscut, avem nevoie de un estimator al ei. Dac p este
2
34
1
2
Tp
t2
Avem c: Y Xa ;
Y Xa ;
Y Y Xa Xa ;
X a a .
I X X ' X X ' .
1
Notm: I X X ' X
1
X'.
este o matrice de format (TxT) cu proprietile = (simetric) i 2= (idempotent de grad
t
2
' ' ' ' ii i2 ij i j , unde ij este elementul matricii situat la
i i j
E E E .
t
2
ii i
2
ij i j
i i j
ns, E i j 0 conform I2 i E E
t
2
ii i
2
ii
2
2Ur .
i i
Artm c Ur T p .
Ur Ur I X X ' X
1
X ' Ur I Ur X X ' X 1
X'
Ur I T
Ur X X ' X
1
X ' Ur X ' X X ' X
1
p
(permutarea ntre X X ' X
1
i X ' este posibil datorit formatului acestor matrici i proprietilor
operatorului Ur.)
n final rezult:
E T p
t
2 2
, 2
1
Tp
1
E t2 E
T p
t2 , astfel c
1
2
Tp
t2 este estimator nedeplasat al lui 2 .
T este numrul de observaii, p este numrul de parametri de estimat i relaia gsit o
generalizeaz pe cea din capitolul II.
35
3.5. Teste i regiuni de ncredere
regresia simpl. Deoarece a a X ' X X ' , rezult c a este distribuit dup o lege normal n p
1
a i ai
(*) urmeaz o lege normal redus N(0,1);
ai
T p 2 t2
(**) este distribuit 2 (hi-ptrat) cu (T-p) grade de libertate.
2 2
a i ai
(***) urmeaz o lege Student cu (T-p) grade de libertate.
ai
Legea Student este utilizat n mod curent pentru a aprecia validitatea estimatorului unui
coeficient ai. De exemplu, dac se testeaz ipoteza (H0:ai=0) contra ipotezei (H1:ai 0), pentru a accepta
a i t
H1 trebuie ca t , unde este valoarea tabelat a variabilei t repartizat Student, cu T-p grade
ai 2 2
Observaie:
2 . Deci, dac a i
Pentru T>30 i =0,05, t 2 se accept H1, adic ipoteza c variabila
2 ai
a i ai0 t
particular ai , se calculeaz raportul t
0
i se compar cu .
ai 2
1 ,..., a
Considerm acum toi estimatorii a p :
36
La fel ca la regresia liniar simpl, rezultatele anterioare permit construirea de intervale de
ncredere relative la coeficienii ai, ca i a unui elipsoid de ncredere relativ la ansamblul coeficienilor n
a i ai
t t
2 ai 2
ai t a i ai ai t
2 2
a i ai t ai a i ai t
2 2
iar pentru ansamblul coeficienilor, ecuaia elipsoidului de
ncredere este: F=F(,p,T-p).
Aceleai principii conduc la determinarea de regiuni de ncredere relative la un numr oarecare de
coeficieni din model. Dac q este numrul coeficienilor reinui, n spaiul q , avem ecuaia
F1=F(,q,T-p), unde:
F1
1
a q aq ' a1q a q aq .
q
a q( 0 ) ), atunci dac:
1
q
1 a a ( 0 ) F , q, T p
a q a q( 0 ) ' aq q q
Observaie:
Se observ c valoarea tabelat F depinde de , q, T p i nu de , q, T q . Rezult c
qF 2q 2
expresia 2 face s apar la numitor T p 2 distribuit 2 cu (T-p) grade de libertate.
T p T p
37
Dac presupunem cunoscute la un moment valorile (x1, x2,..., xp) atunci previziunea variabilei
endogene va fi:
yp a1 x1 a 2 x 2 ... a p x p .
Eroarea de previziune va fi variabila aleatoare:
Y p Y a1 a1 x1 ... a p a p x p .
Se constat c media erorii de previziune este zero:
E Y p Y 0 ,
iar variana erorii de previziune este:
Var Y p Y E Y p Y 2
E a a x
p
i i
2 2
i
2 a i ai a j a j xi x j 2
i 1 i j
deoarece ai i sunt necorelate ( ai nu depind dect de t ), t=1,2,...,T i T<.
Deducem c:
2
E Y p Y xi2 Var a i 2 xi x j cov a i , a j 2 ,
i 1
p
i j
E Yp Y X ' a X 2 , adic:
2
Var Y p Y 2 X ' X ' X X 1 ,
1
unde: X x1 , x 2 ,..., x p .
'
Observaie:
Se arat c dac T este finit i t sunt normal distribuite, atunci a este distribuit normal n p
y y
2 2
t y t y t
2
y
2
t y t
2
R 2
1 .
y y y
2 2
t t y
38
dar tim c Y Xa i Y X a , rezultnd c: Y Y X X a , ceea ce arat c vectorul
rezidual este acelai i pentru valorile (Y,X) i pentru valorile centrate fa de medie Y Y , X X .
Cu alte cuvinte, dac efectum regresia pe ecuaia general, cu variabilele necentrate sau o efectum cu
variabilele centrate pe media lor, estimatorul a i vectorul rezidual sunt aceeai.
Observaie:
Cnd se centreaz valorile X i Y, vectorul a nu conine ultimul estimator a p . Constanta a p
dispare cnd se centreaz variabilele. Considerarea modelului fr constante, cu variabilele necentrate pe
media lor, poate conduce la valori ale lui R 2 care ies din intervalul (0,1).
R2
Y Y ' Y Y , dar Y Y X X a .
Y Y ' Y Y
a X X ' X X X X ' Y Y i coeficientul devine:
1
a ' X X ' Y Y
R 2
Y Y ' Y Y .
Coeficientul R 2 arat rolul jucat de toate variabilele exogene asupra evoluiei variabilei
endogene. El este cu att mai bun cu ct e mai apropiat de 1.
Dar, judecarea calitii unui model doar prin valoarea lui R 2 poate duce la erori grosiere. El
mascheaz uneori influena variabilelor exogene luate separat asupra variabilei endogene i nu poate s se
substituie studiului estimatorilor coeficienilor modelului. Ptratul coeficientului de corelaie multipl nu
ine cont nici de numrul de observaii (T) i nici de numrul variabilelor explicative (p). Ori, se poate
foarte bine ca, avnd aceleai observaii asupra variabilei endogene s considerm dou modele distincte, n
al doilea fcnd s apar un numr de variabile explicative noi. n aceast a doua regresie coeficientul de
corelaie multipl nu poate dect s creasc (pentru c variabilitatea explicat prin regresie crete).
O definire mai precis a lui R 2 , care ine cont de T i p este:
T 1
2
R 1
Tp
1 R2 .
2
R se numete coeficient de corelaie multipl corectat.
p 1
poate lua i valori negative, dac R
2 2
4. R .
T 1
39
Analiza varianei
Atunci cnd studiem rolul jucat de exogene asupra evoluiei endogenei, ne putem ntreba care este
partea de variabilitate explicat de una sau mai multe variabile exogene.
Relum modelul iniial:
(1) y t a1 x1t a 2 x 2 t ... a p x pt t , t=1, 2, ...,T
i considerm q variabile printre cele p, pe care le indexm de la 1 la q:
(2) y t a1 x1t a 2 x 2t ... a q x qt t .
Variabilitatea ne-explicat de cele q exogene n modelul (1) este variabilitatea rezidual asociat
modelului (2).
Fie:
y a1 x1t a 2 x 2 t ... a q x qt
2
2
t
t
y a1 x1t a 2 x 2t ... a p x pt
2 2
t
t
Variabilitatea explicat de cele (p-q) exogene din modelul (1) atunci cnd a1,...,aq sunt estimai cu
modelul (2) este atunci:
2
2 2
Xp
H Xq
p
O Hq
(L)
X1
40
corespunztoare acestei surse de libertate asociate
1. X: mulimea celor p exogene Y ' Y p p
p Y ' Y
p p
p
2. : mulimea reziduurilor ' Y ' Y Yp ' Yp T-p '
Tp
3. Y: variabil endogen Y 'Y T Y 'Y
T
4. (p-q) variabile exogene dintre cele p ' ' ' p-q '
pq
y1 x11 x 21 1
y2 x1 x
Y , X 1 2 , X 2 22 , 2
... ... ... ...
y x x
T 1T 2T T
adic: Y Xa , unde:
x11 x 21 1 a1
X ... ... ... , a a 2
x x 2T 1 a
1T 3
t yt x1t x2t
1 100 100 100
2 106 104 99
3 107 106 110
4 120 111 126
5 111 111 113
6 116 115 103
7 123 120 102
8 133 124 103
9 137 126 98
41
S observm c numrul de observaii (T=9) este mic, din raiuni de simplificare a calculelor.
Vom estima modelul, presupunnd c sunt ndeplinite ipotezele principale ale modelului liniar
general de regresie:
dac ts i E ( t ) , t.
2 2
- ipoteze structurale: dac numrul de variabile exogene veritabile este k, atunci p=k+1 este
numrul parametrilor de estimat. Trebuie ca rangul matricii X s fie egal cu p (p<T), iar matricea
Atunci, a X X
1
X Y este un estimator liniar nedeplasat i cu variana minimal (estimator BLUE).
Pentru a simplifica procedura de calcul vom centra variabilele modelului. Cu notaiile:
Z Y Y , U 1 X 1 X 1 , U 2 X 2 X 2 , ,
1 1 1 1
unde: Y
T t
yt , X 1
T
x
t
1t , X2
T t
x 2t , t ,
T t
modelul se scrie:
Z a1U 1 a 2U 2 , sau Z Ub , unde
y1 y
x11 X 1 x 21 X 2 1
y2 y a1
Z , U ... ... , b , ...
... x X a2
y y
1T 1 x 2T X 2
T
T
1 1 1 1
Deoarece Y
T
y t
t
9
1053 117 , X 1
T
x
t
1t
9
1017 113,
1 1
X2
T
x
t
2t
9
954 106 , valorile centrate ale variabilelor sunt:
t Z Y Y U1 X 1 X 1 U2 X 2 X 2
1 -17 -13 -6
2 -11 -9 -7
3 -10 -7 +4
4 +3 -2 +20
5 -6 -2 +7
6 -1 +2 -3
7 +6 +7 -4
8 +16 +11 -3
9 +20 +13 -8
42
1 a
Pentru a calcula estimatorul b U U U Z , avem nevoie de matricile:
1
a 2
u11 u 21
u ... u1T u12t u u 650 112
U U 11 ... ... 1t 2t
112
u 21 ... u 2T u1t u 2t u 2
648
u1T u 2T 2t
z1
u ... u1T u1t z t 872
U Z 11 ...
u 21 ... u 2T u 2t z t 72
zT
648 112
650 112
1
U U 1 408656 408656
112 648 112 650
408656 408656
648 112
a
b 1 U U U Z 408656
1 408656 872 1,3629
a 2 112 650 72 0,1244
408656 408656
Pentru a determina estimatorul celui de al treilea parametru, a3, utilizm relaia: Y a1 X 1 a 2 X 2 a 3 ,
de unde:
a 3 Y a1 X 1 a 2 X 2 117 1,3629.113 0,1244.106 50,1941
1
relaia:
2
Tp
t2 . Dar,
Y Y Y Y Y Y Z Z Z Ub , iar
872
t
2
Z Ub Z Ub Z Z bU Z . Avem c: U Z 72
872
Z Z z t2 1248 i bU Z 1,3629 0,1244 1179 ,5704
72
t
2
1248 1179,5704 68,4296
1 68,4296
2
Tp
t2
93
11,4049
43
Matricea de varian i covarian a vectorului b este: b U U
2 1
, iar o estimaie a ei se obine
nlocuind pe cu . Avem c:
2 2
648 112
0,0180 0,0031
2 U U 1
(11,4049) 408656 408656
b
112 650 0,0031 0,0181
408656 408656
Coeficientul de corelaie multipl R2, are valoarea:
var iabilitatea exp licata var iabilitatea reziduala
R2 1
var iabilitatea totala var iabilitatea totala
y y z 1248
2 2
Variabilitatea total = t t
44
CAPITOLUL IV
STUDIUL MODELULUI LINIAR CND IPOTEZELE CLASICE ASUPRA ERORILOR
NU MAI SUNT REALIZATE
care erorile t sunt corelate, matricea de varian i covarian a erorilor nu se mai reduce la I , iar
2
(pentru c E 0 ).
a MY MXa M a M
Matricea de varian i covarian a estimatorilor (innd cont c a a M ) este:
a E (a a) (a a) E M ( M ) E M M ME ( ) M M M
Punnd condiia ca a s fie minimal, sub restricia MX=I i rezolvnd aceast problem de extremum
a MY X 1 X 1
X 1Y
a X 1 X 1
Estimatorul a astfel obinut este un estimator liniar, nedeplasat i de dispersie minim. El a fost obinut
prin MCMMP generalizat. Se observ imediat c dac erorile sunt independente, adic I , atunci
2
n cazul n care erorile sunt corelate, determinarea estimatorului a necesit cunoaterea matricei
45
Corelarea erorilor t poate mbrca diverse forme. Cel mai frecvent se studiaz cazul cnd
(2) yt 1 a1 x1 t 1 a2 x 2 t 1 ... a p x p t 1 t 1
unde: z t yt yt 1
u it xit xi t 1 , i=1,2,...,p.
t t t 1
Deoarece, prin ipoteze, erorile t sunt independente, se poate aplica MCMMP obinuit ecuaiei
(4) care va conduce la estimatorul a a1 , a 2 ,..., a p nedeplasat i de minim dispersie.
Dar, cum parametrul nu este cunoscut, pentru estimarea parametrilor unei ecuaii de regresie
atunci cnd erorile sunt corelate (sub forma unui proces autoregresiv de ordinul I, t t 1 t ,
staionar, adic media E t i dispersia Var t sunt independente de timp, iar 1 ) se pot aplica
urmtoarele metode:
Metoda I:
1. Se aplic MCMMP obinuit ecuaiilor (1) fr a ine cont c erorile t sunt
t t 1 t , obinnd .
46
3. nlocuim cu n ecuaia (3) i aplicm MCMMP obinuit acestei ecuaii. Se
obine estimatorul a pentru parametrul a.
Evident, pentru eantioane mici, estimatorul a nu prezint garanii c are proprietile dorite.
Metoda II:
Ecuaia (3) de mai nainte se poate scrie i sub forma:
(5)
yt a1 x1t ... a p x pt yt 1 a1 x1 t 1 ... a p x p t 1 t
Se aplic MCMMP obinuit ecuaiilor (3) i (5) astfel:
1. Dm o valoare iniial lui , de exemplu 0=0 n ecuaia (3) i obinem o prim
estimaie a parametrilor a0 .
2.
nlocuim a 0 a1 , a 2 ,..., a p
0 0 0
n ecuaia (5) i efectund regresia, obinem o nou
valoare pentru , notat 1.
3. nlocuim cu 1 n ecuaia (3) i efectum o nou regresie, obinnd estimatorul
Se reine valoarea lui care d cea mai mic sum a ptratelor erorilor
t
t
2
, creia i corespund
estimatorii a1 , a 2 ,..., a
p ai parametrilor.
***
Exist i alte proceduri de estimare a parametrilor n cazul cnd erorile sunt corelate.
Atunci cnd ipotezele fundamentale ale modelului liniar al regresiei nu sunt ndeplinite
proprietile estimatorilor parametrilor sufer. Astfel, sub ipoteza I 2 referitoare la distribuia erorilor i la
independena lor, estimatorii obinui sunt nedeplasai i au variana minimal. Dac erorile sunt corelate,
estimatorii rmn, n general, nedeplasai, dar matricea de varian i covarian a acestora nu mai este
2 I . Pentru a ne asigura de independena erorilor trebuie s efectum teste. Este vorba despre testul lui
Durbin i Watson.
47
Modelul liniar general al regresiei:
y t a1 x1t a 2 x 2t ... a p x pt t
x1t
x2t
unde: a a1 , a 2 ,..., a p i xt .
...
x
pt
Se aplic MCMMP obinuit i se obine un estimator a a1 , a 2 ,..., a p , calculndu-se
t yt y t a a xt t .
Se consider variabila aleatoare, notat d , numit i statistica Durbin-Watson definit prin
ecuaia:
T
2
t t 1
d t 2
T .
t 1
t
2
Durbin i Watson au determinat densitatea de probabilitate a variabilei aleatoare d , notat f d
i au artat c oricare ar fi irul de exogene considerate, curbele reprezentative ale lui f d oscileaz ntre
dou curbe limit f di i f d . Aceste funcii depind de numrul de observaii (T), de numrul de
s
variabile exogene veritabile ce figureaz n model (m) i de irul erorilor t . Cele dou curbe limit
(reprezentate grafic n figur) sunt atinse pentru anumite iruri de exogene xt i sunt simetrice n raport cu
axa de abscis 2.
48
f d
d1 d2 2 d1 d2
Scopul este de a ti dac erorile modelului sunt autocorelate. Cel mai frecvent se caut testarea
La un nivel de semnificaie dat, Durbin i Watson au determinat dou valori, d1 i d2, n funcie
de numrul de observaii (T) i de numrul de exogene veritabile (m) corespunztoare fiecreia din curbele
limit.
Se calculeaz statistica d cu relaia dat i se observ c:
t t 1 t ;
n tabelul urmtor sunt date cteva valori uzuale pentru d1 i d2 n funcie de T i m, pentru nivelul
de semnificaie =0,05:
Tabela D-W
T m=1 m=2 m=3 m=4 m=5
49
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36 0,96 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
Observaii:
1. n loc s testm 0 contra 0 , se poate testa I 0: 0 , contra I1: 0 . Se obin
b. dac d 2 d d 2 sau d1' d d 2' , atunci exist ndoieli c erorile sunt corelate;
reziduurilor t y t y t :
50
t 1 2 3 4 5 6 7 8
y t 664,2 746,1 828,0 909,8 991,7 1073,6 1155,5 1237,3
t 9 10 11 12 13 14 15
y t 1319,2 1401,0 1482,9 1564,6 1646,6 1728,5 1810,4
t 1 2 3 4 5 6 7 8
t -1,93 -76,79 +84,79 +25,35 +35,49 +71,44 +38,30 -13,25
t 9 10 11 12 13 14 15
t -37,54 +25,25 -106,64 -237,01 -226,00 +205,42 +213,03
Ne propunem s cercetm o eventual autocorelare a erorilor.
Rezolvare:
Pentru a putea utiliza testul Durbin-Watson trebuie ca numrul de observaii T s fie suficient de
mare (n practic T>15), iar modelul s conin un termen constant.
T
t t 1
2
265867,35
tabel, la: d 1,156 .
229991,79
Durbin i Watson au artat c pentru un proces staionar (primele dou momente ale variabilei
aleatoare t independente de timp), valoarea calculat a statisticii d este cuprins ntre 0 i 4, cu absena
corelaiei n vecintatea lui 2. ntre aceste valori limit, tabela D-W furnizeaz, la pragul de seminificaie ,
diferite intervale de valori d corespunztoare prezenei autocorelaiei pozitive sau negative, absenei
autocorelaiei i situaiilor de indecizie, astfel:
n exemplul nostru, numrul de exogene veritabile n model este (m=1) i dispunem de T=15
observaii.
Tabela D-W furnizeaz valorile d1=1,08 i d2=1,36 la pragul de semnificaie =0,05.
51
II. n tabelul urmtor sunt date, pentru perioada 1985-2002:
volumul investiiilor n agricultur, yt;
produsul intern brut agricol, x1t;
indicele volumului importurilor pentru agricultur, x2t.
Anul Investiii n agricultur Produsul intern brut agricol Indicele volumului importurilor pentru agricultur
t yt x1t x2t
1985 85,2 563,8 90,6
1986 90,2 594,7 91,7
1987 96,6 635,7 92,9
1988 112,0 688,1 94,5
1989 124,5 753,0 97,2
1990 120,8 796,3 100,0
1991 131,5 868,5 104,2
1992 146,2 935,5 109,8
1993 140,8 982,4 116,3
1994 160,0 1063,4 121,3
1995 188,3 1171,1 125,3
1996 220,0 1306,6 133,1
1997 214,6 1412,9 147,7
1998 190,9 1528,8 161,2
1999 243,0 1702,2 170,5
2000 303,3 1899,5 181,5
2001 351,5 2127,6 195,4
2002 386,2 2368,5 217,4
Se cere:
1. Determinarea legturii dintre investiii, PIB i volumul importurilor;
2. Testarea autocorelaiei erorilor;
3. Dac exist autocorelaie, cum se pot nltura efectele acesteia?
Rezolvare:
- Studierea legturii dintre variabilele economice amintite se poate efectua cu
modelul de regresie multipl:
yt a bx1t cx2t t
Aplicarea MCMMP conduce la urmtoarea estimare a modelului:
52
(2) yt 1 a bx1(t 1) cx2(t 1) t 1
- nmulim (2) cu i efectum scderea (1)-(2):
Observaie:
Pentru a evita eliminarea primei valori din irul de observaii, prin trecerea la diferene, se pot
53
Coeficientul de corelaie multipl este acum R 2=0,88 iar statistica Durbin-Watson d 1,54 .
Testul de independen conduce acum la concluzia c erorile sunt independente, deoarece:
4-d2=2,47> d =1,54>d2=1,53
erorilor t i nu n mod obligatoriu ca t s urmeze o lege normal. Acest lucru nu este ns valabil pe
eantioane mici. Testarea ipotezelor i intervalele de ncredere nu mai au aceleai proprieti dac legea de
distribuie a erorilor nu este legea normal. Pentru a caracteriza deviaiile de la legea normal se utilizeaz
doi coeficieni:
a) coeficientul de asimetrie, calculat prin raportul:
3
1
2
unde: 3 este momentul centrat de ordinul 3. Dac 1 0 , atunci seria de date este deplasat spre
distribuia normal, n timp ce o valoare 3 0 caracterizeaz o distribuie mai aplatizat dect cea
normal.
Aceste deviaii afecteaz testele i intervalele de ncredere ale estimatorilor. Studiul teoretic al
acestor deviaii este complex. Pentru a obine teste i intervale de ncredere mai robuste, n practic se
procedeaz astfel:
1. Se efectueaz o regresie cu metodele uzuale i se determin o estimaie a reziduurilor
t .
2. Se examineaz cele T reziduuri estimate i se repereaz cele a cror valoare absolut
este foarte mare.
3. Se elimin din seria de date observaiile corespunzatoare acestor erori foarte mari sau
se corecteaz aceste observaii astfel ca s se ajung la valori ct mai normale ale
erorilor.
54
4. Se efectueaz o nou regresie pe eantionul corectat. Proprietile estimatorilor
obinui vor depinde de regula adoptat n etapa anterioar. De exemplu, se poate
adopta regula de a respinge sau corecta observaiile corespunztoare reziduurilor a
cror valoare absolut t este mai mare dect de trei ori media erorilor absolute.
n acest caz, estimatorii obinui sunt nc nedeplasai. Dar, momentele centrate de ordinul doi nemaifiind
constante se comite o eroare de calcul a ecartului-tip al estimatorilor. Se poate evalua deplasarea n
estimaia lui a . Aceast deplasare depinde de natura i importana heteroscedasticitii, adic de irul de
valori 2
t , xt . Deplasarea este nul dac sunt realizate relaiile urmtoare:
(1)
1
2t xt x 0 ;
T t
x x
1 2 1 2
(2)
2
t x 2
t x .
T t
t
T t
t
t
Aceste relaiile sunt realizate atunci cnd nu exist nicio legtur sistematic ntre 2t
i xt .
t2
suma ptratelor erorilor s fie minim, acetia pot fi determinai din condiia ca t 2 s fie minim.
t
1
expresia y 2 t axt b .
2
t t
n cazul n care 2 t
(dispersiile reziduurilor) variaz proporional cu valorile variabilei exogene,
yt axt b 2
2
y b
se poate pune condiia ca t xt2
t a s fie minim.
t xt xt
55
4.3.1. Experien de calcul
SPE1
n cazul n care erorile ar fi distribuite normal i homoscedastice, variabilele aleatoare ,
2
SPE 2
respectiv ar trebui s urmeze fiecare o distribuie hi-ptrat cu (T-d-k-p) grade de libertate, unde T
2
este numrul de observaii, d este numrul de observaii omise (n cazul nostru d=6), k este numrul de
observaii luat n fiecare regresie separat, iar p este numrul parametrilor de estimat. n exemplul nostru T-
1
SPE 2
d-k-p=10. n aceste condiii, variabila aleatoare
10 are o distribuie Fisher cu 10 i respectiv 10
1
SPE1
10
SPE2 250,695
grade de libertate (F10,10). Cu datele calculate, obinem 51,01 . Din tabelele
SPE1 49,14
distribuiei Fischer-Snedecor, la pragul de semnificaie =0,05 gasim Ftab=2,97. Deoarece
Fcalc=51,01>Ftab=2,97 se admite ipoteza de heteroscedasticitate a erorilor.
56
Dac presupunem acum c variana erorilor 2t
este proporional cu ptratul valorilor variabilei
exogene, adic 2t xt2 , fiind o constant nenul, atunci efectele heteroscedasticitii pot fi corectate
prin transformarea modelului. mprind fiecare termen al ecuaiei de regresie prin xt, rezult:
yt b
a t
xt xt xt
yt 1 t
sau z t a bu t t , unde: z t , ut i t .
xt xt xt
t 1 2
Se observ c Var t Var 2 t .
xt xt
Prin urmare, modelul transformat are erorile t homoscedastice, deoarece dispersia lor este
independent de timp. Efectund regresia pe modelul transformat, rezult:
zt ut T zu
b
t
2
u 2
T u
a z bu
Revenind n variabilele iniiale obinem:
yt 1 1 yt 1
x x T x
x
b t t t 2 t t 2 t
1 1 1
t x T x
t t
1 y 1 1
a t b
T t xt T t xt
Efectund calculele, rezult:
b 70,44 ; a 0,072 ; R 0,99 , adic:
2
y t 70,44
0,072 sau y t 0,072 xt 70,44 .
xt xt
S remarcm faptul c panta dreptei de regresie (dup corectarea heteroscedasticitii) este mai
mic dect cea obinut naintea corectrii.
57
Se tie c sub aceast ipotez fundamental estimatorii obinui au proprieti optimale
(nedeplasai, cu varian minimal). Cnd ipoteza nu mai este satisfcut aceste proprieti nu mai sunt
valabile. Cu ct coeficientul de corelaie liniar ( ) dintre t i xt este mai mare, cu att deplasarea
estimatorilor va fi mai mare. n astfel de cazuri este de preferat s se aleag un alt model econometric
pentru studierea legturii dintre variabile.
La fel trebuie procedat i atunci cnd se constat c variana erorilor nu este finit.
Atunci cnd variabilele care apar n model nu sunt variabile observate fr eroare, va exista o
corelaie ntre reziduuri i exogenele din model.
n acest caz, pentru a obine estimatori convergeni, s-a dezvoltat o metod de estimare special,
numit metoda variabilelor instrumentale, pe care o prezentm mai jos.
Fie modelul liniar general:
y t a1 x1t a 2 x 2t ... a p x pt t , t=1, 2, ...,T,
Acest lucru nseamn c E Z i 0 , i=1,2,...,p. Considerm modelul iniial Y=Xa+ scris sub
forma:
(1) Y a1 X 1 a 2 X 2 ... a p X p ,
x11 x 21 x p1
. .
.
unde X 1 . , X 2 . ,..., X p .
. . .
x pT
x1T x 2T
nmulim, succesiv, ecuaia (1) cu Z1, Z2, ...Zp i aplicm operatorul de medie E fiecrei ecuaii. Se
obine sistemul:
58
E Z1 Y a1 E Z1 X 1 ... a p E Z1 X p
E Z 2 Y a1 E Z 2 X 1 ... a p E Z 2 X p
(2)
....
E Z Y a E Z X ... a E Z X
p 1 p 1 p p p
exact soluiile sistemului de ecuaii (2), n care speranele matematice sunt nlocuite cu momentele empirice
corespunztoare:
1
E Zi Y zit yt , i=1,2,...,p
T t
E Zi X j
1
zit x jt , i,j=1,2,...,p
T t
Dac notm:
a Z ' X Z 'Y .
1
2.
MCMMP generalizat: a X ' 1 X X ' Y
1 1
59
Considerm o anchet pe bugetele de familie pentru a studia consumul dintr-un anumit produs.
Ancheta cuprinde un eantion de T familii. Facem urmtoarele notaii:
y1t: cheltuielile totale ale familiei t;
y2t: cheltuielile relative la produsul studiat;
Vt: veniturile familiei t;
i scriem ecuaiile:
(1) y1t Vt 1t
(2) y 2t aVt b 2t
Ne propunem s exprimm cheltuielile relative la produsul studiat n funcie de cheltuielile totale.
y 2 t ay1t b 2 t a 1t
sau, punnd t 2 t a 1t :
(3) y 2 t ay1t b t .
cheltuielile totale i veniturile familiei t. Rezult c VDt nu va fi corelat cu t . Utilizm venitul declarat ca
variabil instrumental.
Pentru simplificarea calculelor, centrm variabilele din model:
y 2t ay1t b t , t=1,2,...,T
1 1 1
y 2t a T t y1t b T t t
T t
y 2 a y1 b
(4) y 2 t y 2 a y1t y 1 t
Dac aplicm MCMMP ecuaiei (4), obinem estimatorul:
y 1t
y 1 y 2t y 2
(5). a
t
y 2
1t y1
t
instrumental centrat VDt VD . nmulind ecuaia (4) cu variabila instrumental centrat i aplicnd
60
E y 2t y 2 VDt VD aE y1t y 1 VDt VD E t VDt VD .
Dar, cum t i VDt nu sunt corelate, nseamn c E VD VD 0 , iar acum
t t
E y 2 t y 2 VDt VD aE y1t y1 VDt VD
1
T t
1
VDt VD y 2t y 2 a VDt VD y1t y 1 ,
T t
de unde:
VD VD y
t 2t y2
a t
VD VD y y
.
t 1t 1
t
instrumental VDt VD att la numrtor, ct i la numitor.
61
BIBLIOGRAFIE
62