Documente Academic
Documente Profesional
Documente Cultură
Econometrie Curs PDF
Econometrie Curs PDF
ECONOMETRIE
BUCURETI
-2011-
CUPRINS
Introducere
Capitolul I: Modele econometrice
1.1.
Generaliti
1.2.
Model aleator
1.3.
Natura variabilelor care apar n model
1.4.
Inducia statistic
1.5.
Identificarea modelului
1.6.
Previziunea variabilei endogene
1.7.
Vocabular uzual
Capitolul II: Regresia simpl
2.1. Modelul liniar al regresiei simple
2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate
2.3. Proprietile estimatorilor
2.3.1. Covariana estimatorilor
2.3.2. Determinarea unui estimator nedeplasat pentru variana erorilor
2.3.3. Interpretarea geometric a metodei celor mai mici ptrate
2.3.4. Coeficientul de corelaie liniar
2.3.5. Distribuia de probabilitate a estimatorilor
2.4. Teste i intervale de ncredere
2.5. Previziunea cu modelul liniar
2.6. Experien de calcul
Capitolul III: Regresia multipl
3.1. Modelul liniar al regresiei multiple
3.2. Determinarea estimatorilor parametrilor
3.3. Proprietile estimatorilor
3.4. Determinarea unui estimator nedeplasat pentru variana reziduurilor
3.5. Teste i regiuni de ncredere
3.6. Previziunea variabilei endogene
3.7. Coeficientul de corelaie multipl. Analiza varianei
3.8. Experien de calcul
Capitolul IV: Studiul modelului liniar cnd ipotezele clasice asupra erorilor nu mai
sunt realizate
4.1. Ipoteza de independen a erorilor
4.1.1. Testarea ipotezei de independen a erorilor
4.1.2. Experien de calcul
4.2. Ipoteza de normalitate a erorilor
4.3. Ipoteza de heteroscedasticitate
4.3.1. Experien de calcul
4.4. Ipoteza de independen a erorilor n raport cu variabilele exogene
4.5. Ipoteza referitoare la faptul c variabilele sunt observate fr eroare
4.5.1. Experien de calcul
Bibliografie
3
4
4
4
4
5
5
5
6
10
10
11
12
15
16
18
21
22
24
25
29
34
34
35
36
38
39
41
42
45
49
49
52
55
59
60
61
63
63
65
68
INTRODUCERE
Dezvoltarea aparatului statistic furnizeaz economitilor tot mai multe date cifrice despre procesele i
fenomenele care au loc n timp i spaiu. Econometria este un mijloc de a exploata aceste date. Noiunea de econometrie
provine din termenii oikonomie (economie) i metron (msurare) i desemneaz totalitatea metodelor i tehnicilor de
msurare a fenomenelor i proceselor care au loc n domeniul economic. Primele lucrri econometrice au avut ca obiect
funciile consumului, care leag nivelul consumului de venitul disponibil (aceste funcii stau la baza teoriei keynesiene).
n decursul timpului, numeroi autori au ncercat definirea econometriei. Lucrarea ECONOMETRIA
PENTRU...ECONOMITI, a profesorului Eugen tefan Pecican, aprut la Editura Econmic n 2003, conine multe
referiri n acest sens, din care am selectat cteva.
Autori
R. Frisch
P.A. Samuelson,
T.C. Koopmans,
J.R.N. Stone
Fr. Perroux
G.C. Chow
W. Griffits,
H. Carter,
G. Judge
Referina
Econometria realizeaz mbinarea punctelor de vedere care se refer la teoria economic, statistic i
matematic cu privire la natura relaiilor cantitative din economie
Econometria reprezint o analiz de natur cantitativ a fenomenelor economice, bazat pe
dezvoltarea recent a teoriei culegerii i interpretrii datelor, n conexiune cu metodele de inferen
(inducie) statistic adecvate
Econometria este o economie de intenie tiinific
Econometria este un domeniu n care se mbin arta i tiina de a utiliza metodele statistice n
vederea msurrii relaiilor economice
Econometria este ansamblul metodelor de realizare a analizei datelor economice
Autorul lucrrii citate mai sus este de prerea c obiectul econometriei const n cunoaterea mecanismelor de
desfurare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natur
statistic sau matematic.
Definiiile date econometriei pun n eviden dou elemente: domeniul de studiu (economia, relaiile dintre
variabilele economice) i metodele utilizate (provenite din statistic i matematic). Econometria se orienteaz spre
construirea de modele econometrice care s reprezinte simplificat procesele sau fenomenele economice analizate i s
permit simulri ale acestora, n scopul nelegerii lor, pe de o parte, dar i s serveasc la realizarea de previziuni,
prognoze care s fundamenteze politicile economice, pe de alt parte.
CAPITOLUL I
MODELE ECONOMETRICE
1.1.
Generaliti
Modelarea economic reprezint un proces de cunoatere mijlocit a realitii cu ajutorul unui instrument cu
caracteristici speciale: modelul. Sistemul real supus studiului este nlocuit prin modelul su, care este o reprezentare
simplificat a obiectului cercetat.
Modelul econometric este, de regul, o mulime de relaii numerice care permite reprezentarea simplificat a
procesului economic supus studiului (uneori chiar a ntregii economii). Modelele actuale comport adesea mai mult de
zece relaii (ecuaii). Validitatea unui model este testat prin confruntarea rezultatelor obinute cu observaiile statistice.
Pentru a studia un fenomen economic se ncearc reprezentarea lui prin comportamentul unei variabile. Aceast
variabil economic depinde, la rndul su de alte variabile de care este legat prin relaii matematice.
De exemplu, dac se studiaz cererea (C) i oferta (O) dintr-un anumit bun pe o pia, se tie c cererea i
oferta depind de preul (p) bunului respectiv. Putem scrie c variabilele C i O sunt funcii de variabila p i c la
echilibrul pieei, trebuie ca cererea s fie egal cu oferta. Se construiete astfel un model elementar de forma:
C = f ( p )
[1]
O = g ( p )
C =O
Oferta i cererea dintr-un anumit bun depind i de alte variabile dect preul. Astfel, cererea dintr-un bun
alimentar depinde i de venitul disponibil, de preul unor produse analoage etc. La fel, dac este vorba despre un bun
agricol (gru,...) oferta depinde de preul anului precedent. Relaia stabilit ntre variabile n modelul econometric este
dat, de regul, la un anumit moment de timp t, caz n care variabilele apar indiciate:
[2]
C t = f ( pt , x1t , x 2t ,..., x nt )
Ot = g ( pt 1 , x1t , x 2t ,..., x rt )
C t = Ot
n modelul [2] s-au introdus mai multe variabile care explic cererea i oferta dintr-un bun i s-a considerat
realizarea acestor variabile la momentul t sau t-1. Se observ c modelul comport mai multe relaii. Se zice c avem un
model cu ecuaii multiple. Evident, se va ncepe studiul cu un model mai simplu, cu o unic ecuaie.
1.2.
Model aleator
S presupunem c se studiaz consumul (Ci) dintr-un anumit bun de ctre o familie (i). ntre alte variabile,
consumul depinde de venitul disponibil al familiei (Vi). Modelul econometric elementar const n a exprima Ci n
funcie de Vi. Desigur, ali factori dintre care unii sunt necunoscui determin de asemenea consumul familiei.
Condensm efectele acestor ali factori ntr-unul singur, aleator, notat i. Se obine astfel un model aleator:
[3]
Ci = f (Vi ) + i
Factorul aleator i este o variabil aleatoare care urmeaz o anumit lege de probabilitate, ce va trebui s fie
specificat prin ipotezele fcute asupra modelului. Cel mai frecvent, ipotezele se refer doar la momentele de ordinul I
i II ale variabilei aleatoare i. Urmeaz s ne asigurm c funcia f (sau clasa de funcii) aleas nu contrazice rezultatele
experienei. De exemplu, dac s-a ales f ca o funcie liniar (adic f(Vi) = aVi+b), modelul econometric este:
[4]
C i = aVi + b + i
i variind pe i pentru diferitele familii studiate, ne vom asigura c relaia [4] este bine satisfcut. Se spune c testm
modelul. Dac rezultatul obinut este convenabil, se va trece la estimarea parametrilor a i b. Apoi, definind o regul
de previziune se va putea determina consumul Ci dac se cunoate venitul Vi.
1.3.
Distincia ntre natura variabilelor este foarte important i va trebui precizat ntotdeauna nainte de a studia
modelul. Cnd modelul econometric a cptat formularea matematic definitiv se spune c modelul a fost specificat.
Modelul [4] de mai sus este specificat. Se cunoate forma funciei f din expresia Ci = f(Vi) + i , adic f(Vi) = aVi+b.
Adugarea variabilei exogene i d modelului formularea definitiv [4].
Mulimea parametrilor care definesc complet modelul econometric constituie structura acestuia. De
exemplu, dac a = 0,7 i b = 23 iar urmeaz o lege de probabilitate normal de medie (speran matematic) egal cu
zero i dispersie (varian) egal cu 5, atunci mulimea
a = 0,7; b= 23; = 5
constituie structura modelului [4]. Scopul va fi acela ca, plecnd de la cuplurile (Ci,Vi) asociate diferitelor familii i, s
se determine structura adevrat a modelului. Cu alte cuvinte, plecnd de la un spaiu eantion definit de mulimea
cuplurilor (Ci,Vi) s se determine structura adevrat a modelului n spaiul cu trei dimensiuni al structurilor
a , b, . Aici intervine induciastatistic.
1.4.
Inducia statistic
Obiectul induciei statistice este de a determina o procedur care, pornind doar de la observaiile statistice de
care dispunem, s permit trecerea de la spaiul eantion la spaiul structurilor. Odat ce modelul a fost ales, se admite
c exist un triplet (a, b, ) care permite reprezentarea exact a procesului prin care valorile variabilelor observate au
fost determinate. n cursul induciei statistice modelul nu se mai modific. Procedura aleas aa cum se va vedea n
continuare va consta n obinerea de estimatori pentru parametrii a i b care s permit determinarea celor mai bune
valori reale ale acestor parametri. Aceste valori se vor aprecia, n general, cu ajutorul unor intervale de ncredere
construite la un prag de semnificaie () dat. De exemplu, n modelul [4] se va gsi c a[0,64;0,78] i b[20;27] cu o
probabilitate de 95% (s-a considerat =5%). Se poate estima i abaterea medie ptratic () a variabilei aleatoare i. Se
va vedea rolul important jucat de aceast variabil aleatoare n modelul econometric.
1.5.
Identificarea modelului
Considerm din nou modelul Ci=aVi+b+i. S presupunem c procedura utilizat, pornind de la informaia
deinut, adic de la cuplurile (Ci,Vi), i=1,2,... nu conduce la o soluie unic, ci la dou structuri distincte:
s0=a0,b0,0 , s1 =a1,b1,1. Deorece legea de probabilitate pentru precizeaz i legea de probabilitate pentru C,
fiecare structur (innd cont de valorile exogenelor i de legea lui ) conduce la o lege de probabilitate pentru C.
Presupunem c structurile s0 i s1 conduc la aceeai lege de probabilitate pentru consumul C. Sunt posibile dou cazuri:
s0 i s1 sunt distincte i nu putem alege ntre ele. Se spune c structurile considerate nu
sunt identificabile i, ca urmare, modelul nu este identificabil. Din aceast cauz nu
vom putea determina valorile parametrilor care figureaz n model;
s0 i s1 nu sunt distincte, intersecia lor nu este vid. Acestea vor permite identificarea unei
pri a parametrilor modelului (cei care aparin interseciei). Se spune c cele dou
structuri sunt echivalente, dar nu permit o identificare complet a modelului.
Problema identificrii este important mai ales n cazul modelelor cu ecuaii multiple.
1.6.
Interesul unui model a crui structur a fost determinat const n a-l utiliza pentru previzionarea variabilelor
endogene ntr-o etap viitoare sau ntr-o circumstan dat, dac este vorba despre observaii luate la acelai moment-,
atunci cnd cele exogene au fost fixate. De exemplu, dac dorim s studiem evoluia importurilor (Y) n funcie de
produsul intern brut (X1) i de nivelul stocurilor (X2), modelul econometric este:
yt=a1x1t+a2x2t+b+t, t=1,2,...,T
unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X1 i X2 (observaiile fiind anuale)
permit determinarea parametrilor modelului. S presupunem c am gsit estimaiile punctuale:
a1 = 0,14
a 2 = 0,6
b = 6
y t = 0,14 x1t + 0,6 x 2t + 6 . Dac dorim s facem o previziune a importurilor pentru anul
2007, trebuie s tim PIB-ul i nivelul stocurilor n anul 2007. Presupunnd c aceste variabile exogene sunt x1=1030 i
x2=12,7 vom avea ca previziune pentru y:
y2007=(0,14).1030+(0,6).(12,7)+6
sau, n general,
1.7.
Vocabular uzual
Dac suntei familiarizai cu statistica matematic, putei trece la capitolul II. n caz contrar, v reamintim aici
cteva noiuni de baz. Lectura acestui paragraf credem c v va incita s revedei cursul de Statistic matematic.
Nor de puncte Fiind dat o serie de date statistice n care valorile (xi,yj) apar efectiv de nij ori putem
reprezenta ntr-un plan toate aceste valori prin puncte de coordonate (xi,yj) afectate de coeficienii nij , obinndu-se
astfel un nor de puncte.
Ajustare Reprezentarea grafic a seriilor de date economice conduce frecvent la figuri puin lizibile i greu
de interpretat din cauza variaiilor pe termen scurt, numeroase i sensibile, dar fr o semnificaie important. Metodele
matematice numite de ajustare permit obinerea unei curbe simple, ct mai apropiat posibil de mulimea de puncte
furnizate de observaiile empirice disponibile.
Ajustare liniar Atunci cnd reprezentarea grafic a unei serii statistice duble d un nor de puncte de form
alungit, se ncearc obinerea unei aproximri bune a acestei serii cu ajutorul unei drepte, realizndu-se astfel o ajustare
liniar. Exist mai multe metode pentru gsirea acestei drepte:
- metoda grafic (se determin punctul mediu M ale crui coordonate sunt ( x, y ) i se traseaz dreapta care
pare a fi cea mai reprezentativ a seriei, determinnd ecuaia Y=aX+b. Aceast metod este ambigu pentru c nu ine
cont de ponderea fiecrui punct n norul de puncte);
- metoda lui Mayer (se regrupeaz punctele norului n dou submulimi crora li se determin punctele medii
M1 i M2. Dreapta de ajustare este atunci dreapta care trece prin M1 i M2);
- metoda celor mai mici ptrate (const n a face minim suma ptratelor distanelor de la punctele norului la o
dreapt de ecuaie Y=aX+b numit dreapt de regresie a lui Y n X. Se arat c panta (coeficientul director) acestei
drepte este a=cov(X,Y)/Var(X). Coeficientul b se obine scriind c dreapta de regresie trece prin punctul mediu:
2=1, adic
n afara faptului de a da o reprezentare mai mult sau mai puin satisfctoare legturii dintre X i Y, importana
ajustrii liniare este de a permite previziuni statistice, asociind lui X o valoare probabil a lui Y prin relaia Y=aX+b.
Probabilitate Fiind dat o mulime finit , numim probabilitate pe orice aplicaie p a lui P()
mulimea prilor lui - n intervalul [0,1] care verific trei condiii:
- p(A)0, pentru A P()
- p()=1
- p(AB)= p(A)+ p(B), dac A,B P(), AB=
se numete univers (sau univers de probabiliti). nzestrat cu probabilitatea p se numete spaiu
probabilizat. Orice parte a lui este un eveniment. Un singleton (mulime ce conine un singur element) al lui se
6
numete eveniment elementar sau eventualitate. este evenimentul cert. este evenimentul imposibil. A este
evenimentul complementar lui A n (se numete eveniment contrar lui A). Dac AB=, evenimentele A i B sunt
incompatibile.
Variabil aleatoare Dac este un univers finit, numim variabil aleatoare orice aplicaie X: R ( a
lui n mulimea numerelor reale). Mulimea valorilor lui X, adic X() se numete universul imagine. Atenie!- o
variabil aleatoare nu este o variabil, ci o aplicaie! Se observ c nu este necesar s cunoatem o probabilitate pe
pentru a defini o variabil aleatoare pe .
Legea de probabilitate a unei variabile aleatoare Dac universul finit este nzestrat cu o probabilitate p,
iar X este o variabil aleatoare definit pe , numim lege de probabilitate a variabilei aleatoare X, aplicaia px:
X()[0,1] care asociaz oricrui xX() probabilitatea evenimentului mulimea antecedentelor lui x prin X.
Aceast mulime X-1(x) este notat (X=x). Legea de probabilitate a lui X, notat px este definit prin px: X()[0,1], x
p(X=x). A studia o variabil aleatoare nseamn a-i descoperi legea sa de probabilitate.
Funcie de repartiie Dac universul finit este nzestrat cu o probabilitate p, iar X este o variabil
aleatoare definit pe , se asociaz acestei variabile aleatoare funcia F:R[0,1] definit prin F(x)=p(X<x) numit
funcie de repartiie a variabilei aleatoare X. Evenimentul (X<x) este imaginea intervalului ( , x ) prin funcia X.
Funcia de repartiie este o funcie n scar.
Sperana matematic Dac X este o variabil aleatoare definit pe universul finit , nzestrat cu
probabilitatea p, universul imagine este o mulime finit i ia valorile xi, i=1,2,...,n. Legea de probabilitate a lui X
asociaz fiecrui xi probabilitatea pi=p(X=xi). Se numete speran matematic a variabilei aleatoare X, numrul real
n
E ( X ) = pi xi
. E(X) este media n probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator
i =1
liniar.
Variana Dac X este o variabil aleatoare definit pe universul finit , nzestrat cu probabilitatea p,
universul imagine este o mulime finit i ia valorile xi, i=1,2,...,n. Legea de probabilitate a lui X asociaz fiecrui xi
probabilitatea pi=p(X=xi). Se numete varian a variabilei aleatoare X, numrul real pozitiv
n
Var ( X ) = p i ( xi E ( X )) 2
i =1
Rdcina ptrat (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat x.
Momente
condiionate
Se
P ( X = xi , Y = y j ) = p ij , pij > 0,
consider
p
i
P ( X = xi / Y = y j ) =
p ij
p. j
ij
vectorul
aleator
(X ,Y ) : R 2
cu
repartiia
M ( X k / Y = y j ) = xik P( X = xi / Y = y j ) = xik
i
p ij
p. j
1
p. j
ij
xik
M (X /Y = y j ) =
1
p. j
x p
i
ij
, M (Y / X = xi ) =
1
y j pij
pi . j
M (X /Y = y j )
, p. j 0, p. j = 1
M ( X / Y ) :
p. j
j
Regresie Se numete regresia variabilei aleatoare X n raport cu Y, variabila aleatoare M(X/Y) cu mulimea
valorilor posibile: M(X/Y=y),
x R.
Repartia normal Variabila aleatoare X urmeaz o repartiie normal de parametri m i (se mai scrie i
exp(
( x m) 2
), x R,
2 2
m R, >0
1
2
exp(
x2
),
2
x R,
Se arat c parametri m i 2 sunt media (sperana matematic), respectiv dispersia (variana) variabilei aleatoare
X N (m, ) .
Repartiia 2 (hi-ptrat) cu n grade de libertate Variabila aleatoare X urmeaz legea de repartiie hi-ptrat
cu n grade de libertate (se mai scrie i X H ( n) ) dac densitatea ei de repartiie este:
Dac
*
1
x
x 2 exp( ), x>0, n N
2
n
f ( x) =
n
( ) 2 2
2
aleatoare X i
variabilele
N (0,1),
i=1,2,...,n
sunt
independente,
atunci
variabila
aleatoare
Y = X i2
i =1
Repartiia Student cu n grade de libertate S(n) Variabila aleatoare X urmeaz legea de repartiie Student
cu n grade de libertate dac densitatea ei de repartiie este:
f ( x) =
1
x2
1 +
n
n 1
n ,
2 2
n +1
2
x R, n N *
Dac variabilele aleatoare X N (0,1), Y H (n) sunt independente, atunci variabila aleatoare
.
X
Z=
S (n)
Y
n
Repartiia Fisher-Snedecor F(n1,n2) Variabila aleatoare X urmeaz legea de repartiie Fisher-Snedecor cu
n1 i n2 grade de libertate dac densitatea ei de repartiie este:
n1
2
n1 n21 1
x
n
n
1 + 1
f ( x) = 2
n2
n n
1 , 2
2 2
n1 + n2
2
x>0,
n1 , n2 N *
Dac variabilele aleatoare X 1 H (n1 ) i X 2 H (n2 ) sunt independente, atunci variabila aleatoare
X1
.
n
X = 1 F (n1 , n2 )
X2
n2
CAPITOLUL II
REGRESIA SIMPL
Studiem, pentru nceput, cel mai simplu model econometric: o variabil endogen reprezint evoluia
fenomenului considerat i aceast evoluie este explicat printr-o singur variabil exogen.
n cadrul capitolului este prezentat metoda de estimare a parametrilor care intervin ntr-un model
econometric, se vor examina proprietile estimatorilor obinui i se vor generaliza rezultatele analizei pentru modele
mai complexe. ntr-o prima parte se va trata obinerea estimatorilor parametrilor modelului i proprietilor lor, iar ntro a doua parte se d o interpretarea geometric a metodei utilizate, determinarea intervalelor de ncredere referitoare la
parametri i previziunea care poate fi fcut cu un astfel de model.
Considerm modelul:
(1)
Ipoteze fundamentale
Pentru a putea obine rezultatele enunate la nceput, vom simplifica lucrurile impunnd o serie de ipoteze
restrictive asupra modelului. Ulterior, n alte capitole, se vor relaxa aceste restricii, discutnd implicaiile abandonrii
unora din aceste ipoteze asupra calitii estimatorilor.
I1:
xt i yt sunt mrimi numerice observate fr eroare;
X variabila explicativ se consider dat autonom n model;
Y variabila endogen este o variabil aleatoare, prin intermediul lui .
I2:
a)- urmeaz o lege de distribuie independent de timp, adic media i dispersia lui nu depind de t:
E ( t ) = 0, t = 1,2,..., T ,
matematic i variana unei variabile aleatoare. Se presupune c studenii au cunotine elementare despre teoria
probabilitilor i statistic matematic. Altfel, ele trebuie revzute!
b)- Realizrile lui sunt independente de realizrile lui X n cursul timpului. Aceasta este ipoteza de
homoscedasticitate. n caz contrar, exist heteroscedasticitate.
9
c)- Independena erorilor (se va vedea pe parcurs c variabila aleatoare reprezint erori sau reziduuri).
Dou erori relative la dou observaii diferite t i t sunt independente ntre ele, nsemnnd c au covariana nul:
d)- Normalitatea erorilor. Presupunem c urmeaz o lege de repartiie normal , cu media 0 i dispersia
ceea ce poate fi scris astfel:
2 ,
N (0, 2 ) .
I3:
Primele momente empirice ale variabilei X, pentru T foarte mare, sunt finite:
1 T
xt T x0
T t =1
(media empiric).
2
1 T
xt x T
s 2 (variana empiric).
T t =1
Aceast ipotez va fi folosit pentru a preciza proprietile asimptotice ale estimatorilor parametrilor a i b.
Ipotezele I1, I2, I3 pot prea foarte restrictive. Vom vedea ulterior ce consecine are abandonarea unora dintre
ele asupra proprietilor estimatorilor lui a i b.
2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici ptrate
Determinarea estimatorilor parametrilor a i b (notai cu
b )
(MCMMP) se face punnd condiia ca suma ptratelor erorilor s fie minim, adic:
T
t =1
2
t
= [ y t axt b ] = (a, b ) .
Pentru ca
1.
t =1
condiii necesare:
= 0,
= 0.
a
b
2
2
2. condiii suficiente:
> 0 , a2
2
a
ba
2
2
ab > 0 .
2
b 2
(a, b ) .
T
= 2( yt axt b )( xt ) = 0
a t =1
T
= 2( yt axt b )( 1) = 0
b t =1
T
2
=
2
xt2 >0
a 2
t =1
10
2
= 2T
b 2
T
2
2
=
= 2 x t .
ab ba
t =1
t
t
t =1
t =1
1 T
1
xt y t a
T
T t =1
y ax b = 0
x
t =1
2
t
bx = 0
.
1
xt yt y x
T
a =
=
2
1
2
xt x
T
b = y a x
x y T y x = (y y )(x x ) .
x T x
(x x )
t
)(
2
t
Am obinut estimatorii a i
yt y xt x ,
a =
2
(2)
xt x
b = y a x
Observaie:
a este o variabil aleatoare pentru c e funcie de yt, iar b este aleator pentru c e funcie de a .
2.3. Proprietile estimatorilor
Vom arta c estimatorii a i
b obinui prin metoda celor mai mici ptrate sunt nedeplasai i convergeni. n
demonstraie vom ine cont de ipotezele I1, I2, I3. Pentru a uura demonstrarea proprietilor enunate, transformm mai
nti expresiile (2) pentru a le exprima n funcie de parametrii a i b. Vom considera modelul (1)
T
T
T
(2)
y = ax + b + .
11
) (
y t y = a xt x + t
(y y ) n expresia lui a :
i nlocuim
[a(x
a =
) ( )]( ) = a (x x ) + ( )(x
(x x )
(x x )
(x x ) (x x ) = a + (x x )
=a+
(x x )
(x x )
t
x + t xt x
x) = ( xt x) = 0 ).
a = a +
t xt x
(x
)=
(x
(deoarece
y = a x + b + , astfel c prin
(a a )x . Am obinut c:
b = b + (a a )x .
Un estimator este nedeplasat dac media estimatorului este chiar parametrul estimat. Vom aplica
operatorul de medie E
xt x
wt =
(x
, astfel c
a = a + t wt
Rezult:
()
()
E b = E (b ) + E xE (a a )
Avem c: E(b)=b,
()
()
1
1
E = E t = E ( t ) = 0 i E (a a ) = E (a ) E (a ) = a a = 0 , deci
T
T
E b = b .
tiind
()
Var b T
0
estimatorilor
tim c
E (a ) = a
pentru ca
()
E b = b ,
b s
este
suficient
, adic
artm
Var(a ) T
0
b .
a = a + wt t
a a = wt t
12
2
Var (a ) = E (a a ) = E ( wt t ) = E wt2 t2 + 2 wt wt ' t t ' =
t <t '
2
2
= wt E t + 2 wt wt ' E ( t t ' )
( )
t <t '
Var (a ) = wt =
2
dar w = xt x
xt x
2
t
2
t
( )
E t2 = 2
E ( t t ' ) = 0 , pentru
t t ' , rezultnd:
=
2
(x x )
este:
Var (a ) =
(x x )
2
1
Conform ipotezei I3,
xt x T
s 2 i avem c Var
(a ) =
2
Ts 2
T
0 .
Am obinut c
a T
a ( a
() ( ) [
]
= E ( ) 2 xE [ (a a )]+ x E (a a )
2
2
2
2 2
Var b = E b b = E (a a )x = E 2 x(a a ) + (a a ) x =
2
( )
2
E = E t = E 2 t + 2 t t ' =
T
t <t '
T
T 2 2
1
2
1
= 2 E t2 + 2 E ( t t ' ) = 2 Var ( t ) = 2 =
T
T
T t <t '
T
T
2
( )
(deoarece
E ( t t ' ) = 0 ).
1
1
2
E (a a ) = E t ( wt t ) = E wt t + wt t t ' =
t <t '
T
T
=
2
1
1
1
2
(
)
(
)
w
E
+
w
E
=
w
Var
=
t t T
t
t
t t'
t
T
T
T
t <t '
( )
(x x ) = 0 ,
(
)
(
)
x
x
x
adic E [ (a a )] = 0 .
T
dar
wt =
t =1
t =1
xt x
13
()
2
2
2
Var b = + x E (a a ) = + x Var (a ) = +
T
T
T
2
Dispersia estimatorului
x 2
(x
este:
x
2 1
Var (b) = +
2
T
(
x
x
)
t
Cum ns
1
0 i
T T
(x x )
()
1
0 , adic
0 rezult c Var b T
Ts 2 T
b T
b ( b
2.3.1.
Covariana estimatorilor a i
( ) [(
(
))] [ ( )]
= E [(a a )( x(a a ))] = E [ (a a ) x(a a ) ] =
x
= E [ (a a )] xE (a a ) = xVar (a ) =
cov a , b = E a E (a )) b E (b = E (a a ) b b =
2
(x
b , notat
2
Var (a ) cov a , b xt x
=
(a ,b ) =
, a
cov
b
Var
b
x 2
2
xt x
1
x
2
2
xt x
x
x
t 2
= 2
x
1
x
+
2
2
T
xt x
xt x
( )
( )
()
Se remarc faptul c
(a ,b ) este deci:
x 2
x
x
t
=
2
1
2 +
2
T xt x
conine pe
estimaie cu
(a ,b )
2 ,
(a ,b ) ,
Var ( t ) = 2 .
2 .
2.3.2.
14
Notm aceast
Utiliznd estimatorii a i
ajustate ale variabilei endogene):
b putem calcula estimaia variabilei endogene yt, notat y t (se mai numesc i valori
y t = a xt + b .
t .
Notm t = yt y t . Avem c
Remarc:
b b = (a a )x
tim c
i nlocuind obinem:
t = t (a a )xt + (a a )x = t (a a ) xt x
).
)(
t2 = t 2(a a ) xt x t + (a a )2 xt x
2
).
2
1
1
t2 = t
T
T
Dar: a a
2(a a )
(x x ) , i
(x x )
t
)(
1
2 1
xt x t + (a a ) xt x
T
T
(x
)(
[ (
)]
) (
x t = t xt x xt x = t xt x xt x = (a a ) xt x
pentru c
xt x = 0 .
nlocuind, rezult:
1
1
t2 = t
T
T
Notm cu
calculm media
2 =
( )
(a a )
1
t
T
1
xt x
T
).
2
E2 :
( )
2
2
1
1
E 2 = E t = E t2 2 t +
T
( )
) = E T1
2
t
2
=
2
1
1
2
1
2
2
2
2
E
=
E
t = E 2 t + 2 t t ' =
T
t <t '
T
T
2
1
2
1
= 2 2 E t2 2 E ( t t ' ) = 2 = 2 1
T
T t <t '
T
T
( )
( )
15
1
1
t2 = t
T
T
(a a )
2
1
xt x ,
2
2
1
1
1
2
E t2 = E 2 Var (a ) xt x = 2 1 = 2 1 .
T
T
T T
T
( )
obinut:
( )
E 2 = 2 , adic
2
este un estimator nedeplasat pentru
yt = axt + b + t
numitorul lui
1
1
t2 , aa c, notnd 2 =
t2
T 2
T 2
2 = E
, am
2 (variana erorilor).
este T-2. (T-2) constituie numrul gradelor de libertate. Vom reveni ulterior asupra acestei
probleme.
n concluzie, pentru modelul liniar al regresiei simple, avem estimatorii:
a =
(y y )(x x )
(x x )
t
b = y a x
2 =
1
t2
T 2
Estimatorul
estimaie a matricei
:
(a ,b ) , notat
(a ,b )
( )
()
= Var (a )
(a ,b )
cov a , b
cov a , b
Var b
( )
2
Var (a ) =
(x x )
unde:
2
1
x
Var b = 2 +
T xt x
()
( )
,
2
cov a , b = x Var (a ) .
2.3.3.
16
Am determinat estimatorii a i
minimului sumei ptratelor erorilor
2
t
2
t
s fie
minimal, cu ajutorul unei reprezentri grafice. Aceast condiie va consta n egalitatea cu zero a dou produse scalare
care redau ecuaiile normale.
yt = axt + b + t
Modelul
Y = aX + bU +
y1
x1
1
1
y2
x2
2
1
.
.
.
.
unde: Y =
, X = , U = . , = .
.
.
.
.
.
.
.
1
y
x
T
T
T
n spaiul ortonormat considerm vectorii Y, X, U i .
T
(L)
Vectorul 0H=aX+bU aparine planului (L) determinat de vectorii X i U. Fie 0A=Y, 0B=X, 0C=U, HA=.
Cantitatea
traduce
prin
2
t
= HA
egalitatea
cu
zero
< Y aX bU , X >= 0
, adic
< Y aX bU ,U >= 0
produsului
scalar
al
vectorilor
respectivi:
HA 0 B = 0
, sau
HA 0C = 0
xt yt a xt2 b xt = 0
.
yt a xt Tb = 0
T determinat de X i U.
Observaie:
17
yt = axt + b + t
revine, deci, la a
Considerm modelul
A
Y
0
U
2
t
= HA
1
T b = 0 , b = yt = y i 0 H = b U = y U = Y . Msura algebric a
T
varianei.
Ecuaia varianei
Y
Y
(L)
(1) AK
= KH
+ HA
18
tim
y t = axt + b
1
1
y t = a xt + b ,
T
T
adic:
y = a x + b .
Dar
y = a x + b , rezultnd c y = y .
AK=0A-0K ( A0 K dreptunghic n K)
Deoarece:
(2 ) (yt y )
(y y )
Variabilitatea
Variabilitatea
total
2
t
Variabilitatea
datorat regresiei
rezidual
Aceasta este ecuaia varianei. Vom reveni asupra ei cnd vom aborda regresia multipl.
(y y )(x x ) .
(y y ) (x x )
cov( X , Y )
n general, =
, unde
=
X Y
XY
X i Y.
tim c estimatorul parametrului a are expresia
a =
(y y )(x x )
(x x )
=
(x x )
(y y ) (x
2
(x x )
(y y )
=
2
a 2 xt x
(y y )
(y
2
2
y = y t y = axt + b a x + b
(y
=
(y
) = (y y )
y)
(y y )
y
(y
2
t
)] = [a (x x )]
2
y = yt y t2 , de unde:
2
=a 2 xt x .
= 1
(y
2
t
19
cos =
2
KH
AK
(y
=
(y
2
2
)
y)
y
= cos = 1
2
, adic
(y
2
t
AK H , avem cos =
0 2 1 i 1 1 .
n mod necesar,
Cnd
Cnd
= 1
KH
,
AK
implic a<0.
2 ,
densitatea de
f ( t ) =
1 t2
exp
, t = 1,2,..., T .
2
2
2
1 t2
1
exp
(1) f ( 1 , 2 ,..., t ) =
2
2
2
t = yt axt b i
Dar,
( )
(deoarece
y t axt b = y t y t = t ).
= ( y ax b ) = [ + (a a )x + (b b )] =
= + (a a ) x + (b b ) + 2 (a a )x + 2 (b b ) + 2(a a )(b b )x =
2
t
2
t
2
t
( ))
( )]
2
= t2 + (a a )xt + b b = t2 + (a a )xt + b b
20
( )
planul (L), prin urmare este perpendicular pe orice vector din acel plan, deci i pe X i U. Produsele scalare cu aceti
vectori vor fi nule, adic:
[(a a )x
( )]
+ b b
a a xt2
=
b b T x
'
T x a a
T b b
1 ( yt axt b )2
1
( y1 , y 2 ,..., yt ) =
=
exp 2
2
1 a a ' 1 x 2 T x a a
1 t2
1
2 t
=
exp
exp
2
b b
b
2
T
x
T
(a ,b ) , se arat uor c:
1 xt2
2 T x
( )
1
T x
= (1 ) i ( y1 , y 2 ,..., yt ) =
( )
a ,b
2 g ( t ) h a, b unde g t este densitatea de
T
probabilitate a lui
t , iar h a , b
Cu aceste rezultate i fcnd apel la unele teoreme importante ale statisticii matematice, putem deduce
urmtoarele distribuii de probabilitate:
1.
Deoarece
raportul
2 =
1
t2
T 2
(T 2) 2 =
2
libertate. (Vectorul
, adic
2
t
2
t
= (T 2 ) 2 ,
2.
a2 = Var (a )
2 a2
=
2 a2
21
a2
(T 2) 2
a
a , respectiv
3.
Cuplul
(a, b)
a a
definite mai jos au repartiiile urmtoare:
a a
S (T 2 )
a
b b
4.
N (0,1) ;
N (0,1) ;
b b
S (T 2 ) .
b
Expresia
'
1 a a 1 a a
F =
2 b b (a ,b ) b b
Pentru c exist tabele cu valorile legilor de probabilitate anterioare, putem determina intervale de ncredere
pentru parametrii a i b la un nivel de semnificaie fixat.
a a
Prob
t = 1
a
este luat din tabela distribuiei Student cu (T-2) grade de libertate. Un calcul simplu conduce la intervalul
a t a a a + t a
ceea ce permite afirmaia c adevrata valoare a parametrului real a , se gsete n intervalul de valori
[a t a ;
a + t a ]
cu probabilitatea 1-.
Cnd se dorete testarea unei valori a0 a parametrului a, este suficient, pentru a accepta aceast valoare cu
riscul , s ne asigurm c:
a a0
t .
a
Altfel spus, este suficient ca a0 s aparin intervalului de ncredere stabilit:
22
a0 [a t a , a + t a ] .
De asemenea,
Prob{F F ( ,2, T 2 )} = 1 .
F = F ( ,2, T 2 ) este ecuaia unei elipse cu centrul n w(a , b ) care definete astfel o regiune de ncredere
pentru cuplul
w
b
B
A
Proieciile acestei elipse pe axe determin, de asemenea, dou intervale de ncredere pentru a i b, centrate n
a i b . Dar, este important de remarcat c, nivelul de semnificaie referitor la aceste intervale nu mai este nivelul
asociat elipsei.
Dac se dorete testarea simultan a dou valori a0, b0 alese apriori, este suficient s nlocuim a i b n expresia
F prin a0 i b0.
Dac
F (a0 , b0 ) F ( ,2, T 2)
accepta cuplul (a0, b0) la nivelul de semnificaie este suficient ca punctul M0(a0,b0) s aparin elipsei de ncredere
asociat cuplului (a, b).
Observaii:
1.
Expresia
funcie de yt,
(a, b), legea de probabilitate condiionat a lui y (dat de factorul g) nu depinde dect de valorile
adevrate (dar necunoscute) ale parametrilor a i b. Se zice c (a , b ) sunt estimatori exhaustivi pentru a i b,
cuplului
( y1 , y2 ,..., yT ) este chiar funcia ( y1 , y 2 ,..., yT ) . Pentru obinerea de estimatori ai lui a i b prin metoda
verosimilitii maxime, este suficient s maximizm expresia ( y1 , y 2 ,..., yT ) , adic s minimizm
23
(y
( )
2
axt b ) . Estimatorii a , b obinui cu metoda celor mai mici ptrate coincid, deci, cu cei obinui
a i b obinui prin
metoda celor mai mici ptrate au variana minim printre toi estimatorii liniari centrai n a i b (se va da o
demonstraie pe cazul general).
yP = a x + b ,
iar realizarea efectiv a lui Y este:
y = ax + b + .
Eroarea de previziune se poate exprima prin variabila aleatoare
( )
eP = yP y .
yP y = (a a )x + b b .
Se remarc imediat c
( ) ( )
] [ ( )]
2
2
2
Var (eP ) = E yP y = x2 E (a a ) + E b b + E 2 +
+ 2 x E (a a ) b b 2 x E (a a ) 2 E b b
( )]
()
( )
a , ca i i b sunt necorelai).
( )
= x
2
1+
2 x x 2
2
+
2
xt x
xt x
Tx
(x x ) T (
1
(x x )
1 + +
T (x x )
2
1
x
2 = 2 1 + +
2
T xt x
24
Aceast varian poate fi redus, pe de o parte prin creterea numrului de observaii (T), iar pe de alt parte,
prin alegerea lui
x astfel nct x x
( )
t N (0, 2 ) atunci i (a a ) N i b b N
(urmeaz legi
yP y
yP y
N (0,1) .
(T 2) 2 = (T 2) 2
2
Putem construi, avnd P ca centru i paralel cu axa 0y un interval de ncredere M1M2 la nivelul de semnificaie .
yP y
P
< t = 1 .
2
x = x . Punctele M1 i M2 sunt deci situate, cnd variaz, pe dou arce de curb (vezi figura), care determin astfel
regiunea creia i aparine
M2
y = ax + b
yP
M1
y
Observaii
1. O variabil aleatoare t este distribuit dup o lege Student cu T-2 grade de libertate dac expresia
este raportul dintre o variabil aleatoare distribuit
libertate. Fie
t=
a a
. Atunci:
a
25
t2
T 2
cu (T-2) grade de
t2
(a a ) =
=
T 2 (T 2) a2
2
(a a )2
a2
a2
(T 2) 2
a
2 cu un grad de libertate
2 cu (T - 2) grade de libertate
2. O variabil aleatoare F este distribuit dup o lege Fisher-Snedecor cu n1 i n2 grade de libertate dac
n1 F
2
2
este raportul dintre o variabil aleatoare distribuit cu n1 grade de libertate i o alta distribuit
n2
expresia
cu n2 grade de libertate.
Fie
F=
1 a a 1 a a
.
'
2 b b (a ,b ) b b
Atunci:
a a xt2 T x a a
T b b
2F
b b T x
=
=
T 2
(T 2) 2
,
a a xt2
b b T x
,
T x a a
T b b
(T 2) 2
2
pentru c
procedm astfel:
yt ;
nlocuim
1
y1
2
D( )
J=
= y
1
D( y )
...
T
y1
1
y 2
2
y 2
...
T
y 2
1
yT
1 0
2
0 1
...
yT =
... ...
... ...
0 0
T
...
yT
...
...
...
...
...
0
0
=1
...
1
(a a ) = wt t , t
t . Deci:
(a a ) N (0,1)
a
26
(a a )2
este distribuit 2 cu 1 grad de libertate pentru c este ptratul unei variabile aleatoare N(0,1).
2
a
(b b) N (0,1)
b
(b b)
2 (1)
Deoarece
b2
2
t
2
t
(
=
= t
(a a )2
2
) =
(x x )
(a a )
(a a )2
(x
(x
(a a )2 2
(1)
Var (a )
Rezult c:
Pentru a studia cum variaz cheltuielile de ntreinere i reparaii ale unui utilaj agricol n funcie de vrsta
utilajului, s-au cules urmtoarele date:
Vrsta utilajului (xt)
15
36
41
16
21
21
48
43
77
89
50
40
56
62
53
10
32
17
58
20
100
47
71
58
102
35
60
Rezolvare:
Cutm s estimm parametrii unei regresii liniare nte variabilele X i Y, de forma
presupunnd c sunt ndeplinite ipotezele fundamentale I1,I2,I3.
27
yt = axt + b + t
1. Pentru a calcula estimatorii, se folosesc relaiile de calcul stabilite anterior (n cadrul seminarului se vor
prezenta facilitile de calcul oferite de diferite pachete de programe dedicate). Elementele necesare calculului sunt date
n tabelul ce urmeaz:
28
xt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
yt
15
8
36
41
16
8
21
21
53
10
32
17
56
6
20
362
xtyt
48
43
77
89
50
40
56
62
100
47
71
58
102
35
60
938
720
344
2772
3649
800
320
1176
1302
5300
470
2272
986
5916
210
1200
27437
xt x
-9,1333
-16,1333
11,8666
16,8666
-8,1333
-16,1333
-3,1333
-3,1333
28,8666
-14,1333
7,8666
-7,1333
33,8666
-18,1333
-4,1333
-
( xt x ) 2 yt y
83,4177
260,284
140,818
284,484
66,1511
260,284
9,8177
9,8177
833,284
199,751
61,8844
50,8844
1146,95
328,818
17,0844
3753,73
-14,5333
-19,5333
14,4666
26,4666
-12,5333
-22,5333
-6,5333
-0,5333
37,4666
-15,5333
8,4666
-4,5333
39,4666
-27,5333
-2,5333
-
( y t y ) 2 x t2
211,218
381,551
209,284
700,484
157,084
507,751
42,6844
0,2844
1403,75
241,284
71,6844
20,5511
1557,62
758,084
6,4177
6269,73
y t2
225
64
1296
1681
256
64
441
441
2809
100
1024
289
3364
36
400
12490
29
2304
1849
5929
7921
2500
1600
3136
3844
10000
2209
5041
3364
10404
1225
3600
64926
= 1 , 28 x
+ 31 , 67
50,8544
41,9034
77,7073
84,1008
52,1331
41,9034
58,5267
58,5267
99,4454
44,4609
72,5925
53,4118
105,8389
39,346
57,248
-
y y
-11,6789
-20,6298
15,174
21,5675
-10,4002
-20,6298
-4,0066
-4,0066
36,912
-18,0724
10,0591
-9,1214
43,3056
-23,1873
-5,2853
-
( y y ) 2
136,396
425,59
230,251
465,16
108,164
425,59
16,053
16,053
1362,5
326,613
101,187
83,201
1875,38
537,649
27,9347
6137,72
-2,8544
1,0965
-0,7073
4,8991
-2,1331
-1,9034
-2,5267
3,4732
0,5545
2,539
-1,5925
4,5881
-3,8389
-4,346
2,7519
-
t2
8,1479
1,2023
0,5003
24,0012
4,5503
3,6232
6,3842
12,0637
0,3075
6,4469
2,536
21,0509
14,7375
18,8883
7,5734
132,0144
1
T
x=
- a
1
362 = 24,133
15
xt =
t =1
y=
1
T
y
t =1
1
938 = 62,533
15
t
2
t
(y
(y
)(
y xt x
y xt x
2
27437 15(24,133)(62,533)
6269.733 3753,733
= 0,9894
Valoarea apropiat de 1 a coeficientului de corelaie arat c ntre cele dou variabile studiate exist o
corelaie liniar.
Observaie: Am vzut c:
=
2
a 2 xt x
(y
) = (ax
2
(y
ax ) 2
y) 2
( y
(y
y ) 2
y) 2
Ptratul coeficientului de corelaie liniar este raportul dintre variabilitatea explicat prin model i
variabilitatea total.
- ecuaia de analiz a varianei:
variabilitatea total = variabilitatea explicat + variabilitatea rezidual
(y y )
6269,733
(y y )
6137,719
2
t
132,014
n spaiul observaiilor, Y este cu att mai bine explicat prin modelul liniar, cu ct este mai aproape se
planul (L) generat de vectorii X i U (vectorul unitar), deci cu ct variabilitatea rezidual este mai mic fa
de variabilitatea empiric total. Aceasta face ca raportul dintre variabilitatea explicat prin model i
variabilitatea total, adic 2, s fie apropiat de 1.
- estimaiile varianelor reziduurilor i ale estimatorilor:
2 =
1
132,0144
t2 =
= 10,15
T 2
15 2
Var (a ) =
(x
10,15
= 0,0027;
3753,733
x
2 1
Var b =
+
T xt x
()
a = 0,0027 = 0,052
1 (24,133) 2
= 10,15 +
= 2,25
15 3753,733
30
b = 2,25 = 1,5
- calculul intervalelor de ncredere pentru estimatori:
(a a )
Variabilele aleatoare
libertate. Alegnd un nivel de semnificaie =0,05, putem extrage din tabelele repartiiei (astfel de tabele se
gsesc n majoritatea crilor de econometrie, sau de statistic matematic) valoarea ttab corespunztoare
numrului de grade de libertate i nivelului de semnificaie ales. n cazul nostru, pentru T-2=13 grade de
libertate i =5%, gsim ttab=2,16. Intervalele de ncredere vor fi:
a [a t a ; a + t a ] = [1,28-(2,16)(0,052) ; 1,28+(2,16)(0,052)]=
= [1,17 ; 1,39]
probabilitate de 95%.
Stabilim acum un interval de ncredere pentru estimatorul varianei erorilor. Am vzut c variabila
2 1
(T 2) 2 = 2 t2
aleatoare
n tabelele legii hi-ptrat vom gsi, pentru un nivel de semnificaie dat, dou valori: v1 avnd
probabilitatea (1-/2) de a fi depit, respectiv v2 avnd probabilitatea (/2) de a fi depit, astfel c
2
Pr obv1 (T 2) 2 v 2 = 1
(T 2) 2 (T 2) 2
;
v2
v1
pentru =0,05 i 13 grade de libertate extragem din tabel v1=5,01 i v2=24,7 rezultnd intervalul:
- testm dac parametrii a i b ai modelului sunt semnificativ diferii de zero la pragul de semnificaie
=0,05.
31
Variabilele aleatoare
a
a
b
b
Aceste rapoarte se numesc i raportul t Student empiric (tcalculat). Se accept ipoteza H0: (a=0) dac tcalculat
(luat n modul) este mai mic dect ttabelat , altfel se accept ipoteza contrar H1:(a 0). Acest lucru se poate
scrie:
a 0
< t tab
a
determinat pentru a. Cum 0 [1,17 ; 1,39], acceptm ipoteza H1:(a 0). La fel stau lucrurile i pentru b.
Prin urmare, a i b sunt semnificativ diferii de zero la pragul de semnificaie de 5%. Se spune c variabila
explicativ (exogen) X (vrsta utilajului) este contributiv.
- ne propunem acum s determinm o previziune a cheltuielilor de ntreinere i reparaii pentru un utilaj
yp
x . Avem c
e p = yP y ,
erorii de previziune:
2
1
x x
1 (48 24,133) 2
= 1 + +
= 10,151 + +
= 12,366
2
15
3753,733
T xt x
= 2 = 12,366 = 3,5164
Deoarece variabila aleatoare
yP y
32
CAPITOLUL III
REGRESIA MULTIPL
De multe ori, studiul unui fenomen economic necesit introducerea mai multor variabile
explicative. O variabil endogen se exprim, deci, n funcie de mai multe variabile exogene. Metodele de
regresie utilizate sunt n acest caz generalizri ale celor din capitolul anterior.
(1)
y1
x11
y2
.
x12
Y = , X =
...
.
x
.
1T
y
T
x21
x22
...
x 2T
1
... x p1
a
1
2
... x p 2
.
a2
, a = , =
... ...
...
.
a
.
... x pT
p
T
Y = Xa + .
Ipoteze fundamentale
Ipotezele I1, I2 din capitolul II rmn valabile: ceea ce era adevrat pentru xt este acum valabil
33
x
i =1
it
i ,
i=1,2,...,p
astfel nct
= 0 , t=1, 2, ...,T.
Matricea X de format (Txp) are n acest caz rangul p (T>p) i matricea (XX), unde X
este transpusa lui X, este nesingular, deci exist inversa ei (XX)-1.
1
( X ' X ) tinde ctre o matrice finit, nesingular.
T
b.
Pentru a scrie ecuaiile normale utilizm interpretarea geometric dat n capitolul II. Ne
T
2
propunem s minimizm expresia U = t .
t =1
Xp
(L)
Vectorul
X2,...,Xp. Cantitatea
X2
H
a1
a2
Xa = (X 1 , X 2 ,..., X p )
...
a
p
U = t2 =
X1
34
= Y Xa
este ortogonal
la subspaiul (L). Aceast condiie se traduce prin egalitatea cu zero a produselor scalare dintre vectorul
...............
< Y a1 X 1 a 2 X 2 ... a p X p , X p >= 0
x1t yt x12t
x 2 t yt x 2 t x1t
... = ...
x y x x
pt t
pt 1t
x x
x
1t
2t
2
2t
...
...
x 2t
...
...
pt
...
x
x
x pt a1
a
x
2 t pt 2
.
...
...
x 2pt a p
1t
Sau, cu notaiile
matriciale introduse:
1
a = ( X ' X ) X 'Y
a .
transformm expresia (3) nlocuind Y prin expresia lui n funcie de X:
1
1
a = ( X ' X ) X ' Y = ( X ' X ) X ' ( Xa + ) =
(4)
= (X ' X )
Prin definiie:
35
pentru c ( X ' X )
este o matrice
simetric. Atunci:
ns
E ( ') =
. tim c E ( ') = I
2
(I este
Se poate arta c dac ipoteza a) din I3 rmne valabil cnd T , atunci a este estimator
convergent ctre a.
Propoziie. Estimatorul
1
a = ( X ' X ) X 'Y
a.
Pentru a arta aceast proprietate vom construi un estimator liniar pentru a care s aib variana
minim i el va fi identic cu cel obinut prin MCMMP. Fie a* un estimator liniar al lui a, adic a*=MY,
unde M este o matrice cu coeficieni constani de format (pxT). Estimatorul a* este nedeplasat dac:
E (a *) = ME (Y ) = ME ( Xa + ) = a
adic
Dar,
deci
a * a = M ,
minim, trebuie ca urma matricei (MM) s fie minim, sub restricia (MX)=I. Urma unei matrici este,
prin definiie, suma elementelor de pe diagonala principal. Notm Ur(X) urma matricei X. Ur este un
operator liniar (demonstrai!). Rezolvnd problema de extremum condiionat:
s.r.MX = I
se obine soluia
36
Variana reziduurilor
1
t2
Tp
2 =
Y = Xa + ;
Avem c:
Y = Xa ;
= Y Y = Xa + Xa ;
= X (a a ) .
Dar: a a = ( X ' X ) X ' i = X ( X ' X ) X '
1
= I X ( X ' X )1 X ' .
Notm:
= I X (X ' X ) X ' .
1
Am
2
t
= .
obinut
Evalum
2
t
acum
care
sub
form
matriceal
este:
( ) = E ( ) + E ( ).
2
t
2
i
ii
i j
ns, E
( ) = 0 conform I
i
ij
( ) = E ( ) =
2
t
ii
2
i
ii
Artm c
Ur ( ) = T p .
Ur (I ) = T
= 2Ur ( ) .
)= p
operatorului Ur.)
n final rezult:
37
( ) = (T p )
2
t
E
2 =
1
t2
Tp
2 =
1
E
Tp
( ) = E T 1 p
2
t
2
t
astfel
2 .
a i ai
1
a = a + ( X ' X ) X ' , rezult c a este distribuit dup o lege normal n p
1
E (a ) = 0 i dispersia a = 2 ( X ' X ) . Pentru un estimator a i dat, avem c:
(**)
(***)
(T p ) 2 = t2
a i ai
urmeaz o lege Student cu (T-p) grade de libertate.
ai
Legea Student este utilizat n mod curent pentru a aprecia validitatea estimatorului unui
coeficient ai. De exemplu, dac se testeaz ipoteza (H0:ai=0) contra ipotezei (H1:ai 0), pentru a accepta
H1 trebuie ca
a i
t , unde t este valoarea tabelat a variabilei t repartizat Student, cu T-p grade
2
2
ai
Observaie:
Pentru T>30 i =0,05,
t 2 . Deci, dac
2
a i
2 se accept H1, adic ipoteza c variabila
ai
a i ai0
i se compar cu t .
2
ai
38
ai ai0 .
a1 ,..., a p :
F=
1
(a a ) a1 (a a ) urmeaz o lege Fisher-Snedecor cu p i (Tp
p) grade de libertate.
La fel ca la regresia liniar simpl, rezultatele anterioare permit construirea de intervale de
ncredere relative la coeficienii ai, ca i a unui elipsoid de ncredere relativ la ansamblul coeficienilor n
spaiul
a i ai
t
2
ai
t
2
a i ai
t
2
ai
ai t ai ai ai t
2
a i ai t a i a i + ai t
2
q , avem ecuaia
F1=F(,q,T-p), unde:
F1 =
cu
1
(a q aq )' a1q (a q aq ).
q
:
extras din
a q extras din vectorul a i
a
aq
(0)
a q( 0) ), atunci dac:
1
1 a a ( 0) F ( , q, T p )
a q a q( 0 ) '
aq
q
q
q
se accept ipoteza H0 ( F
39
Observaie:
Se observ c valoarea tabelat F depinde de
( , q, T p ) i nu de ( , q, T q ) . Rezult c
(q )
2
qF
= 2
face s apar la numitor (T p ) 2 distribuit 2 cu (T-p) grade de libertate.
T p (T p )
expresia
yp = a1 x1 + a 2 x2 + ... + a p x p .
Eroarea de previziune va fi variabila aleatoare:
E (Y p Y ) = 0 ,
[(
Var Y p Y = E Y p Y
) ] = E (a
p
i =1
2
ai ) xi2 + 2 (a i ai )(a j a j )xi x j + 2
i< j
deoarece
Deducem c:
[(
E Yp Y
) ]= x
p
i =1
2
i
Var (a i ) + 2 xi x j cov(a i , a j ) + 2 ,
i< j
[(
) ] = X X + , adic:
Var (Y Y ) = [X ( X ' X ) X + 1],
2
E Y p Y
unde:
'
'
Observaie:
Se arat c dac T este finit i t sunt normal distribuite, atunci
dimensiuni. Dac ipotezele nu sunt ndeplinite, atunci cnd
distribuie normal cu media egal cu zero.
40
T , vectorul
T (a a ) urmeaz o
Variabilitatea
Variabilitatea
Variabilitatea
=
+
rezidual
total
valorilor ajustate
(y y )
(y y )
2
t
(y
=
(y
)
y)
y
2
2
=1
(y
2
t
Y = Xa +
c vectorul rezidual
2 .
Y = Y + ,
(Y Y , X X ) . Cu alte cuvinte, dac efectum regresia pe ecuaia general, cu variabilele necentrate sau
sunt aceeai.
Observaie:
Cnd se centreaz valorile X i Y, vectorul
(Y Y )(' Y Y ) , dar (Y Y ) = (X X )a .
(Y Y )(' Y Y )
a = [(X X )(
' X X )] (X X )(
' Y Y ) i coeficientul devine:
a ' (X X )(
' Y Y )
R =
(Y Y )(' Y Y ) .
R2 =
Coeficientul
mascheaz uneori influena variabilelor exogene luate separat asupra variabilei endogene i nu poate s se
41
ine cont nici de numrul de observaii (T) i nici de numrul variabilelor explicative (p). Ori, se poate
foarte bine ca, avnd aceleai observaii asupra variabilei endogene s considerm dou modele distincte, n
al doilea fcnd s apar un numr de variabile explicative noi. n aceast a doua regresie coeficientul de
corelaie multipl nu poate dect s creasc (pentru c variabilitatea explicat prin regresie crete).
O definire mai precis a lui
2
R =1
T 1
(
1 R 2 ).
Tp
1.
R = R2 ;
2.
R < R2 ;
3.
4.
p 1
.
T 1
Analiza varianei
Atunci cnd studiem rolul jucat de exogene asupra evoluiei endogenei, ne putem ntreba care este
partea de variabilitate explicat de una sau mai multe variabile exogene.
Relum modelul iniial:
(1)
Variabilitatea ne-explicat de cele q exogene n modelul (1) este variabilitatea rezidual asociat
modelului (2).
Fie:
2
(yt a1 x1t a 2 x2t ... a q xqt ) =
(y
2
a1 x1t a 2 x 2t ... a p x pt ) =
42
Variabilitatea explicat de cele (p-q) exogene din modelul (1) atunci cnd a1,...,aq sunt estimai cu
modelul (2) este atunci:
2
2
=
Xp
(L)
tim c
Hq
Hp
Xq
X1
0 A = 0H
2
2
+ HA , adic Y 'Y = Y 'Y + ' .
Suma ptratelor
corespunztoare acestei surse
Yp 'Yp
Numrul gradelor
de libertate
p
Media ptratelor
asociate
Yp 'Yp
p
2.
: mulimea reziduurilor
T-p
'
Tp
Y 'Y
Y 'Y
T
p-q
'
pq
3. Y: variabil endogen
Yp = 0 H p este proiecia lui Y pe subspaiul (L) ai crui vectori generatori sunt X1,X2,...,Xp.
Yq = 0 H q este proiecia lui Y pe subspaiul generat de X1,X2,...,Xq.
43
de
la
variabilele
exogene
X1
X2,
printr-un
model
liniar
de
forma:
Y = a1 X 1 + a2 X 2 + a3 + , unde:
x11
y1
x 21
1
x1 2
y2
x 22
Y = , X 1 = , X 2 =
, = 2
...
...
...
...
y
x
x
T
2T
T
1T
adic:
Y = Xa + , unde:
x11
X = ...
x
1T
x 21
...
x 2T
1
a1
..., a = a 2
a
1
3
yt
x1t
x2t
100
100
100
106
104
99
107
106
110
120
111
126
111
111
113
116
115
103
123
120
102
133
124
103
137
126
98
S observm c numrul de observaii (T=9) este mic, din raiuni de simplificare a calculelor.
Vom estima modelul, presupunnd c sunt ndeplinite ipotezele principale ale modelului liniar
general de regresie:
-
ipoteze
stochastice:
E ( ) = 0, E ( . ) = 2 I , (homoscedasticitate),
E ( t . s ) = 0 , dac t s
adic:
E ( t2 ) = 2 , t.
- ipoteze structurale: dac numrul de variabile exogene veritabile este k, atunci p=k+1 este
numrul parametrilor de estimat. Trebuie ca rangul matricii X s fie egal cu p (p<T), iar matricea
( X X ) ,
unde
Atunci,
Z = Y Y , U 1 = X 1 X 1 , U 2 = X 2 X 2 , =
unde:
Y =
1
1
1
1
y t , X 1 = x1t , X 2 = x 2t , = t
T t
T t
T t
T t
modelul se scrie:
Z = a1U 1 + a 2U 2 + , sau Z = Ub +
y1 y
x11 X 1
y2 y
Z =
,U = ...
...
x X
1
1T
y y
T
Deoarece
X2 =
Y =
1
T
x 21 X 2
1
a1
...
, b = , = ...
a2
x 2T X 2
T
1
1
1
1
yt = 1053 = 117, X 1 = x1t = 1017 = 113,
T t
9
T t
9
x
t
, unde
2t
1
954 = 106 , valorile centrate ale variabilelor sunt:
9
Z = Y Y
U1 = X 1 X 1
U2 = X 2 X2
-17
-13
-6
-11
-9
-7
-10
-7
+4
+3
-2
+20
-6
-2
+7
-1
+2
-3
+6
+7
-4
+16
+11
-3
+20
+13
-8
a
1
b = 1 = (U U ) U Z , avem nevoie de matricile:
a 2
45
... u1T
u
U U = 11
u 21 ... u 2T
u11
...
u
1T
... u1T
u
U Z = 11
u 21 ... u 2T
z1
u1t z t 872
=
... =
z u 2t z t 72
T
(U U )1
650 112
=
112 648
u 21
u12t
... =
u u
1t 2t
u 2T
648
= 408656
112
408656
648
1
b = 1 = (U U ) U Z = 408656
112
a 2
408656
Pentru
determina
estimatorul
celui
u u
u
1t
2t
2
2t
650 112
=
112 648
112
408656
650
408656
112
408656
de
al
treilea
parametru,
a3,
utilizm
iar
reziduurile
relaia:
Y = a1 X 1 + a 2 X 2 + a 3 , de unde:
estimat
este:
sunt:
relaia:
2 =
1
t2
Tp
. Dar,
( )
= Y Y = (Y Y ) Y Y = Z Z = Z Ub , iar
2
t
)(
872
= = Z Ub Z Ub = Z Z bU Z . Avem c: U Z =
72
872
= 1179,5704
Z Z = z t2 = 1248 i bU Z = (1,3629 0,1244)
72
2
t
2 =
1
68,4296
t2 =
= 11,4049
Tp
93
46
b este:
= 2 (U U )1
cu
b = 2 (U U )
, iar o estimaie a ei se
2 . Avem c:
648
= (11,4049) 408656
112
408656
112
408656
R2 =
( y y ) = z = 1248
Variabilitatea rezidual = = 68,4296
2
Variabilitatea total =
2
t
2
t
R2 =
1179,5704
= 0,9451 .
1248
Tabelul de analiz a varianei (variabile centrate):
Sursa variabilitii
3. Reziduurile
Suma ptratelor
corespunztoare acestei surse
Numrul gradelor
de libertate
T-1=8
Media ptratelor
asociate
= 1179,5704
k=2
1
z t2
= 68,4296
T-k-1=6
1
t2
T k 1
2
t
2
t
2
t
= 1248
47
1
z t2
T 1
CAPITOLUL IV
STUDIUL MODELULUI LINIAR CND IPOTEZELE CLASICE ASUPRA ERORILOR
NU MAI SUNT REALIZATE
2 I , iar
= E ( ') 2 I nu
E ( ) = 0 ).
Pentru ca
a = MY = MXa + M = a + M
Matricea de varian i covarian a estimatorilor (innd cont c
a a = M ) este:
a = E [(a a ) (a a )] = E [M ( M )] = E [M M ] = ME ( ) M = M M
Punnd condiia ca
M = X 1 X
X 1
a = MY = X 1 X
a = X 1 X
Estimatorul
X 1Y
a astfel obinut este un estimator liniar, nedeplasat i de dispersie minim. El a fost obinut
adic
48
estimaia ei
. n aplicaii, deoarece
Corelarea erorilor
t = t 1 + t
poate mbrca diverse forme. Cel mai frecvent se studiaz cazul cnd
t = t 1 + t ,
(n care
E ( t1 t 2 ) = 0 , pentru t1 t 2
-
ecuaia
E ( t ) = 0 ,
(1)
pentru
t-1
este:
< 1 ):
(2)
yt 1 = a1 x1(t 1) + a 2 x 2 (t 1) + ... + a p x p (t 1) + (t 1)
Prin scderea (1)-(2) obinem:
(3)
(4)
unde:
z t = a1u1t + a 2 u 2t + ... + a p u pt + t
z t = yt yt 1
u it = xit xi (t 1) , i=1,2,...,p.
t = t t 1
Deoarece, prin ipoteze, erorile
(4) care va conduce la estimatorul
Dar, cum parametrul nu este cunoscut, pentru estimarea parametrilor unei ecuaii de regresie
atunci cnd erorile sunt corelate (sub forma unui proces autoregresiv de ordinul I,
49
t = t 1 + t ,
urmtoarele metode:
Metoda I:
Se aplic MCMMP obinuit ecuaiilor (1) fr a ine cont c erorile
1.
Se obine estimatorul
estimaiile erorilor
sunt corelate.
t = yt y1t .
2.
t = t 1 + t , obinnd .
nlocuim cu
3.
obine estimatorul
a pentru parametrul a.
Metoda II:
Ecuaia (3) de mai nainte se poate scrie i sub forma:
(5)
2.
nlocuim
a 0 .
4.
Se opresc iteraiile dac valorile gsite n dou iteraii succesive nu difer dect printr-
a i , i=1,2,... converg).
= {0;0,01;0,02;...;1}.
Aplicm MCMMP obinuit ecuaiei (3) pentru fiecare valoare a lui i calculm reziduurile
Se reine valoarea lui care d cea mai mic sum a ptratelor erorilor
estimatorii
a1 , a 2 ,..., a p ai parametrilor.
50
2
t
t .
, creia i corespund
***
Exist i alte proceduri de estimare a parametrilor n cazul cnd erorile sunt corelate.
Atunci cnd ipotezele fundamentale ale modelului liniar al regresiei nu sunt ndeplinite
proprietile estimatorilor parametrilor sufer. Astfel, sub ipoteza I2 referitoare la distribuia erorilor i la
independena lor, estimatorii obinui sunt nedeplasai i au variana minimal. Dac erorile sunt corelate,
estimatorii rmn, n general, nedeplasai, dar matricea de varian i covarian a acestora nu mai este
2 I . Pentru a ne asigura de independena erorilor trebuie s efectum teste. Este vorba despre testul lui
Durbin i Watson.
Modelul liniar general al regresiei:
yt = a1 x1t + a 2 x 2t + ... + a p x pt + t
se poate scrie sub forma:
yt = axt + t
unde:
a = (a1 , a 2 ,..., a p ) i
x1t
x2 t
xt =
... .
x
pt
y t = axt
i erorile estimate
a = (a1 , a 2 ,..., a p ) ,
calculndu-se
t = yt y t .
xt , deoarece:
t = yt y t = (a a )xt + t .
Se consider variabila aleatoare, notat
ecuaia:
T
d =
( )
t =2
t2
t 1
t =1
51
( )
( )
()
d , notat f d
()
f d oscileaz ntre
t .
(reprezentate grafic n figur) sunt atinse pentru anumite iruri de exogene xt i sunt simetrice n raport cu
axa de abscis 2.
()
f d
d1 d2
d1
d2
Scopul este de a ti dac erorile modelului sunt autocorelate. Cel mai frecvent se caut testarea
legturii erorilor printr-o relaie de forma
t = t 1 + t .
=0
>0
sunt autocorelate).
La un nivel de semnificaie dat, Durbin i Watson au determinat dou valori, d1 i d2, n funcie
de numrul de observaii (T) i de numrul de exogene veritabile (m) corespunztoare fiecreia din curbele
limit.
Se calculeaz statistica d cu relaia dat i se observ c:
1.
52
2.
dac
d 1 < d < d 2 , atunci exist ndoieli c legtura dintre erori este de forma
t = t 1 + t ;
3.
n tabelul urmtor sunt date cteva valori uzuale pentru d1 i d2 n funcie de T i m, pentru nivelul
de semnificaie =0,05:
Tabela D-W
T
m=1
m=2
m=3
m=4
m=5
d1
d2
d1
d2
d1
d2
d1
d2
d1
d2
15
1,08
1,36
0,96
1,54
0,82
1,75
0,69
1,97
0,56
2,21
20
1,20
1,41
1,10
1,54
1,00
1,68
0,90
1,83
0,79
1,99
30
1,35
1,49
1,28
1,57
1,21
1,65
1,14
1,74
1,07
1,83
50
1,50
1,59
1,46
1,63
1,42
1,67
1,38
1,72
1,34
1,77
100
1,65
1,69
1,63
1,72
1,61
1,74
1,59
1,76
1,57
1,78
Observaii:
1. n loc s testm
dou valori
=0
contra
a. dac
b. dac
c. dac
d ca i cnd modelul ar
conine o constant.
3. Statistica Durbin-Watson aplicat pe un model care conine variabile endogene retardate este
deplasat ctre 2, ceea ce nseamn c erorile sunt mai puin corelate ntr-un proces autoregresiv, dect ntrun proces ordinar.
53
I. Se cunosc urmtoarele date referitoare la evoluia n timp a unei variabile economice (n preuri
constante):
t
yt
662,3
669,4
912,7
935,2
1027,2
1145,0
1193,7
1224,1
10
11
12
13
14
15
yt
1281,7
1426,3
1376,2
1327,8
1420,6
1933,9
2023,4
yt = a t + b + t
obinndu-se estimatorii:
a = 81,8657 ; b = 582,404
De asemenea, s-a calculat variana estimatorilor i ecartul-tip al acestora:
b = 72,2721
reziduurilor
a = 7,94887 ;
variabilei endogene
t = y t y t :
y t
664,2
746,1
828,0
909,8
991,7
1073,6
1155,5
1237,3
10
11
12
13
14
15
y t
1319,2
1401,0
1482,9
1564,6
1646,6
1728,5
1810,4
-1,93
-76,79
+84,79
+25,35
+35,49
+71,44
+38,30
-13,25
10
11
12
13
14
15
-37,54
+25,25
-106,64
-237,01
-226,00
+205,42
+213,03
Rezolvare:
Pentru a putea utiliza testul Durbin-Watson trebuie ca numrul de observaii T s fie suficient de
mare (n practic T>15), iar modelul s conin un termen constant.
T
d =
(
t =1
2
t 1 )
t =1
tabel, la:
265867,35
d =
= 1,156 .
229991,79
54
2
t
Durbin i Watson au artat c pentru un proces staionar (primele dou momente ale variabilei
aleatoare
corelaiei n vecintatea lui 2. ntre aceste valori limit, tabela D-W furnizeaz, la pragul de seminificaie ,
diferite intervale de valori
dac
2.
dac
3.
dac
4.
dac
5.
dac
n exemplul nostru, numrul de exogene veritabile n model este (m=1) i dispunem de T=15
observaii.
Tabela D-W furnizeaz valorile d1=1,08 i d2=1,36 la pragul de semnificaie =0,05.
Deoarece
sunt corelate.
Anul
Investiii n agricultur
yt
x1t
x2t
1985
85,2
563,8
90,6
1986
90,2
594,7
91,7
1987
96,6
635,7
92,9
1988
112,0
688,1
94,5
1989
124,5
753,0
97,2
1990
120,8
796,3
100,0
1991
131,5
868,5
104,2
1992
146,2
935,5
109,8
1993
140,8
982,4
116,3
1994
160,0
1063,4
121,3
1995
188,3
1171,1
125,3
55
Anul
Investiii n agricultur
yt
x1t
x2t
1996
220,0
1306,6
133,1
1997
214,6
1412,9
147,7
1998
190,9
1528,8
161,2
1999
243,0
1702,2
170,5
2000
303,3
1899,5
181,5
2001
351,5
2127,6
195,4
2002
386,2
2368,5
217,4
Se cere:
1.
2.
3.
Rezolvare:
-
yt = a + bx1t + cx2t + t
Aplicarea
MCMMP
conduce
urmtoarea
la
estimare
modelului:
d = 0,72 .
t ,
Conform tabelei D-W, pentru =5%, T=18 observaii i m=2 variabile exogene veritabile, rezult:
d1=1,05> d
(2)
yt 1 = a + bx1( t 1) + cx2 (t 1) + t 1
56
y t = 47,56 + 0,70 yt 1 + 0,68 x1t 0,60 x1(t 1) + 3,08 x2t 2,11x2(t 1) Estimaia
gsit pentru coeficientul este
-
cu ajutorul estimaiei gsite, transformm variabilele modelului iniial pentru o nou regresie:
z t = y t y t 1
Anul
= 0,70
u 2t = x2t x2( t 1)
1985
1986
30,56
200,04
28,28
1987
33,46
219,41
28,71
1988
44,38
243,11
29,47
1989
46,10
271,33
31,05
1990
33,68
269,70
31,96
1991
46,94
311,09
34,20
1992
54,15
327,55
36,86
1993
38,46
327,55
39,44
1994
61,44
375,72
39,89
1995
76,30
426,72
40,39
1996
88,19
486,83
45,39
1997
60,60
498,28
54,53
1998
40,68
539,77
57,81
1999
109,37
632,04
57,66
2000
133,20
707,96
62,15
2001
139,19
797,95
68,35
2002
140,15
879,18
80,62
Observaie:
Pentru a evita eliminarea primei valori din irul de observaii, prin trecerea la diferene, se pot
folosi transformrile:
z1 = y1 1 2 , u11 = x11 1 2 , u 21 = x 21 1 2
z t = a0 + a1u1t + a 2 u 2t + t , i rezult:
57
d = 1,54 .
d =1,54>d2=1,53
i nu n mod obligatoriu ca
eantioane mici. Testarea ipotezelor i intervalele de ncredere nu mai au aceleai proprieti dac legea de
distribuie a erorilor nu este legea normal. Pentru a caracteriza deviaiile de la legea normal se utilizeaz
doi coeficieni:
a)
1 =
unde:
3
2
3
2 =
4
3
2
2 < 0
Aceste deviaii afecteaz testele i intervalele de ncredere ale estimatorilor. Studiul teoretic al
acestor deviaii este complex. Pentru a obine teste i intervale de ncredere mai robuste, n practic se
procedeaz astfel:
1.
t .
2.
58
Se elimin din seria de date observaiile corespunzatoare acestor erori foarte mari sau
3.
4.
variaz n funcie de t.
n acest caz, estimatorii obinui sunt nc nedeplasai. Dar, momentele centrate de ordinul doi nemaifiind
constante se comite o eroare de calcul a ecartului-tip al estimatorilor. Se poate evalua deplasarea n
estimaia
valori
, xt
(1)
2
1
2t xt x = 0 ;
T t
(2)
1
T
(x
2
2
1
x =
T
(x
2
2
x .
Aceste relaiile sunt realizate atunci cnd nu exist nicio legtur sistematic ntre
xt .
suma ptratelor erorilor s fie minim, acetia pot fi determinai din condiia ca
t2
t 2
s fie minim.
expresia
1
( y
t
yt = axt + b + t , estimatorii a
2
axt b ) .
59
n cazul n care
( yt axt b )2
xt2
y
b
= t a s fie minim.
xt
t xt
100
75,6
75,6
77,4
78,3
80,1
81
200
80,1
81,9
83,7
83,7
84,6
84,6
300
85,5
88,2
89,1
92,7
92,7
94,5
400
92,7
95,4
98,1
101,7
103,5
105,3
500
104,4
106,2
108,9
112,5
117,9
117,9
y t = 0,08145xt + 67,965
yt = axt + b + t , obinem:
R 2 = 0,9 .
Dorim s testm ipoteza de homoscedasticitate a erorilor. n acest scop efectum dou regresii
separate, una pe primele 12 observaii, alta pe ultimele 12 (valorile lui X fiind ordonate cresctor).
Fie SPE1 i SPE2 suma ptratelor erorilor relative la cele dou regresii.
Regresia lui Y n raport cu X pentru primele 12 observaii, conduce la:
y t( 2 ) = 0,1125 xt + 54,45
respectiv
SPE 2
SPE1
este numrul de observaii, d este numrul de observaii omise (n cazul nostru d=6), k este numrul de
observaii luat n fiecare regresie separat, iar p este numrul parametrilor de estimat. n exemplul nostru T-
1
SPE 2
d-k-p=10. n aceste condiii, variabila aleatoare 10
are o distribuie Fisher cu 10 i respectiv 10
1
SPE1
10
60
SPE2 250,695
=
= 51,01 . Din tabelele
SPE1
49,14
Fischer-Snedecor,
la
pragul
de
semnificaie
corectate prin transformarea modelului. mprind fiecare termen al ecuaiei de regresie prin xt, rezult:
yt
b
=a+ + t
xt
xt xt
sau
z t = a + bu t + t , unde: z t = yt , ut = 1
xt
Se observ c
Var ( t ) = Var t
xt
xt
t =
t
xt
1 2
= 2 t = .
xt
zt ut T zu
b =
2
ut2 T u
a = z bu
Revenind n variabilele iniiale obinem:
y 1 1
y
1
t xt x T t xt x
t
t
t
t
b =
2
2
1 1
1
t x T x
t
t
y
1
1
1
a = t b
T t xt
T t xt
Efectund calculele, rezult:
sau
y t = 0,072 xt + 70,44 .
61
S remarcm faptul c panta dreptei de regresie (dup corectarea heteroscedasticitii) este mai
mic dect cea obinut naintea corectrii.
estimatorilor va fi mai mare. n astfel de cazuri este de preferat s se aleag un alt model econometric
pentru studierea legturii dintre variabile.
La fel trebuie procedat i atunci cnd se constat c variana erorilor nu este finit.
Atunci cnd variabilele care apar n model nu sunt variabile observate fr eroare, va exista o
corelaie ntre reziduuri i exogenele din model.
n acest caz, pentru a obine estimatori convergeni, s-a dezvoltat o metod de estimare special,
numit metoda variabilelor instrumentale, pe care o prezentm mai jos.
Fie modelul liniar general:
(necunoscute acum pentru c observaiile Y i X conin erori!) ale variabilelor din model.
Putem scrie c
~
~
Y = Y + , X = X + , unde i sunt variabile aleatoare. Vom presupune c
prin
expresiile
lor,
obinem
modelul
~ ~
Y = Xa + ,
unde
sub forma:
(1)
Y = a1 X 1 + a 2 X 2 + ... + a p X p + ,
62
scris
x p1
x11
x 21
.
.
.
unde X 1 = . , X 2 = . ,..., X p = .
.
.
.
x
x
x
1T
2T
pT
nmulim, succesiv, ecuaia (1) cu Z1, Z2, ...Zp i aplicm operatorul de medie E fiecrei ecuaii. Se
obine sistemul:
E (Z1 Y ) = a1 E (Z 1 X 1 ) + ... + a p E (Z 1 X p )
E (Z 2 Y ) = a1 E (Z 2 X 1 ) + ... + a p E (Z 2 X p )
(2)
....
E (Z Y ) = a E (Z X ) + ... + a E (Z X )
p
1
p 1
p
p
p
(a ,..., a ) exact
1
soluiile sistemului de ecuaii (2), n care speranele matematice sunt nlocuite cu momentele empirice
corespunztoare:
E (Z i Y ) =
1
zit yt , i=1,2,...,p
T t
E (Z i X j ) =
1
zit x jt , i,j=1,2,...,p
T t
Dac notm:
z11
Z = ...
z
1T
matricial:
x11
z p1
x p1
1
a = (Z ' X ) Z 'Y .
1.
MCMMP obinuit:
2.
MCMMP generalizat:
3.
metoda VI:
a = X ' 1 X
) ( X ' ) Y
1
1
a = (Z ' X ) Z 'Y .
Se trece de la 1. la 2. nlocuind
Se trece de la 1. la 3. nlocuind
Estimatorul
Considerm o anchet pe bugetele de familie pentru a studia consumul dintr-un anumit produs.
Ancheta cuprinde un eantion de T familii. Facem urmtoarele notaii:
y1t: cheltuielile totale ale familiei t;
y2t: cheltuielile relative la produsul studiat;
Vt: veniturile familiei t;
i scriem ecuaiile:
(1)
y1t = Vt + 1t
(2)
y 2t = aVt + b + 2t
Ne propunem s exprimm cheltuielile relative la produsul studiat n funcie de cheltuielile totale.
Vt = y1t 1t
y 2t = ay1t + b + 2t a 1t
sau, punnd
(3)
t = 2t a 1t :
y 2t = ay1t + b + t .
S observm c
1t = y1t Vt ,
y 2t = ay1t + b + t , t=1,2,...,T
64
1
1
1
y 2 t = a y1t + b + t
T t
T t
T t
y 2 = a y1 + b +
(4)
) (
y 2t y 2 = a y1t y1 + t
(5).
a =
(y
1t
)(
y 1 y 2t y 2
(y
1t
y1
t
Folosim ns metoda variabilelor instrumentale. Pentru aceasta, considerm variabila
instrumental centrat
[(
)]
)(
[(
)(
)] [(
)(
Dar, cum
[(
)]
)(
[(
)(
)(
[(
)(
)]
)].
)]
)(
1
1
VDt VD y2t y 2 = a VDt VD y1t y1 ,
T t
T t
de unde:
(VD VD)(y
a =
(VD VD )(y
)
.
y )
2t
y2
1t
65
(y
1t
y1
BIBLIOGRAFIE
1. Andrei, T.
3. Chow, G.
4. Dobrescu, E.
5. Gheroghi, M.
6. Giraud, R. -
7. Gourieroux, C.
Monfort, A.
8. Gujarati, R.N.
9. Isaic-Maniu, Al.
Mitru, C.
Voineagu, V.
10. Malinvaud, E.
11. Onicescu, O.
Botez, M.
Creu, A.
2003
Peptan, E.
16. Tnsoiu, O.
Pecican, E.S.
Iacob, A.
17. Tnsoiu, O.
18. Tnsoiu, O.
Iacob, A.
Bucureti, 1999
19. www.asecib.ase.ro/soft.htm
66