Documente Academic
Documente Profesional
Documente Cultură
Suport Curs Econometrie
Suport Curs Econometrie
IA
Prof. univ. dr. MIRCEA GHEORGHI Conf. univ.dr. SIMONA ROXANA P T RL GEANU
ECONOMETRIE
BUCURE TI -2008-
CUPRINS Introducere Capitolul I: Modele econometrice 1.1. Generalit i 1.2. Model aleator 1.3. Natura variabilelor care apar n model 1.4. Induc ia statistic 1.5. Identificarea modelului 1.6. Previziunea variabilei endogene 1.7. Vocabular uzual Capitolul II: Regresia simpl 2.1. Modelul liniar al regresiei simple 2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici p trate 2.3. Propriet ile estimatorilor 2.3.1. Covarian a estimatorilor 2.3.2. Determinarea unui estimator nedeplasat pentru varian a erorilor 2.3.3. Interpretarea geometric a metodei celor mai mici p trate 2.3.4. Coeficientul de corela ie liniar 2.3.5. Distribu ia de probabilitate a estimatorilor 2.4. Teste i intervale de ncredere 2.5. Previziunea cu modelul liniar 2.6. Experien de calcul Capitolul III: Regresia multipl 3.1. Modelul liniar al regresiei multiple 3.2. Determinarea estimatorilor parametrilor 3.3. Propriet ile estimatorilor 3.4. Determinarea unui estimator nedeplasat pentru varian a reziduurilor 3.5. Teste i regiuni de ncredere 3.6. Previziunea variabilei endogene 3.7. Coeficientul de corela ie multipl . Analiza varian ei 3.8. Experien de calcul Capitolul IV: Studiul modelului liniar cnd ipotezele clasice asupra erorilor nu mai sunt realizate 4.1. Ipoteza de independen a erorilor 4.1.1. Testarea ipotezei de independen a erorilor 4.1.2. Experien de calcul 4.2. Ipoteza de normalitate a erorilor 4.3. Ipoteza de heteroscedasticitate 4.3.1. Experien de calcul 4.4. Ipoteza de independen a erorilor n raport cu variabilele exogene 4.5. Ipoteza referitoare la faptul c variabilele sunt observate f r eroare 4.5.1. Experien de calcul Bibliografie 3 4 4 4 4 5 5 5 6 10 10 11 12 15 16 18 21 22 24 25 29 34 34 35 36 38 39 41 42 45 49 49 52 55 59 60 61 63 63 65 68
INTRODUCERE Dezvoltarea aparatului statistic furnizeaz economi tilor tot mai multe date cifrice despre procesele i fenomenele care au loc n timp i spa iu. Econometria este un mijloc de a exploata aceste date. No iunea de econometrie provine din termenii oikonomie (economie) i metron (m surare) i desemneaz totalitatea metodelor i tehnicilor de m surare a fenomenelor i proceselor care au loc n domeniul economic. Primele lucr ri econometrice au avut ca obiect func iile consumului, care leag nivelul consumului de venitul disponibil (aceste func ii stau la baza teoriei keynesiene). n decursul timpului, numero i autori au ncercat definirea econometriei. Lucrarea ECONOMETRIA PENTRU...ECONOMI TI, a profesorului Eugen tefan Pecican, ap rut la Editura Econmic n 2003, con ine multe referiri n acest sens, din care am selectat cteva. Autori R. Frisch P.A. Samuelson, T.C. Koopmans, J.R.N. Stone Fr. Perroux G.C. Chow W. Griffits, H. Carter, G. Judge Referin a Econometria realizeaz mbinarea punctelor de vedere care se refer la teoria economic , statistic i matematic cu privire la natura rela iilor cantitative din economie Econometria reprezint o analiz de natur cantitativ a fenomenelor economice, bazat pe dezvoltarea recent a teoriei culegerii i interpret rii datelor, n conexiune cu metodele de inferen (induc ie) statistic adecvate Econometria este o economie de inten ie tiin ific Econometria este un domeniu n care se mbin arta i tiin a de a utiliza metodele statistice n vederea m sur rii rela iilor economice Econometria este ansamblul metodelor de realizare a analizei datelor economice
Autorul lucr rii citate mai sus este de p rerea c obiectul econometriei const n cunoa terea mecanismelor de desf urare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natur statistic sau matematic . Defini iile date econometriei pun n eviden dou elemente: domeniul de studiu (economia, rela iile dintre variabilele economice) i metodele utilizate (provenite din statistic i matematic ). Econometria se orienteaz spre construirea de modele econometrice care s reprezinte simplificat procesele sau fenomenele economice analizate i s permit simul ri ale acestora, n scopul n elegerii lor, pe de o parte, dar i s serveasc la realizarea de previziuni, prognoze care s fundamenteze politicile economice, pe de alt parte.
Modelarea economic reprezint un proces de cunoa tere mijlocit a realit ii cu ajutorul unui instrument cu caracteristici speciale: modelul. Sistemul real supus studiului este nlocuit prin modelul s u, care este o reprezentare simplificat a obiectului cercetat. Modelul econometric este, de regul , o mul ime de rela ii numerice care permite reprezentarea simplificat a procesului economic supus studiului (uneori chiar a ntregii economii). Modelele actuale comport adesea mai mult de zece rela ii (ecua ii). Validitatea unui model este testat prin confruntarea rezultatelor ob inute cu observa iile statistice. Pentru a studia un fenomen economic se ncearc reprezentarea lui prin comportamentul unei variabile. Aceast variabil economic depinde, la rndul s u de alte variabile de care este legat prin rela ii matematice. De exemplu, dac se studiaz cererea (C) i oferta (O) dintr-un anumit bun pe o pia , se tie c cererea i oferta depind de pre ul (p) bunului respectiv. Putem scrie c variabilele C i O sunt func ii de variabila p i c la echilibrul pie ei, trebuie ca cererea s fie egal cu oferta. Se construie te astfel un model elementar de forma:
[1]
C ! f ( p) O ! g ( p ) C ! O
Oferta i cererea dintr-un anumit bun depind i de alte variabile dect pre ul. Astfel, cererea dintr-un bun alimentar depinde i de venitul disponibil, de pre ul unor produse analoage etc. La fel, dac este vorba despre un bun agricol (gru,...) oferta depinde de pre ul anului precedent. Rela ia stabilit ntre variabile n modelul econometric este dat , de regul , la un anumit moment de timp t, caz n care variabilele apar indiciate:
[2]
n modelul [2] s-au introdus mai multe variabile care explic cererea i oferta dintr-un bun i s-a considerat realizarea acestor variabile la momentul t sau t-1. Se observ c modelul comport mai multe rela ii. Se zice c avem un model cu ecua ii multiple. Evident, se va ncepe studiul cu un model mai simplu, cu o unic ecua ie. 1.2. Model aleator
S presupunem c se studiaz consumul (Ci ) dintr-un anumit bun de c tre o familie (i). ntre alte variabile, consumul depinde de venitul disponibil al familiei (Vi). Modelul econometric elementar const n a exprima Ci n func ie de Vi. Desigur, al i factori dintre care unii sunt necunoscu i determin de asemenea consumul familiei. Condens m efectele acestor al i factori ntr-unul singur, aleator, notat i. Se ob ine astfel un model aleator: [3]
C i ! f (Vi ) I i
Factorul aleator i este o variabil aleatoare care urmeaz o anumit lege de probabilitate, ce va trebui s fie specificat prin ipotezele f cute asupra modelului. Cel mai frecvent, ipotezele se refer doar la momentele de ordinul I i II ale variabilei aleatoare i. Urmeaz s ne asigur m c func ia f (sau clasa de func ii) aleas nu contrazice rezultatele experien ei. De exemplu, dac s-a ales f ca o func ie liniar (adic f(Vi) = aVi+b), modelul econometric este: [4]
C i ! aVi b I i
i variind pe i pentru diferitele familii studiate, ne vom asigura c rela ia [4] este bine satisf cut . Se spune c test m modelul. Dac rezultatul ob inut este convenabil, se va trece la estimarea parametrilor a i b. Apoi, definind o regul de previziune se va putea determina consumul Ci dac se cunoa te venitul Vi. 1.3. Natura variabilelor care apar n model
ntr-un model econometric se disting dou tipuri de variabile: -exogene. Sunt variabilele explicative ale variabilei studiate i se consider ca fiind date autonom. n modelul [4] Vi este variabila exogen (sau explicativ , independent ). Venitul familiei Vi explic n acest model 4
consumul familiei Ci. Valoarea variabilei exogene pentru un i dat i pentru i precizat- permite determinarea consumului Ci . -endogene. Sunt variabilele de explicat (sau dependente). Ci este variabila endogen n modelul precedent. Se poate remarca faptul c Ci este acum o variabil aleatoare datorit lui i. Distinc ia ntre natura variabilelor este foarte important i va trebui precizat ntotdeauna nainte de a studia modelul. Cnd modelul econometric a c p tat formularea matematic definitiv se spune c modelul a fost specificat. Modelul [4] de mai sus este specificat. Se cunoa te forma func iei f din expresia Ci = f(Vi) + i , adic f(Vi) = aVi+b. Ad ugarea variabilei exogene i d modelului formularea definitiv [4]. Mul imea parametrilor care definesc complet modelul econometric constituie structura acestuia. De exemplu, dac a = 0,7 i b = 23 iar urmeaz o lege de probabilitate normal de medie (speran matematic ) egal cu zero i dispersie (varian ) egal cu 5, atunci mul imea a = 0,7; b= 23; W = 5 constituie structura modelului [4]. Scopul va fi acela ca, plecnd de la cuplurile (Ci,Vi) asociate diferitelor familii i, s se determine structura adev rat a modelului. Cu alte cuvinte, plecnd de la un spa iu e antion definit de mul imea cuplurilor (Ci,Vi) s se determine structura adev rat a modelului n spa iul cu trei dimensiuni al structurilor a , b, W . Aici intervine induc iastatistic . 1.4. Induc ia statistic
Obiectul induc iei statistice este de a determina o procedur care, pornind doar de la observa iile statistice de care dispunem, s permit trecerea de la spa iul e antion la spa iul structurilor. Odat ce modelul a fost ales, se admite c exist un triplet (a, b, W ) care permite reprezentarea exact a procesului prin care valorile variabilelor observate au fost determinate. n cursul induc iei statistice modelul nu se mai modific . Procedura aleas a a cum se va vedea n continuare va consta n ob inerea de estimatori pentru parametrii a i b care s permit determinarea celor mai bune valori reale ale acestor parametri. Aceste valori se vor aprecia, n general, cu ajutorul unor intervale de ncredere construite la un prag de semnifica ie (E) dat. De exemplu, n modelul [4] se va g si c a[0,64;0,78] i b[20;27] cu o probabilitate de 95% (s-a considerat E=5%). Se poate estima i abaterea medie p tratic (W) a variabilei aleatoare i. Se va vedea rolul important jucat de aceast variabil aleatoare n modelul econometric. Identificarea modelului
1.5.
Consider m din nou modelul Ci=aVi+b+ i. S presupunem c procedura utilizat , pornind de la informa ia de inut , adic de la cuplurile (Ci,Vi), i=1,2,... nu conduce la o solu ie unic , ci la dou structuri distincte: s0 =a0 ,b0,W 0 , s1 =a1 ,b1,W 1. Deorece legea de probabilitate pentru precizeaz i legea de probabilitate pentru C, fiecare structur ( innd cont de valorile exogenelor i de legea lui ) conduce la o lege de probabilitate pentru C. Presupunem c structurile s0 i s1 conduc la aceea i lege de probabilitate pentru consumul C. Sunt posibile dou cazuri: s0 i s1 sunt distincte i nu putem alege ntre ele. Se spune c structurile considerate nu sunt identificabile i, ca urmare, modelul nu este identificabil. Din aceast cauz nu vom putea determina valorile parametrilor care figureaz n model; s0 i s1 nu sunt distincte, intersec ia lor nu este vid . Acestea vor permite identificarea unei p r i a parametrilor modelului (cei care apar in intersec iei). Se spune c cele dou structuri sunt echivalente, dar nu permit o identificare complet a modelului. Problema identific rii este important mai ales n cazul modelelor cu ecua ii multiple. Previziunea variabilei endogene
1.6.
Interesul unui model a c rui structur a fost determinat const n a-l utiliza pentru previzionarea variabilelor endogene ntr-o etap viitoare sau ntr-o circumstan dat , dac este vorba despre observa ii luate la acela i moment-, atunci cnd cele exogene au fost fixate. De exemplu, dac dorim s studiem evolu ia importurilor (Y) n func ie de produsul intern brut (X1) i de nivelul stocurilor (X2), modelul econometric este: yt=a1x1t+a2x2t+b+ t, t=1,2,...,T unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X1 i X2 (observa iile fiind anuale) permit determinarea parametrilor modelului. S presupunem c am g sit estima iile punctuale:
pentru anul 2007, trebuie s tim PIB-ul i nivelul stocurilor n anul 2007. Presupunnd c aceste variabile exogene sunt x1=1030 i x2=12,7 vom avea ca previziune pentru y: y2007=(0,14).1030+(0,6).(12,7)+6 sau, n general,
Observa ie. Asupra valorii previzionate trebuie s remarc m: - valorile exogenelor x1 , x2 au fost alese arbitrar, eventual innd cont de evolu ia lor trecut ; - specificarea modelului nu poate fi perfect , forma func iei alese pentru a explica evolu ia lui y neputnd fi suficient de precis ; - este posibil ca variabilele explicative (exogene) ale variabilei endogene (explicate), s nu mai intervin n acela i mod ca n perioada 1990-2005, cnd s-a studiat legatura dintre ele. Este posibil s aib loc un oc, o ruptur care s perturbe echilibrul dintre variabilele care explic fenomenul, la momentul previziunii. Este evident c toate aceste cauze pot constitui surse de eroare a previziunii. Vom vedea care sunt metodele de a minimiza eroarea de previziune. Rezumatul capitolului I Pentru construc ia i utilizarea unui model econometric, se parcurg urm toarele etape: - specificarea modelului (g sirea formul rii matematice definitive a leg turii dintre variabilele care descriu fenomenul sau procesul economic studiat); - estimarea parametrilor i testarea modelului cu ajutorul statisticilor (seriilor de date observate) deja cunoscute; - previziunea variabilei endogene. Vocabular uzual
1.7.
Dac sunte i familiariza i cu statistica matematic , pute i trece la capitolul II. n caz contrar, v reamintim aici cteva no iuni de baz . Lectura acestui paragraf credem c v va incita s revede i cursul de Statistic matematic . Nor de puncte Fiind dat o serie de date statistice n care valorile (xi,yj) apar efectiv de nij ori putem reprezenta ntr-un plan toate aceste valori prin puncte de coordonate (xi ,yj) afectate de coeficien ii nij , ob inndu-se astfel un nor de puncte. Ajustare Reprezentarea grafic a seriilor de date economice conduce frecvent la figuri pu in lizibile i greu de interpretat din cauza varia iilor pe termen scurt, numeroase i sensibile, dar f r o semnifica ie important . Metodele matematice numite de ajustare permit ob inerea unei curbe simple, ct mai apropiat posibil de mul imea de puncte furnizate de observa iile empirice disponibile. Ajustare liniar Atunci cnd reprezentarea grafic a unei serii statistice duble d un nor de puncte de form alungit , se ncearc ob inerea unei aproxim ri bune a acestei serii cu ajutorul unei drepte, realizndu-se astfel o ajustare liniar . Exist mai multe metode pentru g sirea acestei drepte: - metoda grafic (se determin punctul mediu M ale c rui coordonate sunt x, y i se traseaz dreapta care pare a fi cea mai reprezentativ a seriei, determinnd ecua ia Y=aX+b. Aceast metod este ambigu pentru c nu ine cont de ponderea fiec rui punct n norul de puncte); - metoda lui Mayer (se regrupeaz punctele norului n dou submul imi c rora li se determin punctele medii M1 i M2. Dreapta de ajustare este atunci dreapta care trece prin M1 i M2); - metoda celor mai mici p trate (const n a face minim suma p tratelor distan elor de la punctele norului la o dreapt de ecua ie Y=aX+b numit dreapt de regresie a lui Y n X. Se arat c panta (coeficientul director) acestei drepte este a=cov(X,Y)/Var(X). Coeficientul b se ob ine scriind c dreapta de regresie trece prin punctul mediu:
b ! Y aX . Procednd la fel se g se te dreapta de regresie de ecua ie X=adY+bd , cu ad=cov(X,Y)/Var(Y) i b d X a d . Cele dou drepte de regresie sunt, n general, distincte. Compararea lor permite m surarea nivelului ! Y
de corela ie al caracteristicilor X i Y. Corela ia se m soar cu coeficientul de corela ie V=cov(X,Y)/W(X)W(Y). Se constat c V2=aad i c V variaz ntre 1 i 1. V2 m soar unghiul dintre cele dou drepte de regresie, care coincid dac V2=1, adic
n afara faptului de a da o reprezentare mai mult sau mai pu in satisf c toare leg turii dintre X i Y, importan a ajust rii liniare este de a permite previziuni statistice, asociind lui X o valoare probabil a lui Y prin rela ia Y=aX+b. Probabilitate Fiind dat o mul ime finit ;, numim probabilitate pe ; orice aplica ie p a lui P(;) mul imea p r ilor lui ; - n intervalul [0,1A care verific trei condi ii: 6
- p(A)u0, pentru A P(;) - p(;)=1 - p(AB)= p(A)+ p(B), dac A,B P(;), AB=* ; se nume te univers (sau univers de probabilit i). ; nzestrat cu probabilitatea p se nume te spa iu probabilizat. Orice parte a lui ; este un eveniment. Un singleton (mul ime ce con ine un singur element) al lui ; se nume te eveniment elementar sau eventualitate. ; este evenimentul cert. * este evenimentul imposibil. A este evenimentul complementar lui A n ; (se nume te eveniment contrar lui A). Dac AB=*, evenimentele A i B sunt incompatibile. Variabil aleatoare Dac ; este un univers finit, numim variabil aleatoare orice aplica ie X: ; pR ( a lui ; n mul imea numerelor reale). Mul imea valorilor lui X, adic X(;) se nume te universul imagine. Aten ie!- o variabil aleatoare nu este o variabil , ci o aplica ie! Se observ c nu este necesar s cunoa tem o probabilitate pe ; pentru a defini o variabil aleatoare pe ;. Legea de probabilitate a unei variabile aleatoare Dac universul finit ; este nzestrat cu o probabilitate p, iar X este o variabil aleatoare definit pe ;, numim lege de probabilitate a variabilei aleatoare X, aplica ia px: X(;)p[0,1A care asociaz oric rui xX(;) probabilitatea evenimentului mul imea antecedentelor lui x prin X. Aceast mul ime X-1(x) este notat (X=x). Legea de probabilitate a lui X, notat px este definit prin px: X(;)p[0,1A, x pp(X=x). A studia o variabil aleatoare nseamn a-i descoperi legea sa de probabilitate. Func ie de reparti ie Dac universul finit ; este nzestrat cu o probabilitate p, iar X este o variabil aleatoare definit pe ;, se asociaz acestei variabile aleatoare func ia F:Rp[0,1A definit prin F(x)=p(X x) numit func ie de reparti ie a variabilei aleatoare X. Evenimentul (X x) este imaginea intervalului g, x prin func ia X. Func ia de reparti ie este o func ie n scar . Speran a matematic Dac X este o variabil aleatoare definit pe universul finit ;, nzestrat cu probabilitatea p, universul imagine este o mul ime finit i ia valorile xi , i=1,2,...,n. Legea de probabilitate a lui X asociaz fiec rui xi probabilitatea pi =p(X=xi). Se nume te speran matematic a variabilei aleatoare X, num rul real
E ( X ) ! p i xi
i !1
. E(X) este media n probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator
liniar. Varian a Dac X este o variabil aleatoare definit pe universul finit ;, nzestrat cu probabilitatea p, universul imagine este o mul ime finit i ia valorile xi , i=1,2,...,n. Legea de probabilitate a lui X asociaz fiec rui xi probabilitatea pi =p(X=xi). Se nume te varian a variabilei aleatoare X, num rul real pozitiv
Var ( X ) ! pi ( xi E ( X )) 2
i !1
R d cina p trat (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat W x. Momente condi ionate Se consider vectorul aleator
X , Y : ; p R 2
cu
reparti ia
P( X ! xi , Y ! y j ) ! pij , p ij " 0, P( X ! xi / Y ! y j ) ! p ij p. j
p
i j
ij
M ( X k / Y ! y j ) ! xik P( X ! xi / Y ! y j ) ! xik
i i
pij p. j
1 p. j
p
i
ij
xik
Similar se define te momentul de ordinul k al variabilei aleatoare Y condi ionat de X=xi. Pentru k=1 se ob in mediile condi ionate:
M (X /Y ! y j ) !
1 p. j
x p
i i
ij
, M (Y / X ! xi ) !
1 y j pij pi . j
Se pot defini variabilele aleatoare medii condi ionate astfel: - variabila aleatoare media lui X condi ionat de Y, cu reparti ia:
M (X /Y ! y j ) , p. j u 0, p. j ! 1 M (X /Y ) : p. j j
-variabila aleatoare media lui Y condi ionat de X , cu reparti ia:
M (Y / X ! xi ) , p i . u 0, p i . ! 1 M (Y / X ) : pi . i
Regresie Se nume te regresia variabilei aleatoare X n raport cu Y, variabila aleatoare M(X/Y) cu mul imea valorilor posibile: M(X/Y=y),
x R.
Similar, regresia variabilei aleatoare Y n raport cu X este: M(Y/X=x), y R. Dac M(X/Y)=aX+b sau M(Y/X)=cY+d se spune c regresia este liniar Reparti a normal Variabila aleatoare X urmeaz o reparti ie normal de parametri m i N (m, W ) ) dac densitatea ei de probabilitate (derivata func iei de reparti ie) este:
f ( x) !
Pentru m=0 i
1 W 2T
exp(
( x m) 2 ), x R, 2W 2 x2 ), x R, 2
m R, >0
f ( x) !
1 2T
exp(
Se arat c parametri m i 2 sunt media (speran a matematic ), respectiv dispersia (varian a) variabilei aleatoare X N (m, W ) . Reparti ia 2 (hi-p trat) cu n grade de libertate Variabila aleatoare X urmeaz legea de reparti ie hi-p trat cu n grade de libertate (se mai scrie i X H (n) ) dac densitatea ei de reparti ie este:
f ( x) !
1 n +( ) 2 2
n 2
n 1 2
x exp( ), x>0, n N * 2
i=1,2,...,n sunt independente, atunci variabila aleatoare
Dac
variabilele
n
aleatoare
X i N (0,1),
Y ! X i2
i !1
Reparti ia Student cu n grade de libertate S(n) Variabila aleatoare X urmeaz legea de reparti ie Student cu n grade de libertate dac densitatea ei de reparti ie este:
f ( x) !
1 x2 1 n n 1 n& , 2 2
n 1 2
, x R, n N *
Dac
variabilele aleatoare
Z!
X Y n
S (n) .
Reparti ia Fisher-Snedecor F(n1,n2) Variabila aleatoare X urmeaz legea de reparti ie Fisher-Snedecor cu n1 i n2 grade de libertate dac densitatea ei de reparti ie este:
n1
Dac
variabilele aleatoare
X 1 H (n1 )
X 2 H (n 2 )
X1 n aleatoare X ! 1 F ( n1 , n 2 ) . X2 n2
CAPITOLUL II REGRESIA SIMPL Studiem, pentru nceput, cel mai simplu model econometric: o variabil n cadrul capitolului este prezentat
endogen
reprezint
evolu ia
fenomenului considerat i aceast evolu ie este explicat printr-o singur variabil exogen . metoda de estimare a parametrilor care intervin ntr-un model econometric, se vor examina propriet ile estimatorilor ob inu i i se vor generaliza rezultatele analizei pentru modele mai complexe. ntr-o prima parte se va trata ob inerea estimatorilor parametrilor modelului i propriet ilor lor, iar ntro a doua parte se d o interpretarea geometric a metodei utilizate, determinarea intervalelor de ncredere referitoare la parametri i previziunea care poate fi f cut cu un astfel de model. 2.1. Modelul liniar al regresiei simple Consider m modelul: (1)
Se dispune de T observa ii asupra lui Y i X, adic T cupluri (xt, yt ) care sunt realiz ri ale lui X i Y. a i b sunt parametri reali necunoscu i pe care dorim s -i estim m cu ajutorul observa iilor (xt, yt ) cunoscute. Ipoteze fundamentale Pentru a putea ob ine rezultatele enun ate la nceput, vom simplifica lucrurile impunnd o serie de ipoteze restrictive asupra modelului. Ulterior, n alte capitole, se vor relaxa aceste restric ii, discutnd implica iile abandon rii unora din aceste ipoteze asupra calit ii estimatorilor. I1 : xt i yt sunt m rimi numerice observate f r eroare; X variabila explicativ se consider dat autonom n model; Y variabila endogen este o variabil aleatoare, prin intermediul lui I. I2 : a)- I urmeaz o lege de distribu ie independent de timp, adic media i dispersia lui I nu depind de t:
E I t
! 0, t ! 1,2,..., T ,
Var I t
! W I2 , cantitate finit , t .
Observa ie: S-au folosit aici, pentru medie i dispersie, nota iile
matematic i varian a unei variabile aleatoare. Se presupune c studen ii au cuno tin e elementare despre teoria probabilit ilor i statistic matematic . Altfel, ele trebuie rev zute! b)- Realiz rile lui I sunt independente de realiz rile lui X n cursul timpului. Aceasta este ipoteza de homoscedasticitate. n caz contrar, exist heteroscedasticitate. 10
c)- Independen a erorilor (se va vedea pe parcurs c variabila aleatoare I reprezint erori sau reziduuri). Dou erori relative la dou observa ii diferite t i t sunt independente ntre ele, nsemnnd c au covarian a nul :
d)- Normalitatea erorilor. Presupunem c I urmeaz o lege de reparti ie normal , cu media 0 i dispersia ceea ce poate fi scris astfel: I3 : Primele momente empirice ale variabilei X, pentru T foarte mare, sunt finite:
W I2 ,
I N , W I2 . 0
1 T xt Tg p x0 p T t !1
(media empiric ).
2 1 T xt x T pg p s 2 T t !1
(varian a empiric ).
Aceast ipotez va fi folosit pentru a preciza propriet ile asimptotice ale estimatorilor parametrilor a i b. Ipotezele I1, I2, I3 pot p rea foarte restrictive. Vom vedea ulterior ce consecin e are abandonarea unora dintre ele asupra propriet ilor estimatorilor lui a i b. 2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici p trate Determinarea estimatorilor parametrilor a i b (nota i cu
b)
(MCMMP) se face punnd condi ia ca suma p tratelor erorilor s fie minim , adic :
I t2 ! ?yt axt bA ! N a, b
.
2 t !1 t !1
Pentru ca 1.
condi ii necesare:
x 2N xaxb " 0 . x 2N xb 2
N a, b .
xN T ! 2yt axt b
xt
! 0 xa t !1 xN T ! 2yt axt b
1
! 0 xb t !1
T x 2N ! 2 xt2 "0 xa 2 t !1
11
x 2N ! 2T xb 2
T x 2N x 2N ! 2 x t . ! xaxb xbxa t !1
iar condi iile suficiente (de ordinul II) sunt verificate. Ecua iile condi ii de ordinul I (numite ecua ii normale, vezi justificarea geometric din partea a II-a), le mp r im la T, rezultnd:
T 1 1 T xt yt a xt2 b x ! 0 T t !1 T t !1 . ax b ! 0 y
Din a doua ecua ie avem
b ! y ax
t t
1 xt yt y x ! a! T 2 1 2 xt x T
Am ob inut estimatorii
x y T y x ! y y
x x
. x T x x x
t t 2 t 2 2 t
yt y xt x a , ! 2 2 xt x b ! y ax
Observa ie:
a este o variabil aleatoare pentru c e func ie de yt, iar b este aleator pentru c e func ie de a .
2.3. Propriet ile estimatorilor
Vom ar ta c estimatorii a i
b ob inu i prin metoda celor mai mici p trate sunt nedeplasa i i convergen i. n
i b. Vom considera modelul (1)
demonstra ie vom ine cont de ipotezele I1, I2, I3. Pentru a u ura demonstrarea propriet ilor enun ate, transform m mai nti expresiile (2) pentru a le exprima n func ie de parametrii a
to i t i mp r im la T. Rezult :
1 1 1 y t ! a T xt b T I t T
, adic
12
2
y ! a x b I .
Sc dem membru cu membru pe (2) din (1):
yt y ! a xt x I t I
i nlocuim
t
y y
n expresia lui a :
t
! a x x
I
x x
! A I x x
x x
I x x
I x x
! a I x x
!a x x
x x
x I t I xt x
t 2 t t t 2 t t t t t t 2 2 t t
? x a a!
(deoarece
I ( x
x) !I ( xt x) ! 0 ). y ! a x b I , astfel c prin
0 ! a a x b b I sau b ! b I a a x . Am ob inut c :
x x
b ! b I a a
x .
2 t
a !a
I t xt x
sunt estimatori nedeplasa i pentru a i b. media estimatorului este chiar parametrul estimat. Vom aplica n rela iile g site mai sus. Pentru comoditate, not m cu wt cantitatea:
wt !
x x
2 t
xt x
, astfel c
a ! a I t wt
Rezult :
E a ! E a wt E I t ! a , pentru c
E(a)=a i E(It)=0.
E b ! E b
E I xE a a
Avem c : E(b)=b,
1 1 E I ! E I t ! E I t ! 0 T T
E a a
! E a
E a
! a a ! 0 , deci E b ! b .
13
tiind c
E a
! a
pentru ca
E b !b,
este suficient s
ar t m c
Var a T pg p 0
Var b T pg p 0
estimatorilor
bs
b.
, adic
tim c
a ! a wt I t
a a ! wt I t
E I t2 ! W I2
,
E I t I t ' ! 0 , pentru
t { t ' , rezultnd:
Var a
! wt W I ! W I
2 2
2 t
x x 2 t dar wt ! xt x
! 2
x x
2 t
este:
Var a !
x x
.
2 t
W I2
2 1 xt x Tg p s 2 i avem c p T
W I2 Var a ! 2 T pg p 0 . Ts
Am ob inut c
a T pg p a
b
2
2 2 2 2 2 Var b ! E b b ! E I a a x ! E I 2I xa a a a x ! 2 2
? A ! E 2 xE ? a a A x E a a I I
(deoarece
E I t I t ' ! 0 ).
14
T t !1
dar
w !
t t !1
xt x
t
x
x x
2
x x
! 0 ,
t
adic
E I a a ! 0 .
Dispersia estimatorului
este:
2 x ) ! W 2 1 Var (b I 2 T ( xt x)
Cum ns
1 p 0 i T T pg
P
1
t
x
1 p 0 rezult c Ts 2 T pg
Var b T pg p 0 ,
adic 2.3.1.
b T pg p b
Covarian a estimatorilor a i
cov a, b ! E a E a
) b E (b ! E a a
b b !
2
A
?
A ?
I A I ! E ?a a
xa a
! E ? a a
xa a
A! xW ! E ? a a
A xE a a
! xVar a
! I
2 2 I t
x x
2
Matricea de varian
i covarian a lui
a i b , notat
; a ,b este deci:
15
Var a ; a ,b ! cov b, a
W I2 2 cov a, b xt x ! Var b xW I2 2 xt x
xt x 2 1 ! x W I2 T x x 2 t
xW I2
1 2 xt x 2 ! WI x xt x 2
xt x 2 1 x 2 T x x t
Se remarc faptul c
; a ,b con ine
pe
; a ,b ,
Var (I t ) ! W I2 .
Not m aceast
estima ie cu
W I2 .
Determinarea unui estimator nedeplasat pentru varian a erorilor
2.3.2.
Utiliznd estimatorii a i
ajustate ale variabilei endogene):
b putem calcula estima ia variabilei endogene yt, notat yt (se mai numesc i valori
y t ! ax t b .
yt este un estimator pentru eroarea
I t . Not
I t ! yt yt . Avem c
Remarc :
It
It
b b ! I a a x
i nlocuind ob inem:
I t ! I t a a
xt I a a
x ! I t I a a
xt x
iar prin ridicare la p trat:
I t2 ! I t I
2a a
x
2
x I t I a a
xt x
2
.
2
2
1 1 It2 ! T I t I T
Dar:
1
2a a
T x x
I
2 t
I a a
1 xt x T
.
2
aa !
I x x
, x x
t t 2
x I t I ! I t xt x I xt x ! I t xt x I xt x ! a a
xt x
16
pentru c
I xt x ! 0 .
nlocuind, rezult :
1 1 It2 ! T I t I T
Not m cu calcul m media
1
a a
T x x
2 2 2 t
W2 !
1 It I T
dispersia erorilor fa
2
E 2 : W
1 1 It2 ! T I t I T
1
a a
T x x
,
2 2 2 t
1 W I2 ! E It2 , a a c T 2
, notnd
W I2 !
1 It2 , am T 2
ob inut:
E I2 ! W I2 , adic W I W
2
este un estimator nedeplasat pentru
W I2 (varian a erorilor).
yt ! axt b I t
W I2
este T-2. (T-2) constituie num rul gradelor de libertate. Vom reveni ulterior asupra acestei
a!
y y
x x
x x
t t 2 t
b ! y ax
W I2 ! 1 It2 T 2
17
W I2
; a ,b , notat ; a ,b :
Var a
; a ,b
! cov a, b
Var a
!
x
W I2
t
cov a, b , Var b
unde:
x
,
2
2 x !W 21 I Var b T xt x
2 ,
cov a, b ! x Var a .
2.3.3.
Am determinat estimatorii a
minimului sumei p tratelor erorilor
2 t
s fie
minimal , cu ajutorul unei reprezent ri grafice. Aceast condi ie va consta n egalitatea cu zero a dou produse scalare care redau ecua iile normale. Modelul
y t ! axt b I t
Y ! aX bU I
y1 x1 I1 1 y2 x2 I2 1 . . . . unde: Y ! , X ! , U ! . , I ! . . . . . . . . 1 y x I T T T
n spa iul ortonormat
T consider m vectorii Y, X, U i I.
18
A Y
Y
I X
(L)
Vectorul 0H=aX+bU apar ine planului (L) determinat de vectorii X i U. Fie 0A=Y, 0B=X, 0C=U, HA=I. Cantitatea traduce
2 t
! I
! HA
cu
este minimal dac HA este ortogonal pe (L), adic pe X i U. Aceast condi ie se a produsului scalar al vectorilor respectivi:
prin
egalitatea
zero
HA 0B ! 0 , sau HA 0C ! 0
xt yt a xt2 b xt ! 0 . y t a xt T b ! 0
A efectua o regresie a variabilei Y asupra variabilei X n modelul proiecta vectorul Y pe planul (L) din
yt ! axt b I t
revine, deci, la a
T determinat de X i U.
yt ! b I t . O reprezentare analog
A Y 0 U
n scriere matricial , modelul este OA=OH+HA.
Y ! bU I
19
2 t
! HA
Y bU ,U "! 0 sau
Ecua ia varian ei Relu m reprezentarea geometric precedent i not m cu K proiec ia lui A pe suportul vectorului U:
A
I
Y
Y
H K
(L)
1
AK
tim c
! KH
HA
i
y t ! ax t b
1 1 y t ! a T xt b , T
adic :
y ! ax b .
Dar
y ! a x b , rezultnd c y ! y .
Deoarece: AK=0A-0K ( (A0 K dreptunghic n K) HK=0H-0K ( ( 0 HK dreptunghic n K), rezult , folosind (1):
2
yt y
2
!
!
y
2 t
Variabilitatea total
Variabilitatea rezidual
Aceasta este ecua ia varian ei. Vom reveni asupra ei cnd vom aborda regresia multipl .
20
2.3.4. Coeficientul de corela ie liniar Coeficientul de corela ie liniar ntre variabilele X i Y, notat V, se calculeaz cu rela ia:
XY
W X W Y
a! a
y y
x x
, astfel c x x
t t 2 t 2 t 2 t
putem scrie:
y y
x x
x x
V! x x
y y
x
2 t t t 2 2 t t
x
de corela ie n func ie de estimator, iar prin ridicare la p trat: Un calcul imediat arat c :
V !
a 2 xt x
t
. y y
2 2 2 2 2 t t
2 2 y ! y t y ! a xt b a x b
! ?ax x
A !a x x
. A
2
y
2 t
y ! yt y I t2 , de unde:
y ! y
t t
! y y
I y
y y
y
2 2 2 t 2 t
!1
I
t
2 t
y
Pe de alt
i notnd cu
unghiul
KH , AK
cos 2 E !
KH AK
2 2
y y
t t
, adic y
y
2 2
V ! cos E ! 1
I
t
2 t
y
2 .
0 e V 2 e 1 i 1 e V e 1. V ! 0 , nu exist o rela ie de tip liniar yt ! axt b ntre yt i xt, adic a=0. V 2 ! 1 , yt este legat de xt printr-o rela ie de forma yt ! axt b . V ! 1 implic a>0, iar
V ! 1 implic a<0.
Cnd rela ia dintre yt i xt nu este strict , adic V fiind cel al lui a.
21
Deoarece erorile It t=1,2,...,T au o distribu ie normal , de medie zero i dispersie probabilitate a lui It este:
W I2 , densitatea de
f I t !
1 WI
1 I t2 , t ! 1,2,..., T . exp 2 2T 2 WI t { t ' , densitatea de probabilitate a vectorului aleator (I1 , I2, ..., IT) va fi
T
1 I t2 1 exp 1
f I 1 , I 2 ,..., I t
! 2 W 2T 2 WI I
Dar,
I t ! yt axt b
(deoarece
yt axt b ! yt yt ! I t ).
2 t 2 2
A b I I ! y ax b
! ? a a
x b
! b ! I a a
x b
2I a a
x 2I b
2a a
b
! b b x
t t t t 2 t 2 2 t 2 t t t t 2 ! I t2 a a
xt b b ! I t2 a a
xt b b
A
2
2I t a a
xt ! 0 , 2I t b b ! 0 pentru c a a cum arat reprezentarea grafic , vectorul I este ortogonal la I , X "! 0 i I ,U "! 0 ).
'
planul (L), prin urmare este perpendicular pe orice vector din acel plan, deci i pe X i U. Produsele scalare cu ace ti vectori vor fi nule, adic : ntr-o scriere matricial :
a a xt b b
A
2
a a xt2 ! b b T x
T x a a b b T
( las m studen ilor pl cerea de a verifica !). nlocuind n (1) fiecare It prin expresiile calculate mai sus, deducem densitatea de probabilitate a vectorului aleator (y1 ,y2,...,yT):
1 y ax b
2 exp 1 t 2 t N y1 , y2 ,..., yt
! ! WI 2 W I 2T
T
1 ! W 2T I
xt2 Tx
T x a a b b T
22
i covarian
T
a estimatorilor,
; a ,b , se arat
u or c :
1 W I2
xt2 Tx
probabilitate a lui
I
2 t
Cu aceste rezultate i f cnd apel la unele teoreme importante ale statisticii matematice, putem deduce urm toarele distribu ii de probabilitate: 1. Deoarece
W I2 !
1 It2 T 2
2 1 W I W I2
, adic
! T 2 I2 , W
raportul
T 2 W I2 !
2 t
libertate. (Vectorul
2.
2 W I2 W a ! 2 2 WI Wa
a , respectiv
pentru estima ia acesteia). Atunci variabila aleatoare definit G2 cu (T-2) grade de libertate. 3. Cuplul
, b a
aa N 0,1 ; W a
bb N 0,1 ; W b
bb S T 2
. W b
Expresia
' 1 a a 1 a a ; a ,b
F ! b b b b este 2
4.
2.4. Teste i intervale de ncredere Pentru c exist tabele cu valorile legilor de probabilitate anterioare, putem determina intervale de ncredere pentru parametrii a i b la un nivel de semnifica ie E fixat.
a a Prob e tE ! 1 E W a
tE
este luat din tabela distribu iei Student cu (T-2) grade de libertate. Un calcul simplu conduce la intervalul
a tE W a e a e a tE W a
ceea ce permite afirma ia c adev rata valoare a parametrului real a , se g se te n intervalul de valori
?a tE W a ;
a tE W a A
cu probabilitatea 1- .
Cnd se dore te testarea unei valori a0 a parametrului a, este suficient, pentru a accepta aceast valoare cu riscul E, s ne asigur m c :
a a0 e tE . Wa
Altfel spus, este suficient ca a0 s apar in intervalului de ncredere stabilit: De asemenea,
a 0 ?a tE W a , a tE W a A.
a Prob_ e F ,2, T 2 ! 1 E . F E
F ! F ,2, T 2
este ecua ia unei elipse cu centrul n w, b
care define te astfel o regiune de ncredere E a
pentru cuplul
a, b la nivelul de semnifica ie E:
B w
b
B A
a
24
Proiec iile acestei elipse pe axe determin , de asemenea, dou intervale de ncredere pentru a i b, centrate n
a i b . Dar, este important de remarcat c , nivelul de semnifica ie referitor la aceste intervale nu mai este nivelul E
asociat elipsei. Dac se dore te testarea simultan a dou valori a0, b0 alese apriori, este suficient s nlocuim a i b n expresia F prin a0 i b0. Dac
F a0 , b0 e F E ,2, T 2 se accept
accepta cuplul (a0, b0) la nivelul de semnifica ie E este suficient ca punctul M0(a0,b0) s apar in elipsei de ncredere asociat cuplului (a, b).
N y1 , y2 ,..., yT
se descompune n doi factori (g i h). g se exprim doar n func ie de I t , adic n a , b ; h nu con ine dect pe a , b , a i b. Aceasta arat c , odat cunoscut o realizare a
a lui yt (dat de factorul g) nu depinde dect de valorile
adic ei rezum toat informa ia pe care e antionul o poate aduce despre a i b. 2. Cnd ipoteza de normalitate asupra erorilor
y1 , y 2 ,..., yT este chiar func ia N y1 , y 2 ,..., yT . Pentru ob inerea de estimatori ai lui a verosimilit ii maxime, este suficient s maximiz m expresia N y1 , y 2 ,..., yT , adic
y
3.
2 axt b . Estimatorii a, b ob inu i cu metoda celor mai mici p trate coincid, deci, cu cei ob inu i
prin metoda verosimilit ii maxime. Atunci cnd ipoteza de normalitate a erorilor nu se realizeaz , se va ar ta c estimatorii demonstra ie pe cazul general). 2.5. Previziunea cu modelul liniar Fie
a i b ob inu i prin
metoda celor mai mici p trate au varian a minim printre to i estimatorii liniari centra i n a i b (se va da o
xU
yUP ! axU b ,
iar realizarea efectiv a lui Y este:
yU ! axU b I U .
Eroarea de previziune se poate exprima prin variabila aleatoare
yUP yU ! a a
xU b b I U .
25
e P ! yUP yU .
Se remarc imediat c
2 2 2 2 Var e P ! E yUP yU ! xU E a a E b b E I U2 2 xU E a a b b 2 xU E I U a a 2 E I U b b
A ?
A
.
QU2 ! Var eP
Q !x
2 U
2 U
W2 I 2 T xt x
W I2
2 Tx 1 xt x
2 xU xW I2 W I2 2 xt x
2 1 xU x ! W 1 2 T xt x 2 I
W I2 este necunoscut, dar estimat prin W I2 i varian a estimat a erorii de previziune este:
2 1 xU x Q ! W 1 T xt x 2 2 U 2 I
poate fi redus , pe de o parte prin cre terea num rului de observa ii (T), iar pe de alt parte,
xU astfel nct xU x
yUP yU N 0,1
. QU
yUP yU QU
QU2 W I2 T T urmeaz o lege Student cu T-2 grade de libertate pentru c 2
2 ! 2
2 . QU WI y ! ax b . Fie P xU , yUP punctul situat pe dreapta de ajustare.
Putem construi, avnd P ca centru i paralel cu axa 0y un interval de ncredere M1 M2 la nivelul de semnifica ie E.
yUP yU P QU
tE ! 1 E . 2
26
t E fiind luat din tabela distribu iei Student. Pentru T dat, QU ca func ie de xU x
2
xU ! x . Punctele M1 i M2 sunt deci situate, cnd U variaz , pe dou arce de curb (vezi figura), care determin astfel
regiunea c reia i apar ine
y
yUP y
M2 P M1
y ! ax b
xU
x
Observa ii 1. O variabil aleatoare t este distribuit dup o lege Student cu T-2 grade de libertate dac expresia este raportul dintre o variabil aleatoare distribuit libertate. Fie
t2 T 2
t!
aa . Atunci: Wa
a a
! t2 ! T 2 T 2
a W2
2
2. O variabil aleatoare F este distribuit dup o lege Fisher-Snedecor cu n1 i n2 grade de libertate dac expresia
n1 F 2 2 este raportul dintre o variabil aleatoare distribuit G cu n1 grade de libertate i o alta distribuit G n2 1 a a 1 a a ' ; a ,b . 2 b b b b
F!
Atunci:
27
a a xt2 T x a a b b b b T 2F Tx ! ! T 2 T 2
W I2
,
pentru c
, b urmeaz a
3. Jacobianul transform rii permite exprimarea densit ii de probailitate a vectorului aleator pornind de la cea a lui proced m astfel: nlocuim
y1 , y 2 ,..., yT N y1 , y 2 ,..., yT ,
0 0 !1 ... 1
N y1 , y 2 ,..., yT
! f I 1 y1
, I 2 y 2
,..., I T yT
J .
4. Am v zut c de
a a ! wt I t , I t
I t . Deci: a a
N 0,1
Wa a a
2
2 Wa
este distribuit G2 cu 1 grad de libertate pentru c este p tratul unei variabile aleatoare N(0,1).
b
N 0,1
b
W b b b
G
2 2 2 Wb 1
Deoarece
2 t
! It I I
2 I 2
a a
x x
, prin mp r irea la W
2 2 2 t 2 2
2 I ,
ob inem:
I
W
2 I
2 t
I !
a a
x x
W
2 I t
28
I
W I2 a a
2 W
2 I
! I
2
2 t
W I2
a a
x x
! Var a
G
2 t
Rezult c :
I
W
2 I
2 t
2.6. Experien
de calcul
Pentru a studia cum variaz cheltuielile de ntre inere i repara ii ale unui utilaj agricol n func ie de vrsta utilajului, s-au cules urm toarele date: Vrsta utilajului (xt) n luniCheltuieli anuale de ntre inere i repara ii (yt) n RONVrsta utilajului (xt) n luniCheltuieli anuale de ntre inere i repara ii (yt) n RONRezolvare: C ut m s estim m parametrii unei regresii liniare nte variabilele X i Y, de forma presupunnd c sunt ndeplinite ipotezele fundamentale I1,I2,I3. 1. Pentru a calcula estimatorii, se folosesc rela iile de calcul stabilite anterior (n cadrul seminarului se vor prezenta facilit ile de calcul oferite de diferite pachete de programe dedicate). Elementele necesare calculului sunt date n tabelul ce urmeaz : 100 47 71 58 102 35 60 53 10 32 17 58 6 20 48 43 77 89 50 40 56 62 15 8 36 41 16 8 21 21
yt ! axt b I t
29
t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
xt 15 8 36 41 16 8 21 21 53 10 32 17 56 6 20 362
xtyt 720 344 2772 3649 800 320 1176 1302 5300 470 2272 986 5916 210 1200 27437
xt x -9,1333 -16,1333 11,8666 16,8666 -8,1333 -16,1333 -3,1333 -3,1333 28,8666 -14,1333 7,8666 -7,1333 33,8666 -18,1333 -4,1333 -
( xt x ) 2 y t y
( yt y ) 2 xt2
yt2
y t ! 1, 28 x t 31,67
y y
-11,6789 -20,6298 15,174 21,5675 -10,4002 -20,6298 -4,0066 -4,0066 36,912 -18,0724 10,0591 -9,1214 43,3056 -23,1873 -5,2853 -
( y y) 2 I t ! yt yt
I t2
83,4177 260,284 140,818 284,484 66,1511 260,284 9,8177 9,8177 833,284 199,751 61,8844 50,8844 1146,95 328,818 17,0844 3753,73
-14,5333 -19,5333 14,4666 26,4666 -12,5333 -22,5333 -6,5333 -0,5333 37,4666 -15,5333 8,4666 -4,5333 39,4666 -27,5333 -2,5333 -
211,218 381,551 209,284 700,484 157,084 507,751 42,6844 0,2844 1403,75 241,284 71,6844 20,5511 1557,62 758,084 6,4177 6269,73
225 64 1296 1681 256 64 441 441 2809 100 1024 289 3364 36 400 12490
2304 1849 5929 7921 2500 1600 3136 3844 10000 2209 5041 3364 10404 1225 3600 64926
50,8544 41,9034 77,7073 84,1008 52,1331 41,9034 58,5267 58,5267 99,4454 44,4609 72,5925 53,4118 105,8389 39,346 57,248 -
136,396 425,59 230,251 465,16 108,164 425,59 16,053 16,053 1362,5 326,613 101,187 83,201 1875,38 537,649 27,9347 6137,72
-2,8544 1,0965 -0,7073 4,8991 -2,1331 -1,9034 -2,5267 3,4732 0,5545 2,539 -1,5925 4,5881 -3,8389 -4,346 2,7519 -
8,1479 1,2023 0,5003 24,0012 4,5503 3,6232 6,3842 12,0637 0,3075 6,4469 2,536 21,0509 14,7375 18,8883 7,5734 132,0144
30
1 x! T
!
1 xt ! 15 362 ! 24,133 t !1
T
t t t 2 t 2 t 2
1 T 1 y ! yt ! 938 ! 62,533 T t !1 15
2
-a
V!
y y
t
y xt x
y xt x
! 0,9894
Valoarea apropiat de 1 a coeficientului de corela ie arat c ntre cele dou variabile studiate exist o corela ie liniar . Observa ie: Am v zut c :
V !
a 2 xt x
t
! ( ax y y
( y
2 2
t t
ax ) 2 y) 2
(y (y
t t
y) 2 y) 2
prin model i
P tratul coeficientului de corela ie liniar este raportul dintre variabilitatea explicat variabilitatea total . - ecua ia de analiz a varian ei: variabilitatea total = variabilitatea explicat + variabilitatea rezidual
y
=
!
6137,719
y
+
y
2 t
6269,733
132,014
n spa iul observa iilor, Y este cu att mai bine explicat prin modelul liniar, cu ct este mai aproape se planul (L) generat de vectorii X i U (vectorul unitar), deci cu ct variabilitatea rezidual este mai mic fa de variabilitatea empiric total . Aceasta face ca raportul dintre variabilitatea explicat prin model i variabilitatea total , adic
2
, s fie apropiat de 1.
W I2 !
Var a !
W I2
t
x
W a ! 0,0027 ! 0,052
2 x !W 21 Var b I T xt x
W b ! 2,25 ! 1,5
- calculul intervalelor de ncredere pentru estimatori:
a a
Variabilele aleatoare
Wa
b
urmeaz b
W b
libertate. Alegnd un nivel de semnifica ie =0,05, putem extrage din tabelele reparti iei (astfel de tabele se g sesc n majoritatea c r ilor de econometrie, sau de statistic matematic ) valoarea ttab corespunz toare num rului de grade de libertate i nivelului de semnifica ie ales. n cazul nostru, pentru T-2=13 grade de libertate i =5%, g sim ttab=2,16. Intervalele de ncredere vor fi:
a ?a tE W a ; a tE W a A! [1,28-(2,16)(0,052) ; 1,28+(2,16)(0,052)]=
= [1,17 ; 1,39]
WI T aleatoare 2 2 !
2 1 W I W I2
2 t
urmeaz o lege de reparti ie hi-p trat cu (T-2) grade de libertate. dat, dou valori: v1 avnd
probabilitatea (1- /2) de a fi dep it , respectiv v2 avnd probabilitatea ( /2) de a fi dep it , astfel c
W I2 Pr ob v1 e (T 2) 2 e v 2 ! 1 E WI
Se ob ine astfel intervalul de ncredere:
(T 2)W I2 (T 2)W I2 W I2 ; v2 v1
pentru =0,05 i 13 grade de libertate extragem din tabel v1=5,01 i v2=24,7 rezultnd intervalul:
32
Variabilele aleatoare
a Wa
b W b
Aceste rapoarte se numesc i raportul t Student empiric (tcalculat). Se accept ipoteza H0: (a=0) dac tcalculat (luat n modul) este mai mic dect ttabelat , altfel se accept ipoteza contrar H1:(a { 0). Acest lucru se poate scrie:
a0 Wa
t tab
determinat pentru a. Cum 0 [1,17 ; 1,39], accept m ipoteza H1:(a { 0). La fel stau lucrurile i pentru b. Prin urmare, a i b sunt semnificativ diferi i de zero la pragul de semnifica ie de 5%. Se spune c variabila explicativ (exogen ) X (vrsta utilajului) este contributiv . - ne propunem acum s determin m o previziune a cheltuielilor de ntre inere i repara ii pentru un utilaj de 4 ani (48 de luni). Not m cu
yUp
xU . Avem c
e p ! yUP yU ,
erorii de previziune:
2 U 2 I
yUP yU QU
33
CAPITOLUL III REGRESIA MULTIPL De multe ori, studiul unui fenomen economic necesit introducerea mai multor variabile
explicative. O variabil endogen se exprim , deci, n func ie de mai multe variabile exogene. Metodele de regresie utilizate sunt n acest caz generaliz ri ale celor din capitolul anterior. 3.1. Modelul liniar al regresiei multiple Consider m acum modelul: (1)
x 21 x 22 ... x 2T
Y ! Xa I .
Ipoteze fundamentale Ipotezele I1, I2 din capitolul II r mn valabile: ceea ce era adev rat pentru xt este acum valabil
pentru xit, i=1,2,...,p. Ipoteza I3 referitoare la variabilele exogene se modific astfel: a. absen a coliniarit ii variabilelor exogene:
34
Nu exist
astfel nct
P x
i i !1
it
! 0 , t=1, 2, ...,T.
Matricea X de format (Txp) are n acest caz rangul p (T>p) i matricea (XX), unde X este transpusa lui X, este nesingular , deci exist inversa ei (XX)-1. b. Atunci cnd T p g , matricea
3.2. Determinarea estimatorilor parametrilor Pentru a scrie ecua iile normale utiliz m interpretarea geometric propunem s minimiz m expresia dat n capitolul II. Ne
U ! I t2 .
t !1
T
A
I
Y
Y
Xp X2 X1
(L)
Vectorul
a1 a2 Xa ! X 1 , X 2 ,..., X p ... a p
X2,...,Xp. Cantitatea U !
2 t
! I
I ! Y Xa
este ortogonal
35
la subspa iul (L). Aceast condi ie se traduce prin egalitatea cu zero a produselor scalare dintre vectorul
Y Xa
x x x
1t
2t
2 2t
x x
... x pt x2t
x pt a1 x pt a2 2t . ... ... x2 a p pt
1t
1 a ! X ' X X 'Y
3.3. Propriet ile estimatorului a Ar t m c a este un estimator nedeplasat al lui a i deducem expresia matricei de varian
covarian a. i
;a .
transform m expresia (3) nlocuind Y prin expresia lui n func ie de X:
(4)
E a ! a , adic
; a ! E a a a a ' .
36
i ( a a) d I ' X X ' X !
1
pentru c
simetric . Atunci:
1
ns
E II ' ! ; I
E II '
! W I2 I
1
(I este
1
Se poate ar ta c dac ipoteza a) din I3 r mne valabil cnd T p g , atunci a este estimator
convergent c tre a. Propozi ie. Estimatorul a. Pentru a ar ta aceast proprietate vom construi un estimator liniar pentru a care s aib varian a minim i el va fi identic cu cel ob inut prin MCMMP. Fie a* un estimator liniar al lui a, adic a*=MY, unde M este o matrice cu coeficien i constan i de format (pxT). Estimatorul a* este nedeplasat dac :
1 a ! X ' X
X 'Y
E a *
! ME Y
! ME Xa I
! a
I adic E a *
! MX
E a
ME I
! MX
a pentru c E
! 0 .
Pentru ca a* s fie nedeplasat, trebuie ca (MX)=I (matricea unitate de ordinul p). Construim acum matricea de varian i covarian a lui a*:
; a* ! E ?a * a
a * a
'A
Dar,
a* ! MY ! M Xa I
! MX
a MI ! a MI ,
2
deci
a * a ! MI ,
minim , trebuie ca urma matricei (MM) s fie minim , sub restric ia (MX)=I. Urma unei matrici este, prin defini ie, suma elementelor de pe diagonala principal . Not m Ur(X) urma matricei X. Ur este un operator liniar (demonstra i!). Rezolvnd problema de extremum condi ionat:
37
W I2
W I2 !
1 It2 Tp
Y ! Xa I ; Y ! Xa ; I ! Y Y ! Xa I Xa ;
Avem c :
I ! I X a a
.
Dar: a a ! X ' X
X ' I i I ! I X X ' X
X ' I
1 1
1 I ! I X X ' X X ' I
+ este o matrice de format (TxT) cu propriet ile +=+ (simetric ) i +2=+ (idempotent de grad 2). Am
2 t
ob inut
I ! +I .
Evalu m
acum
I
i{ j
2 t
care
sub
form
matriceal
este:
! I 'I ! I ' +' +I ! I ' +I ! K ii I i2 K ij I i I j , unde Kij este elementul matricii + situat la
i
I
! K E I
K E I I
.
2 t ii 2 i ij i j i i{ j
ns , E I i I j ! 0 conform I2 i Ar t m c Ur + ! T p .
I
! K E I
! K W
2 t ii 2 i ii i i
2 I
! W I2Ur + .
1
1
! p
38
E I t2
! T p
I2 , W
W I2 ! 1 It2 Tp
W I2 !
1 E Tp
2
1 I
! E T p I
2 t
2 t
astfel
T este num rul de observa ii, p este num rul de parametri de estimat i rela ia g sit generalizeaz pe cea din capitolul II. 3.5. Teste i regiuni de ncredere
regresia simpl . Deoarece a ! a X ' X
X ' I , rezult c a este distribuit dup o lege normal n p
1
(*)
(**)
2 I
(***)
coeficient ai . De exemplu, dac se testeaz ipoteza (H0:ai =0) contra ipotezei (H1:ai { 0), pentru a accepta H1 trebuie ca
Xi are un coeficient ai semnificativ diferit de zero. Mai general, cnd se pune problema de a ti dac un coeficient ai este diferit de o valoare particular ai , se calculeaz raportul t !
0
ai ai0 W ai
i se compar cu tE .
2
39
Consider m acum to i estimatorii a1 ,..., a p : ' (*) variabila aleatoare a a
; a a a
este distribuit G2 cu p grade de libertate;
1
La fel ca la regresia liniar simpl , rezultatele anterioare permit construirea de intervale de ncredere relative la coeficien ii ai, ca i a unui elipsoid de ncredere relativ la ansamblul coeficien ilor n spa iul . Pentru ai, intervalul de ncredere, la pragul de seminifica ie E este:
p
a i ai u tE 2 W ai
tE e
2
ai ai e tE 2 W ai
2 2
W ai tE e ai ai e W ai tE
a i W ai t E e a i e a i W ai t E
2
iar pentru ansamblul coeficien ilor, ecua ia elipsoidului de ncredere este: F=F(E,p,T-p). Acelea i principii conduc la determinarea de regiuni de ncredere relative la un num r oarecare de coeficien i din model. Dac F1=F(E,q,T-p), unde: q este num rul coeficien ilor re inu i, n spa iul , avem ecua ia
q
F1 !
1 aq aq ' ; a1q aq aq . q
dorim s
( 0)
40
endogene va fi:
YU p YU ! a1 a1
x1U ... p a p
pU I U . a x
E YU p YU ! 0 ,
Var YU p YU ! E YU p YU
A! E a
2 p
i !1
2 ai xi2 2 ai ai j a j iU x jU I U2 a x U i j
i !1
i j
E U p YU ! X U' ; a X U W I2 , adic : Y
unde:
X U' ! 1U , x 2U ,..., x pU
. x
Observa ie: Se arat c
dac T este finit i It sunt normal distribuite, atunci a este distribuit normal n p T a a urmeaz o
dimensiuni. Dac ipotezele nu sunt ndeplinite, atunci cnd T p g , vectorul distribu ie normal cu media egal cu zero. 41
3.7. Coeficientul de corela ie multipl R. Analiza varian ei i n acest caz, ecua ia varian ei se scrie:
Variabilitatea total
Variabilitatea rezidual
y
R
2
y
!
2 2
y
2 t
2 t
y ! y
t t
! 1 I y
y y
y
t
2 .
Y !Y I ,
de medie
Y ! Xa I
c vectorul rezidual I este acela i i pentru valorile (Y,X) i pentru valorile centrate fa
o efectu m cu variabilele centrate pe media lor, estimatorul a i vectorul rezidual I sunt aceea i. Cnd se centreaz valorile X i Y, vectorul a nu con ine ultimul estimator a p . Constanta a p
dispare cnd se centreaz variabilele. Considerarea modelului f r constante, cu variabilele necentrate pe media lor, poate conduce la valori ale lui R care ies din intervalul (0,1). Expresia matricial a coeficientului de corela ie multipl este:
2
Y
Y
, dar Y
! X X
a . 'Y Y Y
Y
Y 'Y Y a ! ?X X
X
X
Y
i coeficientul devine: ' X A X 'Y X a ' X
Y
'Y R ! Y
Y
. Y 'Y
R2 !
1 2
Coeficientul R
arat
endogene. El este cu att mai bun cu ct e mai apropiat de 1. Dar, judecarea calit ii unui model doar prin valoarea lui R poate duce la erori grosiere. El
mascheaz uneori influen a variabilelor exogene luate separat asupra variabilei endogene i nu poate s se 42
substituie studiului estimatorilor coeficien ilor modelului. P tratul coeficientului de corela ie multipl nu ine cont nici de num rul de observa ii (T) i nici de num rul variabilelor explicative (p). Ori, se poate foarte bine ca, avnd acelea i observa ii asupra variabilei endogene s consider m dou modele distincte, n al doilea f cnd s apar un num r de variabile explicative noi. n aceast a doua regresie coeficientul de corela ie multipl nu poate dect s creasc (pentru c variabilitatea explicat prin regresie cre te). O definire mai precis a lui R , care ine cont de T i p este:
2
R ! 1
2
T 1 1 R2 . Tp
R2 ; p 1 . T 1
R poate sc dea prin introducerea n model a unei noi variabile exogene; R poate lua i valori negative, dac R 2
2
Analiza varian ei Atunci cnd studiem rolul jucat de exogene asupra evolu iei endogenei, ne putem ntreba care este partea de variabilitate explicat de una sau mai multe variabile exogene. Relu m modelul ini ial: (1)
Variabilitatea ne-explicat de cele q exogene n modelul (1) este variabilitatea rezidual asociat modelului (2). Fie:
y
t
y
t
2 a1 x1t a 2 x 2 t ... a p x pt ! I
43
Variabilitatea explicat de cele (p-q) exogene din modelul (1) atunci cnd a1,...,aq sunt estima i cu modelul (2) este atunci:
2
! \ I
A
I
Xp
\
Hp
L
Xq
(L)
Hq
X1
tim c
0 A ! 0H
Rezultatele se grupeaz , adesea, ntr-un tabel de analiz a varian ei: Sursa variabilit ii 1. X: mul imea celor p exogene Suma p tratelor corespunz toare acestei surse Num rul gradelor de libertate p Media p tratelor asociate
T-p
p-q
Y p ! 0 H p este proiec ia lui Y pe subspa iul (L) ai c rui vectori generatori sunt X1,X2,...,Xp. Yq ! 0 H q este proiec ia lui Y pe subspa iul generat de X1,X2,...,Xq.
44
Dispunem de observa iile din tabelul de mai jos i ne propunem s explic m variabile endogen Y variabilele
Y ! a1 X 1 a2 X 2 a3 I , unde:
x11 y1 x 21 I1 x1 2 y2 x 22 I2 Y ! , X 1 ! , X 2 ! ... , I ! ... ... ... y x I x 1T T 2T T
adic :
Y ! Xa I , unde:
x 21 ... x 2T 1 a1 ..., a ! a 2 a 1 3
yt 100 106 107 120 111 116 123 133 137 x1t 100 104 106 111 111 115 120 124 126 x2t 100 99 110 126 113 103 102 103 98
x11 X ! ... x 1T
t 1 2 3 4 5 6 7 8 9
S observ m c num rul de observa ii (T=9) este mic, din ra iuni de simplificare a calculelor. Vom estima modelul, presupunnd c sunt ndeplinite ipotezele principale ale modelului liniar general de regresie: ipoteze stochastice:
E (I ) ! 0, E (I .I d! W I2 I , (homoscedasticitate), )
t{s i
adic :
E (I t .I s ) ! 0 , dac
X d
, X
E (I t2 ) ! W I2 , t.
- ipoteze structurale: dac num rul de variabile exogene veritabile este k, atunci p=k+1 este num rul parametrilor de estimat. Trebuie ca rangul matricii X s fie egal cu p (p<T), iar matricea unde X d transpusa lui X este nesingular , deci inversabil . este 45
Pentru a simplifica procedura de calcul vom centra variabilele modelului. Cu nota iile:
Z ! Y Y , U 1 ! X 1 X 1 , U 2 ! X 2 X 2 ,L ! I I
unde:
Y !
1 1 1 1 yt , X 1 ! T x1t , X 2 ! T x2t , I ! T I t T t t t t
, unde
modelul se scrie:
Z ! a1U 1 a 2U 2 L , sau Z ! Ub L
y1 y x11 X 1 y2 y Z ! , U ! ... ... x X 1 y y 1T T
Deoarece
x 21 X 2 I1 I a1 ... , b ! ,L ! ... a 2 I I x 2T X 2 T
Y !
X2 !
t 1 2 3 4 5 6 7 8 9
U1 ! X 1 X 1
-13 -9 -7 -2 -2 +2 +7 +11 +13
U2 ! X2 X2
-6 -7 +4 +20 +7 -3 -4 -3 -8
46
u11 ... u 1T
u 21 u2 ... ! 1t u u u 2T 1t 2t
u u u
1t
2t
2 2t
U d U
1
1
iar
reziduurile
sunt:
rela ia:
W I2 !
1 It2 Tp
. Dar,
Y I ! Y Y ! Y Y Y ! Z Z ! Z Ub , iar
2 t
872 d I Z Z UZ ! I d! Z Ub Z Ub ! Z d bd d. Avem c : U d! 72
2 t
W I2 !
47
i covarian
a vectorului b este:
; b ! W I2 d UU
1
, iar o estima ie a ei se
W I2
cu
W I2 . Avem c :
112 408656 ! 0,0180 0,0031 650 0,0031 0,0181 408656
U U 1 ; b ! W I2 d
R2 !
var iabilitatea exp licata var iabilitatea reziduala ! 1 var iabilitatea totala var iabilitatea totala
2 t 2 t
R2 !
z
z
2 t
2 t
! 1248
1 zt2 T 1 1 z t2 k 1 It2 T k 1
! 1179,5704
2 t
k=2
3. Reziduurile
! 68,4296
T-k-1=6
48
CAPITOLUL IV STUDIUL MODELULUI LINIAR CND IPOTEZELE CLASICE ASUPRA ERORILOR NU MAI SUNT REALIZATE 4.1. Ipoteza de independen a erorilor a erorilor ;I nu se mai reduce la W I I , iar
2 2
S-a studiat anterior modelul liniar de regresie sub ipoteza c erorile sunt independente. n cazul n care erorile It sunt corelate, matricea de varian i covarian
M ! X dI 1 X ;
A Xd ;
1
1 I
a ! MY ! X dI 1 X ;
A Xd Y ;
1 I
1
; a ! X dI 1 X ;
1
Estimatorul a astfel ob inut este un estimator liniar, nedeplasat i de dispersie minim . El a fost ob inut
prin MCMMP generalizat . Se observ imediat c dac erorile sunt independente, adic
49
n cazul n care erorile sunt corelate, determinarea estimatorului a necesit cunoa terea matricei
de varian i covarian a erorilor
;I
;I
estima ia ei
; I , ceea ce nu antreneaz
Corelarea erorilor I t poate mbr ca diverse forme. Cel mai frecvent se studiaz cazul cnd
I t ! VI t 1 L t
(1) (n care
I t ! VI t 1 L t ,
E t ! 0 , L
E t1L t 2
! 0 , pentru t1 { t 2 L
ecua ia
scris
pentru
t-1
este:
(3)
(4) unde:
z t ! a1u1t a 2u 2t ... a p u pt L t
uit ! xit Vxi t 1
, i=1,2,...,p.
z t ! yt Vyt 1
L t ! I t VI t 1
Deoarece, prin ipoteze, erorile L t sunt independente, se poate aplica MCMMP obi nuit ecua iei (4) care va conduce la estimatorul
a a ! 1 , a 2 ,..., a p nedeplasat
i de minim dispersie.
Dar, cum parametrul V nu este cunoscut, pentru estimarea parametrilor unei ecua ii de regresie atunci cnd erorile sunt corelate (sub forma unui proces autoregresiv de ordinul I, I t ! VI t 1 L t ,
50
sta ionar, adic media E t i dispersia Var t sunt independente de timp, iar V I I urm toarele metode: Metoda I: 1.
1 ) se pot aplica
Se aplic MCMMP obi nuit ecua iilor (1) f r a ine cont c erorile I t sunt corelate.
Se ob ine estimatorul a1 al lui a i se determin valorile ajustate Y1 ! Xa1 estima iile erorilor I t ! y t y1t .
2. D m o estimare a parametrului V aplicnd MCMMP obi nuit
ecua iei
I t ! VI t 1 L t , ob innd
3. nlocuim V cu
V.
ob ine estimatorul
a pentru parametrul a.
Evident, pentru e antioane mici, estimatorul a nu prezint garan ii c are propriet ile dorite.
Metoda II: Ecua ia (3) de mai nainte se poate scrie i sub forma: (5)
Se aplic MCMMP obi nuit ecua iilor (3) i (5) astfel: 1. D m o valoare ini ial lui V, de exemplu V0=0 n ecua ia (3) i ob inem o prim
estima ie a parametrilor a0 .
2.
nlocuim a0 ! a1 , a2 ,..., a p
valoare pentru V, notat V1.
n ecua ia (5)
3.
1 2 p a1 ! a1 , a1 ,..., a1
4.
.a.m.d.
Se opresc itera iile dac valorile g site n dou itera ii succesive nu difer dect printr-
V ! _ ;0,01;0,02;...;1a. 0
51
Aplic m MCMMP obi nuit ecua iei (3) pentru fiecare valoare a lui V i calcul m reziduurile L t .
Se re ine valoarea lui V care d cea mai mic sum a p tratelor erorilor
L
t
2 t
, c reia i corespund
Atunci cnd ipotezele fundamentale ale modelului liniar al regresiei nu sunt ndeplinite propriet ile estimatorilor parametrilor sufer . Astfel, sub ipoteza I2 referitoare la distribu ia erorilor i la independen a lor, estimatorii ob inu i sunt nedeplasa i i au varian a minimal . Dac erorile sunt corelate, estimatorii r mn, n general, nedeplasa i, dar matricea de varian
2 I
i covarian
W I . Pentru a ne asigura de independen a erorilor trebuie s efectu m teste. Este vorba despre testul lui
Durbin i Watson. Modelul liniar general al regresiei:
yt ! a1 x1t a 2 x 2t ... a p x pt I t
se poate scrie sub forma:
yt ! axt I t
a ! 1 , a2 ,..., a p
i a
x1t x2 t xt ! ... . x pt
i se ob ine un estimator
unde:
a a ! 1 , a2 ,..., a p , calculndu-se
yt ! axt
i erorile estimate
I t ! yt yt .
I t ! yt yt ! a a
xt I t .
Se consider variabila aleatoare, notat ecua ia:
d , numit
52
d!
I I
t t 1 t !2
It2
t !1
f d
i au ar tat c oricare ar fi irul de exogene considerate, curbele reprezentative ale lui f d oscileaz ntre
dou curbe limit
f di
variabile exogene veritabile ce figureaz n model (m) i de irul erorilor I t . Cele dou curbe limit (reprezentate grafic n figur ) sunt atinse pentru anumite iruri de exogene xt i sunt simetrice n raport cu axa de abscis 2.
f d
d1 d2
d1
d2
Scopul este de a ti dac erorile modelului sunt autocorelate. Cel mai frecvent se caut testarea leg turii erorilor printr-o rela ie de forma I t ! VI t 1 L t . Se spune c erorile urmeaz un proces autoregresiv de ordinul nti. Vrem s test m ipoteza I0: V ! 0 (absen a autocorela iei erorilor), contra ipotezei I1: V " 0 (erorile I t sunt autocorelate). La un nivel de semnifica ie E dat, Durbin i Watson au determinat dou valori, d1 i d2, n func ie de num rul de observa ii (T) i de num rul de exogene veritabile (m) corespunz toare fiec reia din curbele limit . 53
i se observ c :
dac d
dac
d1
I t ! VI t 1 L t ;
3.
n tabelul urm tor sunt date cteva valori uzuale pentru d1 i d2 n func ie de T i m, pentru nivelul de semnifica ie E=0,05: Tabela D-W T 15 20 30 50 100 m=1 d1 1,08 1,20 1,35 1,50 1,65 d2 1,36 1,41 1,49 1,59 1,69 m=2 d1 0,96 1,10 1,28 1,46 1,63 d2 1,54 1,54 1,57 1,63 1,72 m=3 d1 0,82 1,00 1,21 1,42 1,61 d2 1,75 1,68 1,65 1,67 1,74 m=4 d1 0,69 0,90 1,14 1,38 1,59 d2 1,97 1,83 1,74 1,72 1,76 m=5 d1 0,56 0,79 1,07 1,34 1,57 d2 2,21 1,99 1,83 1,77 1,78
Observa ii: 1. n loc s test m V ! 0 contra V " 0 , se poate testa I0: V ! 0 , contra I1: V { 0 . Se ob in dou valori d1 i d 2 simetrice n raport cu 2 i se constat c :
' '
a. dac d
2. Dac modelul studiat nu con ine constanta, trebuie s determin m d ca i cnd modelul ar
con ine o constant . 3. Statistica Durbin-Watson aplicat pe un model care con ine variabile endogene retardate este deplasat c tre 2, ceea ce nseamn c erorile sunt mai pu in corelate ntr-un proces autoregresiv, dect ntrun proces ordinar.
54
de calcul
I. Se cunosc urm toarele date referitoare la evolu ia n timp a unei variabile economice (n pre uri 2 669,4 10 1426,3 3 912,7 11 1376,2 4 935,2 12 1327,8 5 1027,2 13 1420,6 6 1145,0 14 1933,9 7 1193,7 15 2023,4 ,s-a aplicat MCMMP, 8 1224,1
yt ! a t b I t
a ! 81,8657 ; b ! 582,404
De asemenea, s-a calculat varian a estimatorilor i ecartul-tip al acestora:
W a ! 7,94887 ;
i ale
W b ! 72,2721
reziduurilor I t ! y t y t :
t 1 664,2 9 1319,2 2 746,1 10 1401,0 3 828,0 11 1482,9 4 909,8 12 1564,6 5 991,7 13 1646,6 6 1073,6 14 1728,5 7 1155,5 15 1810,4 8 1237,3
yt
t
yt
t 1
2 -76,79 10 +25,25
3 +84,79 11 -106,64
4 +25,35 12 -237,01
5 +35,49 13 -226,00
6 +71,44 14 +205,42
7 +38,30 15 +213,03
8 -13,25
It
t
-1,93 9 -37,54
It
Ne propunem s cercet m o eventual autocorelare a erorilor. Rezolvare: Pentru a putea utiliza testul Durbin-Watson trebuie ca num rul de observa ii T s fie suficient de mare (n practic T>15), iar modelul s con in un termen constant.
I
t !1
I t 1
2 t
I
t !1
55
Durbin i Watson au ar tat c pentru un proces sta ionar (primele dou momente ale variabilei
aleatoare I t independente de timp), valoarea calculat a statisticii d este cuprins ntre 0 i 4, cu absen a
corela iei n vecin tatea lui 2. ntre aceste valori limit , tabela D-W furnizeaz , la pragul de seminifica ie E, diferite intervale de valori
d d d
dac 4 d 2 dac 4 d1
n exemplul nostru, num rul de exogene veritabile n model este (m=1) i dispunem de T=15 observa ii. Tabela D-W furnizeaz valorile d1=1,08 i d2=1,36 la pragul de semnifica ie E=0,05. Deoarece
putem s spunem c erorile I t sunt corelate. II. n tabelul urm tor sunt date, pentru perioada 1985-2002: volumul investi iilor n agricultur , yt; produsul intern brut agricol, x1t ; indicele volumului importurilor pentru agricultur , x2t. Anul t 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 Investi ii n agricultur yt 85,2 90,2 96,6 112,0 124,5 120,8 131,5 146,2 140,8 160,0 188,3 Produsul intern brut agricol x1t 563,8 594,7 635,7 688,1 753,0 796,3 868,5 935,5 982,4 1063,4 1171,1 Indicele volumului importurilor pentru agricultur x2t 90,6 91,7 92,9 94,5 97,2 100,0 104,2 109,8 116,3 121,3 125,3
56
Investi ii n agricultur yt 220,0 214,6 190,9 243,0 303,3 351,5 386,2 Se cere: 1. 2. 3. Rezolvare: -
Produsul intern brut agricol x1t 1306,6 1412,9 1528,8 1702,2 1899,5 2127,6 2368,5
Indicele volumului importurilor pentru agricultur x2t 133,1 147,7 161,2 170,5 181,5 195,4 217,4
Determinarea leg turii dintre investi ii, PIB i volumul importurilor; Testarea autocorela iei erorilor; Dac exist autocorela ie, cum se pot nl tura efectele acesteia? Studierea leg turii dintre variabilele economice amintite se poate efectua cu modelul de regresie multipl :
yt ! a bx1t cx2t I t
Aplicarea MCMMP conduce la urm toarea estimare a modelului:
3. Pentru a nl tura efectele autocorela iei erorilor, se procedeaz astfel: - scriem dependen a dintre variabile (1) (2)
- nmul im (2) cu
57
c ut m o estima ie a coeficientului
. Observ m c
este coeficientul
variabilei yt-1 n rela ia anterioar . Efectu m o regresie cu MCMMP pe ultima ecua ie, f r s inem cont de rela iile dintre coeficien i, adic pe ecua ia:
! I t VI t 1
yt ! 47,56 0,70 yt 1 0,68 x1t 0,60 x1(t 1) 3,08 x2t 2,11x2(t 1)
Estima ia g sit pentru coeficientul Anul 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 este
V ! 0,70
cu ajutorul estima iei g site, transform m variabilele modelului ini ial pentru o nou regresie:
z t ! y t Vy t 1
30,56 33,46 44,38 46,10 33,68 46,94 54,15 38,46 61,44 76,30 88,19 60,60 40,68 109,37 133,20 139,19 140,15
Observa ie: Pentru a evita eliminarea primei valori din irul de observa ii, prin trecerea la diferen e, se pot folosi transform rile:
z1 ! y1 1 V 2 , u11 ! x11 1 V 2 , u 21 ! x 21 1 V 2
58
i rezult :
d ! 1,54 .
Testul de independen conduce acum la concluzia c erorile sunt independente, deoarece: 4-d2=2,47> d =1,54>d2=1,53 4.2. Ipoteza de normalitate a erorilor Unele propriet i ale estimatorilor nu depind de normalitatea erorilor. De exemplu, distribu iile asimptotice ale estimatorilor necesit doar existen a primelor dou momente (media i dispersia) ale erorilor I t i nu n mod obligatoriu ca I t s urmeze o lege normal . Acest lucru nu este ns valabil pe e antioane mici. Testarea ipotezelor i intervalele de ncredere nu mai au acelea i propriet i dac legea de distribu ie a erorilor nu este legea normal . Pentru a caracteriza devia iile de la legea normal se utilizeaz doi coeficien i: a) coeficientul de asimetrie, calculat prin raportul:
K1 !
Q3 W I2
0 , exist o deviere spre stnga.
unde: Q 3 este momentul centrat de ordinul 3. Dac K 1 " 0 , atunci seria de date este deplasat spre dreapta fa de legea normal , iar dac K 1
K2 !
Q4 3 W I2
0 caracterizeaz o distribu ie mai aplatizat dect cea normal .
O valoare pozitiv pentru K 3 indic faptul c distribu ia este mai pu in aplatizat dect distribu ia normal , n timp ce o valoare K 3
Aceste devia ii afecteaz testele i intervalele de ncredere ale estimatorilor. Studiul teoretic al acestor devia ii este complex. Pentru a ob ine teste i intervale de ncredere mai robuste, n practic se procedeaz astfel:
59
1.
It .
2. 3. Se examineaz cele T reziduuri estimate i se repereaz cele a c ror valoare absolut este foarte mare. Se elimin din seria de date observa iile corespunzatoare acestor erori foarte mari sau se corecteaz aceste observa ii astfel ca s se ajung la valori ct mai normale ale erorilor. 4. Se efectueaz o nou regresie pe e antionul corectat. Propriet ile estimatorilor ob inu i vor depinde de regula adoptat n etapa anterioar . De exemplu, se poate adopta regula de a respinge sau corecta observa iile corespunz toare reziduurilor a
c ror valoare absolut I t este mai mare dect de trei ori media erorilor absolute.
4.3. Ipoteza de heteroscedasticitate
S presupunem, deci, c de i I t
variaz n func ie de
t. n acest caz, estimatorii ob inu i sunt nc nedeplasa i. Dar, momentele centrate de ordinul doi nemaifiind constante se comite o eroare de calcul a ecartului-tip al estimatorilor. Se poate evalua deplasarea n estima ia lui de valori
; a . Aceast
2 It
W
(1) (2)
, xt
. Deplasarea este nul dac sunt realizate rela iile urm toare:
1 W I2t xt x ! 0 ; T t
2 1 1 W I2t xt x ! T T t
W
t
2 It
2 xt x . t
Aceste rela iile sunt realizate atunci cnd nu exist nicio leg tur sistematic ntre
W I2t
xt .
Homoscedasticitatea erorilor se admite n seriile cronologice atunci cnd ordinul de m rime al variabilelor este apropiat pentru diverse observa ii. Dar, n studiul datelor micro-economice, variabilele pot avea ordine de m rime foarte diferite. Acest fapt conduce la erori de estimare importante pentru coeficien ii unui model econometric.
60
W I2t
suma p tratelor erorilor s fie minim , ace tia pot fi determina i din condi ia ca
I t2 W2 t It
s fie minim .
y t ! axt b I t , estimatorii a
1 W y
t
2 It
2 axt b .
n cazul n care
W I2t
yt axt b
2
xt2
y b ! t a s fie minim . x xt t t
de calcul
Ne propunem s studiem legatura dintre volumul investi iilor i suprafa a cultivat . Pe un e antion de 30 de ntreprinderi agricole s-au ob inut urm toarele date: Suprafa a (ha) 100 200 300 400 500 75,6 80,1 85,5 92,7 104,4 75,6 81,9 88,2 95,4 106,2 Cheltuielile de investi ii (RON) 77,4 83,7 89,1 98,1 108,9 78,3 83,7 92,7 101,7 112,5 80,1 84,6 92,7 103,5 117,9 81 84,6 94,5 105,3 117,9
y t ! axt b I t , ob inem:
yt ! 0,08145 xt 67,965
R 2 ! 0,9 .
Dorim s test m ipoteza de homoscedasticitate a erorilor. n acest scop efectu m dou regresii separate, una pe primele 12 observa ii, alta pe ultimele 12 (valorile lui X fiind ordonate cresc tor). Fie SPE1 i SPE2 suma p tratelor erorilor relative la cele dou regresii. Regresia lui Y n raport cu X pentru primele 12 observa ii, conduce la:
y t1
! 0,054 xt 72,6
iar regresia pe ultimele 12 observa ii d :
yt2 ! 0,1125 xt 54,45
61
SPE1 , W2
respectiv
SPE 2 ar trebui s urmeze fiecare o distribu ie hi-p trat cu (T-d-k-p) grade de libertate, unde T W2
este num rul de observa ii, d este num rul de observa ii omise (n cazul nostru d=6), k este num rul de observa ii luat n fiecare regresie separat , iar p este num rul parametrilor de estimat. n exemplul nostru T-
1 SPE 2 10 d-k-p=10. n aceste condi ii, variabila aleatoare are o distribu ie Fisher cu 10 i respectiv 10 1 SPE1 10
grade de libertate (F10,10). Cu datele calculate, ob inem distribu iei Fischer-Snedecor, la pragul de
varian a erorilor
W I2t
cu p tratul valorilor
variabilei exogene, adic W I t ! Pxt , P fiind o constant nenul , atunci efectele heteroscedasticit ii pot fi corectate prin transformarea modelului. mp r ind fiecare termen al ecua iei de regresie prin xt, rezult :
yt b I !a t xt xt xt
sau
z t ! a but L t , unde: zt ! yt , ut ! 1
xt
Se observ c
xt
i Lt !
It . xt
I Var t ! Var t L x t
1 2 ! 2 W It ! P . x t
Prin urmare, modelul transformat are erorile L t homoscedastice, deoarece dispersia lor este independent de timp. Efectund regresia pe modelul transformat, rezult :
z t u t T zu b ! 2 u t2 T u ! z bu a
Revenind n variabilele ini iale ob inem:
62
yt 1 1 yt 1 x x T x x t t t ! t t t 2 b 2 1 1 1 x T x t t t 1 y 1 1 a ! t b T t xt T t xt
Efectund calculele, rezult :
yt ! 0,072 xt 70,44 .
S remarc m faptul c panta dreptei de regresie (dup corectarea heteroscedasticit ii) este mai mic dect cea ob inut naintea corect rii. 4.4. Ipoteza de independen Se tie c a erorilor n raport cu varibilele exogene ipotez fundamental estimatorii ob inu i au propriet i optimale
sub aceast
(nedeplasa i, cu varian
minimal ). Cnd ipoteza nu mai este satisf cut aceste propriet i nu mai sunt
valabile. Cu ct coeficientul de corela ie liniar ( V ) dintre I t i xt este mai mare, cu att deplasarea estimatorilor va fi mai mare. n astfel de cazuri este de preferat s se aleag un alt model econometric pentru studierea leg turii dintre variabile. La fel trebuie procedat i atunci cnd se constat c varian a erorilor nu este finit . 4.5. Ipoteza referitoare la faptul c variabilele modelului sunt observate f r eroare Atunci cnd variabilele care apar n model nu sunt variabile observate f r eroare, va exista o corela ie ntre reziduuri i exogenele din model. n acest caz, pentru a ob ine estimatori convergen i, s-a dezvoltat o metod de estimare special , numit metoda variabilelor instrumentale, pe care o prezent m mai jos. Fie modelul liniar general:
i X valorile reale
(necunoscute acum pentru c observa iile Y i X con in erori!) ale variabilelor din model.
63
Putem scrie c Y ! Y Q , X ! X K , unde Q i K sunt variabile aleatoare. Vom presupune c Q i K satisface ipotezele fundamentale (medie zero, varian finit , independente). nlocuind X i Y prin expresiile lor, ob inem modelul
~ ~ Y ! Xa L ,
unde
L ! Ka I Q . Aceasta arat
intermediul lui K.
Presupunem acum c se cunosc alte p variabile exogene Zi , i=1,2,...,p necorelate cu Q, K i L, deci necorelate cu I. Acest lucru nseamn c sub forma: (1)
E Z i I ! 0 , i=1,2,...,p. Consider
Y ! a1 X 1 a 2 X 2 ... a p X p I ,
E Z Z1 Y
! a1 E Z 1 X 1
... a p E 1 X p
E Z Z 2 Y
! a1 E Z 2 X 1
... a p E 2 X p
(2) .... p Y
! a1 E p X 1
... a p E p X p
E Z Z Z Metoda de estimare VI (variabilelor instrumentale) const n a lua ca estimatori a1 ,..., a p exact
solu iile sistemului de ecua ii (2), n care speran ele matematice sunt nlocuite cu momentele empirice corespunz toare:
E Z i Y !
E i X j
! Z
Dac not m:
64
z11 Z ! ... z 1T
matricial :
x p1 ... ... sistemul (2) transformat se scrie sub form ... x pT ...
1 a ! Z ' X Z 'Y .
X ' ;
Y
1 1 I
1
1 a ! Z ' X Z 'Y .
Se trece de la 1. la 2. nlocuind X ' prin X ' ; I . Se trece de la 1. la 3. nlocuind X ' prin Z ' . Cunoa terea primei formule permite exprimarea celorlalte dou .
Estimatorul a ob inut prin metoda VI este un estimator deplasat pentru a, dar converge n
probabilitate c tre a pentru T suficient de mare. Pentru a putea utiliza metoda VI trebuie g site attea variabile instrumentale cte exogene con ine modelul. Aceste variabile instrumentale trebuie s fie necorelate cu reziduurile, dar puternic corelate cu exogenele modelului. Aceste restric ii limiteaz alegerea variabilelor instrumentale i, prin urmare, metoda VI nu este o metod general de estimare. 4.5.1. Experien de calcul
Consider m o anchet pe bugetele de familie pentru a studia consumul dintr-un anumit produs. Ancheta cuprinde un e antion de T familii. Facem urm toarele nota ii: y1t: cheltuielile totale ale familiei t; y2t: cheltuielile relative la produsul studiat; Vt : veniturile familiei t; i scriem ecua iile: (1) (2)
y1t ! Vt I 1t
y 2t ! aVt b I 2t
65
Ne propunem s exprim m cheltuielile relative la produsul studiat n func ie de cheltuielile totale. Din ecua ia (1) avem c
Vt ! y1t I 1t
y 2t ! ay1t b I 2t aI 1t
sau, punnd L t (3)
! I 2 t aI 1t :
y 2t ! ay1t b L t .
S observ m c L t este corelat cu y1t prin intermediul lui I1t. Vom estima a i b din ecua ia (3) introducnd o variabil instrumental . Fie VDt venitul declarat de familia t. Este evident corela ia puternic dintre variabilele VDt i Vt. Dimpotriv , venitul declarat VDt nu este corelat cu
I 1t ! y1t Vt ,
cheltuielile totale i veniturile familiei t. Rezult c VDt nu va fi corelat cu L t . Utiliz m venitul declarat ca variabil instrumental . Pentru simplificarea calculelor, centr m variabilele din model:
y 2t ! ay1t b L t , t=1,2,...,T
1 1 1 y2t ! a T y1t b T L t T t t t
y 2 ! a y1 b L
(4)
y 2t y 2 ! a y1t y 1 L t L
y
t
1t
y1 y 2t y 2
1t
(5).
a!
y
t
t
y1
centrat i aplicnd
A ?
A.
66
Dar, cum L t
VD VD
y a! VD VD
y
t t t t
2t
1t
. y
y2
1
1t
y1
i la numitor.
67
BIBLIOGRAFIE 1. Andrei, T. 2. Cenu , Ghe. (coord.) 3. Chow, G. 4. Dobrescu, E. 5. Gheroghi , M. 6. Giraud, R. 7. Gourieroux, C. Monfort, A. 8. Gujarati, R.N. 9. Isaic-Maniu, Al. Mitru , C. Voineagu, V. 10. Malinvaud, E. 11. Onicescu, O. Botez, M. 12. Pecican, E.S. 13. Pecican, E.S. 14. Ta nadi, Al. 15. Ta nadi, Al. Cre u, A. Peptan, E. 16. T n soiu, O. Pecican, E.S. Iacob, A. 17. T n soiu, O. 18. T n soiu, O. Iacob, A. 19. www.asecib.ase.ro/soft.htm Econometrie-studii de caz, Editura A.S.E., 1998 Econometrie aplicat , Editura Arteticart, Bucure ti, 1999 Modele econometrice, Editura A.S.E., 2001 Methodes statistiques de leconometrie, Dunod, Paris, 1978 Incertitudine i modelare economic (Econometrie informa ional ), Editura tiin ific Bucure ti, 1985 Econometria pentru ... economi ti; Econometrie-teorie i aplica ii, Editura Economic , Bucure ti, 2003 Econometrie, Editura All, Bucure ti, 1994 Econometrie, Editura A.S.E., 2001 Econometrie proiect, Editura A.S.E., 2003 i Enciclopedic , Statistic i econometrie, Editura Economic , Bucure ti, 2004
Matematici pentru economi ti, Editura CISON, Bucure ti, 2000 Econometrics, McGraw Hill, New York, 1989 Tranzi ia n Romnia-Abord ri econometrice, Editura Economic , Bucure ti, 2002 Modelarea i simularea proceselor economice, Editura ASE, Bucure ti, 2001 Econometrie, Economica, 49 rue Hericart, Paris, 1990 Statistique et Modeles Econometriques, Economica, Paris, 1989 Essentials of Econometrics, McGraw Hill, New York, 1998 Statistica pentru managementul afacerilor, Editura Economic , 1995
68