Sunteți pe pagina 1din 66

ACADEMIA DE STUDII ECONOMICE FACULTATEA DE ECONOMIE AGROALIMENTARĂ ŞI A MEDIULUI

Prof. univ. dr. MIRCEA GHEORGHIłĂ

Conf. univ.dr. SIMONA ROXANA PĂTĂRLĂGEANU

ECONOMETRIE

BUCUREŞTI

-2011-

1

CUPRINS

Introducere

3

Capitolul I: Modele econometrice

4

 

1.1. GeneralităŃi

4

1.2. Model aleator

4

1.3. Natura variabilelor care apar în model

4

1.4. InducŃia statistică

5

1.5. Identificarea modelului

5

1.6. Previziunea variabilei endogene

5

1.7. Vocabular uzual

6

Capitolul II: Regresia simplă

10

 

2.1.

Modelul liniar al regresiei simple

10

2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici pătrate

11

2.3. ProprietăŃile estimatorilor

12

2.3.1. CovarianŃa estimatorilor

15

2.3.2. Determinarea unui estimator nedeplasat pentru varianŃa erorilor

16

2.3.3. Interpretarea geometrică a metodei celor mai mici pătrate

18

2.3.4. Coeficientul de corelaŃie liniară

21

2.3.5. DistribuŃia de probabilitate a estimatorilor

22

2.4. Teste şi intervale de încredere

24

2.5. Previziunea cu modelul liniar

25

2.6. ExperienŃă de calcul

29

Capitolul III: Regresia multiplă

34

 

3.1.

Modelul liniar al regresiei multiple

34

3.2. Determinarea estimatorilor parametrilor

35

3.3.

ProprietăŃile estimatorilor

36

3.4. Determinarea unui estimator nedeplasat pentru varianŃa reziduurilor

38

3.5. Teste şi regiuni de încredere

39

3.6. Previziunea variabilei endogene

41

3.7. Coeficientul de corelaŃie multiplă. Analiza varianŃei

42

3.8. ExperienŃă de calcul

45

Capitolul IV: Studiul modelului liniar când ipotezele clasice asupra erorilor nu mai sunt realizate

49

 

4.1.

Ipoteza de independenŃă a erorilor

49

4.1.1. Testarea ipotezei de independenŃă a erorilor

52

4.1.2. ExperienŃă de calcul

55

4.2. Ipoteza de normalitate a erorilor

59

4.3. Ipoteza de heteroscedasticitate

60

4.3.1. ExperienŃă de calcul

61

4.4. Ipoteza de independenŃă a erorilor în raport cu variabilele exogene

63

4.5. Ipoteza referitoare la faptul că variabilele sunt observate fără eroare

63

4.5.1. ExperienŃă de calcul

65

Bibliografie

68

2

INTRODUCERE

Dezvoltarea aparatului statistic furnizează economiştilor tot mai multe date cifrice despre procesele şi fenomenele care au loc în timp şi spaŃiu. Econometria este un mijloc de a exploata aceste date. NoŃiunea de econometrie

provine din termenii oikonomie (economie) şi metron (măsurare) şi desemnează totalitatea metodelor şi tehnicilor de măsurare a fenomenelor şi proceselor care au loc în domeniul economic. Primele lucrări econometrice au avut ca obiect funcŃiile consumului, care leagă nivelul consumului de venitul disponibil (aceste funcŃii stau la baza teoriei keynesiene). În decursul timpului, numeroşi autori au încercat definirea econometriei. Lucrarea „ECONOMETRIA

a profesorului Eugen Ştefan Pecican, apărută la Editura Econmică în 2003, conŃine multe

referiri în acest sens, din care am selectat câteva.

PENTRU

ECONOMIŞTI”,

Autori

ReferinŃa

R.

Frisch

Econometria realizează îmbinarea punctelor de vedere care se referă la teoria economică, statistică şi matematică cu privire la natura relaŃiilor cantitative din economie

P.A. Samuelson,

Econometria reprezintă o analiză de natură cantitativă a fenomenelor economice, bazată pe dezvoltarea recentă a teoriei culegerii şi interpretării datelor, în conexiune cu metodele de inferenŃă (inducŃie) statistică adecvate

T.C. Koopmans,

J.R.N. Stone

Fr.

Perroux

Econometria este o economie de intenŃie ştiinŃifică

G.C. Chow

Econometria este un domeniu în care se îmbină arta şi ştiinŃa de a utiliza metodele statistice în vederea măsurării relaŃiilor economice

W.

Griffits,

Econometria este ansamblul metodelor de realizare a analizei datelor economice

H.

Carter,

G.

Judge

Autorul lucrării citate mai sus este de părerea că obiectul econometriei constă în cunoaşterea mecanismelor de desfăşurare a proceselor economice descrise de serii de date statistice, prin utilizarea metodelor cantitative de natură statistică sau matematică. DefiniŃiile date econometriei pun în evidenŃă două elemente: domeniul de studiu (economia, relaŃiile dintre variabilele economice) şi metodele utilizate (provenite din statistică şi matematică). Econometria se orientează spre construirea de modele econometrice care să reprezinte simplificat procesele sau fenomenele economice analizate şi să permită simulări ale acestora, în scopul înŃelegerii lor, pe de o parte, dar şi să servească la realizarea de previziuni, prognoze care să fundamenteze politicile economice, pe de altă parte.

3

CAPITOLUL I

MODELE ECONOMETRICE

1.1. GeneralităŃi

Modelarea economică reprezintă un proces de cunoaştere mijlocită a realităŃii cu ajutorul unui instrument cu caracteristici speciale: modelul. Sistemul real supus studiului este înlocuit prin modelul său, care este o reprezentare simplificată a obiectului cercetat. Modelul econometric este, de regulă, o mulŃime de relaŃii numerice care permite reprezentarea simplificată a procesului economic supus studiului (uneori chiar a întregii economii). Modelele actuale comportă adesea mai mult de zece relaŃii (ecuaŃii). Validitatea unui model este testată prin confruntarea rezultatelor obŃinute cu observaŃiile statistice. Pentru a studia un fenomen economic se încearcă reprezentarea lui prin comportamentul unei variabile. Această variabilă economică depinde, la rîndul său de alte variabile de care este legată prin relaŃii matematice. De exemplu, dacă se studiază cererea (C) şi oferta (O) dintr-un anumit bun pe o piaŃă, se ştie că cererea şi oferta depind de preŃul (p) bunului respectiv. Putem scrie că variabilele C şi O sunt funcŃii de variabila p şi că la echilibrul pieŃei, trebuie ca cererea să fie egală cu oferta. Se construieşte astfel un model elementar de forma:

[1]

C

O

=

=

C

f

g

=

(

(

O

p

p

)

)

Oferta şi cererea dintr-un anumit bun depind şi de alte variabile decât preŃul. Astfel, cererea dintr-un bun

alimentar depinde şi de venitul disponibil, de preŃul unor produse analoage etc. La fel, dacă este vorba despre un bun

agricol (grâu,

dată, de regulă, la un anumit moment de timp t, caz în care variabilele apar indiciate:

oferta depinde de preŃul anului precedent. RelaŃia stabilită între variabile în modelul econometric este

)

[2]

C

O

t

t

=

=

f

g

(

(

p

p

t

t

,

1

C

t

x

,

1

t

x

=

1

x

,

2

,

t

O

x

t

t

2

,

t

,

,

x

,

)

nt

x

rt

)

În modelul [2] s-au introdus mai multe variabile care explică cererea şi oferta dintr-un bun şi s-a considerat realizarea acestor variabile la momentul t sau t-1. Se observă că modelul comportă mai multe relaŃii. Se zice că avem un model cu ecuaŃii multiple. Evident, se va începe studiul cu un model mai simplu, cu o unică ecuaŃie.

1.2. Model aleator

Să presupunem că se studiază consumul (C i ) dintr-un anumit bun de către o familie (i). Între alte variabile, consumul depinde de venitul disponibil al familiei (V i ). Modelul econometric elementar constă în a exprima C i în funcŃie de V i . Desigur, alŃi factori – dintre care unii sunt necunoscuŃi – determină de asemenea consumul familiei. Condensăm efectele acestor alŃi factori într-unul singur, aleator, notat ε i . Se obŃine astfel un model aleator:

[3]

C

i

=

f (V ) +

i

i

Factorul aleator ε i este o variabilă aleatoare care urmează o anumită lege de probabilitate, ce va trebui să fie specificată prin ipotezele făcute asupra modelului. Cel mai frecvent, ipotezele se referă doar la momentele de ordinul I şi II ale variabilei aleatoare ε i . Urmează să ne asigurăm că funcŃia f (sau clasa de funcŃii) aleasă nu contrazice rezultatele experienŃei. De exemplu, dacă s-a ales f ca o funcŃie liniară (adică f(V i ) = aV i +b), modelul econometric este:

[4]

C

i

= aV

i

+ b +

i

şi variind pe i pentru diferitele familii studiate, ne vom asigura că relaŃia [4] este bine satisfăcută. Se spune că „testăm” modelul. Dacă rezultatul obŃinut este convenabil, se va trece la „estimarea” parametrilor a şi b. Apoi, definind o „regulă de previziune” se va putea determina consumul C i dacă se cunoaşte venitul V i .

1.3. Natura variabilelor care apar în model

Într-un model econometric se disting două tipuri de variabile:

-exogene. Sunt variabilele explicative ale variabilei studiate şi se consideră ca fiind date autonom. În modelul [4] V i este variabila exogenă (sau explicativă, independentă). Venitul familiei V i explică în acest model consumul familiei C i . Valoarea variabilei exogene –pentru un i dat şi pentru ε i precizat- permite determinarea consumului C i . -endogene. Sunt variabilele de explicat (sau dependente). C i este variabila endogenă în modelul precedent. Se poate remarca faptul că C i este acum o variabilă aleatoare datorită lui ε i .

4

DistincŃia între natura variabilelor este foarte importantă şi va trebui precizată întotdeauna înainte de a studia modelul. Când modelul econometric a căpătat formularea matematică definitivă se spune că modelul a fost „specificat”. Modelul [4] de mai sus este specificat. Se cunoaşte forma funcŃiei f din expresia C i = f(V i ) + ε i , adică f(V i ) = aV i +b. Adăugarea variabilei exogene ε i dă modelului formularea definitivă [4]. MulŃimea parametrilor care definesc complet modelul econometric constituie „structura” acestuia. De exemplu, dacă a = 0,7 şi b = 23 iar ε urmează o lege de probabilitate normală de medie (speranŃă matematică) egală cu zero şi dispersie (varianŃă) egală cu 5, atunci mulŃimea

a = 0,7; b= 23;

=

5
5

constituie structura modelului [4]. Scopul va fi acela ca, plecând de la cuplurile (C i ,V i ) asociate diferitelor familii i, să se determine structura adevărată a modelului. Cu alte cuvinte, plecând de la un spaŃiu eşantion definit de mulŃimea cuplurilor (C i ,V i ) să se determine structura adevărată a modelului în spaŃiul cu trei dimensiuni al structurilor a , b, . Aici intervine „inducŃia”statistică.

1.4. InducŃia statistică

Obiectul inducŃiei statistice este de a determina o procedură care, pornind doar de la observaŃiile statistice de care dispunem, să permită trecerea de la spaŃiul eşantion la spaŃiul structurilor. Odată ce modelul a fost ales, se admite că există un triplet (a, b, ) care permite reprezentarea exactă a procesului prin care valorile variabilelor observate au fost determinate. În cursul inducŃiei statistice modelul nu se mai modifică. Procedura aleasă – aşa cum se va vedea în continuare – va consta în obŃinerea de estimatori pentru parametrii a şi b care să permită determinarea celor mai bune valori reale ale acestor parametri. Aceste valori se vor aprecia, în general, cu ajutorul unor „intervale de încredere” construite la un prag de semnificaŃie ( ) dat. De exemplu, în modelul [4] se va găsi că a [0,64;0,78] şi b [20;27] cu o probabilitate de 95% (s-a considerat =5%). Se poate estima şi abaterea medie pătratică ( ) a variabilei aleatoare ε i . Se va vedea rolul important jucat de această variabilă aleatoare în modelul econometric.

1.5. Identificarea modelului

Considerăm din nou modelul C i =aV i +b+ε i . Să presupunem că procedura utilizată, pornind de la informaŃia

nu conduce la o soluŃie unică, ci la două structuri distincte:

s 0 =a 0 ,b 0 , 0 , s 1 =a 1 ,b 1 , 1 . Deorece legea de probabilitate pentru ε precizează şi legea de probabilitate pentru C, fiecare structură (Ńinând cont de valorile exogenelor şi de legea lui ε) conduce la o lege de probabilitate pentru C. Presupunem că structurile s 0 şi s 1 conduc la aceeaşi lege de probabilitate pentru consumul C. Sunt posibile două cazuri:

- s 0 şi s 1 sunt distincte şi nu putem alege între ele. Se spune că structurile considerate nu sunt „identificabile” şi, ca urmare, modelul nu este identificabil. Din această cauză nu vom putea determina valorile parametrilor care figurează în model;

- s 0 şi s 1 nu sunt distincte, intersecŃia lor nu este vidă. Acestea vor permite identificarea unei părŃi a parametrilor modelului (cei care aparŃin intersecŃiei). Se spune că cele două structuri sunt echivalente, dar nu permit o identificare completă a modelului. Problema identificării este importantă mai ales în cazul modelelor cu ecuaŃii multiple.

deŃinută, adică de

la cuplurile (C i ,V i ), i=1,2,

1.6. Previziunea variabilei endogene

Interesul unui model a cărui structură a fost determinată constă în a-l utiliza pentru previzionarea variabilelor

endogene – într-o etapă viitoare sau într-o circumstanŃă dată, dacă este vorba despre observaŃii luate la acelaşi moment-, atunci când cele exogene au fost fixate. De exemplu, dacă dorim să studiem evoluŃia importurilor (Y) în funcŃie de produsul intern brut (X 1 ) şi de nivelul stocurilor (X 2 ), modelul econometric este:

y t =a 1 x 1t +a 2 x 2t +b+ε t , t=1,2,

,T

unde t este timpul. Datele istorice (pe perioada 1990-2005) despre Y, X 1 şi X 2 (observaŃiile fiind anuale)

permit determinarea parametrilor modelului. Să presupunem că am găsit estimaŃiile punctuale:

ˆ

a

1

a ˆ

= 0,14 = 0,6 b = 6

2

ˆ

. Dacă dorim să facem o previziune a importurilor pentru anul

2007, trebuie să ştim PIB-ul şi nivelul stocurilor în anul 2007. Presupunînd că aceste variabile exogene sunt x 1 =1030 şi x 2 =12,7 vom avea ca previziune pentru y:

Modelul „estimat” este:

y ˆ

t

=

0,14

x

1

t

+

0,6

x

2

t

+

6

y 2007 =(0,14).1030+(0,6).(12,7)+6

5

ˆ

sau, în general, y a x a x b , unde θ este perioada de previziune.

ObservaŃie. Asupra valorii previzionate trebuie să remarcăm:

p

ˆ

1

+

ˆ

2

=

+

1

2

- valorile exogenelor x 1θ , x 2θ au fost alese arbitrar, eventual Ńinînd cont de evoluŃia lor trecută;

- specificarea modelului nu poate fi perfectă, forma funcŃiei alese pentru a explica evoluŃia lui y neputînd fi suficient de precisă;

- este posibil ca variabilele explicative (exogene) ale variabilei endogene (explicate), să nu mai intervină în acelaşi mod ca în perioada 1990-2005, cînd s-a studiat legatura dintre ele. Este posibil să aibă loc un şoc, o ruptură care să perturbe echilibrul dintre variabilele care explică fenomenul, la momentul previziunii. Este evident că toate aceste cauze pot constitui surse de eroare a previziunii. Vom vedea care sunt metodele de a minimiza eroarea de previziune.

Rezumatul capitolului I

Pentru construcŃia şi utilizarea unui model econometric, se parcurg următoarele etape:

- specificarea modelului (găsirea formulării matematice definitive a legăturii dintre variabilele care descriu fenomenul sau procesul economic studiat);

- estimarea parametrilor şi testarea modelului cu ajutorul statisticilor (seriilor de date observate) deja cunoscute;

- previziunea variabilei endogene.

1.7. Vocabular uzual

Dacă sunteŃi familiarizaŃi cu statistica matematică, puteŃi trece la capitolul II. În caz contrar, vă reamintim aici cîteva noŃiuni de bază. Lectura acestui paragraf credem că vă va incita să revedeŃi cursul de Statistică matematică.

Nor de puncte – Fiind dată o serie de date statistice în care valorile (x i ,y j ) apar efectiv de n ij ori putem reprezenta într-un plan toate aceste valori prin puncte de coordonate (x i ,y j ) afectate de coeficienŃii n ij , obŃinându-se astfel un nor de puncte. Ajustare – Reprezentarea grafică a seriilor de date economice conduce frecvent la figuri puŃin lizibile şi greu de interpretat din cauza variaŃiilor pe termen scurt, numeroase şi sensibile, dar fără o semnificaŃie importantă. Metodele matematice numite „de ajustare” permit obŃinerea unei curbe simple, cât mai apropiată posibil de mulŃimea de puncte furnizate de observaŃiile empirice disponibile. Ajustare liniară – Atunci când reprezentarea grafică a unei serii statistice duble dă un nor de puncte de formă alungită, se încearcă obŃinerea unei aproximări bune a acestei serii cu ajutorul unei drepte, realizându-se astfel o ajustare liniară. Există mai multe metode pentru găsirea acestei drepte:

- metoda grafică (se determină punctul mediu M ale cărui coordonate sunt (x, y) şi se trasează dreapta care

pare a fi cea mai reprezentativă a seriei, determinând ecuaŃia Y=aX+b. Această metodă este ambiguă pentru că nu Ńine cont de ponderea fiecărui punct în norul de puncte);

- metoda lui Mayer (se regrupează punctele norului în două submulŃimi cărora li se determină punctele medii

M 1 şi M 2 . Dreapta de ajustare este atunci dreapta care trece prin M 1 şi M 2 );

- metoda celor mai mici pătrate (constă în a face minimă suma pătratelor distanŃelor de la punctele norului la o

dreaptă de ecuaŃie Y=aX+b numită dreaptă de regresie a lui Y în X. Se arată că panta (coeficientul director) acestei drepte este a=cov(X,Y)/Var(X). Coeficientul b se obŃine scriind că dreapta de regresie trece prin punctul mediu:

b = Y

aX . Procedând la fel se găseşte dreapta de regresie de ecuaŃie X=a Y+b , cu a =cov(X,Y)/Var(Y) şi

b = X a Y . Cele două drepte de regresie sunt, în general, distincte. Compararea lor permite măsurarea nivelului de corelaŃie al caracteristicilor X şi Y. CorelaŃia se măsoară cu coeficientul de corelaŃie =cov(X,Y)/ (X) (Y). Se constată că 2 =aa şi că variază între –1 şi 1. 2 măsoară unghiul dintre cele două drepte de regresie, care coincid dacă

2 =1, adică

În afara faptului de a da o reprezentare mai mult sau mai puŃin satisfăcătoare legăturii dintre X şi Y, importanŃa ajustării liniare este de a permite previziuni statistice, asociind lui X o valoare probabilă a lui Y prin relaŃia Y=aX+b. Probabilitate – Fiind dată o mulŃime finită , numim probabilitate pe orice aplicaŃie p a lui P( ) – mulŃimea părŃilor lui - în intervalul [0,1] care verifică trei condiŃii:

=1

. Caracteristicile X şi Y sunt corelate maximal când

este apropiat de 1).

- p(A)0, pentru

A

P(

)

- p( )=1

- p(A B)= p(A)+ p(B), dacă A,B

P(

), A

B=

se numeşte univers (sau univers de probabilităŃi). înzestrat cu probabilitatea p se numeşte spaŃiu probabilizat. Orice parte a lui este un eveniment. Un singleton (mulŃime ce conŃine un singur element) al lui se

6

numeşte eveniment elementar sau eventualitate. este evenimentul cert. este evenimentul imposibil. A este

(se numeşte eveniment contrar lui A). Dacă A B= , evenimentele A şi B sunt

incompatibile. Variabilă aleatoare – Dacă este un univers finit, numim „variabilă aleatoare” orice aplicaŃie X: R ( a lui în mulŃimea numerelor reale). MulŃimea valorilor lui X, adică X( ) se numeşte universul imagine. AtenŃie!- o variabilă aleatoare nu este o variabilă, ci o aplicaŃie! Se observă că nu este necesar să cunoaştem o probabilitate pe pentru a defini o variabilă aleatoare pe . Legea de probabilitate a unei variabile aleatoare – Dacă universul finit este înzestrat cu o probabilitate p, iar X este o variabilă aleatoare definită pe , numim lege de probabilitate a variabilei aleatoare X, aplicaŃia p x :

evenimentul complementar lui A în

X( ) [0,1] care asociază oricărui x X( ) probabilitatea evenimentului „mulŃimea antecedentelor lui x prin X”. Această mulŃime X -1 (x) este notată (X=x). Legea de probabilitate a lui X, notată p x este definită prin p x : X( ) [0,1], x p(X=x). A studia o variabilă aleatoare înseamnă a-i descoperi legea sa de probabilitate. FuncŃie de repartiŃie – Dacă universul finit este înzestrat cu o probabilitate p, iar X este o variabilă aleatoare definită pe , se asociază acestei variabile aleatoare funcŃia F:R [0,1] definită prin F(x)=p(X<x) numită

funcŃie de repartiŃie a variabilei aleatoare X. Evenimentul (X<x) este imaginea intervalului ( , x) prin funcŃia X. FuncŃia de repartiŃie este o funcŃie în scară. SperanŃa matematică Dacă X este o variabilă aleatoare definită pe universul finit , înzestrat cu

probabilitatea p, universul imagine este o mulŃime finită şi ia valorile x i , i=1,2,

asociază fiecărui x i probabilitatea p i =p(X=x i ). Se numeşte speranŃă matematică a variabilei aleatoare X, numărul real

Legea de probabilitate a lui X

,n.

E

(

X

) =

n

i = 1

p x

i

i

. E(X) este media în probabilitate a valorilor luate de variabila aleatoare X. E(.) este un operator

liniar.

VarianŃa – Dacă X este o variabilă aleatoare definită pe universul finit , înzestrat cu probabilitatea p,

Legea de probabilitate a lui X asociază fiecărui x i

probabilitatea p i =p(X=x i ). Se numeşte varianŃă a variabilei aleatoare X, numărul real pozitiv

universul imagine este o mulŃime finită şi ia valorile x i , i=1,2,

,n.

(

Var X

)

=

n

i = 1

p

i

(

x

i

E

(

X

))

2 . VarianŃa este media în probabilitate a pătratului distanŃelor de la x i la media lor.

Rădăcina pătrată (radicalul) lui Var(X) este ecartul-tip al variabilei aleatoare X, notat x .

Momente

P(X = x ,Y = y

i

j

P

(

X

=

x

i

/

Y

=

y

condiŃionate

) = p

ij

,

j

)

=

p

ij

p

. j

p

ij

, p

. j

> 0,

=

i

Se

p

ij

consideră

∑∑

p

ij

repartiŃia

= 1 şi variabila aleatoare condiŃionată (X/Y=y j ) cu repartiŃía

vectorul

aleator

(

X ,Y

)

:

R

2

,

cu

i

j

. Momentul de ordinul k al variabilei aleatoare X condiŃionat de Y=y j este

momentul iniŃial de ordinul k al variabilei aleatoare condiŃionate (X/Y=y j ):

M

(

X

k

/

Y

=

y

j

)

=

i

x

k

i

P

(

X

=

x

i

/

Y

=

y

j

)

=

i

x

k

i

p

ij

p

.

j

=

1

p

.

j

i

p

ij

x

k

i

Similar se defineşte momentul de ordinul k al variabilei aleatoare Y condiŃionat de X=x i . Pentru k=1 se obŃin mediile condiŃionate:

(

M X

/

Y

=

y

j

)

=

1

p

.

j

i

x p

i

i j

,

M

(

Y

/

X

=

x

i

)

=

1

p .

i

j

y

j

p

ij

Se pot defini variabilele aleatoare „medii condiŃionate” astfel:

- variabila aleatoare „media lui X condiŃionată de Y”, cu repartiŃia:

(

M X

/

Y

)

:

M X

(

/

p

Y

.

j

=

y

j

)  

,

p

.

j

0,

j

p

.

j

=

1

-variabila aleatoare „media lui Y condiŃionată de X” , cu repartiŃia:

M

(

Y

/

X

)

:

M Y

(

/

X

p .

i

=

x

i

)  

,

p

i

.

0,

i

p

i

=

.

1

Regresie – Se numeşte regresia variabilei aleatoare X în raport cu Y, variabila aleatoare M(X/Y) cu mulŃimea

valorilor posibile: M(X/Y=y), x

R.

Similar, regresia variabilei aleatoare Y în raport cu X este: M(Y/X=x), y Dacă M(X/Y)=aX+b sau M(Y/X)=cY+d se spune că regresia este liniară

7

R.

RepartiŃía normală – Variabila aleatoare X urmează o repartiŃie normală de parametri m şi σ (se mai scrie şi

X

N (m, ) ) dacă densitatea ei de probabilitate (derivata funcŃiei de repartiŃie) este:

f

(

x

) =

2 1 ( x m ) exp( 2 2 2
2
1
(
x
m
)
exp(
2
2
2

),

x

R,

m

R, σ>0

Pentru m=0 şi σ =1 se obŃine repartiŃia normală „normatăN(0,1), cu densitatea de probabilitate:

f

(

x

)

=

1

2
2

x

2

2

),

exp(

x

R,

Se arată că parametri m şi σ 2 sunt media (speranŃa matematică), respectiv dispersia (varianŃa) variabilei aleatoare

X

N(m,

) .

RepartiŃia χ 2 (hi-pătrat) cu n grade de libertate – Variabila aleatoare X urmează legea de repartiŃie hi-pătrat

cu n grade de libertate (se mai scrie şi X

H (n) ) dacă densitatea ei de repartiŃie este:

f

(

x

) =

1

(

n

2

)2

n

2

x

n

2

1

exp(

x

2

),

Dacă

variabilele

n

aleatoare

X

i

N (0,1),

Y

=

X

i 2 urmează legea de repartiŃie H(n).

i = 1

x>0,

n

i=1,2,

N

*

,n

sunt

independente,

atunci

variabila

aleatoare

RepartiŃia Student cu n grade de libertate S(n) – Variabila aleatoare X urmează legea de repartiŃie Student cu n grade de libertate dacă densitatea ei de repartiŃie este:

Z =

X

Y n
Y
n
1  f ( x ) = 1   1   n 
1
f
( x
) =
1
 
1 
n
  n
,
2
2
Dacă variabilele aleatoare
.
S(n)

+

X

n

2

x

n + 1

2

,

x

N (0,1),

R,

Y

n

N

*

H(n) sunt independente, atunci

variabila aleatoare

RepartiŃia Fisher-Snedecor F(n 1 ,n 2 ) – Variabila aleatoare X urmează legea de repartiŃie Fisher-Snedecor cu n 1 şi n 2 grade de libertate dacă densitatea ei de repartiŃie este:

X =

X

1

n

1

X

2

n

2

f

(

x

Dacă

F

(

n

) =

n 1 n  n  2 1 1  1  x 2 
n 1
n
 n 
2
1
1
1
x
2
n
2
n
1
2
  n
2
,
2

variabilele

aleatoare

1

,

n

2

)

.

1

+

X

1

n

1

n

2

x

H

(

n

1

n

1

+

n

2

)

2

şi

,

X

x>0,

2

8

H

n ,n

1

(

n

2

)

2

sunt

N

*

independente,

atunci

variabila

aleatoare

CAPITOLUL II REGRESIA SIMPLĂ

Studiem, pentru început, cel mai simplu model econometric: o variabilă endogenă reprezintă evoluŃia fenomenului considerat şi această evoluŃie este explicată printr-o singură variabilă exogenă. În cadrul capitolului este prezentată metoda de estimare a parametrilor care intervin într-un model econometric, se vor examina proprietăŃile estimatorilor obŃinuŃi şi se vor generaliza rezultatele analizei pentru modele mai complexe. Într-o prima parte se va trata obŃinerea estimatorilor parametrilor modelului şi proprietăŃilor lor, iar într- o a doua parte se dă o interpretarea geometrică a metodei utilizate, determinarea intervalelor de încredere referitoare la parametri şi previziunea care poate fi făcută cu un astfel de model.

2.1. Modelul liniar al regresiei simple

în care:

Considerăm modelul:

(1)

y

t

= ax

t

+ b +

t

, t=1, 2,

Y reprezintă o variabilă endogenă;

X o variabilă exogenă;

,T

o variabilă aleatoare ale cărei caracteristici vor fi precizate prin ipoteze. Se dispune de T observaŃii asupra lui Y şi X, adică T cupluri (x t , y t ) care sunt realizări ale lui X şi Y. a şi b sunt parametri reali necunoscuŃi pe care dorim să-i estimăm cu ajutorul observaŃiilor (x t , y t ) cunoscute.

Ipoteze fundamentale Pentru a putea obŃine rezultatele enunŃate la început, vom simplifica lucrurile impunînd o serie de ipoteze restrictive asupra modelului. Ulterior, în alte capitole, se vor relaxa aceste restricŃii, discutînd implicaŃiile abandonării unora din aceste ipoteze asupra calităŃii estimatorilor.

I

1 :

 

x t şi y t sunt mărimi numerice observate fără eroare;

X –variabila explicativă se consideră dată autonom în model;

Y –variabila endogenă este o variabilă aleatoare, prin intermediul lui .

I

2 :

a)-

urmează o lege de distribuŃie independentă de timp, adică media şi dispersia lui

E(

Var

t

(

)

= 0,

t

)

=

t

2

= 1,2,

,

T

,

, cantitate finită, t .

nu depind de t:

ObservaŃie:

E(), respectiv Var(), provenind de la „speranŃa

matematicăşi „varianŃa” unei variabile aleatoare. Se presupune că studenŃii au cunoştinŃe elementare despre teoria probabilităŃilor şi statistică matematică. Altfel, ele trebuie revăzute!

S-au folosit aici, pentru medie şi dispersie, notaŃiile

b)- Realizările lui

sunt independente de realizările lui X în cursul timpului. Aceasta este ipoteza de

homoscedasticitate. În caz contrar, există heteroscedasticitate.

9

c)- IndependenŃa erorilor (se va vedea pe parcurs că variabila aleatoare reprezintă „erori” sau „reziduuri”). Două erori relative la două observaŃii diferite t şi t’ sunt independente între ele, însemnînd că au covarianŃa nulă:

cov(

)= 0

(

E

)= 0

t

 

t

, ceea ce implică

 

.

,

 

t

t

.

Prin definiŃie, cov(

 

t

,

t

)

=

E

[(

t

E

(

t

))(

t

E

(

t

))]

şi Ńinînd cont de a) rezultă implicaŃia.

 

2

d)- Normalitatea erorilor. Presupunem că urmează o lege de repartiŃie normală , cu media 0 şi dispersia

 

,

ceea ce poate fi scris astfel:

I 3 :

N

(

0,

2

)

.

Primele momente empirice ale variabilei X, pentru T foarte mare, sunt finite:

1

T

1

T

T

t = 1

x

t

T

t

= 1

(

x

t

T

x

)

2

T

x

0

(media empirică).

s

2

(varianŃa empirică).

Această ipoteză va fi folosită pentru a preciza proprietăŃile asimptotice ale estimatorilor parametrilor a şi b. Ipotezele I 1 , I 2 , I 3 pot părea foarte restrictive. Vom vedea ulterior ce consecinŃe are abandonarea unora dintre ele asupra proprietăŃilor estimatorilor lui a şi b.

2.2. Determinarea estimatorilor parametrilor prin metoda celor mai mici pătrate

Determinarea estimatorilor parametrilor a şi b (notaŃi cu

aˆ

şi b ˆ ) prin metoda celor mai mici pătrate

(MCMMP) se face punând condiŃia ca suma pătratelor erorilor să fie minimă, adică:

T

t =

1

2

t

=

T

t

= 1

[

y

t

ax

t

b

]

2

=

(

a b

,

)

.

Pentru ca (a,b) să fie minimală, trebuie ca:

1. condiŃii necesare:

2. condiŃii suficiente:

∂ ∂ = 0 , = 0 . ∂ a ∂ b 2 2 ∂
= 0 ,
= 0
.
∂ a
∂ b
2
2
2
2
∂ ∂
a
a
b
> 0
,
2
2
2
∂ a
2
b
a
∂ b

> 0

.

Calculăm derivatele parŃiale ale funcŃiei (a,b).

a

=

t

= 1

T

T

2(

y

t

(

2 y

b

2

=

t

a

2

=

= 1

2

T

t = 1

t

x

2

t

ax

ax

>

0

t

t

b

b

)(

)(

x

t

1)

)

=

= 0

0

10

2

b

2

2

= 2 T

2

a

b

=

b

a

= 2

T

t = 1

x

t

.

Atunci, condiŃiile de ordinul I (necesare) conduc la sistemul de ecuaŃii:

( )

1


T

t =

T

1

t =

1

x

t

y

t

y

t

a

T

=

a

T

=

1

t

t

1

x

t

x

2

t

b

T

=

1

t

Tb

= 0

x

t

= 0

,

iar condiŃiile suficiente (de ordinul II) sunt verificate. EcuaŃiile condiŃii de ordinul I (numite ecuaŃii normale, vezi justificarea geometrică din partea a II-a), le împărŃim la T, rezultând:

1

T


x

T

y

t =

1

ax

t

y

t

b

a

1

T

= 0

T

t

= 1

x

2 bx

t

= 0

ˆ

.

Din a doua ecuaŃie avem b = y

ax

şi înlocuind în prima ecuaŃie:

1 ∑ x y yx ( )( ) t t x y T yx y
1
x y
yx
(
)(
)
t
t
x y
T yx
y
y
x
x
t
t
a =
ˆ T
= ∑
= ∑
t
t
.
1
2
(
)
2
2
2 2
x
T x
x
x
x
x
t
t
t
T

Am obŃinut estimatorii aˆ şi b ˆ ai parametrilor a şi b daŃi de relaŃiile:

(

2

)


a ˆ =

( )( ) ∑ y y x x t t , ( ) 2 ∑
(
)(
)
y
y
x
x
t
t
,
(
) 2
x
x
t
ˆ
b
=
y
ax
ˆ

ObservaŃie:

aˆ este o variabilă aleatoare pentru că e funcŃie de y t , iar b ˆ este aleator pentru că e funcŃie de aˆ .

2.3. ProprietăŃile estimatorilor

Vom arăta că estimatorii aˆ şi b ˆ obŃinuŃi prin metoda celor mai mici pătrate sunt nedeplasaŃi şi convergenŃi. În demonstraŃie vom Ńine cont de ipotezele I 1 , I 2 , I 3 . Pentru a uşura demonstrarea proprietăŃilor enunŃate, transformăm mai întâi expresiile (2) pentru a le exprima în funcŃie de parametrii a şi b. Vom considera modelul (1)

y

t

= ax

t

+ b +

t

, t=1, 2,

1

T

y

t

=

a

1

T

x

t

(2) y = ax + b +

,T,

+

.

b

însumăm după to