Sunteți pe pagina 1din 23

Ipotezele modelului de

regresie linear​ă și
proprietăți ale estimatorilor

Prof.univ.dr. Dorin Jula: ​Econometrie

Ipotezele modelului de regresie


lineară Proprietăți ale estimatorilor
Teorema Gauss-Markov

Prof.univ.dr. Dorin Jula: ​Econometrie

Ipotezele modelului

I–1: ​Modelul de regresie este linear


I–2​: ​Ipotezele referitoare la variabilele explicative
a. Variabilele explicative X nu sunt corelate cu erorile din
ecuația de regresie (ipoteza de exogeneitate)
b. Fiecare variabilă explicativă are dispersia nenulă, dar finită
c. Numărul de observații este superior numărului de
parametri d. Nu există nicio relație lineară între două sau mai
multe ​variabile explicative (absența multicolinearității)

Prof.univ.dr. Dorin Jula: ​Econometrie

Ipotezele modelului
I–3​: ​Ipotezele referitoare la erori
a. Erorile e​t au
​ media nulă
b. Erorile e​t au​ dispersia constantă oricare ar fi ​t ​(erorile nu sunt
heteroscedastice)
c. Erorile e​t sunt
​ independente (nu sunt autocorelate)
d. Erorile e​t sunt
​ normal distribuite

Prof.univ.dr. Dorin Jula: ​Econometrie

Ipoteza I-1: ​linearitatea modelului


Modelul este linear în sensul că oricare ar fi înregistrarea (Y​t​, X​1t​, X​2t​, …, X​kt​)
selectată, forma legăturii dintre Y​t​, variabilele explicative X​kt și
​ variabila de abatere
(e​t​) este lineară. Legătura dintre variabile este dată de ecuația de regresie lineară: Y​t =​
a​0 +​ a​1​X​1t +​ a​2​X​2t​+ … + a​k​X​kt +​ e​t​,

Obs. Linearitatea este în raport cu parametrii și nu neapărat în raport cu variabilele


explicative
Ex.1. Y​t​= a​0 +​ a​1​X​1t +​ a​2​ln(X​2t​) + e​t​, transformarea ln(X​2t​) ≡ Z​t​, Y​t​=
a​0 +​ a​1​X​1t +​ a​2​Z​t +​ e​t​,

Ex.2. Y​t​= a​0 +​ a​1​X​1t +​ a​2​(X​2t​)​2 ​+ e​t​, transformarea (X​2t​)​2 ​≡ Z​t​, ​Y​t​= a​0
+ a​1​X​1t +​ a​2​Z​t +​ e​t​,

Ex.3. Y​t =​ A(L​t​)​α​(K​t​)​β​,


ln(Y​t​) = ln A + αln(L​t​) + βln(K​t​)
y​t =​ a​0 +​ a​1​x​1t +​ a​1​x​2t
Prof.univ.dr. Dorin Jula: ​Econometrie

Ipotezele I-2, ​referitoare la variabilele


explicative

a. Variabilele explicative X nu sunt corelate cu erorile din


ecuația de regresie (ipoteza de exogeneitate)
b. Fiecare variabilă explicativă are dispersia nenulă, dar
finită
c. Numărul de observații este superior numărului de
parametri
d. Nu există nicio relație lineară între două sau mai multe
variabile explicative (absența coliniarității)

Prof.univ.dr. Dorin Jula: ​Econometrie


a. ​Variabilele explicative X nu sunt corelate cu erorile din ecuația de regresie
(ipoteza de exogeneitate). V​ aloarea variabilei endogene Y este influențată atât
de exogenele X, cât și de variabila necontrolabilă ​e​.
O variantă a acestei ipoteze presupune că ​variabilele X nu sunt aleatoare, ​au
valorile fixate atunci când se repetă selecția. Valorile X​t​ale variabilei
independente sunt înregistrate fără erori de observație, iar aceste mărimi sunt
păstrate fixe dacă se repetă experimentul (selecția). Faptul că atunci când se
repetă experimentul se păstrează exact aceleași valori ale variabilei X nu implică
obținerea unor valori neschimbate pentru variabila Y.
​ ariabila X are dispersia nenulă și finită​. N
b. V ​ u toate valorile variabilei exogene
sunt egale între ele. Cu alte cuvinte, dispersia de selecție a variabilei X nu este
zero, dar este finită.
c. ​Numărul de observații este superior numărului de parametri​.
d. ​Nu există nici o relație lineară între două sau mai multe variabile explicative
(absența coliniarității). Dacă ipoteza nu este respectată, înseamnă că există o
relație lineară între coloanele matricei X și, în consecință, între coloanele matricei
X'X. Adică X'X este singulară și atunci relația de calcul a estimatorilor

 = (X'X)​-1​X'Y nu are sens, deoarece nu există (X'X)​-1


Prof.univ.dr. Dorin Jula: ​Econometrie
Ipotezele I-3​, referitoare la erori

a. Erorile e​t au
​ media nulă
b. Erorile e​t au
​ dispersia constantă oricare ar fi ​t (​ erorile nu
sunt heteroscedastice)

c. Erorile e​t sunt


​ serial independente (nu sunt autocorelate)
d. Erorile e​t sunt
​ normal distribuite

Prof.univ.dr. Dorin Jula: ​Econometrie


Ipoteza I-3a: ​erorile au media zero

Erorile ​e​t din


​ modelul linear unifactorial sunt variabile
aleatoare cu media zero:

M(​e​t)​ = 0

Erorile nu înregistrează vreo componentă sistematică


și/sau o tendință de evoluție.

Prof.univ.dr. Dorin Jula: ​Econometrie


Ipoteza I-3b: ​dispersia erorii este constantă
➢ ​Erorile ​e​t sunt
​ identic distribuite, cu o dispersie
constantă și finită.
➢ ​Lipsa acestei proprietăți poartă denumirea de
heteroscedasticitate​.
Potrivit ipotezei I-3b, distribuția variabilei de abatere este
relativ constantă, indiferent care ar fi subsecventa de valori
e​t din
​ populația analizată.

Prof.univ.dr. Dorin Jula: ​Econometrie


Ipoteza I-3c: ​erorile sunt independente
Covarianța dintre oricare două valori ale variabilei de
abatere este zero: e​t și
​ e​p sunt
​ independente, oricare ar fi
t ≠ p (lipsa autocorelării)
cov(e​t​, e​p​) = 0, ​∀​t ≠ p

Ipoteza I-3d: ​erorile sunt distribuite normal


Fiecare variabilă aleatoare e​t este
​ distribuită normal în jurul
mediei sale egală cu zero.
( )​2
e ​→​N 0,​σ
te

Prof.univ.dr. Dorin Jula: ​Econometrie


Ipotezele de la I-3a la I-3d pot fi însumate
în următoarea afirmație:

Erorile e​t sunt


​ independente și normal distribuite, cu
media zero și dispersia constantă, oricare ar fi ​t​.

Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-1: ​Estimatorii sunt lineari
P-2: ​Estimatorii sunt nedeplasați
P-2’:​Estimatorii sunt consistenți
P-3: ​Estimatorii sunt eficienți
P-4: ​Estimatorii sunt normal
distribuiți ​P-5: ​Estimatorii sunt de
maximă
verosimilitate
Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-1: ​Estimatorii sunt lineari​.
Estimatorii parametrilor din modelul multifactorial de
regresie lineară sunt funcții lineare de observațiile din
eșantionul selectat.

 = (X'X)​-1​X'Y = CY

deci  = CY este combinație lineară a valorilor Y din


eșantion, cu ponderi care depind de valorile înregistrate
pentru variabilele explicative.

Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-2: ​Estimatorii sunt nedeplasați (nedistorsionați)​. ​Dacă erorile
sunt variabile aleatoare cu media zero, estimatorii ​lineari ai
parametrilor din modelul multifactorial de regresie lineară sunt
nedeplasați (media estimatorului este egală cu media parametrului
pe care îl estimează).

Deoarece  = (X'X)​-1​X'Y și Y = XA + e.
Rezultă Â = (X'X)​-1​X'(XA+e) = (X'X)​-1​X'XA + (X'X)​-1​X’e
 = A + (X'X)​-1​X'e
În relația precedentă se aplică operatorul de medie:
M(Â) = M[A + (X'X)​-1​X'e] = A + (X'X)​-1​X'M(e)
DeoareceM(C) = C și M(e) = 0, rezultă M(Â) = A
adică estimatorii sunt nedeplasați.
Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-2’: ​Estimatorii sunt consistenți​.
➢ ​Proprietatea este specifică selecțiilor de volum mare.
➢ ​Un estimator este consistent dacă pe măsură ce numărul
observațiilor crește, valoarea estimatorului se apropie de valoarea
parametrului estimat.
➢ ​La limită, un estimator este consistent dacă, atunci când
dimensiunea eșantionului tinde la infinit, valoarea estimatorului
tinde în probabilitate spre valoarea parametrului estimat.

Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-3: ​Estimatorii sunt eficienți​.
Un estimator al unui parametru este ​eficient ​dacă este
nedeplasat (nedistorsionat) și nu există un alt estimator
nedeplasat care are o dispersie mai mică.
Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţi ale estimatorilor


P-4: ​Estimatorii sunt normal distribuiți​.
Estimatorii  sunt combinații lineare ale variabilei endogene
Y, Â = (X'X)​-1​X'Y = CY.
Însă, Y este o variabilă aleatoare calculată ca sumă între
constantele XA și variabila aleatoare ​e ​repartizată normal:
Y = XA + e
Rezultă că valorile Y sunt variabile aleatoare repartizate normal și,
în consecință, vectorul  conține elemente care sunt variabile
aleatoare repartizate normal.

Prof.univ.dr. Dorin Jula: ​Econometrie

Proprietăţile estimatorilor
P-5: ​Estimatorii sunt de maximă verosimilitate
➢ ​Un estimator este verosimil dacă generează valori
plauzibile pentru variabila endogenă.
➢ ​În ipotezele obișnuite, estimatorii obținuți prin metoda
celor mai mici pătrate sunt de maximă verosimilitate.

Adică, estimatorii respectivi au cea mai mare probabilitate


ca, prin intermediul relației lineare
Ŷ = XÂ,
să genereze valorile observate pentru variabila endogenă

Y. ​Prof.univ.dr. Dorin Jula: ​Econometrie

Teorema Gauss-Markov
Dacă (I-1) modelul de regresie este linear,
(I-2) variabilele explicative X nu sunt corelate cu erorile din
ecuația de regresie, au dispersia nenulă, dar finită,
numărul de observații este superior numărului de
parametri și nu există nici o relație lineară între două sau
mai multe variabile explicative și
(I-3) erorile e​t​sunt independente, normal distribuite, cu media
zero și dispersia constantă,
atunci estimatorii â​0, â​​ 1​, …, â​k​calculați prin metoda celor mai mici
pătrate pentru parametrii modelului de regresie sunt ​cei mai buni
estimatori lineari nedeplasați​, în sensul că, dintre toți estimatorii
lineari nedeplasați, au cea mai mică dispersie.

Prof.univ.dr. Dorin Jula: ​Econometrie

Teorema Gauss-Markov
În literatura de specialitate se folosește expresia
BLUE
(​B​est L
​ ​inear ​U​nbiased ​E​stimators)
pentru estimatorii parametrilor din modelul de regresie
lineară calculați prin metoda celor mai mici pătrate, atunci
când estimatorii respectivi îndeplinesc condițiile din
teorema Gauss-Markov.

Prof.univ.dr. Dorin Jula: ​Econometrie


Bibliografie

Jula, Dorin; Jula, Nicolae-Marius. 2020. ​Econometrie​, ediția a 3a, Editura


Mustang, București, pp. 42-46

Prof.univ.dr. Dorin Jula: ​Econometrie

S-ar putea să vă placă și