Sunteți pe pagina 1din 19

Modelul de regresie

clasic


Specificarea unui model de
regresie
Un studiu econometric ncepe cu o serie de presupuneri
teoretice despre anumite aspecte ale economiei.
Investigaiile empirice furnizeaz estimatori pentru
parametri necunoscui ai modelului.
Keynes: C=f(x)
Suma cheltuit pentru consum depinde de:
mrimea venitului pe de o parte
alte obiective n funcie de circumstane (de exemplu investiiile)
alte nevoi subiective


Specificarea unui model de
regresie
Legea psihologic fundamental: o persoan este dispus
de regul i n medie s i creasc consumul pe msura
creterii venitului dar nu n aceeai msur


Un nivel absolut mai mare al venitului va tinde de regul s
mreasc diferena ntre venit i consum:


Presupunerea cea mai simpl: C=o+|X, 0<|<1 este o
relaie determinist neadecvat.
1 0 < <
dX
dC
0
) / (
<
dX
X C d
Specificarea unui model de
regresie
n model trebuie inclus i factorul aleator:
C=f(X,c)
Modelul cel mai simplu:
C=o+|X+c
Modelul general ce trebuie estimat are forma:
y
i
=o + |x
i
+ c
i
, i=1,n
unde:
x
i
este nestochastic (situaie experimental)
Analistul alege valorile regresiei x
i
i apoi observ y
i
Specificarea unui model de
regresie
Valoarea parametrului | arat modificarea proporional a
variabilei efect (Y) la modificarea cu o unitate a variabilei
cauz (X).
Valoarea parametrului o arat punctul n care linia
intercepteaz (taie) axa OY
c
i
reprezint componenta rezidual (eroarea aleatoare)
pentru fiecare unitate, adic partea din valoarea variabilei Y
care nu poate fi msurat prin relaia sistematic existent
cu variabila X.
Specificarea unui model de
regresie









Modelul liniar unifactorial y=1+0,5x
Specificarea unui model de
regresie
Modelul probabilistic conine:
componenta deterministic, adic partea din valoarea lui Yi care poate
fi determinat cunoscnd valoarea Xi (o + |Xi = Yi')
componenta rezidual care nu poate fi determinat cunoscnd valoarea
individual Xi (ci)
Atunci,
Y
i
= o + |X
i
+ c
i


Y
i
= componenta predictibil (detrministic) + eroarea aleatoare

Y
i
= Y
i
' + c
i

Specificarea unui model de
regresie
Dac datele disponibile provin dintr-un eantion avem la
dispoziie n perechi de observaii (x
1
, y
1
), (x
2
,y
2
), ... (x
n
, y
n
),
pe care le vom folosi pentru estimarea parametrilor ecuaiei
de regresie liniar simpl, o i |.
Modelul de regresie liniar n eantion este:
y
i
= a + bx
i
+ e
i

cu componenta predictibil:

a i b sunt estimatorii punctului de intercepie (o) i pantei liniei
drepte (|), obinui pe eantion
e
i
este valoarea rezidual (pentru unitatea i) n eantion:
e
i
= y
i
(a + bx
i
)
i i
bx a y

+ =
Ipotezele modelului de regresie
liniar
Pentru a obine proprietile dorite ale estimatorilor regresiei, se
fac, de obicei, cinci presupuneri (ipoteze) standard pentru modelul
din populaia general:

Ipotezele ce trebuie verificate:

Forma funcional: y
i
=o + |x
i
+ c
i
, i=1,n
Normalitatea erorilor: c
i
~N(0, )
Media zero a erorilor: (c
i
)=0 i
Homoscedasticitatea:
2
(c
i
)= constant i
Non autocorelarea erorilor: Cov(c
i
,c
j
)=0 i=j
Necorelarea ntre regresor i erori: Cov(x
i
,c
j
)=0 i i j


2
c
o
2
c
o
Ipoteza 1: Forma funcional
y=a+bx
y=a+bz, z=e
x
y=a+br, r=1/x
y=a+bq, q=ln(x)

Sau
y=Ax
|
ln(y)=o+|ln(x)
Forma general:
f(y
i
)= o+|g(x
i
)+c
i
Contra exemplu:

nu poate fi transformat n model liniar.
-400
-200
0
200
400
600
800
1000
-1 0. 003 0. 008 0. 013 0. 018 0. 023 0. 028 0. 033 0. 038 0. 043 0. 048 0. 053 0. 058 0. 063 0. 068
X
Y
|
.
|

\
|
+
x
b a
1
x
be a +
bx a +
( ) x b a ln +
Modele ce pot fi linearizate
x
y
+
+ =
|
o
1
Erorile
Ipoteza de linearitate a modelului include i aditivitatea
erorilor.
Forma modelului:
y = o + |x + c,
De exemplu modelul se transform prin
logaritmare n modelul liniar: ln(y)=ln(A)+|ln(x)+c .
ns modelul nu mai poate fi transformat n
model liniar.
Dac ipoteza de linearitate este verificat, variabila
dependent observat este suma a dou elemente:
un termen nestochastic: o+|x
o variabil aleatoare
c |
e Ax y =
c
|
+ = Ax y
Ipoteza 2: normalitatea erorilor
Se presupune c variabila aleatoare c
i
este normal
distribuit :
Distribuia de probabilitate pentru c
i

Ipoteza 3: media erorilor este
zero: (c
i
)=0 i
Este natural atta timp ct c este vzut ca suma efectelor
individuale, cu semne diferite.
Dac media erorilor este diferit de zero, ea poate fi
considerat ca o parte sistematic a regresiei:
(c)= o + |x + c = (o+) + |x + (c-)
Media erorilor este acum nul.
Aceast presupunere indic faptul c media valorilor Y,
condiionat de X, (Y/X = X
i
) = o + |X
i
, adic nu exist
variabile omise asociate cu regresia n populaie.
Ipoteza 4 (de homoscedasticitate):
Var(c
i
)= constant i
Dispersia reziduurilor n populaie este constant peste toate
valorile X
i
2
c
o
Functia de consum
0
200
400
600
800
1000
1200
200 300 400 500 600 700 800 900 1000
venit
c
o
n
s
u
m
Ipoteza 4 (de homoscedasticitate):
Var(c
i
)= constant i
2
c
o
a) b)
Dispersia reziduurilor a) constant; b) variabil
Discuie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor
mici.
Variaia cheltuielilor gospodriilor n funcie de venit sau de mrimea
lor poate fi
Ipoteza 5: Non autocorelarea
erorilor: (c
i
c
j
)=0 i=j
Aceast ipotez nu implic faptul c y
i
i y
j
sunt necorelate,
ci faptul c deviaiile observaiilor de la valorile lor ateptate
sunt necorelate.
Variabilele aleatoare c
i
sunt statistic independente una de
alta, adic = 0, pentru i = j.
Acest lucru nseamn c eroarea asociat cu o valoare a
variabilei Y nu are nici un efect asupra erorilor asociate cu
alte valori ale lui Y;
Nu exist deci corelaie ntre reziduuri;
OBSERVAIE: Este convenabil a considera c erorile sunt
independente i normal distribuite cu medie zero i
variaie constant pentru obinerea de rezultate statistice
exacte.
j i
c c

Estimarea parametrilor
modelului de regresie clasic
Parametrii necunoscui ai reaciei stochastice sunt cei ce trebuie estimai:
y
i
=o + |x
i
+ c
i
, i=1,n
Modelul estimat va fi scris:

Eroarea asociat unui punct i este:
c
i
= y
i
- o - |x
i

Pentru orice valori estimate a i b, erorile estimate vor fi:
e
i
= y
i
- a - bx
i

Pentru estimarea parametrilor o i | pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate, deci de minimizare a erorilor observate:

n i bx a y
i
i
, 1 , = + =
.

=
i
i i
i
i
bx a y e
2 2
) ( min min
Estimarea parametrilor
modelului de regresie clasic
Condiiile de ordin 1 de minimizare a funciei sunt:


=
c
c
=
c
c

0
) (
0
) (
2
2
b
e
a
e
i
i
i
i

+ =
+ =


b x a x y x
b x na y
i
i
i
i
i
i i
i
i
i
i
) ( ) (
) (
2

= =
=



2
2
2
x n x
y x n y x
x x
x n
y x x
y n
b
x b y a
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
Estimarea parametrilor
modelului de regresie clasic
Rmne de verificat dac este verificat condiia de ordin 2, adic soluia gsit
este un punct de minim. Matricea derivatelor pariale de ordin doi trebuie s fie
pozitiv definit:









Deci matricea este pozitiv definit.
(
(
(

=
(
(
(
(
(
(

c
c
c c
c
c c
c
c
c



i
i
i
i
i
i
i
i
i
i
i
i
i
i
x x
x n
b
e
a b
e
b a
e
a
e
2
2 2
2 2 2 2
2 2
2 2
2 2
2 2
2 2
) ( ) (
) ( ) (

> =
>
>

0 ) ( 4 ) ( 4 4
0 2
0 2
2 2 2
2
i
i
i
i
i
i
i
i
x x n x x n
x
n

S-ar putea să vă placă și