Sunteți pe pagina 1din 19

1

Curs 5
Modelul de regresie clasic


2
CE ESTE REGRESIA?
Modelul econometric modeleaz dependena variabilelor complexe de un
ansamblu de factori principali i secundari, sistematici sau aleatori, care
acioneaz n acelai sens sau n sensuri diferite
Regresia este o metod statistic pentru studiul relaiei ntre o variabil
dependent i una sau mai multe variabile independente

Cauze
Funcia
Efect
Variabile
independente
f
Variabila
dependent
f(x1,x2,...,xn)=Y
3
REGRESIA Cnd i cum o utilizm?
Regresia se folosete pentru:
a determina o relaie cauzal
a testa o relaie cauzal
a previziona o variabil dependent n funcie de una sau mai multe
variabile independente
a explica efectul n funcie de cauze

Regresia liniar descrie relaia liniar dintre o variabil cauz,
reprezentat pe axa ox i o variabil efect reprezentat pe axa oy
4
Specificarea unui model de regresie
Modelul liniar general de regresie unifactorial:
Y=o+|x + c


Parametrul | arat modificarea proporional a variabilei efect (Y) la
modificarea cu o unitate a variabilei cauz (X).

Parametrul o arat punctul n care linia intercepteaz (taie) axa OY

c
i
reprezint componenta rezidual (eroarea aleatoare) pentru fiecare
unitate, adic partea din valoarea variabilei Y care nu poate fi msurat
prin relaia sistematic existent cu variabila X.
Componenta predictibil Variabila/eroarea aleatoare
5
Specificarea unui model de regresie
Modelul liniar unifactorial y=1+0,5x
X
Y

1.0
1
0,5
X
Y



6
Specificarea unui model de regresie
Se efectueaz o selecie de volum n : (x
i
,y
i
)
i=1...n

Pe baza acestei selecii se estimeaz parametrii ecuaiei de regresie
liniar simpl, o i |.

Modelul de regresie liniar observat este:
y
i
= a + bx
i
+ e
i


cu componenta predictibil:
a este estimatorul punctului de intercepie (o) obinut pe baza datelor din eantion
b este estimatorul pantei liniei drepte (|) obinut pe baza datelor din eantion
e
i
este valoarea rezidual (pentru unitatea i) n eantion:
e
i
= y
i
(a + bx
i
)
i i
bx a y + =
7
Ipotezele modelului de regresie liniar
Pentru a obine proprietile dorite ale estimatorilor regresiei, se
fac, de obicei, cinci presupuneri (ipoteze) standard pentru modelul
din populaia general:

Ipotezele ce trebuie verificate:

Forma funcional: y
i
=o + |x
i
+ c
i
, i=1,n
Normalitatea erorilor: c
i
~N(0, )
Media zero a erorilor: (c
i
)=0 i
Homoscedasticitatea:
2
(c
i
)= constant i
Non autocorelarea erorilor: Cov(c
i
,c
j
)=0 i=j
Necorelarea ntre regresor i erori: Cov(x
i
,c
j
)=0 i i j


2
c
o
2
c
o
8
Ipoteza 1: Forma funcional
y=a+bx
y=a+bz, z=e
x
y=a+br, r=1/x
y=a+bq, q=ln(x)

Sau
y=Ax
|
ln(y)=o+|ln(x)
Forma general:
f(y
i
)= o+|g(x
i
)+c
i
Contra exemplu:

nu poate fi transformat n model liniar.
-400
-200
0
200
400
600
800
1000
-1 0. 003 0. 008 0. 013 0. 018 0. 023 0. 028 0. 033 0. 038 0. 043 0. 048 0. 053 0. 058 0. 063 0. 068
X
Y
|
.
|

\
|
+
x
b a
1
x
be a +
bx a +
( ) x b a ln +
Modele ce pot fi linearizate
x
y
+
+ =
|
o
1
9
Erorile
Ipoteza de linearitate a modelului include i aditivitatea
erorilor.
Forma modelului:
y = o + |x + c,
De exemplu modelul se transform prin
logaritmare n modelul liniar: ln(y)=ln(A)+|ln(x)+c .
ns modelul nu mai poate fi transformat n
model liniar.
Dac ipoteza de linearitate este verificat, variabila
dependent observat este suma a dou elemente:
un termen nestochastic, determinist: o+|x
o variabil aleatoare
c |
e Ax y =
c
|
+ = Ax y
10
Ipoteza 2: normalitatea erorilor
Se presupune c variabila aleatoare c
i
este normal
distribuit :
Distribuia de probabilitate pentru c
i

11
Ipoteza 3: media erorilor este zero: (c
i
)=0 i
Este natural atta timp ct c este vzut ca suma efectelor
individuale, cu semne diferite.
Dac media erorilor este diferit de zero exist posibilitatea
ca variabile exogene cu influen semnificativ asupra
variabilei Y s fie omise din model.
Dac media valorilor Y, condiionat de X, este
(Y/X = X
i
) = o + |X
i
, atunci nu exist variabile omise
asociate cu regresia n populaie.
12
Ipoteza 4 (de homoscedasticitate):
Var(c
i
)= constant i
2
c
o
a) b)
Dispersia reziduurilor a) constant; b) variabil
Dispersia reziduurilor n populaie este constant peste toate valorile Xi
13
Ipoteza 5: Non autocorelarea erorilor: (c
i
c
j
)=0 i=j
Aceast ipotez nu implic faptul c y
i
i y
j
sunt necorelate, ci faptul c
deviaiile observaiilor de la valorile lor ateptate sunt necorelate.
Variabilele aleatoare c
i
sunt statistic independente una de alta, adic
= 0, pentru i = j.
Acest lucru nseamn c eroarea asociat cu o valoare a variabilei Y nu
are nici un efect asupra erorilor asociate cu alte valori ale lui Y;
Nu exist deci corelaie ntre reziduuri;
OBSERVAIE: Este convenabil a considera c erorile sunt
independente i normal distribuite cu medie zero i variaie
constant pentru obinerea de rezultate statistice exacte.
j i
c c

14
Estimarea parametrilor modelului de regresie clasic
Parametrii necunoscui ai modelului din colectivitatea general sunt cei ce trebuie
estimai:
y
i
=o + |x
i
+ c
i
, i=1,n

Modelul estimat va fi scris:


Eroarea asociat unui punct i este:
c
i
= y
i
- o - |x
i


Pentru orice valori estimate a i b, erorile estimate vor fi:
e
i
= y
i
- a - bx
i

n i bx a y
i
i
, 1 , = + =
.
15
Estimarea parametrilor modelului de
regresie clasic
Metoda celor mai mici ptrate:
Pentru estimarea parametrilor o i | pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate, deci de minimizare a erorilor observate:


=
i
i i
i
i
bx a y e
2 2
) ( min min
16
Estimarea parametrilor modelului de
regresie clasic
Condiiile de ordin 1: determinarea soluiei





Condiia de ordin 2: soluia gsit este un punct de minim.
Matricea derivatelor pariale de ordin doi trebuie s fie pozitiv
definit.

=
c
c
=
c
c


0
) (
0
) (
2
2
b
e
a
e
i
i
i
i

+ =
+ =


b x a x y x
b x na y
i
i
i
i
i
i i
i
i
i
i
) ( ) (
) (
2
17
Estimarea parametrilor modelului de
regresie clasic

= =
=





2
2
2
x n x
y x n y x
x x
x n
y x x
y n
b
x b y a
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i

= =

= =













2 2
2
2 2
2
2
2
i
i
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i
i
i i
i
i
i
i
i
i
x x n
y x y x n
x x
x n
y x x
y n
b
x x n
y x x x y
x x
x n
x y x
x y
a
Condiiile de ordin 1:
18
Estimarea parametrilor
modelului de regresie clasic
Deci:


2
x
xy
s
s
b =


=
+
+
=
=

=
+
+
=
i
i
i
i i
i
i
i
i i
i
i
i
i i
i
i i
i
i i
i
i
i
i
i
i
i
i
i
i
i
i i
x x
y y x x
x x x x x x
y x x y x x
x x x
y x x
x n x x x x x
y x n y x y x y x
b
2
2
2
) (
) )( (
) ( ) (
) ( ) (
) (
) (
19
Estimarea parametrilor modelului de regresie clasic

s
xy
este covariana ntre x i y.










Linii de regresie cu a) pant pozitiv b) pant negativ c) pant egal cu zero




Estimatorul a (intercepia) poate lua valori negative sau pozitive.
Estimatorul b (panta liniei drepte) numit i coeficient de regresie are
ntotdeauna semnul indicatorului s
xy
,