Sunteți pe pagina 1din 19

Modelul de regresie

clasic
Specificarea unui model de
regresie

 Un studiu econometric începe cu o serie de presupuneri


teoretice despre anumite aspecte ale economiei.
 Investigaţiile empirice furnizează estimatori pentru
parametri necunoscuţi ai modelului.
 Keynes: C=f(x)
 Suma cheltuită pentru consum depinde de:
 mărimea venitului pe de o parte
 alte obiective în funcţie de circumstanţe (de exemplu investiţiile)
 alte nevoi subiective
Specificarea unui model de
regresie
 Legea psihologică fundamentală: „o persoană este dispusă
de regulă şi în medie să îşi crească consumul pe măsura
creşterii venitului dar nu în aceeaşi măsură”
dC
0 1
dX
 Un nivel absolut mai mare al venitului va tinde de regulă să
mărească diferenţa între venit şi consum:
d (C / X )
0
dX
 Presupunerea cea mai simplă: C=+X, 0<<1 este o
relaţie deterministă neadecvată.
Specificarea unui model de
regresie
 În model trebuie inclus şi factorul aleator:
C=f(X,)
 Modelul cel mai simplu:
C=+X+
 Modelul general ce trebuie estimat are forma:
 yi = + xi + i, i=1,n
unde:
xi este nestochastic (situaţie experimentală)
 Analistul alege valorile regresiei xi şi apoi observă yi
Specificarea unui model de
regresie

 Valoarea parametrului  arată modificarea proporţională a


variabilei efect (Y) la modificarea cu o unitate a variabilei
cauză (X).
 Valoarea parametrului  arată punctul în care linia
interceptează (taie) axa OY
 i reprezintă componenta reziduală (eroarea aleatoare)
pentru fiecare unitate, adică partea din valoarea variabilei Y
care nu poate fi măsurată prin relaţia sistematică existentă
cu variabila X.
Specificarea unui model de
regresie

Modelul liniar unifactorial y=1+0,5x


Specificarea unui model de
regresie
 Modelul probabilistic conţine:
 componenta deterministică, adică partea din valoarea lui Yi care poate fi
determinată cunoscând valoarea Xi ( + Xi = Yi')
 componenta reziduală care nu poate fi determinată cunoscând valoarea
individuală Xi (i)
 Atunci,
 Yi =  + Xi + i

 Yi = componenta predictibilă (detrministică) + eroarea aleatoare

 Yi = Y i' + i
Specificarea unui model de
regresie
 Dacă datele disponibile provin dintr-un eşantion avem la
dispoziţie n perechi de observaţii (x1, y1), (x2,y2), ... (xn, yn),
pe care le vom folosi pentru estimarea parametrilor ecuaţiei
de regresie liniară simplă,  şi .
 Modelul de regresie liniară în eşantion este:
yi = a + bxi + ei
 cu componenta predictibilă:
ŷ i  a  bx i
 a şi b sunt estimatorii punctului de intercepţie () şi pantei liniei
drepte (), obţinuţi pe eşantion
 ei este valoarea reziduală (pentru unitatea i) în eşantion:
ei = yi – (a + bxi)
Ipotezele modelului de regresie
liniară
 Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se fac,
de obicei, cinci presupuneri (ipoteze) standard pentru modelul din
populaţia generală:

 Ipotezele ce trebuie verificate:

 Forma funcţională: yi = + xi + i, i=1,n


 Normalitatea erorilor: i N(0, )2
 Media zero a erorilor: μ(i)=0 i
2
 Homoscedasticitatea: σ2(i)= constantă

i
 Non autocorelarea erorilor: Cov(i,j)=0 ij
 Necorelarea între regresor şi erori: Cov(xi,j)=0 i şi j
Ipoteza 1: Forma funcţională
 y=a+bx Y
1000

1 a  be x
y=a+bz, z=ex 800
a  b 
x

y=a+br, r=1/x
600

y=a+bq, q=ln(x) a  bx
400

 Sau 200

a  b ln  x 

y=Ax  ln(y)=+ln(x) 0
-1 0.003 0.008 0.013 0.018 0.023 0.028 0.033 0.038 0.043 0. 048 0. 053 0.058 0.063 0.068
X
 Forma generală: -200

f(yi)= +g(xi)+i
1 -400

 Contra exemplu: y  
x
Modele ce pot fi linearizate
nu poate fi transformat în model liniar.
Erorile
 Ipoteza de linearitate a modelului include şi aditivitatea
erorilor.
 Forma modelului:
y =  + x + ,
 
 De exemplu modelul y  Ax e se transformă prin
logaritmare în modelul liniar: ln(y)=ln(A)+ln(x)+ .

 Însă modelul y  Ax   nu mai poate fi transformat în
model liniar.
 Dacă ipoteza de linearitate este verificată, variabila
dependentă observată este suma a două elemente:
 un termen nestochastic: +x
 o variabilă aleatoare
Ipoteza 2: normalitatea erorilor
 Se presupune că variabila aleatoare i este normal
distribuită :

Distribuţia de probabilitate pentru i


Ipoteza 3: media erorilor este
zero: μ(i)=0 i

 Este naturală atâta timp cât  este văzută ca suma efectelor


individuale, cu semne diferite.
 Dacă media erorilor este diferită de zero, ea poate fi
considerată ca o parte sistematică a regresiei:
 μ()=   + x +  = (+) + x + (-)
 Media erorilor este acum nulă.
 Această presupunere indică faptul că media valorilor Y,
condiţionat de X,  (Y/X = Xi) =  + Xi, adică nu există
variabile omise asociate cu regresia în populaţie.
Ipoteza 4 (de homoscedasticitate):
Var(i)=   constantă i
2

 Dispersia reziduurilor în populaţie este constantă peste toate


valorile Xi
Functia de consum
1200

1000

800
consum

600

400

200

0
200 300 400 500 600 700 800 900 1000
venit
Ipoteza 4 (de homoscedasticitate):
Var(i)=   constantă i
2

a) b)
Dispersia reziduurilor a) constantă; b) variabilă

Discuţie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor
mici.
Variaţia cheltuielilor gospodăriilor în funcţie de venit sau de mărimea
lor poate fi
Ipoteza 5: Non autocorelarea
erorilor: μ(ij)=0 ij
 Această ipoteză nu implică faptul că yi şi yj sunt necorelate,
ci faptul că deviaţiile observaţiilor de la valorile lor aşteptate
sunt necorelate.
 Variabilele aleatoare i sunt statistic independente una de
alta, adică   i j = 0, pentru i  j.
 Acest lucru înseamnă că eroarea asociată cu o valoare a
variabilei Y nu are nici un efect asupra erorilor asociate cu
alte valori ale lui Y;
 Nu există deci corelaţie între reziduuri;
 OBSERVAŢIE: Este convenabil a considera că erorile sunt
independente şi normal distribuite cu medie zero şi
variaţie constantă pentru obţinerea de rezultate statistice
exacte.
Estimarea parametrilor
modelului de regresie clasic
 Parametrii necunoscuţi ai reacţiei stochastice sunt cei ce trebuie estimaţi:
yi = + xi + i, i=1,n
 Modelul

estimat va fi scris:
y i  a  bxi , i  1, n
 Eroarea asociată unui punct i este:
i = yi -  - xi
 Pentru orice valori estimate a şi b, erorile estimate vor fi:
ei = yi - a - bxi
 Pentru estimarea parametrilor  şi  pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate,
2
deci de minimizare2a erorilor observate:
min  ei  min  ( yi  a  bxi )
i i
Estimarea parametrilor
modelului de regresie clasic
 Condiţiile de ordin 1 de minimizare a funcţiei sunt:
  (  ei2 )


i 0  yi  na  ( xi )b


a
 i i
  (  ei2 )  2
 i 0
x y
 i i  ( x
 i ) a  (  i )b
x

 b i i i

a  y  bx

 n  yi
 i
  xi  xi yi  xi yi  n x y
 i i
b   i
n  xi 2 2
 i
 xi  n x
 2 i
  xi  xi
 i i
Estimarea parametrilor
modelului de regresie clasic
 Rămâne de verificat dacă este verificată condiţia de ordin 2, adică soluţia găsită
este un punct de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie
pozitiv definită:
  2 ( ei2 )  2 ( ei2 ) 
 i i 
 2 2   2n 2 xi 
  a ab   i 

2   2 x
  2 ( ei2 ) 2
 ( ei ) i 2 xi2 
 
  i i 
i i
 ba 
  2b 2 


2 n  0
 2
2 xi  0
 i
 2 2 2
 4 n  x i  4(  xi )  4 n  ( xi  x ) 0
 i i i
 Deci matricea este pozitiv definită.

S-ar putea să vă placă și