Documente Academic
Documente Profesional
Documente Cultură
clasic
Specificarea unui model de
regresie
Yi = Y i' + i
Specificarea unui model de
regresie
Dacă datele disponibile provin dintr-un eşantion avem la
dispoziţie n perechi de observaţii (x1, y1), (x2,y2), ... (xn, yn),
pe care le vom folosi pentru estimarea parametrilor ecuaţiei
de regresie liniară simplă, şi .
Modelul de regresie liniară în eşantion este:
yi = a + bxi + ei
cu componenta predictibilă:
ŷ i a bx i
a şi b sunt estimatorii punctului de intercepţie () şi pantei liniei
drepte (), obţinuţi pe eşantion
ei este valoarea reziduală (pentru unitatea i) în eşantion:
ei = yi – (a + bxi)
Ipotezele modelului de regresie
liniară
Pentru a obţine proprietăţile dorite ale estimatorilor regresiei, se fac,
de obicei, cinci presupuneri (ipoteze) standard pentru modelul din
populaţia generală:
1 a be x
y=a+bz, z=ex 800
a b
x
y=a+br, r=1/x
600
y=a+bq, q=ln(x) a bx
400
Sau 200
a b ln x
y=Ax ln(y)=+ln(x) 0
-1 0.003 0.008 0.013 0.018 0.023 0.028 0.033 0.038 0.043 0. 048 0. 053 0.058 0.063 0.068
X
Forma generală: -200
f(yi)= +g(xi)+i
1 -400
Contra exemplu: y
x
Modele ce pot fi linearizate
nu poate fi transformat în model liniar.
Erorile
Ipoteza de linearitate a modelului include şi aditivitatea
erorilor.
Forma modelului:
y = + x + ,
De exemplu modelul y Ax e se transformă prin
logaritmare în modelul liniar: ln(y)=ln(A)+ln(x)+ .
Însă modelul y Ax nu mai poate fi transformat în
model liniar.
Dacă ipoteza de linearitate este verificată, variabila
dependentă observată este suma a două elemente:
un termen nestochastic: +x
o variabilă aleatoare
Ipoteza 2: normalitatea erorilor
Se presupune că variabila aleatoare i este normal
distribuită :
1000
800
consum
600
400
200
0
200 300 400 500 600 700 800 900 1000
venit
Ipoteza 4 (de homoscedasticitate):
Var(i)= constantă i
2
a) b)
Dispersia reziduurilor a) constantă; b) variabilă
Discuţie:
Profiturile firmelor mari vor varia mult mai mult ca profiturile firmelor
mici.
Variaţia cheltuielilor gospodăriilor în funcţie de venit sau de mărimea
lor poate fi
Ipoteza 5: Non autocorelarea
erorilor: μ(ij)=0 ij
Această ipoteză nu implică faptul că yi şi yj sunt necorelate,
ci faptul că deviaţiile observaţiilor de la valorile lor aşteptate
sunt necorelate.
Variabilele aleatoare i sunt statistic independente una de
alta, adică i j = 0, pentru i j.
Acest lucru înseamnă că eroarea asociată cu o valoare a
variabilei Y nu are nici un efect asupra erorilor asociate cu
alte valori ale lui Y;
Nu există deci corelaţie între reziduuri;
OBSERVAŢIE: Este convenabil a considera că erorile sunt
independente şi normal distribuite cu medie zero şi
variaţie constantă pentru obţinerea de rezultate statistice
exacte.
Estimarea parametrilor
modelului de regresie clasic
Parametrii necunoscuţi ai reacţiei stochastice sunt cei ce trebuie estimaţi:
yi = + xi + i, i=1,n
Modelul
estimat va fi scris:
y i a bxi , i 1, n
Eroarea asociată unui punct i este:
i = yi - - xi
Pentru orice valori estimate a şi b, erorile estimate vor fi:
ei = yi - a - bxi
Pentru estimarea parametrilor şi pe baza datelor observate, un
criteriu natural este cel de maximizare a potrivirii modelului cu datele
observate,
2
deci de minimizare2a erorilor observate:
min ei min ( yi a bxi )
i i
Estimarea parametrilor
modelului de regresie clasic
Condiţiile de ordin 1 de minimizare a funcţiei sunt:
( ei2 )
i 0 yi na ( xi )b
a
i i
( ei2 ) 2
i 0
x y
i i ( x
i ) a ( i )b
x
b i i i
a y bx
n yi
i
xi xi yi xi yi n x y
i i
b i
n xi 2 2
i
xi n x
2 i
xi xi
i i
Estimarea parametrilor
modelului de regresie clasic
Rămâne de verificat dacă este verificată condiţia de ordin 2, adică soluţia găsită
este un punct de minim. Matricea derivatelor parţiale de ordin doi trebuie să fie
pozitiv definită:
2 ( ei2 ) 2 ( ei2 )
i i
2 2 2n 2 xi
a ab i
2 2 x
2 ( ei2 ) 2
( ei ) i 2 xi2
i i
i i
ba
2b 2
2 n 0
2
2 xi 0
i
2 2 2
4 n x i 4( xi ) 4 n ( xi x ) 0
i i i
Deci matricea este pozitiv definită.