Documente Academic
Documente Profesional
Documente Cultură
1
Media şi dispersia variabilei dependente
2
•La nivelul populaţiei regresia se reduce la exprimarea
mediei condiţionate a lui Y:
Dreapta de regresie
Y
X
4
Modelul de regresie liniară la
nivelul populaţiei
Y Yi 0 1X i i Valoarea
observată
i = Eroarea
0 1X i
YX
(E(Y))
X
Valoarea 5
observată
Modelul de regresie liniară la
nivelul eşantionului
Yˆi ˆ0 ˆ1 X i
Yi = Valoarea estimată a lui Y pentru observaţia i
= Estimatorul pantei 1
̂1 6
Estimarea parametrilor modelului de regresie
Metoda celor mai mici pătrate(M.C.M.M.P.) –
Ordinary Least Squares(OLS sau LS)
Presupunem că avem n perechi de observaţii (x1,
y1), (x2, y2), …, (xn, yn).
Ideea este să minimizăm distanţa dintre valorile
estimate şi valorilen reale 2 n
i 1
L Yi Yˆi ˆ i2 m in
i 1
Ne reamintim că deci
7
Ilustrare grafică
n
LS m inim izează ˆ
i 1
i
2
ˆ ˆ ˆ ˆ
1
2 2
2
2
3
2
4
Y Y 2 0 1 X 2 2
^4
^2
^1 ^3
Yi 0 1X i
X 8
Condiţiile de minim:
9
Estimatorii modelului de regresie
cov( X , Y )
b1 2
sx
b 0 y b1 x
10
Notaţii
Valoarea estimată:
Valoarea reziduală(reziduul):
11
Estimatorul dispersiei modelului
12
Proprietăţile estimatorilor modelului de regresie
ˆ0 şi ˆ1 sînt estimatori nedeplasaţi ai parametrilor 0 şi 1
E ( ˆ ) şi E ( ˆ )
0 0 1 1
ˆ 2 1 x 2
V( 0 )
n S xx
2
V(ˆ1 )
S xx
n
unde S xx ( xi x ) 2 şi 2 este dispersia variabilei reziduale
i 1
Y Sample 1 Line
All Possible
Sample Slopes
Sample 2 Line Sample 1: 2.5
Population Line
Sample 2: 1.6
X Sample 3: 1.8
Sample 4: 2.1
Sampling Distribution
: :
S^ 1
Very large number of
sample slopes
^
1 1
14
Eroarea standard a estimatorilor
n
i
e 2
2 1 x2
V ( ˆ
) n S 1 x 2
ˆ
-SE ( 0 ) 0
xx 2
ˆ
df n2 n S xx
n2
16
Teorema Gauss-Markov
Estimatorii obţinuţi prin metoda celor mai mici pătrate
sînt B.L.U.E. i.e. orice alt estimator liniar are o
dispersie mai mare decît cei obţinuţi prin MCMMP.
Conform OLS, estimatorul pantei este o combinaţie liniară de valorile variabilei dependente:
n n n n
( y y)( x x) y ( x x) y ( x x) y ( x x)
i i i i i i i n
ˆ1 i 1
n
i 1
n
i 1
i 1
n
i yi
( x x)
i 1
i
2
( x x)
i 1
i
2
( x x)
i 1
i
2 i 1
n n n n
Fie qi yi 0 qi 1 qi xi qi i un alt estimator liniar.
'
i 1 i 1 i 1 i 1
n n
Pentru ca E( ) 1 , e necesar ca qi 0 şi qi xi 1.
'
i 1 i 1
n n
Rezultă qi i 1 , deci varianţa sa este V( )
' ' 2
q . 2
i
i 1 i 1
n
Fie vi q i i , atunci qi i vi şi avem V( ) ' 2
(
i 1
i vi ) 2
n n n
2
( i
2 2
2 i vi v )
i
2
( i
2
v ) 2
i
2
i
2
V ( ˆ1 ).*** QED 17
i 1 i 1 i 1
Exemplu-chiria ca funcţie de suprafaţă
18
Analiza varianţei pentru modelul de regresie
ˆ ˆ
(Y i - Y ) (Y i - Y ) (Y i - Y i)
19
Descompunerea variaţiei
Y
SSE =(Yi - Yi )2 ^ Xi
_ β^ 0
β
+ 1
SST = (Yi - Y) Yi =
2
_
SSR = (Yi - Y)2
_
Y
X
X Xi
20
ANOVA pentru regresie
ˆ ˆ
2
(Y i Y ) 2
(Yi Y ) (Y i Y i) 2
22
Coeficientul de determinaţie R2
Este o măsură a proporţiei varianţei explicate de
model n n
SSR i
( ˆ
y y ) 2
i
e 2
2
R i 1
1 i 1
0,1
SST ( y y)
i
i
2
( y y)
i
i
2
•Modelul explică 72.23% din variaţia chiriei pentru apartamentele din zona
centrală
Standard Error : n
i
e 2
ˆ i 1
24
n2
Observaţii
25
Foarte important!!
Pentru modele de regresie fără termen liber, de tipul
y1 1 x1 1
, unde y2i y1i şi x2i x1i
y2 2 x2 2
Y R2 = 1, r = +1 Y R2 = 1, r = -1
^=b +b X
Y i 0 1 i
^=b +b X
Yi 0 1 i
X X
Y = .8, r = +0.9
R2
Y R2 = 0, r = 0
^=b +b X
Y ^=b +b X
Y
i 0 1 i i 0 1 i
X X27
Tabelul ANOVA
Source of Sum of Squares df Mean F
Variation Square
n
SSR MSR
Regression SSR ( yˆi y ) 2
k-1 MSR=
i 1 k 1 MSE
n n
SSE
Error SSE ( yi yˆi ) ei 2
2
n-k MSE=
i 1 i 1 nk
SST ( yi y ) 2 SST
Total n-1
i n 1
SSR
Testul k-numărul de parametri ai
F k 1 ~ Fk 1, n k modelului
SSE
nk
este folosit la verificarea validităţii modelului. Un model este valid dacă proporţia varianţei
explicate prin model este semnificativă. Ipoteza nulă pentru testul F in cazul acesta este cea
de model nevalid. 28
Excel Output
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.85
R Square 0.72
Adjusted R Square 0.71
Standard Error 194.70
Observations 25
ANOVA
df SS MS F Significance F
Regression 1 2267827.07 2267827.07 59.82347359 0.00
Residual 23 871898.93 37908.64913
Total 24 3139726
29