Documente Academic
Documente Profesional
Documente Cultură
( yˆi − y)
Varia ia totală:
n
SST = S y = ∑( y − y)
i
2
X i
=1
Varia ia explicată de X:
Y
Varia ia neexplicată de X:
n n
yˆi ∑ ( − y) ∑ ( y − yˆ )
2
S =
SSR y/x =
2
i =1
= = Se
SSE i i
i =1
I. Testarea validită ii mode lului de
reg res ie folosind met oda analizei de var ian
ă
Sy
Dispersia corectată totală: s 2y =
n −1
Sy/x
Dispersia corectată sistematică: s 2y / x =
k
Se
Dispersia corectată reziduală: se2 =
n − k −1
Ipotezele testate:
Datorată
regresiei
n
2 k 2 Sy
(explica tă de Sy/x = ∑ ( yˆ i − sy= 2
model) i =1 n −1 sy / x
y) F=
Reziduală
n
2 S s e2
(neexplicată de
model)
Se = ∑ ( yi − yˆi ) n-k se2 = e
n − k −1
i
=1
Totală n –
2
Sy= ∑ ( yi − y) n-1 2
Sy/
i s x y / x=
=1 k
II. Determinarea măsurii calită ii ajustării
n n
∑( ∑( )
2
yi − yˆi −2y
SSR S S yˆni )
2
Coeficientul de determinare: 2 y/x
R = = =1− e
= 1 − i =1 = i =1
n
SST Sy Sy
( ∑( )
2
∑ yi − i =1
yi − y
y
i =1
)
ia valori în intervalul [0,1] şi poate fi interpretat ca procentul varia iei lui Y
explicată de varia ia variabilei X
∧
R2 = 0 dacă b=0, y = y , deci dacă ecua ia de regresie este o drea ptă orizontală.
În acest caz variabila X nu are putere explicativă (X nu influenteaza variatia lui Y).
R2 = 1 dacă punctele determinate de observa iile făcute asupra variabilelor X şi Y
se află toate pe o drea ptă, caz în care erorile vor fi zero.
În cazul în care toate valorile lui Y se află pe o dreaptă verticală, R2 nu are nici o
semnifica ie şi nu poate fi calculat.
Observa ii:
1. R2 poate fi interpretat ca procentul varia iei lui y explicată de varia ia
variabilei x doar pentru cazul în care metoda celor mai mici pătrate este
aplicată modelului liniar de regresie și modelul are termen liber.
2. Pentru orice model coeficientul R2 poate fi calculat ca:
2
∑ ei
2 2
R =1− i unde S yy = ∑ ( − y)
S yy
yi
i
III. Verificarea ipotezelor mode lulu i de regresie
x t ∈ (X ± 3σ x ) ⇔ X - 3σ x < x < X + 3σ x
y t ∈ (Y ± 3σ y ) ⇔ Y - 3σ t < Y+ 3σ y
y
< yt
Această ipoteză, referitoare la calitatea datelor înregistrate, se
consideră rezolvată în eta pa de prelucrare a datelor observate statistic
sau, cel mai târziu, în etapa de identificare a modelului.
Valorile variabilei reziduale εt nu sunt corelate
Se emit ipotezele:
H0: ρ = 0 (coeficientul de autocorelare a erorilor)
H1 : ρ ≠ 0
Se determină statistica Durbin Watson:
∑ (e
t=2
t
- et -1 )2
d= T
∈ [0,4]
∑e
t=1
2
t
Testul Durbin - Watson
d, se compară cu dL şi dU, din tabelul distribu iei Durbin - Watson
în func ie de α , convenabil ales, (α = 0,05 sau α = 0,01), de
numărul de variabile exogene, k, şi de valorile observate (n).
H 0: ε ∼ N (0 ,1 )
H 1: ε ∼ N(0,1)
S2 ( K- 3)2
JB calc =n +
6 24
Funcţia
Efect
Cauze
Variabile f Variabila
independente dependentă
f(x1,x2,...,xn)=Y
REGRESIA – Când şi cum o utilizăm?
0,5 ε
Y
Y
1.0
ε
1
X
X
Modelul liniar unifactorial y=1+0,5x
Sp ecificarea unui model de regresie
cu componenta predictibilă: yˆ = a + bx i
i
a este estimatorul punctului de intercepţie (α ) obţinut pe baza datelor din eşantion
b este estimatorul pantei liniei drepte (β ) obţinut pe baza datelor din eşantion
ei este valoarea reziduală (pentru unitatea i) în eşantion:
ei = yi – (a + bxi)
Estimarea parametrilor mod elul ui de
regr esie clasic
min ∑ ei 2 = min∑ ( yi − a − bx i) 2
i i