Documente Academic
Documente Profesional
Documente Cultură
Y = + X +
Considerando la muestra (xi, yi) para i=1,n
Yi = + X i+ei
Suposiciones del modelo:
La variable X es no aleatoria.
Los errores ei son variables aleatorias con media 0 y varianza
constante 2.
Los errores ei y e j (ij=1,n) son independientes entre si.
: expresa la magnitud
del cambio de y por
cada unidad de x
E(y|x)
E(y|x)=+x
E(y|x)
x
{
Constante
Parmetro de
intercepcin
X
E(y|x)
=
x
Es la pendiente
Parmetro de pendiente
Q(, ) =
n
i=1
2
i
2
(
y
x
)
i
i
i =1
i=1
i=1
n
i=1
nxi yi xi yi
n
nxi2 (xi )2
i=1
i=1
=
equivalentemente
xy
xx
= y x
(RRP)
E(y) = + x
y4
e4 {
y3
y2
y1
e2 {.
(RRM)
y = b 0 + b 1x
.}e3
e1
}
.
x1
x2
x3
x4
b)
c) La varianza de es
2
Sxx
y la de
es
2
1
x
2( +
)
n Sxx
a)
b)
e x
i =1
c)
i i
=0
e
y
i i =0
i =1
s2 =
2
(
y
y
i i)
i =1
n2
e
i =1
2
i
n2
(CME)
( yi y ) = ( yi yi ) + ( yi y )
n
( y i y ) = ( yi yi ) 2 +
n
i =1
i =1
i =1
SCR =
2
(
x
x
)
i
i =1
(y
y)2
El Coeficiente de Determinacin
Es una medida de la bondad de ajuste del modelo
R
SCR
SCT
2
R
Un modelo de regresin con
mayor o igual a 75% se puede
x
media
.
i y varianza
Se puede establecer que:
~ N(,
Sxx
1 x2 2
~ N(, ( + ) )
n Sxx
Las sumas de cuadrados son formas cuadrticas del vector aleatorio Y y por
lo tanto se distribuyen como una Chi-cuadrado. Se pueden establecer los
siguientes resultados:
i)
ii)
iii)
SCT
SCE
SCR
~ '(2n 1)
2
( n2)
~ '(21)
Equivalentemente
(n 2) s 2
~ (2n 2)
E ( SCR ) = E ( 2 S xx ) = 2 + 2 S xx
media y varianza
Sxx
( t( n 2,1 / 2 )
s
, + t( n 2,1 / 2 )
Sxx
s
)
Sxx
1 x2
1 x2
( t( n 2,1 / 2 ) s
+
, + t( n 2,1 / 2 ) s
+
)
n Sxx
n Sxx
=0
A
>0
B
1< 0
C
Caso II
Ho: =*
Ha: *
Caso III
Ho: =*
Ha: >*
Prueba Estadstica
t=
*
s
Sxx
Regla de Decisin
Rechazar Ho,
Rechazar Ho
~ t( n 2)
Rechazar Ho
si tcal<-t(1-,n-2)
si |tcal |>t(1-/2,n-2) si tcal>t(1-,n-2)
*Un P-value cercano a cero, sugirira rechazar la hiptesis nula.
x
)
1
Var (Y0 ) = 2 ( + 0
)
n
Sxx
2
(
x
x
)
1
0
+ x0 t(1 / 2,n 2 ) s +
n
Sxx
2
(
x
x
)
1
0
+ x0 t(1 / 2,n 2 ) s 1 + +
n
Sxx
El Coeficiente de Correlacin
Mide el grado de asociacin lineal entre las variables X y Y y se
define como:
=
Cov( X , Y )
x y
a) 1 1
b) La media condicional de Y dado X es E(Y / X ) = + x,
donde: = y y = y x
x
c) La varianza condicional de las Y dado X, est dado por
y2 / x = y2 (1 2 )
r =
Notar que:
Sxx
r=
Syy
Sxy
SxxSyy
Sxx
SCR
r =
=
Syy
SCT
2
Los siguientes
datos
presentan
el nmero
promedio
Ejemplo
de
un
modelo
No
lineal
de bacterias sobrevivientes dentro de un alimento
a
enlatado y los minutos
de exposicin al calor
1
2
3
4
5
6
7
8
9
10
11
12
Total
175
bacterias
108
95
82
71
50
49
31
28
17
16
11
12
1
tiempo
2
3
4
5
6
7
8
9
10
11
12
12
1
Modelo
a.
a.
Limitado a los primeros 100 casos.
Regresin
Residual
Total
Suma22268,813
de
cuadrados
gl
3348,104
25616,917
1
10
11
,932
a
,869
R cuadrado
R cuadrado
,856
corregida
Error tp.
de la
18,298
estimacin
ANOVA
b
1
Modelo
Media22268,813
cuadrtica F
334,810
66,512
Sig.
,000
a
a.
b.
Coeficientes
a
Variables predictoras: (Constante), tiempo
Variable dependiente: bacterias
1
Modelo
(Constante)
tiempo
Coeficientes no
estandarizados
142,197
11,262
Error tp.
-12,479
1,530
a.
Variable dependiente: bacterias
Coeficientes
estandarizad
os
Beta
t
-,932
12,627
,000
Sig.
-8,155
,000
Cmo transformarla?
En esta situacin es fcil conocer la
transformacin ya que los datos representan el
crecimiento de las bacterias en el tiempo, para
el cual se conoce que el nmero de bacterias en
el tiempo t , , se modela como
donde n0es el nmero inicial de bacterias y .
Tomando logaritmo natural a ambos lados se
tiene
Diagrama
de
dispersin
del
logaritmo del nmero de bacterias
sobrevientes a travs del tiempo
1
Modelo
a.
b.
,991
a
,982
R cuadrado
Coeficientes
a
Coeficientes
Coeficientes no
estandarizad
estandarizados
os
1
(Constante)
5,339 ,074
72,054 ,000
Modelo
B
Error tp. Beta
t
Sig.
tiempo
-,236 ,010
-,991 -23,459 ,000
a.
Variable dependiente: LnY
R cuadrado
,980
corregida
Error tp.
de la
,12039
estimacin
Regresin Cuadrtica
Un modelo cuadrtico es de la forma:
Y = a + bX + cX 2 +
Ejemplo
Case Summaries
a
1
2
3
4
5
6
7
8
9
10
Total
1
Tienda
2
3
4
5
6
7
8
9
10
10
Valor
Agregado por
hora-hombre
4,0
($)
3,4
3,5
3,1
2,9
1,9
4,1
3,2
3,8
3,6
10
Tamao de la
tienda ( miles
de pies21,0
cuadrados)
12,0
25,2
10,4
30,9
6,8
19,6
14,5
25,0
19,1
10
a.
Limitado a los primeros 100 casos.
,883
R cuadrado F
26,438
Sig.
,001
-,120
Constante
Transformacin
Modelo Linealizado
Exponencial
Y=eX
Z=Ln Y
X=X
Z=Ln +X
Logartmico
Y= +Log X
Y=Y
W=Log X
Y= +W
Doblemente Logartmico
Y=X
Z=Log Y W=Log X
Z= Log +W
Hiperblico
Y= +/X
Y=Y
W=1/X
Y= +W
Inverso
Y=1/( +X)
Z=1/Y
X=X
Z= +X