Sunteți pe pagina 1din 9

Regresin logstica mltiple

Anlisis de datos Categricos

Regresin logstica mltiple


Ms Carlos Lpez de Castilla Vsquez
Universidad Nacional Agraria La Molina

2015-2

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Regresin logstica mltiple

El modelo general de regresin logstica es:


log

i
1 i

= xT
i

Una prueba de bondad de ajuste usando la devianza:


D=2

 


N 
X
ni yi
yi
yi log
+ (ni yi ) log
2Np
yi
ni yi
i=1

donde N es el nmero de datos y p el nmero de parmetros a


estimar en el modelo.
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Ejemplo: Diabetes

Se tiene informacin proveniente de un estudio con 768


pacientes mujeres del Instituto Nacional de enfermedades
Digestivas, Diabetes y de Rin.
Las variables independientes involucradas son: nmero de
embarazos, concentracin de glucosa en plasma en una prueba
de tolerancia oral (mmol/L), presin arterial diastlica
(mmHg), grosor del pliegue del trceps (mm), suero de insulina
en dos horas (muU/ml), ndice de masa corporal, funcin
pedigr de diabetes, edad (aos).
La variable respuesta diabetes cuyo valor 1 es interpretado
como prueba de diabetes positiva.
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Estadsticas de bondad de ajuste

El estadstico chi-cuadrado de Pearson es:


N
X
(yi ni
i )2
X =
2Np
ni
i (1
i )

i=1

Cuando y es 0 o 1 entonces X 2 y D no proporcionan una


medida de bondad de ajuste que sea apropiada.
Lo anterior tambin podria ocurrir si las variables explicativas
son continuas.
En cualquiera de estas situaciones es preferible usar el
estadstico de Hosmer y Lemeshow (1980).
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Estadsticas de bondad de ajuste

La idea es agrupar las observaciones en categoras de acuerdo


a las probabilidades estimadas usando g grupos cada uno con
aproximadamente la misma cantidad de observaciones.
Con 10 grupos, el primer grupo de conteos observados y sus
correspondientes conteos estimados esta formado con las n/10
observaciones con las probabilidades ms altas y as
sucesivamente.
El valor estimado es la suma de las probabilidades estimadas
en cada grupo.
Sea yij la observacin j en el grupo denido por la particin i ,
i = 1, 2, , g y j = 1, 2, , ni .
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Estadsticas de bondad de ajuste

Sea ij las probabilidades estimadas con la data no agrupada.


El estadstico de Hosmer y Lemeshow es:
2
XHL
=

g
X
i=1

P

2

ij
j yij
j

P
 

j ij
j ij /ni

P

cuya distribucin es aproximadamente chi-cuadrado con g 2


grados de libertad.
Si el valor es grande puede ser evidencia de una falta de ajuste
en el modelo.

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Estadsticas de bondad de ajuste

Es posible comparar el logaritmo de la verosimilitud del modelo


estimado y el modelo minimal que es aquel donde todas las
probabilidades son iguales.
Sea i las probabilidades estimadas para yi bajo el modelo de
inters.
La estadstica chi-cuadrado de razn de verosimilitud es:
C = 2 (l(
, y) l(
, y)) 2p

Otra estadstica usada es:


pseudo R2 =

Ms Carlos Lpez de Castilla Vsquez

l(
, y) l(
, y)
l(
, y)
Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Residuales de Pearson

El

residual de Pearson es:

yk nk
k
pk = p
nk
k (1
k )
P
tal que X 2 = pk2 .

El

k = 1, 2, , m

residual estandarizado de Pearson es:


pk
rpk = p
( 1 hk )

donde hk es el

leverage obtenido de la matriz hat.

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

Regresin logstica mltiple

Regresin logstica mltiple


Estadsticas de bondad de ajuste
Residuales

Residuales de Devianza

Los

residuales de Devianza son:


 

yk
dk = signo(yk nk
k ) 2 yk log
nk
k


nk yk
+(nk yk ) log
nk nk
k
P
donde D = dk2 .

Los

residuales estandarizados de Devianza son:


dk
rdk = p
( 1 hk )

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos Categricos

S-ar putea să vă placă și