Sunteți pe pagina 1din 7

La regresión Probit

El Análisis probit es un método estadistico que se usa para analizar la relación que existe entre un
estímulo (dosis) y una respuesta cuantitativa, siempre se prefieren las respuestas cuantitativas, pero en
muchas situaciones, sólo es posible determinar si se ha producido una determinada respuesta, como la
muerte, por ejemplo.

El modelo probit relaciona la probabilidad de ocurrencia P del resultado contado por Y con las
variables predictoras X, que pueden ser cuantitativas o categóricas, el modelo toma la forma:

P( X) = Φ( β1 + β2 X2 + β3 X3 +… + βN XN )

donde Φ(Z) es la función de distribución acumulada normal estándar.

El procedimiento regresión Probit está diseñado para ajustar un modelo de regresión en el cual la
variable dependiente Y caracteriza un evento con sólo dos posibles resultados.

La variable dependiente Y puede ser un conjunto de ceros y unos, donde 1 representa la ocurrencia de
uno de los dos posibles resultados o puede ser la proporción de veces que ocurre cada uno de los dos
resultados.

En este procedimiento, se asume que la probabilidad de un evento está relacionada con los predictores
a través de la función probit.

Puede usarse el procedimiento Regresión Logística para ajustar el mismo tipo de datos empleando
una forma funcional diferente.

El procedimiento ajusta el modelo usando máxima verosimilitud o mínimos cuadrados ponderados.

Para probar la significancia de los coeficientes del modelo se realizan pruebas de cociente de
verosimilitud.

Se puede graficar los valores que toma el modelo ajustado y las predicciones generados a partir del
mismo, se pueden graficar y grafican y los residuos atípicos se identifican y grafican

Aplicaciones de la regresión Probit


El rango de posibles aplicaciones de la regresión Probit es bastante amplio: sociología, análisis
financiero, econometría, bioestadística, análisis de riesgos, toxicología, asistencia sanitaria, medicina
veterinaria e investigación clínica son algunos de los campos donde el la regresión Probit ya ha sido
ampliamente usada, una de las aplicaciones de mayor interés es la determinación de las dosis y las
concentraciones letales.

Los ingenieros de seguridad aplican esta metodología para la determinación de los efectos térmicos,
tóxicos y de explosiones sobre las personas y los bienes materiales en los establecimientos
industriales.

La DL50
La dosis letal 50 (DL50) es la dosis de tóxico necesaria para causar la muerte del 50% de la población
de estudio en un tiempo determinado

La regresión Probit permite determinar la relación que existe entre una variable independiente (la
dosis) y una variable dependiente (la respuesta) para una exposición determinada.

Para determinar la DL50 con la regresión Probit, Si se representa la mortalidad acumulada en


unidades probit ( % en el eje Y) y el logaritmo de la dosis en el eje X obtenemos una respuesta de
tipo sigmoides, en el grafico resultante podemos hallar para el valor 50% de la respuesta, el valor de
la dosis (DL50) que causa esa respuesta: La dosis letal 50 (DL50)

La DL50 (o la DE50 cuando el parámetro que se estudia es diferente a la mortalidad) es útil para
comparar sensibilidades entre diferentes tipos de individuos para un mismo tóxico, para comparar la
toxicidad de varios compuestos para un mismo tipo de individuo y para determinar criterios de
calidad.

Ejemplo de un Análisis Probit


A un grupo de individuos se les suministra diferentes dosis de un fármaco y se registra el numero de
individuos que tiene una reacción determinada (la muerte, por ejemplo), este experimento fue
ideado por Bliss (1935) en el cual se expusieron escarabajos a diferentes concentraciones de bisulfuro
de carbono y se registraron la dosis, el número de escarabajos expuestos, y el número de escarabajos
muertos.

Los datos del ejemplo son datos hipoteticos del resultado de un experimento de Bliss y van a ser
usados para ilustrar un Análisis Probit.
Datos del Ejemplo:
OBS Dosis (ml) Expuestos Muertos
1 49 59 6
2 52 60 13
3 56 62 18
4 60 56 28
5 64 63 52
6 68 59 53
7 72 62 61
8 76 60 60

Los resultados de un Análisis Probit


Se presentan los resultados de un Análisis Probit en tablas en la que aparecerá para cada
variable el valor del coeficiente; su error estándar; la tabla de percentiles, la LD50, el Log-
verosimilitud, el valor de p para ese contraste; así como los errores de cada variable y sus
intervalos de confianza para el 95 % de confianza.
Análisis de Probit: Muertos. Ensayados vs. Dosis (ml)
Distribución: Normal
Variable Valor Conteo
Muertos Evento 291
Sin evento 190
Ensayados Total 481

Método de cálculo: Máxima verosimilitud


Tabla de regresión
Error
Variable Coef estándar Z P
Constante -8,46914 0,658720 -12,86 0,0001
Dosis (ml) 0,144449 0,0110673 13,05 0,0001
Log-verosimilitud = -183,411

El modelo ajustado para los datos del ejemplo es:

P(Muertos ) = Φ(-8,46914+ 0,144449Dosis)

El valor de P para Dosis es muy pequeño, indicando que es un predictor estadísticamente


significativo para la proporción de individuos muertos.

Pruebas de bondad del ajuste


Método Chi-cu GL P
Pearson 5,21025 6 0,517
Desviación 5,58257 6 0,472

Cálculos del parámetro


Error Intervalo de C de 95,0%
Parámetro Estimado estándar Inferior Superior
Media 58,6306 0,516107 57,6191 59,6422
Desv.Est. 6,92285 0,530412 5,95755 8,04456

Análisis Probit -Mínimos cuadrados [Distribución Normal]


Probit Peso
Dosis (Estímulo) Porcentaje Actual (%) N (Y) (Z)
49 0,10 59 3,73 2,68
52 0,22 60 4,22 3,93
56 0,29 62 4,45 4,40
60 0,50 56 5,00 5,00
64 0,83 63 5,94 3,63
68 0,90 59 6,27 2,68
72 0,98 62 7,14 1,00
76 1,00
Gráfica de supervivencia para Muertos
60 7,64 1,00

Normal - IC de 95%
Estadísticos de
Datos probit - Cálculos de ML
Regresión 50
100
Tabla de estadísticas
Media 58,6306
Desv.Est. 6,92285
80 Mediana 58,6306
IQR 9,33879
taje

60
LD50 58,64 LD50 Error Estándar 0,52
LD50 LCL 57,62 LD50 UCL 59,66
Beta 0,14 Intercepto -3,43
Beta Error Estándar 0,03

LD10 49,72 LD16 51,68


LD84 65,59 LD90 67,55
LD100 69,07

Tabla de percentiles con los errores y los intervalos de confianza

I de Confianza de
Error 95,0%
Porcentaje Percentil estándar Inferior Superior
1 42,5257 1,37297 39,3937 44,8911
2 44,4128 1,24011 41,5913 46,5549
10 49,7586 0,883957 47,7765 51,3079
20 52,8042 0,707404 51,2481 54,0680
30 55,0003 0,604484 53,7026 56,1070
40 56,8767 0,543039 55,7467 57,9024
50 58,6306 0,516107 57,5957 59,6421
60 60,3845 0,523408 59,3752 61,4513
70 62,2610 0,567508 61,2056 63,4604
80 64,4571 0,656407 63,2727 65,8868
90 67,5026 0,821873 66,0549 69,3363
99 74,7356 1,30108 72,4911 77,6997

Dosis (ml) Ensayados Muertos DESV1 PROBEV1 COEF1


49 59 6 0,53045 0,082092 -8,46914
52 60 13 0,95070 0,169085 0,14445
56 62 18 -1,03205 0,351975
60 56 28 -1,18071 0,578401
64 63 52 0,87498 0,781008
68 59 53 -0,36414 0,912036
72 62 61 0,55794 0,973270
76 60 60 0,85362 0,993946

Análisis de Desviación: descomposición de la desviación de los datos en un componente


explicado (Modelo) y un componente no explicado (Residuo). La Desviación compara la
función de verosimilitud de un modelo con el valor más grande que puede alcanzar la
función de verosimilitud, de tal forma que un modelo perfecto tendría una desviación igual
a
0.

Se incluyen el cuadrado medio del error (CME), el error absoluto medio (EAM), el error
porcentual absoluto medio (EPAM), el error medio (EM), y el error porcentual medio
(EPM).
Estas estadísticas de validación pueden ser comparadas con las estadísticas del modelo
ajustado para determinar qué tan bien el modelo predice las observaciones fuera de los
datos
usados para ajustarlo.
El modelo ajustado para los datos del ejemplo es
P(Killed ) = Φ( - 34.9349 +19.7277 Dose) (5)
La regresión explica alrededor del 96.4% de la desviación de un modelo sin Dose. El valor
de P
para Dose es muy pequeño, indicando que es un predictor estadísticamente significativo
para la
proporción de escarabajos muertos (Killed).
Advierta que el valor de P para los Residuos no es significativo, indicando que no queda
“falta de
ajuste” significativa sin explicar. P X = Φ β + β X + β X + + β X (1)
donde Φ(Z) es la fun
Gráfico del Modelo Ajustado
El Gráfico del Modelo Ajustado presenta la probabilidad estimada de un resultado Pˆ(X )
versus
cualquier variable predictora sola, con las otras variables constantes.

Pruebas de Razón de Verosimilitud – una prueba de significancia para cada efecto en el


modelo ajustado. Estas pruebas comparan la función de verosimilitud del modelo completo
con la del modelo en el cual sólo el efecto indicado ha sido removido. Valores de P
pequeños
indican que el modelo ha mejorado significativamente por el efecto correspondiente.

El modelo ajustado para los datos del ejemplo es


P(Killed ) = Φ( - 34.9349 +19.7277 Dose) (5)
La regresión explica alrededor del 96.4% de la desviación de un modelo sin Dose. El valor
de P
para Dose es muy pequeño, indicando que es un predictor estadísticamente significativo
para la
proporción de escarabajos muertos (Killed).
Advierta que el valor de P para los Residuos no es significativo, indicando que no queda
“falta de
ajuste” significativa sin explicar.

Gráfico del Modelo Ajustado


El Gráfico del Modelo Ajustado presenta la probabilidad estimada de un resultado Pˆ(X )
versus cualquier variable predictora sola, con las otras variables constantes.
Gráfica de fallas acumuladas de Muertos
Normal - IC de 95%
Datos probit - Cálculos de ML
65
100

80
Porcentaje

60
50
40
Tabla de estadísticas
Media 58,6306
20 Desv.Est. 6,92285
Mediana 58,6306
IQR 9,33879

40 45 50 55 60 65 70 75
Dosis (ml)

Gráfica de probabilidad para Muertos


Normal - 95% de IC
Datos probit - Cálculos de ML
99
Tabla de estadísticas
Media 58,6306
95 Desv.Est. 6,92285
Mediana 58,6306
90 IQR 9,33879 90
80
Gráfica de supervivencia para Muertos
Normal - IC de 95%
Datos probit - Cálculos de ML
50
100
Tabla de estadísticas
Media 58,6306
Desv.Est. 6,92285
80 Mediana 58,6306
IQR 9,33879
Porcentaje

60
50
40

20

S-ar putea să vă placă și