Documente Academic
Documente Profesional
Documente Cultură
RESPUESTA POISSON
P (Y y ) ; y 0,1, 2,...
y!
n= y corresponde al número promedio de éxitos (eventos) que
ocurren en un número muy grande de repeticiones del experimento.
La distribución de Poisson es el modelo de referencia para datos
de recuento (Lindsey, 1998).
La ley de eventos raros establece que el número total de eventos
seguirá, aproximadamente, una distribución de Poisson si un
evento puede ocurrir en cualquier punto del tiempo o del espacio
bajo observación, pero la probabilidad de ocurrencia en un punto
determinado es pequeña (Cameron y Trivedi, 1998).
Es decir, los datos de recuento de fenómenos con una baja
probabilidad de ocurrencia (sucesos raros) siguen una
distribución de probabilidad conocida, denominada distribución
de Poisson.
La distribución de Poisson permite obtener la probabilidad de que
se produzca un número determinado k de ocurrencias de un
evento:
Este modelo también es válido cuando se tiene un intervalo de
tiempo (h), un área o un volumen, entonces se define el modelo
de probabilidad como :
e (h )
h y
E (Y ) ; V (Y )
Existe un famoso ejemplo de un libro de 1898 publicado por
Ladislao Von Bortkiewicz que modela «el número de soldados
muertos por patadas de mulas cada año en la caballería prusiana»
, mediante una distribución de Poisson. El título del libro era
“La ley de los números pequeños”.
DISTRIBUCIÓN DE PROBABILIDAD POISSON ( )
DISTRIBUCIÓN DE PROBABILIDAD POISSON ( )
RELACION ENTRE LAS DISTRIBUCIONES DE
PROBABILIDADES POISSON ( ) Y
EXPONENCIAL (1/ )
La distribución de poisson surge naturalmente cuando el tiempo
(T) entre eventos es independiente e idénticamente distribuida
como una Exponencial
t Exponencial (1/)
Si este es el caso, el número de eventos (y) contabilizados en
cada intervalo tiene distribución poisson con parámetro
La distribución exponencial entre dos eventos va a resultar de la
suposición, que la ocurrencia de un evento en el intervalo de
tiempo es constante e independiente de la ocurrencia de otro
evento.
MODELO LINEAL
GENERALIZADO
POISSON
MODELO DE REGRESIÓN POISSON
Objetivos :
Predecir una respuesta a partir de un perfil de variables
explicativas (regresores).
Estimar el efecto de uno o más variables sobre una respuesta
que puede ser medida como conteos (Enteros positivos).
Calcular riesgos relativos ajustados de ocurrencia de un
evento (Ej. enfermedad) entre dos grupos de individuos
(expuestos y no expuestos a un factor de riesgo)
MODELO DE REGRESIÓN POISSON
El modelo de regresión poisson se utiliza para explicar una variable
respuesta,
Y: Número de ocurrencias de un evento en un intervalo h
en un periodo de tiempo, un área, o un volumen a partir de un
conjunto de k variables que se supone que explican la variación de
la variable Y, las cuales se denotan como X1,X2,…,Xk. El modelo
se expresa como:
E (Y / X ) ( x) Exp X
Supuestos :
1. Las respuestas (yi : i=1,2,…,n) son independientes
2. El número promedio de eventos es constante en cada intervalo
de tiempo o espacio.
3. Las variables explicativas (X1, X2,…, XK) son independientes
4. La variable respuesta tiene distribución Yi Poisson(i);
i=1,...,n
5. La media y la varianza de la variable aleatoria son iguales,
E(Yi) = V(Yi ) = i ; i=1,2,...,n (Heterocedasticidad)
6. Dado que V(Y)=V=, entonces, si =1, no existe sobre ni sub dispersión,
pues: E(Y)=V(Y)=
MODELO DE REGRESIÓN POISSON
La variable respuesta Y, puede representar :
El número de accidentes de tráfico que la persona i tiene
durante los últimos 5 años;
el número de hijos de la familia i;
el número de huelgas en la empresa i en los últimos 3 años;
el número de adultos que desarrollan una enfermedad en un
periodo de 3 años.
La abundancia de una especie de ave en un parque
El modelo de regresión de Poisson pretende explicar esta
variable de conteo Y utilizando variables explicativas X1,
…,XK.
MODELO DE REGRESIÓN POISSON
El modelo lineal generalizado poisson también se utiliza
cuando se tiene una variable respuesta binaria pero el tamaño
de muestra es muy grande y la probabilidad de ocurrencia del
evento de interés es muy pequeña.
Por ejemplo, el número de casos de sarampión en una muestra
de 500 000 niños menores de 5 años en el Perú.
La principal bondad del modelo de regresión poisson es que es
capaz de capturar la naturaleza discreta y no negativa de los
datos de recuento en especial cuando tales datos de recuento
proceden de eventos raros.
MODELO DE REGRESIÓN POISSON
Los tres componentes del modelo de regresión poisson (MRP)
son:
• Componente sistemático: El predictor lineal
X
expresa la combinación lineal de las variables explicativas y
proporciona el valor predicho.
• Componente aleatorio: el componente aleatorio ε , recoge la
variabilidad de Y no explicada por el predictor lineal η
• Función de enlace: En el modelo de regresión de Poisson, la
función que enlaza el componente sistemático η con el valor
esperado μ es la función logarítmica, ya que
η = log(μ )
VARIABLE DE EXPOSICIÓN (OFFSET)
De manera equivalente
tx es el número de años/persona
Leyenda
Evento
7
Censura
6
5
4
3
2
1
Supuestos :
Los respuestas (yi : i=1,2,…,n) son independientes
1. a() =1, no existe sobre ni sub dispersión (=1)
2. El número promedio de eventos es constante en todos los intervalos
de tiempo o espacio,
3. Las variables explicativas (X1, X2,…, XK) son independientes entre si.
Donde:
0=ln (): Ocurrencia de un evento en un intervalo de longitud
unitaria, cuando todas las variables independientes son
cero.
j : Cambio en ln() cuando la variable explicativa Xj varia en
una unidad, manteniendo fijadas las demás variables.
INTERPRETACIÓN DE LOS COEFICIENTES
DEL MODELO
Existe una relación entre el exponencial del coeficiente del
modelo de regresión expresado como:
0 1 X 1 ... k X k
E (Y / X1 x1 ,..., X k xk ) ( X ) e
0 1x1 2 x2 3 x3 4 x4
20
15
Número de individuos
10
0
0 1 2 3 4 5 6 7 8 9 10 11
Número de caidas
E (Y / X1 x1 ,..., X 4 x4 ) ( X ) e 0 1 X1 2 X 2 3 X 3 4 X 4
.
ˆ ( X tW 1X )1 X tW 1Y
INTERPRETACIÓN DE COEFICIENTES
ESTIMADOS
Para facilitar la interpretación consideremos un modelo con una sola variable
explicativa numérica.
Ejemplo: En el estudio del número de caídas en un periodo de 6 meses consideremos
la variable explicativa X3 : Balance
El modelo será:
ln ( x3 ) i ( x3 ) ˆo ˆ 3 x 3
El modelo ajustado será:
ln ˆ ( x3 ) ˆ i ( x3 ) 0.6074 0.0093 x 3
La estadística G= 9.60 p=0.0019
INTERPRETACIÓN DE PARÁMETROS
ln ˆ(a) ˆ i (a) 0.6074 0.0093 a
ln ˆ(a 1) ˆ i (a 1) 0.6074 0.0093( a 1)
ˆ(a 1) ˆ
ln
1 0.0093
ˆ
(a)
INTERPRETACIÓN DE PARÁMETROS
ˆ ( x) e1.5091.064 Intervención
EJEMPLO: NÚMERO DE CAÍDAS EXPLICADO
POR LA INTERVENCIÓN
G 2( D0 ( , y ) D1 ( ( x), y ) k2
EVALUACIÓN DEL MODELO AJUSTADO
E Y / X x ( x ) e 0
La desvianza para el modelo nulo es 199.194 con 99 gl.
Modelo propuesto
E Y / X x ( x) e 0 1Intervención
1
Var ( ˆ ) 1 I ( ˆ )
EVALUACIÓN DE LOS COEFICIENTES DEL MODELO AJUSTADO
Hipótesis :
Contraste de hipótesis
Chi-cuadrado
Parámetro B Error típico de Wald gl Sig.
(Intersección) 1,509 ,0665 514,288 1 ,000
[interven=1] -1,064 ,1313 65,625 1 ,000
[interven=0] 0 . . . .
(Escala) 1
RELACIÓN ENTRE LOS MODELOS LOGIT Y POISSON.
Si = n y n , entonces