Sunteți pe pagina 1din 116

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE MEDICINA
DEPARTAMENTO DE MEDICINA PREVENTIVA Y SALUD
PUBLICA

ASOCIACION
OR Y RR

DR RAMIRO CARBAJAL NICHO

PROFESOR AUXILIAR
RIESGO:

ES LA PROBABILIDAD DE ENFERMAR O MORIR


POR ESTAR EXPUESTO A UN DETERMINADO
FACTOR DE RIESGO

ASOCIACION RIESGO
Factor de riesgo

Toda variable asociada a la


propagación de un daño en una
población.
Ventajas del concepto de riesgo

„ Es de carácter predictivo
„ Al estar asociado a la probabilidad de
ocurrencia, tiene una fuerte base
estadístico-matemática.
„ Permite identificar e implementar
intervenciones preventivas.
Desventajas del concepto de riesgo

„ Es reduccionista, simplifica la realidad.


„ Difícil de aplicar en procesos de propagación
con muchos factores que interaccionan entre
sí de forma sistémica.
„ Depende mucho de factores de medición y
avances metodológicos y estadísticos.
„ Su uso excesivo nos lleva a falsas
asociaciones.
Medición de asociaciones

„ Si se analiza la distribución de la magnitud e


velocidad de un daño en distintas
poblaciones o segmentos de la población
pueden inferirse asociaciones.
„ La simple comparación de las tasas de
prevalencia e incidencia en poblaciones
distintas, permite inferir ciertas asociaciones
con características como hábitos,
condiciones de vida, edad, raza, etc.
„ El uso de celulares incrementa el riesgo
de tumores cerebrales?

Uso de Tumores
celulares cerebrales
Para responder esta pregunta la
epidemiología utiliza un recurso
metodológico: COMPARAR

Usan Cuántos tienen


celulares tumores cerebrales
COMPARAR
No Usan Cuántos tienen
celulares tumores cerebrales
La Epidemiología es comparar

Comparar implica medir las diferencias y determinar


si una variable está asociada a otra; o si la
exposición a una variable afecta a otra.

Usan Cuántos tienen


celulares tumores cerebrales COMPARAR

Más personas con


No Usan Cuántos tienen tumores en los que
celulares tumores cerebrales usan celulares

El uso de celulares está


asociado a los tumores
La diferencia entre los expuestos y no expuestos se
puede medir

„ La medida es probabilística.
„ Si los expuestos tienen más enfermos con
tumores cerebrales entonces los
expuestos a celulares tienen mayor
probabilidad de presentar tumores
cerebrales.
„ Esta probabilidad mide el riesgo de
enfermar cuando están expuestos a algún
factor.
¿QUÉ ES UN ENFOQUE DE RIESGO?

El enfoque de riesgo es la
metodología que se sigue para
encontrar grupos poblacionales
donde está presente los factores
que están asociados a mayor
riesgo, con el objeto de focalizar las
medidas de intervención sanitaria
apropiadas.
Por ejemplo
„ Si se encuentra que los que usan
celulares tienen mayores
probabilidades de enfermar de tumores
cerebrales, entonces se puede realizar
medidas preventivas en estos usuarios.
„ Por ejemplo controlar la intensidad de
las ondas de los celulares.
Tipos de Factores Asociados

Necesario:
Factor de riesgo
Causal
Relación de
dependencia
Contribuye (sin ser
necesario)
Factor asociado a Factor de riesgo
La mayor frecuencia No Causal

Sin relación de Marcador de


dependencia Riesgo
¿QUÉ ES UN FACTOR DE RIESGO CAUSAL?

Factor de Riesgo Causal, es aquél factor


presenta, además de una asociación
estadística con el mayor riesgo, una relación
causal.
La relación causal debe ser evaluada
cuidadosamente, sobre todo en relación a la
posibilidad de que se trate de una falsa
asociación.
Las falsas asociaciones están en relación a la
presencia de factores confusores.
DIFERENCIA ENTRE ASOCIACIÓN
ESTADÍSTICA Y ASOCIACIÓN CAUSAL

„ La asociación estadística sólo establece


que dos hechos aparecen en forma
simultánea.
„ No significa necesariamente que el hecho
este relacionado con el proceso de
propagación.
„ La estadística siempre se subordina al
análisis del proceso de propagación.
¿QUÉ ES UNA ASOCIACIÓN
CAUSAL?

Cuando se encuentra que un factor


explica la aparición o exacerbación de
un situación dada, hablamos de la
existencia de una asociación causal.
Para poder determinar relación causal
se tiene que cumplir con determinados
criterios
Criterios de Hill (1965)

„ Fuerza de asociación
„ Consistencia
„ Constancia
„ Especificidad
„ Relación dosis-respuesta
„ Temporalidad
„ Compatibilidad con hipótesis
científicas comprobadas.
Fuerza de asociación

Se refiere al grado en que el factor


considerado causal determina la presencia
de la enfermedad.
Es necesario establecer la frecuencia con
que el antecedente de exposición al factor
de riesgo está presente entre los enfermos
y no se presenta entre los que no están
enfermos
¿CÓMO SE MIDE EL RIESGO?

„ Midiendo la probabilidad de que ocurra


una enfermedad o la muerte en un
grupo expuesto a un factor.
„ Puede ser medido en un solo grupo o
comparando grupos.
„ En un solo grupo = riesgo absoluto
„ Comparando grupos = riesgo relativo
Medición de Asociaciones

„ Hay asociación entre un factor y la


enfermedad, cuando aumenta la
frecuencia relativa de la enfermedad
entre quienes están expuestos al factor
MEDIDAS DE ASOCIACIÓN MÁS
IMPORTANTES

„Riesgo Relativo
„Razón de probabilidad u
“ODDS RATIO” (OR).
RIESGO RELATIVO (RR)

El riesgo relativo es una razón de


incidencias
Expresa: la probabilidad de sufrir una
enfermedad entre quienes están
expuestos al factor considerado causal,
respecto a los no expuestos.

Riesgo Relativo = Incidencia entre los expuestos /


Incidencia entre los no expuestos
¿CÓMO INTERPRETAMOS EL VALOR DE
RIESGO RELATIVO?

„ Si el RR es igual a 1 no existe
evidencia de asociación entre el
factor y el daño.

„ Si el RR es mayor de 1, es un factor
de riesgo (aumenta el riesgo de
aparición de daño).

„ Si el RR es menor de 1, es un factor
protector (disminuye el riesgo de
aparición del daño).
Interpretación de RR y OR*

RANGO de RR INTERPRETACIÓN

0.0 - 0.3 Beneficio grande

0.4 - 0.5 Beneficio moderado

0.6 - 0.8 Beneficio insignificante

0.9 - 1.1 Sin efecto

1.2 - 1.6 Riesgo insignificante

1.7 - 2.5 Riesgo moderado

>2.6 Riesgo elevado

* Cuando el tamaño de los grupos es grande


Por ejemplo
„ Incidencia de Infección Respiratoria
Aguda (IRA)
„ 14 en mil, entre niños desnutridos
„ Uno en mil, entre niños normales

„ Riesgo relativo será 14/1 =14.


„El RR puede estimarse en la población o
en una muestra.
„Cuando se realiza en una muestra hay
que inferir los resultados obtenidos a la
población.
„Esto se realiza calculando el intervalo de
confianza.
„El intervalo de confianza es un rango de
valores en el cual debe estar contenido el
verdadero valor de la población
Intervalo de confianza del RR

Permite estimar el RR para la población, y que es el que se habría


obtenido si el estudio se hubiera hecho con todos los individuos y
no con una muestra.

RR en la población
RAZON DE PROBABILIDADES
(Odds ratio )

Llamado también razón de ventaja u OR


El OR es un estimador indirecto del riesgo
relativo, que tiene la propiedad de no
depender del tipo de diseño de investigación
empleado
Cálculo de RR y OR

Enfermo Sano Total


Expuesto a b a+b
No exp. c d c+d
Total a+c b+d a+b+c+d

RR = a:a+b/c:c+d OR = a.d/b.c
Manifestaciones Sin manifestaciones Total
neurológicas neurológicas
Tipo de trabajo

Trabajadores de 20 80 100
baterías (Pb)

Trabajadores de 4 96 100
tejidos (no Pb)

Total 24 176 200

La incidencia en trabajadores de baterías fue de


(20 / 100) * 1000 = 200‰
La incidencia en trabajadores de tejidos fue de
(4 /100) * 1000 = 40‰

Por lo tanto: el RR= 200/ 40= 5


Mortalidad en individuos normales y obesos según compañias
de seguros norteamericana

Tasas de mortalidad RR RR

Enfermedad Obesos Normal Cálculo Valor


es

Accidentes 171 70 171/70 2.4


cerebrovasculares

Cardiopatías 129 80 129/80 1.6

Diabetes 118 16 118/16 7.4

Accidentes 86 60 86/60 1.4


Razón de probabilidades (razón de
ventaja u OR (odds ratio)

„ No siempre es posible hacer estudios


prospectivos
„ Menos exacto que el riesgo relativo
„ Da una buena aproximación que puede
obtenerse de una manera más rápida y
barata.
„ El OR es un estimador indirecto del riesgo
relativo
„ No depende del tipo de diseño
Enfermedad Enfermedad Total
Presente Ausente

Factor a b a+b
Presente
Factor c d c+d
Ausente
Total a+c b+d a+b+c+d

OR = ad / bc
Se realiza un estudio de caso control para determinar el efecto de la
irradiación prenatal en niños con leucemia

Niños con Niños sin


leucemia leucemia Total

Factor
Niños con irradiación 30 70 100

Niños sin irradiación 45 155 200

Total 75 225 300

OR= 30x155 / 70x45 = 1.48


¿Cómo se expresa el RR?

Los trabajadores de baterías expuestos al


plomo tienen 5 veces más riesgo de
presentar manifestaciones neurológicas,
que los trabadores de tejidos no expuestos
al plomo.
Ejemplo de OR
Sin Total
Tipo de trabajo Manifestaciones manifestaciones
neurológicas neurológicas
Exposición al 20 (a) 5 (b) 25
plomo
No Exposición 80 (c ) 95 (d) 175
al plomo

Total 100 100 200


OR = a*d /b*c OR = 4.75
OR = 20*95 / 5*80
¿Cómo se expresa el OR?

Para fines prácticos:


Los trabajadores de baterías expuestos al
plomo tienen 5 veces más riesgo de
presentar manifestaciones neurológicas, que
los trabadores de tejidos no expuestos al
plomo.
No solo se necesita conocer la asociación
sino el efecto

Desde el punto de vista de salud pública y la


puesta en marcha de programas de prevención, es
fundamental conocer cuál será el impacto
potencial que se logrará al implementar
intervenciones sobre estos factores de riesgo.
Entonces no solo se necesita conocer la
asociación, sino determinar el efecto del factor
sobre la enfermedad.
Medidas de efecto
„ Las medidas de asociación permiten
identificar factores relacionados con el mayor
riesgo a un daño. Sobre estos factores se
pueden diseñar intervenciones para reducir el
riesgo.
„ Para medir cuánto riesgo se puede disminuir
se utiliza las medidas de efecto.
RIESGO ATRIBUIBLE

Llamado también Riesgo Diferencial, mide la parte de


riesgo que puede ser atribuido al factor en estudio,
también mide el probable impacto en la salud de la
población expuesta, si este factor se suprimiera.
NO MIDE FUERZA DE ASOCIACIÓN.
Cálculo:
R.A. =Tasa de incidencia entre expuestos —
Tasa de incidencia entre no expuestos
Riesgo atribuible
„ TASA DE INCIDENCIA ENTRE EXPUESTOS
– TASA DE INCIDENCIA ENTRE NO
EXPUESTOS
„ El riesgo atribuible realmente no mide fuerza
de asociación
„ Mide la parte de riesgo que puede ser
atribuido al factor en referencia
„ También mide el probable impacto en la
salud de la población si este factor se
suprimiera.
EJEMPLO DE RIESGO ATRIBUIBLE
En el ejemplo de los trabajadores de baterías
(expuestos al Pb) y los de tejidos (no expuestos al Pb).
En los expuestos la tasa de incidencia= 200‰
En los no expuestos la tasa de incidencia=40 ‰
RA = 200 – 40 = 160 ‰

LA INCIDENCIA EN EXPUESTOS QUE PUEDE SER


ATRIBUIDA AL FACTOR DE RIESGO ES DE 160 ‰.
RIESGO ATRIBUIBLE POBLACIONAL

Inc. Población – Inc. No Expuestos


(RAP%) = X 100
Tasa de Incidencia en Población

Mide la proporción de incidencia en la población que puede


ser atribuido al factor de riesgo
FRACCIÓN ETIOLÓGICA DE
RIESGO (FER)

Llamado también Riesgo Atribuible Porcentual


mide la proporción de incidencia entre
expuestos, que puede ser atribuido al factor de
riesgo.
Cálculo:

FER= Riesgo Atribuible_____________ x 100


Tasa de Incidencia en Expuestos
FRACCIÓN ETIOLÓGICA DEL RIESGO(FER):
„ Es la proporción (porcentaje) que representa
el factor estudiado del total de factores
etiológicos(red de causalidad)
Riesgo atribuible
__________________________
__ X 100 Tasa de
incidencia en expuestos
Ejemplo de FER

FER= Riesgo Atribuible_____________ x 100


Tasa de Incidencia en Expuestos

FER= _160_ x 100= 80%


200

LA PROPORCIÓN DE LA INCIDENCIA EN EXPUESTOS QUE PUEDE


SER ATRIBUIBLE AL FACTOR DE RIESGO ES 80%.

SI SE CONTROLARA EL FACTOR DE RIESGO, LA INCIDENCIA EN


EXPUESTOS SE REDUCIRÍA EN 80%
Ciclo del Análisis Epidemiológico

Cuantificar Comparar Proponer

Asignar un número Observado vrs. Esperado Modificar la


A un hecho (Analizar) Realidad
(Medir) (Proponer)

Medidas de Medidas de Medidas de


Frecuencia Asociación Impacto Potencial
Prevalencia/Incidencia Riesgo Relativo Riesgo
Riesgo Atribuible Poblacional
Ej: En un estudio se pudo seguir a una
población de individuos expuestos durante 20
años a un producto cancerígeno
(contaminante ambiental). Al finalizar dicho
período un cáncer poco frecuente apareció
en una población en que el 40% de las
personas expuestas al factor y el 60% no lo
estuvieron.
Enfermos Sanos Total
Expuestos 320 399 680 400 000
No expuestos 120 799 880 600 000
Total 1 000 000
RI(expuestos)= 320/400 000 = 0,0008 o 80/100
000 = La tasa de ataque (riesgo individual) en
los expuestos, es decir la incidencia global
para el período y el acontecimiento es de
80/100 000 habitantes

RI(no expuestos)= 120/600 000 = 0,0002 o


20/100 000 = La tasa de ataque (riesgo
individual) en los no expuestos es de 20/100
000 habitantes
RR= Te/ Tne = 0,0008/0,0002 = 4,0
Los expuestos al factor presentan un riesgo
cuatro veces mayor de padecer cáncer que los
no expuestos
RA= Te-Tne = 0.0008 – 0,0002= 0,0006 o
60/100 000habitantes
Solamente la tasa de 60/100 000 puede ser
atribuida al factor estudiado
FER= Te – Tne x 100 = 80 – 20 = 75%
Te 80
El factor estudiado representa el 75% del total de
factores etiológicos. Controlandolo se evitarían el
75% de los cánceres de ese tipo en expuestos
Distribución de la Fiebre Tifoidea en Lima según áreas económicas y ambientales. Lima
1975 - 1979 (tasa x 100 000)

Nivel 1975 1976 1977 1978 1979 1980

Alto 23.4 58.0 40.6 24.6 56.3 101.6


Medio 31.4 62.4 46.9 33.6 83.2 131.8
Bajo s/d 181.9 109.4 78.2 231.6 357.7
Características de Salubridad de los Distritos del Area Hospitalaria 1 y Casos de
Fiebre Tifoidea. Lima 1980

% de % Pob. % Pob. Pobl. Casos Tasa


Pob.
P.J . Agua Desagü e Tifoidea *

Ríma c 37.8 88 85.2 262,100 275 104.9


San Mar tín 70.7 88 82.7 350,000 839 239.7
Indepen dencia 88.2 23.8 28.1 166,880 383 229.5
Lu riganch o 91.9 53.2 52.6 130,885 411 314.0
P uente Piedra § 22.7 37.9 27.4 28,647 91 317.7

* Tasa por 100,000 habitantes; §: El 73.8% de su población vive en zonas rurales.


Falsas Asociaciones
„ Inferida una probable asociación ésta debe
ser evaluada cuidadosamente
„ Generalmente las falsas asociaciones están
en relación a la presencia de factores
confusores.
„ Estos factores pueden distraer al investigador
y mostrar una relación, incluso muy intensa,
que se debe a su fuerte relación con el
verdadero factor causal.
Causas de la tuberculosis

Exposición a Invasión de
la bacteria los tejidos
Factores genéticos

Malnutrición

HUÉSPED SUSCEPTIBLE INFECCIÓN TUBERCULOSIS

Hacinamiento

Pobreza

Factores de riesgo para la tuberculosis Mecanismos de la Tuberculosis


Causas del cólera

Exposición al Efectos de las toxinas


agua del cólera en las células
contaminada de la pared intestinal
Factores genéticos

Malnutrición

INGESTIÓN DEL
AUMENTO DE LA VIBRIÓN DEL CÓLERA
SUSCEPTIBILIDAD CÓLERA

Hacinamiento

Pobreza

Factores de riesgo para el cólera Mecanismos del cólera


Frecuencia de uso del cinturón de seguridad e incidencia de lesiones
en el Reino Unido

100 4000

90

80 Lesiones mortales y
graves 3000
70
Uso de cinturón de seguridad

60

N° de lesiones
50 2000
Uso de cinturón de seguridad
(%)

40

30
1000
20

10

0 0
E F M A M J J A S O N D E F M A M J J A S O N D
1982 1983

Entrada en vigor de la ley de obligaoriedad del cinturón de seguridad


UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE MEDICINA
DEPARTAMENTO DE MEDICINA PREVENTIVA Y SALUD
PUBLICA

PRUEBA
2
DR RAMIRO CARBAJAL NICHO

PROFESOR AUXILIAR
Se clasifican en:

„ CUANTITATIVAS O NUMÉRICAS : Se
pueden promediar
„ CUALITATIVAS O CATEGÓRICAS:
Muestran valores que se pueden
expresar en porcentajes
CUANTITATIVAS
( Numéricas)
Se pueden promediar. Tienen posibilidades de
aprovechar las propiedades matemáticas. Ej:
Edad, peso, talla, etc
Se subclasifican en :
– CUANTITATIVA CONTÍNUA: Pueden
adoptar decimales.Ej: Peso, Nivel de
Hemoglobina, Ingreso familiar.
– CUANTITATIVA DISCRETA:No se pueden
fraccionar:Ej: Número de hijos, Número de
embarazos, Integrantes de la familia, etc.
Cualitativas ( categóricas)
– Expresan valores que se pueden
expresar en porcentajes. Ej:
Enfermedad, estado nutricional, etc.
ESCALAS DE MEDICION
VARIABLE ESCALA UTILIDAD

CUALITATIVA NOMINAL IDENTIFICAR Y


CLASIFICAR
ORDINAL ORDINAL

CUANTITATIVA INTERVALO CERO


RELATIVO
RAZÓN CERO
ABSOLUTO
TIPOS DE ERROR
PRUEBA DECISION
DE
HIPOTESIS
HIPOTESIS NULA ACEPTAR RECHAZAR

VERDADERA ACIERTO ERROR TIPO I


(NIVEL DE (ALFA)
CONFIABILIDAD)
FALSA ERROR TIPO II ACIERTO
( BETA) ( PODER)
ANALISIS DE DATOS
„ Tablas de contingencia: Cruza variables
– Analíticas: Determinación de
diferencias
– Analíticas: Exploran relaciones
TABLAS DE CONTINGENCIA
„ La variable independiente es colocada
verticalmente ( a la izquierda)
„ Todas las tablas deben llevar un título claro y
los encabezados de reglones y columnas
„ Todas las tablas deben tener un reglón y una
columna separados para totales
TABLA Nº

VARIABLE VARIABLE DEPENDIENTE TOTAL


INDEPEDIENTE
TOS NO TOS

FUMADORES 11 52 63
NO 3 71 74
FUMADORES
TOTAL 14 123 137
EL ANÁLISIS
Es parte del diseño y debe planearse
claramente antes de recoger los
datos .
ELECCION DEL TEST ESTADISTICO ADECUADO
NATURALEZA DE METODO HIPOTESIS CONCLUSIONES
LAS VARIABLES NECESARIAS POSIBLES

2 CUALITATIVAS Efectivos teóricos Existencia de la


Test de 2 suficientes asociación
( Comparación de
%)

1 cualitativa Análisis de varianza La variable Existencia de la


cuantitativa debe asociación. Las
vs tener una distribución diferencias entre las
normal medias dan una idea
1 cuantitativa de la importancia de
la asociación

2 cuantitativas Test de regresión y Las distribucónes Existencia de la


correlación deben ser normales asociación; curva de
regresión. Grado de
asociación
Cruce de datos categóricos
„ ASOCIACION: Cambios en una
variable repercuten en otra
„ Ingresos económicos/ consumo
„ Cinturón de seguridad/ Secuelas
accidentes de tránsito
Contrastes no paramétricos

Los contrastes no paramétricos hacen referencia a la


distribución poblacional en su conjunto:

(1) Cómo podemos decidir a partir de una muestra si


la población sigue (“ajusta”) a una determinada
distribución dada (problema de bondad de ajuste).
(2) ¿Estas muestras provienen de poblaciones con la
misma distribución? (problema de la homogeneidad).
(3) ¿Son independientes o dependientes varias
características poblacionales?
Chi Cuadrado
EVALUA RELACION ENTRE DOS
DEFINICION VARIABLES CATEGORICAS

VARIABLES DOS
INVOLUCRADAS
NIVEL DE MEDICION NOMINAL U ORDINAL

PROCEDIMIENTO TABLA DE
CONTINGENCIA
ASOCIACION ENTRE
VARIABLES CUALITATIVAS
„ Ji cuadrada: Distribución de probabilidades
„ Sesgada a la derecha
„ Valores de Z han sido elevados al cuadrado y toman
el nombre 2
„ La distribución 2 puede deducirse a partir de la
distribución normal, con media y varianza 2
„ Al estudiar la distribución muestral de Z2 se observa
que sigue una distribución 2 con n grados de
libertad
Ji CUADRADO

2
CARACTERÍSTICAS
En la distribución 2, para cada grado de
libertad hay una curva de probabilidades o
de frecuencias.
No tiene valores negativos. El valor mínimo es
0 y a la derecha se distribuye hasta el
infinito.
Todas las curvas son asimétricas.
A medida que aumentan los grados de libertad
las curvas son menos elevadas y más
extendidas a la derecha.
APLICACIONES
„ Construir intervalos de confianza y
probar hipótesis acerca de la varianza
de la población.
„ Probar hipótesis
„ Karl Pearson demostró que la
distribución x2 puede emplearse
como prueba de la congruencia entre
la observación y la hipótesis
„ La estadística x2 es más adecuada
para utilizarse con variables medidas
PROBAR HIPOTESIS
Los procedimientos más conocidos :
„ Prueba de bondad de ajuste
„ Prueba de Independencia y
„ Prueba de homogeneidad.
La fórmula

Donde:
⎛ Oi − E i ⎞ Oi representa las frecuencias observadas para
X = ∑ ⎜⎜
2
⎟⎟ la i-ésima categoría de la variable de interés
⎝ Ei ⎠ Ei representa las frecuencias esperadas para la
i-ésima categoría dado que la Ho es verdadera
FRECUENCIAS OBSERVADAS

„ Número de objetos o individuos en la


muestra que caen dentro de las
categorías de la variable de interés
„ Los datos se presentan en tablas de
doble entrada llamadas de contingencia
cuyas dimensiones son f x c:
„ f corresponde al número de clases o
niveles del criterio fila
„ c corresponde a las clases o niveles del
criterio columna
FRECUENCIAS ESPERADAS
„ Es el número de individuos u
objetos en la muestra que se
esperaría observar si alguna
hipótesis nula respecto a la variable
es verdadera

FRECUENCIA Total de fila x Total de columna


ESPERADA
Total general
GRADOS DE LIBERTAD
„ La cantidad de x2 con (f - 1)(c - 1) grados de libertad, es una
medida del grado con el que los pares de frecuencias
observadas y esperadas concuerdan en una situación dada.
„ Si la congruencia es exacta entre Oi - Ei , el valor x2 será cero
para cada par de frecuencias en cada categoría
„ Si el nivel de concordancia es estrecho proporciona un valor x2
será próximo a cero y no es posible rechazar la hipótesis de
nulidad
„ Cuando la congruencia es pobre, dicho valor es muy grande
„ En consecuencia sólo con un valor calculado suficientemente
grande de x2 será posible rechazar la hipótesis nula.
CALCULOS DE GRADOS DE
LIBERTAD
GRADOS DE ( f – 1) ( c – 1)
LIBERTAD
RECOMENDACIONES TABLAS 2X2

„ n>40 se usa 2 corregida por continuidad


„ Si n está entre 20 y 40 se usará 2 en el caso de que todas las
frecuencias esperadas sean mayor o igual a 5
„ Si n< 20, no se usa 2. En ese caso se usará la prueba Exacta de
Fisher

x2 2 n(ad- g.l=1
bc-0.5n)
(a+c)(b+d)(a+b)(c+d)
Prueba de bondad de ajuste 2

Supongamos una muestra aleatoria simple


de tamaño n.
Desconocemos que la distribución F de la
población.
Contrastaremos la hipótesis:

H0: F = F0 y H1: F x F0

Es decir: la distribución desconocida F de la


población es F0. Por ejemplo una
di t ib ió d P i d t i d
Procedimiento:

(1) Dividimos el dominio de la distribución en k


clases o intervalos disjuntos. Calculamos el
número de datos esperados, según la distribución
teórica a contrastar F0 , que deberían haber caído
en cada clase. Para ello basta multiplicar la
probabilidad que asigna F0 a cada clase por n,
el tamaño muestral.

Hemos de construir las clases de modo que cada una contenga al


menos 5 datos muestrales. Tenemos pues: A1, A2, ... ,Ak clases
con n1esp, n2esp, ... ,nkesp datos muestrales en cada clase, todos
valores mayores o iguales a 5.
Ejemplo: Durante 200 días se han recogido el
número de accidentes diarios:

Número de accidentes 0 1 2 3 4 5 6 7

Número de días 22 53 58 39 20 5 2 1

Creemos que el número de accidentes se distribuye como una


Poisson de media 2 (hipótesis nula).

Núm. de accidentes 0 1 2 3 4 5

N. esperado de días 27,06 54,14 54,14 36,08 18,04 10,54

Calculamos los valores esperados a través de la Poisson.


26
P ( x = 6) = e − 2 = 0.012; 200 × 0.012 = 2.41
6!
Realizaremos el test de constraste utilizando
el estadístico chi-cuadrado siguiente: Frecuencias
muestrales

(ni − Ei )
k ˆ 2
χ =∑
2

i =1 Eˆ i Frecuencias
esperadas
que sigue una distribución chi-cuadrado con k-1 grados
de libertad.
En nuestro ejemplo tenemos k = 6 clases. Luego:

6
( n − E ˆ ) 2
( 22 − 27. 06) 2
(8 − 10. 54) 2
χ2 = ∑ i i
= + ... + = 2.307
i =1 Eˆ i 27.06 10.54
Procedimiento:
(2) Ahora construimos las mismas k clases o
intervalos disjuntos para los datos muestrales.
Tendremos también: A1, A2, ... ,Ak clases con
n1, n2, ... ,nk datos muestrales en cada clase.

Número de accidentes 0 1 2 3 4 5 6 7

Número de días 22 53 58 39 20 5 2 1

Ajustamos al número de clases que nos determinó la distribución


a contrastar.
Número de accidentes 0 1 2 3 4 5

Número de días 22 53 58 39 20 8

Aquí la probabilidad
será de 5 a infinito.
Nuestro estimador chi-cuadrado vale: χ 2 = 2.307

El estimador se distribuye como: χ 2


k −1 =χ 2
6 −1 =χ 2
5

Supongamos que queremos: α = 0.5


En las tablas encontramos:
0.05 χ 52,0.05 = 11.07

χ 2
5, 0.05 = 11.07

χ 2 = 2.307 < 11.07 ⇒ No podemos rechazar H 0


Prueba de independencia
Supongamos que de n elementos de una población
se han observado dos características X e Y. Es decir:
disponemos de los datos de una muestra aleatoria
simple bidimensional:

( x1 , y1 ), ( x2 , y2 ),..., ( xn , yn )
Deseamos contrastar si las características poblacionales
X e Y son independientes o no.
Nuevamente hemos de dividir el conjunto de
observaciones en k clases: A1, A2, ... ,Ak clases
determinadas por los valores esperados de X y
en r clases: B1, B2, ... ,br para Y. (De nuevo en cada
clase, todos valores mayores o iguales a 5)
El estadístico de contraste será ahora: Número total de
elementos de la clase j
de Y con el resto de clases
Frecuencia muestral de de X
la clase (i, j) (X,Y).
2
⎛ Eˆ Eˆ total total

nij − ⎜ i j ⎟
⎜ n ⎟
⎝ ⎠
k r
χ = ∑∑
2

i =1 j =1
ˆ total ˆ total
Ei E j
El estadístico
n seguirá una
Número total de distribución
elementos de la clase i chi-cuadrado de
de X con el resto de clases (k-1)(r-1) grados
de Y de libertad.
PRUEBA DE
INDEPENDENCIA
„ Se usa para probar hipótesis de nulidad que indica
que dos criterios de clasificación son independientes.
„ Incluye dos variables
„ H1: Si dos criterios de clasificación están
relacionados
„ H0: Si las variables no están relacionadas, son
independientes
„ Dos criterios de clasificación son independientes sí la
distribución de un criterio es la misma, sin importar
cuál sea la distribución del otro
„ Si se rechaza la hipótesis de nulidad, se concluye
que los dos criterios de clasificación no son
independientes, es decir están asociados.
„ Los datos para esta prueba están medidos en escala
nominal u ordinal
„ La característica principal de esta prueba es que n
se extrae en forma aleatoria de una población, en
consecuencia, las frecuencias que caen en las
diferentes celdas suceden en forma aleatoria, por lo
tanto los totales marginales de las filas y renglones
son también aleatorios.
TABLAS DE CONTINGENCIA
2X2

n(ad − bc) donde a,b,c y d son la frecuencias


2
X2 = observadas en las celdas
(a + c)(b + d )(a + b)(c + d )
EJEMPLO
„ Se desea probar si hay independencia entre
la proporción en que se presenta la
arterioesclerosis obliterans en los diabéticos
que fuman y en los diabéticos que no fuman
en un total de 301 diabéticos examinados.
Los resultados de las observaciones se
presentan en la siguiente tabla.
No fumadores Fumadores
DIABÉTICOS Oi Ei Oi Ei TOTAL
Con arterioesclerosis 31 43.29 126 113.71 157
Sin arterioesclerosis 52 39.71 92 104.29 144
TOTAL 83 218 218 301
Solución
„ Hipótesis
„ H0: La presencia de la arterioesclerosis oblitenrans es
independiente del hábito de fumar.
„ H1: La presencia de la arterioesclerosis oblitenrans es
dependiente del hábito de fumar.
„ Nivel de significación: = 0.05
„ Estadístico de prueba:
„ Regla de decisión: Se rechazará la hipótesis de nulidad si 2
calculado es mayor o igual que 3.841
„ Cálculo de la estadística de prueba:

X 2
=
(31− 43.29) (52− 39.71)
+ + ...
(92−104.29)
2
= 10.073
43.29 39.71 104.29
„ Decisión estadística: se rechaza la hipótesis de
nulidad por que 2 calculado es que el de la tabla.
„ Se concluye que la proporción en que se presenta la
arterioesclerosis oblitenrans en pacientes diabéticos
està asociada con el hàbito de fumar.
„ Conclusión: Se concluye que la proporción en que se
presenta la arterioesclerosis oblitenrans se relaciona
con el hábito de fumar.
„ Para estudiar la dependencia entre la
práctica de algún deporte y la
depresión, se seleccionó una muestra
aleatoria simple de 100 jóvenes, con los
siguientes resultados:
Sin depresión Con depresión
Deportista 38 9 47
No deportista 31 22 53
69 31 100
„ L = (38 – 32,43)2/32,43 + (31 – 36,57)2/36,57 + (9 –
14,57)2/14,57 + (22 – 16,43)2/16,43= 0,9567 + 0,8484 + 2,1293
+ 1,8883 = 5,8227

„ El valor que alcanza el estadístico L es 5,8227.


„
„ Buscando en la tabla teórica de Chi Cuadrado para 1 grado de
libertad se aprecia Lt = 3,84146 < 5,8227
„ Rechazar la hipótesis de independencia de caracteres con un
nivel de significación del 5%,
„ Por tanto que la práctica deportiva disminuye el riesgo de
depresión.
„ En un estudio para determinar si existe
relación entre el sexo y el propósito de
elegir una carrera técnica se
entrevistaron a 120 aspirantes a la
universidad.
Aspira a Carrera Técnica
Sexo Total
Si No
Masculino 40 30 70
Femenino 10 40 50
Total 50 50 120
„ Se aplicará la fórmula para encontrar χ2
„ χ2 = (120(40x40 – 10x30)2)/70x50x50x70 = 16,56
„ De la tabla teórica de Chi Cuadrado: 0,1% superior es 10,828
„ Por lo tanto, la hipótesis según la cual existe independencia
entre el sexo y el propósito de elegir una carrera técnica debe
ser rechazada.
„ Si se tiene en cuanta la corrección por continuidad de Yates se
obtiene:
„ χ2 = (120(|40x40 – 10x30| - 0,5(120))2)/70x50x50x70 = 15,06
„ Que es ligeramente inferior al valor antes obtenido, pero aun
así, la hipótesis de independencia debe ser rechazada
Prueba de homogeneidad
Supongamos que disponemos de los datos de
m muestras aleatorias y deseamos saber si podemos
decidir si provienen de la misma distribución poblacional.

= n1 + n2 + ... + nm
Tamaño Tamaño de
total de todas
n la muestra m.
las muestras.
Nuevamente hemos de dividir el conjunto de
observaciones en k clases: A1, A2, ... ,Ak clases
determinadas por los valores esperados (en cada
clase, todos valores mayores o iguales a 5). Pero
ahora lo haremos m veces.
El estadístico de contraste será ahora:

Número total de
Frecuencia muestral de elementos de la muestra i
la clase j de la muestra i
2
⎛ Eˆ i Eˆ total

nij − ⎜⎜ i ⎟

m k
⎝ n ⎠
χ = ∑∑
2

i =1 j =1
ˆ
Ei Ei ˆ total

El estadístico
n seguirá una
Suma de las frecuencias distribución
muestrales de todas las chi-cuadrado de
clases número i (m-1)(k-1) grados
de libertad.
PRUEBA DE HOMOGENEIDAD
„ Se usa para probar hipótesis de nulidad que indica si, dos o más
muestras provienen de poblaciones homogéneas con respecto a algún
criterio de clasificación.
„ En este caso la hipótesis nula establece que las muestras se extraen de
la misma población.
„ En esta prueba los datos se presentan en tablas de contingencia en las
que un conjunto (fila o columna) de totales marginales es fijo, mientras
que el otro conjunto, es aleatorio.
„ Es conveniente entender que los totales de los renglones o columnas
están bajo el control del investigador, es decir, éste puede especificar que
las muestras independientes pueden ser extraídas de varias poblaciones
previamente seleccionadas, por lo tanto el procedimiento de muestreo en
esta prueba es diferente al de la prueba de independencia.
„ El estadístico de prueba es el mismo.
„ Las hipótesis y conclusiones se establecen en términos de homogeneidad
de las poblaciones con respecto a la variable de interés
EJEMPLO
„ Un investigador al estudiar el grado de uso de drogas
entre estudiantes de bachillerato que habían
declarado ser adictos a ellas, seleccionó de este
grupo una muestra de 150 alumnos del primer año,
135 del segundo, 125 del tercer año y 100 del último
año. Cada estudiante contestó un cuestionario en el
que indicaba el grado de su uso de droga, ya sea
como experimento, ocasionalmente, o bien, desde
moderado hasta intenso.
GRADO DE USO DE LA DROGA
Grado Académico De moderado TOTAL
Experimental Casual a alto
Primer año 57 63.24 50 51.47 43 35.29 150
Segundo año 57 56.91 58 46.32 20 31.76 135
Tercer año 56 52.70 45 42.89 24 29.41 125
Ultimo año 45 42.16 22 34.31 33 23.53 100
TOTAL 215 175 120 510
X2 = ∑
(Oi − Ei )
Ei

Solución
„ Hipótesis:
„ H0: Las cuatro poblaciones (primer año, segundo, tercero y cuarto)
son homogéneas, con respecto al grado de uso de drogas.
„ H1: Las cuatro poblaciones no son homogéneas con respecto al
grado de uso de drogas
„ = 0.05
„ Estadística de prueba
X 2
=
(57 − 63.24 ) (50 − 51.47 )
2
+
2
+ ... +
(33 − 23.53)
2
= 19.4
63.24 51.47 23.53

„ Regla de decisión. se rechaza H0 si el valor calculado de 2 es


mayor o igual que 12.592.
„ Cálculo de a estadística de prueba: Primero se procede a
calcular las frecuencias esperadas multiplicando los totales
marginales. El producto se divide entre el total de la muestra.
Luego:
Decisión estadística
„ Al consultar la tabla de distribución 2 se
encuentra que la probabilidad de encontrar
un valor tan grande como 19.4, cuando la
hipótesis nula es verdadera, es menor que
0.005.
„ La decisión es, entonces, rechazar la
hipótesis nula.
„ Se concluye que las poblaciones no son
homogéneas dado que 19.4 > 1.548.
„ Un estudio sobre caries dental en niños
de seis ciudades con diferentes
cantidades de fluor en el suministro de
agua, ha proporcionado los resultados
siguientes:
Nº niños Nº niños
Comunidad
sin caries con caries
A 38 87 125
B 8 117 125
C 30 95 125
D 44 81 125
E 64 61 125
F 32 93 125
216 534 750
„ El contraste arroja un valor del estadístico L
de 65,85
„ Rechazar la hipótesis de homogeneidad y
aceptar que el diferente contenido de fluor en
el suministro del agua puede ser la causa de
la disparidad en el número de niños con
caries
„ El Lt esperado según la tabla de las
distribución Chi Cuadrado es 11,0705 que es
menor 65,85.
Distribuciones teóricas
Test Chi-Cuadrado

X2k-1,1-a: valor de la tabla de la distribución Chi-


Cuadrada
Si X2 > X2k-1,1-a rechazar H0
Si X2 £ X2k-1,1-a no rechazar H0

a: probabilidad de cometer error de Tipo I


(rechazar H0 cuando es verdadera)
Distribuciones teóricas
Test Chi-Cuadrado

Recomendaciones:
• Construir categorías equiprobables
• Asegurar que nPj ³ 5 "j en 1..k
• No olvidar las “colas” de las distribuciones
Observaciones:
• El test tiende a no rechazar H0 cuando hay
pocos datos (n pequeño) y a rechazar H0
cuando hay muchos datos (n grande)
www.obesidadcirugia.com

MUCHAS
GRACIAS

S-ar putea să vă placă și