Documente Academic
Documente Profesional
Documente Cultură
Ejercicios resueltos
1. Para estudiar la asociacin entre la raza y la imposicin de pena de muerte a individuos culpables de
homicidio se llev a cabo un estudio sobre 326 individuos culpables de homicidio en Florida durante 19761977. Los datos observados para las variables veredicto de pena de muerte (si, no) y raza del acusado
(blanca, negra) figuran en la tabla I:
pena de muerte
raza blanca
raza negra
si
no
19
17
141
149
Tabla I.
Solucin:
El cociente de ventajas muestral es:
19 149
=
= 1,18
17 141
Esta estimacin puntual significa que en la muestra la probabilidad estimada de ser condenado a muerte en
lugar de no serlo es 1,18 veces mayor para una persona de raza blanca que para una de raza negra.
Para poder inferir este resultado a la poblacin se construye un intervalo de confianza sobre al nivel 0,95.
( )
1
1
1
1
+
+
+
= 0,354
19 141 17 149
Por lo tanto, un intervalo de confianza al nivel 0.95 para ln es:
ln =
(e
0,527
es un intervalo de confianza aproximado al nivel 0,95 para . Dado que este intervalo contiene al valor
= 1 de independencia, los datos no son significativos para concluir que los acusados de raza blanca y los
de raza negra tienen distinta probabilidad de recibir pena de muerte.
La Q de Yule muestral se obtiene como:
19 149 14117
= 0, 00830
Q =
19 149 + 14117
Para construir un intervalo de confianza sobre Q al nivel 0,95 se estima su error estndar asinttico
( )
( 0, 2615 , 0, 4275 )
2. Con el fin de estudiar la relacin entre la opinin sobre la legalizacin de las drogas y el nivel de estudios
se dispone de los datos de la siguiente tabla. La opinin respecto a la legalizacin de las drogas se clasifica
en tres categoras: D (desaprobacin), M (aprobacin moderada) y A (aprobacin general). El nivel de
estudios se clasifica tambin en tres niveles: EP (estudios primarios), EM (estudios medios) y EU
(estudios universitarios).
EP
EM
EU
total
total
209
151
16
376
101
126
21
248
237
426
138
801
547
703
175
1425
G 2observada = 96,527
Para ambos sus valores p que corresponden a la probabilidad acumulada a su derecha por una 4 son
2
exactamente cero. Esto lleva a rechazar la hiptesis nula de independencia con cualquier nivel de
significacin.
Los valores estimados de las medidas de asociacin basadas en son:
2
= 0, 256
C = 0, 248
V = 0,181
Obsrvese que el grado de asociacin global estimado con estas medidas es muy pequeo.
Como ambas variables son ordinales se procede a estimar la asociacin mediante la medida gamma. El
nmero de pares concordantes es el siguiente:
C = 209 (126 + 426 + 21 + 138 ) + 101( 426 + 138 ) + 151( 21 + 138 ) + 126 138
= 246960
Anlogamente, el nmero de pares discordantes es:
( ) = 0, 037 , permite construir el intervalo de confianza al nivel 0,95 dado por (0,31448 , 0,45952).
Obsrvese que el valor estimado es muy preciso dado que el intervalo de confianza es estrecho de modo
que se puede concluir, en base al signo positivo de esta medida, que existe cierto grado de monotona
creciente en la asociacin. Esto significa que la probabilidad de estar a favor de la legalizacin de las drogas
aumenta con el nivel de estudios.
3. Se desea comparar los registros que dos observadores han obtenido a lo largo de una sesin. Nos
interesa conocer cul es la fiabilidad entre los registros de estos dos observadores:
observador 2
B
C
D
A
A
B
C
D
observador 1
191
83
59
91
424
97
123
76
78
374
65
88
161
65
379
88
73
39
144
344
441
367
335
378
1521
Tabla III.
Solucin:
Se calcula el valor del ndice kappa ( ) a partir de la frmula general:
k
ni i
i =1
n
i =1
n
i =1
i+
i+
n+ j
n+ j
n
i =1
ii
n
i =1
ii
f ++
Para conocer el efecto de las respuestas aleatorias de los observadores se calcula la proporcin de
concordancia aleatoria utilizando para ello los marginales de la matriz de confusin:
k
n
i =1
i+
n+ j =
n
i =1
i+
n+ j
2
++
= 0, 25
Una vez conocidas las dos proporciones se sustituye en la forma general del ndice y se tiene:
0, 41 0, 25
= 0, 21
1 0, 25
4. Supngase que en una determinada poblacin se desea averiguar si existen diferencias en la prevalencia
de obesidad entre hombres y mujeres o si, por el contrario, el porcentaje de obesos no vara entre sexos.
Tras ser observada una muestra de 14 sujetos se obtuvieron los resultados que se muestran en la tabla IV:
sexo
hombres
mujeres
total
obesidad s
obesidad no
total
7 (a)
1 (c)
8 (a+c)
2 (b)
4 (d)
6 (b+d)
9 (a+b)
5 (c+d)
14 (n)
Tabla IV. Tabla de contingencia para estudiar las diferencias en la prevalencia de obesidad entre sexos.
Estudio de prevalencia sobre 14 sujetos.
Solucin:
En esta tabla, la frecuencia esperada en tres de las cuatro celdas es menor de 5, por lo que no resulta
adecuado aplicar el test , aunque s el test exacto de Fisher. Si las variables sexo y obesidad fuesen
independientes, la probabilidad asociada a los datos que han sido observados vendra dada por:
2
p =
( a + b )! ( c + d )! ( a + c )! ( b + d )!
n! a ! b! c! d !
9! 5! 8! 6!
= 0, 0599
14! 7! 2! 1! 4!
Las siguientes tablas (V a X) muestran todas las posibles combinaciones de frecuencias que se podran
obtener con los mismos totales marginales que en la tabla IV. Para cada una de ellas, se ha calculado la
probabilidad exacta de ocurrencia bajo la hiptesis nula, segn la frmula general mencionada
anteriormente. Los resultados obtenidos se muestran en la tabla XI. El valor de la p asociado al test exacto
de Fisher puede entonces calcularse sumando las probabilidades de las tablas que resultan ser menores o
iguales a la probabilidad de la tabla que ha sido observada:
9
5
14
9
5
14
9
5
14
9
5
14
9
5
14
9
5
14
[1]
V
VI
VII
VIII
IX
X
8
7
6
5
4
3
1
2
3
4
5
6
0
1
2
3
4
5
5
4
3
2
1
0
0,0030
0,0599
0,2797
0,4196
0,2098
0,2080
Tabla XI. Probabilidad exacta asociada con cada una de las disposiciones de frecuencias de la tabla IX.
Otro modo de calcular el valor de p correspondiente consistira en sumar las probabilidades asociadas a
aquellas tablas que fuesen ms favorables a la hiptesis alternativa que los datos observados. Es decir,
aquellas situaciones en las que la diferencia en la prevalencia de obesidad entre hombres y mujeres fuese
mayor que la observada en la realidad. En el ejemplo, slo existe una tabla ms extrema que la
correspondiente a los datos observados (aquella en la que no se observa ninguna mujer obesa), de forma
que:
[2]
p = 2 0, 0629
[3]
Como se puede observar, las dos formas de clculo propuestas no tienen por qu proporcionar
necesariamente los mismos resultados. El primer mtodo siempre resultar en un valor de p menor o igual
al del segundo mtodo. Si se recurre a un programa estadstico como el SPSS para el cmputo del test,
ste utilizar la primera va para obtener el valor p correspondiente a la alternativa bilateral y el segundo
mtodo de clculo para el valor de p asociado a un planteamiento unilateral. En cualquier caso, y a la vista
de los resultados, no existe evidencia estadstica de asociacin entre el sexo y el hecho de ser obeso en la
poblacin de estudio.
5. Supngase que se desea estudiar la existencia de una asociacin entre el consumo de tabaco y el hecho
de sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar su magnitud se
disea un estudio de casos y controles en el que se investigar el consumo de tabaco de una serie de
pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles). Se
cree que alrededor de un 40 % de los controles son fumadores y se considera como diferencia importante
entre ambos grupos un odds ratio de 4. Con estos datos, se puede calcular el tamao de muestra necesario
en cada grupo para detectar un odds ratio de 4 como significativamente diferente de 1 con una seguridad
del 95 % y una potencia del 80 %.
Solucin:
De acuerdo con lo expuesto con anterioridad, se conocen los siguientes parmetros:
Nivel de seguridad:
95 %
Potencia estadstica:
80 %
Por tanto, se estima que la frecuencia de exposicin entre los casos vendr dada por:
p1 =
w p2
(1 p ) + w p
2
=
2
4 0, 40
1, 6
=
= 0, 73
(1 0, 40 ) + 4 0, 40 0, 60 + 1, 6
Esto es, se estima que aproximadamente un 73 % de los casos son fumadores. Aplicando la frmula
correspondiente, se obtiene:
n =
( 0, 73 0, 4 )
35
Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del odds ratio de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el odds ratio es aproximadamente igual a 3, se
obtiene:
p1 =
w p2
(1 p ) + w p
2
=
2
3 0, 40
= 0, 67
(1 0, 40 ) + 3 0, 40
y, de acuerdo con la frmula correspondiente, seran necesarios n = 54 pacientes por grupo para llevar a
cabo el estudio.
Ocasionalmente, el investigador rene un nmero mayor de controles que de casos con el objeto de
incrementar el poder estadstico. Supngase que en el presente ejemplo se planea obtener dos controles
por caso, y se asume que el odds ratio a detectar es aproximadamente igual a 3. Aplicando la frmula
correspondiente:
(1,96
n =
( 2 + 1) 0,565 (1 0,565)
+ 0,84 2 0, 73 (1 0, 73) + 0, 4 (1 0, 4 )
2 ( 0, 73 0, 4 )
40
p1 = 0, 40
p = 0, 475
p 2 = 0,55
z 1 =
n = 130
= 0, 05 z 1 = 1, 645
=
p1 p 2
n z 1 2 p (1 p )
p1 (1 p1 ) + p 2 (1 p 2 )
0, 4 0.55
= 0, 467
A partir de la tabla correspondiente (vase Notas), se puede determinar que un valor de z 1 = 0, 467
corresponde a una potencia en torno al 6570 %. Utilizando las tablas de la distribucin normal, se sabe
que la potencia es del 68 %, es decir, el estudio tendra un 68 % de posibilidades de detectar una mejora en
la eficacia del tratamiento del 15 %.