Sunteți pe pagina 1din 7

ANALISIS CUALITATIVOS

Ejercicios resueltos
1. Para estudiar la asociacin entre la raza y la imposicin de pena de muerte a individuos culpables de
homicidio se llev a cabo un estudio sobre 326 individuos culpables de homicidio en Florida durante 19761977. Los datos observados para las variables veredicto de pena de muerte (si, no) y raza del acusado
(blanca, negra) figuran en la tabla I:

pena de muerte
raza blanca
raza negra

si

no

19
17

141
149
Tabla I.

Solucin:
El cociente de ventajas muestral es:

19 149
=
= 1,18
17 141
Esta estimacin puntual significa que en la muestra la probabilidad estimada de ser condenado a muerte en
lugar de no serlo es 1,18 veces mayor para una persona de raza blanca que para una de raza negra.
Para poder inferir este resultado a la poblacin se construye un intervalo de confianza sobre al nivel 0,95.

= 0,166 cuyo error estndar estimado es:


Para ello se calcula ln

( )

1
1
1
1
+
+
+
= 0,354
19 141 17 149
Por lo tanto, un intervalo de confianza al nivel 0.95 para ln es:
ln =

0,166 1,96 0,354


de modo que el intervalo:

(e

0,527

, e0,860 ) = ( 0,5902 , 2,3633)

es un intervalo de confianza aproximado al nivel 0,95 para . Dado que este intervalo contiene al valor
= 1 de independencia, los datos no son significativos para concluir que los acusados de raza blanca y los
de raza negra tienen distinta probabilidad de recibir pena de muerte.
La Q de Yule muestral se obtiene como:

19 149 14117
= 0, 00830
Q =
19 149 + 14117
Para construir un intervalo de confianza sobre Q al nivel 0,95 se estima su error estndar asinttico

( )

Q = 0,17578 . Entonces el intervalo de confianza es:


0, 00830 1,96 0,17578
que contiene al valor Q = 0 de independencia.

( 0, 2615 , 0, 4275 )

2. Con el fin de estudiar la relacin entre la opinin sobre la legalizacin de las drogas y el nivel de estudios
se dispone de los datos de la siguiente tabla. La opinin respecto a la legalizacin de las drogas se clasifica
en tres categoras: D (desaprobacin), M (aprobacin moderada) y A (aprobacin general). El nivel de
estudios se clasifica tambin en tres niveles: EP (estudios primarios), EM (estudios medios) y EU
(estudios universitarios).

EP
EM
EU
total

total

209
151
16
376

101
126
21
248

237
426
138
801

547
703
175
1425

Tabla II. Asociacin opinin respecto a las drogas nivel de estudios.


Solucin:
Se propone estudiar la asociacin entre la actitud respecto a legalizar las drogas y el nivel de estudios
mediante los cocientes de ventajas locales que tienen en cuenta su naturaleza ordinal.
En primer lugar se contrastar la independencia mediante los contrastes y de razn de verosimilitudes
que pueden ser aplicados ya que la mnima frecuencia esperada bajo independencia es 30,46. Los valores
observados de estos estadsticos son:
2

2observada = 93, 034

G 2observada = 96,527
Para ambos sus valores p que corresponden a la probabilidad acumulada a su derecha por una 4 son
2

exactamente cero. Esto lleva a rechazar la hiptesis nula de independencia con cualquier nivel de
significacin.
Los valores estimados de las medidas de asociacin basadas en son:
2

= 0, 256
C = 0, 248
V = 0,181
Obsrvese que el grado de asociacin global estimado con estas medidas es muy pequeo.
Como ambas variables son ordinales se procede a estimar la asociacin mediante la medida gamma. El
nmero de pares concordantes es el siguiente:

C = 209 (126 + 426 + 21 + 138 ) + 101( 426 + 138 ) + 151( 21 + 138 ) + 126 138
= 246960
Anlogamente, el nmero de pares discordantes es:

D = 101( 51 + 16 ) + 237 (151 + 126 + 16 + 21) + 126 16 + 426 (16 + 21)


= 109063
Como consecuencia el valor muestral de la medida gamma es = 0,3873 . Su error estndar estimado

( ) = 0, 037 , permite construir el intervalo de confianza al nivel 0,95 dado por (0,31448 , 0,45952).
Obsrvese que el valor estimado es muy preciso dado que el intervalo de confianza es estrecho de modo
que se puede concluir, en base al signo positivo de esta medida, que existe cierto grado de monotona
creciente en la asociacin. Esto significa que la probabilidad de estar a favor de la legalizacin de las drogas
aumenta con el nivel de estudios.

3. Se desea comparar los registros que dos observadores han obtenido a lo largo de una sesin. Nos
interesa conocer cul es la fiabilidad entre los registros de estos dos observadores:

observador 2
B
C
D

A
A
B
C
D

observador 1

191
83
59
91
424

97
123
76
78
374

65
88
161
65
379

88
73
39
144
344

441
367
335
378
1521

Tabla III.
Solucin:
Se calcula el valor del ndice kappa ( ) a partir de la frmula general:
k

ni i
i =1

n
i =1

n
i =1

i+

i+

n+ j

n+ j

Se calcula la proporcin de concordancia observada y la proporcin de concordancia aleatoria. En el caso


de la proporcin de concordancia observada interesan las casillas que tienen los mismos subndices, donde
coinciden los registros de los dos observadores:
k

n
i =1

ii

n
i =1

ii

f ++

191 + 123 + 161 + 144


= 0, 41
1521

Para conocer el efecto de las respuestas aleatorias de los observadores se calcula la proporcin de
concordancia aleatoria utilizando para ello los marginales de la matriz de confusin:
k

n
i =1

i+

n+ j =

n
i =1

i+

n+ j

2
++

( 441 424 ) + ( 367 374 ) + ( 335 379 ) + ( 378 344 )


15212

= 0, 25

Una vez conocidas las dos proporciones se sustituye en la forma general del ndice y se tiene:

0, 41 0, 25
= 0, 21
1 0, 25

4. Supngase que en una determinada poblacin se desea averiguar si existen diferencias en la prevalencia
de obesidad entre hombres y mujeres o si, por el contrario, el porcentaje de obesos no vara entre sexos.
Tras ser observada una muestra de 14 sujetos se obtuvieron los resultados que se muestran en la tabla IV:

sexo
hombres
mujeres
total

obesidad s

obesidad no

total

7 (a)
1 (c)
8 (a+c)

2 (b)
4 (d)
6 (b+d)

9 (a+b)
5 (c+d)
14 (n)

Tabla IV. Tabla de contingencia para estudiar las diferencias en la prevalencia de obesidad entre sexos.
Estudio de prevalencia sobre 14 sujetos.

Solucin:
En esta tabla, la frecuencia esperada en tres de las cuatro celdas es menor de 5, por lo que no resulta
adecuado aplicar el test , aunque s el test exacto de Fisher. Si las variables sexo y obesidad fuesen
independientes, la probabilidad asociada a los datos que han sido observados vendra dada por:
2

p =

( a + b )! ( c + d )! ( a + c )! ( b + d )!
n! a ! b! c! d !

9! 5! 8! 6!
= 0, 0599
14! 7! 2! 1! 4!

Las siguientes tablas (V a X) muestran todas las posibles combinaciones de frecuencias que se podran
obtener con los mismos totales marginales que en la tabla IV. Para cada una de ellas, se ha calculado la
probabilidad exacta de ocurrencia bajo la hiptesis nula, segn la frmula general mencionada
anteriormente. Los resultados obtenidos se muestran en la tabla XI. El valor de la p asociado al test exacto
de Fisher puede entonces calcularse sumando las probabilidades de las tablas que resultan ser menores o
iguales a la probabilidad de la tabla que ha sido observada:

Tabla V obesidad si obesidad no


8
1
hombres
0
5
mujeres
8

Tabla VI obesidad si obesidad no


7
2
hombres
1
4
mujeres
8

Tabla VII obesidad si obesidad no


6
3
hombres
2
3
mujeres
8

Tabla VIII obesidad si obesidad no


5
4
hombres
3
2
mujeres
8

Tabla IX obesidad si obesidad no


4
5
hombres
4
1
mujeres
8

Tabla X obesidad si obesidad no


3
6
hombres
5
0
mujeres
8

9
5
14

9
5
14

9
5
14

9
5
14

9
5
14

9
5
14

p = 0, 0030 + 0, 0599 + 0, 0280 = 0, 0909

[1]

V
VI
VII
VIII
IX
X

8
7
6
5
4
3

1
2
3
4
5
6

0
1
2
3
4
5

5
4
3
2
1
0

0,0030
0,0599
0,2797
0,4196
0,2098
0,2080

Tabla XI. Probabilidad exacta asociada con cada una de las disposiciones de frecuencias de la tabla IX.
Otro modo de calcular el valor de p correspondiente consistira en sumar las probabilidades asociadas a
aquellas tablas que fuesen ms favorables a la hiptesis alternativa que los datos observados. Es decir,
aquellas situaciones en las que la diferencia en la prevalencia de obesidad entre hombres y mujeres fuese
mayor que la observada en la realidad. En el ejemplo, slo existe una tabla ms extrema que la
correspondiente a los datos observados (aquella en la que no se observa ninguna mujer obesa), de forma
que:

p = 0, 0030 + 0, 0599 = 0, 0629

[2]

Este sera el valor de la p correspondiente a un planteamiento unilateral. En este caso la hiptesis a


contrastar sera que la prevalencia de obesidad es igual en hombres y mujeres, frente a la alternativa de
que fuese mayor en los varones. Cuando el planteamiento se hace con una perspectiva bilateral, la
hiptesis alternativa consiste en asumir que existen diferencias en la prevalencia de obesidad entre sexos,
pero sin especificar de antemano en qu sentido se producen dichas diferencias. Para obtener el valor de la
p correspondiente a la alternativa bilateral se debera multiplicar el valor obtenido en [2] por 2:

p = 2 0, 0629

[3]

Como se puede observar, las dos formas de clculo propuestas no tienen por qu proporcionar
necesariamente los mismos resultados. El primer mtodo siempre resultar en un valor de p menor o igual
al del segundo mtodo. Si se recurre a un programa estadstico como el SPSS para el cmputo del test,
ste utilizar la primera va para obtener el valor p correspondiente a la alternativa bilateral y el segundo
mtodo de clculo para el valor de p asociado a un planteamiento unilateral. En cualquier caso, y a la vista
de los resultados, no existe evidencia estadstica de asociacin entre el sexo y el hecho de ser obeso en la
poblacin de estudio.
5. Supngase que se desea estudiar la existencia de una asociacin entre el consumo de tabaco y el hecho
de sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar su magnitud se
disea un estudio de casos y controles en el que se investigar el consumo de tabaco de una serie de
pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles). Se
cree que alrededor de un 40 % de los controles son fumadores y se considera como diferencia importante
entre ambos grupos un odds ratio de 4. Con estos datos, se puede calcular el tamao de muestra necesario
en cada grupo para detectar un odds ratio de 4 como significativamente diferente de 1 con una seguridad
del 95 % y una potencia del 80 %.
Solucin:
De acuerdo con lo expuesto con anterioridad, se conocen los siguientes parmetros:

Frecuencia de exposicin entre los controles: 40 %

Odds ratio previsto:

Nivel de seguridad:

95 %

Potencia estadstica:
80 %
Por tanto, se estima que la frecuencia de exposicin entre los casos vendr dada por:

p1 =

w p2

(1 p ) + w p
2

=
2

4 0, 40
1, 6
=
= 0, 73
(1 0, 40 ) + 4 0, 40 0, 60 + 1, 6

Esto es, se estima que aproximadamente un 73 % de los casos son fumadores. Aplicando la frmula
correspondiente, se obtiene:

n =

1,96 2 0,565 (1 0,565 ) + 0,84 0, 73 (1 0, 73) + 0, 4 (1 0, 4 )

( 0, 73 0, 4 )

35

Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del odds ratio de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el odds ratio es aproximadamente igual a 3, se
obtiene:

p1 =

w p2

(1 p ) + w p
2

=
2

3 0, 40
= 0, 67
(1 0, 40 ) + 3 0, 40

y, de acuerdo con la frmula correspondiente, seran necesarios n = 54 pacientes por grupo para llevar a
cabo el estudio.
Ocasionalmente, el investigador rene un nmero mayor de controles que de casos con el objeto de
incrementar el poder estadstico. Supngase que en el presente ejemplo se planea obtener dos controles
por caso, y se asume que el odds ratio a detectar es aproximadamente igual a 3. Aplicando la frmula
correspondiente:

(1,96
n =

( 2 + 1) 0,565 (1 0,565)

+ 0,84 2 0, 73 (1 0, 73) + 0, 4 (1 0, 4 )

2 ( 0, 73 0, 4 )

40

Por tanto, se necesitara un grupo de n = 40 casos (pacientes con infarto de miocardio) y m = 2 40 = 80


controles para llevar a cabo la investigacin.
6. Supngase que se quiere llevar a cabo un ensayo clnico para comparar la efectividad de un nuevo
frmaco con la de otro estndar en el tratamiento de una determinada enfermedad. Al inicio del estudio, se
sabe que la eficacia del tratamiento habitual est en torno al 40 %, y se espera que con el nuevo frmaco la
eficacia aumente al menos en un 15 %. El estudio se dise para que tuviese un poder del 80 %,
asumiendo una seguridad del 95 %. Esto implica que son necesarios 173 pacientes en cada uno de los
grupos para llevar a cabo la investigacin. Tras finalizar el estudio, slo fue posible tratar con cada uno de
los frmacos a 130 pacientes en cada grupo en lugar de los 173 pacientes estimados inicialmente. Al
realizar el anlisis estadstico, se objetiv que no hay diferencias significativas en la efectividad de ambos
tratamientos.
Solucin:
A partir de la frmula correspondiente (vase Notas), se puede calcular cul ha sido finalmente la potencia
del estudio. Aplicando la frmula para el clculo de la potencia estadstica de comparacin de dos
proporciones ante un planteamiento unilateral se obtiene:

p1 = 0, 40
p = 0, 475
p 2 = 0,55

z 1 =
n = 130

= 0, 05 z 1 = 1, 645
=

p1 p 2

n z 1 2 p (1 p )

p1 (1 p1 ) + p 2 (1 p 2 )
0, 4 0.55

130 1, 645 2 0, 475 (1 0, 475 )


0, 4 (1 0, 4 ) + 0,55 (1 0,55 )

= 0, 467

A partir de la tabla correspondiente (vase Notas), se puede determinar que un valor de z 1 = 0, 467
corresponde a una potencia en torno al 6570 %. Utilizando las tablas de la distribucin normal, se sabe
que la potencia es del 68 %, es decir, el estudio tendra un 68 % de posibilidades de detectar una mejora en
la eficacia del tratamiento del 15 %.

S-ar putea să vă placă și