Sunteți pe pagina 1din 10

Problemas resueltos de Bioestadstica

1. Se realiz un estudio de caso control para determinar si la fractura de colles se


asociaba con la osteoporosis. En el estudio se incluyeron 94 mujeres con fractura
de colles confirmada y 272 controles. Mediante criterios de densitometra (DXA)
se encontr que en las 94 fracturadas, 45 tenan osteoporosis mientras que en las
272 controles haba 121 con osteoporosis. Sean
E
y
C
las prevalencias de
osteoporosis en los grupos de casos (E) y controles (C) respectivamente.
Estimarlas mediante un intervalo de confianza al 95%.
Estimar =
E
/
C
mediante un intervalo de confianza al 95% e
interpretar el resultado.

Solucin:

a. El intervalo de confianza para una proporcin es, como se ha visto:
( ) ( )
2 2
1 ; 1
n n
z n z n


(
+


Las estimaciones de la prevalencia en los grupos de casos y controles son:
121 45
0.445 0.479
272 94
C E
= = = =
y los intervalos de confianza al 95%:


[ ] [ ] 0.445 1.65 0.445 0.555/ 272 0.445 0.05 0.395, 0.495
C

(
= =


[ ] [ ] 0.479 1.65 0.479 0.521/ 94 0.479 0.085 0.393, 0.564
E

(
= =



b. El valor estimado del cociente de proporciones es:
0.479
1.076
0.445
= =
y su logaritmo: ( )
log 0.074 = . El intervalo de confianza al 95% para el logaritmo
del cociente de proporciones es:
[ ] [ ]
1 2
2
1 1 1 2
1 1 0.555 0.521
log 0.074 1.96
0.445 272 0.479 94
0.074 0.249 0.175, 0.323
z
n n


( (

+ = + =
( (


= =

Mediante la exponenciacin (transformacin inversa del log) se obtiene el intervalo
de confianza para :
[ ] 0.839,1.381
Este intervalo nos indica que, con una confianza del 95%, el verdadero valor del
cociente de proporciones est en este intervalo; no es descartable, por tanto, que el
cociente sea 1, y que ambas proporciones sean iguales; esto es, no puede asegurarse
que la prevalencia de osteoporosis sea diferente entre casos y controles.

2. El siguiente diagrama de cajas y barras corresponde al mismo estudio del
ejercicio anterior y resume las determinaciones de la DXA en los grupos de casos
y controles.



En el siguiente cuadro se resume el marcador por grupo de estudio.

Hallar un intervalo de confianza al 95% para la diferencia de medias e
interpretarlo (el diagrama de cajas permite aceptar la normalidad del marcador
en cada grupo de estudio).

El intervalo de confianza para la diferencia de medias es de la forma:
( )
1 2 2 1 2
1 2
1 1
2
p
X X t n n S
n n

(
+ +
(


Sustituyendo los valores obtenidos en el estudio:
( )
[ ] [ ] [ ]
0.025
1 1
0.80215 0.85230 93 274 2 0.16988
93 274
0.05015 1.96 0.02039 0.05015 0.03996 0.09011, 0.01019
CASOS CONTR
t
(
+ + =
(

= = =

donde hemos calculado s
p
mediante:
( ) ( )
1 2
2
2
1, 1 2, 2
1 1 2
1 2
2
n n
j j
j j
p
X X X X
S
n n
= =
+
= =
+


( )
( )
( )
( )
1 2
2 2
1, 1 2, 2
1 1
1 2
1 2 1 2
1
1 1
2 1 1
n n
j j
j j
X X X X
n n
n n n n
= =




= + =
`
+


)


( ) ( ) { } ( ) ( )
{ }
2 2
2 2
1 1 2 2
1 2
1 1
1 1 92 0.158351 273 0.173593
2 93 274 2
0.028859 0.16988
p
n s n s
n n
s
= + = + =
+ +
= =


Por tanto, con una confianza del 95% podemos asegurar que el valor medio del marcador
DXA es entre 0,09011 y 0,01019 unidades menor en casos que en controles.




3. Hallar el tamao muestral necesario para estimar una prevalencia con cotas de
error del 1%, 5% y 10%.

Tal como se ha visto, el tamao muestral para estimar una proporcin (prevalencia), cuando
no se tiene ningn conocimiento del valor de la misma, viene dado por:
( )
2 2
/ 2
4 n z

=
Si se desea realizar la estimacin con un nivel de confianza del 95%, entonces 1- = 0.95,
por lo que /2=0.025, y en la tabla de la distribucin normal z
/2
= 1.96. Por tanto, para:
Error del 1% (=0.01):
( ) ( )
2 2 2 2
/ 2
4 1.96 / 4 0.01 9604 n z

= = =
Error del 5% (=0.05):
( ) ( )
2 2 2 2
/ 2
4 1.96 / 4 0.05 384 n z

= = =
Error del 10% (=0.10):
( ) ( )
2 2 2 2
/ 2
4 1.96 / 4 0.10 96 n z

= = =

Ntese que para conseguir disminuir el error a la mitad, del 10% al 5%, el tamao de la
muestra ha tenido que aumentar 4 veces (de 96 a 384); asimismo, para disminuir el error a
la quinta parte, del 5% al 1%, el tamao de la muestra debe aumentar 25 veces (de 384 a
9604)




4. Se desea evaluar la eficacia de un tratamiento experimental para una
enfermedad comparando su tasa de respuestas favorables (desconocida) con la
correspondiente al tratamiento estndar
0
(conocida). Se conjetura que el
nuevo tratamiento puede elevar la tasa de respuestas (
0
> ). Habr pues que
contrastar la hiptesis nula
0 0
: H = frente a la alternativa
1 0
: H > . Para tal
fin se aplica el nuevo tratamiento a una muestra aleatoria de n pacientes y se
observan las respuestas
1
, ,
n
X X = X , donde X
i
es uno o cero segn el i-simo
sujeto haya o no presentado respuesta favorable. Sea el test estadstico
1
n
n i
i
T X
=
=

(nmero de respuestas favorables) y la regla de decisin: rechazar
H
0
si
n
T C > y aceptar en caso contrario. Para un nivel de significacin y
potencia 1 para una alternativa especificada
1
, determinar los valores de n
y C.

Solucin:

Para el nuevo tratamiento, la variable X
i
, que mide la respuesta del paciente i, tiene
distribucin b(1,). Por tanto
1
n
n i
i
T X
=
=

tendr distribucin b(n,). Entonces:
( ) ( )
( ) ( )
0 0 0
0 0 1
Rechazar cierta
1 Rechazar falsa
n
n
P H H P T C
P H H P T C


= = > =
= = > =

Si suponemos que n es relativamente grande (cosa que deber ocurrir si deseamos realizar
el contraste con una buena potencia), entonces:
( )
( )
( )
( ) , 1 0,1
1
T np
T N np np p N
np p


donde p=
0
si H
0
es cierta y p=
1
si H
0
es falsa. Por tanto:
( )
( ) ( ) ( )
( )
0 0 0
0
0 0 0 0 0 0
0
0 0
1 1 1
1
n
n
T n C n C n
P T C P P Z
n n n
C n
z
n


| | | |

| |
= > = = > = >
| |

\ \


De modo anlogo:
( ) ( )
1 1
1
1 1 1 1
1
1 1
C n C n
P Z z z
n n



| |

|
= > = =
|

\

Despejamos C en ambas ecuaciones:
( ) ( )
0 0 0 1 1 1
1 1 C n z n C n z n

= + =
e igualando y despejando n:
( ) ( )
( ) ( ) ( )
0 0 0 1 1 1
0 0 1 1 1 0
1 1
1 1
n z n n z n
z n z n n




+ =
+ =

( ) ( )
( )
( )
( ) ( )
( )
( )
0 0 1 1 1 0
0 0 1 1
1 0
1 1
1 1
n z z n
z z
n
n
n





+ =
+
= =


( ) ( )
2
0 0 1 1
1 0
1 1 z z
n



| |
+
|
=
|
\

Sustituyendo este valor de n en la primera de las dos ecuaciones para C anteriores,
obtenemos el valor de C (el resultado sera idntico si sustituyramos en la segunda):
( ) ( )
( )
( ) ( ) ( ) ( )
( )
( ) ( ) ( ) ( )
( ) ( ) ( )
0 0 0 0 0 0
0 0 1 1 0 0 1 1
0 0 0
1 0 1 0
0 0 1 1 1 0 0 0 1 1
1 0 1 0
2 2
0 1 0 1
1 1
1 1 1 1
1
1 1 1 1
1 1
C n z n n n z
z z z z
z
z z z z
z z z










= + = + =
( | | | |
+ +
( | |
= + =
| | (
\ \
| || |
+ +
| |
= =
| |
\ \
+ +
=
( ) ( ) ( )
( )
0 1 0 0 1 1
2
1 0
1 1 z






5. Se sabe que con un frmaco estndar, la tasa de respuestas favorables es
1
. Se
piensa que con un frmaco experimental la tasa es
2
y se desea contrastar si
0 1 2
: H = frente a
1 1 2
: H . Para tal fin se toma una muestra aleatoria de
200 pacientes, de los cuales, 100 son asignados al tratamiento estndar y 100 al
experimental. Los datos obtenidos se resumen en la siguiente tabla de
contingencia:

Remisin
Tratamiento
Si No
Experimental 62 38
Estndar 43 57

(a) Hallar estimaciones puntuales para
1
y
2
.
(b) Contrastar
0 1 2
: H = frente a
1 1 2
: H y dar el p-valor del contraste

Solucin:
(a)
1
2
43/100 0.43
62/100 0.62

= =
= =

(b) Utilizamos el test de la
2
. Para ello primero completamos los totales de la tabla:

Remisin
Tratamiento
Si No Totales
Experimental 62 38 100
Estndar 43 57 100
Totales 105 95 200

Ahora calculamos las frecuencias esperadas si H
0
es cierta:

Remisin
Tratamiento
Si No Totales
Experimental 105 100/ 200 =
52.5
95 100 / 200 =
47.5
100
Estndar 105 100/ 200 =
52.5
95 100 / 200 =
47.5
100
Totales 105 95 200

Y por ltimo calculamos el valor del estadstico J
2
:

( ) ( ) ( ) ( )
2 2 2 2
2
62 52.5 43 52.5 38 47.5 57 47.5
7, 238
52.5 52.5 47.5 47.5
J

= + + + =

En la tabla de la
2
vemos que
( )
2
1
6.635 0.01 P > = y que
( )
2
1
7.879 0.005 P > = .
Por tanto el p-valor del contraste es
( )
2
1
7.238 0.01 P > < , de donde se sigue que el
contraste es significativo.


6. Los elevados valores de la lipoprotena de baja densidad (LDL) representan un
notable riesgo de patologa cardiovascular. Se piensa que la sustitucin de la
grasa animal de la leche por grasa vegetal puede disminuir los valores del LDL. En
orden a evaluar esta hiptesis para una poblacin infantil, se dise un estudio
en el cual, tras un periodo de lavado con placebo, 49 nios se alimentaron
durante un periodo de seis meses con leche entera (grasa animal) y 54 con un
preparado lcteo, el cual consista en sustituir la grasa animal por grasa vegetal.
Finalizado el periodo de tratamiento, se determinaron los valores de la LDL, los
cuales se resumen en el siguiente cuadro
49 111,506 23,50472
54 94,0704 22,82548
Leche
Entera
Vegetal
LDL
N Media
Desviacin
tp.

(c) Contrastar la igualdad de varianzas.
(d) Contrastar la igualdad de medias mediante el t-test dando el
correspondiente p-valor. Puede concluirse que la sustitucin de la grasa
animal por grasa vegetal disminuye el nivel de la LDL?.

Solucin:

(a) Para contrastar la igualdad de varianzas utilizaremos el test estadstico
2 2
1 2
F S S = ,
que en este caso da como resultado: F = (23.50472)
2
/(22.82548)
2
= 1.060. La regla
de decisin a aplicar es Aceptar la hiptesis nula H
0
si
1 2 1 2 2 1 2
( 1, 1) ( 1, 1) f n n F f n n


y rechazarla en caso contrario. Con los datos disponibles:
( )
( )
( )
1 2 1 2 0.975
0.025
2 1 2 0.025
1 1
( 1, 1) 48, 53 0.57
53, 48 1.75
( 1, 1) 48, 53 1.73
f n n f
f
f n n f

= = =
=


Como el valor de F est comprendido entre estos dos valores, se acepta H
0
(no
existe evidencia de que las varianzas sean distintas).
(b) Hemos de realizar el contraste:
0
1
:
:
ENT VEG
ENT VEG
H
H


=

>



Utilizaremos el estadstico:
1 1
A B
p A B
Y Y
T
S n n

=
+
i i

donde A es el grupo que ha utilizado leche entera y B el que ha usado leche con
grasa vegetal. En primer lugar calculamos:
( ) ( ) { }
( ) ( )
{ }
2 2 2
2 2
1
1 1
2
1
48 23.50472 53 22.82548 535.95826 23.15077
49 54 2
p A A B B
A B
p
S n s n s
n n
s
= + =
+
= + = =
+

El valor del test estadstico es entonces:
111.506 94.0704
3.8172
1 1 23.15077 1 49 1 54
A B
p A B
Y Y
T
S n n

= = =
+ +
i i

En la tabla de la t de Student con n
A
+ n
B
-2 = 101 grados de libertad (aproximamos
a 100 ya que 101 no est en la tabla), encontramos que ( )
101
3.174 0.001 P T > = , por
lo que el p-valor = ( )
101
3.8172 0.001 P T > < . Por tanto existe evidencia suficiente
para rechazar la hiptesis nula y concluir que la leche con grasa vegetal disminuye
el nivel medio de LDL.



7. El efecto de los estrgenos sobre los niveles lipdicos hace pensar que en
transexuales (hombre-mujer) que han recibido tratamiento con estrgenos podra
tambin producirse una disminucin es estas variables. En un estudio de caso-
control se determinaron los niveles lipdicos de transexuales y de varones que
nunca han recibido estrgenos, los cuales se resumen en la siguiente tabla:

Media (SD) Lpido
Transexuales Controles
p-valor
Apo-A 111.8 (35.3) 147.6 (22.3) 0.005
Apo-B 85.9 (28.3) 106.3 (22.0) 0.050
Colesterol total 184.2 (40.8) 222.3 (32.6) 0.002
HDL 46.0 (14.3) 49.1 (9.8) 0.446
LDL 113.7 (30.4) 145.5 (28.7) 0.003
Triglicridos 114.6 (55.4) 105.4 (58.0) 0.616

Evidencian estos datos que el tratamiento con estrgenos en varones produce
una disminucin en los niveles lipdicos?. En caso afirmativo, en que variable se
produce la disminucin?.


Utilizaremos el contraste de Newman-Keuls para comparaciones mltiples. Eligiendo como
nivel de significacin global
G
= 0.05, para realizar las seis comparaciones elegimos en
primer lugar como nivel de significacin penalizado para cada comparacin el valor =
0.05/6 = 0.0083. Para este nivel resultan significativas las disminuciones detectadas en
Apo-A, Colesterol total y LDL. Quedan tres diferencias no significativas. Volvemos a
reajustar el nivel de significacin para estas tres diferencias tomando ahora = 0.05/3 =
0.0166. Como los tres p-valores restantes son todos mayores que concluimos que estas
diferencias no son globalmente significativas.

S-ar putea să vă placă și