Documente Academic
Documente Profesional
Documente Cultură
Introduccin
Las exigencias en la investigacin actual han creado la necesidad de profundizar en muchos aspectos estadsticos. Es prctica comn pedir a los alumnos de maestra y doctorado
que calculen el tamao de la muestra del estudio que realizan. Para ello deben escoger las
variables que han utilizado para la hiptesis de trabajo y deben diferenciar las variables de
respuesta (dependientes) y las predictoras (independientes).
Para realizar un clculo adecuado del tamao de muestra, el investigador debe
conocer con amplitud las variables que debe analizar. Cada variable tiene su propia
distribucin probabilstica y algunas cuentan con formas muy particulares. Por ejemplo,
las concentraciones en suero de triglicridos y leptina tienen distribuciones sesgadas
a la derecha (consltese el captulo 15, El sesgo en la investigacin) y es comn que la
desviacin estndar tenga un valor muy parecido al promedio respectivo. La transformacin logartmica es muy utilizada con estas variables. Este conocimiento contribuye a
que los clculos se hagan de manera adecuada con los logaritmos y no con las variables
originales.
Estas tcnicas estadsticas para la investigacin se utilizan en casi todas las reas del
conocimiento, con un auge importante en salud. Existen varias razones para seleccionar
una muestra; el objetivo fundamental es hacer inferencias estadsticas (estimaciones de
uno o ms parmetros acerca de una poblacin finita de inters). Esta poblacin es la
que se desea investigar y a la que se le denomina poblacin de inters, poblacin blanco o poblacin diana. Para que la extrapolacin (inferencia estadstica) tenga validez, la
muestra debe ser representativa y la representatividad alude a que el estimador muestral
de las variables de inters debe tener una distribucin con comportamiento similar a las
66
de la poblacin de las que proviene.1 Para cumplir con este supuesto de representatividad
es deseable que la muestra sea probabilstica y para calcular su tamao se deben tomar
en cuenta varios factores: estructura de la hiptesis, error tipo I (error alfa), error tipo II
(error beta), poder estadstico deseado, variabilidad, prdidas en el seguimiento del estudio, diferencia clnicamente significativa y tipo de estudio epidemiolgico utilizado en
determinada investigacin.
Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra
Poblacin
de inters
Muestra
probabilstica
Estimador
muestral
67
Extrapolacin
Parmetro
de la
poblacin
Representatividad:
Distribucin de frecuencias similar
entre la muestra y la poblacin
68
Hiptesis
De acuerdo con el tipo de estudio de investigacin, tal vez sea necesario formular una o
ms hiptesis. Si se trata de un estudio de tipo descriptivo, esto no es necesario, porque
slo se busca una caracterizacin de la poblacin de inters. En cambio, en los estudios de
tipo comparativo, en que se emplean pruebas de significacin estadstica, s es necesario
establecer una o ms hiptesis. Por lo general, en la formulacin de una hiptesis el investigador plantea a priori el posible resultado, mientras que con los estudios descriptivos se
pueden establecer propuestas de hiptesis a posteriori. En ambos casos, es necesario contrastar las hiptesis y determinar si se aceptan o se rechazan. Para realizar este contraste,
las hiptesis toman el nombre de nula (H0) o alternativa (H1). En casi todos los casos, la
hiptesis que el investigador desea probar se plantea en la hiptesis alternativa; es decir, el
investigador espera que se rechace la hiptesis nula (cuadro 7-1).
El tipo de contraste de hiptesis puede ser unilateral (una cola) o bilateral (dos
colas). Una hiptesis unilateral se plantea cuando se especifica la direccin de la asociacin (mayor o menor) de las variables; en la hiptesis bilateral, se puede afirmar la existencia de asociacin entre las variables, pero no se especifica la direccin. Por lo general,
se recomienda que el contraste de hiptesis sea bilateral, porque ofrece la estimacin ms
robusta, a pesar de que el tamao de muestra es ms grande. El contraste unilateral slo
debe utilizarse cuando existe evidencia suficiente para limitar las hiptesis a una direccin
(una cola).2 Aunque esto es posible, la mayora de los revisores de protocolos de investigacin tiene la costumbre de exigir contrastes a dos colas. Cabe mencionar que el valor de
Z de una distribucin normal cambia dependiendo del tipo de contraste de hiptesis. As,
para la probabilidad de aceptada, en un contraste unilateral, se tendra Z y para el bilateral se tendra Z/2. En cuanto al valor correspondiente a la probabilidad de aceptada
en ambos contrastes es Z.6
Error tipo I o error
Cuadro 7-1.
Decisin
Realidad
H0 es cierta
H1 es cierta
Se acepta H0
Se acepta H1
(error tipo I)
Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra
69
pendiendo del nivel de confianza que se quiera para la prueba; el criterio ms usado en la
literatura biomdica consiste en aceptar un riesgo de < 0.05.
Error tipo II o error
A la probabilidad de que se acepte H0 cuando es falsa (H1 es cierta) se le conoce como error
tipo II o error , es decir: P(aceptar H1|H0 es cierta) = . Al igual que con el error tipo I,
cuanto menor sea la probabilidad de cometer el error tipo II mayor debe ser el tamao de
muestra requerido. El valor de tolerable de mayor aceptacin en la comunidad cientfica
va de 0.1 a 0.2; incluso se ha insistido en que el error debe ser igual que el error .
Poder estadstico
Es la dispersin esperada de los datos. La variabilidad se evala dependiendo de la variable de inters. Si stas son continuas, el tamao de muestra est determinado por la
variable con el mayor coeficiente de variacin [CV(Y )=(SY /Y )], donde SY es la desviacin estndar y Y es la media. Cuanto mayor sea el CV, el tamao de muestra es mayor.
Por otra parte, cuando las variables de inters son categricas, debe utilizarse la estimacin de la proporcin que ms se acerque a 0.5. En caso de que existan hiptesis con
ambos tipos de variables, el tamao de muestra se debe calcular de acuerdo con la variable categrica, porque sto garantiza una mayor cantidad de elementos o individuos y,
por tanto, resultados ms robustos.6 Por lo general, la variabilidad se obtiene de estudios
previos reportados o de estudios piloto. Por medio de la estadstica, se ha demostrado
que cuanto ms agrupados estn los valores alrededor de un eje central, la variabilidad
es menor y, por tanto, el tamao de muestra tambin resulta menor.2
Prdidas en el seguimiento del estudio
Durante la realizacin del estudio, puede haber prdidas de los sujetos bajo anlisis por
diversas razones, como retiros del estudio (drop-outs). Por ello, se debe predecir la cantidad
70
esperada de prdidas y contemplar un aumento en el tamao de muestra en esta proporcin, porque el tamao mnimo de muestra necesario para obtener resultados estadsticamente significativos est pensado de acuerdo con el nmero de sujetos al final del estudio
y no en los incluidos al principio.6
Diferencia clnicamente signicativa
La magnitud de la diferencia del efecto que se desea detectar entre los grupos evaluados
es la condicionante ms importante para el clculo del tamao de la muestra. Muchas
veces, la obtencin de una diferencia estadsticamente significativa no resulta clnicamente significativa. Por ejemplo, tal vez exista diferencia estadsticamente significativa
al comparar el efecto de dos medicamentos. El investigador clnico o epidemilogo debe
determinar si la magnitud de esa diferencia es clnicamente relevante, sin importar que
haya resultado estadsticamente significativa. Este criterio es slo clnico. Cuanto mayor
sea la diferencia de esta magnitud, menor es el tamao de muestra requerido; en cambio,
si se desea detectar diferencias pequeas, el tamao de la muestra debe ser mayor. No
obstante, cualquier diferencia de relevancia clnica, tambin debe ser estadsticamente
significativa.
s=
i =1
n 1
/2
Z2 a/2*S 2
Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra
71
n
suele multiplicar por el factor de correccin por finitud 1
, quedando la estimacin
Z2 /2*S 2
= Z
22
p(1 p ) ,
n
Z2 /2* p(1 p)
n
N
mada del parmetro poblacional y Z/2 es el valor del eje de las abscisas de la funcin
normal estndar en donde se acumula la probabilidad de (1 ). En general, el error de
estimacin () se obtiene de una muestra piloto o de estudios anteriores. En caso de que
no se pueda determinar esta proporcin, se toma p = 0.5, porque este valor garantiza el
mayor tamao de muestra. El nivel de confianza (1 )*100 que suele utilizarse en estas
pruebas, por lo general es de 95%. El intervalo de confianza para una proporcin queda
definido como
IC = p = p Z 2 *
p 1 p
).
nc = ne =
2* S 2
* Z 2 * Z
D2
72
La frmula del tamao de muestra para cada uno de los grupos que habr de compararse es
nc = ne =
Z + Z
2
*S2
d2
donde d es el promedio de las diferencias individuales entre los valores basales y posteriores, S2 es la varianza de ambas distribuciones, que se suponen iguales, Z/2 es el valor del
eje de las abscisas de la funcin normal estndar en donde se acumula la probabilidad de
(1 ) para un contraste de hiptesis bilateral y Z es el valor del eje de las abscisas de la
funcin normal estndar, en donde se acumula la probabilidad de (1 ).6
Clculo para el tamao de muestra de la comparacin de dos medias
pareadas (medidas repetidas) en dos grupos distintos de sujetos
Este diseo se utiliza cuando se quiere comparar el cambio entre una medida basal y otra
posterior de dos grupos distintos de sujetos. Es posible que exista una correlacin entre
ambas medidas; en este caso, se corrige por el coeficiente de correlacin (), que, al igual
que la desviacin estndar, se estima a partir de pruebas piloto o de experiencias previas.
La frmula para la estimacin del tamao de muestra de los grupos es
2
nc = ne =
2* Z + Z *(1 )* S 2
| M de M dc |2
donde Mdc es la diferencia entre los valores iniciales y los finales en el grupo de los controles y Mde es la diferencia entre los valores iniciales y finales en el grupo con tratamiento.6
Clculo para estimar el tamao de muestra de la diferencia de dos proporciones
p1 (1 p1 ) + p2 (1 p2 )
(p p )
1
* Z 2 + Z
Cuando se tiene una tabla de contingencia de dos por dos y las condiciones se cumplen
para aplicar una prueba 2, se puede utilizar esta aproximacin para el clculo del tamao
Enfoque prctico de los elementos necesarios para la estimacin del tamao de la muestra
73
de la muestra de la comparacin de proporciones independientes. Siguiendo este planteamiento, la frmula que Marragat y colaboradores proponen para la diferencia de proporciones independientes es
nc = ne =
* 2* P * Q + Z * Pc * Qc + Pe * Qe
( Pe Pc )2
En este caso, la frmula para el clculo del tamao de muestra del grupo control y del
expuesto es
2
Pc * Qc * Z 2 + Z
nc = ne =
2
( Pc Pe )
donde Pc es la estimacin de la proporcin de eventos de inters en el grupo control,
Qc = 1 Pc y Pe es la proporcin de eventos de inters en el grupo tratado, Z/2 es el valor
del eje de las abscisas de la funcin normal estndar en dnde se acumula la probabilidad
de (1 ) para un contraste de hiptesis bilateral y Z es el valor del eje de las abscisas de
la funcin normal estndar en dnde se acumula la probabilidad de (1 ).6
En la actualidad, con el uso de internet se facilita la obtencin del tamao de muestra
empleando programas en lnea u otros que se descargan. La diversidad es tal que se puede obtener el tamao especfico de una muestra para el diseo de experimentos y de los
factores determinantes para el tamao de muestra. Entre los programas ms usuales en
la epidemiologa estn EPIDAT, GPOWER y EPIINFO, que pueden obtenerse sin costo.
Referencias
1.
2.
Cid Cid A.I., Delgado Manrquez C.A., Leguey Galn S. Muestreo en poblaciones nitas. En:
Leguey Galn S (coord). Introduccin al muestreo en poblaciones nitas. Madrid, Espaa: ENE,
Nuevas estructuras, 1999.
Prez Medina A., Gmez Restrepo C., Snchez Pedraza R., Dennis R., Ruiz Morales A. Seleccin de la muestra y factores determinantes para el clculo de su tamao. En: Ruiz Morales
A., Gmez Restrepo C., Lendoo Trujillo D. (ed). Investigacin clnica: Epidemiologa clnica
aplicada. Bogot, Colombia: Centro Editorial Javeriano, ceja, 2001.
74
3.
4.
5.
6.
7.
Mndez Ramrez I., Eslava Gmez G., Romero Mares P. Conceptos bsicos de muestreo (serie monogrca), Mxico, D.F.: Instituto de Investigaciones en Matemticas Aplicadas y en Sistemas,
Universidad Nacional Autnoma de Mxico, 2004, Vol 12, Nm. 27.
Martnez Bencardino C. Estadstica y muestreo, 12a. ed. Bogot, Colombia: Ecoe Ediciones, 2005.
Cochran W.G. Sampling Techniques, 3a. ed. Nueva York: John Wiley & Sons, 1977.
Marrugat J., Vila J., Pavesi M., Sanz F. Estimacin del tamao de muestra en la investigacin clnica y epidemiolgica, Unidad de Lpidos y Epidemiologa Cardiovascular. Barcelona, Espaa:
Instituto Municipal de Investigacin Mdica (imim), Medicina Clnica, 1998;111:267-276.
Henneckens C.H., Mayrent S.L. Epidemiology in Medicine. Boston: Little Brown and Company, 1987.