Documente Academic
Documente Profesional
Documente Cultură
www.elsevier.es
PALABRAS CLAVE
Tamao
de
muestra;
clculo; error estadstico;
investigacin en educacin
mdica; Mxico.
Resumen
Un aspecto importante en la metodologa de la investigacin, es el clculo de la cantidad de
participantes que deben incluirse en un estudio. El tamao de muestra permite a los investigadores saber cuntos individuos son necesarios estudiar, para poder estimar un parmetro
GHWHUPLQDGRFRQHOJUDGRGHFRQDQ]DGHVHDGRRHOQ~PHURQHFHVDULRSDUDSRGHUGHWHFWDU
una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente.
El clculo del tamao de la muestra es una funcin matemtica que expresa la relacin entre
las variables, cantidad de participantes y poder estadstico.
La muestra de un estudio debe ser representativa de la poblacin de inters. El objetivo principal de seleccionarla es hacer inferencias estadsticas acerca de la poblacin de la que
proviene. La seleccin debe ser probabilstica.
Los factores estadsticos que determinan el tamao de la muestra son: hiptesis, error alfa,
error beta, poder estadstico, variabilidad, prdidas en el estudio y el tamao del efecto.
6HUHYLVDQODVIyUPXODVXWLOL]DGDVSDUDHOFiOFXORGHOWDPDxRGHODPXHVWUDHQODVVLWXDFLRQHV
ms frecuentes en investigacin, as como la revisin de frmulas para un clculo ms rpido. Se incluyen ejemplos de investigacin en educacin mdica. Tambin se revisan aspectos
importantes como: tamao de la muestra para estudios piloto, estrategias para disminuir el
Q~PHURQHFHVDULRGHVXMHWRV\software para el clculo del tamao de muestra.
KEYWORDS
6DPSOH VL]H FDOFXODWLRQ
population;
statistical
error; research in medical
education; Mexico.
Correspondencia: Jos Antonio Garca Garca. Dr. Balmis N 148, Colonia Doctores, Delegacin Cuauhtmoc, C.P. 06726, Mxico
D.F., Mxico. Telfonos: 5004 3842, 5004 3843. Conmutador: 2789 2000, ext. 1164. Correo electrnico: drjagarcia2@prodigy.net.mx
ISSN - see front matter 2013 Facultad de Medicina Universidad Nacional Autnoma de Mxico. Publicado por Elsevier Mxico. Todos los derechos reservados.
218
Garca-Garca JA et al
know how many individuals it is necessary to study in order to estimate a parameter with the
desired degree of condence, or the number needed in order to detect a certain difference
between the study groups, assuming that exist actually.
The calculation of the sample size is a mathematical function that expresses the relationship
between the variables, amount of participants and statistical power.
A sample from a study should be representative of the population of interest. The main goal
of selecting a sample is to make statistical inferences about the population from which comes
from. The selection must be probabilistic.
Statistical factors that determine the sample size are: assumptions, error alpha, beta error,
statistical power, and variability, losses in the study and size effect.
We review the formulas used for calculating the sample size in the most common situations
in research, as well as the revision of formulas for a faster calculation.
Its included examples of research in medical education.
Also reviewed are important issues such as: sample size for pilot studies, strategies to reduce
the required number of subjects, and software for the sample size calculation.
Introduccin
Un aspecto relevante en la metodologa de la investigacin, es la estimacin o clculo de la cantidad de participantes que deben incluirse en un estudio. La primera
UHH[LyQ TXH VXUJH HV SDUD TXp VLUYH HO FiOFXOR GHO WDmao de la muestra? Permite a los investigadores saber
cuntos individuos son necesarios estudiar, para estimar
XQSDUiPHWURGHWHUPLQDGRFRQHOJUDGRGHFRQDQ]DGHVHDGRRHOQ~PHURQHFHVDULRSDUDGHWHFWDUXQDGHWHUPLnada diferencia entre los grupos de estudio, suponiendo
que existiese realmente.
/D LQFOXVLyQ GH XQ Q~PHUR H[FHVLYR GH VXMHWRV HQcarece el estudio en varios aspectos. Un estudio con un
WDPDxRLQVXFLHQWHGHODPXHVWUDHVWLPDUiXQSDUiPHWUR
FRQSRFDSUHFLVLyQRVHUiLQFDSD]GHGHWHFWDUGLIHUHQFLDV
entre los grupos, conduciendo a conclusiones errneas.
En este documento se revisan los aspectos sobresaOLHQWHV GHO WHPD LQFOX\HQGR ORV PDWHPiWLFRV XWLOL]DGRV
para estimar el tamao de la muestra.
Prembulo
Groso modo, puede considerarse que el objetivo de una
investigacin puede ser:
1. Estimacin de un parmetro. Se pretende hacer
inferencias a valores poblacionales (medias, proporciones), a partir de los resultados en una muestra. Por ejemplo, el porcentaje de estudiantes de
pregrado con obesidad o el de alumnos que son
aceptados para hacer una residencia mdica.
2. Contraste de hiptesis. Aqu se tiene como propsito comparar si las medidas (medias, proporciones) de las muestras son diferentes. Por ejemplo, evaluar qu intervencin educativa consigue
un mayor porcentaje de xitos.1,2
necesariamente se acompaa del cambio de la otra considerada en la ecuacin. Permite una mejor aproximacin
DO Q~PHUR TXH VH UHTXLHUH DMXVWDQGR D VX YH] HO SRGHU
estadstico con otros parmetros.
Se denota por: y = f(x)
donde:
y = variable dependiente (atributo o caracterstica
cuyo cambio es el que interesa medir, tambin se le denomina resultante o desenlace. En el clculo del tamao
GHODPXHVWUDHVHOQ~PHURGHSDUWLFLSDQWHVTXHVHQHcesitan).
x = variable independiente (atributo o caracterstica
que explica o predice el cambio en la variable dependiente. En el clculo del tamao de la muestra, un ejemplo es
el poder estadstico que se requiere y que el investigador
MDFRQDQWHODFLyQ
f = funcin (es una coleccin de pares de valores ordenados, que pertenecen a diferentes conjuntos. En el
clculo del tamao de la muestra, los conjuntos se pueGHQ HMHPSOLFDU FRQ HO SRGHU HVWDGtVWLFR \ HO Q~PHUR
muestral resultante).
f (x) = regla de correspondencia (expresa que para
cada elemento de un conjunto se relaciona solamente con
un elemento de otro conjunto En el clculo del tamao
de la muestra, para un elemento del poder estadstico se
UHODFLRQDVRODPHQWHFRQXQQ~PHURPXHVWUDO
En la Figura 1 se ilustran dos ejemplos hipotticos
SDUDODUHSUHVHQWDFLyQJUiFDGHOFRQFHSWRGHIXQFLyQSD
UD OD HVWLPDFLyQ GHO WDPDxR GH PXHVWUD 6H XWLOL]DURQ
GDWRV SDUD PRGHORV FRQ GLIHUHQFLD GH PHGLDV JUiFD
L]TXLHUGD\SDUDGLIHUHQFLDGHSURPHGLRVJUiFDGHUHFKD/DJUiFDGHODIXQFLyQHVXQDOtQHD\VREUHHOODORV
seguidores del mtodo tradicional solicitan el resultado
de las frmulas aritmticas empleadas para el clculo,
que representa solamente un punto sobre la lnea. Se utiOL]yHOsoftware Statistica versin 8, para las estimacioQHV\UHSUHVHQWDFLyQJUiFDGHOWDPDxRPXHVWUDO3,4
219
350
300
250
200
150
100
0.6
0.7
0.8
Poder estadstico
0.9
1.0
45
40
35
30
25
20
0.70
0.75
0.80
0.85
0.90
Poder estadstico
0.95
1.00
Figura 1.5HSUHVHQWDFLyQJUiFDGHODIXQFLyQSDUDHOFiOFXORGHOWDPDxRGHODPXHVWUDWDQWRSDUDFRPSDUDUGRVPHGLDVFRPRGRVSURSRUFLRQHV(QHOHMHGHODVRUGHQDGDVVHPXHVWUDHOQ~PHURGHLQWHJUDQWHVGHODPXHVWUD\HQHOHMHGHODVDEVFLVDVHOSRGHUHVWDGtVWLFR/D
funcin est representada por la lnea, y el asterisco sobre ella representa el valor resultante de la frmula matemtica correspondiente,
REWHQLHQGRDVtHOWDPDxRGHODPXHVWUDSDUDXQSRGHUHVWDGtVWLFRGHOTXHHVXWLOL]DGRKDELWXDOPHQWH
poblacin es la que se desea investigar y se le denomina poblacin de inters, blanco, objeto o diana. Para que
ODH[WUDSRODFLyQLQIHUHQFLDHVWDGtVWLFDWHQJDYDOLGH]OD
muestra debe ser representativa, y alude a que el estimador muestral de las variables de inters debe tener una
distribucin similar a las de la poblacin de dnde proviene. Para cumplir este supuesto de representatividad
es deseable que la muestra sea probabilstica (Figura 2).8
Abraham Flexner, en su trascendental documento, incluy al 100% de la poblacin diana que fueron todas las
escuelas de medicina de Estados Unidos de Norteamrica
\&DQDGi/DPXHVWUDIXHLJXDOHQQ~PHURDODSREODFLyQ
un hecho muy difcil de emular.9
Un aspecto diferente de muestreo es el caso de los
HVWXGLRVSDUDGHWHUPLQDUODHFDFLD\VHJXULGDGGHDOJ~Q
medicamento, comparado con los tratamientos estndares o contra placebo. En ellos, el inters reside en contrastar hiptesis sobre una intervencin (tratamiento o
maniobra) que interesa al investigador. En este caso, el
muestreo suele ser a conveniencia.10
Este artculo se enfoca en el diseo y la determinacin
del tamao de la muestra para obtener representatividad
RYDOLGH]H[WHUQDHQODVFRQFOXVLRQHV
220
Garca-Garca JA et al
Poblacin
de inters
Muestra de tipo
probabilstica
1. Hiptesis
Extrapoblacin
Inferencia estadstica
Estimador e
de la muestra
Parmetro O
de la poblacin
Tamao de la
muestra = n
Tamao de la
poblacin = N
Representatividad:
distribucin de frecuencias similar
entre la muestra y la poblacin
Figura 2. Interrelacin entre poblacin y muestra. La representatividad de una muestra probabilstica permite hacer inferencias
HVWDGtVWLFDVDODSREODFLyQGHLQWHUpV0RGLFDGRGH/ySH]$OYDrenga JC, et al.8
VHDOHDWRUL]DHQIRUPDLQGHSHQGLHQWHSDUDORJUDUJUXSRV
balanceados en la intervencin o tratamiento.11
Recientemente se public un ensayo controlado y
DOHDWRUL]DGR HQ LQYHVWLJDFLyQ HQ HGXFDFLyQ PpGLFD HQ
donde la intervencin o tratamiento fue un curso sobre
medicina basada en evidencia de seis meses de duracin,
la muestra incluy a los alumnos del quinto ao de la liFHQFLDWXUD HQ PHGLFLQD ORV FXDOHV IXHURQ DOHDWRUL]DGRV
HQ GRV JUXSRV EDODQFHDGRV HV GHFLU FRQ HO PLVPR Q~mero de participantes. Como variables dependientes se
midieron las actitudes, conocimientos y habilidades autoreportadas, en ambos grupos.12
Resultado de la
investigacin
Correcto
Correcto
221
Z_/2 (2 colas)
Z` (1 cola)
0.1
1.65
0.2
0.84
0.05
1.96
0.1
1.28
0.01
2.58
0.05
1.65
WROHUDEOHGHPD\RUDFHSWDFLyQHQODFRPXQLGDGFLHQWtFD
va de 0.1 a 0.2.4
4. Poder estadstico
Es la probabilidad de que un estudio de un determinado
WDPDxRGHWHFWHFRPRHVWDGtVWLFDPHQWHVLJQLFDWLYDXQD
diferencia que realmente existe.
6H GHQH FRPR `. Es decir, P(aceptar H1 | H1 es
cierta) = 1 - `
Su valor depende del error tipo II que se acepte. Si `
= 0.2, se tendr una potencia de 1 - ` = 0.8. En trminos
porcentuales se dice que la prueba tiene una potencia
del 80%, que es el mnimo aceptado en la literatura biomdica.
Cuanto menores sean los riesgos calculados para los
errores alfa y beta, mayor ser el tamao muestral requerido. Cuanto menor sea la variabilidad, menor ser la
muestra estimada. A menor diferencia que se desea deWHFWDUPD\RUVHUiHOQ~PHURGHSDUWLFLSDQWHV2,16
5. Variabilidad
(VODGLVSHUVLyQHVSHUDGDGHORVGDWRV6HHYDO~DGHSHQdiendo de la variable de inters. Si stas son numricas
FRQWLQXDV JUXSR GH YDORUHV LQQLWRV TXH LQFOX\HQ GHFLmales), el tamao de muestra estar determinado por la
YDULDEOH FRQ HO PD\RU FRHFLHQWH GH YDULDFLyQ &9 >CV
5HOHYDQFLDGHOWDPDxRGHOHIHFWR\VLJQLcancia estadstica
La magnitud de la diferencia del efecto que se desea detectar entre los grupos evaluados, es la condicionante
ms importante para el clculo del tamao de la muestra.
Con frecuencia, la obtencin de una diferencia estadstiFDPHQWHVLJQLFDWLYDGLIHUHQFLDHQORVUHVXOWDGRVDOFRQtrastar dos o ms valores o grupos con una prueba estaGtVWLFDJHQHUDOPHQWHVHMDXQSXQWRGHFRUWHSDUDGHFLU
que si hay diferencias entre los valores. Por convencin,
lo ms frecuente es aceptar la propuesta de Karl Pearson,
TXHKD\GLIHUHQFLDVVLJQLFDWLYDVFXDQGRHOYDORUGHp es
QR UHVXOWD UHOHYDQWH SDUD HO iUHD HQ TXH VH HVWi
investigacin, prctica clnica, educacin mdica, etc. El
investigador debe determinar si la magnitud de esa diferencia es relevante para el rea de inters, independienWHPHQWHGHTXHKD\DVLGRHVWDGtVWLFDPHQWHVLJQLFDWLYD
Se espera que cualquier diferencia de relevancia tambin
VHDHVWDGtVWLFDPHQWHVLJQLFDWLYD10,18
Si en un estudio se han considerado los factores arriba descritos, pero no se ha anticipado que el resultado
sea relevante en educacin mdica, pierde utilidad. Para
HMHPSOLFDUVHUHDOL]yXQHVWXGLRFX\RREMHWLYRIXHPHdir el conocimiento en medicina familiar de dos muestras
de estudiantes que tomaron clases con profesores distintos, y el instrumento de medicin del nivel de conociPLHQWRIXHXQH[DPHQGHRSFLyQP~OWLSOHGHtWHPV
$O PRPHQWR GH DQDOL]DU HVWDGtVWLFDPHQWH ORV GDWRV VH
encontraron diferencias entre ambos grupos (p<0.05),
SHUR HQ HO DQiOLVLV VH LGHQWLFy TXH ODV GLIHUHQFLDV IXH
ron solamente del valor de dos respuestas, por lo anterior,
VH SXHGH DUPDU TXH KD\ GLIHUHQFLDV HVWDGtVWLFDPHQWH
VLJQLFDWLYDVSHURFDUHFHGHUHOHYDQFLDSDUDODWRPDGH
decisiones educativas.
$O FDOFXODU HO WDPDxR GH OD PXHVWUD VH XWLOL]DQ IyUmulas matemticas que consideran en forma simultnea
varios de los siete factores estadsticos antes descritos,
para la mayora de ellos ya existen valores aceptados por
convencin o incluso asignados de manera arbitraria; al
momento de sustituir valores en tales frmulas nos encontramos que los rubros de variabilidad y tamao del
HIHFWRUHTXLHUHQUHYLVLyQELEOLRJUiFDHVWXGLRVSLORWRR
la opinin de expertos para asignar un valor apropiado.
222
Garca-Garca JA et al
y
, y Z
s
i1
n 1
Z
quea,
Z
n n
c
n
N
, quedando
Z 2 2 * s2
2
* 1
n
N
Z
d
*S 2 ,
donde d es el promedio
6HXWLOL]DFXDQGRVHTXLHUHFRPSDUDUHOFDPELRHQWUHXQD
medida basal y otra posterior de dos grupos distintos de sujetos. La frmula para la estimacin del tamao de mues-
sigue:
n
2
2
* p(1 p)
2
n
N
, donde
Z
p(1 p)
n
, se cono-
n
HV HO IDFWRU GH FRUUHFFLyQ SRU QLWXG GH OD SRN
la funcin normal estndar, en donde se acumula la probabilidad de (1-_). El error absoluto (b) se obtiene de una
muestra piloto o estudios previos. Si no puede determinarse esta proporcin, se tomar a p= 0.5, porque este
YDORUJDUDQWL]DUiHOPD\RUWDPDxRGHPXHVWUD(OQLYHOGH
FRQDQ]D_
TXHVXHOHXWLOL]DUVHHQHVWDVSUXHEDV
SRUORJHQHUDOHVGHO(OLQWHUYDORGHFRQDQ]DSDUD
XQD SURSRUFLyQ TXHGD GHQLGR GH OD VLJXLHQWH PDQHUD
p 1 < p
n
IC p ( b p ( Z_ 2 *
.10,19
n
2*S 2
D
*Z
*Z
, donde nc es el ta-
n n
c
2* Z
Z
|M
de
*(1
M |2
)*S 2
dc
p1
p2
de p1 es la proporcin del primer grupo y p2 es la proporcin del segundo grupo a comparar y (p1-p2) es la
diferencia de las proporciones entre ambos grupos,
Z_/2 es el valor del eje de las abscisas de la funcin
normal estndar en donde se acumula la probabilidad de (1-_) para un contraste de hiptesis bilateral y
Z` es el valor del eje de las abscisas de la funcin normal estndar, en donde se acumula la probabilidad de
(1-`).2 Un ejemplo es el Reporte Nacional del Estatus
de la Educacin Mdica en EUA.20
223
n n
c
Z * 2* P *Q
Z * P *Q
P *Q
(P
P )2
, donde
Conclusiones
La investigacin educativa debe tener el mismo rigor meWRGROyJLFRTXHRWUDViUHDVFLHQWtFDVLQFOXLGRHOFiOFXOR
del tamao de la muestra. Hay que practicar una y otra
YH]HVGHFLUVHUDFWLYRVSDUDSRGHUVHUFRPSHWHQWHHQ
OD FRQFHSWXDOL]DFLyQ GH FyPR HVWLPDU OD IXQFLyQ PDWHmtica del tamao muestral. Al respecto, Abraham FlexQHUHVFULELyODPHGLFLQDPRGHUQDFRPRWRGDHQVHxDQ]D
FLHQWtFDHVWiFDUDFWHUL]DGDSRUODDFWLYLGDG/DVFRQIHrencias y los libros no son sustitutos de las experiencias.
Financiamiento
Ninguno.
&RQLFWRGHLQWHUHVHV
/RV DXWRUHV GHFODUDQ QR WHQHU QLQJ~Q FRQLFWR GH LQWHreses.
Consideraciones especiales
Presentaciones previas
Ninguna.
Se recomienda incluir entre 30 y 50 participantes, los cuales deben poseer los atributos que se desean medir en la
poblacin objetivo.21
Referencias
3. Software de utilidad
El uso de internet facilita obtener el tamao de muestra empleando programas en lnea. Los programas utili]DQ GLIHUHQWHV DOJRULWPRV PDWHPiWLFRV SDUD HIHFWXDU HO
FiOFXOR\DXQTXHHVHQFLDOPHQWHXWLOL]DQORVPLVPRVHOHPHQWRVSXHGHKDEHUOLJHUDVGLIHUHQFLDVHQHOQ~PHURGH
la muestra.
(QWUH ORV SURJUDPDV PiV XWLOL]DGRV HVWiQ (3,'$7,
G*Power y Epi Info,8 de acceso libre. Hojas de clculo
como Excel2, tambin son de utilidad. Entre los software
de paga destacan Stata,16 SAS,22 STATISTICA3 y SigmaPlot,23SRUPHQFLRQDUVyORDOJXQRV/RVGRV~OWLPRVWLHQHQODYHQWDMDGHSRGHUJUDFDUODVIXQFLRQHVGHHVWLPDciones del tamao de la muestra.
Hay que usarlos crticamente, siendo necesario comprender bien los principios del clculo.
224
11. Box GE, Hunter JS, Hunter WG. Estadstica para investigadores.
Diseo, innovacin y descubrimiento. 2 edicin. Espaa: Editorial Revert; 2008. p. 133-172.
12. 6iQFKH]0HQGLROD0.LHIIHU(VFREDU/)0DUtQ%HOWUiQ6HWDO
Teaching of evidence-based medicine to medical students in
0H[LFRDUDQGRPL]HGFRQWUROOHGWULDO%0&0HG(GXF
107.
13. /DQGHUR+5*RQ]iOH]507(VWDGtVWLFDFRQ6366\PHWRGRORJtD
de la investigacin. Mxico: Trillas; 2007. p. 67-75.
14. &RER(0XxR]3*RQ]iOH]-$%LRHVWDGtVWLFDSDUDQRHVWDGtVWLcos. Espaa: Elsevier; 2007. p. 212-228.
15. (ORU]D37+(VWDGtVWLFDSDUDODVFLHQFLDVVRFLDOHVGHOFRPSRUtamiento y de la salud. 3 edicin. Mxico: CENGAGE Learning;
2008. p. 319-338.
16. Acock AC. A gentle introduction to Stata. 3th edition. Texas: Stata
Press; 2012. p.170-177.
17. Hulley SB, Cummings SR, Browner WS, et al. Design clinical research. 3th edition. Philadelphia, USA: Lippincott, Williams & Wilkins; 2007. p. 65-69.
Garca-Garca JA et al
18. 6XOOLYDQ*1)HLQQ58VLQJHIIHFWVL]HRUZK\WKHSYDOXHLVQRW
enough. J Grad Med Educ 2012;4:279-282.
19. Marrugat J, Vila J, Pavesi M, et al. Estimacin del tamao de
muestra en la investigacin clnica y epidemiolgica. Med Clin
1998;111:267-276.
20. Sullivan AM, Lakoma MD, Block SD. The status of medical education in end-of-life care. A National Report. J Gen Intern Med
2003;18:685-695.
21. Babbie E. Fundamentos de la investigacin social. 3 edicin.
Mxico: Thomson editores; 2000. p. 232-256.
22. Consultado el 08 de mayo de 2013. http://www.sas.com/technologies/analytics/statistics/stat/index.html
23. Consultado el 02 de mayo de 2013. http://www.sigmaplot.com/
products/sigmaplot/sigmaplot-details.php#sa.