Sunteți pe pagina 1din 355

DISEO RAZONADO

DE MUESTRAS Y
CAPTACIN DE DATOS
PARA LA INVESTIGACIN
SANITARIA

ZZZPHGLOLEURVFRP

DISEO RAZONADO
DE MUESTRAS Y
CAPTACIN DE DATOS
PARA LA INVESTIGACIN
SANITARIA
LUIS CARLOS SILVA AYAGUER
INSTITUTO SUPERIOR DE CIENCIAS MDICAS DE LA HABANA
Investigador Titular
Profesor de la Escuela de Salud Pblica de La Habana

Luis Carlos Silva Ayaguer, 2000


Ediciones Daz de Santos, S. A., 2000
Juan Bravo, 3-A
28006 Madrid.
www.diazdesantos.es
E-mail:ediciones@diazdesantos.es

Reservados todos los derechos.


No est permitida la reproduccin total o parcial de este libro,
ni su tratamiento informtico, ni la transmisin de ninguna forma
o por cualquier medio, ya sea electrnico, mecnico, por fotocopia,
por registro u otros mtodos, sin el permiso previo y por escrito
de los titulares del Copyright.

ISBN: 978-84-7978-454-6
Depsito legal: 34.147-2000
Fotocomposicin: FER Fotocomposicin (Madrid)
Impresin: EDIGRAFOS, S.A. (Madrid)
Encuadernacin: RSTICA-HILO, S. L. (Madrid)

Dedico este libro a quienes con su dignidad,


su creatividad o su amistad, contribuyen a dar sentido
y densidad a la vida de muchos otros; en especial,
en este mes de mayo del ltimo ao del siglo XX, pienso
en mi amigo Leslie Kish, quien est cumpliendo en Ann
Arbor sus 90 generosos aos; en Rivaldo y Benedetti,
donde quiera que estn globalizando la belleza con su
poesa, literaria o goleadora; y en Juan Miguel Gonzlez,
por la altura de su conducta en todos estos meses.

La ciencia no solo es compatible con la espiritualidad


sino que es una fuente profunda de espiritualidad.
Carl Sagan
Se insiste demasiado en los cmputos y en la repeticin
de innumerables problemas que siempre son lo mismo.
No es que sea malo tener el control sobre frmulas
y ecuaciones, pero esto resulta rido y aburrido.
Carece de sentido educar a alguien para que compita
con una calculadora de cinco dlares,
la cual adems, siempre ganar.
John Allen Paulus
Cuando se discute no existe superior, ni inferior,
ni ttulos, ni edad, ni nombre: slo cuenta la verdad;
delante de ella todo el mundo es igual.
Romain Rolland
La cobarda pregunta: ser peligroso? La conveniencia
pregunta: ser poltico? La vanidad pregunta: ser
popular? Pero la conciencia pregunta: ser correcto?
Punzn

Contenido

PRLOGO ............................................................................................

XVII

PRESENTACIN ..................................................................................

XXI

CAPITULO 1. MARCO CONCEPTUAL DE LAS TCNICAS


MUESTRALES
1.1. La muestra: un modelo de la realidad .............................................
1.2. Las tcnicas mustrales como herramienta de la investigacin ........
1.2.1. Las preguntas de investigacin.............................................
1.2.2. Tcnicas cualitativas: una puntualizacin oportuna .............
1.3. Estudios descriptivos y analticos ...................................................
1.4. Problema de muestreo en estudios descriptivos ............................
1.5. Unidades de anlisis, unidades de muestreo y marco muestral........
1.6. Probabilidad de seleccin y diseos probabilsticos .......................
1.7. Diseos equiprobabilsticos.............................................................
1.7.1. Algunos ejemplos simples....................................................
1.7.2. Tamao muestral y probabilidades de seleccin ................
1.7.3. Una ilustracin histrica ...................................................
1.8. Muestras no probabilsticas .............................................................
1.9. El concepto de representatividad y el papel del azar .......................
1.9.1. La nocin de representatividad ..........................................
1.9.2. Garantiza el azar la representatividad? ...............................
1.9.3. Los mritos del azar.............................................................
1.9.4. Elegir el mtodo, aceptar la muestra ..................................
1.10. Estimacin puntual y por intervalos ..............................................
1.10.1. Interpretacin de los intervalos de confianza .....................
1.10.2. La zona ms probable ........................................................

1
3
3
5
7
8
9
9
11
11
12
14
16
19
19
20
21
22
23
23
25

xii

DISEO RAZONADO DE MUESTRAS

1.10.3. Intervalo de confianza como alternativa de las pruebas de


hiptesis................................................................................
1.10.4. Error absoluto y error relativo ............................................
1.11. Muestras y censos .............................................................................
Bibliografa..................................................................................................

25
27
29
29

CAPITULO 2. LA ENCUESTA Y EL CUESTIONARIO


2.1. Organizacin de la encuesta .............................................................
2.1.1. Las tareas bsicas....................................................................
2.1.2. Errores ajenos al muestreo......................................................
2.2. El cuestionario....................................................................................
2.2.1. Formas de aplicacin ............................................................
2.2.2. Ubicacin de las preguntas......................................................
2.2.3. Tipos de preguntas .................................................................
2.3. Indicaciones para el diseo de cuestionarios y redaccin de preguntas.
2.3.1. Recomendaciones generales para la construccin de
cuestionarios ...........................................................................
2.3.2. Pautas especficas para la redaccin de interrogantes ..........
2.4. Validacin y estudio piloto.................................................................
Bibliografa ..................................................................................................

33
33
35
35
36
37
38
45
45
58
77
80

CAPITULO 3. MUESTREO SIMPLE ALEATORIO


3.1. Introduccin........................................................................................
3.2. Definicin y mtodos de seleccin ....................................................
3.2.1. Nmeros aleatorios .................................................................
3.3. Media y varianza de los estimadores ...............................................
3.3.1. Estimacin de la media poblacional........................................
3.3.2. Varianza de la estimacin de la media....................................
3.4. Un ejemplo ilustrativo ........................................................................
3.5. Distribucin de la media muestral......................................................
3.6. Clculo de los intervalos de confianza ............................................
3.7. Tamao de la muestra ........................................................................
3.8. Estimacin de otros parmetros .........................................................
3.8.1. Estimacin de un total poblacional ......................................
3.8.2. Estimacin de una fraccin o proporcin................................
3.8.3. Error absoluto, error relativo y estimaciones complementarias
3.9. Un problema de urnas ........................................................................
3.10. Discusin de un ejemplo prctico ......................................................
3.11. Complementos del muestreo simple aleatorio ...................................

85
85
87
88
88
91
94
98
101
102
106
107
107
109
111
113
116

CONTENIDO

3.11.1. Muestreo simple aleatorio con reemplazo ...........................


3.11.2. Subconjuntos de una muestra simple aleatoria .....................
3.11.3. Asignacin aleatoria .............................................................
3.11.4. Estimacin de una razn ......................................................
APNDICE: El azar y los nmeros pseudoaleatorios .................................
Bibliografa .................................................................................................

xiii

116
117
118
119
121
123

CAPTULO 4. MUESTREO SISTEMTICO


4.1. Una alternativa al muestreo simple aleatorio ..................................
4.2. Mtodo regular de seleccin ..............................................................
4.3. Estimacin de parmetros..................................................................
4.4. Otorgamiento de una probabilidad fija y seleccin en fases ..........
4.5. Varianza de la media muestral...........................................................
4.6. Una advertencia acadmica ...............................................................
4.7. Aplicaciones del muestreo sistemtico..............................................
Bibliografa .................................................................................................

125
126
128
128
132
134
138
139

CAPTULO 5. MUESTREO ALEATORIO ESTRATIFICADO


5.1.
5.2.
5.3.
5.4.
5.5.

La necesidad de ponderaciones .......................................................


Estratificacin y representatividad ..................................................
Procedimientos de estimacin ........................................................
Dos ejemplos ilustrativos ................................................................
Complementos del muestreo aleatorio estratificado .........................
5.5.1. Asignacin de tamaos mustrales a los estratos ................
5.5.2. Tamao de muestra .............................................................
5.5.3. Nmero de estratos ..............................................................
5.5.4. Postestratificacin ...............................................................
Bibliografa .................................................................................................

141
143
144
147
151
151
152
152
153
153

CAPTULO 6. MUESTREO POR CONGLOMERADOS


6.1. Seleccin en etapas ...........................................................................
6.2. Muestreo por conglomerados monoetpico ......................................
6.2.1. Tres rasgos singulares .........................................................
6.2.2. Estimacin insesgada y de razn............................................
6.2.3. Estimacin de errores .............................................................
6.2.4. Una incongruencia del estimador insesgado ..........................
6.3. Muestreo en etapas con submuestreo ..............................................
6.3.1. Estimador sin sesgo ...............................................................

156
157
158
160
161
164
166
168

xiv

DISEO RAZONADO DE MUESTRAS

6.3.2. Probabilidades de seleccin....................................................


6.3.3. Estimador de razn .................................................................
6.3.4. Ilustracin ...............................................................................
6.4. Muestreo polietpico..........................................................................
6.5. Efecto de diseo ..............................................................................
Bibliografa ..................................................................................................

169
171
172
173
173
176

CAPITULO 7. UN DISEO ESPECIAL: SELECCIN DE


CONGLOMERADOS CON PROBABILIDADES
PROPORCIONALES A SUS TAMAOS
7.1. Procedimiento de seleccin................................................................
7.2. Estructura probabilstica ...................................................................
7.3. Seleccin de unidades en la segunda etapa ....................................
7.4. Notacin ..........................................................................................
7.5. Procedimientos de estimacin............................................................
7.6. Manejo prctico de las aproximaciones de tamao............................
Bibliografa ..................................................................................................

178
180
181
183
184
186
188

CAPTULO 8. MUESTREO ESTRATIFICADO POLIETPICO


8.1. Estratificacin de unidades de primera etapa ...................................
8.2. Estructura y notacin ..........................................................................
8.3. Mtodo de seleccin .........................................................................
8.4. Procedimientos de estimacin............................................................
8.5. Un ejemplo detallado del muestreo estratificado polietpico ............
8.6. Otros aspectos del muestreo estratificado polietpico ........................
8.6.1. Unidades autorrepresentadas .................................................
8.6.2. Dos UPE por estrato ...............................................................
8.6.3. Tratamiento de cross-clases ................................................
8.6.4. Caso no equiprobabilstico......................................................
8.7. Tamao muestral y efecto de diseo ..................................................
Bibliografa ..................................................................................................

189
190
192
195
196
200
200
201
203
204
207
208

CAPTULO 9. OTRAS TCNICAS DE MUESTREO


9.1.
9.2.
9.3.
9.4.
9.5.

Muestreo replicado ...........................................................................


Tcnica de respuesta aleatorizada ......................................................
Estimacin por pesca y repesca .........................................................
Muestreo condicional en dos fases ...................................................
Muestreo en el tiempo........................................................................

209
210
216
218
219

CONTENIDO

9.6. Muestras maestras .............................................................................


9.7. Muestreos y tcnicas de evaluacin rpida .......................................
9.8. Estimacin de eventos infrecuentes y muestreo en red.....................
9.9. Medias segn unidades de informacin .........................................
9.10. Diseos con cuestionario parcial.......................................................
Bibliografa .................................................................................................

xv

220
221
222
226
227
230

CAPTULO 10. MUESTREO Y TCNICAS ESTADSTICAS


CONVENCIONALES
10.1. Tcnicas estadsticas aplicadas a muestras complejas .......................
10.2. Muestras transversales y causalidad ................................................
10.2.1. Premisa de precedencia temporal ........................................
10.2.2. Computar o no computar asociaciones en estudios
transversales? ...................................................................
10.2.3. Una ilustracin detallada .....................................................
10.2.4. Consideraciones finales .......................................................
10.3. Tamao de muestra en estudios clnicos y de epidemiologa analtica ...
10.4. Seleccin de casos y controles ........................................................
10.5. Anlisis contextual .........................................................................
10.6. Asignacin aleatoria ........................................................................
Bibliografa .................................................................................................

233
235
235
237
240
242
243
244
245
248
249

CAPITULO 11. RECURSOS COMPUTACIONALES PARA EL


TRATAMIENTO DE DATOS MUSTRALES
11.1.
11.2.
11.3.
11.4.

Programas para determinacin de tamaos mustrales.....................


Tratamiento de datos en una muestra simple aleatoria ....................
Diseos no equiprobabilsticos y empleo de ponderaciones ..........
Programas para la estimacin de errores en muestras complejas ...
11.4.1. Mdulo CSAMPLE de EPIINFO.........................................
11.4.2. Otros programas para clculo de errores en diseos
complejos.............................................................................
11.5. Programas para la seleccin de muestras .......................................
11.6. Sistema general de simulacin de diseos y aplicaciones muestrales
11.6.1. Programas de seleccin.........................................................
11.6.2. Simulacin de muestras.........................................................
11.6.3. Otras aplicaciones informticas relacionadas con el muestreo
11.6.4. Requerimientos y rasgos generales del sistema .................
Bibliografa .................................................................................................

251
252
252
254
254
261
263
263
263
265
269
271
271

xvi

DISEO RAZONADO DE MUESTRAS

CAPTULO 12. REFLEXIONES CRTICAS SOBRE LA PRCTICA


MUESTRAL CONTEMPORNEA
12.1. Marco de extrapolacin ...................................................................
12.1.1. Una regla rgida ...................................................................
12.1.2. Pruebas de significacin en muestras poblacionales .
12.1.3. Necesidad de un superuniverso ..........................................
12.1.4. Informacin autorrepresentada..............................................
12.2. Problemas del marco muestral ........................................................
12.3. El problema del tamao muestral .....................................................
12.3.1. Repasando la teora oficial....................................................
12.3.2. Seis realidades escamoteadas ................................................
12.3.3. El caso de las pruebas de hiptesis .......................................
12.3.4. Reconocimiento de lo subjetivo ............................................
12.3.5. Finalmente, qu hacer?........................................................
12.4. El problema de la no-respuesta ..........................................................
12.4.1. El modelo esencial ............................................................
12.4.2. Tcnicas para reducir la no respuesta ...................................
12.4.3. Tcnicas para la imputacin .................................................
12.4.4. Correccin de estimadores....................................................
12.5. Determinacin de valores normales ................................................
12.5.1. El recorrido normal ............................................................
12.5.2. Qu poblacin ha de muestrearse?......................................
12.5.3. Carcter histrico de la normalidad ......................................
12.6. Las encuestas en la prensa..................................................................
12.6.1. Estereotipos para no decir nada ............................................
12.6.2. Lo que ocultan las afirmaciones globales ..........................
12.6.3. Falsos vaticinios ....................................................................
12.7. Clculo y presentacin de errores mustrales ................................
12.8. Conjurando errores comunes..............................................................
12.8.1. Fraccin de muestreo versus tamao muestral .....................
12.8.2. Un 50% mgico?.................................................................
12.8.3. Diseos convertidos en un esfuerzo estril .........................
12.8.4. Sustitucin mecnica de unidades .......................................
12.8.5. Rutas aleatorias ..................................................................
Bibliografa...................................................................................................

273
273
277
278
281
281
282
283
285
291
292
293
295
295
296
297
298
299
299
301
302
304
304
307
309
313
313
313
315
318
320
321
321

NDICE DE AUTORES ...........................................................................

325

NDICE DE MATERIAS ..........................................................................

329

Prlogo

Cuando a uno le proponen prologar un libro, experimenta una serie de sensaciones en cierto modo contradictorias. Un innegable orgullo, la seguridad de no
ser el ms adecuado, la duda de si colmar las expectativas del autor, la constatacin de que nos estamos haciendo viejos..., son algunas de ellas.
Entre otras muchas actividades, Luis Carlos Silva ha impartido decenas de
cursos de muestreo en nuestro pas, auspiciados por instituciones sanitarias autonmicas y centrales y como profesor colaborador de la Escuela Nacional de
Sanidad. Por todo ello, prologar su cuarto libro tiene la dificultad aadida de que
el autor es tan ampliamente conocido y valorado en Espaa que resulta difcil
descubrir al lector algo que no sepa de l. Intentar superar el sesgo que supone
haber ledo sus anteriores libros y la amistad que nos une, para enjuiciar este que
tienes entre tus manos.
Creo que es una opinin compartida por muchos profesionales de la salud pblica que el muestreo tiene mucho que ver con las arenas movedizas. Parece un
terreno transitable con unas cuantas precauciones y recetas, pero cuando nos
adentramos en l suele ser demasiado tarde para arreglar los desperfectos. El
puente que en su da tendi el autor con Muestreo para la investigacin en ciencias de la salud para librarnos del barro se refuerza y consolida hoy con este
Diseo razonado de muestras y captacin de datos para la investigacin sanitaria. Una vez ledos estos libros, el lector estar de acuerdo con que el autor y su
obra pertenecen a esa rara y valorada especie que invalida aquel Never trust
a biostatician. At worst, they will intentionally try to deceive and embarrass you.
At best, it is unitentional.
El nuevo texto incorpora en el marco conceptual del muestreo aspectos de la
estimacin puntual y por intervalos, y subraya el uso de intervalos de confianza
como alternativa a las pruebas de hiptesis. El lector encontrar un captulo
completo dedicado a la organizacin, diseo y validacin de encuestas y cuestionarios que ampla muy sustancialmente lo que se bosquejaba en su anterior libro sobre el tema.

xviii

DISEO RAZONADO DE MUESTRAS

En todo texto sobre muestreo son imprescindibles captulos sobre los diseos
aleatorio simple, sistemtico, estratificado y por conglomerados. El rasgo distintivo que encontrar el lector en estas pginas estriba en la claridad de la exposicin y en la estructura didctica del texto, sin que esto suponga una prdida de
profundidad o rigor, sino todo lo contrario. Este es, sin lugar a dudas, uno de los
mritos ms destacables del autor.
El captulo 9 aborda de forma ms suscinta, pero con un nivel de desarrollo
suficiente para su comprensin y hasta su puesta en prctica, tcnicas de muestreo como el replicado, muestreo en el tiempo, uso de muestras maestras, diseos
con cuestionario parcial y otras que pueden ser tiles a un buen nmero de lectores.
Cualquier investigador, clnico o epidemilogo, se encuentra habitualmente
ante el problema de determinar el tamao de la muestra para su estudio, sea este
descriptivo, analtico o experimental. Puesto que son bien conocidos diversos
textos que lo solventan tcnicamente, como por citar dos ejemplos, los de
Schlesselman o Friedman, este Diseo razonado de muestras y captacin
de datos para la investigacin sanitaria no se concentra en las formulaciones,
sino que pone el nfasis en dar una visin global, de profundo calado conceptual,
sobre tan polmico tema.
Cada vez contamos con ms programas de ordenador que cuentan con opciones para la determinacin de tamaos mustrales y el tratamiento de datos
en diseos complejos; el captulo 11 ofrece un anlisis descriptivo y crtico de un
buen nmero de ellos, desde el popular y completo CSAMPLE de EpiInfo hasta Stata o Suddan. Este valor aadido del libro se completa con el programa SIGESMU, que acompaa al texto, e ilustra de forma clara y original diversos
mtodos para el cumplimiento de una tercera tarea del muestreo (raramente
incluida en programas habituales): la obtencin de las muestras. Parte de estos
recursos est en proceso de integracin dentro del sistema informtico Epidat,
cuya tercera versin se desarrolla con Luis Carlos Silva como uno de los miembros del grupo de trabajo.
El ltimo captulo enlaza con el espritu de Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica, anterior libro del
mismo autor, desgranando de forma amena tpicos y errores que, por comunes,
nos parecen a todos asumibles. Especialmente recomendable considero, aunque
salga del mbito estrictamente sanitario, el apartado sobre las encuestas con que
nos abruma (condiciona?) la prensa cuando se aproximan las elecciones. Este
espritu crtico del autor, enemigo de los dogmas y las recetas, ha sido el que motiv su apertura en los ltimos tiempos a otras pticas metodolgicas, como el
enfoque bayesiano frente al frecuentismo dominante.
Esta obra puede utilizarse de dos maneras. En primer lugar sirve para realizar
consultas puntuales, aclara conceptos o plantear y realizar un diseo muestral
determinado; es decir, es suficientemente directa, concreta y estructurada como
para resultar til al profesional sanitario o estudiante que necesite profundizar en

PROLOGO

xix

tcnicas de muestreo. En segundo lugar tiene la virtud escassima en textos de


estadstica, de enganchar al lector que, casi sin darse cuenta, se ve sumergido
en sus pginas. ste comprobar que la inclusin en el ttulo de la palabra razonado no es casual, ya que este carcter impregna todo el texto hasta el punto
de constituir quiz el principal elemento diferenciador de la obra. Por todo ello
le auguro un xito seguro no slo en Espaa sino en todos los pases de habla
hispana.
A Luis Carlos lo conoc en dos fases. La primera, por las ras de Santiago,
hace ya muchos aos, fue breve y tcnica. La de verdad, aos ms tarde en La
Habana, cristaliz en una prspera relacin profesional y en una sincera amistad.
Entre ambas, amigos comunes, referencias cruzadas y muchas coincidencias de
criterio. Me imagino que todo ello combinado le llev a proponerme estas lneas,
que no quiero terminar sin animarle a que siga trabajando como hasta ahora, con
rigor y honestidad. Todos se lo agradeceremos.
Enrique Vzquez Fernndez - Santiago de Compostela, junio de 2000

Presentacin

La presente obra constituye una prolongacin, tanto cualitativa como cuantitativa, de mi libro Maestreo para la investigacin en ciencias de la salud publicado por la Editorial Daz de Santos hace ms de un lustro. Habindose empleado
como texto en decenas de cursos de posgrado impartidos en varios pases, fueron
cuantiosas las insuficiencias detectadas que ahora procuro enmendar o mitigar.
En aquella edicin ya se sealaba la existencia de diversos textos orientados
a proveer a estudiantes e investigadores de recursos instrumentales para el diseo de muestras. Sin embargo, despus de unos cuantos aos de prctica docente
e investigativa relacionada con el muestreo en el campo de la salud, sigo considerando conveniente contar con un material que ponga el mximo nfasis en la
interpretacin cualitativa de sus resultados bsicos y que, simultneamente, centre su atencin en el nivel emprico dentro del que opera la salud pblica: las
investigaciones de salud y epidemiolgicas concretas.
En la versin anterior ya se pretenda ofrecer un material cuya comprensin
exigiera solamente conocimientos elementales de estadstica y probabilidades y
que expresamente eludiera, por tanto, la derivacin matemtica de resultados, as
como las frmulas repletas de signos de sumatoria y subndices que slo causan
extraeza y desconcierto al investigador simple. Tal espritu ha sido enteramente
respetado en la versin actual. El acopio de una ya prolongada experiencia en la
materia me ha convencido de que los textos vertebrados en torno a formulaciones
abigarradas poco tienen que ver con las expectativas de mis colegas salubristas y
epidemilogos. Sin embargo, diversos aspectos reclamaban actualizacin y un manejo ms acucioso, con el fin de incrementar su inters prctico. Por otra parte,
este libro procura ser ms abarcador en varios sentidos: ahora se aborda un crecido nmero de asuntos previamente no considerados, con lo cual la versin actual
duplica el nmero de captulos. Especialmente enriquecido se ha visto el texto destinado al rea de captacin de datos. El lector hallar adems que, ya sea por medio de notas tcnicas laterales o de apndices, se tratan de satisfacer las inquietudes de lectores ms avezados, o que se interesan en aspectos ms avanzados.

xxii

DISEO RAZONADO DE MUESTRAS

Por otra parte, a lo largo del texto se han introducido diversos ejemplos
concretos con el fin de compartir -aunque sea de manera parcial- mi modesta
experiencia en el empleo de las tcnicas mustrales como medio auxiliar para
dar respuesta a diversas interrogantes relacionadas con el estado de salud de la
poblacin, los problemas econmicos de la salud pblica, la organizacin de
los servicios de salud y otras cuestiones afines.
Con fines ilustrativos y procurando optimizar la comunicacin de los principios
en que reposa toda la teora muestral, se apela en varios puntos del libro a ejemplos artificiales en que las poblaciones son de muy pequeo tamao. Naturalmente, tales ejemplos carecen de realismo, ya que en la prctica no tiene sentido aplicar tcnicas de muestreo a poblaciones minsculas. Sin embargo, la naturaleza de
algunos de los problemas tratados es completamente independiente de los tamaos
poblacional y muestral; de modo que trabajar con poblaciones muy reducidas no supone ningn escollo conceptual a la vez que favorece didcticamente la exposicin.
En trminos generales, la obra procura adems romper con diversos dogmas
y mitos que se han ido consolidando en la metodologa oficial del muestreo.
Se trata de poner en su justo lugar ciertos mtodos frecuentemente invocados
en algunos textos clsicos y que, aun teniendo ocasionalmente cierto inters acadmico, estn objetivamente alejados de las posibilidades prcticas regulares, o
son directa y llanamente desconocidos por ellas.
Para consolidar y comunicar las ideas contenidas en este libro he contado con
innumerables fuentes de estmulo. Desde el punto de vista formativo en materia
de muestreo, siempre me sentir en deuda con mis queridos profesores y amigos
Leslie Kish, de la Universidad de Michigan, y Joseph Machek, de la Universidad Carolina de Praga, por sus generosas enseanzas. Y desde una perspectiva
ms general, expreso mi agradecimiento al profesor Francisco Rojas Ochoa, del
Instituto Superior de Ciencias Mdicas de la Habana, maestro por antonomasia de
un par de generaciones de salubristas e investigadores cubanos. Agradezco igualmente a todos mis alumnos y, especialmente, a la ya larga lista de aquellos amigos y colegas espaoles, quienes de un modo u otro han promovido mi actividad
docente sobre las tcnicas mustrales en diversos puntos del Estado espaol; la
lista de estos colegas (seguramente incompleta) incluye a Alfonso Abaigar, Pepe
Almenara, Esther Arbes, Rodrigo Arquiaga, Txema Arteagoita, Clotilde Boix,
Carlos Campillo, Jos Manuel Casas, Javier Damin, Manuel Daz-Olalla, Iaki
Galn, Gonzalo Grandes, Eliseo Guallar, Gonzalo Gutirrez, Juan Ramn Lacalle, Jess Martn, Jos Mara Martn Moreno, Antonio Pareja, Luis Prieto, Elas
Rovira, Jos Manuel Salamanca, Emilio Snchez Cantalejo, Antonio Segura,
Patricio Surez, Enrique Vzquez, Toms Vega y ngel Vilches. Por su inestimable colaboracin tcnica, agradezco a mi alumno Ramn Surez, a cuya habilidad como programador debemos, los lectores y yo, la posibilidad de explotar un
sistema informtico original y eficiente que apoya al texto.
Luis Carlos Silva - La Habana, junio de 2000

1
Marco conceptual
de las tcnicas muestrales
1.1. La muestra: un modelo de la realidad
El muestreo es aquella disciplina estadstica que ofrece herramientas para la
solucin de un problema que, en el contexto de la investigacin cientfica de salud, resulta virtualmente universal: determinar qu parte de una realidad debe
examinarse con la finalidad de hacer inferencias sobre ella.
La necesidad de pronunciarse sobre un fenmeno o asunto habindolo observado slo parcialmente, se presenta con extrema frecuencia en la cotidianidad
y abarca las ms diversas esferas de la vida diaria. Por ejemplo, despus de algunos contactos con un pas, se vierten criterios sobre sus habitantes; partiendo
de dos novelas de un escritor, se opina sobre su obra y, tras examinar un cm3 de
sangre de un paciente, se valora todo su volumen sanguneo. Se trata de una
prctica natural cuya validez est determinada por el mero sentido comn.
Naturalmente, un proceso inductivo de tal naturaleza, que va de lo particular
a lo general, inevitablemente entraa la posibilidad de cometer errores, y es claramente intuitivo que dichos errores estn llamados a ser mayores en la medida
que la porcin observada sea ms reducida y, sobre todo, en la medida que ella
no refleje o represente la realidad (a la que en el lenguaje muestral suele
llamarse poblacin o universo) sobre la que recaern las conclusiones de la
inferencia.
El muestreo, como proceder cientfico, funciona de manera similar, pero procura aportar mtodos formales que contribuyan razonablemente a conseguir
que la muestra conforme un modelo del universo. En efecto, en el problema del
universo y la muestra estamos ante un singular ejemplo del proceso de representacin de la realidad objetiva mediante un modelo. Obtener una buena
muestra significa, precisamente, configurar una versin simplificada de la
poblacin, que reproduzca sus rasgos bsicos a la vez que desdee los innece-

DISEO RAZONADO DE MUESTRAS

sarios y, como debe ocurrir con todo modelo eficiente, que sea suficientemente
simple como para resultar manejable, pero no tanto como para que se difuminen sus perfiles especficos fundamentales. Kish (1989) describe una buena
muestra como un espejo de la poblacin, o una poblacin en miniatura.
En rigor, la tarea del muestrista va ms all: adems de determinar el mtodo de seleccin de la muestra y, por tanto, su tamao, ha de establecer los procedimientos que habrn de aplicarse a los datos as obtenidos para realizar inferencias fecundas.
Diversas razones prcticas pueden mencionarse para justificar el uso de esta
tcnica. Sin embargo, en ltima instancia, la fundamental es la necesidad de ahorrar recursos. Por lo general, resulta literalmente imposible estudiar a todos los
individuos que integran una poblacin (hacer un censo). Este imperativo econmico ha estado presente siempre, aunque no fue hasta la dcada de los treinta del
siglo XX, con un clebre trabajo presentado por el polaco Jerzy Neyman ante la
Roy al Statistical Society1, cuando se comenz a desarrollar una teora orgnica
sobre las tcnicas que permiten superar de manera cientfica esa dificultad (Neyman, 1934). El impulso determinante se produjo fundamentalmente en Gran
Bretaa, Estados Unidos y, ms tarde tambin, en la India y los pases escandinavos.
El uso del muestreo fue generalizndose y sus bases tericas experimentaron
un proceso de cimentacin gradual hasta la consolidacin de esta disciplina como una rama con personalidad propia dentro de la estadstica. Los siguientes
datos reflejan elocuentemente tanto su juventud como su rpida expansin:
mientras el International Statistical Institute (ISI) fue fundado el siglo pasado y
constituye una de las asociaciones cientficas internacionales ms antiguas que
funcionan en la actualidad, no es hasta 1971 que se establece la Asociacin Internacional de Muestristas como una de sus secciones. Sin embargo, en 1997
ya contaba con 1.244 miembros de 131 pases (IASS, 1997). Por otra parte, en las
ltimas cuatro dcadas se ha ido conformando un cuerpo terico slido recogido
en una ya larga serie de libros exclusivamente dedicados al tema (vase el interesante trabajo ad hoc de Parada, 1987) integrada, entre otros, por los siguientes clsicos: Hansen, Hurwitz and Madow (1953), Slonim (1960), Deming
(1960), Sampford (1962), Kish (1965), Murthy (1967), Des Raj (1968), Yamane (1970), Som (1973), Cochran (1977), Williams (1978), Jessen (1978), Scheaffer, Mendenhall y Ott (1979), Yates (1980), Levy y Lemeshow (1980), Kalton
(1983), Stuart (1984), Sukhatme, Sukhatme, Sukhatme y Asok (1984), Dalenius (1985).

1
Algunos de los resultados all expuestos, sin embargo, haban sido publicados diez aos antes por el ruso
A. A. Chuprov, segn resean Azorn y Snchez (1986).

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

1.2. Las tcnicas muestrales como herramienta de la investigacin


Como se ha dicho, las tcnicas mustrales son herramientas de trabajo especialmente tiles en el mbito de la investigacin cientfica, aunque tambin son
intensamente utilizadas en reas tales como la indagacin de mercado y los sondeos polticos y electorales. Constituyendo la investigacin el marco operativo
que nos ocupar, y siendo sta una actividad que con demasiada frecuencia es
objeto de confusin, no resulta ocioso detenerse brevemente a caracterizarla y
adelantar algunas reflexiones relevantes a los efectos que nos interesan.

1.2.1. Las preguntas de investigacin


La investigacin cientfica es una actividad de finalidad cognoscitiva; es decir, una accin destinada a obtener nuevos conocimientos que cubran una laguna en la comprensin de la realidad, o que contribuyan al entendimiento de algo
que se domina imperfectamente (Silva, 1989). Ella supone, necesariamente, o
bien la existencia de preguntas claramente definidas sobre un dominio concreto, o bien, si el alcance del problema y la madurez del autor lo consienten, la
formulacin de hiptesis que demanden del mtodo cientfico para su valoracin rigurosa.
La estructura del pensamiento y del accionar de un investigador en la fase de
formulacin del problema debe discurrir segn los siguientes elementos insoslayables (Silva, 1991):
1. Expresar el problema ntidamente (mediante preguntas o hiptesis).
2. Fundamentar la necesidad de encararlo (consignar beneficios esperados).
3. Exponer tanto el marco terico en que se inscribe como los antecedentes
en que reposa.
Ahora bien, los estudios que ms se vinculan con la teora muestral, tal y como la entenderemos predominantemente en el presente libro, son los llamados
estudios descriptivos: aquellos que tienen por objeto bsico caracterizar cmo es
una poblacin.
Es harto frecuente que, al valorar cierta realidad, sea necesario conocer
datos generales en trminos resumidos (promedios, porcentajes, medidas de
variabilidad, etc.), que contribuyan a una interpretacin ms clara de sus
rasgos. Los estudios descriptivos tambin se suelen llevar adelante con el
afn de obtener informacin que permita la fundamentacin emprica de hiptesis sobre las leyes que rigen los fenmenos examinados (hiptesis de
causalidad).
Es preciso reconocer que uno de los problemas ms frecuentes presentes en
los estudios de tipo descriptivo consiste en que las preguntas que se plantea el in-

DISEO RAZONADO DE MUESTRAS

vestigador no son suficientemente explcitas, de manera que quedan subsumidas


dentro de un planteamiento muy general, con frecuencia borroso. Supongamos
que se plantea el problema en trminos como los siguientes: Estudiar epidemiolgicamente el comportamiento de la gripe en el pas durante el perodo
1980-1990. Ms que un verdadero problema, lo que se ha planteado en este
caso es un dominio de inters. No comprender la diferencia entre consignar una
esfera de trabajo y formular preguntas concretas casi siempre garantiza el
desconcierto futuro. El curso natural de un proceso de investigacin con tal punto de partida suele ser como sigue:
a) Confeccin de un cuestionario en que se acumula de manera ms bien
catica una serie de tems relacionadas con ese dominio, pero cuya funcin especfica se ignora o a lo sumo slo se intuye.
b) Acopio de cierto monto de informacin (a menudo enorme) llamada a ser
en gran parte desechada.
c) Acudir a un bioestadstico que supuestamente tendra que desfacer un
entuerto pero que nunca podr saber bien en qu consiste su tarea, ya que
el hecho de que haya trabajo de terreno, se cuente con datos y se puedan
construir tablas, no modifica el problema cardinal: que la formulacin de
preguntas rectoras sigue siendo un captulo pendiente.
Es evidente que el mtodo que vaya a adoptarse para contestar una pregunta de investigacin slo puede decidirse una vez que ella ha sido formulada con toda nitidez. El cuestionario que ha de utilizarse, por tanto, slo
podr ser diseado de manera racional una vez que todas las preguntas a las
que se quiere dar respuesta han sido explcitamente planteadas y cuando estn al menos bosquejadas las tablas por medio de las cuales habrn de resumirse los datos. Unas y otras configuran el nico criterio lgico para decidir
la pertinencia de los aspectos incorporados al cuestionario que se planifica
aplicar.
Por otra parte, un verdadero estudio descriptivo debe, en mi opinin, trascender la simple contemplacin neutra de la realidad. Los trabajos contemplativos, muchas veces indistinguibles de un informe administrativo que no va
ms all que lo que una computadora puede producir y que justamente se detiene all donde nuestro cerebro resulta imprescindible, no constituyen verdadera
investigacin cientfica. Esta slo tiene lugar cuando nace de una vocacin
crtica, capaz de transformar los resultados numricos en juicios de valor. Es imprescindible, en fin, dejar claro que las tcnicas de muestreo pueden contribuir
a que los resultados sean extrapolables y precisos, pero su traduccin al plano
conceptual, su conversin en valoraciones, exige el concurso de una cultura
cientfica de los investigadores, que poco tiene que ver con el muestreo u otros
instrumentos estadsticos.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

1.2.2. Tcnicas cualitativas: una puntualizacin oportuna


Como ya seal recientemente en otro sitio (Silva, 1997), una gran cantidad
de problemas de ndole social se abordaron durante muchos aos sin emplear
tcnicas formales de encuesta, sino mediante informacin no susceptible de ser
manejada en un entorno cuantitativo. Los procedimientos de anlisis eran de orden bsicamente cualitativo, especialmente entre antroplogos y etngrafos, pero
tambin entre socilogos, psiclogos e, incluso, clnicos. Investigadores de la talla de Max Weber llegaban a sostener que la sociologa consegua sus resultados
por medio de la comprensin, a diferencia de las ciencias naturales, que procedan
por va de la explicacin (Boudon, 1978). Tal afirmacin resulta hoy un poco extraa, con un sentido difcil de entender cabalmente, pero en cualquier caso es
expresiva de la tendencia a segregar las metodologas de uno y otro tipo.
Con el tiempo, fueron expandindose diversos desarrollos tericos en especial las tcnicas de muestreo que, al propiciar la cuantificacin de los resultados
y permitir la sntesis, por tanto, de manera ms formal, fueron desplazando de
la prctica a dichas tcnicas cualitativas de anlisis, a la vez que las iban devaluando metodolgicamente. En rigor, los procedimientos cualitativos nunca
desaparecieron y en cierta medida tuvieron incluso expresiones importantes de
renovacin y vitalidad; lo que s se consolid como realidad fue la separacin
casi absoluta2 entre unas y otras.
El epidemilogo tpico de la nueva hornada positivista, cuya gestin, quisiralo o no, tena profunda connotacin sociolgica, miraba con desdn al antroplogo que se perda en lo que, a su juicio, no pasaba de ser diletantismo subjetivo y visin novelada de la realidad. El cientfico social clsico, por su parte,
recelaba de las tecnologas presuntamente encartonadas que le proponan los
estadsticos y que lo obligaran a reducir la riqueza de sus observaciones a tablas
y porcentajes. Gurvitch (1950), por ejemplo, escriba que cuando las estadsticas no se aplican en un marco cuidadosamente acotado y verificado, no constituyen ms que manipulaciones puramente matemticas de grandes cifras y,
refirindose a las tcnicas formales de encuestas, encarnadas por entonces en la
archifamosa empresa que las popularizara en Estados Unidos, destilaba una
inusitada agresividad con afirmaciones tales como que los procedimientos de
Gallup son irrisorias bsquedas de promedios arbitrarios que no existen y operan
en el vaco.
Almeida (1992) atribuye el divorcio entre tcnicas cuantitativas y cualitativas
al profundo compromiso de la epidemiologa con las primeras, lo cual impidi
una integracin ms estrecha entre las estrategias de investigacin de las ciencias
sociales en general. Y agrega:
2
Tal parcelamiento, sin embargo, tuvo excepciones desde muy temprano. El estudio, por citar un ejemplo,
de Warner (1947), en que se combinan las encuestas formales con la observacin etnogrfica, da cuenta de ello.

DISEO RAZONADO DE MUESTRAS

Decir que uno se pierde en lo especfico, o que el otro siempre ofrece


una aproximacin superficial de cuestiones complejas, perdidas en los
grandes nmeros, es una actitud por lo menos ingenua que algunas veces
aparece entre investigadores de ambas disciplinas... La naturaleza desigual y multifactica del objeto epidemiolgico y su determinante justificar el empleo de un sensato pluralismo metodolgico.
Entre las ms connotadas tcnicas cualitativas, todas bosquejadas y referenciadas por Castellanos (1989), se hallan la asamblea o frum comunitario, el famoso brainstorming y el menos conocido brainwriting, las entrevistas en profundidad, las tcnicas grupales (nominal, de discusin y Delfos), la
historia de vida, el uso de informantes claves, la observacin estructurada y
la observacin participante. El debate que he bosquejado tiene plena vigencia.
La investigadora australiana Frances Baum ha desarrollado una circunstanciada defensa de la posibilidad y la conveniencia de asumir una integracin metodolgica que supere las distancias que objetivamente se viven hoy (vase
Baum, 1997). No todos comparten sin embargo lo que podra entenderse como
una facilista conciliacin salomnica. Por ejemplo, Prieto (1997) sostiene que
los llamados mtodos cualitativos son no cientficos debido a que no
cumplen ciertos requisitos generales que se consideran esenciales, tales como
que conduzcan a los mismos resultados aunque los observadores sean diferentes.
Es cierto que virtualmente todas las tcnicas de este tipo suponen la existencia de lo subjetivo e intentan aprehenderlo sin ruborizarse. A mi juicio no hay
motivos para el rubor si se repara en que para cierto tipo de problemas esos mtodos resultan tanto o ms recomendables que determinadas aplicaciones estadsticas cuya objetividad dista mucho de ser absoluta.
Las encuestas estructuradas, por ejemplo, por lo comn restringen marcadamente el espacio de expresin de los interrogados. Con ello se viabiliza y simplifica notablemente el procesamiento estadstico, pero no se salva de la subjetividad al investigador; ste contamina el proceso tan pronto se fijan, tanto
sintctica como conceptualmente, las respuestas posibles. La diferencia bsica
entre los procedimientos cuantitativos y los cualitativos no estriba en que aqullos sean objetivos y stos no, sino en el punto y el modo en que se introduce la
subjetividad: los ltimos ponen el nfasis en permitir y hasta en promover que
los actores sociales participen con su propia subjetividad en el proceso; en los
primeros la subjetividad poca o mucha, pero inevitable es virtualmente
monopolizada por los investigadores.
Las tcnicas cualitativas tienen, sin embargo, un alcance limitado. Si bien
pueden ser un magnfico instrumento alternativo o complementario de las encuestas para resolver algunas tareas especficas (tales como sopesar un estado de
opinin u ordenar jerrquicamente un paquete de necesidades segn priorida-

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

des), resultan inoperantes por s mismas en muchsimos problemas de investigacin epidemiolgica, en la inmensa mayora de los del rea clnica y en la
totalidad de los problemas planteados por las ciencias bsicas. No obstante, resulta poco razonable renunciar dogmticamente al empleo de mtodos que han
demostrado su eficacia y que en determinados contextos pueden operar en rgimen de simbiosis con recursos como los que nos ocupan predominantemente en
este libro.

1.3. Estudios descriptivos y analticos


Las tcnicas de muestreo en las que se pone el nfasis en este libro son aquellas que procede aplicar especficamente ante preguntas de investigacin que
apuntan en direccin descriptiva, aunque las investigaciones que van ms all de
la descripcin y procuran descubrir explicaciones (los llamados estudios analticos) tambin operan, desde luego, con muestras. Sin embargo, el manejo de
series de observaciones que se derivan de un conjunto numeroso de condiciones externas y que se obtienen sin intervencin formal de las tcnicas clsicas de
muestreo, no slo es comn sino inevitable en muchas probablemente la mayora de las investigaciones analticas.
Un ejemplo tpico se produce cuando se quiere establecer el cuadro causal
de una enfermedad; lo que se estudia es la asociacin de algn factor exgeno
tal como el hbito de fumar o el rgimen nutricional con la presencia o ausencia de la enfermedad. En una situacin tal, no suelen elegirse muestras formales a partir de listados poblacionales; el nfasis debe ponerse en conseguir que
los grupos sean similares a todos los efectos salvo en lo que concierne al factor
(la mal llamada comparabilidad3 entre el grupo de casos con el de controles),
antes que en la representatividad que unos y otros exhiban en relacin con las
respectivas poblaciones (Keller, 1969). Dicho de otro modo, en los estudios analticos la demanda metodolgica fundamental en relacin con las muestras no
concierne a la representatividad, sino al grado de similitud que exhiban los grupos que vayan a compararse.
Si bien, como se ha dicho, este libro se concentra en el mbito descriptivo;
el importante tema del muestreo en estudios analticos se aborda especficamente en el Captulo 10.

Creo que el trmino no es afortunado, pues dos cosas son comparables no cuando son parecidas, sino cuando son susceptibles de comparacin. No es posible comparar el dimetro de una naranja con el peso de un pltano, pero s se puede comparar la talla de un ser humano con la distancia entre La Habana y Madrid.

DISEO RAZONADO DE MUESTRAS

1.4. Problema de muestreo en estudios descriptivos


Supongamos que estamos ante una poblacin finita cualquiera o sea, un
conjunto de entes susceptibles, al menos tericamente, de ser listados y que se
quiere conocer una caracterstica general o parmetro, definido por el resultado
numrico de combinar de alguna manera prefijada los datos que se obtendran
en caso de que se midiesen todos los elementos de la poblacin4.
Por ejemplo, podra tratarse del porcentaje de aquellos ancianos de una
comunidad que son capaces de valerse por s mismos, del salario promedio de
los mdicos de un pas, del nmero total de historias clnicas deficientemente llenadas en un hospital, o de la edad mediana en que se produce la menarqua en las
zonas urbanas de una provincia. Si en lugar de proceder a obtener los datos necesarios para todas y cada una de las unidades de la poblacin de inters (todos
los ancianos de la comunidad, la totalidad de los mdicos del pas, el conjunto
completo de historias clnicas o todas las nias y adolescentes de la parte urbana de la provincia), se decide examinar slo una porcin de tales unidades, y
estimar el nmero desconocido a partir de dicha informacin, entonces decimos
que se ha planteado un problema de estimacin por muestreo.
Para dar solucin a tal problema es necesario expresado esquemticamenteencarar las siguientes tareas:
a) Delimitar el nmero de unidades o elementos que deben estudiarse.
b) Establecer la forma en que se efectuar la seleccin.
c) Determinar el modo en que se procesarn los datos para realizar la estimacin.
d) Identificar el procedimiento de clculo estimado del error que se comete
en el proceso inferencial (la distancia mxima estimada entre la estimacin efectuada y el parmetro desconocido).
Lejos de lo que pudiera pensarse, estas cuatro tareas se condicionan mutuamente, incluso en el sentido de que no es posible abordarlas secuencialmente:
se necesita una aproximacin simultnea e integral que, para cada nuevo problema de muestreo, puede demandar un enfoque relativamente original.

Aunque aqu, con el fin de simplificar la exposicin, nos estamos refiriendo a un parmetro, en la prctica
regular no hay un nico parmetro por estimar, sino varias decenas de ellos. Por ejemplo, en un estudio sobre
productividad mdica en la asistencia de urgencia el objetivo central puede que sea estimar el nmero promedio
de pacientes atendidos por hora, pero difcilmente el inters se circunscriba al conocimiento de ese nmero;
tpicamente, se desear obtener tablas que contemplen aspectos tales como el diagnstico, la edad del mdico, los
horarios de trabajo, etc.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

1.5. Unidades de anlisis, unidades de muestreo y marco muestral


Se denomina unidad de anlisis a cada uno de los elementos o sujetos que
componen la poblacin y que podran ser, en su momento, objeto de interrogatorio o medicin.
Ocasionalmente, antes de seleccionar la muestra, la poblacin se divide en
unidades de primera etapa (UPE). Cada UPE puede estar conformada por un
conjunto de unidades de anlisis5. En cualquier caso, las unidades de muestreo
de primera etapa deben cubrir por entero a la poblacin sin intersecarse; o sea,
todo miembro de la poblacin o unidad de anlisis pertenecer a una y slo una
UPE. En el caso ms general, una unidad de muestreo puede estar conformada
a su vez por un conjunto de unidades de muestreo correspondientes a una etapa
posterior de seleccin. Se llama marco muestral al conjunto de listas de todas las
unidades de muestreo necesarias para llevar adelante el proceso.
Para fijar mejor estas nociones, supongamos que se estudia una poblacin de
escolares para conocer la prevalencia de cierta dolencia. Cada escolar es una
unidad de anlisis (el ente que se examina). Si se tiene un listado de todos los
escolares al que se aplica un mtodo de seleccin directamente, entonces dicho
listado es el marco muestral, y las unidades de anlisis son tambin las de muestreo. Pero, si en lugar de contar con un listado de escolares, se tiene uno de
escuelas, algunas de las cuales se elegirn para el estudio, entonces las unidades
primarias de muestreo sern las escuelas. Si, hecha esta seleccin, se toman
slo algunas aulas de las escuelas elegidas y, finalmente, dentro de estas ltimas se eligen alumnos para integrar la muestra definitiva, entonces habra tres
procesos escalonados de seleccin; existen en este caso las llamadas unidades de
muestreo de primera, segunda y tercera etapa (escuelas, aulas y alumnos respectivamente). El conjunto de listados imprescindibles para la seleccin total (de escuelas primero, despus el de las aulas que tiene cada escuela seleccionada, y
finalmente el de nios dentro de cada una de las aulas as elegidas) constituyen
el marco muestral del estudio.

1.6. Probabilidad de seleccin y diseos probabilsticos


Un paso de crucial relevancia en el proceso histrico de consolidacin de la
teora del muestreo fue dado con la introduccin del azar en el acto de seleccin
muestral.

La situacin en que las unidades de muestreo son directamente las unidades de anlisis es un caso particular.

10

DISEO RAZONADO DE MUESTRAS

Supongamos que se ha concebido un procedimiento de seleccin muestral


cualquiera de una poblacin P integrada por N elementos: P ={e1, e2, eN,}. El
azar puede intervenir de muchos modos en ese proceso, pero se considera que se
ha conferido un carcter estadsticamente riguroso al mtodo de seleccin slo
cuando se cumplen dos condiciones: que el procedimiento otorgue a cada elemento de la poblacin una probabilidad i conocida de integrar la muestra (es
decir, que i se conozca de antemano para todo elemento ei de P), y que tal probabilidad no sea nula para elemento alguno (esto es, i > 0 para todo i). En tal
caso, se dice que se ha seguido un mtodo probabilstico de muestreo.
Consideremos el conjunto de todas las muestras posibles (es decir, aquellos
subconjuntos de la poblacin que, teniendo en cuenta el mtodo de seleccin que
se ha prefijado, puedan resultar elegidos en calidad de muestra). Si Mj representa a la j-sima de esas muestras posibles y e, es un elemento cualquiera de la poblacin, entonces la probabilidad i de que ei resulte seleccionado es igual a la
suma de las probabilidades que tienen de ser elegidas todas aquellas muestras
posibles que contienen al elemento ei. En trminos formales, esto es:

i =

M j ei

P (M j )

donde P(Mj) representa la probabilidad que tiene Mj de ser el subconjunto elegido como muestra. A modo de ilustracin consideremos una situacin en extremo
simple y, desde luego, sin inters prctico alguno.
Numeremos los meses del ao del 1 al 12 y supongamos que se desea una
muestra de ellos. Supongamos adems que se forman 3 subconjuntos de meses:
M1= { 1 , 2 , 3 , 4 , 5 , 6 }
M2= {1, 7, 8, 9, 10, 11}
M3 ={1, 6, 12}
Supongamos que la seleccin de los meses se realiza del modo siguiente: se tiran
dos monedas; si salen dos caras, la muestra ser igual a M1; si salen 2 escudos, estar formada por los elementos de M2, y en otro caso, coincidir con M3. Las probabilidades respectivas de las 3 muestras posibles son: 1 , 1 y 1 . La probabilidad
4 4 2
de que el mes de enero sea elegido es 1 (ser seleccionado con certeza), pues las 3
muestras posibles lo contienen. La probabilidad de seleccin de los meses 2, 3, 4,
5, 7, 8, 9, 10 y 11 es igual a

1
,
4

pues en cada caso es sa la probabilidad de la

nica muestra posible que lo contiene; la probabilidad de junio (mes 6) es


P (M1) + P (M3) = 1 + 1 = 3 y, finalmente, la de que resulte elegido el mes de
4 2 4

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

11

diciembre es 1 , pues sa es la probabilidad de que M3, la nica muestra que


2

contiene al 12, resulte elegida.

1.7. Diseos equiprobabilsticos


Una forma especial de diseo probabilstico es aquel en que todos los sujetos de la poblacin tienen la misma probabilidad de ser seleccionados (TT, es
constante para todo i); en tal caso se dice que el mtodo es equiprobabilstico.

1.7.1. Algunos ejemplos simples


Veamos a continuacin algunos ejemplos relacionados con esta condicin.
Consideremos para ello la poblacin formada por los 365 das del ao 2001 y valoremos algunos mtodos para seleccionar una muestra de das6.
Ejemplo 1. Se ponen 365 bolas en una urna, cada una de las cuales lleva inscrito un
da diferente del ao. Se extraen sucesivamente 10 de ellas de manera similar a como se procede en la lotera; se incluyen en la muestra los das consignados en dichas bolas.

Es muy intuitivo (vase la demostracin en la Seccin 3.2); que la probabilidad


comn a todos los das es =

10
.
365

Ejemplo 2. Se procede como en el ejemplo anterior, pero la bola elegida entre las 365 de
la urna slo sirve para seleccionar un mes del ao (se elige el mes al que pertenece el da sealado en esa bola). Luego se toman al azar exactamente 10
das de dicho mes.

La probabilidad de que resulte elegido un da dado, P(D), es igual al producto de dos probabilidades: la de que resulte seleccionado el mes que contiene a dicho da, P(M), y la probabilidad condicional P(D | M) de que sea se uno de los 10
das seleccionados supuesto que fue seleccionado el mes que lo contiene. Esto es:
P(D) = P(M) P(D | M). Es fcil apreciar que P(M) =

Ni
365

, donde Ni es el nmero

Lo que va a medirse en esas unidades de anlisis puede ser la humedad ambiental o el nmero de accidentes
automovilsticos registrados en una ciudad. A los efectos de esta ilustracin, sin embargo, ese dato es irrelevante.

12

DISEO RAZONADO DE MUESTRAS

de das contenidos en el mes de que se trate, y que P(D | M)

Ni 10
10
=
.
365 Ni 365
O sea, que la probabilidad es la misma para todos los das.

10
Ni

de modo que:

i =

Ejemplo 3. Se colocan los nombres de los 12 meses en respectivas tarjetas y, tras mezclarlas concienzudamente, se eligen 3 de ellas; se incluyen en la muestra
todos los das contenidos en los tres meses seleccionados.

La probabilidad de cualquier mes es 3 ; puesto que un da queda automti12

camente elegido si lo fue el mes en que est contenido, todos los das del ao
3
tendrn esa misma probabilidad de inclusin: i =
12
Como comentario lateral, advirtamos que este ejemplo evoca una situacin
prctica totalmente verosmil. Supongamos que tenemos un listado de 50 viviendas en las que viven 225 personas. Se quiere una muestra de individuos y se
decide seleccionar 10 viviendas al azar e incluir en la muestra a todos los individuos que las habitan. La muestra tendr tantos elementos como sujetos vivan
en las 10 viviendas elegidas. Puesto que ese nmero no se conoce hasta que no
se haya concluido la seleccin de las viviendas, el tamao de la muestra de sujetos depende de cules sean las viviendas que el azar haya determinado. Sin
embargo, el diseo es equiprobabilstico. Efectivamente, la probabilidad de inclusin de cada individuo coincide con la que tenga su vivienda de estar entre las
10 que se seleccionen; o sea, todos los elementos tienen la misma probabilidad
de inclusin:

10
50

= 0, 2 .

Ejemplo 4. Para cada da se tira una moneda al aire; si sale cruz, se elige ese da; en
otro caso, ese da se descarta.

En este caso es evidente que i =

1
2

para todo i. La muestra puede tener un

tamao que va desde 0 a 365.


En los ejemplos 3 y 4, a diferencia de los dos primeros, el tamao muestral
no est fijo de antemano sino que es aleatorio: no lo conoceremos hasta que no
termine la seleccin. De hecho, por tanto, el tamao muestral es en esos dos casos una variable aleatoria.

1.7.2. Tamao muestral y probabilidades de seleccin


Hablar del valor esperado del tamao muestral slo tiene un sentido no trivial
para diseos en que, como en los dos ltimos ejemplos, el tamao muestral re-

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

13

sultante no es constante. Cmo se ver ms adelante, en la prctica es frecuente


que se trabaje con mtodos de muestreo para los que el tamao muestral no se
conoce hasta que no concluya el proceso de seleccin. Sin embargo, si el procedimiento es probabilstico, siempre se podr tener una idea de cul podra ser
el tamao que se obtendr.
Si dicho procedimiento se repitiera muchas veces, los respectivos tamaos de
muestra seran realizaciones de una variable aleatoria. El procedimiento de tales realizaciones es el valor esperado de la variable. El valor esperado del tamao muestral es el nmero en torno al cual se ubican los distintos tamaos
de muestra posibles (lo que cabe esperar que resulte); formalmente esto es:

E ( n) =

P(n = nh )

donde los nh son los tamaos de muestra posibles y dnde P(n nh) denota la
probabilidad de que el tamao muestral sea nh. Una manera alternativa de computar este nmero viene dada por la siguiente propiedad:
La suma de las probabilidades de seleccin de todos los miembros de la poblacin es igual al valor esperado del tamao muestral (vase Des Raj, 1968).
Formalmente: E ( n) =

i =1

Consideremos el ejemplo 3 de la Seccin 1.7.1. Se trataba de una muestra


de los 365 das del ao 2001, conformada con los das pertenecientes a 3 meses
elegidos al azar. El clculo de los diferentes tamaos de muestra posibles y de sus
respectivas probabilidades es bastante laborioso. Sin embargo, usando la propiedad, el cmputo de E(n) es inmediato; en efecto, puesto que el procedimiento es equiprobabilstico (con i = 0,25 para todos los das), se tiene:
365

i =1

365
= 91, 25
4

Si el tamao de muestra es fijo (como en los ejemplos 1 y 2), este resultado


se reduce a afirmar que la suma de las probabilidades de inclusin de todos los
elementos de la poblacin coincide con el tamao muestral. Si adems de producir tamao muestral fijo, el diseo es equiprobabilstico, y llamamos n a la
probabilidad comn a todos los elementos, entonces se cumple, necesariamente,
que =

n
.
N

14

DISEO RAZONADO DE MUESTRAS

1.7.3. Una ilustracin histrica


Los diseos equiprobabilsticos tienen varias ventajas, que se expondrn en
diversos puntos del texto. De momento, sin embargo, slo destacaremos que,
ocasionalmente, el carcter equiprobabilstico del mtodo es prcticamente vital.
Esto resulta evidente, por ejemplo, cuando se trata de elegir nmeros que determinan premios en una lotera o en los procesos de asignacin aleatoria dentro
de algunos diseos experimentales.
Una ilustracin interesante que muestra cuan espinoso puede ser este asunto,
se vincula con un hecho acaecido en 1997 con motivo de un proceso de seleccin muestral llevado adelante por el ejrcito espaol.
Cuando se haca el llamado a filas para servir en las fuerzas armadas, estaba
entonces establecido que una parte de los candidatos fuese exonerada de tal obligacin, as como que la seleccin de los agraciados se verificase pblicamente
y por un procedimiento que otorgara la misma probabilidad de ser eximidos a todos los jvenes cuyas edades estaban comprendidas entre dos fechas prefijadas.
El modo en que se llev adelante el procedimiento en 1997, pareca correcto
(equiprobabilstico); pero no lo era. Para explicarlo, consideremos un ejemplo
estructuralmente equivalente, pero numricamente mucho ms sencillo que el
real. Su explicacin tiene cierta complejidad, por lo que se recomienda no adentrarse en sus detalles si no se posee cierta destreza algebraica y probabilstica.
Supongamos que se quieren elegir n = 5 sujetos de un listado que consta de
N= 17 individuos, los cuales se numeran del 0 al 16. La seleccin se realiza por
un mtodo, que consta de las siguientes dos etapas:
Primera etapa: Se elige un nmero r entre 0 y 16. Para ello, primero se eligen
dos nmeros b1 y b2. Para decidir el valor de b1 se tira una moneda al aire: si
sale cara, entonces b1 = 0; si sale escudo, b1 = 1 .La eleccin de b2 depende de
el resultado obtenido para b1 segn la regla siguiente:

a) Si b1 es 0, de una urna que contiene 10 bolas numeradas del 0 al 9 se elige una y se toma dicho nmero como b2.
b) Si b1 es 1, se elige tambin una bola pero de una urna que contiene 7 bolas,
numeradas del 0 al 6 (vale decir, se elige un nmero al azar entre 0 y 6); b2
es el nmero de dicha bola.
Hecho esto, se define r = 10 b1 + b2, que es el nmero entre 0 y 16 que se buscaba en esta primera etapa.
Segunda etapa: Una vez elegido r, se seleccionan los sujetos que estn en los
lugares r , r + 1, r + 2, r + 3, r + 4 del listado. Si r es inferior a 13, estos 5 nmeros no ofrecen dudas. Si 13 r 16, entonces se considera que el listado es circular; por ejemplo, si r = 15, entonces r + 1 = 16, r + 2 = 0, r + 3 = 1 y r + 4 = 2.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

15

Corroboremos ahora que la probabilidad que tienen los sujetos del listado de
ser elegidos no es la misma para todos sino que difiere para cada individuo segn la posicin que ste ocupe en el listado.
La probabilidad de seleccionar el nmero r = 10 b1 + b2 es igual a la probabilidad de seleccionar b1 multiplicada por la de elegir b2 dado que se seleccion b1:
P ( r = 10b1 + b2 ) = P (b1 ) . P (b2 b1 )

Esta probabilidad puede tomar slo dos valores diferentes (llammosle A y B), en dependencia de que bx sea 0 1 respectivamente. Puesto que P(b1 = 0) = P(b1 = 1) =
0,5, es muy fcil convencerse de que dichos valores son:

A=
y de que:

1
2

1
10

y B=

20

P (r = h) =

1
2

1
7

1
14

A para h: 0, ...,9
B para h: 10, ...,16

Ahora recordemos que el sujeto que ocupa el lugar h resulta elegido siempre que
se produzca alguna de las 5 siguientes posibilidades: r = h, r = h - 1, r = h - 2,
r = h-3, o r = h-4. Consecuentemente, para calcular la probabilidad de seleccin
que corresponde al sujeto h , ( 0 h 16), a la que llamaremos p*(h), debe computarse la suma de las probabilidades de estos 5 eventos; o sea, ha de aplicarse la
siguiente frmula:
P * ( h) =

P(r = h i)
i =0

Por ejemplo, la probabilidad de que el noveno sujeto resulte elegido es:


P * (9) = P ( r = 9) + P ( r = 8) + P ( r = 7) + P ( r = 6) + P ( r = 5)

y la que quede seleccionado el segundo, recordando el convenio de circularidad, es:

P *(2) = P(r = 2) + P(r = 1) + P(r = 0) + P(r = 1) + P(r = 2)


= P (r = 2) + P(r = 1) + P(r = 0) + P(r = 16) + P(r = 15)
Finalmente, puesto que P (r = h) slo puede ser igual a A o a B, es obvio que
P* (h) es necesariamente de la forma kA + (5 - k)B donde k es un nmero entre 0
y 5 que cambia en dependencia del valor de h. A partir de esto se puede construir
fcilmente la tabla donde se recogen las probabilidades de cada uno de los 17 sujetos, marcadamente diferentes entre s, como se muestra a continuacin:

16

DISEO RAZONADO DE MUESTRAS

La ltima fila de la tabla permite comprobar que:


16

P *(h) = n
h =0

tal y como afirmaba la propiedad arriba enunciada.

1.8. Muestras no probabilsticas


Un primer caso de inters que debe analizarse es el de las muestras que, habiendo sido planificadas probabilsticamente, pierden ese carcter en la fase de
terreno, circunstancia que puede introducir un fuerte sesgo que descalifique los
resultados.
Imaginemos que se planifica un estudio de morbilidad bucal en cierta rea
de salud y que el procedimiento de seleccin establecido consiste en tomar una
de cada 6 viviendas a lo largo de un listado que incluye a todas las casas del
rea con vistas a examinar entonces a todos los residentes de las que resulten
seleccionadas. Es fcil demostrar que, en principio, si la primera de las casas se
1
elige con probabilidad igual a
(por ejemplo mediante el lanzamiento de un
6
dado), entonces todo residente del rea tiene la misma probabilidad de ser
examinado. Supongamos, sin embargo que, en la prctica, en lugar de establecer

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

17

que se regrese una y otra vez a cada casa seleccionada hasta completar el examen de todos sus habitantes, se sigue la regla de realizar el reconocimiento estomatolgico slo a los individuos que se hallen en la vivienda en el momento de
la visita.
De tal suerte, los ancianos tendrn en la prctica una probabilidad mucho ms
alta de ser encuestados (por tenerla de estar presentes en el momento de la visita) que nios y adultos. Como el cuadro morboso tpico de un anciano es, en
trminos generales, cualitativa y cuantitativamente diferente al del resto de la
poblacin, el panorama general brindado por la muestra no permitir obtener una
visin real de lo que verdaderamente ocurre en el rea de salud. Pero, el problema
que interesa destacar ahora no es tanto que se pierda el carcter equiprobabilstico del diseo como el hecho de que, bajo estas circunstancias, las probabilidades de seleccin pasaran a ser, en rigor, desconocidas, pues el verdadero
mecanismo de eleccin queda afectado por determinantes que ya no estn bajo
control del muestrista.
Por otra parte, ocasionalmente, el muestreo no probabilstico (que algunos
autores han denominado indebidamente opintico) se emplea de manera deliberada. Los procedimientos pueden ser de varios tipos. Circunscribindonos al
caso en que se tiene una poblacin bien definida de la cual se va a obtener una
muestra, las formas bsicas de seleccin no probabilstica son las cuatro siguientes:
a)
b)
c)
d)

Seleccin realizada sin mtodo alguno.


Muestreo semiprobabilstico.
Muestreo por cuotas.
Seleccin segn criterio de autoridad.

El primer mtodo (seleccin al tun tun), en que los elementos se eligen


sin reflexin ni previsin algunas, est obviamente sujeto a importantes e incontrolables sesgos; consecuentemente, es simplemente ajeno a la buena prctica cientfica.
El muestreo semiprobabilstico es como lo indica su nombre un procedimiento cuyo carcter probabilstico se mantiene slo hasta cierto punto del proceso de seleccin y se abandona de ah en adelante. Cochran, Mosteller y Tukey
(1954) lo ilustran del modo siguiente: se quiere una muestra de hojas de una
plantacin para su control fitosanitario; se hace una seleccin probabilstica de
una muestra de rboles, pero dentro de cada rbol elegido se toma un grupo
de hojas segn el criterio del tcnico que selecciona la muestra.
Otro ejemplo de tal tipo de seleccin se puede presentar cuando se siguen reglas como la de suplir a la persona elegida por un vecino en caso de que ella no se
encuentre en la vivienda; en tal situacin, las viviendas pueden haberse elegido
probabilsticamente, pero esa condicin se pierde en la etapa siguiente, con la

18

DISEO RAZONADO DE MUESTRAS

posible aparicin de sesgos, derivados del hecho, por ejemplo, de que las amas
de casa pueden quedar muy sobrerrepresentadas en la muestra.
El maestreo por cuotas muy usado en las encuestas de opinin y de mercado concierne fundamentalmente a la investigacin con poblaciones humanas.
Parte del principio de forzar a que la muestra contenga el mismo porcentaje de
individuos con ciertas caractersticas prefijadas que la poblacin entera. Segn
los intereses que se consideren relevantes, se divide la poblacin en subclases
mutuamente excluyentes y generalmente a partir de datos censales se obtienen
los porcentajes abarcados por cada una de dichas subclases. Se establece entonces que la muestra tenga sus elementos distribuidos dentro de las subclases de
manera tal que los porcentajes mustrales coincidan a la postre con los de la poblacin. Para lograrlo se le asigna a cada enumerador una zona especfica (por
ejemplo, una manzana) y se le permite que all entreviste a los individuos que l
escoja, siempre que lo haga dentro de las restricciones determinadas por las
cuotas de muestreo estipuladas. As, por ejemplo, se le indica hacer 10 encuestas: de las cuales 5 han de ser a hombres y 5 a mujeres; se establece que
uno de los 10 debe ser profesional; que dos de los encuestados deben ser mayores de 50 aos, 6 han de estar entre 25 y 49, en tanto que los otros dos deben tener entre 15 y 24. Al reunir las selecciones realizadas por todos los enumeradores se tendr con certeza que la mitad de la muestra estar integrada por mujeres,
el 10% por profesionales, etc. Es obvio que el procedimiento, como ocurre en
definitiva con todo mtodo no probabilstico, puede conducir a importantes sesgos (los enumeradores podran, por poner un ejemplo, evitar las viviendas con
escaleras o las que tienen perros).
Finalmente, se tiene el caso en que la muestra es determinada mediante el criterio razonado de autoridades en la materia del estudio. En la aplicacin de este mtodo, los investigadores sopesan cuidadosamente las caractersticas de los
elementos que integran la poblacin para elegir racionalmente aqullos que a su
juicio pueden conformar el mejor modelo de la realidad de acuerdo con los objetivos del trabajo.
Como consecuencia de una extendida confusin entre azar y representatividad
que se aborda en la prxima seccin puede ocurrir que esta alternativa se descarte automticamente por considerarse intrsecamente mala; en efecto, al tener en
cuenta que la muestra no fue seleccionada por medio del azar, el investigador
puede sentir que su estudio carece del rigor cientfico necesario. Ese sentimiento
o el afn de desarrollar acciones destinadas a conjurarlo no siempre se apoya en
la justa evaluacin metodolgica de los procedimientos aplicados; en ocasiones
reposa simplemente en la falta de comprensin cabal del contenido y alcance de
los conceptos en juego. Existen circunstancias en que lo nico razonable es optar,
precisamente, por este tipo de eleccin, en lugar de por un mtodo probabilstico. Se trata fundamentalmente de situaciones en las que el tamao de muestra
planificado es muy pequeo, sobre todo si tambin el tamao poblacional lo es.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

19

Por ejemplo, imaginemos que se quiere estudiar el funcionamiento del conjunto de los 25 hospitales de una provincia, y que se decide hacerlo a travs de
una evaluacin exhaustiva de 4 de ellos: es mejor seleccionar los cuatro que racionalmente se consideren ms representativos antes que permitir que sea el azar
quien los determine. La clave tcnica de esa preferencia radica en que, si bien los
errores de las estimaciones no podrn ser objetivamente medidos, stos van a resultar menores y ello es, en ltima instancia, lo que por encima de todo se desea. Por otra parte, es intuitivamente razonable, ya que carece de sentido que,
en lugar de usar al azar como una herramienta ventajosa, quedemos en sus manos hasta el punto de ser posibles vctimas del modo en que se desempee. Advirtase que el azar bien podra producir (y en este caso no con baja probabilidad) muestras totalmente inconvenientes, del tipo en que todos los hospitales
sean de la capital provincial, o que ninguno sea docente. Adems, en situaciones
como la descrita, normalmente no se realizarn estimaciones en el sentido formal, como pudiera ocurrir en poblaciones grandes, sino que las valoraciones globales tienden a ser ms bien de naturaleza cualitativa.

1.9. El concepto de representatividad y el papel del azar


1.9.1. La nocin de representatividad
Es necesario comenzar enfatizando que la nocin de representatividad slo
tiene un alcance intuitivo. En efecto, no existe una definicin formal que permita establecer si una muestra concreta es o no representativa, ni estimar siquiera su grado de representatividad. Esta nocin intuitiva, sin embargo, es tan
familiar que resulta muy fcil hallar ejemplos de la vida cotidiana que ilustren
su empleo.
En el terreno cientfico, sin embargo, es conveniente y posible manejar estas
ideas de manera menos vaga. En ese sentido puede consultarse el libro clsico de
Stephan y McCarthy (1958); all, a la vez que se alerta acerca de que la expresin muestra representativa nunca podr tener un significado formalizable, se
sugieren algunas ideas en la lnea de aproximarse al que le confiere nuestro sentido comn.
La nocin que, ajuicio nuestro, mejor sintetiza el concepto de representatividad muestral es la siguiente: para conseguirla, lo que debe procurarse
es que la muestra exhiba internamente el mismo grado de diversidad que la poblacin.
Imaginemos, por ejemplo, que un estudio sobre las opiniones de la poblacin general acerca del sistema de atencin primaria se ha llevado adelante interrogando slo a estudiantes de medicina. Se trata sin duda de una muestra (un

20

DISEO RAZONADO DE MUESTRAS

subconjunto) de la poblacin, pero inmediatamente ser apreciada con suspicacia; por qu no nos parecera representativa tal muestra? Bsicamente, porque sospechamos o sabemos que es demasiado uniforme: la poblacin general es
ms heterognea que la de estudiantes a los efectos del tema que nos ocupa7.
Las conclusiones derivadas del proceso inferencial, por su propia naturaleza,
siempre estarn sujetas a error. Otra manera de entender el concepto es la siguiente: una muestra puede considerarse representativa a los efectos de ciertos
aspectos especficos de la poblacin cuando el error en que se incurre al emplearla para hacer estimaciones sobre esos aspectos no excede ciertos lmites prefijados. Esto subraya el hecho de que una muestra puede ser representativa de
ciertos rasgos y no de otros (por ejemplo, serlo de la distribucin poblacional
en cuanto a grupos sanguneos pero no en cuanto al nivel de escolaridad).

1.9.2. Garantiza el azar la representatividad?


Consideremos la siguiente situacin. En una escuela primaria hay 100 nios
de cada sexo y se quiere estudiar el rendimiento acadmico del total de los 200
educandos a partir de una muestra de 50 de ellos. Si se permite que sea exclusivamente el azar quien determine los 50 elementos de la muestra, bien podra ocurrir
que todos fuesen varones (aunque tal evento sea tan extraordinariamente improbable que a todos los efectos prcticos pueda considerarse virtualmente imposible).
En tal caso, naturalmente, la muestra no sera representativa con relacin al gnero
y, consecuentemente, tampoco respecto de aquellos factores directa o indirectamente asociados a l. Aunque de manera menos exagerada, igual consideracin
podran merecer, por ejemplo, muestras con 40 varones y 10 nias, o viceversa.
Si se supiera como suele ocurrir que aquello que se investiga est asociado con el gnero, parecera justificado y prudente rechazar tales muestras (si se
produjeran) como fuente de eventual generalizacin. Sin embargo, quizs tampoco sera deseable que la muestra contuviese a 16 de los 20 alumnos zurdos que
hay en la escuela, o que el porcentaje de alumnos de la muestra cuyas madres
sean universitarias resulte mucho menor que el mismo porcentaje entre los
200 alumnos del centro, pues tambin podran existir nexos indirectos, quizs
desconocidos, entre el desempeo escolar y el hecho de ser zurdo, o entre dicho
desempeo y la escolaridad de la madre.
Sin embargo, es evidente que si se descartaran muestras inconvenientes
una y otra vez hasta obtener una que no lo parezca, el uso del azar se reducira a
un autoengao, adems de que el proceso de escudriar las muestras en esta
lnea sera por lo general impracticable y, en definitiva, interminable.
7
Esa es, en esencia, la razn por la cual las votaciones que suelen incluirse en los sitios WEB carecen de
todo fundamento cientfico como instrumento para conocer la opinin pblica.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

21

Por otra parte, represe en que el examen de la muestra propiamente dicha no


puede servir para evaluar su calidad como modelo representativo del universo que
se estudia. En primer lugar, porque habra que analizar un nmero virtualmente ilimitado de caractersticas poblacionales, todas las cuales deberan quedar fidedignamente reflejadas en la muestra y, en segundo lugar, porque se opera con una muestra precisamente en virtud de que las caractersticas poblacionales se desconocen.
Ahora bien, hay que subrayar que el solo hecho de que empleando el azar puedan
obtenerse tales muestras pone en evidencia que dicho mtodo no asegura ni mucho
menos la representatividad. ste es el nudo conceptual de mximo inters: contrariamente a una conviccin bastante extendida, lo cierto es que el azar no inyecta
representatividad a la muestra especfica que pudiera obtenerse por su conducto.
Abundando en el tema, supongamos ahora que el muestrista decide tomar en
calidad de muestra al conjunto de los 50 estudiantes que hayan alcanzado en matemticas las notas ms altas de la escuela; al objetrsele el procedimiento con la crtica de que no intervino el azar, y de que tal muestra es obviamente no representativa, l puede argir que mediante el azar cualquier subconjunto de 50 alumnos
podra haber resultado elegido entre ellos, aquel integrado por los ms destacados
en matemticas y que, en tal caso, exactamente las mismas conclusiones no seran
objetadas. Acaso un poema merece diferente consideracin en dependencia de que
sea ledo por la maana o por la tarde, de que sea annimo o est firmado por un poeta encumbrado? Por qu entonces aceptar cierta muestra si fue seleccionada al
azar pero rechazar esa misma muestra si fue intencionalmente decidida? Formalmente, el argumento esgrimido contra el azar como exigencia parece impecable.

1.9.3. Los mritos del azar


El problema de sacrificar el instrumento de la aleatoriedad en el altar de esa
lgica estriba, como ya se apunt, en que as se estara licitando cualquier
manipulacin tendenciosa del objeto de estudio, en contradiccin con un principio elemental del proceder cientfico.
Cules son entonces los mritos del azar? Se reducen a dos: en primer lugar,
los procedimientos probabilsticos satisfacen esa exigencia intuitiva de eliminar
o mitigar al menos la carga subjetiva que podra influir en la eleccin de los
elementos que se van a examinar (y, por ende, en las conclusiones). El azar juega el papel de seguro contra distorsiones sistemticas, sean o no deliberadas, y
ese papel es por lo general insustituible, aunque no resuelve la encrucijada lgica en que nos hallamos. En segundo lugar, y esto es realmente crucial, slo cuando el mtodo es probabilstico se podr solucionar la tarea de medir el grado de
precisin con que se realizan las estimaciones.
El investigador, naturalmente, desea dos cosas: en primer lugar y sobre todo,
que ese margen de imprecisin en sus conclusiones sea pequeo y, en segundo

22

DISEO RAZONADO DE MUESTRAS

lugar, tener una estimacin de cul es la magnitud real del error. El carcter
probabilstico del mtodo de seleccin asegura esto ltimo y en ello radica
precisamente su virtud fundamental, aunque no necesariamente garantice lo
primero.

1.9.4. Elegir el mtodo, aceptar la muestra


La clave del razonamiento en que se fundamenta el empleo del azar radica
en lo siguiente: la confianza que pueda depositarse en una muestra depende
vital y exclusivamente de la que merezca el procedimiento que la produjo. Vale la pena detenerse en este punto, que es el aspecto metodolgicamente ms relevante.
En general, no se emplea un mtodo porque siempre funcione eficientemente,
ni se descarta porque siempre fracase. La eleccin racional de un procedimiento
(independientemente de lo que se procure resolver con l) nada tiene que ver con
la infalibilidad; con lo que tiene que ver es con la evaluacin del riesgo de que
nos conduzca al fracaso: si ste es muy pequeo, se adopta; si es muy grande,
se desdea. As nos conducimos cotidianamente cada vez que elegimos racionalmente una manera dada para resolver algo (comunicarnos con alguien, comprar un producto, trasladarnos a algn sitio, etc.). En el caso de la seleccin de
muestras, casi siempre es posible que nos toque en suerte una muestra muy deficiente; pero si los tamaos de la poblacin y de la muestra no son muy reducidos, entonces muy probablemente la muestra resultante ser representativa a
cualquier efecto de inters8. Dicho de otro modo, las muestras deficientes
sern relativamente pocas. La que resulte seleccionada cuando se aplique un
procedimiento dado de muestreo no tiene una confiabilidad intrnseca; una vez
elegida no tiene mayor sentido pensar siquiera en sus posibles mritos. Importan
los mritos del diseo que la produjo; como se ha dicho, l es bueno, como
ocurre con cualquier otro mtodo, cuando la inmensa mayora de sus desenlaces sean satisfactorios. Por otra parte, una vez aplicado el procedimiento de
muestreo, ser tpicamente imposible enterarse siquiera acerca de la calidad de
la muestra obtenida.
En la prctica, despus de meditar cuidadosamente el procedimiento muestral
y de haberlo aplicado consecuentemente, el estudio debe continuarse usando la
muestra que haya resultado sin que se admitan manipulaciones a posteriori, por
muy razonables que pudieran parecer.
Cabe recordar, por otra parte, que la ciencia no avanza de manera lineal sino
en virtud de una singularidad que la hace nica: su propia capacidad autoco8
De hecho, eso es lo que afirma en esencia la ley de los grandes nmeros descubierta por Bernoulli y bien
conocida por los probabilistas.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

23

rrectora. De modo que no es muy grave que ocasionalmente lleguemos a resultados incorrectos, pues para considerar que algo es cierto no bastan unos resultados
aislados que lo confirmen, sino que es menester que stos se hayan replicado. La
verdad cientfica se abre paso con carcter necesario, a pesar de los elementos casuales que puedan coyunturalmente ocultarla o tergiversarla (Silva, 1977); desde
el punto de vista del progreso cientfico, las consecuencias de algunas pifias en
el contexto de muchos aciertos no son, por lo general, desastrosas.
En sntesis, al permitir que el azar determine la base de la generalizacin se
corre el riesgo de que, en algunos casos particulares, esta ltima resulte equivocada; pero en la medida en que se siga esta prctica, supuesto que se adopten
medidas para que aquella contingencia sea ms bien excepcional, la resultante final de las generalizaciones terminar por imponerse con fuerza de ley.

1.10. Estimacin puntual y por intervalos


Como ya se ha dicho, en el contexto de los estudios descriptivos la caracterizacin que se procura realizar casi siempre supone la estimacin de parmetros. Concentrmonos en un parmetro genrico al que llamaremos P (que puede
representar, por ejemplo, la prevalencia de asmticos o el nmero total de
cardipatas en una comunidad).
Supongamos que estamos en el primer caso y que un tcnico de salud ha estimado ese nmero mediante un diseo probabilstico y que comunica que la estimacin de P es igual a 11%. Esto, obviamente, no quiere decir que la prevalencia sea exactamente igual a 11%. Cuando se nos dice que la estimacin es 11%,
sabemos que esto quiere decir que el verdadero valor de P es ms o menos
igual a 11. La demanda, natural, sin embargo es conocer cunto ms o menos.
Es decir, resulta inmediata la aspiracin de contar no slo con una estimacin
puntual de P, sino tambin con una idea del error mximo que pudiera estar afectando a dicha estimacin. Esto equivale a disponer de un intervalo en cuyo seno
quepa esperar que se halle el parmetro.

1.10.1. Interpretacin del intervalo de confianza


Un intervalo de confianza para un parmetro P es, informalmente definido,
una pareja de nmeros, P1 y P2, entre los cuales podamos estar confiados que
se halla el parmetro en cuestin. Es obvio que no es lo mismo creer que P es
11% ms o menos 0,5%, que creer que es 11% ms o menos 4%, o que slo saber que es aproximadamente igual a 11%, pero no tener la menor idea acerca
de cul es la magnitud del error posible.

24

DISEO RAZONADO DE MUESTRAS

Para interpretar adecuadamente este intervalo debe repararse en lo siguiente:


para cada muestra posible de la poblacin, puede obtenerse un intervalo de
confianza, aquel al que ella d lugar. Quiere decir que el intervalo es el resultado
de haber realizado una experiencia aleatoria. Ese intervalo puede contener o no
al parmetro, aunque si ello efectivamente ocurre o no es algo que no podremos
nunca dirimir en la prctica; lo que puede afirmarse es que, para un alto porcentaje de las muestras, el intervalo resultante contiene al parmetro desconocido.
La virtud del intervalo que se obtiene para la nica muestra que se selecciona en la prctica estriba en que se produjo por un mtodo confiable; o sea, se podr estar razonablemente confiado en que ese nico intervalo que toc en suerte
no estar entre los pocos que no contienen al parmetro. Consecuentemente, si el
intervalo se construye por un mtodo tal que acierta a atrapar a P, por ejem-

plo, el 95% de las veces, se dice que P se halla entre P1 y P2 con una confiabilidad del 95%.
Para ilustrar estas ideas, supongamos que cierto estudio tiene entre sus propsitos conocer el gasto promedio en medicamentos en que incurren mensualmente los ncleos familiares de cierta comunidad. Los investigadores conocen por estudios similares que dicho valor debe estar entre $2.00 y $6.00, pero
necesitan un dato ms preciso. Naturalmente, si se opta por el uso del muestreo,
el verdadero promedio nunca ser conocido con certeza absoluta.
Supongamos que tras una encuesta por muestreo se obtuvo, en calidad de estimacin, que dicho gasto promedio asciende a $3.25. Qu significa ese dato si
no se tiene una idea del posible error cometido? Virtualmente nada. Sin embargo, si adems se informase de que el error mximo es e - $0,15, lo que se est
afirmando es que el verdadero gasto promedio se encuentra casi con seguridad
entre $3.10 y $3.40. Ahora, si en lugar de $0.15, el error asociado a la estimacin
asciendiera a $3.20, entonces lo nico que se conocera, en definitiva, sera que
el verdadero gasto medio est entre $0.05 y $6.45. O sea, no se agregara absolutamente nada a lo que ya se conoca de antemano. Es preciso comprender que
la estimacin aislada, sin una medida del error que pueda estar afectndola,
carece virtualmente de inters.
Cuando un titular de prensa afirma algo como lo siguiente:
A partir de una rigurosa muestra aleatoria de 300 hombres de la
capital, los expertos han estimado que el porcentaje de hombres que usan
preservativos regularmente subi en el curso del ltimo ao de 31,4% a
35,7%
pero escamotea (quizs porque no considera necesario comunicarlo) que el error
mximo asociado a esta ltima estimacin es de 4,6%, probablemente el lector
comn quede automticamente persuadido de que ese consumo ha aumentado.
Pero lo que realmente se sabe es que el porcentaje actual est, muy proba-

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

25

blemente, entre 31,1% y 40,3%, de modo que pudiera ser incluso inferior al
31,4% obtenido antes.
Supongamos que, a su vez, aquel 31,4% se haba obtenido con una muestra
que produjo tal estimacin con error estimado de un 6,0%. Entonces el verdadero valor inicial podra verosmilmente haber sido, por ejemplo, 36,0% (nmero
que est dentro del intervalo que va de 25,4% a 37,4%, correspondiente al porcentaje estimado para el ao anterior). En sntesis, la verdad que est detrs de la
declaracin segn la cual el uso de preservativos subi de 31,4% a 35,7%, pudiera tener como realidad subyacente que el empleo de preservativos baj del
36,0% al 31,2%, ya que esta ltima afirmacin es perfectamente compatible con
los resultados que arrojaron los estudios. Otra ilustracin prctica concerniente a
este tema se desarrolla en detalle en la Seccin 3.6.

1.10.2. La zona ms probable


Una pregunta natural que suelen hacerse algunos investigadores es la siguiente: son todos los puntos del intervalo igualmente probables? Replantemosla en un marco ms especfico. Supongamos que la prevalencia de asmticos
considerada en la seccin anterior ha sido estimada como 11% con un error mximo del 2%; de modo que el intervalo de confianza sera [9%-13%]. Hay
ms razones para pensar que P sea igual a 11 % que, por ejemplo, a 12%? O, dicho de otro modo: puesto que 12 est dentro del intervalo, es tan verosmil que
P sea 12 como que P sea igual a 11, punto medio del intervalo? Es cierto que
todos los valores del segmento 9%-13% son compatibles con P, pero realmente es ms verosmil que P est ms cerca del punto medio del intervalo que
de cualquier otro punto del mismo9.

1.10.3. Intervalo de confianza como alternativa a las pruebas de hiptesis


No mucho despus de su aparicin, las pruebas de hiptesis clsicas empezaron a recibir fuertes crticas. Un detallado examen histrico y conceptual sobre
este polmico asunto se puede hallar en Silva (1999).
Diversos juicios crticos pueden encontrarse en la obra de muchos objetores
actuales y pasados del uso de las pruebas de hiptesis; entre ellos cabe mencio9
El trmino verosmil no se ha elegido slo porque sea semnticamente expresivo como recurso del
castellano (que lo es), sino porque el punto medio del intervalo es la estimacin que maximiza la funcin de
verosimilitud (es la estimacin mximo verosmil de P. Este concepto desborda el alcance del presente texto,
pero debe consignarse que toda la teora de la verosimilitud, en su momento relegada por la popularidad de las
pruebas de significacin, recupera cada da ms espacio. Vase Royall (1997).

26

DISEO RAZONADO DE MUESTRAS

nar a Rozeboom (1960), Rothman (1978), Salsburg (1985), Walker (1986),


Gardner y Altman (1986), Thompson (1987), Goodman y Royall (1988),
Goodman (1992), Chia (1997), Barnett y Mathisen (1997) y Goodman (1999).
La crtica fundamental, sin embargo, estriba en el hecho siguiente: que se encuentre o no significacin depende de un elemento externo a la realidad que se
estudia, el tamao de muestra.
Como uno de los remedios, desde hace algn tiempo se ha venido sugiriendo la estrategia de suplir las pruebas de hiptesis por el empleo de intervalos de confianza, alternativa defendida con vehemencia por diversos autores entre los que se destacan los connotados estadsticos britnicos Martin Gardner y
Douglas Altman (vanse Gardner y Altman, 1986; Gardner y Altman, 1987) vinculados al British Medical Journal, y secundada actualmente por muchos editores de revistas mdicas. (Vase: Bullpit (1987) de Lancet, Evans, Mills y Dawson (1988) de British Heart Journal, Davidoff (1999) de Annals of Infernal
Medicine). A estos dos estadsticos se debe incluso un software (Confidence Interval Analysis, CIA) que permite el cmputo de intervalos de confianza para
una amplia gama de parmetros en el caso de que la muestra haya sido simple
aleatoria.
Estos autores sugieren que los intervalos sean empleados como recurso expresivo bsico siempre que se haga una inferencia de los resultados a un mbito ms
abarcador y que concierna a medidas de resumen no a caractersticas individuales tales como tasas, diferencias de medias, coeficientes de regresin, etc.. Las
revistas mencionadas no exigen que los famosos valores p deban ser necesariamente suprimidos pero, en cualquier caso, s que ocupen a lo sumo un lugar secundario o complementario.
El argumento central en que se sustenta esta corriente de opinin proclama
que los intervalos son mucho ms informativos que el mero valor de p, ya que
ste no transmite informacin alguna sobre la magnitud de la diferencia o de la
asociacin que se valora, en tanto que el intervalo nos provee de un recorrido
de valores posibles para el valor poblacional (o compatibles con l), en lugar de
una dicotoma arbitraria. Se aade, por otra parte, que los intervalos incluyen toda la informacin necesaria para aplicar la prueba de significacin si se deseara
realizarla, puesto que, por ejemplo, si H0 establece que P1 = P2, rechazar H0 equivale a que el intervalo de confianza para P1 - P2 no contenga al cero.
Puesto que con frecuencia las pruebas de hiptesis se emplean para valorar la
diferencia entre dos parmetros, lo que debe construirse es un intervalo de confianza para la diferencia (Altman, 1980), y no formar dos intervalos (uno para
cada parmetro) con el fin de examinar si se intersecan o no; en caso de que los
datos estuvieran pareados, tal prctica no sera solamente inconveniente, sino directamente errnea.
En mi opinin, el uso de intervalos de confianza es menos inadecuado que el
de las pruebas de hiptesis, en especial porque proveen ms informacin y por

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

27

Figura 1.1. Diagrama de flujo para pronunciarse sobre una diferencia de parmetros.

aportar un enfoque ms flexible. De hecho, si se procede a estimar, pongamos


por caso, una diferencia entre medias poblacionales y se corrobora que el error
de esa estimacin es suficientemente pequeo como para considerar que dicha
estimacin es eficiente (por ejemplo, que el error es inferior al 5% de la magnitud de la propia estimacin10), lo cual equivale a que el intervalo de confianza
sea suficientemente estrecho, entonces ya se cuenta con toda la informacin necesaria para hacerse un juicio acerca del problema abordado. En efecto, lo que
corresponde hacer una vez que ha alcanzado ese punto es simplemente pronunciarse sobre la sustantividad o significacin clnica de la diferencia en cuestin.
Vale decir, el esquema de pensamiento en trminos de intervalos de confianza
ante una diferencia de dos porcentajes, sera del modo que refleja el diagrama de
flujo que se reproduce en la Figura 1.1.

1.10.4. Error absoluto y error relativo


Como se ha dicho, a travs de una muestra probabilstica se puede estimar un
parmetro P, as como el error (llammosle e) inherente a dicha estimacin; a

10

Vase el concepto de error relativo en la prxima seccin.

28

DISEO RAZONADO DE MUESTRAS

partir de ese conocimiento, se puede construir un intervalo ( P1 , P2) dentro del


cual podemos estar altamente confiados que se halle P. Generalmente (no siempre), los extremos P1 y P2 se obtienen respectivamente sustrayendo de y
sumando a la estimacin puntual P el valor e; es decir:

P1 = P e

P2 = P + e

Naturalmente, lo que se desea es que el error e sea pequeo (es decir, que el
intervalo sea lo ms estrecho posible).
Supongamos que nos informan de que la longitud de cierto objeto se ha medido
con precisin de 2 cm (es decir, que la distancia entre la medicin y la verdadera
longitud asciende a lo sumo a 2 centmetros). Es ste un error grande o pequeo?
Puede considerarse inaceptable o, por el contrario, refleja una buena precisin?
Naturalmente, no es posible pronunciarse al respecto hasta que no sepamos
de qu objeto se trata. Si lo que se ha medido es la talla de un individuo adulto,
probablemente tal precisin resulte satisfactoria; pero, obviamente, no sera se
el caso si lo que se mide es el radio de un anillo, un nmero posiblemente mucho
menor que el propio error cometido. Si lo que se midi hubiese sido, en cambio, la longitud de un autobs, entonces habra que considerar que el error
mencionado es absolutamente despreciable. En fin, para valorar o calificar la
magnitud de un error se piensa, tcita o explcitamente, en trminos relativos.
El error de muestreo no es una excepcin. Con frecuencia, despus de calcular el error asociado a la estimacin de p, se procede a computar el llamado error
relativo de la estimacin:

er =

e
p

Debe notarse que, mientras e viene dado en las mismas unidades en que se
mide la variable, er es un ndice que carece de unidades.
Consecuentemente, suele expresarse en trminos de porcentaje (es decir, multiplicado por 100). Por ejemplo, tomando las ilustraciones de la seccin precedente, diramos que el error relativo con que se estim el gasto promedio en
medicamentos fue del 4,6% en el primer caso (ya que 0,15 = 0, 046 ) y del 98,5%
3, 25
(pues 3, 20 = 0,985 ) en el segundo.
3, 25
En general se considera que un error relativo no superior al 10 % (es decir, un
valor de er inferior a 0,11) resulta aceptable a todos los efectos prcticos. Tal
consideracin emprica es compatible con nuestros puntos de vista en la vida
diaria: si una seora de 42 aos nos dice que tiene 40, diramos que est
redondeando (el error relativo es 5%), pero si nos comunica que tiene 30,
12
diramos que nos ha mentido (en ese caso er =
= 0,18).
42

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

29

1.11. Muestras y censos


El costo de los censos es enorme. sa es, precisamente, una de las razones para emplear muestras. Cada una de las preguntas supone un costo y ste ha de
multiplicarse por el tamao de la poblacin (de hogares o personas) o por el de
la muestra, si se opta por esta alternativa. Consecuentemente, los cuestionarios
empleados en los censos deben ser, en lo posible, relativamente breves y sencillos.
No obstante, cada vez con ms frecuencia se estn combinando datos propiamente censales con los obtenidos mediante encuestas por muestreo, que se incluyen como parte del propio censo. Estas muestras pueden sustituir incluso a
los censos, en cuyo caso tienden a ser de gran tamao (suelen constituir entre el
1 % y el 25% de la poblacin). Un enfoque ms verstil consiste en disear una
muestra grande que tal vez abarque un tercio o un cuarto de la poblacin) para
aquellas preguntas sobre las que se necesita gran detalle, adems de una mucho
ms pequea (abarcadora quizs del 0,5% de la poblacin) para las preguntas
ms complejas o difciles.
El muestreo no slo reduce el costo total que supone obtener estos datos; puede tambin producir mayor precisin, especialmente cuando se adoptan medidas
que mejoren la calidad del dato primario, tales como la de formar encuestadores debidamente preparados.
El uso conjunto de registros y de encuestas por muestreo est resultando exitoso; tal ha sido el caso de los pases escandinavos, que poseen unos excelentes
registros de poblacin. Por ejemplo, Dinamarca prescindi del censo desde 1980
y utiliz en su lugar las llamadas estimaciones de reas locales.

Bibliografa
Almeida N. Epidemiologa sin nmeros. Serie Paltex, N. 28. Washington: OPS/OMS,
1992.
Altman DG. Statistics and ethics in medical research: VI-presentation of results. British
Medical Journal 1992; 281: 1542-1544.
Azorn F, Snchez JL. Mtodos y aplicaciones del muestreo. Madrid: Alianza, 1986.
Barnett ML, Mathisen A Tyranny of the p-value. Scandinavian Journal of Work and Environmental Health. 1997; 23: 152-154.
Baum F. Investigacin en salud pblica: el debate sobre las metodologas cuantitativas y
cualitativas. Revisiones en Salud Pblica 1977,5: 195-199.
Boudon R. Los mtodos en sociologa. Buenos Aires: El Ateneo, 1978.
Bullpit CJ. Confidence intervals. Lancet 1987; i: 494-497.
Castellanos PL. Algunas tcnicas para el estudio de lo subjetivo, los problemas cuasiestructurados y el estudio de la situacin de salud OPS/OMS. Presentado en la Reunin

30

DISEO RAZONADO DE MUESTRAS

sobre abordajes y mtodos para estudiar diferenciales de salud segn condiciones de


vida. Brasilia 7-11 de agosto de 1989.
Cochran WG. Sampling techniques (3.a ed.) New York: Wiley, 1977.
Cochran WG, Mosteller F, Tukey JW. Principies of sampling. Journal of the American
Statistical Association 1954; 49: 1-12.
Chid K.S. Significant-itis: an obsession with the P-value. Scandinavian Journal of Work
and Envimmental Health 1977; 23: 152-154.
Dalenius T. Elements of survey sampling. Estocolmo: The Swedish Agency for Research
Cooperation with Developing Countries, 1985.
Davidoff F. Standing satatistics right side up. Annals of lnternal Medicine 1999, 130:
1019-1021.
Deming WE. Sample design in business research. New York: Wiley, 1960.
Evans SJW, Mills P, Dawson J. The end of the p value? British Heart Journal 1988; 60:
177-180.
Gardner MJ, Altman DG. Using confidence intervals. Lancet 1987; i: 746.
Gardner MJ, Altman DG. Confidence intervals rather than P values: estimation rather
than hypothesis testing. British Medical Journal 1986; 292: 746-750.
Goodman SN. p values, hypothesis test, and likelihood: implications for epidemiology
of a neglected historical debate, American Journal of Epidemiology, 1992; 137:485495.
Goodman SN, Royall R. Evidence and scientific research. American Journal of Public
Health 1988; 78: 1568-1574.
Goodman SN, Toward evidence-based medical statistics. 1: The P value fallacy. Annals
of lnternal Medicine 1999, 130: 995-1004.
Gurvitch G. La voaction actualle de la sociologie. Pars: Presses Universitaires de France, 1950.
Hansen MH, Hurwitz WN, Madow WG. Sample survey methods and theory. New York:
Wiley, 1953.
IASS. Members directory. Pars: International Association for Survey Statisticians,
1997.
Jessen RJ. Statistical survey techniques. New York: Wiley, 1978.
Keller S. Use of non-representative surveys for etiological problems. En: Honson NL
(ed). New developments of Survey Sampling. New York: J Wiley and Sons, 1969.
Kalton G. Introduction to survey sampling. California: Sage Publications, Beverly Hills,
1983.
Kish L. Sampling methods for agricultural surveys. Roma: FAO Statistical Development, Series 3, 1989.
Kish L. Survey sampling. New York: Wiley, 1965.
Levy PS, Lmeshow S. Sampling for health professionals Belomont: Lifetime Learning
Publications, 1980.
Murthy MN. Sampling theory and methods. Calcutta: Statistical Publishing Society, 1967.
Neyman J. On the two different aspects of the representative method: The method of
Stratrified sampling and the method of positive selection. Journal of the Royal
Statistical Society 1934; xx: 558-606.
Parada J. Textos de muestreo en poblaciones finitas en castellano. Estadstica Espaola
1987; 115: 123-132.

MARCO CONCEPTUAL DE LAS TCNICAS MUESTRALES

31

Prieto L. Ms all de los mtodos cuantitativos y cualitativos: el mtodo cientfico. Revisiones en Salud Pblica 1997, 5: 195-199.
Raj D. Sampling theory. New York: McGraw-Hill, 1968.
Rothman KJ. A show of confidence. New England Journal of Medicine 1978; 299;
1362-1363.
Royall RM. Statistical evidence: a likelihoud paradigm. Boca Ratn: Chapman & Hall,
1997.
Rozeboom WW. The fallacy of the nuil hypothesis significance test. Psychological Bulletin 1960; 56: 26-47.
Salsburg D. The religion of statistics as practiced in medical journals. The American
Statistician 1985; 39: 220-223.
Sampford MR. An introduction to sampling theory with applications to agriculture.
Edinburh: Oliver and Boyd, 1962.
Scheaffer RL Mendenhall W, Ott L. Elementary survey sampling. North Scituate, Massachussets: Duxbury Press, 1979.
Silva LC. El razonamiento en las aplicaciones de la estadstica; nociones conceptuales
y terminolgicas. Revista Cubana de Administracin de Salud 1977; 3: 275-279.
Silva LC. Apuntes sobre el proyecto de investigacin del estudiante de posgrado. Revista de Educacin Mdica Superior 1989; 3: 29-40.
Silva LC. La formulacin de problemas de investigacin en salud. Revista Cubana de
Cardiologa y Ciruga Cardiovascular 1991; 5:64-71.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: Una mirada crtica. Madrid: Daz de Santos, 1997.
Silva LC. La crisis de las pruebas de hiptesis y la alternativa bayesiana. Memorias del
IV Congreso Galego de Estadstica e Investigacin de Operaciones, Santiago de
Compostela, noviembre de 1999.
Slonim MR. Sampling in a nutshell. New York: Simon and Schuster, 1960.
Som RK. A manual of sampling techniques. London: Heinemann Educational Books
Ltd., 1973.
Stephan FF, McCarthy PJ. Sampling opinions. London: Chapman and Hall, 1958.
Stuart A. The idea of sampling. High Wycombe: Charles Griffin and Company, 1984.
Sukhatme PV, Sukhatme BV, Sukhatme S, Asok C. Sampling theory of surveys with
applications. Ames, Iowa: Iowa State University Press, 1984.
Thompson WD. Statistical criteria in the interpretation of epidemiologic data. American
Journal of Public Health 1987; 77: 191-194.
Walker AM. Reporting the results of epidemiologic studies. American Journal of Public
Health (Different Views) 1986; 76: 556-558.
Warner L. The status system of a modern community New Haven: Yale University
Press, 1947.
Williams B. A Sampler on sampling. New York: Wiley, 1978.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.
Yates F. Sampling methods for censuses and surveys. London: Charles Griffin & Co.,
1980.

2
La encuesta y el cuestionario

Aunque las tcnicas mustrales pueden emplearse en principio en cualquier


tipo de universo, lo cierto es que sus aplicaciones en el mbito sanitario se verifican predominantemente sobre poblaciones humanas, especialmente para interrogar individuos y en ocasiones tambin para medirlos (registrar resultados captados
con o sin instrumentos). Tpicamente, entonces, el interrogatorio est presente en
las investigaciones de salud pblica y epidemiologa, en especial en aquellas que
tienen un componente social. De ah su estrecho vnculo con el muestreo.
Para dar solucin a un problema de muestreo en tal tipo de situacin es
necesario por tanto programar una encuesta, actividad compleja que exige alto
grado de organizacin y demanda colaboracin de profesionales y tcnicos de
diversas especialidades y perfiles.
De modo que las tcnicas mustrales y las encuestas, aunque no estn inexorablemente vinculadas entre s, suelen venir aparejadas. El presente captulo
procura profundizar en los ms importantes aspectos tcnicos en esta materia.

2.1. Organizacin de la encuesta


2.1.1. Las tareas bsicas
Una vez definidos los objetivos de la encuesta, los pasos fundamentales que
deben darse para completar el proceso de su aplicacin son, en esencia, los siete
siguientes:
1.
2.
3.
4.

Redactar un cuestionario.
Confeccionar un plan de tabulacin y anlisis.
Construir un marco muestral adecuado.
Disear la muestra.

34

DISEO RAZONADO DE MUESTRAS

5. Aplicar el cuestionario a las unidades elegidas.


6. Procesar la informacin.
7. Realizar inferencias.
Sin embargo, la buena prctica de las encuestas no permite que estas tareas se
completen de manera lineal. Es altamente recomendable, por poner un ejemplo,
realizar una experiencia piloto que retroalimente a los investigadores y les permita realizar enmiendas al proyecto original.
El esquema recogido en la Figura 2.1 e inspirado en un folleto divulgativo
de la American Statistical Society presenta la secuencia e interrelaciones de las
acciones que se deben concretar para el exitoso desarrollo de una encuesta por
muestreo.
Las flechas del diagrama indican el orden de precedencia de las acciones. Por
ejemplo, para el desarrollo de la encuesta piloto, nodo crucial del proceso, se observa que hay dos actividades previas, ambas igualmente medulares: confeccionar el proyecto de cuestionario y establecer la forma en que se habra de tomar la
informacin primaria en terreno. Por otra parte, una vez llevado a cabo dicho
pilotaje, sus resultados influirn en el desarrollo de tres tareas: concluir el diseo muestral, ajustar el cuestionario y definir las formas definitivas de trabajo en
la prctica (tales como seleccin de horarios, estimacin del tiempo que supone
completar el cuestionario e identificacin de aspectos cuya calidad debe ser especialmente controlada). Por otra parte, como muestra el diagrama, el proceso

Figura 2.1. Diagrama de la organizacin y desarrollo de una encuesta por muestreo.

LA ENCUESTA Y EL CUESTIONARIO

35

completo incluye un amplio conjunto de acciones a cuya eficiencia se subordina en buena medida la calidad de los resultados finales.

2.1.2. Errores ajenos al muestreo


A lo largo de la encuesta pueden introducirse errores ajenos al hecho de que
la informacin proceda de una muestra (y no de un censo). No son errores
inherentes al proceso inferencial, sino a las diversas actividades prcticas que
deben ejecutarse. stos reciben el nombre de errores no mustrales y pueden
producirse por deficiencias en aspectos tales como el diseo del cuestionario,
la estructura o redaccin de las preguntas o durante el registro de la informacin.
Es difcil minimizar la importancia de este tipo de errores. Ocasionalmente se presta atencin priorizada a los errores de muestreo y se consigue
reducirlos en unos pocos puntos de porcentaje o, incluso, fracciones de punto; y al mismo tiempo, se desdean los principios que deben observarse al disear el cuestionario. Sin embargo, varios experimentos de vieja data ponen
en evidencia que el monto potencial de error inducido por preguntas deficientemente formuladas puede superar los 20 o los 30 puntos de porcentaje
(Payne, 1951). Lo ms llamativo del asunto es que, mientras incrementar la
precisin refinando el diseo muestral o aumentando el tamao de muestra
puede hacer crecer notablemente los costes, el proceso de mejorar el cuestionario del que provienen los datos es, en cambio, sumamente econmico
por lo general (Fowler, 1995).
Con el fin de aportar elementos que permitan disminuir el margen de informacin primaria inservible o de dudosa calidad, vale la pena detenerse en las
tcnicas de confeccin de cuestionarios.

2.2. El cuestionario
Un cuestionario es un documento concebido para ayudar en el proceso de
obtener y registrar informacin a travs de una secuencia de preguntas o mediciones. En lo que resta de este captulo, nos concentraremos en aquella informacin que se procura obtener a travs de preguntas; stas, a diferencia de las
mediciones fsicas que se realizan por medio de instrumentos, suelen constituir
la nica va para obtener informacin medular que permita alcanzar los objetivos
de una investigacin. Por una parte, como es obvio, no hay otro modo de medir
niveles de satisfaccin, sentimientos o grados de concordancia con una opinin.
Por otra parte, la medicin de la magnitud o la frecuencia con que el individuo

36

DISEO RAZONADO DE MUESTRAS

realiza o ha realizado ciertas actividades a menudo exige de una indagacin directa. Por ejemplo no todos los delitos son denunciados a la polica ni todos los
episodios morbosos registrados por el sistema de salud, de modo que el testimonio de los propios individuos puede ser la nica va confiable para hacer
estimaciones adecuadas relacionadas con la seguridad ciudadana o el estado de
salud de la poblacin. Ha de tenerse en cuenta, adems, que incluso lo que queda registrado puede ser diferente de lo que el sujeto es capaz de testimoniar (Jabine, 1987).
Los aspectos que se tratan a continuacin procuran demostrar que tanto
las modalidades de aplicacin como la forma en que se disean las preguntas
tienen notable importancia. Durante muchos aos se subvalor la relevancia
de estos aspectos y en el mejor de los casos se consideraban pertenecientes a
la esfera del sentido comn. Ms recientemente, sin embargo, el tema ha alcanzado mayor prominencia y ha sido objeto de no pocos y reveladores experimentos. Se ha desarrollado un marco terico altamente estructurado y ya
se dispone de textos exclusivos que tratan el asunto con todos los requerimientos de una disciplina cientfica consolidada. Entre los ms destacados cabe mencionar los libros de Tanur (1992), Fowler (1995) y Sudman, Bradburn
y Schwarz (1995).

2.2.1. Formas de aplicacin


Los modos en que un cuestionario puede aplicarse son, esencialmente, cuatro: a travs de un encuestador o entrevistador, usando cuestionarios autoadministrados, (el propio sujeto interrogado lo cumplimenta), mediante indagacin
telefnica, y procurando respuestas por correo. En cuanto al registro de
respuestas, se manejan dos alternativas fundamentales: la modalidad clsica,
consistente en que se transcriban al papel los resultados, y las variantes en las
que el proceso de registro se auxilia de la computadora.
Para decidir la modalidad que se emplear, el sentido lgico del investigador
se complementar, entre otros factores, con la naturaleza del tema abordado, las
caractersticas culturales de la poblacin que se estudia y los recursos disponibles. Es evidente, por ejemplo, que la autoenumeracin es ms apropiada cuando la encuesta se aplica a sujetos que se hallan reunidos que a individuos aislados, o que hay informacin que no puede recabarse telefnicamente por exigir
una apreciacin visual directa, como cuando la encuesta incluye, por ejemplo, un
examen dental.
Ocasionalmente se hacen combinaciones; por ejemplo, se ha comprobado
que las entrevistas telefnicas son mas tiles y viables cuando se realizan despus de haberse producido las entrevistas personales (supuesto, naturalmente,
que el estudio exija tal seguimiento).

LA ENCUESTA Y EL CUESTIONARIO

37

La encuesta asistida por ordenador, bautizada como CADAC (Computer


Assisted Data Collection) est planteando oportunidades insospechadas hasta
hace poco, especialmente si se tienen en cuenta las posibilidades que abren
INTERNET.
La oportunidad de hacer exmenes de consistencia de las respuestas simultneamente con su registro (y por ende, de realizar in situ las enmiendas que procedan), adems del ahorro de papel, personal y tiempo que supone, ha llevado a
la entusiasmada adopcin de dicho mtodo por muchas agencias especializadas
y por cada vez ms equipos investigadores. Los efectos de tal procedimiento
estn siendo estudiados desde finales de los aos ochenta (Saris, 1989; Weeks,
1992; Nicholls, Baker y Martin, 1986). De hecho, se han manejado dos variantes
fundamentales: el uso de las computadoras para el desarrollo de entrevistas
(Baker, 1992; Couper y Burt, 1994) y su aplicacin en los cuestionarios
autoadministrados (O'Reill et al, 1994).
Cabe esperar que este proceso renovador siga extendindose en la medida
que se generalicen otras tecnologas de acceso a informantes potenciales como el correo electrnico, que despert inters a estos efectos desde su surgimiento (Kiesler y Sproull, 1986) en virtud de la nueva y atractiva posibilidad
de realizar encuestas sin necesidad de contactar ni fsica ni verbalmente con los
encuestados.

2.2.2. Ubicacin de las preguntas


Se acostumbra a colocar mecnicamente todas las preguntas generales
(nombre, gnero, ocupacin, etc.) al comienzo de la encuesta. No necesariamente es sta una decisin ptima. Como ocurre con cualquier decisin que
se adopta rutinariamente, puede ser en unos casos atinada y en otros no. En
particular, pudiera ser conveniente colocar algunas de estas preguntas en otros
puntos del cuestionario, de manera que se evite un largo y aburrido tramo inicial, y tambin porque algunas preguntas generales pueden ser ocasionalmente embarazosas.
Otra pregunta relevante es cul debe ser la estrategia para ubicar las preguntas que, tocando temas desagradables o embarazosos, son, sin embargo, de vital
importancia para el estudio? Una recomendacin casi universalmente admitida
es que no deben colocarse al principio del cuestionario. Se ha sugerido, incluso,
que se deben dejar todas las preguntas conflictivas para el final, sonsacar
cuanto se pueda sobre ellas y dar por terminada la entrevista si surgen problemas. Este enfoque podra por una parte ser ticamente cuestionable, pero adems
revela una forma de facilismo difcil de defender, ya que sugiere como legtimo
que queden preguntas en blanco a la vez que no invita a una reflexin crtica
orientada a evitar tal contingencia.

38

DISEO RAZONADO DE MUESTRAS

2.2.3. Tipos de preguntas


Las preguntas pueden ser caracterizadas segn distintos ejes de clasificacin. Por ejemplo, atendiendo al grado de aporte que se espera del interrogado,
pueden ser abiertas o cerradas, o desde el punto de vista mtrico, pueden ser
cualitativas o cuantitativas.
Cada tipo de preguntas puede ofrecer dificultades especficas en cuanto al
modo de manejar los resultados, lo cual a su vez depende en muy buena medida
del objetivo con que se formula. Haremos algunos comentarios al respecto en la
medida que se considere oportuno para las diferentes modalidades que se comentan en las secciones siguientes.
2.2.3.1. Preguntas cerradas y abiertas
Lo ms frecuente es formular preguntas cerradas, aqullas cuyas respuestas
posibles han sido previstas en su totalidad por el investigador y se ofrecen al
encuestado para que l elija la que mejor se ajuste a su situacin. Tal suele ser
el caso bien familiar en que se indaga el gnero (masculino/femenino), el estado civil, o el grupo tnico al que pertenece el sujeto; tambin estn en ese caso
aquellas preguntas de opinin que exigen posicionamiento del interrogado segn
una escala ordinal, como la siguiente:
Cmo cree usted que ha sido la gestin del gobierno en materia de
salud ambiental en el ltimo ao?
___
___
___
___
___

muy eficiente
eficiente
aceptable
ineficiente
muy ineficiente

Mucho se ha investigado acerca de cules y cuntas categoras emplear. Hay


consenso en que no deben usarse ms de 10 (Andrews, 1984), aunque un nmero entre 5 y 7 suele ser lo ms adecuado.
La capacidad discriminatoria de la misma pregunta puede verse apreciablemente modificada por las opciones de respuesta con las cuales se cierra. Por
ejemplo, consideremos las siguientes opciones:
Cmo considera usted que es su estado de salud actualmente?
Bueno ____

Malo ___

LA ENCUESTA Y EL CUESTIONARIO

39

Cmo considera usted que es su estado de salud actualmente?


Bueno____

Aceptable ____

Malo ____

Cmo considera usted que es su estado de salud actualmente?


ptimo ____

Muy bueno ____

Bueno_____

Regular____

Malo

El porcentaje de los que optan por la ltima categora (estado de salud malo) disminuira en la medida que el nmero de alternativas se incrementa.
Quiere esto decir que la interpretacin del resultado no puede hacerse al margen del contexto que configura el conjunto de respuestas posibles. Consecuentemente, nuestro pensamiento debe operar en sentido inverso: elegir ese
conjunto en funcin de lo que realmente queremos que constituya una gua para la interpretacin.
Cuando la pregunta es abierta el entrevistado responde redactando (o exponiendo, verbalmente, segn el caso) su respuesta de manera libre. Se preguntara, por ejemplo:
Cul es su opinin acerca del grado de eficiencia de la gestin gubernamental en materia de sanidad ambiental?
Y se dara en espacio para verter dicha opinin.
2.2.3.2. Preguntas cuantitativas o cualitativas
Las que hemos llamado cuantitativas son aqullas cuya respuesta consiste
en un nmero; por una parte, estn las dimensiones objetivamente medibles
(aos cumplidos, colesterolemia o circunferencia ceflica) y, por otra, las cuantificaciones en que interviene la subjetividad del sujeto interrogado (cuntos hijos quisiera tener, o qu salario le parecera justo percibir). Las cualitativas, por
su parte, son aquellas en que se desemboca en una clasificacin, como ocurre
con la actividad ocupacional o el grupo sanguneo.
2.2.3.3. Preguntas de ordenacin
En las preguntas de ordenacin se pide al entrevistado que ubique jerrquicamente una serie de alternativas de acuerdo con su preferencia personal o teniendo en cuenta algn otro marco referencial.

40

DISEO RAZONADO DE MUESTRAS

Dos ejemplos son los siguientes:


Ponga en orden de importancia para su vida numerndolos del ms importante (1) al menos importante (5):
__
__
__
__
__

trabajo
dinero
relaciones de amistad
relaciones de pareja
salud

En qu orden cronolgico deben a su juicio introducirse los alimentos siguientes a los nios durante su primer ao de vida?
Poner nmeros del 1 al 4 o.
__
__
__
__

zumos de frutas
pescado
carne de res
cereales

Cabe distinguir dos situaciones diferentes: cuando existe y cuando no existe


un orden ptimo (o correcto). El segundo ejemplo ilustra el caso en que tal orden
existe (segn OMS, primero debe introducirse el cereal, y luego los granos, la
carne y el pescado por ese orden). Aqu las alternativas de anlisis son diversas:
desde computar el porcentaje de sujetos que colocan cierta categora en primer
lugar hasta el lugar promedio que ocupa una categora. En el primero, obviamente, no existe una ordenacin que pueda considerarse correcta o incorrecta.
Un tipo de pregunta singular dentro de esta lnea se produce cuando se
solicita al interrogado que coloque en cierto orden un conjunto de nominaciones. Tal es el caso de lo que Linniger y Warwick (1978) llaman una
tcnica sociomtrica, que se emplea para obtener informacin sobre el
patrn de sentimientos positivos y negativos entre los miembros de un grupo. Se insta a cada integrante del grupo a que haga un nmero limitado de
nominaciones, e indique a aquellas personas de su entorno que ms quieren o admiran, o a quienes consideran ms adecuadas a ciertos efectos. La
ilustracin que sigue est tomada de un estudio de normas comunitarias en
un colegio norteamericano (Bennington College) realizado por Newcomb y
col. (1967):

LA ENCUESTA Y EL CUESTIONARIO

41

Supongamos que durante el prximo invierno habr una importante


reunin de representantes de los estudiantes de cada uno de los tipos de
colegios norteamericanos. Cada colegio seleccionado deber estar representado por tres estudiantes que sern elegidos por sus compaeros. Es lgico suponer que este colegio ser juzgado, en buena medida, por los estudiantes que lo representen. Por favor, anote debajo los nombres de por lo
menos dos estudiantes (y no ms de cinco) a quienes usted admire en forma especial, independientemente de las razonas que tenga para ello.

2.2.3.4. Preguntas de escala


Las preguntas de escala pueden ser de varios tipos. Las ms importantes se
exponen e ilustran a continuacin:
1. Escala de analoga visual
La escala analgica visual se compone de una pregunta y de un segmento
de recta (de 8 a 10 centmetros de longitud) en cuyos extremos se colocan calificaciones opuestas tales como sin dolor y mximo dolor imaginable y sin
texto adicional que califique las posiciones intermedias. El interrogado debe
colocar una marca en el punto del segmento que considere ms adecuado a su situacin. Por ejemplo, en una encuesta a pacientes asmticos puede aparecer la
siguiente pregunta:
Cuan fuertes han sido los ataques asmticos que ha sufrido en la ltima
semana?
No tuve __________________________________________________ De extrema
ataques
intensidad

Huskisson (1974) ha sealado que el 7 % de los pacientes interrogados por


este medio tuvo dificultades para comprender la demanda. Este mismo autor con
un colega (Scott y Huskisson, 1979) emple con xito, sin embargo, este tipo
de escalas para medir cambios tras un tratamiento. El inters de este enfoque
radica en que, si bien la personalidad de cada sujeto llevara a que ste quede
ubicado segn su propia metrizacin subjetiva, tal problema afectara a ambas
magnitudes (antes y despus del tratamiento), de modo que la distancia entre
ellas medira la diferencia, con lo cual se mitigara o, incluso, se cancelara el
efecto de la subjetividad individual.

42

DISEO RAZONADO DE MUESTRAS

2. Escala de Likert
Para la valoracin del grado en que un individuo comparte cierta lnea de
pensamiento o teora general, un tipo de escala adecuada es la propuesta por Likert (1952).
Para aplicarla se considera una secuencia de afirmaciones (se ha sugerido que
sean alrededor de 15) que se pronuncian (algunas a favor y otras en contra) acerca de determinado punto de vista general; para cada afirmacin la persona encuestada debe elegir en cada caso una de varias (usualmente 5) alternativas, que
expresan diversos grados de adhesin a dicha posicin. Por ejemplo, las afirmaciones y las alternativas de respuesta que se ofrecen al entrevistado para cada una de las afirmaciones podran ser como las dos que se enuncian a continuacin:

A) La prctica de la medicina privada es altamente conveniente


1.
2.
3.
4.
5.

Discrepo totalmente.
No lo comparto.
Lo comparto slo parcialmente.
Estoy de acuerdo en lo esencial.
Estoy totalmente de acuerdo.

B) Resulta inaceptable tratar la salud como una mercanca ms


1.
2.
3.
4.
5.

Discrepo totalmente.
No lo comparto.
Lo comparto slo parcialmente.
Estoy de acuerdo en lo esencial.
Estoy totalmente de acuerdo.

ndice de adherencia para escalas tipo Likert. Supongamos que en un estudio en que se emplean escalas tipo Likert hay k afirmaciones y que el interrogado debe optar por una de r alternativas que se ofrecen para cada una de ellas.
Llamemos x a la opcin elegida ante la afirmacin i-sima (por ejemplo x6 = 2 si
el sujeto eligi la segunda respuesta para la sexta afirmacin), se puede computar entonces un ndice de Adherencia (IA) mediante la frmula:

LA ENCUESTA Y EL CUESTIONARIO

43

El valor de IA se mueve dentro del intervalo (0, 1) e indica el grado en que


el sujeto interrogado simpatiza con la corriente de opinin o punto de vista cuyo
apoyo se investiga: IA = 1 indicara absoluta adherencia, y el valor IA = 0 significara discrepancia total.
Imaginemos, por ejemplo, que hay k = 9 afirmaciones y r = 5 alternativas (supongamos que para esta ilustracin las afirmaciones que ocupan los lugares impares son positivas y las que ocupan los lugares pares son negativas), y que las
respuestas (x1, x2,..., x3) son respectivamente las siguientes: 1, 3, 4, 5, 5, 2, 2, 2 y 5.
El cmputo de IA arrojara, entonces, lo siguiente:

IA =

(0 + 2 + 3 + 0 + 4 + 3 + 1 + 3 + 4)
(9)(5)

20
45

= 0, 44

3. Escala semntica diferencial


Este mtodo (Osgood, Suci y Tannembaum, 1957) utiliza una serie de alternativas de evaluacin (usualmente con un nmero de opciones entre 7 y 10)
colocadas entre dos polos que representan posiciones opuestas: bueno-malo,
agradable-desagradable, positivo-negativo, fuerte-dbil o excitable-tranquilo.
Qu le parece el funcionamiento del sistema sanitario actual?
Psimo

ptimo

Por ejemplo, al indagar sobre el trabajo del sistema sanitario en la comunidad, podra preguntarse:
Cabe advertir que al construir escalas de este tipo los investigadores suelen
poner todo el nfasis en las palabras elegidas para ubicar en los extremos y desdea el efecto que sobre el interrogado ejercen los valores numricos ofrecidos.
Para ilustrar la importancia que puede alcanzar tal efecto, consideremos la experiencia siguiente. Se pregunta sobre el grado en el cual el sujeto cree que su vida
ha sido exitosa y que se ofrecen 11 alternativas de respuesta. Consideremos que
hay dos formatos alternativos, ambos creciendo desde absolutamente inexitosa a
absolutamente exitosa. La pregunta es la misma, pero la semitica de la escala
empleada se modifica. Una posibilidad consiste en que la escala vaya de 0 a 10:
Cuan exitosamente dira usted que ha sido su vida?
Absolutamente
inexitosa

10

Absolutamente
exitosa

44

DISEO RAZONADO DE MUESTRAS

Otra variante es plantear una escala que va de -5 a 5:


Cun exitosamente dira usted que ha sido su vida?
Absolutamente
inexitosa

-5

-4

-3

-2

-1

Absolutamente
exitosa

Qu significan los puntos extremos para el interrogado? La condicin absolutamente inexitosa, qu quiere decir?, que el sujeto ha padecido una
ausencia total de xitos, o que su vida ha estado signada por grandes fracasos
explcitos? Se ha comprobado que los interrogados acuden a la propia escala numrica para responderse a s mismos esta pregunta, y por ende, para descifrar lo
que en realidad se les est preguntando.
Un estudio realizado con 1.025 adultos asignados aleatoriamente a cada una
de las dos alternativas (Schwarz y col., 1991) produjo resultados claramente
diferenciados, como muestra la Tabla 2.1. La escala que va de -5 a +5 subraya la
polaridad entre los extremos y hace pensar en que el extremo inferior concierne
a grandes fracasos, mientras que la que va de 0 a 10 hace pensar que se trata de
ausencia de xitos apreciables.
Tabla 2.1. Distribucin de respuestas segn valores en cada una de las
escalas numricas

LA ENCUESTA Y EL CUESTIONARIO

45

Los resultados son elocuentes por s mismos, pero llamo la atencin sobre
uno de ellos: el porcentaje de sujetos que se ubican en el punto medio de la escala o menos asciende a 34 para la escala de 0 a 10 y slo a 13 (casi un tercio!)
para la que va de -5 a +5.
4. Escalas grficas
Andrews y Withey (1976) sugirieron el uso de un recurso grfico como el que
se muestra a continuacin, especialmente para la medicin de sentimientos.
Una pregunta tpica podra ser como sigue:

Cul de las siguientes caras expresa mejor cmo Ud. se siente con respecto
a la atencin de enfermera que recibe en la consulta?

2.3. Indicaciones para el diseo de cuestionarios y redaccin de


preguntas
La eleccin, organizacin y redaccin de las preguntas constituye un proceso complejo y delicado, que exige reflexin y paciencia, especialmente para revisar una y otra vez el proyecto de cuestionario de manera que nunca se traspase el umbral crtico que supone su aplicacin en el terreno hasta que no se tenga
razonable certeza de que cumple las debidas condiciones.
A continuacin se enuncian, comentan e ilustran, por una parte, algunas
recomendaciones generales que a mi juicio, han de contemplarse en el proceso
de concepcin y construccin del cuestionario y, en segundo lugar, una serie de
pautas especficas que cabe tener en cuenta en el momento de confeccionar los
interrogantes.

2.3.1. Recomendaciones generales para la construccin del cuestionario.


La lista de 10 recomendaciones generales es la siguiente:

46

DISEO RAZONADO DE MUESTRAS

1. Comprobar que las preguntas que se realizan se deriven exclusivamente


de las que se haya formulado el investigador
2. Conformar cuestionarios tan breves como sea posible
3. Conseguir que las preguntas sean autoexplicativas
4. Reducir al mximo las preguntas que exijan rememoracin a largo plazo
5. Evitar las preguntas abiertas salvo situaciones excepcionales
6. Emplear la tcnica de retrotraduccin siempre que la encuesta original
haya sido redactada en otro idioma
7. Tener en cuenta que el interrogado suele no adoptar una posicin
crtica ante la redaccin o la forma de la pregunta
8. Reparar en que el interrogado tiende a preocuparse ms por la imagen
que da, que por la exactitud de la informacin que comunica
9. Valorar la conveniencia de usar una pregunta de filtro antes que indagar directamente sobre determinada conducta u opinin
10. Tener en cuenta que una pregunta que procure obtener una opinin, si se
proyecta sobre otra persona, puede conseguir ms veracidad que cuando
se reclama de manera directa
A continuacin se discuten e ilustran una por una estas recomendaciones. Debe sealarse que la totalidad de los ejemplos que se citan proceden de estudios
reales. Algunos de ellos son trabajos de tesis de terminacin de maestra o de especialidad desarrollados por alumnos de la Facultad de Salud Pblica de La Habana. En estos casos no se trata, por tanto, de estudios realizados por profesionales del muestreo o especialistas en confeccin de encuestas; creemos que,
justamente, eso le confiere ms inters, pues muchos de estos ejemplos recogen
el tipo de errores en que pudieran incurrir los destinatarios neutrales del presente libro.
1. Comprobar que las preguntas que se realizan se deriven exclusivamente de
las que se hayan formulado el investigador
Deben evitarse todos los aspectos para los que no se haya previsto un
tratamiento derivado de las preguntas de investigacin previamente formuladas. Se trata de conjurar uno de los errores ms frecuentes: el de confeccionar cuestionarios que recogen una gran cantidad de informacin relacionada
con lo que se est investigando, pero cuya funcin real, en rigor, no se ha
previsto.

LA ENCUESTA Y EL CUESTIONARIO

47

Especialmente frecuentes (y perniciosas) son las preguntas inerciales,


aquellas que se hacen con el argumento de que son importantes. Argir que se
incluye cierta pregunta en un cuestionario porque es importante, es esencialmente lo mismo que decir que se incluye porque se incluye. Si el investigador
cree firmemente que cierta pregunta ha de integrar el cuestionario pese a que no
se derive de objetivo alguno, entonces ser necesario revisar los objetivos; pero
es crucial que haya consistencia entre los propsitos del estudio y el contenido
del cuestionario.
2. Conformar cuestionarios tan breves como sea posible
Cualquiera que haya diseado un cuestionario sabe o debera saber que
los temas que en l deben incluirse han de ser slo aquellos determinados por
los problemas que se quieren resolver, como se seala en la recomendacin
anterior. Sin embargo, aun bajo esta premisa hay un grado ineludible de relatividad, y por ende, un margen objetivo para adoptar decisiones personales:
siempre es posible incluir menos o ms preguntas; por eso mismo no huelga
insistir en que a veces los cuestionarios abarcan un crecido nmero de preguntas de las cuales slo una pequea porcin ser efectivamente utilizada, en
tanto que el resto ser desechado una vez que se llegue a la fase de anlisis
de las respuestas. Es crucial hacer un esfuerzo para evitar tal despilfarro de recursos materiales, tiempo y energa. Por otra parte, los cuestionarios muy largos producen fatiga y desestmulo en el sujeto interrogado, y siempre ser
preferible sacrificar, llegado el caso, parte de los objetivos en aras de preservar la calidad del dato primario.
3. Conseguir que las preguntas sean autoexplicativas
De ser posible, deben evitarse aquellas preguntas cuyas respuestas demanden
de instructivos para los encuestadores (con ms razn, para los propios entrevistados, en caso de que se planifique usar un cuestionario autoadministrado). La
experiencia generalizada dice que el personal designado para la tarea de recoger los datos no consulta instructivo alguno sino que, en el mejor de los casos, se
conduce segn la comprensin que haya alcanzado durante la etapa preparatoria sobre la naturaleza de las preguntas. Por ejemplo, es mejor solicitar a una
mujer que: Seale el nmero de veces que ha quedado embarazada, se haya o
no producido el parto antes que preguntar por el nmero de embarazos aclarando al enumerador en un documento independiente que ese nmero incluye
tanto los partos como los abortos.
En lnea con esta recomendacin, se halla el hecho claramente demostrado
(Mangione, Fowler y Louis, 1992) de que aquellos interrogantes que ms esclarecimiento necesiten de los entrevistadores, peores resultados producen.

48

DISEO RAZONADO DE MUESTRAS

4. Reducir al mnimo las preguntas que exijan rememoracin a largo plazo


El inters del investigador casi nunca es equivalente al de los sujetos interrogados; es por ello que facilitar la cooperacin de estos ltimos se torna medular.
Debe intentarse que las respuestas emerjan rpidamente de la memoria, sin la
menor dificultad; para ello es altamente recomendable evitar las preguntas que
exijan rememoracin a largo plazo.
Cuando se reclama informacin sobre acontecimientos muy lejanos, el sesgo
se incrementa, pues el interrogado puede no recordar lo que se le pide y responder, si llega a hacerlo, de modo tentativo y ajeno a todo rigor.
Segn Lehnen y Skogan (1981), en la Encuesta Nacional de Salud de Estados
Unidos, cuando se pregunta el nmero de das de trabajo perdidos por razones de
salud, el reclamo se cie a las ltimas dos semanas precisamente por el temor al
incremento de imprecisiones que cabe esperar si se elige un lapso mayor.
Sin embargo, es preciso tener en cuenta que, independientemente del lapso
transcurrido, los errores son ms frecuentes cuando se indaga sobre sucesos comunes o de poca importancia; por ejemplo, es ms fcil recordar detalles sobre
una enfermedad aguda padecida aos atrs, que el nmero de veces que se ha sufrido dolor de cabeza en el ltimo bimestre. Tambin se ha demostrado que,
cuanto ms prximo haya sido un acontecimiento con la manera de pensar o los
deseos del interrogado, con ms facilidad dicho acontecimiento ser recordado
por l (Eisenhower, Mathiowetz y Morganstein, 1991).
5. Evitar las preguntas abiertas salvo situaciones excepcionales
Sobre todo cuando el mtodo empleado se inscribe en el ambiente de las tcnicas cualitativas (vase Seccin 1.2.2.), las preguntas abiertas pueden ser enteramente apropiadas. Si se indaga acerca de cul es la comida favorita, es imposible anticipar todas las respuestas posibles. A veces, lo que se quiere es
justamente una descripcin personal que obliga a dar la palabra al encuestado.
Tal sera el caso, por ejemplo, de un estudio sobre el grado de esfuerzo que ha
de hacer el sujeto en su trabajo; en tal caso, lo ms oportuno sera pedir: Describa a grandes rasgos el trabajo que realiza, o de uno que intente desbrozar
los trillos por los cuales se desarrolla la epidemia de SIDA, en el cual podra ser
til preguntar a los sujetos seropositivos: Cmo cree Ud. que se infest con
el VIH?. En tales circunstancias, la respuesta del sujeto no puede encasillarse
de ninguna manera a priori pues, justamente, lo que se desea es obtener testimonios complejos que ms tarde sern procesados de manera especial.
En el contexto de las encuestas clsicas, sin embargo, este tipo de preguntas
pueden generar problemas diversos. Schuman y Presser (1981) han demostrado
que las preguntas son ms fiables y tienen ms validez cuando al interrogado se
le ofrece un conjunto de respuestas concretas por las cuales optar que cuando
se le pide que se exprese libremente.

LA ENCUESTA Y EL CUESTIONARIO

49

Una misma pregunta abierta puede ser respondida con expresiones muy diferentes, circunstancia que suele entorpecer muy considerablemente el procesamiento ya que, en tal caso, si se quieren construir tablas formales, las diferentes
respuestas deben ser examinadas una a una para conformar las categoras primero, e ir clasificando a posteriori a los sujetos. Adems de ser un proceso arduo y
tedioso, el margen para la subjetividad por parte de quien haga la clasificacin es
muy acusado. La pregunta abierta, por otra parte, exige ms tiempo y consume
mayor energa, tanto por parte del entrevistado como del entrevistador.
Ahora bien, las preguntas cerradas tienen que estar bien cerradas. No siempre el investigador consigue ser eficiente en ese sentido y puede por esa va generar conflictos de considerable magnitud y difcil solucin.
Una idea de cuan conflictivo o difcil resulta redactar atinadamente una pregunta de este tipo puede alcanzarse reparando en la siguiente y curiosa circunstancia. De un libro, ciertamente interesante en muchos puntos, en que se aborda
de manera exhaustiva y cuidadosa el tema (Linniger y Warwick, 1978), reproduzco textualmente el siguiente ejemplo de una pregunta cerrada, presuntamente bien formulada:
De los siguientes tipos de enfermedades, cules se han presentado en su
familia?
___ ningn problema serio
___ uno o ms de los miembros de la familia es invlido y requiere muchos cuidados
___ uno o ms de los miembros de la familia est lisiado o es defectuoso, pero no requiere mucha atencin
__ cuentas de hospital y honorarios mdicos muy altos.

Al menos dos aspectos pueden objetarse frente a tal paradigma. En primer


lugar, las respuestas posibles no son excluyentes. Si bien esto puede considerarse formalmente legtimo, pues se pregunta cules tipos de enfermedades se han
presentado (y no cul), lo cierto es que alguien pudiera marcar las opciones primera y tercera (hay algn lisiado, pero ajuicio del entrevistado ese enfermo no
requiere mucha atencin, de modo que a su juicio no hay ningn problema serio). Sin embargo, dara la impresin de que los autores de la encuesta aspiran a
que se opte por la primera alternativa slo cuando no proceda marcar ninguna de
las otras. En segundo lugar, algo ms importante: como revela una lectura cuidadosa, no todas las alternativas que se brindan son tipos de enfermedades,
como se anuncia en el encabezamiento.
Uno de los mtodos que se ha sugerido para cerrar la pregunta con alternativas apropiadas ha sido aplicar una prueba previa con preguntas abiertas similares y utilizar las respuestas que se presenten con ms frecuencia como op-

50

DISEO RAZONADO DE MUESTRAS

ciones de respuesta para conformar definitivamente la pregunta cerrada (Scheaffer, Mendenhall y Lyman, 1996)
Una cuestin debatible es si conviene o no cerrar las preguntas cuantitativas.
Mi opinin es que no debe hacerse, ya que al crear categoras para datos cuantitativos como la edad, se pierde innecesariamente informacin. Hay, sin embargo, situaciones ms bien excepcionales en que, quizs con el sano propsito de no obtener
respuestas vagas, se exige un nivel de precisin exagerado que termina por producir un error mucho mayor. Consideremos, por ejemplo, la siguiente formulacin:
Cuntos cigarrillos fuma como promedio diariamente?

Se fuerza al sujeto a dar un dato preciso, est o no en condiciones de hacerlo, con lo cual puede contribuirse, paradjicamente, a la invalidez de los resultados. Una opcin capaz de extraer datos ms prximos a la verdad sera plantear la pregunta con alternativas de respuesta menos precisas pero ms
confiables:
Cuntos cigarrillos fuma como promedio diariamente?
___
___
___
___

ninguno
de 1 a 20
de 21 a 40
ms de 40

6. Emplear la tcnica de retrotraduccin siempre que la encuesta original haya sido redactada en otro idioma
Si el material de partida fuera un cuestionario creado en otro idioma, entonces es imprescindible corroborar la calidad de la traduccin. Un recurso natural
es aplicar lo que ha dado en llamarse retrotraduccin; esto es, traducir nuevamente al idioma original el texto que se obtuvo como resultado de la primera traduccin. La expectativa es que la versin original no difiera apreciablemente del
resultado de la retrotraduccin; en tal caso podr confiarse en que el documento
con el que se trabajar ha respetado el espritu del original y, sobre todo, que ha
reproducido adecuadamente su contenido.
Debe enfatizarse no obstante que, aunque la retrotraduccin es un recurso
bastante til para contribuir a la fidelidad de la traduccin de las palabras, no garantiza la equivalencia del significado.
En Anderson (1967) y Deutscher (1973) pueden hallarse detalles acerca de
diversas tcnicas para lograr equivalencia en la traduccin. Cabe subrayar que,

LA ENCUESTA Y EL CUESTIONARIO

51

una vez hecha la traduccin y habindose confirmado su eficiencia, estamos en


el mismo punto que cuando se adopta un cuestionario elaborado por otros pero
redactado originalmente en nuestro propio idioma y que no es, por tanto, menester traducir: no hay forma alguna de constatar empricamente que el cuestionario
funciona en un sitio del mismo modo que lo hace en otro (vanse ms detalles en Silva, 1997).
7. Tener en cuenta que el interrogado suele no adoptar una posicin crtica
ante la redaccin o la forma de la pregunta
Ciertamente, esta es una indicacin tan sutil como esencial. Para explicarla
acudir a una experiencia llevada adelante con 189 estudiantes de primer ao de
la carrera de medicina de La Habana (vanse detalles en Silva y Macas, 2000).
A los efectos de lo que nos ocupa, se formul a todos los alumnos de esa muestra la siguiente pregunta mediante encuesta annima:
En su opinin, es la informtica una tecnologa completamente inteligente respecto del futuro?
S i ___

No ____

Leyendo la pregunta tal y como se formula, el encuestado debera negarse a


responderla: la redaccin empleada es un galimatas sin sentido; debe desconcertarlo hasta el punto de no permitirle responder ni afirmativa ni negativamente, ya que la categora tecnologa completamente inteligente no significa nada,
y la aclaracin respecto del futuro no hace ms que empeorar las cosas.
A pesar de las insalvables dudas que se deberan presentar ante tal pregunta,
solo 9 de los estudiantes (el 5%) se neg a responder o reaccion mediante algn
tipo de sealamiento crtico; el resto respondi como si la formulacin tuviera
sentido: 171 (90%) respondi que SI y el 5% restante dijo NO estar de acuerdo
con la afirmacin. Estos porcentajes confirman claramente que los encuestados
suelen encarar las encuestas de manera acrtica: cuando leen una pregunta, se hacen su propia composicin de lugar (que puede diferir marcadamente entre unos
y otros), sin esforzarse por desentraar la intencin del investigador. Consecuentemente, es a ste a quien corresponde poner todo el empeo para conseguir
que su pregunta sea uniforme y adecuadamente interpretada.
8. Reparar en que el interrogado tiende a preocuparse ms por la imagen
que da que por la exactitud de la informacin que comunica
Se ha demostrado que el temor a dar una imagen negativa, desagradable o que
ajuicio del sujeto pudiera ser socialmente inconveniente, genera una tendencia a

52

DISEO RAZONADO DE MUESTRAS

que ste d respuestas ms acordes al afn por producir buena impresin que al
de informar la verdad.
La tcnica de respuesta aleatorizada que se discute- en la seccin 9.2 fue
creada justamente para superar los sesgos que tal tendencia genera. Una expresin particular de este fenmeno se produce en relacin con la posible imagen de
desinformacin o ignorancia, que suele conducir a que el entrevistado acte como si dominara algo que realmente ignora. Por ejemplo, en ocasiones, cuando a
los encuestados se les ha pedido opinin sobre materias oscuras o ficticias, se
ha puesto al descubierto que un nmero apreciable ha sido capaz de emitir opiniones aun cuando no tenan ningn conocimiento a priori sobre el tema.
Por ejemplo, Bishop, Oldenick y Tuchfarber (1986) en sus encuestas experimentales pidieron criterios sobre fenmenos que no existan Y obtuvieron que
nada menos que un tercio de los interrogados respondieron como si tuviera sentido dar tales opiniones. En relacin con esta recomendacin, en el estudio de
Silva y Macas (2000) antes mencionado, se pregunt a los 189 alumnos de medicina lo siguiente:
Comparte usted los argumentos existentes para fundamentar que se
otorgue el premio Nobel al creador de la vacuna antimeningocccica?
Si ___

No ____

No conozco el tema ____

Para contestarla afirmativa o negativamente es necesario conocer algo imposible de conocer, ya que no existe tal propuesta de premio Nobel (ni, por tanto,
argumento alguno con el cual concordar o no). Aunque lo lgico sera que todos optaran por la tercera posibilidad, se obtuvo un porcentaje muy apreciable
acumulado por las dos primeras, como se aprecia en la siguiente tabla:

Es notable que uno de cada tres haya dicho compartir criterios inexistentes y
que uno de cada ocho haya renegado de dichos criterios, con lo cual se acumula
nada menos que un 44% de respuestas deshonestas. Esto convalida la idea de
que el temor a dar una imagen de desinformacin suele conducir a que el entrevistado acte como si conociera algo que realmente ignora, o a que comunique en
calidad de ponderada conviccin un punto de vista que acaba de improvisar.

LA ENCUESTA Y EL CUESTIONARIO

53

Para solucionar este problema, en algunas situaciones, sera mejor incluir varias opciones de respuesta sobre lo que se desea conocer y ofrecer al interrogado la posibilidad de elegir la que considere correcta segn su conocimiento. En lugar de preguntar:
Considera que la penicilina cura el catarro?
Si ___

No____

No s____

podra ser mejor que, aunque slo interese el conocimiento acerca del efecto de
la penicilina sobre el catarro, se emplee esta otra formulacin:
La penicilina es un producto adecuado para curar:
Las enfermedades de la piel

Si ____

No ____

No s ____

Las neumonas

Si ____

No _____

No s ____

El catarro

Si ____

No _____

No s ____

Algunas enfermedades oculares

Si ____

No _____

No s ____

Cuando se trata de respuestas que pudieran resultar vergonzosas por el contenido, se ha sugerido (Sudman y Bradburn, 1982) con textual izar las preguntas
para suavizar la situacin. Por ejemplo, en lugar de preguntar directamente:
Su consumo de bebidas alcohlicas por lo general es:
Nulo ___

Escaso ____

Moderado ____

Alto _____

Muy alto ____

podra ser mejor realizar la siguiente secuencia de preguntas:


a) En general, Ud. dira que Ud. ingiere bebidas alcohlicas:
Menos que sus amigos ____
Aproximadamente igual que ellos ____
Ms que sus amigos ____

b) Piense en aquel de sus amigos que ms alcohol consume. Cuntos


tragos Ud. cree que l consume a diario como promedio?:
___

___

54

DISEO RAZONADO DE MUESTRAS

c) Y cunto consume Ud. aquellos das en que lo hace?:


Aproximadamente cuntos tragos?

Habindose hecho primero las preguntas contextales a) y b), se ha probado


(Fowler, 1993) que el monto testimoniado en c) es significativamente superior.
Otra variante es insertar la pregunta conflictiva en el contexto de otras que no
lo son. Por ejemplo, preguntar:

Algunos estudios han sealado que ciertas conductas son protectoras del
infarto. Ha hecho en los ltimos siete das alguna de las siguientes actividades:
Realizar ejercicios durante
no menos de 20 minutos

Si ___

No ____

Tomar al menos una aspirina

Si _____

No ____

Consumir vino, cerveza, ron


u otra bebida alcohlica

Si _____

No ___

Comer fruta

Si _____

No ____

Relacionado con estas tendencias se halla el impulso de muchos, especialmente si el nivel cultural es bajo (Converse y Presser, 1986) a estar de acuerdo
con lo que se les propone.
Finalmente, puesto que se ha demostrado (vase Aquilino y Losciuto, 1990
y Fowler, 1993) que el fenmeno que nos ocupa es menos acusado cuando los
cuestionarios son autoadministrados que cuando la encuesta la realiza un entrevistador, en este ltimo caso debe ponerse especial cautela.
9. Valorar la conveniencia de usar una pregunta de filtro antes que indagar
directamente sobre determinada conducta u opinin
El uso de la pregunta de filtro es en ocasiones muy aconsejable, pues con
ella se puede conseguir mejor organizacin de la encuesta, ahorrar tiempo y que
el interrogado entienda mejor y ms fcilmente lo que se quiere de l. En un estudio en que se interrogaba a funcionarios del sistema educativo (Fonseca,
1987), se preguntaba:

LA ENCUESTA Y EL CUESTIONARIO

55

Reciben los nios de este centro atencin estomatolgica sistemticamente?


___ preventiva
___ curativa
___ ambas
___ no la reciben

Tal y como est redactada, muchos podran marcar en cualquiera de las primeras tres opciones y dar por sentado que la atencin estomatolgica ofrecida a
los nios es sistemtica aunque no fuera ese el caso; si optara por la cuarta posibilidad, no se podr saber si opina que no se ofrece atencin alguna o que la
que se brinda no es sistemtica. Los resultados podran ser ms precisos si se
preguntara de la siguiente manera:

Los nios de este centro reciben atencin estomatolgica sistemtica?


Si -----------

No ------- (pasar a la prxima pregunta)

Qu tipo de atencin reciben?


Preventiva

Si ____

No ____

Curativa

Si ____

No ____

Knuper (1997) sugiere considerar crticamente la siguiente formulacin:

En los ltimos 10 aos, cuntas veces ha sido usted vctima de alguna


conducta criminal?

Ser vctima de una conducta criminal no es una situacin frecuente y, hecha


la pregunta de este modo, algunos podran considerar como conducta criminal cualquier situacin desagradable relacionada con el delito. Segn este autor, el asunto sera encarado con mayor rigor si se replanteara de la siguiente
forma:

56

DISEO RAZONADO DE MUESTRAS

En los ltimos 10 aos, ha sido usted vctima de alguna conducta criminal?


Si----------

No----------- (pasar a la prxima pregunta)

Si respondi que s, cuntas veces?

__

___

Sin embargo, esto no es ms que un paliativo; lo ideal sera dejar claro en la


propia formulacin qu ha de entenderse por conducta criminal (vase la recomendacin nmero 3).
En el estudio de Silva y Macas (2000) con 189 estudiantes universitarios se
hizo un experimento consistente en dividir el grupo aleatoriamente en dos partes
(A y B) y formularles, respectivamente, las preguntas siguientes:

Grupo A: Para el estudio independiente, utiliza usted la biblioteca?


Si ___

No____ (pasar a la prxima pregunta)

Cuntas veces hace uso de ella a lo largo de un mes?


___

una

____ dos a tres

____ cuatro a cinco

___ ms de cinco

Grupo B: Para el estudio independiente, cuntas veces hace uso de la biblioteca a lo largo de un mes?
___
___
___
__
__

nunca
una
dos o tres
cuatro o cinco
ms de cinco

Si la pregunta de filtro tuviera un efecto, entonces cabra esperar resultados


diferentes en cuanto a lo que dicha pregunta trata de delimitar. Los resultados
fueron elocuentes:

LA ENCUESTA Y EL CUESTIONARIO

57

La diferencia entre 54,3% y 15,8% es impresionante: revela que la pregunta


de filtro contribuy en grado notable a que los encuestados reconocieran que no
usaban la biblioteca para el estudio individual.
10. Tener en cuenta que una pregunta que procure obtener una opinin, si se
proyecta sobre otra persona, puede conseguir ms veracidad que cuando se
reclama de manera directa
Para valorar el efecto de esta estrategia, el estudio de Silva y Macas (2000)
oper nuevamente con los dos grupos de estudiantes aleatoriamente conformados. Las preguntas empleadas fueron:
Grupo A: Un compaero suyo se ve involucrado en un fraude acadmico.
Cul es su opinin acerca de la medida que debe tomarse?
Estara a favor de:
__ sancionarlo pero permitirle que contine la carrera
__ expulsarlo de la carrera
-----hacerle slo una advertencia

Grupo B: Si usted se ve involucrado en un fraude acadmico, la medida


adecuada que procede aplicarle en su opinin sera:
__ sancionarlo pero permitirle que contine la carrera
__ expulsarlo de la carrera
------ hacerle slo una advertencia

Los resultados se resumen a continuacin:

58

DISEO RAZONADO DE MUESTRAS

Los porcentajes correspondientes a la opcin ms benvola fueron, segn


se tratara del propio interrogado o de otra persona respectivamente, 27,9 frente a
16,0. Es decir, la opcin de perdonar al alumno se elige casi dos veces ms para s mismo que para otro.
La recomendacin que nos ocupa no debe confundirse con la posibilidad que
en ocasiones se aplica de permitir que quien responda no sea el sujeto elegido
sino un familiar u otro allegado (los llamados proxy respondents en la literatura
anglfona) ya sea porque el sujeto no se encuentra o por estar incapacitado. La
experiencia demuestra, sin embargo que, tpicamente, estos sustitutos no consiguen suplir adecuadamente a los verdaderos destinatarios de las preguntas (vanse, por ejemplo, Clarridge y Massagli, 1989 o Rodger y Herzog, 1989).

2.3.2. Pautas especficas para la redaccin de interrogantes


Uno de los libros ms consultados recientemente en materia de redaccin de
preguntas, debido a Fowler (1995), establece que una buena pregunta es aquella capaz de obtener el tipo especfico de respuesta que se necesita conocer,
conseguir que los interrogados comprendan el significado de la pregunta (especialmente, que todos entiendan lo mismo), que sea susceptible de ser contestada
por todos ellos, as como que promueva que la respuesta recogida sea fidedigna
y acorde con lo que se quiere.
Sin embargo, stas no son ms que indicaciones generales, que no constituyen una gua detallada que solucione realmente los problemas que suelen aparecer durante la confeccin de las preguntas y ayude a su elaboracin.
Aunque algunos autores, como el propio Fowler, se han enfrascado en darle
solucin a este problema, se trata de una materia en permanente crecimiento, de
modo que considero de inters ofrecer una gua actualizada que procura indicar
e ilustrar exhaustivamente los errores que con ms reiteracin se presentan como
resultado de no transitar por un camino tericamente riguroso en el llamado
arte de preguntar. Las 12 pautas que se enumeran a continuacin intentan po-

LA ENCUESTA Y EL CUESTIONARIO

59

ner de relieve los errores ms frecuentes y servir de alerta para encarar adecuadamente la confeccin del cuestionario dentro del proceso investigativo.

1. Eliminar toda ambigedad en la formulacin


2. Evitar las preguntas negativas
3. Garantizar que la indagacin tenga sentido para todos los interrogados
4. Utilizar un lenguaje sencillo y asequible
5. Usar una sintaxis correcta y coherente
6. Ubicar las frases condicionales o definiciones al inicio de la formulacin
7. Evitar el uso de preguntas de respuesta mltiple
8. Contemplar todas las situaciones posibles e impedir que el interrogado pueda ubicarse en ms de una categora de respuesta
9. Procurar no inducir las respuestas salvo que sea una decisin deliberada
10. Las preguntas deben ser especficas
11. Las preguntas deben ser sensibles
12. Evitar la inclusin de dos o ms preguntas en una misma formulacin

A continuacin se explican e ilustran, en casi todos los casos con ejemplos


reales, cada una de las 12 pautas enunciadas.
1. Eliminar toda ambigedad en la formulacin
No es nada infrecuente que la redaccin contenga elementos de ambigedad
que restan confiabilidad a los resultados. Entre los problemas ms frecuentes se
halla la presencia de trminos indefinidos, un aspecto de suprema importancia.
Donde menos nos imaginamos si no estamos especialmente atentos al
problema surgen dudas y ambigedades exclusivamente atribuibles a la ausencia de claridad sobre el significado de los trminos empleados.
Para asegurarse de que un trmino dado ser consistentemente entendido,
puede ser til incluir la definicin que se requiere dentro de la propia formulacin de la pregunta. Ocasionalmente, usando varias preguntas que cubran todos
los aspectos susceptibles de ser registrados, se suple el uso de definiciones y se
ayuda a que el encuestado emita una ajustada respuesta final.
Hay que asegurarse de que todos los trminos relevantes que se hayan empleado estn bien definidos. Quizs la principal fuente de deficiencias de los

60

DISEO RAZONADO DE MUESTRAS

cuestionarios provenga de esta insuficiencia, la cual podra ser obvia, aunque casi siempre es ms bien sutil. Imaginemos la pregunta siguiente:

Ha realizado ejercicios fsicos en algn momento de la semana pasada?


S ------------

No----------------

Qu es hacer ejercicios fsicos? Por ejemplo, incluyen el acto de caminar? Durante cunto tiempo ha de extenderse para considerar que los ha hecho?
Y qu es la semana pasada? Los ltimos siete das, o los siete das previos
al ltimo lunes? Quizs debera reformularse as:
Ha realizado gimnasia, caminatas u otra forma de ejercitacin fsica por
ms de 20 minutos en algn momento de los ltimos siete das?
S -----------

No ------------

2. Evitar las preguntas negativas


La inclusin de negaciones dentro de la pregunta casi siempre asegura que se introduzca un elemento de incertidumbre. Consideremos la siguiente interrogante:

Algunos mdicos defensores de la lactancia materna opinan que no debe


permitirse la publicidad de la leche maternizada. Est Vd. de acuerdo?
S ------------

No --------------

No tengo opinin---------

Si piensa que, en efecto, no debe permitirse la publicidad de la leche artificial,


no sabr si marcar que SI (s comparte la afirmacin) o que No (no debe permitirse la publicidad) . Una formulacin correcta puede ser:

Algunos mdicos defensores de la lactancia materna opinan que debe


prohibirse la publicidad de la leche maternizada. Est Ud de acuerdo
con ellos?
S-------------

No--------------

No tengo opinin ---------------

LA ENCUESTA Y EL CUESTIONARIO

61

3. Garantizar que la indagacin tenga sentido para todos los interrogados


Es la pregunta aplicable a todos los encuestados? A veces se consigue desconcertar al entrevistado preguntndole algo como Qu edad tiene su esposa?
siendo l soltero; pero ello se produce, sobre todo, cuando la formulacin es tal
que l no se reconoce en ninguna de las alternativas que se le ofrecen.
Un ejemplo tpico se da cuando no se maneja la posibilidad de que el sujeto
comunique que no tiene opinin sobre el asunto tratado, ya que, si efectivamente no la tuviera, no sabra qu hacer; si deja en blanco todas las casillas, entonces
no se podr saber si se trata de que no tiene opinin formada, de que la pregunta no le fue formulada, o de que su respuesta no fue registrada, que son tres cosas bien diferentes'.
En un estudio (Gonzlez, 1991) se preguntaba:

Aos de convivencia con cnyuge fumador -------------Aqu podran presentarse dos problemas: primero que el entrevistado no tenga cnyuge, y segundo que ste no sea fumador. Mejor sera esta variante:

En su relacin de pareja, se encuentra usted:


------- Sola (Termina aqu)
------- Acompaada

Es su compaero fumador?

S--------------- No ----------------(Termina aqu)

Cuntos aos de convivencia llevan?

-------------

4. Utilizar un lenguaje sencillo y asequible


Un requerimiento bsico para obtener informacin objetiva y exacta es asegurarse de que todos los interrogados entiendan por igual lo que se indaga. Los
investigadores deben estar razonablemente seguros de que las palabras o trminos utilizados tengan el mismo significado para todos los que enfrentan la pregunta. Por tanto, lo ms recomendable ser usar un lenguaje sencillo, eliminan1
Por cierto, en algunos mbitos se ha generalizado la curiosa costumbre de adicionar la categora NS/NC (es
decir, no sabe, no contesta). Esto es absurdo, porque no es lo mismo no saber que abstenerse de contestar.
En principio, esta ltima posibilidad no debe ofrecerse como opcin.

62

DISEO RAZONADO DE MUESTRAS

do todo tipo de locuciones extranjeras y asegurndose de que las palabras sean


directas y familiares; debe evitarse el uso de abreviaturas, siglas, argot, etc.
Asimismo, como bien subrayan Rebagliato, Ruiz y Arranz (1996), las frases
deben utilizar una estructura gramatical tan sencilla como sea posible.
Consideremos, el siguiente ejemplo:
Marque con una cruz en la casilla que corresponda a la religin que Vd.
practica:
Catlica

____

Protestante

____

Islmica

____

Otra

____

Ninguna

____

Sera mejor reducir la pregunta del modo siguiente:


Religin que practica:
Catlica

____

Protestante

____

Islmica

____

Otra

____

Ninguna

____

En definitiva, el encuestador aplicar la segunda alternativa aunque estuviese


redactada de la primera forma, y en general buscar por s mismo una formulacin simple en caso de que el texto oficial sea ms frondoso de lo necesario.
Es obvio que resultara improcedente preguntar:
Ha consumido Vd. antagonistas del calcio en el ltimo trimestre?
S ___

No _____

Aquellos interrogados que no posean conocimientos farmacolgicos tendran


gran dificultad para responder; muchos de ellos por temor a demostrar ignorancia o por no conocer a qu se refiere el investigador, podran responder Si o No,
cuando en rigor ni siquiera saben lo que se les pregunta.
Sin embargo, como han sealado Clark y Schober (1992), la comprensin del
lenguaje muchas veces no concierne a las palabras elegidas, sino al significado

LA ENCUESTA Y EL CUESTIONARIO

63

que tienen para quien las formula. Por ejemplo, las palabras empleadas en la siguiente pregunta no ofrecen dudas por s mismas:

Cmo se ha sentido en la ltima semana?


Bien ____

Regular ____

Mal ____

Pero qu debe responder el entrevistado?, se indaga acerca de su estado de


nimo?, sobre su bienestar fsico?, sobre el grado en que ha considerado exitoso su desempeo laboral o social a lo largo de la semana? Desde luego, las respuestas a estas preguntas podran hallarse en las propias alternativas que se
ofrezcan al interrogado, pero a veces tales alternativas son en ese sentido neutras, como ocurre precisamente en el ejemplo.
5. Usar una sintaxis correcta y coherente
Resulta medular pulir la redaccin empleada y ser cuidadoso con la sintaxis.
Usar una sintaxis sin errores facilita al interrogado la comprensin de la pregunta y que le d la importancia que merece. Una formulacin como la que sigue
es absolutamente tpica:

Considera usted que la participacin de la enfermera en el control de enfermos crnicos es:


___
___
___
___
___
___

importante
necesaria
pobre
poco til
lleva el mayor peso del trabajo
no participa

Si se conecta la frase inicial con cualquiera de las dos ltimas opciones de respuesta, la oracin pierde sentido. Decir, por ejemplo, La participacin de la enfermera en el control de enfermos crnicos es no participa es sintcticamente
incoherente. Por otra parte, en la redaccin precedente se piden a la vez opiniones
genricas (1 y 2) y testimonios concretos (opciones 3, 4, 5 y 6). Para resolver la
situacin se podra desdoblar la interrogante segn esos dos tipos. Sin embargo,
por excepcin, no dar una solucin para el ejemplo que nos ocupa: arreglar esta formulacin es demasiado complicado, pues adems de los sealamientos ya

64

DISEO RAZONADO DE MUESTRAS

hechos, aparece la opcin de que la participacin sea importante, la cual es


completamente inespecfica (vase Pauta N. 11). Adems hay riesgo de redundancia, pues si la participacin de la enfermera en el control es considerada necesaria, entonces ineludiblemente tendr que ser conceptuada como importante.
En ocasiones nos encontramos frente a una pregunta que puede no ser correctamente respondida por falta de lgica o debido a su inconsistencia sintctica. El sentido comn debe resolver esta situacin. No obstante, vale la pena detenernos en el tema y poner algunos ejemplos ms, pues muchos de los
cuestionarios contienen preguntas con errores de esta ndole.
En el cuestionario (dirigido a padres) de un estudio sobre retardo en el desarrollo psquico infantil (Avila, 1994), aparece la pregunta siguiente:
Asiste usted con frecuencia a las reuniones de padres?
S ____

No ____

En ocasiones

____

La deficiencia aparece al dar la opcin en ocasiones; el hecho de preguntar


si asiste con frecuencia es inconsistente con esta posibilidad. Para solucionar
la situacin, se podra eliminar el trmino con frecuencia, que de por s es
equvoco, y que en este caso nada agrega. Una solucin podra ser entonces la siguiente:
Asiste usted a las reuniones de padres?
Siempre ____

En ocasiones ____

En otro estudio (Gutirrez, 1987) se lee:


Ingiere bebidas alcohlicas?
S ___

Con qu frecuencia ?
__
__
__
__
__
__

diariamente
una vez a la semana
2-3 veces por semana
4-6 veces por semana
espordicamente
no ingiere bebidas alcohlicas

No ____

Nunca

LA ENCUESTA Y EL CUESTIONARIO

65

La ltima opcin es innecesaria, porque si previamente se indaga sobre la


presencia o no del hbito, basta con enviar a la prxima pregunta a quienes se
manifiesten negativamente y eliminar esa ltima opcin para quienes dieron una
respuesta inicial afirmativa.
6. Ubicar las frases condicionales y definiciones al inicio de la formulacin
Cuando la pregunta contiene una frase condicional o la definicin de algn
trmino empleado para formularla, ubicar dicha frase o definicin al inicio de
la formulacin contribuye a la objetividad de la respuesta. La experiencia de Silva y Macas (2000) con los estudiantes de medicina tambin abord este tema.
Las preguntas formuladas a los grupos A y B fueron:

Grupo A: Cuando un alumno ha tenido problema con el transporte y llega tarde a clases, considera que debe ser justificado?
S ____

No _____

Grupo B: En su opinin, debe justificarse la tardanza a clases de un


alumno cuando se ha producido por problemas con el transporte?
S ____

No ____

El contenido de las dos preguntas es en esencia el mismo; slo vara la localizacin de la frase condicional, que se pone al inicio (caso A), o al final de la
formulacin (caso B) . Si tal variacin tuviera algn efecto, los resultados seran diferentes. Lo que puede ocurrir (era lo que se quera poner en evidencia), es
que cuando la condicin se encuentra al final, ya leda la pregunta, el resto pierde inters para algunos encuestados y por tanto tal condicin no es tenida en
cuenta al responder. De hecho, en este caso los resultados convalidaron esta
presuncin:

El mayor porcentaje de respuestas positivas correspondi, en efecto, al grupo


al que se formul la pregunta que tena la frase condicional colocada al inicio
de la formulacin, resultado compatible con lo esperado.

66

DISEO RAZONADO DE MUESTRAS

En una encuesta a padres (Avila, 1994) se preguntaba:


Cree Vd. que los maestros de la escuela se encuentran suficientemente
preparados para el tratamiento de los contenidos de educacin sexual?
S _____

No____

Sera mejor especificar primero a qu rea de la preparacin magisterial se


alude preguntando:
Para el tratamiento de los contenidos de educacin sexual, se encuentran
en su opinin suficientemente preparados los maestros de la escuela?
S ____

No ____

No tengo opinin ____

7. Evitar el uso de preguntas de respuesta mltiple


Un tipo especial de pregunta cerrada es aquel en que se permite escoger ms de
una alternativa (tambin llamada pregunta de respuesta mltiple). Imaginemos
que en un estudio sobre consumo de frmacos se formula la siguiente pregunta:
De los siguientes medicamentos, marque aquellos que ha consumido almenos una vez en los ltimos 30 das:
Aspirina

___

Atenolol

___

Librium

___

Ninguno

___

Ntese que, en verdad, se estn haciendo tres preguntas diferentes. En rigor,


la ltima alternativa es innecesaria, ya que si se ofrecen slo las tres primeras,
quien estuviera en el caso de no haber consumido ninguno de los tres frmacos
podra comunicarlo mediante el recurso de dejar en blanco las tres posibilidades.
El inconveniente fundamental, como ya se dijo, radica en que ese mismo resultado se obtendra en caso de que la pregunta, por olvido u otra razn, no llegase
a ser formulada.
Aunque la formulacin que nos ocupa tiene cierto atractivo por su simplicidad, sera preferible forzar a un pronunciamiento explcito plantendola del
modo siguiente:

LA ENCUESTA Y EL CUESTIONARIO

67

Seale si ha consumido los siguientes medicamentos al menos una vez en


los ltimos 30 das:
Aspirina

S ___

No ____

Atenolol

S ___

No ____

Librium

S ___

No ___

Otro ejemplo de preguntas de respuesta mltiple, tomado textualmente de Ortiz (1996), es el siguiente:
En su familia pueden haber ocurrido una serie de problemas de salud; por
favor, refiralos, cules ha presentado durante el ltimo ao?
__
__
__
__
__

miembros con invalidez y/o minusvala


miembros con amenaza de muerte
trastornos psiquitricos
algn familiar con padecimiento crnico
alcoholismo

Adems de la falta de uniformidad en las opciones (algunas empiezan mencionando problemas y otras con la palabra miembros), lo que ahora importa es
que algunos interrogados dejarn en blanco ciertas opciones de la pregunta, de
modo que no se podr saber si olvidaron responder, si no estaban incluidos dentro de dicha categora de respuesta, si no se registr la situacin, o si no tenan
conocimiento al respecto. Ms correcto sera redactarla de la siguiente manera:

Durante el ltimo ao en su familia pueden haber ocurrido algunos problemas de salud. Acerca de cada una de las siguientes posibilidades
seala si alguno de sus miembros los ha padecido durante el ltimo ao:
invalidez o minusvala

S---------

No ---------

amenaza de muerte

S---------

No ---------

trastornos psiquitricos

S---------

No ---------

padecimiento crnico

S---------

No ---------

alcoholismo

S---------

No ---------

En resumen, puede afirmase que las preguntas de respuesta mltiple suelen


ofrecer dudas al sujeto encuestado y conducir a la comisin de errores a in-

68

DISEO RAZONADO DE MUESTRAS

vestigadores poco experimentados. Por otra parte, si tales preguntas se conforman a travs de varias preguntas simples, como se ha sugerido, los anlisis
estadsticos posibles se simplifican y esclarecen de manera natural, a la vez que
las alternativas para llevarlo adelante se incrementan, ya que se pueden considerar distribuciones tanto para cada categora simple como para subconjuntos
de categoras (por ejemplo, en el caso de la primera ilustracin, se podra computar el porcentaje de los encuestados que no han consumido ni atenolol ni librium)
8. Contemplar todas las situaciones posibles e impedir que el interrogado
pueda ubicarse en ms de una categora de respuesta
Para el cumplimiento de esta pauta es necesario haber identificado todas las
alternativas posibles. Las posibles respuestas han de ser excluyentes y exhaustivas.
En una encuesta relacionada con contaminantes ambientales, Navarro (1989)
inclua la siguiente pregunta, dirigida a trabajadores que padecan cierta enfermedad:

Durante el ltimo ao usted ha tenido necesidad de ausentarse por descompensacin o complicacin de su enfermedad de base al:
-------trabajo
-------estudio
-------trabajo y estudio
-------no trabaja
-------no estudia

Quien se vea enfrentado a responder esta pregunta puede tener muchas dudas;
por ejemplo, el que marque en la opcin trabajo, podr adems marcar en no
estudia si, en efecto, no estudiara. La formulacin correcta (y mucho ms simple) sera:

Durante el ltimo ao ha tenido usted necesidad de ausentarse por descompensacin o complicacin de su enfermedad de base al:
Trabajo?

S ---------

No ---------

No procede

Estudio?

S ---------

No ---------

No procede

-----------------

LA ENCUESTA Y EL CUESTIONARIO

69

El ejemplo que sigue, tomado de Moreira (1994), es tpico:

Quin lo atiende actualmente?


------ familiar
------ vecino
------- amigo
------ vive solo
------- nadie

Puede darse el caso de que a algunos interrogados corresponda colocarse en


ms de una opcin, ya que son atendidos por ms de una de las personas enumeradas (por ejemplo, familiar y vecino), as como que otros se vean imposibilitados de marcar en cualquiera de ellas, como le ocurrira a un sujeto atendido
por una institucin de seguro social. Se presenta otro error con la penltima categora de respuesta, la cual introduce una formulacin inconsistente (vase Pauta N. 6) ya que si la persona vive sola o no, es un dato en principio irrelevante
a los efectos de quin sea la persona que atiende al sujeto encuestado. La formulacin correcta podra ser la siguiente:

Quin lo atiende actualmente?


familiar

S --------

No ---------

vecino

S --------

No ---------

amigo

S --------

No ---------

otro

S --------

No ---------

Naturalmente, en este caso quizs sera conveniente insertar una pregunta de


filtro (Recomendacin N. 9 de la Seccin 2.3.1) que indague si el sujeto es o
no atendido por alguien.
9. Procurar no inducir las respuestas salvo que sea una decisin
deliberada
Una pregunta persuasiva o inductora impulsa al entrevistado a preferir determinada respuesta (ya sea por el hecho de que aceptarla tiene cierta connotacin favorable, o por sugerencia directa) y muchas veces compromete su libre opinin.
A veces la induccin se produce de manera bastante sutil como consecuencia del empleo de palabras cargadas de emotividad, planteamientos que apelan

70

DISEO RAZONADO DE MUESTRAS

a estereotipos o formulaciones que entraan juicios de valor implcitos. Por


ejemplo, algunas personas desocupadas podran encontrar embarazoso contestar
no si se les pregunta Usted trabaja?, pero estaran ms proclives a hacerlo
si la pregunta fuese: Tiene usted trabajo actualmente? Anlogamente, puede
haber personas renuentes a admitir que algo debe ser prohibido pero que estaran de acuerdo en no permitir esa misma cosa.
Avila (1994) preguntaba a los padres:
Qu castigos utiliza ms frecuentemente contra su hijo?
---------- Penitencia
---------- Golpes
---------- Gritos
---------- Amarrarlo
---------- Quitarle la ropa
----------- Otros cules?

Virtualmente, tal pregunta est obligando a los encuestados a admitir que


castigan a sus hijos, ya que no se contempl siquiera la opcin de que el padre no
castigue a su hijo; a la vez, el uso de la preposicin contra puede condicionar al
interrogado. Una pregunta de filtro puede ayudar (vase Recomendacin N. 9).
En determinados contextos, hacer una pregunta inductora puede, sin embargo, ser beneficioso para la calidad de las estimaciones. Posteriormente al famoso trabajo de Kinsey, Pomeroy y Martin (1953) sobre conducta sexual femenina,
el autor principal del informe argumentaba que si se le pregunta a la gente si
acostumbra a realizar algunas prcticas sexuales bochornosas, lo negaran
aunque fuera cierto, en tanto que si se les pregunta cundo, dnde o con qu
frecuencia la hacen, es ms probable que lo admitan. Silva y Macas (2000) encararon este asunto formulando las preguntas siguientes a los dos grupos de estudiantes aleatoriamente conformados:
Grupo A: Muchos psiclogos y estudiosos del tema consideran que para
resolver problemas de la vida cotidiana es casi inevitable, en ocasiones,
decir mentiras, lo ha hecho usted durante el ltimo mes?
S -------------

No -------------

Grupo B: Para resolver algn asunto de la vida cotidiana, ha dicho usted


alguna mentira durante el ltimo mes?
S -------------

No ------------

71

LA ENCUESTA Y EL CUESTIONARIO

Como se, ve, una de ellas (Grupo A) induca la respuesta, ya que inclua un
comentario previo que tomaba partido hacia la respuesta afirmativa; en el otro
cuestionario, la pregunta se haca neutra y directamente. Puesto que responder
afirmativamente a una pregunta como esta no es nada enaltecedor, el hecho de
recibir anticipadamente un comentario que justifica la conducta reprobable,
ayudara a conseguir cierta informacin difcil de obtener. Los resultados fueron:

Se obtuvo un porcentaje mucho mayor de respuestas positivas en el caso


de usar la pregunta bajo una frmula inductora (69 %) que para el caso contrario (47 %), lo cual parece validar inequvocamente la idea de que las preguntas inductoras pueden servir de ayuda para obtener ciertas informaciones
difciles de conseguir al preguntar directamente. De modo que, si bien generalmente se advierte (atinadamente) del sesgo que pueden introducir las formulaciones inductoras, tal advertencia no debe asimilarse mecnicamente.
En esta materia, uno de los investigadores ms interesantes es el profesor
alemn Norbert Schwarz, de la Universidad de Michigan, a quien debemos una serie de sorprendentes resultados. En sus trabajos ha puesto de relieve que normalmente se considera al cuestionario como un mtodo para obtener informacin del
entrevistado sin reparar en que tambin es un medio de dar informacin a ste.
Un hallazgo interesante en esta direccin fue puesto de relieve en Schwarz
(1995); consiste especficamente en mostrar cmo algunos encuestados se apoyan en el cuestionario para elegir la respuesta (vanse tambin Schwarz y Hippler, 1991; Sudman, Bradburn y Schwarz, 1995; Schwarz, 1997). Se trata de que
los encuestados asumen que las escalas que se le proponen reflejan el conocimiento del investigador sobre la distribucin del fenmeno y se apoyan en ello
para elegir la respuesta.
En relacin con ello, Silva y Macas (2000) hicieron respectivas preguntas en
el experimento con sus dos grupos de estudiantes:

Grupo A: Cuntas horas dedica aproximadamente al estudio individual


cada da?
-------menos de

--------- a 1

------- 1 a 2

-------- 2 a 3

---------3 y ms

72

DISEO RAZONADO DE MUESTRAS

Grupo B: Cuntas horas dedica aproximadamente al estudio individual


cada da?
-------menos de 3

---------3 a 3

---------3 a 4

---------4 a 5

---------5 y ms

Como se aprecia, en realidad se elabor una nica pregunta, pero se usaron


escalas diferentes, de baja y alta frecuencia respectivamente, y de modo que los
lapsos se interceptaran a la vez que el centro fuera muy diferente en un caso
y en el otro. Los resultados obtenidos fueron:

Como se ve, el porcentaje de estudiantes que marc alguna de las primeras 4 opciones en el Grupo A es muy diferente del porcentaje de los que eligieron la primera opcin en el Grupo B. En efecto, el porcentaje de encuestados que marcaron el periodo menor de 3 horas para el Grupo A (76 %) fue
muy superior al de los que hicieron lo propio para el Grupo B (21 %). Muchos
sujetos se apoyan aparentemente en la propia escala que se les ofrece; asumen que si los investigadores han elegido esta escala es por que saben que la
mayora de las personas estn en el centro y se distribuye normalmente hacia los extremos. Dicho de otro modo, muchos que se autoconsideran promediales se ubican en el centro independientemente de cul sea dicha categora central.
10. Las preguntas deben ser sensibles
Una pregunta tiene sentido prctico si produce respuestas diferentes siempre
que los sujetos sean realmente diferentes. No deben formularse preguntas que,
por su naturaleza, produzcan una concentracin desmedida de sujetos en una

LA ENCUESTA Y EL CUESTIONARIO

73

misma categora de respuesta. Tales preguntas son poco informativas. Consideremos un ejemplo tomado de Triana (1998).
Si le ofrecen un cambio de trabajo, qu hara usted?
------ lo aceptara
-------lo pensara
------ lo aceptara sin vacilacin
-------lo aceptara con reserva

Una gran mayora debe marcar en la opcin lo pensara, ya que muy pocos tendrn una opinin incondicional (probablemente, nadie en sus cabales optara por la primera alternativa sin contar con ms datos). Aunque los individuos
tengan visiones muy diferentes acerca de su actual trabajo, probablemente
contesten del mismo modo. La pregunta as formulada no es sensible a las variaciones que existen en el universo investigado. Algo mejor seria usar, por
ejemplo, variantes como la siguiente:

Si le ofrecen un cambio de trabajo donde mejore en un 30% su salario,


qu hara usted?
-------lo aceptara
------- lo rechazara
-------depende de otros elementos

11. Las preguntas deben ser especficas


La pregunta es especfica si slo produce respuestas diferentes para sujetos
que a ese respecto sean diferentes. Imaginemos que se quiere saber la edad a la
cual un profesional universitario inici su vida laboral, pero que se pregunta:

Cundo empezaste a trabajar?


Un interrogado pudiera responder: A los 27 aos, otro: En 1996 y otro:
Cuando termin la carrera. Sin embargo ellos pudieran haber comenzado su
vida laboral a la misma edad (deberan responder lo mismo si la pregunta hubiera sido especfica). Esta pregunta no tendra porqu tener dificultad si se re-

74

DISEO RAZONADO DE MUESTRAS

dactara adecuadamente, especificando lo que el investigador busca. Se podra lograr una respuesta uniforme, como ocurre en la reformulacin que sigue:

A qu edad empezaste a trabajar?


No deben redactarse las preguntas de manera tal que se carezca de un marco
referencial claro y consientan que se escapen casos con una condicin dada;
esto dispersara la respuesta ms all de lo debido y aportara pocos beneficios,
ya que no tendra la capacidad de colocar a cada quin donde le toca.
12. Evitar la inclusin de dos o ms preguntas en una
misma formulacin
El planteamiento de dos o ms preguntas dentro de una misma formulacin
introduce una ambigedad que compromete la fiabilidad de los resultados.
En un trabajo sobre el desempeo de la enfermera, Sabido (1998) incluye la
siguiente pregunta dirigida a un paciente:
La enfermera encuestadora le habl sobre la enfermedad que usted tiene, le explic porqu la tiene y cmo evitarla?
Si ____

No ____

No recuerdo ___

Tal y como se formula, puede resultar imposible responder adecuadamente;


la formulacin est incluyendo tres preguntas en una sola, y slo se obtendra
una respuesta adecuada si para todas las situaciones consideradas la respuesta
coincidiera; en otro caso se producirla desconcierto y, en ltima instancia, se obtendrn respuestas carentes de fiabilidad. La pregunta podra redactarse de la siguiente manera:

En relacin con su enfermedad, le explic la enfermera encuestadora?


sobre la enfermedad que padece?

Si ___

No ___

No recuerdo ___

por qu la tiene?

Si ___

No ___

No recuerdo ___

cmo evitarla?

SI ___

No ____

No recuerdo ___

La ambivalencia puede aparecer de manera menos evidente, como en el siguiente ejemplo, tomado de Saeteros (1998):

LA ENCUESTA Y EL CUESTIONARIO

75

El trabajo del colectivo pedaggico y del personal de salud en cuanto a la


preparacin de la familia en aspectos de promocin y educacin para la
salud es:
___ Suficiente
___ Regular
___ Insuficiente

Cuando algn interrogado considere que el trabajo de ambos equipos merece la misma calificacin, no se presentara ninguna dificultad; el problema aparecer cuando no sea as. Por ejemplo, si una persona considera que el trabajo del
colectivo pedaggico es Regular pero que el del personal de salud es Suficiente, no sabra qu responder. La pregunta debera formularse as:

A continuacin se mencionan dos de los grupos encargados de la preparacin de las familias en aspectos de promocin y educacin para la salud.
Cmo considera su trabajo?
Colectivo pedaggico: ____ Suficiente _____ Regular_____ Insuficiente
Personal de salud:

___ Suficiente ____ Regular ____ Insuficiente

En Silva (1993) se inclua este otro ejemplo:

Marque con una cruz en la casilla adecuada, de acuerdo con su punto de


vista:
La leche materna es altamente beneficiosa y debe ser el nico alimento que se suministre
durante los 4 primeros meses de vida.
SI ____

NO ____

Al menos dos dificultades se abren para el sujeto interrogado.


Si l comparte que la leche materna es beneficiosa, pero piensa que no necesariamente debe consumirse de manera exclusiva, marcara NO (pues formalmente
no comparte la afirmacin tal y como ella se ha hecho); pero lo mismo tendra que
hacer si opina de manera diametralmente opuesta (considera que no es beneficiosa y que debe emplearse la leche de vaca maternizada), de modo que tambin en
este caso podra legtimamente marcar NO. Por otra parte, no se contempla la posibilidad de que el sujeto no tenga una opinin formada sobre el asunto.

76

DISEO RAZONADO DE MUESTRAS

El enunciado podra replantearse del modo siguiente:

Marque en la casilla adecuada, de acuerdo con su punto de vista:


Sobre el empleo de la leche materna durante los primeros cuatro meses
de vida, Ud, cree que:
* es una prctica beneficiosa
si ____no_____tengo opinin____

* los ideal es suministrarla de modo exclusivo


si ___ no ____ no tengo opinin ____

En el experimento de Silva y Macas (2000) varas veces citado, se formularon estas preguntas a los respectivos grupos de estudiantes:

Grupo A: Considera usted que las actividades prcticas previstas para


su formacin profesional comienzan en el momento oportuno y se extienden suficientemente?
__

de acuerdo

___ en desacuerdo

____ no s

Grupo B: Considera usted que las actividades prcticas previstas para


su formacin profesional:
comienzan en el momento oportuno?
__

de acuerdo

____ en desacuerdo ________ no s

se extienden suficientemente?
__

de acuerdo

____ en desacuerdo

____ no s

La expectativa era encontrar diferencia entre los resultados de una y otra encuesta, puesto que cuando las dos afirmaciones estn dentro de la misma formulacin, el interrogado puede tener dudas en caso de que no est de acuerdo
con (o no sepa sobre) una sola de las dos interrogantes; en tal caso no podra discernir entre estar en desacuerdo con la afirmacin tal y como se hizo o con slo
una parte de ella; cuando ambas situaciones se separan, tal ambivalencia queda
resuelta. Los resultados son expresivos:

LA ENCUESTA Y EL CUESTIONARIO

77

Como se aprecia, en el caso en que se reunieron las dos afirmaciones dentro de una misma formulacin, se obtuvo un porcentaje mucho mayor de encuestados que opinaban estar de acuerdo (64%) que el obtenido para el cuestionario que las separaba: solo 34 de los 95 estudiantes del grupo B (36%)
dijeron estar de acuerdo con ambas afirmaciones. Los resultados varan entre los dos grupos debido, verosmilmente, a la dualidad contenida en la pregunta; aparentemente, muchos encuestados que solamente estaban de acuerdo
con una parte de lo que se le pregunt, expresaron su acuerdo global dentro del
grupo A.

2.4. Validacin y estudio piloto


Ante una encuesta que ya se ha llevado adelante, no es infrecuente escuchar
preguntas crticas tales como: fue validada esta encuesta? o fue validado el
cuestionario? El trmino validacin, que es de por s conflictivo (vase Silva,
1997), se maneja en estos casos de manera bastante confusa.
Es importante puntualizar que, en principio, lo que puede validarse es un
instrumento o un procedimiento concebido para medir una dimensin concreta,
sea esta de naturaleza fsica (como la temperatura corporal o el pliegue suprahilaco de un sujeto) o abstracta (como la inteligencia o el nivel socio- econmico).
Validar tal instrumento equivale a corroborar que l efectivamente mide lo que
se supone que mide.

78

DISEO RAZONADO DE MUESTRAS

Cuando se trata de una nocin abstracta, es muy comn que el instrumento


empleado sea una variable sinttica construida a partir de las respuestas que se
obtienen del entrevistado a travs de una encuesta. Tal variable s puede y debe
validarse (Silva, 1997).
Sin embargo, validar un cuestionario carece de sentido claro, ya que ste
suele ser simplemente un conjunto de preguntas y no un instrumento cuantificador en el sentido que puede serlo un termmetro, el ndice Apgar o un test de
inteligencia.
Naturalmente, hay preguntas que por s mismas intentan medir algo y, en
tal caso, ocurre con ellas lo mismo que con cualquier otro instrumento: pueden y
deben de ser posible ser validadas. Hay otras, por ejemplo todas aquellas con
las que se intenta establecer algo de la esfera subjetiva y que por tanto no son
susceptibles de ser respondidas correcta o incorrectamente, para las cuales la susodicha validacin no tienen mayor sentido.
Sin embargo, los cuestionarios deben ser probados en la prctica, generalmente a travs de una encuesta piloto. Es decir, lo que en cualquier caso resulta
crucial es adoptar medidas para conseguir que la informacin recabada que se recoja tenga calidad, y esa es una de las funciones bsicas del estudio piloto. La
necesidad de hacer pruebas preliminares con el cuestionario, como con otras partes esenciales de la encuesta, est fuera de toda duda. Si por validar un cuestionario se entiende corroborar que supera con xito estas pruebas, entonces todo se reducira a que para ello se ha empleado un nombre ya acuado para otro
fin; pero desafortunadamente con cierta frecuencia se invoca la necesidad de hacer esa validacin sin que est bien definido qu se ha de entender bajo ese trmino.
En cuanto al estudio piloto, es grande la tentacin de creer que esta vez no
hace falta realizarlo, puesto que todo est claro; sin embargo, nada es ms peligroso que caer en esa trampa. Por supuesto, el equipo investigador debe estar
totalmente de acuerdo en que el cuestionario es eficiente antes de aplicarlo en el
terreno, pero las valoraciones tericas no pueden suplir el contacto directo con la
poblacin que se va a estudiar. La falta de pruebas preliminares adecuadas es una
de las mayores fuentes de fracaso en encuestas que podran haber sido enteramente exitosas.
Para llevar adelante esta prueba previa casi nunca se realizan diseos probabilsticos formales; suele bastar con aplicarla a unas pocas decenas de sujetos,
elegidos sobre bases de conveniencia y disponibilidad (Fowler, 1995).
Las pruebas piloto deben utilizarse para evaluar no slo la claridad de los
items del cuestionario, sino tambin la eficacia de las instrucciones, la factibilidad del diseo muestral, la calidad de las entrevistas, la eficiencia de la organizacin del trabajo de campo, la magnitud del rechazo y las razones de su existencia, la duracin de la entrevista, la idoneidad del mtodo de encuesta para
el problema que se aborda y los costos. Permiten adems delimitar si las pre-

LA ENCUESTA Y EL CUESTIONARIO

79

guntas contienen expresiones locales que puedan ser incorporadas a las formulaciones (o eliminadas de ellas) para evitar malentendidos e incrementar la fluidez comunicativa, as como cules son las preguntas o secciones que ofrecen
mayores dificultades y cules son capaces de producir irritacin, embarazo o
confusin.
Es crucial que las condiciones en que se realice el pilotaje sean las mismas en
que se llevar adelante la encuesta real. A veces, por ejemplo, los interrogatorios
del pilotaje los desarrollan los propios directores del estudio. Craso error: estos
tienen por lo general niveles de compromiso y sensibilidad con el estudio marcadamente superiores que los de un encuestador asalariado.
Es conveniente que los encuestadores rindan un informe, preferiblemente
escrito, de su experiencia en el pilotaje. Son ellos los agentes llamados a identificar los problemas y propiciar un diagnstico adecuado del cuestionario (Converse y Presser, 1986). Un aspecto que debe recabarse es que para cada rechazo
el encuestador consigne las razones. El anlisis cuidadoso de esta informacin es
de extrema importancia para la adopcin de medidas preventivas de la llamada
no-respuesta. Por ejemplo, en una encuesta en que los sujetos deban ser contactados en la vivienda, resulta conveniente adicionar una pregunta como la siguiente:

No existe o no pudo localizarse la direccin

Casa desocupada o no enclavada en edificio residencial

No haba nadie en la casa

El entrevistado estaba ausente

Se produjo una negativa parcial a contestar

Se produjo una negativa total a colaborar

El entrevistado result inaccesible por alguna razn personal o administrativa

Otra (especifique)

Este tipo de pruebas, sin embargo, no son una panacea. Presser (1989) discute sus posibles limitaciones, tales como la subjetividad del propio encuestador
participante, potenciada por el pequeo tamao muestral, tpico de los pilotajes,
que puede dar lugar a que una ancdota puntual se erija en calidad de problema
general.
Precisamente, debido a esas limitaciones es que se ha sugerido emplear recursos alternativos o complementarios como la del grupo focal, una tcnica de
vieja data que sigue produciendo inters, como pone de manifiesto la reciente

80

DISEO RAZONADO DE MUESTRAS

aparicin de libros destinados exclusivamente a ella (vanse Morgan, 1988 o


Stewart y Shamdasani, 1990) . Se trata, en esencia, de reunir a un grupo de entre 6 y 10 personas ms bien heterogneas, y conseguir mediante un intercambio
centrado en los objetivos del estudio, que se expongan las advertencias pertinentes acerca de las fuentes potenciales de dificultad debidas a aspectos tales como la redaccin de las preguntas, el lenguaje empleado y la capacidad o conocimiento de la poblacin encuestada.

Bibliografa
Anderson RBW. On the comparability of meaningful stimuli in cross-cultural research. Sociometry 1967; 30: 124-136.
Andrews FM. Construct validity and error components of survey measures: A structural modelling approach. Public Opinion Quarterly 1984; 48(2): 409-422.
Andrews FM, Withey SB Social indicators of well-being. New York-Plenum, 1976.
Aquilino WS, Losciuto LA. Effects of interview on self-reported drug use. Public
Opinion Quarterly 1990; 54(3): 362-391.
Avila S. Variables psicosociales asociadas al retardo en el desarrollo psquico en nios
de una escuela especial. Trabajo de terminacin de Tesis de la especialidad de Higiene y Epidemiologa. Ciudad Habana, 1994.
Baker RP. New technology in survey research: Computer assisted personal interviewing (CAP). Social Science Computer Review 1992; 10: 145-157.
Bishop GF, Oldendick RW, Tuchfarber RJ. Opinions of fctitious issues: the pressure
to answer survey questions. Public Opinion Quarterly 1986; 50: 240-250.
Clark HH, Schober MF. Asking questions and infuencing answers. En: Tanur JM
(ed.). Questions about questions. New York: Russell Sage, 1992; 15-48
Clarridge BR, Massagli MP. The use of female spouse proxies in common symptom
reporting. Medical Care 1989; 27(4): 352-366.
Converse JM, Presser S. Survey questions: Handcrafting the standardized questionnaire. Beverly Hills, CA: Sage, 1986.
Couper MP, Burt G. Interviewer reactions to alternative hardware for computer assisted personal interviewing. Journal of Official Statistics 1994; 8: 201-210.
Deutscher I. Asking questions cross-culturally: Some problems of linguistic comparability. En: Warwick D y Osherson JS (eds.). Comparative research methods.
Prentice-Hall, New Jersey: Englewood Cliffs, 1973; 163-186.
Eisenhower D, Mathiowetz NA, Morganstein D. Recall error: Sources and bias reduction
techniques In Measurement errors in surveys, En: P. Biemer, R. Groves, L. Lyberg,
N. Mathio wetz, S. Sudman (eds). Measurements errors in surveys. New York: Wiley.
Fonseca L. Estudio de la aplicacin del Programa de Atencin Estomatolgica a la
poblacin menor de 15 aos en los Municipio Especial Isla de la Juventud. Trabajo de terminacin de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana, 1987.
Fowler F. Improving survey questions: Design and evaluation. USA: Sage Publications, 1995.

LA ENCUESTA Y EL CUESTIONARIO

81

Fowler F. Survey research methods (Second Edition) Newbury Park CA: Sage,
1993.
Gonzlez S. Asociacin de la morbilidad respiratoria en grupos de riesgo con la
contaminacin atmosfrica originada por el transporte y otros factores ambientales. Trabajo de terminacin de Tesis de la especialidad de Higiene. Ciudad
Habana, 1991.
Gutirrez I Estudio de la aplicacin del Programa de Atencin Estomatolgica a la poblacin menor de 15 aos en los Municipio Plaza de la Revolucin, Marianao y La
Lisa. Ciudad Habana. Trabajo de terminacin de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana, 1987.
Huskisson EC. Measurement of pain. Lancet 1974; ii, 1127-1131.
Jabine TB. Reporting chronic conditions in the National Health Interview Survey: A
review of tendencies from evaluation studies and methodological test. Vital and
Health Statistics, 1987. (Series 2, N' 105, DHHS Pub, N' PHS 87-1397). Washington, DC: Government Printing Office.
Kiesler S, Sproull LS. Response effects in electronic surveys. Public Opinion Quarterly 1986; 50: 402-413.
Kinsey AC, Pomeroy WB, Martin CE. Sexual behaviour in the human female. Philadelphia: Saunders', 1953.
Knuper B. Filter questions and question interpretation: Presuppositions at work.
Michigan: Mahau, 1997.
Lehnen RG, Skogan WG. Current and historical perspectives. (The National Crime
Survey Working Papers, Vol 1), 1981. Washington, DC: Department of Justice,
Bureau of Justice Statistics.
Likert RA. A technique for the development of attitude scales. Educational and
Psychological Measurement 1952; 12: 313-315.
Linninger CA, Warwick DP. La encuesta por muestreo. Mxico DF: CECSA, 1978.
Mangione TW, Fowler FJ, Louis T A. Question characteristics and interviewer effects. Journal of Official Statistics, 1992. 5(3) : 293-307.
Moreira JM. Prevalencia de sntomas depresivos en poblacin de ancianos del rea de
salud del policlnico Toms Romay. Municipio Artemisa. Provincia Habana.
Trabajo de terminacin de Tesis de la especialidad de Higiene y Epidemiologa,
Ciudad Habana, 1994.
Morgan DC. Focus groups as qualitative research. Newbury Park. CA: Sage, 1988
Navarro E. Impacto de la introduccin del Mdico de la Familia en la dispensarizacin del adulto mayor. Policlnico Diego Tamayo. Trabajo de terminacin
de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana,
1989.
Newcomb TM, Koenig KE, Flacks R, Warwick DP. Persistence and Chenge. New
York: Gennington College and Its Students after Twenty-five years, Wiley,
1967.

82

DISEO RAZONADO DE MUESTRAS

Nicholls WL II, Baker RP, Martin J. The effects of new data collection technologies
on survey data quality. En: Lyberg L. et al. (eds.). Survey measurement andprocess quality, New York: Wiley, 1986.
O'Reill JM, Hubbard ML, Lessler JT, Biemer PP, Turner CF. Audio and video computer assisted self-interviewing: preliminary tests of new technologies for data
collection. Journal of Official Statistics 1994; 2: 197-214.
Ortiz T. Proyecto de intervencin en salud familiar. Una propuesta metodolgica. Trabajo de terminacin de curso de la Maestra en Salud Pblica, Ciudad Habana,
1996.
Osgood CE, Suci GJ, Tannenbaum PH. The measurement of meaning. University of
Illinois Press, Urbana, 1957.
Payne SL. The art of asking questions. Princeton, New Jersey: Princeton University
Press, Princeton, New Jersey, 1951.
Presser S. Pretesting: A neglected aspect of survey research. En: FJ. Fowler, Jr. (Ed.),
Conference Proceedings of Health Survey Research Methods, 1989. (DHHS Pub.
No. PHS 89-3447, pp.35-38). Washington, DC: National Center for Health Services Research.
Rebagliato M, Ruiz I, Arranz M. Metodologa de investigacin en epidemiologa. Madrid: Daz de Santos, 1996.
Rodger WL, Erzog AR. The consequences of accepting proxy respondents on total
survey error f or elderly populations. En: F. J. Fowler, Jr. (Ed), Conference Pzoceedngs of Health Survey Research Methods, 1989. (DHHS Pub. No.PHS
89-3447, pp. 139-146). Washington, DC: National Center for Health Services
Research.
Sabido V. Evaluacin del programa de control de la Sfilis. Policlnico Aleyda Fernndez Chardiet. Municipio La Lisa. Trabajo de terminacin de curso de la Maestra en Salud Pblica. Escuela Nacional de Salud Pblica, Ciudad Habana,
1998.
Saeteros R. Diagnstico operacional de la promocin y educacin para la salud en el
ambiente escolar primario del complejo Ciudad Escolar Libertad. Trabajo de
terminacin de curso de la Maestra en Atencin. Primaria, Facultad de Salud
Pblica, La Habana, 1998.
Saris WE. A technological revolution in data collection. Quality and Quantity 1989;
23: 333-349.
Scheaffer R, Mendenhall W, Lyman R. Elementary survey sampling 62-68, USA,
Sage, 1996.
Schuman HH, Presser S. Questions and answers in attitude surveys. New York: Academc Press, 1981.
Scott PJ, Huskison EC. Accuracy of subjective measurements made with and without previous scores: An important Source of error in serial measurement. Annals
of the Rheumatic Diseases 1979; 38: 558-559.
Schwarz N, Hippler HJ. Response alternatives: The impact of their choice and ordering. En: Bieme P, Groves R, Mathiowetz N y Sudman S (eds.). Measurement
error in surveys. Chichester, Wiley: 1991; 41-56.

LA ENCUESTA Y EL CUESTIONARIO

83

Schwarz N, Knuper B, Hippler HJ, Noelle-Neumann E, Clark F. Rating scales: numerical values may change the meaning of scale labels. Public Opinion Quarterly 1991; 55: 618-630.
Schwarz N. Frecuency reports of physical symtoms and health: How the questionnaire determines the results. New York: Mahaw, 1997.
Schwarz N. What respondents learn from questionnaires: the survey interview and the
logic of conversation. International Statistical Review 1995; 63: 153-168.
Silva LC, Macas M. La redaccin de cuestionarios para la investigacin socio sanitaria. Un estudio experimental. Revista Cubana de Educacin Mdica Superior (en
prensa), 2000.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: Una mirada
crtica. Madrid: Daz de Santos, 1997.
Silva LC. Muestreo para la investigacin en salud. Madrid: Daz de Santos, 1993.
Stewart DW, Shamdasani PN. Focus groups. Newbury Park, CA: Sage, 1990.
Sudman S, Bradburn N. Asking questions. San Francisco: Jossey-Bass, 1982.
Sudman S, Bradburn N, Schwarz N. Thinking about answers: The applications of
cognitive science to survey methodology. San Francisco: Jossey-Bass, 1995.
Tanur JM. Questions about questions. New York: Russell Sage, 1992.
Triana I. Condiciones de vida y salud de los maestros de la enseanza especial. Marianao. Trabajo de terminacin de curso de la Maestra en Salud Pblica, Ciudad
Habana, 1998.
Weeks MF. Computer-Assisted Survey Information Collection: A review of CASIC
methods and their implication for survey operations. Journal of Official Statistics
1992; 4: 445-466.

3
Muestreo simple aleatorio

3.1. Introduccin
En este captulo se presenta el muestreo simple aleatorio (MSA), el ms sencillo y conocido procedimiento probabilstico de seleccin. Como se ver en su
momento, se trata paradjicamente, tal vez del mtodo menos utilizado en forma pura en la prctica del diseo de muestras. Varias razones justifican, sin
embargo, que se haga un estudio detallado de sus rasgos y propiedades.
En primer lugar, es un procedimiento bsico como componente de casi todos
los diseos que se explican ms adelante. En segundo lugar, el muestreo simple
aleatorio se utiliza ampliamente en el diseo experimental (en particular, en la
fase de asignacin de casos a los tratamientos en el marco de los ensayos clnicos controlados) y constituye el ms importante punto de contacto de la teora de
muestreo en poblaciones finitas con la estadstica inferencial clsica (Fienberg
y Tanur, 1996).
Finalmente, una prominente funcin adicional del MSA en este libro es la de
viabilizar la introduccin formal de un amplio espectro de conceptos, ideas y notaciones que, si bien tienen valor general para cualquier tipo de diseo muestral,
se comprenden ms fcilmente en el contexto de un diseo sencillo como ste.

3.2. Definicin y mtodos de seleccin


Supongamos que se quiere seleccionar una muestra de tamao de una poblacin que consta de N unidades (donde, naturalmente, n N). Se dice que el procedimiento de seleccin es un muestreo simple aleatorio si el proceso aplicado
otorga a todo subconjunto de tamao n de la poblacin la misma probabilidad de
seleccin.

86

DISEO RAZONADO DE MUESTRAS

Ms abajo se demuestra que el MSA otorga a los N sujetos de la poblacin


la misma probabilidad de quedar incluidos en la muestra, y que dicha probabin
lidad comn es igual a f = . El MSA es, por tanto, un procedimiento equiN

probabilstico; cabe subrayar, sin embargo, que no todo mtodo muestral que
produzca equiprobabilidad coincide con el MSA, como ocasionalmente se tiende a pensar y como se ha dicho incluso en algunos buenos libros aunque no especializados en muestreo.
Para fijar la definicin, supongamos que se tiene un listado de 12 nios ordenados alfabticamente y que, de ellos, se quieren seleccionar n = 6. Consideremos las siguientes tres alternativas para la seleccin:
a) Tomar los 6 primeros elementos del listado.
b) Dividir el listado en dos grupos: uno formado por los 6 primeros elementos y el otro por los restantes 6; lanzar una moneda al aire y tomar en calidad de muestra a los elementos del primer grupo en caso de obtener cara,
y a los del segundo si se obtiene escudo.
c) Asignar nmeros del 1 al 12 a los elementos de la lista. Colocar en una urna 12 bolas numeradas sucesivamente, mezclar totalmente las bolas y
seleccionar a ciegas 6 de ellas; finalmente, admitir en la muestra a los
elementos cuyos nmeros aparezcan sealados en las bolas elegidas.
El mtodo a no es probabilstico: los ltimos 6 elementos del listado no podrn integrar la muestra.
El mtodo b, en cambio, es probabilstico, ya que toda unidad tiene una probabilidad no nula y conocida de quedar incluida en la muestra. En efecto, la
probabilidad de inclusin de cada nio es la misma que tiene el grupo al que pertenece. sta es, obviamente, igual a 0,5; de modo que la probabilidad es igual
para todos ellos, con lo cual el procedimiento es, adems, equiprobabilstico. Sin
embargo, el mtodo no equivale al MSA, ya que existen subconjuntos de 6 elementos que no pueden resultar seleccionados al aplicarlo (por ejemplo, el de los
que ocupan los lugares impares en el listado).
El mtodo c, por ltimo, es MSA, ya que cualquiera de los subconjuntos diferentes que pueden formarse con 6 nios puede ser elegido y, dado el modo de
seleccin, es claro que ninguno de dichos conjuntos tiene ms probabilidad que
otro de ser el que a la postre resulte seleccionado. Detengmonos en este punto.
De la teora combinatoria sabemos que el nmero total de subconjuntos
posibles es:

N
N!
12!
=
= 924
=
n
( N n)! n ! 6!6!

K =

Por tanto, se es tambin el nmero K de muestras posibles en este caso.

MUESTREO SIMPLE ALEATORIO

87

Puesto que todas ellas tienen igual probabilidad de ser la que finalmente
quede conformada, dicha probabilidad es igual a 1 .
K

Dado un elemento ei de la poblacin, cuntas de las posibles muestras lo


contienen?: tantas como subconjuntos de tamao n 1 pueden conformarse a
partir del conjunto de los N 1 individuos que quedan en la poblacin cuando se
suprime aquel cuya probabilidad de seleccin estamos considerando. Unos segundos de reflexin permiten apreciar que dicho nmero es:

N 1
( N 1)!
11!
=
=
= 462

n1 ( N n)!(n 1)! 6!5!

K* =

de modo que la probabilidad de inclusin, igual a i =

P( M

) como vimos en
1
la Seccin 1.6, equivale en este caso a sumar K* veces el valor
; es decir,
K
K* n
para todo elemento de la poblacin. En nuestro ejemplo:
i =
=
K
N

i =

462
924

6
12

ei M j

= 0, 5

3.2.1. Nmeros aleatorios


Para determinar cul de las posibles muestras ser la elegida pueden adoptarse diversos mtodos concretos. El que se sugiri en tercer lugar para seleccionar 6 de 12 nios, es evidentemente generalizable; se trata de numerar los individuos secuencialmente desde 1 hasta N, escribir dichos nmeros en otras tantas
bolas o tarjetas, luego mezclar adecuadamente estas ltimas, y finalmente seleccionar n de ellas para identificar a los individuos de la muestra.
Sin embargo, este recurso adolece de algunos defectos. Por ejemplo, exige
la posesin o creacin de un dispositivo fsico en cuya imparcialidad haya razones para creer; adems, cuando N y n son nmeros bastante grandes, que es
lo comn en la prctica, su aplicacin resultara extraordinariamente engorrosa.
Con el fin de facilitar el proceso de seleccin simple aleatoria florecieron en
la dcada de los cincuenta las llamadas tablas de nmeros aleatorios. Para su
construccin se simul un mecanismo anlogo al de la urna en cuanto al principio, aunque mucho ms preciso en el sentido de eliminar posibles tendencias que
favorecieran la aparicin de un dgito ms que la de otro y, ms generalmente,
para evitar que alguna secuencia de dgitos tuviera mayor frecuencia de aparicin que otra secuencia cualquiera con el mismo nmero de cifras.
La Tabla 3.1 reproduce 150 dgitos que integran uno de los bloques de nmeros aleatorios contenidos en la tabla de Fisher y Yates (1963).

88

DISEO RAZONADO DE MUESTRAS

Tabla 3.1. Nmeros casuales o aleatorios

Hasta la aparicin y difusin de los microprocesadores, an tena sentido explicar cmo se utiliza una tabla como la que parcialmente hemos reproducido
(as se haca, por ejemplo, en Silva, 1982). Desde mediados de la dcada de los
ochenta, ya no lo tiene. En efecto, las PC1 nos relevan de aplicar tediosas manipulaciones, pues cualquier lenguaje de programacin contiene eficientes generadores de nmeros aleatorios. Los nmeros aleatorios se emplean en varios dominios; adems de su importantsimo papel en el marco del muestreo,
constituyen un ingrediente clave en el campo de la simulacin, en algunas reas
del anlisis numrico, como recurso en la programacin y en la experimentacin
en fsica. Pero lo que ahora puntualmente interesa es que gracias a dichos generadores, hoy contamos con programas muy rpidos y precisos para la seleccin
de una muestra simple aleatoria (vase Captulo 11).
Algunas aclaraciones y notas tcnicas sobre el tema de la generacin de nmeros aleatorios pueden hallarse en el apndice del presente captulo.

3.3. Media y varianza de los estimadores


3.3.1. Estimacin de la media poblacional
Como se ha dicho, los objetivos que llevan a seleccionar una muestra suelen
exigir la estimacin de parmetros poblacionales. Consideremos este problema
en el contexto del MSA.
Supongamos que se quiere conocer el promedio de cierta variable X en una
poblacin finita de N elementos. Si la medicin de X se practicase sobre todos
1

Usaremos la expresin PC (iniciales de Personal Computer) para designar a los modernos microprocesadores, tambin denominados ordenadores personales en algunas latitudes.

MUESTREO SIMPLE ALEATORIO

89

los elementos, se obtendran los N nmeros correspondientes a las respectivas


observaciones. Denotmoslos mediante X1, X2, ..., Xn. Supongamos que se quiere
conocer el promedio X de esos N nmeros:
X=

1
N

X
i =1

Admitamos que se selecciona una muestra de n elementos mediante MSA y


que los numeramos desde 1 hasta n, segn el orden en que van siendo seleccionados. La Figura 3.1 representa una muestra simple aleatoria como la que nos
ocupa. Usaremos minsculas para designar los valores de X correspondientes a la
muestra; o sea, designaremos como x1, x2,..., xn a los valores de la muestra, donde
x representa el valor de X para el i-simo elemento seleccionado, el cual puede ser
cualquier elemento del conjunto de datos poblacionales.
Llamaremos x a la media muestral que, en el caso del MSA, usaremos en
calidad de estimador de X . Es decir:

x=

1 n
xi
n i =1

Y llamaremos fraccin de maestreo al valor f =

n
N

. Adems de coincidir con

la probabilidad de seleccin comn a todos los elementos de la poblacin, f expresa la fraccin que representa el tamao muestral respecto del tamao poblacional. El valor que asume x queda determinado una vez seleccionada la muestra; pero antes de contar con una la muestra concreta, puede considerarse que x
es una variable, puesto que a cada muestra posible corresponde su propia media
muestral especfica. Adems, dado que la seleccin de la muestra depende del
azar, se trata de una variable aleatoria, que puede asumir hasta K valores diferentes (tantos como muestras posibles hay), donde como vimos en la
Seccin 3.2 K =

N!
( N n)! n !

Figura 3.1. Representacin de una muestra simple aleatoria.

90

DISEO RAZONADO DE MUESTRAS

La pregunta natural en este punto es la siguiente: por qu aceptar x como estimador de X ?, por qu no tomar, por ejemplo, la mediana del conjunto x1,...,xn
en calidad de estimador?; e incluso por qu no admitir alguna otra funcin de
los datos mustrales como pudiera ser el estadgrafo G =

x
i =1

2
i

+5 ?

Es fcil corroborar que el promedio de todas las medias muestrales coincide


exactamente con la media poblacional. Es decir, si llamamos xh a la h-sima de
esas posibles medias, en trminos formales se tendra:

1
K

x
h =1

=X

[3.1]

Este hecho se sintetiza diciendo que x es un estimador insesgado del parmetro X .


La conveniencia de trabajar con estimadores insesgados es clara desde el
punto de vista intuitivo: ello significa que las estimaciones posibles se reparten
equilibradamente alrededor del parmetro desconocido. sa es una condicin,
por ejemplo, que no cumplen ni la mediana de los datos mustrales ni el estrafalario estadgrafo G, como puede comprobar fcilmente el lector construyendo
una pequea poblacin. Por ejemplo, consideremos el conjunto poblacional de
tamao N = 4 siguiente: {3, 9, 18, 30}, cuya media es X = 15,0, con una muestra de tamao n = 3. El nmero K de posibles muestras es igual a 4. La Tabla
3.2 recoge dichas muestras, as como los estadgrafos considerados y sus promedios para las muestras posibles.
Tabla 3.2. Muestras posibles de tamao 3 en la poblacin y
estadgrafos correspondientes

Obsrvese que el promedio de las cuatro medias mustrales coincide con la


1 4

media poblacional x = xi =15, 0 , pero que no ocurre lo mismo con la me4 i =1

diana ni, mucho menos, con el estadgrafo G.


El ejemplo demuestra que ni la mediana ni G son estimadores insesgados, pero no demuestra (slo corrobora) que la media muestral x lo sea. Procede mencionar en este punto una propiedad general:

MUESTREO SIMPLE ALEATORIO

91

Si la muestra es equiprobabilstica y su tamao no depende del azar (tamao


fijo), entonces la media muestral siempre es un estimador insesgado de la
media poblacional.
Siendo el muestreo simple aleatorio un mtodo de seleccin equiprobabilstico que produce muestras de tamao fijo, se deduce que en este caso, la media
muestral estima sin sesgo a la poblacional. El mensaje central de este resultado
(cuya demostracin puede hallarse en Kish, 1965), puede traducirse del modo siguiente: los procedimientos equiprobabilsticos son tales que, para estimar una
media poblacional (o un porcentaje) simplemente se utiliza la media muestral (o
el porcentaje muestral). Usar el promedio muestral, que parece lo natural, no
siempre es adecuado, como se ilustra en prximos captulos.

3.3.2. Varianza de la estimacin de la media


Sin embargo, no se gana mucho con que el estimador sea insesgado si tales
estimaciones (o muchas de ellas) estn alejadas del parmetro ( X , en este caso).
Lo que resulta verdaderamente conveniente es que todas las estimaciones posibles (o, al menos, la inmensa mayora de ellas) se hallen en una pequea vecindad del parmetro; slo de ese modo se podr estar razonablemente confiado de
que la nica estimacin que a la postre va a hacerse habr de estar prxima al parmetro que se quiere conocer.
Recurdese una vez ms que la utilidad de un procedimiento cualquiera depende de la frecuencia con que ste produce buenos resultados.
Una manera en principio lgica de medir globalmente el grado en que las distintas estimaciones posibles se dispersan en torno a X consiste en promediar las
K distancias entre las estimaciones y X . En el caso de usar la media muestral
como estimador, tendramos:

D=

1
K

(x

h =1

X)

Sin embargo, el valor de D ser nulo, debido a que se estn sumando nmeros negativos y positivos equidistantes de cero en promedio. Para eludir ese
problema, una solucin consiste en promediar los cuadrados de las diferencias.
Tal promedio es lo que se denomina error cuadrtico medio de x :

ECM ( x ) =

1
K

(x
h =1

X )2

[3.2]

El ECM de un estimador es una medida resumen de cuan eficiente es usarlo


como va para estimar el parmetro de inters. En el ejemplo que se resumi en

92

DISEO RAZONADO DE MUESTRAS

la Tabla 3.2 es fcil calcular los valores del ECM para los tres estadgrafos:
ECM (x) = 11,5

ECM = (Mediana) = 22,5

ECM (G) = 29,1

En este ejemplo, por tanto x sera el mejor estimador, le seguira la mediana y


el esotrico G sera el menos eficiente. Cuando, como ocurre con la media muestral, el estimador es insesgado, entonces el ECM coincide con la varianza del
estimador.
O sea, en este caso, la expresin segn la cual se mide la calidad del estimador no es otra cosa que la varianza del conjunto de posibles estimaciones puntuales de la media poblacional. Es importante comprender que, con acuerdo a la
consideracin arriba desarrollada, lo ideal sera que VAR (x) fuese lo ms pequea posible.
Para elegir x como estimador, adems de las razones mencionadas y de otras
que veremos ms adelante, se tiene en cuenta que VAR(x), definida por [3.2],
puede expresarse en funcin de una medida de la variabilidad poblacional. En
efecto, puede demostrarse que:

S2
VAR( x ) =
(1 f )
n
donde S 2 =

1 N
( X i X )2 es un nmero que cuantifica cuan dispersos entre
N 1 i =1

s estn de los N valores poblacionales2.


Cabe advertir que la varianza poblacional podra definirse del mismo modo
que S2 pero dividiendo la suma

(X
i =1

X ) 2 por N en lugar de por N 1; de hecho,

aunque no hay dudas acerca de que S2 mide la variabilidad de los datos (ya que
en el fondo, a esos efectos, da igual si la suma de las distancias cuadrticas se divide por un nmero o por el otro), la definicin de S2 parece algo antinatural.
La frmula [3.3] permite ver que la varianza del estimador es mayor cuanto
mayor sea la variabilidad de los datos poblacionales. Dicho de otro modo: cuanto ms variable sea la realidad que se estudia, mayor ser la dispersin de las posibles estimaciones de X (suponiendo, desde luego, que n no se modifica) y, por
ende, menor la eficiencia de la media muestral como estimador de la media poblacional. Se trata de un resultado sumamente intuitivo; smiles de la vida cotidiana vienen a la mente: por ejemplo, es ms fcil acertar cuando se vaticina
la reaccin de un sujeto estable y ordenado ante cierto estmulo que ante la de alguien impulsivo y de carcter variable ante este mismo estmulo.
Por otra parte, puede observarse que VAR( x ) disminuye en la medida que
aumenta el tamao muestral n (una caracterstica del proceso, por cierto, que, al
2
Las demostraciones de las frmulas [3.1] y [3.3] pueden verse desarrolladas con recursos elementales en
Yamane (1970).

93

MUESTREO SIMPLE ALEATORIO

menos tericamente, s est en manos del investigador modificar). Este rasgo


de la frmula [3.3] refleja otro hecho intuitivo: con el incremento del tamao de
la muestra, aumenta la calidad del proceso inferencial.
Una consecuencia ms se saca de la frmula [3.3] (en este caso, bastante
sorprendente): a partir de cierta magnitud, el tamao de la poblacin tiene una
influencia virtualmente nula en la eficiencia de la estimacin. Si se tuvieran n y
S2 constantes, Var( X ) crece en la medida que aumenta N, pero de modo imperceptible a partir de cierto tamao poblacional, tal y como refleja la Figura 3.2.
En trminos prcticos, esta afirmacin tiene expresiones como las que ilustra el ejemplo siguiente:
El salario medio de las mujeres en edad frtil se puede estimar tan aceptablemente con una muestra de digamos 500 mujeres en una gran ciudad (por
ejemplo, de 1 milln de habitantes) como en un pueblo 10 veces menor3. En ambos casos el valor de f (magnitud relativa de la muestra) ser tan cercano a cero
(0,0005 y 0,005 respectivamente) que el factor 1 f puede suplirse por 1 en ambos casos; o, lo que es equivalente, puede suprimirse.

Tamao poblacional (miles)


Nota: Para el cmputo se consider que la varianza y el tamao muestral fueron respectivamente 400 y 100.

Figura 3.2. Variacin del error muestral en MSA en funcin del tamao muestral.

En cambio, si se fijan N y S2, la disminucin de Var( X ) cuando aumenta n es


sostenida y pronunciada (vase Figura 3.3) hasta anularse en el caso extremo en
que n = N(l f= 0), algo natural, puesto que en tal caso extremo no estaramos
ante una muestra sino ante un censo, de modo que tampoco puede haber variabilidad.
3

Naturalmente, se est asumiendo que la variable salario tiene anlogo grado de heterogeneidad en ambas
poblaciones.

94

DISEO RAZONADO DE MUESTRAS

Figura 3.3. Variacin del error muestral en MSA en funcin del tamao muestral.

Estas relaciones entre la eficiencia del estimador con cada uno de los tres
parmetros considerados (tamao muestral, heterogeneidad poblacional y tamao del universo) son esencialmente vlidas en toda situacin de muestreo,
cualquiera sea el diseo, incluidos aquellos ms complejos y realistas que el
MSA, aunque all no se deriven tan claramente de la formulacin correspondiente.

3.4. Un ejemplo ilustrativo


En esta seccin se analizar detenidamente un ejemplo artificial por conducto del cual se procura ilustrar el comportamiento de un estimador en el contexto
del MSA y, simultneamente, sedimentar los principios conceptuales introducidos en la seccin precedente.
Supongamos que en una ciudad hay N = 15 hospitales y que la variable X en
estudio es el nmero de mdicos que laboran en cada cual. Los valores de X en
estas 15 unidades de anlisis aparecen en la Tabla 3.3.
Al realizar una seleccin aleatoria4 de tamao n = 2 sobre esta poblacin, se ob 15 15!
tiene alguna de las 105 muestras posibles. [Ntese que k = =
= 105 ].
2 13!2!

MSA.

En lo sucesivo, cuando se diga que la seleccin es aleatoria o al azar, se entender que nos referimos a un

MUESTREO SIMPLE ALEATORIO

95

Tabla 3.3. Nmero de mdicos en una poblacin


artificial de 15 hospitales

En la prctica, dicha muestra nos proveera de una estimacin del parmetro


3.000
X . En este ejemplo, de finalidad didctica, sabemos que X =
= 200 y po15
demos conocer los 105 posibles valores de x .
La Tabla 3.4 refleja las 105 muestras posibles de tamao 2 y las respectivas
estimaciones de X .
Si se suman los nmeros correspondiente a las 105 celdas ocupadas de la
Tabla 3.4, el resultado es igual a 21.000; al dividirlo por 105, se obtiene el nmero 200, que no es otra cosa que la media poblacional, tal y como anunciaba
la frmula [3.1].
En la Tabla 3.4 se observa que las 105 estimaciones posibles se encuentran
entre 50 y 415; quiere esto decir que, si bien se hallan alrededor del valor
X = 200, algunas estn muy distantes del nmero que se pretende estimar. En
efecto, si el azar determinara que los hospitales de la muestra fueran el 13 y el
14, tendramos x = 50, una acusada subestimacin del parmetro. Anlogamente, si los elegidos fueran el 5 y el 11, estaramos en el otro caso extremo, pues
x = 415 arroja una marcada sobrestimacin de X .

96

DISEO RAZONADO DE MUESTRAS

Tabla 3.4. Estimaciones de X para cada una de las muestras de tamao 2


que pueden obtenerse por MSA de la poblacin descrita en la Tabla 3.3

Se recordar que la expresin [3.2] da una medida promedio de la distancia


a que se hallan las distintas estimaciones del valor central:

VAR ( x ) = 6.017,1
Puede corroborarse ahora la validez de la expresin [3.3]: al calcular S2 se obtiene, en efecto, que:
1 15
S2 =
( X i 200) 2 = 13.885, 7

14 i =1
y puede comprobarse que:
S2

(1 f ) =

13.885, 7
2
(1 ) = 6.017,1
2
15

Se haba afirmado que la magnitud de VAR( x ) disminua con el aumento de n.


Esto se puede comprobar de inmediato; por ejemplo, para n = 3 podramos calcular los 455 valores de x a que daran lugar las respectivas muestras de tamao
3 y computar la varianza de ese conjunto; pero no necesitamos hacer tal esfuer-

MUESTREO SIMPLE ALEATORIO

97

zo: la relacin [3.3] nos habilita para hacerlo rpidamente en este caso en que,
por excepcin, conocemos S2. Aplicndola entonces para n = 3, se tiene:
VAR ( x ) =

13.885, 7
3
1 = 3.702,9
3
15

Como se ve, la disminucin en la variabilidad del conjunto de medias es notable.


Otro modo de apreciarlo sera a travs del examen del recorrido del conjunto de medias mustrales. Cules seran las muestras ms desfavorables que pudieran producirse? Por una parte, la formada por los hospitales 10, 13 y 14 (que producira la
estimacin x = 60,3) y, por otra, la formada por los elementos 3,5 y 11 ( x = 380,0).
Tabla 3.5. Valores aproximados de VAR ( x ) y recorrido
de las medias posibles para MSA de la poblacin de
la Tabla 3.2 con distintos tamaos de muestra

La Tabla 3.5 resume los valores de VAR( x ) y el recorrido (menor y mayor valor de x ) para todos los posibles tamaos de muestra (desde 1 hasta 15). Como ya
sabamos, VAR( x ) va disminuyendo en la medida que aumenta el tamao de la
muestra. El recorrido, por su parte, tambin va estrechndose hasta llegar a la situacin extrema en que ambos puntos coinciden con la media poblacional. Este
caso refleja la situacin en que de hecho no se ha tomado una muestra como
tal, sino que se trabaja con toda la poblacin.

98

DISEO RAZONADO DE MUESTRAS

3.5. Distribucin de la media muestral


En la Seccin 3.3 se discutieron el valor esperado y la varianza de la media
muestral, pero no se analiz la distribucin que sigue esta variable aleatoria. En
un sentido totalmente informal, lo que debe entenderse por distribucin de una
variable aleatoria es la forma del histograma que puede formarse con un conjunto numeroso de observaciones de dicha variable.
Si consideramos el ejemplo de la Seccin 3.4 y el contenido de la Tabla 3.4,
es posible formar una tabla de clases y frecuencias que refleje cmo se distribuyen los 105 valores de x entre los valores extremos: 50 y 415. No es difcil
constatar que, si se toman, por ejemplo, intervalos de longitud igual a 40, la
distribucin porcentual de x es la siguiente:

Un examen similar puede repetirse para otros tamaos de muestra (n =3,


n = 4, etc.) teniendo en cuenta, para cada caso, todas las posibles muestras y sus
correspondientes medias.
La Tabla 3.5 resume el resultado de esa operacin para valores de n desde 2
hasta 14, en intervalos de amplitud 40. Varias apreciaciones pueden realizarse a
partir de dicha tabla.
En primer lugar, es notable que, para todos los tamaos muestrales, un alto
porcentaje de las estimaciones se ubique en los intervalos 160-199 o 200-239.
Por otra parte, se advierte que tal porcentaje crece rpidamente en la medida
que aumenta n : el 34% de las medias caen en esos intervalos para n = 2 (o
sea, 35 de los 105 valores de x ), mientras que, por ejemplo, para n = 5 ya se
tiene que el 62% de las estimaciones (1.866 de las 3.003 posibles) se ubican
all, y para n = 8 ocurre con el 83% de las 6.435 posibles muestras de ese tamao.
Por otra parte, puede observarse que la forma de los histogramas que resultan
de dichas tablas va aproximndose, en la medida que aumenta el tamao muestral, a la de la famosa campana de Gauss (es decir, a la de una distribucin normal). Esto es una expresin emprica del archifamoso teorema central del lmite. Las Figuras 3.4, 3.5 y 3.6, que reflejan las distribuciones porcentuales
construidas con las 10 clases (de longitud 40 cada una) de la Tabla 3.6, para los
casos correspondientes a n = 2, n = 4 y n = 6, respectivamente, permiten apreciarlo de manera ms palpable.
Es importante enfatizar que estas propiedades de la distribucin de x son vlidas de manera general; o sea, no dependen ni de la naturaleza de los datos ni

MUESTREO SIMPLE ALEATORIO

99

Tabla 3.6. Distribucin porcentual segn intervalos de todas las posibles


medias correspondientes al MSA de tamaos n de 2 a 14 para la poblacin
descrita en la Tabla 3.2

tampoco de la magnitud relativa del tamao muestral. Con esto ltimo queda
subrayado que para considerar que x sigue aproximadamente una distribucin
normal no es necesario que el tamao muestral constituya una fraccin importante del tamao poblacional sino que basta que sea grande en trminos absolutos (es decir: en la medida que aumenta n, los histogramas tienden a asumir la
forma de la campana de Gauss). Concretamente, cuando n supera a 50 (como
ocurre prcticamente en toda muestra real), la distribucin de los valores de x
ser siempre muy aproximadamente igual a la mencionada distribucin terica,
cualquiera sea el valor de N y cualquiera sea la distribucin de la variable X.
Como se recordar, esta distribucin tiene la propiedad, por ejemplo, de que
aproximadamente el 95% de las observaciones distan de la media menos que dos
veces5 su desviacin estndar (independientemente de los valores que tengan estos dos parmetros).
Por ejemplo, si se recuerda que en nuestro ejemplo VAR ( x ) = 77, 6 para
n = 2, y se calcula | x - 200| para los 105 valores de la Tabla 3.4, se puede corroborar que 101 de ellos (el 88 %, no muy lejano del porcentaje 95 % esperado)
5

El valor exacto es 1,96, percentil 97,5 de la distribucin normal estndar.

100

DISEO RAZONADO DE MUESTRAS

Figura 3.4. Distribucin porcentual segn intervalos de todas las muestras posibles
medias para muestras de tamao 2.

Figura 3.5. Distribucin porcentual segn intervalos de todas las posibles medias para
muestras de tamao 4.

Figura 3.6. Distribucin porcentual segn intervalos de todas las posibles medias para
muestras de tamao 6.

MUESTREO SIMPLE ALEATORIO

101

son menores que el producto (1,96) (77,6) = 152,0. Algo similar (aunque mucho ms ajustado a lo esperado) ocurre para valores mayores de n. Por ejemplo,
de las 6.435 medias mustrales calculables para n = 8, 6.157 (esto es, el 95,7%)
distan de X menos que (1,96)( 810 ) = 55,8. La utilidad fundamental que tiene
esta caracterstica de la distribucin de x estriba en que nos habilita para la
construccin de intervalos de confianza.
Luego de sacar una muestra concreta y suponiendo que se conociera S2 se
podra calcular lo que llamaremos error de muestreo:
E = (1, 96) VAR ( x)

[3.4]

Sumando E a la estimacin x obtenida, se tiene el extremo superior del intervalo y restando E de x , el extremo inferior6.

3.6. Clculo de los intervalos de confianza


Al observar la frmula [3.4], se advierte de inmediato que en la prctica sera imposible calcular este intervalo de confianza, ya que en un problema real, S2
es desconocido; su cmputo exige conocer los valores de X para todos los miembros de la poblacin, y eso es precisamente lo que se quiere suplir mediante el
recurso del muestreo.
Sin embargo, este nmero puede ser estimado a travs de la propia muestra
mediante la llamada varianza maestral:

s2 =

2
( xi x )

n 1 i =1

[3.5]

Puede demostrarse que en el caso que nos ocupa (MSA), s2 es un estimador


insesgado de S2; o sea, que el promedio de todos los valores de s2, calculados para
N
las muestras posibles, coincide con S2.
n
En este punto ya se puede construir un intervalo de confianza que depende
slo de elementos conocidos. Sustituyendo s2 en lugar de S2 en [3.3], se puede
estimar VAR( x ) mediante la frmula siguiente:

6
En rigor, habra que considerar la llamada confiabilidad. Aqu se ha partido de que se trabaj con una
confiabilidad del 95% y se ha puesto sistemticamente el nmero 1,96, correspondiente al percentil 97,5 de la
distribucin normal estndar. Tal simplificacin resulta acorde con el espritu del libro y con la prctica ms
extendida. El caso general, sin embargo, resulta muy fcil de construir para cualquier lector entrenado en teora
elemental de probabilidades.

102

DISEO RAZONADO DE MUESTRAS

Se estima entonces el error de muestreo:

y, finalmente, se construye el intervalo en s:

Debe notarse que e es la mitad de la longitud del intervalo de confianza; por


tanto, si efectivamente ocurriese que X est dentro del intervalo, entonces la distancia entre la estimacin x y el parmetro X es, a lo sumo, igual a e; de ah que
se considere ese nmero como el error asociado a la estimacin.

3.7. Tamao de la muestra


De las secciones precedentes se deriva una primera conclusin, tan importante como intuitiva: el tamao de muestra tiene un papel determinante sobre la
magnitud del error muestral de las estimaciones; consecuentemente, el tamao
mnimo necesario depender del error mximo que se considere admisible.
Desde luego, en la prctica hay una limitacin adicional evidente: los recursos.
Los requerimientos de precisin se supeditan, en ltima instancia, a las posibilidades materiales con que se cuente. Si obviamos por el momento este aspecto
del problema7, el asunto puede plantearse en los trminos siguientes: cul es el
tamao de muestra mnimo con que puede estimarse X de manera que | x X |
sea menor que cierta magnitud preestablecida? Ya sabemos que tomando n
suficientemente grande se podr estar virtualmente seguro de que se cumpla
que | x X | E, por pequeo que sea el valor de E.
Por consiguiente, la solucin exige que se comience por establecer el valor
mximo que puede admitirse para E. Supongamos que, luego dejan anlisis con
el especialista, se arriba a la conviccin de que basta conocer X con error no
superior a E0.
Por ejemplo, si lo que se quiere es conocer el salario medio en cierta poblacin, y se declara que se admite un error mximo de hasta E0 = 7 pesos, entonces
es que se est pensado en trminos como los siguientes: Si el verdadero promedio fuera $320, pero lo que se me informa es que asciende a $327, entonces
7

En la Seccin 12.3 se discuten detalladamente diversos aspectos relacionados con el tamao muestral.

MUESTREO SIMPLE ALEATORIO

103

considero que conozco adecuadamente el dato; sin embargo, si se me dijera que


ese nmero es, por ejemplo, $312, y luego me entero de la cifra verdadera,
entonces considero que estaba trabajando con un dato demasiado alejado de
la verdad. Tal valor de E0 determina el tamao mnimo necesario. Puesto que la
relacin entre el error y el tamao muestral viene dada por la frmula [3.4], para
conocer n, todo lo que hay que hacer es despejarla de la expresin
S2
n
E0 = (1, 96)
1 .
n N
Al hacer tal despeje (maniobra algebraica que, por cierto, no es inmediata), se obtiene:
n0
n=
n
1+ 0
N
donde

n0 =

(1,96) 2 S 2
E02

[3.9]

Como se aprecia en esta frmula, el tamao muestral depende de tres elementos: del tamao poblacional N, de la varianza poblacional S2 y del mximo
error admisible E0, elementos que, por tanto, deben ser conocidos de antemano
para aplicar la frmula. Para cada uno de ellos cabe hacer algunas consideraciones8.
i) Tamao poblacional

El MSA exige la posesin de un listado de elementos; por tanto, con ms razn, el tamao de ese listado tambin tiene que conocerse. Sin embargo, en la
prctica suele ocurrir que el verdadero tamao de la poblacin se ignora; sa es
una de las razones por las que raramente se utiliza el MSA puro. Es fcil comprender que, por ejemplo, el nmero exacto de mujeres en edad frtil en una provincia o la cantidad de nios del pas que tienen entre 3 y 5 aos son, en condiciones normales, nmeros desconocidos, aunque, naturalmente, casi siempre se
puedan tener valores aproximados (sobre todo poco despus de un Censo Nacional). En otro tipo de poblaciones, tales como el conjunto de sujetos de una
ciudad cuyo padre haya muerto de un infarto de miocardio, conocer exactamente ese nmero es simplemente quimrico. Prescindiendo por el momento de es-

En rigor, dependen de un cuarto componente, la confiabilidad; pero ya se aclar que se asumira la ms


convencional (95%).

104

DISEO RAZONADO DE MUESTRAS

ta limitacin, consideremos brevemente la influencia de la magnitud de N sobre


el tamao de muestra necesario.
Aqu se presenta un hecho muy poco intuitivo: la influencia de N es en la
mayor parte de las situaciones prcticas despreciable. En efecto, si se tienen dos
poblaciones con aproximadamente el mismo valor de S2 y los requerimientos
de precisin no varan, el tamao de muestra necesario ser aproximadamente el
mismo aunque las poblaciones sean de tamaos muy diferentes. Dicho de otro
modo: lo que influye de manera sustancial en la precisin de las estimaciones no
es la magnitud relativa de la muestra con respecto a la que tenga la poblacin
(expresada formalmente a travs de la fraccin de muestreo f), sino el tamao
absoluto de la muestra. Esto es vlido cuando, como ocurre casi siempre, se trate
de poblaciones muy grandes respecto de los posibles tamaos mustrales, pero
no rige cuando el valor de f sea apreciable (por ejemplo, no cuando sea mayor
que 0,1).
Para ilustrar estas ideas, supongamos que se planifican dos estudios de fecundidad: uno en una gran ciudad donde hay alrededor de medio milln de mujeres en edad frtil, y otro en uno de sus municipios que tiene unas 55.000 mujeres en esa franja de edad. Supongamos que en ambos casos se quiere conocer
mediante MSA el salario medio de dichas mujeres con error no mayor de $7 y
que de estudios anteriores se conoce que 5 es aproximadamente igual a $75
para ambos grupos9. Cul sera el tamao de muestra necesario en cada estudio?
Hay que aplicar la frmula [3.9] para cada situacin:
n0 =

(1, 96) 2 (72) 2


72

441 es el mismo en los dos casos (no depende de N); el

efecto del tamao poblacional puede evaluarse calculando

la ciudad se tiene n =
1+

441
441
500.000

441,

n=
1+

n0
. Para toda
n0
1+
N

441
437 para
441
55.000

el municipio.
O sea, el tamao de muestra para ambas poblaciones sera bsicamente el
mismo. Sin embargo, si el estudio se fuese a verificar en un rea de salud que tu-

9
Cabe intercalar que, desde luego, en la prctica casi nunca se abordaran poblaciones de varios miles de
unidades mediante MSA, como veremos ms adelante. Pero esta relacin que rige entre el tamao poblacional y
el que debe alcanzar la muestra es tpica, cualquiera sea el mtodo de muestreo utilizado; de ah el inters de este anlisis.

MUESTREO SIMPLE ALEATORIO

105

viese slo 1.000 mujeres en las edades de inters, la reduccin del tamao de
441
muestra sera apreciable: n =
306.
441
1+
1.000
ii) Mximo error admisible
El mximo error admisible E0 refleja el grado de precisin que se desea como
mnimo. Puesto que E0 figura en el denominador de la frmula de n0, y como a
su vez n crece cuando lo hace n0, la frmula [3.9] conduce a que el aumento en
la precisin exigida incrementa el tamao muestral necesario, hecho compatible con nuestro sentido comn.
En su determinacin interviene vitalmente el usuario del muestreo, ya que
es l quien mejor puede identificar las consecuencias prcticas que se podran producir en caso de superar un error dado. Cabe aqu hacer una observacin en consonancia con las consideraciones preliminares contenidas en la
Seccin 1.10.4.
Puesto que la frmula [3.9] exige que anticipemos un error mximo admisible, es evidente que este habr de nacer de una reflexin racional (si tuviera
sentido fijar E0 libremente, entonces sera mejor decidir el tamao muestral directamente sin ms trmite). Las claves de esa racionalidad son dos:
a) La situacin prctica, que conduce a que nos preguntemos cul sera un
nivel de precisin mnimo aceptable teniendo en cuenta lo que ya se sabe sobre
este parmetro? En efecto, no tendr sentido plantearse estimar, por ejemplo, la
tasa de ciegos en una ciudad con un error absoluto mximo de 2%, ya que cual
quiera que sea el intervalo que obtengamos, ste ser no informativo (vese
12.8.2).
b) La magnitud que a grandes rasgos tiene el parmetro. Por poner un ejemplo elocuente, es fcil advertir que no se puede valorar si una precisin de un
kilogramo, al estimar un peso promedio, es o no aceptable mientras se ignore
qu es lo que estamos pensando (probablemente sera exageradamente exigente
si se trata de camiones, adecuada si fueran personas adultas, y totalmente insuficiente si fueran lombrices). Se trata del mismo callejn sin salida en que se estara si, para medir la longitud de un objeto, hubiera que decidir si ha de emplearse una cinta mtrica, una regla escolar, un pie de rey o un micrmetro sin
conocer cul es el objeto en cuestin.
Ambos asuntos, emparentados entre s, conducen a pensar en trminos relativos a la hora de fijar E0.
Tpicamente, E0 suele tomarse entre el 5% y el 10% de la magnitud que
presumiblemente podra tener el parmetro que se quiere estimar (er = 0,05 o
er = 0,10 respectivamente).

106

DISEO RAZONADO DE MUESTRAS

iii) Varianza poblacional

Aqu se presenta una situacin contradictoria: para calcular n se necesita S2,


pero ste no slo es un parmetro desconocido sino que ni siquiera puede estimarse, ya que, obviamente, la determinacin del tamao muestral es previa al
acto de la seleccin (y, por ende, anterior a toda aspiracin de emplearla para hacer una estimacin). Bsicamente son dos las opciones que se sugieren en los
textos clsicos para resolver esta contradiccin:
a) estimarlo a travs de una muestra piloto.
b) obtener un valor a partir de las referencias que se tengan de trabajos o experiencias similares ya realizados.
En general, es claramente intuitivo que cuanto ms variable sea cierta realidad, ms informacin sobre la misma ser necesario poseer para poder describirla aceptablemente. Por ejemplo, 1 cm2 de cierta tela puede servir para apreciar
cmo es toda la tela si sta es uniforme; pero sera insuficiente si se tratara de un
estampado; y cuanto ms complejo sea el estampado, mayor ser la muestra de
tela necesaria para describirlo. La frmula [3.9] sintetiza este hecho ya que, a
mayor valor de S2, mayor es el tamao muestral necesario.
En esta seccin se ha tratado el problema de la determinacin del tamao
muestral de manera bastante esquemtica. En la prctica el asunto es mucho ms
complejo por mltiples razones; la primera de ellas es que en las aplicaciones
ms comunes no se utiliza el modelo que se ha supuesto aqu (MSA). Por esa razn, en el ltimo captulo (Seccin 12.3) se vuelve a abordar el tema, entonces
con un enfoque mucho ms flexible y realista.

3.8. Estimacin de otros parmetros


Las secciones anteriores se dedicaron al caso en que el problema de muestreo
se asocia a la estimacin de una media poblacional. Con frecuencia, sin embargo, el inters se centra en la estimacin del total acumulado por una variable en
una poblacin o -con muchsima ms frecuencia- en la estimacin de un porcentaje o de una fraccin o proporcin10. Como se ver, la teora correspondiente
a estos casos se asocia ntimamente a la desarrollada para la media poblacional.
En la literatura estadstica (especialmente en la que se dedica al muestreo), se suele hablar de proporcin para referirse a una fraccin en que el denominador es un nmero de unidades y el numerador es el nmero de tales unidades que cumplen alguna condicin. Ignoro de dnde surge esta prctica (que abarca al ingls, con
el trmino proportion) pero la considero incorrecta. En efecto, el trmino proporcin est reservado para una relacin en que intervienen cuatro elementos. Se dice, por ejemplo, que a y b guardan la misma proporcin que
a
c
cuando se cumple que = . Sin embargo, la expresin est tan extendida que ocasionalmente la empleab

remos como sinnimo de fraccin.

MUESTREO SIMPLE ALEATORIO

107

3.8.1. Estimacin de un total poblacional

Supongamos que lo que se desea es estimar el parmetro X T = X i , el llamai =1


do total poblacional de la variable X. Consideremos, por ejemplo,
que se tiene
una poblacin de N sujetos que fueron objeto de cierta intervencin quirrgica,
donde se define Xi como el costo de la operacin correspondiente al i-simo sujeto y se quiere conocer el gasto total XT en que incurri el sistema de salud como
consecuencia de esas N intervenciones. Obtenido dicho dato para los n integrantes de una MSA, se tiene la informacin muestral x 1 , x 2, ,x 3 . Cmo
obtener una estimacin insesgada de XT a partir de los datos muestrales?
Advirtiendo que X T = NX es evidente que X T = Nx cumple la condicin de
insesgamiento. De aqu se deduce inmediatamente que:
var( X T ) = N 2 var( x )

[3.10]

La frmula ya conocida para obtener un intervalo de confianza vale ahora con


la modificacin correspondiente para la varianza.
Cabe consignar que el resultado que se acaba de exponer es un caso particular
del siguiente teorema, cuya demostracin puede hallarse en Kish (1965):

Si llamamos XT al total muestral correspondiente a una muestra equiprobabilstica entonces X T es un estimador insesgado del total poblacio

nal, donde es la probabilidad de inclusin (comn a todos los elemenn

tos). Ms generalmente, cualquiera sea el diseo,


insesgada del total poblacional.

i =1

Xi

es una estimacin

3.8.2. Estimacin de una fraccin o proporcin


Supongamos ahora que lo que interesa es estimar una proporcin. O sea, se
tiene una poblacin de N elementos, cada uno de los cuales posee o no cierta
A
caracterstica, y lo que se quiere es estimar la fraccin P =
donde A es el
N
nmero total de elementos que poseen dicha condicin. Obviamente, P es un nmero mayor o igual que 0 y no mayor que 1. Con frecuencia este parmetro se
expresa multiplicado por una potencia conveniente de 10; tal es el caso por
ejemplo de los porcentajes, que no son sino fracciones multiplicadas por 100.

108

DISEO RAZONADO DE MUESTRAS

Para estudiar este problema resulta ventajoso cuantificar la variable cualitativa de la siguiente manera: se define la variable X que slo puede tomar el
valor 1 o el valor 0 en dependencia de que el sujeto tenga o no, respectivamente, la caracterstica en estudio. O sea, se considera que la poblacin de valores
X1, X2,, XN est integrada por ceros y unos, donde Xi = 1 si el i-simo sujeto tiene la condicin y X1 = 0 en caso de que no la tenga. A partir de ello es evidente
N

que

X i = A y, por tanto, que P =


i =1

1
N

X .
i =1

Esto quiere decir que la proporcin es un caso particular de la media aritmtica; sea, cuando Xi asume la forma particular que se acaba de describir, la
media X pasa a ser la fraccin P que ahora nos ocupa.
ste es un hecho de singular importancia, ya que ahora slo resta adecuar la
teora desarrollada para la estimacin de X a esta forma particular de la variable.
En particular, teniendo en cuenta que para estos valores de Xi se cumple que
N

i =1

i =1

X i = X i = A
2

Xi
2
N
N
i =1
= A A = N ( P P 2 ),
y que ( X i X ) 2 = X i2
N
N
i =1
i =1
no es difcil constatar que [3.3] se reduce, en este caso, a:

N PQ
(1 f )
N 1 n

VAR( p) =

[3.11]

donde Q = 1 P.
Si seleccionamos una muestra mediante MSA y llamamos x1, x2, ,xn a los
valores de estos elementos, se tiene que

1 N
xi es la fraccin muestral de sujetos
n i =1

con la caracterstica. En efecto, anlogamente a como ocurre a nivel poblacional,


la suma tiene tantos sumandos iguales a 1 como elementos de la muestra tengan
la condicin. Llammosle a a ese nmero y denotemos la proporcin muestral
mediante la letra p.
Ahora, como ya sabemos que x es un estimador insesgado de X , independientemente de cules sean los valores especficos que tengan los elementos de
la poblacin, se deduce que p es un estimador insesgado de P.
1 n 2

Observando ahora que [3.5] es equivalente a s 2 =


xi nx 2 y que en

n 1 i =1

este caso particular se cumple

x =x
i =1

2
i

i =1

2
= a se infiere que, s puede expresarse

MUESTREO SIMPLE ALEATORIO

como una funcin de p: s 2 =

n
n 1

109

pq donde q = 1p.

La varianza de p puede estimarse -haciendo uso de [3.6] mediante:


var( p ) =

pq
n 1

(1 f )

[3.12]

Sustituyendo en la frmula [3.4], tenemos que:


e = (1, 96)

pq
n 1

(1 f )

[3.13]

De modo que se puede calcular el intervalo de confianza para P con la


frmula [3.8].
Razonando de la misma manera, a partir de [3.9], es fcil arribar a que el tamao de muestra mnimo para estimar P con error absoluto no mayor que E0 y
confiabilidad del 95 % viene dado por:
n=

n0
n0

n 1
N 1 n0
+
1+ 0
N
N
N

donde
n0 =

(1, 96) 2 PQ

[3.14]

E02

3.8.3. Error absoluto, error relativo y estimaciones complementarias


Cuando se estima una fraccin P, se est de hecho estimando tambin su
complemento Q = 1 P. Puesto que el error absoluto estimado viene dado por
pq
la frmula e = 1, 96
(1 f ) es obvio que ste ser el mismo para P que
n
para Q; consecuentemente, salvo que P Q = 0.5, los errores relativos
e
e
nunca sern iguales.
y er ( q) =
er ( p ) =
P
Q
Mirndolo al revs, si se fijara un error relativo para determinar el tamao
muestral a la hora de estimar P, y el mismo error relativo para estimar Q, se obtendran tamaos de muestra diferentes, lo cual carece de sentido. Dicho de otro

110

DISEO RAZONADO DE MUESTRAS

modo: no es posible estimar tanto P como Q con el mismo error relativo11. Cmo conciliar esta realidad con la recomendacin opuesta, segn la cual lo nico
racional es operar con errores relativos? Reproduzco a continuacin las ideas
contenidas en Silva (2000) sobre este controvertido asunto.
Consideremos primero un caso ms general que el de P y Q: supongamos que
se quiere estimar una distribucin donde, en lugar de 2, hay K categoras. Es
k

decir, se quieren estimar K porcentajes que cumplen la condicin Pi = 1


i =1

Qu frmula emplear para determinar el tamao muestral con el fin de estimar


estos porcentajes?
Supongamos que K=3 y que para determinar ese tamao elegimos uno de los
porcentajes de inters (digamos, P1). En principio los tres porcentajes interesan
por igual, como por ejemplo ocurrira si se tratara de estimar tasas de enfermos
con SIDA, de seronegativos y de seropositivos a VIH. Si se fija un valor para
Pi a priori y un error absoluto e1, se podr aplicar la frmula [3.14] usando:
n0 =

(1, 96) 2 P1 (100 P1 )


e12

Pero, siendo as, entonces no se tendr control alguno sobre la precisin con
que se estimarn P2 y P3, estimaciones que sern rehenes del e1, elegido.
A mi juicio lo nico razonable sera centrar el inters en el ms pequeo de
todos, fijar un error que se considere razonable (directamente un error relativo, o
un error absoluto, pero teniendo en cuenta cul pudiera ser el valor de esa fraccin, que es lo mismo que fijar un error relativo) y, con esos datos, aplicar la
frmula, que producir un tamao con el cual se estimaran adecuadamente (probablemente, con creces) los dems.
Para ilustrar lo anterior, supongamos que hay 4 categoras de inters y que la
distribucin verdadera es 3%, 10%, 18% y 69%. Supongamos que se elige la
cuarta fraccin para determinar el tamao muestral con que se quieren estimar
las 4, y que como anticipacin se establece el valor P4 = 70, as como un error
absoluto de e 4 = 7. La frmula [3.14] usando n0 =

(1, 96) 2 P4 (100 P4 )


e42

producira un tamao de muestra igual a n = 165 (suponiendo, ahora y en el


resto de esta Seccin, que la fraccin de muestreo es despreciable). Si tras seleccionar tal muestra se obtuvieran, pongamos por caso, las estimaciones 2%,
10% y 18% para los tres primeros porcentajes, los respectivos errores estimados seran aproximadamente 2%, 5% y 6% (errores relativos de 100%, 50% y
11

Esta circunstancia ha conducido a algunos autores (Seuc, 1999, Marrugat, Vila y Pavesi 1999, por citar dos
ejemplos) a recomendar que se fije, simplemente, un error absoluto (el cual s ser comn a ambos parmetros).

MUESTREO SIMPLE ALEATORIO

111

33% respectivamente). Es virtualmente seguro que en el primer caso, y quizs en


el segundo y hasta en el tercero, los intervalos obtenidos no contribuyan a saber
nada que no se conociera de antemano. Lo que hay que hacer es concentrarse
en el primero de ellos (por ser el ms pequeo) y fijar como error absoluto un
valor que pudiera ser quizs e1=0,6 (20% de 3), lo cual arrojara que el tamao
necesario es 2102. Ello producir para los otros tres porcentajes, respectivamente, los siguientes errores absolutos: 1.3%, 1.6% y 2.0%. Ellos pudieran ser,
en algunos de los casos, ms pequeos de lo necesario, pero ese es el precio que
hay que pagar por el hecho de que una de las tasas que interese (la primera) sea
tan pequea.
La situacin en que K=2 no es ms que un caso particular de lo anterior. Habra que elegir el menor de los dos (entre P y 1 P) y calcular el tamao necesario fijando sobre bases racionales el error para ste. Es la nica manera de estar seguros de que dicho error absoluto estimado (comn a ambos en este caso)
ser razonablemente pequeo tanto para el menor como para el mayor de los dos
porcentajes complementarios12.

3.9. Un problema de urnas


A continuacin se plantea un problema que resulta til en ms de un sentido.
En primer lugar porque es bonito (en definitiva, por qu no reivindicar la belleza como algo til?). En segundo lugar porque subraya el papel del tamao
muestral absoluto en relacin con la precisin. Y, finalmente, porque enfatiza
que la varianza de los estimadores es el recurso natural para valorar la eficiencia de un procedimiento muestral (especialmente, para comparar procedimientos
mustrales alternativos).
Supongamos que dos personas participan en el juego que se describe a continuacin. En un saln hay dos urnas (A y B), cada una de las cuales contiene bolas rojas y blancas. La urna A contiene NA = 200 bolas en total, en tanto que la B
contiene NB = 10.000; el porcentaje P de bolas rojas se desconoce, pero se sabe
que es el mismo en ambas urnas. De lo que se trata es de estimarlo; para ello se
consideran slo dos estrategias posibles:
A: Seleccionar nA = 50 bolas al azar de la urna A.
B: Seleccionar nB = 300 bolas al azar de la urna B.

Supongamos que cada uno de los dos contendientes selecciona una estrategia
diferente; hecha la experiencia, cada uno obtiene su estimacin, basada,
12

En relacin con este tema, vase tambin la Seccin 12.8.2.

112

DISEO RAZONADO DE MUESTRAS

naturalmente, en la fraccin muestral de bolas rojas p A =

rA

y pB =

rB

segn
nA
nB
el caso, donde rA y rB representan el nmero de bolas de ese color que hay en la
muestra de tamao 50 y 300 respectivamente. El ganador del juego es aqul cuya estimacin de P sea ms precisa. O sea, A ganar si |pA P| es menor que |pB
P|, y B gana en caso contrario. Si pA dista de P tanto como pB, se declarar un
empate. Cul estrategia ser la ms favorable? Dicho de otro modo, cul de las
dos alternativas produce la victoria con mayor probabilidad?
El problema puede plantearse en trminos de errores mustrales: en ambos
casos se hace un MSA para estimar el mismo porcentaje desconocido, pero con
tamaos mustrales y poblacionales diferentes. La pregunta formulada equivale
a establecer para cul de las dos estrategias el error de muestreo es menor.
El sentido comn o la intuicin indican (equivocadamente) a la mayor parte
de las personas que debe elegirse la estrategia A, pues la inferencia se estara
basando en la observacin del 25% de la poblacin (50 de 200), en tanto que
bajo la estrategia B sta se basara en un msero 3% de la poblacin (300 de
10.000). Sin embargo, 300 es mucho mayor que 50 y, por ende, la primera muestra contiene ms informacin que la segunda, hecho que parece no contar para la
mayora de las personas.
En palabras de Kahneman y Tversky (1972): la nocin de que la varianza
muestral decrece proporcionalmente con el aumento del tamao absoluto de la
muestra no parece integrar del repertorio de intuiciones del ser humano.
Bar-Hillel (1979) realiz una experiencia consistente en plantear a 110 estudiantes que solicitaban su ingreso a la universidad un problema similar al que hemos formulado arriba. El 65% de ellos escogi la estrategia A y el resto la B. En
mi experiencia, el porcentaje de individuos que se pronuncia por la estrategia
ms ineficiente es aun mayor.
Volviendo al problema, al aplicar la frmula [3.11], se tiene:
VAR ( p A ) =
VAR ( pB ) =

PQ N A n A
nA

NA

= PQ

PQ N B nB
nB 1

NB

200 50
(49)(200)

= PQ

= (0, 015) PQ

10.000 300
(299)(10.000)

= (0, 003) = PQ

O sea, independientemente del valor de P, VAR(pB) es 5 veces menor que


VAR(pA). Si se hace 1.000 veces la experiencia: en cuntas de ellas ganar cada
contrincante? La respuesta no tiene una solucin analtica simple aunque sepamos que la estrategia B conducir ms veces a la victoria que la estrategia A para cualquier valor del porcentaje comn a ambas urnas. En una experiencia simulada se obtuvo, por poner un ejemplo, lo siguiente: para P = 0,40, B gan 705

MUESTREO SIMPLE ALEATORIO

113

veces, perdi 272 veces y se produjeron 23 empates. Para P = 0,01 (slo el 1%


de las bolas son rojas en cada urna), B gan en 902 oportunidades, perdi 56
veces y se obtuvieron 42 empates. El programa URNAS que se halla dentro
del mdulo de simulaciones de SIGESMU (vase el captulo 11) permite simular esta experiencia con parmetros (na, Na, nh, Nb y P) definidos por el
usuario.

3.10. Discusin de un ejemplo prctico


Supongamos que se tienen 6.760 historias clnicas (HC) acopiadas durante
varios aos por el servicio de psiquiatra de un hospital, correspondientes a pacientes que ya lo abandonaron (alrededor del 15% por fallecimiento y el 85%
restante por recibir el alta). Las HC se hallan archivadas de modo que pueden
numerarse del 1 al 6.760 y se quiere seleccionar una muestra con vistas a una
auditora mdica. Aunque la encuesta habr de registrar diversos aspectos (y ser
ms acuciosa para los sujetos que recibieron el alta con la etiqueta de muerte
hospitalaria), admitamos que interesa especialmente estimar dos parmetros:
porcentaje de historias que contenan alguna deficiencia13 y tiempo medio de
estancia. Supongamos que este ltimo, sin embargo, slo interesa para los sujetos que estaban vivos en el momento del alta.
Habindose decidido aplicar un MSA, el primer paso consiste en determinar
el tamao de muestra necesario. Supongamos que se plantea que la precisin no
tiene que ser mayor que la que brinda un error relativo del 10 %. Esto quiere decir que si el verdadero valor del tiempo medio de estancia fuese, por ejemplo,
de 20 das, el error mximo que se admitira para dicha estimacin sera de 2 das.
Consideremos que como es usual se ha decidido trabajar con confiabilidad igual al 95 %. Para poder aplicar la frmula [3.9] hace falta an tener una
idea de la varianza de esta variable (tiempo de estancia).
Al examinar una muestra piloto de 15 historias de sujetos vivos al alta
(elegidas sin ningn criterio especial)14 se obtuvieron los siguientes resultados
(en das):
18

13

67

12

49

32

146

36

27

121

83

16

10

30

30

No definiremos ahora qu se entiende por deficiencia de una HC, pues ello resulta irrelevante; en una
encuesta real, sin embargo, tal definicin operacional sera de mxima importancia.
14
No procede que para este pilotaje se haga un diseo riguroso; todos los objetivos del estudio piloto suelen alcanzarse sin dificultad haciendo una seleccin informal, esencialmente basada en el sentido comn. (Vase Seccin 2.4.)

114

DISEO RAZONADO DE MUESTRAS

La media y la varianza de estos nmeros son iguales, respectivamente, a15:

XP =
S P2

15

X Pi = 45, 7

15 i =1
15

2
( X Pi X P ) = 1.727, 95

14 i =1

Puesto que el 10% de X P es igual a 4,6, tomaremos E0 = 4,6. Aplicando la frmula [3.9] se tiene entonces que: n = 299,7.
Finalmente, hay que contemplar el hecho de que slo el 85% del total de las
historias clnicas corresponden a los individuos que interesan a los efectos de este parmetro (vivos al alta). De modo que la cifra final sera el resultado de dividir 299,7 entre 0,85, operacin que arroja un tamao muestral de 353 historias.
Por otra parte, supongamos que de un estudio anterior se conoce que alrededor del 30% de las historias clnicas de psiquiatra presentan alguna anomala
en el sentido definido para este estudio. Si queremos estimar P con el mismo
error relativo mencionado antes (10%) 16, en trminos absolutos se trata entonces
de la dcima parte de 30; es decir E0 = 3. De modo que, a los efectos del porcentaje, el tamao muestral sera, segn la frmula [3.14]: n = 791.
Los nmeros 353 y 791, candidatos a constituir el tamao muestral, son marcadamente discrepantes: cul elegir? Una solucin es alcanzar una especie de
compromiso como, por ejemplo, un nmero intermedio; tambin puede ser el
mayor de los dos (lo cual cubrira ambas demandas, una de ellas con creces), u
otra variante que no est muy alejada de las alternativas en juego. Supongamos
que, finalmente, se decidi estudiar 600 historias clnicas. O sea, se supone, en
resumen, que con una muestra de alrededor de 600 historias se podr estimar
adecuadamente el tiempo medio de estancia X y el porcentaje de historias con
deficiencias, ambos con error relativo no muy alejado del 10%. As las cosas,
se tiene que la fraccin de muestreo es f = 0,088.
Supongamos que, a lo largo del estudio de la muestra, cinco de las HC
seleccionadas tuvieron que ser desechadas por resultar ilegibles, de modo
que los datos corresponden a slo 595 encuestas. Hecho el estudio, se obtuvo que el nmero de historias con anomalas ascendi a 203 y que el nmero de historias correspondientes a altas de sujetos que salieron vivos result
ser 487.

15

Se ha usado el subndice P para subrayar que se trata de datos salidos del pilotaje.
Cabe preguntarse, como es natural, qu porcentaje tomar como bueno para la definicin del error relativo
o, alternativamente, porqu tomar el 10%. No existe ninguna razn especial; quizs 2 argumentos pueden invocarse. Primero, que un error del 10% de lo que se mide, suele admitirse en la vida comn como algo aceptable.
Segundo, que los humanos tenemos 10 dedos (o sea, el nmero 10 es el ms cercano a nuestros ojos, lo cual le
d quizs preferencia sobre el 9 o el 10,2).
16

MUESTREO SIMPLE ALEATORIO

115

Por otra parte, si llamamos Xi al nmero de das que estuvo ingresado el paciente correspondiente a la i-sima historia clnica entre aquellos 487 que salieron vivos del servicio, supongamos que se obtuvieron los siguientes resultados:
487

xi = 22.411

i =1

s 2 = 2.012, 21

En este punto, ya es inmediato el cmputo de intervalos de confianza para los


parmetros.
Comencemos por las estimaciones puntuales:
22.411
203
x=
= 46, 02
p=
= 0, 341
487
595
Se ha de notar que los denominadores son diferentes: mientras el porcentaje
se estima empleando la muestra completa (595 historias clnicas), la media se estima con la submuestra de los 487 que estaban vivos al alta. Esta ltima, tal y como se ver ms adelante (Seccin 3.11.2) puede considerarse un MSA del universo de pacientes vivos en el momento del alta hospitalaria.
Resumiendo hasta ahora: los resultados mustrales permiten decir que el tiempo de estancia estimado para sujetos vivos en el momento del alta es de 46 das, y
que el 34% de las historias reflejan alguna anomala. Ahora corresponde estimar
los errores asociados a estas estimaciones.
Con los datos arriba consignados y usando las frmulas [3.6] y [3.12] respectivamente se obtienen las estimaciones de las varianzas, necesarias para estimar
los errores:
var( x ) = 3, 776
var( p ) = 0, 00042
Finalmente, los intervalos de confianza, calculados a travs de la frmula
usual, son: [42,2-49,8] para la media (en das), y [30,1-38,1] para el porcentaje. Quiere esto decir que se puede estar virtualmente seguro de que, aproximando a das completos, la estancia media en el hospital de aquellos pacientes
(del total de 6.760) que estaban vivos al alta, no est por debajo de 42 ni por encima de 50 das. Anlogamente, el porcentaje de HC que exhiben alguna anomala no supera al 38% ni es menor del 30%l7.
Obsrvese ahora que los errores relativos estimados son, respectivamente, del
8 % y del 12 %; o sea, en el primer caso un nmero menor que el deseado, y en
el segundo, uno mayor18. Esto es totalmente lgico y ocurre tpicamente en cualquier encuesta: algunas estimaciones sern ms precisas de lo previsto y otras
17
Ntese que, en rigor, 38,1 supera a 38, pero slo en un marco de puntillosidad formal: para el pensamiento estadstico, estos dos nmeros son una misma cosa.
18
Estos errores relativos se estiman, naturalmente, dividiendo la mitad de la longitud de los intervalos de
confianza entre la estimacin puntual del parmetro.

116

DISEO RAZONADO DE MUESTRAS

menos, pues dependen de las variabilidades verdaderamente estimadas con la


muestra y no de las especulaciones realizadas para poder establecer el tamao
muestral (aparte de que los tamaos calculados eran diferentes mientras que el
empleado, desde luego, es nico).
Del ejemplo se deriva un planteamiento general ya formulado: debe procurarse una estimacin con el nivel de precisin previsto, y para ello ha de tomarse un tamao muestral adecuado (en el bien entendido de que ste es un concepto relativo y por ende susceptible de un manejo flexible). Pero si, por alguna
razn, esto no se lograse, queda un dividendo de gran importancia: luego de la
encuesta siempre puede calcularse de manera objetiva la magnitud del error en
que, a lo sumo, se incurri. Asimismo, puede calcularse el error asociado a la estimacin de cualquier otro parmetro que con esa muestra quiera investigarse,
aunque no haya intervenido en la determinacin del tamao muestral, como ocurre con la inmensa mayora de ellos.

3.11. Complementos del muestreo simple aleatorio


3.11.1. Muestreo simple aleatorio con reemplazo
Supongamos que en el ejemplo c) de la Seccin 3.2, en lugar de seleccionar 5
bolas simultneamente de entre las 10 que se hallan en la urna, se procede del siguiente modo: se saca una bola, se anota su nmero y se reintegra a la urna;
despus se mezclan las diez bolas y se repite el procedimiento en otras cuatro
oportunidades. Bajo tal procedimiento una misma bola puede ser seleccionada
ms de una vez.
Cuando una poblacin de tamao N se somete a la eleccin de n elementos de
manera tal que, en cada seleccin, todos los elementos tienen probabilidad

1
N

de

ser elegidos, se dice que se ha realizado un muestreo simple aleatorio con


reemplazo (MSACR).
Si un elemento quedase incluido ms de una vez en la muestra, al hacer cualquier estimacin debe repetirse el valor correspondiente de la variable tantas
veces como esto haya ocurrido. Al igual que con MSA, puede demostrarse que
la media muestral x es un estimador insesgado de X , as como que la frmula para la varianza de x es, en este caso, la siguiente:
VARR ( x ) =

N 1 S 2
N

Al comparar [3.15] con [3.3] se aprecia que la varianza de la media, si se ha


usado MSA, nunca puede ser mayor que la que corresponde al MSACR. En
efecto, puede observarse que la igualdad slo se produce si n = 1 (en cuyo caso,

MUESTREO SIMPLE ALEATORIO

117

naturalmente, ambos mtodos se reducen a lo mismo), pero que si n > 1, entonces necesariamente se cumple que:
VARR ( x ) > VAR ( x )
Este resultado es completamente lgico, ya que el MSA siempre produce
muestras integradas por n elementos diferentes de la poblacin, en tanto que a
travs de MSACR, el nmero de elementos distintos entre s puede ser menor,
con la consecuente prdida de informacin. Es decir, el MSA siempre ser ms
eficiente que el MSACR para un mismo tamao muestral.
Corresponde enfatizar que aqu se han usado las frmulas de la varianza con
un objetivo diferente del ms usual: hasta ahora se haban empleado, bsicamente, para hallar estimadores del error de muestreo, pero en este caso, al igual
que en el problema de las urnas de la Seccin 3.9, han servido para comparar dos
mtodos de seleccin. Esto tiene importancia metodolgica: ilustra cmo pueden
y deben hacerse evaluaciones relativas de los procedimientos desde un punto de
vista general e independiente de los resultados fortuitos a que pueden dar lugar
las aplicaciones especficas.

3.11.2. Subconjuntos de una muestra simple aleatoria


En Hansen, Hurwitz y Madow (1953) se puede ver la demostracin del siguiente resultado:
Si se toma una muestra mediante MSA de una poblacin, entonces los elementos de dicha muestra que tengan cierta caracterstica constituyen una
muestra simple aleatoria del subconjunto de la poblacin definido por la
posesin de dicha caracterstica.
Este resultado tiene relevancia prctica, ya que es muy comn la situacin
en la cual, adems de ciertas estimaciones poblacionales, se desea hacer algunas estimaciones restringidas a una parte de la poblacin, a la que suele llamrsele una clase o un dominio de la poblacin.
Por ejemplo, imaginemos que se proyecta una encuesta para estudiar la morbilidad por accidentes entre estudiantes de enseanza media. Adems del inters
por estimar ciertos parmetros poblacionales (por ejemplo, el promedio de das
de clase perdidos por concepto de accidentes, o el porcentaje de individuos
accidentados durante cierto lapso), lo natural es que tambin se deseen estimaciones segn grupos de edad y sexo, o dentro de otros dominios (clases) como el de los alumnos escolarmente ms y menos calificados, los que practican
o no deportes, etc.

118

DISEO RAZONADO DE MUESTRAS

Lo que afirma el teorema es que si la seleccin inicial se efectu mediante


MSA, entonces para estudiar una subpoblacin se puede considerar que los elementos de la muestra que estn en dicha parte constituyen una MSA de la misma. De modo que el procesamiento de esa submuestra puede hacerse con la misma teora general que se aplicara a la muestra inicial19. Debe consignarse, sin
embargo, que el nuevo tamao muestral de esta submuestra pasar a ser en rigor una variable aleatoria.
Este resultado tiene utilidad prctica incluso por otra razn: con frecuencia el
listado al que se tiene acceso contiene elementos que no pertenecen a la poblacin objeto y se hallan dispersos dentro de dicho listado. En tal caso, si se conoce que la fraccin de estos elementos ajenos a la poblacin de inters es , se
toma una muestra de tamao n y se trabaja luego con los que efectivamente
1
pertenezcan a dicha poblacin.
Por ejemplo, supongamos que se tiene un listado con los nombres y centros
de trabajo de un conjunto de enfermeras en el cual no aparece consignada la
edad, pero que lo que interesa para un estudio de morbilidad laboral es seleccionar una muestra de 100 enfermeras mayores de 35 aos. Si se sabe que slo el
40% de las que tienen esta profesin sobrepasan tal edad (o sea = 0,6), enton100
ces deben seleccionarse
= 250 por MSA y conservar slo aque0, 4
llas mayores de 35 aos para el estudio; ese conjunto puede ser tratado como una
MSA tomada de la poblacin de elementos mayores de 35 aos.
Por extensin, para muestras bastante grandes y si se trata de subconjuntos
que no se concentran en zonas especficas de la poblacin, sino que estn
dispersas dentro de ella, este resultado vale para cualquier diseo muestral. Es
decir: el subconjunto de una muestra definido por la posesin de un rasgo dado
puede considerarse, en esencia, una muestra de todos los que tienen dicho rasgo,
que ha sido seleccionada con el mismo procedimiento muestral usado para la
muestra completa.

3.11.3. Asignacin aleatoria


Supongamos que se planifica un ensayo clnico para evaluar la eficacia de la
homeopata en la curacin de la conjuntivitis y que se compararan 3 tratamientos: cierto remedio homeoptico (A), agua (B) y un colirio convencional (C). Se
ha decidido tratar 50 pacientes con cada uno de ellos. Es necesario asignar
aleatoriamente los prximos 150 enfermos que acudan a la consulta de modo
19

De hecho, as fue como se procedi para estimar la media muestral del tiempo de estancia en el ejemplo
de la Seccin 3.11.

MUESTREO SIMPLE ALEATORIO

119

que queden ubicados 50 en cada uno de ellos. Potencialmente, se cuenta con


un listado de 150 sujetos. La asignacin aleatoria a los tres grupos no es otra
cosa que seleccionar una muestra simple aleatoria de tamao 50 y asignarle
el tratamiento A a sus integrantes; luego obtener otra muestra simple aleatoria de los otros 100, asignar el tratamiento B a stos y finalmente el tratamiento C a los 50 que restan. El procedimiento es algo engorroso, aun contando
con un programa informtico para realizar seleccin aleatoria, ya que despus de la primera seleccin habra que renumerar del 1 al 100 a los sujetos no
seleccionados. Por eso es conveniente contar con programas ad hoc para la
asignacin, aunque, en rigor, lo que stos hacen es aplicar sucesivamente el
MSA.
El programa ASAL incluido dentro del mdulo de Simulaciones dentro de
SIGESMU tiene exactamente ese propsito, (vase Captulo 11)

3.11.4. Estimacin de una razn


Supongamos que estamos ante una poblacin finita de N elementos y que se
estn considerando dos variables diferentes X e Y, susceptibles de ser medidas
sobre cada unidad de anlisis.
Puede entonces considerarse la razn entre los totales respectivos de estas variables en la poblacin. O sea, podemos definir un nuevo parmetro poblacional,
al que llamaremos razn, mediante la frmula:
N

R=

Yi

i =1
N

[3.16]

Xi

i =1

Vale la pena detenerse brevemente a considerar algunas situaciones que ilustran el posible inters por estimar razones. Los siguientes recuadros contienen
tres de ellas:

Supongamos que se estudia una comunidad integrada por ncleos familiares y definamos:
Xi = salario mensual que recibe la i-sima familia.
Yi = gasto mensual en que incurre la i-sima familia por concepto de medicinas.
El parmetro R expresa qu fraccin o parte del salario es utilizado en la comunidad para adquirir medicinas. En este caso R es un nmero entre 0 y 1.

120

DISEO RAZONADO DE MUESTRAS

La poblacin en estudio est integrada por las viviendas de un rea de salud. Se definen:
Xi = nmero de habitaciones de la vivienda i-sima.
Yi = nmero de residentes habituales de la vivienda i-sima.
R puede entenderse en este caso como un ndice de hacinamiento en el
rea de salud, que expresa el nmero medio de individuos por habitacin.
R puede, tericamente, ser mayor, igual o menor que 1.
Se tiene una poblacin de estudiantes (por ejemplo, alumnos de tercer ao
de medicina). Consideremos:
X i = promedio de notas obtenidas por el i-simo alumno durante su
segundo ao.
Yi = promedio de notas del i-simo alumno en tercer ao.
R es un nmero que refleja si el grupo de estudiantes experiment o no
una mejora de uno a otro ao, y expresa la magnitud de la mejora (si
R>1) o del deterioro (si R fuera menor que la unidad).
Supongamos que se desea estimar R a travs de un muestreo simple aleatorio.
Sean x1, x2,..., xn e y1, y2,..., yn los resultados obtenidos al medir X e Y en n unidades seleccionadas por MSA.
El estimador que usualmente se utiliza es:
n

R =

yi

i =1
n

[3.17]

xi

i =1

Se trata de un estimador sesgado: basta crear un ejemplo sencillo para corroborar que el promedio de todos los posibles valores de R no coincide con R.
Debe advertirse, como rasgo distintivo peculiar, que tanto el numerador como
el denominador son, en este caso, resultados aleatorios.
Se puede demostrar, sin embargo, que el sesgo de R es una magnitud que
disminuye rpidamente cuando n aumenta, y que se aproxima a 0 para valores
medianamente grandes del tamao muestral.
La varianza de R se estima mediante la frmula
var( R ) =

1 f
xT2

n
n n 2 2 n 2
yi + R xi 2 R xi yi
i =1
i =1

n 1 i =1

donde es el total muestral de la variable X.

[3.18]

MUESTREO SIMPLE ALEATORIO

121

Debe sealarse que la frmula [3.18] se puede usar slo si la variabilidad del
denominador de R no es muy acusada. Concretamente, como medida de variabilidad de xT se ha sugerido el siguiente valor:
cv = n(1 f )
donde S x =

Sx
xT

2
( xi x ) En trminos prcticos, se exige que cv sea menor

n 1 i =1
que 0,2 (Kish, 1965).
Consideremos que en el segundo ejemplo arriba mencionado el tamao
poblacional es N = 184 y que los valores de X e Y para una muestra simple aleatoria de tamao n = 12 son los que siguen:

Entonces:

63
R =
= 2, 25
28
1
var( r ) =

12

184 . 12 453 + (2, 25) 2 (76) 2(2, 25)(147) = 0, 229

282 11

Es fcil corroborar que CV = 1,141 y que en este caso puede emplearse


[3.18], lo cual arroja el resultado: e = (1, 96) 0, 229 = 0, 94 . Es decir, se estima
que hay 2,25 individuos por habitacin con un error de casi un habitante.
APNDICE: El azar y los nmeros pseudoaleatorios

Una posible definicin de lo que significa el azar sera aquello no susceptible de ser programado. Obviamente, esto se contradice directamente con la
existencia de programas computacionales capaces de producir nmeros aleatorios. En rigor, lo que se puede obtener con las PC son los llamados nmeros
pseudoaleatorios. Vale decir: se trata de algoritmos que permiten obtener se-

122

DISEO RAZONADO DE MUESTRAS

cuencias de dgitos que soportan adecuadamente las pruebas de aleatoriedad y


son considerados como aleatorios a todos los efectos prcticos.
El trabajo original en esta materia fue debido a Neuman (1951), quien introdujo el mtodo conocido como middle square. La idea central era tomar un nmero inicial (semilla) de n dgitos, elevarlo al cuadrado para formar as un nmero de 2n dgitos, tomar entonces los n dgitos intermedios para continuar el ciclo
elevndolo al cuadrado, y continuar sucesivamente el proceso. Por ejemplo, consideremos n = 4 y tomemos la semilla So = 8374. Los siguientes tres nmeros
de la secuencia seran:

S02 = 70123876 S1 = 1238


S12 = 1532644 S 2 = 3264
S 22 = 10653696 S3 = 6536
Lamentablemente, este proceso conduce bastante rpidamente a una repeticin peridica, especialmente si uno de los dgitos elegidos para integrar S0 es
cero.
Una importante contribucin en el refinamiento de estos procesos fue debida
a Lehmer (1951), quien propuso el mtodo de la congruencia lineal, en que una
sucesin de nmeros aleatorios se obtiene a partir de una semilla r0 (no negativa y menor que cierto m prefijado) del modo siguiente:
ri +1 = ( ari + b) mod m
donde los nmeros a y b son tambin no negativos e inferiores a m. (NOTA:
recordar que la expresin X = Y mod m equivale a decir que el resto resultante de
dividir Y entre m es igual a X, en ese caso se dice que Y es congruente con X
r
mdulo m.) Tras obtener la sucesin, los nmeros aleatorios sern ai = i . Por
m
ejemplo, si tomamos m = 235, a = 4, b = 13 y r0 = 21, se tiene que a r0 + b =
(4)(21) + 13 = 97; por otra parte, 97/235 = 0 3 5 + 97, de modo que, r 1 = 97. Los
primeros 10 valores de r i y de A i seran:

r0 = 21

a0 = 0, 089

r1 = 97

a1 = 0, 413

r2 = 166

a2 = 0, 706

r3 = 207

a3 = 0,880

r4 = 136

a4 = 0, 579

r5 = 87

a5 = 0, 370

r6 = 126

a6 = 0, 536

r7 = 47

a7 = 0, 200

MUESTREO SIMPLE ALEATORIO

r8 = 201

a8 = 0,855

r9 = 112

a9 = 0, 477

123

El trabajo realizado a lo largo de los ltimos 40 aos en esta rea ha sido intenso y productivo. Revisiones exhaustivas de esos esfuerzos pueden hallarse en
Sowey (1978), James (1990) y Dodge (1996).

Bibliografa
Bar-Hillel M. The role of sample size in sample evaluation. Organizational Behavior
and Human Performance 1979; 24: 295-257.
Dodge Y. A natural random number generator. International Statistical Review 1996;
64: 329-344.
Fienberg SE, Tanur JM. Reconsidering the fundamental contributions of Fisher and
Neyman on experimentation and sampling. International Statistical Review 1996;
64: 237-253.
Fisher RA, Yates F. Tablas estadsticas. Madrid: Editorial Aguilar, 1963.
Hansen MH, Hurwitz WN, Madow WG. Sample survey methods and theory. New York:
Wiley, 1953.
James F. A review of pseudorandom number generators. Computer Physics Communications 1990; 60: 329-344.
Kahneman D, Tversky A. Subjective probability: a judgment of representativeness. Cognitive Psychology 1972; 3: 430-454.
Kish L. Survey sampling. New York: Wiley, 1965.
Lehmer DH. Mathematical methods in large scale computing units. Annals of Computer Laboratory of Harvard 1951; 26: 141-146.
Marrugat J, Vila J, Pavesi M. Supuesto de mxima indeterminacin: error absoluto o
error relativo en el clculo del tamao de la muestra? Gaceta Sanitaria 1999; 13:
491-493
Neuman I von. Various techniques used in connection with random digits. En: Honseholder AS, (ed.) The Monte Cario Method Ced. National Bureau of Standard: Applied Mathematics Service, No. 12, 36-38
Seuc AH. Relation between the prevalence of a characteristic and the size of the sample
needed to estimate it. European Journal of Epidemiology 1998; 14 627-628.
Silva LC. Tcnicas mustrales aplicadas a la investigacin higinico-social. La Habana: Instituto de Desarrollo de la Salud, 1982.
Silva LC. Nueva visita al supuesto de mxima indeterminacin y al empleo de errores
absolutos y relativos. Gaceta Sanitaria 2000 (en prensa).
Sowey ER. A Second clasified bibliography on random number generation and testing.
International Statistical Review 1978; 46:89-102.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.

4
Muestreo sistemtico

4.1. Una alternativa al muestreo simple aleatorio


Supongamos que se quiere elegir una muestra de tamao 80 de un listado de
mdicos que contiene exactamente 16.000 nombres ordenados alfabticamente.
Una primera idea sera seleccionar una muestra simple aleatoria, en cuyo caso
la fraccin de muestreo sera igual a f =

80
16.000

1
200

; esto quiere decir que

la muestra contendra el 0,5% de los individuos de la lista. Para aplicar tal procedimiento sera necesario numerar primero consecutivamente a los 16.000
elementos de la poblacin, despus seleccionar al azar 80 nmeros menores que
16.000 diferentes entre s y, finalmente, identificar a los 80 sujetos asociados con
los nmeros resultantes. Como resulta evidente, tal procedimiento resulta considerablemente laborioso.
Puede entonces contemplarse un recurso alternativo, conocido como muestreo sistemtico (MS), el cual se bosqueja a continuacin.
Se selecciona un nmero aleatorio r entre 1 y 200 y se forma la sucesin
siguiente:
r, r + 200, r + 400, ... , r + 15.800
que consta de exactamente 80 nmeros e identifica a otros tantos individuos
diferentes. Los elementos que integran esta muestra se han determinado por un
procedimiento en el que interviene el azar, aunque de manera muy especial.
En efecto, tan pronto se elige aleatoriamente el primer elemento de la muestra (el que ocupa el r-simo lugar del listado), queda automticamente determinado todo el subconjunto que resultar seleccionado en calidad de muestra. El
nmero r que se elige para iniciar el proceso de seleccin se denomina arranque aleatorio.

126

DISEO RAZONADO DE MUESTRAS

Es fcil convencerse de que en este ejemplo, puesto que hay slo 200 arranques posibles y de que las muestras posibles son disjuntas' entre s, el nmero de
tales muestras posibles es tambin igual a 200. Esto contrasta notablemente con
el astronmico nmero de posibilidades a que dara lugar un MSA. Es natural
preguntarse si, a partir de esta peculiaridad, ambos mtodos son igualmente eficientes o no. A ello nos referiremos ms adelante pero, por el momento, corresponde subrayar la sencillez del trmite.
Tal sencillez se torna extrema en determinadas situaciones, para las que no es
preciso siquiera asignar nmeros previamente a los elementos de la poblacin,
sino que basta con disponer de un marco muestral con cierta ordenacin fsicamente explcita (visitas sucesivas de pacientes a un centro, renglones en un libro de registro o historias clnicas en un estante). A modo de ilustracin, supongamos que se tiene un archivo con 3.000 tarjetas o fichas de identificacin de
pacientes y que se quiere seleccionar una muestra de tamao 300 para estimar
el porcentaje de tarjetas que adolecen de algn tipo de omisin. Supongamos que
el nmero elegido entre 1 y 10 result ser el 7: se toma la sptima tarjeta, se
cuentan 9 tarjetas y se extrae la siguiente (decimosptima segn el orden). El
procedimiento se repite hasta que se haya recorrido el archivo completo.

4.2. Mtodo regular de seleccin


Al plantearnos el problema de obtener una muestra sistemtica de n elementos de un listado que contiene N unidades, pueden distinguirse formalmente dos
situaciones:
a) N es un mltiplo de n.
b) N no es un mltiplo de n.
El caso a) equivale a que exista un nmero entero K tal que N = nK. La frac1
cin de muestreo ser, por tanto, igual a f =
. Para aplicar el mtodo descrito
K
en la Seccin 4.1 se selecciona el arranque aleatorio r entre 1 y K y, a partir del
sujeto que ocupa el lugar r, se van tomando sucesivamente los que estn K lugares ms adelante hasta completar n elementos. En el caso b) no existe un entero K que cumpla N = nK. No obstante, una posibilidad para la aplicacin del
mtodo consiste en definir K como la parte entera de la fraccin

N
n

(o simple-

mente como el entero ms prximo a dicha fraccin) y con ese nmero obrar

Es decir, ningn objeto del listado puede pertenecer a ms de una de las muestras que pueden producirse.

MUESTREO SISTEMTICO

127

como en el caso a). Al nmero K se le llama intervalo de seleccin, y al


procedimiento, mtodo regular de seleccin sistemtica.
No es difcil advertir de que, tanto en el caso a) como en el b), el mtodo es
equiprobabilstico; as se deriva de las siguientes tres circunstancias: i) todo
1
elemento de la poblacin tiene probabilidad
de ser seleccionado, ya que caK
da arranque tiene esta probabilidad de ser el que resulte elegido, ii) cada muestra
tiene la misma probabilidad de ser seleccionada que la que corresponde al arranque que la determina, iii) cada elemento est en una y slo una de dichas muestras.
Por otra parte, en el caso a) el tamao de muestra es necesariamente igual a n,
pero en el caso b) dicho tamao es un nmero que puede ser igual a n o a n + 1 ,
en dependencia de que el arranque r seleccionado sobrepase o no, respectivaN
mente, al resto de la razn
. Por ejemplo, si N = 27 y n = 6 podemos decidir
n
27
que K sea la parte entera de
(o sea, K = 4), con lo cual se tiene que
6
27 = (6) (4) + 3. Como se aprecia, el resto es 3; es fcil comprobar que si el arranque (que se elige entre 1 y 4) es 1,2 3, entonces el tamao de muestra es 7; pero
si es igual a 4 (sobrepasa al resto), entonces el tamao de muestra es igual a 6.
Un esquema que ilustra grficamente cmo se procede con este mtodo es el
que aparece en la Figura 4.1. All se ha representado una pequea poblacin de
71 sujetos de la que se ha seleccionado sistemticamente una muestra de n = 12
unidades mediante la aplicacin de un intervalo de magnitud k = 6 a partir del
arranque r = 3. Ntese que para llevar adelante este proceso hay que definir

N = 71 K = 6 r = 3 N = 12

Figura 4.1. Representacin de una muestra sistemtica.

128

DISEO RAZONADO DE MUESTRAS

previamente cul es el orden en que se considera organizada la poblacin. En el


ejemplo de la Figura 4.1 se ha asumido que los sujetos estn ordenados de izquierda a derecha y que en cada nueva lnea se recomienza por la izquierda (el mismo
orden que rige para leer las palabras en un texto escrito en idioma castellano).

4.3. Estimacin de parmetros


Segn un resultado de la Seccin 3.12.2, la media muestral x es un estimador insesgado de X en el caso a), pero no necesariamente en el caso b). Sin embargo, este sesgo es virtualmente despreciable, especialmente si n es mayor que
40 (o sea, casi siempre); de modo que a todos los efectos prcticos la distincin entre ambas situaciones, salvo contadas excepciones, es irrelevante.
N
La situacin en que
no es un nmero entero puede abordarse por otros
n
procedimientos. Por ejemplo, para el caso en que se desea seleccionar una muestra equiprobabilstica de tamao exactamente igual a la de la situacin b), Kish
(1965) sugiere el mtodo del intervalo fraccional.

4.4. Otorgamiento de una probabilidad fija y seleccin en fases


Ocasionalmente, el inters radica en obtener una muestra equiprobabilstica
de un listado a partir de una probabilidad prefijada2. O sea, en lugar de tener
preestablecido un tamao de muestra, en esos casos se fija de antemano la probabilidad de inclusin que debe asignarse a cada unidad del listado (o equivalentemente, el porcentaje de la poblacin que debe quedar incluido en la muestra). En tal situacin se puede aplicar el mtodo de seleccin en fases, debido a
Farias y Silva (1984), que procura resolver el problema de manera simple y
econmica. La teora general se desarrolla en el trabajo citado; a continuacin
slo se describe una forma particular del mtodo general.
Supongamos que se tiene un listado de N = 70 elementos y que se desea una
muestra sistemtica, pero seleccionada de manera que la probabilidad de inclusin para todo elemento sea igual a f = 0,37. Se plantea tomar un elemento de cada 3 por el mtodo regular y, en una segunda fase, adicionar, por el mismo mtodo, un elemento de cada 18 de los que no fueron seleccionados en la primera.
Supongamos que el primer arranque aleatorio (para la seleccin en la primera
fase con intervalo K1 = 3) fue igual a 2. Esto hace que seleccionemos los 23
sujetos que ocupan los lugares: 2, 5, 8, ..., 62, 65 y 68. Al listado remanente de
2

Como se ver ms adelante, en diseos complejos de la prctica suele presentarse tal necesidad.

MUESTREO SISTEMTICO

129

47 sujetos se le aplica ahora el mtodo regular pero con intervalo K2 = 18.


Supongamos que en este segundo caso el arranque fue el 3: se adicionan a la
muestra los individuos que estn en los lugares 3, 21 y 39 del listado de los no
seleccionados (que resultan ser los elementos 4, 31 y 58 del listado original).
En este ejemplo, en definitiva, la muestra quedara integrada por los 26 (37%
de 70) individuos que ocupan los lugares marcados en el listado que se reproduce a continuacin:

En general, si se obtiene una parte de la poblacin mediante el mtodo regular con intervalo K1 y se adiciona otra parte mediante la aplicacin del intervalo
K2 a los no seleccionados en la primera fase, es fcil demostrar que la probabilidad de inclusin de cada individuo es igual a:
f =

En el ejemplo, esto es: f =

K1 + K 2 1
K1 K 2

3 + 18 1
(3)(18)

[4.1]

= 0, 37.

En Farias y Silva (1984) se considera una segunda posibilidad: tomar una


muestra por el mtodo regular con intervalo K1 y suprimir de ella una parte de
los elementos por el propio mtodo regular, pero con intervalo K2. Puede
demostrarse que en ese caso la probabilidad de quedar seleccionado es, para cada elemento, igual a:

130

DISEO RAZONADO DE MUESTRAS

por ejemplo, si f = 0,42, se puede tomar 1 de cada 2 y eliminar 1 de cada 6 de


6 1
los que resulten elegidos. Es fcil ver que 0, 42 =
. En la misma poblacin
(2)(6)
anterior de tamao N - 70, si se toma r1 = 1 (sujetos impares) y r2 = 5, el resultado de la seleccin sera el siguiente:

Nota: Aparecen en negrita los sujetos finalmente elegidos, y subrayados los que fueron eliminados en la segunda fase.

Si se parte de la probabilidad, digamos f, entonces hay que hallar un par de


nmeros enteros K1 y K2 que satisfagan con aceptable aproximacin, o bien la
ecuacin [4.1], o bien la [4.2]. La Tabla 4.1 presenta los intervalos de seleccin
adecuados para la aplicacin combinada del mtodo regular en las dos fases para cada/entre 0,01 y 0,50 (restringiendo K1 y K2 a valores no superiores a 50).
En lugar de detallar los mtodos considerados y la notacin correspondiente,
optamos por ilustrar el uso de la tabla con tres ejemplos.
Ejemplo 1. f = 0,05
Se aplica el mtodo regular con K1 = 20. En este caso, K2 = 0; es decir, no procede
aplicar una segunda fase, pues hay un nmero entero cuyo inverso coincide con f.
Ejemplo 2. f =0,15
Para este valor de f la tabla seala K1 = 6 y K2 = -10. Hay que seleccionar un individuo de cada 6 y luego aplicar el mtodo regular con intervalo de magnitud 10 a la
muestra seleccionada para suprimir de ella los elementos resultantes de esta segunda

MUESTREO SISTEMTICO

131

maniobra. El signo menos indica, precisamente, que el intervalo se aplica sobre la muestra para eliminar elementos de ella.
Ejemplo 3. f = 0,61
Como f > 0,5 se buscan los intervalos para 1 f = 0,39: K1 = 3 y K2 = 12. Se aplica
el mtodo regular con intervalo K1 = 3 y luego se adiciona uno de cada 12 de los sujetos no seleccionados. De ese modo se ha elegido un subconjunto que constituye el 39%
de la poblacin. Finalmente, se toma en calidad de muestra el complemento de ese subconjunto3.
Tabla 4.1. Intervalos de seleccin (K1, K2) para aplicar el mtodo
en dos fases que produce probabilidad de seleccin igual a f

Ntese que esa tctica permite que la Tabla 4.1 slo contemple las soluciones para valores de f inferiores
a 0,51.

132

DISEO RAZONADO DE MUESTRAS

4.5. Varianza de la media muestral


Una diferencia obvia entre el MSA y el MS radica en que en el segundo procedimiento la ordenacin de los elementos dentro del listado es un componente
ntimamente relacionado con los posibles resultados del mtodo de seleccin, en
tanto que para el MSA la ordenacin original de la poblacin es completamente
irrelevante. Concretamente, como se ilustra ms adelante en esta seccin, en MS
el ordenamiento de la poblacin determina las muestras posibles y, por tanto,
tambin la varianza del estimador que se considere.
Para la discusin subsiguiente, asumiremos que se est en la situacin en
N
que el intervalo
es un nmero entero K. En tal caso, las k muestras posibles
n
contienen exactamente n elementos y son disjuntas dos a dos (ya que no existe
ningn elemento de la poblacin que pertenezca a ms de una de las muestras
posibles).
Llamemos xi a la media muestral correspondiente a la i-sima de las K muestras posibles y X ij al elemento j-sima dicha muestra. Como ya sabamos de la
Seccin 4.2, la media muestral es un estimador insesgado; es fcil comprobar
que:

X =
En efecto

1
K

xi =

i =1

1
K

xi

i =1

1 n
1 K n
X ij =
X ij
K i =1 n j =1
Kn i =1 j =1
1

Ahora, puesto que Kn = N, y dado que ninguna pareja de muestras posibles


se intersecan, la expresin de la derecha coincide con X .
Segn la definicin, se tiene que la varianza de x puede escribirse del modo
siguiente:

VAR ( x ) =

1
K

2
( xi X )

i =1

[4.3]

Consideremos como ilustracin el ejemplo de la Seccin 3.4. Es fcil ver que,


considerando el listado de hospitales en el orden en que aparece en la Tabla 3.3,
se pueden seleccionar K = 5 muestras de tamao n = 3. La Tabla 4.2 resume los
posibles resultados.
El promedio de estos 5 valores posibles de x es, efectivamente, igual a 200, la
media poblacional.

MUESTREO SISTEMTICO

133

Tabla 4.2. Estimaciones de X para cada una de las muestras de tamao 3


que pueden obtenerse por MS de la poblacin descrita en la Tabla 3.3

Al aplicar la frmula [4.3] se tiene que VAR( x )= 2.272,0. Lo natural ahora


es comparar este resultado con el que se obtiene para un MSA de n = 3 elementos. En la Tabla 3.5 se vio que, en tal caso, VAR( x ) = 3.702,9. De modo que, en
este ejemplo, el muestreo sistemtico resulta ms eficiente que el MSA de tamao n =3. Estamos ante una situacin tpica?, se trata de una casualidad?, de
una excepcin?
Para responder a estas preguntas, notemos que cuando se aplica un MS el
valor de VAR( x ) depende de la ordenacin original con que aparezcan los elementos en el marco muestral. Las muestras posibles en un muestreo sistemtico
dependen del orden en que se hallen las unidades de anlisis dentro del listado;
consecuentemente, la varianza entre las medias posibles tambin se modifica al
cambiar dicho orden.
Por ejemplo, cuando decimos que si se usa una muestra sistemtica de tamao n = 3 en la poblacin de la Tabla 3.3 la varianza asociada a la estimacin de
la media es igual a VAR( x )= 2.272,0, se sobreentiende que nos referimos a la poblacin de hospitales listada en el orden en que aparecen en dicha tabla. Pero si
los mismos 15 hospitales se organizaran de otro modo, entonces las 5 muestras
posibles de tamao 3 no son las de la Tabla 4.2 sino otras 5 (dependientes de la
organizacin especfica del listado original) y, consecuentemente, otro sera el
valor de VAR( x ). Por ejemplo, si ordenamos la misma poblacin de hospitales de
menor a mayor segn nmero de mdicos, las muestras posibles y las estimaciones correspondientes seran las que se muestran en la Tabla 4.3.
Obsrvese que, en este caso, los posibles valores de x se parecen entre s, y
son a su vez ms prximos a X = 200. La varianza de x es ahora igual a 2.134,5,
desde luego inferior a 2.272,0 (ya que el ordenamiento impuesto fuerza a que cada una de las muestras posibles recorra la poblacin), y menor por tanto que la
varianza correspondiente al MSA (3.702,9). Otras ordenaciones producirn, sin
embargo, que Var( x ) sea mayor que este ltimo valor.
De hecho, existe un interesante resultado terico al respecto, que se puede
enunciar del modo siguiente (Madow y Madow, 1944):

134

DISEO RAZONADO DE MUESTRAS

Tabla 4.3. Estimaciones de X para cada una de las muestras de tamao 3


que pueden obtenerse por MS de la poblacin descrita en la Tabla 3.3,
pero ordenada de menor a mayor

Si consideramos los N! ordenamientos posibles de una poblacin de tamao


N, y llamamos Vsys(i) a la varianza de x para un MS en la i-sima de esas poblaciones, entonces:
1 N!
Vsys (i ) = VarMSA ( x )
N ! i =1
donde VarMSA ( x ) es la varianza de x en el caso del MSA. Se trata de un teorema
sin inters prctico directo que resalta que no hay una varianza nica de x asociada a la poblacin (independiente del orden que tengan sus elementos) y, sobre
todo, que el MS es equivalente en promedio al MSA si consideramos todos los
posibles ordenamientos.

4.6. Una advertencia acadmica


Supongamos que tenemos un campo con 45 rboles de naranja que se halla ubicado entre un riachuelo y una carretera, tal y como se bosqueja en la Figura 4.2. Se
quiere una muestra de rboles para estimar qu porcentaje de ellos est infestado
por cierta plaga de insectos. Supongamos que la humedad sea favorable a la
plaga, as como que el monxido de carbono que despiden los vehculos automotores sea, por el contrario, hostil al hbitat de los insectos. En la figura, los
rboles sombreados son los que padecen la plaga; en concordancia con las condiciones antes sealadas, los rboles prximos al ro estn infestados en su inmensa mayora, y los que se hallan cercanos a la carretera estn casi totalmente
libres de infeccin.
Supongamos ahora que los rboles se numeran verticalmente como se seala en
la Figura 4.3, as como que se ha decidido tomar exactamente 1 de cada 5 rboles

MUESTREO SISTEMTICO

135

Figura 4.2. Representacin de un terreno con rboles infestados y no infestados.

Figura 4.3. Representacin de una muestra sistemtica de rboles ordenados verticalmente (K 5; r = 1).

136

DISEO RAZONADO DE MUESTRAS

entre los 45 que existen. En tales circunstancias, si el arranque elegido fuese


r = 1 , entonces la muestra estara formada por los nueve naranjos que se hallan a la
vera de la carretera, de modo que se llegara a la estimacin de que la plaga alcanza al 100% de los rboles (Figura 4.3). Si r = 5, entonces tendramos la otra estimacin extrema: 0%. Otros valores de r daran lugar a valores menos aberrantes.
El ejemplo aporta una elegante y sugestiva ilustracin del efecto nefasto que
podra derivarse de una organizacin cclica de la poblacin. Sin embargo, la situacin es de ciencia ficcin. La vida es, desde luego, mucho ms rica y florida
que la situacin elaborada (arduamente) en la construccin precedente. Ntese
que para que se produzca la situacin descrita no slo se necesita una realidad
encartonada y uniforme hasta extremos exagerados, sino que adems el muestrista tendra que sumarse a la confabulacin tomando exactamente las decisiones necesarias para que se produzca el problema: basta con que, en lugar de k = 5
se hubiese tomado k = 6 (Figura 4.4), o manteniendo K = 5, que los rboles se
hubiesen numerado de otro modo (digamos, de izquierda a derecha, Figura 4.5)
para que las muestras posibles tuviesen otro aspecto totalmente diferente. Es
decir, incluso en una situacin de por s inslitamente desfavorable, el MS habr
de producir regularmente muestras perfectamente aceptables.
El ejemplo que he ideado es del tipo de los que clsicamente se invocan para
alertar acerca del peligro que puede esconderse detrs del MS. Tpicamente, la

Figura 4.4. Representacin de una muestra sistemtica de rboles ordenados verticalmente (K= 6; r= 1).

MUESTREO SISTEMTICO

137

Figura 4.5. Representacin de una muestra sistemtica de rboles ordenados horizontalmente (K = 5 ; r = 1).

organizacin de los listados con que objetivamente se trabaja en la prctica habr


de ser ajena a cualquier ciclicidad u otro rasgo que haga superior al primer mtodo
respecto del segundo, a los efectos de la precisin de los estimadores. Es decir, si
bien tericamente se pueden producir tanto ordenamientos ms favorables (para
los que cada una de las muestras posibles exhiben gran variabilidad interna) como ordenamientos muy desfavorables (para los que las muestras posibles son todas, o en su mayora, internamente homogneas y, por ende, poco representativas),
en la prctica tales regularidades no se presentan casi nunca. Consecuentemente,
en general, los valores de VAR( x ) para MS y para MSA no sern muy diferentes.
A nuestro juicio, es importante subrayar esta circunstancia, ya que el peligro
inherente a un presunto comportamiento peridico de ciertas variables ha sido
advertido en algunos textos, cuando en realidad no se trata ms que de una posibilidad de inters casi exclusivamente acadmico.
El problema, no obstante, es real, y podra presentarse aunque sea por
excepcin. De hecho, tras muchos aos de experiencia en esta materia, slo
conozco un ejemplo de este tipo, y es tan obvio que no parece necesitar de un
marco terico que nos ayude a precavernos. Se trata del caso en que las unidades
de muestreo son das de cierto ao. Supongamos que aquellos das elegidos de
un calendario sern los sealados para estudiar la asistencia de pacientes a un
cuerpo de guardia (por ejemplo, para estimar el porcentaje de urgencias verda-

138

DISEO RAZONADO DE MUESTRAS

deras). Si la eleccin fuera sistemtica con intervalo k = 7, entonces todos los


das de la muestra seran iguales en cuanto a su ubicacin dentro de la semana
(todos seran lunes, o todos martes, etc.). Puesto que el nmero de urgencias verdaderas guarda cierta ciclicidad a lo largo de la semana (es mayor, por ejemplo,
los sbados que los lunes), la muestra estara claramente sesgada.
Es fcil reparar, sin embargo, en que la mencionada dificultad quedara anulada tan pronto se tome otro intervalo de seleccin. Por ejemplo, bastara tomar
K = 6 o K = % para producir el efecto completamente opuesto: cualquier muestra contendra representacin de todos los das de la semana en similar o, incluso, igual proporcin.

4.7. Aplicaciones del muestreo sistemtico


El muestreo sistemtico adolece de un problema notable: a diferencia del
muestreo simple aleatorio, es formalmente imposible computar los errores
asociados a las estimaciones a partir de la muestra utilizada para la obtencin
de estas ltimas. Ello se debe a que la frmula [4.3] no puede ponerse en funcin
de un parmetro poblacional susceptible de ser estimado con la propia muestra,
como ocurra con S2 en MSA. Los mtodos de muestreo que presentan esta carencia se denominan no mensurables.
Tal deficiencia invalidara, en principio, el uso del muestreo sistemtico, si es
que se desea estimar la magnitud de los errores de muestreo a que da lugar. Para
superar este escollo terico, lo que se hace es utilizar los resultados correspondientes al MSA aunque se haya practicado un MS. Vale decir: cuando se utiliza
el MS en el acto de seleccin, tanto el tamao de la muestra como las estimaciones de los parmetros y de los errores se calculan como si se fuese a utilizar o se hubiese utilizado un MSA.
Esta lnea de actuacin se fundamenta en el hecho de que, en la mayora de
las situaciones prcticas, el orden del listado es esencialmente equivalente al que
resultara tras una permutacin aleatoria, en cuyo caso, desde luego, es lo mismo
elegir una MS que una MSA.
Un rasgo singular del MS, como ya se consign, consiste en que, a diferencia
del caso en que se emplea MSA, no siempre hace falta tener explcitamente y de
antemano un listado como tal de las unidades de anlisis. Por ejemplo, si se desea
una muestra de altas hospitalarias correspondientes a cierto ao en determinado
hospital y el estudio se est planificando en algn momento del ao anterior al
de su desarrollo, entonces obviamente se desconocen los individuos especficos
que integrarn la poblacin de inters (o sea, la poblacin de sujetos que habrn
de recibir el alta en el hospital); no se sabe siquiera el nmero de elementos que
tendr dicha poblacin. Es imposible, por tanto, delimitar los integrantes de la
muestra a travs de un MSA. Sin embargo, como es obvio, puede establecerse

MUESTREO SISTEMTICO

139

algn sistema que permita dar una ordenacin consecutiva a los pacientes que van
a ir recibiendo el alta, y prestablecer con toda precisin los elementos que integrarn una muestra sistemtica de esa futura poblacin de altas.
Digamos que se desea una muestra de 480 individuos y que, con acuerdo a
la experiencia previa, se presume que el nmero de altas que se habrn de producir a lo largo del ao entrante ascender a unos 3.200 pacientes; se calcula
480
Entonces f =
= 0,15 , lo que significa que debe seleccionarse aproxima3.200
damente el 15 % de la futura poblacin. Es fcil ver que en este caso no hay
ningn entero cuyo inverso sea igual o muy cercano a 0,15; pero se puede aplicar el mtodo de seleccin en dos fases.
En la Tabla 4.1 vemos que basta tomar un sujeto de cada 6 y eliminar uno
de cada 10 altas as seleccionadas. Tomando un arranque entre 1 y 6
(r = 3, por ejemplo) y otro entre 1 y 10 (digamos r = 8), es fcil conformar el listado
de individuos identificados por los lugares correspondientes que habrn de seleccionarse. De antemano se sabra, por ejemplo, que los individuos que ocupen los lugares 3, 9, 15, 21, 27, 33, 39, 51, 57 y 63 en el orden de altas seran los primeros 10
sujetos que habrn de incorporarse a la muestra. Este listado de sujetos previstos para ser encuestados y que conforman la futura muestra puede extenderse tanto como
se desee. Como se ignora el nmero exacto de elementos de la poblacin que se habr de conformar a lo largo del ao prximo, puede confeccionarse el listado de sujetos llamados a ser seleccionados usando un supuesto nmero de altas mucho mayor que lo que razonablemente cabe esperar, por ejemplo, 4.000 (en lugar de 3.200).
De tal suerte, si en realidad se produjesen, digamos, 3.425 altas a lo largo del ao, la
muestra, naturalmente, no contendr 480 individuos, sino 514, pero todas las altas
tendran probabilidad igual a 0,15 de integrarla (en tal caso, los nmeros que identifican la muestra y que estn entre 3.426 y 4.000, simplemente se ignoraran).
Debe sealarse que el procedimiento de seleccin sistemtica es utilizado como sustituto del MSA en el contexto de otros procedimientos ms complejos que
tienen este ltimo mtodo incorporado en algunas de sus etapas. Tal es el caso
del muestreo aleatorio estratificado y el del muestreo por conglomerados, que
sern objeto de atencin en los prximos captulos.

Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.
Farias H, Silva LC. Seleccin equiprobabilstica mediante muestreo sistemtico para
una probabilidad prefijada. Revista Investigacin Operacional 1984; 5: 51-77.
Madow WG, Madow LH. On the theory of sistematic sampling. Annals of Mathematical
Statistics 1944; 15: 1-24.

5
Muestreo aleatorio
estratificado
El MSA, introducido y desarrollado en el Captulo 3, es una tcnica de seleccin que reposa exclusivamente en el azar. Sin embargo, como ya se examin
detenidamente en la Seccin 1.9, el azar no es una garanta de representatividad.
Supongamos que en la poblacin bajo estudio pueden identificarse diferentes
grupos de elementos cuya representacin en la muestra quisiera asegurarse
(por ejemplo, diferentes grupos ocupacionales en un estudio de salud laboral).
La manera natural de lograrlo es conformar listados separados para cada uno de
dichos grupos y seleccionar submuestras dentro de cada uno de ellos. Actuando de esa manera, no slo se asegura la representacin de cada grupo en la muestra, sino que se puede controlar de antemano qu parte de la muestra habr de
proceder de cada uno de ellos.
La idea subyacente en esa estrategia es la misma que se asocia a la bsqueda
de representatividad: hacer que la muestra resulte tan variable como sea la poblacin. Para llevar a la prctica este tipo de seleccin es necesario contar con
una informacin previa sobre la poblacin que permita tanto la definicin de
los grupos mencionados como la confeccin de listados de los elementos
correspondientes a cada subconjunto. Antes de discutir con detalle esta alternativa, detengmonos en un ejemplo introductorio.

5.1. Necesidad de ponderaciones


Consideremos una fbrica que cuenta con 1.000 trabajadores: 900 mujeres y
100 hombres. Supongamos que el 80% de los hombres y el 10% de las mujeres
fuman, de modo que el porcentaje general de fumadores asciende a 17,0% (es
decir, P = 0,17), como se aprecia tras un simple clculo aritmtico. Pero supongamos momentneamente que esos datos se ignoran, y que se quiere estimar dicho porcentaje general de fumadores mediante muestreo.

142

DISEO RAZONADO DE MUESTRAS

Supongamos que para ello se selecciona una muestra de tamao 100 conformada por 50 mujeres y 50 hombres, en ambos casos elegidos al azar, y que los resultados son los siguientes: 38 hombres y 6 mujeres de la muestra son fumadores (datos compatibles con los porcentajes reales, aunque para el muestrista estos ltimos
sean desconocidos). La muestra contiene por tanto 44 fumadores en total. De modo que el porcentaje muestral es igual a 44%, resultado de dividir 44 entre el tamao muestral. Supongamos, finalmente, que se es el nmero que se da en calidad de
estimacin; es decir, que se infiere que el 44% de los trabajadores son fumadores.
Obviamente, tal conclusin es bastante disparatada, ya que el porcentaje real de
fumadores era 17. Qu ha ocurrido? En qu consisti el error cometido?
Una primera reaccin podra llevarnos a atribuir el error al hecho de no haber tomado una muestra representativa en trminos de gnero, ya que hay una
sobrerrepresentacin masculina y los hombres de esta fbrica fuman ms que las
mujeres. Sin embargo, ello no constituye error alguno. El error se comete en el
momento en que se hace la extrapolacin de la muestra al universo; es decir,
cuando se dice que el hallazgo de un porcentaje muestral de 44% permite inferir que ste ser el porcentaje poblacional.
Un enfoque elemental (aplicando un par de veces la regla de tres) conduce
a estimar que el 76% de los hombres de la fbrica y el 12% de sus mujeres es
decir, 76 y 108 trabajadores de los respectivos gneros son fumadores. Vale
decir, se infiere que 184 de los 1.000 obreros son fumadores, para una estimacin
del 18,4%. Evidentemente, la estimacin est mucho ms prxima de P = 0,17
que la proporcin muestral p = 0,44.
Lo ocurrido fue que la muestra se trat como si fuera un MSA o un MS, cuando en realidad sta ni siquiera era equiprobabilstica. En efecto, la probabilidad que
tuvo cada mujer de ser elegida fue igual a f1 =

n1

N1
n
50
de cada hombre fue 9 veces mayor: f 2 = 2 =
=
N 2 100

=
1
2

50

900
.

18

, mientras que la
.

La moraleja fundamental que se extrae de esta ilustracin es que, cuando la


muestra no se ha elegido mediante un procedimiento que otorgue la misma probabilidad de inclusin a todas las unidades de anlisis, entonces las estimaciones
no pueden realizarse mimticamente, como se hara en un MSA (estimar la media o el porcentaje poblacionales a travs de la simple media o porcentaje muestrales), sino que es menester introducir ponderaciones.
Procede intercalar aqu una frmula general (vlida para cualquier diseo
muestral) que produce una estimacin adecuada de la media poblacional. sta es:
n

X =

i xi

i =1
n

i =1

[5.1]

MUESTREO ALEATORIO ESTRATIFICADO

donde i =

143

y i es la probabilidad de inclusin que correspondi a la i-sima

unidad muestral. Es inmediato que si el procedimiento fuera equiprobabilstico,


entonces i sera constante, y x se reducira a la media muestral.
La frmula [5.1], como ya se dijo, es completamente general, de modo que
funcionar tambin en el ejemplo que nos ocupa. Si se repara en que i = 18
para las 50 mujeres de la muestra y i = 2 para los 50 varones, resultar fcil
advertir que:
18 xi + 2 xi
iM
x = iH
1.000
donde H representa el subconjunto muestral de hombres y M lo propio para las
mujeres.
Finalmente, si se define
1 si el sujeto fuma
xi =
0 si el sujeto no fuma
entonces se llega al mismo nmero obtenido antes: X = 0,184 .

5.2. Estratificacin y representatividad


Con el fin de obtener una muestra que tenga en s una variabilidad similar a la
de la poblacin, lo ideal sera conseguir que los subconjuntos en que ella se divide fuesen internamente homogneos y consecuentemente diferentes o heterogneos entre s.
Para ilustrar estas ideas supongamos que se quiere investigar la morbilidad
bucal de los escolares de una ciudad y que los investigadores saben que los patrones morbosos dependen en buena medida del nivel cultural de los padres. De
modo que, para tener un cuadro real de la magnitud y la estructura del problema,
sera conveniente examinar escolares procedentes de los diversos estratos socio-econmicas de la poblacin. En lugar de obtener un listado global de todos los escolares, el muestrista podra procurarse listas separadas de nios segn
distintas zonas de la ciudad, escogidas stas de manera que cada una se identifique a grandes rasgos con uno de los estratos socio-econmicas considerados.
Con el marco muestral as dividido, se procede a la seleccin de nios dentro de
cada listado separadamente. De tal suerte, la muestra contendr nios de todos
los grupos diferentes1.
1

sta es una estratificacin indirecta. Es evidente que resultara utpico plantearse la obtencin de listas
directamente conformadas por nios de cada estrato, ya que no es realista la aspiracin de clasificar a cada nio
segn una escala socio-econmica previamente confeccionada.

144

DISEO RAZONADO DE MUESTRAS

En la ilustracin del prrafo precedente se ha utilizado el trmino estrato socio-econmico, procedente del lenguaje comn, por su connotacin semntica
en el sentido de aludir a un grupo homogneo en algn sentido. Cuando se aplica este tipo de muestreo, los grupos en que se divide la poblacin son conocidos como estratos.
Cuando para seleccionar los sujetos dentro de los estratos se utiliza un procedimiento en que interviene el azar, se dice que se aplica un muestreo aleatorio estratificado (MAE). En lo sucesivo se asumir que el mtodo de seleccin
practicado dentro de cada estrato es muestreo simple aleatorio o, equivalentemente, muestreo sistemtico.

5.3. Procedimientos de estimacin


Como antes, supondremos que la poblacin se compone de N elementos y
que se quiere seleccionar una muestra de tamao n. Ahora se supone que este
universo est dividido en L estratos de tamaos N1, N2, ..., NL cuya suma es,
desde luego, igual a N. Se denota por nh, al tamao de la muestra seleccionada
en el estrato h, de modo que la suma n1 + n2 + + nL ser el tamao total n de
la muestra. La Figura 5.1 muestra la estructura general del MAE usando un
ejemplo en que se habran construido L = 5 estratos.
Para cierta variable X llamaremos respectivamente xh y sh2 y si a las estimaciones
de la media y la varianza dentro del h-simo estrato. Estos valores se computan
con las mismas frmulas usadas en muestreo simple aleatorio ( x y s2), pero ahora dentro de cada estrato con los nh elementos all seleccionados.

Figura 5.1. Representacin de una muestra aleatoria estratificada.

MUESTREO ALEATORIO ESTRATIFICADO

145

n
Anlogamente, se pueden definir f h = h , la fraccin de muestreo en ese esNh
a
estrato; y ph = h la fraccin de individuos que tienen cierta caracterstica en
nh
el estrato h, donde ah es el nmero de individuos de la muestra con ese rasgo en
dicho estrato.
Un estimador insesgado de la media poblacional X viene dado por la frmula siguiente:
L
[5.2.]
xI = Wh xh
h =1

donde Wh =

Nh
N

es un nmero no negativo y no mayor que uno, el cual refleja

qu parte (o porcentaje, si se multiplica por 100) de la poblacin corresponde al


L

estrato h. Obviamente, Wh = 1.
h =1

Es fcil convencerse de que xI no es igual a la media muestral. De hecho, xI


es una media ponderada de las medias x1 , x2 , ..., xL procedentes de los estratos,
con W1, W2, ..., WL como ponderaciones.
Del mismo modo, la estimacin de una proporcin P se realiza mediante el
estimador insesgado correspondiente:
L

pI = Wh ph

[5.3]

h =1

De hecho, [5.2] y [5.3] son formas particulares que asume la frmula general
[5.1] para el caso del MAE. Ntese, sin embargo, que [5.1] es una media ponderada de individuos mientras que [5.2] es un promedio ponderado de medias, aunque en este caso particular resultan ser expresiones algebraicas equivalentes.
El ejemplo de la fbrica desarrollado en la seccin anterior constituye, obviamente, una ilustracin del MAE. All tenamos:

Al aplicar [5.3], tenemos:

PI = (0,1)

como era de esperar.

38
50

+ (0, 9)

6
50

= 0,184

146

DISEO RAZONADO DE MUESTRAS

El ejemplo ilustra no slo que p, no coincide con p, sino tambin cmo, en


ciertas circunstancias, el uso de la simple fraccin muestral sera totalmente errneo a la vez que el estimador insesgado p, est en principio libre de objecin.
Para que un diseo basado en MAE sea equiprobabilstico debe cumplirse la
siguiente condicin:
n

f1 = f 2 = ... = f L f =

nh

Dicho de otro modo, debe ocurrir que

Nh

[5.4]

n
N

para todo h. En ese caso (y

slo en ese caso), se tendr xI = x y pI = p.


La condicin [5.4] aparece implcitamente en la formulacin siguiente: en el
contexto del MAE, la media muestral es un estimador insesgado de X si y slo si
se cumple que el tamao muestral n se ha repartido entre los diferentes estratos
de manera proporcional a sus tamaos.
Para calcular los errores de muestreo asociados a los estimadores en este diseo, basta advertir que la seleccin muestral es independiente dentro de los estratos (la eleccin que resulte en uno no influye en cules sean los elementos elegidos en otro) y recordar de la teora de probabilidades que:

VAR h Z h = h2VAR ( Z h )
h =1

h =1

donde 1, 2, ... L son constantes cualesquiera, siempre que Z1, Z2, , ZL sean
variables aleatorias independientes. En
el caso que nos ocupa:
L

sh2

h =1

nh

var( xI ) = Wh2

(1 f h )

[5.5]

y
L

p h qh

h =1

nh 1

var( pI ) = Wh2

(1 f h )

[5.6]

ya que en cada estrato la seleccin se ha verificado mediante MSA, y slo se trata de usar las frmulas [3.6] y [3.12] dentro de cada sumando.
No es difcil ver ahora que si se cumple la condicin de proporcionalidad
[5.4], las expresiones [5.5] y [5.6] se simplifican, y pasan a ser:
var( x ) =
var( p ) =

(1 f )
n

(1 f )
n 1

Wh sh

[5.7]

Wh ph qh

[5.8]

h =1
L

h =1

MUESTREO ALEATORIO ESTRATIFICADO

donde f =

n
N

147

es la fraccin general de muestreo (coincidente, en este caso, con

las fracciones de muestreo de los estratos).


Al examinar la expresin de var( xI ) se observa que la precisin del estimador
aumenta si crecen los valores de nh, y que dicha precisin es ms alta en la medida que las varianzas sh2 sean menores. Tales resultados, adems de ser lgicos,
confirman la aseveracin general que se hiciera cuando estudiamos el MSA, en
el sentido de que, cualquiera fuese el diseo, sa sera la relacin entre variabilidad, tamao muestral y precisin.
Por otra parte, ntese que la frmula de la varianza tiene sumandos dentro de
los cuales se hallan los respectivos valores que estiman la variabilidad interna de
los estratos (los sh2 ). En la medida que se haya logrado construir estratos internamente homogneos, estas varianzas sern pequeas, y el aporte de los diferentes sumandos a la varianza general tambin lo ser. Esto quiere decir que la
frmula refleja la situacin que, en definitiva, condujo a la estratificacin: cuanto ms homogneos sean los estratos, ms precisas resultarn las estimaciones
producidas por este sistema de seleccin.
Debe consignarse, sin embargo, que la ganancia de precisin producida por el
MAE respecto del MSA suele ser modesta, particularmente en el caso de la estimacin de porcentajes. Excepcionalmente, incluso (vase ejercicio 5.3 del Captulo 5 de Hansen, Hurwitz y Madow, 1953) puede ocurrir que el MAE llegue a
ser menos preciso que el MSA. Por otra parte, en general resulta muy poco frecuente que la situacin prctica consienta la conformacin de estratos eficientes.
Para calcular intervalos de confianza para X o para P es necesario estimar el
error asociado a la estimacin puntual realizada. Como es usual, segn el caso,
se calculan:
e = (1, 96) var( xI )

o e = (1, 96) var( pi )

5.4. Dos ejemplos ilustrativos


En esta seccin se exponen dos ejemplos de naturaleza diferente. El primero
se basa en la misma ilustracin de los hospitales y los mdicos introducida en la
Seccin 3.4, y tiene idntico propsito: aprovechar un caso artificial en que se
conoce toda la poblacin con el fin de examinar las propiedades y los fundamentos del mtodo. El segundo concierne a un problema de ndole prctica.

148

DISEO RAZONADO DE MUESTRAS

Supongamos que para la poblacin de la Tabla 3.3 se quiere estimar X mediante una MAE de tamao n = 2, donde n1 = n2 = 1, y que dicha poblacin se
ha dividido en L = 2 estratos de la manera que se recoge en la Tabla 5.1:
Tabla 5.1. Estratos formados para la poblacin de 15 hospitales
de la Tabla 3.3

Tenemos, por lo tanto, L = 2, N = 15, N1 = 7 y N2 = 8. Puesto que las muestras


tienen que constituirse mediante un hospital de cada estrato, slo 56 de los 105
subconjuntos posibles de tamao dos pueden resultar elegidos como muestra (resultado de multiplicar 7 por 8). Las posibles muestras y las estimaciones para el
caso en que se emplea la media maestral se resumen en la Tabla 5.2.
Tabla 5.2. Medias mustrales para cada una de las muestras de tamao
n = 2 que pueden obtenerse por MAE de la poblacin descrita
en la Tabla 3.3 con los estratos de la Tabla 5.1

Nota: Entre parntesis aparece el nmero que identifica a cada hospital, y al lado el nmero de mdicos.

Si se promedian los 56 nmeros de la Tabla 5.2, se obtiene el valor 194,6.


Como se ve, el promedio de las medias mustrales no coincide con la media
poblacional X = 200 pues, como ya sabemos, la media muestral no es un estimador insesgado en ausencia de equiprobabilidad. En este caso, la distancia entre
1 56
xh y X a diferencia del ejemplo de la fbrica de la Seccin 5.1, es
56 h =1
pequea, debido a que la disparidad de las probabilidades de inclusin entre

MUESTREO ALEATORIO ESTRATIFICADO

149

diferentes estratos no es tan acusada: si bien no se cumple la condicin


de proporcionalidad, ya que las dos fracciones mustrales no coinciden
1
y f 2 = ) , la diferencia entre ellas dista de ser apreciable.
7
8
En la Tabla 5.3 se vuelven a calcular las 56 estimaciones posibles, pero empleando la frmula [5.2], que en este caso se reduce a:
( f1 =

xIj =

7
15

x1 j +

8
15

x2 j

donde {x1j, x2j} sera la j-sima muestra posible.


Tabla 5.3. Estimaciones de X segn la frmula [5.2] para cada muestra
de tamao 2 que pueden obtenerse por MAE de la poblacin descrita
en la Tabla 3.3 con los estratos definidos en la Tabla 5.1

Nota: Entre parntesis aparece el nmero que identifica a cada hospital, y al lado el nmero de mdicos.

En este ltimo caso, la media de las 56 estimaciones s coincide, naturalmente,


con el parmetro X = 200, con lo cual se corrobora el carcter insesgado de xI .
Si se calcula la varianza de este ltimo conjunto de 56 estimaciones, se obtiene:

VAR ( xI ) =

56

2
( xIj X ) = 2.822, 7

56 j =1
donde xIj denota la j-sima media ponderada entre las 56 estimaciones posibles.
Por otra parte, en la Seccin 3.4 habamos obtenido que la varianza de x por MSA
de ese mismo tamao (n = 2) era igual a 6.017,1, un nmero ms de dos veces
mayor; o sea, con la estratificacin planteada2 la varianza se reduce a la mitad.
2
Obsrvese que sta es la estratificacin ptima, ya que no hay otra manera de formar dos estratos con esos
tamaos de modo que resulten internamente ms homogneos.

150

DISEO RAZONADO DE MUESTRAS

Es evidente que en la prctica el criterio de estratificacin no puede ser, como


se ha hecho en este ejemplo, el de agrupar directamente los elementos de la poblacin segn los valores de la propia variable que se estudia, puesto que tales
valores se desconocen. Como ya se consign antes, lo que se pudiera hacer es
buscar alguna variable de clasificacin correlacionada con las que se estudian y
utilizarla para llevar adelante la ubicacin en estratos. Esto es, precisamente, lo
que se ilustra con el siguiente ejemplo.
Supongamos que se tiene un listado de 1.825 pacientes hospitalizados durante cierto periodo en un hospital y que se quiere conocer, entre otras medidas
de eficiencia, el tiempo promedio de estancia en dicho centro. Se conoce que en
cierta fecha empez a regir un conjunto de medidas administrativas presuntamente influyentes en la variable de inters. Puesto que el listado est organizado cronolgicamente por fechas de alta, resulta fcil dividirlo en dos estratos:
1.200 pacientes que recibieron el alta antes de la fecha en cuestin, y 625 que la
recibieron despus. Se planifica tomar una muestra con la misma asignacin
en los estratos (de 60 individuos en cada uno), y estimar el parmetro a travs
de los 120 datos tomados de las hojas de alta que se hallan en las historias
clnicas.
En resumen, se tiene:
L = 2 N = 1.825 N1 = 1.200 N 2 = 625 W1 = 0, 66 W2 = 0, 34
n1 =60 n2 =60 n =120

Supongamos que los resultados (das de estancia del i-simo paciente de la


muestra correspondiente al h-simo estrato) se resumen del modo siguiente:
60

60

60

60

i =1

i =1

i =1

i =1

2
2
xi (1) = 624, xi (2) = 346, xi (1) = 8.249, xi (2) = 3.869

donde xi(1) denota el i-simo elemento del primer estrato y xi(2) el del segundo. De
aqu, aplicando [5.2], se obtiene que:
x1 = W1 x1 + W2 x2 = 8,82

O sea, se estima que el tiempo medio de estancia fue de 8,82 das, cifra diferente, desde luego, a la media muestral simple, que sera igual a:

( 624 + 346 ) = 8, 08
( 60 + 60 )
Para aplicar ahora la frmula [5.5] hace falta computar las estimaciones de
la varianza dentro de los estratos:
s12 = 28,8

s22 = 31,8

MUESTREO ALEATORIO ESTRATIFICADO

151

Como f1 = 0,050 y f2 = 0,096, sustituyendo en [5.5] se tiene:


var( xI ) = (0, 66) 2 (0, 950)

28,8
60

+ (0, 34) 2 (0, 904)

31,8
60

= 0, 2540

El error absoluto estimado, con un 95% de confiabilidad, es entonces igual a

e = (1, 96) 0, 2540 = 0, 95 , de modo que los lmites de confianza para X son:
8,82 0,95 = 7,87

8,82 + 0,95 = 9,77.

Podramos decir entonces que estamos confiados en que el tiempo medio de


estancia es un nmero que se halla entre 7,9 y 9,8 das.

5.5. Complementos del muestreo aleatorio estratificado


5.5.1. Asignacin de tamaos muestrales a los estratos
Al aplicar un MAE, una vez que se ha determinado el tamao n, es necesario
determinar cmo va a distribuirse ese tamao entre los L estratos; o sea, debe decidirse el modo en que se dividir el tamao general n en los tamaos n 1 , n 2 ,...,n L
correspondientes a los estratos respectivos. A tal proceso se le llama asignacin
de tamaos mustrales a los estratos.
Ya se haba considerado la asignacin proporcional, resumida a travs de la
frmula [5.4] (la ms comnmente usada), la nica que produce una muestra
equiprobabilstica. Sin embargo, esta asignacin no es necesariamente la ms
eficiente; es decir, no es el modo de repartir el tamao muestral que da lugar a
menor varianza de los estimadores.
Intuitivamente, no es difcil sospechar que si la fraccin de muestreo es mayor en los estratos con varianzas mayores que en los menos variables, para un
mismo tamao general de la muestra, la precisin aumentar. Puede demostrarse (Yamane, 1970) que la varianza de xI se hace mnima si n se desagrega en sumandos proporcionales al producto del tamao del estrato por la raz cuadrada de
su varianza. Dicho de manera resumida: la manera ptima de asignar tamaos
mustrales a los estratos a partir de un tamao muestral general igual a n, es definir nh del modo siguiente:
N S
[5.9]
nh = n L h h
N h Sh
h =1

A tal manera de asignar los tamaos mustrales se le denomina asignacin de


Neyman, debido a que fue conocida inicialmente cuando la expuso Neyman
(1934), aunque luego se supo que su descubrimiento se haba producido 11 aos
antes (Tschuprow, 1923).

152

DISEO RAZONADO DE MUESTRAS

Naturalmente, para aplicar la asignacin [5.9] es necesario conocer todos los


valores de S h2 , adems de los tamaos de los estratos; esto es, hablando estrictamente, imposible. Sin embargo, tal como ocurra al calcular el tamao de muestra en MSA (Seccin 3.7), podra recurrirse supuestamente a procedimientos que
permitan una aplicacin aproximada de la asignacin.
Todo esto es, sin embargo, algo de inters esencialmente acadmico: en la
prctica, de las pocas veces que se emplea el MAE directamente a las unidades
de anlisis, casi siempre se aplica la asignacin proporcional; es decir, salvo
raras excepciones, nunca se emplea otro tipo de asignaciones. Adems de las limitaciones impuestas por la carencia de la informacin necesaria, ntese que cada parmetro de inters exigira su propia asignacin (un estrato puede ser muy
variable para cierta dimensin X y homogneo para otra X*); pero en la prctica
slo puede haber una asignacin, puesto que se selecciona una nica muestra. En
rigor, esta advertencia es ms pertinente cuanto ms alambicados sean los procedimientos sugeridos. Muchos de ellos son quizs ms interesantes tericamente, pero proporcionalmente ms estriles en la prctica (vase, por ejemplo,
Bearwood, Holton y Hammersley, 1959).

5.5.2. Tamao de muestra


El enfoque que procede utilizar para determinar el tamao de muestra necesario sera esencialmente el mismo que se introdujo en la Seccin 3.7: identificar
n tal que el error
L

E = (1, 96) Wh2VAR ( xh )


h =1

no exceda cierta magnitud prefijada, y despejar n de esta relacin.


Sin embargo, una estrategia razonable sera la de actuar, sin ms trmite,
como si se tratara de un MSA. Por una parte, difcilmente se encuentran datos
para aplicar las frmulas resultantes (en particular, el conocimiento previo de
las varianzas dentro de los estratos difcilmente seran otra cosa que el resultado
de un acto de especulacin) y, por otra, las frmulas del MSA en la prctica siempre producirn tamaos mayores, de modo que emplendolas no habra riesgos
de trabajar con tamaos insuficientes.

5.5.3. Nmero de estratos


Aunque se han conseguido algunos desarrollos tericos destinados a guiar al
muestrista acerca del nmero ptimo de estratos que debe construir (vase
Cochran, 1977), las sugerencias ms tiles a nuestro juicio provienen de la

MUESTREO ALEATORIO ESTRATIFICADO

153

experiencia prctica acumulada. Parece indiscutible la conveniencia de evitar la


consideracin de estratos muy pequeos y, en general, se ha sugerido tomar L
entre 3 y 10 con el fin de lograr una ganancia apreciable de precisin.

5.5.4. Postestratificacin
Una posibilidad ocasionalmente practicable consiste en realizar estimaciones
teniendo en cuenta estratos poblacionales aunque la estratificacin formal no haya intervenido en el diseo. Es decir, aplicar ponderaciones a pesar de haber seleccionado una MSA o un MS. Si los tamaos Nh se conocieran (por ejemplo, a
partir de datos censales, estadsticas oficiales u otra fuentes), se pueden clasificar las unidades a posteriori y aplicar [5.2], donde xh es la media de los sujetos
que resulten elegidos dentro del estrato h. El mtodo exigira que los nh fuesen
suficientemente grandes (quizs mayores que 30).

Bibliografa
Bearwood J, Holton JH, Hammersley JM. The shortest path through many points. Proceedings of the Cambridge Philosophical Society 1959; 55: 299-327.
Cochran WG. Sampling techniques (3rd Edition). New York: Wiley, 1977.
Tschuprow AA. On the mathematical expectation of the moments of frequency distributions in the case of correlated observations. Metron 1923; 2: 461-493.
Neyman J. On the two different aspects of the representative method: the method of stratified samplign and the method of purposive selection. Journal of the Roy al Statistical Society 1934; 97: 110-114.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.

6
Muestreo
por conglomerados
Para introducir este trascendente mtodo de seleccin muestral, imaginemos
un problema prctico de magnitud tal como el que supone estudiar la anemia en
una gran ciudad. Naturalmente, en una situacin real de este tipo, donde se pretende seleccionar una muestra de tan vasto universo, nunca se desea estimar un
solo parmetro. En la prctica, probablemente, se quieran sondear aspectos tales como la prevalencia por sexos y grupos de edad, o indagar ciertas relaciones
como la que pudiera existir entre niveles de hemoglobina en sangre y condiciones socioeconmicas. Sin embargo, para esta discusin supondremos, una
vez ms, que se trata de un problema simple: la estimacin de la prevalencia de
anemia como nico parmetro de inters.
Consideremos la posibilidad de encarar dicho problema a travs de un MSA1.
Puesto que las unidades de anlisis son todos los residentes de la ciudad, el primer requerimiento sera el de conseguir un listado de la totalidad de los individuos que all residen: una lista que podra llegar a contar con alrededor de
400.000 individuos. Las dificultades para obtener tal informacin, que incluira
nombres y direcciones, son obvias; dicho ms claramente, en condiciones normales, si se deseara que tal lista estuviera realmente actualizada, se estara ante
un escollo simplemente insalvable. Supongamos, no obstante, que ste se ha superado y valoremos las dificultades a que an estara abocado el proyecto.
Admitamos que se desea una muestra de 2.000 ciudadanos y que se ha concluido el engorroso proceso de identificar 2.000 nmeros aleatorios diferentes
entre 1 y, digamos, 402.8062. Ahora nos encontraramos un panorama desola1

Toda la discusin y el razonamiento que siguen valen tambin para el caso en que se valore el uso de MS
o de MAE.
2
Para no perder realismo se supone que el listado consta exactamente de 402.806 individuos. En la prctica,
incluso, el verdadero tamao N de la poblacin es, virtualmente, imposible de conocer.

156

DISEO RAZONADO DE MUESTRAS

dor: al identificar los lugares de residencia de estos 2.000 sujetos, se


comprobara que estn dispersos a lo largo y ancho de la ciudad. La mera perspectiva de recorrerla palmo a palmo para tomar muestras de sangre y practicar interrogatorios desalentara a cualquier investigador con sentido comn.
En efecto, no tardara en ser considerada una alternativa tal como la de seleccionar, pongamos por caso, unas 50 de las miles de manzanas que existen y
completar la muestra tomando alrededor de 40 sujetos por manzana, consiguiendo as que el esfuerzo se concentre en unos pocos ncleos urbanos pequeos. Evidentemente, una variante de este tipo resultara mucho ms econmica.
En resumen: ante un problema real de mediana o gran envergadura, no resulta posible la aplicacin de un mtodo muestral que opere con un listado de todas las unidades de anlisis. La imposibilidad se debe tanto al hecho de que
usualmente se carece de una fuente adecuada de la cual obtener tal marco muestral, como a que aun en caso de que se obtuviese el listado completo el gasto
en que se incurrira para llevar adelante el estudio de una muestra inevitablemente dispersa sera prohibitivo, o muy difcilmente justificable.

6.1. Seleccin en etapas


La solucin del problema pasa necesariamente por la seleccin de la muestra
en etapas. La poblacin se divide en cierto nmero de partes o conglomerados
a las que se llama unidades de primera etapa (UPE); cada una de ellas puede a
su vez atomizarse en subconjuntos llamados unidades de segunda etapa (USE),
y as sucesivamente, hasta llegar a cierta etapa cuyas unidades estn directamente integradas por los sujetos que sern objeto de interrogatorio o medicin.
La idea estriba, entonces, en seleccionar un nmero de UPE, luego tomar un
conjunto de USE dentro de las que integran las UPE seleccionadas, y continuar
bajando hasta llegar a seleccionar las unidades de anlisis que conformen la
muestra final.
Ilustremos un proceso de esa naturaleza aprovechando el mismo ejemplo arriba planteado: la ciudad se divide en sectores censales (UPE), los sectores se consideran divididos en manzanas (USE) y stas en viviendas, las cuales estn finalmente integradas por individuos, que son en este caso las unidades de
anlisis. Supongamos que se seleccionan 40 sectores entre todos los que existen
en la ciudad3, y que dentro de cada uno de ellos se toman 5 manzanas; supongamos que se contina con la seleccin de 10 viviendas en cada una de las 200
3
De momento, no interesa detenerse en el mtodo de seleccin empleado, ni para esta ni para las siguientes etapas.

MUESTREO POR CONGLOMERADOS

157

manzanas ya obtenidas y que, finalmente, se escoge un individuo dentro de cada vivienda elegida para determinar as los 2.000 elementos de la muestra. El
proceso ha transitado en este caso por cuatro etapas de seleccin: sectores, manzanas, viviendas e individuos.
Un distintivo clave del proceso de seleccin en el muestreo en etapas consiste en que la necesidad de listados de las unidades de muestreo en una etapa
se limita a aquellas unidades seleccionadas en la etapa anterior. As, en nuestro ejemplo, se necesita un listado de sectores; luego uno de manzanas, pero slo para los 40 sectores escogidos; en su momento se necesitar un listado de
viviendas, pero solamente para las 200 manzanas elegidas en dichos sectores; y
finalmente un listado de sujetos para cada una de las 2.000 viviendas seleccionadas.
Como es obvio, la conformacin de estos listados no puede producirse al unsono, sino que tiene que ser escalonada, ya que en una etapa an no se conoce
qu listados han de ser necesarios en la siguiente. Esto economiza recursos y
favorece la agilidad del proceso; por ejemplo, la lista de residentes en una vivienda puede conformarse in situ, cuando sta sea por primera vez visitada para
realizar la encuesta correspondiente.
En sntesis: la totalidad de las unidades de anlisis est potencialmente contenida en el marco, de manera que todo individuo tiene posibilidades de quedar
en la muestra a pesar de que slo una nfima parte de ellos llega a ser explcitamente listada (en este caso, los habitantes de las 2.000 viviendas seleccionadas
en la tercera etapa y de los cuales se elegirn a la postre los 2.000 sujetos de la
muestra). Finalmente, en lo que concierne al acto de toma de informacin en terreno, las ventajas prcticas y econmicas son evidentes.
Hasta ahora, slo se ha expuesto la estructura del diseo. Naturalmente, en
cada etapa de seleccin pueden aplicarse diversos mtodos especficos. En las
restantes secciones de este captulo se desarrollan y discuten algunas variantes
y se analizan algunos de sus mritos y desventajas relativas.

6.2. Muestreo por conglomerados monoetpico


Supongamos que estamos ante una poblacin finita de N elementos (unidades
de anlisis) dividida en M conglomerados (UPE) cuyos tamaos son N1, N2, , NM,
M

de modo que N = N i .
i =1

Consideremos que se planifica seleccionar una muestra simple aleatoria de m


UPE y que la muestra final est integrada por todas las unidades de anlisis contenidas en dichos conglomerados. En tal caso, se dice que se trata de una muestra por conglomerados monoetpica puesto que, en efecto, la seleccin de ele-

158

DISEO RAZONADO DE MUESTRAS

Figura 6.1. Representacin de una muestra por conglomerados monoetpica.

mentos de la poblacin se ha verificado en una sola etapa. La estructura de este


diseo se ilustra grficamente (Figura 6.1) con un caso en que M = 11 y m = 3.

6.2.1. Tres rasgos singulares


Antes de discutir los problemas de estimacin asociados a este procedimiento, detengmonos brevemente en el examen de tres de sus caractersticas o propiedades generales.
i) El mtodo es equiprobabilstico
En efecto, tratndose de una seleccin simple aleatoria de conglomerados, cam
da uno de ellos tiene probabilidad de inclusin igual a f =
. Puesto que cada
M

unidad de anlisis queda automticamente incluida en la muestra una vez que


se selecciona la UPE que la contiene, es evidente que todos los elementos de la
poblacin tienen esa misma probabilidad de inclusin.
ii) El tamao muestral es aleatorio
El tamao total de la muestra n es, en este caso, igual a la suma de los que tenm

gan las UPE seleccionadas: n = N i. Si los tamaos N1, N2, ,nM son difereni =1
tes entre s (como ocurre en la prctica, casi sin excepcin), entonces el valor

MUESTREO POR CONGLOMERADOS

159

de n depender de los tamaos de las UPE que resulten seleccionadas. Esta


caracterstica constituye una desventaja del procedimiento, ya que imposibilita
que se conozca de antemano el nmero de encuestas que habrn de realizarse,
lo cual, a su vez, conspira contra una demanda elemental para la planificacin de
esfuerzos y recursos.
Naturalmente, si los Ni no son muy diferentes, entonces la imprevisibilidad de
n no ser muy acusada, y esta desventaja queda, a los efectos prcticos, diluida.
Debe tenerse en cuenta que, de hecho, nunca el tamao muestral es exactamente igual al planificado ya que, en el mejor de los casos, se ver afectado en una
u otra medida por el hecho de que algunos individuos no responden (la llamada
no respuesta, aspecto tratado con detalle en la Seccin 12.4).
Resumiendo, la variabilidad del tamao muestral depende de las diferencias
que exhiban los tamaos de las UPE entre s.
Detengmonos en un ejemplo sencillo para ilustrarlo. Supongamos que M = 8
y que los valores de los tamaos de los conglomerados son los siguientes:

Si se plantea llevar adelante un muestreo por conglomerados mediante la seleccin de m = 3 UPE, cules son los valores posibles del tamao muestral?
3

Por simple inspeccin de los valores de los Ni, se constata que n = N i es una vai =1

riable aleatoria cuyo valor mnimo se alcanza cuando resultan seleccionados los
conglomerados 2, 7 y 8 (n = 10 + 20 + 20 = 50), y cuyo mximo valor sera el
que alcanza si las UPE seleccionadas fueran las correspondientes a los nmeros
3, 4 y 6 (n = 100 + 80 + 140 = 320).
O sea, el tamao muestral puede moverse entre 50 y 320. La distancia entre estas dos cotas constituye una medida rudimentaria de la variabilidad de n, pero
como es natural pueden usarse medidas ms refinadas, como la desviacin estndar o el coeficiente de variacin; de momento, sin embargo, basta con sta.
Si, en cambio, los valores de los Ni fuesen ms parecidos entre s, entonces
la variabilidad del tamao muestral no sera tan marcada. Por ejemplo, supongamos que los valores fuesen:

En este caso, n queda necesariamente constreido entre 145 y 215, un recorrido en efecto mucho ms reducido. En este segundo caso, por tanto, aunque
se mantiene el carcter aleatorio del tamao muestral, su control previo es
considerablemente mayor.

160

DISEO RAZONADO DE MUESTRAS

iii) No es preciso conocer el tamao poblacional


En efecto, otra propiedad (en este caso ventajosa) del procedimiento radica
en que no slo no es necesario tener un listado de las unidades de anlisis para
realizar la seleccin, sino que ni siquiera hace falta conocer el tamao N de la
poblacin. La ventaja dimana del hecho de que como se apuntara en la seccin
precedente en la prctica el valor exacto de N se puede conocer slo en raras
ocasiones.

6.2.2. Estimacin insesgada y de razn


Toca ahora considerar el problema de estimacin que se abre cuando se ha
realizado un muestreo por conglomerados monoetpico. Llamemos X iT valor
acumulado (o total) de X por todas las unidades que integran el conglomerado
i-simo.
Puede demostrarse que:
1 M m T
[6.1]
xI =
Xi
N m i =1
es un estimador insesgado de X . Es importante sealar que la ventaja expresada
en el punto iii) de la seccin precedente, consistente en que no es preciso conocer N para llevar adelante el proceso de seleccin, desaparece tan pronto entramos en la fase de estimacin: efectivamente, uno de los ingredientes que aparecen en [6.1] es el tamao poblacional.
Una variante para la estimacin del parmetro X que no demanda conocer N es
la de emplear, sencillamente, la media muestral que, en este caso, sera igual a:
m

x=

Xi

i =1
m

Ni

i =1

A x se le llama estimador de razn, pues es una razn de dos variables aleatorias. A diferencia del caso anterior, la media muestral [6.2] no es insesgada.
El sesgo suele ser, sin embargo, despreciable; por tanto, siendo [6.2] mucho
ms simple y natural que [6.1], lo regular es utilizar x como estimacin de X
cuando se emplea este tipo de diseo.
Huelga extenderse en que la situacin descrita abarca el caso de la estimacin
de una proporcin P. Si llamamos X iT al nmero de aquellos individuos del i-simo conglomerado elegido que poseen cierta caracterstica, entonces [6.1] y [6.2]
son estimadores (insesgado el primero, con un pequeo sesgo el segundo) de la
fraccin de individuos con dicha caracterstica en toda la poblacin. Respectivamente, los denotaremos mediante p1 y p.

MUESTREO POR CONGLOMERADOS

161

Consideremos el ejemplo, en extremo simple, de una poblacin con 3 conglomerados (M = 3). Supongamos que se tiene:
N1=40

N2=60

N3=100

y que se han contado los sujetos de cada conglomerado que tienen cierto rasgo
(por ejemplo, ser mujer) con los siguientes resultados:

X 1T = 10

X 2T = 20

X 3T = 40

La fraccin poblacional de mujeres es


M

P=

X1

i =1
M

Ni

70
200

= 0, 35.

i =1

Consideremos ahora todas las muestras posibles de tamao m - 2 (que se reducen a 3) y sus resultados, los cuales se resumen a continuacin:

Es fcil constatar que el promedio de las 3 estimaciones posibles, cuando se


emplea el estimador p1, coincide con P; en tanto que el de las estimaciones de razn es igual a 0,344, diferente del parmetro.
En resumen, al utilizar el econmico procedimiento de muestreo monoetpico,
se pueden aplicar dos mtodos de estimacin: el estimador insesgado [6.1] o el
estimador de razn [6.2], ms simple y natural Ambos son inconvenientes cuando la variabilidad de los tamaos de las UPE es grande y el primero no puede
usarse si como ocurre con frecuencia el tamao poblacional N se desconoce.

6.2.3. Estimacin de errores


Procede considerar ahora el problema de estimacin de los errores.
Para el estimador [6.1], la varianza se estima empleando la siguiente expresin:

162

DISEO RAZONADO DE MUESTRAS

var( x1 ) =

M 2 S12
N2 m

(1 f )

[6.3]

donde

f =

S I2 =

T
T
Xi X

m 1 i =1

XT=

1
m

Xi

i =1

Para el estimador [6.2], la frmula es:


var( x ) =

1 f
n

m
m
m m
2
2
T 2
T
( X i ) + x Ni 2 x X i Ni
i =1
i =1

m 1 i =1

[6.4]

La frmula [6.4], sin embargo, es una aproximacin cuya validez se subordina al cumplimiento de la siguiente condicin4:

m(1 f ) sI2 < (0, 2) n

[6.5]

Para ilustrar estas frmulas, consideremos ahora otro ejemplo. Se investigan


los certificados de defuncin acumulados durante varios aos en una oficina central, los cuales se hallan almacenados en 480 paquetes de diferentes tamaos. El
nmero de certificados por paquete oscila entre 50 y 300, pero se desconoce para cada uno de ellos.
Supongamos que se cuenta, sin embargo, con el nmero exacto del total de
certificados acopiados durante el lapso que se investiga, el cual asciende a
84.228. Se quiere estimar la proporcin P de certificados que contienen algn
apartado en blanco, u otro defecto apreciable en su llenado.
Supongamos que del total de 480, se seleccionan 20 paquetes mediante muestreo simple aleatorio. Los resultados obtenidos al contar el nmero de unidades
Ni y el de certificados defectuosos X IT en los paquetes elegidos son los que se
reflejan en la Tabla 6.1.
Los datos de resumen relevantes son:
M = 480

f =
m

1
24

2
X i = 488.024

i =1

N = 84.228

m = 20

n = Ni = 2.704
i =1

T 2
( X i ) = 30.715

i =1

T
X i = 587

i =1
m

T
X i N i = 113.334

i =1

El coeficiente 0,2 es un nmero esencialmente arbitrario que se sugiere en Kish (1965).

MUESTREO POR CONGLOMERADOS

163

Tabla 6.1. Tamaos de 20 paquetes de certificados de defuncin y


nmero de certificados defectuosos por paquete

A partir de ellos, puede calcularse [6.1]: xi = 0,167 y, aplicando [6.3], se tiene: var( xi ) = 0,001105.
Por otra parte, la media muestral, segn [6.2], es igual a:
x=

587
2.704

= 0, 217

Para evaluar la precisin de esta estimacin, se utiliza la frmula [6.4] y se


obtiene var( x )= 0,000622, resultado vlido ya que, como es fcil corroborar,
en este caso se cumple la condicin [6.5].
En resumen, la fraccin P se ha estimado, con los mismos datos, por dos vas,
y los resultados son los siguientes:

164

DISEO RAZONADO DE MUESTRAS

O sea, si se usa el estimador de razn, se concluye que entre el 17% y el 27%


de los certificados contienen error, mientras que, por el otro mtodo, se concluira que dicho parmetro est entre 10% y 22%.
Se aprecia, por otra parte, que el estimador de razn produjo aparentemente5
un resultado ms preciso, pero tambin que, incluso en este caso, el error es considerable: asciende a un 5%. En trminos relativos, esto representa un 23% de
la magnitud estimada del parmetro.

6.2.4. Una incongruencia del estimador insesgado


Un caso interesante se produce cuando cada elemento puede clasificarse en
K categoras diferentes (K 2) y se desea estimar la distribucin de la poblacin segn dichas clases; es decir, estimar las fracciones P1, P2,..., PK correspondientes a cada una de dichas categoras.
Si se trabajara con los mtodos de seleccin estudiados anteriormente (MSA,
MS o MAE), la estimacin de dichas fracciones con cada uno de stos se podra
llevar adelante segn las frmulas correspondientes sin incongruencia alguna; es
fcil convencerse, sin embargo, de que en el caso del muestreo por conglomerados
monoetpico, al estimar los Pi mediante la frmula [6.1] se obtienen estimaciones
K

P1 , P2 ,..., PK cuya suma no es la unidad: Pi 1 . Esto es obviamente contrai =1

producente, ya que por definicin se cumple que Pi =1 .


i =1

Por ejemplo, supongamos que se tiene la siguiente situacin: en una escuela


que tiene N = 850 alumnos en total, ubicados en M = 26 grupos; se han seleccionado m = 4 de estos grupos, la totalidad de cuyos integrantes fue interrogada
sobre diversos aspectos relacionados con accidentes. Una de las preguntas clasificaba a cada alumno en una de K = 3 categoras segn nmero de accidentes
sufridos durante el ltimo ao:
1) No tuvo accidente alguno.
2) Tuvo slo un accidente.
3) Tuvo ms de un accidente.
5

No podemos estar totalmente seguros de ello, porque slo contamos con estimaciones de las varianzas y no
con las varianzas verdaderas, que son de hecho imposibles de conocer a travs de datos mustrales.

MUESTREO POR CONGLOMERADOS

165

Los resultados fueron:

Al aplicar la frmula [6.1] a cada categora se obtiene:

M 1 4 T 26 83
P1 =
X i1 = 850 4 = 0,63
N m i =1
M 1 4 T
26 10
P2 =
X i2 =
= 0,08

N m i =1
850 4
M 1 4 T 26 5
P3 =
X i3 = 850 4 = 0,04
N m i =1
La suma de estos tres nmeros es 0,75. De modo que, en caso de que se usara [6.1] para estimar cada una de las fracciones, la distribucin porcentual de
alumnos segn estas tres clases en que necesariamente se ubica todo elemento
de la poblacin no abarcara al 100% de la poblacin, sino slo al 75% de ella!
K

Pi de las estimaciones insesgadas es


En general, es fcil probar que la suma
i =1
m

igual a la unidad si y slo si se cumple la relacin, m = n donde n = N i . Tal


i =1
M N
condicin, como es obvio, ocurre slo excepcionalmente. En Silva y Rub (1983)
se discute esta situacin aberrante, nunca consignada en textos de muestreo
que, sin embargo, se regodean en complicados desarrollos formales sobre los estimadores insesgados.
El problema que se ha presentado abarca al caso en que K = 2; es decir, al
caso hiperfrecuente en que se estima una simple fraccin o proporcin. En efecto, en esta situacin la anomala se traduce en el hecho de que P 1 Q supuesto que tanto P como su complemento Q se estiman mediante [6.1]. Lo que
ocurre es que, en la prctica, se obtiene la estimacin de P y, si resulta necesario referirse a la fraccin (o porcentaje) de los sujetos que tienen la condicin
complementaria, directamente se emplea 1 P en lugar de reestimar Q a travs
de Q. Ello explica que esta grosera incongruencia del estimador quede oculta.
Para abundar sobre el tema consideremos el mismo ejemplo arriba expuesto pe-

166

DISEO RAZONADO DE MUESTRAS

ro considerando slo dos categoras: no haber sufrido accidente alguno y haber


tenido al menos un accidente. La situacin sera:

Si se estima la fraccin de no accidentados, sta es, como vimos, 63%; si alguien nos pregunta por el porcentaje de accidentados, usualmente restaramos 63
de 100 y responderamos: 37%. Sin embargo, si se aplica [6.1] para estimar este
ltimo porcentaje, se obtendra un nmero aparatosamente diferente: 12%
26 15

. .
resultado de calcular:
850 4

La solucin obvia para eludir esta inconsistencia consiste en usar el simple


estimador de razn [6.2] (es decir, el porcentaje muestral). En ese caso, las estimaciones seran:
m

pj =

X
i =1
m

T
ij

N
i =1

cuya suma, naturalmente, es la unidad. En el caso inicial (con tres categoras),


por ejemplo, se tendra:

p1 =

83
98

p2 =

10
98

p3 =

5
98

6.3. Muestreo en etapas con submuestreo


El muestreo monoetpico es en muchas situaciones eficiente y perfectamente
aplicable; ello explica que se emplee con bastante frecuencia, especialmente en
estudios de magnitud reducida. Tiene algunas desventajas, sin embargo; adems de
la impredecibilidad del tamao muestral que, como se vio, pudiera llegar a ser acusada, ha de contemplarse la que se explica a continuacin. En ocasiones la poblacin es demasiado grande para que el muestreo por conglomerados monoetpico
sea aplicable, ya que, bien no resuelve el problema de la dispersin incosteable de
la muestra (a la vez que exige poseer unos listados que por lo general son virtualmente imposibles de conseguir), bien las UPE seran desmesuradamente grandes.

MUESTREO POR CONGLOMERADOS

167

Supongamos que se planifica seleccionar una muestra de unos 2.000 ancianos


de una ciudad de alrededor de 1.700.000 habitantes. La poblacin objeto (o diana)
consta de unos 148.000 sujetos elegibles (ancianos) para el estudio, los cuales,
como es natural, se dispersan por todo el permetro urbano. Descartados, como
es obvio, el MSA, el MAE y el MS por las razones ya consabidas (detalladas en
la Seccin 6.1), valoremos la posibilidad de emplear un muestreo monoetpico.
Cules podran ser las UPE?
La ciudad se divide en 98 municipios de tamaos esencialmente similares, y
cada uno de ellos se subdivide en circunscripciones (entre 300 y 400 circunscripciones en cada municipio). Supongamos, por mencionar un nmero realista,
la ciudad consta de 32.144 circunscripciones en total.
Si se tomara cierta cantidad de municipios en calidad de UPE, se abre un problema evidente: en cada municipio hay no menos de 1.500 ancianos; entonces
resulta imposible elegir por muestreo monoetpico alrededor de 2.000 elementos, ya que el nmero mnimo de UPE que hay que elegir6 (m = 2) producira
un tamao acusadamente mayor que el deseado (aproximadamente 3.000).
Por otra parte, si se optase por seleccionar circunscripciones en calidad de
UPE (entre las 32.044 existentes) para luego estudiar todos los ancianos all radicados, y as completar el muestreo por conglomerados monoetpico, cuntas
de tales circunscripciones habra que seleccionar?
Un simple cmputo aritmtico deja ver que, como promedio, habr unos 4
5 ancianos en cada una de estas UPE. De modo que, para tener unos 2.000 sujetos, en la muestra, haran falta ms de 400 circunscripciones, lo cual implica que
la muestra exhibir una dispersin geogrfica muy probablemente indeseable o
directamente incosteable (adems del engorro que supone procurarse un listado
de decenas de miles de circunscripciones y despus operar con l). La introduccin de al menos una etapa adicional de muestreo resuelve estas dificultades.
La estructura del muestreo por conglomerados bietpico y la notacin correspondiente se exponen a continuacin. Se trata de seleccionar cierto nmero
m de UPE y, dentro de cada UPE seleccionada, elegir una parte de las unidades
de anlisis que la integran. La Figura 6.2 refleja este diseo para un caso en que
hay M = 13 UPE en total, de las cuales se toman m = 3 para aplicarles submuestreo.
Por ejemplo, retomando la ilustracin de los certificados de defuncin desarrollado en la Seccin 6.2.3, se podra considerar la eleccin de una muestra de
3.000 certificados mediante la seleccin inicial de 60 paquetes al azar del conjunto
de los 480 almacenados, y luego tomar 50 certificados de cada paquete as seleccionado.

6
Obsrvese que con un solo conglomerado no podran estimarse errores, ya que tanto la frmula [6.3] como la [6.4] contienen el trmino m 1 en el denominador.

168

DISEO RAZONADO DE MUESTRAS

Figura 6.2. Representacin de una muestra por conglomerados bietpica.

En general consideramos que hay M UPE de tamaos N1, N2, ..., NM y que
se seleccionan m de ellas; luego, en el i-simo conglomerado elegido, se toman
ni unidades para formar la muestra7. La notacin que usaremos es consistente
con la que se introdujo en la seccin precedente:

6.3.1. Estimador sin sesgo


Si la seleccin de las m UPE de entre las M existentes se hace mediante MSA,
y este mismo mtodo se utiliza para elegir los elementos dentro de las UPE seleccionadas, puede probarse que un estimador insesgado de X viene dado por:
7

Es fcil advertir que, cuando se toman todos los conglomerados (m = M), entonces estamos exactamente
ante la estructura de un MAE y que, en el caso en que se tenga ni = Ni para todas las UPE, lo que se realiza no es
ms que un muestreo por conglomerados monoetpico. O sea: el muestreo por conglomerados bietpico abarca
tanto al MAE como al muestreo monoetpico, como casos particulares.

MUESTREO POR CONGLOMERADOS

xc =

169

M m
Ni xi
N m i =1

[6.6]

y un estimador insesgado de P, como caso particular, por:


pc =

M m
Ni pi
N m i =1

[6.7]

donde pi es la fraccin muestral de sujetos del i-simo conglomerado seleccionado que poseen el atributo que se estudia.
Las frmulas exactas para estimar la varianza de xc y pc son en extremo complicadas y engorrosas. En la prctica, los estimadores [6.6] y [6.7] slo se emplean raramente, pero considero conveniente reproducirlas, sobre todo para que
se pueda apreciar dicha complejidad. Para la media tenemos:

var( xc ) =
donde

S x2 =

1 M 2 ( M m) S x2 M
+

N2
M
m m

1 m
( X i X *) 2

m 1 i =1

Ni2
i =1

S2 =

Ni ni Si2

ni
ni

1 ni
( xij xi ) 2

ni 1 j =1

[6.8]
con X i = N i xi ,

1 m
X * = X i , y donde xij denota el valor de X para la j-sima unidad elegida en el
m i =1
i-simo conglomerado de la muestra.
Para el caso de una fraccin, la frmula es:
var( pc ) =

1
N2

2
M 2 ( M m) m
1 m
M

N
p
N
p

i i m
i i +
m
i =1

Mm( m 1) i =1

i =1

N i ni pi qi

ni ni 1

[6.9]

donde qi = 1 pi.
La estrategia general que se ha expuesto no necesariamente produce muestras
equiprobabilsticas, circunstancia parcialmente responsable del abigarramiento
que exhiben las frmulas [6.8] y [6.9].

6.3.2. Probabilidades de seleccin


Cabe ahora intercalar la cuestin de cmo se calculan, en general, las probabilidades de inclusin bajo el rgimen de seleccin en dos etapas. La regla de
cmputo general de la probabilidad de inclusin/de un sujeto de la poblacin es
la siguiente:
f = f1 f 2
[6.10]

170

DISEO RAZONADO DE MUESTRAS

donde f1 es la probabilidad de que se elija la UPE en que se halla el sujeto y f2


es la probabilidad condicional de que ste resulte seleccionado dado que lo fue
la UPE que lo contiene.
Advirtase que la frmula [6.10] no es ms que la aplicacin de un resultado
elemental de teora de probabilidades, el que establece que P(AB)=P(B|A)P(A).
En este caso, A representa el suceso de que sea elegido el conglomerado que
contiene a la unidad considerada y B el de que esta ltima sea elegida en la
segunda etapa.
Si los m conglomerados se eligen por un mtodo equiprobabilstico (por
ejemplo, MSA o MS), entonces f1 = m para todas las UPE.
M
Anlogamente, si los ni individuos dentro del i-simo conglomerado seleccionado se toman por medio de MSA o por MS, entonces, para los individuos de
n
esa UPE se tiene que f 2 = i . Aplicando [6.10] se arriba a que la probabilidad
Ni
final de una unidad perteneciente al conglomerado i-simo es igual al producto
de esas dos fracciones:
m ni
f =
[6.11]
M Ni
Para la eleccin de los tamaos ni no hay ninguna regla; cualquier valor para
n, es en principio legtimo. Sin embargo, suelen valorarse dos casos particulares:
a) Seleccionar una fraccin fija de unidades de anlisis dentro de los conglomerados elegidos (es decir, el mismo porcentaje en cada uno de ellos).
b) Seleccionar un nmero fijo, digamos n , de elementos dentro de cada UPE
seleccionada (el mismo nmero de unidades de segunda etapa en todas y
cada una de las UPE, independientemente de sus tamaos).
En el primer caso se tiene una muestra final equiprobabilstica, pero el tamao
1
final sera aleatorio. En efecto: si f2 es constante (por ejemplo, f 2 =
, supo10
niendo que se decide tomar el 10% de los elementos contenidos en cada uno de
los m conglomerados), entonces segn la frmula [6.10] se tiene que f =

m
f2 ,
M

un nmero que no depende de qu conglomerado se trate y por lo tanto igual


para todos los elementos de la poblacin. Por otra parte, el tamao muestral ascendera en ese ejemplo al 10% del nmero de sujetos abarcados por las m UPE
que hayan resultado elegidas; consecuentemente, dicho tamao se ignorar hasta tanto no concluya la eleccin aleatoria en la primera etapa.
En el segundo caso cuando se toma un nmero fijo de unidades en cada UPE
ocurre lo contrario: el tamao final de la muestra es fijo (igual al producto mn ),

MUESTREO POR CONGLOMERADOS

171

pero, segn [6.10], la probabilidad de inclusin de cada sujeto es inversamente


proporcional al nmero de unidades de anlisis que integran la UPE que lo conm n
tiene:
, dependiente de i (igual dentro de cada UPE, pero diferente entre
M Ni
conglomerados que tengan tamaos diferentes).
Al igual que en el caso monoetpico, si los tamaos de las UPE son muy diferentes unos de otros, la variante a) debe evidentemente descartarse porque el
tamao final de muestra sera virtualmente impredecible. De no ser ste el caso,
tanto la variante a) como la b) pueden utilizarse, pero las frmulas [6.6], [6.7],
[6.8] y [6.9] slo pueden emplearse en el infrecuente caso en que se conozca
exactamente el tamao poblacional.

6.3.3. Estimador de razn


Adems de que muchas veces se desconoce N, debe enfatizarse que, en rigor, lo ideal y ms conveniente es prescindir de formulaciones tan abigarradas
como las que se asocian a los estimadores insesgados. Una alternativa de mucho mayor aplicacin en la prctica consiste en el empleo de un estimador de
razn. Si el procedimiento es equiprobabilstico, ste no es otra cosa que la
media muestral; si no lo fue, hay que incorporar ponderaciones. Veamos este
ltimo caso (el ms general).
Si llamamos yij al valor de la variable Y para el sujeto j de la unidad de primera etapa i-sima y wij a la ponderacin que corresponde a ese valor (el inverso de
ni

la probabilidad de seleccin que tuvo ese sujeto), se definen yi = wi j yij


ni

j =i

y xi = wi j .
j =1

i =1

i =1

Con estos valores pueden computarse x e y: x = xi e y = yi , y con ellos,


finalmente, se produce la estimacin:
r=

y
x

[6.12]

La varianza de r se estima, por ltimo, mediante la frmula siguiente:


var(r )

m
m
1 m m 2

yi + r 2 xi2 2r xi yi

2
x m 1 i =1
i =1
i =1

[6.13]

Ntese que la frmula [6.13] tiene la misma estructura que [6.4]. Si el diseo es equiprobabilstico, las ponderaciones pueden eliminarse. Los valores de yi
y xi se reducen a:
m

yi = yij
j =1

xi = xij
j =1

172

DISEO RAZONADO DE MUESTRAS

y [6.13] coincide enteramente con [6.4] aunque con otra notacin, salvo que en [6.13]
se ha considerado que f 0, lo cual es enteramente razonable, ya que el empleo de
muestreo bietpico se asocia tpicamente a poblaciones considerablemente grandes.

6.3.4. Ilustracin
Consideremos nuevamente el ejemplo de los certificados de defuncin introducidos en la Seccin 6.2.3, pero suponiendo que se han tomado ni = 30 sujetos
con MSA o MS en cada uno de los m = 20 paquetes. Como se recordar el nmero total de paquetes era M = 480, de modo que la probabilidad de seleccin de
m ni
20 30
=
un sujeto en la i-sima UPE es igual a
, de donde se deduce que a
M Ni 480 Ni
todos los elementos de esa UPE les corresponde la ponderacin: wi = 480 N i = 0,8 Ni .
600
Los resultados son los que recoge la Tabla 6.2.
Tabla 6.2. Tamaos de 20 paquetes de certificados de defuncin y
nmero de certificados defectuosos por paquete y datos para el cmputo
de estimaciones

MUESTREO POR CONGLOMERADOS

173

A partir de estos datos, se obtiene:


20

r=

y
=
x

i =1
20

12.157,6
= 0,187
64.896

i =1

Por otra parte:


20

yi2 = 12.328.714,9
i =1

20

xi2 = 281.101.824
i =1

20

x
i =1

yi = 53.990.073,6

y al aplicar [6.13] para m = 20, x = 64.896 y r = 0,187 se obtiene:

var(r ) = 0,000491

var(r ) = 0,022

De modo que el error de esta estimacin se estima en (1,96) (2,2) = 4,3% y


el intervalo de confianza, finalmente, resulta ser [14,3 % 23,1 %].

6.4. Muestreo polietpico


Hasta aqu se ha discutido en detalle el caso bietpico. Pero el muestreo en
etapas puede aplicarse, desde luego, a poblaciones tan grandes que pudieran exigir la incorporacin de tres, cuatro o incluso ms etapas de seleccin. Todos los
conceptos desarrollados pueden extenderse fcilmente a tal situacin. Por ejemplo, si el nmero de etapas fuese 4, la frmula [6.10] pasara a ser:
f= f 1 f 2 f 3 f 4
Las frmulas [6.12] y [6.13] tienen valor general; es decir, son igualmente vlidas en la situacin polietpica. Esto quiere decir que lo nico que influye de
manera sustancial en el cmputo de errores es la variabilidad que exhiben entre
s los datos para las unidades de primera etapa, independientemente de cuntas
etapas adicionales se hayan empleado (Kalton, 1979).

6.5. Efecto de diseo


En este punto debe insertarse un concepto de cierta importancia, sobre todo
terica: el llamado efecto de diseo. Antes de introducirlo, reparemos en la siguiente circunstancia: el muestreo en etapas es en general menos eficiente que el
MSA (supuesto, naturalmente, que no se modifica el tamao muestral) en lo

174

DISEO RAZONADO DE MUESTRAS

que concierne a la precisin de los estimadores. Ello se debe a que, en la prctica, las mismas circunstancias que agrupan o conglomeran, a los sujetos suele
hacerlos parecidos entre s y, por tanto, al tomar informacin de sujetos procedentes de unos pocos conglomerados, sta tiende a ser redundante y menos informativa que la que se obtendra a partir de una muestra con el mismo nmero
de individuos, pero dispersa por toda la poblacin.
Esta reduccin de la representatividad es claramente intuitiva; una rpida mirada a la Figura 6.3 ayuda a persuadirnos de ello: la muestra consta de 28 sujetos, pero en un caso se hallan concentrados en dos conglomerados, y en el otro
dispersos por toda la poblacin.
El grado en que la conglomeracin induce una prdida de eficiencia puede
expresarse formalmente en trminos de los errores de muestreo; ms especficamente, en trminos de la varianza de los estimadores.
Concretamente, supongamos que se quiere estimar X con una muestra de
cierto tamao y que se manejan dos alternativas: MSA y muestreo en etapas
(ME), en cualquiera de sus variantes. Llamemos VMSA( x ) y VME( x ) a las varianzas respectivas; entonces usualmente se tendr que VMSA( x ) < VME( x ). A la razn entre tales nmeros se le llama efecto de diseo y se le denota por DEFF.
El nombre un apcope de la expresin inglesa design effect es sugestivo de la
nocin subyacente, ya que se entiende que un MSA no es en rigor un diseo, sino que consiste en la toma de informacin exclusivamente basada en el azar,
sin intervencin diseadora del muestrista; en cambio, en el proceso del muestreo en etapas hay una serie de decisiones involucradas acerca de cules y cun-

Figura 6.3. Esquema de un muestreo en etapas frente a uno simple aleatorio.

MUESTREO POR CONGLOMERADOS

175

tas son las UPE, cules las unidades de segunda etapa, etc. El diseo consiste,
precisamente, en el resultado de haber adoptado tales decisiones, y DEFF mide
el efecto de hacerlo con respecto al caso en que slo interviene el ciego azar. Es
decir, se define
DEFF =

VME ( x )
VMSA ( x )

[6.14]

DEFF es normalmente mayor que 1, y el grado en que excede a este nmero expresa cunta eficiencia se ha perdido como consecuencia de haber adoptado un diseo menos preciso (aunque tambin mucho ms econmico y prctico) que un MSA.
En la prctica, cuando se ha realizado un muestreo en etapas, DEFF puede
estimarse mediante deff (inherente a dicho diseo) del modo siguiente:
1. Se hace la estimacin varME( x ) de VME( x ) mediante la frmula que corresponda al diseo elegido (usualmente, algn tipo de muestreo en etapas).
2. Se toman los n elementos resultantes en la muestra como si provinieran de
un MSA (sin reparar en las UPE de las que proceden) y se calcula la varianza de los datos mustrales, exactamente como se habra hecho en un
MSA. Por ejemplo, si se trata de la estimacin de una media, se calcula
1 n
s2 =
( xi x )2 donde n es el tamao de la muestra resultante del din 1 i =1
seo en cuestin, xi el valor de su i-simo integrante.
s2
3. Se calcula varMSA ( x ) =
que es una estimacin de la varianza de x bajo
n
MSA (donde se suele prescindir del factor de correccin).
4. Se computa: deff =

varME ( x )
varMSA ( x )

NOTA: Se ha desarrollado el caso en que se estima el DEFF correspondiente a una media; si se


tratara de una fraccin o proporcin, la formulacin es la misma, pero contemplando que
se pondra xi = 1 en caso de que el i-simo sujeto tuviera la caracterstica y xi = 0 en el
caso opuesto.

Podemos medir ahora el efecto de diseo correspondiente al ejemplo de la


seccin precedente. Se tena que la estimacin de la fraccin de certificados defectuosos era: p = 0,187 y que var(r) = 0,000491 [sta sera varME( x )].
Ahora varMSA ( p) =
y deff =

r (1 r ) (0,187)(0,813)
=
= 0,000253
n
600

0,000491
= 1,94.
0,000253

176

DISEO RAZONADO DE MUESTRAS

En este ejemplo, el muestreo en etapas es aproximadamente dos veces ms


ineficiente que el MSA en lo que hace a la estimacin de la fraccin de certificados defectuosos.

Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.
Kalton G. Ultimate cluster sampling. Journal of the Royal Statistical Society, Series A
1979; 142:210-222.
Silva LC, Rubi A. On the estimation of proportions using complete cluster sampling.
The American Statistician 1983; 37: 53-54.

7
Un diseo especial: seleccin
de conglomerados con
probabilidades
proporcionales a sus tamaos
Este captulo se destina a explicar un procedimiento que posee especial importancia prctica y cuya esencia estriba en seleccionar las UPE con diferentes
probabilidades en lugar de hacerlo a travs de un mtodo que como el MSA
otorgue iguales posibilidades de eleccin a todas ellas.
Consideremos que se quiere disear una muestra para estudiar la morbilidad
hospitalaria de una regin y que se decide hacerlo mediante una muestra de aproximadamente 2.000 historias clnicas correspondientes a altas hospitalarias producidas durante el ltimo ao. Supongamos que las altas proceden de 106
hospitales y que en total ascienden a unas 400.000 a lo largo del ao. La seleccin de altas se har en dos etapas, escogiendo inicialmente hospitales, y luego
200 sujetos de cada uno.
Supongamos que, al analizar la distribucin de altas por hospitales, se advierte que sta dista de ser uniforme: hay un pequeo grupo de 12 grandes hospitales que genera en total el 45% de las altas hospitalarias de la regin. Consecuentemente, si la seleccin de las 10 UPE se realizara con MSA, entonces cada
uno de estos 12 hospitales grandes tendra la misma probabilidad de ser incluido en la muestra que la de todos los restantes, la mayora de los cuales son
pequeas unidades municipales que por su naturaleza reflejan un tipo muy
particular de morbilidad hospitalaria.
A partir de estas consideraciones, puesto que las UPE tienen tamaos muy diferentes, es intuitivamente ilgico usar un procedimiento equiprobabilstico en la
primera etapa. Se corre el riesgo, por ejemplo, de que muchos hospitales grandes
(quiz todos) queden fuera del estudio, lo cual sera obviamente chocante. Dicho en trminos ms tcnicos: la posibilidad de tener muestras demasiado homogneas (es decir, poco representativas) sera muy grande.

178

DISEO RAZONADO DE MUESTRAS

7.1. Procedimiento de seleccin


Consideremos un mtodo especfico destinado a eliminar esta dificultad, el
cual como se ver exhibe varias virtudes adicionales. Se trata de un maestreo
equiprobabilstico que se realiza en varias etapas, pero otorgando a cada UPE
una probabilidad de seleccin proporcional a su tamao. La versin que se explica a continuacin corresponde a un diseo en dos etapas. En la medida que
se desarrolle se expondr, paralelamente, un ejemplo sencillo.
Supongamos nuevamente que se tiene una poblacin de N unidades de anlisis divididas en M conglomerados de tamaos N1,N2, ..., NM. En la vida real
suele ocurrir que los Ni no se conocen de antemano con exactitud. Por tanto, para no perder realismo, en lo sucesivo consideraremos que lo que se conoce son
ciertas aproximaciones A1, A2, ..., AM de los tamaos reales. Al tamao total
aproximado lo llamaremos A.
Por ejemplo, supongamos que se cuenta con los datos provenientes de un censo no actualizado de los residentes de un sector de salud que tiene aproximadamente A = 2.200 individuos distribuidos en M =8 manzanas del siguiente modo:

La idea es seleccionar una muestra de aproximadamente n elementos en dos


etapas: obtener m UPE con probabilidades de seleccin proporcionales a sus tamaos, y luego tomar aproximadamente n individuos en cada UPE (n = m n )1;
por ejemplo, fijemos n = 200, m = 4 y n = 50. As las cosas, la probabilidad comn que se otorgar a todos los sujetos ser igual a: f = n = 200 .
A

2.200

A continuacin se exponen, comentan e ilustran los seis pasos que deben darse para llevar adelante la seleccin.
1. Crear una lista de las UPE y obtener los tamaos acumulados
Ci = A1 + A2 + + Ai a lo largo de la misma.
En el ejemplo, esto significa conformar una tabla como la siguiente:

Acerca de la determinacin de m y

n nos referiremos ms adelante.

UN DISEO ESPECIAL: SELECCIN DE CONGLOMERADOS...

2. Calcular el intervalo de seleccin I =

En el ejemplo, esto es I =

179

A
.
m

2.200
= 550.
4

3. Seleccionar un nmero aleatorio R entre 1 e I.

Supongamos que el nmero elegido al azar entre 1 y 550 result ser R = 369.
4. Se calculan los nmeros siguientes:
Z1 = R Z2 = R + I Z3 = R + 2I Zm = R + (m 1) I
En nuestro caso, estos m = 4 nmeros son:
369

919

1.469

2.019

5. Asociar cada uno de estos nmeros con una UPE del modo siguiente:
se selecciona para cada Zi la primera UPE cuyo tamao acumulado supere o iguale al nmero en cuestin.

De ese modo, 369 identifica a la manzana 3 (pues C3 = 860 es el primer valor de Ci no superado por 369); 919 identifica a la UPE nmero 4 por ser 1.170
el primer acumulado que lo supera; 1.469 identifica a la manzana 6 y 2.019 a la
ltima. As, en el ejemplo, han quedado elegidos los conglomerados que ocupan los lugares 3, 4, 6 y 8 del listado.

180

DISEO RAZONADO DE MUESTRAS

6. Dentro del conglomerado i-simo, obtener una muestra equiprobabin


lstica con probabilidad f 2 = .
Ai

En nuestro caso se aplican fracciones de muestreo de magnitud

50 50
,
,
525 310

50
50
,y
y respectivamente a los listados de individuos en las manzanas ele190
210
gidas.

7.2. Estructura probabilstica


Analicemos ahora la estructura probabilstica inherente al procedimiento descrito. Se puede demostrar que la probabilidad de que sea elegido el conglomerado i-simo es igual a f1 =

Ai
A
= m i . No es difcil corroborarlo con un ejemI
A

plo cualquiera: el conglomerado 6, pongamos por caso, resulta elegido siempre


que uno de los nmeros Z, se halle entre 1.376 y 1.565; esto ocurre a su vez si
R es uno de los 190 valores que se encuentran entre 276 y 465. El valor de R
que se obtuvo en el ejemplo fue 369 y est en ese caso; pero si hubiese sido
466, ya no hubiera producido la seleccin de esta sexta UPE, pues 666+(2)(550)
= 1.566, un nmero mayor que C5 = 1.565; de modo que hay 190 posibles valores de R que dan lugar a dicha seleccin. Siendo 550 el nmero de arranques diferentes (es decir, de valores posibles de R ), la probabilidad de seleccin
190
190
de la sexta UPE es igual a
, que coincide con 4
.
550
2.200
Dentro del i-simo conglomerado, se ha fijado que la probabilidad de que un
n
sujeto resulte seleccionado sea f 2 = . De ese modo se consigue la equiprobaAi
bilidad general programada:

f1 f 2 = m

Ai n mn n
=
= = f
A Ai
A
A

Es necesario tener en cuenta que en el momento de seleccionar los elementos


dentro de las UPE elegidas en la primera etapa es preciso contar con listas de los verdaderos elementos que las integran. El nmero de elementos de esta lista, Ni, es en
general diferente de Ai (prximo si la aproximacin es buena, distante en otro caso).

UN DISEO ESPECIAL: SELECCIN DE CONGLOMERADOS...

181

Si en cada UPE elegida se tomasen exactamente n elementos (con MSA, por


ejemplo)lo cual pudiera ser resultado de un primer impulso entonces la
n
, de modo que la
Ni
Ai n
n
, un nmero diferente de f = , salvo
probabilidad general sera: m
A Ni
A
que no se hubieran hecho aproximaciones, sino que se conocieran los tamaos
exactos (o, equivalentemente, que se cumpliera que Ai = Ni para todas las UPE).
probabilidad de cada elemento en la segunda etapa sera

7.3. Seleccin de unidades en la segunda etapa


En principio, hay dos maneras de conseguir que la subseleccin se produzca
n
entre los Ni elementos de la i-sima UPE:
Ai
a) Usar muestreo sistemtico en fases con dicha probabilidad.
N
b) Seleccionar xi = n i sujetos mediante MSA u otro procedimiento equiAi
probabilstico.

con probabilidad f 2 =

La primera variante resulta en general ms expedita, pero cualquiera de estas maneras de practicar el submuestreo produce el mismo efecto: en lugar de
obtener exactamente n USE por cada UPE seleccionada, se obtendr un nmero
aleatorio xi cuya proximidad con n depender de cuan buena haya sido la aproximacin Ai que se emple como sucedneo de Ni. Si Ai>Ni, entonces xi ser
menor que n , y viceversa.
En sntesis, el mtodo es equiprobabilstico y produce una muestra de tamao aproximadamente igual a n. Consecuentemente, la media y la fraccin mustrales estiman adecuadamente a los parmetros correspondientes.
En el ejemplo de la Seccin 7.1 se haban seleccionado las manzanas 3, 4, 6
y 8. Para hacer la subseleccin hay que obtener los listados de los individuos que
realmente residen en esas 4 manzanas. Supongamos que para esta segunda etapa se ha optado por el primer procedimiento.
Tomemos, por ejemplo, la manzana 8 (cuarta elegida): supongamos que
cuando se procede a censar las viviendas, se obtiene un listado de 205 individuos
n
50
=
= 0, 238 0, 24 ,
(en lugar de los 210 supuestos). Primero se calcula
Ai 210
y de inmediato se aplica un muestreo sistemtico en fases (ntese que en este ca-

182

DISEO RAZONADO DE MUESTRAS

so no puede usarse el mtodo regular). En la Tabla 4.2, buscamos los intervalos


K1 y K2 que corresponden a f= 0,24 y obtenemos: K1 = 4 y K2 = 25. Admitamos que se obtiene como primer arranque aleatorio (entre 1 y 4) el nmero r1 = 4,
y como segundo arranque r2 = 10; es fcil corroborar que, en ese caso, se eligen
exactamente 49 sujetos de los 205 existentes.
En el caso de la manzana 3 del listado (primera que se seleccion), se tena
A1 =525; supongamos que, cuando se va al terreno, se detecta que N1 = 612, ya
que, por ejemplo, un edificio que no exista cuando se hizo el registro del que san
50
lieron los Ai fue posteriormente habitado2. Se calcula
=
= 0,095 0,10
Ai 525
En este caso no es preciso acudir a la Tabla 4.2; como f2 = 0,1, es obvio que el
problema se resuelve seleccionando 1 de cada 10 elementos del listado de 612.
Supongamos que se arranca en r = 7; de este modo sern elegidos x1 =61 individuos3.
De manera similar se conduce el proceso para las otras dos manzanas seleccionadas. Como se ve, el nmero de unidades de anlisis tomadas para la encuesta
dentro de una UPE no es en general igual a n = 50, sino un nmero aleatorio cuya
magnitud depende bsicamente de la diferencia que haya entre Ai y Ni. El ejemplo
de la primera manzana de la muestra es un caso extremo (Ai considerablemente menor que Ni) y por ello la diferencia entre x1 y n es notable. Sin embargo, aun cuando se produzca alguna pifia relativamente grande como sta, si las aproximaciones fluctan por encima y por debajo de los respectivos tamaos para unas y otras
m

UPE, y supuesto que m no es muy pequeo, entonces x = xi debe ser muy pri =1
ximo a n = m n .
NOTA: Ocasionalmente podra ocurrir que 2 o ms nmeros de los Zi obtenidos identifica-

ran al mismo conglomerado; esto slo pasara para una UPE cuyo valor de Ai fuera
muy grande (necesariamente mayor que I). En tal caso, en dicha UPE se aplica

sucesivamente la fraccin

2
3

n
tantas veces como nmeros la hayan identificado.
Ai

Este incidente revela que la fuente de informacin para obtener los Ai fue bastante defectuosa.
Seran 62 sujetos si el arranque fuese 1 2.

UN DISEO ESPECIAL: SELECCIN DE CONGLOMERADOS...

183

7.4. Notacin
Una vez seleccionadas las unidades de anlisis, se procede a la aplicacin de
la encuesta propiamente dicha. Como veremos, la estimacin de los errores se
consigue sin necesidad de conocer ms que los totales dentro de cada UPE. Llamaremos yi a dichos totales; o sea, yi es la suma de los valores de la variable en
estudio para los xi sujetos elegidos en la i-sima UPE seleccionada (o el nmero
de individuos que posee cierto rasgo bajo estudio entre los interrogados, si lo
que se quiere estimar es una fraccin poblacional).
Por ejemplo, consideremos que en el problema que venimos considerando
se quieren estimar los siguientes dos parmetros:
a) la fraccin de individuos que tienen anticuerpos a cierto virus.
b) el nmero medio de consultas mdicas por habitante que recibi la poblacin durante el ltimo ao.
En la cuarta manzana se encuestaron 49 sujetos (x4 = 49); supongamos que 14
tenan anticuerpos de modo que y4 = 14. Si entre esos mismos 49 encuestados
se acumularon 62 visitas al mdico, entonces, a los efectos de la estimacin del
segundo parmetro, se tiene y4 = 62.
La Tabla 7.1 recoge todos los datos relevantes del ejemplo hipottico,
supuesto que ya se tienen los resultados de la encuesta.
Tabla 7.1. Resultado en el ejemplo de la aplicacin del mtodo de muestreo
en dos etapas y seleccin de las UPE con probabilidad proporcional
a los tamaos aproximados

El procedimiento explicado como ya se ha dicho produce una muestra


equiprobabilstica. Tal muestra no tiene tamao fijo; ste es un valor aleatorio x

184

DISEO RAZONADO DE MUESTRAS

que no puede por tanto predecirse con exactitud. Sin embargo, usualmente se
tiene mucho mayor control del tamao muestral que con el muestreo monoetpico. En el ejemplo, el tamao final result ser 208 en lugar del 200 previsto.
La diferencia dista de ser muy apreciable, pero en cualquier caso es debida bsicamente a la mala aproximacin obtenida para la primera UPE elegida4.

7.5. Procedimientos de estimacin


Para estimar una media o una fraccin poblacionales se usan, respectivamente, la media o fraccin mustrales. Sin embargo, debe recordarse el cam

rcter aleatorio del tamao de muestra. ste es x = xi , de modo que dichos esi =1
timadores son razones de variables aleatorias.
Tanto la media como la proporcin se estiman entonces mediante la frmula
siguiente:
m

r=

y
i =1
m

[7.1]

x
i =1

En nuestro ejemplo tenamos, a partir de la Tabla 7.1, que el tamao muestral


es x = 61 + 48 + 50 + 49 = 208. La estimacin de la proporcin P de individuos
m

con anticuerpos en la poblacin es r (1) =

(1)

i =1
m

56
= 0, 269 . y la estimacin
208

i =1

del promedio de consultas por habitante a lo largo del ao resulta ser


m

(2)

y
i =1
m

(2)

x
i =1

277
= 1,33
208

Se puede demostrar que, si se tuviera Ai = Ni para todas las UPE (una situacin inusual y, por tanto, de muy escaso inters prctico), en cuyo caso xi = n , entonces:

En el ejemplo hemos supuesto que para los 208 individuos se pudo obtener respuesta para las dos preguntas. En la prctica ocurrir que el tamao de muestra real variar de una pregunta a otra como resultado de la no
respuesta.

UN DISEO ESPECIAL: SELECCIN DE CONGLOMERADOS...

var (r ) =

1
m 2

y mr 2
2 i
m(m 1)n i =1

185

[7.2]

es una estimacin insesgada de la varianza de r.


Advirtase que la frmula de var(r) es en este caso de una sencillez extrema, sobre todo si se tiene en cuenta la complejidad del mtodo.
Pero, lamentablemente, la vida es ms rica que las mejores previsiones, de
modo que en general se trabaja con aproximaciones, y en tal caso la estimacin
de la varianza del estimador [7.1] viene dada por la misma frmula utilizada
para el caso monoetpico; con la notacin que tenemos ahora, sta es:
var (r ) =

m
m
1 f m m 2

2
2
+

y
r
x
2
r
xi yi

i
i

2
x m 1 i =1
i =1
i =1

[7.3]

cuya validez se supedita a que se cumpla la condicin:


m

(1 f )msx2 < (0, 2) xi

[7.4]

i =1

donde sx2 =

1 m 2 x2
xi . En las aplicaciones prcticas, usualmente se
m 1 i =1
m

tiene que f =

n
0, de modo que se puede suprimir el factor (1 f) de la frA

mula [7.3].
200
= 0,091 m = 4 sx2 = 33,664, de modo
2.200
que, en efecto, se cumple [7.4], ya que:
En nuestro ejemplo se tiene f =

(1 f )msx2 = 11,546 y (0,2)x = 10,600


Al aplicar [7.3] para calcular la varianza estimada de ambas estimaciones, se
tiene lo siguiente:
var (r (1) ) = 0,00054
var (r (2) ) = 0,11956
Sumando y restando el error absoluto (1,96) var (r ) en cada caso, los intervalos de confianza al 95% de confiabilidad para P y X son, respectivamente,
[0,224-0,315] y [0,654-2,009].
Como se ve, los errores son considerables (0,046 para la fraccin y 0,678 para
el nmero medio de consultas); en trminos relativos ascienden a 17.1% y 60%
respectivamente. Ello se debe a que en este pequeo ejemplo didctico, el nmero de UPE seleccionadas (m = 4) es muy reducido, algo inusual en la prctica.

186

DISEO RAZONADO DE MUESTRAS

Resumiendo: en esta seccin se ha introducido y discutido un procedimiento


puntual que posee los siguientes rasgos:
a)
b)
c)
d)

es equiprobabilstico;
el tamao muestral est bajo control;
otorga probabilidades de seleccin proporcionales al tamao de las UPE;
el tamao de muestra dentro de cada UPE es bsicamente el mismo.

Los cuatro rasgos mencionados son atractivos por diferentes razones. El carcter equiprobabilstico es favorable porque en ese caso todas las frmulas son
ms simples, porque es psicolgicamente ms admisible por parte del personal
lego en la materia y porque la incorporacin de ponderaciones siempre resta algo
de eficiencia a las estimaciones (Kish, 1965). La ventaja de poder hacer una
prediccin razonable del tamao muestral es evidente. Por otra parte, el hecho de
que las UPE mayores tengan ms oportunidad de ser elegidas que las ms pequeas contribuye, como se explic antes, a la representatividad. Finalmente,
desde el punto de vista logstico, en lo que concierne a trabajo de terreno, tener
tamaos de muestra similares dentro de cada una de las UPE, independientemente de la magnitud que tengan, suele ser altamente conveniente, porque ayuda sensiblemente a la organizacin del trabajo de terreno.

7.6. Manejo prctico de las aproximaciones de tamao


Todo el procedimiento explicado en este captulo reposa en que se cumpla la
siguiente condicin:
A
Ai
m
Ai

Esto se debe a que las razones


son probabilidades de seleccin, y
y
A
I
como tales tienen que ser nmeros no mayores que 1.
La condicin Ai < I solo habr de incumplirse para alguna UPE cuyo tamao
sea extraordinariamente grande respecto del resto. Ntese que el incumplimiento de dicha condicin no es muy probable, ya que m es usualmente
mucho menor que M, de modo que A (que no es otra cosa que el valor promeM
A
dio de los Ai) habr de ser sustancialmente menor que I = . Consecuentem
mente, slo un conglomerado que sea muchsimo mayor que los restantes (y por
ende mucho mayor que la media de todos ellos) podra producir tal incumplimiento. No obstante, qu hacer cuando los tamaos de los Ai sean tales que esa
condicin no se cumpla?

UN DISEO ESPECIAL: SELECCIN DE CONGLOMERADOS...

187

Hay que recordar que el carcter equiprobabilstico de la muestra es totalmente independiente de la calidad que tengan las aproximaciones. De modo
que los Ai que se usen para llevar adelante el procedimiento pueden ser aumentados o disminuidos (si ello resulta conveniente) sin comprometer aquel carcter.
Si las modificaciones de las aproximaciones con que se habr de trabajar no son
muy notables, entonces tampoco el tamao final de muestra se ver afectado de
manera apreciable, y aun en caso de que lo sean, puede ocurrir que dicho tamao no diste mucho del esperado gracias a las compensaciones que podran producirse si hubiera tanto sobrestimaciones como subestimaciones.
A continuacin se exponen algunas maniobras que se pueden realizar si fuese menester:
1. Si para algunas UPE se tiene n > Ai
a) Una primera variante es actuar segn se explica en la NOTA con que
concluye la Seccin 7.3.
b) Otra variante consiste, sencillamente, en atribuir a dicha UPE un tamao aproximado Ai = n (lo cual equivale a que en la segunda etapa se
tomarn todos los integrantes de tal UPE). Esto puede recomendarse
si la diferencia entre el tamao aproximado y n no es muy acusada (digamos, si n no lo supera en ms del 20%).
c) Una tercera posibilidad consiste en unir las UPE conflictivas a otras
contiguas, de modo que el problema desaparezca. En tal caso, la UPE
resultante de la unin antedicha tendr tamao aproximado igual a la
suma de los correspondientes a las UPE que la componen, y ser
considerada como un solo conglomerado (de ah la importancia de que
sus componentes sean contiguos o, ms generalmente, de que luego
no constituya un problema prctico a los efectos del submuestreo en caso de ser seleccionadas).

A
m
a) La primera variante consiste en dividir este conglomerado en dos o
ms UPE. Tal manipulacin se hara de manera que la suma de los tamaos aproximados de estas ltimas coincida con el de la UPE que es
objeto de la divisin. Es importante que en tal caso las nuevas UPE
estn bien delimitadas, de manera que si alguna de ellas resultase seleccionada, no haya ambigedad en la fase de submuestreo.
A
b) Si
es slo un poco mayor que el tamao aproximado de la UPE5,
m
entonces este ltimo valor puede disminuirse. Ntese que no basta con

2. Si alguna UPE tiene tamao aproximado mayor que

5
Si hubiera alguna UPE cuyo tamao aproximado fuera mucho mayor que I, entonces el tratamiento del
asunto es radicalmente diferente y se aborda en el Captulo 8.

188

DISEO RAZONADO DE MUESTRAS

atribuirle el valor A , ya que tal disminucin producir un nuevo


m
tamao aproximado de toda la poblacin y, por tanto, al dividir ese
nuevo valor de A por m, el problema se reproduce. Por ejemplo, si los tamaos aproximados en un estrato son iguales a 40, 60, 20 y 180
A
(A = 300), y m = 2, se tiene
= 150. Si se decidiera atribuir sin ms
m
el tamao 150 a la cuarta UPE en lugar de 180, se tendra que
A 270
=
= 35, de modo que no se eliminara
40+60+20+150=270 y
m
2
el problema, ya que 135< 150. Quiere esto decir que, cuando el
procedimiento sea utilizado, el Aiconflictivo tendra que reducirse
bastante por debajo del valor de I y debe replantearse siempre todo el
cmputo con el fin de corroborar que la condicin que se procura asegurar sea vlida para la nueva configuracin.
Finalmente, cabe sealar que puede ser conveniente conseguir, en el contexto de estas manipulaciones, que todos los Ai sean mltiplos de n . En tal caso, en
la fase de subseleccin se tendr que cada fraccin de muestreo sea igual al inverso de un entero y se podr entonces aplicar el mtodo regular de seleccin sistemtica en lugar del ms engorroso de seleccin en fases. Consecuentemente,
de ser posible, se redondean los tamaos de las UPE llevndolos a ser mltiples de n y obtener as intervalos enteros.

Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.

8
Muestreo estratificado
polietpico
Hasta ahora se han desarrollado diversos procedimientos de seleccin de
muestras con diferentes niveles de complejidad. Puede decirse, sin embargo, que
se han manejado tres situaciones alternativas bsicas: muestreo directo de unidades de anlisis (muestreo simple aleatorio o sistemtico, tratados en los Captulos 3 y 4), muestreo estratificado (Captulo 5) y muestreo por conglomerados
(Captulos 6 y 7).
El presente Captulo presenta un diseo en el que se integran todas las tcnicas precedentes: se combina el muestreo estratificado para la eleccin de unidades en la primera etapa con el muestreo en etapas dentro de las UPE seleccionadas; aunque no se trata de una definicin formal, a los diseos de ese tipo se les
suele denominar genricamente diseos complejos.
La introduccin de estratos al nivel de las UPE es conveniente, ya que puede
mitigar el notable efecto negativo para la representatividad que, muy a pesar
del muestrista, suele producir el muestreo por conglomerados. La idea es enteramente natural y consiste en introducir la tcnica de muestreo estratificado en la
primera etapa; o sea: organizar las UPE en estratos y luego seleccionar algunos
conglomerados de todos y cada uno de los estratos considerados. Las unidades
de anlisis se seleccionan posteriormente (en una o ms etapas) dentro de cada
UPE elegida en los estratos. A esta estrategia se la denomina muestreo estratificado polietpico (MEP).

8.1. Estratificacin de unidades de primera etapa


La literatura recoge mltiples ejemplos de vocacin didctica sobre la aplicacin de este procedimiento. El excelente texto de Moser y Kalton (1971) expone
detalladamente un ejemplo de una encuesta de opinin realizada en Gran Breta-

190

DISEO RAZONADO DE MUESTRAS

a; otra ilustracin detallada puede hallarse en Lininger y Warwick (1978), uno


de los textos ms abarcadores sobre la conduccin de encuestas.
En el terreno investigativo, la aplicacin de este diseo es harto frecuente.
Fue empleado intensamente, por ejemplo, en ocasin de los estudios desarrollados bajo la gida de la Encuesta Mundial de Fecundidad en las dcadas de los
setenta y ochenta. En un estudio comparativo de las caractersticas bsicas de los
diseos mustrales usados en 17 pases europeos para realizar la encuesta nacional de fecundidad, Berent, Jones y Siddiqui (1982) consignan la aparicin de
estratificacin de UPE en 15 de ellos, 14 de los cuales usaron ms de una etapa
(entre 2 y 5). Otra peculiaridad de la inmensa mayora de los diseos 14 de los
17 fue su carcter equiprobabilstico.
Para la creacin de los estratos se debe seguir como en el MAE el criterio
de conformar, en lo posible, grupos homogneos de poblacin. En ocasiones se
utilizan criterios geogrficos (provincias o municipios), zonas ecolgicas o socioculturalmente diferentes entre s, o con distintas densidades de poblacin. Estos criterios han merecido atencin; en OMuircheartaigh (1977) se puede hallar,
por ejemplo, una discusin sobre las ventajas de este ltimo criterio. Un eje de
clasificacin muy usado en encuestas de poblacin (ocasionalmente cruzado con
otro) es el definido por la localizacin, en urbano-rural, de las viviendas de los
individuos.

8.2. Estructura y notacin


La presente seccin expone el uso del muestreo estratificado polietpico y algunos de los problemas asociados a su aplicacin.
Supongamos que estamos ante una poblacin finita de tamao N, dividida
en M UPE, as como que este conjunto de conglomerados se ha organizado en L
L

estratos y que en el estrato h (h:1, ..., L) hay Mh UPE, de modo que

M
h =1

= M.

El plan consiste en seleccionar una muestra de unidades de anlisis segn la


siguiente estrategia: elegir primero, en cada estrato, cierto nmero mh de UPE
L

(de modo que en total se eligen m = mh UPE), y realizar luego una subselech =1

cin de unidades de anlisis dentro de cada UPE obtenida en la primera etapa.


En la Figura 8.1 se representa la estructura de este diseo. En ese ejemplo se
ha reflejado el caso en que hay L = 3 estratos y M = 18 UPE, de las cuales m = 6
resultan elegidas y son objeto de subseleccin.
Para llevar adelante este plan general se puede adoptar alguna de un sinnmero de tcticas diferentes. Lo ideal es que el muestrista domine la teora general de manera que, atendiendo a cada problema especfico, pueda optar por aquella variante que mejor armonice con la situacin en que se produce el problema

MUESTREO ESTRATIFICADO POLIETPICO

191

Figura 8.1. Representacin de una muestra estratificada polietpica.


(definida en lo esencial por los objetivos de la encuesta, el marco muestral disponible, la informacin que se posea sobre la poblacin, los recursos disponibles
y el tiempo con que se cuenta).
Sin embargo, para ser coherentes con la tnica del presente texto, entre cuyos
propsitos se halla el de facilitar el proceso de aplicacin de las tcnicas muestrales a estudiantes e investigadores no especialistas en la materia, he optado por
poner en primer plano un procedimiento particular de muestreo estratificado
polietpico que por sus caractersticas puede ser aplicado en una amplia gama de situaciones de la investigacin de salud y del mbito epidemiolgico.
Sirve a la vez como ilustracin de este tipo de diseo, aunque se trata de un
procedimiento equiprobabilstico. En la Seccin 8.6.4 se bosquejan casos ms
generales.
Denotemos por Ah al tamao aproximado del estrato h y por A al de toda la poblacin (por tamao aproximado, entindase nmero aproximado de unidades
de anlisis). Supongamos que se ha considerado que el tamao muestral requerido es igual a n y que se exigir que todos los sujetos tengan probabilidad de sen
leccin igual a f = . Se supone, adems, que en cada UPE se tomarn alredeA
dor de n unidades de anlisis y que se planifica seleccionar m de las M UPE que
integran la poblacin. Esto quiere decir que, tal y como se hizo en el captulo
precedente, se deben definir n, n y m de manera que n = n m1. Cabe enfatizar,
sin embargo, que, a todos los efectos prcticos, basta con que el tamao general
de muestra, el nmero de UPE seleccionadas, y el nmero de unidades que a la
postre resulten elegidas en cada UPE seleccionada sean slo aproximadamente
iguales a n, m y n respectivamente.
1

Estos tres nmeros deben responder, en rigor, a un anlisis de costo-eficiencia acerca del cual se hacen algunas consideraciones ms adelante (Seccin 8.7).

192

DISEO RAZONADO DE MUESTRAS

Antes de proceder a la seleccin debe corroborarse que, para toda UPE, se


cumple la siguiente relacin: el tamao aproximado que se le atribuya ha de haA
llarse entre n y
. Es importante advertir que el anlisis del cumplimiento de
m
esta restriccin para el tamao aproximado de las UPE y las eventuales medidas que deben adoptarse en caso de que no se cumpla, pueden y deben realizarse antes de dar por concluida la formacin de los estratos. En la prctica, la
condicin exigida suele cumplirse, sobre todo si, como es usual, las UPE son
relativamente grandes y adems M es bastante mayor que m. Las acciones que
deben desplegarse cuando esto no se cumple son las mismas detalladas en la
Seccin 7.6. Un caso no tratado all, que merece especial atencin y que s se
presenta con alguna frecuencia, es el que se produce cuando existe al menos
una UPE cuyo tamao es mucho mayor que el de cualquier otra. El manejo de tal
situacin se explica en la Seccin 8.6.1. Una discusin ms detallada sobre tamaos inadecuados puede hallarse en Kish (1965) y Kish (1978).

8.3. Mtodo de seleccin


Una vez configurados los estratos, debe procederse a la seleccin de las UPE.
Este proceso es esencialmente el mismo que el explicado en la Seccin 7.3; consiste en otorgar a las UPE probabilidades de seleccin proporcionales a sus tamaos aproximados.
El mtodo, concretamente, discurre segn los siguientes tres pasos:

A
.
m
2. Formar una tabla dentro de cada estrato en la que se ordenen las UPE
y calcular los tamaos aproximados acumulados.
3. Aplicar en todos los estratos el mtodo de seleccin de UPE expuesto
en la Seccin 7.3, usando en todos ellos el intervalo I.
1. Calcular I =

Por ejemplo, supongamos que se quiere hacer un control de calidad en las


historias clnicas de individuos que ingresan debido a una intoxicacin en los hospitales de cierta regin. En la regin hay L = 5 provincias (estratos) que abarcan
M = 65 hospitales (UPE). En calidad de aproximacin se decidi considerar el nmero de ese tipo de altas en el ao anterior y seleccionar m = 20 UPE en total.
Como tamao aproximado total se asumi el valor A = 2.400 (es decir, que se
estima que se produjeron alrededor de 2.400 ingresos por concepto de intoxica-

MUESTREO ESTRATIFICADO POLIETPICO

193

2.400
= 120.
20
Para seleccionar los hospitales que quedarn en la muestra dentro de cada estrato se procede a ordenarlos y a calcular de inmediato sus tamaos acumulados2.
Para el h-simo estrato se escoge ahora, aleatoriamente, un nmero Rh, entre 1 e
I = 120, y se construyen los nmeros Rh, Rh +I, Rh + 2I,..., hasta llegar al mayor
nmero que no sobrepase el tamao atribuido al estrato (Ah). De la manera usual
(a travs de los tamaos acumulados, como se explic en la seccin 7.3) se identifican las UPE elegidas; al nmero de UPE que resultan seleccionadas le
llamaremos, como se haba dicho, mh.
Ahora supongamos que en un estrato, por ejemplo el tercero, se tiene M3 = 5
y A3 =270; para elegir las m3 UPE que le corresponden hay que seleccionar
aleatoriamente un nmero R3 entre 1 y 120. En la Tabla 8.1 se resume la informacin relevante sobre dicho estrato y sobre las alternativas de seleccin de
UPE en el mismo.
cin); por tanto, el intervalo de seleccin que ha de aplicarse es I =

Tabla 8.1. Listado de hospitales en un estrato hipottico con sus tamaos


aproximados y los arranques aleatorios que determinaran su eleccin
Hospital (UPE)

A (4,2)

B (6,3)

C (6,4)

D (8,2)

E (9,8)

Tamao aproximado

20

40

60

70

80

Tamao aproximado

20

60

120

190

270

1-20

21-60

61-120

1-70

1-30

acumulado
Arranques aleatorios que
determinan la eleccin

71-120

de cada UPE
NOTA: El nmero entre parntesis es el nmero medio de das de estancia en cada hospital.

Ntese que en el diseo que se est sugiriendo, el nmero m3 de UPE seleccionadas es aleatorio; por ejemplo, si el R3 que resulte elegido es un nmero
que se halla entre 1 y 20, entonces se seleccionan 3 UPE: A, D y E; pero si fuese, digamos, R3 = 65, entonces resultarn elegidos slo dos hospitales: C y E.
Resumiendo, en este ejemplo se tiene que m3 = 2 si R3 est entre 31 y 120, pero
m3 = 3 si R3 resulta estar entre 1 y 30.
2
Puede ser conveniente buscar un ndice que refleje de algn modo la eficiencia de la gestin hospitalaria
(sobre el supuesto de que podra estar asociada a la calidad de las historias) como pauta para establecer ese orden.
Por ejemplo, se podra elegir el tiempo medio de estancia hospitalaria durante el ao anterior y ordenar los hospitales de menor a mayor segn el valor de dicho tiempo medio. Actuando de ese modo, se asegurar que la
muestra de UPE recorra todo el espectro de valores inherentes al ndice escogido.

194

DISEO RAZONADO DE MUESTRAS

Para completar la muestra de manera que toda unidad de anlisis tenga pron
babilidad de inclusin igual a f = , basta subseleccionar las unidades dentro
A
de cada UPE elegida con fraccin de muestreo igual a la razn entre n y el tamao aproximado que se haya atribuido desde el comienzo a dicha UPE.
Ahora bien, el proceso de subseleccionar con dicha probabilidad entre los sujetos que integran la UPE en cuestin puede llevarse adelante de diversas maneras. Si las UPE no son muy grandes, puede actuarse como en el caso explicado en la Seccin 7.3 (cuando no se estratificaba); o sea: subseleccionar
directamente sobre el listado de los elementos existentes en el listado a travs
de muestreo sistemtico en fases, o mediante un MSA con un tamao de muestra establecido de suerte que se cumpla forzosamente la demanda probabilstica
inicial.
Sin embargo, la obtencin de listados dentro de las UPE seleccionadas puede ser en extremo dificultosa o simplemente prohibitiva. Por ejemplo, si se tratase de una encuesta nacional de fecundidad en la que se hubiesen seleccionado, digamos, m = 52 municipios de las provincias (estratos) del pas, entonces
habra que encarar la onerosa (acaso irrealizable) tarea de obtener los listados
de mujeres de 15 a 49 aos en cada uno de los 52 municipios.
Pero, afortunadamente, para la aplicacin de las frmulas de estimacin de
parmetros y de sus errores (que se expondrn ms adelante) cualquier procedimiento que produzca la probabilidad requerida en la UPE es lcito. Siendo
as, pueden valorarse variantes tales como:
- Formar bloques de unidades de anlisis dentro de cada UPE seleccionada, elegir por muestreo sistemtico una parte de ellos con la probabilidad
prefijada y luego encuestar a todos los integrantes de dichos bloques. En
Silva (1981) se desarrolla un ejemplo en que las UPE son reas de salud y
los bloques son viviendas completas: en ese caso, en lugar de un listado
de las mujeres del rea, basta contar con uno de las viviendas que dicha
rea abarca.
- Aplicar un muestreo bietpico dentro de cada UPE seleccionada mediante
la formacin de bloques, los cuales se someten a una seleccin con probabilidad proporcional a los tamaos aproximados, y luego se submuestrean.
Esto es: aplicar una muestra bietpica con probabilidades proporcionales
a los tamaos aproximados (tal y como se estudi en el captulo precedente) dentro de cada una de las UPE elegidas3.

Notar que este mtodo lleva el procedimiento a tres etapas de seleccin.

MUESTREO ESTRATIFICADO POLIETPICO

195

8.4. Procedimientos de estimacin


Cualquiera que sea el mtodo de subseleccin dentro de la i-sima UPE del
estrato h, se obtendr un cierto nmero de unidades de anlisis que provienen
de dicha UPE; a ese nmero se le denotar por xhi. Tambin usaremos las notaciones:
mh

xh = xhi

x = xh

i =1

h =1

Para cualquier variable que se est investigando, se llamar genricamente yhi


al total acumulado para dicha variable por los xhi elementos de la UPE i-sima
del h-sima estrato. O sea, si se trata de una caracterstica dicotmica (que cada
elemento tiene o no), entonces yhi es el nmero de sujetos en la muestra obtenida dentro de esa UPE (de tamao xhi) que poseen el atributo; si la variable es
cuantitativa, yhi representa la suma de los valores de dicha variable para los xhi
sujetos examinados en esa UPE. Tambin se definen, finalmente:
mh

yh = yhi

y = yh

i =1

h =1

Con esta informacin, se estima la media poblacional de la variable (fraccin o proporcin en el caso de que la variable sea cualitativa) mediante el ya familiar estimador de razn:
r=

y
x

La varianza de r se estima mediante la frmula siguiente:


L
L
1 f L

var (r ) = 2 U h + r 2 Vh 2r Wh
x h =1
h =1
h =1

donde
1 mh 2
2
Uh =
mh yhi yh
mh 1 i =1

Vh =

1 mh 2
2
mh xhi xh
mh 1 i =1

Wh =

1 mh
mh xhi yhi xh yh
mh 1 i =1

[8.1]

[8.2]

La frmula [8.2] es una aproximacin cuya validez se subordina a que se


cumpla la siguiente condicin:

196

DISEO RAZONADO DE MUESTRAS


L

(1 f )Vh < (0, 2) x

[8.3]

h =1

Si se desea estimar el total Y de la variable en la poblacin, puede usarse el


estimador insesgado:
y
Y =

[8.4]
f
cuya varianza puede estimarse mediante:
1
var (Y ) = 2
f

U
h =1

[8.5]

8.5. Un ejemplo detallado del Muestreo Estratificado Polietpico


A continuacin, se ilustran los procedimientos explicados en las Secciones 8.2
y 8.3 mediante la exposicin detallada de un minsculo estudio transversal de la
poblacin adulta de una pequea comunidad con el fin de examinar su situacin
estomatolgica. Imaginemos que, entre otros, se quiere estimar tres parmetros:
1. Tasa de prevalencia de adultos necesitados de atencin estomatolgica, P.
2. Nmero total de tales sujetos, Y.
3. Nmero medio de caries por persona, R.
Supondremos que el rea cuenta con 5 sectores y abarca en total 38 manzanas. Se quiere que la muestra involucre a los 5 sectores con el fin de asegurar
alguna representatividad adicional, y se dispone de los datos sobre el nmero
aproximado de adultos en cada una de las manzanas, tal y como se registra en la
Tabla 8.1.
Se decide entonces seleccionar una muestra equiprobabilstica estratificada
bietpica tomando los sectores como estratos (L = 5) y las manzanas como UPE.
La Tabla 8.1 permite ver que M1 = 7, M2 = 9, etc. Se ha decidido tomar alrededor
de m = 15 manzanas para elegir finalmente unos n = 630 adultos. De modo que
se fija = 42, resultado de dividir n entre m.
630
n
Es fcil constatar que A = 13.740, de modo que f = =
= 0,046;
A 13.740
A 13.740
puesto que m = 15, el intervalo resulta ser I = =
= 916. Tambin puem
15
de constatarse que los tamaos aproximados de las 38 UPE cumplen con la restriccin de estar entre = 42 e I = 916.

MUESTREO ESTRATIFICADO POLIETPICO

197

Tabla 8.1. Tamaos aproximados de las manzanas existentes en


la poblacin segn sectores

NOTA: El smbolo -----denota que las manzanas as marcadas no existen en los sectores respectivos.

Hay que elegir un nmero aleatorio entre 1 y 916 para cada uno de los 5 estratos. Supongamos que stos fueron respectivamente los siguientes:
R1 = 23

R 2 = 345

R 3 = 105

R 4 = 701

R 5 = 456

Al aplicar la regla de seleccin basada en los tamaos aproximados dentro de


cada sector, resultan elegidas las manzanas cuyas celdas aparecen ocupadas con
nmeros en la Tabla 8.2 y, por tanto, quedan fuera de la muestra las restantes (marcadas con tres asteriscos en la tabla)4. En esa tabla aparecen los verdaderos tamaTabla 8.2. Tamaos reales de las manzanas seleccionadas
en la primera etapa

El lector puede corroborarlo formando los acumulados; es decir, sumando sucesivamente 916 al arranque
correspondiente a cada estrato y aplicando la regla de seleccin explicada en la Seccin 7.3.

198

DISEO RAZONADO DE MUESTRAS

os para dichas manzanas (es decir, el nmero real de unidades de anlisis que integraban los listados conformados a posterior i para los conglomerados elegidos):
En la Tabla 8.2 se observa que:
m1 = 3 m 2 = 4 m 3 = 3 m 4 = 2 m 5 = 4

y, por tanto, que el nmero final de UPE elegidas ascendi a m = 16.


Para hacer la seleccin dentro de cada UPE, primero se comput la fraccin
de muestreo que en cada caso corresponda aplicar: se dividi n entre el tamao
aproximado del conglomerado en cuestin. Por ejemplo, para la tercera UPE
42
elegida en el segundo estrato, se calcul:
= 0,09. A partir de la Tabla 4.2
450
se determin el procedimiento sistemtico que proceda aplicar (MSF). En la
UPE mencionada, por ejemplo, se tom (del verdadero listado de 440 adultos)
por muestreo sistemtico uno de cada 10 sujetos y, finalmente, se elimin uno de
cada 10 de los 44 as elegidos. La muestra en este conglomerado result ser de
40 sujetos.
En la Tabla 8.3 aparecen los tamaos de muestra resultantes despus de esta
operacin en cada una de las 16 UPE seleccionadas.
Se ve ahora que x11 = 42, x12 = 43, x13 = 42, x21 = 45, etc. y se puede corroborar que los tamaos mustrales por estratos fueron:

x1 = 127

x2 = 172

x3 = 118

x4 = 87

x5 = 169

as como que el tamao de muestra final fue x = 673. Con esta informacin ya se
puede corroborar fcilmente que se cumple ampliamente la condicin [8.3].
Los resultados de la encuesta en cuanto a las dos variables relevantes (tener
problemas de salud bucal que exigen atencin y nmero de caries) se resumen en
Tabla 8.3. Tamaos mustrales resultante en las 16 manzanas
seleccionadas

MUESTREO ESTRATIFICADO POLIETPICO

199

Tabla 8.4. Nmero de sujetos con necesidad de atencin estomatolgica


en cada manzana de la muestra y nmero de caries acumuladas por ellos

la Tabla 8.4. All se recogen los valores de cada UPE de la muestra, necesarios
para hacer las estimaciones: nmero de sujetos con necesidad de atencin (yhi) y
!
nmero de caries acumulados por los sujetos encuestados ( yhi ). Este ltimo aparece entre parntesis.
Los resultados de este ltimo cuadro reflejan que, por ejemplo, y52 = 39; es decir, 39 de los 43 elementos examinados en la segunda UPE del quinto estrato ne!
cesitaban atencin, y entre dichos 43 sujetos haban acumulado y52 = 33 caries5.
Se puede apreciar, finalmente, que los totales de adultos enfermos por estratos fueron:
y1 = 22 y2 = 44 y2 = 3 y4 = 6 y5 = 141

de modo que y = 216. Para el nmero total de caries, los resultados respectivos
fueron:
!
!
!
!
!
y1 = 51 y2 = 42 y2 = 6 y4 = 5 y5 = 154
!
con lo cual, y = 258. Con estos datos, se pueden estimar ahora los tres parmetros:
1. Tasa de prevalencia de adultos necesitados de atencin estomatolgica (P)
y 216
p= =
= 0,321
x 673
L
L
1 f L

2
+

U
p
V
2
p
Wh = 0,00052
h

h
x 2 h =1
h =1
h =1

!
Como se ve, hemos usado el smbolo y para representar el nmero de caries acumuladas con el fin de dis-

var ( p ) =

tinguirlo de y, el nmero de sujetos que necesitan atencin.

200

DISEO RAZONADO DE MUESTRAS

e = (1,96) var ( p ) = 0,045


con lo cual se calcula el intervalo de confianza, que en trminos de porcentajes
es: [27,6-36,6].
2. Nmero total de sujetos necesitados de atencin (Y):
y
216
Y = =
= 4.696
f 0,046

var ( y ) =

1
f2

U
h =1

= 24.891 e = (1,96) var (Y ) = 309

lo que da lugar al intervalo: [4.387-5.005].


3. Nmero medio de caries por persona (R):
!
y 258
r= =
= 0,383
x 673

var (r ) =

L
L
1 f L

2
+

U
r
V
2
r
Wh = 0,00190

h
2 h
x h =1
h =1
h =1

e = (1,96) var (r ) = 0,085


Con esos datos se puede construir, finalmente, el intervalo de confianza: [0,2980,468].

8.6. Otros aspectos del muestreo estratificado polietpico


Siendo el diseo ms complejo, es por consecuencia el ms verstil. A continuacin se explican algunos aspectos particulares de inters bsicamente prctico.

8.6.1. Unidades autorrepresentadas


Procede ahora considerar una situacin especial: la que se produce cuando
una UPE es extraordinariamente grande respecto de las restantes. En tal caso,
el tratamiento es diferente: esa unidad se convierte por s misma en un nuevo estrato independiente, tambin llamado unidad autorrepresentada. Con cada UPE
autorrepresentada se procede en lo sucesivo como con los restantes estratos. Pa-

MUESTREO ESTRATIFICADO POLIETAPICO

201

Figura 8.2. Diagrama de la poblacin de UPE con una unidad extragrande.

ra ello esta UPE devenida en estrato debe dividirse en subconjuntos que harn
las veces de conglomerados, parte de los cuales se seleccionan en una primera
etapa para ser luego submuestreados. Esto quiere decir que deben crearse especialmente conglomerados que posteriormente desempearn exactamente el
mismo papel que las UPE en los estratos comunes.
Consideremos el siguiente ejemplo. En una ciudad existen 24 hospitales y se
quiere hacer un estudio de satisfaccin laboral entre el personal que labora en la
atencin secundaria. La ciudad puede dividirse en 3 zonas: este, centro y oeste,
pero una de las 5 UPE en la zona este es un hospital de grandes proporciones
(al que denominamos Hospital Central), tal y como refleja el diagrama de la
Figura 8.2. Dicho hospital, cuyo nmero de trabajadores es tal vez 5 6 veces
mayor que el nmero promedio de los restantes, se convertir en un estrato. Supongamos que se divide dicho centro en 6 reas (rea administrativa, rea de
urgencia, rea quirrgica, etc.). As la poblacin pasara a tener 4 estratos y 29
UPE distribuidas en dichos estratos, como muestra la Figura 8.3.

8.6.2. Dos UPE por estrato


El planteamiento general presentado en la Seccin 8.4 es susceptible de simplificaciones cuya incorporacin al diseo no deben soslayarse si se dan las condiciones propicias.
El primer y ms notable caso particular, valorado por Kish (1965) como la
clave ms importante en el diseo contemporneo de encuestas por mues-

202

DISEO RAZONADO DE MUESTRAS

Figura 8.3. Diagrama de la poblacin de UPE reconfigurada tras la creacin de un


nuevo estrato.

treo6, consiste en seleccionar exactamente mh = 2 UPE en cada estrato. Este mtodo se identifica con el nombre de seleccin pareada de unidades primarias.
Para su desarrollo es necesario hacer algunos ajustes previos. Si se ha planim
ficado seleccionar m UPE, hay que crear L =
estratos. Esto debe hacerse de
2
manera tal que los Ah sean iguales para todos los estratos; o sea, hay que forzar las
A 2A
cosas de manera tal que Ah = =
, lo cual se logra mediante la manipulaL m
cin oportuna de los tamaos aproximados de las unidades de primera etapa y
con una definicin adecuada de los estratos.
Ocasionalmente, adems de disminuir o aumentar los tamaos aproximados,
hay que dividir o unir diferentes UPE. Un ejemplo detallado de ese proceso puede encontrarse en Silva y Barreras (1983), donde se exponen algunos resultados
de una encuesta nacional basada en este tipo de diseo.
Una vez establecida la configuracin en estratos con las restricciones arriba
mencionadas, se sigue exactamente el procedimiento explicado en la seccin anterior. Las frmulas de estimacin adoptan en este caso expresiones muy simplificadas: Uh, Vh y Wh pasan a ser:

Esta afirmacin, que data de hace 35 aos, resulta en la actualidad exagerada, pues el advenimiento de las
PC ha abierto posibilidades computacionales entonces inalcanzables.

MUESTREO ESTRATIFICADO POLIETPICO

203

U h = ( yh1 yh 2 ) 2
Vh = ( xh1 xh 2 ) 2
Wh = ( xh1 xh 2 ) 2 ( yh1 yh 2 ) 2

8.6.3. Tratamiento de cross-clases


Un aspecto hasta ahora escasamente tratado en el presente texto, y que merece especial atencin, concierne a las estimaciones que se restringen a una parte
de la poblacin. Con extrema frecuencia se presenta la situacin siguiente: se
proyecta una encuesta para estimar un conjunto de datos poblacionales, pero se
tiene tanto o ms inters en conocer estos mismos datos para ciertos subconjuntos o clases de dicha poblacin. Por ejemplo, una encuesta nacional puede tener
entre sus objetivos bsicos la estimacin de los niveles de fecundidad en todo el
pas, pero tpicamente tambin interesar realizar dicha estimacin segn grupos
de edad, segn sectores econmicos, segn tipos de ocupacin o nmero de hijos de la mujer (la mal llamada paridad), para cada estado civil, etc.
Casi sin excepcin estas clases (por ejemplo: mujeres entre 25 y 30 aos, mujeres casadas o amas de casa), aparecen representadas en todas las UPE y todos
los estratos; de ah que se les llame cross-clases (clases que atraviesan los conglomerados y los estratos, en lugar de concentrarse en slo algunos de ellos).
Cabe preguntarse cmo proceder en caso de que se quiera estimar por ejemplo una media o una proporcin dentro de una cross-clase. La respuesta es sencilla: como consecuencia del carcter equiprobabilstico de la muestra, aquellos
elementos de la muestra que pertenecen a cierta cross-clase constituyen una
muestra equiprobabilstica de la subpoblacin definida por las mismas restricciones que definen dicha cross-clase. Por ejemplo, las mujeres casadas de la
muestra constituyen una muestra equiprobabilstica de la subpoblacin integrada slo por mujeres casadas. Y tanto la estructura como las propiedades del diseo son heredadas por estos subconjuntos. Esto quiere decir que todas las
frmulas desde [8.1] hasta [8.5]7 pueden ser utilizadas en este caso, con una nica precaucin: xhi representa ahora al nmero de elementos encuestados en la
i-sima UPE del h-simo estrato que pertenezcan a la cross-clase y yhi es el total
acumulado de la variable por esos xhi sujetos. Al igual que en los diseos anteriores, puede medirse el efecto de diseo (deff) para la estimacin dentro de la
cross-clase.

Este resultado es vlido, naturalmente, tambin para el caso particular en que no se emplea estratificacin,
desarrollado en el Captulo 7.

204

DISEO RAZONADO DE MUESTRAS

8.6.4. Caso no equiprobabilstico


El diseo explicado en las Secciones 8.2 y 8.3 tena una forma muy particular. Sin embargo, bien puede ocurrir que, por decisin expresa del muestrista o
por razones ajenas al investigador, se haya adoptado un MEP en que los tamaos
mustrales y los procedimientos de seleccin no hayan seguido ningn patrn
especfico (en particular, que no sea equiprobabilstico). Imaginemos que estamos ante la situacin ya discutida en la Seccin 8.4. Como se recordar, el rea
constaba de 5 sectores (estratos) y abarcaba en total 38 manzanas.
Ahora supongamos que se eligieron las manzanas dentro de cada sector mediante muestreo simple aleatorio y que se decidi hacerlo del modo siguiente:
m1 = 2

m2 = 3

m3 = 2

m4 = 4

m5 = 2

Supongamos que los conglomerados as elegidos fueron los que refleja la Tabla 8.5, la cual tambin refleja las probabilidades que les correspondieron a estas
UPE en la primera etapa.
Tabla 8.5. UPE seleccionadas por sectores y probabilidades de inclusin

Tabla 8.6. Tamaos de las manzanas elegidas y de los tamaos


muestrales resultantes tras la seleccin sistemtica

MUESTREO ESTRATIFICADO POLIETPICO

205

Una vez en terreno se tomaron muestras sistemticas de sujetos con el intervalo I = 5 (es decir f2 = 0,2) en todas y cada una de las 13 UPE seleccionadas.
Siendo as, los tamaos de las UPE y los tamaos mustrales correspondientes
fueron los que refleja la Tabla 8.6.
La Tabla 8.7 recoge los resultados de la encuesta realizada sobre esta muestra
(nmero de sujetos con necesidad de atencin estomatolgica).
Tabla 8.7. Resultados de la encuesta en las manzanas seleccionadas

Las probabilidades de seleccin que tuvieron en este ejemplo todos los elementos de la muestra son los que se reflejan en la Tabla 8.8.
Tabla 8.8. Probabilidades de seleccin de los elementos de las diferentes
manzanas elegidas

Consecuentemente, las ponderaciones que deben emplearse son las que se recogen en la Tabla 8.9:

206

DISEO RAZONADO DE MUESTRAS

Tabla 8.9. Ponderaciones que corresponden a los elementos


de las diferentes manzanas elegidas

Si llamamos yhij al valor de la variable Y para el sujeto j de la unidad de primera etapa i-sima en el estrato h, y whij a la ponderacin que corresponde a ese
valor (usualmente el inverso de la probabilidad de seleccin que correspondi a
ese sujeto), se definen:
yhi = whij yhij y xhij whij donde j recorre los sujetos de esa unidad de primera
j

etapa y ese estrato.


Con estos valores pueden computarse las siguientes expresiones:
mh

xh = xhi
i =1

x = xh
h =1

y
mh

yh = yhi
i =1

y = yh
h =1

donde mh es el nmero de UPE elegidas en el estrato h, en tanto que L es el nmero de estratos involucrados. Ahora se pueden aplicar las frmulas [8.1] y
[8.2], vlidas en la presente situacin.
El lector puede corroborar que, aplicadas tales frmulas se obtiene:
r = 0, 436 var (r ) = 0,0425 as como que el intervalo de confianza al 95% es
0,3520,519.
Puede comprobarse, adicionalmente, que si se tratan los datos como si procedieran de un MSA, tendramos: r = 0, 400 y var (r ) = 0,1642, de modo que la
2

0,0425
estimacin de DEFF sera deff =
= 6,7.
0,0164

MUESTREO ESTRATIFICADO POLIETPICO

207

8.7. Tamao muestral y efecto de diseo


Suponiendo que se ha identificado un parmetro como el ms importante del
estudio en los diseos multietpicos (involucren o no estratificacin), el discurso oficial del muestreo plantea que ha de comenzarse por calcular el tamao
de muestra correspondiente a la estimacin de ese parmetro bajo la suposicin
de que se usa MSA; llamemos ns a ese nmero. Para compensar el hecho de que
se trata de un diseo complejo, usualmente afectado por un efecto debido a la
conglomeracin, ns debe ser aumentado. Lo que se hace es multiplicarlo por el
DEFF correspondiente al diseo en juego. Naturalmente, no es fcil hallar una
estimacin adecuada de DEFF para ese parmetro ms importante. En la prctica se asume que DEFF se halla entre 1,5 y 3,0: si se piensa que los individuos
de una misma UPE son muy parecidos entre s respecto de lo que se investiga, se
toma un valor ms bien prximo a 3; de lo contrario, se elige uno ms prximo a
1,5 (se aumenta el tamao correspondiente a un MSA en alrededor de 3 veces y
en un 50%, respectivamente).
Puesto que a veces es difcil identificar un parmetro como el ms importante, se ha sugerido que este procedimiento se aplique para los 3 4 parmetros
que se consideren ms relevantes y, finalmente, tomar como tamao definitivo
un valor que se halle dentro del recorrido de las magnitudes as obtenidas.
El nmero final planificado debe contemplar la magnitud esperable de la llamada no-respuesta (tema que se aborda en la Seccin 12.4). Si se espera que
el porcentaje de individuos que va a responder sea de alrededor de , se divide el
tamao deseado por

. Por ejemplo, si se sospecha que slo el 85% de las


100
unidades podr ser efectivamente interrogado, se calcula el tamao:
ns ( DEFF )100
85
Resulta conveniente que el nmero que finalmente se establezca para n sea un
mltiplo del n que se haya planificado. Con el fin de determinar el nmero m de
UPE que se debe seleccionar se trabaja con este tamao total redondeado.
En Hansen, Hurwitz y Madow (1953) se sugiere que m est aproximadamente entre 15 y 50. No obstante, tal regla debe ser observada con espritu flen
xible, de manera que si
resultase igual, digamos, a m = 10 o a m = 56, no nen
cesariamente tendra que desecharse dicho resultado. En rigor, el elemento determinante es el anlisis de recursos a que deben someterse los nmeros m, n y n .
En la determinacin de n hay que tener en cuenta el significado prctico que
tiene tal nmero de unidades en una UPE. Por ejemplo, quizs se quiere que los
interrogatorios en cada UPE sean concluidos a lo largo de un solo da, con el fin
n=

208

DISEO RAZONADO DE MUESTRAS

de movilizar una sola vez al equipo de encuestadores hacia el sitio en que se ubica dicha UPE. Si se sabe que, en un mismo da, pueden realizarse 20 pero no 30
encuestas, podra decidirse que n fuera igual a 20, 40 u otro mltiplo de 20.
Asimismo, debe valorarse el efecto econmico de trasladarse a m UPE. En
general, es obvio que resulta ms conveniente desde el punto de vista de la representatividad tomar m grande y n pequeo (bajo la restriccin) que viceversa,
pero tambin lo es que, cuanto mayor sea m, mayores sern los gastos en la generalidad de las situaciones reales.
Como se puede apreciar tras la lectura de la presente Seccin, el espritu con
que se sugiere enfrentar el problema de decidir los tamaos de muestra dentro de
las diferentes etapas del diseo es abiertamente flexible. Se dan algunas ideas y
pautas generales, pero al final tal proceso quedar redondeado por el sentido
comn. Las numerosas formulaciones matemticas que se han sugerido para resolver este problema (vase el libro clsico de Hansen, Hurwitz y Madow, 1953)
son muy interesantes para los estadstico-matemticos, pero han demostrado ser
estriles para los investigadores aplicados.

Bibliografa
Berent J, Jones EF, Siddiqui MK. Basic characteristics, sample designs and questionnaires. Comparative Studies No. 18, World Fertility Survey, 1982.
Hansen MH, Hurwitz WN, Madow WG. Sample survey methods and theory. New York:
Wiley, 1953.
Kish L. Survey sampling. New York: Wiley, 1965.
Kish L. Exhausted and undersized PSU's. Survey Statistician, 1978. No. 0.
Lininger CA, Warwick DP. La encuesta por muestreo. Mxico DE: CECSA,
Moser CA, Kalton G. Survey methods in social investigation. 2.a ed. London: Heinemann Educational Books, 1971.
OMuircheartaigh C. Proximum designs for crude sampling frames. Bulletin of the International Statististical Institute 1977; 46, No. 3.
Silva LC. Sobre la aplicacin de un diseo estratificado polietpico en encuestas de
salud. La Habana: Instituto de Desarrollo de Salud. MINSAP, 1981.
Silva LC, Barreras M. Sobre la evaluacin de la calidad de los registros. Resultados de
una experiencia. Revista Cubana de Administracin de Salud 1983; 9: 385-393.

9
Otras tcnicas de muestreo

En el presente captulo se pasa revista someramente a diversas tcnicas ntimamente vinculadas al muestreo. Si bien no guardan, en general, relacin mutua,
todas aportan informacin complementaria de inters y contribuyen a conformar
una cultura ms slida tanto en materia de seleccin muestral como de estimacin.

9.1. Muestreo replicado


Esta tcnica de muestreo, que data de la dcada del cuarenta y que fue defendida con especial entusiasmo por Deming (1960), procura simplificar el
conflictivo proceso de estimacin de los errores de muestreo. La idea bsica consiste en seleccionar varias muestras independientes (tambin llamadas muestras
interpenetrantes), todas con el mismo diseo y cada una de las cuales pudiera
por s misma ser fuente de estimaciones. Mediante el uso combinado de la informacin procedente de todas ellas se pueden obtener, efectivamente, estimadores sumamente simples de los errores, lo cual es especialmente atractivo cuando se trata de estadgrafos complejos, tales como coeficientes de regresin o de
concordancia, no considerados en este libro. El procedimiento demanda que se
seleccionen muestras independientes, cada una resultante de un diseo que puede tener toda la complejidad que se quiera.
Supongamos que se tiene un parmetro y cierto procedimiento de estimacin
asociado a algn diseo muestral especfico. Llamemos 1 , 2 ,..., k a las estimaciones procedentes de respectivas muestras obtenidas tras haberse aplicado sucesiva1 k
mente este diseo, y consideremos su promedio como estimador de : M = j .
k j =1
De esta forma, se puede calcular la varianza de M mediante:

210

DISEO RAZONADO DE MUESTRAS


k

var (M ) =

(
j =1

M ) 2

k (k 1)

Ilustres muestristas, como Mahalanobis y Lahiri, propugnaban que el nmero de muestras interpenetrantes independientes fuese k = A. Una descripcin
del mtodo, en que se recomienda enfticamente tomar k = 10 replicaciones,
puede hallarse en Deming (1960).
Fuertemente emparentados con este mtodo de las replicaciones reiteradas, se
hallan los procedimientos conocidos como jackknife y, ms recientemente, los
mtodos de remuestreo conocidos como bootstrap (Efron, 1982); exposiciones
adecuadas pueden hallarse en Rust (1985) y Rao et al. (1986). Todos estos mtodos tienen en comn que remuestrean de las mismas unidades previamente
seleccionadas y producen errores de muestreo que son aproximadamente iguales
entre s (Kish y Frankel, 1974).

9.2. Tcnica de respuesta aleatorizada


Como se discuti en la Seccin 2.3, las investigaciones son a veces de naturaleza tal que los encuestados tienden a negarse a responder o, peor an, deciden distorsionar la verdad. Esto resulta especialmente verosmil cuando se trata de indagaciones de ndole muy personal, o que involucran rasgos embarazosos tales como
ciertas prcticas sexuales, conductas socialmente censuradas o prcticas ilegales.
En una situacin en que las preguntas formuladas sean de naturaleza altamente comprometedora sera iluso esperar que las respuestas fuesen veraces y,
por tanto, poco riguroso sacar conclusiones globales de tal informacin, salvo
que se hayan adoptado precauciones metodolgicas especiales. El recurso convencional consiste en comprometerse a conservar el anonimato, pero as no
siempre se consigue disipar las posibles suspicacias de los encuestados.
Con el fin de mitigar estos efectos, Warner (1965) ide un muy ingenioso
procedimiento de interrogatorio basado en la estrategia de que el interrogado
inyecte cierto error a su respuesta mediante un recurso regido por el azar. La
idea central consiste en que el interrogado realice un experimento aleatorio (tal
como lanzar un dado) y, sin revelar el resultado obtenido, d una informacin
que dependa, segn cierta regla predeterminada, tanto de tal resultado como de
su verdadera situacin ante la cuestin indagada. As, el encuestador nunca conocer la situacin que realmente corresponde al individuo; pero el estadstico,
usando los datos recogidos y las leyes probabilsticas que rigen el experimento,
podr obtener datos globales correctos sobre la poblacin.
A continuacin se expone la descripcin que se hace en Silva (1982) y Silva
(1997) de un problema de este tipo, y de la solucin que se emple para
encararlo.

OTRAS TCNICAS DE MUESTREO

211

En 1973 se realiz una encuesta de fecundidad (vase Krotki y McDaniel,


1975) en Alberta, Canad, sitio donde el aborto provocado era en aquel momento ilegal, salvo que mediaran razones teraputicas. Entre otras, se formulaban las siguientes dos preguntas:
1. HA TENIDO UN ABORTO PROVOCADO (TERAPUTICO O ILEGAL) A LO LARGO
DE 1972?
2. SE HA CASADO EN ALGUNA OPORTUNIDAD?
Es fcil advertir el carcter altamente sensitivo de la primera pregunta en
aquel medio, as como que la segunda carece, en principio, de carcter embarazoso y, por ende, de todo efecto inhibitorio.
Se seleccionaron tres muestras independientes, de 327, 269 y 342 mujeres
en edad frtil respectivamente. Con cada una de ellas se siguieron sendos procedimientos, diferentes entre s; para comenzar, expondremos cmo se procedi con las dos primeras.
La primera se abord, sin ms, a travs del interrogatorio directo; a las integrantes de la segunda se les indic enviar su respuesta por correo sin consignar
el remitente (encuesta annima). Se procuraba eliminar as, en este segundo grupo, las razones para la distorsin que verosmilmente aquejaran al primero.
Los porcentajes de respuestas afirmativas que se obtuvieron para la pregunta
comprometedora fueron 0,3% y 0,8% respectivamente: como se ve, el segundo
es casi tres veces mayor que el primero, presumiblemente debido al efecto
desinhibitorio producido por el anonimato. Para la segunda pregunta, en cambio,
estos porcentajes fueron 82,3% y 81,8%; la notable similitud entre estos dos
nmeros refleja y confirma la naturaleza no comprometedora de la pregunta.
Caba preguntarse, sin embargo, si los resultados de la encuesta annima eran
realmente confiables. Para valorarlo, se encar el problema desde otro ngulo.
En lugar de centrar la atencin en los porcentajes, se consider el nmero total
de abortos ilegales que se verificaron en la ciudad durante el ao 1972. Al tener
en cuenta el total de mujeres en edad frtil en la ciudad y el resultado de la primera muestra, se estim que 1.148 mujeres haban sido objeto de algn tipo de
aborto; cuando se utiliz el resultado de la encuesta annima, el nmero estimado de abortos, fuesen teraputicos o ilegales, ascendi a 3.058.
Hasta aqu todo parece lgico pero, por su carcter oficial, se conoca el nmero de abortos de ndole teraputica (y por tanto, legales): fueron 4.040 en el
perodo! Ello revela que incluso la encuesta annima padeci de un apreciable
subregistro, ya que el nmero de abortos teraputicos no puede ser mayor que
la totalidad de interrupciones1 (teraputicas e ilegales). Con esto se ilustra con1

Aqu se est equiparando el nmero de mujeres que abortaron en un ao con el de abortos producidos en
ese perodo, ya que el caso de una sola mujer con dos o ms interrupciones en tan breve lapso, aunque posible,
es muy poco probable.

212

DISEO RAZONADO DE MUESTRAS

vincentemente la inoperancia que puede aquejar a una encuesta annima como


recurso para evitar el posible temor que genera el interrogatorio en virtud de
que pudieran divulgarse sus respuestas.
Este problema vena planteando un desafo a los estadsticos: cmo obtener
conclusiones confiables sin dejar de conseguir que cada interrogado sepa (no
que crea ni que confe, sino que sepa) que no es posible establecer su situacin
respecto de la condicin embarazosa? La solucin encontrada fue la que se aplic a la tercera muestra en el estudio canadiense. Se trata de una expresin sencilla del llamado mtodo de respuesta aleatorizada, elegida entre numerosos
procedimientos concebidos bajo el mismo principio.
En un cartn se dibuja un crculo que se divide en dos secciones dentro de las
cuales aparecen afirmaciones complementarias de la manera indicada en la Figura 9.1.
La parte ms pequea abarca la cuarta parte del rea total del crculo. Fija al
centro del crculo hay una saeta metlica que, tras un impulso inicial de la persona interrogada, gira libremente. Cada mujer debe encarar aquella de las dos
afirmaciones que resulte sealada por la flecha al detenerse. En dependencia de
su situacin real, declara si es verdadera o falsa la afirmacin seleccionada
por el mecanismo; el encuestador simplemente anota esta respuesta (verdadero o
falso), sin conocer, naturalmente, a qu afirmacin corresponde.
Una vez interrogadas n mujeres, se conocer el nmero a de las que contestaron verdadero. Puede suponerse que slo a una cuarta parte de las mujeres
les haya correspondido evaluar la afirmacin contenida en la seccin pequea,
y tambin, obviamente, que el resultado de cada experimento (la regin en que
cae la flecha) es independiente de que la mujer se haya o no practicado un abor-

Figura 9.1. Dispositivo para interrogatorio con respuesta aleatorizada.

OTRAS TCNICAS DE MUESTREO

213

to. Usando la teora elemental de probabilidades, estas suposiciones permiten


a
na
afirmar que P + (1 )
donde es la fraccin del crculo corresponn
n
diente a la declaracin afirmativa.
Es fcil deducir que el porcentaje desconocido P de mujeres que tuvieron un
1
), puede estimarse mediante la frmula [9.1]:
4
3n 4a
P =
[9.1]
2n
Como se recordar, en la encuesta se haban tomado 3 muestras. Cada una
de las 342 mujeres de la tercera fue interrogada mediante el procedimiento descrito; a = 251 de ellas respondieron que era verdadera la afirmacin sobre la cual
les toc pronunciarse, de modo que, segn [9.1], el porcentaje de mujeres que
se haban realizado abortos se estima como 3,2%. Cabe preguntarse ahora: es
efectivamente eficaz el procedimiento? Los porcentajes estimados con los tres
mtodos de encuesta se resumen en la Tabla 9.1.

aborto, en este caso (donde =

Tabla 9.1. Estimaciones de los porcentajes de mujeres con abortos


y de mujeres casadas segn mtodo de encuesta

Por otra parte, las estimaciones de los totales para los diferentes tipos de abortos se resumen en la Tabla 9.2.
Tabla 9.2. Nmero estimado del total de abortos segn mtodo de encuesta

214

DISEO RAZONADO DE MUESTRAS

Las cifras son sumamente elocuentes: segn se aprecia en la Tabla 9.1, cuando se emplea respuesta aleatorizada, el porcentaje de abortadoras (pregunta comprometedora) se multiplica por 10, en tanto que el de casadas (pregunta inocua) no
exhibe prcticamente variacin alguna. Por otra parte, la Tabla 9.2 muestra que,
mientras los dos procedimientos convencionales arrojaron conclusiones disparatadas (el total de abortos ilegales era negativo), la tcnica de respuesta aleatorizada consigui arrancar una estimacin enteramente razonable de dicho nmero.
Numerosos procedimientos similares al que se ha explicado (en los que se involucran artilugios tales como cartas, dados o monedas) fueron creados para
encarar problemas como ste. Uno ms simple que el de Warner consiste en
solicitar que se lance una moneda y pedir al sujeto que, si sale cara, responda a
la pregunta: Ha tenido usted un aborto?; en tanto que, si el resultado es escudo, responda S. En este caso es fcil ver que la estimacin de mujeres que
abortaron se estimara mediante: P = 2 ps 1 , donde ps representa la fraccin de
mujeres encuestadas que respondieron S.
Ms tarde, se crearon incluso procedimientos para estimar promedios, como
muestra el siguiente ejemplo de Dalenius y Vtale (1974), quienes adecuaron el
procedimiento de Warner para estimar la media de una variable cuantitativa
conflictiva, tal como la edad de la primeras relaciones sexuales (X).
Se parte de que X puede tomar cualquiera de los 35 valores que van desde
15 a 49 aos y que se trabaja con una muestra de n mujeres que admiten haber
tenido tales relaciones en el momento de la encuesta. En un cartn se dibuja un
crculo que se divide en 35 secciones iguales que se numeran sucesivamente del
15 al 49. Fija al centro del crculo hay, como antes, una varilla metlica que la interrogada hace girar; cuando el dispositivo se detiene, el extremo de la varilla reposar sobre un nmero que, naturalmente, el encuestador no conocer. Cada
mujer se circunscribe a decir NO en caso de que sus primeras relaciones sexuales se hayan verificado a una edad estrictamente superior al nmero sealado por
a
la saeta, y S en caso opuesto. Puede probarse que = 15 + 35 es un estiman
dor insesgado de la media, donde a es el nmero de mujeres que contestaron NO.
Si, por ejemplo, el porcentaje de respuestas negativas es 40%, entonces
= 15 + (35)(0, 4) = 29; o sea, se estima que la edad media del comienzo de las
relaciones sexuales en esa poblacin es 29 aos.
NOTA: Naturalmente, todas estas estimaciones estn afectadas por cierto error. Adems
del error del muestreo, en este caso est presente un componente de error debido al efecto que produce el mecanismo aleatorio. No se examinar, sin embargo, este problema aqu, ya que desborda el nivel del libro. Su solucin puede
hallarse, por ejemplo, en Boruch y Cecil (1979).

La tcnica de respuesta aleatorizada alcanz un considerable aval prctico.


Muchas experiencias se realizaron en esferas tales como fecundidad, conducta

OTRAS TCNICAS DE MUESTREO

215

sexual, consumo de alcohol, actuaciones ilegales y fraude acadmico. Massey,


Ezatti y Folsom (1989) la sugirieron para estimar el porcentaje de personas que
niegan falsamente mantener conductas de riesgo en relacin con el SIDA.
A travs de una encuesta basada en esta tcnica, Zdep y Rhodes (1971) encontraron, por ejemplo, que la estimacin del porcentaje de individuos que golpean a sus hijos era cinco veces mayor que lo que arroj el mtodo de respuesta
annima por correo.
En algunos pases de alto desarrollo el procedimiento ha servido para mostrar
que la prevalencia de drogadiccin es mucho mayor de lo que los mtodos tradicionales hacan suponer; por ejemplo, el estudio de Brown y Harding
(1973) en que se encuestaron miles de individuos produjo estimaciones dos
veces mayores para submuestras tratadas con respuesta aleatorizada que para
otras manejadas annimamente.
Otros estudios proporcionan resultados igualmente elocuentes; es obvio, sin
embargo, que el mero hecho de que las diferencias entre las estimaciones obtenidas con respuesta aleatorizada y por un mtodo convencional sean muy marcadas no constituyen prueba irrefutable de la eficiencia del procedimiento. Los
trabajos de validacin realizados agregaron en su momento algn aliento adicional a las expectativas creadas por el mtodo. Para llevar adelante tal validacin
es menester comparar los verdaderos parmetros (suponiendo, claro, que stos
sean conocidos) tanto con las estimaciones obtenidas por conducto de la tcnica
novedosa como con las que proceden de mtodos tradicionales. Lamb y Stem
(1978) y Tracy y Fox (1981) obtuvieron resultados bastante estimulantes en esta lnea.
La experiencia acumulada hace pensar que, en general, el nivel de confianza
del sujeto interrogado aumenta considerablemente entre los que acceden a participar; sin embargo, el grado de participacin no se ha visto sensiblemente incrementado. En efecto, los mtodos estadsticos pueden generar suspicacia y
desconcierto entre los interrogados y segn se informa en la literatura su aplicacin no ha producido la disminucin esperada en las tasas de no respuesta.
La manera en que se explican y aplican los procedimientos, el mecanismo
aleatorio utilizado y, especialmente, el nivel cultural de los encuestados, parecen
influir decisivamente en el xito de procedimientos como ste.
En este sentido, Silva (1984) apuntaba algunas sugerencias:
a) La tcnica debe aplicarse a una parte de la muestra piloto y el mtodo regular a la otra parte; as podra evaluarse su comprensin, grado de aceptacin y funcionamiento general en la poblacin.
b) En su fase de aplicacin es preciso constatar que cada interrogado ha
comprendido no slo aquello que se espera de l, sino que entienda que
el mtodo, efectivamente, le confiere absoluta privacidad.
c) Las preguntas tratadas por respuesta aleatorizada deben aparecer al final

216

DISEO RAZONADO DE MUESTRAS

del cuestionario, despus de las que se formulan por vas convencionales


y previa explicacin de que se trata de un procedimiento para cuya aplicacin se solicita especial cooperacin.
Las posibilidades de comunicacin horizontal que actualmente ofrece Internet y el correo electrnico abren oportunidades novedosas a la tcnica que nos
ocupa, ya que si el sujeto encuestado recibe la demanda por esta va, puede operar segn se le indique sin testigos, y el dispositivo fsico (dados, ruleta, baraja
o lo que sea) puede suplirse por un recurso simulado a travs de un programa
que se adjunte a la propia encuesta para que el usuario ejecute y responda en funcin del resultado.

9.3. Estimacin por pesca y repesca


Un problema interesante surge cuando se quiere estimar el nmero total (llammosle N) de animales que habitan una zona; por ejemplo, guilas en un valle
o peces en un lago. Una tcnica para abordar este problema consiste en emplear
el sistema denominado de captura-recaptura o pesca-repesca. En su versin
ms elemental la tcnica consiste en tomar una muestra de n animales (por ejemplo, un conjunto de peces), marcarlos mediante algn procedimiento (un anillo
o una cruz de pintura) y devolverlos a la zona (al lago). Una vez que los ya capturados se mezclen con los restantes, se selecciona una nueva muestra, ahora de
m animales. Se cuenta el nmero k de los que estn marcados entre estos ltimos
(es decir, los que fueron capturados en las dos ocasiones).
Es muy fcil comprender que, basndose en los supuestos de que la poblacin
no se modifica durante el lapso que dura el estudio y de que en ambos procesos
de seleccin todos los animales tienen igual probabilidad de seleccin, un estimador adecuado del tamao poblacional es el siguiente:
nm
N =
[9.2]
k
De hecho, en Feller (1950) se demuestra que [9.2] es un estimador de mxima verosimilitud2.
Un sencillo razonamiento conduce a la frmula [9.2] de manera natural. Imaginemos que inicialmente se pescaron n = 1.300 peces, que en la segunda ocasin se capturaron m = 2.500 y que k= 125 de stos ltimos haban integrado
tambin la primera muestra. A juzgar por los resultados de la segunda muestra,
2
La funcin de verosimilitud es un recurso usualmente aplicado en Teora de Estimacin cuya definicin
desborda el nivel del presente texto. La estimacin mximo verosmil es el valor que conduce al estimador ms
razonable dados los datos que se poseen.

OTRAS TCNICAS DE MUESTREO

217

el 5% de la totalidad de los peces del lago llevan marca (125 de 2.500). De modo que 1.300 (total de peces marcados) representa el 5% del nmero desconocido. Concretamente, N debe ser 20 veces mayor que 1.300; es decir: se estima que
hay 26.000 peces en total. La frmula [9.2] produce, desde luego, el mismo resultado:
(1.300)(2.500)
N =
= 26.000
125
Existen diversas aplicaciones del procedimiento, cuya versin ms simple se
acaba de exponer (Hook y Regal, 1995). El modelo podra emplearse, por ejemplo, para estimar el nmero total de ambulancias o de coches policiales en una
ciudad3, pero una de las aplicaciones ms sealadas en el mbito salubrista concierne al afn de evaluar la integridad de los sistemas de registro en salud pblica, en lo que tambin se conoce como sistemas duales de registro (Wells, 1971).
El ms clsico fue propuesto por Chrandasekar y Deming (1949) para estimar
ciertos datos globales aprovechando las discordancias entre dos sistemas de registro independientes que traten de obtener informacin sobre un mismo tipo de
acontecimientos. Para estimar el nmero total de tales acontecimientos, el procedimiento asume que la poblacin de donde procede la informacin es cerrada
(en el mismo sentido en que lo es la poblacin de peces) y que es posible identificar correctamente tanto los casos que aparecen en ambos registros como los
que slo estn en uno de ellos pero no en el otro.
La informacin necesaria es el nmero a de casos registrados en los dos
sistemas, el nmero b de los que registra el registro 1 pero no el 2, y los que se
hallan en el segundo pero no en el primero, al que llamamos c. Se definen
n1=a + b y n2 = a + c y se obtiene la estimacin del total N de sujetos que estn
en al menos uno de los dos. El estimador [9.2] con esta notacin sera:
n n
N = 1 2
a
Pero tambin se ha propuesto el estimador:
(n + 1)(n2 + 1)
N = 1
a +1
La estimacin de la varianza de N viene dada por:

( n + 1)(n2 + 1)cb
Var (N ) = 1
(a + 1) 2 (a + 2)
3

[9.3]

[9.4]

Se tratara de anotar las matrculas de un conjunto de estos coches mientras circulan aleatoriamente
durante cierto lapso, y hacerlo nuevamente unos das ms tarde.

218

DISEO RAZONADO DE MUESTRAS

Una aplicacin vinculada a los problemas de muestreo es la siguiente


(Teutsch y Churchill, 1994): imaginemos que en una comunidad hay un registro
de asmticos que se pretende emplear en calidad de marco muestral pero que se
sabe que es incompleto; se tiene un segundo registro independiente y se quiere
estimar la magnitud de las deficiencias de cobertura presentes en el marco inicial. Hay a = 140 sujetos que estn en ambos registros; b = 20 estn en el registro 1 pero no en el 2 y c = 55 se hallan en el 2 pero no en el 1.
El total de sujetos tericamente elegibles sera, segn [9.3], igual a:
(164 + 1)(195 + 1)
N =
= 229, 4
(140 + 1)
La varianza de N sera:
(165)(196)(20)(55)
var ( N ) =
= 12,6
(141) 2 (142)
De modo que un intervalo de confianza para N sera 229, 4 (1,96) 12,6;
es decir, puede estarse razonablemente seguro de que el nmero de asmticos
se halla entre 222 y 236. Para ms detalles, vase Wolter (1983).

9.4. Muestreo condicional en dos fases


Supongamos que se est realizando un estudio de morbilidad para estimar la
prevalencia de cierta dolencia, pero imaginemos que se presenta la siguiente singularidad: el costo de la prueba diagnstica que se considera ptima (a la que llamaremos T2) es demasiado alto como para realizarla a todos los sujetos de la
muestra, a la vez que existe una prueba ms barata (llammosla T1) de relativamente baja especificidad pero muy sensible. Es decir: si el sujeto padece la dolencia arrojar casi con seguridad un resultado positivo ante la prueba T1 pero
la casi completa confirmacin slo se obtendr si se repite ese resultado
cuando se le aplique la prueba T2.
Una estrategia comn en tales circunstancias es la siguiente: realizar la prueba
T1 a una muestra (que en principio consideraremos elegida simplemente al azar,
pero que puede ser seleccionada por cualquier otro mtodo) de tamao n y luego
aplicar T2 slo a n2 individuos elegidos al azar de los n1 que resultaron positivos
bajo T1 donde n2 < n 1 . Supongamos que en esta segunda fase son m los positivos.
La prueba T1 funciona como una especie de tamizaje o screening inicial y el diseo puede denominarse muestreo condicional en dos fases. La situacin es la
que refleja la Figura 9.2. El problema consiste en estimar la tasa de prevalencia de
la dolencia empleando la informacin que resulta de aplicar las dos fases. Consideraremos positivo slo a quienes hayan arrojado el resultado T2+ y T1+ .

OTRAS TCNICAS DE MUESTREO

219

Figura 9.2. Muestra condicional en dos fases.

La probabilidad de que se produzca esa conjuncin es igual, segn el teorema


de Bayes, a P (T2 + T1+ ) P (T1+ ), lo cual se estima, si suponemos que se aplic
m n1
. .
n2 n
Por ejemplo, si el primer tamizaje se llev adelante con 200 sujetos, de los
cuales 120 resultaron ser positivos, y al aplicar T2 a 50 de estos ltimos, resultaron 20 positivos, entonces n = 200 n1 = 120 n2 = 50 m = 20, de modo que
120 20 24
. =
p =
= 0, 24.
200 50 100
La estimacin del error de este estimador es complicada por tratarse del producto de una proporcin y una razn, especialmente si los diseos empleados
en ambas etapas fueron complejos. El problema aqu esbozado est abierto, especialmente para el caso en que se conocen la sensibilidad y la especificidad de
las pruebas involucradas, datos que pudieran ser incorporados con provecho en
todo el proceso de estimacin.

un diseo equiprobabilstico en ambas ocasiones, a travs del producto

9.5. Muestreo en el tiempo


Se comentan brevemente a continuacin algunas estrategias de diseos temporales en las encuestas por muestreo. Por regla general, algunas de estas alternativas se adoptan por simple hbito o por tradicin, y con frecuencia no se ha
tenido en cuenta la seleccin probabilstica en la dimensin temporal. No pocas
veces se usan los llamados perodos tpicos (representativos), tal y como ocurre con el primero de abril para los censos decenales en Estados Unidos; en su
momento se consider que dicha fecha era tpica y ms conveniente que cualquier otro da, hasta que ya se volvi tradicional, al igual que ocurre con la tercera semana para representar a la poblacin cada mes en el Current Population
Survey (US Census Bureau, 1978). Ocurre, en fin, como con las reas tpicas,

220

DISEO RAZONADO DE MUESTRAS

que tambin fueron muy utilizadas como paradigmas de representatividad espacial hasta que se generaliz el uso del muestreo probabilstico de reas.
El muestreo a lo largo de un intervalo dado de tiempo representa una posibilidad: de la misma manera que una poblacin se ubica en el espacio, tambin
puede considerarse el tiempo como otra dimensin de la variacin. Las poblaciones varan de un ao a otro y de una semana a otra, del mismo modo que varan entre regiones o municipios. El muestreo probabilstico de reas poblacionales sirve como recurso que contempla la variacin espacial, pero la variacin
temporal puede tener tanta o ms importancia, especialmente en cuanto a las modificaciones cclicas (estacionales, semanales o incluso diarias). Cuando por limitaciones de orden prctico, como las existentes para los censos decenales, se
requiere un periodo nico, la seleccin basada en criterios subjetivos de un periodo representativo puede ser preferible a una eleccin en que intervenga el
azar. Pero cuando se cuente con un nmero mayor de periodos, cabe considerar
la posibilidad de realizar una seleccin probabilstica de los periodos (de igual
modo que se hara con las reas).
Los cortes transversales, por regla general, tienden a sacrificar la cobertura
temporal, mientras que los estudios longitudinales estn limitados espacialmente. Los diseos matriciales para muestrear tanto el espacio como el tiempo mediante muestras peridicas equilibradas pueden constituir una solucin integral.
Las encuestas peridicas, diseadas para determinados periodos, pueden ser
promediadas para el total del intervalo que abarcan. Con las muestras repetidas
podemos estar en condiciones de mejorar la calidad y reducir los costos; por otra
parte, las muestras repetidas pueden producir datos para construir series temporales que permitan estimar cambios y tendencias; y, finalmente, las medias y
sumas obtenidas con muestras repetidas pueden producir resultados inferenciales mejores que los basados en muestras nicas (Kish, 1989).

9.6. Muestras maestras


Sera difcil imaginar muestras peridicas que pudiesen aplicarse sin contar
con marcos mustrales tipo o muestras maestras. Dichos marcos pueden suministrar muchos datos auxiliares para mejorar las muestras peridicas. El trmino
muestra maestra alude a una coleccin de mapas, listas, planos y otras informaciones auxiliares, ya sean referidas a toda la poblacin o a una amplia seleccin de unidades primarias de muestreo, que a su vez sirven como marco para
seleccionar las muestras necesarias. Es posible seleccionar, por ejemplo en una
primera fase inicial, una muestra grande (digamos de manzanas) para despus
elegir a partir de esas listas ya preparadas, y segn se necesiten, las unidades de
las siguientes etapas para conformar las muestras reales de cada nueva encuesta.

OTRAS TCNICAS DE MUESTREO

221

Una muestra tipo puede incluso contener datos personales obtenidos en entrevistas realizadas en una primera fase, de modo que sobre una submuestra de estos
individuos entrevistos se efectan las encuestas que vayan siendo necesarias.
Tales submuestras, con frecuencia, son objeto de rotacin: se conservan las
UPE iniciales (con sus probabilidades) y en momentos sucesivos se completan
las selecciones correspondientes a etapas posteriores, contemplando para estas
subselecciones las probabilidades originalmente previstas.
Para ilustrarlo con un ejemplo muy sencillo imaginemos que en una comunidad hay 12 escuelas primarias de las que se han seleccionado 3 con probabilidades proporcionales al nmero de nios y que luego se eligieron 20 nios, por
escuela para completar una muestra equiprobabilstica de 60 sujetos. Supongamos que las probabilidades de seleccin resultaron ser las siguientes:

f1 = 0,12

f2 = 0,43

f3 = 0,28

Dos aos ms tarde, se realiza otra encuesta con la misma poblacin: los nios
de las 12 escuelas existentes. Naturalmente, los nios ya no sern los mismos, ni
ser igual el nmero de nios por escuela, ni el nmero total de nios. Supongamos que en este segundo momento se quiere una muestra equiprobabilstica con f
= 0,03 como probabilidad general (calculada mediante la determinacin del tamao n deseado y del actual valor de N, o eligiendo la misma f del estudio anterior).
En tal caso, pueden usarse las mismas tres escuelas y aplicarse entonces, respectivamente, las siguientes fracciones de muestreo (quizs mediante muestreo sistemtico en fases) a las listas de alumnos que ahora se hallan en dichas escuelas:

f1' = 0, 25

f 2' = 0,07

f 3' = 0,11

que son las necesarias para que se cumpla la condicin fif i ' = f .

9.7. Muestreo y tcnicas de evaluacin rpida


En los ltimos aos se ha venido hablando con insistencia de las llamadas
tcnicas rpidas de evaluacin sanitaria. En un nmero de World Health Statistics Quarterly especialmente destinado al tema de se puede apreciar que abarcan
a las tcnicas de muestreo. Bennet et al. (1991) exponen lo que ellos denominan mtodo general simplificado de muestreo por conglomerados como alternativa a un procedimiento propuesto aos antes por Henderson y Sundaresan
(1982), consistente en tomar 30 conglomerados y 7 sujetos en cada uno, un diseo simplemente arbitrario.
Ahora bien, en mi opinin, el planteamiento de Bennet y sus colaboradores
no se distingue en lo esencial del que formula la teora clsica de muestreo y, en

222

DISEO RAZONADO DE MUESTRAS

el fondo, no es otra cosa que el contenido del Captulo 7 del presente libro. A mi
juicio, ms que una tcnica rpida de evaluacin, lo que ellos hacen es una
exposicin rpida de una tcnica convencional.

9.8. Estimacin de eventos infrecuentes y muestreo en red


Supongamos que se desea estimar el nmero total de casos de cierta enfermedad (por ejemplo, un tipo de cncer o de hepatitis) acaecidos en la poblacin
durante un lapso dado. El procedimiento convencional sera interrogar una
muestra de sujetos e indagar si han tenido o no la enfermedad; pero, si la dolencia es muy poco frecuente, el tamao muestral debera ser muy grande.
Una alternativa sera seleccionar un conjunto de mdicos e interrogarlos a
ellos en lugar de a los posibles enfermos, y preguntarles cuntos casos diferentes
han atendido a lo largo de cierto lapso previo. La dificultad estriba, en principio, en que ms de un mdico puede informar del mismo caso. Cuando se trata
de cuantificar un acontecimiento poco frecuente en una comunidad, este recurso,
puede ser, sin embargo, en extremo til.
Cuando se admite una regla de conteo mltiple como la que se describe a
continuacin con un ejemplo, el mtodo de muestreo suele denominarse muestreo en red.
Supongamos que en una escuela hay A = 600 alumnos distribuidos en varios
grupos. Cada alumno tiene cierto nmero de profesores. Dicho nmero depende del ao escolar que curse y de otros aspectos acadmicos inherentes al estudiante en cuestin; consecuentemente, puede diferir de alumno a alumno. Imaginemos que el nmero total de docentes es 12 y que se quiere estimar el nmero
de alumnos que cometieron fraude acadmico a lo largo del ltimo ao.
La manera natural de realizar la estimacin es seleccionar una muestra de
alumnos (por ejemplo, a = 50 estudiantes) e indagar en el expediente de cada
cual si ha cometido o no un fraude. Si para na de ellos se tiene respuesta afirmativa, entonces la estimacin sera:
A
X 1 = na
a
Supongamos que en total se han producido cuatro casos de fraude; es evidente que la inmensa mayora de las muestras posibles de tamao 50 produciran
na = 0 y, por tanto, la estimacin X 1 = 0 (puede demostrarse que ello ocurrir concretamente con el 70.5% de las muestras). Como ya sabemos (vase Seccin
3.3), la varianza de X 1 es igual a:
n
Var ( X 1 ) = A2Var a
a

2 PQ
= A a 1 A

OTRAS TCNICAS DE MUESTREO

223

4
, tenemos:
600
6002 4 596
50
Var ( X 1 ) =
1
= 43,71
50 600 600 600
Otra posibilidad es tomar una muestra de profesores (digamos, n = 5 de los
N = 12) y preguntar a cada cual cuntos de sus alumnos han cometido un fraude
en el ltimo ao. La dificultad radica en que un mismo alumno puede ser sealado por varios profesores (suponiendo que todos los profesores de un alumno
conocen si ste ha incurrido o no en la mencionada transgresin).
Una posible solucin para evitar este posible sobrerregistro consiste en establecer que un profesor slo pueda informar los casos de fraude cometidos en su
asignatura. Llamemos xi al nmero de alumnos identificados bajo dicha regla por
el i-simo profesor de la muestra. Entonces, un estimador insesgado de X sera:
N n
X 2 = xi
n i =1
Por ejemplo, si a uno de los cinco profesores de la muestra le correspondieron dos casos de fraude, a otro un caso, y ningn caso a los restantes tres, entonces la estimacin sera:
Puesto que P =

12
36
X 2 = (2 + 1 + 0 + 0 + 0) =
= 7, 2
5
5
Imaginemos que, estructuralmente, la situacin es como la que refleja la
Figura 9.3. All aparecen los N = 12 profesores de la escuela y los cuatro alum-

Figura 9.3. Muestra en red.

224

DISEO RAZONADO DE MUESTRAS

nos que han cometido fraude. Las flechas unen a cada uno de estos alumnos
con cada uno de sus profesores.
Esto quiere decir que el primer alumno tiene 4 profesores, el segundo tiene 3,
el tercero tiene 5 y el cuarto tiene 2. Por otra parte las flechas de trazo grueso
indican, para cada alumno, con qu profesor especfico se produjo el fraude.
Por otra parte, la Figura 9.3 tambin permite apreciar la situacin de los profesores. Por ejemplo, de ella se deduce que slo a 3 profesores se les ha cometido fraude y que para uno de los 12 se dio la situacin de que ninguno de sus
alumnos cometi fraude. La situacin se resume en la Tabla 9.3.
Tabla 9.3. Situacin de los profesores de la escuela en relacin
con el nmero de alumnos que han cometido fraude

Nota:

X i*

se define ms adelante.

OTRAS TCNICAS DE MUESTREO

225

La varianza de X 2 es:
S2
n
Var ( X 2 ) = N 2
1
n N

donde S 2 =

1 N
1 N
(
)
con
X

X
X
=
i
X i . Es fcil ver que, con los datos de la
N 1 i =1
N i =1

Tabla 9.3, se tiene X =

4 1
= y S 2 = 0, 424, de modo que Var ( X 2 ) = 2,67.
12 3

Advirtase que en este caso X 2 ser igual a cero para todas las muestras que
no contengan a los 3 profesores a los que le cometieron fraude (es decir, a los
que hemos numerado 4, 7 y 10). 12
El total de muestras posibles es ,I = 792, y el nmero de las que no con6
9
tienen a ninguno de los profesores mencionados es = 126, de modo que ahora
5
slo el 16% de las muestras (126 de 792) da lugar a la estimacin X 2 = 0 .
Una tercera posibilidad es admitir para la muestra de profesores el llamado
conteo mltiple: cada profesor comunica el nmero de todos sus alumnos
que hayan cometido fraude. Obviamente, la probabilidad de que un alumno sea
sealado es inversamente proporcional al nmero de profesores que tenga. Se
m

define xi* =

ij

para el i-simo profesor, donde m es el nmero total de alumsj


nos diferentes que han sido reportados, donde ij vale 1 si el profesor i tiene entre sus alumnos al alumno; y ij = 0 en otro caso, y donde sj es el nmero de profesores que tiene el alumno j. Entonces se define:
j =i

N n
X 3 = xi*
n i =1
Se puede probar que X 3 tambin es un estimador insesgado de X. En el ejemplo, los valores de xi* son los que se hallan en la ltima columna de la Tabla 9.3.
As, por ejemplo, si en la muestra quedaran seleccionados los primeros 5 pro12 5 2
fesores, entonces X 3 sera igual a
+ = 4, 2. Advirtase que en este
5 4 3
caso ninguna de las muestras producira la aberracin de dar lugar a una estimacin de X igual a 0. La varianza de X 3 tiene la misma estructura que la de

S2
1 N
n
( X i X )2 .
X 2 : Var ( X 3 ) = N 2 * 1 donde S 2* =

N 1 i =1
n N
*
En este caso, S 2 = 0, 4241 y Var ( X 3 ) = 0,829. Como se aprecia, Var ( X 3 ) es mucho menor que Var ( X 2 ); lo que revela las ventajas de este procedimiento, espe-

226

DISEO RAZONADO DE MUESTRAS

cialmente til para la estimacin de totales en caso de que las prevalencias sean
muy bajas (digamos, del orden del 3% o menos). Un ejemplo de aplicacin de
esta tcnica puede hallarse en Sirken (1970). La teora correspondiente a muestreo en red para diseos ms complejos que el MSA (por ejemplo, para muestreo
por conglomerados) puede hallarse en Levy (1977).

9.9. Medias segn unidades de informacin


Segn consigna Kish (1965), alrededor de 1957 (despus de los primeros xitos rusos en cosmonutica) aparecieron en Estados Unidos informaciones
sobrecogedoras sobre la enseanza de las ciencias en este pas: en la mitad de los
colegios de enseanza media no se imparta fsica, la cuarta parte no enseaba
qumica y otra cuarta parte no enseaba geometra. No tard en repararse en que,
aunque los colegios con tales expresiones de retraso eran realmente muchos,
slo abarcaban al 2% de los estudiantes de enseanza media.
Haba muchos ms colegios pequeos que grandes, pero una pequea fraccin de colegios grandes contena un gran porcentaje de estudiantes, a la vez que
los programas de estudio que ofrecan los colegios grandes se diferenciaban radicalmente de los de los pequeos. Por ello, la presentacin de las condiciones
promedio de los colegios proporcionaba una imagen tergiversada de las condiciones en que se encontraba la inmensa mayora de los estudiantes.
Este problema se puede presentar cada vez que se emplean grupos de elementos de tamaos muy diferentes entre s que no slo constituyen unidades de
muestreo, sino que tambin operan como unidades de observacin, y ocurre
cuando se observa una caracterstica grupal de cada unidad y se asigna tal condicin a todos los elementos comprendidos dentro de las unidades. Las posibles
diferencias entre las medias simples no ponderadas de las unidades y las medias
ponderadas de los elementos son grandes, lo cual supone notables sesgos en caso
de que se emplee como recurso descriptivo la media inadecuada.
Supongamos que se tienen n unidades de tamaos N1, N2, ..., Nn y una variable
Y dicotmica (Yi = 1 si la i-sima de estas unidades tiene cierto rasgo, e Yi = 0 en
1 n
caso contrario). La media simple no ponderada para las unidades es Y = Yi ,
n i =1
en tanto que la media ponderada es:
n

Yw = WiYi =
i =1

N Y
i =1
n

i i

N
i =1

donde Wi =

Ni

N
i =1

Si los Ni fuesen iguales entre s, ambos estadgrafos coincidiran, pero las


variaciones de tamao que existen en muchos de los grupos sociales que con frecuencia son sujetos de observacin y de promediacin, puede ser notable. Uni-

OTRAS TCNICAS DE MUESTREO

227

dades como ciudades y provincias, universidades u hospitales, suelen tener tamaos que difieren marcadamente entre s. Si la correlacin entre el tamao y
la variable de estudio no es desdeable, la diferencia entre la media ponderada
y la no ponderada puede ser grande.
Consideremos la sencilla situacin que sigue: tenemos n = 5 hospitales cuyos
tamaos (medidos en trminos del nmero de mdicos) son iguales a 300, 510,
820, 60 y 50.
Supongamos que slo en los 2 ltimos hay graves problemas de ventilacin.
Si bien es cierto que el 40% de los hospitales padece el mencionado problema,
en realidad slo el 7% del total de mdicos trabajan en tales hospitales y estara
por tanto realmente afectado por el problema (110 de 1.740).

9.10. Diseos con cuestionario parcial


En la Seccin 2.3 habamos abogado a favor de que se confeccionaran cuestionarios tan cortos como fuera posible. Sin embargo, no siempre puede conseguirse brevedad; ocasionalmente es imprescindible la inclusin de un gran
nmero de preguntas para satisfacer los objetivos de la encuesta.
Para conciliar esta realidad con el afn de que las encuestas sean cortos se ha
ideado un ingenioso recurso al que denominaremos diseo con cuestionario parcial (Wacholder, Carroll, Pee y Gail, 1994). La idea consiste en que cada encuestado responda slo a una parte del cuestionario, a la vez que se procede de
modo que cada una de sus preguntas sea contestada, como mnimo, por un
subconjunto de sujetos de la muestra. El mtodo en cuestin, tambin discutido
por Williams y Ryan (1996), Raghunathan y Grizzle (1995) y Zeger y Thomas
(1997), puede bosquejarse a travs del ejemplo siguiente.
Supongamos que las preguntas del cuestionario se dividen en cuatro bloques mutuamente excluyentes (Bl, B2, B3, B4) y que la muestra se divide a su
vez en tres submuestras (SI, S2, S3) que tampoco se intersecan entre s. Se decide que todas las preguntas incluidas en Bl se formulen a la totalidad de la
muestra, en tanto que a los integrantes de cada una de las tres submuestras se le
formulan las preguntas incluidas en slo uno de los tres bloques restantes. Por
ejemplo, a la submuestra S1 se le aplican adems de B1 las preguntas del bloque B2; a la S2 las preguntas de Bl y B3, y a la tercera submuestra, S3, las del
bloque B1 y B4. Esquemticamente, la situacin sera la que se recoge en la Tabla 9.4.
En una situacin como la descrita, la limitacin bsica que se presenta es
que resultara imposible cruzar preguntas pertenecientes a bloques diferentes,
salvo que uno de dichos bloques sea el primero. Por ejemplo si la condicin de

228

DISEO RAZONADO DE MUESTRAS

Tabla 9.4. Diseo con cuestionario parcial para tres submuestras y cuatro
bloques de preguntas con un bloque comn

enfermo crnico se pregunta en el bloque B2 y la ocupacin en el B4, entonces


ser imposible computar tasas de prevalencia de enfermos crnicos segn ocupacin. Por otra parte, las estimaciones correspondientes a las preguntas de los
bloques B2, B3 y B4 se realizan a slo una tercera parte de la muestra, con la
consecuente disminucin de precisin en las estimaciones correspondientes.
Una particin menos radical pudiera ser acorde al diseo de la Tabla 9.5.
Tabla 9.5. Diseo con cuestionario parcial para tres submuestras y cuatro
bloques de preguntas con un bloque comn y una replicacin de los otros

En este caso, cada pregunta de los bloques 2, 3, y 4 quedara incluida en las


dos terceras partes de la muestra total y ya sera posible hacer cruzamientos de
dos preguntas cualesquiera de la encuesta, aunque en ellos participaran a lo sumo los dos tercios de la muestra (si una de ellas procede de B1 y la otra no) y en
muchos casos, un tercio (si una es, por ejemplo, de B2 y la otra de B4).
Lo lgico es que en B1 se ubiquen todas las preguntas generales (nombre,
ubicacin, etc.), as como aquellas ms importantes (las que exijan estimaciones
ms precisas) y, finalmente, las que puedan ser tiles como variables auxiliares,
en el sentido que se explica ms abajo.
Consideremos dos preguntas Pl y P2, ambas politmicas. Supongamos que
se ha seleccionado una MSA de tamao n de una poblacin con N unidades de
anlisis y que se quiere estimar Nij: el nmero de sujetos incluidos en la categora i respecto de Pl y en la categora j respecto de P2, donde Pl es una pregunta
que pertenece a B1 (bloque para el cual n sujetos han respondido) y donde P2 es
una pregunta de algn otro bloque a la cual responden slo m individuos, que
conforman a su vez una MSA de la muestra inicial.
La estimacin natural o directa de Nij se deriva de aplicar una simple regla
de tres:

OTRAS TCNICAS DE MUESTREO

229

N
N ij = mij
[9.5]
m
donde mij es el nmero de personas de la muestra que caen en la celda ij de la tabla de contingencia. La varianza de este estimador se estima mediante:
mij
N 2 m mij
[9.6]
(1
)
1
m N m
m
Una alternativa para realizar la estimacin consiste en hacer uso de los resultados de la muestra completa para la pregunta Pl, adems de los que arroja
la submuestra:
var ( N ij ) =

N mij
N ija =
ni .
m mi

[9.10]

donde ni. y m i. representan el nmero de personas que estn en la categora i-sima de la pregunta Pl para la muestra y para la submuestra respectivamente.
La varianza de este segundo estimador se estima mediante:
N2
n mij mij N 2 m ni. mij mij
Var ( N ija ) =
1

1
+
1
1
n N m
m m
n n mi . mi .
Veamos un ejemplo de este proceso.
Imaginemos que N = 400 y n = 120. A todos los sujetos se les aplica el bloque B1. Supongamos que B2, B3 y B4 se aplican respectivamente a submuestras
disjuntas de tamao m = 40. Consideremos dos preguntas dicotmicas: Pl (que
pertenece a Bl) y P2 (que pertenece a B2). Se desea estimar N12, el nmero de
sujetos que tienen el rasgo de inters en relacin con ambas interrogantes. Supongamos que para Pl la condicin es poseda por 60 de los 120 sujetos encuestados, que para P2 la respuesta positiva fue dada por 30 sujetos de la submuestra de 40, y que hay 20 individuos que respondieron afirmativamente a
ambas interrogantes.
De modo que, en resumen, tenemos que: n = 120, m = 40, N = 400, m12 = 20,
m1., = 30 y n1. = 50. Con estos datos se computa:
400
N 12 =
20 = 200
40
var ( N 12 ) =

(400) 2
40 20 20
1
1 = 450,0
40 400 40 40

y por otra parte


400 60
a
50 = 133,3
N 12
=
120 30

230

DISEO RAZONADO DE MUESTRAS

(400) 2 120 20 20
a
)=
var ( N 12
1
1 +
120 400 40 40
400

N12 =
20 = 200
40
(400) 2
40 6 20 20
1

1 = 413,0.
40 120 120 30 30
a
La situacin del ejemplo, donde N 12
tiene menor varianza (y es por ende un
a
estimador ms preciso) que N 12 , es tpica.

Bibliografa
Bennet S et al. A simplified general method for cluster-sample surveys of health in developing countries. World Health Statisties Quarterly 1991; 44: 98-106.
Boruch RF, Cecil JS. Assuring the confidentiality of social research data. Pennsylvania: University of Pennsylvania Press, 1979.
Brown GH, Harding FD. A comparison of methods of studying illicit drug usage. Arlinton: HUMRO Technical Report 73, 1973.
Chrandasekar C, Deming WE. On a method of estimating birth and death rates and the extent of registration. Journal of the American Statistical Association 1949; 44:101 -15.
Dalenius T, Vitale RA. A new randomized response design for estimating the mean of a
distribution. Report No. 78 of the Errors in Surveys Research Project. University of
Stockholm (mimeo), 1974.
Deming WE. Sample desing in business research. New York: Wiley and Sons, 1960.
Efron B. The jackknife, the bootstrap and other resampling plans. Filadelfia: SIAM,
1982.
Feller W. An Introduction to probabiliry theory and its applications, vol. II. Nueva York:
Wiley, 1950.
Henderson RH, Sundaresan T. Cluster sampling la assess inmunization coverage: a review of experence with a simplifield sampling method. Bulletin of the World Health
Organization 1982; 60:253-260.
Hook EB, Regal RR. Capture-recapture methods in epidemiology: methods and limitations. American Journal of Epidemiology 1995; 17: 243-264.
Kish L, Frankel M. Inference from complex samples. Journal of the statistical Society,
Series B, 1974; 36: 1-37.
Kish L. Sampling organizations and groups of unequal sizes. American Sociological Review 1965; 20:564-572.
Kish L. Sampling methods for agricultural surveys. FAO Statistical Development. Series
3, Roma, 1989
Krotki KJ, McDaniel SA. Three estimates of illegal abortion in Alberta, Canada: survey,
mail-back questionnaire and randomized response technique. Trabajo presentado en
la 40.a Sesin del International Statistical Institute, Varsovia, 1975.
Lamb CW, Stem EE. An empirical validation of the randomized response technique.
Journal of Marketing Research 1978; 15: 616-621.

OTRAS TCNICAS DE MUESTREO

231

Levy PS. Simple cluster sampling with multiplicity. Proceedings of the American Statistical Association: 963-966, 1977.
Massey JT, Ezzati TM, Folsom R. Survey methodology requirements to determine the feasibility of the national household seroprevalence survey. Quality Assessment Task
Force Report, NCHS, 1989.
Raghunathan TE, Grizzle JE. A Split Questionnaire Survey Design. Journal of the American Statistical Association 1995; 90: 54-63.
Rao JNK, Platek R, Sarndal CE, Singh MR Small Area Statistics: An International Symposium. Nueva York: Wiley-Interscience, 1986.
Rust F. Variance estimation for complex estimators in sample surveys. Journal of Official Statistics 1985; 1: 381-398.
Silva LC. La confidencialidad: Un desafo aleatorio. Revista Juventud Tcnica 1982;
776:33-35.
Silva LC. La tcnica de respuesta aleatorizada: un mtodo para la reduccin de conductas evasivas en las encuestas de poblacin. Revista Cubana de Administracin de Salud 1984; 10: 53-59.
Silva LC. Cultura estadstica e investigacin en el campo de la salud. Madrid: Daz de
Santos, 1997.
Sirken MG. Household surveys with multipicity. Journal of the American Statistical Association 1970; 65: 257-266.
Teutsch SM, Churchill RE. Principies and practice of public health surveillance. New
York: Oxford University Press, 1994.
Tracy PE, Fox JA. The validity of randomized response for sensitive measurements.
American Sociological Review 1981; 46: 187-200.
US Census Bureau. The Current Population Survey: Design and methodology. Technical Paper 40, 1978.
Wacholder S, Carroll RJ, Pee D, Gail MH. The Partial Questionnaire Design for CaseControl Studies. Statistics in Medicine 1994; 13: 623-634.
Warner S. Randomized response: a survey technique for eliminating evasive answer
bias. Journal of the American Statistical Association 1965; 60: 63-69.
Wells HB. Dual record systems for measurement of fertility change. Working Papers of
the East-West Population Institute, N 13, Honolulu East-West Population Institut,
1971.
Williams P, Ryan L. Design of Multiple Binary Outcome Studies With Intentionally
Missing Data. Biometrics 1996; 52.1498-1514.
Zdep SM, Rhodes IN. Making the randomized response technique, 1971.
Zeger LM, Thomas N. Efficient Matrix Sampling Instruments for Correlated Latent
Traits: Examples From the National Assessment of Educational Progress. Journal
of the American Statistical Association 1997; 92: 416-425.

10
Muestreo y tcnicas
estadsticas convencionales
Histricamente, el cuerpo terico clsico de la inferencia estadstica naci
de manera independiente al del muestreo para poblaciones finitas y se mantuvo
esencialmente separado de l durante largo tiempo. Aunque las inquietudes al
respecto vienen de antao, slo en los ltimos diez aos se han dado pasos productivos que puedan considerarse, adems, integradores. En este captulo se
agrupan diversos tpicos que, si bien son relativamente inconexos entre s, comparten el hecho de ubicarse en esas zonas comunes a ambas esferas concernientes al muestreo.

10.1. Tcnicas estadsticas aplicadas a muestras complejas


Como es bien conocido, virtualmente todos los desarrollos tericos conseguidos en materia de inferencia estadstica parten del supuesto de que la muestra
es simple aleatoria y procedente de una poblacin infinita (es decir, que los datos son independientes y provienen de una distribucin terica dada). Sin embargo, en la prctica diaria tanto en la clnica como en la epidemiolgica se
utilizan procedimientos concebidos bajo tal supuesto de independencia, aun
cuando la muestra provenga de diseos mustrales complejos como los explicados en captulos precedentes.
La serie de aportes tericos concretos destinados a ir cubriendo esa laguna
entre la teora y una parte no despreciable de la prctica, concierne a esfuerzos
para resolver problemas tales como, por poner un ejemplo, realizar adecuadamente un anlisis de regresin mltiple con datos procedentes de una muestra
por conglomerados bietpica.
Si bien el vnculo entre el muestreo en poblaciones finitas y las tcnicas inferenciales clsicas (tales como teora de estimacin, pruebas de hiptesis, mo-

234

DISEO RAZONADO DE MUESTRAS

delos lineales, mtodos no paramtricos, tcnicas de correlacin o anlisis multivariante), ha ganado en formalizacin, la situacin sigue dando motivos para el
debate y margen para el esclarecimiento.
El problema central radica, como sabemos, en que la conglomeracin (presente en la inmensa mayora de los diseos que se aplican realmente) casi siempre entraa cierto grado de dependencia mutua -mayor o menor, dependiendo de
la poblacin y de las variables- entre las observaciones. Consecuentemente, proceder como si se cumpliera la condicin de independencia suele producir anomalas tales como sesgos en las estimaciones e incrementos indebidos en la potencia de las pruebas de hiptesis.
Este asunto exhibe gran complejidad terica (vanse Kish y Frankel, 1974;
Lee, Forthofer y Lorimor, 1989; Skinner, Holt y Smith, 1989: Lethonen y Pahkinen, 1995). Las frmulas aproximadas para realizar las estimaciones de parmetros simples (medias y totales) y sus varianzas bajo diseos complejos pueden
deducirse de diversos modos; los que se han recogido en captulos precedentes
se han conseguido, bsicamente, a partir de desarrollos en series de Taylor. Las
frmulas para resolver problemas inferenciales ms complejos (por ejemplo,
estimacin de coeficientes de regresin o pruebas de independencia entre variables) parten de demandas matemticas tanto o ms avanzadas, de modo que su
solucin desborda ampliamente el nivel del presente material.
Ahora bien, es preciso recordar que, como se explic en el Captulo 1, los
problemas que se centran en la estimacin son terica y prcticamente diferentes
de aquellos cuyas preguntas demandan de la comparacin. Justamente, para los
primeros se han conseguido soluciones ms claras. Para aquellos centrados en la
comparacin, en cambio, el empleo de tcnicas complejas de muestreo como
las discutidas en el presente libro ha recibido poca atencin. Lo que suele hacerse en la prctica es llevar adelante el anlisis asumiendo que la muestra es
simple aleatoria y prescindiendo totalmente de que se hayan usado o no diseos
complejos. Debe sealarse, sin embargo, que tal realidad dista de ser grave; y no
lo es por la sencilla razn de que la inmensa mayora de los estudios se llevan
adelante con datos que no slo no proceden de muestras complejamente diseadas, sino que ni siquiera corresponden a muestras formales en sentido alguno.
Usualmente se trata de datos empricos que procuran representar poblaciones definidas por situaciones abstractas generales, tales como el conjunto de los
pacientes hipertensos tratados de cierto modo especificado y el de los tratados
de otra forma. La exigencia de trabajar con muestras obtenidas formalmente seria simplemente paralizante, tanto por las dificultades prcticas que supone conseguirlo como por el hecho de que algunas de estas poblaciones abstractas no
admiten, por definicin, la conformacin de un listado. Y aqu, como suele ocurrir tantas veces, es mejor colaborar con lo inevitable. (Vanse comentarios
adicionales en la Seccin 10.4 y una amplia discusin de este tema en la Seccin 12.3.)

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

235

10.2. Muestras transversales y causalidad


A continuacin y en este contexto se valora un problema de mxima importancia. No obstante su aparente simplicidad, es ciertamente insidioso, hasta el
punto de que puede provocar no pocos estropicios. Es sumamente frecuente la
situacin en que, aunque no se ha manejado un diseo concebido con vistas a la
comparacin, sino que se ha obtenido una muestra representativa de cierta poblacin (hyase empleado o no un mtodo formal de seleccin), se considera la
posibilidad de realizar cruzamientos para medir asociacin entre variables. Se
trata de una zona donde, en mi opinin, reina apreciable confusin metodolgica, la cual merece, por tanto, consideracin detenida.

10.2.1. Premisa de precedencia temporal


En 1965, Sir Austin Bradford Hill pronuncia su famoso y trascendente discurso ante la Seccin de Medicina Ocupacional de la Royal Society of Medicine.
Los criterios all expuestos aportan bases tericas universalmente reconocidas y
por su utilidad para el examen de las relaciones de causalidad en medicina
y, especialmente, en epidemiologa. Hill (1992) enumera nueve pautas que han
de considerarse en estudios epidemiolgicos y cuya corroboracin incrementara
la conviccin de que cierta relacin observada es de naturaleza causal.
Se parte de que se ha observado una asociacin claramente definida entre dos
fenmenos dinmicos, representados por medio de sendas variables X e Y, y
que se ha descartado la posibilidad de que dicha asociacin sea exclusivamente
atribuible al azar'. La asociacin registrada entre una variable X y otra Y puede
deberse, adems de al azar, a la presencia de errores sistemticos en la medicin (sesgos) o a la distorsin introducida por los llamados factores de confusin2.
Los nueve rasgos de tal asociacin que este autor identifica como elementos
que aumentan su valor en tanto indicio de causalidad, son: intensidad, consistencia, especificidad, gradiente dosis-respuesta, coherencia, fundamento experimental, analoga y adecuada secuencia temporal. El papel de las primeras
ocho pautas es, precisamente, consolidar la idea de que no resulta aceptable
ninguna de aquellas tres posibles explicaciones (azar, sesgos, confusin). En tal
caso slo quedan, formalmente, dos alternativas: X es causa de Y, o Y es causa de
X. Para poder inclinarnos por una de ellas, hay que atender a la precedencia tem1

se es exacta y nicamente el papel que desempean las pruebas de hiptesis: si la asociacin es significativamente diferente de 0, entonces puede afirmarse con escaso margen de error que la relacin entre X e Y
no se ha observado por mera casualidad.
2
Variables que se relacionan tanto con X como con Y y cumplen la condicin de no ser un estadio intermedio
en la secuencia causal entre la exposicin y el efecto.

236

DISEO RAZONADO DE MUESTRAS

poral que guarden los datos, la ltima de las premisas de Hill. Nos concentraremos entonces en ella, la nica que nada tiene que ver con aspectos tericos. Es la
ms obvia, la menos discutible ( y a que es condicin sine qua non) y. quiz por
eso mismo, lamentablemente, una de las menos contempladas.
Ms formalmente, se trata de la pauta basada en que la accin de un agente
causal siempre precede al efecto: Para que una modificacin en cierta condicin X pueda considerarse responsable de los cambios que se producen en otra
condicin yV, es imprescindible que .X haya actuado antes de que Y se haya modificado. Toda hiptesis de causalidad involucra a un efecto y a una presunta
causa: lo que plantea dicho postulado (y esto es lo relevante) es que para considerar empricamente avalado el hecho de que la supuesta causa produce tal efecto, los acontecimientos han de haberse observado de suerte que haya certeza
acerca de que la precedencia temporal con que se generaron los datos sea compatible con la afirmacin causal que se valora.
Subrayo nuevamente que en este caso no nos referimos a una condicin cuyo cumplimiento aumente la conviccin de que la hiptesis sea cierta: es mucho ms que eso: se trata de una premisa metodolgicamente imprescindible. Tal
condicin, a la que denominaremos premisa de precedencia temporal (PPT), est directamente vinculada al diseo del estudio, ya que es ste el que puede (y
debe garantizar la validez de aqulla.
Los estudios prospectivos, en los cuales, como su nombre indica, los hechos
supuestamente se miden o registran en el mismo orden temporal en que se producen, se prestan a menos suspicacias en cuanto a que se haya cumplido o no la
PPT. De hecho, en el caso particular de los estudios experimentales no existe
siquiera este peligro: en los observacionales de cohorte, dado que la observacin
comienza cuando aun no se han producido los desenlaces que se estn considerando, tal riesgo esta casi siempre conjurado por el propio diseo.
Los estudios transversales y retrospectivos, en los cuales slo puede intentarse la reconstruccin histrica de los acontecimientos, son, en cambio, altamente vulnerables al no cumplimiento de la PPT. En este tipo de estudios, con
ms frecuencia que la deseada (Silva y Benavides, 1999), se soslaya toda consideracin sobre esta premisa, o directamente se acta sin reparar en que no ha
sido satisfecha. Aunque existen trabajos que advierten la necesidad de eludir
esta falacia (vanse, por ejemplo, Susser, 1973, y Gray y Krainer, 1988), se trata de un error frecuente, poco enfatizado, escasamente ilustrado, que asume
diferentes formas, y cuyos efectos han sido poco estudiados.

El asunto es suficientemente insidioso como para que, incluso en tal caso, pueda producirse, por excepcin,
el problema (vase Silva, 1997).

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

237

10.2.2. Computar o no computar asociaciones en estudios transversales?


La problemtica tratada en la seccin precedente desde la perspectiva que nos
interesa, nos lleva a la constatacin de que ante la tentacin natural de calcular
asociaciones entre variables, en el caso de los estudios considerados transversales, coexisten tres puntos de vista:
a) Hacer el clculo en cuestin sin el menor reparo.
b) Negar taxativa y terminantemente el derecho a realizar cruzamientos (y
por tanto a computar indicadores que miden asociacin, tales como riesgos relativos u odds ratios) con el argumento de que. en un estudio transversal, tal maniobra es ilegtima.
c) Admitir que si bien tales estudios no permiten sacar conclusiones causales,
consienten al menos la medicin de asociaciones como un recurso que se
emplea sin ms pretensiones que complementar o enriquecer la descripcin.
La primera opcin es claramente errnea y es responsable de la mayor cantidad de los errores. En cuanto a las dos ltimas, tal y como estn formuladas, cabe decir que tanto una como otra originan confusin; ambos principios son por
razones diferentes, cuestionables. Para fundamentarlo, consideremos la situacin
detenidamente.
En el primero de esos dos casos, la prohibicin que suele esgrimirse es la
siguiente: siendo el estudio transversal, cmo puede soslayarse un principio como el de la PPT (vase Seccin 10.2.1), que tal tipo de estudios es intrnsecamente incapaz de garantizar?
Procede dejar sentado, en primer lugar, que si bien la descripcin no constituye un procedimiento explicativo per se, es, sin embargo, una forma legtima de
investigacin biomdica y constituye un pilar bsico de cualquier otra expresin.
No en balde, Greenland (1990) llega a afirmar que la primera tarea del epidemilogo es descriptiva. Pero ese argumento es netamente irrelevante a los efectos que nos ocupan
Lo crucial ahora es distinguir ntidamente entre dos conceptos que suelen
manejarse como si fueran idnticos aunque distan de serlo: investigacin descriptiva e investigacin transversal. Mientras la primera clasificacin alude al
propsito del estudio, la segunda concierne al marco metodolgico en que se verifica. La confusin se ha originado en la ambivalencia del adjetivo transversal, el cual tiene dos acepciones radicalmente diferentes: por una parte, sirve
para indicar que los datos se toman temporalmente en un nico corte indagatorio (por oposicin a aquellos en que los datos se van recopilando en la medida
que acaecen los hechos de los que proceden): y por otra, para aludir al hecho de
que la informacin concierne a lo que est ocurriendo ahora (lo que rige en el
momento en que se verifica el interrogatorio o la medicin).

238

DISEO RAZONADO DE MUESTRAS

Veremos ms abajo que si lo que se ha hecho es estrictamente esto ltimo, la


estimacin de medidas de asociacin nunca tiene sentido claro: cuando el estudio es transversal en el sentido de la primera acepcin, sin embargo, s puede
tenerlo.
Para fijar ideas imaginemos que se valora el posible efecto del consumo de
golosinas sobre la obesidad infantil; o sea, que se quiere cuantificar en qu grado ese consumo constituye un factor de riesgo (concepto que, dicho sea de paso,
en su sentido epidemiolgico ha dado lugar a una vasta produccin terica y
prctica, pero tambin a no pocas confusiones y falacias4; vanse Silva. 1997b
y Garca. 1999).
Supongamos que se realiza un estudio con ese fin en 1999 y que se interroga
a todos los nios de una muestra (tanto a quienes en el momento de la encuesta
padecen de obesidad como a los que en dicho momento estn libres de la dolencia); y supongamos que se recogen ciertos datos, tales como si en la actualidad
consumen regularmente golosinas, o si practican ejercicios. Estos datos pueden
ser tiles para estimar la prevalencia de obesidad o el monto en que se consumen
golosinas, pero no permiten evaluar el posible efecto causal, por ejemplo, del
consumo de golosinas sobre el desarrollo de la enfermedad, pues lo que realmente interesara conocer no ha sido registrado. Si el sujeto las consume en estos momentos carece de todo inters; lo que verdaderamente importa es si lo
haca o no antes de cierto momento para el cual se sabe (o se puede legtimamente suponer) que ninguno de los interrogados tena la enfermedad. Si durante
la entrevista se pregunta a obesos y a no obesos si coman regularmente chocolates en 1994 (cinco aos antes) y se eliminan del anlisis a aquellos individuos
que eran obesos en aquella poca, entonces s podra hacerse dicha valoracin,
independientemente de que el estudio sea transversal. De hecho, a los efectos
que interesan, no lo es.
Tal inadvertencia, llamativamente frecuente, es sumamente insidiosa. Cuando se desdea este detalle, se pierde la lgica del estudio y se arruina cualquier
interpretacin potencial de sus resultados. Ello puede ser catastrfico, aunque
muchos investigadores no lo tomen en cuenta, o lo consideren como un problema menor que se resuelve consignando en la discusin que fue una limitacin del estudio.
Un ejemplo como el que sigue ilustra situaciones frecuentes de este tipo.
Consideremos las variables insatisfaccin laboral y estrs, y contemplemos el
planteamiento de una pregunta tal como si hay asociacin entre ambas condiciones. Si lo que se hace es determinar la situacin vigente para ambas cuestiones,

Pidrola et al. (1990) definen un factor de riesgo como aquel factor endgeno o exgeno, que puede ser
controlado, precede al comienzo de la enfermedad, est asociado a un incremento de la probabilidad de incidencia de una enfermedad y tiene responsabilidad en su produccin.

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

239

entonces la asociacin que se mida tendr un sentido inexorablemente borroso.


Obviamente, malas condiciones de trabajo pueden contribuir al deterioro de
la estabilidad emocional y traducirse en altos niveles de estrs. Pero tambin
ocurrir que algunos sujetos estresados experimentarn insatisfaccin laboral
incluso en un entorno de trabajo favorable como consecuencia exclusiva de su
estado emocional. Cada factor puede ser causa contribuyente o retroalimentadora del otro, de modo que una pregunta neutra sobre la existencia de
asociacin suele no conducir a ninguna parte.
El acto de investigacin podra servir para examinar, o bien el efecto del primer factor sobre el segundo, o bien el del segundo sobre el primero (e incluso,
ocasionalmente, ambos efectos), pero ello exige un diseo que contemple la observacin de los hechos de manera que el orden temporal en que ellos ocurren
quede debidamente registrado, de suerte que la PPT pueda ser debidamente considerada. Cuando el diseo no es otra cosa que la seleccin de una muestra
representativa, entonces o bien no se dispone de informacin temporal alguna
(y por tanto el anlisis no procede), o bien la informacin necesaria acerca del
orden en que ocurrieron los hechos puede establecerse gracias al modo en que se
formulan las preguntas, en cuyo caso s pudiera ser adecuado.
El tercer posicionamiento arriba consignado consista en computar medidas
de asociacin, pero aclarando que se hace sin pretensiones de arrojar luz en materia de causalidad.
Esta alternativa para dar solucin al problema est ciertamente preada de
ingenuidad: consiste en curarse en salud mediante el subterfugio de comunicar
que slo se quiere cuantificar la asociacin entre X e Y, como si las palabras
pudieran dar un salvaconducto, y como si medir la asociacin pudiera tener un
inters intrnseco (lo cual es absurdo, puesto que no solo ste, sino ningn procedimiento puede ser un fin en s mismo); como si tal cuantificacin, en fin, tuviera algn sentido cuando no se inserta en el contexto de una conjetura causal.
A nadie se le ocurrira investigar, por ejemplo, si hay asociacin entre tiempo
de estada hospitalaria de un sujeto ingresado y el color de la vivienda de dicho
paciente. A qu se debe? Simplemente, a que siempre que se mide una
asociacin es porque se tiene una sospecha fundamentada, aunque sea subconsciente, de que tal medicin pudiera brindar una prueba de causalidad o, por lo
menos, ser indicio de ella. El mero acto de cuantificacin de una asociacin
(sea a travs de coeficientes de correlacin, diferencias de porcentajes, odds ratios o de cualquier otro medio) entraa, implcita o explcitamente, un afn explicativo puesto que dimana, necesariamente, de una sospecha razonable en esa
direccin.
Est muy extendido el temor a admitir explcita y claramente que se quiere
probar que X influye en Y o evaluar el grado en que X puede considerarse
causa de Y. Parcialmente, ello se debe a la dificultad que supone la tarea de evaluar causalidad, a la multitud de sesgos que se pueden cometer, as como al te-

240

DISEO RAZONADO DE MUESTRAS

mor que genera el compromiso que siempre se contrae cuando se anuncia que
lo que se busca es una explicacin. De ah que, aun cuando se proceda a calcular
medidas de asociacin, algunos investigadores se apresuren a dejar claro que no
tienen intenciones explicativas. Lo que pasa es que tal declaracin es en el fondo falsa pues, si no las tuvieran carecera de todo sentido llevar adelante tal
maniobra computacional. El asunto no se resuelve, por tanto, declarando una u
otra intencin, sino asegurndose de que el cmputo es interpretable siempre que
se haga.
En sntesis:
a) Si se generan cruzamientos o se calculan medidas, de asociacin, es necesariamente porque se piensa en trminos causales, independientemente
de que se procure enmascararlo proclamando otra cosa.
b) Si el estudio es epidemiolgicamente transversal (se registra el status
prevaleciente al margen de la temporalidad), entonces realizar esta accin es un acto, cuando menos, estril, y con frecuencia pernicioso.

10.2.3. Una ilustracin detallada


Con el fin de consolidar las ideas precedentes, consideremos ms detalladamente el mismo ejemplo ya esbozado. Supongamos que en el ao 2000 se ha
seleccionado una muestra de nios de 10 aos, representativa de una comunidad
donde la prevalencia de obesidad en esa edad es, aproximadamente, del 10%;
admitamos que la muestra contiene 450 nios normales y 50 obesos, y supongamos que se formulan dos preguntas de naturaleza dicotmica (la respuesta
es S o NO) a las madres de estos 500 nios. A saber:
1. Come su hijo golosinas regularmente?
2. Era obeso el padre del nio en el momento del nacimiento?

Tabla 10.1. Distribucin de la muestra segn se trate o no de obesos


y segn consumo de golosinas (ao 2000)
Nio obeso

Consume
golosinas

No

Total

10

400

410

No

40

50

90

Total

50

450

500

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

241

Al procesar los resultados que se derivan de la primera pregunta, se obtiene la


Tabla l0.1. Cualquier examen que se haga de la tabla conducira en principio a
la conclusin de que la asociacin entre obesidad y consumo es negativa; es decir, tiende a ocurrir que quienes no consumen son obesos y viceversa. En efecto,
el porcentaje de obesos entre consumidores (2,4%) es casi 20 veces menor que
entre no consumidores (44,4%). El odds ratio es muchsimo menor que la unidad:

10.50
= 0,03
40.400

Pero el asunto es que ninguna de estas valoraciones permite arribar a conclusin alguna.
La clave del problema radica en que la pregunta no tiene en cuenta el orden en
que aparecieron los acontecimientos que se registran: de hecho, es imposible establecerlo. Todas las alternativas son posibles (obesos que consuman golosinas
antes de serlo, no obesos que dejaron de serlo cuando abandonaron el consumo,
obesos que dejaron de consumir golosinas precisamente por estar enfermos, etc.).
Lo que no es posible es determinar cul de esas alternativas correspondi a cada
sujeto de la muestra. Imaginemos que tenemos una mquina del tiempo y que retrocedemos 6 aos. Descubrimos que estos 500 nios (todos de cuatro aos) eran
entonces normopesos, pero que 100 de ellos eran consumidores regulares de golosinas en tanto que los restantes 400 no lo eran. Con el paso del tiempo, digamos,
a los dos aos, 40 de los primeros desarrollan obesidad, al igual que 10 de los no
consumidores, sin que se modificara esencialmente el patrn de consumo.
En ese punto un corte transversal hubiera producido la Tabla 10.2
Las tasas de incidencia son, entonces, de 40,0% y 2,5% respectivamente,
indicio de una intensa asociacin positiva.
Supongamos que en esa etapa hay una gran ofensiva publicitaria a favor del
consumo de golosinas entre escolares, con la que se consigue que 340 de los 390
que no consuman ni eran obesos pasen a consumir; paralelamente, 30 de los 40
obesos consumidores abandonan el hbito por prescripcin mdica de modo que
Tabla 10.2. Distribucin de la muestra segn se trate o no de obesos
y segn consumo de golosinas (ao 2000)
Nio obeso

Consume golosinas

No

Total

40

60

100

No

10

390

400

Total

50

450

500

242

DISEO RAZONADO DE MUESTRAS

Tabla 10.3. Distribucin de la muestra segn fuese o no obeso el padre


en el momento del nacimiento del nio
Nio obeso
S
Consume golosinas

No

Total

30

50

80

No

20

400

420

Total

50

450

500

se llega a la situacin actual (Tabla 10.1). La falacia implcita en el hecho de no


reparar en la temporalidad cuando se analiza dicha Tabla 10.1 es obvia.
El problema es tpico de las situaciones en las que aparecen involucradas las
enfermedades crnicas: el conocimiento de lo que ocurri antes de su comienzo
puede ser muy difcil (o imposible), debido a la dificultad (o imposibilidad) para
identificar el momento en que comenz el trastorno.
Supongamos ahora que en relacin con la obesidad del padre se obtienen los
resultados recogidos en la Tabla 10.3.
La Tabla 10.3 permite apreciar una intensa asociacin positiva entre ambas
condiciones morbosas (padece obesidad el 38% de los nios de padres que eran
obesos, y slo el 5% de aquellos cuyos padres no lo eran). En este caso, sin embargo, a partir de los resultados, s puede prosperarse cualitativa y conceptualmente. Que fuera o no obeso es una condicin del padre anterior a la situacin
que pueda tener su hijo ahora, de modo que la asociacin tiene, al menos en
principio5, una interpretacin razonable en trminos causales.

10.2.4. Consideraciones finales


Como resumen de toda la discusin anterior, cabe concluir lo siguiente:
Cuando se ha seleccionado una muestra de cierta poblacin y se han indagado
ciertas caractersticas de sus elementos, la interpretacin de los cruzamientos
entre variables se supedita a que se haya contemplado la temporalidad de los
datos registrados ya sea en el diseo del estudio o en el de las preguntas. No
hay reglas generales para establecer en qu caso estamos. Tales cruzamientos
pueden ser fructuosos o pueden estar condenados a no tener sentido alguno, pero ello nunca depender exclusivamente de etiquetas tales como transversal,
longitudinal que se le apliquen a los estudios.
5

Naturalmente, no me detengo en el examen del efecto de posibles factores confusores ni en otras consideraciones metodolgicamente imprescindibles para el examen de relaciones causales, adems de las que nos ocupan.

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

243

10.3. Tamao de muestra en estudios clnicos


y de epidemiologa analtica
Una necesidad harto frecuente entre investigadores de la clnica y la epidemiologa consiste en la determinacin de los tamaos mustrales necesarios para los grupos que sern objeto de comparacin. sta es una demanda formal de
los financiadores, y tambin una obvia necesidad prctica de los autores. Hay
dos alternativas fundamentales: resolverlo a travs de frmulas matemticas, o
tomar la decisin por medios ms informales. En este captulo nos circunscribiremos a exponer e ilustrar el caso en que se opta por un procedimiento matemtico formal.
Entre muchas variantes, consideremos un ejemplo tpico: se quiere discutir la
hiptesis que afirma que dos porcentajes P1 y P2 son iguales, con la hiptesis
alternativa de que son diferentes. Imaginemos que se trata de un ensayo clnico
en que P1 es la tasa de recuperacin de pacientes que reciben un tratamiento convencional, y P2 la de los que reciben uno experimental.
El problema consiste en determinar el tamao de muestra mnimo n con que
debe conformarse cada grupo (el mismo para ambos), de modo que la prueba estadstica con que se va a valorar la hiptesis sea capaz de detectar como significativa (no atribuible al azar) una diferencia mnima prefijada entre P1 y P2. La
frmula correspondiente6 es la siguiente:
Z1 / 2 2 P * (1 P*) + Z1 P1 (1 P1 ) + P2 (1 P2 )

n=
2
( P1 P2 )

[10.1]

donde y representan las probabilidades mximas admisibles de cometer, respectivamente, los errores de tipo I (rechazar indebidamente la hiptesis nula) y
P +P
de tipo II (no rechazarla a pesar de ser falsa), y donde P* = 1 2 .
2
En esta situacin el investigador ha de prefijar (por ejemplo, puede elegirse el sacralizado = 0,05) y (se toma con frecuencia = 0,2). Supongamos
que P1 es conocido en la prctica clnica y que asciende a 60% (P1 = 0,6), as como que la diferencia se considerar clnicamente relevante si la tasa de recuperacin se eleva, desde ese supuesto 60%, por lo menos, hasta 70% (P2 = 0,7).
En tal caso la aplicacin de [10.1] arrojara n 745.
Lo que se ha expuesto aqu es slo un ejemplo que ilustra el modo en que tericamente habra que conducirse; no nos interesa reproducir aqu un recetario, no
slo por el resquemor que nos producen las recetas (vase Seccin 12.3), sino
6

Debo advertir que sta es una de las mltiples situaciones posibles (aunque, tal vez. tambin una de las ms
frecuentes). Incluso para esta misma situacin, sin embargo, existen otros enfoques.

244

DISEO RAZONADO DE MUESTRAS

porque para ello ya tenemos el libro de Lemeshow, Hosmer, Klar y Lwanga


(1990), el cual incluye adems un conjunto de tablas que relevaran al usuario de
aplicar por s mismos las frmulas. Adicionalmente, existen diversos programas
computacionales que ofrecen solucin a ste y a problemas similares (vase Seccin 11.1), de modo que tales tablas son, incluso, prcticamente innecesarias.

10.4. Seleccin de casos y controles


Los estudios de casos y controles constituyen un recurso metodolgico de notable prominencia en la investigacin biomdica contempornea; de ah la conveniencia de comentar algunos aspectos relevantes en relacin con las muestras
en que se basan.
La seleccin de la muestra en estos estudios es a menudo problemtica y
presenta rasgos y exigencias especficas que han de considerarse con rigor para
dar validez al estudio.
La definicin de caso es particularmente importante para tomar decisiones en
materia de seleccin, tanto para elegir los propios casos como para definir y seleccionar los controles. Resulta crucial delimitar muy cuidadosamente qu es
un caso; slo entonces procede identificarlo operacionalmente con vistas a la seleccin real.
Lasky y Stolley (1994) ponen como ejemplo la definicin conceptual del
VIH (una persona para la cual, en caso de que se le aplicara la prueba del VIH,
se obtendra un resultado positivo), fre n te a una definicin operacional (personas a las cuales, habindoseles practicado la prueba, se les declar VIH positivas). Aquellos factores que influyan en la decisin de realizar la prueba, as como sus caractersticas intrnsecas ( s e n s i b i l i d a d y especificidad), son los
elementos que a la postre determinan quin se convierte operacionalmente en un
caso positivo. Segn estos autores, mediante la comparacin del grupo definido
conceptualmente con el definido operacionalmente, los investigadores sern capaces de enumerar posibles sesgos de seleccin que pueden afectar el grupo final de casos. Vale decir, el ejercicio de pensar en la posible brecha existente entre las definiciones conceptual y operacional ayuda al investigador a reconocer
sesgos potenciales y a idear procedimientos para minimizarlos, o por lo menos
estimarlos.
Resulta crucial que se acte en funcin de que todos los casos verdaderos tengan la misma probabilidad de quedar incluidos en el estudio, pero tambin de
que entre los casos no se introduzcan sujetos que no lo son. Tpicamente, sin embargo, el requerimiento de equiprobabilidad no se lleva adelante de manera formal (en el sentido de aplicar el azar a un listado de candidatos). Los casos pudieran ser, por ejemplo, todos los nios ingresados con leucemia durante cierto
nmero de aos en los hospitales de una regin; lo que se requiere es que tal

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

245

muestra sea representativa del conjunto genrico de nios leucmicos y el


esfuerzo debe orientarse en direccin a evitar que determinados nios tengan,
sea por razones administrativas, criterios de ingreso u otras, menor oportunidad
que otros de ser incluidos. De modo que en una situacin como la mencionada,
lo que est en juego es si ese conjunto de hospitales y los nios que ingresan en
ellos aportan una muestra que pueda considerarse representativa.
El tema de la seleccin de controles ha generado una enconada discusin en
la literatura epidemiolgica (vanse Feinstein y Horwitz, 1983, Pearce y Checkoway, 1988 y Wacholder, McLaughlin, Silverman et al., 1992). Esta eleccin se
subordina en buena medida a la definicin de caso, ya que los controles deben
provenir de la misma poblacin que estaba en riesgo de padecer la enfermedad.
El principio es intuitivamente aceptable. Los nios, por poner un ejemplo obvio,
son inaceptables como controles en un estudio sobre el efecto del hbito de fumar que procura evaluar la demencia senil, puesto que si bien ellos cumplen
con la condicin central (no tener demencia senil), tampoco estn en riesgo de
tener la condicin presuntamente generadora de la enfermedad (hbito de fumar). En la mayora de los casos, sin embargo, este debate en mucho ms sutil.
Cuando los casos provienen de un centro asistencial que los ha detectado como
tales, a veces ocurre que es precisamente la presencia del factor cuyo efecto se
quiere estudiar la responsable de que el sujeto haya acudido, y por ende los portadores del factor tienen a priori ms oportunidad de convertirse en casos.
Entre las fuentes ms comunes para conseguir controles estn los pacientes
de hospitales o clnicas, las listas de certificados de defuncin, los registros de
morbilidad, amigos, familiares o vecinos de los casos, y la poblacin general.
En lo que parece haber claro consenso es en cuanto a que la teora formal de diseos mustrales tiene escasa incidencia en este tipo de estudios.
Otro aspecto de inters se relaciona con los tamaos mustrales; en esa materia,
el contenido de la Seccin 10.3 es esencialmente vlido aqu. Una particularidad
radica en tomar ms de un control por caso. Gail, Williams, Byar et al. (1976) demuestran que, cuando el nmero de casos es limitado, un aumento en el grupo de
controles (varios controles por cada caso) aumentar la potencia del estudio.
El aumento en la razn de controles por caso produce ganancias en este sentido hasta que se llega a una razn de 4 por 1; a partir de este punto, el incremento de la potencia es casi siempre demasiado pequeo para compensar los
gastos que supone. En cualquier caso, aumentar la razn de controles por caso
parece ser til y factible slo cuando hay pocos casos disponibles.

10.5. Anlisis contextual


Los estudios ecolgicos son aquellos en que las mediciones, tanto de factores
condicionantes como de daos, se verifican a nivel de grupos poblacionales y no

246

DISEO RAZONADO DE MUESTRAS

al de los sujetos que portan dichos factores o sufren los daos (Susser, 1998). Esta modalidad ha sido crecientemente desdeada y excluida de la investigacin
epidemiolgica contempornea. Como dato elocuente, represe en que, por poner un ejemplo, a lo largo del bienio 1996-1997 el American Journal of Epidemiology public 999 artculos originales: slo 9 de ellos eran de este tipo. Ello se
debe en parte al temor que despierta la falacia ecolgica, descrita por primera
vez hace medio siglo por Robinson (1950): el hecho de que una asociacin que
se produce entre grupos de sujetos pudiera no existir, o incluso tener signo
opuesto cuando las mismas variables se miden al nivel de los individuos (vase
una ilustracin en Silva, 1997a). El riesgo de incurrir en tal falacia es real pero,
por qu dar por sentado que, en el fondo, siempre se quiere elucidar el problema a nivel individual? Esta premisa ha tomado una dimensin tal en nuestra
mente, que ha conseguido obstaculizar que centremos la discusin, precisamente, en un marco social.
Si en un estudio, por ejemplo, se demostrara que la presencia de nios con bajo peso al nacer es ms frecuente en las comunidades con altos ndices de
desempleo que en las que lo tienen bajo, entonces la afirmacin no puede trasladarse automticamente al nivel de los sujetos (es decir, tal vez no pueda
concluirse que los hijos de los desempleados nazcan con la condicin de bajo
peso con mayor frecuencia que los hijos de los que tienen un puesto de trabajo
regular), so pena de incurrir en la susodicha falacia ecolgica. Pero lo importante es que (al vez no haya ningn afn en hacer ese traslado; quizs el inters
est directamente orientado a evaluar el efecto de ese indicador sobre todos los
miembros de la comunidad, tengan o no vinculacin laboral remunerada. Consideraciones similares pueden hacerse sobre los efectos de variables ecolgicas tales como regulaciones jurdicas, formas de organizacin laboral, valores
religiosos predominantes o grado de desigualdad.
Pero el desdn hacia los estudios ecolgicos tambin se debe, en buena medida, a prejuicios injustificados (Schwartz, 1984); tanto es as que estos estudios han llegado a conceptualizarse slo como sucedneos como un mal menor de aquellos en que las unidades de anlisis son los individuos, a pesar de
que, como recuerda Susser (1994), constituyen una herramienta de la salud pblica y la epidemiologa, con su propio peso especfico, y con cuyo concurso se
ha producido conocimiento enteramente vigente aun despus de muchos aos.
Los rasgos contextales pueden y suelen tener impactos globales sobre todos los sujetos abarcados por ellos. Esto es as no slo en el sentido en que operan condiciones intrnsecamente ecolgicas que, como la contaminacin
ambiental, no distinguen entre unos y otros individuos y los afecta a todos en una
u otra medida. Tambin ocurre con rasgos globales conformados a partir de caractersticas de los sujetos, tales como el porcentaje de analfabetos en una comunidad, los cuales frecuentemente influyen sobre todos los individuos, analfabetos o no.

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

247

Uno de los ms arraigados y perniciosos prejuicios se concentra en el postulado de que las condiciones grupales, asociadas a variables medidas a nivel de
grupos, no representan agentes causales de enfermedad. Esta corriente de pensamiento cientfico, coherente con la insistente convocatoria actual al individualismo en muchas esferas de la vida (que en el campo de la salud se concreta en la
prctica de culpabilizar a la vctima, trasladar los costos operativos de la asistencia a quien la recibe, y promover la privatizacin de los servicios), tiene un
importante componente ideolgico.
Se ha perdido de vista incluso que cuando se mide un rasgo individual muchas veces se est midiendo algo distinto que cuando se trata de ese mismo rasgo pero mirado a nivel colectivo. Por ejemplo, el concepto de pobreza referido
a un sujeto no es el mismo que el que corresponde a la pobreza de la comunidad en la que l vive; tanto es as que quien resida en una comunidad empobrecida, por ejemplo, se ver afectado por todos los condicionamientos globales derivados de esa pobreza (tales como violencia o falta de higiene comunal),
independientemente de que su personal nivel econmico sea ms o sea menos
elevado.
Hasta la expresin variable medida a nivel de grupo es tendenciosa, pues
parece descartar a priori el posible inters hacia aquellas variables que slo
pueden medirse a ese nivel por ser intrnsecamente concernientes a una agrupacin (Diez, 1998). Sin embargo, existen importantes constructos que no tienen
sentido a nivel individual, sino slo cuando se trata de un colectivo. Por poner
un ejemplo, cualquier mdico de familia sabe que un individuo que vive en
una familia desestructurada, en cuyo seno se verifican tensiones graves, suele no ser un individuo sano en el sentido amplio del concepto, incluso aunque
entendiramos la enfermedad slo como mera desviacin de la fisiologa normal del sujeto. El ejemplo ilustra el posible papel etiolgico de un rasgo grupal,
as como que tal rasgo (desestructuracin familiar, en este caso) slo tiene
sentido para el colectivo y nunca para sus integrantes como entes aislados.
Quizs la ms emblemtica declaracin que refleja hasta dnde ha llegado la
esterilizante contraccin de la epidemiologa al nivel individual de anlisis sea la
que hizo Rothman (1986) cuando escribi que la clase social no se relaciona
causalmente con ninguna o casi ninguna enfermedad. Para dar slo un elemento persuasivo en direccin contraria, bastara detenerse en algunos de los
numerosos trabajos que ponen en evidencia la notable persistencia a lo largo de
decenas de aos de una marcada diferenciacin de la esperanza de vida y de
otros indicadores de salud entre estratos socioeconmicos (vase Syme, 1989).
En sntesis, puesto que la bsqueda de factores etiolgicos ubicados al nivel
del individuo ha resultado ser tan poco fructuosa (Silva, 1997b), y dado que no
quedan dudas de que existen factores colectivos cuyo valor etiolgico puede ser
crucial, eludir el examen de los problemas en su dimensin socio-epidemiolgica resulta absurdo. Ha de reconocerse que estas nuevas lneas de pensa-

248

DISEO RAZONADO DE MUESTRAS

miento an esperan por aportes operativos ms concretos, pero ya se aprecian resultados interesantes en esta direccin (vanse, por ejemplo, Evans, Morris y
Marmor, 1994 y Wilkinson, 1996).
Tras estas consideraciones tericas, lo que importa destacar es que las tcnicas mustrales clsicas se concentran en la seleccin de sujetos y no de grupos
(salvo, como paso intermedio, para seleccionar los sujetos de su seno): pero, de
hecho, tales procedimientos se pueden aplicar anlogamente para diversos niveles de agregados. Los mtodos estadsticos integradores de variables medidas
a diversos niveles de agregacin (multilevel analysis y modelos jerrquicos) parten del supuesto de MSA y an reclaman un marco terico slido para el caso de
los diseos mustrales formales.

10.6. Asignacin aleatoria


Como es bien conocido, la metodologa de los ensayos clnicos controlados
reposa sobre dos pilares fundamentales: el enmascaramiento de los tratamientos y la asignacin aleatoria de los sujetos a las distintas alternativas teraputicas consideradas.
El primero de estos recursos no es de ndole estadstica, sino estructural: concierne al hecho de que los pacientes involucrados no conozcan cul de los tratamientos en juego es el que le ha correspondido (Hulley y Cummings, 1988).
Cuando esto se consigue, se dice que el estudio es ciego. Variantes ms sofisticadas involucran otros niveles de enmascaramiento: si quienes evalan los resultados tambin ignoran el tratamiento que corresponde a cada paciente, el estudio es doble ciego: y si otro tanto ocurre, adems, con los que administran el
tratamiento (los propios terapeutas), se dice que es triple ciego.
Sin embargo, lo que se relaciona directamente con el muestreo es la tarea de
asignar los sujetos a los grupos experimentales. Supongamos que se planifica un
ensayo clnico para evaluar la eficacia de la homeopata en la curacin de cierto
tipo de conjuntivitis, y que se compararan tres tratamientos: remedio homeoptico (A), agua destilada (B) y un colirio convencional (C). Supongamos que se
ha decidido aplicar cada uno de ellos a 50 pacientes. Asumamos que es entonces necesario distribuir aleatoriamente a cada uno de los prximos 150 portadores de esa forma de conjuntivitis que acudan a la consulta a uno de los tres
tratamientos, y hacerlo de modo que queden 50 en cada cual.
Aplicar una asignacin aleatoria a los tres grupos en las condiciones mencionadas no es otra cosa que lo siguiente: primero, sacar una muestra simple
aleatoria de tamao 50 de dicho listado y asignarle el tratamiento A a sus integrantes: luego obtener otra muestra simple aleatoria de 50 entre los 100 que
restan y asignar el tratamiento B a stos, y finalmente ubicar en el C a los 50
pacientes no elegidos hasta entonces.

MUESTREO Y TCNICAS ESTADSTICAS CONVENCIONALES

249

El procedimiento es algo engorroso, aun contando con un programa informtico que realice una seleccin simple aleatoria dentro de un listado. En efecto, despus de seleccionar el primer grupo de 50 habra que renumerar del 1 al
100 a los sujetos no elegidos, y aplicar entonces por segunda vez el programa.
Por eso es conveniente contar con programas ad hoc para realizar la asignacin,
aunque lo que tales programas hacer, en esencia es aplicar sucesivamente el
MSA. Para obtener informacin sobre programas informticos que solucionan
esta tarea. Vase la Seccin 11.1.
Debe aclararse, sin embargo, que hemos descrito una situacin ideal, no necesariamente acorde con las circunstancias o restricciones reales. Ocasionalmente no se puede delimitar de antemano con exactitud cuntos pacientes que
darn en el estudio. Eso ocurre, por ejemplo, si en lugar de precisar el nmero de
individuos que quedarn incluidos, lo que se fija es un lapso durante el cual se
irn incorporando pacientes al ensayo. Puesto que es conveniente que cuando
se haga el anlisis, los grupos tengan tamaos similares entre s, una manera de
ayudar a conseguirlo consiste en asignar los pacientes del modo siguiente: imaginemos que se trata de k tratamientos y que en determinado momento se han
asignado m1, m2, , mk sujetos respectivamente.
k

Llamemos m = mi . El sujeto m + 1 se asigna al grupo i con probabilidad


i =1

mi
m ; es decir con probabilidad variable, ms concretamente, menor
Pi =
k 1
cuanto mayor sea el nmero de sujetos ya asignados a dicho grupo hasta ese momento. De ese modo, la asignacin va prosperando equilibradamente. El programa de asignacin aleatoria a tratamientos que se incluye dentro de SIGESMU
(vase la Seccin 11.5.4), contempla esta posibilidad.
1

Bibliografa
Hullev SB. Cunimings SR. Designing clinical research: An epidemiological approach.
Baltimore: Williams and Wilkins. 1488.
Diez AV. Bringing context back into epidemiology: variables and fallacies in multilevel
analysis. American Journal of Public Health 1998; 88: 216-222.
Evans RG. Morris LB, Marmor TR. Why are some people healthy and others not? The
determinants of health of populations. New York: Aldine de Gruyter, 1994.
Feinstein AR. Horwitz RI. On choosing the control group in case-control studies. Journal of Chronic Diseases 1983: 36: 3 11-313.
Gail MH. Williams XX. Byar DP et al. How many controls? Journal of Chronic Diseases 1976; 29: 723-731.
Garca FM. Factores de riesgo: una nada inocente ambigedad en el corazn de la medicina actual. Atencin Primaria 1999: 22: 585-595.

250

DISEO RAZONADO DE MUESTRAS

Gray A, Kramer G. Causality inference in observational vs. experimental studies. American Journal of Epidemiolology 1988; 127: 885-892.
Greenland S. Randomization, statistics and causal inference. Epidemiology 1990: 1:
421-429.
Hill AB. Ambiente y enfermedad: Asociacin o causacin? Boletn de la Oficina Sanitaria Panamericana 1992: 113: 233-242.
Kish L, Frankel M. Inference from complex samples (with discussion). Journal of the
Royal Statistical Society. Series B. 1974: 36: 1-37.
Lasky T, Stolley PD. Selection of cases and controls. Epidemiologic Reviews 1994; 16:
6-17.
Lee EL, Forthofer RN, Lorimor RJ. Analyzing complex survey data. Beverly Hills, CA:
Sage Publications. Inc., 1989.
Lemeschow S, Hosmer Jr DW, Klar J, Lwanga SK. Adecuacy of sample sized in health
studies. Wiley, New York and Community Health 1990; 52:608-611.
Lehtonen R, Pahkinen EJ. Practical methods for design and analysis of complex surveys. Chichester: Wiley. 1995.
Pearce N, Checkoway H. Case-control studies using other diseases as controls: problems
of excluding expesure-related diseases. American Journal of Epidemiology 1988:
727:851-856.
Pidrola G el al. Medicina preventiva y salud pblica. Barcelona. Salvat: 1990.
Robinson WS. Ecological correlations and the behavior of individuals. American Sociological Review 1950; 75: 531-537.
Rothman JK. Modern epidemiology. Boston: Little. Brown and Col., 1986.
Schwartz S. The Fallacy of the ecological fallacy: The potential misuse of a concept and
the consequences. American Journal of Public Health 1984: 84: 819-824.
Silva LC. Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica. Madrid: Daz de Santos, 1997a.
Silva LC. Hacia una epidemiologa revitalizada. Dimensin Humana 1997b; 1: 23-33.
Silva LC, Benavides A. Causalidad e inobservancia de la premisa de precedencia temporal. Revue Methodological (en prensa), 1999.
Skinner CJ, Holt D, Smith TMF. Analysis of complex surveys. Chichester: Wiley, 1989.
Susser M. The logic in ecological: I. The logic of analysis. American Journal of Public
Health 1994; 84: 825-829.
Susser M. The logic in ecological: II. The logic of design. American Journal of Public
Health 1994; 84: 830-833.
Susser M. Causal thinking in the health science. New York: Oxford University Press,
1973.
Syme L. La investigacin sobre la salud y la enfermedad en la sociedad actual: la necesidad de una epidemiologa ms relevante. Anthropos 1989; 118/119: 39-46.
Wacholder S, McLaughlin JK. Silverman DT y col. Selection of controls in case-control
studies. American Journal of Epidemiology 1992; 7J5: 1019-1050.
Wilkinson RG. Unhealthy societies: The afflictions of inequality. London: Rutledge.
1996.
Wolter KM. An introduction to variance estimation. New York: Springer-Verlag, 1985.

11
Recursos computacionales
para el tratamiento de datos
muestrales
En este captulo se pasa revista a las ms importantes aplicaciones informticas disponibles que se relacionan con los procesos de seleccin de muestras
en poblaciones finitas y con la estimacin de parmetros y el manejo de problemas inferenciales en ese contexto. La informacin aqu contenida corre el riesgo
evidente de envejecer rpidamente, habida cuenta de la vertiginosa renovacin
de recursos computacionales de que disfrutamos (y que padecemos) desde hace
ya varios aos.
Siempre he defendido el punto de vista segn el cual el dominio de los recursos informticos debe adquirirse de manera esencialmente autodidacta y, en
particular, mediante el proceso de hurgar individualmente dentro de los programas para comprenderlos. Por lo general es recomendable prescindir de cursos
y con bastante frecuencia resulta posible desentenderse, incluso, de manuales detallados (Silva, 1997). Por esa razn, el contenido subsiguiente se circunscribe
casi enteramente1 a resear los recursos disponibles sin explicar en detalle cmo
explotarlos.

11.1. Programas para determinar tamaos muestrales


Existen varios programas para establecer el tamao muestral adecuado para
un estudio. Casi todos se reducen, sin embargo, al caso del MSA (para problemas de estimacin) y a la determinacin de tamaos de dos grupos cuyos
resultados habrn de compararse (en problemas analticos simples). Estas dos situaciones, claramente distintas entre s, se manejan mediante enfoques tambin
1

Se hace una cierta excepcin en la Seccin 11.4.1.

252

DISEO RAZONADO DE MUESTRAS

diferentes. Algunos paquetes, como por ejemplo, dos mdulos de EPIINFO


(STATCALC y EPITABLE) y, especialmente, el sistema EPIDAT (Vzquez et
al., 1997), contienen soluciones de ese tipo. En EPIDAT se recogen muchos de
todos los procedimientos descritos y tabulados en el libro ya mencionado anteriormente y destinado exclusivamente al tema (Lwanga y Lemeshow, 1991).
Otro programa (Study Design Pack) que contiene diversos recursos para el diseo, el que nos ocupa entre ellos, ha sido divulgado por el laboratorio Glaxo
Wellcome. Puesto que las mencionadas aplicaciones informticas son sumamente amigables y, por otra parte, dado que considero que la solucin algortmica de este importante asunto es intrnsecamente cuestionable (vanse Seccciones 10.3 y 12.3), no me extender ms en este punto.

11.2. Tratamiento de datos en una muestra simple aleatoria


Como se explic en el captulo precedente, la teora estadstica clsica se ha
desarrollado durante varias dcadas partiendo del supuesto de que la muestra
disponible es simple aleatoria. Consecuentemente, con el desarrollo de los nuevos microprocesadores, se gener una copiosa produccin de software vertebrado en torno a ese supuesto; en efecto, a partir de los aos ochenta proliferaron los
grandes paquetes con aplicaciones estadsticas (SPSS, BMDP, EGRET, MINITAB, SYSTAT, SAS, S-PLUS y GLIM entre otros), los cuales no han dejado desde entonces de desarrollarse cualitativa y cuantitativamente a travs de versiones
sucesivas, aunque sin separarse nunca, en lo esencial, del supuesto en cuestin.
Aparentemente, al menos cuando se trata de un MSA, la interfaz entre muestreo formal y tcnicas estadsticas clsicas qued computacionalmente resuelta.
Cabe advertir que, en rigor, casi ninguna de estas aplicaciones informticas incorpora los factores de correccin que formalmente exigira una muestra simple aleatoria obtenida de una poblacin finita (es decir, de un listado). ste, sin
embargo, es un asunto de importancia marginal, pues los resultados son virtualmente equivalentes, contmplese o no dicha correccin. De modo que lo que
realmente interesa examinar es el abanico de soluciones computacionales disponibles cuando se han aplicado diseos mustrales de mayor complejidad, tales
como los que se han estudiado en los captulos 5, 6, 7 y 8.

11.3. Diseos no equiprobabilsticos y empleo de ponderaciones


Cada uno de los diseos mustrales formales que hemos venido considerando es susceptible de clasificacin en alguno de los cuatro grupos que pueden formarse al cruzar dos ejes: el que separa a los procedimientos segn se manejen o

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

253

no estratos en algn punto del diseo, y el que concierne al empleo o no de


conglomerados (independientemente del nmero de etapas involucradas en caso
afirmativo). La Tabla 1 1.1 recoge la ubicacin de cada uno de los siete diseos
diferentes que se han abordado en este libro en las cuatro celdas generadas por la
combinacin de posibilidades a que dan lugar estos dos ejes.
Tabla 11.1. Distribucin de mtodos de muestreo segn empleen o no
estratificacin y segn usen o no etapas
EMPLEO DE ESTRATIFICACIN
NO

E
E
M
T
P D A
L E P
E
A
O
S

NO

Simple aleatorio
Sistemtico

Aleatorio estratificado

Estratificado polietpico

Monoetpico
Bietpico
Multietpico

Tres de estos procedimientos son, por definicin, equiprobabilsticos: el


muestreo simple aleatorio, el muestreo sistemtico y el muestreo monoetpico2.
Los restantes cuatro pueden serlo o no. en dependencia de los recursos empleados para la seleccin y de los tamaos de muestra elegidos para los estratos y las
UPE.
Para los diseos no equiprobabilsticos, las ms recientes versiones de algunos paquetes estadsticos, como SPSS, han procurado mitigar el problema que
nos ocupa (suponer MSA sin que lo sea) mediante la incorporacin de ponderaciones que permitan corregir los resultados con acuerdo a la probabilidad de
inclusin que hayan tenido los sujetos.
Concretamente, esto significa que se brinda la posibilidad siguiente: en l u gar de operar con los datos resultantes de las mediciones, los valores de xi, se
ofrece la posibilidad de trabajar con datos transformados, xi* = xii donde i, es
un nmero positivo por cuyo conducto se pondera el valor correspondiente al
i-simo individuo. La ponderacin natural consiste en definir i como el inverso
1
de la probabilidad de seleccin i, correspondiente al i-simo sujeto: i = .

En rigor, en cualquiera de los tres casos podran haberse introducido modificaciones que los hubieran
convertido en procedimientos no equiprobabilsticos. Por ejemplo, se podra realizar un muestreo por conglomerados monoetpico tomando las UPE con probabilidad proporcional a sus tamaos, o un muestreo directo de
unidades de anlisis que. por ejemplo, forzara la presencia de algunas de ellas y continuara con la aplicacin de
un MSA sobre el resto. S i n embargo, tal y como los hemos estudiado, en los tres casos se trata de diseos
equiprobabilsticos.

254

DISEO RAZONADO DE MUESTRAS

La lgica de este procedimiento estriba en que si cierto individuo I1 tuvo mayor


probabilidad de inclusin (digamos, el doble) que otro I2, el grado de representacin implcita que supone la presencia de I2 en la muestra es diferente al de I1;
en este ejemplo, I1 sobrerrepresenta a los sujetos de su tipo. Consecuentemente,
el peso o influencia de dicho sujeto en el anlisis debe ser menor (en
este caso, la mitad) que el de aqul: es decir, debe cumplirse que 1 =

.
2
Este recurso, si bien compensa los desequilibrios que afectan a la muestra en materia de representatividad, no soluciona el hecho de que el mtodo estadstico
maneja los datos como si fueran independientes, cuando es bien sabido que la estructura de los diseos complejos introduce dependencias, a veces fuertes, entre
los individuos de la muestra3. Por esa razn se han desarrollado sistemas informticos de estadstica que contemplan cabalmente esa eventual complejidad de
los diseos, como se resea en la siguiente seccin.

11.4. Programas para la estimacin de errores en muestras


complejas
En los ltimos aos se ha ido conformando una creciente produccin de software especializado para el manejo de procedimientos estadsticos asociados a
muestras procedentes de diseos complejos. A continuacin se expone con cierto detalle el que a juicio nuestro es ms sencillo y amistoso: el mdulo
CSAMPLE de la versin 6.0 de EPIINIFO para DOS4. Posteriormente se resean muy brevemente otros programas disponibles.

11.4.1. Mdulo CSAMPLE de EPIINFO


EPIINFO es un sistema informtico de distribucin gratuita, subvencionado
por la Organizacin Mundial de la Salud (OMS) y desarrollado por el Centro
de Control de Enfermedades (CDC) de Estados Unidos. A diferencia de otros
sistemas similares, al menos en lo que concierne al procesamiento estadstico
de datos, EPIINFO se ha caracterizado hasta ahora por evitar en lo posible todo
maximalismo: ofrece slo los recursos analticos fundamentales y exhibe un
marcado afn de simplificar las cosas al investigador. En lugar de atiborrarlo con
posibilidades que muchas veces resultarn desconcertantes al usuario, sobre todo
3

Ms concretamente, los sujetos de un mismo conglomerado se parecen, tpicamente, ms entre s que los
que proceden de conglomerados diferentes.
4
En el momento que este libro vea la luz. probablemente ya est disponible la versin de EPIINFO para
Windows (EPI2000). El tratamiento que all se da al tema que nos ocupa, no es muy diferente del que aqu se
explica en cuestiones de fondo. El usuario hallar, sin embargo, diversas diferencias de forma o de procedimiento. Por ejemplo, la nueva versin incluye la posibilidad de trabajar con ficheros de EXCEL y ACESS.

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

255

cuando ste no conoce los recursos que se le ofrecen, en EPIINFO stas se han
reducido a lo verdaderamente esencial. Adems, en lugar de pedir frecuentemente al usuario que opte entre varias alternativas, EPINFO (especialmente
en sus mdulos STATCALC y ANLISIS) suele proceder sin ms a hacer los
procesamientos esenciales, de manera que el usuario luego escoge los resultados
que considere relevantes o procedentes a los efectos de su estudio.
A partir de la Versin 6.0, EPIINFO incorpor el mdulo CSAMPLE, cuyo
propsito exclusivo es el cmputo de estimaciones puntuales y por intervalos
de algunos parmetros en diseos mustrales complejos.
El programa parte de que toda la informacin necesaria se halla en una base de
datos que contiene tantos registros como individuos tenga la muestra. En dicha
base, adems de las variables sustantivas de inters para cada sujeto, tales como
pudieran ser edad, talla, nmero de hijos, etc., se incluyen, cuando procede, los
tres campos necesarios a los efectos de que CSAMPLE identifique la posicin
de dicha unidad dentro del diseo muestral empleado (estrato al que pertenece,
conglomerado en que se halla y ponderacin que le corresponde).
Cuando se invoca el programa, se presenta un cuadro de dilogo que solicita la
identificacin de un fichero con extensin REC (el formato de los ficheros con que
opera EPIINFO y que se crean en otro de sus mdulos5) que es el que ha de contener
la informacin muestral (con un nmero de records o registros igual al tamao muestral, como ya se dijo). Una vez cargado ese fichero, se presenta la siguiente pantalla:

Naturalmente. EPIINFO cuenta con posibilidades de importacin que permiten traducir al formato
REC los ficheros originalmente confeccionados en otros sistemas, tales como hojas electrnicas o bases de datos.

256

DISEO RAZONADO DE MUESTRAS

A travs del llenado de los cuatro primeros campos presentes en esta pantalla (Main, Strata, PSU y Weight) se informa a CSAMPLE cul es la variable con
que se va a operar (en el primero) y cul el diseo muestral que se us (en los
otros tres).
El sistema exige que en el campo Main se consigne la variable del fichero cuya media o distribucin ser objeto de estimacin. Los campos Strata (estratos),
PSU6 (unidades de primera etapa) y Weight (ponderaciones) son opcionales: su
funcin se reduce a informar a CSAMPLE del diseo muestral que se aplic y del
cual se obtuvo la muestra cuyos resultados se hallan en el fichero de trabajo.
La regla fundamental para completar esta tarea es la siguiente: si uno de esos
campos se deja en blanco, significa que el elemento correspondiente no ha intervenido en el diseo. As, dejando el campo Strata en blanco se estara indicando que en el diseo no se ha empleado estratificacin: si no se llena PSU, ello
significa que no se han empleado etapas en el proceso de seleccin y, finalmente, dejar el campo Weight sin rellenar, es el modo de comunicar que el mtodo
muestral aplicado es equiprobabilstico.
As, una vez que se mencione una variable en Main, si se dejaran las otras tres
en blanco, el programa entiende que se trata de una muestra simple aleatoria. Pero cuando cualquiera de estas tres circunstancias se haya producido (estratificacin, conglomeracin o ausencia de equiprobabilidad), hay que ocupar los espacios correspondientes con los nombres de aquellos campos de la base de datos
que contengan la informacin que corresponda.
Resumiendo, si el diseo no es MSA, entonces el modo en que se indica a
CSAMPLE de qu diseo se trata es, como ya se expuso, muy simple: basta llenar
los campos Strata, PSU y Weight segn proceda. Para captar cuan sencillo es este
proceso, remitmosnos a la Tabla 1 1 . 1 . Strata y PSU indican a qu celda de dicha tabla pertenece el diseo muestral empleado. Weight (si procede) se llena solamente
cuando el diseo no es equiprobabilstico: en tal caso, ha de colocarse aquel campo
de la base que contiene para cada sujeto el inverso de su probabilidad de seleccin.
Por ejemplo, si la muestra se ha obtenido mediante maestreo aleatorio estratificado con asignacin proporcional, entonces los campos PSU y Weight deben
quedar vacos, ya que el diseo no implic uso de conglomerados y es equiprobabilstico, pero se colocar en Strata el campo de la base que designa a qu
estrato pertenece cada individuo. Si la muestra fuese estratificada, pero no hubiese sido seleccionada con asignacin proporcional, sino con otro tipo de asignacin muestral en los estratos, entonces el carcter no equiprobabilstico de la
muestra se debe informar explcitamente poniendo en Weight el nombre del campo donde se han ubicado las ponderaciones que compensen dicha falta de
equiprobabilidad.
6

Primary Sampling Units.

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

257

La casilla Crosstab tambin es opcional: se usa slo en caso de que se quiera,


hacer un tipo especial de anlisis, como se ver ms adelante.
La siguiente informacin se emplea para comunicar la va por la cual obtener las salidas; las posibilidades son tres: Screen (pantalla), Printer (impresora)
o File (archivo); si se opta por esta ltima, entonces has que declararen File
name un nombre que identifique el fichero de texto donde se ubicarn los resultados del procedimiento.
Finalmente hay dos rdenes de ejecucin posible: Tables y Jeans. La primera se reserva slo para el caso en que la variable original que se estudia sea nominal (u ordinal), tal como sexo o religin, pero no de tipo continuo; Means puede usarse para variables cuantitativas de cualquier tipo: discretas, como nmero de
hijos, o continuas, tales como toalla o hemoglobina. Las singularidades inherentes
a cada una de estas rdenes se vern de inmediato a travs de ejemplos.
Debe advertirse que el fichero de trabajo exige que los records estn organizados de manera que los cdigos correspondientes a la variable usada para indicar los estratos aparezcan en orden creciente; otro tanto debe ocurrir con el campo que identifica los PSU (la que indica a qu unidad de primera etapa pertenece
el record) dentro de cada uno de los estratos. No es preciso que los cdigos sean
nmeros naturales consecutivos, pero s que respeten el orden mencionado; si
ello no ocurre en la base original, se puede accionar la orden Sort para preparar la base antes de invocar una de las dos rdenes posibles. Esta indicacin no
modifica el fichero de trabajo que se encuentra en el disco, sino solamente a su
representacin en memoria.
Supongamos que la muestra tiene 1.370 sujetos y que en Main se menciona
una variable dicotmica (cdigos 0 y 1); cuando se da la orden Tables, CSAMPLE produce una tabla de frecuencias para la variable en cuestin, que tiene en
lo esencial el aspecto siguiente:

283

Obs
Percent
SE %
LCL %
UCL %

20.657
1.094
18512
22.802

Obs
Percent
SE %
LCL %
UCL %

1.087
79.343
1.094
77.138
81.488

En el archivo debe llevar un cdigo numrico).

258

DISEO RAZONADO DE MUESTRAS

Percent da la estimacin puntual de cada porcentaje; SE % es el error estndar de esta estimacin (raz cuadrada de la varianza); LCL es la sigla que
identifica el lmite inferior de confianza (lower confidence limit) y UCL el superior (upper confidence limit). Si se dejaron las tres condiciones en blanco, entonces en la salida aparecern las siguientes tres lneas:
Sampling WeightsNone
Primary Sampling UnitsNone
StratificationNone
por conducto de las cuales se indica que el diseo empleado es MSA en este
caso.
Debe notarse que, en el caso de la orden Jabes, los resultados de CSAMPLE
se expresan en forma de porcentajes. Para computar los lmites de confianza, el
programa siempre trabaja con confiabilidad del 95% y por tanto procede, cualquiera sea el mtodo de muestreo, restando de, y sumando a la estimacin puntual
el valor e = (1,96) se(p). En este caso, por ejemplo, el error con que se estima el
porcentaje de sujetos para los que la variable tiene cdigo 1 es: (1,96) (1,094) =
= 2,14, que a su vez coincide con 22,802 20,657 y con 20,657 18.512.
Por otra parte, mediante la orden Tables, CSAMPLE procede a la estimacin
de los porcentajes (y sus intervalos) que correspondan a todas las categoras
que existan (dos en el caso de una variable dicotmica, como en el ejemplo).
Si en Main se pone una variable cuantitativa como la EDAD y se indica la orden Means, entonces se obtiene un resultado como el siguiente:

Analysis of EDAD

Total

Obs

Mean

Std Error

Confidence
Lower

Limits
Upper

1.370

64,092

0,593

62,930

65,254

donde, igualmente, los extremos del intervalo, se computan mediante:


64,092 (1,96) (0,593) = 62,930
y
64,092 + (1,96) (0,593) = 65,254
Supongamos ahora que se quiere evaluar si la edad media de los sujetos es diferente entre los que tienen cierto rasgo R = 1 y aquellos para los que R = 2, don-

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

259

de R es el nombre que se ha dado a cierta variable dicotmica para clasificar a


los sujetos con y sin el rasgo en cuestin. Se pone Edad en Main y R en Crosstab
con los cdigos 1 y 2. El resultado es:
Analysis of EDAD by R
R
1

Ob
667

Mean
44,844

Std Error
0,493

Confidence
Lower
43,878

Limits
Upper
45,810

703

82,354

1,375

81,619

83,089

1.370

64,092

0,593

62,930

65,254

37,510

0,620

38,724

36,296

Total
Difference

Ntese que 37,510 es la estimacin de X 1 X 2 , donde X 1 es la edad media


para los 667 individuos con R = 1 y X 2 la media para los 703 para los cuales
R=2. Esa diferencia tiene como intervalo de confianza: [38,724: 36,296]. El
hecho de que ste no contenga al cero, desde la lgica de las pruebas de hiptesis, indicara que la edad media para R = 2 es significativamente mayor que
para R = 1.
Lo trascendente es que esa prueba de significacin se ha verificado respetando el diseo muestral realmente empleado y no como lo hara cualquier software
tradicional (tratando la muestra como si fuera un MSA). Si el intervalo calculado por CSAMPLE no contiene al 0, entonces la prueba convencional (t de
Student en este caso) tambin arrojara, por lo general, significacin; pero puede
ocurrir que dicha t d significacin al suponer MSA, pero que el intervalo correcto s abarque al cero. Es decir, el empleo de CSAMPLE a estos efectos nos
precavera de rechazar H0 a pesar de ser falsa con mayor facilidad de la que se
fij de antemano.
Finalmente, el programa da la posibilidad de computar la distribucin de
una variable politmica dentro de cada uno de dos subconjuntos (subclases) determinados por cierta variable. Consideremos, por ejemplo, cierta variable dicotmica8 llamada VARDI (con valores 0 y 1) y. que para hacer el cruzamiento, se
elige la variable R.
El resultado ser de la forma siguiente:

Podra tener ms de dos categoras, aunque se ha elegido el caso dicotmico para la ilustracin.

DISEO RAZONADO DE MUESTRAS

260

CTABLES COMPLEX SAMPLE DESIGN ANALYSIS


Analysis of VARDI by R
Comparison between R 0 and 1
R

VARDI
0

1
Obs
Percent
Percent
SE %
LCL %
UCL %
Deff.

Total

569

98

667

52,346
85,307
1,371
82,620
87,995
1,001

34,629
14,693
1,371
12,005
17,380
1,001

48,686
100,000

Obs
Percent
Percent
SE %
LCL %
UCL %
Deff.

518

185

703

47,654
73,684
1,661
70,428
76,941
1,001

65,37 1
26,3 16
1,661
23,059
29,572
1,001

51,314
100,000

1,087
100,000
79,343
1,094
77,198
81,488
1,001

283

1,370

100,000
20,657
1,094
18,512
22,802
1,001

Total

Obs
Percent
Percent
SE %
LCL %
LICL %
Deff.

100,000

Como se ve, aparecen los porcentajes por filas (horizontalmente) y por columnas (verticalmente) H y V respectivamente, aunque el intervalo de confianza slo aparece para las filas. En este caso (Tabla 2.2) tambin se obtienen
tres estimaciones de inters para los epidemilogos (odds ratio, riesgo relativo y
diferencia de riesgos) y sus respectivos intervalos de confianza, como se muestra a continuacin:

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

261

CTABLES COMPLEX SAMPLE DESIGN ANALYSIS OF 2 X 2 TABLE


Odds Ratio
95 % Conf. Limits
Risk Ratio
95 % Conf. Limits

(OR)
(RR)

RR = (Risk of VARDI = 0 if R = 0)
Risk Difference
95 % Conf. Limits

(RD)

RD = (Risk of VARDI = 0 if R = 0)

2,074
(1,58; 2,72)
1,158
(1,10; 1,22)
/ (Risk of VARDI = 0 if R = 1)
11,623 %
(7,40; 15,85)
- (Risk of VARDI = 0 if R = 1)

Nuevamente, lo singular que tienen estos intervalos es el hecho de que se han

computado teniendo en cuenta los diseos verdaderos. Por ltimo, en las salidas que se producen cuando se da la orden Tables, aparece el valor de Deff. Se
trata de una estimacin de la magnitud del valor del efecto de diseo explicado
detalladamente en la Seccin 6.3.

11. 4.2 Otros programas para clculo de errores en diseos complejos


A continuacin se presentan muy sucintamente los s i e t e programas ms reconocidos en la materia que nos ocupa.
1. SUDAAN

Se trata de una aplicacin comercial desarrollada en el Research Triangle Institute que provee facilidades para estimar un buen nmero de parmetros tales
como medias, porcentajes, razones, cuantiles y odds ratios, as como para aplicar mtodos de regresin (lineal, logstica y hazards) y de tablas de contingencia.
(Barnwell, Bieler y Shan, 19%)
2. PC-CARP
PC-Carp es la versin para PC del programa SUPER CARP, uno de los pioneros en este campo, desarrollado y comercializado por la Universidad de Iowa.
Permite computar errores para medias, porcentajes, cuarteles, razones, diferencias de razones, as como para realizar pruebas de hiptesis sobre tablas de
contingencia (Fuller et al., 1989).

262

DISEO RAZONADO DE MUESTRAS

3. CENVAR
Segn se describe en Megill (1997), el paquete CENVAR (Census Variance
Calculation System) es una parte de IMPS (Integrated Microcomputer Procesing
System) desarrollado por el Bur del Censo de Estados Unidos. De hecho es una
derivacin de PC-CARP, al cual procura superar en materia de tablas de salida.
4. WESVARPC
Segn describen en el manual para la Versin 2.1 Brick, Broene, James y
Severyn se (1997), WesVar PC es un paquete para computar estimaciones puntuales y estimaciones replicadas de las varianzas a partir de datos obtenidos de
muestras complejas. Se trata de una aplicacin implementada sobre Windows
que trabaja con tcnicas de muestras replicadas como las descritas en la Seccin 9.1. Una valoracin de la versin 3 (Wesvar Complex Samples) puede encontrarse en Nixon (1998); a sta se ha aadido la posibilidad de estimar curvas
de regresin lineal y logstica.
5. STATA
STATA es una de las grandes aplicaciones informticas que presuntamente
cumple de manera cabal con el propsito que nos ocupa, adems de realizar todas las tareas de los grandes sistemas para aplicaciones estadsticas. Se trata de
un sistema programable desarrollado por una corporacin (Stata Co.) con una
amplsima gama de prestaciones. La validez de los algoritmos en que se basan
las prestaciones que ofrece STATA para el caso de diseos complejos se ha prestado, sin embargo, a cierta suspicacia informal en medios especializados, y en mi
opinin merece un examen valorativo profundo del que an se carece.
6. VPLX
Este sistema ha sido diseado por el Bur del Censo de Estados Unidos y emplea replicaciones y estimaciones tipo jackknife. El sistema WESVAR PC arriba mencionado tiene, a mi juicio, una interfaz mquina-usuario ms amigable.
7. CLUSTERS
Nacido del proyecto World Fertility Survey. CLUSTERS se limita, como
CSAMPLE, a computar errores para medias y proporciones en subclases, aunque opera en un ambiente de hoja electrnica.
8. SAS
Este es el otro gran paquete de aplicaciones estadsticas de propsito general
que incluye procedimientos de anlisis acordes a mtodos complejos de muestreo
(en la versin 8), Anthony, Watts y Stokes (1999) dan cuenta de un mdulo pa-

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

263

ra la seleccin de muestreo de diversos tipos, otro para estimar medias y porcentajes y un tercero para anlisis de regresin lineal.

11.5. Programas para la seleccin de muestras


Los programas hasta aqu descritos se relacionan con la determinacin de
tamaos mustrales y con el anlisis de datos; pero no se involucran en el proceso de seleccin. Los que hacen esto ltimo son virtualmente inexistentes.
Algunos paquetes contienen la posibilidad de realizar la seleccin de una muestra
simple aleatoria (con y sin reemplazo) o sistemtica de un listado, pero tpicamente no se pasa de ah. De hecho, en su seccin de Preguntas y Respuestas,
la revista especializada The Survey Statistician de diciembre de 1998 recoge el
sealamiento de Kish (1995) acerca de la inexistencia de programas de este tipo
y la urgente conveniencia de contar con ellos. Recientemente, como se consign en la seccin anterior, SAS ha incluido un mdulo creado con ese fin. El
otro programa que conocemos que aborda este asunto es SIGESMU, objeto de la
siguiente seccin.

11.6. Sistema general de simulacin de diseos y aplicaciones


muestrales (SIGESMU)
El programa SIGESMU fue creado especialmente para acompaar este libro. En las cuatro subsecciones que siguen, se comunican sus rasgos y prestaciones fundamentales.

11.6.1. Programas de seleccin


El libro que constituye la versin precedente del actual (Silva, 1993) vena
acompaado de un disco que contena algunos programas muy simples para facilitar algunos procesos de seleccin elementales. Ahora, intentando hacer una
contribucin ms relevante en este sentido, hemos diseado (Surez, 1998) un
sistema denominado Sistema General de Simulacin y Seleccin de Muestras
(SIGESMU), parte de cuyas prestaciones conciernen especficamente al proceso
de seleccin. SIGESMU puede instalarse en ambiente Windows haciendo uso del
disco compacto que se adjunta9.
El propsito de este sistema informtico general de simulacin de diseos y
aplicaciones mustrales es proveer al usuario de las siguientes posibilidades:
9

El sistema fue programado utilizando el lenguaje de 32 bits Delphi 3.0 para Windows 95 98.

264

DISEO RAZONADO DE MUESTRAS

Figura 11.1. Ventana principal de SIGESMU.


Visualizar y practicar distintos diseos mustrales.
Valorar las virtudes \ limitaciones de las tcnicas de seleccin ms importantes.
Contar con herramientas de inters didctico que permitan la consolidacin
de nociones bsicas relacionadas con el maestreo.
Avadar en el proceso de seleccin de muestras equiprobabilsticas sobre
marcos de muestreo explcitos e implcitos.
En lo que sigue se describe brevemente cada uno de los componentes de los
dos mdulos bsicos de SIGESMU (Figura 11.1) .
SIGESMU incluye recursos de seleccin de muestras equiprobabilsticas
aplicables a una base de datos cuyo formato sea compatible con dBase, la cual ha
de ser proveda por el usuario en calidad de marco muestral. Con el subconjunto resultante del proceso de seleccin ( l a muestra), el sistema crea una base de
ciatos idntica a la original (salvo el hecho, naturalmente, de que sta slo contiene los registros correspondientes a los sujetos elegidos).
Los mtodos de seleccin incluidos en este componente son:
a)
b)
c)
d)

muestreo simple aleatorio


muestreo sistemtico en tases
muestreo aleatorio estratificado
muestreo por conglomerados monoetpico

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

265

e) muestreo por conglomerados bietpico con probabilidades proporcionales


a los (amaos de las unidades de primera etapa
f) muestreo estratificado polietpico
Por otra parte. SIGESMU tambin ofrece la posibilidad de aplicar mtodos
de seleccin cuando no se cuenta con bases de datos explcitamente conformadas: es decir, para realizar la seleccin sobre unidades de anlisis genricas, que
el usuario identificara a posteriori en un marco muestral externo. Para este caso, se han incluido los siguientes diseos:
a) muestreo simple aleatorio.
b) muestreo sistemtico en fases.
c) muestreo por conglomerados bietpico con probabilidades proporcionales
a los tamaos de las unidades de primera etapa.

11.6.2. Simulacin de muestras


Los programas que procuran resolver o encarar el proceso de seleccin pueden ser tiles, adems de por su funcin operativa, para la formacin del usuario.
Tal es el caso cuando este puede percibir cmo fluye el proceso de seleccin y
comparar los resultados provenientes de mtodos diferentes sobre la misma poblacin, va que pueden constituir una va importante para identificar las ventajas
y desventajas relativas que tienen los diseos, as como para valorar el efecto del
tamao de muestra sobre la calidad de as estimaciones.
SIGESMU posee un rasgo singular en este sentido. Se trata de un recurso
para simular selecciones muestrales segn diversos mtodos posibles. Este submdulo permite computar estimaciones en muestras simuladas y facilitar por esa
va la comparacin de resultados de los diferentes mtodos utilizables. Con ese
fin, se ha creado artificialmente una poblacin t i p o . Para conformarla se construy mediante simulacin una base de datos, con caractersticas que se ajustan
a la estructura de una poblacin real, adecuada en principio para la aplicacin de
cualquier procedimiento de muestreo. Se simularon varios miles de sujetos, cada uno de los cuales se ubic en una de 4 zonas, despus en alguno de los distritos existentes dentro de stas, y finalmente, en viviendas dentro de los distritos.
A los sujetos simulados, una vez distribuidos en zonas, distritos y viviendas,
se les atribuyeron valores para cuatro variables personales, definidas del modo
siguiente:

Nivel socioeconmico:
Valor entero entre 1 y 4: 1 para los de ms bajo nivel y 4 a los que poseyeran
mejor nivel socioeconmico. As se representa a una variable sinttica supuestamente conformada a partir de cierta informacin y de un algoritmo validado de
asignacin en una de las 4 categoras.

266

DISEO RAZONADO DE MUESTRAS

Se atribuy el mismo nivel socioeconmico a todos los integrantes de una


misma vivienda.

Edad:
Valor entero entre 0 y 100, expresado en aos.
Nmero de caries:
Nmero entero entre 0 y 8, que identifica para cada sujeto el nmero de piezas dentales afectadas por caries.
Necesidad de atencin estomatolgica:
Variable dicotmica, cuyos valores posibles son: 0 si el sujeto no requiere
atencin estomatolgica, y 1 en caso contrario.
La base de datos constituida, denominada POBLADO.DBF, e incluida en el
CD que se adjunta, es compatible con dBase; en ella cada sujeto ocupa un artculo. Grficamente, la estructura de la poblacin creada se ha representado en
la Figura 11.2.
Como resultado de la aplicacin de un conjunto de reglas probabilsticas aplicadas para simular la poblacin, se obtuvo una base de 2.393 viviendas (distribuidas por zonas y distritos), y dentro de ellas se simularon 9.234 sujetos. Este
componente sirve como entrenamiento para la seleccin de muestras por medio
de los seis diseos incluidos en el mdulo de seleccin, ya que todos ellos han si-

Figura 11.2. Estructura de la poblacin tipo creada para la simulacin.

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

267

do incluidos como posibilidad para que el usuario elija aqul con el que quiere
trabajar con vistas a la simulacin. Las seis tablas siguientes dan una semblanza
de los rasgos de esta poblacin artificial.
Como puede observarse en la Tabla 11.1, la distribucin de sujetos segn grupos de edad tuvo predominio de los grupos de edad de entre 20 y 60 aos.
El porcentaje de sujetos segn ZONA y NSE, as como las medias y varianzas del NSE, se presentan en la Tabla 11.2; la media del NSE aumenta desde la
zona 1 a la 4, con varianzas similares entre las zonas, siempre menores que la variabilidad total (indicando que las zonas son internamente homogneas en materia de nivel econmico-social).
El comportamiento de la media de caries por persona y el porcentaje de personas con caries segn zonas se aprecia en la Tabla 11.3.
Tabla 11.1. Distribucin de los sujetos por grupo de edad
SUJETOS
GRUPO EDAD
%

NO

0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99

772
911
1.486
1.547
1.534
1.498
555
450
256
225

8,4
9,9
16,1
16,8
16,6
16,2
6,0
4,9
2,8
2,4

TOTAL

9.234

100,0

Tabla 11.2. Distribucin porcentual de los sujetos con cada


nivel de NSE segn ZONA, medias y varianzas de NSE por zonas
NSE
ZONA
1

1
2
3
4
TOTAL

49.5
37,7
14,9
9.7

29,4
28,7
14,8
13,0

13,5
19,8
30,7
30,8

S2

1.792
2.098
2.949
3.141

0.890
1,120
1,138
0,964

2.419

1.332

7,6
13,8
39,5
46,5

268

DISEO RAZONADO DE MUESTRAS

Tabla 11.3. Tasas de sujetos con caries


y nmero medio de caries por zonas
CARIES

ZONA

tasa (%)

1
2
3
4

30,1
29.0
19.3
16,3

0,744
0,675
0,375
0,343

TOTAL

0,561

Tabla 11.4. Tasas de sujetos con caries medias y


varianzas del nmero de caries segn NSE
NSE

tasa (%)

Promedio de CARIES

S2

38.6

1.014

2.292

27,5
19,3
9.7

0,613
0,371
0,135

1.306
0,727
0,193

0,561

1.311

3
4
TOTAL

Tabla 11.5. Tasas de sujetos con necesidad de atencin


estomatolgica segn zonas
ZONA

tasa (%)

39,8

2
3
4

37,6
25,5
23,2

TOTAL

32.7

Atendiendo a la presencia de caries segn nivel socio econmico, encontramos diferencias acusadas entre las medias, con varianzas notablemente alejadas
entre s (Tabla 11.4).
Finalmente, los porcentajes de sujetos con necesidad de atencin estomatolgica segn zonas y segn NSE se recogen respectivamente en las Tablas 11.5 y 11.6.

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

269

Tabla 11.6. Tasas de sujetos con necesidad de atencin


estomatolgica segn NSE
NSE

tasa (%)

49.1

2
3
4

37.1
27.0
13.7

TOTAL

32,7

La estructura impuesta a la matriz de datos procuraba generar un efecto de


diseo bastante grande mediante el recurso de hacer las UPE bastante homogneas internamente, aunque tambin las zonas se disearon para que fueran relativamente homogneas.

11.6.3. Otras aplicaciones informticas relacionadas con el muestreo


SIGESMU incluye, por otra parte, programas destinados al desarrollo de algunas tareas de simulacin. Expuestos a grandes rasgos, se trata de los siguientes tres procedimientos:
JUEGO DE LAS URNAS
Gracias a este componente, el usuario podr percatarse fcilmente de un elemento crucial del muestreo: para lograr buenas estimaciones, no importa mucho
cuan grande sea el tamao relativo de la muestra en relacin a la poblacin de
la cual proviene, lo verdaderamente crucial es el tamao absoluto de la muestra.
Lo que se simula es el juego de urnas descrito en la Seccin 3.9. Naturalmente, el usuario podr decidir los tamaos de las urnas, de las muestras, del parmetro de inters y del nmero de replicaciones. El sistema mostrar los resultados en una tabla y a travs de una representacin grfica.
ASIGNACIN DE PALABRAS A LISTAS
Como sabemos, para muestras medianamente grandes, el azar es capaz de lograr que la mayora de las muestras seleccionadas por su conducto sean representativas de las poblaciones de las cuales proceden. En particular, la asignacin
aleatoria de unidades a varios grupos suele conseguir que dichos grupos sean muy
parecidos entre s a casi cualquier efecto que se desee. Contribuir a que este hecho
pueda palparse de manera elocuente es el objetivo de este componente.

270

DISEO RAZONADO DE MUESTRAS

Esta simulacin se basa en la idea de tomar palabras en calidad de unidades de


anlisis. Para cada una de stas pueden medirse varios rasgos, tales como nmero de letras en ellas contenida, o el hecho de que empiece con vocal o consonante. Para llevar adelante el proceso de asignacin en que se basa esta aplicacin
de ndole demostrativa, se parte de un archivo de texto (con formato ASCII)
elegido por el usuario, cuyas palabras son objeto de la asignacin aleatoria a varias listas (2, 3 4, segn defina el usuario).
El archivo de textos original para llevar adelante el proceso descrito se indica
por el usuario por medio de una ventana de peticin tipo Windows. Al escoger
dicho archivo, la ventana de la simulacin se activa y el usuario puede definir los
parmetros para los cuales desea realizar estimaciones: nmero de veces que
aparece una letra determinada y porcentaje de palabras cuya longitud sea igual
o mayor a cierto valor. Se estiman asimismo el porcentaje de palabras que comienzan con vocal y la longitud media en letras de cada una de las listas. Realizado el cmputo, se muestran los resultados para cada grupo as como los valores poblacionales, de modo que se puedan comparar con los que corresponden
a los listados conformados. A su vez, al cotejar los resultados de cada una de
las listas se podr constatar que, salvo casos excepcionales, especialmente si el
nmero de palabras contenidas en el fichero es grande, el azar equipara las
submuestras de la poblacin: es decir, se observar la proximidad entre las estimaciones hechas y la proximidad de stas con el valor poblacional.
ASIGNACIN DE SUJETOS A TRATAMIENTOS
Supongamos que se est diseando un estudio que exige la comparacin de
dos drogas, una conocida y la otra de nueva generacin. Se precisa asignar a cada uno de 56 sujetos el tratamiento que habr de recibir una vez que sea declarado elegible, de forma tal que los grupos resultantes, adems, sean de igual
tamao.
Para resolver un problema como ese, basta con disponer de un programa que
extraiga muestras aleatorias: cuando el nmero de tratamientos es superior a dos,
ya resulta conveniente contar con un programa ad hoc, como el que nos ocupa.
En la ventana de asignacin no existen ms complicaciones que indicar el nmero de tratamientos y el de los sujetos que han de distribuirse: de tal forma, al
indicar que se efecte el procesamiento, la ventana mostrar los listados de los
sujetos que han de incluirse en cada uno de los grupos. Se pueden crear hasta
cinco listas para tratamientos
Una alternativa a la conformacin de grupos de igual tamao, en que la probabilidad de asignacin es la misma para todos los sujetos, es optar por la construccin de grupos equilibrados. En la asignacin equilibrada, los sujetos se
van asignando a los tratamientos con probabilidades que varan dependiendo del
nmero de sujetos ya incluidos en cada lista: se otorga a un nuevo sujeto mayor

RECURSOS COMPUTACIONALES PARA EL TRATAMIENTO DE DATOS MUESTRALES

271

probabilidad de inclusin en las listas con menor tamao (vase Seccin 10.6).
Tal recurso se aplica con el fin de conseguir que en cualquier punto de este proceso los listados hasta ese momento conformados sean bsicamente de igual tamao. La utilidad de actuar de tal modo se deriva de que, ocasionalmente, en
lugar de fijar de antemano un nmero de unidades por grupo, se fija un lapso durante el cual se estarn acopiando casos para el estudio; en tal situacin no se sabe cuntos sujetos habr finalmente, y el proceso de asignacin quedar truncado cuando se alcance la fecha lmite. Tambin puede ser que se desee hacer
cortes parciales a lo largo del estudio. Al seguir este mtodo de asignacin quedar esencialmente garantizado que los tamaos de los grupos en ocasin de dichos cortes sean aproximadamente iguales.
Cabe sealar que las listas formadas pueden guardarse en ficheros de texto y
por tanto, en su momento, podran imprimirse para trabajar con ellas en terreno.

11.6.4. Requerimientos y rasgos generales del sistema


Para la instalacin de SIGESMU se necesita una computadora IBM compatible
486 o superior con sistema operativo Windows 95 o superior; debe tener al menos 16 Mb de memoria RAM y ocupa aproximadamente 11.5 Mb de disco duro
disponible. Para la instalacin se exige una Unidad de lector de CD y una tarjeta de
vdeo SVGA (800 600, 256 colores).
El programa cuenta con un detallado sistema de ayudas, similar al implementado por conocidas aplicaciones desarrolladas sobre Windows 95, con todas las posibilidades de bsqueda y manejo de informacin previstas por dicho
sistema operativo. La ayuda cuenta con descripciones de los campos de entrada
de cada una de las ventanas incorporadas al sistema, as como con definiciones
de algunos conceptos del muestreo esenciales para el usuario.
La instalacin se realiza a travs de un archivo ejecutable con el nombre
SETUP.EXE, de manera anloga a cualquier aplicacin convencional sobre
Windows 95.

Bibliografa
Anthony A, Watts D, Stokes M. SAS procedures for analysis of sample survey The
Survey Statistician 41: 10-13, 1999
Barnwell BG, Bieler GS, Shah BV. SUDAAN Technical Report: The MULTILOG Procedure, Release 6.6, Research Triangle Institute. Research Triangle Park, North Caroline, 1996.
Brick, JM, Broene P, James P, Severynse J. A User's Guide to WesVar PC. Rockville,
MD; Westat, Inc., 1997.

272

DISEO RAZONADO DE MUESTRAS

Fuller, WA, Kennedy W, Schnell D, Sullivan G, Partk HJ. PC CARP. Ames, IA: Statistical Laboratory, Iowa State University. 1989.
Kish L. Questions and answers, Paris: IASS, 1995.
Lwanga SK, Lemeshow S. Sample size determination in health studies: A practical manual. Ginebra: Organizacin Mundial de la Salud, 1991.
Megill DJ. CENVAR software for tabulating samplig errors. The Survey Statistician
1997; 37: 11-14.
Nixon M. WesVar complex samples software. The Survey Statistician 1998; 39:8-11.
Silva LC. Muestreo para la investigacin en ciencias de la salud. Madrid: Daz de Santos, 1993.
Silva LC. Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica. Madrid: Daz de Santos, 1997.
Surez R. Sistema General de Simulacin y Seleccin de Muestras (SIGESMU). Tesis
de Especialista en Bioestadstica. La Habana: Escuela Nacional de Salud Pblica.
1998.
Vzquez E et al. EPIDAT: Anlisis epidemiolgico de datos tabulados. Santiago de
Compostela: Xunta de Galicia. 1997.

12
Reflexiones crticas sobre
la prctica muestral
contempornea
En este captulo se abordan crticamente diversos aspectos de inters prctico,
tales como errores que se cometen con relativa frecuencia por parte de muestristas
inexpertos, que son vctimas de tradiciones discutibles, o que actan segn criterios directamente improcedentes. Simultneamente, se desarrollan algunas ideas y procedimientos pendientes de examen cuya discusin suele esquivarse. Finalmente, se hacen diversas precisiones conceptuales que tienen repercusin
considerable a los efectos de aplicar o de comprender las tcnicas mustrales.

12.1. Marco de extrapolacin


La legitimidad de las extrapolaciones es uno de los temas ms espinosos en la
prctica; parece mucho menos escabroso de lo que realmente es, debido a que
responde al tipo de asuntos que suelen eludirse olmpicamente en la literatura. Es
de los temas que, de ser posible, no bajan a los textos de nivel medio o elementales; y slo raramente se abordan, incluso, en crculos muy especializados.

12.1.1. Una regla rgida


Entre los estudiantes de muestreo es bien conocida la pauta que establece que
las inferencias que se produzcan a partir de una muestra han de circunscribirse
a la poblacin que fue objeto del acto de seleccin. Desde una ptica rigurosa,
esto es impecablemente cierto. Pero un apego estricto a dicha regla tendra efectos tan paralizantes que en la prctica suele pasarse por alto.
En efecto, debemos reconocer que con frecuencia el mtodo de seleccin es
tal que, por una razn u otra, no todos los individuos de la poblacin objeto de
anlisis tienen oportunidad de integrar la muestra y, sin embargo, la inferencia

274

DISEO RAZONADO DE MUESTRAS

objetivamente realizada abarca a toda la poblacin y no slo a la porcin de la


que procede la muestra. El grado en que una transgresin como esa resulte perdonable no es por lo general un asunto de naturaleza estadstica, sino algo inherente al problema que se aborda: depende de la valoracin que hagan los
investigadores, basada en su sentido comn y en su cultura sobre el problema,
elementos a partir de los que se dir la ltima palabra.
Por ejemplo, supongamos que se hace un estudio sobre la informacin que
poseen los jvenes de la enseanza media acerca del SIDA usando una muestra
de 120 alumnos de una escuela de Madrid, que sobre esas bases se estima que
solo el 20% tiene conocimientos adecuados sobre el tema, y que se obtiene un
intervalo de confianza al 95% de [16% 24%], qu quiere decir esto? La respuesta cannica sera que podemos estar razonablemente confiados en que el
porcentaje de jvenes de esa escuela que tena conocimientos adecuados en el
momento de la encuesta se hallaba entre 16% y 24%. Ni ms ni menos. Lo
que importa subrayar es que, formalmente, la inferencia se reduce a lo que prevaleca en esa escuela y en ese momento.
Sin embargo, nadie (con excepcin quizs de la direccin de esa escuela)
hara el estudio para obtener tan magro dividendo, reducido a una ancdota histrica. Si tal resultado se publica es porque tcitamente se cree que los resultados
son indicativos de algo que ocurre ms all de la escuela y ms all del momento
de la encuesta. Lo que pasa es que la decisin de cul es el alcance geogrfico y
temporal de tal extrapolacin suele dejarse en un limbo que, si bien releva al
investigador de comprometerse explcitamente, no resuelve el hecho real de
que la inferencia que objetivamente se est haciendo trasciende el mbito de la
seleccin en que se basa.
Es evidente que la realidad desvelada por el estudio no ser vigente 10 aos
despus de realizado el estudio ni tampoco extrapolable a la ciudad de Copenhague, pero es verosmil que tambin refleje lo que ocurre en otras escuelas de
Madrid, y que sea esencialmente vlida mientras no cambien los factores que determinan el grado de conocimiento de los jvenes madrileos sobre el SIDA.
Por otra parte, a veces es simplemente imposible hacer extrapolacin alguna. Por ejemplo, en un artculo titulado Consumo de drogas en una muestra de
mdicos rurales de la provincia de Valladolid, Carvajal, Garca, Holgado y Velasco (1984) dan cuenta de un estudio basado en una encuesta realizada por medio del correo a la que 73 mdicos aportaron testimonios sobre sus hbitos de
consumo de drogas (tanto de las llamadas institucionales -alcohol, cafena y
tabaco- como de las que no lo son, tales como anfetaminas, cidos, opiceos y
alucingenos).
En principio, la poblacin de inters estaba conformada por 211 mdicos, a
todos los cuales les fue originalmente remitido el cuestionario; solo respondi,
sin embargo, el 34,5% de ellos. Dada la naturaleza obviamente comprometedora
de algunas de las respuestas posibles (los propios autores adelantan en el traba-

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

275

jo un juicio moral negativo hacia un mdico que consuma estas sustancias), resulta altamente dudosa la representatividad de una muestra autoconfigurada por
sus integrantes.
Ntese que el propio ttulo del trabajo anuncia algo anmalo: lo que ocurra en
una muestra, como all se consigna (en este caso, la magnitud o forma del consumo), no es algo que interese. Lo que puede interesar es esta informacin para
la poblacin de mdicos. La muestra es un intermediario metodolgico, ajeno
por completo al propsito de un estudio, cualquiera que sea ste. Si hay motivos para pensar que la muestra representa adecuadamente a cierta poblacin, entonces es posible que los resultados obtenidos de aqulla puedan extenderse o
extrapolarse a esta ltima. En tal caso, es posible que se haya alcanzado aquel
propsito; vale decir que nunca interesa un resultado muestral per se, sino slo
el que se deriva de ese proceso de extrapolacin.
En el caso que nos ocupa, resulta muy difcil establecer a qu poblacin podra representar la muestra que nos ocupa: A los que no tienen nada que ocultar? A quienes no tienen aprensin en admitir sus hbitos? A los que aprovechan la ocasin para dar pistas falsas sobre sus hbitos reales? Considero
imposible responder estas preguntas. Sin embargo, de lo que no quedan dudas es
de que la muestra representa exclusivamente a los mdicos que acceden a contestar, subgrupo cuya diferencia con el de los que optan por no responder es algo
ms que verosmil. Se trata a todas luces de una muestra llamada a arrojar estimaciones sesgadas.
Por otra parte, aun cuando la totalidad de los mdicos hubiese respondido, habra motivos para sospechar la presencia de un sesgo: es bien conocido que
cuando se formula una pregunta embarazosa, los resultados suelen arrojar
subestimaciones (o sobrestimaciones, segn sea lo que se investigue). El trabajo,
por poner un ejemplo, comunica que el porcentaje de mdicos que consumen
cocana (ya fuese habitual o espordicamente) es nulo; ni hombres ni mujeres de
la muestra admiten tal consumo. Podr razonablemente confiarse en que, si la
realidad fuese otra, habra quedado fielmente reflejada en las respuestas?
La endeblez fundamental que tiene este artculo no radica, sin embargo, en
que una parte de la muestra no responda; esto suele ocurrir siempre en una u otra
medida y existe un vasto campo terico al respecto (vase Seccin 12.4). Si bien
la tasa de no respuesta es ciertamente desmedida, el defecto fundamental del
trabajo estriba en que no se dice (ni es posible decirlo) a qu poblacin cabe atribuir los resultados hallados1.
Supongamos ahora que se quiere estimar la prevalencia de insuficiencia renal
crnica (IRC) en una ciudad pero que, por razones prcticas, la muestra se ele1

El artculo analizado es bastante antiguo. Actualmente es difcil hallar trabajos publicados que padezcan de
tan notables insuficiencias, pues los editores (y los autores) han alcanzado niveles de versacin, experiencia y
rigor mucho mayores que los que tenan entonces.

276

DISEO RAZONADO DE MUESTRAS

gir de un listado incompleto, que contiene solamente al 90% de la poblacin actual (por ejemplo, slo incluye a los que poseen telfono, ya que, supongamos,
el marco muestral ser la gua telefnica; en tal caso, la muestra resultante comprender solamente a poseedores de telfono).
La pregunta clave, que evidentemente no es de ndole estadstica, sera: hay
motivos para sospechar que la posesin o no de telfono se relaciona de algn
modo con el hecho de padecer IRC? Si la respuesta fuera positiva, no habr perdn. Pero si, por mucho que salubristas y nefrlogos especulen tericamente,
no aparece ningn vnculo, ni directo ni indirecto, entre ambos rasgos, yo me inclino por la absolucin metodolgica. Me baso en que, de todos modos, el conocimiento que se obtenga por va muestral habr de ser provisional, perfectible
y sujeto a refinamiento. Por otra parte, si somos flexibles con la extrapolacin en
el tiempo, por qu no serlos con la extrapolacin en el espacio? En ltima instancia, se trata de ser flexible en el marco de un talante riguroso, que es mucho
mejor que ser rgido sobre un substrato conceptualmente borroso, como ocurre
con tanta frecuencia y en tantos contextos sin que ello genere tanto escndalo.
En mi opinin, tal flexibilidad tiene fundamentos claros. Supongamos que
se estudian las dimensiones antropomtricas de los nios de una ciudad a travs
de una muestra equiprobabilstica de hogares de una ciudad. Supongamos asimismo que el proceso discurri sin ningn tipo de anomalas: el marco muestral
estaba actualizado, todos los hogares fueron elegidos segn lo planeado y los nios de la muestra fueron medidos en su totalidad. Hecho el estudio, se obtiene
un amplio conjunto de estimaciones, entre ellas, pongamos por caso, que la talla media de un varn de 5 aos es igual a 104 cm y que el percentil 5 de la distribucin de esa variable es 96 cm. Tras un examen estadstico adecuado de los
datos, los auxlogos deciden recomendar que aquellos nios de esa edad cuya talla est por debajo de 96 deben ser examinados por personal especializado. Esta
pauta sale publicada y se difunde mucho despus de realizadas las mediciones
(con buena suerte, un ao ms tarde).
Ahora bien, para qu poblacin son vlidas las estimaciones que, tras la mencionada elaboracin, dan lugar a tal recomendacin? Obviamente, no para los nios que tenan 5 aos en el momento de la encuesta. Dichos nios ni siquiera existen ya como tales, pues en el momento de la publicacin ellos tendrn por lo
menos seis aos. Por otra parte, la pauta en cuestin seguir vigente durante mucho tiempo (quizs un decenio). De modo que la extrapolacin verdadera se extiende formalmente a una poblacin enteramente diferente a la que fue muestreada. A nadie se le ocurrira sugerir la repeticin del estudio dos meses despus, del
mismo modo que difcilmente se aceptara que sus resultados guarden vigencia durante los 40 aos siguientes, ya que es bien conocido que existe una tendencia secular que obliga a actualizar cada cierto tiempo las curvas de crecimiento y desarrollo. La decisin al respecto est condenada a ser informal y, en cualquier caso,
ajena a una aplicacin rgida de la regla enunciada al comienzo de esta seccin.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

277

sta es la realidad de todos los das: las medidas que se adopten tras un estudio de satisfaccin de pacientes hospitalizados se aplicarn a una poblacin diferente de la que se estudi, el nivel de educacin sexual que se atribuye a una
poblacin de adolescentes se conoce a travs de una muestra de una poblacin
de adolescentes que ahora son adultos, y as sucesivamente.
Muy posiblemente, los nios que hoy tienen 5 aos, los hospitalizados y los
adolescentes actuales no difieran en lo esencial de los que en su momento fueron
estudiados; por eso la inferencia que realmente se hace verosmilmente ser legtima aunque no responda al esquema formal de que slo se extrapola a la poblacin muestreada. Sin embargo, el hecho de que lo sea (y hasta cundo seguir sindolo) escapa a la estadstica y al muestreo para caer en la rbita del
sentido comn y la reflexin crtica.
En sntesis, el nivel de extrapolacin adecuado suele ser un problema en que
participan por igual las tcnicas formales de muestreo y los recursos informales
centrados en el sentido comn.

12.1.2. Pruebas de significacin en muestras poblacionales


En un libro clsico, aunque en buena medida olvidado, Hagood (1941) encara
el tema desde una perspectiva general, que desborda el marco del muestreo en
poblaciones finitas con fines descriptivos y abarca tambin el de las pruebas de
hiptesis. Lo que all se discute es la situacin en que la muestra no es tal en
sentido estricto, sino que constituye toda la informacin disponible. Por ejemplo, supongamos que contamos con las tasas de mortalidad infantil de las 50 provincias de un pas y con las correspondientes 50 tasas de analfabetismo en un
ao dado, y supongamos que se calcula el coeficiente de correlacin de
Spearman con esos 50 pares. Tiene sentido evaluar si dicho coeficiente difiere
significativamente de cero? El asunto es cundo y sobre qu bases se pueden hacer inferencias a un universo hipottico, un superuniverso del cual nuestro universo finito (es decir, lo que se ha observado) puede ser considerado una muestra aleatoria. Hagood baraja varias posibles interpretaciones segn las cuales lo
observado puede considerarse la realizacin de una experiencia aleatoria (configuraciones espaciales posibles o variabilidad en el tiempo); se trata de alternativas que justificarn tericamente la posibilidad de conducirse con flexibilidad
en esta materia.
Es bien conocido que la teora formal ubica a l a s pruebas de significacin en el mbito inferencial; de modo que para ellas tambin rige el principio que reza: a partir de los datos mustrales se infieren conclusiones sobre
aquella poblacin supuestamente representada por la muestra. Consecuentemente, desde un punto de vista terico y formal, no tiene sentido aplicar tales
pruebas cuando los datos, en lugar de conformar una muestra, coinciden con
todo el universo. Esa regla, no obstante se presta a gran confusin y por ello

278

DISEO RAZONADO DE MUESTRAS

resulta de mxima importancia establecer con claridad qu significa este


enunciado.
Imaginemos que en un hospital se estudian todos los pacientes intervenidos
quirrgicamente durante 1995 y que se calculan las tasas de infeccin postoperatoria en cada uno de dos grupos de edad bien diferenciados, digamos jvenes y viejos. Procede en este caso aplicar una prueba de hiptesis?
Una de las fuentes de errores ms importantes en el empleo incorrecto de la
estadstica deriva de un hecho muy simple: no se ha planteado con claridad el
problema que se quiere resolver con su ayuda, no se ha formulado con transparencia una pregunta antes de emplearla. En este caso, resulta crucial saber cul
es el problema que se encar, para qu se computaron las tasas mencionadas. Si
los investigadores quieren simplemente describir el comportamiento de la infeccin postquirrgica de ese ao y para ese hospital, entonces no tiene sentido
hacer prueba de hiptesis alguna para comparar las tasas especficas entre grupos
de edad, pues la informacin disponible se maneja en su totalidad. Si se realizara
una prueba de hiptesis para evaluar la diferencia entre estas tasas, entonces
necesariamente tiene que estarse suponiendo que los sujetos estudiados conforman una muestra. En tal caso, cabe preguntarse, una muestra de qu poblacin?
Para profundizar en este tema, en la siguiente seccin se amplan algunas ideas
en buena medida ya desarrolladas y consideradas en Silva (1997).

12.1.3. Necesidad de un superuniverso


Para obtener una respuesta razonable, procede considerar el ya mencionado
concepto de superuniverso, que fuera introducido por Stouffer (1934), quien
lo defini como un universo infinito de posibilidades, formado por todos los
universos finitos que pudieran haberse producido en el momento de la observacin y del cual nuestra poblacin finita puede considerarse una muestra aleatoria.
En efecto, si la prueba se lleva a cabo, es porque la verdadera pregunta formulada, aun en el caso de que los investigadores no lo declaren as, no se remite
a ese hospital ni a ningn hospital especfico, sino genricamente a un superuniverso. La pregunta de investigacin concierne genricamente a l a
enfermedad nosocomial en sujetos operados; es decir, atae a un aspecto de la
fisiologa humana (la propensin a infectarse en funcin de la edad). De modo
que la poblacin sobre la que se infiere abarca a todos los sujetos operados, pasados y futuros. Es en ese sentido que la poblacin estudiada puede entenderse
como una muestra. La dificultad terica de mayor entidad, sin embargo, radica
no tanto en el hecho de que haya que inventar un superuniverso que d sentido
a la aplicacin de la prueba, sino en valorar si hay derecho a ver esta
muestra como el resultado de haber aplicado un procedimiento aleatorio de
seleccin en el superuniverso.

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

279

De hecho, la solucin de imaginar un superuniverso es muy singular, pues


parecera que viene a decir, poco ms o menos, lo siguiente: como la aplicacin
de la prueba de significacin exige cierta condicin que en principio no se cumple, y puesto que se va a aplicar de todos modos, ha de inventarse una elaboracin terica que le d sentido. Sin embargo, el asunto no es tan burdo.
Supongamos que la tasa de infeccin en ancianos asciende a 19,2%, mientras
que entre adultos jvenes es slo de 8,6%, y que al realizar una prueba de hiptesis, esta apreciable diferencia resulta ser estadsticamente significativa2. Como
se ha dicho, la conclusin de que la tasa es mayor para ancianos que para quienes no lo son, obviamente no recae sobre los pacientes de ese ao en dicho hospital; para establecer que 19,2 es un nmero mayor que 8,6 no hace falta una
prueba estadstica: bastan los conocimientos de un escolar. Puede decirse entonces que hay mayor propensin a infectarse entre ancianos que entre jvenes,
independientemente del pas en que se realiza el estudio, del tipo de hospital y de
las caractersticas de los pacientes? Desde luego, no. Pudiera ocurrir que este
hospital estuviera enclavado en un rea de bajo nivel econmico, y que si el estudio se repitiera usando pacientes con mejor situacin (y por ello mejor alimentados, con ms instruccin o con hbitos de vida ms saludables), las dos tasas fueran esencialmente iguales, quizs porque en tal caso la desventaja
fisiolgica inherente a la vejez no se expresara a travs de la infeccin.
De modo que en un caso como el que nos ocupa, en el que el enfoque de identificar un superuniverso parece ineludible, la identificacin de aquel que resulte
adecuado no es una tarea susceptible de ser resuelta mecnicamente, sino que,
una vez ms, reclama el concurso del sentido comn, del conocimiento profundo
de la materia y, al fin, de una inevitable dosis de subjetividad. Ahora imaginemos
que se ha hecho el mismo estudio y que se obtuvieron los mismos resultados pero a partir ele una muestra de pacientes del hospital en cuestin. Se hace la prueba estadstica y se consigue rechazar la hiptesis de nulidad. Lo usual es que el
investigador afirme sin ms que se ha hallado suficiente evidencia muestral de
que la incidencia de infeccin es mayor entre ancianos que entre jvenes.
Pero, en qu poblacin es esto as?, cul es el alcance poblacional de la inferencia? Normalmente la respuesta a esta pregunta queda en un limbo conceptual puesto que, bajo el amparo de que se ha trabajado con una muestra, la pregunta no llega a formularse explcitamente. Sin embargo, el hecho de que se
haya operado con una parte de los pacientes de ese hospital durante ese ao, y no
con todos ellos, no cambia la realidad de que el verdadero inters del investigador no se concentra en lo que pudo haber ocurrido en ese sirio y en ese momento. El papel que en este caso pudo haber tenido una seleccin formal no radica en
que cambie la naturaleza de la pregunta, sino en la contribucin a la imparcialidad de la seleccin que aporta tal procedimiento dada la inconveniencia o im2

Por cierto, si esto ocurre o no con esas dos magnitudes depende de los tamaos de los grupos comparados.

280

DISEO RAZONADO DE MUESTRAS

posibilidad de estudiar a toda la poblacin. La necesidad de un superuniverso,


por tanto, sigue igualmente vigente.
Por otra parte, en estrecha relacin con todo el problema est la necesidad
de superar la conviccin, presente en algunos equipos investigadores, de que su
trabajo es el que dar la respuesta a la pregunta planteada, cuando en realidad
seguramente se tratar de un trabajo ms, llamado a sumarse al debate que la
comunidad cientfica desarrolla sobre el problema. Ese trabajo debera arriesgar una propuesta de superuniverso, se haya sacado una muestra formal o no;
en su momento se irn produciendo las acotaciones o enmiendas que procedan.
Slo el cotejo con otros esfuerzos y el examen integrado de resultados acaso
ayudado por enfoques como el del metaanlisis y en medio de un permanente
proceso de ajustes ser capaz de generar respuestas cientficamente fructferas.
Hace casi medio siglo que el clebre estadstico Frank Yates advirti (Yates.
1951):
El nfasis en las pruebas de hiptesis v la consideracin de los resultados de
cada experimento separadamente han tenido la desafortunada consecuencia
de que los trabajadores cientficos han considerado con frecuencia la ejecucin
de una prueba de significacin o un experimento como el objetivo ltimo; actan sabr la base de que las resultados o son o no son significativos v de que
ste es el fin de todo.

Los propios creadores de las pruebas de hiptesis, Egon Pearson y Jerzy Neyman, advirtieron con toda transparencia que stas no fuesen utilizadas a la manera en que, en definitiva, se hace a diario: como instrumentos para evaluar la
validez o la falsedad de una ley cientfica. En sus propias palabras (Neyman y
Pearson, 1933), advertan:
Ninguna prueba basada en la teora de probabilidad puede por s misma generar ndices vlidos sobre la verdad o la falsedad de una hiptesis. Las pruebas de hiptesis deben ser miradas desde otra perspectiva. Siguiendo la regla
de aceptar o rechazar una hiptesis no estamos diciendo nada definitivo sobre
si la hiptesis es o no verdadera... Lo que se puede demostrar es que si somos
consecuentes con esa regla, a la larga, la rechazaremos cuando sea cierta no
ms, digamos, que una de cada 100 veces: adicionalmente, la rechazaremos
con alta frecuencia cuando sea falsa.
Nota: Cabe intercalar que la problemtica que estamos considerando (procede o no hacer inferencias cuando se trabaja con una poblacin y no con una muestra formal?) queda intrnsecamente despejada cuando el anlisis se desarrolla en el marco bayesiano en lugar de en el entorno
frecuentista habitual.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

281

El enfoque bayesiano asume como algo natural el hecho de que los parmetros de inters (en
este caso, la diferencia entre las tasas tericas de infeccin) son variables sujetas a las leyes probabilsticas.
La tarea que esta teora se traza, justamente, es la de caracterizar nuestro conocimiento del
problema por conducto de dichas leyes. Ms concretamente, ofrece herramientas para combinar
lo que en un momento dado consideramos que constituye una presentacin atinada de nuestro
conocimiento del problema con datos empricamente obtenidos como los del mencionado estudio hospitalario para producir una nueva representacin probabilstica actualizada.
La teora bayesiana desborda claramente el nivel y el contexto natural del presente libro, pero consideramos oportuno consignar al menos su existencia, as como sealar la pujanza con que
ha venido revitalizndose en los ltimos aos, tal y como queda fundamentado en trabajos como
Davidoff (1999), Goodman (1999) y Silva (1999).

12.1.4. Informacin autorrepresentada


Consideremos, para concluir, una situacin cualitativamente diferente. El decano de la facultad de medicina observa que en 1998 el 84% de los alumnos
termin exitosamente el primer ao, en tanto que en 1999 este porcentaje cay
al 77%. Ante tales datos, acudir a un estadstico para que los analice y le informe si tal reduccin es o no significativa carece de todo sentido.
Es imprescindible comprender que el problema que en ese punto est considerando el decano no es de naturaleza estadstica; disciplina que termin su funcin
tan pronto como los datos fueron resumidos. Ahora corresponde a un especialista pedaggico, a un poltico o (si se quiere demorar el asunto) a una comisin,
pronunciarse sobre la significacin cualitativa de los datos. Si esa diferencia de
7% es o no alarmante, si merece o no una indagacin ms profunda, si cabe adoptar o no medidas especiales, ya son cuestiones que no pertenecen a la rbita estadstica. Lo que ocurre es que en este caso no hay ninguna poblacin razonable,
ni hipottica ni real, ni finita ni infinita, a la cual extrapolar los resultados: tenemos toda la informacin posible y el papel de la estadstica se redujo a resumirla
con el fin de facilitar la descripcin, sin margen alguno para la extrapolacin.

12.2. Problemas del marco muestral


El marco muestral disponible suele no ser perfecto. Raras veces el marco
cumple todas las condiciones relevantes: contener exactamente a todas las unidades, que stas aparezcan dentro del marco en una y slo una ocasin y, adems, que todo elemento ajeno a la poblacin de inters est excluido.
La falta de cobertura fue considerada en la Seccin 12.1.1. Pero a veces se
presenta el problema contrario: el marco disponible contiene individuos regis-

282

DISEO RAZONADO DE MUESTRAS

trados en ms de una ocasin o sujetos que no conciernen al estudio. La primera


situacin slo se mitiga procurando limpiar el marco de duplicidades, pero el
segundo caso suele ser inevitable, aunque tiene una solucin relativamente simple.
Imaginemos que nuestro estudio concierne a mdicos con al menos cinco
aos de experiencia como tales, pero que contamos con una base de datos en que
aparecen registrados todos los mdicos actuantes en cierta regin, de los cuales
desconocemos el dato mencionado. Probablemente sea impracticable la idea de
limpiar el marco; es decir, eliminar del listado, antes de la seleccin, a los mdicos con menos de 5 aos de experiencia. Mucho ms econmico (y. por tanto,
ms eficiente) sera obtener una muestra empleando ese marco o listado disponible y retener en ell a slo a quienes cumplan la condicin de poseer ms de
5 aos de experiencia laboral. Habra que seleccionar, eso s, un nmero mayor
de sujetos para luego quedarnos con el nmero deseado del tipo de individuos
que interesan. Si se hubiera planificado contar con n sujetos en la muestra y se
piensa que una fraccin (0 1) del listado est formado por individuos
ajenos a nuestro inters, se tomarn n*, resultado de dividir n por 1 .
Es importante notar que tal estrategia no modifica las probabilidades originales otorgadas a los sujetos que verdaderamente integran la poblacin de inters.
As, si la muestra de n* fuera, por ejemplo, equiprobabilstica, la submuestra que
resulte tras la eliminacin, seguir sindolo.
Kish (1965), en diversos segmentos de su libro, incluye consideraciones prcticas de suma utilidad para el enfrentamiento de estos problemas.

12.3. El problema del tamao muestral


He tratado este tema con mucho detalle en un libro reciente (Silva. 1997).
No agregar ahora mucho ms a aquellas ideas. Sin embargo, considero oportuno incluirlas nuevamente en este texto ms especfico (con algunas matizaciones adicionales) en virtud de la singular relevancia que le confieren dos
circunstancias: por una parte, que la tarea de determinar un tamao muestral
es obviamente ineludible y, por otra, que el tema sigue produciendo abundantes malentendidos.
No obstante haber sido profusamente tratado en libros y artculos, a pesar de
que se explica en clases y conferencias y de que existen programas informticos y tablas ad hoc para hacer determinaciones de tamaos mustrales, el asunto parecera renuente a dejarse dominar por los interesados. Llegado el momento de calcular el tamao muestral, muchos investigadores, yo dira que la
mayora, se sienten incapacitados para hacerlo por s solos o, en el mejor de los
casos, inseguros con lo que han hecho.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

283

En la Seccin 11.1 ya se haba subrayado que deban reconocerse dos situaciones bien diferenciadas:
a) aquella en que se necesita determinar el tamao muestral necesario para
realizar estimaciones,
b) cuando se est planificando un estudio analtico, sea de tipo observacional
o experimental, y lo que se quiere es determinar los tamaos mustrales correspondientes a los grupos involucrados en una futura prueba de hiptesis.
La primera de ellas corresponde, en esencia, a los llamados estudios descriptivos. Por ejemplo, diagnsticos de salud, caracterizaciones epidemiolgicas, o
estudios de prevalencia que requieren de estimaciones paramtricas (fundamentalmente de porcentajes, razones, medias, varianzas y totales poblacionales), as
como estudios que, tambin con afn descriptivo, requieren de la estimacin de
otros parmetros como coeficientes de correlacin o de regresin.
En la segunda situacin, el anlisis no se cie a conocer la magnitud de algo,
sino que exige en algn punto hacer uso de la comparacin entre parmetros
correspondientes a distintas subpoblaciones. En efecto, en el entorno analtico, el
examen estadstico de los datos suele conducir a maniobras tales como la comparacin estadstica de porcentajes o medias, o a la evaluacin de la significacin de coeficientes de concordancia o de correlacin3.
Ambos procesos demandan el manejo de muestras, y es natural que, trtese
de lo uno o de lo otro, se desee operar con la menor cantidad posible de unidades
de anlisis con el fin de economizar recursos. El problema consiste en hallar
ese nmero mnimo de unidades con el cual puedan resolverse eficientemente tales tareas.

12.3.1. Repasando la teora oficial


En las Secciones 3.7 y 10.3 se expuso lo que pudiramos llamar la teora oficial sobre el tema; es decir, lo que uno puede hallar al respecto en un texto
convencional. Curiosamente, a pesar de ser uno de los temas ms borrosamente
solucionados por la estadstica, la uniformidad del tratamiento que le dan los textos es casi total (y se reduce en lo esencial al contenido que se expuso en aquellas Secciones); ello hace pensar a muchos que la interfaz entre la teora y la
prctica correspondiente est completamente consolidada y carece de fisuras.
Desde hace relativamente poco tiempo contamos, incluso, con una especie de
portavoz de ese oficialismo: un libro exclusivamente destinado al tema, debido a
Lemeshow, Hosmer, Klar y Lwanga (1990), publicado entonces por la prestigiosa editorial Wiley, pero heredero del manual de Lwanga y Lemeshow (1989),
3

Ntese que, de hecho, en este ltimo caso se trata tambin de comparar; lo que se compara es el coeficiente (por ejemplo, de correlacin) con el nmero cero.

284

DISEO RAZONADO DE MUESTRAS

publicado varias veces por la Organizacin Mundial de la Salud. La existencia


de este libro, titulado Correccin del tamao muestral en estudios de salud,
constituye, por su alta especificidad temtica, una magnfica referencia para el
examen que sigue.
Para el caso de estimar un porcentaje bajo MSA, se recordar (Seccin 3.7)
que la frmula universalmente aceptada es la siguiente:
n0
n 1
1+ 0
N

[12.1]

Z12 / 2 P(100 P)
E02

[12.2]

n=

donde

n0 =

en la cual Z1/2 representa al percentil (1 /2) 100 de la distribucin normal estandarizada (por ejemplo, si = 0.05, entonces Z1/2 = Z0,975 = 1.96). N es el tamao poblacional y E0 es el mximo error absoluto que el investigador est dispuesto a admitir al estimar P.
Se plantea que usualmente se puede tener una idea aproximada del valor de
P a partir de un estudio piloto, o de una investigacin similar realizada anteriormente4.
Imaginemos que se trata de una poblacin de N = 2.800 sujetos hospitalizados sobre la que se realiza un estudio de satisfaccin. Admitamos, como es
usual, que se trabajar con una confiabilidad del 95% ( = 0,05) y que un E0 = 3%
se considera aceptable. Finalmente, consideraremos P= 86%, idea aproximada que se ha obtenido, por ejemplo, a partir de un estudio anterior. As las cosas, la aplicacin de [12.1] y [12.2] arroja que n = 434.
Ahora bien, sta es la solucin que se da al caso en que se usa el muestreo
simple aleatorio. Si el diseo muestral es otro, en particular si se trata de un
muestreo en etapas (que es el que se utiliza por lo menos 90 de cada 100 veces
en la prctica), el error que regularmente se comete al estimar P es mayor que
el que corresponde al MSA (supuesto, desde luego, que se est usando el mismo tamao de muestra). Dicho de otro modo: con muestreo por conglomerados, para alcanzar el grado de precisin prefijado, es necesario seleccionar una
muestra de tamao mayor que el que demanda el MSA.
La sugerencia que se da entonces es, simplemente, multiplicar el tamao
surgido de [12.1] por un nmero mayor que la unidad: el llamado efecto de diseo, usualmente denotado como deff (vase Seccin 8.6).
4
Otra variante consiste en poner directamente P 50; de ella ya nos ocuparemos especficamente en la Seccin 12.8.2.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

285

Es decir, el tamao corregido n, sera:


nc = (deff)(n)

[12.3]

Lemeshow y sus tres coautores, refirindose al MSA, dicen textualmente lo


siguiente:
ste nunca sera el diseo empleado en una encuesta de terreno verdadera. Como resultado de ello, el tamao de muestra ha de elevarse en una magnitud igual al efecto de diseo. Por ejemplo, si se fuera a utilizar maestreo
por conglomerados, pudiera estimarse que el efecto de diseo es igual a 2.

12.3.2. Seis realidades escamoteadas


Hasta aqu, la sntesis de la solucin oficial para la situacin ms simple
dentro de los estudios descriptivos. Como veremos de inmediato, este planteamiento contiene demasiadas pldoras difciles (algunas, imposibles) de tragar.
Lamentablemente, el discurso oficial tiende a ejercer un tipo de censura que silencia casi todos los problemas reales, o suple su solucin con formulaciones
acadmicas de escasa o nula aplicabilidad. Varios puntos son usualmente omitidos (algunos, a cal y canto) cuando se aborda el tema. A continuacin se analizan seis de ellos tomando como paradigma, nuevamente, el caso ms simple: la
estimacin de P en el contexto descriptivo y del MSA5.
A) La demanda inicial es directamente absurda
Retomemos el ejemplo de la seccin precedente: para conocer el porcentaje
de pacientes satisfechos se haba fijado E0 = 3% y Z1/2 = 1,96, y se saba que
N 2.800; pero para hacer uso de [12.2] es necesario conocer nada menos que el
propio valor de P, el porcentaje de pacientes satisfechos.
Menudo crculo vicioso!: todo el proceso tiene como finalidad conocer el valor de P pero, para empezar a desarrollarlo, es necesario conocer precisamente P.
Ntese que no se trata de un detalle lateral: un enfoque riguroso aconsejara detener el proceso en este punto por elementales razones de coherencia. El planteamiento es anlogo, por poner un ejemplo, a que un viajero que se halle en La Habana y quiera trasladarse a Madrid, slo pueda adquirir el billete de avin que lo
conduzca a Madrid acudiendo personalmente... a una oficina radicada en Madrid.
B) Subjetividad en la determinacin de los datos que exigen las frmulas
La pre-estimacin de P es, desde luego (lo anterior ya nos convence de
ello), un acto intrnsecamente cargado de subjetividad. Pero vale la pena recalcarlo con la siguiente consideracin: puesto que vamos a trabajar con una
5

Para casos ms complejos, la situacin no hace sino agravarse.

286

DISEO RAZONADO DE MUESTRAS

idea aproximada del valor de P, estamos condenados a conocer slo una idea
aproximada del valor del n necesario. Si aquella aproximacin fuera mala (muy
errnea), as ser el tamao muestral, algo altamente inconveniente. Pero si, en
cambio, estuviramos verdaderamente persuadidos de que la pre-estimacin de
P fuera muy cercana a su verdadero valor, entonces la situacin sera directamente absurda, porque en tal caso no hara falta hacer tal estimacin, y. consiguientemente, mucho menos necesario sera el cmputo de n.
Examinemos ahora los otros elementos de la frmula. En el ejemplo, verosmilmente podra contarse, como supusimos antes, con un estudio previo que hubiese arrojado un 86% de hospitalizados que estuvieran satisfechos; pero tambin
es posible que una pequea encuesta piloto hubiese producido una pre-estimacin
de, por ejemplo, 80%. Cmo escoger entre ambas alternativas? Qu argumentos puede esgrimir alguien que defienda una de las dos para rechazar la otra?
Por otra parte, se supone que hay un error mximo que se puede aceptar;
sin embargo, no siempre resulta fcil la identificacin a priori de esa cota. Esta
tarea exige del investigador que piense en unos trminos para los que con frecuencia no est preparado. Pero esto no es atribuible al mtodo, sino a sus usuarios. Lo verdaderamente crucial es comprender que, ineludiblemente, se trata de
una decisin esencialmente subjetiva. Volvamos al ejemplo: qu error ha de
considerarse suficientemente pequeo como para que resulte admisible? No
parece existir rbitro alguno que determine sin margen para el debate si un error
de un 3% (como habamos supuesto en el ejemplo) es admisible: o si, para que
lo sea, ste no debe exceder, por ejemplo, el 2% de pacientes satisfechos. Algo
muy similar ocurre con la confiabilidad 1 . Tomar 0.95%?, o 0.99%, como sugieren otros con no menos argumentos?
A todo este monto de subjetividad hay que aadir la que se deriva de que los
diseos son, por lo general, totalmente diferentes al muestreo simple aleatorio. Como bien sabemos, los errores mustrales en el caso de muestras complejas no slo dependen del tamao total de la muestra, sino tambin de las asignaciones muestrales a los estratos y de los tamaos de muestra en las etapas intermedias (es decir,
del nmero de conglomerados en cada etapa y de los tamaos mustrales dentro
de los que se elijan) cuando, como ocurre casi siempre, se usa muestreo polietpico.
Este hecho, cuando no se pasa por alto, se resuelve a travs del coeficiente expansor del tamao muestral: deff. Aqu comparece un acto de prestidigitacin numrica: el libro destinado a dar soluciones tcnicamente fundamentadas se limita (como
consignamos en la Seccin 12.3.1) a comunicar que el deff pudiera estimarse como igual a 2. Naturalmente, lo esperable es que el investigador que acuda al libro
para buscar su receta, proceda siempre de ese modo: multiplicar por dos el tamao
muestral obtenido bajo el supuesto de MSA. En el recurso de ayuda que aparece
en el mdulo STATCALC de EPIINFO, en concordancia con el talante ms realista
que caracteriza a este sistema, se sugiere elegir un deff entre 1.5 y 2,0, variante
ms flexible, pero no menos subjetiva (e, incluso, arbitraria).

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

287

Uno se pregunta: para qu tantas frmulas previas y tantas tablas, si a la postre hay que multiplicar el nmero tan arduamente obtenido por dos, un factor
balbuceado a partir de una especulacin cuya pertinencia es totalmente discutible? Se podra argir que el efecto de diseo suele ser de esa magnitud. Pero
es falso: basta echar una ojeada a algunos estudios que calculan los deff para
corroborar que este nmero cambia radicalmente de una encuesta a otra, de un
diseo muestral a otro y que, incluso dentro de la misma encuesta y del mismo
diseo, suele modificarse notablemente en dependencia del parmetro elegido.
Por ejemplo, en un estudio ad hoc relacionado con encuestas demogrficas y de
salud, Verma y Le (1996) comunican valores de deff que van desde 1 hasta 9,
con una media de 2,25. Lo cierto es que con el deff' se hace la contribucin final
a la de por s abultada coleccin de elementos subjetivos que inexorablemente
intervienen en este proceso.
A modo de ilustracin del efecto que puede tener tal carga subjetiva, computemos los tamaos de muestra que se obtendran con dos juegos de posibles decisiones adoptables en el marco de las alternativas que hemos venido considerando. La Tabla 12.1 recoge los resultados correspondientes a dichos dos juegos
(ambos igualmente razonables y, ciertamente, escasamente discordantes), computados usando [12.1], [12.21 y [12.3J.
Tabla 12.1. Tamaos muestrales necesarios para estimar cierta prevalencia
segn dos juegos de decisiones iniciales
Alternativa 1

Alternativa 2

Tamao poblacional (N)


Prevalencia (P)
Mximo error (E0)

2.800
86 %
3%

2.800
80 %
2%

Confiabilidad (1)
Efecto de diseo (deff)

0,95

0,99

1,5

2,0

Tamao muestral

651

2.726

Quiere esto decir que dos investigadores independientes, siguiendo la misma


estrategia general (usando las mismas frmulas para la estimacin del mismo parmetro), obtendran tamaos abismalmente diferentes, slo por el hecho de que
aprecian (legtimamente ambos) de manera ligeramente distinta6 los valores que
deben darse a los elementos que las frmulas demandan. Podr mantenerse que,
al usar las frmulas, se est empleando un mtodo medianamente objetivo?
6

Pudiera pensarse que la diferencia entre una confianza del 95% y una del 99% no es pequea: pero debe recordarse que, si se decidiera trabajar con confiabilidad mayor del 95%, segn el ritual consagrado, se escoger 99%, nunca 96,7% o 98,3%. De modo que si alguien siente que 95% no es un nmero suficientemente grande,
habr de admitir que 99% es cualitativamente el nmero ms cercano a 95% por el que se optara.

288

DISEO RAZONADO DE MUESTRAS

Por otra parte, cualquier investigador honesto reconocer que, usualmente, ha


llevado el proceso de determinacin de tamaos mustrales al revs: ha ido escogiendo los valores de P, , E0 y deff de manera tal que la frmula [12.3] arroje aquel valor que, ms o menos, ha decidido de antemano. Es precisamente el
marco de subjetividad que inevitablemente padece el proceso el que permite,
promueve, e incluso da cierta legitimidad a tal manipulacin.
C) Casi nunca se quiere estimar un nico parmetro
Una encuesta, en la realidad, nunca se proyecta para estimar uno o dos parmetros, sino que normalmente exige realizar decenas o incluso cientos de estimaciones. Debe notarse que una tabla demanda una estimacin por cada celda y,
en ocasiones, suelen construirse muchas tablas con varias celdas en cada cual. Es
evidente, entonces, que no resulta demasiado prctico aplicar frmulas como la
examinada para cada uno de estos parmetros. Por lo pronto, a nadie, que yo sepa, se le ha ocurrido sugerir tal absurdo.
Pero, aunque ello fuese factible, y aunque se contara con informacin disponible para hacerlo, nos encontraramos con un panorama contraproducente: los
tamaos que demandaran las diferentes estimaciones recorreran, probablemente, un amplsimo espectro de valores, todos candidatos a ser el tamao
muestral con el que a la postre se trabajara (ste s, necesariamente nico).
Esta polivalencia suele ocultarse bajo la premisa de que se puede elegir el parmetro ms importante (en el mejor de los casos, los dos o tres ms importantes). Obviamente, incluso suponiendo que tuviera sentido hacer tal discriminacin7, el margen de subjetividad para decidir cules son tales parmetros ms
importantes es enorme. Y aun as, esos ms importantes pueden dar lugar a
nmeros muy dispares entre s.
D) Carcter reductor de los tamaos mustrales inducidos
por la necesidad de realizar estimaciones dentro de subclases
Lo usual es que se seleccione una muestra general de unidades y luego se hagan, adems de anlisis globales, otros circunscritos a subconjuntos de la poblacin, basados naturalmente en los correspondientes subconjuntos muestrales,
cuyos tamaos son necesariamente menores (a veces mucho menores) que el de
la muestra original.
Por ejemplo, en el estudio de los pacientes hospitalizados que se ha bosquejado, es muy probable que se quieran hacer estimaciones del porcentaje de sujetos satisfechos, no slo para toda la poblacin de hospitalizados, sino tambin
para cada uno de los sexos, o segn servicios del hospital, o con acuerdo a lapsos de estancia hospitalaria.
7

Es muy probable que no existan parmetros ms importantes: los problemas suelen exigir enfoques integrados, que superen su desconcatenacin metafsica en parcelas.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

289

De hecho, muchas sesudas formulaciones para determinar tamaos de muestra pasan totalmente por alto que ms tarde se harn estimaciones dentro de
subconjuntos para los que las muestras necesariamente se reducen, en algunos
casos muy notablemente.
En sntesis, lo que se quiere subrayar en este punto es que, al computar un
tamao muestral empleando frmulas, normalmente se acta pensando en estimaciones para la poblacin completa; pero el error mximo que se est dispuesto a cometer y que se usa con el fin de realizar aquella determinacin, resulta mucho menor que el que verdaderamente se comete en el fragor de la
tabulacin verdadera. Ejemplos reales de este fenmeno se exponen detalladamente en las Secciones 12.6 y 12.8.3.
E) El costo de los procesos es casi siempre mucho ms determinante
que cualquier consideracin terica
Realizar el anlisis del tamao muestral sin pensar en trminos de eficiencia
carece de sentido: si no hubiese limitaciones de recursos, en muchos casos no
se planteara siquiera el uso de muestras, sino que se investigara ntegramente la
poblacin. Las disponibilidades de tiempo, personal y presupuesto deben ocupar
(y de hecho ocupan) un lugar determinante en las decisiones, aunque muchas veces la influencia de esta limitante se ejerza de manera implcita o solapada.
Debe decirse que existen numerosos esfuerzos tericos para hacer intervenir
los aspectos econmicos en la solucin del problema del tamao de muestra. Por
ejemplo, a lo largo del libro de Hansen, Hurwitz y Madow (1953) el lector hallar no pocos desarrollos formales acerca de cmo determinar valores ptimos
para el nmero de conglomerados, o para las asignaciones de tamaos a estratos,
en diseos que involucran ese tipo de decisiones. Se trata, sin embargo, de frmulas en general extremadamente abigarradas cuya aplicacin exige especificaciones cuantitativas previas sobre costos y variabilidades que slo pueden conocerse de antemano mediante el procedimiento de... inventarlas.
Consideremos el siguiente ejemplo, en que se quiere realizar un muestreo
trietpico de escolares para estimar una media poblacional. Segn el diseo,
primero se eligen m escuelas, en cada una de ellas se tomarn como promedio
n grupos o aulas y, finalmente, dentro de cada uno de estos ltimos, se elegir un
nmero medio de q alumnos. Los nmeros m, n y q que maximizan la precisin
para un presupuesto total disponible igual a C unidades monetarias, segn Hansen, Hurwitz y Madow (1953) (concretamente, vase Captulo 19. Seccin 19 de
dicho libro) se determinan a travs de [12.4].

q=

Ww
Wb2 Ww2 / Q

C2
C3

1 Ww
n=
q B

C2
C3

C
m=
C1 + C2 n + C3 nq

[12.4]

290

DISEO RAZONADO DE MUESTRAS

donde Q es el nmero medio de alumnos por escuela (computado usando el total


de escuelas de la poblacin). C1 es el costo que supone acceder a una escuela,
C2 el de contactar a un grupo, y C3 el de encuestar a un alumno. Ww, Wb, y B son
complejsimas expresiones que representan medidas de variabilidad relativa entre y dentro de las unidades de muestreo.
Los valores de estos 8 parmetros (C, C1, C2, C3, Ww, Wb, B y Q) han de conocerse antes de realizar el estudio8. Creo que no es menester extenderse demasiado enfatizando el carcter quimrico que tiene la aspiracin de aplicar toda esta parafernalia formal, habida cuenta del laberinto en que ya nos colocaba el
sencillsimo problema del tamao muestral para estimar un modesto porcentaje
en el contexto del MSA. La influencia del presupuesto disponible se concreta
en la prctica de manera sencilla y directa; frmulas como [12.4] posiblemente
no se hayan aplicado jams a lo largo de los ltimos 40 aos.
F) Se deben estimar parmetros de diversa naturaleza
Usualmente se computa un tamao muestral para estimar una media o un porcentaje dados, y se opera con la frmula correspondiente. Pero ms tarde, en el
estudio propiamente dicho, suelen hacerse estimaciones de todo tipo de parmetros, tales como coeficientes de correlacin, pendientes de regresin o coeficientes de concordancia.
En el mejor de los casos, se construyen intervalos de confianza para estos parmetros (saludable prctica que permite aquilatar el grado de conocimiento alcanzado sobre el parmetro en cuestin); pero casi nunca se utilizan procedimientos formales para establecer el tamao muestral con que sera necesario
trabajar en estos casos.
Desde luego, tales frmulas existen9, aunque nadie las recuerde, quizs debido
a que son muy complicadas y sobre todo por las exigencias de conocimiento
previo que las reducen a ser ejemplos de inters meramente acadmico. Pero si
los cultores de la objetividad quieren ser coherentes, no deberan actuar como
si dichos parmetros no fueran luego a ser estimados. Tal conducta recuerda el
conocido chiste de quien busca las llaves extraviadas en la vecindad de un farol,
no porque se hayan perdido all, sino porque sa es la zona iluminada.

8
Ntese que en esta formulacin no aparecen la confiabilidad ni el error mximo admisible porque el criterio usado no se basa en poner una cota al intervalo de confianza, sino en optimizar la precisin dentro de una
restriccin presupuestaria.
9
Por ejemplo, Hsieh (1989) ha hallado una solucin para el tamao muestral exigido al aplicar una regresin
logstica en el caso del MSA. No creo que exista para el caso de la regresin logstica bajo muestreo en etapas,
aunque no sera demasiado difcil construir una propuesta.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

291

12.3.3. El caso de las pruebas de hiptesis


Aunque el pormenorizado recorrido que hemos hecho se ha ceido a la situacin en que lo que se quiere es hacer una estimacin, virtualmente todo lo
que se ha dicho es vlido para el caso en que se procura determinar el tamao
muestral para un estudio analtico, como se deriva de las siguientes observaciones.
a) Las decisiones previas (vase Seccin 10.3) sobre , , P 1 , P2. etc., son
necesariamente, en una u otra medida, dependientes de la subjetividad.
b) A menudo no solamente se aplica aquella prueba de significacin que fue
tomada como base para fijar el tamao muestral10: no es extrao que se
apliquen 5. 10. o ms pruebas diferentes. Qu sentido puede tener un
complejo anlisis acerca de la potencia de la prueba, si en la prctica
se realizan luego, con todo desenfado, 17 pruebas de significacin?
c) Ocasionalmente se hacen comparaciones entre parmetros no inherentes a
la poblacin original, sino a subconjuntos de sta. se es el caso frecuente, por ejemplo, de la postestratificacin. Por ejemplo, se determina que el
estudio debe abarcar 200 casos y 200 controles. Pero en el curso del anlisis se discuten problemas para subconjuntos de esos casos y controles; se
toman, digamos, slo los ancianos (por ejemplo. 43 casos y 56 controles)
y se examina con esa informacin si cierto odds nio difiere significativamente de la unidad o no; otro tanto se hace con las mujeres, con los hipertensos, con los que poseen nivel universitario, etc. Y no es que tales
maniobras sean condenables; todo lo contrario: es por ser enteramente
lgicas, e incluso inevitables, que en este tipo de estudios la discusin inicial del tamao muestral global termina siendo casi un ejercicio numerolgico intrascendente.
d) Los problemas de costo son tanto o ms influyentes en este tipo de estudios que en los descriptivos. Siempre recuerdo que, a poco de concluir mis
estudios universitarios especializados en estadstica matemtica, me toc
asesorar a un bioqumico que planificaba un experimento con ratones de
alta pureza gnica, quien quera conocer a cuntos de ellos deba aplicar
cierto tratamiento estrognico y a cuntos no. Empleadas las frmulas de
mis libros, obtuve cifras del orden de las centenas; pero unos minutos ms
tarde qued paralizado por el dato de que, bajo concepto alguno, se poda
aspirar a trabajar con mas de 40 ratones en total, debido al elevadsimo
costo de cada uno. Tal restriccin, por otra parte, era consistente con lo
que recoga la literatura al uso sobre el tema.
10

Debe consignarse que este fenmeno se produce con menos intensidad que en los estudios descriptivos. En
algunos estudios (sobre todo en el ambiente clnico) puede ocurrir que se realice una nica prueba de significacin.

292

DISEO RAZONADO DE MUESTRAS

e) Aunque se estime el tamao de muestra necesario para probar la diferencia de dos porcentajes o evaluar la diferencia entre un odds ratio y la unidad, no es infrecuente que en el mismo estudio se hagan pruebas para contrastar, adems, otras hiptesis no consideradas en el proceso de elegir el
tamao, relacionadas por ejemplo con coeficientes de correlacin de un
modelo de regresin mltiple o logstico.
f) Una frmula como [10.1] se deduce a partir del supuesto de que se ha
realizado un MSA, circunstancia casi desconocida en la epidemiologa y
la investigacin clnica actuales.

12.3.4. Reconocimiento de lo subjetivo


Algunas de las fuentes de subjetividad que plagan, como hemos visto, a este
proceso son ocasionalmente reconocidas en tal calidad por la literatura, pero lo
tpico es que no se haga mencin alguna a ellas, o se den explicaciones doctrinarias como la que aparece en un reciente artculo (Meja, Fajardo, Gmez et
al., 1995):
... podra parecer que la suposicin de estos valores es extremadamente
arbitraria; sin embargo, es mejor intentar esta aproximacin a llevar a
cabo el estudio sin intentarlo...
Curiosa afirmacin; lamentablemente, lo que no nos dicen Meja y sus ocho
colaboradores es por qu es mejor hacer suposiciones extremadamente arbitrarias sobre los datos de que depende el tamao muestral antes que elegir ese tamao directamente desde nuestra subjetividad.
Como ya expuse antes, la mayora de los textos y de los profesores pasan por
alto estas realidades. Afortunadamente, hay algunas excepciones; una de ellas
es, en mi opinin, notable, pues se encuentra en el famoso libro de Rothman
(1986) quien, aunque sin desarrollar las ideas in extenso, reconoce con crudeza
la inviabilidad de una solucin terica cuando escribe:
En resumidas cuentas, el problema de determinar el tamao de muestra ms adecuado no es de naturaleza tcnica; no es susceptible de ser
resuelto por va de los cmputos, sino que ha de encararse mediante el
juicio, la experiencia v la intuicin.
En la redimensionada versin de este libro, Rothman y Greenland (1998) aluden vagamente a la existencia de frmulas, pero reiteran el carcter relativo de
su utilidad.
Sin embargo, lo que se ha consolidado entre estudiantes e investigadores es la
conviccin de que para cada problema existe un nmero que puede ser descu-

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

293

bierto por los especialistas, independientemente del enfoque personal; un nmero que puede determinarse tcnicamente por aquellos elegidos, capaces de
desentraar complejas formulaciones. Muchos metodlogos profesionales pueden poner (y, de hecho, lo hacen) en un serio aprieto a modestos investigadores
exigindoles que justifiquen formalmente el tamao muestral que han elegido
por analoga con lo que han visto en la literatura, o porque es el que permiten sus
recursos. Irnica circunstancia, pues me temo que la inmensa mayora de los
propios inquisidores se veran en similar dificultad si, en lugar de dedicarse a pedir respuestas, tuvieran que producirlas11. En tal caso, quizs acudiran a la aplicacin de frmulas que, como se ha explicado e ilustrado, contienen una carga
de subjetividad acaso mayor que la de quien elige el tamao muestral guiado por
su propio y saludable sentido comn.

12.3.5. Finalmente, qu hacer?


Lo ms importante es comprender que cualquiera que sea el tamao ele
muestra, tanto los errores de muestreo como la probabilidad de rechazar errneamente una hiptesis de nulidad pueden ser calculados a posteriori. O sea,
tanto las frmulas para el cmputo de errores como las de los estadgrafos en que
se basan las pruebas de hiptesis contemplan explcitamente los tamaos muestrales empleados; en ambos casos la estructura de esas frmulas es tal que el investigador se ver imposibilitado de sacar partido concluyente a la informacin
si el tamao de la muestra fuera insuficiente.
Los investigadores se sienten a menudo desconcertados e inseguros por la
simple razn de que se les impone una teora desconcertante e insegura, plagada de inalcanzables exigencias. Los tericos hacen sus elegantes propuestas y.
si surgen cuestionamientos a los absurdos en que se basan o a las endebleces que
padecen, miran hacia otro lado. Uno no puede menos que recordar la frase de
Churchill: En ocasiones, el hombre tropieza con la verdad; pero, casi siempre,
evita caerse y sigue adelante.
Los investigadores reales, en cambio, no pueden usar el cmodo recurso de
hacerse los entretenidos, pues verdaderamente necesitan de un tamao muestral
concreto, no para hacer manuales basados en recetas mgicas, sino para llevar
adelante estudios tangibles. Cul es, finalmente, la recomendacin que han de
seguir estos ltimos ante tan acuciante exigencia prctica, que no puede esperar
por soluciones que hoy se ignoran?

11

No en balde el notable socilogo norteamericano Wright ( 1 9 6 1 ) lanzaba varias dcadas atrs la exhorta-

cin: Metodlogos: a trabajar!.

294

DISEO RAZONADO DE MUESTRAS

Como siempre, roto el hechizo, todo es simple. No me sonrojo al decir que,


a partir de los recursos disponibles, resulta preferible usar el sentido comn y
tener en cuenta los tamaos usados en trabajos similares (es decir, incorporar el
sentido comn de los dems). Porque cada problema tiene, no lo olvidemos,
una historicidad a la que debe prestarse atencin. As, por ejemplo, un estudio
longitudinal de 200 sujetos sanos para estudiar los factores de riesgo convencionales para las cardiopatas resulta, a estas alturas, histricamente absurdo.
Despus de contar con resultados como, por poner un ejemplo, el estudio de Framingham, en que se ha operado con cohortes de miles y miles de sujetos, ninguna frmula puede justificar que trabajemos con 200 individuos.
Cabe aclarar, por lo dems, que no tengo ninguna enemistad principista hacia
las frmulas; no necesariamente me parece mal que se empleen en ciertos casos
siempre que se haga de modo flexible, se reconozcan sus enormes limitaciones y
se complementen con una reflexin crtica y abarcadora.
En cualquier caso, es ilustrativo reparar en que no casualmente la inmensa
mayora de los trabajos serios y trascendentes (por ejemplo, los que aparecen
en revistas de impacto real como Lancet o British Medical Journal), no se detienen a explicar con taparrabos tcnicos sus tamaos mustrales: usualmente
se circunscriben a comunicar los que fueron usados y punto. Los juicios que
nos puedan merecer sus conclusiones no se modificaran en absoluto por el hecho de que consiguieran o no persuadirnos de la legitimidad tcnica de aquella
decisin, sino, en todo caso, por la longitud concreta de los intervalos de confianza o por el valor concreto que tenga la probabilidad de los resultados que
arroj el estudio bajo el supuesto de que es vlida la hiptesis nula.
Muchos de estos investigadores, sin embargo, tuvieron en su momento que
explicar el origen de los tamaos al presentar el proyecto en procura de financiacin. En ese contexto la aparicin de las frmulas es, con frecuencia, puntualmente demandada, aunque a mi juicio no sea sa la conducta ms racional
por parte de dichos funcionarios tcnicos. Pero, siendo as, los investigadores
pueden verse obligados a colaborar con lo inevitable y proceden a insertar en el
proyecto frmulas como la [12.1] (u otra similar) para serenar a los tesoreros. Es
natural que los financiadores reclamen argumentos para el tamao muestral
propuesto, ya que de l dependen vitalmente los recursos que habran de asignarse. Lo que no es razonable es que se consideren relevados de responsabilidad tan pronto se les ofrezca un artificio numerolgico. Acaso sean estos personajes quienes deben hacer una reflexin ms profunda sobre el tema y tratar de
hallar, en todo caso, argumentos racionales en contra del talante flexible que yo
defiendo. Nunca las acusaciones de hereja confirieron verdadero aval al dogmatismo, y es bien conocido que la pseudociencia reacciona con irritacin y no
con argumentos ante las refutaciones racionales. Incidentalmente agrego que
cualquier intento de objetar razonadamente uno por uno los argumentos aqu desarrollados sera bienvenido.

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

295

12.4. El problema de la no-respuesta


Un tpico que ha producido gran cantidad de literatura especializada concierne al hecho inevitable de que parte de la informacin llamada a ser recogida
no puede ser registrada por una u otra razn; se trata de la llamada no-respuesta, problema que puede llegar a tener enorme importancia. En rigor, bajo esta
denominacin quedan abarcadas dos circunstancias diferentes: la no respuesta de
una unidad de anlisis completa, y la que se asocia a una pregunta especfica.
La negativa a colaborar, como fenmeno social, ha ido creciendo con el tiempo (Steeh. 1981; Kessler, Little y Groves, 1995) hasta el punto de haberse triplicado las tasas de no-respuesta en 20 aos desde los aos cincuenta, especialmente en sociedades de mayor desarrollo econmico. Es hoy un problema de
gran vigencia (vase, por ejemplo, Smidt y Tortora, 1998).
Intuitivamente, casi cualquier persona involucrada en la conduccin de una
encuesta siente que, al incrementarse la no-respuesta, crecen los sesgos, salvo
que se den circunstancias especiales o se adopte alguna medida correctora. Al
enfoque tcnico de este asunto se destinan las prximas secciones.

12.4.1. El modelo esencial


Para examinar este problema adecuadamente consideremos la siguiente situacin, relacionada con el caso de la no respuesta a una pregunta. Supongamos
que se realizara una encuesta en una poblacin con N individuos, de los cuales
N1 son respondedores potenciales a cierta pregunta asociada a una variable X
(sujetos que no rehsan dar una respuesta), en tanto que N2 = N N1 individuos
no responderan a tal pregunta en caso de que les fuera formulada. Supongamos
que la media de X para los N1 respondedores es X 1 , y que llamamos X 2 a la media
entre los N2 que no responderan. Obviamente, la inedia poblacional sera igual a:

X=

N1 X 1 + N 2 X 2
N

Supongamos que se toma una MSA de n unidades, pero que de ellas slo responden n 1 . Estas n 1 respuestas no seran ms que las que corresponden a los integrantes de una muestra (que puede considerarse simple aleatoria) de la subpoblacin de respondedores. Llamemos x a dicha media muestral, que es, como
sabemos, un estimador insesgado de X 1 . Si recordamos que el sesgo de x es igual
a E( x X ), puede corroborarse, tras un poco de lgebra, que dicho sesgo es
igual a:
N
E ( x ) X = X1 X = 2 ( X1 X 2 )
N

La magnitud del sesgo depende entonces tanto de la que tenga

[12.5]
N2
como de
N

296

DISEO RAZONADO DE MUESTRAS

la correspondiente a X 1 X 2 , ya que es igual al producto de ambas. Si no hubiera diferencia entre X 1 , y X 2 , el sesgo sera nulo independientemente de cun grande sea N2; otro tanto ocurrira si se cumpliera N2 = 0, sea cual sea la diferencia
entre las medias por este concepto. Esto quiere decir que si los que no respondieran tuvieran el mismo valor medio de X que los que s lo hiciesen (es decir,
si no difieren unos de otros), no habra sesgo alguno (el problema se reducira a
la prdida de tamao muestral) y, naturalmente, que si todos respondieran, tampoco se producira sesgo alguno.
Ambos resultados son muy intuitivos. Pero [12.5] nos dice algo ms: si hay diferencias entre las medias para las dos subpoblaciones, entonces la magnitud del
sesgo se incrementa en la medida que crezca la fraccin de sujetos que no responden. Lamentablemente, es frecuente que X 1 , sea diferente de X 2 ; cuando esto ocurre, se dice que la respuesta a X es selectiva. Eaton et al. (1992), por ejemplo, han
comunicado que en sus estudios de salud mental la no respuesta es significativamente mayor en personas con desrdenes psiquitricos que en el resto.
Consecuentemente con [12.5], para disminuir el sesgo se puede hacer una de
dos cosas (o ambas): tratar de disminuir la fraccin

N1
, y tratar de conocer la
N

magnitud de X 1 X 2 para suplir el estimador inicial x por un estimador corregido


que emplee tal informacin. Antes de examinar estas alternativas, veamos una
ilustracin.
Imaginemos que en una pequea comunidad hay N = 1.500 adultos y que se
quiere estimar el porcentaje de sujetos que se cepillan los dientes al menos tres
veces al da. Supongamos que el 30% de ellos se negaran a responder tal pregunta. Supongamos tambin que slo el 50% de estos ltimos (225) tienen el hbito en cuestin, mientras que lo tiene el 80% de los N1 = 1.050 que estaran dispuestos a contestar. As las cosas, el sesgo ascendera a (0,3) (80 50) = 9; es
decir, en estas condiciones se producira una sobreestimacin del 9%. En efecto,
el verdadero porcentaje es

(1.050)(80) + (450)(50)
= 71 y no 80, como arroja1.500

ra la muestra.

12.4.2. Tcnicas para reducir la no respuesta


Distintos procedimientos se han sugerido para reducir la no respuesta. En primer lugar, desde luego, se halla el recurso de volver una y otra vez a intentar el
contacto con la persona que no sea hallada en el primer intento, pero ste es simplemente un acto administrativo y solo concierne al caso en que el individuo no
responde porque no se tom contacto con l.
Con un basamento sociolgico de otro orden, se han sugerido estrategias tales
como avisar de antemano a los sujetos seleccionados que sern visitados, elegir

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

297

racional y cuidadosamente la apariencia del encuestador, as como pautarle escrupulosamente el modo en que habr de conducirse, y el empleo de incentivos
materiales o monetarios para el encuestado.
El aviso a travs de una carta (recurso que no siempre procede) parece tener
un efecto significativo en el aumento de las tasas de respuesta (vanse los estudios experimentales de Dillman, Gallegos y Frey, 1976).
Los incentivos (monetarios y materiales) con vistas a incrementar las tasas de
respuesta en las encuestas han sido empleados desde hace muchos aos. Se han
aplicado dos modalidades fundamentales: la entrega a priori del incentivo, y el
ofrecimiento de ste en un primer contacto. Tal recurso ha sido objeto de estudio
cuidadoso, tanto para el caso de encuestas cara a cara como en el de las telefnicas. Erdos (1970) discute detalladamente el tema para el caso de las encuestas postales, y un examen reciente puede hallarse en Church (1993), quien
realiz un meta-anlisis que involucr cerca de 40 estudios y concluy que los
estudios en que se aplicaba un prepago conseguan incrementar como promedio
las respuestas en casi 20 puntos de porcentaje. Cuando se daban regalos (gifts)
en lugar de dinero, el efecto era mucho menor. Resulta interesante que, segn este trabajo, el monto del pago monetario era ciertamente reducido (menos de
1,50 dlares como promedio). Singer et al. (1996), en un estudio similar de 30
artculos destinados a evaluar el efecto de tales incentivos, corroboraron en lo
esencial aquellos resultados.
Un problema que se ha sealado en relacin con los incentivos materiales no
monetarios radica en que stos pueden ser ms atractivos para ciertos subgrupos poblacionales que para otros, con la posible generacin de sesgos (Levy y
Lemeshow, 1980).

12.4.3. Tcnicas para la imputacin


Una de las vas ms aplicadas y estudiadas para encarar la ausencia de un
dato (los missing data de la literatura sajona) es la llamada imputacin. Esto significa que los datos faltantes son suplidos por otros, usualmente surgidos de los
cuestionarios que s los contienen. Adems del inters que despierta como solucin ante posibles sesgos, el proceso de imputacin genera matrices de datos rectangulares sin omisiones en sus celdas, lo cual es altamente conveniente a los
efectos de ciertos anlisis avanzados.
Los mtodos de imputacin son diversos. El ms simple consiste en sustituir
cada valor faltante por la media aritmtica de los valores procedentes de la parte de la muestra para la que dicho dato se conoce. Es tambin el ms burdo. Un
defecto importante es que, si hay muchos valores perdidos y sustituidos por la
media, se producir una homogeneidad artificial errneamente reductora de la
estimacin de errores. Un refinamiento dentro de la mima lnea consiste en for-

298

DISEO RAZONADO DE MUESTRAS

mar grupos de sujetos similares y computar las medias dentro de cada grupo,
de modo que el valor faltante se suple con la media de la variable para el subgrupo al que pertenece.
Otra alternativa similar, pero aun ms refinada, consiste en atribuir valores resultantes de un anlisis de regresin. La curva de regresin se estima empleando los records (sujetos) para los que se cuente con las respuestas a todas las variables involucradas en el proceso; es decir, usando tanto la variable que ser
objeto de imputacin como las variables que, por considerarse que tienen algn
valor predictivo, se hayan incorporado en dicho modelo.
Si el valor que ha de imputarse es un nmero (edad, salario, hemoglobina,
etc.), puede emplearse la regresin mltiple; si fuese una condicin categorial
(grupo religioso, status laboral, condicin de hipertenso o no) podra emplearse
regresin logstica y hacer la atribucin o imputacin de la categora desconocida con acuerdo a la probabilidad que el modelo de regresin estimado otorgue a
cada categora de respuesta para el sujeto en cuestin.
Otro procedimiento empleado es el mtodo conocido como cold deck. En
esencia se trata de tomar los valores de un sujeto parecido al que tiene valores perdidos y atriburselos. Se pueden hallar detalles de ste y otros procedimientos (como el hot deck method) en Allen (1990), Verboon y Nordholt (1997)
y en Nordholt (1998). Finalmente, cabe mencionar tcnicas ms especializadas,
como la imputacin mltiple, descrita en Rubin (1996) y Fay (1996).

12.4.4. Correccin de estimadores


Finalmente, est la posibilidad de corregir el estimador. La idea convencional, que se remonta a la propuesta de Hansen y Hurwitz (1946), consiste en hacer un submuestreo de no respondedores. Supongamos que se ha seleccionado
una muestra simple aleatoria de tamao n y que, para cierta variable X, tenemos
respuesta para n 1 , individuos (n 2 = n n 1 no respondieron). Asumamos que mediante algn esfuerzo especial se consigue ahora la informacin para m indivin
duos de los n2 que no respondieron. Si llamamos w = 1 , y denotamos mediann2
te x1 a la media de los que respondieron inicialmente y x2 a la media de X para
la submuestra de no respondedores, entonces la estimacin corregida de X sera:

xc = wx1 + (1 w) x2
con varianza igual a:
Var ( xc ) =

(1 f )[ S 2 + (h 1)WS 22 ]
n

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

299

n
n
, W es la fraccin poblacional de no respondedores, h = 2 , S 2 es la
N
m
2
varianza de X para toda la poblacin y S 2 la de los no respondedores. Ocasionalmente se asume que S2 = S22 , con lo cual se simplifica el proceso. Ntese
que si se cumple esta condicin y, adems, h = 1 (es decir, que todos los no respondedores son submuestrados), entonces las frmulas de xc , y Var( xc ) se reducen
a las conocidas para MSA.

donde f =

12.5. Determinacin de valores normales


Un problema de gran trascendencia tanto para la prctica clnica como para la
epidemiolgica, y en cuya solucin el muestreo desempea un papel protagonista, es el que consiste en establecer valores de referencia; es decir, algn tipo de
marco referencial o escala que permita conocer la posicin relativa de un sujeto
dado en relacin con la poblacin a la que pertenece.
Por su naturaleza, todos los enfoques para resolver este problema pasan, de
un modo u otro, por el uso de la estadstica. Los aspectos polmicos, como se
ver de inmediato, conciernen slo tangencialmente al proceso de seleccin. Se
vinculan, ms bien, con la identificacin adecuada de la poblacin que debe investigarse y al tratamiento que se d a los datos, y por ende con la estimacin.
Esta seccin reproduce en buena medida ideas desarrolladas en Silva (1997)
debido a que tambin son relevantes en materia de muestreo.

12.5.1. El recorrido normal


El modo ms comn de presentar valores de referencia para los parmetros
fisiolgicos es a travs del llamado recorrido de normalidad. Por ejemplo, para
la creatinina, se plantea que los valores normales correspondientes a un hombre
adulto estn dentro del intervalo que va de 7 a 18 mmol/24 h. Consecuentemente, un sujeto que tenga un valor por debajo de 7 o por encima de 18 mmol/24 h
sera considerado, en lo que a la creatinina concierne, anormal.
Uno de los procedimientos estadsticos ms utilizados para fijar ese tipo de intervalos es en extremo simple. Comienza con la seleccin de una muestra de una
poblacin de individuos que supuestamente no tienen patolgicamente alterado el
parmetro en cuestin. El procedimiento habitual exige establecer ciertos criterios de exclusin (que usualmente se aplican a la muestra una vez elegida, y no
a la poblacin) concebidos para eliminar individuos evidentemente anmalos.
Por ejemplo, para hallar valores de referencia para la talla, se eliminaran de la
muestra los acromeglicos y los que padecen de enanismo (si los hubiera).
A continuacin se realiza para cada sujeto elegido la determinacin de laboratorio o, ms generalmente, la medicin (llammosle X), y se procede a com-

300

DISEO RAZONADO DE MUESTRAS

putar tanto el valor medio x como la desviacin estndar .v de los datos12. Finalmente, se resta de, y se suma a x la magnitud 2s. De este modo, el intervalo determinado por los extremos x 2s y x + 2s es considerado un recorrido de normalidad para la dimensin fisiolgica de inters. Este procedimiento
corresponde al propsito (explcito o no) de fijar dos lmites (L1 y L2) para los
que se cumplan tres condiciones:
A) que por debajo de L1 quede el 2.5%/c de los valores.
B) que entre L1 y L2 se halle el 95% de los datos,
C) que por encima de L2 se ubique el restante 2,5% de las observaciones.
Si la distribucin de la variable X es gausiana o normal, entonces los lmites
L1 = x 2s y L2 = x + 2s satisfarn aproximadamente las tres condiciones.
Esta estrategia nace de una propuesta formulada por Ronald Fisher con el
afn de identificar los valores ms comunes (los que se ubican en el intervalo
[L1, L2]) y los poco comunes: el 5% que se reparte entre los extremos. Buscar
valores L1 y L2 que cumplan A), B) y C) es una decisin totalmente arbitraria,
vinculada a una propiedad de la distribucin normal, pero sin verdadero asiento
en consideraciones relacionadas con el problema visto desde una perspectiva clnica o fisiolgica.
Pueden mencionarse cuatro objeciones a este procedimiento:
a) Con todo derecho uno puede preguntarse: por qu elegir el 5% para identificar a aquellos individuos que estn fuera de la normalidad? Por qu
no 4%, o 6,2%?
b) Por qu exigir una relacin de simetra? Si se decidi que 95 iba a ser
el porcentaje de normales, cul es la razn para repartir el 5% restante en partes iguales?
c) En cualquier caso, los lmites x 2s y x + 2s cumplen las tres condiciones
solo si la distribucin de X es normal. Este rasgo no tiene que regir necesariamente, como qued demostrado hace ms de medio siglo por Rietz
(1927), en ocasin de su medular trabajo sobre estadstica matemtica.
Es bien conocido que variables tales como el calcio srico o las protenas
totales siguen distribuciones muy alejadas de la gausiana. De hecho, autores como Elveback, Guillier y Keating (1970) afirman que la mayora de
las variables fisiolgicas distan de ajustarse a una distribucin normal.
d) Finalmente, puede ocurrir que 2s sea mayor que x ; en ese caso L1 sera inferior a cero, situacin que, salvo excepciones, carecera de todo sentido,
ya que usualmente los parmetros fisiolgicos no pueden alcanzar valores
negativos.
12

Naturalmente, si la muestra no fuera equiprobabilstica, se emplearan las ponderaciones correspondientes.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

301

Supuesto que se admite el procedimiento de hallar L1 y L2 con la regla del


95%, una solucin para las objeciones c) y d) consiste en trabajar con la misma muestra pero usar estimaciones no paramtricas de L1 y L2; concretamente,
operar con percentiles empricos: una vez ordenados todos los valores de la
muestra de menor a mayor, L1 se define como aquel nmero por debajo del cual
se ubica el 2,5% de sus integrantes; anlogamente, el nmero por debajo del cual
queda el 97,5% de los individuos de la muestra se puede aceptar como L2.
Obviamente, por una parte se cumplirn las tres condiciones, sea la distribucin gausiana o no y, por otra, la ltima dificultad (lmite inferior negativo)
nunca habr de presentarse.

12.5.2. Qu poblacin ha de muestrearse?


Ahora bien, fijar L1 y L2 como lmites para establecer la normalidad, cualquiera sea la va utilizada, parece entraar algunas contradicciones difciles de
pasar por alto.
Se exige partir de una muestra de cierta poblacin que sea considerada, en
principio, sana. Pero el mtodo es tal que el 5% de la muestra que se elija para
establecer los lmites necesariamente terminar siendo anormal, hecho que
nos coloca en una aparente contradiccin, pues si los integrantes de la poblacin son sanos a los efectos de ese parmetro, tambin lo sern los de la muestra,
y por tanto ella no puede a la vez contener sujetos con valores patolgicos.
Como veremos, la contradiccin no es tal, siempre que hagamos una conceptualizacin adecuada de estos valores de referencia. Para introducir el
asunto, consideremos un problema inquietante que no concierne al modo de definir los lmites, sino al proceso de seleccin; ms concretamente, a la poblacin que ser objeto de muestreo.
Imaginemos que se quieren conocer los valores normales para las funciones pulmonares (capacidad vital, capacidad vital forzada en un segundo, etc.).
Qu debemos entender por una poblacin sana de la cual tomar la muestra?
Algunos opinan que debe tomarse una muestra representativa de la poblacin
general, excluyendo slo a aquellos de cuya condicin patolgica (en lo que se
refiere a dolencias que comprometan la funcin respiratoria, tales como la silicosis o el cncer pulmonar) se tenga constancia. Otros consideran que deben eliminarse a priori, por ejemplo a los fumadores, ya que la funcin pulmonar de stos se ha modificado artificial y negativamente como consecuencia del
tabaquismo. Pero, en esa misma lnea, otros podran exigir que tampoco se admitieran sujetos sedentarios en la muestra, pues el buen funcionamiento pulmonar demanda practicar ejercicios regularmente. Y an podra exigirse que la
muestra estuviese exclusivamente integrada por montaeses, que no slo no fuesen fumadores ni sedentarios, sino que nunca o casi nunca hubiesen respirado
monxido de carbono, con lo cual su sistema respiratorio conservara el estado
ms prximo posible a su constitucin fisiolgica original.

302

DISEO RAZONADO DE MUESTRAS

En este punto cabe recordar que las acciones como las que estamos discutiendo nunca son un fin en s mismo, sino que se llevan adelante para algo concreto. Imaginemos que, empleando estos lmites obtenidos a travs de una muestra de personas con su sistema respiratorio en ptimas condiciones con acuerdo
al ms restrictivo de los criterios, se valora al conjunto de trabajadores de una
planta textil en el contexto de un tamizaje organizado por autoridades de salud
ocupacional. Con ese rasero, quizs todos resulten ser anormales! La muestra
elegida para fijar el criterio diagnstico sera tan normal que lo ms comn y
corriente resultara ser anormal.
Es imposible escapar de este laberinto mientras no se delimite para qu se est
procurando encontrar los susodichos valores de referencia. Si lo que se quiere,
por ejemplo, es conocerlos con la finalidad de establecer una regulacin de
carcter jurdico, segn la cual un trabajador que presente valores anmalos resulte beneficiado con un perodo de descanso o algn tipo de compensacin,
entonces la muestra apropiada sera la de la poblacin general, fumadores incluidos. Si lo que se estudia es el efecto de cierta exposicin ocupacional a travs de la desviacin atribuible a los contaminantes ambientales cuando se comparen dichos valores con los de referencia, entonces la muestra ms adecuada
sera la de los montaeses no fumadores. Si los valores en cuestin se desean como elementos orientativos para la prctica clnica regular, entonces es menester
que razonemos en trminos relativos a la circunstancias socio-histricas del espacio o enclave en que dicha prctica ha de ejercerse, tal y como se fundamenta
en la seccin siguiente.

12.5.3. Carcter histrico de la normalidad


Para comenzar hay que reparar en cuan artificial resulta el afn dicotomizador que lleva las cosas al plano polar: normal-anormal. En un magnfico artculo sobre este tema, Murphy (1973), refirindose al conflictivo ejemplo de las
dolencias mentales, escribe:

Los defectos mentales se discuten a menudo, al menos por el hombre comn, como si hubiera dos grupos, el de aquellos con un desarrollo mental
normal y el de los que no lo tienen: dos clases distinguibles sin ambigedad,
del modo en que pueden distinguirse las plantas de los insectos.
Y tras un anlisis de las consecuencias y los riesgos implcitos en tal enfoque,
seala que la lnea divisoria entre la normalidad y la anormalidad es muy frecuentemente arbitraria (aunque no caprichosa, que es algo bien diferente) y que,
cuando se establece, ello se debe solamente a un imperativo operacional, ya que
sin tal demarcacin sera imposible adoptar ciertas decisiones, por ejemplo, en el
mbito jurdico. En relacin con esto, reflexiona:

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

303

En qu punto de su desarrollo la sociedad decidi que el tonto del


pueblo ya no deba ocuparse de barrer las calles o llevar las vacas a pastar y fue puesto bajo el amparo de una institucin? Es difcil evitar la
conclusin de que la respuesta simplemente es: Cuando la sociedad estuvo en condiciones de asumirlo.
Este carcter relativo de las acciones, que se verifican ms en funcin de las
posibilidades reales que a partir de identificaciones intrnsecas de anormalidad, se aprecia en hechos como que el desarrollo de la sociedad contempornea
consiente, al menos en los pases econmicamente ms avanzados, que los
oftalmlogos receten gafas graduadas al 95% de la poblacin adulta general, cuya capacidad visual estara, por definicin, dentro del recorrido normal. Cabe
recordar a Illich (1975) cuando sealaba que toda dolencia es una realidad que
posee una configuracin social; tanto su significado como la reaccin a que da
lugar tienen una historia.
Paradjicamente, a la vez que solemos reiterar doctrinariamente que el hombre es un ser bio-psico-social, aspiramos a manejar reglas dicotmicas y unidimensionales que nos digan para cada parmetro fisiolgico si un valor especfico es o no normal. El carcter normal de ciertas funciones no puede ser
descontextualizado, ni de su relacin con otras variables fisiolgicas conexas,
ni del entorno econmico, histrico, social y psicolgico en que se desempea el
individuo analizado.
De hecho, parece haberse enraizado un enorme malentendido al trasladar el
trmino normal, proveniente del descubrimiento del fsico-matemtico Karl
F. Gauss, relacionado con las mediciones sucesivas de un mismo objeto, y el
alcance semntico que tiene en la clnica para separar a los sujetos que no estn
enfermos de los que s lo estn.
En principio, no hay ningn derecho a considerar que los lmites que definen
al intervalo en que se ubican los valores menos habituales o menos distanciados
de la mediana por ejemplo, los correspondientes al 95% de los individuos que
no se hallan en los extremos de la distribucin sirvan para marcar la normalidad en el sentido clnico del trmino. As lo han advertido varios autores; por
ejemplo, Riegelman y Hirsh (1992) sintetizan adecuadamente esta realidad al sealar que el intervalo de lo normal es descriptivo y no diagnstico.
En general, cuando un clnico eficiente examina un conjunto de parmetros
fisiolgicos integralmente, lo har sin desdear la historia del individuo concreto, y su juicio depender del enclave histrico, econmico y cultural en que se
halle. Es muy conveniente que disponga de datos que le informen cules son
los valores ms comunes para cada parmetro, cul el recorrido usual de stos
en la poblacin de la que procede el paciente, pero sin etiquetar a priori el dato
como normal o anormal, algo que l decidir despus del complejo anlisis cuyos ejes bsicos se han bosquejado arriba. Tal matizacin, por cierto, cabe
tambin para el examen epidemiolgico a nivel poblacional.

304

DISEO RAZONADO DE MUESTRAS

Por otra parte, estas consideraciones nos llevan de la mano a la siguiente


recomendacin: los recorridos de normalidad exigen correcciones peridicas en
el tiempo; en la medida de lo posible, adems, deben establecerse para diversos
subgrupos poblacionales bien definidos (gneros, etnias, grupos de edad, zonas
geogrficas, etc.), que a su vez han de interpretarse mediante la conjuncin de
valoraciones tcnicas y socioculturales. Slo en tal caso adquieren un sentido
cabal.

12.6. Las encuestas en la prensa


ltimamente se han ido consolidando determinados estereotipos para comunicar resultados de las encuestas a la poblacin, a la vez que se han aplicado ciertos procedimientos que resultan tan pseudocientficos como el horscopo o la
homeopata.
A pesar de que implica que nos separemos por excepcin del mbito de la salud, es insoslayable encarar este problema con rigor, aunque slo fuera porque
estos hechos comprometen gravemente la imagen y el prestigio de las tcnicas
estadsticas y del muestreo ante la opinin pblica y, peor aun, distorsionan la visin que puedan tener de esta disciplina otros profesionales de la ciencia no especializados en el tema.

12.6.1. Estereotipos para no decir nada


En mayo de 1993 se produjo en Madrid un debate televisado entre dos candidatos presidenciales: Jos Mara Aznar y Felipe Gonzlez. Tres das ms tarde, el peridico espaol El Pas (1993) comunic el resultado de una encuesta
realizada por la empresa Demoscopia en la que se sondeaba la opinin popular
conformada al da siguiente de producido el mencionado debate.
La llamada ficha tcnica, contenida en el artculo de prensa, incluye el texto que se reproduce textualmente a continuacin:
Tamao y distribucin de la muestra: 800 entrevistas fijadas mediante muestreo estratificado por regin y tamao de hbitat proporcional a la distribucin
de la poblacin y con ampliacin de cuotas de sexo y edad.
Error de muestreo: asumiendo los criterios de muestreo aleatorio simple, para
un nivel de confianza de 95,5% (dos sigrnas) y para la hiptesis ms desfavorable (p = q = 50), el error para el total de la muestra sera de 3,5%.

Comencemos examinando ahora el primero de los dos prrafos.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

305

Confieso que el texto me resulta crptico: no consigo entender cabalmente casi nada a partir de la palabra entrevistas. Y sospecho fuertemente que a los lectores regulares de El Pas les pasar lo mismo, aunque quizs muchos de ellos
queden ms bien anonadados con la cientificidad que, a juzgar por su apariencia, destila tal enunciado.
Si se quiere comprender esa informacin, es menester tener las respuestas para las siguientes preguntas: Qu debe entenderse por fijar entrevistas? A qu
le llaman regin? Qu es hbitat en este contexto? Qu significa ampliacin de cuotas de sexo y edad? Demasiadas dudas para un texto de 30 palabras. Uno se pregunta: qu sentido tiene brindar una informacin tcnica
que resulta ininteligible, incluso para especialistas?
Es curioso, adems, constatar que un texto tan alejado de la transparencia
deseable para una comunicacin que, aun siendo de prensa, supuestamente tiene carcter cientfico, parece constituir una cmoda horma general. Por ejemplo,
cinco aos despus, y a raz de las elecciones primarias del Partido Socialista
Obrero Espaol, El Pas (1998b) publicaba la siguiente ficha tcnica en el
contexto de una de sus encuestas habituales:

Tamao y distribucin de la muestra: 1.200 encuestas fijadas mediante maestreo


estratificado por regin y tamao de hbitat proporcional a la distribucin de la
poblacin v con ampliacin de cuotas de sexo y edad.
Error de muestreo: asumiendo los criterios de maestreo aleatorio simple, para
un nivel de confianza de 95,5% (dos sigmas) y para la hiptesis ms desfavorable (p = q = 50), el error para el total de la muestra sera de 2,9%.

Un cotejo detallado entre el contenido de los recuadros precedentes permite


apreciar lo que no pasa de ser un acto de clonacin; ser que estos dos diseos
carecen de especificidades propias dignas de ser comunicadas? Sera sorprendente que as fuera, mxime cuando la encuesta de 1993 fue telefnica y la de
1998 cara a cara.
Otra formulacin recurrente en muchas de las susodichas fichas tcnicas
consiste en afirmar algo como lo siguiente: la encuesta tiene un nivel de confianza del 95,5% y un margen de error de 2,9 para datos globales (vase, por
ejemplo, El Pas, 1997).
Como bien sabemos, es completamente injustificable decir que la encuesta
tiene tal o ms cul nivel de confianza. Con ese recurso se da una falsa imagen
de alta calidad. La afirmacin carece de sentido, pues la confianza que se pueda
depositar en una estimacin ser mayor o menor en dependencia de que se haya
decidido trabajar con una u otra confiabilidad (es decir, el error estimado se supedita al coeficiente de confiabilidad que se haya elegido). Sin embargo, tal y

306

DISEO RAZONADO DE MUESTRAS

como est escrito en la susodicha ficha, da la impresin de que la confianza que


uno puede tener en la encuesta es muy alta (del 95,5%). De hecho, se est jugando con la ambivalencia del trmino confianza, que en el lenguaje habitual tiene un valor semntico diferente del sentido tcnico con que se emplea en el
muestreo.
A finales de 1997 me dirig al Defensor del lector de ese peridico para comentarle este desatino. Me permito reproducir una parte sustancial de su respuesta (Gor, 1998):
Este lector cuestiona, por incomprensible y errnea, la frmula empleada para expresar el nivel de confianza y el margen de error del sondeo. (...) Hay que sealar, en todo caso, que la frmula cuestionada (Tiene un nivel de confianza X
y un margen de error de X) es la habitual. Lo cual no resta fundamento a la observacin, (...) la cual es acertada aunque de difcil encaje en una frmula inteligible para legos, ajuicio de Jos Ignacio Wert, presidente de Demoscopia. Debo
empezar reconociendo, seala Wert en su respuesta al lector, que su argumento
sobre el nivel de confianza de la encuesta y la forma de expresarla es absolutamente inobjetable. En efecto, tcnicamente hablando, el nivel de confianza es un
parmetro que responde a una convencin y no se tiene sino que se adopta. En
puridad terminolgica, sera ms correcto decir adoptando un nivel de confianza
del 95,5% o para un nivel de confianza del 95,5%. Wert admite: Hemos
utilizado una convencin lingstica inapropiada para dar cuenta de un dato tcnico no del todo fcil de traducir en lenguaje no tcnico.
(...) Queda, en todo caso, a la capacidad de los expertos insistir en la cuadratura de esta especie de crculo (una frmula inteligible para el lego al tiempo que
tcnicamente correcta), antes de optar por suprimir una alternativa posible que
seala Wert cualquier referencia a la confiabilidad y referirse tan slo al error
del muestreo, parmetro, al menos en apariencia, ms inteligible.

Unos meses despus, ante otra de las encuestas a cargo de esa empresa, me
interes, naturalmente, ver qu solucin se haba hallado para no incurrir en el
error tan rotunda y honestamente admitido. Me asombr encontrar que los tcnicos de Demoscopia, impertrritos, incluan el siguiente texto: la encuesta
tiene un nivel de confianza del 95,5% y un margen de error de 2,9 para el total
de la muestra (El Pas, 1998a). Es evidente que hay algo, nebuloso e inquietante en todo esto.
En ocasin de aquel intercambio de opiniones, tuve a bien sugerir una solucin que me pareca (y me sigue pareciendo) ptima para resolver con toda
transparencia el conflicto (la cuadratura del crculo a que aluda el defensor
del lector): publicar la encuesta con una ficha informativa muy general, que slo abarque aquello realmente comprensible por cualquiera por tanto exenta de
todo tecnicismo, y que comunique que todo aquel lector interesado en los
detalles tcnicos se dirija al sitio WEB de la empresa responsable del estudio.
Naturalmente, si se colocara dicho informe tcnico detallado en el sitio WEB

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

307

de Internet, no habra que preocuparse por las lgicas restricciones de espacio


que rigen en la prensa. Todos, al menos tericamente, ganaramos: la empresa
podra explayarse, los especialistas podran satisfacer cualquier duda, y los lectores tendran la tranquilidad de que la encuesta puede ser evaluada, llegado
el caso, por especialistas cualificados. Lamentablemente, las empresas que se
ocupan de estos temas parecen preferir que no se adopte una solucin tan simple y eficiente como sta. Ignoro con qu argumentos, pues hasta ahora no se
han dado, a la vez que se mantiene la prctica habitual sin mayor (ni menor)
rubor.

12.6.2. Lo que ocultan las afirmaciones globales


Ahora volvamos a la encuesta sobre el debate entre aspirantes a la presidencia espaola de 1993 y concentrmonos en que nos han informado de que el tamao muestral es n = 800. La primera pregunta que se formul a los encuestados
fue: VIO ENTERO O EN PARTE EL DEBATE?
Nos comunican que slo 431 entrevistados lo vieron durante un lapso suficientemente largo como para opinar, y casi todo el resto del anlisis se remite a
ese nmero de espectadores. Por ejemplo, a continuacin se pregunt:
CON INDEPENDENCIA DE SUS SIMPATAS POLTICAS, QUIN LE HA RESULTADO
MS CREBLE?
y registran los siguientes resultados segn las tres grandes agrupaciones polticas
espaolas13:
Partido
Socialista
%

Partido
Popular
%

Izquierda
Unida
%

Felipe Gonzlez

55

25

Jos Mara Aznar


Los dos por igual
Ninguno de los dos
No sabe/no contesta

28
7
13
3

94
3
1
1

34
29
12
0

Lamentablemente, los autores no comunican cuntos entrevistados correspondieron a cada una de estas tres agrupaciones pero; teniendo en cuenta datos
conocidos, cabe esperar que, por ejemplo, los simpatizantes de Izquierda Unida
hayan sido alrededor de 40, ya que esa fuerza agrupaba en aquel momento algo
menos del 10% del electorado. De modo que, para estimar el porcentaje de in13

Ntese que la suma de porcentajes dentro del Partido Socialista asciende absurdamente a 106%. No es una
errata de este libro: as aparece en el informe de Demoscopia.

308

DISEO RAZONADO DE MUESTRAS

dividuos de Izquierda Unida a quienes result ms creble el seor Gonzlez, se


trabaj con una muestra de 40, un nmero 20 veces menor que el tamao de
muestra original. Esta situacin es enteramente tpica: aunque la ficha tcnica
informe que la muestra fue de 800 entrevistados, el tamao efectivo vara en
dependencia de los vericuetos computacionales que exige el estudio. Ahora detengmonos a examinar qu efecto tiene este hecho.
Si se computa el error de muestreo en que se ha incurrido (suponiendo que se
us muestreo simple aleatorio), como se recordar de la Seccin 3.6 hay que
aplicar la frmula siguiente:
p (100 p )
[12.6]
n 1
Recordemos lo que textualmente deca en su ficha tcnica el artculo que
nos ocupa sobre el error de muestreo: asumiendo los criterios de muestreo
aleatorio simple, para un nivel de confianza de 95,5% (dos sigmas) y para la hiptesis ms desfavorable (p = q = 50), el error para el total de la muestra sera de
3,5%.
La frase para la hiptesis ms desfavorable (p = q = 50) aparece sistemtica y casi obsesivamente en todas las fichas tcnicas de este tipo. Qu se quiere
decir exactamente con ella? Se trata de que el valor p(100 p) que est bajo el
radical de [12.6] alcanza su mximo en el caso en que P se suple por 50 (vase
una explicacin detallada en la Seccin 12.8). Consecuentemente, el mayor valor que puede alcanzar e corresponde a dicha magnitud de P. Por ejemplo, tomando n = 800 y Z1/2 = 2, el valor del error ser, a lo sumo, igual a 3,5, que es
el que figura en la ficha tcnica.
Pero, es sta realmente la hiptesis ms desfavorable? Ciertamente no.
Consideremos otra pregunta del cuestionario; segn el informe, el 6% de los 800
encuestados comunic que probablemente no vera el segundo debate, programado para una semana ms tarde.
El error asociado a tal estimacin, aplicando la frmula [12.6], sera entonces:
e = Z1 / 2

e=2

(6)(94)
1,7
799

Este nmero es, en efecto, menor que 3,5 en trminos absolutos; sin embargo, la calidad de la estimacin es inferior, pues 1.7 representa el 28% de p = 6
mientras que 3.5 es solamente el 7% de p = 50.
e
En general, el error relativo, definido como er = , se incrementa en la medip
da que p disminuye, de manera que es absurdo afirmar que el caso en que la calidad de la estimacin es ms desfavorable corresponde a preguntas para las cuales la estimacin es p = 50.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

309

Sin embargo, lo verdaderamente grave es que para casi ninguna de las estimaciones de la encuesta se trabaja con ese tamao de muestra, sino con nmeros
muchsimo menores.
Tomando p = 25% (dato registrado en la tabla como estimacin de la credibilidad de Gonzlez dentro de Izquierda Unida), n = 40 y Z1/2 = 2, la estimacin del error mximo en que se ha incurrido es e = 13.9%.
Por otra parte, sta sera la estimacin del error si se hubiera tratado de un
muestreo simple aleatorio. Siendo un diseo complejo (como se colige del texto
incluido en la ficha tcnica), entonces el error verdadero ha de ser mayor. Concretamente, si llamamos ec al error correspondiente al verdadero diseo, se tendr (Kish, 1965): ec = e deff .
Supongamos que al diseo muestral que nos ocupa le corresponde un deff
igual a 2,25 (el valor medio que se produce en una encuesta comn y corriente,
como consignamos en la Seccin 12.3.2). Es un supuesto conservador, ya que
por la naturaleza del problema (obvia tendencia a la homogeneidad de opiniones
y valores dentro de una misma localidad o regin), cabra esperar un deff mayor. Pero considermoslo as para prosperar sin riesgo de que se considere que
nuestro anlisis es extremista. En tal caso, el error estimado, una vez hecho el
ajuste, resulta igual a:
ec = 13,9 2, 25 = 20,3

Quiere esto decir que el error cometido al estimar ese porcentaje de 25% podra razonablemente ser como mnimo de 20%. Se trata de un error enorme: casi igual a la magnitud de lo que se estima (concretamente, las cuatro quintas partes). Es tan poco informativo como si cuando me preguntaran mi edad, yo dijera
que sta se halla entre 9 y 80 aos. Algo similar ocurre con la mayora de las
estimaciones de la encuesta.

12.6.3. Falsos vaticinios


Entre las grandes reas de trabajo en las que se emplea el muestreo fuera de
la investigacin biomdica se hallan las encuestas electorales, aquellas que se
realizarn sobre una poblacin de votantes, ya sea para estudiar la intencin
de voto como para vaticinar los resultados. Tal vaticinio, a su vez, puede hacerse en un momento previo pero ya muy prximo al acto electoral, o en un
momento posterior a la votacin, antes de contar con resultados oficiales.
A veces, tales encuestas consiguen identificar aceptablemente con antelacin los resultados (el ganador de la presidencia, la reparticin de escaos, la respuesta que emerge victoriosa tras un referndum, o el desenlace que sea). Con
sospechosa frecuencia, sin embargo, se producen aparatosos fracasos de las empresas encargadas de hacer el vaticinio, como ocurri en ocasin de la derrota

310

DISEO RAZONADO DE MUESTRAS

del Sandinismo en la eleccin presidencial de Nicaragua en 1991. En aquella


ocasin se atribuy el fiasco a la falta de cultura poltica de la poblacin nicaragense, a la tendencia secular a ocultar sus verdaderos pensamientos y a una larga serie de explicaciones de ese tenor. Pero he aqu que fenmenos muy similares se produjeron aos despus en el Reino Unido en 1992, en Espaa e Italia
en 1993 y en Francia en 1995. En este ltimo caso, todas las encuestas sin excepcin anunciaron que Jacques Chirac sera el ganador con el 25% de los votos;
Edouard Balladour alcanzara alrededor del 20% en tanto que Lionel Jospin, no
llegara siquiera a esta ltima cifra; el resultado fue otro: Jospin gan con ms
del 23% y quien no lleg a 19% fue Balladour.
El da 3 de marzo de 1996 se celebraron las elecciones generales en el Estado
espaol, en las cuales se disputaban 350 escaos parlamentarios. Conquistar al
menos 176 de ellos por parte de uno de los partidos significaba contar con la
mayora absoluta y poder, consecuentemente, prescindir de alianzas polticas. De antemano, slo el Partido Popular pareca tener posibilidades reales de
alcanzar dicha cifra. En las semanas previas se produjo la consabida avalancha
de encuestas preelectorales que, al precio de ms de 4 millones de dlares, intentaban vaticinar los resultados.
El panorama de lo acaecido resulta en extremo interesante, no slo por el estruendoso fracaso de dichos vaticinios, sino por el patrn que exhiban. Hagamos
un sucinto resumen de lo ms significativo; para simplificar la exposicin nos
circunscribiremos a los vaticinios concernientes a las dos grandes formaciones
polticas espaolas: Partido Popular (PP) y Partido Socialista Obrero Espaol
(PSOE).
El da 14 de febrero, el peridico ABC public los resultados de una macroencuesta conducida por el Centro de Investigaciones Sociolgicas (CIS) segn los cuales el PP alcanzara una apabullante victoria con ms de 50 escaos
de ventaja, a la vez que al PSOE correspondera el nmero ms bajo de su historia. Esta encuesta se bas en 25.000 entrevistas, y sus responsables se adelantaban a declarar que El fenmeno de voto oculto al PSOE, encuestados que no
reconocen su intencin de volver a votar a ese partido, se tiene muy en cuenta en
todos los estudios despus de las anteriores elecciones y adicionaban que La
gran cantidad de entrevistas con que se hace la macroencuesta del CIS permite
afinar ms que las empresas privadas a la hora de distribuir escaos (ABC,
1996).
Las Tablas 12.2 y 12.3 recogen vaticinios y realidades para los dos grandes
partidos.
Como puede apreciarse, el fiasco no slo es enorme y palmario, sino sorprendentemente uniforme: mientras la diferencia real en el porcentaje de votos
fue un escaso 1,3%, todas las encuestas anticipan una diferencia enorme (de
6,0 puntos la que menos yerra, y nada menos que de 11,6 la que se equivoca de
manera ms sensacional).

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

311

Tabla 12.2. Vaticinios realizados por las empresas contratadas


por grandes medios de prensa espaoles del nmero de escaos
que alcanzaran el PP y el PSOE en las elecciones generales de 1996
Peridico

PP

PSOE

ABC
El Pas
El Mundo
La Vanguardia
El Peridico

176- 184
170- 178
170- 179
160- 170
165 - 175

117- 125
118- 128
113- 123
135- 145
119- 129

Resultados reales

156

141

Tabla 12.3. Porcentajes de votos vaticinados para el PP y el PSOE


por las empresas contratadas por los grandes peridicos espaoles
en las elecciones generales de 1996
Peridico

PP

PSOE

Diferencia

ABC
El Pas
El Mundo
La Vanguardia
El Peridico

44,1
42.4
42,3
41,0
41.2

32.5
33.4
31.4
35,0
33.5

11.6
9,0
10.9
6,0
7.7

Resultados reales

38,8

37,5

1,3

Por si fuera poca coincidencia, debe notarse que si bien las encuestas mencionadas en la Tabla 12.2 se realizaron das antes de la votacin, tres estudios
realizados a pie de urna, una vez consumada la votacin, arrojaron resultados
parecidos, como se aprecia en la Tabla 12.4.
Tabla 12.4. Resultados de las encuestas a pie de urna sobre el nmero
de diputados alcanzados por el PP y el PSOE
en las elecciones generales de 1996
Empresa

PP

PSOE

Tabula
Demoscopia
Sigma 2

164 - 174
160 - 171
164 - 174

120 - 132
125 - 135
124 - 131

Resultados reales

156

141

312

DISEO RAZONADO DE MUESTRAS

De hecho, los 6 intervalos de confianza estuvieron muy lejos de atrapar al


parmetro.
Ante el estupor de legos y especialistas producido por tal desaguisado, las
reacciones de los responsables de los sondeos y las estimaciones son diversas y
harto elocuentes. No creo que valga la pena examinarlas exhaustivamente, pero
s apreciarlas a grandes rasgos.
Una de las explicaciones ms mencionadas consiste en que exista un voto
oculto; es decir un voto vergonzante de quienes no estn dispuestos a admitir el que a la postre sera su voto verdadero (en este caso, desde luego, atribuible a votantes del PSOE). La notable consistencia del error hace pensar en una
clara sistematicidad. Si el error fuera aleatorio, no se hubiera escorado siempre
hacia el mismo lado, de modo que la explicacin en s misma es bastante verosmil. Lo que ella no explica es el fallo de las encuestas.
Por una parte, tal eventualidad no pudo haber sido imprevista, como refleja el
texto de ABC arriba citado. Por otra parte, algunos llegan por ese camino a culpar al electorado de su fracaso. Por ejemplo, el responsable de la encuesta realizada por Tabula V, la ms desatinada de todas, comunic que crea hasta ahora
que estaba en una democracia estable. Es como decir: la responsable del error
es la realidad, no el instrumento que he empleado para conocerla. Algo similar
haba declarado Frderic de Saint Sernin, responsable de la encuesta encargada
por Jacqes Chirac en 1995, cuando las urnas desmintieron espectacularmente su
vaticinio: la gente puede comportarse de manera totalmente irracional cuando
acude a votar.
Esto es como si al equivocarse en el pronstico del tiempo, el Instituto de
Meteorologa comunicara que la culpa del error la tuvieron las nubes.
Si un equipo tcnico de muestristas y analistas se propone hacer un vaticinio
electoral, no puede escudarse en tales excusas: parte de su responsabilidad consiste precisamente en conducirse con el rigor necesario para contemplar la realidad tal como es. Esto significa, en primer lugar, que han de emplearse tamaos
mustrales adecuados: en mi opinin, por ejemplo, una muestra nacional en Espaa que se proponga repartir escaos no puede bajar de 20.000 sujetos y casi
todos estos estudios trabajaban con menos de 5.000. Pero mucho ms importantes son: el mtodo de seleccin (son realmente probabilsticos los diseos?, se
adoptan medidas para que no haya sobrerrepresentacin de encuestados fciles.
como pueden ser ancianos o amas de casa?), el manejo de la no respuesta (se
manejan tcnicas adecuadas de imputacin, reduccin de las tasas de no respuesta
y correccin de estimadores?), la realizacin de controles de calidad rigurosos del
dato primario (se retribuye adecuadamente a encuestadores y supervisores?, se
controla con rigor su desempeo?, se hacen reencuestas de control?). Es
imposible responder estas seis preguntas, ya que la transparencia metodolgica es
nula, como ya vimos en las secciones precedentes, aunque no sea imposible imaginarse las respuestas. Personalmente, sospecho que las contestaciones a todas o
casi todas esas interrogantes son esencialmente negativas.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

313

12.7. Clculo y presentacin de errores muestrales


Como ya sabemos, tras una encuesta verdadera se produce usualmente la estimacin de decenas o cientos de parmetros. Es bastante natural que nos preguntemos: es necesario calcular y presentar los errores de muestreo asociados a
todas las estimaciones? La respuesta es obviamente negativa. Hacerlo dara lugar a un informe tan farragoso que podra desnaturalizarlo. La conducta ms recomendable es la de escoger un grupo de parmetros, tpicamente aquellos que
se consideren ms representativos del estudio, y exponer para ellos los errores de
muestreo (y, ocasionalmente, los valores de deff).
En algunas tablas suele ponerse entre parntesis, al lado de las estimaciones,
los errores absolutos o relativos de dichas estimaciones14. En ocasiones se pone,
por lo menos, una nota en que se consigne que todos los errores relativos estimados son inferiores a cierto valor (el que corresponda). No es una solucin ptima,
pero es mucho mejor que no aludir al tema. Un trabajo en que se desarrollan y
ejemplifican profusamente las diversas tcnicas de presentacin (incluyendo recursos grficos) es el de Gonzlez, Ogus, Shapiro y Tepping (1975). Otra variante posible (Levy y Lemeshow, 1980) para evitar que el informe crezca insoportablemente, no excluyente de las anteriores, es ingenirselas para dar la informacin
necesaria que permita al lector hacer sus propios cmputos si lo desea.

12.8. Conjurando errores comunes


Para concluir este captulo, se enumeran y comentan varios errores que suelen cometerse en la prctica, algunos de los cuales estn tan extendidos que incluso han llegado reiteradamente a la imprenta.

12.8.1. Fraccin de muestreo versus tamao muestral


En ocasiones se hacen recomendaciones como la siguiente15:
Si UD. NO TIENE ELEMENTOS PARA DECIDIR EL TAMAO MUESTRAL DE MANERA
RIGUROSA, TOME EL 10% DE LA POBLACIN PARA FORMAR LA MUESTRA

En ms de una oportunidad, tras explicarme un problema concreto, me han


consultado directamente en esos trminos: qu porcentaje de la poblacin debe ser muestreada?
14

Atencin: no confundir con la desviacin estndar de la variable correspondiente.


No conozco, ciertamente, textos serios que hagan esta recomendacin. Este comentario se incluye no para hacer una crtica a lo que he llamado teora oficial del muestreo, sino para precaver a los lectores sobre la improcedencia de una regla que aparece ocasionalmente en ambientes tcnico-administrativos.
15

314

DISEO RAZONADO DE MUESTRAS

En el texto de una normativa para realizar una auditora de la gestin hospitalaria, en la que se fijan los pasos que debe dar el equipo auditor, puede aparecer una orientacin del tipo siguiente:
SELECCIONAR EN CADA HOSPITAL UNA MUESTRA ALEATORIA FORMADA POR EL
15% DE LAS HISTORIAS CLNICAS INICIADAS DURANTE EL LTIMO TRIMESTRE Y, SI
EL PORCENTAJE DE HISTORIAS QUE TIENEN DEFICIENTEMENTE RELLENADO LA
CAUSA DE INGRESO EXCEDE EL 25%, ENTONCES...

Todos son ejemplos de un enfoque improcedente: el de establecer el tamao


muestral fijando un porcentaje poblacional, como si ste fuera relevante. Por
ejemplo, en el caso de la auditora, contrariamente a lo buscado y a lo que podra
pensarse, para la evaluacin de los hospitales grandes la muestra ser de tamao probablemente excesivo, y por tanto se verificar con extraordinario rigor, en
tanto que para la de los pequeos el tamao muestral puede llegar a ser minsculo, y como consecuencia resultar en extremo imprecisa, ya que el azar
tendra mucho ms margen para influir en las conclusiones de lo que resulta conveniente o aceptable. Es bien sabido que la calidad de una estimacin depende
vitalmente del tamao absoluto de la muestra, y solo mnimamente del porcentaje que ste representa con respecto al poblacional. El juego de las urnas descrito en la Seccin 3.8 procura subrayar esta realidad; uno de los componentes
incluidos en el mdulo de simulaciones de SIGESMU permite al usuario apreciar vividamente este hecho.
Si se quieren o se necesitan indicaciones de tipo general, hay que darlas a
travs de nmeros absolutos. Por ejemplo, en World Fertility Survey (1975) se
recomienda que los estudios nacionales de fecundidad se realicen con tamaos
elegidos entre 2.000 y 8.000 mujeres en edad frtil. Ntese, por una parte, el
enorme margen que se da para la eleccin, pero por otra parte y sobre todo, represe en que, puesto que el tamao muestral puede oscilar entre esas dos magnitudes independientemente del pas estudiado, entonces la fraccin de muestreo puede variar notablemente de un pas a otro, ya que los tamaos
poblacionales entre pases exhiben un recorrido cientos de veces mayor. Si se
tomara una muestra de 2.000 uruguayas (de una poblacin con alrededor de un
milln de mujeres en edad frtil), la fraccin de muestreo ser 0.2%; si se toman 8.000 para un estudio en la India, entonces la fraccin de muestreo se reduce a, 0,0008%, un nmero 250 veces menor que la fraccin correspondiente
a Uruguay. Sin embargo ambas muestras producirn estimaciones similarmente eficientes.
A la hora de establecer el tamao muestral, en sntesis, hay que pensar en
trminos absolutos sin dejarse impresionar por el hecho de que ese nmero pueda representar una pequea (o grande) parte del tamao poblacional.

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

315

12.8.2. Un 50% mgico?


Al asumir que si el porcentaje de sujetos con cierto rasgo asciende al 50% entonces se obtiene el mayor tamao de muestra simple aleatoria posible, se incurre en una falacia que parece muy extendida. Es posible hallarla tanto en textos
de muestreo (Azorn y Snchez-Crespo, 1986), como de metodologa de la investigacin (Argimn y Jimnez, 1991) y de epidemiologa (Jenicek y Cleroux,
1987) as como en manuales de estadstica (Domenech, 1990). Por cierto, tambin figura en el recetario que debemos a Lemeshow y sus tres colaboradores
(Lemeshow, Hosmer, Klar y Lwanga, 1990). All, por ejemplo, se hace textualmente la tajante afirmacin siguiente:

Cuando el investigador no renga la menor idea acerca de cul puede ser el valor de P. sustituya 50 en su lugar y siempre obtendr suficientes observaciones,
cualquiera que sea el verdadero valor de P.

Para examinar la fundamentacin de esta curiosa receta recordemos una vez


ms las formulas [ 12.1) y f 12.2] correspondientes a la estimacin de un porcentaje en el marco del MSA. Dicha fundamentacin sera la siguiente:
Puesto que 50 es el valor de P para el cual el producto P (100P) es
mximo, al suplir P por 50 se asegura el mayor valor posible para n0.
Este tamao nunca podra ser menor que lo cine resulta de tal manipulacin ya que, como se deriva de [12.2], n0 es directamente proporcional a
P (100 P). Finalmente, puesto que, segn la frmula [12.1], a mayor valor de n0, mayor es n, ningn otro valor de P puede producir una muestra
mayor que la que se alcanza fijando P = 50.
Como ya he expuesto con detalle en otro sitio (Silva, 1997), se trata de una
regla totalmente falaz, cuya fundamentacin es inaceptable y carente de inters
prctico. Sin embargo, el problema ha concitado controversia, como pone de
manifiesto la publicacin de una serie de defensas y rplicas en torno a la posible invalidez del principio que se ha resumido en el recuadro; a saber: Campell
(1993). Seuc (1998), Garca y Almenara (1999), Marrugat, Vila, Pavesi y Sanz
(1999), Surez y Alonso (1999), Marrugat, Vila y Pavesi (1999) y Silva (2000).
Antes de entrar en detalles, sugiero al lector que, valindose slo de su intuicin,
intente responder por s mismo el siguiente problema.
Dos investigadores quieren hacer respectivas estimaciones concernientes a la
poblacin adulta de una misma ciudad: uno de ellos quiere estimar la tasa de
prevalencia de ciegos; el otro se interesa por conocer el porcentaje de individuos
que han acudido al mdico al menos una vez en los ltimos 5 aos. Guindose

316

DISEO RAZONADO DE MUESTRAS

simplemente por el sentido comn, cul de los dos investigadores necesitar a


su juicio una muestra mayor?
Es bastante intuitivo que en el segundo caso una muestra de, por ejemplo,
solamente 50 sujetos podra servir. No se afirma que la estimacin resultante en
tal caso sea buena; slo que no sera descabellado trabajar con dicho tamao. Por otra parte, un par de clculos elementales nos permiten comprender
que una muestra de 50 personas tomada de la poblacin general ser flagrantemente insuficiente para estimar el primer parmetro. Veamos: es casi seguro que
ella no contenga ciego alguno (en cuyo caso sacaramos la absurda conclusin
de que no hay ciegos en la ciudad, ya que no slo la estimacin puntual sera
igual a cero, sino que tambin el error estimado sera nulo); pero si apareciera al
menos un invidente en la muestra, en principio se concluira que la tasa de ceguera es por lo menos 2%, dato casi tan absurdo corno el anterior, pues se sabe
positivamente que la verdadera tasa de ceguera es marcadamente menor (ntese que el intervalo de confianza en caso de que hubiera un ciego en la muestra
sera aproximadamente [-2%, 6%], lo cual equivale a no decir nada que no sepamos). Tales despropsitos no ocurrirn con el porcentaje de individuos que
acudieron al mdico; si por ejemplo, 20 de los 50 encuestados estuvieran en ese
caso, la estimacin de la tasa sera muy imprecisa, pero no sera ni mucho menos disparatada. Sin embargo, este ltimo porcentaje est muchsimo ms cerca
de 50% que la tasa de ceguera. Cmo sostener entonces que el cmodo recurso de suplir p por 50 produce el tamao muestral mayor que pudiera exigir el
problema? Dicho de otro modo: tanto la intuicin como un simple anlisis cuantitativo nos conducen inevitablemente a pensar que para estimar adecuadamente la prevalencia de un fenmeno muy raro necesitamos una muestra muy grande, lo contrario de lo que ocurre cuando se trata de estimar una prevalencia
prxima a 50%.
De modo que la afirmacin del ltimo recuadro entra en franca colisin contra nuestro sentido lgico. Las reflexiones que siguen reafirman que, esta vez, no
se trata de que la intuicin nos traicione, sino de que el contenido del recuadro
intercalado al inicio de esta Seccin es errneo.

(1,96)2 P(100 P) como fun,


E02
cin de P, alcanza su mximo valor para P = 50. Ntese que en tal caso:
Formalmente, es cierto que la expresin, n0 =

n0 =

(1,96)2 2.500 10.000

E02
E02

y que cualquier otro valor de P producir un n0, menor. Por ejemplo, para P = 30
(al igual que para P = 70), tendramos: n

8.400
.
E02

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

317

Tabla 12.5.1. Magnitud del producto P (100 - P) para diferentes valores de


P en el recorrido que va de 0 a 100
P

10

30

50

70

90

95

100

P(100P)

475

900

2.100

2.500

2.100

900

475

La Tabla 12.5.1 muestra el comportamiento de P(100 P) para varios valores escogidos de en su recorrido posible de 0 a 100.
Como se aprecia, P(100 P) disminuye en la medida que P se aleja de 50,
cualquiera sea la direccin en que ello ocurra.
Ahora bien, n0 es una funcin de P, pero tambin lo es de E0, de modo que la
relacin entre P y n0 slo es vlida siempre que se suponga que E0 est fijado
de antemano. Sin embargo, y aqu radica la esencia de todo: el mximo error
absoluto E0 que se puede admitir a la hora de estimar no puede establecerse
razonablemente sin tener en cuenta la de P; no se podr fijar hasta que no se
tenga una idea de dicha magnitud.
Imaginemos que se ha estimado la prevalencia de cierta dolencia especfica,
y que se sabe que el error que se ha cometido al hacerlo no excede al 1%. Es
grande o pequeo ese error? Se ha conseguido estimar razonablemente bien el
valor de esa prevalencia P? Si el lector medita durante unos segundos y procura
responder a estas dos preguntas, no demorar en comprender que es imposible
darles respuesta hasta tanto no conozca cul es el valor de P. Esto es as, del mismo modo que no sabemos si resulta caro un objeto que se vende al precio de 100
dlares mientras no sepamos de qu objeto se trata.
En efecto, si se trata, por ejemplo, de la prevalencia de cncer pulmonar (un nmero prximo a 1 en 20.000), un error de 1% sera descomunal; pero, si se trata de
la prevalencia de hipertensin arterial (que podra ser un 15% quizs), tal error sera
perfectamente admisible, pues con seguridad es menor que la dcima parte de P.
Dicho de otro modo: cuando se va a calcular n0 en el caso que analizamos,
hay que preestimar P, no slo porque lo demanda explcitamente la frmula
[12.2], sino porque sin ese conocimiento es imposible decidir el valor del error
absoluto que tambin aparece en ella.
Imaginemos que le pedimos al seor Lemeshow que calcule el tamao muestral para un estudio que realizaremos en una poblacin de 2.000 habitantes. Para
simplificar las cosas le diremos que se trata de un MSA y que queremos estimar
un solo parmetro: el porcentaje de sujetos que poseen cierto componente sanguneo denominado farsemia. Se trata de un componente que est presente (o
no) en la sangre de cada individuo; pero no tenemos ni la menor idea de cul
ser el porcentaje de sujetos que posee ese rasgo. l conoce N, puede decidir, por
ejemplo, que en 0,05, y suponer que P = 50 (no porque crea que se es el valor, sino para tener la muestra mayor posible); ahora bien, qu valor coloca-

318

DISEO RAZONADO DE MUESTRAS

r en lugar de E0 dentro de [12.2]? Es simplemente imposible fijar ese nmero de


manera racional mientras no se tenga una idea de la verdadera prevalencia de
farsemia entre los seres humanos. Cualquier valor de E0 que l surgiera pudiera
ser enorme (o exageradamente pequeo) comparado con la prevalencia de farsemia, ya que sobre ese nmero se ignora todo. Es para m un excitante misterio
conocer qu respuesta dara a dicha pregunta.
Lo que s podra fijarse de antemano es el valor del error relativo. Por ejemE
plo, podra decidirse que ste no sobrepase al 10% de P: Er = 0 = 0,1. para poP
ner n0 en funcin de Er, se divide tanto el numerador como el denominador de
[12.2] por P2 y se tendr:

n0 =

100 P
P
Er2

(1,96) 2

[12.7]

100 P
.
P
Ya no aparece el fastidioso E0 en la frmula. Pero es fcil ver que, a diferencia de
De modo que para Er = 0,1, al aplicar [ 12.7] se tiene que n0 = 384

P (100P), la expresin (100 P ) que ahora tenemos no est superiormente


P
acotada ni alcanza su mximo para P = 50, sino que tiende a infinito en la medida que P se aproxima a 0.
Dicho de otro modo: cuando se prestablece el error en trminos relativos, n0
crece en la medida que P disminuye, resultado que no nos puede sorprender,
pues como ya vimos en el ejemplo de los ciegos es coherente con la intuicin:
si el rasgo cuya prevalencia se quiere estimar es muy poco frecuente, entonces el
tamao de muestra necesario ha de ser muy alto.
En sntesis, la regla que se ha examinado es absurda porque olvida que el
conocimiento previo del valor de la prevalencia es necesario no slo para sustituirlo en la frmula, sino tambin para poder fijar E0, detalle que la mgica
sustitucin de P por 50 no resuelve. Si no se tiene la menor idea de cul es el
valor de p, lo nico sensato es procurar alguna informacin al respecto usando
un tamao muestral elegido sin emplear frmula alguna. Consideraciones conexas a las que se acaban de abordar pueden hallarse en la Seccin 3.8.7.

12.8.3. Diseos convertidos en un esfuerzo estril


Con frecuencia se realiza un diseo probabilstico (a veces complejo), pero
luego no se calculan errores de muestreo, o se hacen vagas declaraciones en torno a ellos. Es decir, se trabaja con rigor en la fase de diseo, se acude incluso a

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

319

un especialista con el fin de conseguir que la muestra sea probabilstica, pero en


la fase de anlisis se prescinde del clculo de errores. Se reducen as los esfuerzos iniciales a un formalismo. Probablemente, quienes as se conducen creen
errneamente (vase Seccin 1.7) que al hacer un diseo formal con participacin del azar estn insuflando representatividad a la muestra, cuando lo nico
que asegura tal procedimiento es la objetividad del muestrista y la posibilidad de
estimar el grado de precisin de las estimaciones.
No es raro encontrar afirmaciones como sta: los porcentajes de esta encuesta se han estimado dentro de mrgenes de error inferiores al 5%. Cabe
preguntarse: qu se quiere decir con tal afirmacin? Significa que el error relativo es para todas las estimaciones inferior a la vigsima parte de los respectivos valores puntuales? Si es as, hay que decirlo con toda claridad17. Si se trata
de que es el error absoluto el que no excede el 5%, probablemente no haya motivo alguno para el regocijo, ya que cualquier caracterstica cuya presencia se haya estimado por debajo del 30% estara afectada por un error relativo posiblemente muy grande, y quizs enorme. En cualquier caso, as formulada, se trata
de una informacin borrosa y equvoca, y no es improbable que tal afirmacin
concierna exclusivamente a la variable elegida para determinar el tamao muestral.
En una encuesta para evaluar actitudes sociales ante el SIDA entre el colectivo de trabajadores de la salud en Espaa, por poner un ejemplo real, Arredondo, Coronado, De la Fuente y Luengo (1990) incurren en la omisin que nos
ocupa. Se obtuvo una muestra estratificada bietpica de 1.325 trabajadores y se
identificaron cuatro subclases, a saber: Mdicos (491), Personal de Enfermera
(399), Personal Auxiliar de Enfermera (389) y Asistentes Sociales (46).
A lo largo del texto no se trabaja con errores de muestreo ni con intervalos de
confianza. Al respecto, slo se comunica textualmente lo siguiente:
Los mrgenes de error pueden aproximarse por las frmulas habituales
para muestreo aleatorio simple en el caso de distribuciones de variables
con dos categoras igualmente distribuidas (p = q = 50%). A un nivel de
confianza del 95% los errores de muestreo absolutos seran:
Total de la muestra ........................... 2,7 %
Mdicos ............................................ 4,4%
Personal de enfermera .................... 4,9%
Personal Auxiliar de Enfermera...... 4,4%

Dicha declaracin suscita en principio los siguientes dos comentarios crticos:


17

Incidentalmente, de ser ese el caso se estara ante una magnfica encuesta.

320

DISEO RAZONADO DE MUESTRAS

a) Dado que se realiz un diseo complejo, no es correcto actuar como si se


tratara de un MSA y aplicar esa aproximacin que se afirma que puede
hacerse y de hecho se hace. Ntese, por ejemplo, que 2.7% es el valor del
error (frmula [12.6]) cuando se tiene p = 50% con una muestra de 1.325
en MSA (trabajando con f = 0).
b) Por qu no se comunica el error que afecta a las estimaciones de porcentajes correspondientes a los asistentes sociales? Siguiendo los mismos
clculos que realizaron estos autores y teniendo en cuenta que el tamao
muestral en este caso es 46, para el mismo caso p = 50, dicho error ascendera a 14,6%. O sea. un nmero enorme (casi un 30% de error relativo), sin contar el hecho de que, en realidad, es an ms grande, ya que el
muestreo no fue simple aleatorio. Si p = 7%, entonces incluso para
MSA sera 7,4% (error relativo del 100%!). Por otra parte, el hecho de
que no se mencione el error asociado a las estimaciones en este grupo, no
quiere decir que luego stas no se hagan: a lo largo del texto hay numerosas estimaciones circunscritas a esta subclase, as como juicios que reposan en las diferencias encontradas entre stas y las que se hallaron en los
otros grupos.

12.8.4. Sustitucin mecnica de unidades


A veces se sigue la tctica de suplir una unidad que no fue posible encuestar
por la que ocupa el siguiente lugar de la lista o la que subsigue dentro de la zona en que se trabaja. Por ejemplo, una casa deshabitada que estaba en la muestra se sustituye por la siguiente vivienda habitada segn cierto orden preestablecido. Tal prctica debe evitarse, porque rompe con la estructura probabilstica
establecida. Imaginemos una situacin muy simple: se quiere seleccionar una
muestra sistemtica con intervalo K = 4 de una poblacin de N = 20 viviendas:
supongamos que la regla preestablecida sea tomar la siguiente vivienda cada vez
que se tropiece con una deshabitada y que en nuestro listado la tercera vivienda
tenga esa condicin. De tal suerte, la probabilidad de seleccin de la cuarta vivienda sera la suma de su probabilidad inicial (0,25) y la de la tercera vivienda
(0,25). A la cuarta vivienda se le est otorgando la probabilidad de seleccin que
inicialmente se le haba asignado, ms la de la unidad precedente, debido a que
no se pudo localizar o a que no proceda encuestarla. Siendo as, las unidades
prximas a las conflictivas aumentan indebidamente su presencia en la muestra, con lo cual pueden sesgarse los resultados.
La conducta tcnicamente correcta es la de no hacer sustitucin alguna, sino
retener en la muestra solamente a los que, habiendo sido elegidos, son tambin
localizados y encuestados.
Asociada a la idea de sustituir unidades mecnicamente, se halla otra, a la vez
ms perniciosa y aun ms frecuente: determinar un tamao muestral e ir selec-

REFLEXIONES CRTICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

321

cionando elementos de un listado hasta que se alcance dicho tamao. Es evidente que, actuando de ese modo, se pierde el control probabilstico del proceso;
por decirlo rpido, las unidades que se hallan al final del listado tienen probabilidad mnima o nula de ser elegidas, en tanto que las primeras saldrn con certeza total o casi total.

12.8.5. Rutas aleatorias


Con alguna frecuencia las empresas que se ocupan de encuestas (raras veces
en el marco de la investigacin cientfica de salud) mencionan en sus fichas tcnicas que se han empleado las llamadas rutas aleatorias dentro del diseo.
Supuestamente, se trata de la aplicacin del azar para determinar los movimientos sobre el terreno de los encuestadores, de manera que se produce una especie
de random walk; a partir de tales rutas, ellos siguen ciertas reglas de conducta,
muchas veces difusas, para decidir las viviendas que han de encuestarse.
El procedimiento carece de un marco terico claro y abre evidentes conflictos en materia de control del carcter probabilstico de la muestra, generando la
consiguiente suspicacia en materia de sesgos. Autoridades de fama mundial,
como Leslie Kish, no slo han desestimulado y criticado el uso de este recurso,
sino que han instado a las empresas a responder a tales sealamientos (Kish,
1994).

Bibliografa
ABC. La macroencuesta del CIS encargada por el Gobierno reconoce al PP una ventaja de ms de 50 escaos. Madrid: 14 de febrero, pg 22. 1996.
Alien JD, An overview of imputation procedures. (Staff Report SMB90-06. US Department of Agriculture, Washington, DC), 1990.
Argimn JM, Jimnez J. Mtodos de investigacin: Aplicados a la atencin primaria de
salud. Barcelona: Doyma, 1991.
Arredondo C, Coronado A, de la Fuente M, Luengo S. Actitudes sociales ante el SIDA
entre el colectivo de trabajadores de la salud. Madrid: Ministerio de Sanidad y Consumo. 1990.
Azorn F. Snchez-Crespo JL. Mtodos y aplicaciones del maestreo. Madrid: Alianza.
1986.
Campbell MJ. Sample sized in audit. British Medical Journal 1993: 307: 735-736.
Carvajal A. Garca JL, Holgado E, Velasco A. Consumo de drogas en una muestra de
mdicos rurales de Valladolid. Medicina Clnica 1984; 83: 444-446.
Church AH. Estimating the effect of incentives on mail survey response rates: A metaanalysis. Public Opinion Quarterly 1993; 57:62-79.
Davidoff F (ed). Standing Statistics Right Side Up. Annals of Internal Medicine
1999:730:1019-1021.

322

DISEO RAZONADO DE MUESTRAS

Dillman D, Gallegos JG, Frey J. Reducing refusal rates for telephone interviews. Public Opinin Quarterly 1976; 40: 6678.
Domenech JM. Mtodos estadsticos en ciencias de la salud. Unidad Didctica 5. Barcelona: Grficas Signo. 1990.
Eaton WW, Anthony JC, Tepper S. et al. Psychopathology and attrition in the catchment
area study. American Journal of Epidemiology 1992: 135: 1051-1059.
El Pas. Triunfo claro de Amar en el primer debate. 26 de mayo, pgina 15. Madrid.
1993.
El Pas. Barmetro de otoo. 30 de noviembre, pgina 18. Madrid, 1997.
El Pas. Los votantes del PSOE creen que ganar Almunia. 27 de marzo, pgina 15. Madrid. 1998a.
El Pas. Borrell aventajara a Aznar por 10 puntos. 26 de abril, pgina 19, Madrid.
1998b.
Elveback LR, Guillier CL, Keating FR. Health, normality, and the ghost of Gauss. Journal of the American Medical Association 1970: 211: 69-75.
Erdos P. Profesional mail surveys. New York: McGraw Hill. 1970.
Fay, RE. Alternative paradigms for the analysis of imputed survey data. Journal of the
American Statistical Association 1996; 91: 490-498.
Garca C. Almenara P. Determinacin del tamao de muestra en variables cualitativas
en las que se desconoce el valor del parmetro. Medicina Clnica.\999: 112:
797-798.
Gonzlez ME, Ogus JL. Shapiro G. Tepping. BJ. Standards for discussion and presentation of errors in survey and census data. Journal of the American Statistical Association 1975: 70. Number 351. Part II.
Goodman SN. Toward evidence-based medical statistics. 1: The P value fallacy. Annals
of Internal Medicine 1999; 130:995-1004.
Gor F. La verdad de las encuestas. Madrid: El Pas, 4 de enero. 1988.
Hagood MJ. Statistics for sociologists. New York: Reynal and Hitchcock. 1941.
Hansen MH. Hurwitz WN. The problem of nonresponse in sample surveys. Journal of
the American Statistical Association 1946; 41: 516-529.
Hansen MH. Hurwitz WN. Madow WG. Sample survey methods and theory. New York:
Wiley and sons. 1953.
Hsieh FY. Sample size tables for logistic regression. Statistics in Medicine 1989; <N': 795802.
Illich 1. Medical nemesis. Londres: Calder and Boyars. 1975.
Jenicek M. Cleroux R. Epidemiologa. Principios-tcnicas-aplicaciones. Barcelona:
Salvat. 1987.
Kessler RC. Little RJA, Grover RM. Advances in strategies for minimizing and adjusting for survey non response. Epidemiologic Reviews 1995: 17.192-204.
Kish L. Survey sampling. New York: Wiley. 1965.
Kish L. Questions/Answers. From the Survey Statistician 1978-1994. Pars: 1ASS. Vespa-Leyder. 1994.
Lemeshovv S. Hosmer Jr DW, Klar J. Lwanga SK. Adequacy of sample size in health studies. New York: Wiley. 1990.
Levy PS. Lemeshow S. Sampling for health professionals. Belmont: Lifetime learning
Publications, 1980.

REFLEXIONES CRITICAS SOBRE LA PRCTICA MUESTRAL CONTEMPORNEA

323

Lwanga SK, Lemeshow S. Sample size determination in health studies: a user's manual.
Geneva: World Health Organization. 1989.
Marrugat J, Vila J, Pavesi M, Sanz F. Rplica, Cartas al Director. Medicina Clnica
1999; 112:798.
Marrugat J, Vila J. Pavesi M. Supuesto de mxima indeterminacin: error absoluto o
error relativo en el clculo del tamao de la muestra? Gacela Sanitaria 1999; 13:
491-493.
Meja JM, Fajardo A, Gmez A, Cuevas ML, Hernndez H, Garduo J et al. El tamao
de muestra: un enfoque prctico en la investigacin clnica peritrica. Boletn Mdico del Hospital Infantil de Mxico 1995; 52: 381 -391.
Murphy EA. The normal. American Journal of Epidemiology 1973; 98: 403-411.
Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypotheses. Philosophical Trans of the Royal Society of London 1933: A 231: 289-337.
Nordholt ES. Imputation: Methods, Simulation Experiments and Practical Examples. International Statistical Review 1998: 66:157-180.
Riegelman RK. Hirsch RP. Cmo estudiar un estudio y probar una prueba: lectura crtica de la literatura mdica. Publicacin Cientfica N." 53 I. Washington: Organizacin Panamericana de la Salud, 1992.
Rietz HL. Mathematical statistics. Carus Mathematical Monograph N. 3. Mathematical
Association of America. Chicago: Open Court Publishing. 1927.
Rothman JK. Modern Epidemiology. Boston: Little. Brown and Col., 1986.
Rothman JK. Greenland S. Modern Epidemiology (2. a edicin). Philadelphia: Lippincott-Raven, 1998.
Rubin DB. Multiple imputation for nonresponse in surveys. New York: Wiley, 1996.
Rubin DB. Schenker N. Multiple imputation in health-care databases: an overview and
some applications. Statistics in Medicine 1991; 10:585-598.
Seuc AH. Relation between the prevalence of a characteristic and the size of the sample
needed to estimate it. European Journal of Epidemiology 1998; 14: 627-628.
Silva LC. La crisis de las pruebas de hiptesis y la perspectiva bayesiana Memorias del
XI Congreso de la Sociedad Gallega de Estadstica e Investigacin Operativa: Santiago de Compostela, octubre 1999.
Silva LC. Nueva visita al supuesto de mxima indeterminacin y al empleo de errores
absolutos y relativos Gaceta Sanitaria: 2000: 14: 255-257.
Silva LC. Maestreo para la investigacin en ciencias de la salud. Madrid: Daz de Santos, 1993.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: una mirada crtica. Madrid: Daz de Santos. 1997.
Singer E, Gebler N, Raghunathan T, VanHoewyk J, McGonagle K. The effect of Incentives on Response Rates in Face-to-Face, Telephone, and Mixed Mode Surveys. Survey Methodology Program 1996;. Institute for Social Research University of Michigan. N. 045.
Smidt RK, Tortora R. Evaluating the effects of nonresponse and the number of response
levels on servey samples. Statistical Case Studies. En: Peck R, Haugh LD y Goodman. A. Philadelphia: ASA. 1998.
Steeh CG. Trends in nonresponse rates. 1952-1979. Public Opinion Quarterly 1981;
45:40-57.

324

DISEO RAZONADO DE MUESTRAS

Stouffer SA. Sociology and sampling. En: Bernard LL (Ed). Fields and methods of
sociology. New York: Long and Smith, 1934.
Surez P, Alonso JC. Sobre el supuesto de mxima indeterminacin, el tamao muestral y otras consideraciones sobre muestreo. Gaceta Sanitaria 1999; 13: 243-246.
Verboon P. Nordholt SE. Simulation experiments for hot deck imputation. En Statistical Data Editing. Methods and Techniques, 1997; 2: 22-29. New York/Geneva: United Nations.
Verma V, Le T. An analysis of sampling errors for the demographic and health surveys,
International Statistical Review 1996; 64: 265-294.
Yates F. The influence of Statitical Methods for Research Workers on the development
of the science of statistics. Journal of the American Statistical Association 1951;
46: 32-33.
World Fertility Survey. Manual on sample designs. The Hauge: International Statistical
Institute, 1975.
Wright C. La imaginacin sociolgica. La Habana: Revolucionaria, 1961.

ndice de autores

ABC, 321,310
Allen JD, 321,298
Almeida N, 5, 29
Almenara J, 315, 322
Alonso JC, 315, 324
Altman DG, 26, 29, 30
Anderson RBW, 50, 80
Andrews FM, 38, 45
Anthony A, 262,271
Anthony JC, 322
Aquilino WS, 54, 80
Argimn JM, 315, 321
Arranz M, 62, 82
Arredondo C, 319, 321
Asok C, 2, 31
Avila S, 64, 66, 70, 80
Azorn F, 2, 29, 315, 321
Baker RP, 37, 80, 82
Bar-Hillel M, 112, 123
Barnett ML, 26, 29
Barnwell BG, 261,271
Barreras M, 202, 208
Baum F, 6, 29
Bearwood J, 152, 153
Benavides A, 236, 250
Bennet S, 221,230
Berent J, 190,208
Bieler GS, 261,271
Biemer PP, 82
Bishop GF, 52, 80
Boruch RF, 214, 230
Boudon R, 5, 29
Bradburn N, 36, 53, 71, 83

Brick JM, 262, 271


Broene P, 262, 271
Brown GH, 215,230
Bullpit CJ, 26, 29
Burt G, 37, 80
Byar DP, 245, 249
Campbell MJ, 315, 321
Carroll RJ, 227, 231
Carvajal A, 274, 321
Castellanos PL, 6, 29
Cecil JS, 214, 230
Clark F, 83
Clark HH, 62, 80
Clarridge BR, 58, 80
Cleroux R, 315, 322
Cochran WG, 2, 17, 30, 152, 153
Converse JM, 54, 79, 80
Coronado A, 319, 321
Couper MP, 37, 80
Cuevas ML, 323
Cummings SR, 248, 249
Checkoway H, 245, 250
Cha KS, 26, 30
Chrandasekar C, 217, 230
Church AH, 319, 321
Churchill RE, 218, 321
Dalenius T, 2, 30, 214, 230
Davidoff F, 26, 30, 281,321
Dawson J, 26, 30
De la fuente M, 319, 321
Deming WE, 2, 30, 209, 210,
217,230,

Deutscher I, 50, 80
Diez AV, 247, 249
Dillman DA, 297, 322
Dodge Y, 123
Domenech JM, 315, 322
Eaton WW, 296, 322
Efron B, 210, 230
Eisenhower D, 48, 80
El Pas, 304, 305, 306, 322
Elveback LR, 300, 322
Erdos P, 297, 322
Erzog AR, 58, 82
Evans RG, 248, 249
Evans SJW, 26, 30
Ezzati TM, 215, 231
Fajardo A, 292, 323
Farias H, 128, 129, 139
Fay RE, 298, 322
Feinstein AR, 245, 249
Feller W, 216, 230
Fienberg SE, 85, 123
Fisher RA, 87, 123
Flacks R, 81
Folsom RE, 215, 231
Fonseca L, 54, 80
Forthofer RNFox JA, 234, 250
Fowler FJ, 35, 36, 47, 54, 58,
78, 80, 81
Frankel M, 210, 230, 234,
250
Frey J, 297, 322
Fuller WA, 261,272

326

Gail MH, 227, 231, 245,249


Gallegos JG, 297, 322
Garca C, 315, 322
Garca FM, 238, 249
Garca JL, 274, 321
Gardner MJ, 26, 30
Garduo J, 323
Gebler N, 323
Gmez A, 292, 323
Gonzlez ME3, 313, 322
Gonzlez S, 61, 81
Goodman SN, 26, 30, 281, 322
Gor F, 306, 322
Gray A, 236,250
Greenland S, 237, 250, 292, 323
Grizzle JE, 227, 231
Groves RM, 295, 322
Guillier CL, 300, 322
Gurvitch G, 5, 30
Gutirrez I, 64, 81
Hagood MJ, 277, 322
Hammersley JM, 152, 153
Hansen MH, 2, 30, 117, 123,
147,208,289,298,322
Harding FD, 215, 230
Henderson RH, 221,230
Hernndez H, 323
Herzog AR, 58, 82
Hill AB, 235, 250
Hippler HJ, 71,82, 83
Hirsch RP, 303, 323
Holgado E, 274, 321
Holt D, 234, 250
Holton JH, 152, 153
Hook EB, 217, 230
Horwitz RI, 249, 245
Hosmer Jr DW, 244, 250, 283,
315,322
Hsieh FY, 290, 322
Hubbard ML, 82
Hulley SB, 248, 249
Hurwitz WN, 2, 30, 117, 123,
147, 207, 208, 289, 298,
322
Huskisson EC, 41, 81, 82

NDICE DE AUTORES

IASS, 2, 30
Illich I, 303, 322
Jabine TB, 36, 81
James F, 123
James P, 262, 271
Jenicek M, 315,322
Jessen RJ, 2, 30
Jimnez J, 315,321
Jones EF, 190,208
Kahneman D, 112, 123
Kalton G, 2, 30, 173, 176,
189,208
Keating FR, 300, 322
Keller S, 7, 30
Kennedy W, 272
Kessler RC, 295, 322
Kinsey AC, 70, 81
Kiesler S, 37, 81
Kish L, 2, 30, 91, 107, 121,
123, 128, 139, 162, 176,
186, 188, 192,201,208,
210,220,226,230,263,
272, 282, 309, 322
Klar J, 244, 250, 283, 315, 322
Knuper B, 55, 81,83
Koenig KE, 81
Kramer G, 236, 250
Krotki KJ, 211,230
Lamb CW, 215,230
Lasky T, 244, 250
Le T, 287, 324
Lee EL, 234, 250
Lehmer DH, 122, 123
Lehnen RG, 48, 81
Lehtonen R, 234, 250
Lemeshow S, 2, 30, 244, 250,
252,272,283,297,313,
315,322,323
Lessler JT, 82
Levy PS, 2, 30, 226, 231,297,
313, 322
Likert RA, 42, 81
Linninger CA, 40, 49, 81,
190, 208

Little RJA, 295, 322


Lorimor RJ, 234, 250
Losciuto LA, 54, 80
Louis T A, 47, 81
Luengo S, 319, 321
Lwanga SK, 244, 250, 252,
272,283,315,322,323
Lyman R, 50, 82
Macas M, 51,52 , 56, 57, 65,
70, 71, 76, 83
Madow WG, 2, 30, 117, 123,
133, 139, 207, 208, 289,
322
Madow LH, 133, 139, 147
Mangione TW, 47, 81
Marmor TR, 248, 249
Marrugat J, 110, 123, 315, 323
Martin CE, 70, 81
Martin J, 37, 82
Massagli MP, 58, 80
Massey JT, 215, 231
Mathiowetz NA, 48, 80
Mathisen A, 26, 29
McCarthy PJ, 19,31
McDaniel SA, 211,230
McGonagle K, 323
McLaughlin JK, 245, 250
Megill DJ, 262, 272
Meja JM, 293, 323
Mendenhall W, 2, 31, 50, 82
Mills P, 26, 30
Moreira J, 69, 81
Morgan DC, 80, 81
Morganstein D, 48, 80
Morris LB, 248, 249
Moser CA, 189, 208
Mosteller F, 17, 30
Murphy EA, 302, 323
Murthy MN, 2, 30
Navarro E, 68, 81
Neuman I von, 122, 123
Newcomb TM, 40, 81
Neyman J, 2, 30, 151, 153,
280, 323
Nicholls WLII, 37, 82

327

NDICE DE AUTORES

Nixon M, 262, 272


Noelle-Neumann E, 83
Nordholt SE, 298, 323, 324
OMuircheartaigh C, 190, 208
OReill JM, 37, 82
Ogus JL, 313, 322
Oldendick RW, 52, 80
Ortiz T, 67, 82
Osgood CE, 43, 82
Ott L, 2, 31
Pahkinen EJ, 234, 250
Parada J, 2, 30
Partk HJ, 272
Pavesi M, 110, 123, 315,323
Payne SL, 35, 82
Pearce N, 245, 250
Pearson E, 280, 323
Pee D, 227, 231
Pidrola G, 238, 250
Platek R, 231
Pomeroy WB, 70, 81
Presser S, 48, 54, 79, 80, 82
Prieto L, 6, 31
Raghunathan TE, 227, 231, 323
Raj D, 2, 31
Rao JNK, 210, 231
Rebagliato M, 62, 82
Regal RR, 217, 230
Rhodes IN, 215, 231
Riegelman RK, 303, 323
Rietz HL, 300, 323
Robinson WS, 246, 250
Rodger WL, 58, 82
Rothman KJ, 26, 31, 247, 250,
292,323
Royall R M, 25, 26
Rozeboom WW, 26, 31
Rub A, 165, 176
Rubin DB, 298, 323
Ruiz I, 62, 82
Rust F, 210,231
Ryan L, 227, 231
Sabido V, 74, 82
Saeteros R, 74, 82

Salsburg D, 26, 31
Sampford MR, 2, 31
Snchez JL, 2, 29, 315, 321
Snz F, 323
Saris WE, 37, 82
Sarndal CE, 231
Scott PJ, 4 1 , 8 2
Scheaffer RL, 2, 31, 50, 82
Schnell D, 272
Schober MF, 62, 80
Schuman HH, 48, 82
Schwartz S, 246, 250
Schwarz N, 36, 44, 71, 82,
83
Seuc AH, 110, 123,315,323
Severynse J, 262, 271
Shah BV, 261,271
Shamdasani PN, 80, 83
Shapiro G, 313, 322
Siddiqui MK, 190,208
Silva LC, 3,5,23, 25, 3 1 , 5 1 ,
52,56,57,65,70,71,75,
76,77,78,83,88, 110,
123, 128, 129, 139, 165,
176, 194,202,208,210,
215,231,236,238,246,
247,251,263,272,278,
281,282,315,323
Silverman DT, 245, 250
Singer E, 297, 323
Singh MP, 231
Sirken MG, 226, 231
Skinner CJ, 234, 250
Skogan WG, 48, 81
Slonim MR, 2, 31
Smidt RK, 295, 323
Smith TMF, 234, 250
Som RK, 2, 31
Sowey ER, 123
Sproull LS, 37, 81
Steeh CG, 295, 323
Stem EE, 215,230
Stephan FF, 19, 31
Stewart DW, 80, 83
Stolley PD, 244, 250
Stokes M, 262, 271

Stouffer SA, 278, 324


Stuart A, 2, 31
Suarez P, 315,324
Suarez R, 263, 272
Suci GJ, 43, 82
Sudman S, 36, 53, 71,83
Sukhatme BV, 2, 31
Sukhatme PV, 2, 31
Sukhatme S, 2, 31
Sullivan G, 272
Sundaresan T, 221,230
Susser M, 236, 246, 250
Syme L, 247, 250
Tannenbaum PH, 43, 82
Tanur JM, 36, 83, 85, 123
Tepper S, 322
Tepping BJ, 313, 322
Teutsch SM, 218, 231
Thomas N, 227,231
Thompson WD, 26, 31
Tortora R, 295, 323
Tracy PE, 215, 231
Triana I, 73, 83
Tschuprow AA, 151, 153
Tuchfarber RJ, 52, 80
Tukey JW, 17,30
Turner CF, 82
Tversky A, 112, 123
US Census Bureau, 219, 231
Van Hoewyk J, 323
Vzquez E, 252, 272
Velasco A, 274, 231
Verboon P, 298, 324
Verma V, 287, 324
Vila JS, 110, 123,315,323
Vitale RA, 214, 230
Wacholder S, 227, 231,245,
250
Walker AM, 26, 31
Warner L, 5, 31
Warner S, 210, 231
Warwick DP, 40, 49, 81,
190, 208
Watts D, 262, 271
Weeks MF, 37, 83

328

Wells HB, 217, 231


Wilkinson RG, 248, 250
Williams B, 2, 31
Williams P, 227, 231
Williams R, 245, 249

NDICE DE AUTORES

Withey SB, 45, 80


Wolter KM, 218, 250
World Fertility Survey, 314,
324
Wright C, 293, 324

Yamane T, 2, 31, 92, 123, 151,


153
Yates F, 2, 31, 87, 123, 280, 324
Zdep SM, 215, 231
Zeser LM, 227, 231

ndice de materias

anlisis contextual, 245-247


aplicaciones informticas, 251-271
aproximaciones de tamao, 186
arranque aleatorio, 125, 134-138
asignacin
aleatoria, 248
de Neyman, 151
de tamaos mustrales a los estratos, 151
proporcional, 151-152,256
BMDP, 252
bootstrap, 210
brainwriting, 6
CADAC, 37
campana de Gauss, 98-99, 303
causalidad, 235-242
censos, 29, 35, 219-220
CENVAR, 262
ciclicidad del marco muestral, 137-139
CLUSTERS, 262
coeficientes de correlacin, 234, 237-240, 277278, 283, 290, 292
coeficientes de regresin, 26, 209, 233-234, 261263, 290
comparabilidad, 7
comparacin, 234
confeccin de un cuestionario, 45-58
confiabilidad, 24, 101, 103, 284-286, 305-306
conteo mltiple, 222-225
correo electrnico, 37, 216
cross-ciases, 203 CSAMPLE, 254-261
cuestionarios, 36-76, 227-228
cuestionarios autoadministrados, 36-37

definicin operacional, 113, 244


DEMOSCOPIA, 304
diseos
complejos, 189-207,233-234
con cuestionario parcial, 227-230
equiprobabilsticos, 11-14, 252-254
no probabilsticos, 15-18
probabilsticos, 8-14
distribucin
de la media muestral, 98-100
normal, 98-101,300
efecto de diseo, 173-175, 203, 207, 261, 269,
284-287, 309
EGRET, 252
encuesta
a pie de urna, 311
asistida por ordenador, 37
de prensa, 304-312
electoral, 304-312
piloto, 77-80
enmascaramiento, 248
ensayo clnico, 118, 243, 248
EPIDAT, 252 EPI2000, 254
EPIINFO, 259-260, 286
EPITABLE, 252
error
absoluto, 27-28, 105-111, 123, 151, 185,
284, 313, 315, 318
ajeno al muestreo, 35
cuadrtico medio, 91-92
mximo, 23-25, 102,286
no muestral, 103-105, 284, 317

330

NDICE DE MATERIAS

de muestreo, 313
relativo, 109-111, 113-115,27-28,308,315-320
escala
analgica visual, 41
de Likert, 42, 81
grfica, 45
semntica diferencial, 43-45
estadstica bayesiana, 281
estimacin
de razn, 119-120
mximo verosmil, 25, 216
por intervalos, 23, 27
por pesca y repesca, 216
puntual, 106-109
estimador
de mxima verosimilitud, 25, 216
de razn, 119-121, 160-166, 171,195
insesgado, 90-91, 107-108, 128, 132, 145150, 160-165, 168-169, 196
estratificacin, 141-152, 189-195, 253, 256
estratificacin de unidades de primera etapa
estudio
analtico, 283, 291
ciego, 248
de casos y controles, 244, 291
de cohorte, 236
de epidemiologa analtica, 243
descriptivo, 3-4, 7-8, 23, 283-285
ecolgico, 245-248
experimental, 85, 235-236, 243, 248-249
longitudinal, 242, 294
piloto, 77-78, 113,284
retrospectivo, 77-80, 113-114
transversal, 196,235-242
experimentos, 35-36
extrapolacin, 142,273-281
factor
de correccin, 175
de confusin, 235-237
falacia ecolgica, 246 ficha
tcnica, 304-309 formulacin
del problema, 3 fraccin
fija, 170
de muestreo, 89

GLIM, 252
hiptesis
de causalidad, 3, 236
ms desfavorable, 304-308
historia de vida, 6
homeopata, 118,248,304
horscopo, 304
hot deck method, 298
IASS, 2
imputacin, 297-298, 312
indagacin de mercado, 3
informacin autorrepresentada, 274-275, 281
informantes claves, 6
INTERNET, 20, 307
intervalo
de confianza, 23-27
no informativo, 26, 105
investigacin
cientfica, 36-38
descriptiva, 3-8, 23, 237-240
transversal, 196,235-242
experimental, 85, 235-236, 243, 248-249,
291
jackknife, 209, 262
marco muestral, 9, 33, 156, 191, 273-276, 281
mximo error admisible, 103-105
mediana, 90-92 mtodo
cientfico, 3, 31
cualitativo, 5-6, 48
de seleccin en fases, 128-131
del intervalo fraccional, 128
probabilstico, 8-14
regular de seleccin sistemtica, 126-127
modelos jerrquicos, 248
muestras
interpenetrantes, 209
maestras, 220
no probabilsticas, 15-18
representativas, 19-22
transversales, 235-242
muestreo
aleatorio estratificado, 141-153
bietpico, 166

NDICE DE MATERIAS

condicional en dos fases, 218


en el tiempo, 219
en etapas con submuestreo, 166-172
en red, 222-225
estratificado polietpico, 189-207
por conglomerados, 156-173
por conglomerados monoetpico, 157-165
por cuotas, 17-18
polietpico, 173-176
replicado, 209
semiprobabilstico, 17
simple aleatorio, 85-113, 252
simple aleatorio con reemplazo, 116
sistemtico, 125-139
sistemtico en faces, 128-131
multilevel analysis, 248-249
no respuesta, 215, 275, 295-299, 312
nmeros
aleatorios, 87-88, 121-122
pseudoaleatorios, 87, 121-122
nmero de estratos, 152
observacin
estructurada, 6
participante, 6
odds ratios, 237-242, 291-292
permutacin aleatoria, 138
pilotaje, 77-80, 113-114,286
plan de tabulacin, 33
ponderaciones, 141-142, 145, 171-172,252-256,
205-206
postestratificacin, 291
pre-estimacin, 285
pregunta de respuesta mltiple
preguntas
abiertas, 38, 48-49
cerradas, 38, 48-50
conflictivas, 37
cualitativas, 39
cuantitativas, 39
de escala, 41-42
de filtro, 54-57, 69-70
de investigacin, 3-4
de ordenacin, 39
de respuesta mltiple, 66-67

331

embarazosas, 37
especficas, 59, 73-74
negativas, 59-60
sensibles, 59, 72-73
premisa de precedencia temporal, 235-236
presentacin de errores mustrales, 313
prevalencia, 25, 196-199, 238-240, 283, 315318
principio de mxima indeterminacin, 123
probabilidad
condicional, 11, 170
de seleccin o de inclusin, 12-15, 169-171,
128-129, 142-143, 107,252-254
problema
de estimacin, 8, 160-161, 234
de muestreo, 8, 33, 106
programa informtico, 251 -271
proyecto de investigacin, 31
pruebas de hiptesis, 25-26, 31, 233-235, 277-280
recorrido de normalidad, 299-300
reencuestas de control, 312
regresin mltiple, 233, 292, 298
representatividad, 7, 18-22, 141, 143, 174, 189,
196, 220, 273-281
respuesta
aleatorizada, 53, 210-215, 231
annima, 215
retrotraduccin, 50
rutas aleatorias, 321
S-PLUS, 252
salud ocupacional, 302
SAS, 252, 262-263
screening, 218
seleccin
en etapas, 156
por cuotas, 17-18
segn criterio de autoridad, 17
sesgos, 16-18, 48, 52, 7 1 , 9 1 , 120, 128, 160,
168, 275,2 95-297
SIGESMU, 113, 119, 249, 263-271, 314
significacin estadstica, 25-27, 277-283, 291
simulacin de muestras, 265-269
sistemas duales de registro, 217
software, 26, 251-271
sondeos polticos y electorales, 304-312

332

NDICE DE MATERIAS

SPSS, 252-253
STATA, 262
STATCALC, 252, 255, 286
subjetividad, 6, 291-293, 985-288
SUDDAN, 261
superuniverso, 277-281
sustitucin mecnica de unidades, 320
SYSTAT, 252
tablas de nmeros aleatorios, 87
tamao muestral, 12-13,94, 98-105, 109-113,
146-147, 151-152, 158-159, 207-208, 243,
251, 282-295, 307-309, 313-317
tamizaje, 218-219, 302
tcnicas
cualitativas, 5-6, 48
de evaluacin rpida, 221
grupales, 6

teorema de bayes, 219


teorema central del lmite, 98
teora oficial, 287, 313
unidades
autorrepresentadas, 200-201
de anlisis, 9
de muestreo, 9
de primera etapa, 156
de segunda etapa, 156
universo hipottico, 277-281
validacin, 77-79, 215
valores normales, 299-304
variable sinttica, 78-265
vaticinios electorales, 309-312
VPLX, 262
WESVAR PC, 262

S-ar putea să vă placă și