Documente Academic
Documente Profesional
Documente Cultură
DE MUESTRAS Y
CAPTACIN DE DATOS
PARA LA INVESTIGACIN
SANITARIA
ZZZPHGLOLEURVFRP
DISEO RAZONADO
DE MUESTRAS Y
CAPTACIN DE DATOS
PARA LA INVESTIGACIN
SANITARIA
LUIS CARLOS SILVA AYAGUER
INSTITUTO SUPERIOR DE CIENCIAS MDICAS DE LA HABANA
Investigador Titular
Profesor de la Escuela de Salud Pblica de La Habana
ISBN: 978-84-7978-454-6
Depsito legal: 34.147-2000
Fotocomposicin: FER Fotocomposicin (Madrid)
Impresin: EDIGRAFOS, S.A. (Madrid)
Encuadernacin: RSTICA-HILO, S. L. (Madrid)
Contenido
PRLOGO ............................................................................................
XVII
PRESENTACIN ..................................................................................
XXI
1
3
3
5
7
8
9
9
11
11
12
14
16
19
19
20
21
22
23
23
25
xii
25
27
29
29
33
33
35
35
36
37
38
45
45
58
77
80
85
85
87
88
88
91
94
98
101
102
106
107
107
109
111
113
116
CONTENIDO
xiii
116
117
118
119
121
123
125
126
128
128
132
134
138
139
141
143
144
147
151
151
152
152
153
153
156
157
158
160
161
164
166
168
xiv
169
171
172
173
173
176
178
180
181
183
184
186
188
189
190
192
195
196
200
200
201
203
204
207
208
209
210
216
218
219
CONTENIDO
xv
220
221
222
226
227
230
233
235
235
237
240
242
243
244
245
248
249
251
252
252
254
254
261
263
263
263
265
269
271
271
xvi
273
273
277
278
281
281
282
283
285
291
292
293
295
295
296
297
298
299
299
301
302
304
304
307
309
313
313
313
315
318
320
321
321
325
329
Prlogo
Cuando a uno le proponen prologar un libro, experimenta una serie de sensaciones en cierto modo contradictorias. Un innegable orgullo, la seguridad de no
ser el ms adecuado, la duda de si colmar las expectativas del autor, la constatacin de que nos estamos haciendo viejos..., son algunas de ellas.
Entre otras muchas actividades, Luis Carlos Silva ha impartido decenas de
cursos de muestreo en nuestro pas, auspiciados por instituciones sanitarias autonmicas y centrales y como profesor colaborador de la Escuela Nacional de
Sanidad. Por todo ello, prologar su cuarto libro tiene la dificultad aadida de que
el autor es tan ampliamente conocido y valorado en Espaa que resulta difcil
descubrir al lector algo que no sepa de l. Intentar superar el sesgo que supone
haber ledo sus anteriores libros y la amistad que nos une, para enjuiciar este que
tienes entre tus manos.
Creo que es una opinin compartida por muchos profesionales de la salud pblica que el muestreo tiene mucho que ver con las arenas movedizas. Parece un
terreno transitable con unas cuantas precauciones y recetas, pero cuando nos
adentramos en l suele ser demasiado tarde para arreglar los desperfectos. El
puente que en su da tendi el autor con Muestreo para la investigacin en ciencias de la salud para librarnos del barro se refuerza y consolida hoy con este
Diseo razonado de muestras y captacin de datos para la investigacin sanitaria. Una vez ledos estos libros, el lector estar de acuerdo con que el autor y su
obra pertenecen a esa rara y valorada especie que invalida aquel Never trust
a biostatician. At worst, they will intentionally try to deceive and embarrass you.
At best, it is unitentional.
El nuevo texto incorpora en el marco conceptual del muestreo aspectos de la
estimacin puntual y por intervalos, y subraya el uso de intervalos de confianza
como alternativa a las pruebas de hiptesis. El lector encontrar un captulo
completo dedicado a la organizacin, diseo y validacin de encuestas y cuestionarios que ampla muy sustancialmente lo que se bosquejaba en su anterior libro sobre el tema.
xviii
En todo texto sobre muestreo son imprescindibles captulos sobre los diseos
aleatorio simple, sistemtico, estratificado y por conglomerados. El rasgo distintivo que encontrar el lector en estas pginas estriba en la claridad de la exposicin y en la estructura didctica del texto, sin que esto suponga una prdida de
profundidad o rigor, sino todo lo contrario. Este es, sin lugar a dudas, uno de los
mritos ms destacables del autor.
El captulo 9 aborda de forma ms suscinta, pero con un nivel de desarrollo
suficiente para su comprensin y hasta su puesta en prctica, tcnicas de muestreo como el replicado, muestreo en el tiempo, uso de muestras maestras, diseos
con cuestionario parcial y otras que pueden ser tiles a un buen nmero de lectores.
Cualquier investigador, clnico o epidemilogo, se encuentra habitualmente
ante el problema de determinar el tamao de la muestra para su estudio, sea este
descriptivo, analtico o experimental. Puesto que son bien conocidos diversos
textos que lo solventan tcnicamente, como por citar dos ejemplos, los de
Schlesselman o Friedman, este Diseo razonado de muestras y captacin
de datos para la investigacin sanitaria no se concentra en las formulaciones,
sino que pone el nfasis en dar una visin global, de profundo calado conceptual,
sobre tan polmico tema.
Cada vez contamos con ms programas de ordenador que cuentan con opciones para la determinacin de tamaos mustrales y el tratamiento de datos
en diseos complejos; el captulo 11 ofrece un anlisis descriptivo y crtico de un
buen nmero de ellos, desde el popular y completo CSAMPLE de EpiInfo hasta Stata o Suddan. Este valor aadido del libro se completa con el programa SIGESMU, que acompaa al texto, e ilustra de forma clara y original diversos
mtodos para el cumplimiento de una tercera tarea del muestreo (raramente
incluida en programas habituales): la obtencin de las muestras. Parte de estos
recursos est en proceso de integracin dentro del sistema informtico Epidat,
cuya tercera versin se desarrolla con Luis Carlos Silva como uno de los miembros del grupo de trabajo.
El ltimo captulo enlaza con el espritu de Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica, anterior libro del
mismo autor, desgranando de forma amena tpicos y errores que, por comunes,
nos parecen a todos asumibles. Especialmente recomendable considero, aunque
salga del mbito estrictamente sanitario, el apartado sobre las encuestas con que
nos abruma (condiciona?) la prensa cuando se aproximan las elecciones. Este
espritu crtico del autor, enemigo de los dogmas y las recetas, ha sido el que motiv su apertura en los ltimos tiempos a otras pticas metodolgicas, como el
enfoque bayesiano frente al frecuentismo dominante.
Esta obra puede utilizarse de dos maneras. En primer lugar sirve para realizar
consultas puntuales, aclara conceptos o plantear y realizar un diseo muestral
determinado; es decir, es suficientemente directa, concreta y estructurada como
para resultar til al profesional sanitario o estudiante que necesite profundizar en
PROLOGO
xix
Presentacin
La presente obra constituye una prolongacin, tanto cualitativa como cuantitativa, de mi libro Maestreo para la investigacin en ciencias de la salud publicado por la Editorial Daz de Santos hace ms de un lustro. Habindose empleado
como texto en decenas de cursos de posgrado impartidos en varios pases, fueron
cuantiosas las insuficiencias detectadas que ahora procuro enmendar o mitigar.
En aquella edicin ya se sealaba la existencia de diversos textos orientados
a proveer a estudiantes e investigadores de recursos instrumentales para el diseo de muestras. Sin embargo, despus de unos cuantos aos de prctica docente
e investigativa relacionada con el muestreo en el campo de la salud, sigo considerando conveniente contar con un material que ponga el mximo nfasis en la
interpretacin cualitativa de sus resultados bsicos y que, simultneamente, centre su atencin en el nivel emprico dentro del que opera la salud pblica: las
investigaciones de salud y epidemiolgicas concretas.
En la versin anterior ya se pretenda ofrecer un material cuya comprensin
exigiera solamente conocimientos elementales de estadstica y probabilidades y
que expresamente eludiera, por tanto, la derivacin matemtica de resultados, as
como las frmulas repletas de signos de sumatoria y subndices que slo causan
extraeza y desconcierto al investigador simple. Tal espritu ha sido enteramente
respetado en la versin actual. El acopio de una ya prolongada experiencia en la
materia me ha convencido de que los textos vertebrados en torno a formulaciones
abigarradas poco tienen que ver con las expectativas de mis colegas salubristas y
epidemilogos. Sin embargo, diversos aspectos reclamaban actualizacin y un manejo ms acucioso, con el fin de incrementar su inters prctico. Por otra parte,
este libro procura ser ms abarcador en varios sentidos: ahora se aborda un crecido nmero de asuntos previamente no considerados, con lo cual la versin actual
duplica el nmero de captulos. Especialmente enriquecido se ha visto el texto destinado al rea de captacin de datos. El lector hallar adems que, ya sea por medio de notas tcnicas laterales o de apndices, se tratan de satisfacer las inquietudes de lectores ms avezados, o que se interesan en aspectos ms avanzados.
xxii
Por otra parte, a lo largo del texto se han introducido diversos ejemplos
concretos con el fin de compartir -aunque sea de manera parcial- mi modesta
experiencia en el empleo de las tcnicas mustrales como medio auxiliar para
dar respuesta a diversas interrogantes relacionadas con el estado de salud de la
poblacin, los problemas econmicos de la salud pblica, la organizacin de
los servicios de salud y otras cuestiones afines.
Con fines ilustrativos y procurando optimizar la comunicacin de los principios
en que reposa toda la teora muestral, se apela en varios puntos del libro a ejemplos artificiales en que las poblaciones son de muy pequeo tamao. Naturalmente, tales ejemplos carecen de realismo, ya que en la prctica no tiene sentido aplicar tcnicas de muestreo a poblaciones minsculas. Sin embargo, la naturaleza de
algunos de los problemas tratados es completamente independiente de los tamaos
poblacional y muestral; de modo que trabajar con poblaciones muy reducidas no supone ningn escollo conceptual a la vez que favorece didcticamente la exposicin.
En trminos generales, la obra procura adems romper con diversos dogmas
y mitos que se han ido consolidando en la metodologa oficial del muestreo.
Se trata de poner en su justo lugar ciertos mtodos frecuentemente invocados
en algunos textos clsicos y que, aun teniendo ocasionalmente cierto inters acadmico, estn objetivamente alejados de las posibilidades prcticas regulares, o
son directa y llanamente desconocidos por ellas.
Para consolidar y comunicar las ideas contenidas en este libro he contado con
innumerables fuentes de estmulo. Desde el punto de vista formativo en materia
de muestreo, siempre me sentir en deuda con mis queridos profesores y amigos
Leslie Kish, de la Universidad de Michigan, y Joseph Machek, de la Universidad Carolina de Praga, por sus generosas enseanzas. Y desde una perspectiva
ms general, expreso mi agradecimiento al profesor Francisco Rojas Ochoa, del
Instituto Superior de Ciencias Mdicas de la Habana, maestro por antonomasia de
un par de generaciones de salubristas e investigadores cubanos. Agradezco igualmente a todos mis alumnos y, especialmente, a la ya larga lista de aquellos amigos y colegas espaoles, quienes de un modo u otro han promovido mi actividad
docente sobre las tcnicas mustrales en diversos puntos del Estado espaol; la
lista de estos colegas (seguramente incompleta) incluye a Alfonso Abaigar, Pepe
Almenara, Esther Arbes, Rodrigo Arquiaga, Txema Arteagoita, Clotilde Boix,
Carlos Campillo, Jos Manuel Casas, Javier Damin, Manuel Daz-Olalla, Iaki
Galn, Gonzalo Grandes, Eliseo Guallar, Gonzalo Gutirrez, Juan Ramn Lacalle, Jess Martn, Jos Mara Martn Moreno, Antonio Pareja, Luis Prieto, Elas
Rovira, Jos Manuel Salamanca, Emilio Snchez Cantalejo, Antonio Segura,
Patricio Surez, Enrique Vzquez, Toms Vega y ngel Vilches. Por su inestimable colaboracin tcnica, agradezco a mi alumno Ramn Surez, a cuya habilidad como programador debemos, los lectores y yo, la posibilidad de explotar un
sistema informtico original y eficiente que apoya al texto.
Luis Carlos Silva - La Habana, junio de 2000
1
Marco conceptual
de las tcnicas muestrales
1.1. La muestra: un modelo de la realidad
El muestreo es aquella disciplina estadstica que ofrece herramientas para la
solucin de un problema que, en el contexto de la investigacin cientfica de salud, resulta virtualmente universal: determinar qu parte de una realidad debe
examinarse con la finalidad de hacer inferencias sobre ella.
La necesidad de pronunciarse sobre un fenmeno o asunto habindolo observado slo parcialmente, se presenta con extrema frecuencia en la cotidianidad
y abarca las ms diversas esferas de la vida diaria. Por ejemplo, despus de algunos contactos con un pas, se vierten criterios sobre sus habitantes; partiendo
de dos novelas de un escritor, se opina sobre su obra y, tras examinar un cm3 de
sangre de un paciente, se valora todo su volumen sanguneo. Se trata de una
prctica natural cuya validez est determinada por el mero sentido comn.
Naturalmente, un proceso inductivo de tal naturaleza, que va de lo particular
a lo general, inevitablemente entraa la posibilidad de cometer errores, y es claramente intuitivo que dichos errores estn llamados a ser mayores en la medida
que la porcin observada sea ms reducida y, sobre todo, en la medida que ella
no refleje o represente la realidad (a la que en el lenguaje muestral suele
llamarse poblacin o universo) sobre la que recaern las conclusiones de la
inferencia.
El muestreo, como proceder cientfico, funciona de manera similar, pero procura aportar mtodos formales que contribuyan razonablemente a conseguir
que la muestra conforme un modelo del universo. En efecto, en el problema del
universo y la muestra estamos ante un singular ejemplo del proceso de representacin de la realidad objetiva mediante un modelo. Obtener una buena
muestra significa, precisamente, configurar una versin simplificada de la
poblacin, que reproduzca sus rasgos bsicos a la vez que desdee los innece-
sarios y, como debe ocurrir con todo modelo eficiente, que sea suficientemente
simple como para resultar manejable, pero no tanto como para que se difuminen sus perfiles especficos fundamentales. Kish (1989) describe una buena
muestra como un espejo de la poblacin, o una poblacin en miniatura.
En rigor, la tarea del muestrista va ms all: adems de determinar el mtodo de seleccin de la muestra y, por tanto, su tamao, ha de establecer los procedimientos que habrn de aplicarse a los datos as obtenidos para realizar inferencias fecundas.
Diversas razones prcticas pueden mencionarse para justificar el uso de esta
tcnica. Sin embargo, en ltima instancia, la fundamental es la necesidad de ahorrar recursos. Por lo general, resulta literalmente imposible estudiar a todos los
individuos que integran una poblacin (hacer un censo). Este imperativo econmico ha estado presente siempre, aunque no fue hasta la dcada de los treinta del
siglo XX, con un clebre trabajo presentado por el polaco Jerzy Neyman ante la
Roy al Statistical Society1, cuando se comenz a desarrollar una teora orgnica
sobre las tcnicas que permiten superar de manera cientfica esa dificultad (Neyman, 1934). El impulso determinante se produjo fundamentalmente en Gran
Bretaa, Estados Unidos y, ms tarde tambin, en la India y los pases escandinavos.
El uso del muestreo fue generalizndose y sus bases tericas experimentaron
un proceso de cimentacin gradual hasta la consolidacin de esta disciplina como una rama con personalidad propia dentro de la estadstica. Los siguientes
datos reflejan elocuentemente tanto su juventud como su rpida expansin:
mientras el International Statistical Institute (ISI) fue fundado el siglo pasado y
constituye una de las asociaciones cientficas internacionales ms antiguas que
funcionan en la actualidad, no es hasta 1971 que se establece la Asociacin Internacional de Muestristas como una de sus secciones. Sin embargo, en 1997
ya contaba con 1.244 miembros de 131 pases (IASS, 1997). Por otra parte, en las
ltimas cuatro dcadas se ha ido conformando un cuerpo terico slido recogido
en una ya larga serie de libros exclusivamente dedicados al tema (vase el interesante trabajo ad hoc de Parada, 1987) integrada, entre otros, por los siguientes clsicos: Hansen, Hurwitz and Madow (1953), Slonim (1960), Deming
(1960), Sampford (1962), Kish (1965), Murthy (1967), Des Raj (1968), Yamane (1970), Som (1973), Cochran (1977), Williams (1978), Jessen (1978), Scheaffer, Mendenhall y Ott (1979), Yates (1980), Levy y Lemeshow (1980), Kalton
(1983), Stuart (1984), Sukhatme, Sukhatme, Sukhatme y Asok (1984), Dalenius (1985).
1
Algunos de los resultados all expuestos, sin embargo, haban sido publicados diez aos antes por el ruso
A. A. Chuprov, segn resean Azorn y Snchez (1986).
des), resultan inoperantes por s mismas en muchsimos problemas de investigacin epidemiolgica, en la inmensa mayora de los del rea clnica y en la
totalidad de los problemas planteados por las ciencias bsicas. No obstante, resulta poco razonable renunciar dogmticamente al empleo de mtodos que han
demostrado su eficacia y que en determinados contextos pueden operar en rgimen de simbiosis con recursos como los que nos ocupan predominantemente en
este libro.
Creo que el trmino no es afortunado, pues dos cosas son comparables no cuando son parecidas, sino cuando son susceptibles de comparacin. No es posible comparar el dimetro de una naranja con el peso de un pltano, pero s se puede comparar la talla de un ser humano con la distancia entre La Habana y Madrid.
Aunque aqu, con el fin de simplificar la exposicin, nos estamos refiriendo a un parmetro, en la prctica
regular no hay un nico parmetro por estimar, sino varias decenas de ellos. Por ejemplo, en un estudio sobre
productividad mdica en la asistencia de urgencia el objetivo central puede que sea estimar el nmero promedio
de pacientes atendidos por hora, pero difcilmente el inters se circunscriba al conocimiento de ese nmero;
tpicamente, se desear obtener tablas que contemplen aspectos tales como el diagnstico, la edad del mdico, los
horarios de trabajo, etc.
La situacin en que las unidades de muestreo son directamente las unidades de anlisis es un caso particular.
10
i =
M j ei
P (M j )
donde P(Mj) representa la probabilidad que tiene Mj de ser el subconjunto elegido como muestra. A modo de ilustracin consideremos una situacin en extremo
simple y, desde luego, sin inters prctico alguno.
Numeremos los meses del ao del 1 al 12 y supongamos que se desea una
muestra de ellos. Supongamos adems que se forman 3 subconjuntos de meses:
M1= { 1 , 2 , 3 , 4 , 5 , 6 }
M2= {1, 7, 8, 9, 10, 11}
M3 ={1, 6, 12}
Supongamos que la seleccin de los meses se realiza del modo siguiente: se tiran
dos monedas; si salen dos caras, la muestra ser igual a M1; si salen 2 escudos, estar formada por los elementos de M2, y en otro caso, coincidir con M3. Las probabilidades respectivas de las 3 muestras posibles son: 1 , 1 y 1 . La probabilidad
4 4 2
de que el mes de enero sea elegido es 1 (ser seleccionado con certeza), pues las 3
muestras posibles lo contienen. La probabilidad de seleccin de los meses 2, 3, 4,
5, 7, 8, 9, 10 y 11 es igual a
1
,
4
11
10
.
365
Ejemplo 2. Se procede como en el ejemplo anterior, pero la bola elegida entre las 365 de
la urna slo sirve para seleccionar un mes del ao (se elige el mes al que pertenece el da sealado en esa bola). Luego se toman al azar exactamente 10
das de dicho mes.
La probabilidad de que resulte elegido un da dado, P(D), es igual al producto de dos probabilidades: la de que resulte seleccionado el mes que contiene a dicho da, P(M), y la probabilidad condicional P(D | M) de que sea se uno de los 10
das seleccionados supuesto que fue seleccionado el mes que lo contiene. Esto es:
P(D) = P(M) P(D | M). Es fcil apreciar que P(M) =
Ni
365
, donde Ni es el nmero
Lo que va a medirse en esas unidades de anlisis puede ser la humedad ambiental o el nmero de accidentes
automovilsticos registrados en una ciudad. A los efectos de esta ilustracin, sin embargo, ese dato es irrelevante.
12
Ni 10
10
=
.
365 Ni 365
O sea, que la probabilidad es la misma para todos los das.
10
Ni
de modo que:
i =
Ejemplo 3. Se colocan los nombres de los 12 meses en respectivas tarjetas y, tras mezclarlas concienzudamente, se eligen 3 de ellas; se incluyen en la muestra
todos los das contenidos en los tres meses seleccionados.
camente elegido si lo fue el mes en que est contenido, todos los das del ao
3
tendrn esa misma probabilidad de inclusin: i =
12
Como comentario lateral, advirtamos que este ejemplo evoca una situacin
prctica totalmente verosmil. Supongamos que tenemos un listado de 50 viviendas en las que viven 225 personas. Se quiere una muestra de individuos y se
decide seleccionar 10 viviendas al azar e incluir en la muestra a todos los individuos que las habitan. La muestra tendr tantos elementos como sujetos vivan
en las 10 viviendas elegidas. Puesto que ese nmero no se conoce hasta que no
se haya concluido la seleccin de las viviendas, el tamao de la muestra de sujetos depende de cules sean las viviendas que el azar haya determinado. Sin
embargo, el diseo es equiprobabilstico. Efectivamente, la probabilidad de inclusin de cada individuo coincide con la que tenga su vivienda de estar entre las
10 que se seleccionen; o sea, todos los elementos tienen la misma probabilidad
de inclusin:
10
50
= 0, 2 .
Ejemplo 4. Para cada da se tira una moneda al aire; si sale cruz, se elige ese da; en
otro caso, ese da se descarta.
1
2
13
E ( n) =
P(n = nh )
donde los nh son los tamaos de muestra posibles y dnde P(n nh) denota la
probabilidad de que el tamao muestral sea nh. Una manera alternativa de computar este nmero viene dada por la siguiente propiedad:
La suma de las probabilidades de seleccin de todos los miembros de la poblacin es igual al valor esperado del tamao muestral (vase Des Raj, 1968).
Formalmente: E ( n) =
i =1
i =1
365
= 91, 25
4
n
.
N
14
a) Si b1 es 0, de una urna que contiene 10 bolas numeradas del 0 al 9 se elige una y se toma dicho nmero como b2.
b) Si b1 es 1, se elige tambin una bola pero de una urna que contiene 7 bolas,
numeradas del 0 al 6 (vale decir, se elige un nmero al azar entre 0 y 6); b2
es el nmero de dicha bola.
Hecho esto, se define r = 10 b1 + b2, que es el nmero entre 0 y 16 que se buscaba en esta primera etapa.
Segunda etapa: Una vez elegido r, se seleccionan los sujetos que estn en los
lugares r , r + 1, r + 2, r + 3, r + 4 del listado. Si r es inferior a 13, estos 5 nmeros no ofrecen dudas. Si 13 r 16, entonces se considera que el listado es circular; por ejemplo, si r = 15, entonces r + 1 = 16, r + 2 = 0, r + 3 = 1 y r + 4 = 2.
15
Corroboremos ahora que la probabilidad que tienen los sujetos del listado de
ser elegidos no es la misma para todos sino que difiere para cada individuo segn la posicin que ste ocupe en el listado.
La probabilidad de seleccionar el nmero r = 10 b1 + b2 es igual a la probabilidad de seleccionar b1 multiplicada por la de elegir b2 dado que se seleccion b1:
P ( r = 10b1 + b2 ) = P (b1 ) . P (b2 b1 )
Esta probabilidad puede tomar slo dos valores diferentes (llammosle A y B), en dependencia de que bx sea 0 1 respectivamente. Puesto que P(b1 = 0) = P(b1 = 1) =
0,5, es muy fcil convencerse de que dichos valores son:
A=
y de que:
1
2
1
10
y B=
20
P (r = h) =
1
2
1
7
1
14
A para h: 0, ...,9
B para h: 10, ...,16
Ahora recordemos que el sujeto que ocupa el lugar h resulta elegido siempre que
se produzca alguna de las 5 siguientes posibilidades: r = h, r = h - 1, r = h - 2,
r = h-3, o r = h-4. Consecuentemente, para calcular la probabilidad de seleccin
que corresponde al sujeto h , ( 0 h 16), a la que llamaremos p*(h), debe computarse la suma de las probabilidades de estos 5 eventos; o sea, ha de aplicarse la
siguiente frmula:
P * ( h) =
P(r = h i)
i =0
16
P *(h) = n
h =0
17
que se regrese una y otra vez a cada casa seleccionada hasta completar el examen de todos sus habitantes, se sigue la regla de realizar el reconocimiento estomatolgico slo a los individuos que se hallen en la vivienda en el momento de
la visita.
De tal suerte, los ancianos tendrn en la prctica una probabilidad mucho ms
alta de ser encuestados (por tenerla de estar presentes en el momento de la visita) que nios y adultos. Como el cuadro morboso tpico de un anciano es, en
trminos generales, cualitativa y cuantitativamente diferente al del resto de la
poblacin, el panorama general brindado por la muestra no permitir obtener una
visin real de lo que verdaderamente ocurre en el rea de salud. Pero, el problema
que interesa destacar ahora no es tanto que se pierda el carcter equiprobabilstico del diseo como el hecho de que, bajo estas circunstancias, las probabilidades de seleccin pasaran a ser, en rigor, desconocidas, pues el verdadero
mecanismo de eleccin queda afectado por determinantes que ya no estn bajo
control del muestrista.
Por otra parte, ocasionalmente, el muestreo no probabilstico (que algunos
autores han denominado indebidamente opintico) se emplea de manera deliberada. Los procedimientos pueden ser de varios tipos. Circunscribindonos al
caso en que se tiene una poblacin bien definida de la cual se va a obtener una
muestra, las formas bsicas de seleccin no probabilstica son las cuatro siguientes:
a)
b)
c)
d)
18
posible aparicin de sesgos, derivados del hecho, por ejemplo, de que las amas
de casa pueden quedar muy sobrerrepresentadas en la muestra.
El maestreo por cuotas muy usado en las encuestas de opinin y de mercado concierne fundamentalmente a la investigacin con poblaciones humanas.
Parte del principio de forzar a que la muestra contenga el mismo porcentaje de
individuos con ciertas caractersticas prefijadas que la poblacin entera. Segn
los intereses que se consideren relevantes, se divide la poblacin en subclases
mutuamente excluyentes y generalmente a partir de datos censales se obtienen
los porcentajes abarcados por cada una de dichas subclases. Se establece entonces que la muestra tenga sus elementos distribuidos dentro de las subclases de
manera tal que los porcentajes mustrales coincidan a la postre con los de la poblacin. Para lograrlo se le asigna a cada enumerador una zona especfica (por
ejemplo, una manzana) y se le permite que all entreviste a los individuos que l
escoja, siempre que lo haga dentro de las restricciones determinadas por las
cuotas de muestreo estipuladas. As, por ejemplo, se le indica hacer 10 encuestas: de las cuales 5 han de ser a hombres y 5 a mujeres; se establece que
uno de los 10 debe ser profesional; que dos de los encuestados deben ser mayores de 50 aos, 6 han de estar entre 25 y 49, en tanto que los otros dos deben tener entre 15 y 24. Al reunir las selecciones realizadas por todos los enumeradores se tendr con certeza que la mitad de la muestra estar integrada por mujeres,
el 10% por profesionales, etc. Es obvio que el procedimiento, como ocurre en
definitiva con todo mtodo no probabilstico, puede conducir a importantes sesgos (los enumeradores podran, por poner un ejemplo, evitar las viviendas con
escaleras o las que tienen perros).
Finalmente, se tiene el caso en que la muestra es determinada mediante el criterio razonado de autoridades en la materia del estudio. En la aplicacin de este mtodo, los investigadores sopesan cuidadosamente las caractersticas de los
elementos que integran la poblacin para elegir racionalmente aqullos que a su
juicio pueden conformar el mejor modelo de la realidad de acuerdo con los objetivos del trabajo.
Como consecuencia de una extendida confusin entre azar y representatividad
que se aborda en la prxima seccin puede ocurrir que esta alternativa se descarte automticamente por considerarse intrsecamente mala; en efecto, al tener en
cuenta que la muestra no fue seleccionada por medio del azar, el investigador
puede sentir que su estudio carece del rigor cientfico necesario. Ese sentimiento
o el afn de desarrollar acciones destinadas a conjurarlo no siempre se apoya en
la justa evaluacin metodolgica de los procedimientos aplicados; en ocasiones
reposa simplemente en la falta de comprensin cabal del contenido y alcance de
los conceptos en juego. Existen circunstancias en que lo nico razonable es optar,
precisamente, por este tipo de eleccin, en lugar de por un mtodo probabilstico. Se trata fundamentalmente de situaciones en las que el tamao de muestra
planificado es muy pequeo, sobre todo si tambin el tamao poblacional lo es.
19
Por ejemplo, imaginemos que se quiere estudiar el funcionamiento del conjunto de los 25 hospitales de una provincia, y que se decide hacerlo a travs de
una evaluacin exhaustiva de 4 de ellos: es mejor seleccionar los cuatro que racionalmente se consideren ms representativos antes que permitir que sea el azar
quien los determine. La clave tcnica de esa preferencia radica en que, si bien los
errores de las estimaciones no podrn ser objetivamente medidos, stos van a resultar menores y ello es, en ltima instancia, lo que por encima de todo se desea. Por otra parte, es intuitivamente razonable, ya que carece de sentido que,
en lugar de usar al azar como una herramienta ventajosa, quedemos en sus manos hasta el punto de ser posibles vctimas del modo en que se desempee. Advirtase que el azar bien podra producir (y en este caso no con baja probabilidad) muestras totalmente inconvenientes, del tipo en que todos los hospitales
sean de la capital provincial, o que ninguno sea docente. Adems, en situaciones
como la descrita, normalmente no se realizarn estimaciones en el sentido formal, como pudiera ocurrir en poblaciones grandes, sino que las valoraciones globales tienden a ser ms bien de naturaleza cualitativa.
20
subconjunto) de la poblacin, pero inmediatamente ser apreciada con suspicacia; por qu no nos parecera representativa tal muestra? Bsicamente, porque sospechamos o sabemos que es demasiado uniforme: la poblacin general es
ms heterognea que la de estudiantes a los efectos del tema que nos ocupa7.
Las conclusiones derivadas del proceso inferencial, por su propia naturaleza,
siempre estarn sujetas a error. Otra manera de entender el concepto es la siguiente: una muestra puede considerarse representativa a los efectos de ciertos
aspectos especficos de la poblacin cuando el error en que se incurre al emplearla para hacer estimaciones sobre esos aspectos no excede ciertos lmites prefijados. Esto subraya el hecho de que una muestra puede ser representativa de
ciertos rasgos y no de otros (por ejemplo, serlo de la distribucin poblacional
en cuanto a grupos sanguneos pero no en cuanto al nivel de escolaridad).
21
22
lugar, tener una estimacin de cul es la magnitud real del error. El carcter
probabilstico del mtodo de seleccin asegura esto ltimo y en ello radica
precisamente su virtud fundamental, aunque no necesariamente garantice lo
primero.
23
rrectora. De modo que no es muy grave que ocasionalmente lleguemos a resultados incorrectos, pues para considerar que algo es cierto no bastan unos resultados
aislados que lo confirmen, sino que es menester que stos se hayan replicado. La
verdad cientfica se abre paso con carcter necesario, a pesar de los elementos casuales que puedan coyunturalmente ocultarla o tergiversarla (Silva, 1977); desde
el punto de vista del progreso cientfico, las consecuencias de algunas pifias en
el contexto de muchos aciertos no son, por lo general, desastrosas.
En sntesis, al permitir que el azar determine la base de la generalizacin se
corre el riesgo de que, en algunos casos particulares, esta ltima resulte equivocada; pero en la medida en que se siga esta prctica, supuesto que se adopten
medidas para que aquella contingencia sea ms bien excepcional, la resultante final de las generalizaciones terminar por imponerse con fuerza de ley.
24
plo, el 95% de las veces, se dice que P se halla entre P1 y P2 con una confiabilidad del 95%.
Para ilustrar estas ideas, supongamos que cierto estudio tiene entre sus propsitos conocer el gasto promedio en medicamentos en que incurren mensualmente los ncleos familiares de cierta comunidad. Los investigadores conocen por estudios similares que dicho valor debe estar entre $2.00 y $6.00, pero
necesitan un dato ms preciso. Naturalmente, si se opta por el uso del muestreo,
el verdadero promedio nunca ser conocido con certeza absoluta.
Supongamos que tras una encuesta por muestreo se obtuvo, en calidad de estimacin, que dicho gasto promedio asciende a $3.25. Qu significa ese dato si
no se tiene una idea del posible error cometido? Virtualmente nada. Sin embargo, si adems se informase de que el error mximo es e - $0,15, lo que se est
afirmando es que el verdadero gasto promedio se encuentra casi con seguridad
entre $3.10 y $3.40. Ahora, si en lugar de $0.15, el error asociado a la estimacin
asciendiera a $3.20, entonces lo nico que se conocera, en definitiva, sera que
el verdadero gasto medio est entre $0.05 y $6.45. O sea, no se agregara absolutamente nada a lo que ya se conoca de antemano. Es preciso comprender que
la estimacin aislada, sin una medida del error que pueda estar afectndola,
carece virtualmente de inters.
Cuando un titular de prensa afirma algo como lo siguiente:
A partir de una rigurosa muestra aleatoria de 300 hombres de la
capital, los expertos han estimado que el porcentaje de hombres que usan
preservativos regularmente subi en el curso del ltimo ao de 31,4% a
35,7%
pero escamotea (quizs porque no considera necesario comunicarlo) que el error
mximo asociado a esta ltima estimacin es de 4,6%, probablemente el lector
comn quede automticamente persuadido de que ese consumo ha aumentado.
Pero lo que realmente se sabe es que el porcentaje actual est, muy proba-
25
blemente, entre 31,1% y 40,3%, de modo que pudiera ser incluso inferior al
31,4% obtenido antes.
Supongamos que, a su vez, aquel 31,4% se haba obtenido con una muestra
que produjo tal estimacin con error estimado de un 6,0%. Entonces el verdadero valor inicial podra verosmilmente haber sido, por ejemplo, 36,0% (nmero
que est dentro del intervalo que va de 25,4% a 37,4%, correspondiente al porcentaje estimado para el ao anterior). En sntesis, la verdad que est detrs de la
declaracin segn la cual el uso de preservativos subi de 31,4% a 35,7%, pudiera tener como realidad subyacente que el empleo de preservativos baj del
36,0% al 31,2%, ya que esta ltima afirmacin es perfectamente compatible con
los resultados que arrojaron los estudios. Otra ilustracin prctica concerniente a
este tema se desarrolla en detalle en la Seccin 3.6.
26
27
Figura 1.1. Diagrama de flujo para pronunciarse sobre una diferencia de parmetros.
10
28
P1 = P e
P2 = P + e
Naturalmente, lo que se desea es que el error e sea pequeo (es decir, que el
intervalo sea lo ms estrecho posible).
Supongamos que nos informan de que la longitud de cierto objeto se ha medido
con precisin de 2 cm (es decir, que la distancia entre la medicin y la verdadera
longitud asciende a lo sumo a 2 centmetros). Es ste un error grande o pequeo?
Puede considerarse inaceptable o, por el contrario, refleja una buena precisin?
Naturalmente, no es posible pronunciarse al respecto hasta que no sepamos
de qu objeto se trata. Si lo que se ha medido es la talla de un individuo adulto,
probablemente tal precisin resulte satisfactoria; pero, obviamente, no sera se
el caso si lo que se mide es el radio de un anillo, un nmero posiblemente mucho
menor que el propio error cometido. Si lo que se midi hubiese sido, en cambio, la longitud de un autobs, entonces habra que considerar que el error
mencionado es absolutamente despreciable. En fin, para valorar o calificar la
magnitud de un error se piensa, tcita o explcitamente, en trminos relativos.
El error de muestreo no es una excepcin. Con frecuencia, despus de calcular el error asociado a la estimacin de p, se procede a computar el llamado error
relativo de la estimacin:
er =
e
p
Debe notarse que, mientras e viene dado en las mismas unidades en que se
mide la variable, er es un ndice que carece de unidades.
Consecuentemente, suele expresarse en trminos de porcentaje (es decir, multiplicado por 100). Por ejemplo, tomando las ilustraciones de la seccin precedente, diramos que el error relativo con que se estim el gasto promedio en
medicamentos fue del 4,6% en el primer caso (ya que 0,15 = 0, 046 ) y del 98,5%
3, 25
(pues 3, 20 = 0,985 ) en el segundo.
3, 25
En general se considera que un error relativo no superior al 10 % (es decir, un
valor de er inferior a 0,11) resulta aceptable a todos los efectos prcticos. Tal
consideracin emprica es compatible con nuestros puntos de vista en la vida
diaria: si una seora de 42 aos nos dice que tiene 40, diramos que est
redondeando (el error relativo es 5%), pero si nos comunica que tiene 30,
12
diramos que nos ha mentido (en ese caso er =
= 0,18).
42
29
Bibliografa
Almeida N. Epidemiologa sin nmeros. Serie Paltex, N. 28. Washington: OPS/OMS,
1992.
Altman DG. Statistics and ethics in medical research: VI-presentation of results. British
Medical Journal 1992; 281: 1542-1544.
Azorn F, Snchez JL. Mtodos y aplicaciones del muestreo. Madrid: Alianza, 1986.
Barnett ML, Mathisen A Tyranny of the p-value. Scandinavian Journal of Work and Environmental Health. 1997; 23: 152-154.
Baum F. Investigacin en salud pblica: el debate sobre las metodologas cuantitativas y
cualitativas. Revisiones en Salud Pblica 1977,5: 195-199.
Boudon R. Los mtodos en sociologa. Buenos Aires: El Ateneo, 1978.
Bullpit CJ. Confidence intervals. Lancet 1987; i: 494-497.
Castellanos PL. Algunas tcnicas para el estudio de lo subjetivo, los problemas cuasiestructurados y el estudio de la situacin de salud OPS/OMS. Presentado en la Reunin
30
31
Prieto L. Ms all de los mtodos cuantitativos y cualitativos: el mtodo cientfico. Revisiones en Salud Pblica 1997, 5: 195-199.
Raj D. Sampling theory. New York: McGraw-Hill, 1968.
Rothman KJ. A show of confidence. New England Journal of Medicine 1978; 299;
1362-1363.
Royall RM. Statistical evidence: a likelihoud paradigm. Boca Ratn: Chapman & Hall,
1997.
Rozeboom WW. The fallacy of the nuil hypothesis significance test. Psychological Bulletin 1960; 56: 26-47.
Salsburg D. The religion of statistics as practiced in medical journals. The American
Statistician 1985; 39: 220-223.
Sampford MR. An introduction to sampling theory with applications to agriculture.
Edinburh: Oliver and Boyd, 1962.
Scheaffer RL Mendenhall W, Ott L. Elementary survey sampling. North Scituate, Massachussets: Duxbury Press, 1979.
Silva LC. El razonamiento en las aplicaciones de la estadstica; nociones conceptuales
y terminolgicas. Revista Cubana de Administracin de Salud 1977; 3: 275-279.
Silva LC. Apuntes sobre el proyecto de investigacin del estudiante de posgrado. Revista de Educacin Mdica Superior 1989; 3: 29-40.
Silva LC. La formulacin de problemas de investigacin en salud. Revista Cubana de
Cardiologa y Ciruga Cardiovascular 1991; 5:64-71.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: Una mirada crtica. Madrid: Daz de Santos, 1997.
Silva LC. La crisis de las pruebas de hiptesis y la alternativa bayesiana. Memorias del
IV Congreso Galego de Estadstica e Investigacin de Operaciones, Santiago de
Compostela, noviembre de 1999.
Slonim MR. Sampling in a nutshell. New York: Simon and Schuster, 1960.
Som RK. A manual of sampling techniques. London: Heinemann Educational Books
Ltd., 1973.
Stephan FF, McCarthy PJ. Sampling opinions. London: Chapman and Hall, 1958.
Stuart A. The idea of sampling. High Wycombe: Charles Griffin and Company, 1984.
Sukhatme PV, Sukhatme BV, Sukhatme S, Asok C. Sampling theory of surveys with
applications. Ames, Iowa: Iowa State University Press, 1984.
Thompson WD. Statistical criteria in the interpretation of epidemiologic data. American
Journal of Public Health 1987; 77: 191-194.
Walker AM. Reporting the results of epidemiologic studies. American Journal of Public
Health (Different Views) 1986; 76: 556-558.
Warner L. The status system of a modern community New Haven: Yale University
Press, 1947.
Williams B. A Sampler on sampling. New York: Wiley, 1978.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.
Yates F. Sampling methods for censuses and surveys. London: Charles Griffin & Co.,
1980.
2
La encuesta y el cuestionario
Redactar un cuestionario.
Confeccionar un plan de tabulacin y anlisis.
Construir un marco muestral adecuado.
Disear la muestra.
34
LA ENCUESTA Y EL CUESTIONARIO
35
completo incluye un amplio conjunto de acciones a cuya eficiencia se subordina en buena medida la calidad de los resultados finales.
2.2. El cuestionario
Un cuestionario es un documento concebido para ayudar en el proceso de
obtener y registrar informacin a travs de una secuencia de preguntas o mediciones. En lo que resta de este captulo, nos concentraremos en aquella informacin que se procura obtener a travs de preguntas; stas, a diferencia de las
mediciones fsicas que se realizan por medio de instrumentos, suelen constituir
la nica va para obtener informacin medular que permita alcanzar los objetivos
de una investigacin. Por una parte, como es obvio, no hay otro modo de medir
niveles de satisfaccin, sentimientos o grados de concordancia con una opinin.
Por otra parte, la medicin de la magnitud o la frecuencia con que el individuo
36
realiza o ha realizado ciertas actividades a menudo exige de una indagacin directa. Por ejemplo no todos los delitos son denunciados a la polica ni todos los
episodios morbosos registrados por el sistema de salud, de modo que el testimonio de los propios individuos puede ser la nica va confiable para hacer
estimaciones adecuadas relacionadas con la seguridad ciudadana o el estado de
salud de la poblacin. Ha de tenerse en cuenta, adems, que incluso lo que queda registrado puede ser diferente de lo que el sujeto es capaz de testimoniar (Jabine, 1987).
Los aspectos que se tratan a continuacin procuran demostrar que tanto
las modalidades de aplicacin como la forma en que se disean las preguntas
tienen notable importancia. Durante muchos aos se subvalor la relevancia
de estos aspectos y en el mejor de los casos se consideraban pertenecientes a
la esfera del sentido comn. Ms recientemente, sin embargo, el tema ha alcanzado mayor prominencia y ha sido objeto de no pocos y reveladores experimentos. Se ha desarrollado un marco terico altamente estructurado y ya
se dispone de textos exclusivos que tratan el asunto con todos los requerimientos de una disciplina cientfica consolidada. Entre los ms destacados cabe mencionar los libros de Tanur (1992), Fowler (1995) y Sudman, Bradburn
y Schwarz (1995).
LA ENCUESTA Y EL CUESTIONARIO
37
38
muy eficiente
eficiente
aceptable
ineficiente
muy ineficiente
Malo ___
LA ENCUESTA Y EL CUESTIONARIO
39
Aceptable ____
Malo ____
Bueno_____
Regular____
Malo
El porcentaje de los que optan por la ltima categora (estado de salud malo) disminuira en la medida que el nmero de alternativas se incrementa.
Quiere esto decir que la interpretacin del resultado no puede hacerse al margen del contexto que configura el conjunto de respuestas posibles. Consecuentemente, nuestro pensamiento debe operar en sentido inverso: elegir ese
conjunto en funcin de lo que realmente queremos que constituya una gua para la interpretacin.
Cuando la pregunta es abierta el entrevistado responde redactando (o exponiendo, verbalmente, segn el caso) su respuesta de manera libre. Se preguntara, por ejemplo:
Cul es su opinin acerca del grado de eficiencia de la gestin gubernamental en materia de sanidad ambiental?
Y se dara en espacio para verter dicha opinin.
2.2.3.2. Preguntas cuantitativas o cualitativas
Las que hemos llamado cuantitativas son aqullas cuya respuesta consiste
en un nmero; por una parte, estn las dimensiones objetivamente medibles
(aos cumplidos, colesterolemia o circunferencia ceflica) y, por otra, las cuantificaciones en que interviene la subjetividad del sujeto interrogado (cuntos hijos quisiera tener, o qu salario le parecera justo percibir). Las cualitativas, por
su parte, son aquellas en que se desemboca en una clasificacin, como ocurre
con la actividad ocupacional o el grupo sanguneo.
2.2.3.3. Preguntas de ordenacin
En las preguntas de ordenacin se pide al entrevistado que ubique jerrquicamente una serie de alternativas de acuerdo con su preferencia personal o teniendo en cuenta algn otro marco referencial.
40
trabajo
dinero
relaciones de amistad
relaciones de pareja
salud
En qu orden cronolgico deben a su juicio introducirse los alimentos siguientes a los nios durante su primer ao de vida?
Poner nmeros del 1 al 4 o.
__
__
__
__
zumos de frutas
pescado
carne de res
cereales
LA ENCUESTA Y EL CUESTIONARIO
41
42
2. Escala de Likert
Para la valoracin del grado en que un individuo comparte cierta lnea de
pensamiento o teora general, un tipo de escala adecuada es la propuesta por Likert (1952).
Para aplicarla se considera una secuencia de afirmaciones (se ha sugerido que
sean alrededor de 15) que se pronuncian (algunas a favor y otras en contra) acerca de determinado punto de vista general; para cada afirmacin la persona encuestada debe elegir en cada caso una de varias (usualmente 5) alternativas, que
expresan diversos grados de adhesin a dicha posicin. Por ejemplo, las afirmaciones y las alternativas de respuesta que se ofrecen al entrevistado para cada una de las afirmaciones podran ser como las dos que se enuncian a continuacin:
Discrepo totalmente.
No lo comparto.
Lo comparto slo parcialmente.
Estoy de acuerdo en lo esencial.
Estoy totalmente de acuerdo.
Discrepo totalmente.
No lo comparto.
Lo comparto slo parcialmente.
Estoy de acuerdo en lo esencial.
Estoy totalmente de acuerdo.
ndice de adherencia para escalas tipo Likert. Supongamos que en un estudio en que se emplean escalas tipo Likert hay k afirmaciones y que el interrogado debe optar por una de r alternativas que se ofrecen para cada una de ellas.
Llamemos x a la opcin elegida ante la afirmacin i-sima (por ejemplo x6 = 2 si
el sujeto eligi la segunda respuesta para la sexta afirmacin), se puede computar entonces un ndice de Adherencia (IA) mediante la frmula:
LA ENCUESTA Y EL CUESTIONARIO
43
IA =
(0 + 2 + 3 + 0 + 4 + 3 + 1 + 3 + 4)
(9)(5)
20
45
= 0, 44
ptimo
Por ejemplo, al indagar sobre el trabajo del sistema sanitario en la comunidad, podra preguntarse:
Cabe advertir que al construir escalas de este tipo los investigadores suelen
poner todo el nfasis en las palabras elegidas para ubicar en los extremos y desdea el efecto que sobre el interrogado ejercen los valores numricos ofrecidos.
Para ilustrar la importancia que puede alcanzar tal efecto, consideremos la experiencia siguiente. Se pregunta sobre el grado en el cual el sujeto cree que su vida
ha sido exitosa y que se ofrecen 11 alternativas de respuesta. Consideremos que
hay dos formatos alternativos, ambos creciendo desde absolutamente inexitosa a
absolutamente exitosa. La pregunta es la misma, pero la semitica de la escala
empleada se modifica. Una posibilidad consiste en que la escala vaya de 0 a 10:
Cuan exitosamente dira usted que ha sido su vida?
Absolutamente
inexitosa
10
Absolutamente
exitosa
44
-5
-4
-3
-2
-1
Absolutamente
exitosa
Qu significan los puntos extremos para el interrogado? La condicin absolutamente inexitosa, qu quiere decir?, que el sujeto ha padecido una
ausencia total de xitos, o que su vida ha estado signada por grandes fracasos
explcitos? Se ha comprobado que los interrogados acuden a la propia escala numrica para responderse a s mismos esta pregunta, y por ende, para descifrar lo
que en realidad se les est preguntando.
Un estudio realizado con 1.025 adultos asignados aleatoriamente a cada una
de las dos alternativas (Schwarz y col., 1991) produjo resultados claramente
diferenciados, como muestra la Tabla 2.1. La escala que va de -5 a +5 subraya la
polaridad entre los extremos y hace pensar en que el extremo inferior concierne
a grandes fracasos, mientras que la que va de 0 a 10 hace pensar que se trata de
ausencia de xitos apreciables.
Tabla 2.1. Distribucin de respuestas segn valores en cada una de las
escalas numricas
LA ENCUESTA Y EL CUESTIONARIO
45
Los resultados son elocuentes por s mismos, pero llamo la atencin sobre
uno de ellos: el porcentaje de sujetos que se ubican en el punto medio de la escala o menos asciende a 34 para la escala de 0 a 10 y slo a 13 (casi un tercio!)
para la que va de -5 a +5.
4. Escalas grficas
Andrews y Withey (1976) sugirieron el uso de un recurso grfico como el que
se muestra a continuacin, especialmente para la medicin de sentimientos.
Una pregunta tpica podra ser como sigue:
Cul de las siguientes caras expresa mejor cmo Ud. se siente con respecto
a la atencin de enfermera que recibe en la consulta?
46
LA ENCUESTA Y EL CUESTIONARIO
47
48
LA ENCUESTA Y EL CUESTIONARIO
49
Una misma pregunta abierta puede ser respondida con expresiones muy diferentes, circunstancia que suele entorpecer muy considerablemente el procesamiento ya que, en tal caso, si se quieren construir tablas formales, las diferentes
respuestas deben ser examinadas una a una para conformar las categoras primero, e ir clasificando a posteriori a los sujetos. Adems de ser un proceso arduo y
tedioso, el margen para la subjetividad por parte de quien haga la clasificacin es
muy acusado. La pregunta abierta, por otra parte, exige ms tiempo y consume
mayor energa, tanto por parte del entrevistado como del entrevistador.
Ahora bien, las preguntas cerradas tienen que estar bien cerradas. No siempre el investigador consigue ser eficiente en ese sentido y puede por esa va generar conflictos de considerable magnitud y difcil solucin.
Una idea de cuan conflictivo o difcil resulta redactar atinadamente una pregunta de este tipo puede alcanzarse reparando en la siguiente y curiosa circunstancia. De un libro, ciertamente interesante en muchos puntos, en que se aborda
de manera exhaustiva y cuidadosa el tema (Linniger y Warwick, 1978), reproduzco textualmente el siguiente ejemplo de una pregunta cerrada, presuntamente bien formulada:
De los siguientes tipos de enfermedades, cules se han presentado en su
familia?
___ ningn problema serio
___ uno o ms de los miembros de la familia es invlido y requiere muchos cuidados
___ uno o ms de los miembros de la familia est lisiado o es defectuoso, pero no requiere mucha atencin
__ cuentas de hospital y honorarios mdicos muy altos.
50
ciones de respuesta para conformar definitivamente la pregunta cerrada (Scheaffer, Mendenhall y Lyman, 1996)
Una cuestin debatible es si conviene o no cerrar las preguntas cuantitativas.
Mi opinin es que no debe hacerse, ya que al crear categoras para datos cuantitativos como la edad, se pierde innecesariamente informacin. Hay, sin embargo, situaciones ms bien excepcionales en que, quizs con el sano propsito de no obtener
respuestas vagas, se exige un nivel de precisin exagerado que termina por producir un error mucho mayor. Consideremos, por ejemplo, la siguiente formulacin:
Cuntos cigarrillos fuma como promedio diariamente?
Se fuerza al sujeto a dar un dato preciso, est o no en condiciones de hacerlo, con lo cual puede contribuirse, paradjicamente, a la invalidez de los resultados. Una opcin capaz de extraer datos ms prximos a la verdad sera plantear la pregunta con alternativas de respuesta menos precisas pero ms
confiables:
Cuntos cigarrillos fuma como promedio diariamente?
___
___
___
___
ninguno
de 1 a 20
de 21 a 40
ms de 40
6. Emplear la tcnica de retrotraduccin siempre que la encuesta original haya sido redactada en otro idioma
Si el material de partida fuera un cuestionario creado en otro idioma, entonces es imprescindible corroborar la calidad de la traduccin. Un recurso natural
es aplicar lo que ha dado en llamarse retrotraduccin; esto es, traducir nuevamente al idioma original el texto que se obtuvo como resultado de la primera traduccin. La expectativa es que la versin original no difiera apreciablemente del
resultado de la retrotraduccin; en tal caso podr confiarse en que el documento
con el que se trabajar ha respetado el espritu del original y, sobre todo, que ha
reproducido adecuadamente su contenido.
Debe enfatizarse no obstante que, aunque la retrotraduccin es un recurso
bastante til para contribuir a la fidelidad de la traduccin de las palabras, no garantiza la equivalencia del significado.
En Anderson (1967) y Deutscher (1973) pueden hallarse detalles acerca de
diversas tcnicas para lograr equivalencia en la traduccin. Cabe subrayar que,
LA ENCUESTA Y EL CUESTIONARIO
51
No ____
52
que ste d respuestas ms acordes al afn por producir buena impresin que al
de informar la verdad.
La tcnica de respuesta aleatorizada que se discute- en la seccin 9.2 fue
creada justamente para superar los sesgos que tal tendencia genera. Una expresin particular de este fenmeno se produce en relacin con la posible imagen de
desinformacin o ignorancia, que suele conducir a que el entrevistado acte como si dominara algo que realmente ignora. Por ejemplo, en ocasiones, cuando a
los encuestados se les ha pedido opinin sobre materias oscuras o ficticias, se
ha puesto al descubierto que un nmero apreciable ha sido capaz de emitir opiniones aun cuando no tenan ningn conocimiento a priori sobre el tema.
Por ejemplo, Bishop, Oldenick y Tuchfarber (1986) en sus encuestas experimentales pidieron criterios sobre fenmenos que no existan Y obtuvieron que
nada menos que un tercio de los interrogados respondieron como si tuviera sentido dar tales opiniones. En relacin con esta recomendacin, en el estudio de
Silva y Macas (2000) antes mencionado, se pregunt a los 189 alumnos de medicina lo siguiente:
Comparte usted los argumentos existentes para fundamentar que se
otorgue el premio Nobel al creador de la vacuna antimeningocccica?
Si ___
No ____
Para contestarla afirmativa o negativamente es necesario conocer algo imposible de conocer, ya que no existe tal propuesta de premio Nobel (ni, por tanto,
argumento alguno con el cual concordar o no). Aunque lo lgico sera que todos optaran por la tercera posibilidad, se obtuvo un porcentaje muy apreciable
acumulado por las dos primeras, como se aprecia en la siguiente tabla:
Es notable que uno de cada tres haya dicho compartir criterios inexistentes y
que uno de cada ocho haya renegado de dichos criterios, con lo cual se acumula
nada menos que un 44% de respuestas deshonestas. Esto convalida la idea de
que el temor a dar una imagen de desinformacin suele conducir a que el entrevistado acte como si conociera algo que realmente ignora, o a que comunique en
calidad de ponderada conviccin un punto de vista que acaba de improvisar.
LA ENCUESTA Y EL CUESTIONARIO
53
Para solucionar este problema, en algunas situaciones, sera mejor incluir varias opciones de respuesta sobre lo que se desea conocer y ofrecer al interrogado la posibilidad de elegir la que considere correcta segn su conocimiento. En lugar de preguntar:
Considera que la penicilina cura el catarro?
Si ___
No____
No s____
podra ser mejor que, aunque slo interese el conocimiento acerca del efecto de
la penicilina sobre el catarro, se emplee esta otra formulacin:
La penicilina es un producto adecuado para curar:
Las enfermedades de la piel
Si ____
No ____
No s ____
Las neumonas
Si ____
No _____
No s ____
El catarro
Si ____
No _____
No s ____
Si ____
No _____
No s ____
Cuando se trata de respuestas que pudieran resultar vergonzosas por el contenido, se ha sugerido (Sudman y Bradburn, 1982) con textual izar las preguntas
para suavizar la situacin. Por ejemplo, en lugar de preguntar directamente:
Su consumo de bebidas alcohlicas por lo general es:
Nulo ___
Escaso ____
Moderado ____
Alto _____
___
54
Algunos estudios han sealado que ciertas conductas son protectoras del
infarto. Ha hecho en los ltimos siete das alguna de las siguientes actividades:
Realizar ejercicios durante
no menos de 20 minutos
Si ___
No ____
Si _____
No ____
Si _____
No ___
Comer fruta
Si _____
No ____
Relacionado con estas tendencias se halla el impulso de muchos, especialmente si el nivel cultural es bajo (Converse y Presser, 1986) a estar de acuerdo
con lo que se les propone.
Finalmente, puesto que se ha demostrado (vase Aquilino y Losciuto, 1990
y Fowler, 1993) que el fenmeno que nos ocupa es menos acusado cuando los
cuestionarios son autoadministrados que cuando la encuesta la realiza un entrevistador, en este ltimo caso debe ponerse especial cautela.
9. Valorar la conveniencia de usar una pregunta de filtro antes que indagar
directamente sobre determinada conducta u opinin
El uso de la pregunta de filtro es en ocasiones muy aconsejable, pues con
ella se puede conseguir mejor organizacin de la encuesta, ahorrar tiempo y que
el interrogado entienda mejor y ms fcilmente lo que se quiere de l. En un estudio en que se interrogaba a funcionarios del sistema educativo (Fonseca,
1987), se preguntaba:
LA ENCUESTA Y EL CUESTIONARIO
55
Tal y como est redactada, muchos podran marcar en cualquiera de las primeras tres opciones y dar por sentado que la atencin estomatolgica ofrecida a
los nios es sistemtica aunque no fuera ese el caso; si optara por la cuarta posibilidad, no se podr saber si opina que no se ofrece atencin alguna o que la
que se brinda no es sistemtica. Los resultados podran ser ms precisos si se
preguntara de la siguiente manera:
Si ____
No ____
Curativa
Si ____
No ____
56
__
___
una
___ ms de cinco
Grupo B: Para el estudio independiente, cuntas veces hace uso de la biblioteca a lo largo de un mes?
___
___
___
__
__
nunca
una
dos o tres
cuatro o cinco
ms de cinco
LA ENCUESTA Y EL CUESTIONARIO
57
58
LA ENCUESTA Y EL CUESTIONARIO
59
ner de relieve los errores ms frecuentes y servir de alerta para encarar adecuadamente la confeccin del cuestionario dentro del proceso investigativo.
60
cuestionarios provenga de esta insuficiencia, la cual podra ser obvia, aunque casi siempre es ms bien sutil. Imaginemos la pregunta siguiente:
No----------------
Qu es hacer ejercicios fsicos? Por ejemplo, incluyen el acto de caminar? Durante cunto tiempo ha de extenderse para considerar que los ha hecho?
Y qu es la semana pasada? Los ltimos siete das, o los siete das previos
al ltimo lunes? Quizs debera reformularse as:
Ha realizado gimnasia, caminatas u otra forma de ejercitacin fsica por
ms de 20 minutos en algn momento de los ltimos siete das?
S -----------
No ------------
No --------------
No tengo opinin---------
No--------------
LA ENCUESTA Y EL CUESTIONARIO
61
Aos de convivencia con cnyuge fumador -------------Aqu podran presentarse dos problemas: primero que el entrevistado no tenga cnyuge, y segundo que ste no sea fumador. Mejor sera esta variante:
Es su compaero fumador?
-------------
62
____
Protestante
____
Islmica
____
Otra
____
Ninguna
____
____
Protestante
____
Islmica
____
Otra
____
Ninguna
____
No _____
LA ENCUESTA Y EL CUESTIONARIO
63
que tienen para quien las formula. Por ejemplo, las palabras empleadas en la siguiente pregunta no ofrecen dudas por s mismas:
Regular ____
Mal ____
importante
necesaria
pobre
poco til
lleva el mayor peso del trabajo
no participa
Si se conecta la frase inicial con cualquiera de las dos ltimas opciones de respuesta, la oracin pierde sentido. Decir, por ejemplo, La participacin de la enfermera en el control de enfermos crnicos es no participa es sintcticamente
incoherente. Por otra parte, en la redaccin precedente se piden a la vez opiniones
genricas (1 y 2) y testimonios concretos (opciones 3, 4, 5 y 6). Para resolver la
situacin se podra desdoblar la interrogante segn esos dos tipos. Sin embargo,
por excepcin, no dar una solucin para el ejemplo que nos ocupa: arreglar esta formulacin es demasiado complicado, pues adems de los sealamientos ya
64
No ____
En ocasiones
____
En ocasiones ____
Con qu frecuencia ?
__
__
__
__
__
__
diariamente
una vez a la semana
2-3 veces por semana
4-6 veces por semana
espordicamente
no ingiere bebidas alcohlicas
No ____
Nunca
LA ENCUESTA Y EL CUESTIONARIO
65
Grupo A: Cuando un alumno ha tenido problema con el transporte y llega tarde a clases, considera que debe ser justificado?
S ____
No _____
No ____
El contenido de las dos preguntas es en esencia el mismo; slo vara la localizacin de la frase condicional, que se pone al inicio (caso A), o al final de la
formulacin (caso B) . Si tal variacin tuviera algn efecto, los resultados seran diferentes. Lo que puede ocurrir (era lo que se quera poner en evidencia), es
que cuando la condicin se encuentra al final, ya leda la pregunta, el resto pierde inters para algunos encuestados y por tanto tal condicin no es tenida en
cuenta al responder. De hecho, en este caso los resultados convalidaron esta
presuncin:
66
No____
No ____
___
Atenolol
___
Librium
___
Ninguno
___
LA ENCUESTA Y EL CUESTIONARIO
67
S ___
No ____
Atenolol
S ___
No ____
Librium
S ___
No ___
Otro ejemplo de preguntas de respuesta mltiple, tomado textualmente de Ortiz (1996), es el siguiente:
En su familia pueden haber ocurrido una serie de problemas de salud; por
favor, refiralos, cules ha presentado durante el ltimo ao?
__
__
__
__
__
Adems de la falta de uniformidad en las opciones (algunas empiezan mencionando problemas y otras con la palabra miembros), lo que ahora importa es
que algunos interrogados dejarn en blanco ciertas opciones de la pregunta, de
modo que no se podr saber si olvidaron responder, si no estaban incluidos dentro de dicha categora de respuesta, si no se registr la situacin, o si no tenan
conocimiento al respecto. Ms correcto sera redactarla de la siguiente manera:
Durante el ltimo ao en su familia pueden haber ocurrido algunos problemas de salud. Acerca de cada una de las siguientes posibilidades
seala si alguno de sus miembros los ha padecido durante el ltimo ao:
invalidez o minusvala
S---------
No ---------
amenaza de muerte
S---------
No ---------
trastornos psiquitricos
S---------
No ---------
padecimiento crnico
S---------
No ---------
alcoholismo
S---------
No ---------
68
vestigadores poco experimentados. Por otra parte, si tales preguntas se conforman a travs de varias preguntas simples, como se ha sugerido, los anlisis
estadsticos posibles se simplifican y esclarecen de manera natural, a la vez que
las alternativas para llevarlo adelante se incrementan, ya que se pueden considerar distribuciones tanto para cada categora simple como para subconjuntos
de categoras (por ejemplo, en el caso de la primera ilustracin, se podra computar el porcentaje de los encuestados que no han consumido ni atenolol ni librium)
8. Contemplar todas las situaciones posibles e impedir que el interrogado
pueda ubicarse en ms de una categora de respuesta
Para el cumplimiento de esta pauta es necesario haber identificado todas las
alternativas posibles. Las posibles respuestas han de ser excluyentes y exhaustivas.
En una encuesta relacionada con contaminantes ambientales, Navarro (1989)
inclua la siguiente pregunta, dirigida a trabajadores que padecan cierta enfermedad:
Durante el ltimo ao usted ha tenido necesidad de ausentarse por descompensacin o complicacin de su enfermedad de base al:
-------trabajo
-------estudio
-------trabajo y estudio
-------no trabaja
-------no estudia
Quien se vea enfrentado a responder esta pregunta puede tener muchas dudas;
por ejemplo, el que marque en la opcin trabajo, podr adems marcar en no
estudia si, en efecto, no estudiara. La formulacin correcta (y mucho ms simple) sera:
Durante el ltimo ao ha tenido usted necesidad de ausentarse por descompensacin o complicacin de su enfermedad de base al:
Trabajo?
S ---------
No ---------
No procede
Estudio?
S ---------
No ---------
No procede
-----------------
LA ENCUESTA Y EL CUESTIONARIO
69
S --------
No ---------
vecino
S --------
No ---------
amigo
S --------
No ---------
otro
S --------
No ---------
70
No -------------
No ------------
71
LA ENCUESTA Y EL CUESTIONARIO
Como se, ve, una de ellas (Grupo A) induca la respuesta, ya que inclua un
comentario previo que tomaba partido hacia la respuesta afirmativa; en el otro
cuestionario, la pregunta se haca neutra y directamente. Puesto que responder
afirmativamente a una pregunta como esta no es nada enaltecedor, el hecho de
recibir anticipadamente un comentario que justifica la conducta reprobable,
ayudara a conseguir cierta informacin difcil de obtener. Los resultados fueron:
--------- a 1
------- 1 a 2
-------- 2 a 3
---------3 y ms
72
---------3 a 3
---------3 a 4
---------4 a 5
---------5 y ms
Como se ve, el porcentaje de estudiantes que marc alguna de las primeras 4 opciones en el Grupo A es muy diferente del porcentaje de los que eligieron la primera opcin en el Grupo B. En efecto, el porcentaje de encuestados que marcaron el periodo menor de 3 horas para el Grupo A (76 %) fue
muy superior al de los que hicieron lo propio para el Grupo B (21 %). Muchos
sujetos se apoyan aparentemente en la propia escala que se les ofrece; asumen que si los investigadores han elegido esta escala es por que saben que la
mayora de las personas estn en el centro y se distribuye normalmente hacia los extremos. Dicho de otro modo, muchos que se autoconsideran promediales se ubican en el centro independientemente de cul sea dicha categora central.
10. Las preguntas deben ser sensibles
Una pregunta tiene sentido prctico si produce respuestas diferentes siempre
que los sujetos sean realmente diferentes. No deben formularse preguntas que,
por su naturaleza, produzcan una concentracin desmedida de sujetos en una
LA ENCUESTA Y EL CUESTIONARIO
73
misma categora de respuesta. Tales preguntas son poco informativas. Consideremos un ejemplo tomado de Triana (1998).
Si le ofrecen un cambio de trabajo, qu hara usted?
------ lo aceptara
-------lo pensara
------ lo aceptara sin vacilacin
-------lo aceptara con reserva
Una gran mayora debe marcar en la opcin lo pensara, ya que muy pocos tendrn una opinin incondicional (probablemente, nadie en sus cabales optara por la primera alternativa sin contar con ms datos). Aunque los individuos
tengan visiones muy diferentes acerca de su actual trabajo, probablemente
contesten del mismo modo. La pregunta as formulada no es sensible a las variaciones que existen en el universo investigado. Algo mejor seria usar, por
ejemplo, variantes como la siguiente:
74
dactara adecuadamente, especificando lo que el investigador busca. Se podra lograr una respuesta uniforme, como ocurre en la reformulacin que sigue:
No ____
No recuerdo ___
Si ___
No ___
No recuerdo ___
por qu la tiene?
Si ___
No ___
No recuerdo ___
cmo evitarla?
SI ___
No ____
No recuerdo ___
La ambivalencia puede aparecer de manera menos evidente, como en el siguiente ejemplo, tomado de Saeteros (1998):
LA ENCUESTA Y EL CUESTIONARIO
75
Cuando algn interrogado considere que el trabajo de ambos equipos merece la misma calificacin, no se presentara ninguna dificultad; el problema aparecer cuando no sea as. Por ejemplo, si una persona considera que el trabajo del
colectivo pedaggico es Regular pero que el del personal de salud es Suficiente, no sabra qu responder. La pregunta debera formularse as:
A continuacin se mencionan dos de los grupos encargados de la preparacin de las familias en aspectos de promocin y educacin para la salud.
Cmo considera su trabajo?
Colectivo pedaggico: ____ Suficiente _____ Regular_____ Insuficiente
Personal de salud:
NO ____
76
En el experimento de Silva y Macas (2000) varas veces citado, se formularon estas preguntas a los respectivos grupos de estudiantes:
de acuerdo
___ en desacuerdo
____ no s
de acuerdo
se extienden suficientemente?
__
de acuerdo
____ en desacuerdo
____ no s
La expectativa era encontrar diferencia entre los resultados de una y otra encuesta, puesto que cuando las dos afirmaciones estn dentro de la misma formulacin, el interrogado puede tener dudas en caso de que no est de acuerdo
con (o no sepa sobre) una sola de las dos interrogantes; en tal caso no podra discernir entre estar en desacuerdo con la afirmacin tal y como se hizo o con slo
una parte de ella; cuando ambas situaciones se separan, tal ambivalencia queda
resuelta. Los resultados son expresivos:
LA ENCUESTA Y EL CUESTIONARIO
77
Como se aprecia, en el caso en que se reunieron las dos afirmaciones dentro de una misma formulacin, se obtuvo un porcentaje mucho mayor de encuestados que opinaban estar de acuerdo (64%) que el obtenido para el cuestionario que las separaba: solo 34 de los 95 estudiantes del grupo B (36%)
dijeron estar de acuerdo con ambas afirmaciones. Los resultados varan entre los dos grupos debido, verosmilmente, a la dualidad contenida en la pregunta; aparentemente, muchos encuestados que solamente estaban de acuerdo
con una parte de lo que se le pregunt, expresaron su acuerdo global dentro del
grupo A.
78
LA ENCUESTA Y EL CUESTIONARIO
79
guntas contienen expresiones locales que puedan ser incorporadas a las formulaciones (o eliminadas de ellas) para evitar malentendidos e incrementar la fluidez comunicativa, as como cules son las preguntas o secciones que ofrecen
mayores dificultades y cules son capaces de producir irritacin, embarazo o
confusin.
Es crucial que las condiciones en que se realice el pilotaje sean las mismas en
que se llevar adelante la encuesta real. A veces, por ejemplo, los interrogatorios
del pilotaje los desarrollan los propios directores del estudio. Craso error: estos
tienen por lo general niveles de compromiso y sensibilidad con el estudio marcadamente superiores que los de un encuestador asalariado.
Es conveniente que los encuestadores rindan un informe, preferiblemente
escrito, de su experiencia en el pilotaje. Son ellos los agentes llamados a identificar los problemas y propiciar un diagnstico adecuado del cuestionario (Converse y Presser, 1986). Un aspecto que debe recabarse es que para cada rechazo
el encuestador consigne las razones. El anlisis cuidadoso de esta informacin es
de extrema importancia para la adopcin de medidas preventivas de la llamada
no-respuesta. Por ejemplo, en una encuesta en que los sujetos deban ser contactados en la vivienda, resulta conveniente adicionar una pregunta como la siguiente:
Otra (especifique)
Este tipo de pruebas, sin embargo, no son una panacea. Presser (1989) discute sus posibles limitaciones, tales como la subjetividad del propio encuestador
participante, potenciada por el pequeo tamao muestral, tpico de los pilotajes,
que puede dar lugar a que una ancdota puntual se erija en calidad de problema
general.
Precisamente, debido a esas limitaciones es que se ha sugerido emplear recursos alternativos o complementarios como la del grupo focal, una tcnica de
vieja data que sigue produciendo inters, como pone de manifiesto la reciente
80
Bibliografa
Anderson RBW. On the comparability of meaningful stimuli in cross-cultural research. Sociometry 1967; 30: 124-136.
Andrews FM. Construct validity and error components of survey measures: A structural modelling approach. Public Opinion Quarterly 1984; 48(2): 409-422.
Andrews FM, Withey SB Social indicators of well-being. New York-Plenum, 1976.
Aquilino WS, Losciuto LA. Effects of interview on self-reported drug use. Public
Opinion Quarterly 1990; 54(3): 362-391.
Avila S. Variables psicosociales asociadas al retardo en el desarrollo psquico en nios
de una escuela especial. Trabajo de terminacin de Tesis de la especialidad de Higiene y Epidemiologa. Ciudad Habana, 1994.
Baker RP. New technology in survey research: Computer assisted personal interviewing (CAP). Social Science Computer Review 1992; 10: 145-157.
Bishop GF, Oldendick RW, Tuchfarber RJ. Opinions of fctitious issues: the pressure
to answer survey questions. Public Opinion Quarterly 1986; 50: 240-250.
Clark HH, Schober MF. Asking questions and infuencing answers. En: Tanur JM
(ed.). Questions about questions. New York: Russell Sage, 1992; 15-48
Clarridge BR, Massagli MP. The use of female spouse proxies in common symptom
reporting. Medical Care 1989; 27(4): 352-366.
Converse JM, Presser S. Survey questions: Handcrafting the standardized questionnaire. Beverly Hills, CA: Sage, 1986.
Couper MP, Burt G. Interviewer reactions to alternative hardware for computer assisted personal interviewing. Journal of Official Statistics 1994; 8: 201-210.
Deutscher I. Asking questions cross-culturally: Some problems of linguistic comparability. En: Warwick D y Osherson JS (eds.). Comparative research methods.
Prentice-Hall, New Jersey: Englewood Cliffs, 1973; 163-186.
Eisenhower D, Mathiowetz NA, Morganstein D. Recall error: Sources and bias reduction
techniques In Measurement errors in surveys, En: P. Biemer, R. Groves, L. Lyberg,
N. Mathio wetz, S. Sudman (eds). Measurements errors in surveys. New York: Wiley.
Fonseca L. Estudio de la aplicacin del Programa de Atencin Estomatolgica a la
poblacin menor de 15 aos en los Municipio Especial Isla de la Juventud. Trabajo de terminacin de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana, 1987.
Fowler F. Improving survey questions: Design and evaluation. USA: Sage Publications, 1995.
LA ENCUESTA Y EL CUESTIONARIO
81
Fowler F. Survey research methods (Second Edition) Newbury Park CA: Sage,
1993.
Gonzlez S. Asociacin de la morbilidad respiratoria en grupos de riesgo con la
contaminacin atmosfrica originada por el transporte y otros factores ambientales. Trabajo de terminacin de Tesis de la especialidad de Higiene. Ciudad
Habana, 1991.
Gutirrez I Estudio de la aplicacin del Programa de Atencin Estomatolgica a la poblacin menor de 15 aos en los Municipio Plaza de la Revolucin, Marianao y La
Lisa. Ciudad Habana. Trabajo de terminacin de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana, 1987.
Huskisson EC. Measurement of pain. Lancet 1974; ii, 1127-1131.
Jabine TB. Reporting chronic conditions in the National Health Interview Survey: A
review of tendencies from evaluation studies and methodological test. Vital and
Health Statistics, 1987. (Series 2, N' 105, DHHS Pub, N' PHS 87-1397). Washington, DC: Government Printing Office.
Kiesler S, Sproull LS. Response effects in electronic surveys. Public Opinion Quarterly 1986; 50: 402-413.
Kinsey AC, Pomeroy WB, Martin CE. Sexual behaviour in the human female. Philadelphia: Saunders', 1953.
Knuper B. Filter questions and question interpretation: Presuppositions at work.
Michigan: Mahau, 1997.
Lehnen RG, Skogan WG. Current and historical perspectives. (The National Crime
Survey Working Papers, Vol 1), 1981. Washington, DC: Department of Justice,
Bureau of Justice Statistics.
Likert RA. A technique for the development of attitude scales. Educational and
Psychological Measurement 1952; 12: 313-315.
Linninger CA, Warwick DP. La encuesta por muestreo. Mxico DF: CECSA, 1978.
Mangione TW, Fowler FJ, Louis T A. Question characteristics and interviewer effects. Journal of Official Statistics, 1992. 5(3) : 293-307.
Moreira JM. Prevalencia de sntomas depresivos en poblacin de ancianos del rea de
salud del policlnico Toms Romay. Municipio Artemisa. Provincia Habana.
Trabajo de terminacin de Tesis de la especialidad de Higiene y Epidemiologa,
Ciudad Habana, 1994.
Morgan DC. Focus groups as qualitative research. Newbury Park. CA: Sage, 1988
Navarro E. Impacto de la introduccin del Mdico de la Familia en la dispensarizacin del adulto mayor. Policlnico Diego Tamayo. Trabajo de terminacin
de Tesis de la especialidad de Administracin de la Salud, Ciudad Habana,
1989.
Newcomb TM, Koenig KE, Flacks R, Warwick DP. Persistence and Chenge. New
York: Gennington College and Its Students after Twenty-five years, Wiley,
1967.
82
Nicholls WL II, Baker RP, Martin J. The effects of new data collection technologies
on survey data quality. En: Lyberg L. et al. (eds.). Survey measurement andprocess quality, New York: Wiley, 1986.
O'Reill JM, Hubbard ML, Lessler JT, Biemer PP, Turner CF. Audio and video computer assisted self-interviewing: preliminary tests of new technologies for data
collection. Journal of Official Statistics 1994; 2: 197-214.
Ortiz T. Proyecto de intervencin en salud familiar. Una propuesta metodolgica. Trabajo de terminacin de curso de la Maestra en Salud Pblica, Ciudad Habana,
1996.
Osgood CE, Suci GJ, Tannenbaum PH. The measurement of meaning. University of
Illinois Press, Urbana, 1957.
Payne SL. The art of asking questions. Princeton, New Jersey: Princeton University
Press, Princeton, New Jersey, 1951.
Presser S. Pretesting: A neglected aspect of survey research. En: FJ. Fowler, Jr. (Ed.),
Conference Proceedings of Health Survey Research Methods, 1989. (DHHS Pub.
No. PHS 89-3447, pp.35-38). Washington, DC: National Center for Health Services Research.
Rebagliato M, Ruiz I, Arranz M. Metodologa de investigacin en epidemiologa. Madrid: Daz de Santos, 1996.
Rodger WL, Erzog AR. The consequences of accepting proxy respondents on total
survey error f or elderly populations. En: F. J. Fowler, Jr. (Ed), Conference Pzoceedngs of Health Survey Research Methods, 1989. (DHHS Pub. No.PHS
89-3447, pp. 139-146). Washington, DC: National Center for Health Services
Research.
Sabido V. Evaluacin del programa de control de la Sfilis. Policlnico Aleyda Fernndez Chardiet. Municipio La Lisa. Trabajo de terminacin de curso de la Maestra en Salud Pblica. Escuela Nacional de Salud Pblica, Ciudad Habana,
1998.
Saeteros R. Diagnstico operacional de la promocin y educacin para la salud en el
ambiente escolar primario del complejo Ciudad Escolar Libertad. Trabajo de
terminacin de curso de la Maestra en Atencin. Primaria, Facultad de Salud
Pblica, La Habana, 1998.
Saris WE. A technological revolution in data collection. Quality and Quantity 1989;
23: 333-349.
Scheaffer R, Mendenhall W, Lyman R. Elementary survey sampling 62-68, USA,
Sage, 1996.
Schuman HH, Presser S. Questions and answers in attitude surveys. New York: Academc Press, 1981.
Scott PJ, Huskison EC. Accuracy of subjective measurements made with and without previous scores: An important Source of error in serial measurement. Annals
of the Rheumatic Diseases 1979; 38: 558-559.
Schwarz N, Hippler HJ. Response alternatives: The impact of their choice and ordering. En: Bieme P, Groves R, Mathiowetz N y Sudman S (eds.). Measurement
error in surveys. Chichester, Wiley: 1991; 41-56.
LA ENCUESTA Y EL CUESTIONARIO
83
Schwarz N, Knuper B, Hippler HJ, Noelle-Neumann E, Clark F. Rating scales: numerical values may change the meaning of scale labels. Public Opinion Quarterly 1991; 55: 618-630.
Schwarz N. Frecuency reports of physical symtoms and health: How the questionnaire determines the results. New York: Mahaw, 1997.
Schwarz N. What respondents learn from questionnaires: the survey interview and the
logic of conversation. International Statistical Review 1995; 63: 153-168.
Silva LC, Macas M. La redaccin de cuestionarios para la investigacin socio sanitaria. Un estudio experimental. Revista Cubana de Educacin Mdica Superior (en
prensa), 2000.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: Una mirada
crtica. Madrid: Daz de Santos, 1997.
Silva LC. Muestreo para la investigacin en salud. Madrid: Daz de Santos, 1993.
Stewart DW, Shamdasani PN. Focus groups. Newbury Park, CA: Sage, 1990.
Sudman S, Bradburn N. Asking questions. San Francisco: Jossey-Bass, 1982.
Sudman S, Bradburn N, Schwarz N. Thinking about answers: The applications of
cognitive science to survey methodology. San Francisco: Jossey-Bass, 1995.
Tanur JM. Questions about questions. New York: Russell Sage, 1992.
Triana I. Condiciones de vida y salud de los maestros de la enseanza especial. Marianao. Trabajo de terminacin de curso de la Maestra en Salud Pblica, Ciudad
Habana, 1998.
Weeks MF. Computer-Assisted Survey Information Collection: A review of CASIC
methods and their implication for survey operations. Journal of Official Statistics
1992; 4: 445-466.
3
Muestreo simple aleatorio
3.1. Introduccin
En este captulo se presenta el muestreo simple aleatorio (MSA), el ms sencillo y conocido procedimiento probabilstico de seleccin. Como se ver en su
momento, se trata paradjicamente, tal vez del mtodo menos utilizado en forma pura en la prctica del diseo de muestras. Varias razones justifican, sin
embargo, que se haga un estudio detallado de sus rasgos y propiedades.
En primer lugar, es un procedimiento bsico como componente de casi todos
los diseos que se explican ms adelante. En segundo lugar, el muestreo simple
aleatorio se utiliza ampliamente en el diseo experimental (en particular, en la
fase de asignacin de casos a los tratamientos en el marco de los ensayos clnicos controlados) y constituye el ms importante punto de contacto de la teora de
muestreo en poblaciones finitas con la estadstica inferencial clsica (Fienberg
y Tanur, 1996).
Finalmente, una prominente funcin adicional del MSA en este libro es la de
viabilizar la introduccin formal de un amplio espectro de conceptos, ideas y notaciones que, si bien tienen valor general para cualquier tipo de diseo muestral,
se comprenden ms fcilmente en el contexto de un diseo sencillo como ste.
86
probabilstico; cabe subrayar, sin embargo, que no todo mtodo muestral que
produzca equiprobabilidad coincide con el MSA, como ocasionalmente se tiende a pensar y como se ha dicho incluso en algunos buenos libros aunque no especializados en muestreo.
Para fijar la definicin, supongamos que se tiene un listado de 12 nios ordenados alfabticamente y que, de ellos, se quieren seleccionar n = 6. Consideremos las siguientes tres alternativas para la seleccin:
a) Tomar los 6 primeros elementos del listado.
b) Dividir el listado en dos grupos: uno formado por los 6 primeros elementos y el otro por los restantes 6; lanzar una moneda al aire y tomar en calidad de muestra a los elementos del primer grupo en caso de obtener cara,
y a los del segundo si se obtiene escudo.
c) Asignar nmeros del 1 al 12 a los elementos de la lista. Colocar en una urna 12 bolas numeradas sucesivamente, mezclar totalmente las bolas y
seleccionar a ciegas 6 de ellas; finalmente, admitir en la muestra a los
elementos cuyos nmeros aparezcan sealados en las bolas elegidas.
El mtodo a no es probabilstico: los ltimos 6 elementos del listado no podrn integrar la muestra.
El mtodo b, en cambio, es probabilstico, ya que toda unidad tiene una probabilidad no nula y conocida de quedar incluida en la muestra. En efecto, la
probabilidad de inclusin de cada nio es la misma que tiene el grupo al que pertenece. sta es, obviamente, igual a 0,5; de modo que la probabilidad es igual
para todos ellos, con lo cual el procedimiento es, adems, equiprobabilstico. Sin
embargo, el mtodo no equivale al MSA, ya que existen subconjuntos de 6 elementos que no pueden resultar seleccionados al aplicarlo (por ejemplo, el de los
que ocupan los lugares impares en el listado).
El mtodo c, por ltimo, es MSA, ya que cualquiera de los subconjuntos diferentes que pueden formarse con 6 nios puede ser elegido y, dado el modo de
seleccin, es claro que ninguno de dichos conjuntos tiene ms probabilidad que
otro de ser el que a la postre resulte seleccionado. Detengmonos en este punto.
De la teora combinatoria sabemos que el nmero total de subconjuntos
posibles es:
N
N!
12!
=
= 924
=
n
( N n)! n ! 6!6!
K =
87
Puesto que todas ellas tienen igual probabilidad de ser la que finalmente
quede conformada, dicha probabilidad es igual a 1 .
K
N 1
( N 1)!
11!
=
=
= 462
K* =
P( M
) como vimos en
1
la Seccin 1.6, equivale en este caso a sumar K* veces el valor
; es decir,
K
K* n
para todo elemento de la poblacin. En nuestro ejemplo:
i =
=
K
N
i =
462
924
6
12
ei M j
= 0, 5
88
Hasta la aparicin y difusin de los microprocesadores, an tena sentido explicar cmo se utiliza una tabla como la que parcialmente hemos reproducido
(as se haca, por ejemplo, en Silva, 1982). Desde mediados de la dcada de los
ochenta, ya no lo tiene. En efecto, las PC1 nos relevan de aplicar tediosas manipulaciones, pues cualquier lenguaje de programacin contiene eficientes generadores de nmeros aleatorios. Los nmeros aleatorios se emplean en varios dominios; adems de su importantsimo papel en el marco del muestreo,
constituyen un ingrediente clave en el campo de la simulacin, en algunas reas
del anlisis numrico, como recurso en la programacin y en la experimentacin
en fsica. Pero lo que ahora puntualmente interesa es que gracias a dichos generadores, hoy contamos con programas muy rpidos y precisos para la seleccin
de una muestra simple aleatoria (vase Captulo 11).
Algunas aclaraciones y notas tcnicas sobre el tema de la generacin de nmeros aleatorios pueden hallarse en el apndice del presente captulo.
Usaremos la expresin PC (iniciales de Personal Computer) para designar a los modernos microprocesadores, tambin denominados ordenadores personales en algunas latitudes.
89
1
N
X
i =1
x=
1 n
xi
n i =1
n
N
la probabilidad de seleccin comn a todos los elementos de la poblacin, f expresa la fraccin que representa el tamao muestral respecto del tamao poblacional. El valor que asume x queda determinado una vez seleccionada la muestra; pero antes de contar con una la muestra concreta, puede considerarse que x
es una variable, puesto que a cada muestra posible corresponde su propia media
muestral especfica. Adems, dado que la seleccin de la muestra depende del
azar, se trata de una variable aleatoria, que puede asumir hasta K valores diferentes (tantos como muestras posibles hay), donde como vimos en la
Seccin 3.2 K =
N!
( N n)! n !
90
La pregunta natural en este punto es la siguiente: por qu aceptar x como estimador de X ?, por qu no tomar, por ejemplo, la mediana del conjunto x1,...,xn
en calidad de estimador?; e incluso por qu no admitir alguna otra funcin de
los datos mustrales como pudiera ser el estadgrafo G =
x
i =1
2
i
+5 ?
1
K
x
h =1
=X
[3.1]
91
D=
1
K
(x
h =1
X)
Sin embargo, el valor de D ser nulo, debido a que se estn sumando nmeros negativos y positivos equidistantes de cero en promedio. Para eludir ese
problema, una solucin consiste en promediar los cuadrados de las diferencias.
Tal promedio es lo que se denomina error cuadrtico medio de x :
ECM ( x ) =
1
K
(x
h =1
X )2
[3.2]
92
la Tabla 3.2 es fcil calcular los valores del ECM para los tres estadgrafos:
ECM (x) = 11,5
S2
VAR( x ) =
(1 f )
n
donde S 2 =
1 N
( X i X )2 es un nmero que cuantifica cuan dispersos entre
N 1 i =1
(X
i =1
aunque no hay dudas acerca de que S2 mide la variabilidad de los datos (ya que
en el fondo, a esos efectos, da igual si la suma de las distancias cuadrticas se divide por un nmero o por el otro), la definicin de S2 parece algo antinatural.
La frmula [3.3] permite ver que la varianza del estimador es mayor cuanto
mayor sea la variabilidad de los datos poblacionales. Dicho de otro modo: cuanto ms variable sea la realidad que se estudia, mayor ser la dispersin de las posibles estimaciones de X (suponiendo, desde luego, que n no se modifica) y, por
ende, menor la eficiencia de la media muestral como estimador de la media poblacional. Se trata de un resultado sumamente intuitivo; smiles de la vida cotidiana vienen a la mente: por ejemplo, es ms fcil acertar cuando se vaticina
la reaccin de un sujeto estable y ordenado ante cierto estmulo que ante la de alguien impulsivo y de carcter variable ante este mismo estmulo.
Por otra parte, puede observarse que VAR( x ) disminuye en la medida que
aumenta el tamao muestral n (una caracterstica del proceso, por cierto, que, al
2
Las demostraciones de las frmulas [3.1] y [3.3] pueden verse desarrolladas con recursos elementales en
Yamane (1970).
93
Figura 3.2. Variacin del error muestral en MSA en funcin del tamao muestral.
Naturalmente, se est asumiendo que la variable salario tiene anlogo grado de heterogeneidad en ambas
poblaciones.
94
Figura 3.3. Variacin del error muestral en MSA en funcin del tamao muestral.
Estas relaciones entre la eficiencia del estimador con cada uno de los tres
parmetros considerados (tamao muestral, heterogeneidad poblacional y tamao del universo) son esencialmente vlidas en toda situacin de muestreo,
cualquiera sea el diseo, incluidos aquellos ms complejos y realistas que el
MSA, aunque all no se deriven tan claramente de la formulacin correspondiente.
MSA.
En lo sucesivo, cuando se diga que la seleccin es aleatoria o al azar, se entender que nos referimos a un
95
96
VAR ( x ) = 6.017,1
Puede corroborarse ahora la validez de la expresin [3.3]: al calcular S2 se obtiene, en efecto, que:
1 15
S2 =
( X i 200) 2 = 13.885, 7
14 i =1
y puede comprobarse que:
S2
(1 f ) =
13.885, 7
2
(1 ) = 6.017,1
2
15
97
zo: la relacin [3.3] nos habilita para hacerlo rpidamente en este caso en que,
por excepcin, conocemos S2. Aplicndola entonces para n = 3, se tiene:
VAR ( x ) =
13.885, 7
3
1 = 3.702,9
3
15
La Tabla 3.5 resume los valores de VAR( x ) y el recorrido (menor y mayor valor de x ) para todos los posibles tamaos de muestra (desde 1 hasta 15). Como ya
sabamos, VAR( x ) va disminuyendo en la medida que aumenta el tamao de la
muestra. El recorrido, por su parte, tambin va estrechndose hasta llegar a la situacin extrema en que ambos puntos coinciden con la media poblacional. Este
caso refleja la situacin en que de hecho no se ha tomado una muestra como
tal, sino que se trabaja con toda la poblacin.
98
99
tampoco de la magnitud relativa del tamao muestral. Con esto ltimo queda
subrayado que para considerar que x sigue aproximadamente una distribucin
normal no es necesario que el tamao muestral constituya una fraccin importante del tamao poblacional sino que basta que sea grande en trminos absolutos (es decir: en la medida que aumenta n, los histogramas tienden a asumir la
forma de la campana de Gauss). Concretamente, cuando n supera a 50 (como
ocurre prcticamente en toda muestra real), la distribucin de los valores de x
ser siempre muy aproximadamente igual a la mencionada distribucin terica,
cualquiera sea el valor de N y cualquiera sea la distribucin de la variable X.
Como se recordar, esta distribucin tiene la propiedad, por ejemplo, de que
aproximadamente el 95% de las observaciones distan de la media menos que dos
veces5 su desviacin estndar (independientemente de los valores que tengan estos dos parmetros).
Por ejemplo, si se recuerda que en nuestro ejemplo VAR ( x ) = 77, 6 para
n = 2, y se calcula | x - 200| para los 105 valores de la Tabla 3.4, se puede corroborar que 101 de ellos (el 88 %, no muy lejano del porcentaje 95 % esperado)
5
100
Figura 3.4. Distribucin porcentual segn intervalos de todas las muestras posibles
medias para muestras de tamao 2.
Figura 3.5. Distribucin porcentual segn intervalos de todas las posibles medias para
muestras de tamao 4.
Figura 3.6. Distribucin porcentual segn intervalos de todas las posibles medias para
muestras de tamao 6.
101
son menores que el producto (1,96) (77,6) = 152,0. Algo similar (aunque mucho ms ajustado a lo esperado) ocurre para valores mayores de n. Por ejemplo,
de las 6.435 medias mustrales calculables para n = 8, 6.157 (esto es, el 95,7%)
distan de X menos que (1,96)( 810 ) = 55,8. La utilidad fundamental que tiene
esta caracterstica de la distribucin de x estriba en que nos habilita para la
construccin de intervalos de confianza.
Luego de sacar una muestra concreta y suponiendo que se conociera S2 se
podra calcular lo que llamaremos error de muestreo:
E = (1, 96) VAR ( x)
[3.4]
Sumando E a la estimacin x obtenida, se tiene el extremo superior del intervalo y restando E de x , el extremo inferior6.
s2 =
2
( xi x )
n 1 i =1
[3.5]
6
En rigor, habra que considerar la llamada confiabilidad. Aqu se ha partido de que se trabaj con una
confiabilidad del 95% y se ha puesto sistemticamente el nmero 1,96, correspondiente al percentil 97,5 de la
distribucin normal estndar. Tal simplificacin resulta acorde con el espritu del libro y con la prctica ms
extendida. El caso general, sin embargo, resulta muy fcil de construir para cualquier lector entrenado en teora
elemental de probabilidades.
102
En la Seccin 12.3 se discuten detalladamente diversos aspectos relacionados con el tamao muestral.
103
n0 =
(1,96) 2 S 2
E02
[3.9]
Como se aprecia en esta frmula, el tamao muestral depende de tres elementos: del tamao poblacional N, de la varianza poblacional S2 y del mximo
error admisible E0, elementos que, por tanto, deben ser conocidos de antemano
para aplicar la frmula. Para cada uno de ellos cabe hacer algunas consideraciones8.
i) Tamao poblacional
El MSA exige la posesin de un listado de elementos; por tanto, con ms razn, el tamao de ese listado tambin tiene que conocerse. Sin embargo, en la
prctica suele ocurrir que el verdadero tamao de la poblacin se ignora; sa es
una de las razones por las que raramente se utiliza el MSA puro. Es fcil comprender que, por ejemplo, el nmero exacto de mujeres en edad frtil en una provincia o la cantidad de nios del pas que tienen entre 3 y 5 aos son, en condiciones normales, nmeros desconocidos, aunque, naturalmente, casi siempre se
puedan tener valores aproximados (sobre todo poco despus de un Censo Nacional). En otro tipo de poblaciones, tales como el conjunto de sujetos de una
ciudad cuyo padre haya muerto de un infarto de miocardio, conocer exactamente ese nmero es simplemente quimrico. Prescindiendo por el momento de es-
104
la ciudad se tiene n =
1+
441
441
500.000
441,
n=
1+
n0
. Para toda
n0
1+
N
441
437 para
441
55.000
el municipio.
O sea, el tamao de muestra para ambas poblaciones sera bsicamente el
mismo. Sin embargo, si el estudio se fuese a verificar en un rea de salud que tu-
9
Cabe intercalar que, desde luego, en la prctica casi nunca se abordaran poblaciones de varios miles de
unidades mediante MSA, como veremos ms adelante. Pero esta relacin que rige entre el tamao poblacional y
el que debe alcanzar la muestra es tpica, cualquiera sea el mtodo de muestreo utilizado; de ah el inters de este anlisis.
105
viese slo 1.000 mujeres en las edades de inters, la reduccin del tamao de
441
muestra sera apreciable: n =
306.
441
1+
1.000
ii) Mximo error admisible
El mximo error admisible E0 refleja el grado de precisin que se desea como
mnimo. Puesto que E0 figura en el denominador de la frmula de n0, y como a
su vez n crece cuando lo hace n0, la frmula [3.9] conduce a que el aumento en
la precisin exigida incrementa el tamao muestral necesario, hecho compatible con nuestro sentido comn.
En su determinacin interviene vitalmente el usuario del muestreo, ya que
es l quien mejor puede identificar las consecuencias prcticas que se podran producir en caso de superar un error dado. Cabe aqu hacer una observacin en consonancia con las consideraciones preliminares contenidas en la
Seccin 1.10.4.
Puesto que la frmula [3.9] exige que anticipemos un error mximo admisible, es evidente que este habr de nacer de una reflexin racional (si tuviera
sentido fijar E0 libremente, entonces sera mejor decidir el tamao muestral directamente sin ms trmite). Las claves de esa racionalidad son dos:
a) La situacin prctica, que conduce a que nos preguntemos cul sera un
nivel de precisin mnimo aceptable teniendo en cuenta lo que ya se sabe sobre
este parmetro? En efecto, no tendr sentido plantearse estimar, por ejemplo, la
tasa de ciegos en una ciudad con un error absoluto mximo de 2%, ya que cual
quiera que sea el intervalo que obtengamos, ste ser no informativo (vese
12.8.2).
b) La magnitud que a grandes rasgos tiene el parmetro. Por poner un ejemplo elocuente, es fcil advertir que no se puede valorar si una precisin de un
kilogramo, al estimar un peso promedio, es o no aceptable mientras se ignore
qu es lo que estamos pensando (probablemente sera exageradamente exigente
si se trata de camiones, adecuada si fueran personas adultas, y totalmente insuficiente si fueran lombrices). Se trata del mismo callejn sin salida en que se estara si, para medir la longitud de un objeto, hubiera que decidir si ha de emplearse una cinta mtrica, una regla escolar, un pie de rey o un micrmetro sin
conocer cul es el objeto en cuestin.
Ambos asuntos, emparentados entre s, conducen a pensar en trminos relativos a la hora de fijar E0.
Tpicamente, E0 suele tomarse entre el 5% y el 10% de la magnitud que
presumiblemente podra tener el parmetro que se quiere estimar (er = 0,05 o
er = 0,10 respectivamente).
106
107
[3.10]
Si llamamos XT al total muestral correspondiente a una muestra equiprobabilstica entonces X T es un estimador insesgado del total poblacio
i =1
Xi
es una estimacin
108
Para estudiar este problema resulta ventajoso cuantificar la variable cualitativa de la siguiente manera: se define la variable X que slo puede tomar el
valor 1 o el valor 0 en dependencia de que el sujeto tenga o no, respectivamente, la caracterstica en estudio. O sea, se considera que la poblacin de valores
X1, X2,, XN est integrada por ceros y unos, donde Xi = 1 si el i-simo sujeto tiene la condicin y X1 = 0 en caso de que no la tenga. A partir de ello es evidente
N
que
1
N
X .
i =1
Esto quiere decir que la proporcin es un caso particular de la media aritmtica; sea, cuando Xi asume la forma particular que se acaba de describir, la
media X pasa a ser la fraccin P que ahora nos ocupa.
ste es un hecho de singular importancia, ya que ahora slo resta adecuar la
teora desarrollada para la estimacin de X a esta forma particular de la variable.
En particular, teniendo en cuenta que para estos valores de Xi se cumple que
N
i =1
i =1
X i = X i = A
2
Xi
2
N
N
i =1
= A A = N ( P P 2 ),
y que ( X i X ) 2 = X i2
N
N
i =1
i =1
no es difcil constatar que [3.3] se reduce, en este caso, a:
N PQ
(1 f )
N 1 n
VAR( p) =
[3.11]
donde Q = 1 P.
Si seleccionamos una muestra mediante MSA y llamamos x1, x2, ,xn a los
valores de estos elementos, se tiene que
1 N
xi es la fraccin muestral de sujetos
n i =1
n 1 i =1
x =x
i =1
2
i
i =1
2
= a se infiere que, s puede expresarse
n
n 1
109
pq donde q = 1p.
pq
n 1
(1 f )
[3.12]
pq
n 1
(1 f )
[3.13]
n0
n0
n 1
N 1 n0
+
1+ 0
N
N
N
donde
n0 =
(1, 96) 2 PQ
[3.14]
E02
110
modo: no es posible estimar tanto P como Q con el mismo error relativo11. Cmo conciliar esta realidad con la recomendacin opuesta, segn la cual lo nico
racional es operar con errores relativos? Reproduzco a continuacin las ideas
contenidas en Silva (2000) sobre este controvertido asunto.
Consideremos primero un caso ms general que el de P y Q: supongamos que
se quiere estimar una distribucin donde, en lugar de 2, hay K categoras. Es
k
Pero, siendo as, entonces no se tendr control alguno sobre la precisin con
que se estimarn P2 y P3, estimaciones que sern rehenes del e1, elegido.
A mi juicio lo nico razonable sera centrar el inters en el ms pequeo de
todos, fijar un error que se considere razonable (directamente un error relativo, o
un error absoluto, pero teniendo en cuenta cul pudiera ser el valor de esa fraccin, que es lo mismo que fijar un error relativo) y, con esos datos, aplicar la
frmula, que producir un tamao con el cual se estimaran adecuadamente (probablemente, con creces) los dems.
Para ilustrar lo anterior, supongamos que hay 4 categoras de inters y que la
distribucin verdadera es 3%, 10%, 18% y 69%. Supongamos que se elige la
cuarta fraccin para determinar el tamao muestral con que se quieren estimar
las 4, y que como anticipacin se establece el valor P4 = 70, as como un error
absoluto de e 4 = 7. La frmula [3.14] usando n0 =
Esta circunstancia ha conducido a algunos autores (Seuc, 1999, Marrugat, Vila y Pavesi 1999, por citar dos
ejemplos) a recomendar que se fije, simplemente, un error absoluto (el cual s ser comn a ambos parmetros).
111
Supongamos que cada uno de los dos contendientes selecciona una estrategia
diferente; hecha la experiencia, cada uno obtiene su estimacin, basada,
12
112
rA
y pB =
rB
segn
nA
nB
el caso, donde rA y rB representan el nmero de bolas de ese color que hay en la
muestra de tamao 50 y 300 respectivamente. El ganador del juego es aqul cuya estimacin de P sea ms precisa. O sea, A ganar si |pA P| es menor que |pB
P|, y B gana en caso contrario. Si pA dista de P tanto como pB, se declarar un
empate. Cul estrategia ser la ms favorable? Dicho de otro modo, cul de las
dos alternativas produce la victoria con mayor probabilidad?
El problema puede plantearse en trminos de errores mustrales: en ambos
casos se hace un MSA para estimar el mismo porcentaje desconocido, pero con
tamaos mustrales y poblacionales diferentes. La pregunta formulada equivale
a establecer para cul de las dos estrategias el error de muestreo es menor.
El sentido comn o la intuicin indican (equivocadamente) a la mayor parte
de las personas que debe elegirse la estrategia A, pues la inferencia se estara
basando en la observacin del 25% de la poblacin (50 de 200), en tanto que
bajo la estrategia B sta se basara en un msero 3% de la poblacin (300 de
10.000). Sin embargo, 300 es mucho mayor que 50 y, por ende, la primera muestra contiene ms informacin que la segunda, hecho que parece no contar para la
mayora de las personas.
En palabras de Kahneman y Tversky (1972): la nocin de que la varianza
muestral decrece proporcionalmente con el aumento del tamao absoluto de la
muestra no parece integrar del repertorio de intuiciones del ser humano.
Bar-Hillel (1979) realiz una experiencia consistente en plantear a 110 estudiantes que solicitaban su ingreso a la universidad un problema similar al que hemos formulado arriba. El 65% de ellos escogi la estrategia A y el resto la B. En
mi experiencia, el porcentaje de individuos que se pronuncia por la estrategia
ms ineficiente es aun mayor.
Volviendo al problema, al aplicar la frmula [3.11], se tiene:
VAR ( p A ) =
VAR ( pB ) =
PQ N A n A
nA
NA
= PQ
PQ N B nB
nB 1
NB
200 50
(49)(200)
= PQ
= (0, 015) PQ
10.000 300
(299)(10.000)
= (0, 003) = PQ
113
13
67
12
49
32
146
36
27
121
83
16
10
30
30
No definiremos ahora qu se entiende por deficiencia de una HC, pues ello resulta irrelevante; en una
encuesta real, sin embargo, tal definicin operacional sera de mxima importancia.
14
No procede que para este pilotaje se haga un diseo riguroso; todos los objetivos del estudio piloto suelen alcanzarse sin dificultad haciendo una seleccin informal, esencialmente basada en el sentido comn. (Vase Seccin 2.4.)
114
XP =
S P2
15
X Pi = 45, 7
15 i =1
15
2
( X Pi X P ) = 1.727, 95
14 i =1
Puesto que el 10% de X P es igual a 4,6, tomaremos E0 = 4,6. Aplicando la frmula [3.9] se tiene entonces que: n = 299,7.
Finalmente, hay que contemplar el hecho de que slo el 85% del total de las
historias clnicas corresponden a los individuos que interesan a los efectos de este parmetro (vivos al alta). De modo que la cifra final sera el resultado de dividir 299,7 entre 0,85, operacin que arroja un tamao muestral de 353 historias.
Por otra parte, supongamos que de un estudio anterior se conoce que alrededor del 30% de las historias clnicas de psiquiatra presentan alguna anomala
en el sentido definido para este estudio. Si queremos estimar P con el mismo
error relativo mencionado antes (10%) 16, en trminos absolutos se trata entonces
de la dcima parte de 30; es decir E0 = 3. De modo que, a los efectos del porcentaje, el tamao muestral sera, segn la frmula [3.14]: n = 791.
Los nmeros 353 y 791, candidatos a constituir el tamao muestral, son marcadamente discrepantes: cul elegir? Una solucin es alcanzar una especie de
compromiso como, por ejemplo, un nmero intermedio; tambin puede ser el
mayor de los dos (lo cual cubrira ambas demandas, una de ellas con creces), u
otra variante que no est muy alejada de las alternativas en juego. Supongamos
que, finalmente, se decidi estudiar 600 historias clnicas. O sea, se supone, en
resumen, que con una muestra de alrededor de 600 historias se podr estimar
adecuadamente el tiempo medio de estancia X y el porcentaje de historias con
deficiencias, ambos con error relativo no muy alejado del 10%. As las cosas,
se tiene que la fraccin de muestreo es f = 0,088.
Supongamos que, a lo largo del estudio de la muestra, cinco de las HC
seleccionadas tuvieron que ser desechadas por resultar ilegibles, de modo
que los datos corresponden a slo 595 encuestas. Hecho el estudio, se obtuvo que el nmero de historias con anomalas ascendi a 203 y que el nmero de historias correspondientes a altas de sujetos que salieron vivos result
ser 487.
15
Se ha usado el subndice P para subrayar que se trata de datos salidos del pilotaje.
Cabe preguntarse, como es natural, qu porcentaje tomar como bueno para la definicin del error relativo
o, alternativamente, porqu tomar el 10%. No existe ninguna razn especial; quizs 2 argumentos pueden invocarse. Primero, que un error del 10% de lo que se mide, suele admitirse en la vida comn como algo aceptable.
Segundo, que los humanos tenemos 10 dedos (o sea, el nmero 10 es el ms cercano a nuestros ojos, lo cual le
d quizs preferencia sobre el 9 o el 10,2).
16
115
Por otra parte, si llamamos Xi al nmero de das que estuvo ingresado el paciente correspondiente a la i-sima historia clnica entre aquellos 487 que salieron vivos del servicio, supongamos que se obtuvieron los siguientes resultados:
487
xi = 22.411
i =1
s 2 = 2.012, 21
116
1
N
de
N 1 S 2
N
117
naturalmente, ambos mtodos se reducen a lo mismo), pero que si n > 1, entonces necesariamente se cumple que:
VARR ( x ) > VAR ( x )
Este resultado es completamente lgico, ya que el MSA siempre produce
muestras integradas por n elementos diferentes de la poblacin, en tanto que a
travs de MSACR, el nmero de elementos distintos entre s puede ser menor,
con la consecuente prdida de informacin. Es decir, el MSA siempre ser ms
eficiente que el MSACR para un mismo tamao muestral.
Corresponde enfatizar que aqu se han usado las frmulas de la varianza con
un objetivo diferente del ms usual: hasta ahora se haban empleado, bsicamente, para hallar estimadores del error de muestreo, pero en este caso, al igual
que en el problema de las urnas de la Seccin 3.9, han servido para comparar dos
mtodos de seleccin. Esto tiene importancia metodolgica: ilustra cmo pueden
y deben hacerse evaluaciones relativas de los procedimientos desde un punto de
vista general e independiente de los resultados fortuitos a que pueden dar lugar
las aplicaciones especficas.
118
De hecho, as fue como se procedi para estimar la media muestral del tiempo de estancia en el ejemplo
de la Seccin 3.11.
119
R=
Yi
i =1
N
[3.16]
Xi
i =1
Vale la pena detenerse brevemente a considerar algunas situaciones que ilustran el posible inters por estimar razones. Los siguientes recuadros contienen
tres de ellas:
Supongamos que se estudia una comunidad integrada por ncleos familiares y definamos:
Xi = salario mensual que recibe la i-sima familia.
Yi = gasto mensual en que incurre la i-sima familia por concepto de medicinas.
El parmetro R expresa qu fraccin o parte del salario es utilizado en la comunidad para adquirir medicinas. En este caso R es un nmero entre 0 y 1.
120
La poblacin en estudio est integrada por las viviendas de un rea de salud. Se definen:
Xi = nmero de habitaciones de la vivienda i-sima.
Yi = nmero de residentes habituales de la vivienda i-sima.
R puede entenderse en este caso como un ndice de hacinamiento en el
rea de salud, que expresa el nmero medio de individuos por habitacin.
R puede, tericamente, ser mayor, igual o menor que 1.
Se tiene una poblacin de estudiantes (por ejemplo, alumnos de tercer ao
de medicina). Consideremos:
X i = promedio de notas obtenidas por el i-simo alumno durante su
segundo ao.
Yi = promedio de notas del i-simo alumno en tercer ao.
R es un nmero que refleja si el grupo de estudiantes experiment o no
una mejora de uno a otro ao, y expresa la magnitud de la mejora (si
R>1) o del deterioro (si R fuera menor que la unidad).
Supongamos que se desea estimar R a travs de un muestreo simple aleatorio.
Sean x1, x2,..., xn e y1, y2,..., yn los resultados obtenidos al medir X e Y en n unidades seleccionadas por MSA.
El estimador que usualmente se utiliza es:
n
R =
yi
i =1
n
[3.17]
xi
i =1
Se trata de un estimador sesgado: basta crear un ejemplo sencillo para corroborar que el promedio de todos los posibles valores de R no coincide con R.
Debe advertirse, como rasgo distintivo peculiar, que tanto el numerador como
el denominador son, en este caso, resultados aleatorios.
Se puede demostrar, sin embargo, que el sesgo de R es una magnitud que
disminuye rpidamente cuando n aumenta, y que se aproxima a 0 para valores
medianamente grandes del tamao muestral.
La varianza de R se estima mediante la frmula
var( R ) =
1 f
xT2
n
n n 2 2 n 2
yi + R xi 2 R xi yi
i =1
i =1
n 1 i =1
[3.18]
121
Debe sealarse que la frmula [3.18] se puede usar slo si la variabilidad del
denominador de R no es muy acusada. Concretamente, como medida de variabilidad de xT se ha sugerido el siguiente valor:
cv = n(1 f )
donde S x =
Sx
xT
2
( xi x ) En trminos prcticos, se exige que cv sea menor
n 1 i =1
que 0,2 (Kish, 1965).
Consideremos que en el segundo ejemplo arriba mencionado el tamao
poblacional es N = 184 y que los valores de X e Y para una muestra simple aleatoria de tamao n = 12 son los que siguen:
Entonces:
63
R =
= 2, 25
28
1
var( r ) =
12
282 11
Una posible definicin de lo que significa el azar sera aquello no susceptible de ser programado. Obviamente, esto se contradice directamente con la
existencia de programas computacionales capaces de producir nmeros aleatorios. En rigor, lo que se puede obtener con las PC son los llamados nmeros
pseudoaleatorios. Vale decir: se trata de algoritmos que permiten obtener se-
122
r0 = 21
a0 = 0, 089
r1 = 97
a1 = 0, 413
r2 = 166
a2 = 0, 706
r3 = 207
a3 = 0,880
r4 = 136
a4 = 0, 579
r5 = 87
a5 = 0, 370
r6 = 126
a6 = 0, 536
r7 = 47
a7 = 0, 200
r8 = 201
a8 = 0,855
r9 = 112
a9 = 0, 477
123
El trabajo realizado a lo largo de los ltimos 40 aos en esta rea ha sido intenso y productivo. Revisiones exhaustivas de esos esfuerzos pueden hallarse en
Sowey (1978), James (1990) y Dodge (1996).
Bibliografa
Bar-Hillel M. The role of sample size in sample evaluation. Organizational Behavior
and Human Performance 1979; 24: 295-257.
Dodge Y. A natural random number generator. International Statistical Review 1996;
64: 329-344.
Fienberg SE, Tanur JM. Reconsidering the fundamental contributions of Fisher and
Neyman on experimentation and sampling. International Statistical Review 1996;
64: 237-253.
Fisher RA, Yates F. Tablas estadsticas. Madrid: Editorial Aguilar, 1963.
Hansen MH, Hurwitz WN, Madow WG. Sample survey methods and theory. New York:
Wiley, 1953.
James F. A review of pseudorandom number generators. Computer Physics Communications 1990; 60: 329-344.
Kahneman D, Tversky A. Subjective probability: a judgment of representativeness. Cognitive Psychology 1972; 3: 430-454.
Kish L. Survey sampling. New York: Wiley, 1965.
Lehmer DH. Mathematical methods in large scale computing units. Annals of Computer Laboratory of Harvard 1951; 26: 141-146.
Marrugat J, Vila J, Pavesi M. Supuesto de mxima indeterminacin: error absoluto o
error relativo en el clculo del tamao de la muestra? Gaceta Sanitaria 1999; 13:
491-493
Neuman I von. Various techniques used in connection with random digits. En: Honseholder AS, (ed.) The Monte Cario Method Ced. National Bureau of Standard: Applied Mathematics Service, No. 12, 36-38
Seuc AH. Relation between the prevalence of a characteristic and the size of the sample
needed to estimate it. European Journal of Epidemiology 1998; 14 627-628.
Silva LC. Tcnicas mustrales aplicadas a la investigacin higinico-social. La Habana: Instituto de Desarrollo de la Salud, 1982.
Silva LC. Nueva visita al supuesto de mxima indeterminacin y al empleo de errores
absolutos y relativos. Gaceta Sanitaria 2000 (en prensa).
Sowey ER. A Second clasified bibliography on random number generation and testing.
International Statistical Review 1978; 46:89-102.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.
4
Muestreo sistemtico
80
16.000
1
200
la muestra contendra el 0,5% de los individuos de la lista. Para aplicar tal procedimiento sera necesario numerar primero consecutivamente a los 16.000
elementos de la poblacin, despus seleccionar al azar 80 nmeros menores que
16.000 diferentes entre s y, finalmente, identificar a los 80 sujetos asociados con
los nmeros resultantes. Como resulta evidente, tal procedimiento resulta considerablemente laborioso.
Puede entonces contemplarse un recurso alternativo, conocido como muestreo sistemtico (MS), el cual se bosqueja a continuacin.
Se selecciona un nmero aleatorio r entre 1 y 200 y se forma la sucesin
siguiente:
r, r + 200, r + 400, ... , r + 15.800
que consta de exactamente 80 nmeros e identifica a otros tantos individuos
diferentes. Los elementos que integran esta muestra se han determinado por un
procedimiento en el que interviene el azar, aunque de manera muy especial.
En efecto, tan pronto se elige aleatoriamente el primer elemento de la muestra (el que ocupa el r-simo lugar del listado), queda automticamente determinado todo el subconjunto que resultar seleccionado en calidad de muestra. El
nmero r que se elige para iniciar el proceso de seleccin se denomina arranque aleatorio.
126
Es fcil convencerse de que en este ejemplo, puesto que hay slo 200 arranques posibles y de que las muestras posibles son disjuntas' entre s, el nmero de
tales muestras posibles es tambin igual a 200. Esto contrasta notablemente con
el astronmico nmero de posibilidades a que dara lugar un MSA. Es natural
preguntarse si, a partir de esta peculiaridad, ambos mtodos son igualmente eficientes o no. A ello nos referiremos ms adelante pero, por el momento, corresponde subrayar la sencillez del trmite.
Tal sencillez se torna extrema en determinadas situaciones, para las que no es
preciso siquiera asignar nmeros previamente a los elementos de la poblacin,
sino que basta con disponer de un marco muestral con cierta ordenacin fsicamente explcita (visitas sucesivas de pacientes a un centro, renglones en un libro de registro o historias clnicas en un estante). A modo de ilustracin, supongamos que se tiene un archivo con 3.000 tarjetas o fichas de identificacin de
pacientes y que se quiere seleccionar una muestra de tamao 300 para estimar
el porcentaje de tarjetas que adolecen de algn tipo de omisin. Supongamos que
el nmero elegido entre 1 y 10 result ser el 7: se toma la sptima tarjeta, se
cuentan 9 tarjetas y se extrae la siguiente (decimosptima segn el orden). El
procedimiento se repite hasta que se haya recorrido el archivo completo.
N
n
(o simple-
mente como el entero ms prximo a dicha fraccin) y con ese nmero obrar
Es decir, ningn objeto del listado puede pertenecer a ms de una de las muestras que pueden producirse.
MUESTREO SISTEMTICO
127
N = 71 K = 6 r = 3 N = 12
128
Como se ver ms adelante, en diseos complejos de la prctica suele presentarse tal necesidad.
MUESTREO SISTEMTICO
129
En general, si se obtiene una parte de la poblacin mediante el mtodo regular con intervalo K1 y se adiciona otra parte mediante la aplicacin del intervalo
K2 a los no seleccionados en la primera fase, es fcil demostrar que la probabilidad de inclusin de cada individuo es igual a:
f =
K1 + K 2 1
K1 K 2
3 + 18 1
(3)(18)
[4.1]
= 0, 37.
130
Nota: Aparecen en negrita los sujetos finalmente elegidos, y subrayados los que fueron eliminados en la segunda fase.
MUESTREO SISTEMTICO
131
maniobra. El signo menos indica, precisamente, que el intervalo se aplica sobre la muestra para eliminar elementos de ella.
Ejemplo 3. f = 0,61
Como f > 0,5 se buscan los intervalos para 1 f = 0,39: K1 = 3 y K2 = 12. Se aplica
el mtodo regular con intervalo K1 = 3 y luego se adiciona uno de cada 12 de los sujetos no seleccionados. De ese modo se ha elegido un subconjunto que constituye el 39%
de la poblacin. Finalmente, se toma en calidad de muestra el complemento de ese subconjunto3.
Tabla 4.1. Intervalos de seleccin (K1, K2) para aplicar el mtodo
en dos fases que produce probabilidad de seleccin igual a f
Ntese que esa tctica permite que la Tabla 4.1 slo contemple las soluciones para valores de f inferiores
a 0,51.
132
X =
En efecto
1
K
xi =
i =1
1
K
xi
i =1
1 n
1 K n
X ij =
X ij
K i =1 n j =1
Kn i =1 j =1
1
VAR ( x ) =
1
K
2
( xi X )
i =1
[4.3]
MUESTREO SISTEMTICO
133
134
MUESTREO SISTEMTICO
135
Figura 4.3. Representacin de una muestra sistemtica de rboles ordenados verticalmente (K 5; r = 1).
136
Figura 4.4. Representacin de una muestra sistemtica de rboles ordenados verticalmente (K= 6; r= 1).
MUESTREO SISTEMTICO
137
Figura 4.5. Representacin de una muestra sistemtica de rboles ordenados horizontalmente (K = 5 ; r = 1).
138
MUESTREO SISTEMTICO
139
algn sistema que permita dar una ordenacin consecutiva a los pacientes que van
a ir recibiendo el alta, y prestablecer con toda precisin los elementos que integrarn una muestra sistemtica de esa futura poblacin de altas.
Digamos que se desea una muestra de 480 individuos y que, con acuerdo a
la experiencia previa, se presume que el nmero de altas que se habrn de producir a lo largo del ao entrante ascender a unos 3.200 pacientes; se calcula
480
Entonces f =
= 0,15 , lo que significa que debe seleccionarse aproxima3.200
damente el 15 % de la futura poblacin. Es fcil ver que en este caso no hay
ningn entero cuyo inverso sea igual o muy cercano a 0,15; pero se puede aplicar el mtodo de seleccin en dos fases.
En la Tabla 4.1 vemos que basta tomar un sujeto de cada 6 y eliminar uno
de cada 10 altas as seleccionadas. Tomando un arranque entre 1 y 6
(r = 3, por ejemplo) y otro entre 1 y 10 (digamos r = 8), es fcil conformar el listado
de individuos identificados por los lugares correspondientes que habrn de seleccionarse. De antemano se sabra, por ejemplo, que los individuos que ocupen los lugares 3, 9, 15, 21, 27, 33, 39, 51, 57 y 63 en el orden de altas seran los primeros 10
sujetos que habrn de incorporarse a la muestra. Este listado de sujetos previstos para ser encuestados y que conforman la futura muestra puede extenderse tanto como
se desee. Como se ignora el nmero exacto de elementos de la poblacin que se habr de conformar a lo largo del ao prximo, puede confeccionarse el listado de sujetos llamados a ser seleccionados usando un supuesto nmero de altas mucho mayor que lo que razonablemente cabe esperar, por ejemplo, 4.000 (en lugar de 3.200).
De tal suerte, si en realidad se produjesen, digamos, 3.425 altas a lo largo del ao, la
muestra, naturalmente, no contendr 480 individuos, sino 514, pero todas las altas
tendran probabilidad igual a 0,15 de integrarla (en tal caso, los nmeros que identifican la muestra y que estn entre 3.426 y 4.000, simplemente se ignoraran).
Debe sealarse que el procedimiento de seleccin sistemtica es utilizado como sustituto del MSA en el contexto de otros procedimientos ms complejos que
tienen este ltimo mtodo incorporado en algunas de sus etapas. Tal es el caso
del muestreo aleatorio estratificado y el del muestreo por conglomerados, que
sern objeto de atencin en los prximos captulos.
Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.
Farias H, Silva LC. Seleccin equiprobabilstica mediante muestreo sistemtico para
una probabilidad prefijada. Revista Investigacin Operacional 1984; 5: 51-77.
Madow WG, Madow LH. On the theory of sistematic sampling. Annals of Mathematical
Statistics 1944; 15: 1-24.
5
Muestreo aleatorio
estratificado
El MSA, introducido y desarrollado en el Captulo 3, es una tcnica de seleccin que reposa exclusivamente en el azar. Sin embargo, como ya se examin
detenidamente en la Seccin 1.9, el azar no es una garanta de representatividad.
Supongamos que en la poblacin bajo estudio pueden identificarse diferentes
grupos de elementos cuya representacin en la muestra quisiera asegurarse
(por ejemplo, diferentes grupos ocupacionales en un estudio de salud laboral).
La manera natural de lograrlo es conformar listados separados para cada uno de
dichos grupos y seleccionar submuestras dentro de cada uno de ellos. Actuando de esa manera, no slo se asegura la representacin de cada grupo en la muestra, sino que se puede controlar de antemano qu parte de la muestra habr de
proceder de cada uno de ellos.
La idea subyacente en esa estrategia es la misma que se asocia a la bsqueda
de representatividad: hacer que la muestra resulte tan variable como sea la poblacin. Para llevar a la prctica este tipo de seleccin es necesario contar con
una informacin previa sobre la poblacin que permita tanto la definicin de
los grupos mencionados como la confeccin de listados de los elementos
correspondientes a cada subconjunto. Antes de discutir con detalle esta alternativa, detengmonos en un ejemplo introductorio.
142
Supongamos que para ello se selecciona una muestra de tamao 100 conformada por 50 mujeres y 50 hombres, en ambos casos elegidos al azar, y que los resultados son los siguientes: 38 hombres y 6 mujeres de la muestra son fumadores (datos compatibles con los porcentajes reales, aunque para el muestrista estos ltimos
sean desconocidos). La muestra contiene por tanto 44 fumadores en total. De modo que el porcentaje muestral es igual a 44%, resultado de dividir 44 entre el tamao muestral. Supongamos, finalmente, que se es el nmero que se da en calidad de
estimacin; es decir, que se infiere que el 44% de los trabajadores son fumadores.
Obviamente, tal conclusin es bastante disparatada, ya que el porcentaje real de
fumadores era 17. Qu ha ocurrido? En qu consisti el error cometido?
Una primera reaccin podra llevarnos a atribuir el error al hecho de no haber tomado una muestra representativa en trminos de gnero, ya que hay una
sobrerrepresentacin masculina y los hombres de esta fbrica fuman ms que las
mujeres. Sin embargo, ello no constituye error alguno. El error se comete en el
momento en que se hace la extrapolacin de la muestra al universo; es decir,
cuando se dice que el hallazgo de un porcentaje muestral de 44% permite inferir que ste ser el porcentaje poblacional.
Un enfoque elemental (aplicando un par de veces la regla de tres) conduce
a estimar que el 76% de los hombres de la fbrica y el 12% de sus mujeres es
decir, 76 y 108 trabajadores de los respectivos gneros son fumadores. Vale
decir, se infiere que 184 de los 1.000 obreros son fumadores, para una estimacin
del 18,4%. Evidentemente, la estimacin est mucho ms prxima de P = 0,17
que la proporcin muestral p = 0,44.
Lo ocurrido fue que la muestra se trat como si fuera un MSA o un MS, cuando en realidad sta ni siquiera era equiprobabilstica. En efecto, la probabilidad que
tuvo cada mujer de ser elegida fue igual a f1 =
n1
N1
n
50
de cada hombre fue 9 veces mayor: f 2 = 2 =
=
N 2 100
=
1
2
50
900
.
18
, mientras que la
.
X =
i xi
i =1
n
i =1
[5.1]
donde i =
143
sta es una estratificacin indirecta. Es evidente que resultara utpico plantearse la obtencin de listas
directamente conformadas por nios de cada estrato, ya que no es realista la aspiracin de clasificar a cada nio
segn una escala socio-econmica previamente confeccionada.
144
En la ilustracin del prrafo precedente se ha utilizado el trmino estrato socio-econmico, procedente del lenguaje comn, por su connotacin semntica
en el sentido de aludir a un grupo homogneo en algn sentido. Cuando se aplica este tipo de muestreo, los grupos en que se divide la poblacin son conocidos como estratos.
Cuando para seleccionar los sujetos dentro de los estratos se utiliza un procedimiento en que interviene el azar, se dice que se aplica un muestreo aleatorio estratificado (MAE). En lo sucesivo se asumir que el mtodo de seleccin
practicado dentro de cada estrato es muestreo simple aleatorio o, equivalentemente, muestreo sistemtico.
145
n
Anlogamente, se pueden definir f h = h , la fraccin de muestreo en ese esNh
a
estrato; y ph = h la fraccin de individuos que tienen cierta caracterstica en
nh
el estrato h, donde ah es el nmero de individuos de la muestra con ese rasgo en
dicho estrato.
Un estimador insesgado de la media poblacional X viene dado por la frmula siguiente:
L
[5.2.]
xI = Wh xh
h =1
donde Wh =
Nh
N
estrato h. Obviamente, Wh = 1.
h =1
pI = Wh ph
[5.3]
h =1
De hecho, [5.2] y [5.3] son formas particulares que asume la frmula general
[5.1] para el caso del MAE. Ntese, sin embargo, que [5.1] es una media ponderada de individuos mientras que [5.2] es un promedio ponderado de medias, aunque en este caso particular resultan ser expresiones algebraicas equivalentes.
El ejemplo de la fbrica desarrollado en la seccin anterior constituye, obviamente, una ilustracin del MAE. All tenamos:
PI = (0,1)
38
50
+ (0, 9)
6
50
= 0,184
146
f1 = f 2 = ... = f L f =
nh
Nh
[5.4]
n
N
VAR h Z h = h2VAR ( Z h )
h =1
h =1
donde 1, 2, ... L son constantes cualesquiera, siempre que Z1, Z2, , ZL sean
variables aleatorias independientes. En
el caso que nos ocupa:
L
sh2
h =1
nh
var( xI ) = Wh2
(1 f h )
[5.5]
y
L
p h qh
h =1
nh 1
var( pI ) = Wh2
(1 f h )
[5.6]
ya que en cada estrato la seleccin se ha verificado mediante MSA, y slo se trata de usar las frmulas [3.6] y [3.12] dentro de cada sumando.
No es difcil ver ahora que si se cumple la condicin de proporcionalidad
[5.4], las expresiones [5.5] y [5.6] se simplifican, y pasan a ser:
var( x ) =
var( p ) =
(1 f )
n
(1 f )
n 1
Wh sh
[5.7]
Wh ph qh
[5.8]
h =1
L
h =1
donde f =
n
N
147
148
Supongamos que para la poblacin de la Tabla 3.3 se quiere estimar X mediante una MAE de tamao n = 2, donde n1 = n2 = 1, y que dicha poblacin se
ha dividido en L = 2 estratos de la manera que se recoge en la Tabla 5.1:
Tabla 5.1. Estratos formados para la poblacin de 15 hospitales
de la Tabla 3.3
Nota: Entre parntesis aparece el nmero que identifica a cada hospital, y al lado el nmero de mdicos.
149
xIj =
7
15
x1 j +
8
15
x2 j
Nota: Entre parntesis aparece el nmero que identifica a cada hospital, y al lado el nmero de mdicos.
VAR ( xI ) =
56
2
( xIj X ) = 2.822, 7
56 j =1
donde xIj denota la j-sima media ponderada entre las 56 estimaciones posibles.
Por otra parte, en la Seccin 3.4 habamos obtenido que la varianza de x por MSA
de ese mismo tamao (n = 2) era igual a 6.017,1, un nmero ms de dos veces
mayor; o sea, con la estratificacin planteada2 la varianza se reduce a la mitad.
2
Obsrvese que sta es la estratificacin ptima, ya que no hay otra manera de formar dos estratos con esos
tamaos de modo que resulten internamente ms homogneos.
150
60
60
60
i =1
i =1
i =1
i =1
2
2
xi (1) = 624, xi (2) = 346, xi (1) = 8.249, xi (2) = 3.869
donde xi(1) denota el i-simo elemento del primer estrato y xi(2) el del segundo. De
aqu, aplicando [5.2], se obtiene que:
x1 = W1 x1 + W2 x2 = 8,82
O sea, se estima que el tiempo medio de estancia fue de 8,82 das, cifra diferente, desde luego, a la media muestral simple, que sera igual a:
( 624 + 346 ) = 8, 08
( 60 + 60 )
Para aplicar ahora la frmula [5.5] hace falta computar las estimaciones de
la varianza dentro de los estratos:
s12 = 28,8
s22 = 31,8
151
28,8
60
31,8
60
= 0, 2540
e = (1, 96) 0, 2540 = 0, 95 , de modo que los lmites de confianza para X son:
8,82 0,95 = 7,87
152
153
5.5.4. Postestratificacin
Una posibilidad ocasionalmente practicable consiste en realizar estimaciones
teniendo en cuenta estratos poblacionales aunque la estratificacin formal no haya intervenido en el diseo. Es decir, aplicar ponderaciones a pesar de haber seleccionado una MSA o un MS. Si los tamaos Nh se conocieran (por ejemplo, a
partir de datos censales, estadsticas oficiales u otra fuentes), se pueden clasificar las unidades a posteriori y aplicar [5.2], donde xh es la media de los sujetos
que resulten elegidos dentro del estrato h. El mtodo exigira que los nh fuesen
suficientemente grandes (quizs mayores que 30).
Bibliografa
Bearwood J, Holton JH, Hammersley JM. The shortest path through many points. Proceedings of the Cambridge Philosophical Society 1959; 55: 299-327.
Cochran WG. Sampling techniques (3rd Edition). New York: Wiley, 1977.
Tschuprow AA. On the mathematical expectation of the moments of frequency distributions in the case of correlated observations. Metron 1923; 2: 461-493.
Neyman J. On the two different aspects of the representative method: the method of stratified samplign and the method of purposive selection. Journal of the Roy al Statistical Society 1934; 97: 110-114.
Yamane T. Elementary sampling theory. La Habana: Editorial R, 1970.
6
Muestreo
por conglomerados
Para introducir este trascendente mtodo de seleccin muestral, imaginemos
un problema prctico de magnitud tal como el que supone estudiar la anemia en
una gran ciudad. Naturalmente, en una situacin real de este tipo, donde se pretende seleccionar una muestra de tan vasto universo, nunca se desea estimar un
solo parmetro. En la prctica, probablemente, se quieran sondear aspectos tales como la prevalencia por sexos y grupos de edad, o indagar ciertas relaciones
como la que pudiera existir entre niveles de hemoglobina en sangre y condiciones socioeconmicas. Sin embargo, para esta discusin supondremos, una
vez ms, que se trata de un problema simple: la estimacin de la prevalencia de
anemia como nico parmetro de inters.
Consideremos la posibilidad de encarar dicho problema a travs de un MSA1.
Puesto que las unidades de anlisis son todos los residentes de la ciudad, el primer requerimiento sera el de conseguir un listado de la totalidad de los individuos que all residen: una lista que podra llegar a contar con alrededor de
400.000 individuos. Las dificultades para obtener tal informacin, que incluira
nombres y direcciones, son obvias; dicho ms claramente, en condiciones normales, si se deseara que tal lista estuviera realmente actualizada, se estara ante
un escollo simplemente insalvable. Supongamos, no obstante, que ste se ha superado y valoremos las dificultades a que an estara abocado el proyecto.
Admitamos que se desea una muestra de 2.000 ciudadanos y que se ha concluido el engorroso proceso de identificar 2.000 nmeros aleatorios diferentes
entre 1 y, digamos, 402.8062. Ahora nos encontraramos un panorama desola1
Toda la discusin y el razonamiento que siguen valen tambin para el caso en que se valore el uso de MS
o de MAE.
2
Para no perder realismo se supone que el listado consta exactamente de 402.806 individuos. En la prctica,
incluso, el verdadero tamao N de la poblacin es, virtualmente, imposible de conocer.
156
157
manzanas ya obtenidas y que, finalmente, se escoge un individuo dentro de cada vivienda elegida para determinar as los 2.000 elementos de la muestra. El
proceso ha transitado en este caso por cuatro etapas de seleccin: sectores, manzanas, viviendas e individuos.
Un distintivo clave del proceso de seleccin en el muestreo en etapas consiste en que la necesidad de listados de las unidades de muestreo en una etapa
se limita a aquellas unidades seleccionadas en la etapa anterior. As, en nuestro ejemplo, se necesita un listado de sectores; luego uno de manzanas, pero slo para los 40 sectores escogidos; en su momento se necesitar un listado de
viviendas, pero solamente para las 200 manzanas elegidas en dichos sectores; y
finalmente un listado de sujetos para cada una de las 2.000 viviendas seleccionadas.
Como es obvio, la conformacin de estos listados no puede producirse al unsono, sino que tiene que ser escalonada, ya que en una etapa an no se conoce
qu listados han de ser necesarios en la siguiente. Esto economiza recursos y
favorece la agilidad del proceso; por ejemplo, la lista de residentes en una vivienda puede conformarse in situ, cuando sta sea por primera vez visitada para
realizar la encuesta correspondiente.
En sntesis: la totalidad de las unidades de anlisis est potencialmente contenida en el marco, de manera que todo individuo tiene posibilidades de quedar
en la muestra a pesar de que slo una nfima parte de ellos llega a ser explcitamente listada (en este caso, los habitantes de las 2.000 viviendas seleccionadas
en la tercera etapa y de los cuales se elegirn a la postre los 2.000 sujetos de la
muestra). Finalmente, en lo que concierne al acto de toma de informacin en terreno, las ventajas prcticas y econmicas son evidentes.
Hasta ahora, slo se ha expuesto la estructura del diseo. Naturalmente, en
cada etapa de seleccin pueden aplicarse diversos mtodos especficos. En las
restantes secciones de este captulo se desarrollan y discuten algunas variantes
y se analizan algunos de sus mritos y desventajas relativas.
de modo que N = N i .
i =1
158
gan las UPE seleccionadas: n = N i. Si los tamaos N1, N2, ,nM son difereni =1
tes entre s (como ocurre en la prctica, casi sin excepcin), entonces el valor
159
Si se plantea llevar adelante un muestreo por conglomerados mediante la seleccin de m = 3 UPE, cules son los valores posibles del tamao muestral?
3
Por simple inspeccin de los valores de los Ni, se constata que n = N i es una vai =1
riable aleatoria cuyo valor mnimo se alcanza cuando resultan seleccionados los
conglomerados 2, 7 y 8 (n = 10 + 20 + 20 = 50), y cuyo mximo valor sera el
que alcanza si las UPE seleccionadas fueran las correspondientes a los nmeros
3, 4 y 6 (n = 100 + 80 + 140 = 320).
O sea, el tamao muestral puede moverse entre 50 y 320. La distancia entre estas dos cotas constituye una medida rudimentaria de la variabilidad de n, pero
como es natural pueden usarse medidas ms refinadas, como la desviacin estndar o el coeficiente de variacin; de momento, sin embargo, basta con sta.
Si, en cambio, los valores de los Ni fuesen ms parecidos entre s, entonces
la variabilidad del tamao muestral no sera tan marcada. Por ejemplo, supongamos que los valores fuesen:
En este caso, n queda necesariamente constreido entre 145 y 215, un recorrido en efecto mucho ms reducido. En este segundo caso, por tanto, aunque
se mantiene el carcter aleatorio del tamao muestral, su control previo es
considerablemente mayor.
160
x=
Xi
i =1
m
Ni
i =1
A x se le llama estimador de razn, pues es una razn de dos variables aleatorias. A diferencia del caso anterior, la media muestral [6.2] no es insesgada.
El sesgo suele ser, sin embargo, despreciable; por tanto, siendo [6.2] mucho
ms simple y natural que [6.1], lo regular es utilizar x como estimacin de X
cuando se emplea este tipo de diseo.
Huelga extenderse en que la situacin descrita abarca el caso de la estimacin
de una proporcin P. Si llamamos X iT al nmero de aquellos individuos del i-simo conglomerado elegido que poseen cierta caracterstica, entonces [6.1] y [6.2]
son estimadores (insesgado el primero, con un pequeo sesgo el segundo) de la
fraccin de individuos con dicha caracterstica en toda la poblacin. Respectivamente, los denotaremos mediante p1 y p.
161
Consideremos el ejemplo, en extremo simple, de una poblacin con 3 conglomerados (M = 3). Supongamos que se tiene:
N1=40
N2=60
N3=100
y que se han contado los sujetos de cada conglomerado que tienen cierto rasgo
(por ejemplo, ser mujer) con los siguientes resultados:
X 1T = 10
X 2T = 20
X 3T = 40
P=
X1
i =1
M
Ni
70
200
= 0, 35.
i =1
Consideremos ahora todas las muestras posibles de tamao m - 2 (que se reducen a 3) y sus resultados, los cuales se resumen a continuacin:
162
var( x1 ) =
M 2 S12
N2 m
(1 f )
[6.3]
donde
f =
S I2 =
T
T
Xi X
m 1 i =1
XT=
1
m
Xi
i =1
1 f
n
m
m
m m
2
2
T 2
T
( X i ) + x Ni 2 x X i Ni
i =1
i =1
m 1 i =1
[6.4]
La frmula [6.4], sin embargo, es una aproximacin cuya validez se subordina al cumplimiento de la siguiente condicin4:
[6.5]
f =
m
1
24
2
X i = 488.024
i =1
N = 84.228
m = 20
n = Ni = 2.704
i =1
T 2
( X i ) = 30.715
i =1
T
X i = 587
i =1
m
T
X i N i = 113.334
i =1
163
A partir de ellos, puede calcularse [6.1]: xi = 0,167 y, aplicando [6.3], se tiene: var( xi ) = 0,001105.
Por otra parte, la media muestral, segn [6.2], es igual a:
x=
587
2.704
= 0, 217
164
No podemos estar totalmente seguros de ello, porque slo contamos con estimaciones de las varianzas y no
con las varianzas verdaderas, que son de hecho imposibles de conocer a travs de datos mustrales.
165
M 1 4 T 26 83
P1 =
X i1 = 850 4 = 0,63
N m i =1
M 1 4 T
26 10
P2 =
X i2 =
= 0,08
N m i =1
850 4
M 1 4 T 26 5
P3 =
X i3 = 850 4 = 0,04
N m i =1
La suma de estos tres nmeros es 0,75. De modo que, en caso de que se usara [6.1] para estimar cada una de las fracciones, la distribucin porcentual de
alumnos segn estas tres clases en que necesariamente se ubica todo elemento
de la poblacin no abarcara al 100% de la poblacin, sino slo al 75% de ella!
K
166
Si se estima la fraccin de no accidentados, sta es, como vimos, 63%; si alguien nos pregunta por el porcentaje de accidentados, usualmente restaramos 63
de 100 y responderamos: 37%. Sin embargo, si se aplica [6.1] para estimar este
ltimo porcentaje, se obtendra un nmero aparatosamente diferente: 12%
26 15
. .
resultado de calcular:
850 4
pj =
X
i =1
m
T
ij
N
i =1
p1 =
83
98
p2 =
10
98
p3 =
5
98
167
6
Obsrvese que con un solo conglomerado no podran estimarse errores, ya que tanto la frmula [6.3] como la [6.4] contienen el trmino m 1 en el denominador.
168
En general consideramos que hay M UPE de tamaos N1, N2, ..., NM y que
se seleccionan m de ellas; luego, en el i-simo conglomerado elegido, se toman
ni unidades para formar la muestra7. La notacin que usaremos es consistente
con la que se introdujo en la seccin precedente:
Es fcil advertir que, cuando se toman todos los conglomerados (m = M), entonces estamos exactamente
ante la estructura de un MAE y que, en el caso en que se tenga ni = Ni para todas las UPE, lo que se realiza no es
ms que un muestreo por conglomerados monoetpico. O sea: el muestreo por conglomerados bietpico abarca
tanto al MAE como al muestreo monoetpico, como casos particulares.
xc =
169
M m
Ni xi
N m i =1
[6.6]
M m
Ni pi
N m i =1
[6.7]
donde pi es la fraccin muestral de sujetos del i-simo conglomerado seleccionado que poseen el atributo que se estudia.
Las frmulas exactas para estimar la varianza de xc y pc son en extremo complicadas y engorrosas. En la prctica, los estimadores [6.6] y [6.7] slo se emplean raramente, pero considero conveniente reproducirlas, sobre todo para que
se pueda apreciar dicha complejidad. Para la media tenemos:
var( xc ) =
donde
S x2 =
1 M 2 ( M m) S x2 M
+
N2
M
m m
1 m
( X i X *) 2
m 1 i =1
Ni2
i =1
S2 =
Ni ni Si2
ni
ni
1 ni
( xij xi ) 2
ni 1 j =1
[6.8]
con X i = N i xi ,
1 m
X * = X i , y donde xij denota el valor de X para la j-sima unidad elegida en el
m i =1
i-simo conglomerado de la muestra.
Para el caso de una fraccin, la frmula es:
var( pc ) =
1
N2
2
M 2 ( M m) m
1 m
M
N
p
N
p
i i m
i i +
m
i =1
Mm( m 1) i =1
i =1
N i ni pi qi
ni ni 1
[6.9]
donde qi = 1 pi.
La estrategia general que se ha expuesto no necesariamente produce muestras
equiprobabilsticas, circunstancia parcialmente responsable del abigarramiento
que exhiben las frmulas [6.8] y [6.9].
170
m
f2 ,
M
171
j =i
y xi = wi j .
j =1
i =1
i =1
y
x
[6.12]
m
m
1 m m 2
yi + r 2 xi2 2r xi yi
2
x m 1 i =1
i =1
i =1
[6.13]
Ntese que la frmula [6.13] tiene la misma estructura que [6.4]. Si el diseo es equiprobabilstico, las ponderaciones pueden eliminarse. Los valores de yi
y xi se reducen a:
m
yi = yij
j =1
xi = xij
j =1
172
y [6.13] coincide enteramente con [6.4] aunque con otra notacin, salvo que en [6.13]
se ha considerado que f 0, lo cual es enteramente razonable, ya que el empleo de
muestreo bietpico se asocia tpicamente a poblaciones considerablemente grandes.
6.3.4. Ilustracin
Consideremos nuevamente el ejemplo de los certificados de defuncin introducidos en la Seccin 6.2.3, pero suponiendo que se han tomado ni = 30 sujetos
con MSA o MS en cada uno de los m = 20 paquetes. Como se recordar el nmero total de paquetes era M = 480, de modo que la probabilidad de seleccin de
m ni
20 30
=
un sujeto en la i-sima UPE es igual a
, de donde se deduce que a
M Ni 480 Ni
todos los elementos de esa UPE les corresponde la ponderacin: wi = 480 N i = 0,8 Ni .
600
Los resultados son los que recoge la Tabla 6.2.
Tabla 6.2. Tamaos de 20 paquetes de certificados de defuncin y
nmero de certificados defectuosos por paquete y datos para el cmputo
de estimaciones
173
r=
y
=
x
i =1
20
12.157,6
= 0,187
64.896
i =1
yi2 = 12.328.714,9
i =1
20
xi2 = 281.101.824
i =1
20
x
i =1
yi = 53.990.073,6
var(r ) = 0,000491
var(r ) = 0,022
174
que concierne a la precisin de los estimadores. Ello se debe a que, en la prctica, las mismas circunstancias que agrupan o conglomeran, a los sujetos suele
hacerlos parecidos entre s y, por tanto, al tomar informacin de sujetos procedentes de unos pocos conglomerados, sta tiende a ser redundante y menos informativa que la que se obtendra a partir de una muestra con el mismo nmero
de individuos, pero dispersa por toda la poblacin.
Esta reduccin de la representatividad es claramente intuitiva; una rpida mirada a la Figura 6.3 ayuda a persuadirnos de ello: la muestra consta de 28 sujetos, pero en un caso se hallan concentrados en dos conglomerados, y en el otro
dispersos por toda la poblacin.
El grado en que la conglomeracin induce una prdida de eficiencia puede
expresarse formalmente en trminos de los errores de muestreo; ms especficamente, en trminos de la varianza de los estimadores.
Concretamente, supongamos que se quiere estimar X con una muestra de
cierto tamao y que se manejan dos alternativas: MSA y muestreo en etapas
(ME), en cualquiera de sus variantes. Llamemos VMSA( x ) y VME( x ) a las varianzas respectivas; entonces usualmente se tendr que VMSA( x ) < VME( x ). A la razn entre tales nmeros se le llama efecto de diseo y se le denota por DEFF.
El nombre un apcope de la expresin inglesa design effect es sugestivo de la
nocin subyacente, ya que se entiende que un MSA no es en rigor un diseo, sino que consiste en la toma de informacin exclusivamente basada en el azar,
sin intervencin diseadora del muestrista; en cambio, en el proceso del muestreo en etapas hay una serie de decisiones involucradas acerca de cules y cun-
175
tas son las UPE, cules las unidades de segunda etapa, etc. El diseo consiste,
precisamente, en el resultado de haber adoptado tales decisiones, y DEFF mide
el efecto de hacerlo con respecto al caso en que slo interviene el ciego azar. Es
decir, se define
DEFF =
VME ( x )
VMSA ( x )
[6.14]
DEFF es normalmente mayor que 1, y el grado en que excede a este nmero expresa cunta eficiencia se ha perdido como consecuencia de haber adoptado un diseo menos preciso (aunque tambin mucho ms econmico y prctico) que un MSA.
En la prctica, cuando se ha realizado un muestreo en etapas, DEFF puede
estimarse mediante deff (inherente a dicho diseo) del modo siguiente:
1. Se hace la estimacin varME( x ) de VME( x ) mediante la frmula que corresponda al diseo elegido (usualmente, algn tipo de muestreo en etapas).
2. Se toman los n elementos resultantes en la muestra como si provinieran de
un MSA (sin reparar en las UPE de las que proceden) y se calcula la varianza de los datos mustrales, exactamente como se habra hecho en un
MSA. Por ejemplo, si se trata de la estimacin de una media, se calcula
1 n
s2 =
( xi x )2 donde n es el tamao de la muestra resultante del din 1 i =1
seo en cuestin, xi el valor de su i-simo integrante.
s2
3. Se calcula varMSA ( x ) =
que es una estimacin de la varianza de x bajo
n
MSA (donde se suele prescindir del factor de correccin).
4. Se computa: deff =
varME ( x )
varMSA ( x )
r (1 r ) (0,187)(0,813)
=
= 0,000253
n
600
0,000491
= 1,94.
0,000253
176
Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.
Kalton G. Ultimate cluster sampling. Journal of the Royal Statistical Society, Series A
1979; 142:210-222.
Silva LC, Rubi A. On the estimation of proportions using complete cluster sampling.
The American Statistician 1983; 37: 53-54.
7
Un diseo especial: seleccin
de conglomerados con
probabilidades
proporcionales a sus tamaos
Este captulo se destina a explicar un procedimiento que posee especial importancia prctica y cuya esencia estriba en seleccionar las UPE con diferentes
probabilidades en lugar de hacerlo a travs de un mtodo que como el MSA
otorgue iguales posibilidades de eleccin a todas ellas.
Consideremos que se quiere disear una muestra para estudiar la morbilidad
hospitalaria de una regin y que se decide hacerlo mediante una muestra de aproximadamente 2.000 historias clnicas correspondientes a altas hospitalarias producidas durante el ltimo ao. Supongamos que las altas proceden de 106
hospitales y que en total ascienden a unas 400.000 a lo largo del ao. La seleccin de altas se har en dos etapas, escogiendo inicialmente hospitales, y luego
200 sujetos de cada uno.
Supongamos que, al analizar la distribucin de altas por hospitales, se advierte que sta dista de ser uniforme: hay un pequeo grupo de 12 grandes hospitales que genera en total el 45% de las altas hospitalarias de la regin. Consecuentemente, si la seleccin de las 10 UPE se realizara con MSA, entonces cada
uno de estos 12 hospitales grandes tendra la misma probabilidad de ser incluido en la muestra que la de todos los restantes, la mayora de los cuales son
pequeas unidades municipales que por su naturaleza reflejan un tipo muy
particular de morbilidad hospitalaria.
A partir de estas consideraciones, puesto que las UPE tienen tamaos muy diferentes, es intuitivamente ilgico usar un procedimiento equiprobabilstico en la
primera etapa. Se corre el riesgo, por ejemplo, de que muchos hospitales grandes
(quiz todos) queden fuera del estudio, lo cual sera obviamente chocante. Dicho en trminos ms tcnicos: la posibilidad de tener muestras demasiado homogneas (es decir, poco representativas) sera muy grande.
178
2.200
A continuacin se exponen, comentan e ilustran los seis pasos que deben darse para llevar adelante la seleccin.
1. Crear una lista de las UPE y obtener los tamaos acumulados
Ci = A1 + A2 + + Ai a lo largo de la misma.
En el ejemplo, esto significa conformar una tabla como la siguiente:
Acerca de la determinacin de m y
En el ejemplo, esto es I =
179
A
.
m
2.200
= 550.
4
Supongamos que el nmero elegido al azar entre 1 y 550 result ser R = 369.
4. Se calculan los nmeros siguientes:
Z1 = R Z2 = R + I Z3 = R + 2I Zm = R + (m 1) I
En nuestro caso, estos m = 4 nmeros son:
369
919
1.469
2.019
5. Asociar cada uno de estos nmeros con una UPE del modo siguiente:
se selecciona para cada Zi la primera UPE cuyo tamao acumulado supere o iguale al nmero en cuestin.
De ese modo, 369 identifica a la manzana 3 (pues C3 = 860 es el primer valor de Ci no superado por 369); 919 identifica a la UPE nmero 4 por ser 1.170
el primer acumulado que lo supera; 1.469 identifica a la manzana 6 y 2.019 a la
ltima. As, en el ejemplo, han quedado elegidos los conglomerados que ocupan los lugares 3, 4, 6 y 8 del listado.
180
50 50
,
,
525 310
50
50
,y
y respectivamente a los listados de individuos en las manzanas ele190
210
gidas.
Ai
A
= m i . No es difcil corroborarlo con un ejemI
A
f1 f 2 = m
Ai n mn n
=
= = f
A Ai
A
A
181
con probabilidad f 2 =
La primera variante resulta en general ms expedita, pero cualquiera de estas maneras de practicar el submuestreo produce el mismo efecto: en lugar de
obtener exactamente n USE por cada UPE seleccionada, se obtendr un nmero
aleatorio xi cuya proximidad con n depender de cuan buena haya sido la aproximacin Ai que se emple como sucedneo de Ni. Si Ai>Ni, entonces xi ser
menor que n , y viceversa.
En sntesis, el mtodo es equiprobabilstico y produce una muestra de tamao aproximadamente igual a n. Consecuentemente, la media y la fraccin mustrales estiman adecuadamente a los parmetros correspondientes.
En el ejemplo de la Seccin 7.1 se haban seleccionado las manzanas 3, 4, 6
y 8. Para hacer la subseleccin hay que obtener los listados de los individuos que
realmente residen en esas 4 manzanas. Supongamos que para esta segunda etapa se ha optado por el primer procedimiento.
Tomemos, por ejemplo, la manzana 8 (cuarta elegida): supongamos que
cuando se procede a censar las viviendas, se obtiene un listado de 205 individuos
n
50
=
= 0, 238 0, 24 ,
(en lugar de los 210 supuestos). Primero se calcula
Ai 210
y de inmediato se aplica un muestreo sistemtico en fases (ntese que en este ca-
182
UPE, y supuesto que m no es muy pequeo, entonces x = xi debe ser muy pri =1
ximo a n = m n .
NOTA: Ocasionalmente podra ocurrir que 2 o ms nmeros de los Zi obtenidos identifica-
ran al mismo conglomerado; esto slo pasara para una UPE cuyo valor de Ai fuera
muy grande (necesariamente mayor que I). En tal caso, en dicha UPE se aplica
sucesivamente la fraccin
2
3
n
tantas veces como nmeros la hayan identificado.
Ai
Este incidente revela que la fuente de informacin para obtener los Ai fue bastante defectuosa.
Seran 62 sujetos si el arranque fuese 1 2.
183
7.4. Notacin
Una vez seleccionadas las unidades de anlisis, se procede a la aplicacin de
la encuesta propiamente dicha. Como veremos, la estimacin de los errores se
consigue sin necesidad de conocer ms que los totales dentro de cada UPE. Llamaremos yi a dichos totales; o sea, yi es la suma de los valores de la variable en
estudio para los xi sujetos elegidos en la i-sima UPE seleccionada (o el nmero
de individuos que posee cierto rasgo bajo estudio entre los interrogados, si lo
que se quiere estimar es una fraccin poblacional).
Por ejemplo, consideremos que en el problema que venimos considerando
se quieren estimar los siguientes dos parmetros:
a) la fraccin de individuos que tienen anticuerpos a cierto virus.
b) el nmero medio de consultas mdicas por habitante que recibi la poblacin durante el ltimo ao.
En la cuarta manzana se encuestaron 49 sujetos (x4 = 49); supongamos que 14
tenan anticuerpos de modo que y4 = 14. Si entre esos mismos 49 encuestados
se acumularon 62 visitas al mdico, entonces, a los efectos de la estimacin del
segundo parmetro, se tiene y4 = 62.
La Tabla 7.1 recoge todos los datos relevantes del ejemplo hipottico,
supuesto que ya se tienen los resultados de la encuesta.
Tabla 7.1. Resultado en el ejemplo de la aplicacin del mtodo de muestreo
en dos etapas y seleccin de las UPE con probabilidad proporcional
a los tamaos aproximados
184
que no puede por tanto predecirse con exactitud. Sin embargo, usualmente se
tiene mucho mayor control del tamao muestral que con el muestreo monoetpico. En el ejemplo, el tamao final result ser 208 en lugar del 200 previsto.
La diferencia dista de ser muy apreciable, pero en cualquier caso es debida bsicamente a la mala aproximacin obtenida para la primera UPE elegida4.
rcter aleatorio del tamao de muestra. ste es x = xi , de modo que dichos esi =1
timadores son razones de variables aleatorias.
Tanto la media como la proporcin se estiman entonces mediante la frmula
siguiente:
m
r=
y
i =1
m
[7.1]
x
i =1
(1)
i =1
m
56
= 0, 269 . y la estimacin
208
i =1
(2)
y
i =1
m
(2)
x
i =1
277
= 1,33
208
Se puede demostrar que, si se tuviera Ai = Ni para todas las UPE (una situacin inusual y, por tanto, de muy escaso inters prctico), en cuyo caso xi = n , entonces:
En el ejemplo hemos supuesto que para los 208 individuos se pudo obtener respuesta para las dos preguntas. En la prctica ocurrir que el tamao de muestra real variar de una pregunta a otra como resultado de la no
respuesta.
var (r ) =
1
m 2
y mr 2
2 i
m(m 1)n i =1
185
[7.2]
m
m
1 f m m 2
2
2
+
y
r
x
2
r
xi yi
i
i
2
x m 1 i =1
i =1
i =1
[7.3]
[7.4]
i =1
donde sx2 =
1 m 2 x2
xi . En las aplicaciones prcticas, usualmente se
m 1 i =1
m
tiene que f =
n
0, de modo que se puede suprimir el factor (1 f) de la frA
mula [7.3].
200
= 0,091 m = 4 sx2 = 33,664, de modo
2.200
que, en efecto, se cumple [7.4], ya que:
En nuestro ejemplo se tiene f =
186
es equiprobabilstico;
el tamao muestral est bajo control;
otorga probabilidades de seleccin proporcionales al tamao de las UPE;
el tamao de muestra dentro de cada UPE es bsicamente el mismo.
Los cuatro rasgos mencionados son atractivos por diferentes razones. El carcter equiprobabilstico es favorable porque en ese caso todas las frmulas son
ms simples, porque es psicolgicamente ms admisible por parte del personal
lego en la materia y porque la incorporacin de ponderaciones siempre resta algo
de eficiencia a las estimaciones (Kish, 1965). La ventaja de poder hacer una
prediccin razonable del tamao muestral es evidente. Por otra parte, el hecho de
que las UPE mayores tengan ms oportunidad de ser elegidas que las ms pequeas contribuye, como se explic antes, a la representatividad. Finalmente,
desde el punto de vista logstico, en lo que concierne a trabajo de terreno, tener
tamaos de muestra similares dentro de cada una de las UPE, independientemente de la magnitud que tengan, suele ser altamente conveniente, porque ayuda sensiblemente a la organizacin del trabajo de terreno.
187
Hay que recordar que el carcter equiprobabilstico de la muestra es totalmente independiente de la calidad que tengan las aproximaciones. De modo
que los Ai que se usen para llevar adelante el procedimiento pueden ser aumentados o disminuidos (si ello resulta conveniente) sin comprometer aquel carcter.
Si las modificaciones de las aproximaciones con que se habr de trabajar no son
muy notables, entonces tampoco el tamao final de muestra se ver afectado de
manera apreciable, y aun en caso de que lo sean, puede ocurrir que dicho tamao no diste mucho del esperado gracias a las compensaciones que podran producirse si hubiera tanto sobrestimaciones como subestimaciones.
A continuacin se exponen algunas maniobras que se pueden realizar si fuese menester:
1. Si para algunas UPE se tiene n > Ai
a) Una primera variante es actuar segn se explica en la NOTA con que
concluye la Seccin 7.3.
b) Otra variante consiste, sencillamente, en atribuir a dicha UPE un tamao aproximado Ai = n (lo cual equivale a que en la segunda etapa se
tomarn todos los integrantes de tal UPE). Esto puede recomendarse
si la diferencia entre el tamao aproximado y n no es muy acusada (digamos, si n no lo supera en ms del 20%).
c) Una tercera posibilidad consiste en unir las UPE conflictivas a otras
contiguas, de modo que el problema desaparezca. En tal caso, la UPE
resultante de la unin antedicha tendr tamao aproximado igual a la
suma de los correspondientes a las UPE que la componen, y ser
considerada como un solo conglomerado (de ah la importancia de que
sus componentes sean contiguos o, ms generalmente, de que luego
no constituya un problema prctico a los efectos del submuestreo en caso de ser seleccionadas).
A
m
a) La primera variante consiste en dividir este conglomerado en dos o
ms UPE. Tal manipulacin se hara de manera que la suma de los tamaos aproximados de estas ltimas coincida con el de la UPE que es
objeto de la divisin. Es importante que en tal caso las nuevas UPE
estn bien delimitadas, de manera que si alguna de ellas resultase seleccionada, no haya ambigedad en la fase de submuestreo.
A
b) Si
es slo un poco mayor que el tamao aproximado de la UPE5,
m
entonces este ltimo valor puede disminuirse. Ntese que no basta con
5
Si hubiera alguna UPE cuyo tamao aproximado fuera mucho mayor que I, entonces el tratamiento del
asunto es radicalmente diferente y se aborda en el Captulo 8.
188
Bibliografa
Kish L. Survey sampling. New York: Wiley, 1965.
8
Muestreo estratificado
polietpico
Hasta ahora se han desarrollado diversos procedimientos de seleccin de
muestras con diferentes niveles de complejidad. Puede decirse, sin embargo, que
se han manejado tres situaciones alternativas bsicas: muestreo directo de unidades de anlisis (muestreo simple aleatorio o sistemtico, tratados en los Captulos 3 y 4), muestreo estratificado (Captulo 5) y muestreo por conglomerados
(Captulos 6 y 7).
El presente Captulo presenta un diseo en el que se integran todas las tcnicas precedentes: se combina el muestreo estratificado para la eleccin de unidades en la primera etapa con el muestreo en etapas dentro de las UPE seleccionadas; aunque no se trata de una definicin formal, a los diseos de ese tipo se les
suele denominar genricamente diseos complejos.
La introduccin de estratos al nivel de las UPE es conveniente, ya que puede
mitigar el notable efecto negativo para la representatividad que, muy a pesar
del muestrista, suele producir el muestreo por conglomerados. La idea es enteramente natural y consiste en introducir la tcnica de muestreo estratificado en la
primera etapa; o sea: organizar las UPE en estratos y luego seleccionar algunos
conglomerados de todos y cada uno de los estratos considerados. Las unidades
de anlisis se seleccionan posteriormente (en una o ms etapas) dentro de cada
UPE elegida en los estratos. A esta estrategia se la denomina muestreo estratificado polietpico (MEP).
190
M
h =1
= M.
(de modo que en total se eligen m = mh UPE), y realizar luego una subselech =1
191
Estos tres nmeros deben responder, en rigor, a un anlisis de costo-eficiencia acerca del cual se hacen algunas consideraciones ms adelante (Seccin 8.7).
192
A
.
m
2. Formar una tabla dentro de cada estrato en la que se ordenen las UPE
y calcular los tamaos aproximados acumulados.
3. Aplicar en todos los estratos el mtodo de seleccin de UPE expuesto
en la Seccin 7.3, usando en todos ellos el intervalo I.
1. Calcular I =
193
2.400
= 120.
20
Para seleccionar los hospitales que quedarn en la muestra dentro de cada estrato se procede a ordenarlos y a calcular de inmediato sus tamaos acumulados2.
Para el h-simo estrato se escoge ahora, aleatoriamente, un nmero Rh, entre 1 e
I = 120, y se construyen los nmeros Rh, Rh +I, Rh + 2I,..., hasta llegar al mayor
nmero que no sobrepase el tamao atribuido al estrato (Ah). De la manera usual
(a travs de los tamaos acumulados, como se explic en la seccin 7.3) se identifican las UPE elegidas; al nmero de UPE que resultan seleccionadas le
llamaremos, como se haba dicho, mh.
Ahora supongamos que en un estrato, por ejemplo el tercero, se tiene M3 = 5
y A3 =270; para elegir las m3 UPE que le corresponden hay que seleccionar
aleatoriamente un nmero R3 entre 1 y 120. En la Tabla 8.1 se resume la informacin relevante sobre dicho estrato y sobre las alternativas de seleccin de
UPE en el mismo.
cin); por tanto, el intervalo de seleccin que ha de aplicarse es I =
A (4,2)
B (6,3)
C (6,4)
D (8,2)
E (9,8)
Tamao aproximado
20
40
60
70
80
Tamao aproximado
20
60
120
190
270
1-20
21-60
61-120
1-70
1-30
acumulado
Arranques aleatorios que
determinan la eleccin
71-120
de cada UPE
NOTA: El nmero entre parntesis es el nmero medio de das de estancia en cada hospital.
Ntese que en el diseo que se est sugiriendo, el nmero m3 de UPE seleccionadas es aleatorio; por ejemplo, si el R3 que resulte elegido es un nmero
que se halla entre 1 y 20, entonces se seleccionan 3 UPE: A, D y E; pero si fuese, digamos, R3 = 65, entonces resultarn elegidos slo dos hospitales: C y E.
Resumiendo, en este ejemplo se tiene que m3 = 2 si R3 est entre 31 y 120, pero
m3 = 3 si R3 resulta estar entre 1 y 30.
2
Puede ser conveniente buscar un ndice que refleje de algn modo la eficiencia de la gestin hospitalaria
(sobre el supuesto de que podra estar asociada a la calidad de las historias) como pauta para establecer ese orden.
Por ejemplo, se podra elegir el tiempo medio de estancia hospitalaria durante el ao anterior y ordenar los hospitales de menor a mayor segn el valor de dicho tiempo medio. Actuando de ese modo, se asegurar que la
muestra de UPE recorra todo el espectro de valores inherentes al ndice escogido.
194
Para completar la muestra de manera que toda unidad de anlisis tenga pron
babilidad de inclusin igual a f = , basta subseleccionar las unidades dentro
A
de cada UPE elegida con fraccin de muestreo igual a la razn entre n y el tamao aproximado que se haya atribuido desde el comienzo a dicha UPE.
Ahora bien, el proceso de subseleccionar con dicha probabilidad entre los sujetos que integran la UPE en cuestin puede llevarse adelante de diversas maneras. Si las UPE no son muy grandes, puede actuarse como en el caso explicado en la Seccin 7.3 (cuando no se estratificaba); o sea: subseleccionar
directamente sobre el listado de los elementos existentes en el listado a travs
de muestreo sistemtico en fases, o mediante un MSA con un tamao de muestra establecido de suerte que se cumpla forzosamente la demanda probabilstica
inicial.
Sin embargo, la obtencin de listados dentro de las UPE seleccionadas puede ser en extremo dificultosa o simplemente prohibitiva. Por ejemplo, si se tratase de una encuesta nacional de fecundidad en la que se hubiesen seleccionado, digamos, m = 52 municipios de las provincias (estratos) del pas, entonces
habra que encarar la onerosa (acaso irrealizable) tarea de obtener los listados
de mujeres de 15 a 49 aos en cada uno de los 52 municipios.
Pero, afortunadamente, para la aplicacin de las frmulas de estimacin de
parmetros y de sus errores (que se expondrn ms adelante) cualquier procedimiento que produzca la probabilidad requerida en la UPE es lcito. Siendo
as, pueden valorarse variantes tales como:
- Formar bloques de unidades de anlisis dentro de cada UPE seleccionada, elegir por muestreo sistemtico una parte de ellos con la probabilidad
prefijada y luego encuestar a todos los integrantes de dichos bloques. En
Silva (1981) se desarrolla un ejemplo en que las UPE son reas de salud y
los bloques son viviendas completas: en ese caso, en lugar de un listado
de las mujeres del rea, basta contar con uno de las viviendas que dicha
rea abarca.
- Aplicar un muestreo bietpico dentro de cada UPE seleccionada mediante
la formacin de bloques, los cuales se someten a una seleccin con probabilidad proporcional a los tamaos aproximados, y luego se submuestrean.
Esto es: aplicar una muestra bietpica con probabilidades proporcionales
a los tamaos aproximados (tal y como se estudi en el captulo precedente) dentro de cada una de las UPE elegidas3.
195
xh = xhi
x = xh
i =1
h =1
yh = yhi
y = yh
i =1
h =1
Con esta informacin, se estima la media poblacional de la variable (fraccin o proporcin en el caso de que la variable sea cualitativa) mediante el ya familiar estimador de razn:
r=
y
x
var (r ) = 2 U h + r 2 Vh 2r Wh
x h =1
h =1
h =1
donde
1 mh 2
2
Uh =
mh yhi yh
mh 1 i =1
Vh =
1 mh 2
2
mh xhi xh
mh 1 i =1
Wh =
1 mh
mh xhi yhi xh yh
mh 1 i =1
[8.1]
[8.2]
196
[8.3]
h =1
[8.4]
f
cuya varianza puede estimarse mediante:
1
var (Y ) = 2
f
U
h =1
[8.5]
197
NOTA: El smbolo -----denota que las manzanas as marcadas no existen en los sectores respectivos.
Hay que elegir un nmero aleatorio entre 1 y 916 para cada uno de los 5 estratos. Supongamos que stos fueron respectivamente los siguientes:
R1 = 23
R 2 = 345
R 3 = 105
R 4 = 701
R 5 = 456
El lector puede corroborarlo formando los acumulados; es decir, sumando sucesivamente 916 al arranque
correspondiente a cada estrato y aplicando la regla de seleccin explicada en la Seccin 7.3.
198
os para dichas manzanas (es decir, el nmero real de unidades de anlisis que integraban los listados conformados a posterior i para los conglomerados elegidos):
En la Tabla 8.2 se observa que:
m1 = 3 m 2 = 4 m 3 = 3 m 4 = 2 m 5 = 4
x1 = 127
x2 = 172
x3 = 118
x4 = 87
x5 = 169
as como que el tamao de muestra final fue x = 673. Con esta informacin ya se
puede corroborar fcilmente que se cumple ampliamente la condicin [8.3].
Los resultados de la encuesta en cuanto a las dos variables relevantes (tener
problemas de salud bucal que exigen atencin y nmero de caries) se resumen en
Tabla 8.3. Tamaos mustrales resultante en las 16 manzanas
seleccionadas
199
la Tabla 8.4. All se recogen los valores de cada UPE de la muestra, necesarios
para hacer las estimaciones: nmero de sujetos con necesidad de atencin (yhi) y
!
nmero de caries acumulados por los sujetos encuestados ( yhi ). Este ltimo aparece entre parntesis.
Los resultados de este ltimo cuadro reflejan que, por ejemplo, y52 = 39; es decir, 39 de los 43 elementos examinados en la segunda UPE del quinto estrato ne!
cesitaban atencin, y entre dichos 43 sujetos haban acumulado y52 = 33 caries5.
Se puede apreciar, finalmente, que los totales de adultos enfermos por estratos fueron:
y1 = 22 y2 = 44 y2 = 3 y4 = 6 y5 = 141
de modo que y = 216. Para el nmero total de caries, los resultados respectivos
fueron:
!
!
!
!
!
y1 = 51 y2 = 42 y2 = 6 y4 = 5 y5 = 154
!
con lo cual, y = 258. Con estos datos, se pueden estimar ahora los tres parmetros:
1. Tasa de prevalencia de adultos necesitados de atencin estomatolgica (P)
y 216
p= =
= 0,321
x 673
L
L
1 f L
2
+
U
p
V
2
p
Wh = 0,00052
h
h
x 2 h =1
h =1
h =1
!
Como se ve, hemos usado el smbolo y para representar el nmero de caries acumuladas con el fin de dis-
var ( p ) =
200
var ( y ) =
1
f2
U
h =1
var (r ) =
L
L
1 f L
2
+
U
r
V
2
r
Wh = 0,00190
h
2 h
x h =1
h =1
h =1
201
ra ello esta UPE devenida en estrato debe dividirse en subconjuntos que harn
las veces de conglomerados, parte de los cuales se seleccionan en una primera
etapa para ser luego submuestreados. Esto quiere decir que deben crearse especialmente conglomerados que posteriormente desempearn exactamente el
mismo papel que las UPE en los estratos comunes.
Consideremos el siguiente ejemplo. En una ciudad existen 24 hospitales y se
quiere hacer un estudio de satisfaccin laboral entre el personal que labora en la
atencin secundaria. La ciudad puede dividirse en 3 zonas: este, centro y oeste,
pero una de las 5 UPE en la zona este es un hospital de grandes proporciones
(al que denominamos Hospital Central), tal y como refleja el diagrama de la
Figura 8.2. Dicho hospital, cuyo nmero de trabajadores es tal vez 5 6 veces
mayor que el nmero promedio de los restantes, se convertir en un estrato. Supongamos que se divide dicho centro en 6 reas (rea administrativa, rea de
urgencia, rea quirrgica, etc.). As la poblacin pasara a tener 4 estratos y 29
UPE distribuidas en dichos estratos, como muestra la Figura 8.3.
202
treo6, consiste en seleccionar exactamente mh = 2 UPE en cada estrato. Este mtodo se identifica con el nombre de seleccin pareada de unidades primarias.
Para su desarrollo es necesario hacer algunos ajustes previos. Si se ha planim
ficado seleccionar m UPE, hay que crear L =
estratos. Esto debe hacerse de
2
manera tal que los Ah sean iguales para todos los estratos; o sea, hay que forzar las
A 2A
cosas de manera tal que Ah = =
, lo cual se logra mediante la manipulaL m
cin oportuna de los tamaos aproximados de las unidades de primera etapa y
con una definicin adecuada de los estratos.
Ocasionalmente, adems de disminuir o aumentar los tamaos aproximados,
hay que dividir o unir diferentes UPE. Un ejemplo detallado de ese proceso puede encontrarse en Silva y Barreras (1983), donde se exponen algunos resultados
de una encuesta nacional basada en este tipo de diseo.
Una vez establecida la configuracin en estratos con las restricciones arriba
mencionadas, se sigue exactamente el procedimiento explicado en la seccin anterior. Las frmulas de estimacin adoptan en este caso expresiones muy simplificadas: Uh, Vh y Wh pasan a ser:
Esta afirmacin, que data de hace 35 aos, resulta en la actualidad exagerada, pues el advenimiento de las
PC ha abierto posibilidades computacionales entonces inalcanzables.
203
U h = ( yh1 yh 2 ) 2
Vh = ( xh1 xh 2 ) 2
Wh = ( xh1 xh 2 ) 2 ( yh1 yh 2 ) 2
Este resultado es vlido, naturalmente, tambin para el caso particular en que no se emplea estratificacin,
desarrollado en el Captulo 7.
204
m2 = 3
m3 = 2
m4 = 4
m5 = 2
Supongamos que los conglomerados as elegidos fueron los que refleja la Tabla 8.5, la cual tambin refleja las probabilidades que les correspondieron a estas
UPE en la primera etapa.
Tabla 8.5. UPE seleccionadas por sectores y probabilidades de inclusin
205
Una vez en terreno se tomaron muestras sistemticas de sujetos con el intervalo I = 5 (es decir f2 = 0,2) en todas y cada una de las 13 UPE seleccionadas.
Siendo as, los tamaos de las UPE y los tamaos mustrales correspondientes
fueron los que refleja la Tabla 8.6.
La Tabla 8.7 recoge los resultados de la encuesta realizada sobre esta muestra
(nmero de sujetos con necesidad de atencin estomatolgica).
Tabla 8.7. Resultados de la encuesta en las manzanas seleccionadas
Las probabilidades de seleccin que tuvieron en este ejemplo todos los elementos de la muestra son los que se reflejan en la Tabla 8.8.
Tabla 8.8. Probabilidades de seleccin de los elementos de las diferentes
manzanas elegidas
Consecuentemente, las ponderaciones que deben emplearse son las que se recogen en la Tabla 8.9:
206
Si llamamos yhij al valor de la variable Y para el sujeto j de la unidad de primera etapa i-sima en el estrato h, y whij a la ponderacin que corresponde a ese
valor (usualmente el inverso de la probabilidad de seleccin que correspondi a
ese sujeto), se definen:
yhi = whij yhij y xhij whij donde j recorre los sujetos de esa unidad de primera
j
xh = xhi
i =1
x = xh
h =1
y
mh
yh = yhi
i =1
y = yh
h =1
donde mh es el nmero de UPE elegidas en el estrato h, en tanto que L es el nmero de estratos involucrados. Ahora se pueden aplicar las frmulas [8.1] y
[8.2], vlidas en la presente situacin.
El lector puede corroborar que, aplicadas tales frmulas se obtiene:
r = 0, 436 var (r ) = 0,0425 as como que el intervalo de confianza al 95% es
0,3520,519.
Puede comprobarse, adicionalmente, que si se tratan los datos como si procedieran de un MSA, tendramos: r = 0, 400 y var (r ) = 0,1642, de modo que la
2
0,0425
estimacin de DEFF sera deff =
= 6,7.
0,0164
207
208
de movilizar una sola vez al equipo de encuestadores hacia el sitio en que se ubica dicha UPE. Si se sabe que, en un mismo da, pueden realizarse 20 pero no 30
encuestas, podra decidirse que n fuera igual a 20, 40 u otro mltiplo de 20.
Asimismo, debe valorarse el efecto econmico de trasladarse a m UPE. En
general, es obvio que resulta ms conveniente desde el punto de vista de la representatividad tomar m grande y n pequeo (bajo la restriccin) que viceversa,
pero tambin lo es que, cuanto mayor sea m, mayores sern los gastos en la generalidad de las situaciones reales.
Como se puede apreciar tras la lectura de la presente Seccin, el espritu con
que se sugiere enfrentar el problema de decidir los tamaos de muestra dentro de
las diferentes etapas del diseo es abiertamente flexible. Se dan algunas ideas y
pautas generales, pero al final tal proceso quedar redondeado por el sentido
comn. Las numerosas formulaciones matemticas que se han sugerido para resolver este problema (vase el libro clsico de Hansen, Hurwitz y Madow, 1953)
son muy interesantes para los estadstico-matemticos, pero han demostrado ser
estriles para los investigadores aplicados.
Bibliografa
Berent J, Jones EF, Siddiqui MK. Basic characteristics, sample designs and questionnaires. Comparative Studies No. 18, World Fertility Survey, 1982.
Hansen MH, Hurwitz WN, Madow WG. Sample survey methods and theory. New York:
Wiley, 1953.
Kish L. Survey sampling. New York: Wiley, 1965.
Kish L. Exhausted and undersized PSU's. Survey Statistician, 1978. No. 0.
Lininger CA, Warwick DP. La encuesta por muestreo. Mxico DE: CECSA,
Moser CA, Kalton G. Survey methods in social investigation. 2.a ed. London: Heinemann Educational Books, 1971.
OMuircheartaigh C. Proximum designs for crude sampling frames. Bulletin of the International Statististical Institute 1977; 46, No. 3.
Silva LC. Sobre la aplicacin de un diseo estratificado polietpico en encuestas de
salud. La Habana: Instituto de Desarrollo de Salud. MINSAP, 1981.
Silva LC, Barreras M. Sobre la evaluacin de la calidad de los registros. Resultados de
una experiencia. Revista Cubana de Administracin de Salud 1983; 9: 385-393.
9
Otras tcnicas de muestreo
En el presente captulo se pasa revista someramente a diversas tcnicas ntimamente vinculadas al muestreo. Si bien no guardan, en general, relacin mutua,
todas aportan informacin complementaria de inters y contribuyen a conformar
una cultura ms slida tanto en materia de seleccin muestral como de estimacin.
210
var (M ) =
(
j =1
M ) 2
k (k 1)
Ilustres muestristas, como Mahalanobis y Lahiri, propugnaban que el nmero de muestras interpenetrantes independientes fuese k = A. Una descripcin
del mtodo, en que se recomienda enfticamente tomar k = 10 replicaciones,
puede hallarse en Deming (1960).
Fuertemente emparentados con este mtodo de las replicaciones reiteradas, se
hallan los procedimientos conocidos como jackknife y, ms recientemente, los
mtodos de remuestreo conocidos como bootstrap (Efron, 1982); exposiciones
adecuadas pueden hallarse en Rust (1985) y Rao et al. (1986). Todos estos mtodos tienen en comn que remuestrean de las mismas unidades previamente
seleccionadas y producen errores de muestreo que son aproximadamente iguales
entre s (Kish y Frankel, 1974).
211
Aqu se est equiparando el nmero de mujeres que abortaron en un ao con el de abortos producidos en
ese perodo, ya que el caso de una sola mujer con dos o ms interrupciones en tan breve lapso, aunque posible,
es muy poco probable.
212
213
Por otra parte, las estimaciones de los totales para los diferentes tipos de abortos se resumen en la Tabla 9.2.
Tabla 9.2. Nmero estimado del total de abortos segn mtodo de encuesta
214
Las cifras son sumamente elocuentes: segn se aprecia en la Tabla 9.1, cuando se emplea respuesta aleatorizada, el porcentaje de abortadoras (pregunta comprometedora) se multiplica por 10, en tanto que el de casadas (pregunta inocua) no
exhibe prcticamente variacin alguna. Por otra parte, la Tabla 9.2 muestra que,
mientras los dos procedimientos convencionales arrojaron conclusiones disparatadas (el total de abortos ilegales era negativo), la tcnica de respuesta aleatorizada consigui arrancar una estimacin enteramente razonable de dicho nmero.
Numerosos procedimientos similares al que se ha explicado (en los que se involucran artilugios tales como cartas, dados o monedas) fueron creados para
encarar problemas como ste. Uno ms simple que el de Warner consiste en
solicitar que se lance una moneda y pedir al sujeto que, si sale cara, responda a
la pregunta: Ha tenido usted un aborto?; en tanto que, si el resultado es escudo, responda S. En este caso es fcil ver que la estimacin de mujeres que
abortaron se estimara mediante: P = 2 ps 1 , donde ps representa la fraccin de
mujeres encuestadas que respondieron S.
Ms tarde, se crearon incluso procedimientos para estimar promedios, como
muestra el siguiente ejemplo de Dalenius y Vtale (1974), quienes adecuaron el
procedimiento de Warner para estimar la media de una variable cuantitativa
conflictiva, tal como la edad de la primeras relaciones sexuales (X).
Se parte de que X puede tomar cualquiera de los 35 valores que van desde
15 a 49 aos y que se trabaja con una muestra de n mujeres que admiten haber
tenido tales relaciones en el momento de la encuesta. En un cartn se dibuja un
crculo que se divide en 35 secciones iguales que se numeran sucesivamente del
15 al 49. Fija al centro del crculo hay, como antes, una varilla metlica que la interrogada hace girar; cuando el dispositivo se detiene, el extremo de la varilla reposar sobre un nmero que, naturalmente, el encuestador no conocer. Cada
mujer se circunscribe a decir NO en caso de que sus primeras relaciones sexuales se hayan verificado a una edad estrictamente superior al nmero sealado por
a
la saeta, y S en caso opuesto. Puede probarse que = 15 + 35 es un estiman
dor insesgado de la media, donde a es el nmero de mujeres que contestaron NO.
Si, por ejemplo, el porcentaje de respuestas negativas es 40%, entonces
= 15 + (35)(0, 4) = 29; o sea, se estima que la edad media del comienzo de las
relaciones sexuales en esa poblacin es 29 aos.
NOTA: Naturalmente, todas estas estimaciones estn afectadas por cierto error. Adems
del error del muestreo, en este caso est presente un componente de error debido al efecto que produce el mecanismo aleatorio. No se examinar, sin embargo, este problema aqu, ya que desborda el nivel del libro. Su solucin puede
hallarse, por ejemplo, en Boruch y Cecil (1979).
215
216
217
el 5% de la totalidad de los peces del lago llevan marca (125 de 2.500). De modo que 1.300 (total de peces marcados) representa el 5% del nmero desconocido. Concretamente, N debe ser 20 veces mayor que 1.300; es decir: se estima que
hay 26.000 peces en total. La frmula [9.2] produce, desde luego, el mismo resultado:
(1.300)(2.500)
N =
= 26.000
125
Existen diversas aplicaciones del procedimiento, cuya versin ms simple se
acaba de exponer (Hook y Regal, 1995). El modelo podra emplearse, por ejemplo, para estimar el nmero total de ambulancias o de coches policiales en una
ciudad3, pero una de las aplicaciones ms sealadas en el mbito salubrista concierne al afn de evaluar la integridad de los sistemas de registro en salud pblica, en lo que tambin se conoce como sistemas duales de registro (Wells, 1971).
El ms clsico fue propuesto por Chrandasekar y Deming (1949) para estimar
ciertos datos globales aprovechando las discordancias entre dos sistemas de registro independientes que traten de obtener informacin sobre un mismo tipo de
acontecimientos. Para estimar el nmero total de tales acontecimientos, el procedimiento asume que la poblacin de donde procede la informacin es cerrada
(en el mismo sentido en que lo es la poblacin de peces) y que es posible identificar correctamente tanto los casos que aparecen en ambos registros como los
que slo estn en uno de ellos pero no en el otro.
La informacin necesaria es el nmero a de casos registrados en los dos
sistemas, el nmero b de los que registra el registro 1 pero no el 2, y los que se
hallan en el segundo pero no en el primero, al que llamamos c. Se definen
n1=a + b y n2 = a + c y se obtiene la estimacin del total N de sujetos que estn
en al menos uno de los dos. El estimador [9.2] con esta notacin sera:
n n
N = 1 2
a
Pero tambin se ha propuesto el estimador:
(n + 1)(n2 + 1)
N = 1
a +1
La estimacin de la varianza de N viene dada por:
( n + 1)(n2 + 1)cb
Var (N ) = 1
(a + 1) 2 (a + 2)
3
[9.3]
[9.4]
Se tratara de anotar las matrculas de un conjunto de estos coches mientras circulan aleatoriamente
durante cierto lapso, y hacerlo nuevamente unos das ms tarde.
218
219
220
que tambin fueron muy utilizadas como paradigmas de representatividad espacial hasta que se generaliz el uso del muestreo probabilstico de reas.
El muestreo a lo largo de un intervalo dado de tiempo representa una posibilidad: de la misma manera que una poblacin se ubica en el espacio, tambin
puede considerarse el tiempo como otra dimensin de la variacin. Las poblaciones varan de un ao a otro y de una semana a otra, del mismo modo que varan entre regiones o municipios. El muestreo probabilstico de reas poblacionales sirve como recurso que contempla la variacin espacial, pero la variacin
temporal puede tener tanta o ms importancia, especialmente en cuanto a las modificaciones cclicas (estacionales, semanales o incluso diarias). Cuando por limitaciones de orden prctico, como las existentes para los censos decenales, se
requiere un periodo nico, la seleccin basada en criterios subjetivos de un periodo representativo puede ser preferible a una eleccin en que intervenga el
azar. Pero cuando se cuente con un nmero mayor de periodos, cabe considerar
la posibilidad de realizar una seleccin probabilstica de los periodos (de igual
modo que se hara con las reas).
Los cortes transversales, por regla general, tienden a sacrificar la cobertura
temporal, mientras que los estudios longitudinales estn limitados espacialmente. Los diseos matriciales para muestrear tanto el espacio como el tiempo mediante muestras peridicas equilibradas pueden constituir una solucin integral.
Las encuestas peridicas, diseadas para determinados periodos, pueden ser
promediadas para el total del intervalo que abarcan. Con las muestras repetidas
podemos estar en condiciones de mejorar la calidad y reducir los costos; por otra
parte, las muestras repetidas pueden producir datos para construir series temporales que permitan estimar cambios y tendencias; y, finalmente, las medias y
sumas obtenidas con muestras repetidas pueden producir resultados inferenciales mejores que los basados en muestras nicas (Kish, 1989).
221
Una muestra tipo puede incluso contener datos personales obtenidos en entrevistas realizadas en una primera fase, de modo que sobre una submuestra de estos
individuos entrevistos se efectan las encuestas que vayan siendo necesarias.
Tales submuestras, con frecuencia, son objeto de rotacin: se conservan las
UPE iniciales (con sus probabilidades) y en momentos sucesivos se completan
las selecciones correspondientes a etapas posteriores, contemplando para estas
subselecciones las probabilidades originalmente previstas.
Para ilustrarlo con un ejemplo muy sencillo imaginemos que en una comunidad hay 12 escuelas primarias de las que se han seleccionado 3 con probabilidades proporcionales al nmero de nios y que luego se eligieron 20 nios, por
escuela para completar una muestra equiprobabilstica de 60 sujetos. Supongamos que las probabilidades de seleccin resultaron ser las siguientes:
f1 = 0,12
f2 = 0,43
f3 = 0,28
Dos aos ms tarde, se realiza otra encuesta con la misma poblacin: los nios
de las 12 escuelas existentes. Naturalmente, los nios ya no sern los mismos, ni
ser igual el nmero de nios por escuela, ni el nmero total de nios. Supongamos que en este segundo momento se quiere una muestra equiprobabilstica con f
= 0,03 como probabilidad general (calculada mediante la determinacin del tamao n deseado y del actual valor de N, o eligiendo la misma f del estudio anterior).
En tal caso, pueden usarse las mismas tres escuelas y aplicarse entonces, respectivamente, las siguientes fracciones de muestreo (quizs mediante muestreo sistemtico en fases) a las listas de alumnos que ahora se hallan en dichas escuelas:
f1' = 0, 25
f 2' = 0,07
f 3' = 0,11
que son las necesarias para que se cumpla la condicin fif i ' = f .
222
el fondo, no es otra cosa que el contenido del Captulo 7 del presente libro. A mi
juicio, ms que una tcnica rpida de evaluacin, lo que ellos hacen es una
exposicin rpida de una tcnica convencional.
2 PQ
= A a 1 A
223
4
, tenemos:
600
6002 4 596
50
Var ( X 1 ) =
1
= 43,71
50 600 600 600
Otra posibilidad es tomar una muestra de profesores (digamos, n = 5 de los
N = 12) y preguntar a cada cual cuntos de sus alumnos han cometido un fraude
en el ltimo ao. La dificultad radica en que un mismo alumno puede ser sealado por varios profesores (suponiendo que todos los profesores de un alumno
conocen si ste ha incurrido o no en la mencionada transgresin).
Una posible solucin para evitar este posible sobrerregistro consiste en establecer que un profesor slo pueda informar los casos de fraude cometidos en su
asignatura. Llamemos xi al nmero de alumnos identificados bajo dicha regla por
el i-simo profesor de la muestra. Entonces, un estimador insesgado de X sera:
N n
X 2 = xi
n i =1
Por ejemplo, si a uno de los cinco profesores de la muestra le correspondieron dos casos de fraude, a otro un caso, y ningn caso a los restantes tres, entonces la estimacin sera:
Puesto que P =
12
36
X 2 = (2 + 1 + 0 + 0 + 0) =
= 7, 2
5
5
Imaginemos que, estructuralmente, la situacin es como la que refleja la
Figura 9.3. All aparecen los N = 12 profesores de la escuela y los cuatro alum-
224
nos que han cometido fraude. Las flechas unen a cada uno de estos alumnos
con cada uno de sus profesores.
Esto quiere decir que el primer alumno tiene 4 profesores, el segundo tiene 3,
el tercero tiene 5 y el cuarto tiene 2. Por otra parte las flechas de trazo grueso
indican, para cada alumno, con qu profesor especfico se produjo el fraude.
Por otra parte, la Figura 9.3 tambin permite apreciar la situacin de los profesores. Por ejemplo, de ella se deduce que slo a 3 profesores se les ha cometido fraude y que para uno de los 12 se dio la situacin de que ninguno de sus
alumnos cometi fraude. La situacin se resume en la Tabla 9.3.
Tabla 9.3. Situacin de los profesores de la escuela en relacin
con el nmero de alumnos que han cometido fraude
Nota:
X i*
se define ms adelante.
225
La varianza de X 2 es:
S2
n
Var ( X 2 ) = N 2
1
n N
donde S 2 =
1 N
1 N
(
)
con
X
X
X
=
i
X i . Es fcil ver que, con los datos de la
N 1 i =1
N i =1
4 1
= y S 2 = 0, 424, de modo que Var ( X 2 ) = 2,67.
12 3
Advirtase que en este caso X 2 ser igual a cero para todas las muestras que
no contengan a los 3 profesores a los que le cometieron fraude (es decir, a los
que hemos numerado 4, 7 y 10). 12
El total de muestras posibles es ,I = 792, y el nmero de las que no con6
9
tienen a ninguno de los profesores mencionados es = 126, de modo que ahora
5
slo el 16% de las muestras (126 de 792) da lugar a la estimacin X 2 = 0 .
Una tercera posibilidad es admitir para la muestra de profesores el llamado
conteo mltiple: cada profesor comunica el nmero de todos sus alumnos
que hayan cometido fraude. Obviamente, la probabilidad de que un alumno sea
sealado es inversamente proporcional al nmero de profesores que tenga. Se
m
define xi* =
ij
N n
X 3 = xi*
n i =1
Se puede probar que X 3 tambin es un estimador insesgado de X. En el ejemplo, los valores de xi* son los que se hallan en la ltima columna de la Tabla 9.3.
As, por ejemplo, si en la muestra quedaran seleccionados los primeros 5 pro12 5 2
fesores, entonces X 3 sera igual a
+ = 4, 2. Advirtase que en este
5 4 3
caso ninguna de las muestras producira la aberracin de dar lugar a una estimacin de X igual a 0. La varianza de X 3 tiene la misma estructura que la de
S2
1 N
n
( X i X )2 .
X 2 : Var ( X 3 ) = N 2 * 1 donde S 2* =
N 1 i =1
n N
*
En este caso, S 2 = 0, 4241 y Var ( X 3 ) = 0,829. Como se aprecia, Var ( X 3 ) es mucho menor que Var ( X 2 ); lo que revela las ventajas de este procedimiento, espe-
226
cialmente til para la estimacin de totales en caso de que las prevalencias sean
muy bajas (digamos, del orden del 3% o menos). Un ejemplo de aplicacin de
esta tcnica puede hallarse en Sirken (1970). La teora correspondiente a muestreo en red para diseos ms complejos que el MSA (por ejemplo, para muestreo
por conglomerados) puede hallarse en Levy (1977).
Yw = WiYi =
i =1
N Y
i =1
n
i i
N
i =1
donde Wi =
Ni
N
i =1
227
dades como ciudades y provincias, universidades u hospitales, suelen tener tamaos que difieren marcadamente entre s. Si la correlacin entre el tamao y
la variable de estudio no es desdeable, la diferencia entre la media ponderada
y la no ponderada puede ser grande.
Consideremos la sencilla situacin que sigue: tenemos n = 5 hospitales cuyos
tamaos (medidos en trminos del nmero de mdicos) son iguales a 300, 510,
820, 60 y 50.
Supongamos que slo en los 2 ltimos hay graves problemas de ventilacin.
Si bien es cierto que el 40% de los hospitales padece el mencionado problema,
en realidad slo el 7% del total de mdicos trabajan en tales hospitales y estara
por tanto realmente afectado por el problema (110 de 1.740).
228
Tabla 9.4. Diseo con cuestionario parcial para tres submuestras y cuatro
bloques de preguntas con un bloque comn
229
N
N ij = mij
[9.5]
m
donde mij es el nmero de personas de la muestra que caen en la celda ij de la tabla de contingencia. La varianza de este estimador se estima mediante:
mij
N 2 m mij
[9.6]
(1
)
1
m N m
m
Una alternativa para realizar la estimacin consiste en hacer uso de los resultados de la muestra completa para la pregunta Pl, adems de los que arroja
la submuestra:
var ( N ij ) =
N mij
N ija =
ni .
m mi
[9.10]
donde ni. y m i. representan el nmero de personas que estn en la categora i-sima de la pregunta Pl para la muestra y para la submuestra respectivamente.
La varianza de este segundo estimador se estima mediante:
N2
n mij mij N 2 m ni. mij mij
Var ( N ija ) =
1
1
+
1
1
n N m
m m
n n mi . mi .
Veamos un ejemplo de este proceso.
Imaginemos que N = 400 y n = 120. A todos los sujetos se les aplica el bloque B1. Supongamos que B2, B3 y B4 se aplican respectivamente a submuestras
disjuntas de tamao m = 40. Consideremos dos preguntas dicotmicas: Pl (que
pertenece a Bl) y P2 (que pertenece a B2). Se desea estimar N12, el nmero de
sujetos que tienen el rasgo de inters en relacin con ambas interrogantes. Supongamos que para Pl la condicin es poseda por 60 de los 120 sujetos encuestados, que para P2 la respuesta positiva fue dada por 30 sujetos de la submuestra de 40, y que hay 20 individuos que respondieron afirmativamente a
ambas interrogantes.
De modo que, en resumen, tenemos que: n = 120, m = 40, N = 400, m12 = 20,
m1., = 30 y n1. = 50. Con estos datos se computa:
400
N 12 =
20 = 200
40
var ( N 12 ) =
(400) 2
40 20 20
1
1 = 450,0
40 400 40 40
230
(400) 2 120 20 20
a
)=
var ( N 12
1
1 +
120 400 40 40
400
N12 =
20 = 200
40
(400) 2
40 6 20 20
1
1 = 413,0.
40 120 120 30 30
a
La situacin del ejemplo, donde N 12
tiene menor varianza (y es por ende un
a
estimador ms preciso) que N 12 , es tpica.
Bibliografa
Bennet S et al. A simplified general method for cluster-sample surveys of health in developing countries. World Health Statisties Quarterly 1991; 44: 98-106.
Boruch RF, Cecil JS. Assuring the confidentiality of social research data. Pennsylvania: University of Pennsylvania Press, 1979.
Brown GH, Harding FD. A comparison of methods of studying illicit drug usage. Arlinton: HUMRO Technical Report 73, 1973.
Chrandasekar C, Deming WE. On a method of estimating birth and death rates and the extent of registration. Journal of the American Statistical Association 1949; 44:101 -15.
Dalenius T, Vitale RA. A new randomized response design for estimating the mean of a
distribution. Report No. 78 of the Errors in Surveys Research Project. University of
Stockholm (mimeo), 1974.
Deming WE. Sample desing in business research. New York: Wiley and Sons, 1960.
Efron B. The jackknife, the bootstrap and other resampling plans. Filadelfia: SIAM,
1982.
Feller W. An Introduction to probabiliry theory and its applications, vol. II. Nueva York:
Wiley, 1950.
Henderson RH, Sundaresan T. Cluster sampling la assess inmunization coverage: a review of experence with a simplifield sampling method. Bulletin of the World Health
Organization 1982; 60:253-260.
Hook EB, Regal RR. Capture-recapture methods in epidemiology: methods and limitations. American Journal of Epidemiology 1995; 17: 243-264.
Kish L, Frankel M. Inference from complex samples. Journal of the statistical Society,
Series B, 1974; 36: 1-37.
Kish L. Sampling organizations and groups of unequal sizes. American Sociological Review 1965; 20:564-572.
Kish L. Sampling methods for agricultural surveys. FAO Statistical Development. Series
3, Roma, 1989
Krotki KJ, McDaniel SA. Three estimates of illegal abortion in Alberta, Canada: survey,
mail-back questionnaire and randomized response technique. Trabajo presentado en
la 40.a Sesin del International Statistical Institute, Varsovia, 1975.
Lamb CW, Stem EE. An empirical validation of the randomized response technique.
Journal of Marketing Research 1978; 15: 616-621.
231
Levy PS. Simple cluster sampling with multiplicity. Proceedings of the American Statistical Association: 963-966, 1977.
Massey JT, Ezzati TM, Folsom R. Survey methodology requirements to determine the feasibility of the national household seroprevalence survey. Quality Assessment Task
Force Report, NCHS, 1989.
Raghunathan TE, Grizzle JE. A Split Questionnaire Survey Design. Journal of the American Statistical Association 1995; 90: 54-63.
Rao JNK, Platek R, Sarndal CE, Singh MR Small Area Statistics: An International Symposium. Nueva York: Wiley-Interscience, 1986.
Rust F. Variance estimation for complex estimators in sample surveys. Journal of Official Statistics 1985; 1: 381-398.
Silva LC. La confidencialidad: Un desafo aleatorio. Revista Juventud Tcnica 1982;
776:33-35.
Silva LC. La tcnica de respuesta aleatorizada: un mtodo para la reduccin de conductas evasivas en las encuestas de poblacin. Revista Cubana de Administracin de Salud 1984; 10: 53-59.
Silva LC. Cultura estadstica e investigacin en el campo de la salud. Madrid: Daz de
Santos, 1997.
Sirken MG. Household surveys with multipicity. Journal of the American Statistical Association 1970; 65: 257-266.
Teutsch SM, Churchill RE. Principies and practice of public health surveillance. New
York: Oxford University Press, 1994.
Tracy PE, Fox JA. The validity of randomized response for sensitive measurements.
American Sociological Review 1981; 46: 187-200.
US Census Bureau. The Current Population Survey: Design and methodology. Technical Paper 40, 1978.
Wacholder S, Carroll RJ, Pee D, Gail MH. The Partial Questionnaire Design for CaseControl Studies. Statistics in Medicine 1994; 13: 623-634.
Warner S. Randomized response: a survey technique for eliminating evasive answer
bias. Journal of the American Statistical Association 1965; 60: 63-69.
Wells HB. Dual record systems for measurement of fertility change. Working Papers of
the East-West Population Institute, N 13, Honolulu East-West Population Institut,
1971.
Williams P, Ryan L. Design of Multiple Binary Outcome Studies With Intentionally
Missing Data. Biometrics 1996; 52.1498-1514.
Zdep SM, Rhodes IN. Making the randomized response technique, 1971.
Zeger LM, Thomas N. Efficient Matrix Sampling Instruments for Correlated Latent
Traits: Examples From the National Assessment of Educational Progress. Journal
of the American Statistical Association 1997; 92: 416-425.
10
Muestreo y tcnicas
estadsticas convencionales
Histricamente, el cuerpo terico clsico de la inferencia estadstica naci
de manera independiente al del muestreo para poblaciones finitas y se mantuvo
esencialmente separado de l durante largo tiempo. Aunque las inquietudes al
respecto vienen de antao, slo en los ltimos diez aos se han dado pasos productivos que puedan considerarse, adems, integradores. En este captulo se
agrupan diversos tpicos que, si bien son relativamente inconexos entre s, comparten el hecho de ubicarse en esas zonas comunes a ambas esferas concernientes al muestreo.
234
delos lineales, mtodos no paramtricos, tcnicas de correlacin o anlisis multivariante), ha ganado en formalizacin, la situacin sigue dando motivos para el
debate y margen para el esclarecimiento.
El problema central radica, como sabemos, en que la conglomeracin (presente en la inmensa mayora de los diseos que se aplican realmente) casi siempre entraa cierto grado de dependencia mutua -mayor o menor, dependiendo de
la poblacin y de las variables- entre las observaciones. Consecuentemente, proceder como si se cumpliera la condicin de independencia suele producir anomalas tales como sesgos en las estimaciones e incrementos indebidos en la potencia de las pruebas de hiptesis.
Este asunto exhibe gran complejidad terica (vanse Kish y Frankel, 1974;
Lee, Forthofer y Lorimor, 1989; Skinner, Holt y Smith, 1989: Lethonen y Pahkinen, 1995). Las frmulas aproximadas para realizar las estimaciones de parmetros simples (medias y totales) y sus varianzas bajo diseos complejos pueden
deducirse de diversos modos; los que se han recogido en captulos precedentes
se han conseguido, bsicamente, a partir de desarrollos en series de Taylor. Las
frmulas para resolver problemas inferenciales ms complejos (por ejemplo,
estimacin de coeficientes de regresin o pruebas de independencia entre variables) parten de demandas matemticas tanto o ms avanzadas, de modo que su
solucin desborda ampliamente el nivel del presente material.
Ahora bien, es preciso recordar que, como se explic en el Captulo 1, los
problemas que se centran en la estimacin son terica y prcticamente diferentes
de aquellos cuyas preguntas demandan de la comparacin. Justamente, para los
primeros se han conseguido soluciones ms claras. Para aquellos centrados en la
comparacin, en cambio, el empleo de tcnicas complejas de muestreo como
las discutidas en el presente libro ha recibido poca atencin. Lo que suele hacerse en la prctica es llevar adelante el anlisis asumiendo que la muestra es
simple aleatoria y prescindiendo totalmente de que se hayan usado o no diseos
complejos. Debe sealarse, sin embargo, que tal realidad dista de ser grave; y no
lo es por la sencilla razn de que la inmensa mayora de los estudios se llevan
adelante con datos que no slo no proceden de muestras complejamente diseadas, sino que ni siquiera corresponden a muestras formales en sentido alguno.
Usualmente se trata de datos empricos que procuran representar poblaciones definidas por situaciones abstractas generales, tales como el conjunto de los
pacientes hipertensos tratados de cierto modo especificado y el de los tratados
de otra forma. La exigencia de trabajar con muestras obtenidas formalmente seria simplemente paralizante, tanto por las dificultades prcticas que supone conseguirlo como por el hecho de que algunas de estas poblaciones abstractas no
admiten, por definicin, la conformacin de un listado. Y aqu, como suele ocurrir tantas veces, es mejor colaborar con lo inevitable. (Vanse comentarios
adicionales en la Seccin 10.4 y una amplia discusin de este tema en la Seccin 12.3.)
235
se es exacta y nicamente el papel que desempean las pruebas de hiptesis: si la asociacin es significativamente diferente de 0, entonces puede afirmarse con escaso margen de error que la relacin entre X e Y
no se ha observado por mera casualidad.
2
Variables que se relacionan tanto con X como con Y y cumplen la condicin de no ser un estadio intermedio
en la secuencia causal entre la exposicin y el efecto.
236
poral que guarden los datos, la ltima de las premisas de Hill. Nos concentraremos entonces en ella, la nica que nada tiene que ver con aspectos tericos. Es la
ms obvia, la menos discutible ( y a que es condicin sine qua non) y. quiz por
eso mismo, lamentablemente, una de las menos contempladas.
Ms formalmente, se trata de la pauta basada en que la accin de un agente
causal siempre precede al efecto: Para que una modificacin en cierta condicin X pueda considerarse responsable de los cambios que se producen en otra
condicin yV, es imprescindible que .X haya actuado antes de que Y se haya modificado. Toda hiptesis de causalidad involucra a un efecto y a una presunta
causa: lo que plantea dicho postulado (y esto es lo relevante) es que para considerar empricamente avalado el hecho de que la supuesta causa produce tal efecto, los acontecimientos han de haberse observado de suerte que haya certeza
acerca de que la precedencia temporal con que se generaron los datos sea compatible con la afirmacin causal que se valora.
Subrayo nuevamente que en este caso no nos referimos a una condicin cuyo cumplimiento aumente la conviccin de que la hiptesis sea cierta: es mucho ms que eso: se trata de una premisa metodolgicamente imprescindible. Tal
condicin, a la que denominaremos premisa de precedencia temporal (PPT), est directamente vinculada al diseo del estudio, ya que es ste el que puede (y
debe garantizar la validez de aqulla.
Los estudios prospectivos, en los cuales, como su nombre indica, los hechos
supuestamente se miden o registran en el mismo orden temporal en que se producen, se prestan a menos suspicacias en cuanto a que se haya cumplido o no la
PPT. De hecho, en el caso particular de los estudios experimentales no existe
siquiera este peligro: en los observacionales de cohorte, dado que la observacin
comienza cuando aun no se han producido los desenlaces que se estn considerando, tal riesgo esta casi siempre conjurado por el propio diseo.
Los estudios transversales y retrospectivos, en los cuales slo puede intentarse la reconstruccin histrica de los acontecimientos, son, en cambio, altamente vulnerables al no cumplimiento de la PPT. En este tipo de estudios, con
ms frecuencia que la deseada (Silva y Benavides, 1999), se soslaya toda consideracin sobre esta premisa, o directamente se acta sin reparar en que no ha
sido satisfecha. Aunque existen trabajos que advierten la necesidad de eludir
esta falacia (vanse, por ejemplo, Susser, 1973, y Gray y Krainer, 1988), se trata de un error frecuente, poco enfatizado, escasamente ilustrado, que asume
diferentes formas, y cuyos efectos han sido poco estudiados.
El asunto es suficientemente insidioso como para que, incluso en tal caso, pueda producirse, por excepcin,
el problema (vase Silva, 1997).
237
238
Pidrola et al. (1990) definen un factor de riesgo como aquel factor endgeno o exgeno, que puede ser
controlado, precede al comienzo de la enfermedad, est asociado a un incremento de la probabilidad de incidencia de una enfermedad y tiene responsabilidad en su produccin.
239
240
mor que genera el compromiso que siempre se contrae cuando se anuncia que
lo que se busca es una explicacin. De ah que, aun cuando se proceda a calcular
medidas de asociacin, algunos investigadores se apresuren a dejar claro que no
tienen intenciones explicativas. Lo que pasa es que tal declaracin es en el fondo falsa pues, si no las tuvieran carecera de todo sentido llevar adelante tal
maniobra computacional. El asunto no se resuelve, por tanto, declarando una u
otra intencin, sino asegurndose de que el cmputo es interpretable siempre que
se haga.
En sntesis:
a) Si se generan cruzamientos o se calculan medidas, de asociacin, es necesariamente porque se piensa en trminos causales, independientemente
de que se procure enmascararlo proclamando otra cosa.
b) Si el estudio es epidemiolgicamente transversal (se registra el status
prevaleciente al margen de la temporalidad), entonces realizar esta accin es un acto, cuando menos, estril, y con frecuencia pernicioso.
Consume
golosinas
No
Total
10
400
410
No
40
50
90
Total
50
450
500
241
10.50
= 0,03
40.400
Pero el asunto es que ninguna de estas valoraciones permite arribar a conclusin alguna.
La clave del problema radica en que la pregunta no tiene en cuenta el orden en
que aparecieron los acontecimientos que se registran: de hecho, es imposible establecerlo. Todas las alternativas son posibles (obesos que consuman golosinas
antes de serlo, no obesos que dejaron de serlo cuando abandonaron el consumo,
obesos que dejaron de consumir golosinas precisamente por estar enfermos, etc.).
Lo que no es posible es determinar cul de esas alternativas correspondi a cada
sujeto de la muestra. Imaginemos que tenemos una mquina del tiempo y que retrocedemos 6 aos. Descubrimos que estos 500 nios (todos de cuatro aos) eran
entonces normopesos, pero que 100 de ellos eran consumidores regulares de golosinas en tanto que los restantes 400 no lo eran. Con el paso del tiempo, digamos,
a los dos aos, 40 de los primeros desarrollan obesidad, al igual que 10 de los no
consumidores, sin que se modificara esencialmente el patrn de consumo.
En ese punto un corte transversal hubiera producido la Tabla 10.2
Las tasas de incidencia son, entonces, de 40,0% y 2,5% respectivamente,
indicio de una intensa asociacin positiva.
Supongamos que en esa etapa hay una gran ofensiva publicitaria a favor del
consumo de golosinas entre escolares, con la que se consigue que 340 de los 390
que no consuman ni eran obesos pasen a consumir; paralelamente, 30 de los 40
obesos consumidores abandonan el hbito por prescripcin mdica de modo que
Tabla 10.2. Distribucin de la muestra segn se trate o no de obesos
y segn consumo de golosinas (ao 2000)
Nio obeso
Consume golosinas
No
Total
40
60
100
No
10
390
400
Total
50
450
500
242
No
Total
30
50
80
No
20
400
420
Total
50
450
500
Naturalmente, no me detengo en el examen del efecto de posibles factores confusores ni en otras consideraciones metodolgicamente imprescindibles para el examen de relaciones causales, adems de las que nos ocupan.
243
n=
2
( P1 P2 )
[10.1]
donde y representan las probabilidades mximas admisibles de cometer, respectivamente, los errores de tipo I (rechazar indebidamente la hiptesis nula) y
P +P
de tipo II (no rechazarla a pesar de ser falsa), y donde P* = 1 2 .
2
En esta situacin el investigador ha de prefijar (por ejemplo, puede elegirse el sacralizado = 0,05) y (se toma con frecuencia = 0,2). Supongamos
que P1 es conocido en la prctica clnica y que asciende a 60% (P1 = 0,6), as como que la diferencia se considerar clnicamente relevante si la tasa de recuperacin se eleva, desde ese supuesto 60%, por lo menos, hasta 70% (P2 = 0,7).
En tal caso la aplicacin de [10.1] arrojara n 745.
Lo que se ha expuesto aqu es slo un ejemplo que ilustra el modo en que tericamente habra que conducirse; no nos interesa reproducir aqu un recetario, no
slo por el resquemor que nos producen las recetas (vase Seccin 12.3), sino
6
Debo advertir que sta es una de las mltiples situaciones posibles (aunque, tal vez. tambin una de las ms
frecuentes). Incluso para esta misma situacin, sin embargo, existen otros enfoques.
244
245
246
al de los sujetos que portan dichos factores o sufren los daos (Susser, 1998). Esta modalidad ha sido crecientemente desdeada y excluida de la investigacin
epidemiolgica contempornea. Como dato elocuente, represe en que, por poner un ejemplo, a lo largo del bienio 1996-1997 el American Journal of Epidemiology public 999 artculos originales: slo 9 de ellos eran de este tipo. Ello se
debe en parte al temor que despierta la falacia ecolgica, descrita por primera
vez hace medio siglo por Robinson (1950): el hecho de que una asociacin que
se produce entre grupos de sujetos pudiera no existir, o incluso tener signo
opuesto cuando las mismas variables se miden al nivel de los individuos (vase
una ilustracin en Silva, 1997a). El riesgo de incurrir en tal falacia es real pero,
por qu dar por sentado que, en el fondo, siempre se quiere elucidar el problema a nivel individual? Esta premisa ha tomado una dimensin tal en nuestra
mente, que ha conseguido obstaculizar que centremos la discusin, precisamente, en un marco social.
Si en un estudio, por ejemplo, se demostrara que la presencia de nios con bajo peso al nacer es ms frecuente en las comunidades con altos ndices de
desempleo que en las que lo tienen bajo, entonces la afirmacin no puede trasladarse automticamente al nivel de los sujetos (es decir, tal vez no pueda
concluirse que los hijos de los desempleados nazcan con la condicin de bajo
peso con mayor frecuencia que los hijos de los que tienen un puesto de trabajo
regular), so pena de incurrir en la susodicha falacia ecolgica. Pero lo importante es que (al vez no haya ningn afn en hacer ese traslado; quizs el inters
est directamente orientado a evaluar el efecto de ese indicador sobre todos los
miembros de la comunidad, tengan o no vinculacin laboral remunerada. Consideraciones similares pueden hacerse sobre los efectos de variables ecolgicas tales como regulaciones jurdicas, formas de organizacin laboral, valores
religiosos predominantes o grado de desigualdad.
Pero el desdn hacia los estudios ecolgicos tambin se debe, en buena medida, a prejuicios injustificados (Schwartz, 1984); tanto es as que estos estudios han llegado a conceptualizarse slo como sucedneos como un mal menor de aquellos en que las unidades de anlisis son los individuos, a pesar de
que, como recuerda Susser (1994), constituyen una herramienta de la salud pblica y la epidemiologa, con su propio peso especfico, y con cuyo concurso se
ha producido conocimiento enteramente vigente aun despus de muchos aos.
Los rasgos contextales pueden y suelen tener impactos globales sobre todos los sujetos abarcados por ellos. Esto es as no slo en el sentido en que operan condiciones intrnsecamente ecolgicas que, como la contaminacin
ambiental, no distinguen entre unos y otros individuos y los afecta a todos en una
u otra medida. Tambin ocurre con rasgos globales conformados a partir de caractersticas de los sujetos, tales como el porcentaje de analfabetos en una comunidad, los cuales frecuentemente influyen sobre todos los individuos, analfabetos o no.
247
Uno de los ms arraigados y perniciosos prejuicios se concentra en el postulado de que las condiciones grupales, asociadas a variables medidas a nivel de
grupos, no representan agentes causales de enfermedad. Esta corriente de pensamiento cientfico, coherente con la insistente convocatoria actual al individualismo en muchas esferas de la vida (que en el campo de la salud se concreta en la
prctica de culpabilizar a la vctima, trasladar los costos operativos de la asistencia a quien la recibe, y promover la privatizacin de los servicios), tiene un
importante componente ideolgico.
Se ha perdido de vista incluso que cuando se mide un rasgo individual muchas veces se est midiendo algo distinto que cuando se trata de ese mismo rasgo pero mirado a nivel colectivo. Por ejemplo, el concepto de pobreza referido
a un sujeto no es el mismo que el que corresponde a la pobreza de la comunidad en la que l vive; tanto es as que quien resida en una comunidad empobrecida, por ejemplo, se ver afectado por todos los condicionamientos globales derivados de esa pobreza (tales como violencia o falta de higiene comunal),
independientemente de que su personal nivel econmico sea ms o sea menos
elevado.
Hasta la expresin variable medida a nivel de grupo es tendenciosa, pues
parece descartar a priori el posible inters hacia aquellas variables que slo
pueden medirse a ese nivel por ser intrnsecamente concernientes a una agrupacin (Diez, 1998). Sin embargo, existen importantes constructos que no tienen
sentido a nivel individual, sino slo cuando se trata de un colectivo. Por poner
un ejemplo, cualquier mdico de familia sabe que un individuo que vive en
una familia desestructurada, en cuyo seno se verifican tensiones graves, suele no ser un individuo sano en el sentido amplio del concepto, incluso aunque
entendiramos la enfermedad slo como mera desviacin de la fisiologa normal del sujeto. El ejemplo ilustra el posible papel etiolgico de un rasgo grupal,
as como que tal rasgo (desestructuracin familiar, en este caso) slo tiene
sentido para el colectivo y nunca para sus integrantes como entes aislados.
Quizs la ms emblemtica declaracin que refleja hasta dnde ha llegado la
esterilizante contraccin de la epidemiologa al nivel individual de anlisis sea la
que hizo Rothman (1986) cuando escribi que la clase social no se relaciona
causalmente con ninguna o casi ninguna enfermedad. Para dar slo un elemento persuasivo en direccin contraria, bastara detenerse en algunos de los
numerosos trabajos que ponen en evidencia la notable persistencia a lo largo de
decenas de aos de una marcada diferenciacin de la esperanza de vida y de
otros indicadores de salud entre estratos socioeconmicos (vase Syme, 1989).
En sntesis, puesto que la bsqueda de factores etiolgicos ubicados al nivel
del individuo ha resultado ser tan poco fructuosa (Silva, 1997b), y dado que no
quedan dudas de que existen factores colectivos cuyo valor etiolgico puede ser
crucial, eludir el examen de los problemas en su dimensin socio-epidemiolgica resulta absurdo. Ha de reconocerse que estas nuevas lneas de pensa-
248
miento an esperan por aportes operativos ms concretos, pero ya se aprecian resultados interesantes en esta direccin (vanse, por ejemplo, Evans, Morris y
Marmor, 1994 y Wilkinson, 1996).
Tras estas consideraciones tericas, lo que importa destacar es que las tcnicas mustrales clsicas se concentran en la seleccin de sujetos y no de grupos
(salvo, como paso intermedio, para seleccionar los sujetos de su seno): pero, de
hecho, tales procedimientos se pueden aplicar anlogamente para diversos niveles de agregados. Los mtodos estadsticos integradores de variables medidas
a diversos niveles de agregacin (multilevel analysis y modelos jerrquicos) parten del supuesto de MSA y an reclaman un marco terico slido para el caso de
los diseos mustrales formales.
249
El procedimiento es algo engorroso, aun contando con un programa informtico que realice una seleccin simple aleatoria dentro de un listado. En efecto, despus de seleccionar el primer grupo de 50 habra que renumerar del 1 al
100 a los sujetos no elegidos, y aplicar entonces por segunda vez el programa.
Por eso es conveniente contar con programas ad hoc para realizar la asignacin,
aunque lo que tales programas hacer, en esencia es aplicar sucesivamente el
MSA. Para obtener informacin sobre programas informticos que solucionan
esta tarea. Vase la Seccin 11.1.
Debe aclararse, sin embargo, que hemos descrito una situacin ideal, no necesariamente acorde con las circunstancias o restricciones reales. Ocasionalmente no se puede delimitar de antemano con exactitud cuntos pacientes que
darn en el estudio. Eso ocurre, por ejemplo, si en lugar de precisar el nmero de
individuos que quedarn incluidos, lo que se fija es un lapso durante el cual se
irn incorporando pacientes al ensayo. Puesto que es conveniente que cuando
se haga el anlisis, los grupos tengan tamaos similares entre s, una manera de
ayudar a conseguirlo consiste en asignar los pacientes del modo siguiente: imaginemos que se trata de k tratamientos y que en determinado momento se han
asignado m1, m2, , mk sujetos respectivamente.
k
mi
m ; es decir con probabilidad variable, ms concretamente, menor
Pi =
k 1
cuanto mayor sea el nmero de sujetos ya asignados a dicho grupo hasta ese momento. De ese modo, la asignacin va prosperando equilibradamente. El programa de asignacin aleatoria a tratamientos que se incluye dentro de SIGESMU
(vase la Seccin 11.5.4), contempla esta posibilidad.
1
Bibliografa
Hullev SB. Cunimings SR. Designing clinical research: An epidemiological approach.
Baltimore: Williams and Wilkins. 1488.
Diez AV. Bringing context back into epidemiology: variables and fallacies in multilevel
analysis. American Journal of Public Health 1998; 88: 216-222.
Evans RG. Morris LB, Marmor TR. Why are some people healthy and others not? The
determinants of health of populations. New York: Aldine de Gruyter, 1994.
Feinstein AR. Horwitz RI. On choosing the control group in case-control studies. Journal of Chronic Diseases 1983: 36: 3 11-313.
Gail MH. Williams XX. Byar DP et al. How many controls? Journal of Chronic Diseases 1976; 29: 723-731.
Garca FM. Factores de riesgo: una nada inocente ambigedad en el corazn de la medicina actual. Atencin Primaria 1999: 22: 585-595.
250
Gray A, Kramer G. Causality inference in observational vs. experimental studies. American Journal of Epidemiolology 1988; 127: 885-892.
Greenland S. Randomization, statistics and causal inference. Epidemiology 1990: 1:
421-429.
Hill AB. Ambiente y enfermedad: Asociacin o causacin? Boletn de la Oficina Sanitaria Panamericana 1992: 113: 233-242.
Kish L, Frankel M. Inference from complex samples (with discussion). Journal of the
Royal Statistical Society. Series B. 1974: 36: 1-37.
Lasky T, Stolley PD. Selection of cases and controls. Epidemiologic Reviews 1994; 16:
6-17.
Lee EL, Forthofer RN, Lorimor RJ. Analyzing complex survey data. Beverly Hills, CA:
Sage Publications. Inc., 1989.
Lemeschow S, Hosmer Jr DW, Klar J, Lwanga SK. Adecuacy of sample sized in health
studies. Wiley, New York and Community Health 1990; 52:608-611.
Lehtonen R, Pahkinen EJ. Practical methods for design and analysis of complex surveys. Chichester: Wiley. 1995.
Pearce N, Checkoway H. Case-control studies using other diseases as controls: problems
of excluding expesure-related diseases. American Journal of Epidemiology 1988:
727:851-856.
Pidrola G el al. Medicina preventiva y salud pblica. Barcelona. Salvat: 1990.
Robinson WS. Ecological correlations and the behavior of individuals. American Sociological Review 1950; 75: 531-537.
Rothman JK. Modern epidemiology. Boston: Little. Brown and Col., 1986.
Schwartz S. The Fallacy of the ecological fallacy: The potential misuse of a concept and
the consequences. American Journal of Public Health 1984: 84: 819-824.
Silva LC. Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica. Madrid: Daz de Santos, 1997a.
Silva LC. Hacia una epidemiologa revitalizada. Dimensin Humana 1997b; 1: 23-33.
Silva LC, Benavides A. Causalidad e inobservancia de la premisa de precedencia temporal. Revue Methodological (en prensa), 1999.
Skinner CJ, Holt D, Smith TMF. Analysis of complex surveys. Chichester: Wiley, 1989.
Susser M. The logic in ecological: I. The logic of analysis. American Journal of Public
Health 1994; 84: 825-829.
Susser M. The logic in ecological: II. The logic of design. American Journal of Public
Health 1994; 84: 830-833.
Susser M. Causal thinking in the health science. New York: Oxford University Press,
1973.
Syme L. La investigacin sobre la salud y la enfermedad en la sociedad actual: la necesidad de una epidemiologa ms relevante. Anthropos 1989; 118/119: 39-46.
Wacholder S, McLaughlin JK. Silverman DT y col. Selection of controls in case-control
studies. American Journal of Epidemiology 1992; 7J5: 1019-1050.
Wilkinson RG. Unhealthy societies: The afflictions of inequality. London: Rutledge.
1996.
Wolter KM. An introduction to variance estimation. New York: Springer-Verlag, 1985.
11
Recursos computacionales
para el tratamiento de datos
muestrales
En este captulo se pasa revista a las ms importantes aplicaciones informticas disponibles que se relacionan con los procesos de seleccin de muestras
en poblaciones finitas y con la estimacin de parmetros y el manejo de problemas inferenciales en ese contexto. La informacin aqu contenida corre el riesgo
evidente de envejecer rpidamente, habida cuenta de la vertiginosa renovacin
de recursos computacionales de que disfrutamos (y que padecemos) desde hace
ya varios aos.
Siempre he defendido el punto de vista segn el cual el dominio de los recursos informticos debe adquirirse de manera esencialmente autodidacta y, en
particular, mediante el proceso de hurgar individualmente dentro de los programas para comprenderlos. Por lo general es recomendable prescindir de cursos
y con bastante frecuencia resulta posible desentenderse, incluso, de manuales detallados (Silva, 1997). Por esa razn, el contenido subsiguiente se circunscribe
casi enteramente1 a resear los recursos disponibles sin explicar en detalle cmo
explotarlos.
252
253
E
E
M
T
P D A
L E P
E
A
O
S
NO
Simple aleatorio
Sistemtico
Aleatorio estratificado
Estratificado polietpico
Monoetpico
Bietpico
Multietpico
En rigor, en cualquiera de los tres casos podran haberse introducido modificaciones que los hubieran
convertido en procedimientos no equiprobabilsticos. Por ejemplo, se podra realizar un muestreo por conglomerados monoetpico tomando las UPE con probabilidad proporcional a sus tamaos, o un muestreo directo de
unidades de anlisis que. por ejemplo, forzara la presencia de algunas de ellas y continuara con la aplicacin de
un MSA sobre el resto. S i n embargo, tal y como los hemos estudiado, en los tres casos se trata de diseos
equiprobabilsticos.
254
.
2
Este recurso, si bien compensa los desequilibrios que afectan a la muestra en materia de representatividad, no soluciona el hecho de que el mtodo estadstico
maneja los datos como si fueran independientes, cuando es bien sabido que la estructura de los diseos complejos introduce dependencias, a veces fuertes, entre
los individuos de la muestra3. Por esa razn se han desarrollado sistemas informticos de estadstica que contemplan cabalmente esa eventual complejidad de
los diseos, como se resea en la siguiente seccin.
Ms concretamente, los sujetos de un mismo conglomerado se parecen, tpicamente, ms entre s que los
que proceden de conglomerados diferentes.
4
En el momento que este libro vea la luz. probablemente ya est disponible la versin de EPIINFO para
Windows (EPI2000). El tratamiento que all se da al tema que nos ocupa, no es muy diferente del que aqu se
explica en cuestiones de fondo. El usuario hallar, sin embargo, diversas diferencias de forma o de procedimiento. Por ejemplo, la nueva versin incluye la posibilidad de trabajar con ficheros de EXCEL y ACESS.
255
cuando ste no conoce los recursos que se le ofrecen, en EPIINFO stas se han
reducido a lo verdaderamente esencial. Adems, en lugar de pedir frecuentemente al usuario que opte entre varias alternativas, EPINFO (especialmente
en sus mdulos STATCALC y ANLISIS) suele proceder sin ms a hacer los
procesamientos esenciales, de manera que el usuario luego escoge los resultados
que considere relevantes o procedentes a los efectos de su estudio.
A partir de la Versin 6.0, EPIINFO incorpor el mdulo CSAMPLE, cuyo
propsito exclusivo es el cmputo de estimaciones puntuales y por intervalos
de algunos parmetros en diseos mustrales complejos.
El programa parte de que toda la informacin necesaria se halla en una base de
datos que contiene tantos registros como individuos tenga la muestra. En dicha
base, adems de las variables sustantivas de inters para cada sujeto, tales como
pudieran ser edad, talla, nmero de hijos, etc., se incluyen, cuando procede, los
tres campos necesarios a los efectos de que CSAMPLE identifique la posicin
de dicha unidad dentro del diseo muestral empleado (estrato al que pertenece,
conglomerado en que se halla y ponderacin que le corresponde).
Cuando se invoca el programa, se presenta un cuadro de dilogo que solicita la
identificacin de un fichero con extensin REC (el formato de los ficheros con que
opera EPIINFO y que se crean en otro de sus mdulos5) que es el que ha de contener
la informacin muestral (con un nmero de records o registros igual al tamao muestral, como ya se dijo). Una vez cargado ese fichero, se presenta la siguiente pantalla:
Naturalmente. EPIINFO cuenta con posibilidades de importacin que permiten traducir al formato
REC los ficheros originalmente confeccionados en otros sistemas, tales como hojas electrnicas o bases de datos.
256
A travs del llenado de los cuatro primeros campos presentes en esta pantalla (Main, Strata, PSU y Weight) se informa a CSAMPLE cul es la variable con
que se va a operar (en el primero) y cul el diseo muestral que se us (en los
otros tres).
El sistema exige que en el campo Main se consigne la variable del fichero cuya media o distribucin ser objeto de estimacin. Los campos Strata (estratos),
PSU6 (unidades de primera etapa) y Weight (ponderaciones) son opcionales: su
funcin se reduce a informar a CSAMPLE del diseo muestral que se aplic y del
cual se obtuvo la muestra cuyos resultados se hallan en el fichero de trabajo.
La regla fundamental para completar esta tarea es la siguiente: si uno de esos
campos se deja en blanco, significa que el elemento correspondiente no ha intervenido en el diseo. As, dejando el campo Strata en blanco se estara indicando que en el diseo no se ha empleado estratificacin: si no se llena PSU, ello
significa que no se han empleado etapas en el proceso de seleccin y, finalmente, dejar el campo Weight sin rellenar, es el modo de comunicar que el mtodo
muestral aplicado es equiprobabilstico.
As, una vez que se mencione una variable en Main, si se dejaran las otras tres
en blanco, el programa entiende que se trata de una muestra simple aleatoria. Pero cuando cualquiera de estas tres circunstancias se haya producido (estratificacin, conglomeracin o ausencia de equiprobabilidad), hay que ocupar los espacios correspondientes con los nombres de aquellos campos de la base de datos
que contengan la informacin que corresponda.
Resumiendo, si el diseo no es MSA, entonces el modo en que se indica a
CSAMPLE de qu diseo se trata es, como ya se expuso, muy simple: basta llenar
los campos Strata, PSU y Weight segn proceda. Para captar cuan sencillo es este
proceso, remitmosnos a la Tabla 1 1 . 1 . Strata y PSU indican a qu celda de dicha tabla pertenece el diseo muestral empleado. Weight (si procede) se llena solamente
cuando el diseo no es equiprobabilstico: en tal caso, ha de colocarse aquel campo
de la base que contiene para cada sujeto el inverso de su probabilidad de seleccin.
Por ejemplo, si la muestra se ha obtenido mediante maestreo aleatorio estratificado con asignacin proporcional, entonces los campos PSU y Weight deben
quedar vacos, ya que el diseo no implic uso de conglomerados y es equiprobabilstico, pero se colocar en Strata el campo de la base que designa a qu
estrato pertenece cada individuo. Si la muestra fuese estratificada, pero no hubiese sido seleccionada con asignacin proporcional, sino con otro tipo de asignacin muestral en los estratos, entonces el carcter no equiprobabilstico de la
muestra se debe informar explcitamente poniendo en Weight el nombre del campo donde se han ubicado las ponderaciones que compensen dicha falta de
equiprobabilidad.
6
257
283
Obs
Percent
SE %
LCL %
UCL %
20.657
1.094
18512
22.802
Obs
Percent
SE %
LCL %
UCL %
1.087
79.343
1.094
77.138
81.488
258
Percent da la estimacin puntual de cada porcentaje; SE % es el error estndar de esta estimacin (raz cuadrada de la varianza); LCL es la sigla que
identifica el lmite inferior de confianza (lower confidence limit) y UCL el superior (upper confidence limit). Si se dejaron las tres condiciones en blanco, entonces en la salida aparecern las siguientes tres lneas:
Sampling WeightsNone
Primary Sampling UnitsNone
StratificationNone
por conducto de las cuales se indica que el diseo empleado es MSA en este
caso.
Debe notarse que, en el caso de la orden Jabes, los resultados de CSAMPLE
se expresan en forma de porcentajes. Para computar los lmites de confianza, el
programa siempre trabaja con confiabilidad del 95% y por tanto procede, cualquiera sea el mtodo de muestreo, restando de, y sumando a la estimacin puntual
el valor e = (1,96) se(p). En este caso, por ejemplo, el error con que se estima el
porcentaje de sujetos para los que la variable tiene cdigo 1 es: (1,96) (1,094) =
= 2,14, que a su vez coincide con 22,802 20,657 y con 20,657 18.512.
Por otra parte, mediante la orden Tables, CSAMPLE procede a la estimacin
de los porcentajes (y sus intervalos) que correspondan a todas las categoras
que existan (dos en el caso de una variable dicotmica, como en el ejemplo).
Si en Main se pone una variable cuantitativa como la EDAD y se indica la orden Means, entonces se obtiene un resultado como el siguiente:
Analysis of EDAD
Total
Obs
Mean
Std Error
Confidence
Lower
Limits
Upper
1.370
64,092
0,593
62,930
65,254
259
Ob
667
Mean
44,844
Std Error
0,493
Confidence
Lower
43,878
Limits
Upper
45,810
703
82,354
1,375
81,619
83,089
1.370
64,092
0,593
62,930
65,254
37,510
0,620
38,724
36,296
Total
Difference
Podra tener ms de dos categoras, aunque se ha elegido el caso dicotmico para la ilustracin.
260
VARDI
0
1
Obs
Percent
Percent
SE %
LCL %
UCL %
Deff.
Total
569
98
667
52,346
85,307
1,371
82,620
87,995
1,001
34,629
14,693
1,371
12,005
17,380
1,001
48,686
100,000
Obs
Percent
Percent
SE %
LCL %
UCL %
Deff.
518
185
703
47,654
73,684
1,661
70,428
76,941
1,001
65,37 1
26,3 16
1,661
23,059
29,572
1,001
51,314
100,000
1,087
100,000
79,343
1,094
77,198
81,488
1,001
283
1,370
100,000
20,657
1,094
18,512
22,802
1,001
Total
Obs
Percent
Percent
SE %
LCL %
LICL %
Deff.
100,000
Como se ve, aparecen los porcentajes por filas (horizontalmente) y por columnas (verticalmente) H y V respectivamente, aunque el intervalo de confianza slo aparece para las filas. En este caso (Tabla 2.2) tambin se obtienen
tres estimaciones de inters para los epidemilogos (odds ratio, riesgo relativo y
diferencia de riesgos) y sus respectivos intervalos de confianza, como se muestra a continuacin:
261
(OR)
(RR)
RR = (Risk of VARDI = 0 if R = 0)
Risk Difference
95 % Conf. Limits
(RD)
RD = (Risk of VARDI = 0 if R = 0)
2,074
(1,58; 2,72)
1,158
(1,10; 1,22)
/ (Risk of VARDI = 0 if R = 1)
11,623 %
(7,40; 15,85)
- (Risk of VARDI = 0 if R = 1)
computado teniendo en cuenta los diseos verdaderos. Por ltimo, en las salidas que se producen cuando se da la orden Tables, aparece el valor de Deff. Se
trata de una estimacin de la magnitud del valor del efecto de diseo explicado
detalladamente en la Seccin 6.3.
Se trata de una aplicacin comercial desarrollada en el Research Triangle Institute que provee facilidades para estimar un buen nmero de parmetros tales
como medias, porcentajes, razones, cuantiles y odds ratios, as como para aplicar mtodos de regresin (lineal, logstica y hazards) y de tablas de contingencia.
(Barnwell, Bieler y Shan, 19%)
2. PC-CARP
PC-Carp es la versin para PC del programa SUPER CARP, uno de los pioneros en este campo, desarrollado y comercializado por la Universidad de Iowa.
Permite computar errores para medias, porcentajes, cuarteles, razones, diferencias de razones, as como para realizar pruebas de hiptesis sobre tablas de
contingencia (Fuller et al., 1989).
262
3. CENVAR
Segn se describe en Megill (1997), el paquete CENVAR (Census Variance
Calculation System) es una parte de IMPS (Integrated Microcomputer Procesing
System) desarrollado por el Bur del Censo de Estados Unidos. De hecho es una
derivacin de PC-CARP, al cual procura superar en materia de tablas de salida.
4. WESVARPC
Segn describen en el manual para la Versin 2.1 Brick, Broene, James y
Severyn se (1997), WesVar PC es un paquete para computar estimaciones puntuales y estimaciones replicadas de las varianzas a partir de datos obtenidos de
muestras complejas. Se trata de una aplicacin implementada sobre Windows
que trabaja con tcnicas de muestras replicadas como las descritas en la Seccin 9.1. Una valoracin de la versin 3 (Wesvar Complex Samples) puede encontrarse en Nixon (1998); a sta se ha aadido la posibilidad de estimar curvas
de regresin lineal y logstica.
5. STATA
STATA es una de las grandes aplicaciones informticas que presuntamente
cumple de manera cabal con el propsito que nos ocupa, adems de realizar todas las tareas de los grandes sistemas para aplicaciones estadsticas. Se trata de
un sistema programable desarrollado por una corporacin (Stata Co.) con una
amplsima gama de prestaciones. La validez de los algoritmos en que se basan
las prestaciones que ofrece STATA para el caso de diseos complejos se ha prestado, sin embargo, a cierta suspicacia informal en medios especializados, y en mi
opinin merece un examen valorativo profundo del que an se carece.
6. VPLX
Este sistema ha sido diseado por el Bur del Censo de Estados Unidos y emplea replicaciones y estimaciones tipo jackknife. El sistema WESVAR PC arriba mencionado tiene, a mi juicio, una interfaz mquina-usuario ms amigable.
7. CLUSTERS
Nacido del proyecto World Fertility Survey. CLUSTERS se limita, como
CSAMPLE, a computar errores para medias y proporciones en subclases, aunque opera en un ambiente de hoja electrnica.
8. SAS
Este es el otro gran paquete de aplicaciones estadsticas de propsito general
que incluye procedimientos de anlisis acordes a mtodos complejos de muestreo
(en la versin 8), Anthony, Watts y Stokes (1999) dan cuenta de un mdulo pa-
263
ra la seleccin de muestreo de diversos tipos, otro para estimar medias y porcentajes y un tercero para anlisis de regresin lineal.
El sistema fue programado utilizando el lenguaje de 32 bits Delphi 3.0 para Windows 95 98.
264
265
Nivel socioeconmico:
Valor entero entre 1 y 4: 1 para los de ms bajo nivel y 4 a los que poseyeran
mejor nivel socioeconmico. As se representa a una variable sinttica supuestamente conformada a partir de cierta informacin y de un algoritmo validado de
asignacin en una de las 4 categoras.
266
Edad:
Valor entero entre 0 y 100, expresado en aos.
Nmero de caries:
Nmero entero entre 0 y 8, que identifica para cada sujeto el nmero de piezas dentales afectadas por caries.
Necesidad de atencin estomatolgica:
Variable dicotmica, cuyos valores posibles son: 0 si el sujeto no requiere
atencin estomatolgica, y 1 en caso contrario.
La base de datos constituida, denominada POBLADO.DBF, e incluida en el
CD que se adjunta, es compatible con dBase; en ella cada sujeto ocupa un artculo. Grficamente, la estructura de la poblacin creada se ha representado en
la Figura 11.2.
Como resultado de la aplicacin de un conjunto de reglas probabilsticas aplicadas para simular la poblacin, se obtuvo una base de 2.393 viviendas (distribuidas por zonas y distritos), y dentro de ellas se simularon 9.234 sujetos. Este
componente sirve como entrenamiento para la seleccin de muestras por medio
de los seis diseos incluidos en el mdulo de seleccin, ya que todos ellos han si-
267
do incluidos como posibilidad para que el usuario elija aqul con el que quiere
trabajar con vistas a la simulacin. Las seis tablas siguientes dan una semblanza
de los rasgos de esta poblacin artificial.
Como puede observarse en la Tabla 11.1, la distribucin de sujetos segn grupos de edad tuvo predominio de los grupos de edad de entre 20 y 60 aos.
El porcentaje de sujetos segn ZONA y NSE, as como las medias y varianzas del NSE, se presentan en la Tabla 11.2; la media del NSE aumenta desde la
zona 1 a la 4, con varianzas similares entre las zonas, siempre menores que la variabilidad total (indicando que las zonas son internamente homogneas en materia de nivel econmico-social).
El comportamiento de la media de caries por persona y el porcentaje de personas con caries segn zonas se aprecia en la Tabla 11.3.
Tabla 11.1. Distribucin de los sujetos por grupo de edad
SUJETOS
GRUPO EDAD
%
NO
0-9
10-19
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
772
911
1.486
1.547
1.534
1.498
555
450
256
225
8,4
9,9
16,1
16,8
16,6
16,2
6,0
4,9
2,8
2,4
TOTAL
9.234
100,0
1
2
3
4
TOTAL
49.5
37,7
14,9
9.7
29,4
28,7
14,8
13,0
13,5
19,8
30,7
30,8
S2
1.792
2.098
2.949
3.141
0.890
1,120
1,138
0,964
2.419
1.332
7,6
13,8
39,5
46,5
268
ZONA
tasa (%)
1
2
3
4
30,1
29.0
19.3
16,3
0,744
0,675
0,375
0,343
TOTAL
0,561
tasa (%)
Promedio de CARIES
S2
38.6
1.014
2.292
27,5
19,3
9.7
0,613
0,371
0,135
1.306
0,727
0,193
0,561
1.311
3
4
TOTAL
tasa (%)
39,8
2
3
4
37,6
25,5
23,2
TOTAL
32.7
Atendiendo a la presencia de caries segn nivel socio econmico, encontramos diferencias acusadas entre las medias, con varianzas notablemente alejadas
entre s (Tabla 11.4).
Finalmente, los porcentajes de sujetos con necesidad de atencin estomatolgica segn zonas y segn NSE se recogen respectivamente en las Tablas 11.5 y 11.6.
269
tasa (%)
49.1
2
3
4
37.1
27.0
13.7
TOTAL
32,7
270
271
probabilidad de inclusin en las listas con menor tamao (vase Seccin 10.6).
Tal recurso se aplica con el fin de conseguir que en cualquier punto de este proceso los listados hasta ese momento conformados sean bsicamente de igual tamao. La utilidad de actuar de tal modo se deriva de que, ocasionalmente, en
lugar de fijar de antemano un nmero de unidades por grupo, se fija un lapso durante el cual se estarn acopiando casos para el estudio; en tal situacin no se sabe cuntos sujetos habr finalmente, y el proceso de asignacin quedar truncado cuando se alcance la fecha lmite. Tambin puede ser que se desee hacer
cortes parciales a lo largo del estudio. Al seguir este mtodo de asignacin quedar esencialmente garantizado que los tamaos de los grupos en ocasin de dichos cortes sean aproximadamente iguales.
Cabe sealar que las listas formadas pueden guardarse en ficheros de texto y
por tanto, en su momento, podran imprimirse para trabajar con ellas en terreno.
Bibliografa
Anthony A, Watts D, Stokes M. SAS procedures for analysis of sample survey The
Survey Statistician 41: 10-13, 1999
Barnwell BG, Bieler GS, Shah BV. SUDAAN Technical Report: The MULTILOG Procedure, Release 6.6, Research Triangle Institute. Research Triangle Park, North Caroline, 1996.
Brick, JM, Broene P, James P, Severynse J. A User's Guide to WesVar PC. Rockville,
MD; Westat, Inc., 1997.
272
Fuller, WA, Kennedy W, Schnell D, Sullivan G, Partk HJ. PC CARP. Ames, IA: Statistical Laboratory, Iowa State University. 1989.
Kish L. Questions and answers, Paris: IASS, 1995.
Lwanga SK, Lemeshow S. Sample size determination in health studies: A practical manual. Ginebra: Organizacin Mundial de la Salud, 1991.
Megill DJ. CENVAR software for tabulating samplig errors. The Survey Statistician
1997; 37: 11-14.
Nixon M. WesVar complex samples software. The Survey Statistician 1998; 39:8-11.
Silva LC. Muestreo para la investigacin en ciencias de la salud. Madrid: Daz de Santos, 1993.
Silva LC. Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada crtica. Madrid: Daz de Santos, 1997.
Surez R. Sistema General de Simulacin y Seleccin de Muestras (SIGESMU). Tesis
de Especialista en Bioestadstica. La Habana: Escuela Nacional de Salud Pblica.
1998.
Vzquez E et al. EPIDAT: Anlisis epidemiolgico de datos tabulados. Santiago de
Compostela: Xunta de Galicia. 1997.
12
Reflexiones crticas sobre
la prctica muestral
contempornea
En este captulo se abordan crticamente diversos aspectos de inters prctico,
tales como errores que se cometen con relativa frecuencia por parte de muestristas
inexpertos, que son vctimas de tradiciones discutibles, o que actan segn criterios directamente improcedentes. Simultneamente, se desarrollan algunas ideas y procedimientos pendientes de examen cuya discusin suele esquivarse. Finalmente, se hacen diversas precisiones conceptuales que tienen repercusin
considerable a los efectos de aplicar o de comprender las tcnicas mustrales.
274
275
jo un juicio moral negativo hacia un mdico que consuma estas sustancias), resulta altamente dudosa la representatividad de una muestra autoconfigurada por
sus integrantes.
Ntese que el propio ttulo del trabajo anuncia algo anmalo: lo que ocurra en
una muestra, como all se consigna (en este caso, la magnitud o forma del consumo), no es algo que interese. Lo que puede interesar es esta informacin para
la poblacin de mdicos. La muestra es un intermediario metodolgico, ajeno
por completo al propsito de un estudio, cualquiera que sea ste. Si hay motivos para pensar que la muestra representa adecuadamente a cierta poblacin, entonces es posible que los resultados obtenidos de aqulla puedan extenderse o
extrapolarse a esta ltima. En tal caso, es posible que se haya alcanzado aquel
propsito; vale decir que nunca interesa un resultado muestral per se, sino slo
el que se deriva de ese proceso de extrapolacin.
En el caso que nos ocupa, resulta muy difcil establecer a qu poblacin podra representar la muestra que nos ocupa: A los que no tienen nada que ocultar? A quienes no tienen aprensin en admitir sus hbitos? A los que aprovechan la ocasin para dar pistas falsas sobre sus hbitos reales? Considero
imposible responder estas preguntas. Sin embargo, de lo que no quedan dudas es
de que la muestra representa exclusivamente a los mdicos que acceden a contestar, subgrupo cuya diferencia con el de los que optan por no responder es algo
ms que verosmil. Se trata a todas luces de una muestra llamada a arrojar estimaciones sesgadas.
Por otra parte, aun cuando la totalidad de los mdicos hubiese respondido, habra motivos para sospechar la presencia de un sesgo: es bien conocido que
cuando se formula una pregunta embarazosa, los resultados suelen arrojar
subestimaciones (o sobrestimaciones, segn sea lo que se investigue). El trabajo,
por poner un ejemplo, comunica que el porcentaje de mdicos que consumen
cocana (ya fuese habitual o espordicamente) es nulo; ni hombres ni mujeres de
la muestra admiten tal consumo. Podr razonablemente confiarse en que, si la
realidad fuese otra, habra quedado fielmente reflejada en las respuestas?
La endeblez fundamental que tiene este artculo no radica, sin embargo, en
que una parte de la muestra no responda; esto suele ocurrir siempre en una u otra
medida y existe un vasto campo terico al respecto (vase Seccin 12.4). Si bien
la tasa de no respuesta es ciertamente desmedida, el defecto fundamental del
trabajo estriba en que no se dice (ni es posible decirlo) a qu poblacin cabe atribuir los resultados hallados1.
Supongamos ahora que se quiere estimar la prevalencia de insuficiencia renal
crnica (IRC) en una ciudad pero que, por razones prcticas, la muestra se ele1
El artculo analizado es bastante antiguo. Actualmente es difcil hallar trabajos publicados que padezcan de
tan notables insuficiencias, pues los editores (y los autores) han alcanzado niveles de versacin, experiencia y
rigor mucho mayores que los que tenan entonces.
276
gir de un listado incompleto, que contiene solamente al 90% de la poblacin actual (por ejemplo, slo incluye a los que poseen telfono, ya que, supongamos,
el marco muestral ser la gua telefnica; en tal caso, la muestra resultante comprender solamente a poseedores de telfono).
La pregunta clave, que evidentemente no es de ndole estadstica, sera: hay
motivos para sospechar que la posesin o no de telfono se relaciona de algn
modo con el hecho de padecer IRC? Si la respuesta fuera positiva, no habr perdn. Pero si, por mucho que salubristas y nefrlogos especulen tericamente,
no aparece ningn vnculo, ni directo ni indirecto, entre ambos rasgos, yo me inclino por la absolucin metodolgica. Me baso en que, de todos modos, el conocimiento que se obtenga por va muestral habr de ser provisional, perfectible
y sujeto a refinamiento. Por otra parte, si somos flexibles con la extrapolacin en
el tiempo, por qu no serlos con la extrapolacin en el espacio? En ltima instancia, se trata de ser flexible en el marco de un talante riguroso, que es mucho
mejor que ser rgido sobre un substrato conceptualmente borroso, como ocurre
con tanta frecuencia y en tantos contextos sin que ello genere tanto escndalo.
En mi opinin, tal flexibilidad tiene fundamentos claros. Supongamos que
se estudian las dimensiones antropomtricas de los nios de una ciudad a travs
de una muestra equiprobabilstica de hogares de una ciudad. Supongamos asimismo que el proceso discurri sin ningn tipo de anomalas: el marco muestral
estaba actualizado, todos los hogares fueron elegidos segn lo planeado y los nios de la muestra fueron medidos en su totalidad. Hecho el estudio, se obtiene
un amplio conjunto de estimaciones, entre ellas, pongamos por caso, que la talla media de un varn de 5 aos es igual a 104 cm y que el percentil 5 de la distribucin de esa variable es 96 cm. Tras un examen estadstico adecuado de los
datos, los auxlogos deciden recomendar que aquellos nios de esa edad cuya talla est por debajo de 96 deben ser examinados por personal especializado. Esta
pauta sale publicada y se difunde mucho despus de realizadas las mediciones
(con buena suerte, un ao ms tarde).
Ahora bien, para qu poblacin son vlidas las estimaciones que, tras la mencionada elaboracin, dan lugar a tal recomendacin? Obviamente, no para los nios que tenan 5 aos en el momento de la encuesta. Dichos nios ni siquiera existen ya como tales, pues en el momento de la publicacin ellos tendrn por lo
menos seis aos. Por otra parte, la pauta en cuestin seguir vigente durante mucho tiempo (quizs un decenio). De modo que la extrapolacin verdadera se extiende formalmente a una poblacin enteramente diferente a la que fue muestreada. A nadie se le ocurrira sugerir la repeticin del estudio dos meses despus, del
mismo modo que difcilmente se aceptara que sus resultados guarden vigencia durante los 40 aos siguientes, ya que es bien conocido que existe una tendencia secular que obliga a actualizar cada cierto tiempo las curvas de crecimiento y desarrollo. La decisin al respecto est condenada a ser informal y, en cualquier caso,
ajena a una aplicacin rgida de la regla enunciada al comienzo de esta seccin.
277
sta es la realidad de todos los das: las medidas que se adopten tras un estudio de satisfaccin de pacientes hospitalizados se aplicarn a una poblacin diferente de la que se estudi, el nivel de educacin sexual que se atribuye a una
poblacin de adolescentes se conoce a travs de una muestra de una poblacin
de adolescentes que ahora son adultos, y as sucesivamente.
Muy posiblemente, los nios que hoy tienen 5 aos, los hospitalizados y los
adolescentes actuales no difieran en lo esencial de los que en su momento fueron
estudiados; por eso la inferencia que realmente se hace verosmilmente ser legtima aunque no responda al esquema formal de que slo se extrapola a la poblacin muestreada. Sin embargo, el hecho de que lo sea (y hasta cundo seguir sindolo) escapa a la estadstica y al muestreo para caer en la rbita del
sentido comn y la reflexin crtica.
En sntesis, el nivel de extrapolacin adecuado suele ser un problema en que
participan por igual las tcnicas formales de muestreo y los recursos informales
centrados en el sentido comn.
278
279
Por cierto, si esto ocurre o no con esas dos magnitudes depende de los tamaos de los grupos comparados.
280
Los propios creadores de las pruebas de hiptesis, Egon Pearson y Jerzy Neyman, advirtieron con toda transparencia que stas no fuesen utilizadas a la manera en que, en definitiva, se hace a diario: como instrumentos para evaluar la
validez o la falsedad de una ley cientfica. En sus propias palabras (Neyman y
Pearson, 1933), advertan:
Ninguna prueba basada en la teora de probabilidad puede por s misma generar ndices vlidos sobre la verdad o la falsedad de una hiptesis. Las pruebas de hiptesis deben ser miradas desde otra perspectiva. Siguiendo la regla
de aceptar o rechazar una hiptesis no estamos diciendo nada definitivo sobre
si la hiptesis es o no verdadera... Lo que se puede demostrar es que si somos
consecuentes con esa regla, a la larga, la rechazaremos cuando sea cierta no
ms, digamos, que una de cada 100 veces: adicionalmente, la rechazaremos
con alta frecuencia cuando sea falsa.
Nota: Cabe intercalar que la problemtica que estamos considerando (procede o no hacer inferencias cuando se trabaja con una poblacin y no con una muestra formal?) queda intrnsecamente despejada cuando el anlisis se desarrolla en el marco bayesiano en lugar de en el entorno
frecuentista habitual.
281
El enfoque bayesiano asume como algo natural el hecho de que los parmetros de inters (en
este caso, la diferencia entre las tasas tericas de infeccin) son variables sujetas a las leyes probabilsticas.
La tarea que esta teora se traza, justamente, es la de caracterizar nuestro conocimiento del
problema por conducto de dichas leyes. Ms concretamente, ofrece herramientas para combinar
lo que en un momento dado consideramos que constituye una presentacin atinada de nuestro
conocimiento del problema con datos empricamente obtenidos como los del mencionado estudio hospitalario para producir una nueva representacin probabilstica actualizada.
La teora bayesiana desborda claramente el nivel y el contexto natural del presente libro, pero consideramos oportuno consignar al menos su existencia, as como sealar la pujanza con que
ha venido revitalizndose en los ltimos aos, tal y como queda fundamentado en trabajos como
Davidoff (1999), Goodman (1999) y Silva (1999).
282
283
En la Seccin 11.1 ya se haba subrayado que deban reconocerse dos situaciones bien diferenciadas:
a) aquella en que se necesita determinar el tamao muestral necesario para
realizar estimaciones,
b) cuando se est planificando un estudio analtico, sea de tipo observacional
o experimental, y lo que se quiere es determinar los tamaos mustrales correspondientes a los grupos involucrados en una futura prueba de hiptesis.
La primera de ellas corresponde, en esencia, a los llamados estudios descriptivos. Por ejemplo, diagnsticos de salud, caracterizaciones epidemiolgicas, o
estudios de prevalencia que requieren de estimaciones paramtricas (fundamentalmente de porcentajes, razones, medias, varianzas y totales poblacionales), as
como estudios que, tambin con afn descriptivo, requieren de la estimacin de
otros parmetros como coeficientes de correlacin o de regresin.
En la segunda situacin, el anlisis no se cie a conocer la magnitud de algo,
sino que exige en algn punto hacer uso de la comparacin entre parmetros
correspondientes a distintas subpoblaciones. En efecto, en el entorno analtico, el
examen estadstico de los datos suele conducir a maniobras tales como la comparacin estadstica de porcentajes o medias, o a la evaluacin de la significacin de coeficientes de concordancia o de correlacin3.
Ambos procesos demandan el manejo de muestras, y es natural que, trtese
de lo uno o de lo otro, se desee operar con la menor cantidad posible de unidades
de anlisis con el fin de economizar recursos. El problema consiste en hallar
ese nmero mnimo de unidades con el cual puedan resolverse eficientemente tales tareas.
Ntese que, de hecho, en este ltimo caso se trata tambin de comparar; lo que se compara es el coeficiente (por ejemplo, de correlacin) con el nmero cero.
284
[12.1]
Z12 / 2 P(100 P)
E02
[12.2]
n=
donde
n0 =
en la cual Z1/2 representa al percentil (1 /2) 100 de la distribucin normal estandarizada (por ejemplo, si = 0.05, entonces Z1/2 = Z0,975 = 1.96). N es el tamao poblacional y E0 es el mximo error absoluto que el investigador est dispuesto a admitir al estimar P.
Se plantea que usualmente se puede tener una idea aproximada del valor de
P a partir de un estudio piloto, o de una investigacin similar realizada anteriormente4.
Imaginemos que se trata de una poblacin de N = 2.800 sujetos hospitalizados sobre la que se realiza un estudio de satisfaccin. Admitamos, como es
usual, que se trabajar con una confiabilidad del 95% ( = 0,05) y que un E0 = 3%
se considera aceptable. Finalmente, consideraremos P= 86%, idea aproximada que se ha obtenido, por ejemplo, a partir de un estudio anterior. As las cosas, la aplicacin de [12.1] y [12.2] arroja que n = 434.
Ahora bien, sta es la solucin que se da al caso en que se usa el muestreo
simple aleatorio. Si el diseo muestral es otro, en particular si se trata de un
muestreo en etapas (que es el que se utiliza por lo menos 90 de cada 100 veces
en la prctica), el error que regularmente se comete al estimar P es mayor que
el que corresponde al MSA (supuesto, desde luego, que se est usando el mismo tamao de muestra). Dicho de otro modo: con muestreo por conglomerados, para alcanzar el grado de precisin prefijado, es necesario seleccionar una
muestra de tamao mayor que el que demanda el MSA.
La sugerencia que se da entonces es, simplemente, multiplicar el tamao
surgido de [12.1] por un nmero mayor que la unidad: el llamado efecto de diseo, usualmente denotado como deff (vase Seccin 8.6).
4
Otra variante consiste en poner directamente P 50; de ella ya nos ocuparemos especficamente en la Seccin 12.8.2.
285
[12.3]
286
idea aproximada del valor de P, estamos condenados a conocer slo una idea
aproximada del valor del n necesario. Si aquella aproximacin fuera mala (muy
errnea), as ser el tamao muestral, algo altamente inconveniente. Pero si, en
cambio, estuviramos verdaderamente persuadidos de que la pre-estimacin de
P fuera muy cercana a su verdadero valor, entonces la situacin sera directamente absurda, porque en tal caso no hara falta hacer tal estimacin, y. consiguientemente, mucho menos necesario sera el cmputo de n.
Examinemos ahora los otros elementos de la frmula. En el ejemplo, verosmilmente podra contarse, como supusimos antes, con un estudio previo que hubiese arrojado un 86% de hospitalizados que estuvieran satisfechos; pero tambin
es posible que una pequea encuesta piloto hubiese producido una pre-estimacin
de, por ejemplo, 80%. Cmo escoger entre ambas alternativas? Qu argumentos puede esgrimir alguien que defienda una de las dos para rechazar la otra?
Por otra parte, se supone que hay un error mximo que se puede aceptar;
sin embargo, no siempre resulta fcil la identificacin a priori de esa cota. Esta
tarea exige del investigador que piense en unos trminos para los que con frecuencia no est preparado. Pero esto no es atribuible al mtodo, sino a sus usuarios. Lo verdaderamente crucial es comprender que, ineludiblemente, se trata de
una decisin esencialmente subjetiva. Volvamos al ejemplo: qu error ha de
considerarse suficientemente pequeo como para que resulte admisible? No
parece existir rbitro alguno que determine sin margen para el debate si un error
de un 3% (como habamos supuesto en el ejemplo) es admisible: o si, para que
lo sea, ste no debe exceder, por ejemplo, el 2% de pacientes satisfechos. Algo
muy similar ocurre con la confiabilidad 1 . Tomar 0.95%?, o 0.99%, como sugieren otros con no menos argumentos?
A todo este monto de subjetividad hay que aadir la que se deriva de que los
diseos son, por lo general, totalmente diferentes al muestreo simple aleatorio. Como bien sabemos, los errores mustrales en el caso de muestras complejas no slo dependen del tamao total de la muestra, sino tambin de las asignaciones muestrales a los estratos y de los tamaos de muestra en las etapas intermedias (es decir,
del nmero de conglomerados en cada etapa y de los tamaos mustrales dentro
de los que se elijan) cuando, como ocurre casi siempre, se usa muestreo polietpico.
Este hecho, cuando no se pasa por alto, se resuelve a travs del coeficiente expansor del tamao muestral: deff. Aqu comparece un acto de prestidigitacin numrica: el libro destinado a dar soluciones tcnicamente fundamentadas se limita (como
consignamos en la Seccin 12.3.1) a comunicar que el deff pudiera estimarse como igual a 2. Naturalmente, lo esperable es que el investigador que acuda al libro
para buscar su receta, proceda siempre de ese modo: multiplicar por dos el tamao
muestral obtenido bajo el supuesto de MSA. En el recurso de ayuda que aparece
en el mdulo STATCALC de EPIINFO, en concordancia con el talante ms realista
que caracteriza a este sistema, se sugiere elegir un deff entre 1.5 y 2,0, variante
ms flexible, pero no menos subjetiva (e, incluso, arbitraria).
287
Uno se pregunta: para qu tantas frmulas previas y tantas tablas, si a la postre hay que multiplicar el nmero tan arduamente obtenido por dos, un factor
balbuceado a partir de una especulacin cuya pertinencia es totalmente discutible? Se podra argir que el efecto de diseo suele ser de esa magnitud. Pero
es falso: basta echar una ojeada a algunos estudios que calculan los deff para
corroborar que este nmero cambia radicalmente de una encuesta a otra, de un
diseo muestral a otro y que, incluso dentro de la misma encuesta y del mismo
diseo, suele modificarse notablemente en dependencia del parmetro elegido.
Por ejemplo, en un estudio ad hoc relacionado con encuestas demogrficas y de
salud, Verma y Le (1996) comunican valores de deff que van desde 1 hasta 9,
con una media de 2,25. Lo cierto es que con el deff' se hace la contribucin final
a la de por s abultada coleccin de elementos subjetivos que inexorablemente
intervienen en este proceso.
A modo de ilustracin del efecto que puede tener tal carga subjetiva, computemos los tamaos de muestra que se obtendran con dos juegos de posibles decisiones adoptables en el marco de las alternativas que hemos venido considerando. La Tabla 12.1 recoge los resultados correspondientes a dichos dos juegos
(ambos igualmente razonables y, ciertamente, escasamente discordantes), computados usando [12.1], [12.21 y [12.3J.
Tabla 12.1. Tamaos muestrales necesarios para estimar cierta prevalencia
segn dos juegos de decisiones iniciales
Alternativa 1
Alternativa 2
2.800
86 %
3%
2.800
80 %
2%
Confiabilidad (1)
Efecto de diseo (deff)
0,95
0,99
1,5
2,0
Tamao muestral
651
2.726
Pudiera pensarse que la diferencia entre una confianza del 95% y una del 99% no es pequea: pero debe recordarse que, si se decidiera trabajar con confiabilidad mayor del 95%, segn el ritual consagrado, se escoger 99%, nunca 96,7% o 98,3%. De modo que si alguien siente que 95% no es un nmero suficientemente grande,
habr de admitir que 99% es cualitativamente el nmero ms cercano a 95% por el que se optara.
288
Es muy probable que no existan parmetros ms importantes: los problemas suelen exigir enfoques integrados, que superen su desconcatenacin metafsica en parcelas.
289
De hecho, muchas sesudas formulaciones para determinar tamaos de muestra pasan totalmente por alto que ms tarde se harn estimaciones dentro de
subconjuntos para los que las muestras necesariamente se reducen, en algunos
casos muy notablemente.
En sntesis, lo que se quiere subrayar en este punto es que, al computar un
tamao muestral empleando frmulas, normalmente se acta pensando en estimaciones para la poblacin completa; pero el error mximo que se est dispuesto a cometer y que se usa con el fin de realizar aquella determinacin, resulta mucho menor que el que verdaderamente se comete en el fragor de la
tabulacin verdadera. Ejemplos reales de este fenmeno se exponen detalladamente en las Secciones 12.6 y 12.8.3.
E) El costo de los procesos es casi siempre mucho ms determinante
que cualquier consideracin terica
Realizar el anlisis del tamao muestral sin pensar en trminos de eficiencia
carece de sentido: si no hubiese limitaciones de recursos, en muchos casos no
se planteara siquiera el uso de muestras, sino que se investigara ntegramente la
poblacin. Las disponibilidades de tiempo, personal y presupuesto deben ocupar
(y de hecho ocupan) un lugar determinante en las decisiones, aunque muchas veces la influencia de esta limitante se ejerza de manera implcita o solapada.
Debe decirse que existen numerosos esfuerzos tericos para hacer intervenir
los aspectos econmicos en la solucin del problema del tamao de muestra. Por
ejemplo, a lo largo del libro de Hansen, Hurwitz y Madow (1953) el lector hallar no pocos desarrollos formales acerca de cmo determinar valores ptimos
para el nmero de conglomerados, o para las asignaciones de tamaos a estratos,
en diseos que involucran ese tipo de decisiones. Se trata, sin embargo, de frmulas en general extremadamente abigarradas cuya aplicacin exige especificaciones cuantitativas previas sobre costos y variabilidades que slo pueden conocerse de antemano mediante el procedimiento de... inventarlas.
Consideremos el siguiente ejemplo, en que se quiere realizar un muestreo
trietpico de escolares para estimar una media poblacional. Segn el diseo,
primero se eligen m escuelas, en cada una de ellas se tomarn como promedio
n grupos o aulas y, finalmente, dentro de cada uno de estos ltimos, se elegir un
nmero medio de q alumnos. Los nmeros m, n y q que maximizan la precisin
para un presupuesto total disponible igual a C unidades monetarias, segn Hansen, Hurwitz y Madow (1953) (concretamente, vase Captulo 19. Seccin 19 de
dicho libro) se determinan a travs de [12.4].
q=
Ww
Wb2 Ww2 / Q
C2
C3
1 Ww
n=
q B
C2
C3
C
m=
C1 + C2 n + C3 nq
[12.4]
290
8
Ntese que en esta formulacin no aparecen la confiabilidad ni el error mximo admisible porque el criterio usado no se basa en poner una cota al intervalo de confianza, sino en optimizar la precisin dentro de una
restriccin presupuestaria.
9
Por ejemplo, Hsieh (1989) ha hallado una solucin para el tamao muestral exigido al aplicar una regresin
logstica en el caso del MSA. No creo que exista para el caso de la regresin logstica bajo muestreo en etapas,
aunque no sera demasiado difcil construir una propuesta.
291
Debe consignarse que este fenmeno se produce con menos intensidad que en los estudios descriptivos. En
algunos estudios (sobre todo en el ambiente clnico) puede ocurrir que se realice una nica prueba de significacin.
292
e) Aunque se estime el tamao de muestra necesario para probar la diferencia de dos porcentajes o evaluar la diferencia entre un odds ratio y la unidad, no es infrecuente que en el mismo estudio se hagan pruebas para contrastar, adems, otras hiptesis no consideradas en el proceso de elegir el
tamao, relacionadas por ejemplo con coeficientes de correlacin de un
modelo de regresin mltiple o logstico.
f) Una frmula como [10.1] se deduce a partir del supuesto de que se ha
realizado un MSA, circunstancia casi desconocida en la epidemiologa y
la investigacin clnica actuales.
293
bierto por los especialistas, independientemente del enfoque personal; un nmero que puede determinarse tcnicamente por aquellos elegidos, capaces de
desentraar complejas formulaciones. Muchos metodlogos profesionales pueden poner (y, de hecho, lo hacen) en un serio aprieto a modestos investigadores
exigindoles que justifiquen formalmente el tamao muestral que han elegido
por analoga con lo que han visto en la literatura, o porque es el que permiten sus
recursos. Irnica circunstancia, pues me temo que la inmensa mayora de los
propios inquisidores se veran en similar dificultad si, en lugar de dedicarse a pedir respuestas, tuvieran que producirlas11. En tal caso, quizs acudiran a la aplicacin de frmulas que, como se ha explicado e ilustrado, contienen una carga
de subjetividad acaso mayor que la de quien elige el tamao muestral guiado por
su propio y saludable sentido comn.
11
No en balde el notable socilogo norteamericano Wright ( 1 9 6 1 ) lanzaba varias dcadas atrs la exhorta-
294
295
X=
N1 X 1 + N 2 X 2
N
Supongamos que se toma una MSA de n unidades, pero que de ellas slo responden n 1 . Estas n 1 respuestas no seran ms que las que corresponden a los integrantes de una muestra (que puede considerarse simple aleatoria) de la subpoblacin de respondedores. Llamemos x a dicha media muestral, que es, como
sabemos, un estimador insesgado de X 1 . Si recordamos que el sesgo de x es igual
a E( x X ), puede corroborarse, tras un poco de lgebra, que dicho sesgo es
igual a:
N
E ( x ) X = X1 X = 2 ( X1 X 2 )
N
[12.5]
N2
como de
N
296
la correspondiente a X 1 X 2 , ya que es igual al producto de ambas. Si no hubiera diferencia entre X 1 , y X 2 , el sesgo sera nulo independientemente de cun grande sea N2; otro tanto ocurrira si se cumpliera N2 = 0, sea cual sea la diferencia
entre las medias por este concepto. Esto quiere decir que si los que no respondieran tuvieran el mismo valor medio de X que los que s lo hiciesen (es decir,
si no difieren unos de otros), no habra sesgo alguno (el problema se reducira a
la prdida de tamao muestral) y, naturalmente, que si todos respondieran, tampoco se producira sesgo alguno.
Ambos resultados son muy intuitivos. Pero [12.5] nos dice algo ms: si hay diferencias entre las medias para las dos subpoblaciones, entonces la magnitud del
sesgo se incrementa en la medida que crezca la fraccin de sujetos que no responden. Lamentablemente, es frecuente que X 1 , sea diferente de X 2 ; cuando esto ocurre, se dice que la respuesta a X es selectiva. Eaton et al. (1992), por ejemplo, han
comunicado que en sus estudios de salud mental la no respuesta es significativamente mayor en personas con desrdenes psiquitricos que en el resto.
Consecuentemente con [12.5], para disminuir el sesgo se puede hacer una de
dos cosas (o ambas): tratar de disminuir la fraccin
N1
, y tratar de conocer la
N
(1.050)(80) + (450)(50)
= 71 y no 80, como arroja1.500
ra la muestra.
297
racional y cuidadosamente la apariencia del encuestador, as como pautarle escrupulosamente el modo en que habr de conducirse, y el empleo de incentivos
materiales o monetarios para el encuestado.
El aviso a travs de una carta (recurso que no siempre procede) parece tener
un efecto significativo en el aumento de las tasas de respuesta (vanse los estudios experimentales de Dillman, Gallegos y Frey, 1976).
Los incentivos (monetarios y materiales) con vistas a incrementar las tasas de
respuesta en las encuestas han sido empleados desde hace muchos aos. Se han
aplicado dos modalidades fundamentales: la entrega a priori del incentivo, y el
ofrecimiento de ste en un primer contacto. Tal recurso ha sido objeto de estudio
cuidadoso, tanto para el caso de encuestas cara a cara como en el de las telefnicas. Erdos (1970) discute detalladamente el tema para el caso de las encuestas postales, y un examen reciente puede hallarse en Church (1993), quien
realiz un meta-anlisis que involucr cerca de 40 estudios y concluy que los
estudios en que se aplicaba un prepago conseguan incrementar como promedio
las respuestas en casi 20 puntos de porcentaje. Cuando se daban regalos (gifts)
en lugar de dinero, el efecto era mucho menor. Resulta interesante que, segn este trabajo, el monto del pago monetario era ciertamente reducido (menos de
1,50 dlares como promedio). Singer et al. (1996), en un estudio similar de 30
artculos destinados a evaluar el efecto de tales incentivos, corroboraron en lo
esencial aquellos resultados.
Un problema que se ha sealado en relacin con los incentivos materiales no
monetarios radica en que stos pueden ser ms atractivos para ciertos subgrupos poblacionales que para otros, con la posible generacin de sesgos (Levy y
Lemeshow, 1980).
298
mar grupos de sujetos similares y computar las medias dentro de cada grupo,
de modo que el valor faltante se suple con la media de la variable para el subgrupo al que pertenece.
Otra alternativa similar, pero aun ms refinada, consiste en atribuir valores resultantes de un anlisis de regresin. La curva de regresin se estima empleando los records (sujetos) para los que se cuente con las respuestas a todas las variables involucradas en el proceso; es decir, usando tanto la variable que ser
objeto de imputacin como las variables que, por considerarse que tienen algn
valor predictivo, se hayan incorporado en dicho modelo.
Si el valor que ha de imputarse es un nmero (edad, salario, hemoglobina,
etc.), puede emplearse la regresin mltiple; si fuese una condicin categorial
(grupo religioso, status laboral, condicin de hipertenso o no) podra emplearse
regresin logstica y hacer la atribucin o imputacin de la categora desconocida con acuerdo a la probabilidad que el modelo de regresin estimado otorgue a
cada categora de respuesta para el sujeto en cuestin.
Otro procedimiento empleado es el mtodo conocido como cold deck. En
esencia se trata de tomar los valores de un sujeto parecido al que tiene valores perdidos y atriburselos. Se pueden hallar detalles de ste y otros procedimientos (como el hot deck method) en Allen (1990), Verboon y Nordholt (1997)
y en Nordholt (1998). Finalmente, cabe mencionar tcnicas ms especializadas,
como la imputacin mltiple, descrita en Rubin (1996) y Fay (1996).
xc = wx1 + (1 w) x2
con varianza igual a:
Var ( xc ) =
(1 f )[ S 2 + (h 1)WS 22 ]
n
299
n
n
, W es la fraccin poblacional de no respondedores, h = 2 , S 2 es la
N
m
2
varianza de X para toda la poblacin y S 2 la de los no respondedores. Ocasionalmente se asume que S2 = S22 , con lo cual se simplifica el proceso. Ntese
que si se cumple esta condicin y, adems, h = 1 (es decir, que todos los no respondedores son submuestrados), entonces las frmulas de xc , y Var( xc ) se reducen
a las conocidas para MSA.
donde f =
300
putar tanto el valor medio x como la desviacin estndar .v de los datos12. Finalmente, se resta de, y se suma a x la magnitud 2s. De este modo, el intervalo determinado por los extremos x 2s y x + 2s es considerado un recorrido de normalidad para la dimensin fisiolgica de inters. Este procedimiento
corresponde al propsito (explcito o no) de fijar dos lmites (L1 y L2) para los
que se cumplan tres condiciones:
A) que por debajo de L1 quede el 2.5%/c de los valores.
B) que entre L1 y L2 se halle el 95% de los datos,
C) que por encima de L2 se ubique el restante 2,5% de las observaciones.
Si la distribucin de la variable X es gausiana o normal, entonces los lmites
L1 = x 2s y L2 = x + 2s satisfarn aproximadamente las tres condiciones.
Esta estrategia nace de una propuesta formulada por Ronald Fisher con el
afn de identificar los valores ms comunes (los que se ubican en el intervalo
[L1, L2]) y los poco comunes: el 5% que se reparte entre los extremos. Buscar
valores L1 y L2 que cumplan A), B) y C) es una decisin totalmente arbitraria,
vinculada a una propiedad de la distribucin normal, pero sin verdadero asiento
en consideraciones relacionadas con el problema visto desde una perspectiva clnica o fisiolgica.
Pueden mencionarse cuatro objeciones a este procedimiento:
a) Con todo derecho uno puede preguntarse: por qu elegir el 5% para identificar a aquellos individuos que estn fuera de la normalidad? Por qu
no 4%, o 6,2%?
b) Por qu exigir una relacin de simetra? Si se decidi que 95 iba a ser
el porcentaje de normales, cul es la razn para repartir el 5% restante en partes iguales?
c) En cualquier caso, los lmites x 2s y x + 2s cumplen las tres condiciones
solo si la distribucin de X es normal. Este rasgo no tiene que regir necesariamente, como qued demostrado hace ms de medio siglo por Rietz
(1927), en ocasin de su medular trabajo sobre estadstica matemtica.
Es bien conocido que variables tales como el calcio srico o las protenas
totales siguen distribuciones muy alejadas de la gausiana. De hecho, autores como Elveback, Guillier y Keating (1970) afirman que la mayora de
las variables fisiolgicas distan de ajustarse a una distribucin normal.
d) Finalmente, puede ocurrir que 2s sea mayor que x ; en ese caso L1 sera inferior a cero, situacin que, salvo excepciones, carecera de todo sentido,
ya que usualmente los parmetros fisiolgicos no pueden alcanzar valores
negativos.
12
301
302
En este punto cabe recordar que las acciones como las que estamos discutiendo nunca son un fin en s mismo, sino que se llevan adelante para algo concreto. Imaginemos que, empleando estos lmites obtenidos a travs de una muestra de personas con su sistema respiratorio en ptimas condiciones con acuerdo
al ms restrictivo de los criterios, se valora al conjunto de trabajadores de una
planta textil en el contexto de un tamizaje organizado por autoridades de salud
ocupacional. Con ese rasero, quizs todos resulten ser anormales! La muestra
elegida para fijar el criterio diagnstico sera tan normal que lo ms comn y
corriente resultara ser anormal.
Es imposible escapar de este laberinto mientras no se delimite para qu se est
procurando encontrar los susodichos valores de referencia. Si lo que se quiere,
por ejemplo, es conocerlos con la finalidad de establecer una regulacin de
carcter jurdico, segn la cual un trabajador que presente valores anmalos resulte beneficiado con un perodo de descanso o algn tipo de compensacin,
entonces la muestra apropiada sera la de la poblacin general, fumadores incluidos. Si lo que se estudia es el efecto de cierta exposicin ocupacional a travs de la desviacin atribuible a los contaminantes ambientales cuando se comparen dichos valores con los de referencia, entonces la muestra ms adecuada
sera la de los montaeses no fumadores. Si los valores en cuestin se desean como elementos orientativos para la prctica clnica regular, entonces es menester
que razonemos en trminos relativos a la circunstancias socio-histricas del espacio o enclave en que dicha prctica ha de ejercerse, tal y como se fundamenta
en la seccin siguiente.
Los defectos mentales se discuten a menudo, al menos por el hombre comn, como si hubiera dos grupos, el de aquellos con un desarrollo mental
normal y el de los que no lo tienen: dos clases distinguibles sin ambigedad,
del modo en que pueden distinguirse las plantas de los insectos.
Y tras un anlisis de las consecuencias y los riesgos implcitos en tal enfoque,
seala que la lnea divisoria entre la normalidad y la anormalidad es muy frecuentemente arbitraria (aunque no caprichosa, que es algo bien diferente) y que,
cuando se establece, ello se debe solamente a un imperativo operacional, ya que
sin tal demarcacin sera imposible adoptar ciertas decisiones, por ejemplo, en el
mbito jurdico. En relacin con esto, reflexiona:
303
304
305
Confieso que el texto me resulta crptico: no consigo entender cabalmente casi nada a partir de la palabra entrevistas. Y sospecho fuertemente que a los lectores regulares de El Pas les pasar lo mismo, aunque quizs muchos de ellos
queden ms bien anonadados con la cientificidad que, a juzgar por su apariencia, destila tal enunciado.
Si se quiere comprender esa informacin, es menester tener las respuestas para las siguientes preguntas: Qu debe entenderse por fijar entrevistas? A qu
le llaman regin? Qu es hbitat en este contexto? Qu significa ampliacin de cuotas de sexo y edad? Demasiadas dudas para un texto de 30 palabras. Uno se pregunta: qu sentido tiene brindar una informacin tcnica
que resulta ininteligible, incluso para especialistas?
Es curioso, adems, constatar que un texto tan alejado de la transparencia
deseable para una comunicacin que, aun siendo de prensa, supuestamente tiene carcter cientfico, parece constituir una cmoda horma general. Por ejemplo,
cinco aos despus, y a raz de las elecciones primarias del Partido Socialista
Obrero Espaol, El Pas (1998b) publicaba la siguiente ficha tcnica en el
contexto de una de sus encuestas habituales:
306
Unos meses despus, ante otra de las encuestas a cargo de esa empresa, me
interes, naturalmente, ver qu solucin se haba hallado para no incurrir en el
error tan rotunda y honestamente admitido. Me asombr encontrar que los tcnicos de Demoscopia, impertrritos, incluan el siguiente texto: la encuesta
tiene un nivel de confianza del 95,5% y un margen de error de 2,9 para el total
de la muestra (El Pas, 1998a). Es evidente que hay algo, nebuloso e inquietante en todo esto.
En ocasin de aquel intercambio de opiniones, tuve a bien sugerir una solucin que me pareca (y me sigue pareciendo) ptima para resolver con toda
transparencia el conflicto (la cuadratura del crculo a que aluda el defensor
del lector): publicar la encuesta con una ficha informativa muy general, que slo abarque aquello realmente comprensible por cualquiera por tanto exenta de
todo tecnicismo, y que comunique que todo aquel lector interesado en los
detalles tcnicos se dirija al sitio WEB de la empresa responsable del estudio.
Naturalmente, si se colocara dicho informe tcnico detallado en el sitio WEB
307
Partido
Popular
%
Izquierda
Unida
%
Felipe Gonzlez
55
25
28
7
13
3
94
3
1
1
34
29
12
0
Lamentablemente, los autores no comunican cuntos entrevistados correspondieron a cada una de estas tres agrupaciones pero; teniendo en cuenta datos
conocidos, cabe esperar que, por ejemplo, los simpatizantes de Izquierda Unida
hayan sido alrededor de 40, ya que esa fuerza agrupaba en aquel momento algo
menos del 10% del electorado. De modo que, para estimar el porcentaje de in13
Ntese que la suma de porcentajes dentro del Partido Socialista asciende absurdamente a 106%. No es una
errata de este libro: as aparece en el informe de Demoscopia.
308
e=2
(6)(94)
1,7
799
Este nmero es, en efecto, menor que 3,5 en trminos absolutos; sin embargo, la calidad de la estimacin es inferior, pues 1.7 representa el 28% de p = 6
mientras que 3.5 es solamente el 7% de p = 50.
e
En general, el error relativo, definido como er = , se incrementa en la medip
da que p disminuye, de manera que es absurdo afirmar que el caso en que la calidad de la estimacin es ms desfavorable corresponde a preguntas para las cuales la estimacin es p = 50.
309
Sin embargo, lo verdaderamente grave es que para casi ninguna de las estimaciones de la encuesta se trabaja con ese tamao de muestra, sino con nmeros
muchsimo menores.
Tomando p = 25% (dato registrado en la tabla como estimacin de la credibilidad de Gonzlez dentro de Izquierda Unida), n = 40 y Z1/2 = 2, la estimacin del error mximo en que se ha incurrido es e = 13.9%.
Por otra parte, sta sera la estimacin del error si se hubiera tratado de un
muestreo simple aleatorio. Siendo un diseo complejo (como se colige del texto
incluido en la ficha tcnica), entonces el error verdadero ha de ser mayor. Concretamente, si llamamos ec al error correspondiente al verdadero diseo, se tendr (Kish, 1965): ec = e deff .
Supongamos que al diseo muestral que nos ocupa le corresponde un deff
igual a 2,25 (el valor medio que se produce en una encuesta comn y corriente,
como consignamos en la Seccin 12.3.2). Es un supuesto conservador, ya que
por la naturaleza del problema (obvia tendencia a la homogeneidad de opiniones
y valores dentro de una misma localidad o regin), cabra esperar un deff mayor. Pero considermoslo as para prosperar sin riesgo de que se considere que
nuestro anlisis es extremista. En tal caso, el error estimado, una vez hecho el
ajuste, resulta igual a:
ec = 13,9 2, 25 = 20,3
Quiere esto decir que el error cometido al estimar ese porcentaje de 25% podra razonablemente ser como mnimo de 20%. Se trata de un error enorme: casi igual a la magnitud de lo que se estima (concretamente, las cuatro quintas partes). Es tan poco informativo como si cuando me preguntaran mi edad, yo dijera
que sta se halla entre 9 y 80 aos. Algo similar ocurre con la mayora de las
estimaciones de la encuesta.
310
311
PP
PSOE
ABC
El Pas
El Mundo
La Vanguardia
El Peridico
176- 184
170- 178
170- 179
160- 170
165 - 175
117- 125
118- 128
113- 123
135- 145
119- 129
Resultados reales
156
141
PP
PSOE
Diferencia
ABC
El Pas
El Mundo
La Vanguardia
El Peridico
44,1
42.4
42,3
41,0
41.2
32.5
33.4
31.4
35,0
33.5
11.6
9,0
10.9
6,0
7.7
Resultados reales
38,8
37,5
1,3
Por si fuera poca coincidencia, debe notarse que si bien las encuestas mencionadas en la Tabla 12.2 se realizaron das antes de la votacin, tres estudios
realizados a pie de urna, una vez consumada la votacin, arrojaron resultados
parecidos, como se aprecia en la Tabla 12.4.
Tabla 12.4. Resultados de las encuestas a pie de urna sobre el nmero
de diputados alcanzados por el PP y el PSOE
en las elecciones generales de 1996
Empresa
PP
PSOE
Tabula
Demoscopia
Sigma 2
164 - 174
160 - 171
164 - 174
120 - 132
125 - 135
124 - 131
Resultados reales
156
141
312
313
314
En el texto de una normativa para realizar una auditora de la gestin hospitalaria, en la que se fijan los pasos que debe dar el equipo auditor, puede aparecer una orientacin del tipo siguiente:
SELECCIONAR EN CADA HOSPITAL UNA MUESTRA ALEATORIA FORMADA POR EL
15% DE LAS HISTORIAS CLNICAS INICIADAS DURANTE EL LTIMO TRIMESTRE Y, SI
EL PORCENTAJE DE HISTORIAS QUE TIENEN DEFICIENTEMENTE RELLENADO LA
CAUSA DE INGRESO EXCEDE EL 25%, ENTONCES...
315
Cuando el investigador no renga la menor idea acerca de cul puede ser el valor de P. sustituya 50 en su lugar y siempre obtendr suficientes observaciones,
cualquiera que sea el verdadero valor de P.
316
n0 =
E02
E02
y que cualquier otro valor de P producir un n0, menor. Por ejemplo, para P = 30
(al igual que para P = 70), tendramos: n
8.400
.
E02
317
10
30
50
70
90
95
100
P(100P)
475
900
2.100
2.500
2.100
900
475
La Tabla 12.5.1 muestra el comportamiento de P(100 P) para varios valores escogidos de en su recorrido posible de 0 a 100.
Como se aprecia, P(100 P) disminuye en la medida que P se aleja de 50,
cualquiera sea la direccin en que ello ocurra.
Ahora bien, n0 es una funcin de P, pero tambin lo es de E0, de modo que la
relacin entre P y n0 slo es vlida siempre que se suponga que E0 est fijado
de antemano. Sin embargo, y aqu radica la esencia de todo: el mximo error
absoluto E0 que se puede admitir a la hora de estimar no puede establecerse
razonablemente sin tener en cuenta la de P; no se podr fijar hasta que no se
tenga una idea de dicha magnitud.
Imaginemos que se ha estimado la prevalencia de cierta dolencia especfica,
y que se sabe que el error que se ha cometido al hacerlo no excede al 1%. Es
grande o pequeo ese error? Se ha conseguido estimar razonablemente bien el
valor de esa prevalencia P? Si el lector medita durante unos segundos y procura
responder a estas dos preguntas, no demorar en comprender que es imposible
darles respuesta hasta tanto no conozca cul es el valor de P. Esto es as, del mismo modo que no sabemos si resulta caro un objeto que se vende al precio de 100
dlares mientras no sepamos de qu objeto se trata.
En efecto, si se trata, por ejemplo, de la prevalencia de cncer pulmonar (un nmero prximo a 1 en 20.000), un error de 1% sera descomunal; pero, si se trata de
la prevalencia de hipertensin arterial (que podra ser un 15% quizs), tal error sera
perfectamente admisible, pues con seguridad es menor que la dcima parte de P.
Dicho de otro modo: cuando se va a calcular n0 en el caso que analizamos,
hay que preestimar P, no slo porque lo demanda explcitamente la frmula
[12.2], sino porque sin ese conocimiento es imposible decidir el valor del error
absoluto que tambin aparece en ella.
Imaginemos que le pedimos al seor Lemeshow que calcule el tamao muestral para un estudio que realizaremos en una poblacin de 2.000 habitantes. Para
simplificar las cosas le diremos que se trata de un MSA y que queremos estimar
un solo parmetro: el porcentaje de sujetos que poseen cierto componente sanguneo denominado farsemia. Se trata de un componente que est presente (o
no) en la sangre de cada individuo; pero no tenemos ni la menor idea de cul
ser el porcentaje de sujetos que posee ese rasgo. l conoce N, puede decidir, por
ejemplo, que en 0,05, y suponer que P = 50 (no porque crea que se es el valor, sino para tener la muestra mayor posible); ahora bien, qu valor coloca-
318
n0 =
100 P
P
Er2
(1,96) 2
[12.7]
100 P
.
P
Ya no aparece el fastidioso E0 en la frmula. Pero es fcil ver que, a diferencia de
De modo que para Er = 0,1, al aplicar [ 12.7] se tiene que n0 = 384
319
320
321
cionando elementos de un listado hasta que se alcance dicho tamao. Es evidente que, actuando de ese modo, se pierde el control probabilstico del proceso;
por decirlo rpido, las unidades que se hallan al final del listado tienen probabilidad mnima o nula de ser elegidas, en tanto que las primeras saldrn con certeza total o casi total.
Bibliografa
ABC. La macroencuesta del CIS encargada por el Gobierno reconoce al PP una ventaja de ms de 50 escaos. Madrid: 14 de febrero, pg 22. 1996.
Alien JD, An overview of imputation procedures. (Staff Report SMB90-06. US Department of Agriculture, Washington, DC), 1990.
Argimn JM, Jimnez J. Mtodos de investigacin: Aplicados a la atencin primaria de
salud. Barcelona: Doyma, 1991.
Arredondo C, Coronado A, de la Fuente M, Luengo S. Actitudes sociales ante el SIDA
entre el colectivo de trabajadores de la salud. Madrid: Ministerio de Sanidad y Consumo. 1990.
Azorn F. Snchez-Crespo JL. Mtodos y aplicaciones del maestreo. Madrid: Alianza.
1986.
Campbell MJ. Sample sized in audit. British Medical Journal 1993: 307: 735-736.
Carvajal A. Garca JL, Holgado E, Velasco A. Consumo de drogas en una muestra de
mdicos rurales de Valladolid. Medicina Clnica 1984; 83: 444-446.
Church AH. Estimating the effect of incentives on mail survey response rates: A metaanalysis. Public Opinion Quarterly 1993; 57:62-79.
Davidoff F (ed). Standing Statistics Right Side Up. Annals of Internal Medicine
1999:730:1019-1021.
322
Dillman D, Gallegos JG, Frey J. Reducing refusal rates for telephone interviews. Public Opinin Quarterly 1976; 40: 6678.
Domenech JM. Mtodos estadsticos en ciencias de la salud. Unidad Didctica 5. Barcelona: Grficas Signo. 1990.
Eaton WW, Anthony JC, Tepper S. et al. Psychopathology and attrition in the catchment
area study. American Journal of Epidemiology 1992: 135: 1051-1059.
El Pas. Triunfo claro de Amar en el primer debate. 26 de mayo, pgina 15. Madrid.
1993.
El Pas. Barmetro de otoo. 30 de noviembre, pgina 18. Madrid, 1997.
El Pas. Los votantes del PSOE creen que ganar Almunia. 27 de marzo, pgina 15. Madrid. 1998a.
El Pas. Borrell aventajara a Aznar por 10 puntos. 26 de abril, pgina 19, Madrid.
1998b.
Elveback LR, Guillier CL, Keating FR. Health, normality, and the ghost of Gauss. Journal of the American Medical Association 1970: 211: 69-75.
Erdos P. Profesional mail surveys. New York: McGraw Hill. 1970.
Fay, RE. Alternative paradigms for the analysis of imputed survey data. Journal of the
American Statistical Association 1996; 91: 490-498.
Garca C. Almenara P. Determinacin del tamao de muestra en variables cualitativas
en las que se desconoce el valor del parmetro. Medicina Clnica.\999: 112:
797-798.
Gonzlez ME, Ogus JL. Shapiro G. Tepping. BJ. Standards for discussion and presentation of errors in survey and census data. Journal of the American Statistical Association 1975: 70. Number 351. Part II.
Goodman SN. Toward evidence-based medical statistics. 1: The P value fallacy. Annals
of Internal Medicine 1999; 130:995-1004.
Gor F. La verdad de las encuestas. Madrid: El Pas, 4 de enero. 1988.
Hagood MJ. Statistics for sociologists. New York: Reynal and Hitchcock. 1941.
Hansen MH. Hurwitz WN. The problem of nonresponse in sample surveys. Journal of
the American Statistical Association 1946; 41: 516-529.
Hansen MH. Hurwitz WN. Madow WG. Sample survey methods and theory. New York:
Wiley and sons. 1953.
Hsieh FY. Sample size tables for logistic regression. Statistics in Medicine 1989; <N': 795802.
Illich 1. Medical nemesis. Londres: Calder and Boyars. 1975.
Jenicek M. Cleroux R. Epidemiologa. Principios-tcnicas-aplicaciones. Barcelona:
Salvat. 1987.
Kessler RC. Little RJA, Grover RM. Advances in strategies for minimizing and adjusting for survey non response. Epidemiologic Reviews 1995: 17.192-204.
Kish L. Survey sampling. New York: Wiley. 1965.
Kish L. Questions/Answers. From the Survey Statistician 1978-1994. Pars: 1ASS. Vespa-Leyder. 1994.
Lemeshovv S. Hosmer Jr DW, Klar J. Lwanga SK. Adequacy of sample size in health studies. New York: Wiley. 1990.
Levy PS. Lemeshow S. Sampling for health professionals. Belmont: Lifetime learning
Publications, 1980.
323
Lwanga SK, Lemeshow S. Sample size determination in health studies: a user's manual.
Geneva: World Health Organization. 1989.
Marrugat J, Vila J, Pavesi M, Sanz F. Rplica, Cartas al Director. Medicina Clnica
1999; 112:798.
Marrugat J, Vila J. Pavesi M. Supuesto de mxima indeterminacin: error absoluto o
error relativo en el clculo del tamao de la muestra? Gacela Sanitaria 1999; 13:
491-493.
Meja JM, Fajardo A, Gmez A, Cuevas ML, Hernndez H, Garduo J et al. El tamao
de muestra: un enfoque prctico en la investigacin clnica peritrica. Boletn Mdico del Hospital Infantil de Mxico 1995; 52: 381 -391.
Murphy EA. The normal. American Journal of Epidemiology 1973; 98: 403-411.
Neyman J, Pearson E. On the problem of the most efficient tests of statistical hypotheses. Philosophical Trans of the Royal Society of London 1933: A 231: 289-337.
Nordholt ES. Imputation: Methods, Simulation Experiments and Practical Examples. International Statistical Review 1998: 66:157-180.
Riegelman RK. Hirsch RP. Cmo estudiar un estudio y probar una prueba: lectura crtica de la literatura mdica. Publicacin Cientfica N." 53 I. Washington: Organizacin Panamericana de la Salud, 1992.
Rietz HL. Mathematical statistics. Carus Mathematical Monograph N. 3. Mathematical
Association of America. Chicago: Open Court Publishing. 1927.
Rothman JK. Modern Epidemiology. Boston: Little. Brown and Col., 1986.
Rothman JK. Greenland S. Modern Epidemiology (2. a edicin). Philadelphia: Lippincott-Raven, 1998.
Rubin DB. Multiple imputation for nonresponse in surveys. New York: Wiley, 1996.
Rubin DB. Schenker N. Multiple imputation in health-care databases: an overview and
some applications. Statistics in Medicine 1991; 10:585-598.
Seuc AH. Relation between the prevalence of a characteristic and the size of the sample
needed to estimate it. European Journal of Epidemiology 1998; 14: 627-628.
Silva LC. La crisis de las pruebas de hiptesis y la perspectiva bayesiana Memorias del
XI Congreso de la Sociedad Gallega de Estadstica e Investigacin Operativa: Santiago de Compostela, octubre 1999.
Silva LC. Nueva visita al supuesto de mxima indeterminacin y al empleo de errores
absolutos y relativos Gaceta Sanitaria: 2000: 14: 255-257.
Silva LC. Maestreo para la investigacin en ciencias de la salud. Madrid: Daz de Santos, 1993.
Silva LC. Cultura estadstica e investigacin en el campo de la salud: una mirada crtica. Madrid: Daz de Santos. 1997.
Singer E, Gebler N, Raghunathan T, VanHoewyk J, McGonagle K. The effect of Incentives on Response Rates in Face-to-Face, Telephone, and Mixed Mode Surveys. Survey Methodology Program 1996;. Institute for Social Research University of Michigan. N. 045.
Smidt RK, Tortora R. Evaluating the effects of nonresponse and the number of response
levels on servey samples. Statistical Case Studies. En: Peck R, Haugh LD y Goodman. A. Philadelphia: ASA. 1998.
Steeh CG. Trends in nonresponse rates. 1952-1979. Public Opinion Quarterly 1981;
45:40-57.
324
Stouffer SA. Sociology and sampling. En: Bernard LL (Ed). Fields and methods of
sociology. New York: Long and Smith, 1934.
Surez P, Alonso JC. Sobre el supuesto de mxima indeterminacin, el tamao muestral y otras consideraciones sobre muestreo. Gaceta Sanitaria 1999; 13: 243-246.
Verboon P. Nordholt SE. Simulation experiments for hot deck imputation. En Statistical Data Editing. Methods and Techniques, 1997; 2: 22-29. New York/Geneva: United Nations.
Verma V, Le T. An analysis of sampling errors for the demographic and health surveys,
International Statistical Review 1996; 64: 265-294.
Yates F. The influence of Statitical Methods for Research Workers on the development
of the science of statistics. Journal of the American Statistical Association 1951;
46: 32-33.
World Fertility Survey. Manual on sample designs. The Hauge: International Statistical
Institute, 1975.
Wright C. La imaginacin sociolgica. La Habana: Revolucionaria, 1961.
ndice de autores
ABC, 321,310
Allen JD, 321,298
Almeida N, 5, 29
Almenara J, 315, 322
Alonso JC, 315, 324
Altman DG, 26, 29, 30
Anderson RBW, 50, 80
Andrews FM, 38, 45
Anthony A, 262,271
Anthony JC, 322
Aquilino WS, 54, 80
Argimn JM, 315, 321
Arranz M, 62, 82
Arredondo C, 319, 321
Asok C, 2, 31
Avila S, 64, 66, 70, 80
Azorn F, 2, 29, 315, 321
Baker RP, 37, 80, 82
Bar-Hillel M, 112, 123
Barnett ML, 26, 29
Barnwell BG, 261,271
Barreras M, 202, 208
Baum F, 6, 29
Bearwood J, 152, 153
Benavides A, 236, 250
Bennet S, 221,230
Berent J, 190,208
Bieler GS, 261,271
Biemer PP, 82
Bishop GF, 52, 80
Boruch RF, 214, 230
Boudon R, 5, 29
Bradburn N, 36, 53, 71, 83
Deutscher I, 50, 80
Diez AV, 247, 249
Dillman DA, 297, 322
Dodge Y, 123
Domenech JM, 315, 322
Eaton WW, 296, 322
Efron B, 210, 230
Eisenhower D, 48, 80
El Pas, 304, 305, 306, 322
Elveback LR, 300, 322
Erdos P, 297, 322
Erzog AR, 58, 82
Evans RG, 248, 249
Evans SJW, 26, 30
Ezzati TM, 215, 231
Fajardo A, 292, 323
Farias H, 128, 129, 139
Fay RE, 298, 322
Feinstein AR, 245, 249
Feller W, 216, 230
Fienberg SE, 85, 123
Fisher RA, 87, 123
Flacks R, 81
Folsom RE, 215, 231
Fonseca L, 54, 80
Forthofer RNFox JA, 234, 250
Fowler FJ, 35, 36, 47, 54, 58,
78, 80, 81
Frankel M, 210, 230, 234,
250
Frey J, 297, 322
Fuller WA, 261,272
326
NDICE DE AUTORES
IASS, 2, 30
Illich I, 303, 322
Jabine TB, 36, 81
James F, 123
James P, 262, 271
Jenicek M, 315,322
Jessen RJ, 2, 30
Jimnez J, 315,321
Jones EF, 190,208
Kahneman D, 112, 123
Kalton G, 2, 30, 173, 176,
189,208
Keating FR, 300, 322
Keller S, 7, 30
Kennedy W, 272
Kessler RC, 295, 322
Kinsey AC, 70, 81
Kiesler S, 37, 81
Kish L, 2, 30, 91, 107, 121,
123, 128, 139, 162, 176,
186, 188, 192,201,208,
210,220,226,230,263,
272, 282, 309, 322
Klar J, 244, 250, 283, 315, 322
Knuper B, 55, 81,83
Koenig KE, 81
Kramer G, 236, 250
Krotki KJ, 211,230
Lamb CW, 215,230
Lasky T, 244, 250
Le T, 287, 324
Lee EL, 234, 250
Lehmer DH, 122, 123
Lehnen RG, 48, 81
Lehtonen R, 234, 250
Lemeshow S, 2, 30, 244, 250,
252,272,283,297,313,
315,322,323
Lessler JT, 82
Levy PS, 2, 30, 226, 231,297,
313, 322
Likert RA, 42, 81
Linninger CA, 40, 49, 81,
190, 208
327
NDICE DE AUTORES
Salsburg D, 26, 31
Sampford MR, 2, 31
Snchez JL, 2, 29, 315, 321
Snz F, 323
Saris WE, 37, 82
Sarndal CE, 231
Scott PJ, 4 1 , 8 2
Scheaffer RL, 2, 31, 50, 82
Schnell D, 272
Schober MF, 62, 80
Schuman HH, 48, 82
Schwartz S, 246, 250
Schwarz N, 36, 44, 71, 82,
83
Seuc AH, 110, 123,315,323
Severynse J, 262, 271
Shah BV, 261,271
Shamdasani PN, 80, 83
Shapiro G, 313, 322
Siddiqui MK, 190,208
Silva LC, 3,5,23, 25, 3 1 , 5 1 ,
52,56,57,65,70,71,75,
76,77,78,83,88, 110,
123, 128, 129, 139, 165,
176, 194,202,208,210,
215,231,236,238,246,
247,251,263,272,278,
281,282,315,323
Silverman DT, 245, 250
Singer E, 297, 323
Singh MP, 231
Sirken MG, 226, 231
Skinner CJ, 234, 250
Skogan WG, 48, 81
Slonim MR, 2, 31
Smidt RK, 295, 323
Smith TMF, 234, 250
Som RK, 2, 31
Sowey ER, 123
Sproull LS, 37, 81
Steeh CG, 295, 323
Stem EE, 215,230
Stephan FF, 19, 31
Stewart DW, 80, 83
Stolley PD, 244, 250
Stokes M, 262, 271
328
NDICE DE AUTORES
ndice de materias
330
NDICE DE MATERIAS
de muestreo, 313
relativo, 109-111, 113-115,27-28,308,315-320
escala
analgica visual, 41
de Likert, 42, 81
grfica, 45
semntica diferencial, 43-45
estadstica bayesiana, 281
estimacin
de razn, 119-120
mximo verosmil, 25, 216
por intervalos, 23, 27
por pesca y repesca, 216
puntual, 106-109
estimador
de mxima verosimilitud, 25, 216
de razn, 119-121, 160-166, 171,195
insesgado, 90-91, 107-108, 128, 132, 145150, 160-165, 168-169, 196
estratificacin, 141-152, 189-195, 253, 256
estratificacin de unidades de primera etapa
estudio
analtico, 283, 291
ciego, 248
de casos y controles, 244, 291
de cohorte, 236
de epidemiologa analtica, 243
descriptivo, 3-4, 7-8, 23, 283-285
ecolgico, 245-248
experimental, 85, 235-236, 243, 248-249
longitudinal, 242, 294
piloto, 77-78, 113,284
retrospectivo, 77-80, 113-114
transversal, 196,235-242
experimentos, 35-36
extrapolacin, 142,273-281
factor
de correccin, 175
de confusin, 235-237
falacia ecolgica, 246 ficha
tcnica, 304-309 formulacin
del problema, 3 fraccin
fija, 170
de muestreo, 89
GLIM, 252
hiptesis
de causalidad, 3, 236
ms desfavorable, 304-308
historia de vida, 6
homeopata, 118,248,304
horscopo, 304
hot deck method, 298
IASS, 2
imputacin, 297-298, 312
indagacin de mercado, 3
informacin autorrepresentada, 274-275, 281
informantes claves, 6
INTERNET, 20, 307
intervalo
de confianza, 23-27
no informativo, 26, 105
investigacin
cientfica, 36-38
descriptiva, 3-8, 23, 237-240
transversal, 196,235-242
experimental, 85, 235-236, 243, 248-249,
291
jackknife, 209, 262
marco muestral, 9, 33, 156, 191, 273-276, 281
mximo error admisible, 103-105
mediana, 90-92 mtodo
cientfico, 3, 31
cualitativo, 5-6, 48
de seleccin en fases, 128-131
del intervalo fraccional, 128
probabilstico, 8-14
regular de seleccin sistemtica, 126-127
modelos jerrquicos, 248
muestras
interpenetrantes, 209
maestras, 220
no probabilsticas, 15-18
representativas, 19-22
transversales, 235-242
muestreo
aleatorio estratificado, 141-153
bietpico, 166
NDICE DE MATERIAS
331
embarazosas, 37
especficas, 59, 73-74
negativas, 59-60
sensibles, 59, 72-73
premisa de precedencia temporal, 235-236
presentacin de errores mustrales, 313
prevalencia, 25, 196-199, 238-240, 283, 315318
principio de mxima indeterminacin, 123
probabilidad
condicional, 11, 170
de seleccin o de inclusin, 12-15, 169-171,
128-129, 142-143, 107,252-254
problema
de estimacin, 8, 160-161, 234
de muestreo, 8, 33, 106
programa informtico, 251 -271
proyecto de investigacin, 31
pruebas de hiptesis, 25-26, 31, 233-235, 277-280
recorrido de normalidad, 299-300
reencuestas de control, 312
regresin mltiple, 233, 292, 298
representatividad, 7, 18-22, 141, 143, 174, 189,
196, 220, 273-281
respuesta
aleatorizada, 53, 210-215, 231
annima, 215
retrotraduccin, 50
rutas aleatorias, 321
S-PLUS, 252
salud ocupacional, 302
SAS, 252, 262-263
screening, 218
seleccin
en etapas, 156
por cuotas, 17-18
segn criterio de autoridad, 17
sesgos, 16-18, 48, 52, 7 1 , 9 1 , 120, 128, 160,
168, 275,2 95-297
SIGESMU, 113, 119, 249, 263-271, 314
significacin estadstica, 25-27, 277-283, 291
simulacin de muestras, 265-269
sistemas duales de registro, 217
software, 26, 251-271
sondeos polticos y electorales, 304-312
332
NDICE DE MATERIAS
SPSS, 252-253
STATA, 262
STATCALC, 252, 255, 286
subjetividad, 6, 291-293, 985-288
SUDDAN, 261
superuniverso, 277-281
sustitucin mecnica de unidades, 320
SYSTAT, 252
tablas de nmeros aleatorios, 87
tamao muestral, 12-13,94, 98-105, 109-113,
146-147, 151-152, 158-159, 207-208, 243,
251, 282-295, 307-309, 313-317
tamizaje, 218-219, 302
tcnicas
cualitativas, 5-6, 48
de evaluacin rpida, 221
grupales, 6