Documente Academic
Documente Profesional
Documente Cultură
MEDIANTE ENCUESTAS
Fundamentos teóricos y aspectos prácticos
2
PROYECTO EDITORIAL
SÍNTESIS PSICOLOGÍA
DIRECTOR
Juan Mayor
Áreas de publicación
3
4
5
Reservados todos los derechos. Está prohibido, bajo las
sanciones penales y el resarcimiento civil previstos en las
leyes, reproducir, registrar o transmitir esta publicación,
íntegra o parcialmente, por cualquier sistema de
recuperación y por cualquier medio, sea mecánico,
electrónico, magnético, electroóptico, por fotocopia o por
cualquier otro, sin la autorización previa por escrito de
Editorial Síntesis, S. A.
© EDITORIAL SÍNTESIS, S. A.
Vallehermoso, 34 - 28015 Madrid
Teléf.: 91 593 20 98
http://www.sintesis.com
ISBN: 978-84-995866-8-7
6
7
8
Tres españoles, cuatro opiniones
9
RELACIÓN DE AUTORES
10
11
ÍNDICE
INTRODUCCIÓN
12
2.3.3. Propuesta de una definición de encuesta
2.4. Tipos de encuesta
2.4.1. La encuesta personal
2.4.2. La encuesta de correo
2.4.3. La encuesta telefónica
2.4.4. Otros tipos de encuesta
2.4.5. La elección del tipo de encuesta más adecuada en función de sus
ventajas e inconvenientes
2.5. El proceso general de investigación mediante encuestas
13
3.7.2. Varianzas
3.7.3. Modelos de muestreo en el sotfware al uso
3.8. Problemas prácticos
3.8.1. Problemas con la base de datos
3.8.2. Problemas con la ausencia de respuesta
3.8.3. Los encuestadores
3.9. Software para el muestreo: SOTAM
Anexo 1: Tabla de números aleatorios (3.000 dígitos)
Anexo 2: Rutina Basic para la selección de unidades
14
5.9. Medición de estados subjetivos
5.9.1. Tests de ordenación
5.9.2. Tests tipo Likert
5.10. Revisión de las preguntas
5.10.1. Procedimientos subjetivos
5.10.2. Procedimientos empíricos
5.11. Preguntas demográficas
5.12. Orden y disposición de las preguntas en el cuestionario
CAPÍTULO 6: LA ENTREVISTA
Andrés González Gómez, José Luis Padilla García
6.1. Introducción
6.2. La selección de entrevistadores
6.3. El entrenamiento de los entrevistadores
6.3.1. Entrenamiento general
6.3.2. Entrenamiento específico
6.3.3. Materiales y procedimientos de entrenamiento
6.4. Acceso al campo
6.5. La entrevista en sí
6.5.1. Concepto y tipos de entrevista
6.5.2. La realización de la entrevista
6.5.3. La revisión de la entrevista
6.5.4. Supervisión y control
6.5.5. Feed-back
6.6. Guía de la entrevista
15
7.2.6. Ficha de campo
7.2.7. Punto de inicio de ruta
7.2.8. Teléfono de contacto
7.2.9. Cuaderno de notas
Anexo 1: Normas para la aplicación del cuestionario
Anexo 2: Cuestionario
Anexo 3: Hoja de resultados
Anexo 4: Ficha de campo
16
Meléndez
10.1. Introducción
10.2. Errores asociados al muestreo
10.2.1. La no respuesta
10.3. Errores asociados con el cuestionario
10.3.1. Necesidad de hacer estudios piloto
10.4. Errores asociados con la entrevista
10.4.1. Errores asociados a los encuestadores
10.4.2. La importancia en la supervisión
10.4.3. Repaso a la entrevista y cumplimentación correcta de cuestionarios
10.5. Errores asociados con el tratamiento de datos
10.5.1. Errores en la codificación de datos
10.5.2. Errores asociados al registro o grabación de los datos
10.5.3. Errores en la preparación de los datos para el análisis
10.5.4. Imputación de datos a las respuestas perdidas y a las no respuestas
10.6. Conclusión
Bibliografía
17
INTRODUCCIÓN
El libro que posee el lector en sus manos tiene su germen en la colaboración que
hace ya algunos años (allá por el año 1993) empezaron varios de sus autores y que
culmina en un esfuerzo por plasmar en un texto común muchas de las notas,
experiencias y comentarios que se han acumulado desde entonces. Pero es un curso de
formación de encuestadores, que tiene lugar en la Universidad de Almería en marzo de
1997, el momento definitivo para la cristalización del presente trabajo. Con
anterioridad, el mismo grupo de personas, ha elaborado textos (Manzano y otros, 1994)
y ha publicado trabajos relacionados con el mundo de las encuestas (FAJER, 1996;
Manzano, Rojas y Fernández, 1996). Sin lugar a dudas, podemos decir que este grupo
de personas ha disfrutado no sólo en la elaboración del trabajo que se presenta, sino
durante todo el tiempo dedicado al estudio de la técnica de encuesta, dentro y fuera del
contexto académico.
El objetivo que ha guiado este trabajo es recoger, en un volumen, bastante de lo
necesario para poner en marcha una investigación mediante encuestas; por tanto, son
los investigadores sociales en general la población a la que va dirigido el texto. El
subtítulo de la obra indica el carácter teórico y práctico del texto; se ha intentado
conjugar aspectos teóricos como los “modelos de muestreo” con cuestiones totalmente
prácticas como la “selección de un encuestado” utilizando rutas aleatorias. Para ello, el
trabajo se ha estructurado en diez capítulos. Lo abren dos capítulos introductorios, uno
dedicado a la delimitación de metodología, métodos y técnicas de investigación
científica, y otro específicamente centrado en la técnica de encuesta. Un amplio tercer
capítulo expone en qué consiste el muestreo, dónde se desarrollan en el plano teórico
los distintos tipos de muestreos disponibles en esta clase de investigaciones, además de
adaptaciones a situaciones reales. Un cuarto capítulo ofrece la otra cara de la moneda,
es decir, la práctica del muestreo con casos concretos: la selección del encuestado. Le
sigue un capítulo dedicado a la construcción del cuestionario y otro dedicado a la
entrevista (pilares básicos de la investigación mediante encuestas), ambos con un
marcado carácter práctico. El séptimo es un breve capítulo donde se ejemplifica la
operatoria del trabajo de campo y el uso de todos los materiales habituales de este tipo
de investigaciones. Un breve recorrido sobre el tratamiento que sufren los datos hasta
llegar a las puertas de los análisis estadísticos se hace en el capítulo octavo. El noveno se
18
detiene en la labor final de toda investigación: el informe; se trata a nivel teórico y
práctico, donde se ejemplifica de forma detallada cómo mostrar los resultados
procedentes de este tipo de investigaciones. Por último, en un décimo capítulo se trata
brevemente sobre qué aspectos hay que considerar cuando hablamos de la “calidad” de
una investigación mediante encuestas.
Nos gustaría terminar esta introducción agradeciendo a distintas personas, lugares y
cosas lo mucho que de ellas hay en este trabajo (como diría André Mourois).
Las personas son las de siempre, pero no por ello menos valiosas: Carmen, Deli,
Lola, Maribel, Raquel, Raquelita y Toñi, porque aunque no lo manifiesten abiertamente,
están hartas de que les hablemos de encuestas. Quede un agradecimiento a su paciencia
y buen hacer. Carmen López nos ha mostrado formas más estéticas (y correctas) de
expresarnos; gracias por tu buena disposición y comentarios. Otras muchas personas
que también nos sufren o sufrieron, nos han hecho llegar su deseo expreso de
permanecer en el anonimato (pero queden también nuestras más sinceras gracias). A
quienes nos han padecido como formadores, encuestadores/as de las ocho provincias
andaluzas, especialmente de Almería, Granada y Sevilla, vaya también nuestro
agradecimiento, sin ellos/as esto no tendría sentido. Gracias a todas las personas
encuestadas que reciben, atienden y colaboran amablemente con los encuestadores que
llevan a cabo la ardua tarea del trabajo de campo.
A los lugares: Almería, Granada y Sevilla, sitios de calurosa acogida para
inmigrantes como los autores. A sus Universidades que nos permiten desarrollar
nuestros trabajos y desarrollarnos aunque, a veces, de la manera más difícil.
A las cosas: a esa red (Internet) que ha hecho que las distancias entre Sevilla,
Granada y Almería sólo sean virtuales. A esos duendes informáticos malvados e
inoportunos, que tanto nos han maltratado últimamente, les agradeceríamos que en
próximas ocasiones se ocuparan de que no entren virus en nuestras máquinas. Nuestra
dependencia de ellos (de los duendes) se ha hecho patente en este trabajo.
19
CAPÍTULO 1
INTRODUCCIÓN
A LA INVESTIGACIÓN SOCIAL
1.1. Introducción
20
Este primer capítulo introductorio intenta definir los términos básicos para una
mejor ubicación y desarrollo del tema que nos ocupa: la encuesta como técnica de
investigación social. Para ello se delimitarán los conceptos metodología, métodos y
técnicas y se establecerán una serie de criterios que nos puedan guiar a la hora de
decidir por una determinada “forma de investigar”.
1.2.1. Metodología
21
La metodología adquiere su importancia ante la aparición del saber denominado
científico, con su método particular para conocer.
En el contexto del proceso de la producción de un conocimiento científico sobre
una realidad concreta, es necesaria la articulación de tres esferas fundamentales: a) el
análisis teórico; b) la investigación tecnológica; y c) las investigaciones concretas que
tratan de una realidad. Pues bien, este planteamiento, así como la articulación de estas
tres esferas son tratadas bajo el prisma de la metodología de cada área de estudio. Dicha
metodología se manifiesta, fundamentalmente, al resolver los problemas y las distintas
condiciones que surgen, de acuerdo con las características propias de los objetos de
estudio correspondientes. Entre ellos podemos destacar la clarificación de los
conceptos, la precisión de las observaciones, formas de medida, el paso de los hechos a
los datos y, de ahí, a las interpretaciones, la formalización del razonamiento, la
estructura de las teorías, las bases empíricas de las mismas, etcétera. La toma de
conciencia y resolución de cada uno de ellos nos permitirá no sólo conectar el trabajo
práctico con el teórico, y viceversa, sino un desmenuzamiento de los diferentes
componentes de la investigación (Musso, 1979a; 1979b). En consecuencia, según la
manera en que se resuelvan dichas cuestiones, podremos situarnos más cerca de la
filosofía o de la metafísica o, por el contrario, más cerca de las ciencias naturales y
exactas, o de actividades muy particulares que no admiten comparación con otros
campos de conocimiento.
La importancia de la metodología es tal que actualmente, en casi todos los campos
del conocimiento científico, existen áreas dedicadas a la metodología propia de las
mismas. Así podemos encontrarnos con trabajos con títulos como Metodología de la
Investigación en Sociología, Metodología de la Investigación en Psicología Social,
Metodología de la Investigación en Trabajo Social, Metodología de la Investigación en
Educación, etc., donde sus diferencias fundamentales están en tener en cuenta las
peculiaridades de cada una de estas áreas de conocimiento.
De lo que no cabe duda es de que la preocupación metodológica en “ciencias” tales
como la Psicología, Sociología, etc., más que estar en auge y presente en los
investigadores de dichas disciplinas, se encuentra aislada en una especie de “Santuario”
al que de manera poco frecuente peregrinan los científicos teóricos y, aún más
esporádicamente, los especialistas aplicados. Además, en cada visita buscan objetivos
distintos: la primera, a la que le conceden una importancia desproporcionada, está
motivada por la necesidad de cumplimentar trámites académicos o administrativos; y,
en la segunda y última, el investigador un poco más veterano, trata de justificar el propio
punto de vista metodológico de sus investigaciones en curso. Después de ésta, el
llamado investigador “medio” contemporáneo debido a su pretendida y exigida
22
especialización, propia del mundo moderno, termina justificando su metodología
adoptando las posiciones metodológicas diseñadas por los antecesores que trataron sus
mismos temas de investigación. Todos juntos conforman un grupo, relativamente
amplio, fuera del cual será difícil aceptar o entender sus posiciones metodológicas. Se
trata de “burbujas aisladas” más o menos voluminosas, en las que se insertan aquellos
que abordan un mismo tema y comparten una manera de proceder aunque, a veces, de
forma implícita. Esta razón hace que el diálogo metodológico entre investigadores
pertenecientes a distintas “burbujas” se traduzca en unas descalificaciones mutuas
sostenidas de manera afectiva e ideológica. Así, es posible que en la actualidad se
publiquen trabajos de investigación en revistas especializadas sin que por ello se pueda
presuponer que el autor de los mismos justifique o pudiera justificar, ni siquiera
superficialmente, los criterios metodológicos y, en consecuencia, las implicaciones a las
que le lleva el método adoptado.
Continuando con el ejemplo de los investigadores sociales, su metodología se
consagra exclusivamente (y no en todos los casos y con el suficiente rigor) a: 1°
garantizar la precisión de sus observaciones; 2° asegurar la precisión de sus
instrumentos de medida; y 3° hacer corresponder sus ideas –a veces ni siquiera
conceptos– con pobres variables empíricas consideradas por él como su expresión en la
realidad (Castells y de Ipola, 1975).
Por último, debemos comentar que en este texto no vamos a utilizar el concepto
metodología en sentido restringido, como se ha utilizado con bastante frecuencia
(Clemente, 1992), ya que los autores consideran más adecuado el uso de la palabra
metodología en su primera acepción, a saber: como el estudio de los métodos y no en
referencia a los métodos en sí mismos.
23
tal manera que el calificativo de “científico” no se le pueda aplicar a cualquier tipo de
conocimiento. Pues bien, en opinión de los autores de este trabajo, el conocimiento
científico se caracteriza por el método adoptado y no tanto por el objeto de estudio de
tal manera que cuando el método aplicado por el investigador es el hipotético-deductivo
(con todas sus implicaciones) se deslinda con claridad entre conocimiento científico y
no científico (figura 1.1).
En dicho método, se establecen una serie de momentos y reglas que deben seguirse
en cada caso. No obstante, cabría distinguir por un lado un método general que sirve de
guía a todas aquellas disciplinas que aspiren a la categoría de científicas y, por otro,
unos métodos particulares o tácticas diferenciadas en función del objeto y complejidad
de estudio. Hay que indicar que “método”, en sentido propio, es aquel conjunto de
operaciones teóricas, lógico-epistemológicas y procedimentales que permiten validar o
justificar las teorías científicas.
La esencia del método general (hipotético-deductivo) reside en la posibilidad de
anticipar los conocimientos (aun aquellos más ocultos a la experiencia directa). Ésta es
la función de las hipótesis formalmente deducidas de un cuerpo teórico, que
posteriormente se tratarán de confirmar o refutar con datos de la realidad. Cualquier
otra modalidad de conocimiento no deja de ser una matización más o menos empirista.
Los conocimientos así adquiridos (científicos, lo que llamamos ciencia, etc.) se
24
distinguen porque se manifiestan a dos niveles bien interconectados: por un lado un
conjunto de conocimientos presentados mediante conceptos (elementos de las leyes y
teorías) y, por otro, una integración lógica de dichos conceptos (teorías) que nos
conducen a conocimientos nuevos. La integración lógica aplicada a la totalidad de los
conocimientos produce un sistema teórico que supera a la suma de conocimientos
aislados. Dicho sistema, a su vez, permite sacar nuevas conclusiones sobre la realidad.
Éste sería el proceso y el producto de la aplicación del método científico. En este párrafo
se muestra la distinción entre ciencia como proceso y ciencia como producto, así como
la integración entre ambas.
De esta manera, el método hipotético-deductivo posibilita el ordenamiento
coherente de conocimientos al aplicar la racionalidad a los pasos lógicos que conducen
a este objetivo. Aquí se sitúa todo el debate de la Filosofía de la Ciencia, que trata los
temas relativos a la inducción, la deducción, la verificación, las reglas de
correspondencia entre los conceptos y los hechos, las teorías o la explicación, entre
otros.
En cuanto a los métodos particulares, cabría añadir, además de lo dicho para el
método general, que se trata de herramientas útiles que el investigador utiliza para
comprobar hipótesis de investigación objetivas, deducidas desde el esquema del
método general. En este sentido, tanto la táctica experimental como la selectiva, la
observacional y las distintas técnicas de recogida de información y procedimentales,
también son objeto, al ser métodos y técnicas de investigación, de la metodología y su
validez viene determinada en función del grado de adecuación de éstas con la
formulación de las hipótesis que se someten a prueba. El uso de una táctica frente a otra,
en sí misma no concede status científico a los datos obtenidos por ella.
Resumiendo todo lo anterior, podríamos decir que una investigación y, como
consecuencia, un conocimiento, se considera científica cuando es posible, siguiendo las
reglas del método, presentar los hechos en forma de enunciados, conceptos o teorías
explicativas, y a partir de estas reglas, poder deducir unas consecuencias (hipótesis)
cuyo grado de comprobación lógica o empírica nos permiten consolidar o reformular
las teorías de las que se parte.
Para la comprobación empírica hay que poner en marcha una serie de métodos
particulares que nos determinen unos procedimientos de observación adecuados
(tácticas de investigación) que hagan posible una correcta recopilación de datos que,
junto a la clasificación de los mismos –mediante análisis adecuados, estadísticos o no–
nos conduzcan a unas conclusiones. Éstas harán posible verificar o no aquellas
consecuencias derivadas de las teorías (hipótesis); de tal manera que cuando son
verificadas dichas hipótesis pasan a ser consideradas como leyes y se introducen en el
25
sistema (teoría).
Por este mecanismo se puede decir que los conocimientos así adquiridos
(conocimientos científicos) trascienden al sujeto cognoscente: son aceptados por todos,
independientemente de los gustos, valores, ideología, etc., dado que pueden ser
reproducidos por cualquiera y ser sometidos a la inspección pública. Igualmente son
una representación (pactada) de los objetos de la realidad que se estudian –el pacto de
la operativización– y adquieren el estado de “verdaderos”, aunque no de infalibles ni
autosuficientes.
La fase de comprobación empírica de las hipótesis exige, como ya se ha indicado
anteriormente, una adecuación de los procedimientos a seguir con los enunciados a
verificar. Para que se dé esta adecuación han ido surgiendo a lo largo de la historia de la
ciencia diversas tácticas (métodos particulares) de investigación que hacen posible la
operativización de los enunciados deducidos de las teorías a verificar.
Estas tácticas de investigación son lo que se denomina en la mayoría de los textos
especializados “métodos de investigación”, aunque en su connotación más restringida
significa: camino a seguir para salvar los obstáculos que nos conduzcan a un fin
determinado; en este caso, el fin no es otro que contrastar empíricamente las hipótesis
deducidas. Serán las características de dichas hipótesis las que determinen el método
de investigación a seguir, de tal manera que uno de ellos no tiene por qué ser válido
frente a cualquier hipótesis, es más, no será el tipo de táctica de investigación la que
determine el tipo de conocimiento (científico, no científico) obtenido, ya que ese estado
viene determinado por el planteamiento más general del método hipotético-deductivo,
que para cualquier área de estudio deberá cumplir las siguientes fases (Bunge, 1985):
26
En general, podemos decir que toda investigación parte de un problema a estudiar y
que por una serie de fases se llega a unos resultados empíricos relevantes para el
problema inicialmente planteado, que sirven de base para contrastar las conjeturas
realizadas en relación con el problema planteado. La forma de llegar a estos resultados
empíricos es diversa, pero el proceso de investigación en sí mismo es, desde un punto
de vista lógico-formal, similar (Alvira, 1984).
1.3.1. Experimental
27
exigiendo al investigador una exhaustividad en el cumplimiento de sus fases y
condiciones de aplicación.
— El investigador puede manipular directamente las variables antecedentes
(independientes) para comprobar qué efectos producen sobre las variables
consecuentes (dependientes).
— Se puede determinar el tipo de relación causal existente entre las variables
antecedentes y consecuentes.
— Permite controlar, bien directamente bien estadísticamente, las variables
extrañas previa detección de las mismas por el investigador.
— Generalmente, se aplica en ambientes muy controlados y muy artificiales.
1.3.2. Correlacional
Hay que recordar, una vez más, que es el enunciado hipotético que se quiere
someter a comprobación empírica el que determina la táctica a seguir, de manera que
serán las características de la táctica las que nos permitirán adoptarla para un
enunciado concreto. Así, la táctica correlacional es muy útil cuando los enunciados a
contrastar no permiten al investigador una manipulación directa de las variables
sometidas a estudio. Esto determina sus principales características (Arnau, Anguera y
Gómez, 1990; Clemente, 1992; León y Montero, 1993; Morales, 1981):
— Se intenta descubrir la posible relación existente entre las variables que interesan
en la investigación. Este método nos permite establecer sólo relaciones de
covarianza (no causales) entre las variables, ya que las variables que
constrastamos no permiten la manipulación directa.
28
— El investigador selecciona las variables que le interesan. En general, el
investigador selecciona una variable (antecedente, predictora o independiente)
para conocer la relación que ejerce sobre otra variable (consecuente, criterio o
dependiente). No existe la posibilidad de controlar exhaustivamente las variables
que pueden influir en la variable predictora, tal y como se hace en el método
experimental.
— Generalmente se aplica en ambientes más naturales que el experimental, aunque
también impone un cierto grado de control.
1.3.3. Observacional
29
Como hemos podido observar, los tres métodos de investigación vienen articulados
en función del control que ejerce el investigador sobre la situación investigada.
Siguiendo a Arnau, Anguera y Gómez (1990) podemos plasmar gráficamente esta
relación en un continuum de naturalidad o control por parte del investigador:
Sirva el cuadro 1.1 como resumen de lo dicho para los distintos métodos de
investigación.
1.4. Técnicas
30
un elemento del método, en virtud de lo cual se debe ir desechando la actitud, todavía
común en demasiados investigadores, de interesarse por problemas de investigación en
función de la última de las técnicas aprendidas o dominadas, o de aquellos otros
investigadores que sólo confían en, por ejemplo, la encuesta y no quieren saber nada de
la observación o experimentación, y al contrario. Ante este problema sería más correcto
que el investigador que se enfrenta a un tema se preguntara: ¿qué método debo seguir y
qué técnicas de recogida de datos es la apropiada para lo que pretendo? En este sentido,
las técnicas se han de considerar como un aspecto del método que hacen posible una
recogida de datos acorde con el mismo; de ahí que tanto un experimento como un
informe verbal sean considerados por los autores de este texto como técnicas de
investigación. En definitiva, se trata de ver las observaciones como un encadenamiento
lógico entre campo teórico, métodos y técnicas de investigación.
Debido al gran número de áreas que se pueden estudiar dentro del campo de las
Ciencias Sociales, ha habido una gran especialización y aumento de las técnicas de
investigación que se aplican a cada una de estas áreas. En parte por lo anterior, en parte
por la diversidad de puntos de vista de los investigadores, no existe una clasificación
que sea universalmente aceptada de las técnicas de investigación en Ciencias Sociales
(Visauta, 1989). Por tanto, tenemos técnicas distintas que varían según el grado de
simplicidad, según la información que proporcionan, según las formas de utilización,
según los datos a recoger, etc. Podemos citar entre otras:
— La observación.
— La entrevista.
— La encuesta.
— Las historias de vida.
— Los tests, cuestionarios y escalas.
— Grupos de discusión.
— La experimentación.
— Las medidas psicofisiológicas.
31
técnica de observación podemos aplicarla a los tres métodos) y técnicas que se aplican a
un solo método (por ejemplo la experimentación como tal sólo la podemos aplicar si
utilizamos el método al que da nombre: el experimental).
Ahora podemos entender con conocimiento de causa por qué razón muchos
manuales no incluyen este apartado entre sus capítulos: no existen recetas mágicas. Bajo
este panorama, que pudiera parecer desolador, cobra especial importancia la labor
previa de analizar y comparar los diversos métodos y técnicas teniendo en cuenta sus
ventajas e inconvenientes, y siempre comprobando si se pueden ajustar a nuestra
investigación.
En cualquier caso puede servir de guía atender a una serie de cuestiones que nos
pueden dar la clave a la hora de decidirnos por alguno en concreto. Estas cuestiones,
entre otras, son las siguientes (Sierra, 1982; Pons, 1993):
32
• El acceso a las fuentes de información necesarias.
• El tiempo.
• Los recursos disponibles.
• Los costes: humano, social y económico.
• Los aspectos éticos.
De igual forma que no existe ni un método ni una técnica mejor que otra, tampoco
existe un criterio mejor que otro y ninguno es válido por sí solo (Pons, 1993). En
cualquier caso hay que tenerlos en cuenta todos y el investigador deberá decidir cuál de
ellos es más importante en su investigación concreta.
La exposición que a continuación realizaremos de los criterios no se hace con el
ánimo de proporcionar un recetario para obtener el método y la técnica que
necesitamos, más bien se hace con el ánimo de tener una serie de cuestiones para
reflexionar y que además puedan condicionar nuestra decisión.
33
requieren un mismo grado de formación. Este tema es una cuestión de vital
importancia en la investigación mediante la técnica de encuestas.
4. El acceso a las fuentes de información necesarias. El acceso a la información es muy
importante. A veces nos hemos decidido por un método y justo cuando
aplicamos la técnica para la recogida de datos es cuando caemos en la cuenta de
que es prácticamente imposible el acceso a la información. Debemos evaluar este
aspecto antes de tomar una decisión.
5. El tiempo. En la sociedad actual el tiempo cobra cada vez más importancia y no lo
es menos en este contexto. Normalmente, las investigaciones están sujetas a
plazos que cumplir, por tanto tendremos que descartar aquellos métodos o
técnicas que superen en su aplicación el tiempo que tengamos para la realización
de la investigación.
6. Los recursos disponibles. El presupuesto económico, materiales y aparatos,
personal, etc., son cuestiones que nos determinan la elección de un método y/o
técnica. En cualquier caso siempre tenderemos a maximizar los beneficios con
los mínimos recursos, recordando que no debemos escatimar estos recursos si
los tenemos y si son imprescindibles para la realización de la investigación. A
veces nos quejamos de la falta de ellos y luego nos sobran.
7. Los costes: humano, social y económico. No sólo tenemos que contar con los costes
económicos que generará la utilización de un método u otro o de una técnica u
otra, sino que también debemos atender al esfuerzo que deba realizar el equipo
investigador, las molestias que se puedan causar a la población objeto de la
investigación, etc. Debemos conocer si los costes merecen la pena en función de
las necesidades, dimensiones y repercusiones que puede tener la investigación
(Pons, 1993).
8. Los aspectos éticos. Hay que tener muy en cuenta aquellos métodos y/o técnicas
que planteen problemas éticos en su aplicación.
34
de una característica observable, que la reduce a una descripción numérica y
transforma la característica en datos; b) controlar las variables que, por acción directa
sobre la característica observada o por acción del investigador, puedan confundir el
valor de dicha característica; y c) interpretar, a la luz de las teorías, el significado del
dato. En este sentido, las técnicas traducen la realidad caótica a datos reproducibles y
objetivos. Estos datos se filtran a partir de unas concepciones teóricas y unos
instrumentos de recogida de información. Sin embargo, por técnica, en muchas
ocasiones sólo se entiende el modo en cómo se usa un instrumento para obtener un
dato, sin deseo de interpretarlo. En este otro sentido, los datos que se obtienen con ella
son mejores o peores en función de la potencia de la técnica. La técnica por sí misma
niega toda verdad definitiva. Todo lo conseguido por ella y, en consecuencia por el
sistema científico contemporáneo, es inseguro. A pesar de esto, la técnica pretende
construir una segunda naturaleza, y de ahí la contradicción entre conocimiento
científico y saber (conocimiento). El principio de manipulación de la naturaleza, a través
del método hipotético-deductivo, impone la primacía de la técnica y la convierte por sí
misma en la auténtica herramienta de la creación científica.
Este principio de manipulación de la realidad es el que ha ido produciendo la
primacía o solapamiento de la técnica (como productora de datos e información) sobre
la ciencia (como productora de un tipo de conocimiento). La técnica se convierte, por sí
misma, en herramienta de creación de conocimientos.
El citado científico “medio” contemporáneo, se ocupa de temas muy particulares en
espacios muy definidos de investigación. Esto le hace perder el sentido global de la
realidad y, por ello, se aleja del proceso general del conocimiento. Muchas de sus
actuaciones se concretan en el uso de técnicas en sí mismas y sin conexión con temas
de estudio determinados. Si a esto se le añade que participa del pacto de la
operativización de los fenómenos y de la aplicación y utilización del conocimiento
científico –muy propio de la ciencia moderna–, la técnica y la ciencia se han
confundido hasta hacerse, en algunos ambientes, sinónimos.
Dicho todo esto, el texto que sigue está dedicado a una técnica de uso cada vez más
frecuente: la encuesta. Que ésta sea utilizada en el contexto de la investigación científica
(motivada teóricamente) incluida en la fase de recogida de datos de una determinada
táctica, o bien sea utilizada por el simple hecho de obtener información (saber)
desconectado de cualquier teoría científica, es responsabilidad de cada investigador. Lo
que no ponen en duda los autores es que esta técnica se muestra muy potente en ambos
ámbitos.
35
36
CAPÍTULO 2
LA ENCUESTA COMO TÉCNICA
DE INVESTIGACIÓN SOCIAL
2.1. Introducción
37
tenerse en cuenta en la planificación y elaboración de un proyecto de investigación
mediante encuestas.
Pero antes de comenzar, el lector ha de disculpar que, como ya habrá observado, se
utilicen ciertas perífrasis para hacer referencia a términos tan familiares como el de
“ciencia social” o “conocimiento científico social”. Esto, sin duda, dificulta la lectura del
texto, pero permite a quien lo escribe seguir manteniendo su escepticismo ante los
rígidos criterios de demarcación entre ciencia y no ciencia –con los que a algunos, por
cierto, todavía se les “llena la boca”–, así como defender, de esta forma, que no existen
normas universales ni eternas sobre cuál es la manera adecuada de llevar a cabo una
investigación y, paralelamente, afirmar que a la hora de conocer la realidad social no
“todo vale”.
38
“ánimo” de muchos gobernantes, recuerdan como en Las mil y una noches el califa
Harún-al-Rashid recorre, disfrazado, alguno de los zocos de Bagdag con la intención de
averiguar el sentir general de su pueblo. La misma idea de fondo, esto es, que se puede
acceder al conocimiento de la opinión colectiva sirviéndose de una serie de informantes
bien escogidos, ha guiado las acciones de otros muchos mandatarios. En ocasiones, y
debido a lo que hoy se consideraría una selección inadecuada de la muestra, el
resultado no era el más satisfactorio. Este es el caso, por ejemplo, de Luis XIV, quien,
desoyendo la correcta impresión de sus ministros y creyendo mejor informadas a sus
princesas sobre el parecer de los franceses, decide aceptar para su nieto, el duque de
Angevia, la corona de España. En otras circunstancias, sin embargo, el éxito acompaña a
estas prácticas rudimentarias de investigación social y política. Una muestra de ello se
encuentra en el encargo de Napoleón al conde Lavalette:
39
2.2.1. La aritmética política
40
(1916). Una obra en la que además de estimar el número de familias del país, calculaba
la media de ingresos familiares y, con ello, ofrecía un indicador de la manera en la que
los individuos participaban del bienestar nacional. En Francia destacan las
investigaciones de Colbert y del Marqués Sébastien le Prestre. El primero de ellos,
controlador general de finanzas francés desde 1661 hasta su muerte en 1683, realizó
una serie de estudios sobre el estado general del Reino y, bajo la influencia de Graunt,
sobre su población. Así mismo, realizó trabajos más específicos sobre las manufacturas
francesas. Por su parte, Vauban, comisionado general de las fortificaciones francesas,
además de realizar diversos trabajos de investigación, recomendaba que, a diferencia de
como se venía haciendo, en la construcción de los censos se utilizase al individuo como
unidad de análisis y no a la familia.
Para finalizar este breve comentario sobre la aritmética política, es preciso destacar
que a partir de 1697, bajo el reinado del mencionado Luis XIV, el duque de
Beauvilliers, gobernador del nieto del rey, el duque de Burgundy, promovió la
realización de lo que se conoce como la “Gran Encuesta”, con el objeto de demostrar a
su superior la inadecuada política bélica y fiscal de su abuelo. Se realizaron 32
“memorias”, cada una de las cuales se basaba en los datos recogidos a través de un
cuestionario que se enviaba a los intendentes de cada distrito. Estos últimos, además de
elaborar un censo, ofrecían información sobre el territorio, la naturaleza de la
población, la reputación de los religiosos y de los nobles, y una serie de cuestiones
relativas a la situación económica del distrito.
Con unos orígenes más tardíos, y ya en el siglo XIX, otra gran tradición, de notable
influencia en la historia antecedente a la investigación mediante encuestas, es la que se
conoce con el nombre de –Estadística Moral”. A pesar de que se suele identificar al
francés Le Play y al belga Adolphe Quetelet como sus primeros y grandes defensores, ya
con anterioridad André de Guerry de Champneuf –director del Departamento de
Justicia Criminal del Ministerio de Justicia francés desde 1821 hasta 1835–, Jean
Baptiste Fourier y André de Chabrol de Crousol –con sus Reserches statistiques sur la
ville de Paris es le département de la Seine–, el alemán Joham Peter Süssmilch –al
constatar que las tasas de algunos comportamientos voluntarios, como por ejemplo las
del suicidio, mostraban cierta constancia en el tiempo– y el médico francés Parent-
Duchalet –con sus estudios sobre salud pública–, habían contribuido al estudio,
medición y descripción de las “cualidades morales” y del bienestar social, al prestar
41
atención a temas tales como el crimen, el suicidio, la ilegitimidad, la prostitución y
fenómenos similares.
Frédéric Leplay (1881: 3), que se había formado como ingeniero de minas,
incorpora el espíritu empirista de dicha profesión a las investigaciones sociales que
realiza sobre los obreros europeos:
Desde tiempo había reflexionado sobre un punto esencial, a saber, que, tanto en la
ciencia de las sociedades como en la de los metales, sólo me consideraré en
posesión de la verdad cuando mi convicción pueda apoyarse en la observación de
los hechos.
Para tal fin desarrolla nuevos procedimientos de recogida y análisis de datos, tanto
cuantitativos como cualitativos, que se concretan en su conocido Método Monográfico
de investigación. Éste deriva del tipo de informes sistemáticos que los estudiantes de la
Escuela de Minas realizaban en sus estudios del terreno, y en los que tenían que
destacar aquellos elementos que podían ser contados y tabulados. De esta forma, el
contacto directo con los datos y la utilización de una serie de principios selectivos
guiados teóricamente para la comparación y presentación de los mismos, constituyen,
junto con la utilización de algunas estrategias rudimentarias de muestreo y de ciertos
indicadores e índices de tipo económico, las características principales de la monografía
de Leplay. Sin embargo, y debido, entre otros factores, a sus posiciones políticas,
religiosas y teóricas, la repercusión de la escuela de Leplay en el desarrollo posterior de
las ciencias sociales y, en concreto, de la sociología francesa, no ha sido demasiado
importante, viéndose ensombrecida, sobre todo, por la centralidad de la figura de
Durkheim.
Entre las aportaciones de Quetelet, son dignas de mención: a) la idea de que la
materia viva manifiesta distribuciones de frecuencia con patrones reconocibles y
similares a las que habían estudiado, a finales del siglo XVIII, Laplace y Gauss; b) la
utilización de tablas multivariadas para explorar relaciones entre las tasas de crímenes o
de matrimonios y una serie de factores sociodemográficos como la edad o el sexo; c) la
aplicación del cálculo de probabilidades para explicar la constancia en el tiempo de las
tasas de determinados fenómenos; y d) la ayuda que prestó al establecimiento de la
Sociedad Estadística de Londres y a la organización de varios congresos
internacionales.
42
En los años treinta del siglo XIX se fundó un gran número de Sociedades
Estadísticas a lo largo de Inglaterra. Uno de sus principales objetivos era orientar,
basándose en el estudio objetivo y cuantitativo de la sociedad, las reformas y mejoras
necesarias para solventar los principales problemas sociales del momento. Para ello, y
preocupándose por temas tales como la salud, la educación, las prácticas religiosas y las
condiciones de vida de las clases trabajadoras, financiaban la realización de laboriosas
encuestas. Los datos obtenidos solían presentarse en las reuniones anuales de la
Asociación Estadística Británica y con frecuencia se publicaban en el Journal of the
Royal Statistical Society. Muchas de estas encuestas utilizaban entrevistadores que,
cuestionario en la mano, recorrían puerta a puerta los lugares de los cuales se requería
información.
El movimiento de las encuestas y monografías sociales, del que los trabajos que se
acaban de mencionar constituyen tan sólo un ejemplo, se extendió con rapidez por el
resto de Europa y los Estados Unidos. Sin lugar a dudas, es imposible recoger aquí,
aunque sea mínimamente, los trabajos más importantes que se realizaron y los autores
que con su esfuerzo pretendían aportar información y contribuir a la mejora de los
problemas sociales asociados con la creciente industrialización y urbanización,
perfilando y mejorando, a la par, los procedimientos e instrumentos de investigación
social.
No obstante, a partir de 1850 se produce un parón importante en la actividad de las
sociedades estadísticas y, con ello, al menos en Inglaterra, una ruptura en la tradición
investigadora que conduce a la encuesta actual. La razón principal estuvo asociada, sin
duda, al cambio en el clima intelectual propiciado por el desarrollo de las tesis
evolucionistas y por un pujante darwinismo social. La raza y la heredabilidad se
proponían como categorías fundamentales para el análisis sociológico. De esta forma, el
espíritu ambientalista y de reforma social que había primado hasta ese momento y que
orientaba, en muchos casos, mejoras sustanciales de las condiciones de existencia, se
desvanece. Si en los años treinta lo característico entre las élites intelectuales era
pertenecer a una sociedad estadística, a partir de los cincuenta serán las sociedades
antropológicas, etnográficas y eugenésicas las que cuenten con un mayor número de
afiliados.
Pero con el cambio de siglo se constata un renovado interés por los estudios sociales
de corte ambientalista. Un ejemplo de ello lo constituye Charles Booth. Sus trabajos, así
como los realizados por sus colaboradores Beatrice y Sidney Webb en los primeros años
de este siglo, forman parte de una tradición de investigación mediante encuestas que, en
Inglaterra, se extiende hasta nuestros días. Booth, preocupado por la afirmación de los
socialistas de que la tercera parte de la población londinense vivía en la pobreza,
43
financia y realiza una encuesta dirigida a los obreros del East End de Londres con la
que pretendía descubrir las causas de dicho problema. La calidad metodológica de sus
trabajos, todo hay que decirlo, dejaba bastante que desear. Habría mejorado, sin duda,
si el autor hubiese estado al tanto de los avances estadísticos que en aquel entonces
estaban desarrollando Galton, Edgeweorth, Pearson y Yule. Sin embargo, no fue hasta
los años veinte de nuestro siglo cuando los investigadores sociales comenzaron a hacer
uso de los mismos, influidos por los trabajos que se venían realizando en campos tales
como la biología, la agricultura o la psicología.
En el mismo período en el que trabaja Booth, pero al otro lado del Estrecho, Emilie
Durkheim ofrece, basándose en los datos acumulados por la estadística moral, una
explicación sociológica del suicidio. Tampoco en su caso se hace uso de esas nuevas
estrategias de muestreo. No es de extrañar, pues el muestreo aleatorio y el muestreo por
cuotas no serían admitidos como estrategias de investigación “verdaderamente
científicas” por el Instituto Internacional de Estadística hasta 1903, gracias al tesón y al
esfuerzo del estadístico noruego A. N. Kiaer.
Rompiendo un poco el hilo conductor de esta exposición, habría que mencionar que
otras figuras tan destacadas en la fundación de las modernas ciencias sociales, como
Marx y Weber, también tienen su lugar en la historia de la investigación mediante
encuestas. El primero de ellos realizó, aunque sin concluirla, una encuesta obrera que
pretendía orientar ciertos cambios sociales. Weber, por su parte, participó en una
investigación que tenía como objetivo estudiar las condiciones de trabajo en el medio
rural. Con posterioridad, volverá a utilizar la encuesta en otras dos investigaciones. La
primera sobre el mismo tema. En la segunda se preocupa por el estudio de las actitudes
de los trabajadores industriales. En este último trabajo ya se observa la mayoría de los
rasgos de la investigación mediante encuestas actual: estudio de la opinión y/o actitud,
selección representativa de los sujetos que participan y elaboración cuidadosa del
cuestionario que guía la recogida de la información.
Pero el caso de Weber es una excepción. La mayoría de los trabajos que se han
reseñado hasta el momento, si bien guardan ciertas similitudes con las encuestas
actuales, difieren de las mismas en una serie de aspectos importantes. En muchos casos
se trata de trabajos, censos, que estudian el total de la población. En otros, si bien se
utilizan muestras de individuos, éstas no reúnen, salvo excepciones, un carácter
representativo. Por último, se dedican, generalmente, a recoger información sobre
44
características objetivas de la realidad social y no datos sobre opiniones y/o actitudes.
Y es que a estos breves retazos de la historia de la investigación mediante encuestas
les resta, todavía, tener en cuenta otras dos importantes líneas de trabajo relacionadas,
concretamente, con el estudio de la opinión pública. La primera tiene que ver con el
trabajo metodológico y técnico realizado en el campo de las actitudes y su medida. La
segunda está representada por las “votaciones particulares” que desde principios del
siglo XIX promovían algunos periódicos con el fin de anticipar resultados electorales.
45
2.2.7. Gallup, Roper y Crossley
Desde 1916 las votaciones particulares más famosas fueron las de la revista Literary
Digest, que predijo con éxito los resultados electorales hasta 1936. Este es, como ya se ha
referido, un momento clave para la historia de la investigación mediante encuestas. Lo
cierto es que la Literary Digest, después de gastarse una gran suma de dinero en enviar
10 millones de cuestionarios por correo y en procesar las repuestas de los 2 millones de
personas que los contestaron, fracasó de forma estrepitosa al anticipar, erróneamente,
una victoria aplastante del candidato del partido republicano. En esta misma fecha,
George Gallup, Elmo Roper y Archival Crossley, tres recién llegados al campo de los
sondeos políticos, de manera independiente y utilizando las respuestas de muestras que
rondaban las 4.000 y 5.000 personas, predijeron, de manera adecuada, que Eleanor
Roostvelt sería el futuro presidente. De esta forma ponían en evidencia las debilidades
inherentes de las votaciones particulares, esto es, su carácter sesgado y la falta de
representatividad de los datos que recogían. Hay que recordar que la “base de datos”
que utilizó el Literary Digest para remitir sus cuestionarios estaba conformada por
personas que aparecían en listados telefónicos o que eran propietarias de un automóvil.
Aspecto éste que, sin duda, “covariaba” con una tendencia de voto muy concreta, esto
es, conservadora. Sin embargo, Gallup, Crossley y Roper, seleccionaron de manera muy
cuidadosa sus pequeñas muestras, asignando cuotas específicas de hombres y mujeres
para sus entrevistas, teniendo cuidado, a la par, de que entre las mismas estuviesen
representados los distintos rangos de edad y niveles económicos. Esta forma de trabajo
ya había demostrado su eficacia en el campo de los estudios de mercado, pero su
aceptación y uso generalizado no se produjo hasta que se aplicó a la predicción de los
resultados electorales.
A partir de entonces, la investigación mediante encuestas muestrales comienza a
generalizarse. Se fundan, primero en los Estados Unidos y, poco después, en toda
Europa, un número considerable de Instituciones públicas y empresas privadas que se
sirven de las encuestas para el estudio de los más diversos temas.
Los departamentos universitarios, que hasta ese momento no habían prestado
atención ni a los estudios de mercado ni a los de opinión pública, comienzan a
interesarse, desde entonces, por el tema. Destaca, en este sentido, Paul Lazarsferld
(Lazarsferld, Barelson, Gandet, 1944), fundador del Instituto de Investigación Social
Aplicada de la Universidad de Columbia y figura clave en el desarrollo de las bases
teóricas y metodológicas de la investigación social mediante encuestas.
La Segunda Guerra Mundial supuso un nuevo aldabonazo en el desarrollo técnico
de las encuestas y, de igual modo, en la reafirmación de su utilidad. Los estudios sobre
46
la moral de la tropa (Stouffer y otros, 1949) y sobre la eficacia de la persuasión bélica en
las actitudes de la población fueron los más sobresalientes
Desde ese momento, y a pesar del gran desarrollo conseguido, la historia de la
investigación mediante encuestas no ha sido un camino de rosas. La oposición de
muchos gobiernos y políticos a la realización de determinados tipos de encuestas, en
concreto las pre-electorales, y los tropiezos predictivos que se han constatado en
algunos momentos son buena prueba de ello. Sin embargo, éstas ya son otras
“historias”, por lo que se remite al lector interesado a la literatura existente sobre el
tema (por ejemplo Noelle-Neumann, 1986; Wert, 1996).
Alguna de las “historias” que se han ofrecido en el epígrafe anterior habrán servido,
sin duda, para que el lector haya desarrollado –al menos de manera implícita, y si no lo
había hecho con anterioridad– su propia definición sobre las encuestas. En la misma,
habrá incluido, ordenándolas de una forma u otra, referencias a un conjunto de
técnicas adecuadas de muestreo, a la elaboración y/o realización de cuestionarios y/o
entrevistas de diverso tipo, cuidadosamente elaborados, para indagar, entre otras cosas,
los intereses, preferencias o intenciones de los ciudadanos, al objeto de describir sus
características o para predecir su comportamiento futuro.
No obstante, se hace precisa una mayor clarificación y una serie de distinciones para
ofrecer, como decíamos al principio de este capítulo, una definición adecuada de la
encuesta que no confunda la parte con el todo y en la que su función no se restrinja a
meras tareas descriptivas.
47
hacer uso de diferentes “técnicas” de automoción: el autobús, el tren o el coche (otros
ejemplos similares a éste pueden encontrarse en Manstead y Semin, 1988, y en Robson,
1993).
Por lo tanto, es necesario tener claro que la encuesta es una técnica de investigación.
Una técnica que hace uso, según los casos y la conveniencia, de un amplio conjunto de
procedimientos e instrumentos con los que no se debe identificar ni confundir y que,
como se mostraba en el capítulo anterior, no constituyen los criterios a partir de los
cuales se la puede distinguir de otras técnicas de investigación social.
Así, lo fundamental del estudio de caso, y lo que lo diferencia de la encuesta y del
experimento, es que centra su atención en la recogida de información precisa y
detallada sobre un “caso único”, sea este un individuo, una situación, un proceso o un
pequeño número de acontecimientos relacionados.
Por su parte, el experimento y la encuesta se distinguen entre sí por la existencia o
no de ciertas manipulaciones hechas por los investigadores en la situación objeto de
estudio. Como se indicó en el capítulo anterior, en el experimento se observan y miden
los efectos que produce la manipulación de una o más variables (independientes) sobre
otra u otras variables (dependientes) intentando que el resto de los factores que puedan
mediar las relaciones que se exploraran estén controlados. En las encuestas no se
realiza tal intervención por parte de los investigadores, cuya función consiste,
principalmente, en recoger un conjunto de datos (variables dependientes) de un grupo
de personas y en estudiar sus relaciones (método correlacional). Para ello se utilizarán
diversas técnicas o instrumentos. En la mayoría de los casos serán cuestionarios que, o
bien se envían por correo a los encuestados, o sirven como guión para una entrevista
personal o telefónica.
48
En este sentido, y al igual que ocurre, por ejemplo, con el estudio de caso (véase Yin,
1994), es necesario recordar que, gracias al reciente desarrollo de una serie de técnicas
estadísticas de análisis multivariado y a la posibilidad práctica de su aplicación a través
del ordenador, la encuesta se puede utilizar no sólo para realizar investigaciones de tipo
exploratorio o descriptivo, sino también para analizar y explicar las relaciones existentes
entre diferentes y múltiples variables y fenómenos sociales (Marsh, 1982; De Vaus,
1993).
Por lo tanto, y mediante la elaboración y realización adecuada de una encuesta, un
investigador social puede llegar a responder preguntas sobre el qué, el cuándo, el cómo,
el quién y también el porqué de la realidad en la que se ve inserto.
Con las distinciones anteriores en mente, tan sólo resta ofrecer una definición de
encuesta que se ajuste a las precisiones que se acaban de realizar y que aporte, además,
información adecuada sobre el resto de los rasgos que caracterizan y distinguen a esta
técnica de investigación. La que aquí se adopta, inspirada en la que recientemente ha
ofrecido García Ferrando (1992: 141) es la siguiente:
Si se lee con detenimiento la definición anterior se verá que las dos condiciones que
se han comentado hasta el momento se recogen con claridad. Esto es, por una parte se
distingue la encuesta de los procedimientos de los que hace uso y, por otra, no se limita
su finalidad a la exploración o descripción de los fenómenos objeto de estudio.
Así mismo, y a diferencia de García Ferrando, se opta, como hace por ejemplo De
Vaus (1993), por no circunscribir las unidades de análisis de las encuestas a los seres
humanos, puesto que, si bien son las más frecuentes, la encuesta también puede ser
utilizada para realizar investigaciones sobre otros aspectos de la realidad como, por
ejemplo, el estado de las obras de arte de un museo o la situación del parque móvil de la
policía.
Otra de las características centrales de las encuestas es que, a diferencia de los
censos, se realizan sobre muestras o partes de la población objeto de estudio. Estas
49
muestras tienen que ser representativas y no sesgadas, esto es, deben poseer, de manera
ideal, la misma proporción de casos con características diferentes que se observen en la
población. Para satisfacer estas condiciones se han desarrollado diferentes estrategias
de muestreo, siendo las más utilizadas la de rutas aleatorias y la de cuotas. No nos
detendremos en este momento en su descripción, pues serán objeto de un tratamiento
pormenorizado en los siguientes bloques de este libro (véase, en concreto, los capítulos
3 y 4).
50
CUADRO 2.2. Algunos rasgos diferenciales entre los distintos tipos de encuesta.
51
Inconvenientes potenciales de la encuesta personal
1. Implica un gasto mayor que el resto de las encuestas.
2. Se necesitan encuestadores entrenados y que éstos estén geográficamente
próximos a la muestra que se desea encuestar.
3. Requieren más tiempo que las telefónicas para la recogida de los datos.
4. Ciertas muestras pueden ser más accesibles por otros tipos de encuesta (por
ejemplo estudiantes, trabajadores, etc.).
52
diferencia de la telefónica).
2. Se pueden realizar preguntas largas y con categorías de respuesta complejas.
3. Permite la realización de baterías de preguntas.
4. El encuestado no tiene que compartir sus respuestas con ningún entrevistador.
53
1. Dependiendo de la muestra estudiada, en ocasiones es bastante difícil conseguir
una cooperación adecuada.
2. Implica diversos inconvenientes asociados con la no presencia de un
entrevistador.
3. Se necesita conocer y elaborar correctamente el listado de las direcciones de los
encuestados.
No obstante, es importante indicar que en otros trabajos como los de Ferber (1980)
y Visauta (1989) se clasifican los tipos de encuesta en función de otros criterios, como
son, por ejemplo, la población a la que se dirigen (adultos, profesionales de la salud,
etc.), la clase de datos que pretenden recoger (actitudes, comportamientos, etc.). El
lector interesado en un estudio en profundidad de los diferentes tipos de encuesta
puede consultar, entre otros, los trabajos de Frey (1983), Lavrakas (1987) y Bosch y
Torrente (1993).
54
forma, sus respuestas puedan ser comparadas y analizadas con cierta fiabilidad. Por ello
se hace aconsejable que las personas encargadas de realizar las entrevistas cuenten con
cierta experiencia y hayan recibido un entrenamiento específico para realizar su labor.
En función del tipo de muestreo que se realice, el entrevistador habrá de “buscar” a
los entrevistados de diferentes formas. Cuando el tipo de muestreo que se utiliza es el
de rutas aleatorias, el entrevistador recorre, desde un punto fijado de antemano, un
itinerario que va construyendo, paso a paso y con la ayuda de una tabla de números
aleatorios, hasta que localiza en su vivienda a la persona que debe entrevistar (en el
capítulo II del texto de Manzano y otros –1996–, se describe, de manera muy sencilla,
este tipo de muestreo). En el caso del muestreo por cuotas, al entrevistador se le dice a
cuántas personas y con qué características tiene que entrevistar, cayendo bajo su
responsabilidad la selección de las mismas.
Como su propio nombre indica este tipo de encuesta implica la utilización del
servicio de correos para hacer llegar, a una muestra representativa de sujetos, un
cuestionario autoadministrado, unas instrucciones que indican cómo cumplimentarlo y
un sobre estampado y con la dirección impresa para que lo remitan de vuelta a los
investigadores.
En este caso, y a diferencia de las encuestas personales, no se utilizan
entrevistadores y, por lo tanto, no existe contacto personal alguno entre los
investigadores y los encuestados. Debido a ello es necesario prestar una atención
especial a la elaboración y presentación del cuestionario, de forma que su
cumplimentación resulte sencilla y que las preguntas que planteen puedan ser
claramente entendidas.
Una de las principales dificultades que plantea este tipo de encuesta es la baja tasa
de respuestas que consigue. Para solventar este problema algunos autores han
desarrollado una serie de recomendaciones, que se resumen, con brevedad, en el
cuadro 2.1 (véase al final del capítulo).
55
y rellenar y con suficiente espacio para responder a las preguntas.
2. La claridad del lenguaje y la simplicidad del diseño es esencial. De la misma
forma, unas instrucciones claras son imprescindibles.
3. Se deben ordenar los contenidos para maximizar la cooperación. Por ejemplo
asegurarse de que las primeras preguntas no indiquen a los que responden que
la encuesta ‘“no es para ellos”.
Diseño y disposición
4. La utilización de páginas de color puede ayudar a identificar la estructura del
cuestionario. Por ejemplo se pueden utilizar páginas de distinto color para las
instrucciones.
5. Las respuestas que se realizan poniendo marcas en cajas ‘[]’ son más familiares
y fáciles de responder para la mayoría de las personas. Los sujetos se pueden
confundir si tienen que rodear con un círculo respuestas pre-codificadas.
6. La identificación de las preguntas con números y letras es de gran ayuda, sobre
todo si se agrupan aquellas que están relacionadas con un tema específico.
7. Si se sospecha que los sujetos pueden confundirse no ha de dudarse a la hora
de repetir las instrucciones las veces que sean necesarias.
8. Las respuestas iniciales deben ser más fáciles e interesantes. Las cuestiones de
la parte central del cuestionario deben abarcar las áreas más difíciles. Las
finales deben de ser, de nuevo, más interesantes (es cuando el sujeto se
encuentra más fatigado).
9. La redacción adecuada de las preguntas es de crucial importancia. La
presentación es esencial.
10. Al final del cuestionario es aconsejable, además de dar las gracias y ofrecer un
resumen de los hallazgos de la investigación, incluir una breve nota en la que se
solicite: a)la revisión de las respuestas al cuestionario, por si hay algún error o
se ha dejado alguna sin responder; b) la rápida devolución del cuestionario.
Correo inicial
11. Utilizar sobres de buena calidad, mecanografiados y si es posible
personalizados.
12. Utilizar franqueo de primera clase y sobres que no necesiten sello.
13. Incluir un sobre franqueado para la devolución del cuestionario.
14. Para las encuestas domiciliarias el mejor día para enviarlas es el jueves, para las
relacionadas con empresas y organizaciones el lunes o martes.
15. Evitar el correo en diciembre.
56
Carta acompañante
16. Debe indicar el objetivo de la encuesta y describir su importancia, asegurar la
confidencialidad y animar a que los sujetos contesten. Si se utilizan números de
serie u otros códigos, indicar el porqué.
17. Describir la encuesta como si estuviese realizada a medida para la audiencia
(por ejemplo una encuesta a los padres podría servir para mejorar el cuidado de
la infancia).
18. Dar el nombre del organizador o empresa que financia la encuesta, tanto en el
encabezamiento de la carta como en su cuerpo.
19. Una carta enviada con anterioridad a la encuesta propiamente dicha,
incrementa la probabilidad de la respuesta.
Carta de seguimiento
20. Es el factor más importante para asegurar una buena tasa de respuestas (aun
cuando se hayan aplicado todo el resto de sugerencias).
21. Enfatizar la importancia del estudio y el valor de la participación de los
respondientes.
22. Señalar la sorpresa de que todavía no se haya recibido la respuesta.
23. No sugerir que es común la no devolución.
24. Enviar una copia más del cuestionario y otro sobre franqueado.
Utilización de incentivos
26. Los incentivos que acompañan el correo inicial parecen ser más efectivos que
los que se utilizan cuando ya se han devuelto los cuestionarios (prometidos con
anterioridad).
CUADRO 2.1. Factores que aseguran una buena tasa de respuestas en las encuestas por correo.
Al igual que en las entrevistas personales, en las que se realizan mediante el teléfono
se hace uso de un entrevistador que, a través de este medio, se dirige al encuestado para
realizarle las preguntas que se incluyen en un guión y/o cuestionario. A pesar de que su
uso no fue, en un principio, muy generalizado, hoy en día, y gracias a la ampliación de
57
la cobertura telefónica, a la implementación de procedimientos de muestreo
automatizados como la RDD (Random Digit Dialing) y al desarrollo de entrevistas
telefónicas asistidas por ordenador (CATI, Computer-Assisted Telephone
Interviewing), representan la mayor parte de las encuestas que se realizan, debido, sobre
todo, a su rapidez.
Además de los tres tipos de encuesta que se han comentado, cabe distinguir otras
dos modalidades más en función de la manera en la que se recogen los datos: la
encuesta en grupo que utiliza un cuestionario autoadministrado, y la que se conoce con
el nombre de household drop-off. En el primer caso, se reúne a un grupo de sujetos en
un lugar determinado y se les solicita que contesten a un cuestionario. Las household
drop-off intentan combinar las ventajas de las entrevistas por correo y las de las que se
realizan cara a cara con la ayuda de un entrevistador. Este último se dirige al hogar de
los entrevistados para entregarles un cuestionario, indicándoles, en ese momento, la
fecha en la que volverá a recogerlo o en la que lo tienen que remitir por correo.
De reciente aparición son las encuestas vía Internet, que utilizan la red como medio
para la realización de encuestas. Sin duda, este último tipo de encuestas tienen un
futuro muy prometedor.
2.4.5. La elección del tipo de encuesta más adecuada en función de sus ventajas
e inconvenientes
Como es lógico, cada una de las diferentes modalidades de encuesta tiene una serie
de ventajas e inconvenientes (un resumen de las mismas se ofrece en los cuadros 2.2 y
2.3). De esta forma, y en función de las mismas, en algunos casos su uso estará
perfectamente indicado, mientras que en otros su administración puede implicar
importantes dificultades y costes muy elevados o, lo que es peor, conducir a graves
errores y sesgos.
Por lo tanto, el investigador habrá de conocer muy bien cuáles son las ventajas y los
inconvenientes que se asocian con cada tipo de encuesta para, en función de los
mismos, seleccionar el que más le convenga. Esta elección no es ni mucho menos
sencilla y, en muchas ocasiones, depende de la experiencia y buen juicio del
investigador. Sin embargo, es posible ofrecer una serie de recomendaciones en función
de las características de la población, la muestra, el tema de la encuesta, el tipo de
58
preguntas que se vayan a realizar, los sesgos que se puedan producir y ciertos aspectos
relacionados con su administración (Trochim, 1997).
59
cabo la encuesta, el investigador ha de tener en cuenta una serie de cuestiones
importantes.
En primer lugar, y al igual que se indicaba al hablar de la población, para realizar
encuestas postales o por correo tendrá que comprobar si dispone de las direcciones y/o
de los números de teléfono correctos de los encuestados.
Un segundo aspecto que habrá de tener en cuenta, sobre todo si se realizan
encuestas personales o telefónicas, es si las personas de la muestra van a estar
disponibles en el momento que se precise (por ejemplo profesionales de alto nivel y
muy ocupados). En caso contrario, una buena solución puede ser una encuesta tipo
drop off o por correo.
Así mismo, tendrá que considerar cuáles son las personas concretas que se
requieren para la encuesta. Si se precisa encuestar a individuos específicos y si se
dispone de un listado con su nombre y dirección no va a existir ningún problema para
realizar encuestas por correo. Si no es así, será preferible hacer uso de encuestas
personales.
60
telefónicas, pues será muy difícil mantener la atención de los encuestados durante toda
la encuesta.
Para terminar este capítulo se realizará una descripción esquemática del proceso
general que se lleva a cabo al realizar una investigación mediante encuestas,
independientemente de cuál sea el tipo que se utilicen.
Siguiendo a Oppenheim (1992) se pueden distinguir 14 pasos o etapas
fundamentales:
61
generales, que pueden venir determinados por un cliente externo o por los
propios intereses del investigador, será necesario concretarlos en objetivos de
investigación específicos que, a su vez, tendrán que expresarse en una serie de
objetivos operacionales, es decir, un conjunto concreto de hipótesis a investigar.
2. Es aconsejable revisar la literatura existente sobre el tema de investigación y, en
concreto, cualquier estudio que guarde similitud con el que se va a emprender.
3. Redactar un primer borrador del proyecto de investigación en el que se
especifiquen y relacionen, de manera lógica, los diferentes objetivos de la misma,
así como las tareas de investigación a partir de las cuales se van a cumplimentar.
En este momento puede ser aconsejable realizar un pequeño estudio exploratorio,
como por ejemplo, una serie de entrevistas en profundidad o de grupos de
discusión. Sin duda alguna, y a partir de los mismos, se realizarán algunos ajustes
sobre el borrador inicial de la investigación que se haya confeccionado.
4. Establecer el diseño de la investigación y evaluar su viabilidad en función de los
recursos y tiempo de los que se disponga. Este es un buen momento para
abandonar el trabajo o para reducir o hacer más realistas sus objetivos.
5. Decidir cuáles van a ser las hipótesis específicas que se van a investigar,
concretarlas en términos situacionales y especificar el tipo de variables que será
necesario medir.
6. Diseñar o adaptar las técnicas de investigación mediante encuestas más
adecuadas para realizar la investigación.
7. Llevar a cabo un estudio piloto de las técnicas que se hayan desarrollado o
adaptado (es decir, realizar ensayos con ellas) así como cualquier otro aspecto de
la investigación que se considere necesario.
8. Diseñar y establecer el tipo de muestra o muestras que se va a encuestar.
Especificar el tipo de representatividad que deben poseer y las condiciones
necesarias para que esto se consiga. Hace un estudio piloto de las estrategias de
muestreo que se vayan a utilizar.
9. Construir la muestra, esto es, seleccionar a la gente que debe ser encuestada.
10. Realizar el trabajo de campo. Esto implica la recogida de datos a partir de las
técnicas que se hayan diseñado con anterioridad (encuestas personales, postales y
telefónicas). Establecer y llevar a cabo estrategias de control adecuadas para
asegurarse que todo discurre según se haya establecido.
11. Procesar los datos. Para ello será necesario codificar las respuestas de los
encuestados e introducirlas en el ordenador.
12. Realizar los análisis estadísticos que sean pertinentes
13. Reunir los resultados que se hayan obtenido en los análisis anteriores y contrastar
62
las hipótesis de investigación.
14. Redactar el informe de la investigación. Es aconsejable que las conclusiones que
se obtengan se relacionen, si es posible, con los resultados que se hayan ofrecido
en otros trabajos similares y con las propuestas teóricas existentes en la literatura
especializada.
63
CAPÍTULO 3
SELECCIÓN DE MUESTRAS
Existen muchas ocasiones durante la lectura de un texto en las que la atención baja
sensiblemente y el lector termina entretenido en imágenes y sensaciones que nada
tienen que ver con el libro abierto. De hecho, puede ocurrir que pase alguna que otra
hoja sin retener absolutamente nada. Quizá sea eso lo que está pasando ahora o lo que
ha pasado antes de una segunda lectura.
Otra de las variantes en las que se sumerge un lector no muy implicado con la
cuestión que se trata en el texto (o la forma de tratarlo), es buscar tareas tangenciales
como contar letras, observar los márgenes o el espaciado entre palabras, etc.
Un ejercicio de interés puede ser el que consiste en fijarse en la figura 3.1 de la
página siguiente. ¿Podría contar cuántas veces aparece el símbolo ♂? Está claro que se
trata de un entretenimiento muy limitado. Con unos minutos de paciencia se puede
conseguir una solución. Inténtelo antes de continuar en el siguiente párrafo.
64
FIGURA 3.1. Disposición espacial de los símbolos ♣, ♠, ♂, ♬, ☼, ☺, ☻.
65
obtenido.
Pongamos, por ejemplo, que no estamos implicados en contar los simbolitos de la
figura 3.1, sino en encontrar cuántos andaluces fuman, al menos, diez cigarrillos al día.
Las conclusiones anteriores son también aplicables aquí:
1. Imaginemos por un momento que hay que salir a la calle y preguntar a cada uno
de los 7.314.644 andaluces si fuma y, en el caso de una respuesta afirmativa, si la
cantidad supera los nueve cigarrillos al día. ¿Cuánta gente y durante cuánto
tiempo se necesitaría para culminar con el objetivo de medición? Para la inmensa
mayoría de los mortales es una tarea inabordable.
2. Pero si alguien culminara el trabajo, ¿quién iba a creerse el resultado?
Posiblemente, para cuando se hubiera terminado el estudio, parte del conjunto de
personas encuestadas ya habría fallecido. Quizá ya no exista el tabaco para
entonces. Quizá estén todos y en las mismas condiciones, pero los encuestadores
hayan suministrado respuestas imprecisas y errores. Algunos encuestados lo han
sido varias veces. A otros no ha habido manera de localizarlos. Así pues, si se
culminara el estudio, ¿seguro que el porcentaje facilitado es el correcto?
66
3.2. Solución: encuestar sólo a una muestra
67
FIGURA 3.3. Cuadriculado de la disposición espacial de los símbolos ♣, ♠, ♂, ♬, ☼, ☺, ☻.
68
de selección, que la muestra sea representativa de la población, es decir, que los
resultados que se consigan al nivel de la muestra sean razonablemente
extrapolables a la población a la que representa o sustituye en el estudio.
4. No se ha medido directamente la población. En su lugar se ha puesto en marcha
una estrategia. Como resultado final, cabe esperar algún error durante el camino
de vuelta, ya que la población no tiene por qué coincidir con la estimación que se
hace de ella. En el ejemplo, se supone la existencia de 468 símbolos ♂, cuando
realmente hay 473. La diferencia entre el valor de la medida en la población y la
medida en la muestra (468 − 473 = 5) se desconoce en la práctica (conocer el
valor en la población es el objetivo de la investigación), pero cabe esperar que no
sea muy elevado. Esta esperanza es tanto mayor cuanto mejor se ha seleccionado
la muestra.
69
laboral? ¿Y el nivel y tipo de estudios? Es más, quizá existan variables importantes de las
que el investigador no suponga influencia alguna. Quizá el color de los ojos o la
longitud del cabello, por ejemplo.
Está claro que es imposible considerar a todas las variables con algún tipo de
repercusión sobre los objetivos de medida en la investigación. Entonces, ¿cómo
garantizar una muestra representativa? Respuesta: mediante el azar.
Si lanzamos una moneda al aire y dejamos que caiga, una vez que permanece
inmóvil mostrará una de sus dos caras. Será la cara A o la cara B. Si realizamos 100
lanzamientos, cabría esperar que aproximadamente en 50 ocasiones se haya obtenido A
y en las 50 restantes B. En este último resultado no ha intervenido la intención de quien
tira la moneda al aire. Quizá en los tres primeros lanzamientos se ha obtenido sólo A.
Pero conforme se ha continuado con la experiencia y si la moneda está equilibrada, el
resultado se ha ido acercando progresivamente a un porcentaje del 50% para ambas
caras.
Se puede repartir a 1.000 personas en dos grupos de 500 personas cada uno. Si la
repartición es aleatoria (se lanza una moneda al aire para decidir en qué grupo va cada
sujeto), cabe esperar que las proporciones de mujeres y hombres en cada grupo sean
equiparables en ambos grupos. Igualmente debe ocurrir con cualquier otra variable:
color de ojos, edad, número de calzado, aspiraciones políticas, cantante preferido, etc.
Por esta razón se establece que una muestra, para ser considerada representativa, ha
debido de ser obtenida mediante un procedimiento aleatorio.
No obstante el azar es eso, azar. Su comportamiento es imprevisible con total
exactitud. Por esta razón, los procedimientos de muestreo, aun basándose en la
selección aleatoria, establecen ciertas restricciones para garantizar el control específico
de algunas variables. Así, por ejemplo, en la investigación que nos ocupa en este punto
se pueden extraer dos muestras totalmente aleatorias: una de hombres y otra de
mujeres, con la cantidad de sujetos necesaria en cada caso para que la proporción de las
categorías de sexo coincidan con exactitud en muestra y población.
Más adelante se abordarán los diferentes procedimientos al uso para obtener
muestras aleatorias, bien sea con o sin restricciones o controles específicos. Lo que nos
importa aquí es comprender la importancia del azar para garantizar la representatividad
de una muestra. Esta importancia es la que fundamenta muchos aspectos en la
investigación por muestreo, como lo es la selección de los encuestados, el
comportamiento del encuestador, incluso el análisis de datos posterior.
70
La selección de una muestra concreta y no otra, corresponde a un macroapartado
dentro del marco más amplio de la investigación en su conjunto. Como cabe esperar
que ocurra, los pasos iniciales de la investigación y la especificación de los objetivos,
bañan todo el proceso hasta el establecimiento final de conclusiones, sin que el diseño
de la muestra sea una excepción.
Así pues, el esquema básico de una investigación por muestreo debe consistir en la
culminación de los siguientes puntos (un esquema mucho más completo y extenso
puede encontrarse en Campoy (1980), especialmente a partir de la página 30):
71
6. Construcción o selección y modificación de la/s herramienta/s de recogida de
datos.
7. Diseño del muestreo: “El diseño de la muestra es una programación preparada de
antemano destinada a recopilar y analizar la información necesaria para satisfacer
los objetivos del estudio al más bajo costo posible” (Lininger y Warwick, 1984:
69).
72
entorno, en lo que se refiere a la obtención y trabajo con la muestra.
3.2.4. Conclusión
73
ejemplo, Yates, 1981).
Sin duda alguna, uno de los aspectos que antes preocupan a un investigador que se
enfrenta a un estudio que requiere selección de una muestra es el tamaño de ésta (Feigl,
1978; Teijeiro, 1990; Sudman, 1983; Kalton, 1987; Fink y Kosecoff, 1989; Czaja y Blair,
1996). La decisión sobre el número de unidades a seleccionar no siempre está bien
fundada y, por el contrario, frecuentemente se encuentra en función de criterios como
la comodidad o el hábito (Manzano, 1996).
Observemos la figura 3.6. En ella se ha realizado un cuadriculado más pequeño que
en el caso de la figura 3.3. Como resultado, se han obtenido 8 × 6 = 48 porciones o
posibles muestras de la población de símbolos. Indudablemente, seleccionar una
muestra compuesta por una única cuadrícula y contar las ocurrencias del símbolo ♂, es
mucho más rápido y cómodo en la figura 3.6 que en la 3.3. No obstante, esta comodidad
conlleva consecuencias desastrosas. Para obtener una idea de lo que se está tratando,
seleccionaremos la primera cuadrícula (figura 3.4).
74
FIGURA 3.6. Cuadriculado de la disposición espacial de los símbolos (♣, ♠, ♂, ♬, ☼, ☺, ☻) en 48 porciones.
75
FIGURA 3.5. Ampliación de la cuadrícula tercera de la figura 3.6.
76
1. Debe considerarse el procedimiento de muestreo utilizado. Los procedimientos
difieren entre sí en varios aspectos, entre los que se encuentra la variación de
resultados posibles que son capaces de generar. Un procedimiento que
suministre un intervalo reducido de variación es preferible a otro con el que se
puede obtener cualquier cosa. En la comparación de procedimientos que se
abordarán posteriormente se entrará de nuevo en esta cuestión. Lo importante
aquí es que en función del procedimiento utilizado debe recurrirse a una u otra
expresión de cálculo para el tamaño de la muestra.
2. Debe quedar bien definido el grupo de variables importantes del estudio. En las
investigaciones mediante encuestas se recurre a cuestionarios con multitud de
preguntas. No todas son igualmente relevantes. Incluso, siempre hay algunas que
se pregunta por si acaso y considerando que son fáciles de hacer y responder. En
principio debería calcularse un tamaño de muestra para cada objetivo de medida
(estimar la proporción de respuestas afirmativas a la pregunta 12, estimar una
diferencia entre las medias de respuesta a la pregunta 8 por sexos, etc.). Pero tal
proceder es muy laborioso, especialmente sin el auxilio de herramientas de
software. Sin embargo, sí debería realizarse una estimación independiente del
tamaño de muestra para cada una de las preguntas u objetivos de medida que se
consideren especialmente importantes. No debe ocurrir que, tras realizar el
trabajo de campo, nos encontremos con que la estimación para un objetivo de
interés especial, es muy frágil, pues la muestra era demasiado pequeña para ese
objetivo (si bien, puede ser adecuada para otras estimaciones, dentro del mismo
estudio).
3. La exigencia sobre la cuantía concreta del tamaño óptimo no es ciega al contexto.
Unas pocas entrevistas más o menos no representan ninguna diferencia
apreciable ni en el tiempo empleado en la recogida de los datos, ni en el coste del
trabajo de campo, ni en la seguridad en los resultados. A su vez, ese intervalo de
variación aceptable para el tamaño de la muestra crece conforme disminuyen las
exigencias de control en el estudio. Así, por ejemplo, en los estudios piloto las
exigencias de control están relajadas, por lo que carece de sentido emprender la
búsqueda de un tamaño de muestra preciso. Los estudios piloto se realizan como
un ensayo general que pretende probar el cuestionario, los encuestadores y
cualquier otro elemento del proceso. También se utiliza para recoger información
previa de la población, necesaria para calcular el tamaño de la muestra definitiva,
como lo es alguna medida de variación de las características en la población. Se
tratará en el capítulo 5.
4. La utilización de tablas para calcular el tamaño no es muy recomendable.
77
Fomentan la salida fácil o cómoda, en detrimento de una solución adecuada. El
cálculo del tamaño más recomendable no implica mucho tiempo. Incluso la
fórmula más compleja llevará pocos minutos a un inexperto. Algo más difícil es
tomar decisiones previas al cálculo del tamaño, como las cuantías para el nivel de
significación, el error de precisión, las varianzas poblacionales, etc. En definitiva,
no merece la pena escatimar esfuerzos en la fase para el cálculo del tamaño de la
muestra. Lo único que implica es un poco de tiempo para el investigador
responsable de esta decisión. Si no se culmina adecuadamente, las consecuencias
sí pueden ser negativas, en términos de costes y/o credibilidad en los resultados
obtenidos.
5. Por último, uno de los aspectos que los investigadores noveles suelen pasar por
alto es la previsión de estimaciones independientes para diversos colectivos.
Cuando se establecen distinciones entre elementos de la población puede ser para
aumentar la representatividad de la muestra (como en el muestreo estratificado)
o para establecer conclusiones del estudio en cada uno de los subcolectivos o
dominios considerados en la población. En este segundo caso debe considerarse
que cada dominio o subconjunto es una población en sí y que, por tanto,
requerirá una muestra por separado. Tal circunstancia elevará con mucha
diferencia el tamaño final de la muestra.
78
Ni: número de elementos en el estrato i poblacional.
n: número de elementos en la muestra.
nC: número de conglomerados en la muestra.
σ2: varianza de la característica en la población.
σi2: varianza de la característica en la población, en el estrato i.
σe2: varianza de la característica entre los conglomerados de la población.
σd2: varianza de la característica dentro de los conglomerados de la población.
Zα/2: medida estandarizada del riesgo de errar en la estimación. Así, con una
probabilidad de errar de = 0,05, en una distribución normal, corresponde una
distancia estandarizada de 1,96.
ep: error de precisión o radio del intervalo de estimación.
δ: grado de correlación u homogeneidad entre conglomerados.
Muestreo estratificado:
79
Si se desconoce σd2, sustituir por σ2 − σc2.
Si se desconoce σc2, sustituir por
1. Sin norma, circunstancial o errático (Azorín, 1969): la muestra se toma sin seguir
un criterio claro, sin tener en cuenta consideraciones especiales para la obtención
de la muestra (Cyert y Davidson, 1965). El control por parte del investigador
sobre las fuerzas que actúan en la selección es nulo o casi inexistente. Es un
muestreo casual y fortuito (los primeros en llegar …). Es, únicamente, un trozo de
población. Para Ostle (1970), este apartado no es un tipo de muestreo, ya que por
definición una muestra es una parte de la población seleccionada de acuerdo con
algún criterio, regla o plan. Un tipo con un criterio muy cuestionable es el
80
deliberado o por segmentos (Chou, 1972): se escoge el segmento más accesible de
la población. Criterio: la comodidad. Un ejemplo de selección basada en la
accesibilidad es la selección de subpoblaciones previamente dispuestas, como los
grupos de clase o colectivos definidos en un espacio y estructura concretos:
determinados pacientes en un hospital, un barrio concreto, etc. Otro tipo de
muestreo fortuito, muy extendido especialmente en el ámbito académico, es el de
voluntarios, calificado de “muestreo realmente terrible” por Bradburn y Sudman
(1988: 137).
2. Selección experta o de juicio (Särndal y otros, 1992), donde el investigador acude
a un experto (que puede ser él mismo) que utiliza sus prejuicios, experiencia y
conocimientos previos, para decidir qué unidades deben ser incluidas en la
muestra por ser los elementos más representativos de la población. La selección
experta es preferida a la aleatoria en los casos en que la muestra debe poseer muy
pocos elementos y no se aspira a una inferencia probabilística (por ejemplo, en
algunos estudios piloto). Cuando la muestra es pequeña, la estimación
probabilística es muy imprecisa (el intervalo de estimación es muy amplio) y
pierde utilidad. En esta situación se confía más en la apreciación de un experto
que en el azar. El conocimiento de experto no desaparece en los modelos de
muestreo aleatorio, aunque no puede sustituir otros procedimientos de medida
objetivos (Hansen y otros, 1993). Es un componente de gran utilidad, pues
consigue reunir información pertinente para aumentar la representatividad de la
muestra. La diferencia estriba en que en el muestreo de experto, el conocimiento
de éste es el componente decisorio, mientras que en los modelos aleatorios, el
conocimiento del experto es una información complementaria con respecto al
procedimiento que es, en esencia, aleatorio. La selección propiamente de experto
y algunas variantes de ésta son denominadas también modelo intencional u
opinático (Azorín, 1969) o aplicando criterio (Raj, 1980).
3. En el muestreo por cuotas se combina el muestreo de experto con el
circunstancial (Bamett, 1974), generando un procedimiento no aleatorio, pero
sofisticado, de amplio uso (Derdo, 1980; Särndal y otros, op.cit.). Inicialmente se
recoge información sobre algunas variables poblacionales con respecto a las que
podría realizarse un muestreo estratificado. No obstante, la etapa de selección
aleatoria es sustituida por un procedimiento basado en la subjetividad del
encuestador. A éste se le suministra una tabla de contingencia, en la que figura el
número de encuestados que debe conseguir con perfiles determinados. Si bien se
puede recoger información más o menos compleja acerca de la distribución de
bastantes variables poblacionales, en la práctica esta información se circunscribe
81
únicamente a la edad y el sexo (Rodríguez Osuna, 1991). Dentro de cada
subpoblación (por ejemplo, varones de 25 a 35 años), la selección se realiza por
juicio del encuestador e intervienen factores ajenos a éste y no aleatorios, como
por ejemplo sus preferencias personales. Es un tipo de muestreo muy utilizado en
sondeos comerciales y que suele dar resultados satisfactorios. Pero si bien puede
ser más rápido y barato que un muestreo probabilístico, presenta la desventaja de
que no permite que se realicen inferencias científicas en función de la estadística,
por lo que no es recomendable en estudios a partir de los cuales deban tomarse
decisiones importantes (Rodríguez Osuna, 1991). El muestreo por cuotas ocupará
un espacio específico en el próximo capítulo, en el que nos ocuparemos de
estrategias de selección de encuestados.
4. Muestreo por bola de nieve (Noelle, 1970; Harvatopoulos, Livan y Sarnin, 1992):
se comienza a encuestar a unos pocos seleccionados, bien sea por su condición de
expertos o por criterios de disponibilidad. Tales contactos llevan a otros,
aumentando progresivamente el tamaño de la muestra hasta completar la
cantidad prefijada.
82
El objetivo “respetar las probabilidades” transciende el contexto teórico del diseño.
De hecho, para que el muestreo sea probabilístico no sólo hay que respetar las
probabilidades cuando se diseña un método de selección, sino también cuando se
realiza el estudio en el trabajo de campo. Es en el trabajo de campo cuando las
circunstancias prácticas pueden llegar a distanciar tanto el muestreo diseñado del real y
provocar que se pierda la condición de muestra probabilística (Rodríguez Osuna, 1991),
lo que puede ocurrir, por ejemplo, si el comportamiento de los encuestadores es
subjetivo.
En la práctica de la investigación por encuestas se parte de una misma probabilidad
de selección para todas las unidades de la población. El procedimiento de construcción
de la muestra debe comportarse de tal modo que la probabilidad de selección de un
habitante de un pueblo sea la misma que la de alguien que vive en la ciudad, la misma
para hombres y mujeres, zonas de la periferia o del centro, etc. En tales casos se habla
de muestras autoponderadas. Es una forma de indicar que el peso de todos los
individuos es el mismo. Si los de la ciudad tuvieran mayor probabilidad de pertenecer a
la muestra que los del medio rural, los primeros se encontrarían sobrerrepresentados,
frente a la subrepresentación de los segundos. En tales casos, la muestra ya no sería
autoponderada y debería ponerse en marcha un proceso de ponderación o
equilibración previo al análisis de datos, tal y como se abordará más adelante en el
apartado específico sobre este tema.
El proceso de inferencia o estimación estadística es un procedimiento establecido en
función de criterios probabilísticos. Para que pueda aplicarse una inferencia estadística
sobre los resultados obtenidos con una muestra, es necesario que la selección de ésta se
haya efectuado por algún proceso aleatorio (Aparicio, 1991: 11). En caso contrario no
puede realizarse una estimación probabilística; es decir, no puede conocerse el margen
de error, en términos de probabilidad, al afirmar que la estimación es o no acertada
(Deming, 1966; Sánchez Crespo, 1967; Chou, 1969; Mills, 1969; Stoetzel y Girard, 1973;
Cochran, 1976; McRae, 1978; Kish, 1982; Rodríguez Osuna, 1991).
Existe una amplia variedad de muestreos probabilísticos, especialmente los diseños
mixtos y multitud de variaciones. Sin embargo, unas pocas categorías abarcan, con
mejor o peor suerte, a todos estos modelos. Éstas serán las tratadas en el presente
apartado: muestreo aleatorio simple, estratificado y de conglomerados monoetápico,
con las variantes del muestreo de dominios y de conglomerados con submuestreo.
83
La denominación muestreo aleatorio simple es la más usual en la literatura. No
obstante, se encuentran otros sinónimos como muestreo irrestricto aleatorio o muestreo
probabilístico de elementos. Es el modelo más simple de la serie (Babbie, 1973; Barnett,
1974; Frankel, 1983; Sudman, 1983; Morsy, 1989; Silva, 1993) y, a su vez, la base teórica
sobre la que se asienta el resto (Yates, 1981; Martínez Arias, 1995b), de forma que
constituye el fundamento más trascendente de la teoría de muestreo (Kish, 1982; Stuart,
1984; Mirás, 1985; Levy y Lemeshow, 1991; Rodríguez Osuna, 1991).
Es, sin duda alguna, el procedimiento más simple de concebir, si bien en la práctica
es quizá el más difícil de implementar al enfrentarse con las imperfecciones del marco
o base de datos (Gorden, 1980; Bradbum y Sudman, 1988), según se verá en el último
apartado de este capítulo. Tal es el caso que “en investigación por encuestas es
virtualmente imposible producir la muestra aleatoria perfecta” (Hutton, 1992: 9), por lo
que no es un modelo utilizado usualmente (Hansen y otros, 1993) más que en
poblaciones pequeñas (Abad y Servín, 1978).
El procedimiento estándar para la consecución de una muestra aleatoria simple
parte de contar con un marco, listado o base de datos perfecta en la que se encuentra
toda la información necesaria sobre la identidad de las unidades de la población.
Mediante un procedimiento aleatorio son seleccionadas n unidades de la base de datos,
de la que se obtiene también la información sobre dónde se encuentran localizadas
estas unidades. El trabajo de campo consiste en establecer comunicación (personal,
telefónica o por correo) con las unidades y realizar la encuesta. Así, por ejemplo, las
unidades pueden corresponder a personas concretas, identificadas y numeradas. Un
procedimiento automático, como un programa de ordenador o la consulta repetida a
tablas de números aleatorios, genera una secuencia de n números aleatorios: son las
identificaciones numéricas de los sujetos seleccionados.
Para realizar una selección aleatoria existen, pues, varios recursos. Con la intención
de ser útiles, en el anexo 1 a este capítulo se encuentra una tabla de números aleatorios,
en el anexo 2 se describe una rutina breve en lenguaje BASIC para generar la selección
y en el subapartado software para el muestreo: SOTAM se describe, someramente, cómo
generar una selección aleatoria con el programa SOTAM.
En el muestreo aleatorio simple, las unidades de muestreo coinciden con los
elementos de la población. Además, todos son equiprobables. Estas dos características
simplifican mucho los cálculos y las expresiones sobre las estimaciones. Suelen
distinguirse únicamente dos tipos:
1. Sin reemplazo o sin reposición: los elementos de una muestra son todos
diferentes, no existen repeticiones.
84
2. Con reemplazo o con reposición: los elementos de la población pueden ser
seleccionados, en teoría, más de una vez para la misma muestra, es decir, existe la
posibilidad de encontrar en una muestra el mismo elemento en más de una
ocasión.
Desde el punto de vista de las deducciones teóricas, los modelos con o sin
reemplazo se traducen en independencia o dependencia, respectivamente, en las
probabilidades de selección, aspectos que llevan a expresiones diferentes para la
estimación de las medidas poblacionales.
Pero desde la práctica de la investigación de encuestas, un modelo con reemplazo
carece de sentido. Se argumenta que conforme el tamaño de la población tiende a ser
infinito, la probabilidad de repetición de unidades tiende a ser cero. Considerando que
las expresiones algebraicas para el muestreo con reposición son más sencillas, se
entiende la tendencia a escoger este modelo, especialmente cuando el tamaño de la
población es relativamente grande. Sin embargo, la distinción con/sin reemplazo es
artificial y de difícil aplicación conceptual en la práctica de la investigación por
encuestas. Partiendo de un modelo sin reposición, el único coherente en investigación
social, se llega a expresiones que contienen al tamaño de la población como variable
independiente. Deducidas las expresiones cuando N→∞, se llegan a los formatos que
corresponden para modelos con reemplazo. Con ello, el dilema con/sin reposición es
totalmente sustituido desde la discusión de tamaños de población grandes o pequeños,
aspecto este último que sí resulta planteable en investigación por encuestas.
Un ejemplo real concreto puede consistir en seleccionar alumnos desde la base de
datos de una universidad. En tal estudio, el marco es bueno: contiene la identificación
de cada alumno así como su localización tanto particular como del centro, curso y
asignaturas en las que se encuentra matriculado.
85
La extracción no implica, pues, n selecciones aleatorias, sino tan sólo una: la
primera unidad. Además, el arranque j también es un número aleatorio entre 1 y k =
N/n. La expresión N/n es denominada coeficiente de elevación.
Suele indicarse que el período o salto sistemático (que coincide con el número de
muestras posibles) es k = N/n. No obstante, puede ocurrir que N/n no sea un número
entero, es decir, que N no sea múltiplo exacto de n. En ese caso k debe aproximarse a la
parte entera de N/n (simbolizado por I(N/n)) o de esta cantidad más uno. Para
cualquier caso, las expresiones que hemos deducido son:
86
que se pretende medir, lleva a ejercer un control específico. Con respecto a la variable
con influencia (sexo, edad, nivel de estudios…) se establecen h categorías. Para cada
categoría se extrae una muestra aleatoria de la población. Por ejemplo, si la variable que
interesa controlar es la edad, considerando las categorías joven, adulto y anciano, se
extraerá una muestra de J jóvenes, D adultos y A ancianos. De esta forma, la muestra
final tendrá un tamaño de cuantía n = J + D + A.
Cada uno de los subconjuntos generados por la variable de control se denomina
estrato. La denominación recuerda al ámbito de la geología, donde un estrato se
corresponde con una capa homogénea. De hecho, cabe esperar que los individuos se
parezcan más entre sí dentro de los estratos y difieran más de unos estratos a otros, con
respecto a la característica que se pretende medir.
La distinción entre estratos, si se conocen medidas poblacionales en éstos, permite
reducir el error tipo (Gorden, 1980; Levy y Lemeshow, 1991) y, con ello, disminuye el
tamaño requerido para la muestra (American Institute of Certified Public Accountants,
1973; 1974b).
Conocer las medidas de los estratos poblacionales puede ser uno de los objetivos del
estudio, con independencia de que también interesen medidas del conjunto de la
población. No obstante, en tal caso, cabría utilizar con más propiedad la denominación
muestreo de dominios. El objetivo de la estratificación es aumentar las garantías de
representatividad y reducir la variación posible de la característica, consiguiendo un
tamaño de muestra más reducido. Si se pretende establecer conclusiones
independientes por estratos, éstos deben considerarse como poblaciones
independientes, definición del muestreo de dominios.
Se llama afijación al procedimiento de reparto de las unidades de muestreo en los
diferentes estratos que componen la muestra. Existen varios procedimientos de
afijación, cada uno de ellos con determinadas consecuencias para la estimación:
1. Uniforme o igual: todos los estratos son del mismo tamaño en la muestra. Rara
vez se utiliza, pues ignora los tamaños poblacionales, información de la que
puede disponerse. En términos de precisión en la estimación, esta afijación
favorece a los estratos poblacionales pequeños y perjudica a los de mayor tamaño.
Si la población cuenta, por ejemplo, con 10.000 mujeres y 500 hombres y son
seleccionados 100 sujetos de cada colectivo, de cada cinco hombres será
seleccionado uno, mientras que sólo se contará con una de cada cien mujeres.
Queda clara la diferencia en términos de representatividad de los colectivos en la
muestra.
2. Proporcional: el tamaño del estrato i en la muestra ni es proporcional al tamaño
87
del estrato en la población Ni. Es decir:
88
varianza. Como efecto secundario, los cálculos se complican al perderse la
autoponderación de la muestra.
4. De compromiso: el muestreo proporcional posee un inconveniente importante si
los estratos poblacionales cuentan con tamaños muy desiguales. La submuestra
del estrato poblacional más pequeño puede contar con un ni, excesivamente bajo,
de tal forma que no pueda mantenerse la hipótesis de que se trata de una
submuestra representativa (la estimación al nivel de ese intervalo dará lugar a
intervalos desmesuradamente amplios). El ejemplo de 100 mujeres y 5 hombres
es claro al respecto. Una muestra de 5 unidades es ridícula para la casi totalidad
de las investigaciones imaginables e inadmisible en investigación por encuestas.
Una solución consiste en aumentar el tamaño total de la muestra hasta conseguir
que todos los ni sean de cuantía satisfactoria. Pero esta medida puede generar un
tamaño de muestra demasiado grande, con un coste prohibitivo. Otra solución es
la afijación de compromiso. En ésta se establece un tamaño mínimo para toda
submuestra. El resto de los elementos que son seleccionados hasta completar el n
muestral se reparten por estratos de forma proporcional. Como efecto secundario,
los cálculos se complican al perderse la autoponderación de la muestra.
5. Óptima: es una variación de la afijación de mínima varianza, considerando
además un coste particular en la obtención de cada submuestra. En la afijación
óptima se busca la mínima varianza para un coste dado o el mínimo coste para
una varianza dada. No obstante, es éste último un tipo de muestreo infrecuente,
salvo en el contexto de instituciones especializadas (institutos de estadística,
empresas de sondeos de opinión, etc.). En tales casos, sucesivos estudios sobre la
misma población y las mismas variables centrales ayudan a concretar medidas
aceptablemente fiables sobre las varianzas de los estratos poblacionales, con
respecto a esas variables centrales. Una vez que se considera que las varianzas se
conocen suficientemente, se está en disposición de realizar muestreos
estratificados con afijación de Neyman u óptima, lo que permite aspirar a la
misma precisión en las estimaciones, reduciendo costes.
Hay muchos modelos que consiguen una afijación óptima (mínima varianza para
un n dado, mínimo n para un coste dado, etc.), depende de los objetivos que se persigan
(Koti, 1988). En cualquier caso, los sistemas de afijación diferentes al proporcional
requerirán de una fase de ponderación previa al análisis de datos definitivo (Hedges,
1980) (ver apartado de consecuencias del muestreo en el análisis de los datos).
Mirás (1986) realiza algunas comparaciones de precisión entre las afijaciones
proporcional y óptima, con respecto al muestreo simple aleatorio, concluyendo que:
89
— La afijación proporcional genera mayor precisión que el muestreo aleatorio
simple. Esta afirmación es tanto más cierta cuanto más diferentes son las medias
de los estratos.
— Las afijaciones óptimas y de Neyman son más precisas que la proporcional. Esta
afirmación es tanto más cierta cuanto más diferentes sean los errores típicos de
los estratos.
90
aisladamente, sino que su extracción implica la selección del resto de unidades
elementales que forman el conglomerado al que pertenece.
Si la probabilidad de selección de los conglomerados es proporcional al número de
unidades elementales que los componen, se trata de un modelo de muestra
autoponderada, por lo que la inferencia puede realizarse sin operaciones especiales
intermedias. De esta forma, un conglomerado con 400 unidades debe tener el doble de
posibilidades de ser seleccionado en la muestra, con respecto a un conglomerado de
200 unidades.
Un concepto útil para estudiar la eficacia del muestreo por conglomerados es δ, el
co-eficiente de homogeneidad:
donde:
N = número de conglomerados.
M = tamaño medio de los conglomerados.
Xij = unidad i del conglomerado j.
Xt = media de las medias de los conglomerados.
σ2 = varianza total.
El caso más usual es b), puesto que cabe esperar mayor homogeneidad dentro de los
conglomerados que entre ellos. Así pues, usualmente el muestreo de conglomerados
implica una pérdida de precisión en las estimaciones, frente al muestreo aleatorio. No
91
obstante, presenta dos ventajas muchas veces decisivas para la planificación del trabajo
de campo:
3.5.5. Variantes
Las variaciones que pueden realizarse partiendo de los modelos básicos expuestos
en las anteriores páginas, son muchas. En el presente trabajo, cuyo objetivo no es ser
perfectamente exhaustivos en este sentido, se expondrán las variantes más comunes: los
llamados muestreos de dominios y bietápico.
A) Muestreo de dominios
Las denominaciones que recibe este modelo no son unívocas. Quizá la más
extendida sea la de muestreo de dominios (Kish, 1982; Chaudhuri y Stenger, 1992;
Säardal y otros, 1992).
Existen algunas ocasiones en las que los objetivos de inferencia implican dos niveles
de conjuntos de referencia. Las poblaciones en las que se pretende aplicar las
inferencias cambian según el nivel de análisis. Este tipo de muestreo tiene la apariencia
de un modelo estratificado, con la salvedad de que las clases son también, y a
determinado nivel de análisis, poblaciones. Así pues, en el muestreo de dominios
interesa concluir tanto a nivel de toda la población como a nivel de cada uno de los
dominios contemplados (Särndal, 1984).
92
Un ejemplo concreto de este tipo de procedimiento de muestreo es el caso de una
investigación a nivel de una comunidad autónoma, en la que no sólo se pretende extraer
conclusiones (realizar inferencias) a nivel de toda la comunidad, sino también en cada
provincia.
En una primera actuación cada provincia es una población. Por tanto, dentro de
cada provincia se realiza un muestreo que puede utilizar cualquiera de los
procedimientos descritos hasta el momento. Una vez finalizada la fase de recogida de
datos y realizadas las inferencias a nivel de provincia, éstas pasan a ser consideradas
estratos de la población global o comunidad autónoma, estableciendo las inferencias al
nivel de ésta.
Lo esperable en tales casos es que la representación de las provincias en la muestra
final no sea proporcional al tamaño de cada una, puesto que la selección se ha realizado
procurando una inferencia con suficiente poder a nivel de cada provincia. Esta
circunstancia requiere que, previo al proceso de inferencia a nivel de toda la región,
deba realizarse una ponderación de los datos en función de la provincia de
procedencia: las provincias sobrerrepresentadas en la muestra final (de menor tamaño
poblacional) deberán ponderarse con pesos inferiores a la unidad, mientras que las
provincias infrarrepresentadas en la muestra final (de mayor tamaño poblacional)
deberán ponderarse con pesos superiores a la unidad. De esta forma, un muestreo de
dominios puede conceptualizarse como un muestreo estratificado con afijación óptima
o de Neyman, donde el tamaño de muestra es tal que permite estimaciones
independientes por clase. Debe considerarse que el objetivo de inferencia en el
muestreo estratificado no es cada una de las clases, sino la población en su conjunto,
por lo que las estimaciones por clase generan errores de precisión muy grandes.
La utilización de este modelo de muestreo se encuentra tan extendida que Hedges
(1980: 61) afirma que “en la práctica, el determinante principal del tamaño de muestra
es casi siempre la necesidad de observar separadamente los resultados de los diferentes
subgrupos en la muestra total”.
En principio cabe esperar que un muestreo bietápico sea aquél que se realiza en dos
etapas. No obstante, aunque esto es cierto, se utiliza la denominación para referirse a un
dos-etapas en particular.
La muestra final se obtiene como resultado de seleccionar unidades elementales de
los conglomerados que, en una primera actuación, han sido seleccionadas de la
población. Así, en la primera etapa se realiza un muestreo de conglomerados cuyo
93
resultado es una muestra intermedia de gran tamaño. En la segunda etapa, llamada
submuestreo se consigue la muestra definitiva con una selección de unidades
elementales utilizando como conjuntos de referencia a las clases seleccionadas en la
primera etapa.
El proceso permite resolver problemas de marco referentes a la falta de información,
razón por la cual es sin duda uno de los modelos de muestreo más extendidos (Jolliffe,
1984; Särndal y otros, 1992). Para culminar la primera etapa basta con tener
información sobre la identidad y tamaño de los conglomerados (no de sus elementos
constituyentes). En la segunda etapa únicamente interesa reunir información útil de los
conglomerados seleccionados (no del resto). La existencia de submuestreo hace del
modelo bietápico un diseño de selección de muestras especialmente poderoso, “no en el
sentido de que sea más preciso para iguales tamaños de muestra, sino en el sentido
práctico: se puede introducir donde otros esquemas no tienen cabida prácticamente”
(Abad y Servín, 1978).
En el ejemplo de las provincias, en una primera etapa son seleccionados municipios
dentro de cada provincia. En la etapa de submuestreo, son seleccionadas unidades
elementales únicamente dentro de cada uno de los conglomerados que han sido
seleccionados.
En el muestreo llamado polietápico, cada etapa consiste en la consecución de una
muestra cada vez más pequeña y de tales características que la información que se posee
de ella es cada vez más precisa. Por ejemplo, en un muestreo de conglomerados con
tres etapas, se obtendría una muestra de conglomerados en la primera etapa (por
ejemplo, municipios); en un momento posterior se seleccionan conglomerados de
menor tamaño dentro de los que han sido seleccionados en la etapa anterior (por
ejemplo, secciones censales dentro de los municipios seleccionados); y, por último, de
estos últimos conglomerados serán obtenidas las unidades finales que constituirán la
muestra (personas dentro de las secciones censales seleccionadas).
Como suele ocurrir no hay una regla fácil. En principio y desde la teoría estadística,
el muestreo estratificado es el más recomendable porque permite obtener las muestras
de menor tamaño posible, manteniendo fijas el resto de exigencias en el proceso de
inferencia. No obstante hay algunos inconvenientes claros frente a este consejo:
94
que aunque se puede acceder a esta información, se sospecha que las variables
consideradas no tienen influencia sobre la característica a medir, por lo que no
existirán diferencias entre estratos y el esfuerzo de la estratificación será en
vano. En ambas ocasiones, será más recomendable el muestreo aleatorio.
2. No obstante, el muestreo aleatorio simple tampoco es posible en multitud de
ocasiones, puesto que requiere una base de datos especial y unas condiciones
propicias de aplicación que no se encuentran habitualmente. Una posible
solución es improvisar aleatoriamente sobre la marcha mediante la aplicación de
las rutas aleatorias de las que nos ocuparemos en el próximo capítulo. Otra es
aplicar un muestreo de conglomerados con submuestreo en donde se emplee el
espacio entre ambas etapas para completar la base de datos de los
conglomerados seleccionados.
Aun así, los párrafos anteriores sólo consideran la relación entre el procedimiento
de muestreo y los problemas con el marco o listado de unidades. Por lo general, existen
muy serias limitaciones económicas para decidir tamaños de muestra, pagos de
encuestadores, tiempo implicado en el trabajo de campo, material invertido, etc. Si se
incluye el argumento del coste, indudablemente el procedimiento más barato es el de
conglomerados monoetápico, puesto que disminuye el tiempo del trabajo de campo
(menos gastos en dietas y sueldos fijos) y las distancias que deben recorrerse para
realizar las encuestas (menos gastos en concepto de desplazamiento).
No obstante, cuando se combinan todos los argumentos, la solución no es única ni
fácil. El muestreo de conglomerados es más barato, pero genera mayor variación de la
característica en el muestreo, por lo que requiere un tamaño de muestra sensiblemente
mayor que en el estratificado, por ejemplo. En cada caso se verá si la limitación
económica puede más o menos que la precisión. Así hay tres grupos principales de
argumentos que no van en la misma dirección a la hora de aconsejar un modelo u otro:
los costes, la precisión y la información de base. Así, ordenando a los cuatro
procedimientos específicos abordados según las tres variables mencionadas, se obtiene
el resultado del cuadro 3.1.
CUADRO 3.1. Ordenación de cuánto consigue un procedimiento de selección de muestras, con respecto a tres
95
variables de interés.
96
categórica como, por ejemplo, que 11 de cada 23 ciudadanos fuman al menos un
paquete al día. Pero esto es imposible.
En el ejemplo, el investigador considera que la proporción de fumadores de al
menos un paquete de tabaco es p = 11/23 = 0,478 con respecto al total de los ciudadanos
(de no importa dónde). No obstante, puede que el verdadero valor en la población sea ≠
0,356. La diferencia entre ambos
em = δ* − δ
Una primera aproximación al manejo del error muestral es plantear una medida de
su varianza, es decir, cómo varía el error de una muestra a otra. Si ocurriera que existe
una gran variabilidad, entonces el investigador debería sentir bastante indefensión a la
hora de establecer sus conclusiones, ya que su muestra puede ser una de las muy
abundantes muestras raras de la población (es decir, que suministran valores para δ*
muy alejados de δ). La varianza de δ* con respecto a δ, es decir, el error muestral al
cuadrado por término medio (al igual que ocurre con la justificación para la expresión
de cálculo de una varianza, en ECM, se eleva la diferencia entre los elementos para
transformar las diferencias en cantidades positivas), recibe el nombre de error
97
cuadrático medio, con la expresión:
Como resulta obvio, este proceso empírico no se hace. Primero porque si somos
capaces de obtener todas las muestras posibles de la población, es que podemos medir
directamente a ésta, con lo que el muestreo carece de sentido. Y, segundo, porque en la
práctica no se pueden obtener todas las muestras posibles (por ejemplo, de una
población de tan sólo 40 unidades, pueden obtenerse alrededor de 140.000 millones de
muestras diferentes de tamaño n = 20, con un muestreo aleatorio simple)
Luego la siguiente expresión del error cuadrático medio es más correcta que la
anterior, puesto que no indica una extracción empírica real, sino que se muestra en
función de valores esperados:
Al igual que ocurre con cualquier varianza, su manejo resulta incómodo, puesto que
utiliza unidades cuadráticas. La solución más sencilla es calcular la raíz cuadrada del
error cuadrático medio. El resultado tiene la sugerente denominación de error total del
muestreo:
Así pues, el error total del muestro indica una medida de la dispersión que cabe
esperar en el error muestral. Cuanto mayor sea su cuantía, más esperable resulta
98
obtener una muestra cuyo δ* esté alejado de δ.
¿En qué medida es útil ETM(δ*)? Lo cierto es que no para mucho. El problema del
error muestral es que resulta desconocido a los ojos del investigador. El error
cuadrático medio y su derivado, el error total del muestreo, no sólo manejan el error
muestral, sino que añaden otro problema más: el total de las muestras posibles (con las
restricciones señaladas). No obstante, si bien directamente es inmanejable, de forma
indirecta puede obtenerse alguna información de utilidad práctica. Para ello, vamos a
definir el concepto de sesgo en un estimador como la diferencia entre su valor esperado
y la función poblacional que se pretende estimar (B = E(δ*) − δ). Con ello:
E(B)2 = B2
E(B[δ* − E(δ*)]) = B · E[δ* − E(δ*)] = B·0 = 0
De esta forma, se observa que el error cuadrático medio (el cuadrado del error total
del muestreo) puede subdividirse en dos elementos más. Por un lado, la varianza del
estimador (V[δ*]) y, por otro, su sesgo al cuadrado (B2). Ambos son también medidas
de error, no sólo por participar de ECM(δ*), sino también por méritos propios:
1. La varianza del estimador tiene una fácil interpretación: cuanto mayor sea su
cuantía, mayor dispersión de valores suministra el estimador y, por tanto,
menos fiable es su medida, menos creíble es el resultado δ* como sustituto o
representante del verdadero valor poblacional δ. Por las mismas razones que
hemos comentado en la traducción de ECM a ETM, es preferible manejar la
raíz cuadrada de V(δ*), función que recibe la denominación de error tipo, error
típico o error estándar:
2. Para el sesgo, existen expresiones que muestran su cálculo, si bien están también
en función de variables poblacionales. Fijémonos que el sesgo de un estimador
podría ser bautizado como error muestral medio o valor esperado del error
99
muestral:
100
equivalente a “3,5 ± 0,5”. En este último caso, 3,5 representa el valor del estimador,
mientras que 0,5 es el radio del intervalo de estimación. Es obvio que conforme el radio
sea mayor, más difícil será que el investigador se equivoque en la inferencia.
El radio del intervalo de estimación ha recibido varias denominaciones. Se puede
encontrar incluso “error muestral”. Grave error, puesto que su cuantía es desconocida,
tal y como se ha visto en el subapartado anterior. Hay quien lo denomina “error de
estimación”, con cierta lógica linguística. Sin embargo, también se puede encontrar la
expresión “error de estimación” para referirse a la discrepancia entre δ* y δ. Nosotros
preferimos la expresión error de precisión (ep) (Manzano, 1996). Cuanto mayor es ep,
más imprecisa es la estimación, puesto que el intervalo es mayor.
Usualmente se define el proceso de estimación por intervalo indicando que existe
cierta dosis de confianza (probabilidad) en que el valor de la función poblacional de
interés δ se encuentre dentro del intervalo de estimación. Si denominamos a ese valor
de probabilidad con la letra griega λ, entonces:
p (δ ∈ (δ* ± ep)) = λ
p (em ≤ ep) = λ
101
valor de probabilidad que aparece antes que los datos. Muy relacionado con él está el
grado de significación estadística. Es un valor de probabilidad que se calcula con los
datos del estudio y que representa el riesgo calculado de errar al rechazar la hipótesis
nula. El investigador procederá al rechazo si ocurre que el riesgo calculado (grado de
significación) es inferior al máximo establecido (nivel de significación). Así pues, el
grado es un valor de probabilidad que aparece después que los datos.
En la estimación estadística, la confianza en que δ se encuentre en el intervalo
puede ser calculada o establecida. En la situación más frecuente, el investigador decide
un valor para λ, y, tras obtener los datos, calcula ep, construyendo seguidamente el
intervalo. No obstante, resulta viable (y así se ejercita con no poca frecuencia), construir
primero el intervalo de estimación (es decir, definir primeramente un valor para ep) y
después calcular λ.
No es éste el lugar más apropiado para sugerir diferentes símbolos para las
diferentes situaciones, no obstante, sí es deseable que el lector sepa discriminar que
encontrará tanto valores de λ calculados como pre-establecidos, y tanto con el símbolo
p, como α.
Hasta el momento se han tratado diversos errores. Se comenzó con el total del
muestreo, desglosable en el error tipo y en el medio. Tras ese discurso teórico, pasamos
a situaciones más prácticas: el contexto de estimación, en el que apareció el error de
precisión y los riesgos asociados. Es el momento de ver tales conceptos con algún
ejemplo práctico.
Para ello, consideramos una población de 7 unidades y la selección de una muestra
de 4 elementos. Son posibles, por tanto = 35 muestras diferentes. En cada una de
ellas vamos a calcular la media aritmética, el error muestral y el cuadrado de ambos
valores para posteriores operaciones.
Con respecto a la población:
Datos: 5, 3, 8, 7, 4, 5, 3 5Media:
Como se observa en la quinta columna del cuadro 3.2, la suma de los errores
muestrales es cero, por lo que estamos ante un estimador insesgado, por esta razón su
valor esperado coincide con la media poblacional y el error total del muestreo con el
error tipo.
102
103
CUADRO 3.2. Ejemplo de una población de 7 unidades y la selección de una muestra de 4 elementos.
La distribución muestral de la media en este ejemplo no sigue una ley normal. Pero
estos datos concretos nos resultan útiles no sólo para ejercitar los conceptos y sus
104
expresiones asociadas, sino también para observar la relación entre los errores muestral
y de precisión en una estimación por intervalo.
Supongamos que el investigador decide un error de precisión de 1/2. Su intención
es, por tanto, realizar una estimación por intervalo con una “anchura” de una unidad.
Al realizar la selección de unidades obtiene la muestra identificada con el número de
orden 16 en la tabla anterior (5, 8, 5, 3). La media correspondiente es 5,25. Luego,
construye el intervalo:
El centro del intervalo es 5,25, valor al que suma y resta el error de precisión ep = 0,5
para obtener los extremos (4,75; 5,75). Se observa que el valor μ = 5 se encuentra cri el
intervalo, por lo que la estimación es un acierto (em = 0,25 < 0,5 = ep).
Supongamos ahora que la muestra obtenida es la 22 (3, 8, 7;5), cuya media es 5,75.
Por tanto:
3.7.1. Ponderación
105
que un peso diferencial de los subcolectivos implicados en la muestra es indeseable.
Esta idea trae consigo el que los elementos constituyentes de la población tengan
una representación acorde a su relevancia: aquellos con mayor representación en la
población deben tener un peso también mayor en la muestra. Cuando el procedimiento
de selección consigue respetar este principio, se habla de muestras autoponderadas. Si,
por el contrario, los elementos tienen en la muestra una importancia desigual con
respecto a la población de origen, procede realizar una manipulación previa al análisis
de datos, que recibe el nombre de ponderación de casos (Adams, 1989).
En el contexto de los modelos de muestreo considerados en el presente trabajo, dos
son las situaciones en las que puede violarse la autoponderación:
La ponderación de casos consiste en aplicar un peso a cada dato que puede diferir
de 1. En el análisis de datos, el peso sustituye a la frecuencia tradicional o, en otros
términos, la frecuencia habitual de cada dato (1) constituye un caso particular de peso
en el que todo caso tiene la misma importancia. Denominando wi al peso en la muestra
del dato i, podemos distinguir tres situaciones, según el grupo de procedencia del dato:
106
mayor que la unidad, de tal forma que la suma de pesos corresponda a la
frecuencia total teórica en una muestra autoponderada.
3. (wi = 1). Las frecuencias de los datos de este colectivo no requiere ninguna
manipulación previa. Si tal peso coincide en todos los grupos, se trata de una
muestra autoponderada.
3.7.2. Varianzas
Una vez realizado el muestreo y analizados los datos al nivel de la muestra, procede
establecer las inferencias y concluir consecuentemente. Para realizar estimaciones se
requiere construir un intervalo de valores alrededor del estadístico calculado (una
proporción, por ejemplo). La estimación por intervalo requiere, entonces, un valor
107
central (el estadístico), una medida de variación de la distribución muestral (el error
típico, en función del tamaño de la muestra y del modelo de muestreo) y una medida de
seguridad en la estimación (distancia estandarizada en la distribución teórica de
probabilidad). En el caso de la estimacióin de una proporción:
π ∈ (p ± Zα/2 σp)
a) Muestreo aleatorio
b) Muestreo estratificado
108
donde NC es el número de conglomerados en la población, nC es el número de
conglomerados en la muestra, n es el número de unidades elementales en la
muestra, N es el número de unidades elementales en la población y los
estimadores de las varianzas poblacionales entre y dentro conglomerados ( , y
, respectivamente), corresponden a los componentes típicos del análisis de la
varianza:
109
realizando estimaciones para el total de la población y para los colectivos contemplados
(Fuller y otros, 1986).
La segunda de las soluciones consiste en ingeniar estrategias tales que permitan
utilizar el software estadístico convencional, de tal forma que los resultados de la
inferencia sean sensibles al procedimiento de extracción de muestras utilizado.
Existe una estrategia para conseguir que el software estadístico comercial realice
inferencias, considerando el procedimiento de extracción de muestras utilizado en la
investigación cuyos datos se analizan (Manzano, 1996). Consiste en modificar la
varianza de los datos de la muestra antes de hacer la inferencia. Para ello, si la intención
es estimar la media o la proporción (u otra medida poblacional) de la característica X,
bastará con generar la variable derivada Y mediante una transformación simple de X
consistente en:
Y = k(X − X) + X
b) Muestreo estratificado
110
d) Muestreo de conglomerados con submuestreo
• Basadas en los censos. Son los listados oficiales de que disponen las instituciones
públicas: los ayuntamientos e institutos de estadística nacional o por
comunidades autónomas. Una de las funciones de los institutos de estadística es
facilitar información a la población. Por ello, cuentan con servicios específicos de
atención e información. Por un lado publican los resultados censales
periódicamente y en varios formatos. Alguno de ellos nos será de utilidad.
Inclusive, algunos institutos cuentan también con una base informatizada,
implementada en software que se puede adquirir o consultar y que permite
construir un archivo de salida, como por ejemplo el programa SIMA, del Instituto
de Estadística de Andalucía. La información más actual, no obstante, se encuentra
en el padrón municipal, pero éste no siempre está disponible ni organizado
convenientemente. Depende del ayuntamiento de que se trate, pueden tenerse
más o menos facilidades para obtener información.
A pesar de su carácter oficial, los censos no son perfectos. Por ello y con el
objetivo de adecuarse lo más posible a los hechos, los datos referidos a la
población se encuentran divididos u organizados en dos categorías: población de
derecho (la que debería encontrarse) y población de hecho (la que parece que se
111
encuentra realmente). No obstante la actualización de los datos oficiales se realiza
con relativa lentitud considerando la motilidad de las poblaciones. Pero es muy
útil y aunque no coincida con total exactitud (aspiración imposible) los errores
entran en el saco de las imprecisiones admisibles.
Por lo general, los datos oficiales se estructuran en tablas de contingencia con
abundantes subdivisiones donde constan las frecuencias por zonas, edades, sexo,
nivel de estudios y año de actualización.
Los problemas más frecuentes se derivan de cambios en la estructura de los
municipios (uniones y disgregaciones completas o parciales), la ausencia de
información en el censo con respecto a variables de interés y problemas de
colaboración con los ayuntamientos. Ante cualquiera de ellos, una salida viable y
fácil, que además permite obtener una información aproximada, es la estimación
lineal. Pongamos por caso que se carece de la repartición de frecuencias, por
categorías de edad, para un municipio, pero sí se cuenta con su total poblacional
(número total de empadronados). A partir de la tabla de contingencia o de
estratificación de la provincia (que consta en la información pública del instituto
de estadística nacional y de la comunidad), se puede reproducir la repartición al
nivel del municipio, manteniendo los mismos porcentajes, proporciones o
razones que a nivel de la provincia. Por ejemplo, si de 450.000 habitantes de la
provincia, 198.000 son hombres (un 44%), se estimará que de los 3.500
empadronados en el municipio, 1.540 serán hombres (aplicando 3.500 × 44). No
obstante y por lo general, existe una buena disposición por parte de los
ayuntamientos para facilitar información global (número de mujeres, por
ejemplo, no identificaciones personales), por lo que en algunas ocasiones basta
incluso con una llamada por teléfono para obtener la información necesaria.
• Basadas en listados comerciales. Existen empresas cuyo único cometido es
almacenar datos de posibles compradores. Cuentan con esta información y la
venden a quien esté dispuesto a comprarla. La información cuenta con nombres,
apellidos, dirección y algunas características de interés como el estado civil, sexo
y edad, y una idea del poder adquisitivo a partir de la zona de residencia, tipo de
ocupación o, directamente, nivel de ingresos.
Si bien el origen de estas bases de datos puede ser muy variado, un
procedimiento frecuente consiste en aprovechar el consentimiento de la persona
a registrar por medio de un regalo seguro o un sorteo. Así, por ejemplo, para
recibir en casa una mantelería, un muñeco de peluche, un libro de recetas o una
casita de plástico, el interesado rellena un cupón con sus datos personales y lo
envía por correo. Al respecto, cada vez es más frecuente observar en tales cupones
112
un pequeño texto donde se indica algo así como “si usted desea que sus datos
sean borrados de nuestra base, por favor, indíquelo tachando la casilla adjunta”.
Estos marcos son de interés puesto que cuentan con información actualizada y
específica. Pero suelen ser propiedad de la marca que ha gestionado su obtención.
Por esta razón, la entidad comercial que desee hacer uso de una base de datos
similar, deberá comprar la información a una empresa especializada.
• Ligadas al contexto: cuando la población de interés no es la población global sino
una de características muy específicas, puede existir un marco asociado de fácil
localización. Por ejemplo, si se desea hacer una encuesta en una cadena de
comercios, la entidad tiene la identificación exacta de todos sus empleados. Otro
caso: un estudio con estudiantes universitarios. En las dependencias
administrativas de la universidad que se trate, tienen la identificación y
localización de cada uno de los estudiantes matriculados durante el curso
académico actual. Otro más: una encuesta sobre satisfacción con el producto,
promovida por una empresa de coches. La entidad cuenta con una base de datos
donde figura, incluso, el número de teléfono de los clientes.
En las bases de datos ligadas al contexto es donde menos problemas se
encuentra el investigador en el caso, claro está, de que el estudio esté promovido
por la entidad propietaria de la información.
Las investigaciones mediante encuestas por teléfono y por correo son las que
disponen de un marco más fácil de conseguir, si bien más difícil de actualizar. En las
encuestas por teléfono la exigencia mínima es contar con la definición o características
de los números de teléfono de interés. Pueden corresponder sólo a un prefijo
determinado y variar únicamente parte de los dígitos situados más a la derecha. Es
difícil contar con una base de datos de números de teléfono aparte de las empresas de
teléfono, obviamente. Por lo que la selección de números mediante un procedimiento
automático debe hacerse mediante generación aleatoria.
Por otro lado, la existencia de un listín telefónico no facilita la tarea en el sentido de
que la selección aleatoria es tediosa, exige esfuerzo y está sujeta a error. Si se utilizara el
listín, un procedimiento aconsejable es poner en marcha un muestreo sistemático con
arranque aleatorio. Se supone que la distribución de los abonados es, en la práctica,
aleatoria, ya que se disponen por orden alfabético, característica que cabe esperar que
no correlacione con ninguna de las variables de interés. La utilización del soporte
impreso, frente al informático, tiene la ventaja de que permite descartar los números
que no corresponden a domicilios particulares.
Por último, existe una limitación muy criticada con respecto a las encuestas
113
telefónicas: el sesgo de cobertura. Mientras que todos los habitantes habitan en algún
sitio, no todos tienen un teléfono de localización. No obstante, este problema decrece
con velocidad, de tal forma que las encuestas por teléfono se muestran como una
poderosa alternativa (en tiempo y, sobretodo, en costes) a las personales o cara a cara.
En referencia a las encuestas por correo, si éstas se realizan con direcciones
concretas, las imperfecciones del marco corresponden a problemas de recogida o
actualización de la información por parte de las empresas dedicadas a ello. No obstante
suele estar en vigor un acuerdo entre las dos partes interesadas según el cual la
comunicación de una dirección errónea desde la entidad encuestadora a la propietaria
de la base de datos, es gratificada de alguna forma. La mínima recompensa se traduce
en una nueva dirección, pero pueden existir variantes como descuentos en el
presupuesto, direcciones extra, etc. Consideremos que ambas entidades están
interesadas en que la base de datos sea actual: quien encuesta porque ello aumenta las
garantías de una muestra aleatoria, quien suministra la base porque aumenta la calidad
de ésta.
Con respecto al sesgo de cobertura, cabe señalar que las encuestas por correo no
pueden aspirar a encuestar a cualquier tipo de población (inicialmente al alcance del
procedimiento cara a cara). Sin embargo, en la práctica no interesa cualquier tipo de
población, de tal forma que el procedimiento es seleccionado si existe un marco
adecuado a la población de interés.
La famosa expresión popular “del dicho al hecho hay mucho trecho” tiene una
aplicación directa en investigación mediante encuestas cuando se trata de obtener la
muestra que se ha diseñado. El primer problema ha sido abordado en el subapartado
anterior: el marco del que se dispone no es perfecto. Pero el problema más grave con el
que se encuentra el investigador viene después, cuando debe contarse con la
colaboración de la población y recoger la información de interés. Hay gente que no se
encuentra, otros que se localizan pero que no responden y otros que responden pero no
a todo. En cualquier caso, tales sucesos se aglutinan en torno a un problema común,
omnipresente y de gran trascendencia en investigación mediante encuestas: el
fenómeno de la no-respuesta.
No es de extrañar, pues, que sea “éste uno de los problemas de no muestreo que más
atención ha recibido por parte de los investigadores del método de encuestas”
(Martínez Arias, 1995a: 499). Y ello principalmente por dos inconvenientes de peso que
114
genera: disminuye el tamaño de la muestra y provoca un sesgo importante en los
resultados (Adams, 1989: 105; Aparicio, 1991: 60; Levy y Lemeshow, 1991: 303) al no
contar con la información proveniente de subpoblaciones concretas (a las que
representan las unidades faltantes en el conjunto final de datos). Cuando alguien no
responde a una encuesta, cabe sospechar que exista alguna variable que pueda explicar
tal acontecimiento y es posible que esa variable tenga relación con la característica que
se pretende medir. Pongamos por ejemplo que no se consiguiera la colaboración de
buena parte de los empresarios en una investigación sobre el futuro laboral. ¿Quién
creería los resultados del estudio?
Es preceptivo el facilitar una medida de éxito en la participación de la población, a la
hora de facilitar los resultados del estudio. Esta medida es conocida como tasa de
respuesta (tr): número de unidades que han sido encuestadas con respecto al número
de unidades que deberían haber sido encuestadas.
Pero ¿cómo de alta debe ser la tasa de respuesta? La contestación es muy sencilla: “la
regla general es ‘cuanto más alta mejor’” (Fink y Kosecoff, 1989). Pero la aspiración al
100% es utópica. Groves y Kahn (1979: 3-4) facilitan algunas explicaciones al respecto:
Aspectos a los que podríamos añadir la influencia negativa que sobre la actitud de la
población frente a las encuestas se ejerce desde la venta a domicilio (Manzano y otros,
1996). De hecho, si una investigación no pública alcanza una tasa de respuesta superior
al 90% puede considerarse un verdadero éxito. Con mucha frecuencia, lo esperable es
trabajar con tasas inferiores al 90% incluso en estudios donde se realizan revisitas.
En general, cabe señalar una falta de máxima motivación o implicación en
responder, lo que explica en parte el éxito de los censos precedidos por campañas de
concienciación (Aparicio, 1991). Por otro lado, la conciencia de este problema lleva a
los investigadores, especialmente en Psicología Social, al estudio de los conceptos de
altruismo y conformidad como factores explicativos de la cooperación de los potenciales
entrevistados en las encuestas (Groves, 1990).
Por otro lado, la ausencia de respuesta puede ser debida a diferentes categorías de
115
carácter técnico que tienen influencia en el modo en que son calculados los índices
descriptivos de la no respuesta. Así, Lessler y Kalsbeek (1992: 123-125) indican las
siguientes categorías:
116
Los problemas de no-respuesta en los tres procedimientos de encuestas son
diferentes. En términos generales, la cuestión es la misma: no se ha obtenido respuesta
por parte del seleccionado. No obstante, existen ciertas particularidades.
En la entrevista cara a cara, el encuestador cuenta con información y habilidades
para resolver dudas, motivar e indagar respuestas, por lo que aumenta la probabilidad
de obtenerlas.
En la entrevista por teléfono, no existe la invasión de la intimidad y la seguridad que
el encuestado puede sentir o temer ante una entrevista cara a cara, por lo que el acto de
coger el teléfono resulta más fácil que el de abrir la puerta. Pero igualmente, es menos
agresivo colgar el teléfono que cerrar la puerta, cuando no se desea continuar con la
conversación. En general, depende mucho de las habilidades del encuestador,
características de su voz, tipos de pregunta y longitud del cuestionario.
La entrevista por correo es, sin duda, la que muestra menor tasa de respuesta. La
sensación de compromiso con el encuestador (por teléfono o cara a cara) no existe,
puesto que es el procedimiento menos personal. Por otro lado, cuando una persona es
entrevistada por teléfono o cara a cara, ése es el momento y el lugar, mientras que
responder a un cuestionario que se ha enviado por correo puede aplazarse
indefinidamente. Se han puesto en marcha procedimientos para reducir la no-respuesta
que pasan principalmente por facilitar la tarea (cuestionarios breves y fáciles de
responder que impliquen poco esfuerzo y que incluyan el sobre sellado para su
devolución) y motivar al encuestado (con textos de interés e incentivos económicos o
regalos). En el capítulo próximo, sobre selección del encuestado, volveremos
brevemente sobre esta cuestión, que, por otro lado, ya fue tratada en el capítulo anterior.
Pero sea cual fuere el procedimiento aplicado y mientras no existan fundamentadas
razones para suponer lo contrario, el colectivo de unidades que no responden cuenta
con unas características definitorias cuya ignorancia puede invalidar con facilidad los
resultados del estudio, al menos si se mantiene la misma población objeto inicial. De
este modo, la tasa de respuesta no debería influir en el cálculo del tamaño óptimo de la
muestra. La estrategia más recomendable es insistir en las unidades seleccionadas pero
no entrevistadas. Al respecto, el encuestador tiene instrucciones precisas para insistir en
la entrevista, quedar con los que comparten la vivienda con el seleccionado para pasar
más adelante…
Una estrategia muy recomendable, desde la teoría del muestreo (que no desde la
práctica de las limitaciones económicas), es tratar al colectivo de unidades de no-
respuesta como una población de la que debe obtenerse una muestra, por lo que se debe
poner en marcha una investigación paralela a la principal, incluyendo especialmente la
fase de recogida de datos.
117
3.8.3. Los encuestadores
Realizar una buena investigación mediante encuestas implica una dosis alta de
esfuerzo por parte de los diseñadores del estudio. Deben tomar muchas decisiones a lo
largo del proceso y algunas de ellas requieren un dominio profundo de conocimientos
teóricos y prácticos. En tales circunstancias, se agradece la existencia de productos del
software que ayuden a tomar decisiones. En el presente subapartado se menciona uno
de ellos: SOTAM (Manzano, 1997, 1998), mediante el que un investigador social puede
obtener ayuda en puntos diferentes del proceso del diseño y selección de muestras.
El cometido principal de SOTAM es ayudar al investigador a tomar una decisión
sobre el tamaño óptimo de la muestra. No obstante incluye multitud de utilidades
118
tangenciales: decisión procedimiento de encuesta, modelo de muestreo, selección de
encuestados, elaboración de informes, etc. En cuanto a lo visto en el capítulo, SOTAM
permite:
119
modelo de distribución, la estética o formato de la tabla de salida, etc.,
incluyendo una utilidad que genera tablas específicas para encuestadores en la
realización de las rutas aleatorias. La tabla que se muestra en el anexo 1 ha sido
construida por SOTAM.
La figura 3.7 muestra una relación de módulos ejecutables del programa, en el caso
de que el usuario escoja el procedimiento de navegación por módulos.
120
FIGURA 3.7. Relación de los módulos de acción de SOTAM, en función del menú de pertenencia.
121
Anexo 2: Rutina Basic para la selección de unidades
El listado que sigue ha sido probado en GWBASIC y en QBASIC sin problemas. En
122
la ejecución, pregunta por el tamaño de la población y de la muestra así como el
nombre del archivo de salida en el que grabar la selección. Como resultado se obtiene
un listado de números aleatorios que representan las unidades seleccionadas.
Por ejemplo, en una población con 5.000 unidades de la que se requieran 60 para la
muestra, se puede obtener:
Listado:
123
CAPÍTULO 4
SELECCIÓN DEL ENCUESTADO
4.1. Introducción
124
Una vez que tengamos una base de datos útil y disponible, la selección del
encuestado se reduce a realizar n decisiones aleatorias, siendo n el número de
encuestas a realizar.
En investigación comercial es comprensible que no se realice un muestreo
propiamente dicho, sino más bien una selección de subpoblaciones. Así, si la base de
datos cuenta con información sobre posibles compradores de características muy
dispares, en lugar de realizar un muestreo aleatorio de todos, puede interesar mucho
más el encuestar a todos los que se encuentran en la base que cumplen con ciertas
características peculiares, como es el tener un coche cuando la entidad que encuesta es
una empresa de seguros, por ejemplo.
En investigación social sí que se requiere la extracción de una muestra en su sentido
más estricto. Con el marco a mano puede resultar fácil realizar una estratificación
previa y seleccionar a los encuestados (con su identificación completa) desde un
despacho.
Una vez realizada la selección, lo más complicado del proceso consiste en poner en
marcha una estrategia que aumente la probabilidad de obtener respuesta. Por ello (en el
capítulo 2 el lector puede encontar un listado de acciones recomendables en las
encuestas por correo, orientadas a disminuir la no-respuesta) se han de cumplir las
siguientes condiciones:
125
más información, resolver dudas o aportar sugerencias o comentarios.
c) Sobre con dirección y franqueado (a ser posible con solapa autoadhesiva), de
tal forma que el encuestado únicamente tenga que introducir el cuestionario
resuelto, presionar la solapa y echar en el buzón.
d) Es muy recomendable incluir un incentivo independiente de la motivación
que haya podido crear el texto específico de información (que posiblemente
no sea mucha). El incentivo puede medirse en términos de dinero en
metálico o un regalo material. Al respecto existe cierta controversia acerca de
si es mejor recompensar antes o después de que el encuestado envíe sus
respuestas. Ocurre que al hacerlo antes, el seleccionado no tiene que
responder para obtener su regalo. Si se hace después, puede que tampoco
responda pues no tiene seguridad de que vaya a recibir su regalo después de
que la empresa responsable ya tiene lo que quería (sus respuestas). Los
incentivos económicos tienen, como cabe esperar, un efecto positivo en el
sentido de que aumentan la tasa de respuestas (Scott, 1975; Church, 1993),
pero en términos globales son preferibles pequeños incentivos, puesto que
permiten el mejor equilibrio entre tasa de respuesta y coste de la
investigación (James y Bolstein, 1992).
126
dígito por algún producto de software (Bradburn y Sudman, 1988; Burkheimer y
Levinsohn, 1988; Massey, 1988; Nicholls II, 1988), puede ocurrir que:
El segundo de los problemas tiene una solución fácil si los números de la población
de interés se encuentran claramente delimitados, con un mínimo y máximo o mediante
prefijos. Para el problema 1 no existen repercusiones en el análisis al considerar el
hecho como una unidad ficticia que es ignorada, con lo que no incrementaría la tasa de
no respuesta. En la generación por ordenador, si se encuentra conectado a la red puede
hacerse que sea éste el que marque el número e, inclusive, dé una señal acústica y/o
visual al encuestador con respecto al hecho de que se ha establecido contacto.
Una vez con el número seleccionado y marcado se requiere un procedimiento
mediante el cual se realice contacto con quien va a ser finalmente encuestado. Es
posible que nadie coja el teléfono, en cuyo caso éste debe ser anotado (o registrado en
una base específica, en el caso de llamada por ordenador) para repetir la llamada en
otra ocasión. Es posible que alguien coja el teléfono pero que no reúna las características
necesarias para ser encuestado e, incluso, que no las reúna nadie de la vivienda. Es
posible que exista una persona en la vivienda con el perfil adecuado para la encuesta,
pero que no pueda acceder al teléfono en esos momentos (no está o se encuentra
indispuesto). En definitiva, la selección del número no implica selección del
encuestado, sino que se trata de un paso previo.
Como señala Fowler (1993), la decisión sobre qué persona en concreto entrevistar
depende en primer lugar del tipo de investigación que se está realizando. Si la
información es genérica sobre el domicilio y fácil de transmitir (por ejemplo cuántos
trabajan, si disponen de otra vivienda, etc.) puede servir cualquier adulto que se
encuentre disponible. Si la información es genérica pero especializada, conviene
preguntar por la persona con mayores conocimientos sobre el tema. En el caso de que la
investigación verse sobre temas particulares y sea previsible, por tanto, que diferentes
personas en un mismo domicilio darían distintas respuestas, será necesario establecer
el mecanismo para seleccionar a una persona en particular. Dadas las similitudes que
presenta esta situación con la que se produce en las encuestas a domicilio, postergamos
su descripción a un apartado posterior en este capítulo.
127
Ya se abordaron en el capítulo anterior algunas de las características de este
procedimiento de selección de muestras: es una estrategia no aleatoria, que descarga en
el encuestador buena parte de la representatividad de la muestra, si bien se intenta
garantizar un mínimo mediante la utilización de tablas de contingencia.
En la práctica, la entidad que gestiona el estudio obtiene un marco de la población
de interés con algunas características definidas para determinadas variables o
subpoblaciones. Usualmente, se cuenta con la repartición de la población en una doble
estratificación: por sexos y edades. El investigador elabora x tablas de contingencia
como la que figura en el cuadro 4.1, generalmente por zonas de encuesta. Estas tablas de
contigencia, de estratos o de cuotas, son suministradas a los encuestadores.
128
quizá en representatividad, pero a costa de reducir una de las principales ventajas del
muestreo por cuotas, como es su sencillez.
Cuando interesa obtener una muestra aleatoria de una población, para realizar una
investigación mediante encuestas y con el procedimiento cara a cara, si no se cuenta
con información precisa que identifique las unidades a seleccionar, pueden aplicarse
algunas de las siguientes soluciones:
129
Durante la consecución de la ruta, el encuestador irá seleccionando viviendas, en
una primera fase, y encuestados dentro de cada vivienda seleccionada, en un momento
posterior. Ambos aspectos van a ser tratados a continuación y en el mismo orden.
130
5. Selección de un posible encuestado, dentro de la vivienda.
El quinto punto será abordado en el siguiente apartado. Ahora nos ocupa dar
solución a las situaciones 1 a 4.
131
FIGURA 4.1. Ejemplo de posibles inicios de ruta para el encuestador.
132
FIGURA 4.2. Itinerario en el que se sigue la acera seleccionada (dibujo sombreado) y cambia en cada giro.
En efecto, los municipios, con sus distritos, secciones censales y barrios, están
construidos con una apariencia caótica: manzanas de tamaño y forma muy dispares se
entrelazan con calles rectas y curvas, largas y breves. A su vez, aparecen muros, plazas,
glorietas, callejones, ríos, puentes, desniveles, etc. Por ello, la regla de seguir la acera y
cambiar el sentido con ésta, debe matizarse en función de las excepciones a un trazado
monótono de los municipios:
1. Un callejón será considerado una entrada en una acera, de manera que forma
parte de ésta y no varía el sentido de la ruta (figura 4.3a).
2. La decisión de cambiar de acera como procedimiento sistemático al variar el
sentido de la marcha, podrá aplicarse cuando existan dos aceras (dos
alternativas). La figura 4.3b muestra una situación en la que, al girar, la otra
alternativa no es tal: en el lugar opuesto se encuentra una zona no habitada (sin
viviendas): la tapia de una fábrica o edificio público, un puente, un río, una
plaza, etc. En tal caso, el encuestador insiste en la acera en la que se encuentra,
hasta que puede aplicar de nuevo la regla del cambio de acera.
3. Las variaciones progresivas de sentido son conflictivas por cuanto varían la
dirección de la marcha pero no muestran un cambio brusco tal que permitan
definir con claridad un cambio de acera. Tal situación se muestra en las figuras
133
4.3c y 4.3d. La decisión puede mantenerse en el sentido de variar únicamente
ante un cambio brusco (c) o, ante la percepción del cambio gradual, escoger la
otra acera como referencia (d). Cualquiera de ambos procederes debe ser
indicado al encuestador antes de abordar la zona, pues de lo contrario estaría
mediatizado por la situación.
Recordemos que la regla general es tomar decisiones aleatorias, por lo que ante
cualquier duda acerca de qué camino y acera considerar, bastará con consultar la tabla
para el encuestador.
CUADRO 4.2. Operaciones a realizar con respecto a la selección de los edificios de la figura 4.4, con C = 15.
134
previo. En el cuadro 4.2 se simboliza con S el monto o suma de viviendas contadas
durante el trayecto y E al número de viviendas del edificio en cuya entrada o acceso se
encuentra el encuestador. El procedimiento implicaría los siguientes pasos:
135
FIGURA 4.4. Ejemplo de selección de edificios (marcados con un punto).
D) Selección de la vivienda
136
FIGURA 4.5. Selecciones en un edificio en función de la tabla del anexo 1.
Como vimos antes, la situación que se produce cuando alguien abre la puerta de su
vivienda es similar a la que se produce cuando descuelga el teléfono. En ambos casos,
suele ser necesaria una selección de las personas dentro del domicilio hasta determinar
la persona a la que finalmente se realizará la encuesta. No debemos olvidar que en
ambos casos nos encontramos ante procedimientos de muestreo aleatorios y que
debemos respetar esta aleatoriedad hasta el final del proceso si no queremos
desvirtuarlo. En este sentido, la regla general de actuación consistiría en (Fowler, 1993,
op. cit.):
137
muestra al encontrarse sobrerrepresentadas las personas más dispuestas, en contra, por
ejemplo, de las que prefieren seguir sentadas viendo el televisor.
Por otro lado, hemos visto cómo el proceso hasta seleccionar la vivienda o el
número de teléfono estaba totalmente estructurado, no dejando cabida a la subjetividad
del entrevistador. Es conveniente que esta estructuración se mantenga hasta el final, por
lo que el procedimiento suele quedar recogido en un documento conocido como guía
de la entrevista. Se trata de un esquema que permite al encuestador conducir con éxito
el inicio de la entrevista (Harvatopoulos, Livan y Sarnin, 1992). Aunque esta guía
comprende desde el momento en que alguien abre la puerta hasta el momento de
finalizar la entrevista (Manzano y otros, 1996), en este punto nos limitaremos a la parte
destinada a la selección definitiva del encuestado.
No existe un formato universal de guía de la entrevista. Cada investigación concreta
requerirá del desarrollo de una guía propia. Sin embargo, en el apartado dedicado a la
selección del encuestado, todas compartirán un esquema similar, encaminado a
desarrollar los tres pasos señalados con anterioridad.
138
al encuestado. La diferencia entre los procedimientos de Dillman y Trodahl y
Carter radica en que en el del primero la tabla es constante, mientras que en el
de los segundos varía de encuesta a encuesta.
1. Saludo y presentación.
2. Pregunta: ¿Cuántos hombres mayores de edad viven en esta casa?
3. Respuesta: 2 (por ejemplo)
4. Pregunta: ¿Y cuántas mujeres entre 18 y 45?
5. Respuesta: 3.
6. El entrevistador suma las dos respuestas, obteniendo 5 posibles encuestados.
Por tanto, consulta en una tabla como la del anexo 1 el cruce de la fila 4
139
(número de entrevista) y la columna 5 (número de candidatos), el resultado es
el número 2.
7. Pregunta: ¿Podría hablar con la segunda más joven de esas personas?
140
141
CAPÍTULO 5
ELABORACIÓN DEL CUESTIONARIO
5.1. Introducción
142
común y la experiencia colectiva acumulada. Este capítulo pretende contribuir a
consolidar el cuerpo de conocimientos sobre la elaboración del cuestionario en la
investigación mediante encuesta.
Los objetivos del mismo son:
143
La definición tiene la virtud de la generalidad: abarca todas las posibles formas de
administración de la encuesta (“cara a cara”, por teléfono o autoadministrada); y recoge
todo el conjunto de posibles preguntas (demográficas, factuales, de opinión, etc.).
La delimitación conceptual de otros términos cercanos ha sido tratada en capítulos
anteriores, no obstante, a continuación se presentan algunas definiciones simples para
quienes estén realizando una lectura independiente de los capítulos.
La pregunta está ligada a una previa: ¿por qué utilizar una encuesta? El cuestionario
es el instrumento de recogida de información en la encuesta. Las razones que hayan
llevado a realizar la encuesta son las que motivan la elaboración del cuestionario.
No obstante, la respuesta a la pregunta “¿por qué utilizar una encuesta?” debe tener
en cuenta las ventajas y limitaciones del cuestionario como instrumento de recogida de
información. De manera escueta, podemos recoger las ventajas e inconvenientes
apuntados por Munn y Drever (1995). Las ventajas son las siguientes:
144
— Responde a objetivos descriptivos. Resulta difícil diseñar el cuestionario para
contribuir a la explicación de relaciones entre variables.
— Superficialidad de la información. Es la contrapartida a la estandarización. La
formulación de preguntas homogéneas impide profundizar en las respuestas de
los encuestados.
— Difícil elaboración. El proceso de elaboración del cuestionario lleva tiempo y
requiere experiencia y conocimientos específicos. No es fácil elaborar
cuestionarios de calidad.
145
constructo “liderazgo” puede resumir comportamientos como “repartir tareas”, “fijar
objetivos”, “resolver problemas”, etc. Resulta obvio que la medición de un constructo
debe empezar enumerando los comportamientos que el constructo engloba, tarea
tradicionalmente denominada “definición operacional”. Lord y Novick (1968), para
superar una limitación clara de esta versión operacionalista de la medida, plantearon la
necesidad de incluir en la definición del constructo el conjunto de las relaciones del
constructo con otros constructos y/o variables comportamentales. Esta doble
aproximación a la definición de los constructos es hoy día ampliamente aceptada por
los profesionales de la medida.
¿Qué papel juega el cuestionario? Para responder a este interrogante, además de
considerar el cuestionario como un todo, necesitamos prestar atención a las preguntas y
tests que lo forman. Todos compartiremos la idea de que el proceso de medida no es
una situación “natural”. No podemos esperar a que las personas muestren de manera
espontánea los comportamientos fijados como representativos de la variable. Debemos
provocar la aparición de esos comportamientos. Esta es la función de las preguntas y
tests del cuestionario: “provocar” las respuestas que servirán de indicadores del
constructo a medir. La figura 5.1 reproduce esta argumentación.
Este esquema permite utilizar una definición de medición muy adecuada para la
146
elaboración del cuestionario. Sullivan y Feldman (1994) consideraron que la medida en
las Ciencias Sociales es el proceso de “ligar” los conceptos abstractos de las teorías con
indicadores empíricos, o de otra forma, la puesta en práctica de un plan sistemático,
explícito, para “clasificar”, y en la mayoría de los casos “cuantificar” los datos
particulares en términos de los conceptos más generales del esquema teórico.
Sin embargo, el proceso de “conectar” los indicadores empíricos con los conceptos
teóricos dista de ser fácil. Torgerson (1958) analizó una de las dificultades más
evidentes: la falta de acuerdo sobre los indicadores empíricos de la mayoría de los
constructos psicológicos. Foddy (1996) recoge una serie de problemas que podrían
desanimar a cualquiera que iniciara la elaboración de un cuestionario. Sólo se apuntan
algunos:
En fin, sólo con buenas dosis de optimismo y falta de pudor se puede alguien
embarcar en la tarea. La mayoría de los problemas apuntados inciden sobre la relación
entre la respuesta y el constructo en la que la pregunta o test juega un papel de
“mediador”. Esta relación se puede debilitar por factores que introduzcan una
variabilidad no deseada en las respuestas. No olvidemos que el responsable de la
medición pretende atribuir las diferencias en las respuestas sólo a diferencias en la
variable que se pretende medir. De ahí la denominación de “errores de medida” para
estas fuentes indeseables de variación. El estudio de los errores de medida ha sido
tradicionalmente responsabilidad de dos áreas de investigación: la fiabilidad y la
validez. El tratamiento detallado de ambas cuestiones queda fuera del alcance de este
capítulo. Ahora sólo nos interesa apuntar su significado, ya que serán los criterios que
nos conducirán en la elaboración de las preguntas. Detengámonos un momento en cada
uno:
147
Por ejemplo, la redacción ambigua de una pregunta, la inclusión de una palabra
con un significado técnico, la situación en que la persona responde al
cuestionario (“ruido”, “temperatura”, “tranquilidad”, etc.). Resulta difícil
predecir cómo estos factores pueden influir en las respuestas. Desde una
perspectiva pragmática el mandato de este criterio durante la elaboración del
cuestionario podría resumirse así: por un lado, dos encuestados con el mismo
valor en la variable deberían damos la misma respuesta; y por otro, un
encuestado preguntado en dos ocasiones distintas debería damos la misma
respuesta, si no ha cambiado su valor en la variable.
b) Validez. El responsable de la encuesta persigue atribuir las diferencias en las
respuestas de los encuestados sólo a la variable que pretende medir. Por
ejemplo, las diferencias en las respuestas a la pregunta “¿a qué partido votaría si
mañana hubiera elecciones?” sólo se explicarían por la diferente “intención de
voto” de los encuestados”. Durante la elaboración del cuestionario debemos
procurar no “abrir la puerta” a fuentes sistemáticas, variables distintas a la que
queremos medir, que adulteren la interpretación de las mediciones.
La forma en que se hacen las preguntas determina las repuestas que se obtienen.
Dicho así puede parecer una obviedad: preguntas diferentes obtendrán, naturalmente,
respuestas diferentes. Pero es importante caer en la cuenta del efecto sobre las
respuestas producidas por pequeños cambios en la redacción de las preguntas.
Fink (1995a) propone un ejemplo ilustrativo de cómo pequeños cambios –una o dos
palabras– en la redacción de las preguntas pueden cambiar las respuestas. El ejemplo
compara estas tres preguntas sobre una hipotética subida de impuestos para financiar
las pensiones:
148
— ¿Apoyaría un aumento de los impuestos para financiar las pensiones?
— ¿Apoyaría un aumento de sus impuestos para financiar las pensiones?
— ¿Apoyaría un aumento del 10% en sus impuestos para financiar las pensiones?
La cursiva indica el elemento de las preguntas que puede cambiar el sentido de las
respuestas. Las tres preguntas podrían formar parte de encuestas con el mismo objetivo.
No sería aventurado apuntar una progresiva disminución en la frecuencia de respuestas
afirmativas a medida que se concreta la formulación de la pregunta.
La recomendación está clara: todas las palabras utilizadas al redactar una pregunta
cuentan. Además un consejo: al leer los resultados de una encuesta no se ha de mirar
únicamente los gráficos, hay que prestar un poco de atención a la redacción de las
preguntas.
149
El autor del cuestionario no puede ignorar que las respuestas obtenidas serán
después interpretadas. Anticipar las interpretaciones le proporcionará otro elemento
clave para valorar la calidad de las preguntas e instrumentos que desee incluir en el
cuestionario.
150
El primer paso en la elaboración del cuestionario es describir con el mayor detalle
posible el objetivo u objetivos que pretende lograr. Obviamente, la primera fuente de
información es el objetivo de la encuesta. No olvidemos que el cuestionario es el
instrumento de recogida de información de la encuesta: el objetivo de la encuesta es el
objetivo del cuestionario. Los problemas pueden aparecer si el objetivo de la encuesta no
está definido con precisión. Dada la continua interacción entre los pasos de la
investigación por encuesta, el inicio de la elaboración del cuestionario puede ser un
momento oportuno para retomar el objetivo de la encuesta. Harvatopoulos, Livan y
Sarnin (1992) consideran que un cuestionario puede responder a tres objetivos:
Sea cual sea el objetivo, debe estar definido con precisión. Ahora bien, ¿cómo saber
si el grado de precisión de la definición es suficiente? Nos atrevemos a proponer dos
criterios que pueden ayudar a valorar la claridad de los objetivos:
— Cualquier persona que lea la declaración del objetivo debe coincidir en las
variables que es necesario medir para alcanzarlo.
— En el caso de una hipótesis, se debe conseguir el mayor consenso posible en el
tipo de resultados que confirmaría o rechazaría la hipótesis.
Somos conscientes de que el problema es mucho más complejo, pero los dos
criterios anteriores pueden ayudar a caminar por un territorio más confuso de lo que se
suele reconocer.
A pesar de su importancia, la formulación del objetivo se suele hacer en términos
muy vagos: situación educativa, calidad de la enseñanza, conservadurismo, necesidades
sanitarias o de salud, etc. Términos confusos que más adelante será necesario definir.
Las siguientes declaraciones presentan ejemplos de objetivos: conocer los juicios de los
alumnos sobre la calidad de la enseñanza universitaria, predecir la intención de voto en
las próximas elecciones, describir las opiniones con respecto a la despenalización del
aborto, etc.
¿Por qué insistir tanto en la necesidad de tener un objetivo claramente definido? El
151
objetivo es el “foco de la encuesta”, es decir, todas las decisiones que afectan a la
elaboración del cuestionario se deben tomar por su contribución al objetivo de la
encuesta. La función que desempeña el objetivo de la encuesta es tan importante que
debemos detenernos hasta no tener una declaración precisa del mismo.
El autor debe iniciar ahora la planificación del cuestionario, pero antes, debemos
apuntar el efecto que sobre el cuestionario tienen dos conjuntos de factores que hemos
agrupado bajo las denominaciones del “contexto de la encuesta” y los “recursos
disponibles”. Son tratadas en este apartado por que pueden llegar a condicionar el
objetivo de la encuesta, y por tanto, del cuestionario.
152
médico especialista durante los dos últimos años?”
Otro factor relevante del contexto es si las respuestas serán o no anónimas. Las
respuestas a preguntas comprometedoras dependerán fuertemente de las condiciones
en que se administre y responda a la encuesta, y la formulación de las preguntas deberá
adaptarse también a estas circunstancias.
Las características de los encuestados, la redacción de las preguntas, la
confidencialidad posible de las respuestas… son elementos que el autor del
cuestionario debe considerar en la misma formulación de los objetivos del cuestionario
y en su planificación.
153
para medir las variables. Podemos retomar una analogía anterior. Una vez que hemos
aclarado con los propietarios la relación de habitaciones y sus características – los
objetivos – ha llegado el momento de dibujar los planos: el diseño del cuestionario.
El autor del cuestionario debe abordar en el momento del diseño dos actividades.
154
relación exhaustiva de los indicadores que debemos elaborar y/o seleccionar, lo más
probable es que nos centremos en aquellos contenidos más fáciles de medir y
descuidemos los que requieran preguntas más complejas. El castigo es claro: descuidar
aspectos clave para alcanzar el objetivo de la encuesta. Los recursos y el esfuerzo
invertido pueden caer en saco roto por una mala planificación del cuestionario.
Fink (1995a) recomienda conseguir una relación estructurada de las variables que
va a medir el cuestionario y de las preguntas y tests necesarias para cada una de ellas.
Para ilustrar la tarea podemos recurrir a uno de los objetivos apuntados en ejemplos
anteriores: la evaluación de la calidad de la enseñanza universitaria. El cuadro 5.1
muestra la relación de variables e indicadores necesarios para una de sus áreas de
contenido: el profesorado.
La especificidad con la que se realice esta tarea es una decisión del autor del
cuestionario. Por ejemplo, nada impide “desmenuzar” la información anterior
incluyendo qué tipo de preguntas se debe emplear en cada caso, e incluso, si es
necesaria más de una pregunta para un aspecto, indicando el elemento de información
que cada una debe plantear. Este podría ser el caso en el ejemplo anterior para la
“antigüedad en el puesto”: una pregunta pediría información sobre la “antigüedad en el
grado académico” (licenciado o doctor); y otra sobre la “antigüedad” en la categoría
profesional (contratado o funcionario). Un consejo: se debe invertir todo el tiempo
necesario hasta tener una planificación precisa del cuestionario. Por otra parte, el rigor
en las especificaciones no se debe entender como un “corsé” a la creatividad: la
interacción continua a lo largo del proceso de elaboración permite en todo momento
rectificar decisiones anteriores. Siempre se está a tiempo de hacer una “modificación de
los planos” en la casa.
155
5.8. Recomendaciones para hacer las preguntas del cuestionario
156
5.8.1. Recomendaciones para elaborar preguntas factuales
Las cuestiones deben ser precisas y no ambiguas. Una pregunta precisa es aquella
que dos encuestados diferentes entienden de la misma forma. Por ejemplo,
supongamos que estamos preguntando sobre el estado de salud. Dos personas con
historias de salud diferentes (una habitualmente sana pero con problemas de salud en
los últimos días y otra con una enfermedad crónica) pueden responder en términos
similares a una pregunta ambigua.
Ejemplo:
157
En definitiva, cuanto más detalles podamos aportar más precisa será la respuesta
Ejemplo:
Ejemplo:
158
Examinemos también este otro:
Ejemplo:
Ejemplo:
Evitar abreviaturas: deben evitarse al menos que se esté seguro de que todas las
personas conocen su significado.
Ejemplo:
159
encuestados conoce los términos de las preguntas. Hay, otro problema añadido: la
comunicación de los resultados a una audiencia general puede ser más difícil. La
misma consideración es aplicable a las expresiones técnicas: sólo deben utilizarse
cuando estemos seguros de que todas las personas las conocen.
Ejemplo:
E) Utilice preguntas que hayan sido utilizadas con éxito en otras encuestas.
Las encuestas del INE (instituto Nacional de Estadística) y las EPA (Encuestas de
Población Activa) son unas fuentes de preguntas muy utilizadas y reconocidas, por
ejemplo, para preguntar por las profesiones. Esto nos asegura mayor fiabilidad y mejor
comunicación de los resultados.
Las preguntas breves requieren menos tiempo y menos atención lectora, aunque
también aportan información menos detallada. Las preguntas largas generalmente dan
antecedentes a los encuestados y les ayudan a recordar o pensar en las razones por las
que hacen algo o mantienen una opinión.
Las preguntas largas son útiles para obtener información sobre temas “sensibles”
(salud o hábitos personales) o cuestiones objeto de debate social (control de armas). Al
utilizar preguntas largas en cuestionarios auto-administrados es necesario contar con el
tiempo necesario para leer la pregunta y responder.
Preguntas de este tipo son las relativas a temas como ingresos, situación laboral,
consumo de sustancias ilícitas, hábitos sexuales, etc. Si es necesario hacer este tipo de
preguntas (después de haber reflexionado seriamente sobre su pertinencia), hay
160
diversos procedimientos para “suavizar” la pregunta. Por ejemplo, utilizar intervalos
amplios en las respuestas sobre ingresos económicos, introducir mensajes que ayuden a
poner en situación al encuestado, aproximarse sucesivamente a la pregunta, etc.
Veamos algunos ejemplos.
Los autores de encuestas en ocasiones “cargan” una pregunta para obtener
información sobre temas embarazosos o polémicos. El objetivo de “cargar” una
pregunta es animar al encuestado a que dé una respuesta verdadera en lugar de una
“socialmente aceptable”. Por ejemplo:
— Mala redacción: ¿se ha llevado alguna vez algo de un supermercado sin pagar?
— Mejor: ¡usted no es el único! Todo el mundo ha pensado alguna vez en llevarse algo
sin pagar de un supermercado. En la pasada semana: ¿se ha llevado algo sin pagar
de un supermercado?
Sí No
Aproximación sucesiva
— Muchas personas se han llevado alguna vez algo sin pagar del supermercado.
¿Conoce a alguna persona de su entorno laboral, vecinos o familia que lo haya
hecho?
Sí No
— Trate ahora de recordar. ¿Alguna vez ha pensado usted en llevarse algo sin pagar
del supermercado?
Sí No
— ¿Lo ha llegado a hacer?
Sí No
Sin duda, la aproximación sucesiva es más costosa, pero es el precio a pagar por una
161
mayor sinceridad en las respuestas.
Debemos saber que este tipo de preguntas pueden inducir a que el encuestado deje
de responder o a que directamente tire el cuestionario a la papelera (sobre todo si están
al principio del cuestionario).
Las frases y palabras sesgadas pueden elicitar respuestas emocionales que no tengan
nada que ver con el tema objeto de la encuesta. Palabras como: aborto, pro-vida, “rojo”,
etc., pueden generar respuestas emocionales o prejuicios.
También hay que advertir que el sesgo en las palabras tiende a cambiar con el
tiempo. El sesgo puede evitarse fácilmente con una revisión de las preguntas por
expertos o posibles encuestados.
Las preguntas con más de una idea en su redacción, por ejemplo “¿el gobierno debe
seguir financiando la educación y la sanidad?”, pueden introducir confusión en los
encuestados, ya que realmente se trata de dos preguntas.
Ejemplo:
— Mala redacción: ¿cree que la política económica y exterior del gobierno son
adecuadas?
— Mejor: ¿cree que la política económica del gobierno es adecuada?
— Mejor: ¿cree que la política exterior del gobierno es adecuada?
162
K) Utilizar indicaciones opcionales
Ejemplo:
— ¿Ha sido usted (o alguien que viva con usted) atacado por un extraño en el
último año?
— ¿Informó usted (él o ella) del ataque a la policía?
Ejemplo:
— Mala redacción: ¿qué piensa de su barrio? (Nos interesa su opinión sobre vivienda,
zonas verdes, infraestructura, etc.)
A) Preguntas abiertas
El encuestado tiene que dar las respuestas con sus propias palabras. Son útiles
163
cuando se pretende obtener respuestas no previstas. Algunos encuestados (los de mayor
nivel cultural o con mayor conocimiento del tema) pueden sentirse más cómodos con
las preguntas abiertas que con las cerradas.
El inconveniente principal es que las respuestas a las preguntas abiertas deben ser
categorizadas e interpretadas.
Ejemplo:
Respuestas posibles:
— No demasiadas veces.
— Sobre el 10% de las noches.
— Mucho menos que el mes anterior.
B) Preguntas cerradas
Son más difíciles de escribir que las preguntas abiertas ya que debemos anticipar las
posibles respuestas. Sin embargo, algunos encuestados prefieren este tipo de preguntas
por no estar dispuestos o no ser capaces de expresarse sobre el tema objeto de la
encuesta. Además, las preguntas cerradas facilitan la categorización y análisis de las
respuestas. ¿Cómo podemos decidirnos por un tipo de pregunta u otro?
El cuadro 5.2 puede ayudar en el proceso de decisión:
164
CUADRO 5.2. Comparación de preguntas abiertas y cerradas.
Las preguntas filtro o llave son aquellas que en función de la respuesta dirigen a
unos encuestados, pero no a otros, hacia unas preguntas concretas del cuestionario y no
a otras.
De una encuesta sobre la adicción a los juegos de azar podemos extraer la siguiente
pregunta filtro:
165
Esta práctica divide la muestra entre los encuestados con unas determinadas
características y los que no las tienen. Por ejemplo, los que contestan a la pregunta 2 de
la encuesta sobre la adicción al juego y los que no la contestan. Esta disminución en el
tamaño de la muestra habrá de ser considerada en el análisis de los resultados.
Como regla general se recomienda evitar este tipo de preguntas, especialmente en
los cuestionarios auto-administrados, donde no esta el entrevistador para solucionar
posibles problemas. Es difícil dejar claro a unos encuestados y a otros lo que tienen que
hacer. Si tienen que saltar por secciones enteras del cuestionario, el problema se
complica aún más.
En caso de tener que utilizarlas se recomienda utilizar flechas indicadoras del
“trayecto”, justificar las preguntas a la derecha para que se puedan distinguir, presentar
instrucciones precisas sobre cuál es la siguiente pregunta a la que tiene que responder,
etc.
166
— El concepto de actitud (en general y en particular cuando se refiere a una actitud
determinada) es un constructo. Sirve para “ver” orden y consistencia en lo que
las personas dicen, piensan y hacen; y así, dados ciertos comportamientos,
intentar hacer predicciones de comportamientos futuros. Tal constructo no
puede medirse directamente, sino que debemos inferir su presencia a partir de
determinadas muestras de conducta.
— Los comportamientos, creencias y sentimientos (en definitiva, las tres fuentes
fundamentales para inferir las actitudes) no siempre coinciden, incluso aunque
supongamos que reflejan una única actitud. El estudio de La Piere (1934) reveló
de forma dramática la incongruencia entre declaraciones y comportamientos de
prejuicio racial. Esta “incongruencia” puede hacer que si nos centramos en una
sola manifestación (comportamiento, creencias o sentimiento), nuestra
descripción de la actitud pueda resultar distorsionada.
— Las actitudes son variables especialmente inestables, tanto que no tenemos
garantías de que la actitud que pretendemos medir permanezca estable el
tiempo suficiente para que la medida en una sola ocasión resulte fiable.
— La medida de la mayoría de las actitudes suele hacerse sin que exista un acuerdo
universal sobre su naturaleza.
167
— En general, los profesores se preocupan de sus estudiantes.
— La escuela es interesante.
— La escuela es aburrida.
— Hay demasiadas reglas en la escuela.
Propuesto por Likert en los años treinta es, sin duda, el modelo de medición de
actitudes más popular e intuitivo. Es más, hoy día cualquier escala en la que la
puntuación de una persona se obtenga por la suma de sus respuestas graduadas a los
items que la forman, recibe el nombre de escala “sumativa” o escala tipo Likert (Spector,
1992).
El modelo puede describirse brevemente de la forma siguiente:
El modelo asume unos supuestos sobre la naturaleza de los items y de la escala final
que pueden resumirse en:
168
1. Las variaciones sistemáticas en las respuestas de las personas a los items se
deben únicamente a las diferencias entre las personas. Es decir, los items no
aportan nada a la variabilidad sistemática de las respuestas, cada item es
considerado una replicación de los otros.
2. Los ítems están relacionados monotómicamente con la variable actitudinal que
se supone que miden. Cuanto más favorable (o desfavorable) sea la actitud de la
persona, mayor (o más baja) será su puntuación en el item.
3. Los ítems miden una única variable, es decir, forman una escala
unidimensional.
1. Cada ítem debe expresar una y solamente una idea. Si el item expresa más de una
idea lo más probable es que consigamos confundir a las personas. Será muy
fácil que la persona no sepa a cuál de las dos ideas expresadas en el enunciado
nos referimos.
2. Utilizar ítems redactados de forma favorable y desfavorable. Es una
recomendación generalizada. El escritor de items debe redactar enunciados que
representen posiciones favorables y otros desfavorables al constructo. El
objetivo de esta recomendación es evitar las denominadas tendencias de
respuesta (aquiescencia, deseabilidad social, etc.). Por ejemplo, en el caso de la
aquiescencia si todos los items están redactados de forma positiva, una persona
que muestra un sesgo en su respuesta –aquiescencia– obtendrá puntuaciones
muy altas –o muy bajas– inflando el cálculo de los estadísticos del item y del
test. Cuando hay items redactados de forma favorable y desfavorables, estas
personas tienden a situarse en los valores centrales produciendo un efecto
mucho menor. El precio a pagar por intentar evitar el sesgo en la respuesta es
confundir a las personas (al tener que cambiar su forma de responder), sobre
todo en tests largos.
169
b) Ejemplo de ítem desfavorable:
Ejemplo:
170
empíricos y por procedimientos subjetivos. La literatura sobre elaboración de
cuestionarios no trata con detalle ninguna de las dos aproximaciones. Nuestro objetivo
es dar algunas pautas que ayuden en el proceso de revisión.
Los contenidos de este apartado están dirigidos a la revisión de las preguntas
factuales. Las preguntas o tests diseñados para medir estados subjetivos se pueden
revisar mediante procedimientos más formales que están ampliamente descritos en la
literatura especializada (Crocker y Algina, 1986).
La finalidad general de la revisión es identificar defectos en la redacción de las
preguntas que puedan disminuir su fiabilidad y validez.
El autor del cuestionario puede recurrir a personas familiarizadas con las técnicas
de investigación por encuesta o con el tema objeto de la investigación para revisar las
preguntas.
Para sacar más partido a la tarea es conveniente “guiar” la revisión de las preguntas
hacia aspectos concretos. Los trabajos sobre el tema suelen agrupar las cuestiones a
revisar en los apartados siguientes:
— Contenido:
¿Es necesaria esta pregunta?
¿Son necesarias más preguntas sobre esta cuestión?
¿Es necesario concretar más la pregunta?
— Redacción:
¿Se podría expresar de un modo más claro? ¿Cómo?
¿Puede tener varias interpretaciones?
¿Presenta algún sesgo o prejuicio?
¿Las alternativas son exhaustivas?
¿Se solapan las alternativas de respuesta?
— Ubicación:
¿Está situada en el lugar adecuado?
¿Pueden influir las preguntas precedentes?
171
Por supuesto, el responsable de la revisión puede plantearla en términos más
formales requiriendo a los expertos, por ejemplo, que examinen la adecuación entre la
pregunta y el contenido o variable que pretende medir, que propongan alternativas a los
elementos defectuosos, que califiquen la pertinencia de cada pregunta…
Si el valor obtenido excede las expectativas del autor del cuestionario debe
revisar las preguntas para intentar determinar el origen de este problema.
b) Proporción de elección de las alternativas. No es fácil predecir a priori el patrón
de elección “adecuado” de las alternativas de respuesta en las preguntas
cerradas. Depende, por supuesto, de la distribución de la variable en la
población. No obstante, el investigador puede sospechar que hay algún
problema en aquellas preguntas con alternativas poco elegidas o con una
alternativa mayoritariamente elegida.
La obtención de los datos es sencilla:
172
Los resultados estadísticos no deben ser interpretados como “pruebas de valor”: una
proporción inesperada en la elección de una alternativa no indica necesariamente que
la pregunta sea defectuosa. El resultado se debe utilizar como una señal de alarma que
lleve a una nueva revisión de las preguntas.
173
— Hay que evitar que el encuestado tenga que realizar saltos de página o seguir
indicaciones complejas.
— Dentro de cada área temática las preguntas deben ir de las menos a las más
comprometidas
— Las preguntas relativas a variables demográficas deben ir al final.
174
CAPÍTULO 6
LA ENTREVISTA
6.1. Introducción
175
prestar menos atención a las sesiones de entrenamiento y acostumbran a
producir altas tasas de abandono y bajas proporciones de respuesta por parte de
los entrevistados.
3. Los entrevistadores deben tener flexibilidad horaria. La entrevista requiere que el
entrevistador esté disponible cuando lo esté el entrevistado.
4. El entrevistador debe tener facilidad de desplazamiento. Esto suele aconsejar el
empleo de personas con vehículo propio y, a menudo, desaconsejar el empleo de
personas con determinadas minusvalías físicas. Esta última característica deja de
ser relevante en el caso de las encuestas telefónicas, donde, por otro lado,
adquieren importancia aspectos como el tono de voz o la capacidad de trabajar
bajo una supervisión directa.
A estas peculiaridades podríamos añadir otra, también señalada por Frey y Oishi
(1995), como es el hecho de que los entrevistadores con mayor confianza previa en sus
posibilidades de realizar y completar entrevistas acaban consiguiendo realmente
mejores tasas de respuesta.
Aunque estas características generales pueden ayudarnos a establecer el primer
filtro entre los candidatos a entrevistadores, pueden resultar insuficientes.
Los entrevistadores seleccionados deben ser adecuados para realizar la entrevista
específica que hemos diseñado en el contexto específico en que se realice. Por ejemplo,
a pesar de que no existe ninguna razón a priori para preferir entrevistadores de uno u
otro sexo, parece razonable que una mujer tendrá más facilidades para conseguir
información sobre trastornos menstruales que un hombre. De forma similar es posible
que no informemos igual de nuestros prejuicios étnicos hacia los gitanos a un payo que
a un gitano. Estos dos ejemplos muestran cómo las características específicas de la
encuesta pueden ayudarnos a seleccionar a los entrevistadores.
También hay que prestar atención a las características específicas del contexto. Así,
resultaría conveniente contar con entrevistadores bilingües si queremos realizar
cualquiera de las investigaciones ejemplificadas antes en comunidades con más de una
lengua, como Cataluña o el País Vasco.
Por último, cabe señalar que diversos estudios (Cannell, Marquis y Laurent, 1977;
Fowler y Mangione, 1990 –citado en Fowler, 1993: 110 y ss.–) parecen apuntar que los
entrevistadores expertos son más descuidados o menos cuidadosos que los noveles. Esta
información es de interés tanto para el proceso de selección, como para los de
formación y supervisión. La verdad es que, aunque esta información parece aconsejar el
no seleccionar a personal experimentado, el entrevistador ideal sería aquél que ya sabe
(porque tiene experiencia) y vence la tendencia al hábito y la dejadez o relajamiento en
176
la aplicación ortodoxa del procedimiento.
El buen entrevistador no nace, se hace; por tanto, aunque seleccionemos a los más
prometedores, será necesario instruir al grupo escogido con el fin de convertirlos en
buenos entrevistadores. Podemos dividir el entrenamiento en dos tipos: por un lado
uno de carácter general que podría ser de utilidad en cualquier entrevista y, por otro
uno específico de la investigación que se está desarrollando.
177
6. Feed-back.
Dada su importancia, estos puntos son tratados con más profundidad en apartados
posteriores.
178
6.3.3. Materiales y procedimientos de entrenamiento
Una vez formados los entrevistadores llega el momento de soltarlos a la calle para
que realicen su tarea. La forma global en que se estructure este acceso puede tener
influencia sobre cada entrevista en particular. González Río (1997) distingue dos
posibilidades: invasión, cuando un gran equipo de investigadores realiza todas las
encuestas en un breve espacio de tiempo, e inmersión, cuando un entrevistador, o varios
de ellos, realiza todas las encuestas en un determinado lugar.
El primer método tiene la ventaja de evitar en gran medida que se corra la voz en el
vecindario, lo que puede producir efectos negativos como el conocimiento a priori del
contenido. La inmersión no presenta esa ventaja, por el contrario, al tener que realizar
mayor número de entrevistas es más posible que el entrevistador se fatigue
disminuyendo la calidad de las encuestas. En cambio, esta mayor permanencia en el
medio permite al entrevistador familiarizarse con el contexto y poder planificar mejor
sus entrevistas, ventaja con la que no se cuenta en el método de invasión.
6.5. La entrevista en sí
Bingham y Moore (1924) definen la entrevista como una conversación que tiene un
objetivo. Rogers (1942) señala que una entrevista es un encuentro interpersonal que se
desarrolla dentro de un marco y situación social dada, de tal modo que implica la
presencia de un profesional y un sujeto. A pesar de que éstas son sólo dos posibilidades
de definición de entre un conjunto mucho mayor, en nuestra opinión presentan dos
conceptos fundamentales. Primero, la presencia de un “profesional”. Sin éste la
entrevista se convierte en un simple diálogo. En cambio, en la situación de entrevista, el
179
entrevistador está exclusivamente interesado en obtener información, sin tener que
mostrar sus opiniones o creencias respecto a ningún tema en concreto. Segundo, la
entrevista tiene un objetivo. Es necesario que esté claramente delimitado para servir de
referente al entrevistador en el transcurso de la misma.
Por lo que respecta a los tipos de entrevista podemos clasificarlos, en un primer
nivel, en entrevistas de diagnóstico y entrevistas de estudio (Ghiglione y Matalon, 1989).
La diferencia fundamental entre una y otra radica en que en el primer tipo la entrevista
suele solicitarla el entrevistado y el objetivo es algún tipo de ayuda (psiquiátrica,
terapéutica, de selección, etc.). La entrevista de estudio, en cambio, suele pedirla el
entrevistador y tiene como objetivo alguna generalización. Este segundo tipo de
entrevista es el que está presente en la investigación mediante encuestas.
Siguiendo de nuevo a Ghiglione y Matalon (1989, op. cit.) podemos establecer una
segunda clasificación en función de la libertad que se concede a la persona interrogada.
Esta clasificación es:
180
generales, a medida que se incrementa el grado de estructuración de una entrevista se
producen efectos como:
Para que la realización de la entrevista sea homogénea por parte de todos los
entrevistadores éstos deben disponer de un manual que les indique la secuencia de
acciones que deben tomar en cada momento. Este manual se denomina guía de la
entrevista. En el caso, por ejemplo, de que una vez localizada una vivienda el
entrevistador deba seleccionar a una persona concreta dentro de la misma, la guía debe
incluir también el procedimiento para realizar esa selección. En esta guía se incluirán
también las instrucciones para desarrollar las tres partes en las que suele dividirse una
entrevista, a saber: presentación, realización en sí de la entrevista (esto es, la parte
dedicada a la recogida de información) y despedida. Se presenta un ejemplo completo
de guía de la entrevista al final de este capítulo.
181
Este punto ya fue tratado en profundidad en un capítulo anterior, por lo que aquí
nos limitaremos a recordar que el entrevistador debe tener perfectamente claro cuál
debe ser el procedimiento a seguir ya que distintos procedimientos tendrán efectos
distintos, tanto en la representatividad final de la muestra como en el coste final de la
investigación. De forma añadida presentamos una serie de sugerencias, ajenas en sí al
procedimiento de muestreo, que pueden facilitar la selección de encuestados.
Así, la última hora de la tarde puede ser la más adecuada para realizar las encuestas,
tanto a domicilio como por teléfono, dado que a esa hora es previsible que se
encuentren en su domicilio la mayoría de componentes de la unidad familiar. Cuando
la persona seleccionada en un domicilio no se encuentre disponible en ese momento, es
aconsejable concertar una cita o informarnos de cuándo estará disponible. Puede dar
buenos resultados pedir al interlocutor el nombre de pila de la persona seleccionada
para preguntar directamente por ella cuando se intente realizar de nuevo la entrevista.
B) Presentación
182
C) La realización de la entrevista
D) Preguntas comunes
¿Quién hace el estudio? ¿Quién está detrás de todo esto? Un equipo de investigadores
de la Universidad de Granada interesados por estudiar los diferentes juegos de
azar existentes en la Comunidad andaluza y cómo inciden estos juegos en las
personas. Este estudio está subvencionado por la Consejería de Asuntos Sociales
de la Junta de Andalucía.
¿Por qué yo?, ¿porqué esta vivienda? ¿Qué sabe usted de mí? En Andalucía hay más
de 7 millones de habitantes. No es posible pedir opinión a todos. En este estudio se
ha decidido escoger un grupo de 5.000 personas que representan a toda la
183
Comunidad andaluza. Técnicamente, la única manera de conseguir esta
representatividad es hacer la selección por sorteo, al azar. Yo tengo aquí unas
tablas aleatorias que me han llevado a seleccionar esta vivienda, como si hubiese
lanzado una moneda al aire.
¿Por qué no encuesta a otro? Es muy importante que usted, precisamente, responda
a esta encuesta. Seguro que hay mucha gente como usted, de su edad, sexo,
opinión, sobre las encuestas y sobre los juegos de azar. Si ustedes no responden,
las conclusiones del estudio no podrán referirse a toda la población andaluza y no
merecerá la pena haber implicado todo el esfuerzo y dinero para el fin de esta
investigación.
¿Para qué es esto?, ¿Qué se va a hacer con los resultados? Seguramente usted sabrá
que existen muchos juegos de azar, es decir, juegos que dependen de la suerte y en
los que se apuesta dinero. En esta investigación, interesan aspectos generales como
qué cantidad de personas juegan, qué les motiva a jugar, etc. Con esta información
global se podrán tomar medidas como, por ejemplo, solicitar a las autoridades
competentes apoyo para prevenir que existe dependencia al juego.
E) Manejo de situaciones
184
es siempre un camino de rosas. Por el contrario, es habitual que se encuentren con
problemas que van desde respuestas insatisfactorias por parte del encuestado hasta
negativas más o menos violentas a colaborar con la investigación. Veamos alguna de
estas situaciones y la posible reacción que debería tener el entrevistador (cuadro 6.3).
El entrevistado dice que no sabe sobre el tema. Remarcar los aspectos de opinión de
la encuesta y que nos interesa la opinión de todo el mundo.
El entrevistado dice que es demasiado viejo. Señalar que nos interesa la opinión de
todo el mundo y que la de las personas mayores es tan importante como la de
cualquier otra.
185
El entrevistado no entiende una pregunta o parte de ella. Si en el manual del
encuestador aparece alguna definición de los términos conflictivos de la encuesta,
leerla literalmente. De no ser así, una respuesta estándar es ‘lo que para usted
signifique’.
Repetir la pregunta
Repetir la respuesta
Silencios
Hacer una pregunta
Expresiones como “ajá”, “ya veo”
CUADRO 6.4. Técnicas de indagación.
El entrevistador debe ser cuidadoso en el empleo de estas técnicas. Por un lado para
no forzar en exceso la situación y por otro para no sugerir ningún tipo de respuesta
particular al entrevistado. No conviene, por tanto, que repita literalmente la pregunta.
Esto podría dar la impresión al encuestado de que no le estamos escuchando con
atención. En la reformulación, pueden anteponerse a la pregunta expresiones como: “En
definitiva, (repetir la pregunta)”.
También ha de ser cuidadoso el entrevistador en el manejo de los silencios y de las
expresiones de asentimiento. Los primeros representan una situación violenta que el
entrevistado intentará romper ampliando su respuesta. Los segundos deben emplearse
con mesura para no caer en el ridículo.
El principal problema que puede surgir durante la indagación se da cuando el
entrevistador decide realizar una nueva pregunta para clarificar una respuesta
insatisfactoria. La nueva pregunta debe ser completamente neutral para no producir
186
ningún tipo de sesgo o inducir alguna respuesta al encuestado. Veamos un ejemplo de
cómo no debe y debe realizarse la indagación.
F) Despedida
Una vez finalizada la entrevista puede ser necesario que el entrevistador depure la
información recogida durante la misma. Sobre todo en las encuestas en las que el
encuestador no se limita a señalar alternativas de respuesta. Si ha escrito algo, debe
leerlo inmediatamente para asegurarse de que lo entiende, debe corregir las
abreviaturas que ha utilizado y redactar correctamente las notas que durante la
entrevista haya dejado meramente indicadas. Es también el momento de rellenar la
hoja de resultados de la entrevista. En esta hoja se recoge información sobre lo que
ocurre desde que se selecciona una vivienda, número de teléfono o encuestado hasta
que finaliza la entrevista. También puede incluir una parte dedicada a las encuestas
fallidas o no finalizadas. Esta última debe rellenarse sólo cuando se deseche
definitivamente un domicilio o número de teléfono, no en el caso de haber concertado
una cita para realizar posteriormente la entrevista.
187
Finalmente, cabe señalar que en esta hoja se pueden incluir una serie de cuestiones
que puedan usarse para obtener información ajena al objetivo específico de la
investigación. Por ejemplo, conocer la valoración del entrevistador sobre la sinceridad o
interés del entrevistado o el contexto en que se desarrolló la entrevista. En esta hoja cabe
incluir también cuestiones que serán útiles en el proceso de feed-back que se produce
entre los entrevistadores y los responsables de la investigación. Por ejemplo, la
existencia de preguntas confusas o mal redactadas o de categorías de respuesta
incompletas. En el capítulo 7 mostramos un ejemplo de hoja de resultados.
6.5.5. Feed-back
188
conflictivas, de preguntas confusas en el cuestionario no detectadas en el estudio piloto
o de disponibilidad o resistencia especial de algún tipo de personas.
Instrucciones
GUÍA DE LA ENTREVISTA
189
INVESTIGACIONES SOCIALES. ESTA VIVIENDA HA SIDO
SELECCIONADA POR SORTEO DE ENTRE TODAS LAS DE EL ESTADO
ESPAÑOL.
¿PODRÍA HABLAR CON LA 1ª, 2ª, 3ª… MÁS JOVEN DE ESAS PERSONAS?
5. Leer:
ANTES DE NADA ME GUSTARÍA PRESENTARME, AQUÍ TIENE UNA
CARTA…
Enseñar carta
190
INVESTIGACIÓN. ¿TIENE ALGUNA DUDA SOBRE MI IDENTIFICACIÓN O
SOBRE LOS OBJETIVOS DE LA ENCUESTA?
Si tiene alguna duda, aclarársela.
7. Despedida.
191
CAPÍTULO 7
TRABAJO DE CAMPO
192
resistencia moral (se refiere a resistencia a la frustración –frente a las muchas negativas
que soportará por parte de los encuestados– y también a la honestidad –para no rellenar
e inventar los datos por su cuenta–).
Con respecto al número de encuestadores idóneos para abordar el trabajo de campo
tenemos que decir que es preferible contar con muchos encuestadores y con pocas
encuestas a contar con muchas encuestas y con pocos encuestadores. Esto es así porque,
si cada encuestador se encarga de un número pequeño de encuestas, el trabajo de
campo se realizará en menor tiempo además en caso de fallar el encuestador, son pocas
las encuestas que habrá que considerar. Para evitar estas pérdidas se suele planificar
entre un 5% y un 10% más de encuestas de las necesarias (Hague y Jackson, 1994).
Lo que sí es fundamental es que estos encuestadores tengan formación general
sobre lo que supone una investigación mediante encuestas y formación específica sobre
la investigación concreta en la que participen. Hay que pensar que todos ellos deberán
seguir las instrucciones de la investigación (selección del encuestado, guía de la
entrevista, instrucciones del cuestionario, etc.) de forma meticulosa para asegurar la
uniformidad en la recogida de datos.
193
— Realizan comprobaciones aleatorias de las encuestas ya entregadas. Tras una
selección aleatoria de algunas direcciones o teléfonos de las encuestas, el
coordinador revisita o llama por teléfono al encuestado comprobando si la
entrevista se realizó y en qué condiciones. Además se utilizan para completar
datos o resolver problemas que se planteen en algunas respuestas que no queden
claras en los cuestionarios.
A continuación vamos a enumerar todos los materiales necesarios para llevar a cabo
el trabajo de campo, es decir, todo lo que un encuestador debe tener antes de empezar
su tarea. En este caso detallamos los materiales necesarios para efectuar una
investigación mediante encuestas personales. No cabe duda de que si lo que estamos
realizando es una investigación de encuestas telefónicas, mucho de los materiales que
se citan sobran, y lo imprescindible es tener una guía de teléfonos actualizada de la zona
del estudio.
194
que estemos llevando a cabo estas instrucciones se referirán a cómo obtener la
unidad muestral que necesitamos.
— Tabla de números aleatorios. Como se ha visto anteriormente las tablas de
números aleatorios nos van a ayudar a tomar decisiones cuando estemos en el
proceso de selección del encuestado. Para ello, lo ideal es que cada encuestador
tenga una o varias tablas. (Véase el capítulo 4 para profundizar más sobre este
punto y para tener un ejemplo de tabla.)
— Guía de la entrevista. La guía de la entrevista es un documento en forma de
esquema que permite al encuestador conducir con éxito el inicio de la misma
(Harvatopoulos, Livan y Sarnin, 1992). Nos proporciona una forma de proceder
desde el momento en que hemos seleccionado una vivienda concreta y tomamos
el primer contacto con alguien, hasta el momento de finalizar la entrevista, para
proseguir de nuevo el trabajo (Manzano y otros, 1996). (Véase el capítulo 6 para
profundizar más sobre este punto y para tener un ejemplo de tabla.)
— Normas para la aplicación del cuestionario. Suelen consistir en unas normas
generales de cumplimentación, que servirían para cualquier estudio (véase
anexo 1), y unas normas específicas del estudio concreto que se lleva a cabo.
Estas normas específicas nos informan de qué preguntas son filtros, abiertas o en
cuáles mostraremos tarjetas (si las hay) y, en general, cuaquier consideración de
importancia para la buena marcha de la aplicación del cuestionario.
— Otros. En algunos casos también se proporcionan otros materiales; como pueden
ser un listado de “preguntas comunes que hacen los encuestados’” y cómo
resolverlas, así como algunos “consejos prácticos”.
7.2.2. Cuestionario
195
7.2.3. Carné o acreditación como encuestador
196
FIGURA 7.2. Modelo de acreditación.
Esta tarjeta (figura 7.3) consiste en una pequeña tarjeta de cartulina en la que se
agradece la participación de los encuestados en el estudio, añadiendo dirección y
teléfono para que puedan realizar las consultas que consideren oportunas. Esta tarjeta,
de forma similar a la credencial, tiene unas funciones muy importantes entre las que
podemos citar (Manzano y otros, 1996):
197
Un ejemplo podría ser:
Las hojas de resultados o de incidencias recogen cada uno de los intentos que ha
llevado a cabo el encuestador en la búsqueda de entrevistados y cuáles han sido las
distintas situaciones e incidencias acontecidas en las tentativas.
Además, las hojas de resultados contienen información complementaria relativa al
encuestador (número o nombre), la población, distrito, sección y punto de muestreo,
información necesaria para identificar y analizar, posteriormente, las tasas de respuesta
por encuestador, por zona, etc.
Los encuestadores tendrán reproducciones suficientes de las hojas resultados para
realizar su tarea.
En el anexo 3 se presenta una hoja de resultados –o incidencias– (Manzano y otros,
1996).
Las fichas de campo recogen las cuotas o estratos organizadas, normalmente por
sexo y edad, para que el encuestador vaya anotando las encuestas realizadas, y sepa,
también, cuáles le restan para acabar cada uno de los estratos (ver anexo 4). En los dos
ejemplos propuestos se muestran las distintas configuraciones que pueden adoptar las
hojas de estratos o cuotas (ver cuadros 7.1 y 7.2).
198
CUADRO 7.1. Ejemplo de hoja de cuotas.
El punto de inicio de ruta, como su nombre indica, es una calle concreta donde
comienza la ruta de cada encuestador. Este punto de inicio de ruta puede presentarse
de varias formas. Entre las más utilizadas están las siguientes: 1. listado de calles del
municipio donde deben realizarse las encuestas; y 2. un plano donde se señala la calle
como punto de inicio.
En el caso del listado de calles éste suele ser un callejero de un municipio, distrito o
sección (según sea la unidad de muestreo seleccionada), generalmente tomando como
fuente el Instituto Nacional de Estadística. En estos listados aparecen el nombre de la
vía, tipo de vía (calle, plaza, carretera, etc.), tipo de zona (urbana, diseminada, etc.) y los
números de la vía que están incluidos en esa sección, además de la sección, distrito,
municipio y provincia al que pertenece. Tenemos un ejemplo en el cuadro 7.3.
199
CUADRO 7.3. Ejemplo de Callejero.
FIGURA 7.4. Ejemplo de plano (parte del casco del municipio de Almería).
200
El encuestador tiene que disponer de todo aquel material fungible que le pueda ser
necesario: carpeta, folios o cuaderno de notas, bolígrafos, clips, grapas… De hecho, es
muy aconsejable que el encuestador anote todas aquellas cuestiones que crea oportunas
para la mejora de la investigación (situaciones problemáticas, sinceridad de los
encuestadores, problemas de acceso a viviendas, zonas de difícil acceso o
problemáticas, etc.).
8. Todas las preguntas deben recoger alguna contestación, o en su caso, el NC, pero
nunca deben quedar sin rellenar.
9. Los datos a rellenar por el entrevistador deberán venir correcta y completamente
cumplimentados, asimismo el cuadro de incidencias recogerá el número de orden
y todos los contactos realizados hasta su consecución.
201
10. Se debe anotar la fecha, día, hora y duración de la entrevista.
11. La valoración de la entrevista por parte de los encuestadores se deberá hacer con
sinceridad. Se trata de recoger la impresión subjetiva del entrevistador. Esta opinión
no tendrá ningún efecto ni sobre las respuestas obtenidas ni sobre la aceptación del
trabajo.
Anexo 2: Cuestionario
BLOQUE I
“Prácticamente todo el mundo ha jugado a algún juego de azar. Para empezar nos
gustaría saber algunas cosas como: a qué suele jugar, cuántas veces lo hace, cuánto suele
gastarse, etc. Le voy a ir diciendo diferentes juegos y le haré algunas preguntas sobre
cada uno. Piense durante unos segundos antes de contestar”.
202
203
204
205
Anexo 3: Hoja de resultados
HOJA DE RESULTADOS
206
3. Abrieron, pero no participaron
4. Abrieron, pero no había nadie con el perfil
5. Abrieron, había alguien con el perfil pero estaba fuera
6. Entrevista incompleta
7. Entrevista completa
N° DE ENCUESTADOR:
POBLACIÓN: ALMERÍA
DISTRITO: 1
SECCIÓN: 3
PUNTO DE MUESTREO: 1
CLAVE PARA LA SELECCIÓN DE VIVIENDA: 35
TABLA DE CUOTAS:
207
208
CAPÍTULO 8
INTRODUCCIÓN AL TRATAMIENTO DE DATOS
8.1. Introducción
209
8.2.1. Términos comunes
Antes de seguir adelante, se hace necesario referimos a algunos de los términos más
utilizados en el ámbito del tratamiento de datos en Ciencias Sociales,
fundamentalmente porque es necesario para poder entendemos con todos aquellos que
realizan las mismas actividades (Manzano, 1993).
210
Estamos en el punto en que hemos obtenido las medidas de determinadas variables
de una muestra o población de sujetos (datos brutos). Como hemos comentado, esos
datos habitualmente se encuentran en fichas, cuestionarios o simplemente sobre un
papel. Como podemos imaginar esta información debe ser transformada a datos con los
que podamos operar.
En este momento empieza el proceso de codificación. Pero para ser exactos, el
proceso de codificación tiene dos partes (Noelle, 1970). Una primera se lleva a cabo en
la construcción del cuestionario, ya que gran parte del proceso de codificación viene
determinado por las preguntas y, sobre todo, las respuestas que se hayan considerado;
de hecho, las categorías o valores de las respuestas al cuestionario serán los códigos de
las variables.
La segunda etapa, o codificación propiamente dicha, consiste en llevar a cabo la
transformación de las respuestas de los sujetos a códigos o datos que puedan ser
operativos. Para hacer este traslado hay que tener en cuenta que los datos que tenemos
(datos brutos) pueden proceder de preguntas abiertas o cerradas, y dentro de las
cerradas estas pueden ser números o letras. Así vamos a obtener dos tipos de variables:
variables alfanuméricas o literales (para las respuestas a preguntas abiertas y cerradas
con letras) y variables numéricas (para las respuestas a preguntas cerradas con
números).
En general, podemos decir que el proceso de codificación consiste en (Etxeberria,
Joaristi y Lizasoain, 1991):
1. Nombrar las variables que hemos medido a los sujetos. En el caso de las
encuestas las variables suelen coincidir con las preguntas del cuestionario.
2. Asignar códigos a los distintos valores de las variables. La codificación consiste en
realizar listas numeradas que contienen todas las posibles respuestas que se dan
a cada pregunta. En este sentido, hay que proceder de igual forma ya sea con las
preguntas abiertas como con las cerradas. Como veremos más adelante, al
proceso de construcción de estas listas numeradas con las respuestas a preguntas
abiertas se conoce con el nombre de categorización de respuestas.
En cualquier caso, es muy aconsejable codificar todos los datos como variables
numéricas, debido a que estas variables son mucho más fáciles de manejar para
un programa estadístico, de hecho, muchos de estos programas no admiten
literales o variables alfanuméricas. Recordemos la importancia que van a tener
estos valores numéricos en la tabulación y análisis de datos.
3. Asignar un código específico a los valores ausentes (missing values), es decir,
asignar un número a aquellos valores que no se han respondido, que son
211
confusos, erróneos, etc. Generalmente se utilizan números que no son valores de
las variables, por ejemplo el 9, 99, 999, etc.
4. Construir la matriz de datos. Generalmente, se realiza en papel, para
posteriormente grabarla en soporte magnético.
5. Grabarla en soporte magnético. Hay que tener en cuenta que la asignación de
números a variables alfanuméricas no garantiza que podamos hacer las
operaciones que creamos pertinentes. Para ello, hay que tener en cuenta las
escalas de medida (nominal, ordinal, intervalo, razón) en que vienen expresadas
las variables (para mayor información sobre las escalas de medida se puede
consultar cualquier manual de análisis de datos o psicometría, no obstante, y por
citar algún libro que aparece en el apartado de referencias, señalamos que en el
texto de Álvaro y Garrido –1995– hay un capítulo dedicado a ellas).
212
cerradas.
Una vez que tenemos codificadas las variables para cada sujeto, tenemos que
ponernos a pensar en cuál será el formato que aplicaremos a dichos datos.
Vamos a distinguir varios tipos de formatos de datos (Manzano, 1993):
Como los lectores habrán podido imaginar, este tipo de formato sólo se utiliza
para textos como éste. Nunca se deberían aplicar.
2. Formato fijo. En este formato cada variable ocupa una columna y cada individuo
una fila. Se llama fijo porque la posición que ocupa cada variable es siempre la
misma columna. Las columnas tendrán tantos dígitos como valores hayamos
asignado a cada variable.
Si seguimos con el ejemplo anterior, podríamos obtener la siguiente matriz
(llamado también formato fijo espaciado):
223126
654068
345333
056338
234222
012021
213
Este formato es un poco tedioso, ya que debemos especificar la posición exacta
de cada variable. Pero es especialmente útil para la corrección de errores
cometidos al introducir los datos.
3. Formato libre. Al utilizar este formato cada valor debe estar separado del anterior
y del siguiente, al menos, por un espacio en blanco. A diferencia del anterior, ni
las variables tienen por qué ocupar la misma columna ni cada sujeto tiene por
qué ir en una fila distinta. Veámoslo con el ejemplo.
223 12 6 654 6 8
345 33 3 56 33 8
234 22 2 12 2 1
Los programas que pueden utilizar este tipo de formato leen los datos en el
orden en que se encuentran y los van asignando a las variables y a los sujetos
que correspondan porque la cantidad de datos leídos así lo determina.
Este formato tiene la ventaja de ser el más cómodo para escribir los datos,
además de no ser necesario indicar posteriormente en qué columnas se
encuentra cada variable. Tiene por inconvenientes el de no detectar fácilmente
los errores en los datos y que si no existe uno de los valores (missing) se debe
especificar claramente que ese es un valor missing (cosa que no ocurre con
formato fijo, ya que basta con dejar el espacio en blanco).
Una vez que conocemos los dos formatos de introducción de datos, la elección
depende del especial cariño que uno le tenga a uno u otro. No obstante, existen
estructuras más aconsejables que otras en según qué casos (Manzano, 1993):
214
aconsejable es el fijo compacto (sin espacios entre variables), pues mantiene un
mismo esquema y ocupa el mínimo espacio en el disco.
— Si tenemos pocos datos y los vamos a revisar visualmente, el formato ideal es el
fijo espaciado, pues mantiene un mismo esquema (ideal para identificación de
variables e individuos) y facilita la localización mediante el espaciado.
— Si los datos que tenemos hemos decidido introducirlos directamente en el
programa de análisis de datos que vayamos a utilizar, y no a través de un archivo
previo, el mejor formato es el libre, pues las probabilidades de error disminuyen
considerablemente y resulta más cómodo (si el programa nos lo permite, claro).
La revisión se puede realizar pidiendo un listado de los datos por pantalla.
215
CUADRO 8.2. Hoja o libro de códigos.
Especial cuidado hay que prestar a los errores en los datos, que se pueden producir
por múltiples razones. Queremos hacer énfasis en los errores que se cometen en el
proceso de codificación y transcripción. Para ello existen varios procedimientos que
pretenden reducir este tipo de errores. Aquí nos referiremos brevemente a la
prevención del error y a la depuración de datos (Melià, 1990).
Como medidas preventivas destacaríamos la utilización del formato fijo tanto en
plantillas de papel formateadas con el nombre de las variable, como en presentaciones
en la pantalla del ordenador con el formato de las variables (la práctica totalidad de
programas de tratamiento de textos, hojas de cálculo o incluso los de análisis
estadísticos lo permiten). También la utilización de variables de control, tales como el
número de identificación de sujetos, hace que se eviten errores en la introducción de
datos.
La depuración de datos consiste en detectar los posibles errores que puedan tener
los datos ya introducidos en el ordenador. Meliă (1990) habla de técnicas sistemáticas
de detección de datos erróneos y técnicas de comprobación. Las sistemáticas consisten
en hacer análisis de descriptivos (numéricos o gráficos, generalmente de frecuencias)
de las distintas variables, para detectar si existen valores o modalidades no permitidas
(fuera de rango, es decir, valores por encima o por debajo de los valores permitidos). La
comprobación consiste en detectar errores comparando los valores de los sujetos en la
matriz de datos codificadas con las respuestas brutas de ese sujeto en el cuestionario.
Estas comprobaciones (que nunca suelen ser totales) se realizan sobre una muestra
aleatoria que recoja entre el 10% y el 20% de los sujetos.
216
8.3. Análisis estadísticos de datos
Una vez que tenemos la matriz de datos en soporte magnético y una vez decidido el
paquete estadístico que utilizaremos, sólo nos resta ponernos manos a la obra para
hacer los análisis estadísticos que estimemos convenientes.
Pero, ¿qué análisis estadísticos realizar para datos procedentes de encuestas? La
respuesta, como casi siempre, depende. Al igual que sucede con otras técnicas de
investigación, no existen unos análisis específicos de la técnica de encuesta, sino que
depende en cada caso de los objetivos de la investigación (y de la naturaleza de los datos
con que se trabaja).
Los principales aspectos que determinan la utilización de los análisis estadísticos
univariantes o multivariantes son (Gómez, 1990: 263):
Dado que el objetivo del capítulo no es el análisis de datos, remitimos a los lectores
al anexo 1, donde citamos algunos de los estadísticos más utilizados en el análisis de
datos procedentes de encuestas.
217
Diagrama de sectores
Pictogramas
Cartogramas
Diagrama de barras
Histograma
Polígono de frecuencias
Diagrama de dispersión
Medidas de posición centrales Media
Mediana
Moda
Medidas de posición no centrales Cuartiles
Deciles
Percentiles
Medidas de dispersión absolutas Amplitud o Rango
Rango lntercuartil
Varianza
Desviación típica
Medidas de dispersión relativas Coeficiente de variación de Pearson
Medidas de forma Asimetría
Apuntamiento o curtosis
Coeficientes de correlación Lineal
Múltiple
Parcial
Regresión Lineal simple
Lineal múltiple
Logística
Contrastes de hipótesis t test
ANOVA
ANCOVA
Si los lectores quieren tener una información más detallada pueden consultar
cualquier manual general de análisis de datos. El texto de Fink (1995c) es un libro muy
sencillo, claro y breve donde se explican estos conceptos estadísticos con múltiples
ejemplos de datos procedentes de encuestas. El texto de Santesmases (1997) es un muy
buen texto donde no sólo se comentan los análisis estadísticos más empleados (con un
apartado para análisis multivariados) en el contexto de la investigación mediante
encuestas, sino que además se implementa en un programa informático.
218
CAPÍTULO 9
EL INFORME DE INVESTIGACIÓN
9.1. Introducción
219
esta técnica en la investigación social y al aumento de la importancia de su papel en los
medios de comunicación.
220
considerar como uno de los máximos esfuerzos que se realiza, por parte de la
Sociología, para la comprensión de la realidad social española, por su extensión
y complejidad. En los dos últimos años, esta misma fundación, Cáritas y EDIS,
han llevado a cabo más de una treintena de estudios en distintas provincias
españolas; estas encuestas, sobre las condiciones de vida de la población pobre,
poseen un cuestionario idéntico y una metodología semejante (Equipo de
Investigaciones Sociológicas, 1995).
— La Fundación Santa María desde 1978 promueve la realización de estudios de
investigación educativa y cultural, que publica ella misma. Estas investigaciones
se basan en encuestas realizadas a españoles sobre sus valores, actitudes
religiosas, etc., estudiando en ocasiones sólo a la población infantil, juvenil o a
determinados profesionales (por ejemplo profesores).
— Por último, nos encontramos cómo en distintos medios de comunicación se ha
hecho habitual la publicación, por parte de las empresas privadas o institutos de
estudios de mercado y opinión –Alef, Data, Epsilon, Gallup España…
(AEDEMO, 1996)–, de informes sobre trabajos realizados por encargo. De este
modo, algunas de estas empresas se encuentran vinculadas a determinados
medios de comunicación (véase el cuadro 9.1).
221
FIGURA 9.1. Cuestiones previas.
Respecto a la pregunta quién o quienes van a ser informados distinguimos dos tipos
de personas: técnicos o especialistas y los que no lo son (Fink, 1995c). Los técnicos
especialistas exigirán mayor detalle en la información y más precisión en la
metodología; para el público más amplio, las necesidades son menos ambiciosas en
cuestiones técnicas pero más en aspectos de claridad y exposición. Cabe una tercera
situación en la que la audiencia sea a la vez técnica y no-técnica. A pesar de estas
distinciones existen consideraciones generales que en ningún caso se pueden soslayar
independientemente del público al que se pretenda informar, como por ejemplo la ficha
técnica.
En segundo lugar, a la pregunta de cómo se presentará el informe también
diferenciamos entre una exposición de resultados escrita u oral. Esta doble respuesta
afecta a los recursos utilizados en su preparación (en el caso de los informes orales
hablaremos de transparencias –acetatos–, diapositivas y de la infraestructura técnica
como retroproyectores, cañones de vídeo, etc.) y al papel de la retroalimentación y
diálogo, sólo presente en los informes orales. Lo usual es preparar y llevar a cabo ambos
tipos de exposiciones, aunque en este capítulo nos centraremos específicamente en los
informes escritos.
222
La clase de persona que va a ser destinataria del informe de una investigación
mediante encuesta es el criterio utilizado para diferenciar tres tipos de informes:
informes científicos, técnicos y divulgativos (véase cuadro 9.2). El objetivo de este
capítulo es desarrollar el segundo tipo de informes, los técnicos, que en muchos casos
tienen un carácter divulgativo puesto que pueden ser publicados en editoriales de gran
tirada y difusión, es el caso de los informes señalados en el apartado 9.2.
CUADRO 9.2. Clasificación de los tipos de informes y sus características más importantes.
Los informes científicos son aquellos que se presentan en revistas especializadas para
el mundo académico y para el ámbito de los especialistas, por esta razón el nivel técnico
es muy alto, ya que tiene que responder a mayores exigencias de rigor y precisión. La
presentación y extensión dependerá de cuál sea la revista en la que se edite, porque lo
habitual es que cada publicación tenga sus propias normas. Las partes que suele
presentar un artículo son título, resumen (abstract en inglés), palabras clave (o
keywords), introducción, método, resultados, discusión, referencias y apéndices.
Los informes técnicos responden a la necesidad de comunicar a la institución,
empresa u organismo que ha demandado un estudio o simplemente para divulgar con
el suficiente rigor los resultados de un trabajo. La apariencia que obtiene este tipo de
informes va más allá de un artículo en una revista especializada para tomar el de un
libro o documento con cierta entidad en su extensión. La estructura la analizaremos
más tarde cuando hablemos de los informes técnicos propiamente dichos.
Por último, quedan los informes divulgativos, que son presentados, normalmente, a
través de los medios de comunicación. Sus pretensiones son menores tanto en el
contenido que vienen a recoger como en el rigor técnico que muestran. Los periódicos
buscan el titular necesario para atraer la atención y a lectores, por eso un simple
porcentaje puede motivar un artículo a toda página que desarrolle las implicaciones y
explicaciones de éste. Frecuentemente, la presentación en sus aspectos más técnicos
deja bastante que desear; así, cuando el artículo periodístico tenga cierta entidad en su
extensión es imprescindible ser exigentes en los mínimos del cualquier informe, como
es el caso de las fichas técnicas (Dader, 1990).
223
9.3.3. Consideraciones generales
Artículo 32
Artículo 33
Artículo 34
Informaciones de base
224
b) objetivos del estudio,
c) los nombres de los subcontratistas y consultores que hayan realizado una
parte importante del trabajo.
Muestra:
d) una breve descripción del universo que se ha intentado estudiar y del que
efectivamente se ha estudiado,
e) el tamaño, naturaleza y distribución geográfica de la muestra, tanto
planificado como realizado, y, cuando sea relevante, el tamaño o extensión
de la información recogida de sólo una parte o fracción de la muestra,
f) una descripción detallada del método de muestreo y de los métodos de
ponderación utilizados,
g) cuando es técnicamente relevante, una explicación de la tasa de respuestas y
de los sesgos eventuales que pueden introducir las no-respuestas.
Recogida de datos
Presentación
225
multicliente, la parte del cuestionario referente al sujeto tratado)”
(AEDEMO: 1986).
La ficha técnica de una encuesta pretende recoger los elementos esenciales para la
comprensión de las características del procedimiento utilizado, su importancia es
capital porque representa el carné de identidad y de presentación del estudio realizado;
sin esta carta de identificación o de presentación, automáticamente, habrá que rechazar
la investigación y negarle la bienvenida al acervo del conocimiento científico. Dónde,
quién, cómo, cuándo, a quién, para quién, qué precisión, son algunas de las preguntas
que deben tener respuesta en la ficha técnica para cualquiera que quiera saber la
calidad de una encuesta.
A continuación se presentan los elementos principales que recoge la ficha técnica de
cualquier encuesta:
226
e) Error muestral o error de muestreo: es un número que representa el margen de
error aceptado o consecuente con la muestra empleada. La presentación más
adecuada es con el signo más/menos (±) delante y expresado en porcentaje. En
caso de haber utilizado, en algún momento del análisis de datos, submuestras, es
conveniente expresar el error muestral para estos subconjuntos.
f) Nivel de confianza o intervalo de confianza: viene expresado en porcentaje y
representa la probabilidad de que una estimación, en ausencia de sesgos, se
ajuste a la realidad. El más habitual en ciencias sociales es el 95,5%, lo que
equivale a dos sigmas (bajo determinadas condiciones: por ejemplo normalidad
de las distribuciones). Podemos completarlo con las varianzas utilizadas (valores
de p y q).
g) Tipo de entrevistas: cuál ha sido el tipo de entrevista, personal o cara a cara, por
correo y telefónica. Como se ha dicho antes este apartado puede aparecer
incluido en el tamaño de la muestra o en el tipo de muestreo.
h) Trabajo de campo: en este apartado se harán explícitos los días en los que se ha
administrado el cuestionario de la encuesta e incluso si se estima acertado
nombrar uno por uno el equipo de entrevistadores.
i) Realización: por último, se identifica la empresa u organismo que haya elaborado
y aplicado la encuesta y cualquier otra institución que haya colaborado o
subcontratado cualquier parte del trabajo, ya sea del diseño de la encuesta,
administración o análisis de ésta.
Estas exigencias mínimas establecidas por ley, en muchos casos incumplidas, junto
227
con otras como quién financia la encuesta, quién es el autor de los títulos y comentarios
de la encuesta, número de puntos de muestreo, etc. (González Río, 1997) completan
una ficha técnica imprescindible.
Respecto a la estructura del informe técnico de una encuesta, parece existir cierto
consenso. Sus diferentes partes vienen a coincidir en bastantes puntos con los informes
técnicos genéricos de cualquier investigación, independientemente del instrumento o
método utilizado (Ander-Egg, 1995). Así las partes más importantes son las siguientes:
a) Sección preliminar.
Portada:
— Título (subtítulo si se estima oportuno con detalles más específicos).
— Autor/es (nombre/s y apellidos).
— Destinatario/s (si existiera alguno especialmente).
— Localización geográfica.
— Fecha.
Agradecimientos:
— Patrocinadores del estudio.
228
— Director de la investigación.
— Equipo de investigadores.
— Entrevistadores.
— Colaboradores.
Índice general y analítico. (Capítulos, epígrafes, etc.).
Resumen o prólogo.
El informe técnico escrito contiene dos elementos básicos: el texto y los cuadros. Si
estos últimos están bien realizados y recogen los resultados esenciales de la encuesta, el
texto hará de acompañante y comentador de los mismos.
Existen tres tipos de cuadros siguiendo el criterio del protagonismo de texto o de
229
gráfico: desde los cuadros de texto a las figuras o gráficos, pasando por las tablas o
cuadros propiamente dichos (figura 9.2).
230
fotográficas. De todos los referidos el más destacable para los informes
sociológicos es la representación gráfica o simplemente gráfica a la que
consagraremos, también, un epígrafe completo.
Los datos numéricos pueden ser fascinantes o tediosos, atractivos o repulsivos; una
retahíla de porcentajes, frecuencias o cifras pueden hacer que lo importante se pierda
en esa maraña o que el lector u oyente cierre el informe para siempre o desconecte
pensando en la próxima declaración de la renta. De este preámbulo se obtiene la
conclusión de que es preciso reflexionar previamente sobre cuál es el medio más
idóneo para la presentación de los datos.
Existen distintas maneras de mostrar los mismos datos: desde las presentaciones
escritas o comentarios sociológicos hasta las más modernas presentaciones multimedia,
pasando por las clásicas tablas y gráficas (véase cuadro 9.5). La decisión de optar por
uno u otro camino va a depender de multitud de variables tales como el público al que
está destinado, el medio que se vaya a utilizar, los recursos disponibles, el tiempo, etc.
Con respecto al público un excesivo número de tablas o de texto va a fatigar a personas
no excesivamente especializadas, mientras que los detalles y reflexiones que pueden
aportar éstos serán imprescindibles para el experto; con relación al medio oral o escrito
es obvio que la exposición oral requerirá de mayor número de elementos visuales
gráficos que apoyo en textos; y por último, el tiempo y los recursos necesarios para
preparar presentaciones gráficas o multimedia pueden desbordar las posibilidades o la
preparación técnica del que realiza el informe. En los siguientes apartados se describen,
brevemente, las posibilidades que tienen cada una de las formas posibles de
presentación de datos.
✐ Presentación escrita
✉ Presentación tabular
❖ Presentación gráfica
Presentación multimedia
231
Este apartado lo podemos considerar como el nudo gordiano del informe; se
pueden obtener resultados espectaculares que se mantienen afásicos e insignificantes
cuando llega la hora de comentarlos y se es incapaz de transmitirlos por escrito. Existen
multitud de manuales, guías, y libros de estilo que aportan orientaciones y ejemplos
prácticos para el buen hacer en el campo de la redacción, cuya pretensión hace
coincidir intereses y responder a necesidades comunes desde distintas disciplinas,
como los informes económicos, técnicos, sociales y científicos (Velilla, 1995; Rodríguez,
1997). Las preguntas claves aquí son qué es lo que hay que comentar, cómo hay que
hacerlo y cuáles son los errores a evitar.
B) Presentación tabular
Introducción
232
La presentación tabular se basa en la idea de las matrices de datos organizados en
filas y en columnas. En muchas ocasiones se acompañan con líneas horizontales y
verticales que ayudan a diferenciar cada una de las casillas o celdas donde aparecen los
datos, cifras o texto.
Los objetivos en la construcción de tablas, y también en los gráficos son:
a) Número de tabla. Cuando exista más de una tabla, lo cual no sería extraño en un
informe, es imprescindible asignarle un número para localizarlo fácilmente.
Podemos utilizar el concepto cuadro o tabla y por otra parte la numeración
puede ser relativa al capítulo o al informe en su conjunto, con lo cual tenemos las
siguientes variantes: Cuadro 1, Cuadro 1.1, Tabla 1 y Tabla 1.1.
b) Título. La característica fundamental del título es su capacidad de sintetizar la
respuesta a estas cuatro preguntas: ¿qué?, ¿de quién?, ¿cómo? y ¿cuándo?
Además, para destacar su importancia, puede ser conveniente escribirlo en
mayúscula, por ejemplo: CREENCIAS RELIGIOSAS DEL MUNICIPIO DE
ALMERÍA EN 1997.
c) Subtítulo. En caso de que el título resulte excesivamente largo puede resultar
233
necesario retomar información complementaria en el subtítulo que aparecerá en
letra minúscula y más pequeña.
d) Fuente. Este elemento es imprescindible en cualquier caso, puesto que nos
permite comprobar y ampliar la información de la tabla, máxime cuando no son
originales. Si la tabla ha sido construida por nosotros mismos diremos que es de
elaboración propia.
e) Información complementaria. En muchas ocasiones, debido a la complejidad de
los datos o porque los distintos signos convencionales no ofrecen la solución, se
tiene que recurrir a explicaciones o notas explicativas que normalmente se
escribirán al pie de la tabla.
f) n muestral y base. El n muestral se refiere al número de personas entrevistadas en
la encuesta. Este dato es fundamental e imprescindible para conocer la calidad
de la encuesta, ya que nos permite estimar el error muestral a partir de este
tamaño y del ámbito (universo).
g) Rótulos o encabezamiento de columnas. Cada columna debe poseer un título que
explique los contenidos de un modo escueto y breve. Las unidades en las que
están expresados los datos deben quedar especificadas en los rótulos de las
columnas.
h) Columna matriz. Es la primera columna que nos encontramos a la izquierda que
contiene los conceptos desarrollados en esa fila; es recomendable alinearlos a la
izquierda también.
i) Columnas de datos o cuerpo. Son aquellas que muestran las cifras, porcentajes y
resultados de una distribución o un cálculo. En el caso de las tablas de
contingencia, existe un tipo de columnas especiales que se denominan columnas
marginales y que más adelante se explicarán.
j) Líneas horizontales y verticales. El rayado horizontal es prácticamente
imprescindible para diferenciar el título de la tabla, los rótulos de cada columna
o los totales, mientras el rayado vertical se puede obviar sustituyéndolo por un
mayor espaciado.
k) Tramas. En algunos casos se pueden utilizar tramas, incluso de colores, para
diferenciar resultados según el grado de cada casilla. Con las tramas aplicadas a
las tablas nos acercamos bastante a la presentación mediante gráficos.
Tipos
234
a) El primer tipo de tablas son aquellas que contienen una serie de conceptos o tipos
de objetos presentados de forma tabular, son las llamadas tablas tipológicas de las
que podemos encontrar dos claros ejemplos en las tablas 9.1 y 9.2, pero que
realmente no aportan datos, ni ninguna cifra sino simplemente una clasificación
de conceptos o clases y subclases de elementos. Los otros dos tipos de tablas son
las más habituales en los informes y son las que nos presentan de un modo
ordenado datos en filas y en columnas: las tablas de frecuencias y de
contingencia.
b) Las tablas de frecuencia distribuyen los resultados entre los distintos valores de
una sola variable. En el ejemplo (cuadro 9.6), la variable es la creencia religiosa y
los distintos valores que puede adoptar son católico, indiferente, ateo, otras
creencias y no sabe o no contesta. En las columnas sucesivas aparecen la
frecuencia, el porcentaje, y además se podría incluir porcentajes acumulados,
para lo cual sería recomendable ordenar los valores de un modo distinto (por
ejemplo católicos, otras creencias, indiferentes y ateos).
c) Las tablas de contingencia son una técnica de análisis de los datos que tiene como
función resumir la relación entre variables (Sánchez Carrión, 1989). En este tipo
de tablas aparece una clase distinta de filas y de columnas que se denominan
marginales y que, además, tienen una importancia capital aunque vengan a
reiterar y coincidir con las distribuciones de frecuencia de las distintas variables.
Las posibilidades de las tablas de contingencia son numerosas, ya que se pueden
cruzar dos o más variables en función de los intereses del investigador. En el
ejemplo propuesto (cuadro 9.7) se cruzan sólo dos variables: creencia religiosa y
sexo con las frecuencias y porcentajes de columna.
235
CUADRO 9.7. Ejemplo de una tabla de contingencia.
Fuente: Curso de Encuestadores. Universidad de Almería.
Algunas recomendaciones
236
tipo de relación o vínculo en común.
En definitiva, todas estas recomendaciones van en la línea de los objetivos que nos
habíamos propuesto en el inicio de este apartado dedicado a la presentación tabular.
C) Presentación gráfica.
Introducción
Del mismo modo que una imagen vale más que mil palabras, una gráfica dice más
que mil celdas o casillas de una tabla. Esta versión del antiguo proverbio nos llama la
atención sobre el poder de la representación gráfica. Aunque no nos muestre tantos
detalles exactos, tiene la capacidad de atraer la atención del lector de un modo directo y
transmitirle todo nuestro mensaje en pocos segundos (Wallgren, 1996). Por su parte, los
avances de la metodología de las gráficas, la psicología de la percepción gráfica y los
equipos de ordenadores han hecho posible el perfeccionamiento y la generalización del
uso de representaciones gráficas con un rigor y claridad cada vez más próximos a la
perfección (Jacoby, 1997).
Los objetivos a conseguir en los gráficos son los mismos apuntados en las tablas
(véanse apartados anteriores).
Partes y descripción de las gráficas (figura 9.4)
237
b) Título: (ídem)
c) Subtítulo: (ídem)
d) Fuente: (ídem)
e) Información complementaria: (ídem)
f) N muestral y base: (ídem)
g) Leyenda: preferentemente presentada en un cuadro. Fuera del cuadro de datos
nos identificará las distintas categorías que adopta el eje X o la explicación de las
distintas tramas, tipos de líneas de la gráfica, etc.
h) Rótulos de ejes: las variables representadas en cada uno de los ejes, X e Y, deberán
ser identificadas mediante sus respectivos títulos o rótulos de manera breve y
concisa. Lo idóneo es colocar en el eje X las variables de tiempo, cualitativas o las
que pretendamos cuantificar.
i) Etiquetas de los valores de eje X: los valores de la variable que aparecen en el eje X
serán etiquetados para ser identificados.
j) Rango: el eje Y cuantifica, normalmente, los valores de la variable expresada en el
eje X. De este modo, el eje Y comenzará con una base 0, preferentemente,
construyendo los intervalos o rangos del modo más oportuno con números
pares.
k) Tramas y diferenciación entre categorías: colores, sombreados o distintos tipos de
líneas pueden ser utilizados para diferenciar las distintas categorías que aparecen
en la gráfica.
l) Rótulos de datos: esta parte del gráfico es optativa, consiste en colocar los datos
exactamente en el sector o en el punto de corte de los dos ejes.
ll) Cuadrícula o rejilla: como continuación de las marcas que aparecen en los ejes X
e Y, pueden construirse de modo optativo líneas horizontales y verticales para
tomar en consideración los datos con líneas más próximas.
Tipos
— Barras
— Sectores
— Líneas
— Puntos
238
— Dendograma
— Densidades
— Caja
— Trilinear
— Mapas
— Mixtos
— Gantt
— Pirámides
— Radar
— X-Y dispersión
— Áreas
— Pictograma
— Histogramas
— Anillos
Además, la mayoría de cada uno de estos tipos de gráficas adoptan variantes como
las tres dimensiones, apilamiento, solapamiento, giros de 90°, etc., todo lo cual hace aún
más complejo la clasificación, incluso cuando existe la posibilidad de generar
combinaciones y mezclas entre ellas. A pesar de todo esto, destacamos dos tipos de
gráficos por su profusa difusión y utilización en los informes: gráfica de sectores o
circular y la gráfica de barras o de columnas. La primera de ellas es más conveniente
cuando queremos representar la distribución de un porcentaje o proporción (figura 9.5)
y la segunda cuando queremos establecer alguna relación o comparación (figura 9.6).
239
FIGURA 9.6. Ejemplo de gráfica de barras.
Algunas recomendaciones
— Evaluar la naturaleza de los datos. Cada conjunto de datos tiene su gráfico ideal
y más apropiado; por esa razón puede resultar útil intentar varias gráficas
distintas para presentar los mismos datos, para escoger posteriormente la mejor.
— Seleccionar el gráfico más adecuado. Como se ha dicho antes los gráficos de
sectores son más idóneos para representar porcentajes y proporciones y los de
barras para comparaciones o distribuciones más complejas. La gráfica de
sectores tiene un límite máximo de ocho sectores a partir de los cuales se hace
poco legible, siendo recomendable transformarlo en otro tipo de gráfica. Las
gráficas de barras, cuando sobrepasan las seis columnas, es aconsejable
colocarlas en horizontal.
— Evitar distorsiones producidas por los colores: el 5% de la población no distingue
entre el verde y el rojo; además, dado que se lee de izquierda a derecha, los
colores o tramas más claras irán a la izquierda y las más oscuras a la derecha;
producidas por el rango: procurar iniciar la escala del eje Y por 0; producidas por
los números índices: señalar claramente que se están utilizando; producidas por la
tridimensionalidad: no utilizar las tres dimensiones ni perspectivas superfluas.
— Cuidar la composición y la consistencia. El lugar del gráfico dentro del texto de
informe es una cuestión crucial para la coherencia y la concordancia entre el
comentario y las representaciones gráficas aludidas; como norma general
pondremos la explicación, después la ayuda visual. También hay que cuidar la
consonancia entre las gráficas de un mismo informe cuando se aplican tramas
iguales para idénticas variables en distintas gráficas (por ejemplo utilizar
siempre el rosa para los hombres y el azul para las mujeres).
240
D) Presentación multimedia
Prácticamente todos los programas que nos han facilitado hasta la actualidad el
diseño de nuestras gráficas y tablas están abriendo sus puertas y menús a opciones
multimedia, e incluso a la exportación de los documentos, tablas y gráficas a formatos
adecuados (html, gif, jpg…) para ser leídos por navegadores de Internet (Netscape,
Explorer, Mosaic…). En el cuadro 9.8 aparece un listado de programas gráficos según
su utilidad específica: elaboración de representaciones gráficas, organigramas y
diagramas, y, por último, los que permiten presentaciones multimedia (no se
mencionan versiones porque van actualizándose, casi, mes a mes).
241
CUADRO 9.8. Programas gráficos.
Fuente: PC Magazine, 1996.
242
CAPÍTULO 10
LA CALIDAD DE LA ENCUESTA
10.1. Introducción
243
observación se hace referencia a la parte de la población que no ha sido medida. Vamos
a distinguir tres tipos de errores de no observación. En primer lugar, el error muestral,
que es el que más claramente limita a los sujetos de una población que serán medidos.
En segundo lugar, el error de cobertura, ya no tan evidente, es el que se provoca por el
hecho de que algunos sujetos no formen parte de la lista de los que son previamente
identificados como pertenecientes a la población. Y, por último, el error de la no
respuesta, provocado por aquellos sujetos que no han podido ser localizados por el
encuestador o aquellos localizados que rehusan ser entrevistados. Con los errores de
observación se hace referencia a las desviaciones que presentan las respuestas de los
sujetos del verdadero valor en la variable que se pretende medir; por situaciones tales
como la falta de capacidad del sujeto, la deseabilidad social de la respuesta, etc.,
distorsionan la respuesta de tal forma que provocan que no se ajuste fielmente a lo que
se le pregunta. Igualmente, la desviación podría haber sido producida por la actitud de
los encuestadores con los encuestados, por la estructura y características del
instrumento, así como por la manera de recoger los datos (correo, cara a cara, teléfono,
etc.).
Como puede comprobar el lector a través de estas limitadas pero significativas
referencias, se está produciendo un cambio importante de perspectiva en relación con
la calidad de la encuesta.
Tradicionalmente la calidad se conectaba con los errores de muestreo propiamente
dichos, pero en la actualidad es cada vez más aceptado que los errores ajenos al
muestreo son tan decisivos como aquéllos a la hora de valorar la calidad de los
resultados obtenidos con este enfoque. De ahí que no sólo se preste atención al diseño
de la muestra y a su error correspondiente, sino que se dedica mucho esfuerzo al
procedimiento de recogida de datos, a quienes responden, no responden o no pueden
responder, a la supervisión, a los encuestadores, al cuestionario, etc., todos ellos bajo el
rótulo de errores ajenos al diseño de la muestra.
Este capítulo se tratará desde la perspectiva de la previsión de los errores en la
investigación mediante encuestas, más que desde la preocupación por medirlos o
estimarlos. Se contará con lo ya expuesto en capítulos anteriores que introducen
elementos específicos de control. Por ello, la fiabilidad y validez del instrumento, así
como el error de muestreo propiamente dicho, entre otros aspectos, no serán tratadas
específicamente, en cambio nos detendremos en cuestiones tales como errores debidos
al encuestador, codificación y escritura de datos, imputación de datos perdidos, etc.,
que no han sido tratados en ninguno de los capítulos anteriores. Para seguir la línea
expositiva del texto, se han englobado las posibles fuentes de error en: errores asociados
al muestreo, errores asociados con el cuestionario, errores asociados con la entrevista y
244
errores asociados con el tratamiento de datos.
10.2.1. La no respuesta
245
respuesta). Como puede observarse, se trata de distintos niveles y unos implican a otros.
Así, de una persona (o unidad de muestreo) que no responde, no se dispone de ninguna
información, cosa diferente a que una persona o unidad de muestreo deje sin responder
una o varias preguntas del cuestionario.
Las tasas de respuesta/no respuesta pueden referirse a toda la muestra, a un
conglomerado, a un encuestador, a un grupo con ciertas características, etc. El lector
interesado en este tema puede comenzar consultando el texto de Platek (1986), en
donde se definen formalmente los diferentes tipos de tasas de respuesta/no respuesta y
su conexión matemática con las estimaciones de los parámetros poblacionales.
La idea general que subyace bajo esta problemática se entronca con la preocupación
de la fidelidad con la que la muestra resultante representa a la población. En esto, no
sólo influyen precisos y meticulosos diseños y procedimientos muestrales, sino otras
circunstancias, si cabe más importantes y con menor posibilidad de someter a control:
los datos finales de una encuesta dependen de la actitud de personas concretas, de
forma tal que no se puede asegurar nada en el diseño muestral de la manera en que
deben y tienen que contestar. En toda encuesta hay personas que colaboran y otras no
tanto (se dejan preguntas sin contestar, rehusan ser entrevistados, enmascaran
consciente o inconscientemente sus respuestas, etc.); esta realidad atenta claramente
contra estimaciones realizadas desde los datos finalmente obtenidos. A continuación se
enumeran distintas situaciones de no respuesta:
246
rellenar solos. Es el caso de personas que no saben leer, están en el hospital, han
dejado de vivir en esa casa, etc.
Todas estas situaciones añaden al error de muestreo propiamente dicho otra fuente
de error que puede introducir, como ya se ha indicado, sesgo en los datos globales, de
tal manera que provocan diferencias sistemáticas en relación con la población de
interés. Debido a esto, durante los últimos años se está prestando una atención especial,
independientemente de los errores de muestreo propiamente dicho, al desarrollo de
procedimientos que intenten atenuar esta fuente de error, con una doble finalidad:
247
encuestas por correo hay una mayor colaboración cuando se utilizan grupos de
personas de nivel cultural alto frente a personas de nivel cultural bajo. Por todo ello,
estos aspectos hay que tenerlos en cuenta a la hora establecer las conclusiones finales en
relación con poblaciones de interés heterogéneas. En cambio, la disponibilidad de unas
personas en una encuesta telefónica realizada en horario laboral estará sesgada en
relación con amas de casa, parados, jubilados, y personas en general no pertenecientes
al mundo del trabajo. Es interesante tener en cuenta razonamientos similares para
aquellos procedimientos de recogida de datos que se realizan a través de entrevistas
cara a cara. Por último, cabe recordar una vez más que existe sesgo asociado con
personas de la muestra que no son accesibles, tales como enfermos, personas sin
teléfono, viajantes, presos, extranjeros, etc., aunque ellos representen una pequeña
proporción de la población.
Los párrafos anteriores nos llevan a la conclusión de que una reducción de la tasa
de no respuesta favorecerá la fiabilidad y la calidad de las estimaciones. En líneas
generales, una encuesta con una mayor tasa de respuesta permitirá mejores
estimaciones y serán menos sesgadas que otra con una tasa de respuesta menor. De
manera que, para mejorar la calidad de la encuesta, el investigador debe poner en
marcha todos los medios a su alcance para reducir la tasa de no respuesta. He aquí
algunas iniciativas:
248
entrevistadores para que pongan el máximo empeño en el primer contacto para,
al menos, informar exhaustivamente del objetivo de la encuesta, su importancia,
la confidencialidad de las respuestas, proponer otro momento para realizar la
entrevista, etc. En muchas ocasiones, después de una conversación relajada y
aparentemente desinteresada, el sujeto que en un principio rechazó contestar el
cuestionario accede a su realización.
5. Hacer comprender a los entrevistadores la importancia de contar con una tasa
de respuesta elevada para la relevancia de los resultados obtenidos, el esfuerzo y
el gasto que conlleva todo el trabajo y que lo más importante del mismo recae
en ellos.
6. Identificar a los entrevistadores que obtienen tasas de respuestas bajas y adoptar
alguna estrategia que subsane la situación detectada: entrenarlos nuevamente o
apartarlos momentáneamente de su cometido.
7. En las encuestas por correo, hay que cuidar elementos tales como la claridad del
texto, el uso de colores en la elaboración del cuestionario con cabeceras
adecuadas y atractivas, el envío de regalos antes o después de la colaboración
del sujeto, cuestionarios fáciles de leer y de rellenar y cualquier otro detalle que
al sujeto le sugiera que el cuestionario es serio, atractivo y lo más personalizado
posible. Todo ello rebaja la tasa de no respuesta.
8. Incluir todos los detalles necesarios que comuniquen al entrevistado que sus
respuestas se mantendrán en el más absoluto anonimato.
249
las respuestas de los que no respondieron hubieran sido semejantes a las
disponibles– para hacer que su influencia en la estimación se acerque a lo real.
3. Determinar una muestra de entre los que no respondieron y tratar de conseguir
su colaboración, con métodos más intensivos y directos. Estas nuevas respuestas
pueden ser usadas por los investigadores de dos formas:
250
Esta costumbre eleva la probabilidad de error ya que a veces la contestación se
realiza marcando bien a la derecha o bien a la izquierda de la respuesta.
____ nunca o casi nunca____ alguna vez al mes____ alguna vez a la semana____
todos los días
251
abierta que preserve un nivel de escala de intervalos a otra cerrada que lo limite a
una escala ordinal o nominal.
Entre 0 y 25 años…………1
Entre 26 y 45 años…………2
Más de 46 años……………3
Este es un claro ejemplo de pregunta que hubiese sido preferible hacerla abierta,
a fin de no perder nivel de medida y de esa manera poder hacer uso de análisis
estadísticos acordes con dicho nivel.
En muchas ocasiones, y a veces por el simple hecho de mantener en el
cuestionario una uniformidad en el tipo de preguntas, se utilizan preguntas
cerradas para recoger datos de carácter continuo. Para estos casos se hace uso de
muchas categorías de respuestas, creyendo, con esta actitud, que es una manera
de ayudar a los sujetos que tienen un vago recuerdo de lo que se les pregunta, a
pesar de que así los valores sólo preservan el orden. Con ello se acepta de
antemano una perdida de información útil y válida.
Además de lo indicado, una ventaja de las preguntas abiertas es que ahorrará
espacio y tiempo en el uso del cuestionario y son una excelente alternativa para
cuando no se conoce de manera exhaustiva el rango y variedad de las categorías
de respuesta.
5. Los códigos usados para categorías de respuesta repetidas en las distintas
preguntas del cuestionario, tales como no sabe/no contesta, sí, no, muchas, a
veces, etc., deberán codificarse siempre igual. En éste sentido, se han establecido
normas en relación con los códigos que se asignan a las categorías de respuesta
que más habitualmente se incluyen en los cuestionarios. Así, se usan los
números 7, 8 y 9 respectivamente para las categorías de no sabe/no contesta, para
cuando no se realiza la pregunta al sujeto y para cuando se pierde el dato por
alguna razón (cuadro 10.1).
Estas indicaciones evitan posibles errores, a la vez que facilitan los análisis de la
calidad de los datos una vez procesados.
6. También es de interés resaltar, en aras a la calidad de los resultados, que los
distintos números que se usen para codificar las restantes categorías de respuesta
no deben de determinarse de cualquier manera, sino más bien tratando de que el
número que se use represente lo mejor posible, en términos relativos, el sentido
de la categoría de respuesta. Así, los códigos deben relacionarse con los
252
cuantificadores de respuesta tales como ninguno, alguno, bastante, mucho, etc.,
de manera que los códigos vayan igualmente incrementándose.
La idea general que se persigue con todo esto, es, por un lado, facilitar cualquier tipo
de transformación que se desee realizar y, por otro, el preservar al máximo el nivel de
escala de los datos recogidos.
El lector interesado en cuestiones particulares relativas a las opciones de respuesta
puede consular el trabajo de Bourgue y Clark (1994).
Uno de los aspectos que mejor nos sirve para evaluar la calidad de los datos
recogidos en una encuesta, independientemente del procedimiento seguido para
obtenerlos, es el que se haya desarrollado un estudio piloto del mismo. En este estudio
se pone en escena el instrumento entero así como todas las etapas del proceso de
recogida de datos, utilizando para ello un grupo de sujetos más reducido. Si un
instrumento, así como el proceso de recogida de datos en sí, no ha sido utilizado en una
ocasión anterior (pretest) a la recogida de datos definitivos, bien podría pensarse que la
calidad de la encuesta debe presentar graves deficiencias. Esta etapa básica, aunque
frecuentemente no desarrollada, es fundamental porque en ella se evalúan los
siguientes aspectos:
1. Cómo son de entendibles las distintas preguntas, así como las instrucciones en
general. Igual ocurre con las distintas categorías de respuesta para el caso de
preguntas cerradas.
2. Cuál será la mejor secuencia de preguntas en el cuestionario y cual será el orden
de recogida de los distintos aspectos que pretende cubrir la encuesta.
3. Cómo de adecuada y fiable es la forma de recoger los datos.
4. Cuál será el coste, en tiempo y dinero, del trabajo definitivo.
5. Cuánto tiempo medio será necesario solicitar del sujeto para completar el
cuestionario.
6. Qué preguntas se eliminarían si el tiempo de recogida de datos por sujeto
253
resultase demasiado largo.
7. Cómo se comportan las preguntas de filtro, las de control, etc.
254
concreta del campo en cuestión. Por ejemplo, si el objetivo de una encuesta estuviera
relacionado con los materiales y las condiciones óptimas para la práctica del golf, los
encuestadores deberán acreditar un conocimiento específico relacionado con este
deporte. Sea cual fuere el caso, se necesita un entrenamiento específico, un contacto
previo con el cuestionario, haberlo administrado en una ocasión vigilada, etc. El lector,
puede encontrarla una agenda básica de entrenamiento de encuestadores en Weinberg
(1983).
Todo el proceso de preparación de los datos para su puesta a punto para los posibles
análisis comienza en la recogida de datos realizada por el encuestador. En esta fase el
255
encuestador deberá, una vez realizada la entrevista, repasar lo reseñado en el
cuestionario, ya que es cuando más reciente tiene lo sucedido y podrá completar todos
aquellos aspectos que no pudo anotar al tiempo que realizaba la entrevista. Cabe
destacar a modo de guía los siguientes:
Otra fuente de error que rebaja la calidad de las encuestas está íntimamente ligada a
la codificación de las respuestas de las preguntas abiertas. Esta codificación, como se
dijo en el capítulo 8, trata de la transformación de las respuestas escritas a un código
que las represente. Este proceso se realiza después de recoger la información y de
analizar el contenido de todas las respuestas obtenidas para cada una de las preguntas
abiertas del cuestionario.
Este proceso no es tan intuitivo como en principio puede parecer y de no realizarse
convenientemente, provoca una serie de informaciones erróneas que atentan contra la
validez de la encuesta. Ejemplo: cómo codificar las distintas respuestas que pueden
obtenerse ante la pregunta ¿cuántos amigos tienes? Veamos: si responde 1, 3 o 7 parece
que la situación es fácil, con sólo codificarla con el número correspondiente es
suficiente y correcto. Pero si contesta con un rango, por ejemplo entre 8 o 10, o si usa
como respuesta “muchos”, “pocos”, etc., la situación se complica. En estos casos hay que
determinar, una vez analizada toda la información requerida, qué códigos deberán
256
usarse, de manera que se preserve el sentido de las respuestas dadas por los sujetos a las
preguntas abiertas. De los ejemplos anteriores el mayor problema lo plantean las
respuestas verbales (no numéricas); en estos casos se determinarán códigos arbitrarios y
sólo relacionados con las respuestas en forma de correspondencia: usar valores más
altos para codificar “muchos” que para codificar “pocos”. En relación con las respuestas
a modo de rangos, Sonquist y Duntelberg (1977) aconsejan usar como código el punto
medio del intervalo. Esto, al igual que se determinó para las categorías de respuesta no
sabe/no contesta, etc., facilitará la labor en los análisis que posteriormente se realicen a
partir de los datos procesados.
Es necesario mantener especial atención a la hora de la codificación de las
respuestas abiertas. Cuando se trata de respuestas cortas y concisas tales como
preferencias, ocupación, etc., es aconsejable utilizar algún índice publicado por
organismos públicos o privados. En cambio, para respuestas más complejas es
imprescindible que el investigador cree su propia estructura de códigos. Básicamente se
trata de recoger por categorías, de manera fiel y aceptable, las distintas respuestas dadas
por los sujetos. Para esto se tendrán en cuenta las reglas indicadas para la codificación
de las categorías de respuesta en las preguntas cerradas. Además de éstas, Bourque y
Clark (1994) añaden las siguientes reglas específicas para determinar el sistema de
códigos:
257
10.5.2. Errores asociados al registro o grabación de los datos
Una vez codificados y registrados los datos el investigador puede y debe comprobar
la idoneidad y consistencia de las respuestas dadas por los sujetos; si eran las
adecuadas, si las preguntas filtro se realizaron correctamente, valorar las preguntas de
control, etc. Para ello puede editar el fichero donde se registraron los datos y con una
simple inspección detectar fuentes de error que hasta ese momento pasaron
inadvertidas, tales como el número de registros completos, la dimensión y
características de la muestra, errores claros en el cuestionario, sesgos en las respuestas,
etc. Esto permitiría al investigador introducir cambios en el procedimiento que le lleven
a subsanar los errores detectados antes de iniciar el análisis de los mismos. Éstos
pueden consistir en volver a entrevistar a algunos sujetos del estudio, aumentar el
número de entrevistadores, recoger muestras adicionales que cubran aspectos y
características no recogidas en el ensayo realizado, etc. Como el lector podrá imaginar
todas estas indicaciones favorecerán la calidad de los resultados definitivos, que sin
duda serán menos costosos en tiempo y dinero que unos datos de baja calidad.
Aún queda una tercera y definitiva inspección a los datos registrados que permite
determinar indicadores formales de la calidad de los mismos. En esta fase hay que
atender a aspectos tales como el rango de puntuación de cada una de las variables
procesadas o la existencia de datos que muestren claras inconsistencias. Las tablas de
contingencia, en las que es posible combinar uno o varios datos entre sí de tal manera
que los valores que aparecen en cada casilla de cruce, pueden ayudar a detectar y
determinar dichas inconsistencias. En cualquier caso los errores localizados deberán
ser subsanados antes del inicio de los análisis correspondientes.
Esta tercera fase se completará lo más próxima posible a la fase de recogida y
registro de los datos. El abordar estas tareas pasado un tiempo considerable (4 o 5 meses
después) complica enormemente la tarea de depuración de datos erróneos.
258
donde se sitúan las variables así como el significado de los distintos códigos que
puedan representar a la variable. De acuerdo con la hoja de códigos que
representa el cuadro 10.2a, se muestran los registros correspondientes a cuatro
personas (10.2b).
Con la sola inspección de la hoja de códigos y el fichero de datos sería fácil para
todos aquellos investigadores que intentaran analizar los datos el identificar con
nitidez los valores de una variable en particular o de todas ellas. El registro de
fichero de datos del ejemplo hace referencia a los sujetos 95, 96, 97 y 98 de la
muestra. El sujeto 96 es hombre, con clase social baja, de 45 años de edad. La
hoja de códigos nos permite igualmente establecer el rango de valores posibles
para cada variable y a partir de ellos subsanar los errores ocurridos durante la
introducción de los datos, ya que al comprobar los valores más pequeños y más
altos que aparecen en los distintos campos, identificaríamos aquellos registros en
los que es imposible que un número determinado apareciera en una variable
concreta. Por ejemplo 3 en la variable sexo. Su comprobación nos llevaría a
corregir el valor real de dicha variable una vez que repasáramos los datos del
sujeto en cuestión.
2. Descripción de las características de la muestra obtenida. Esto nos indicará el
grado de representación de la misma en relación con la población de interés. En
el caso en el que algunos estratos de población no estén bien representados
habría que determinar si es aconsejable el recoger datos de los no representados
antes del inicio de los análisis o bien hacer uso de procedimientos estadísticos
para determinar el peso de cada aspecto sobrerrepresentado en relación con las
características de la población y de esta manera contrarrestar su influencia en el
análisis de los datos originales.
3. Eliminación de registros a causa de datos perdidos, incompletos o inconsistentes.
4. Transformación de variables y, a partir de ellas, crear nuevos ficheros desde los
que realizar análisis específicos: crear, del fichero original, dos ficheros (uno en
el que están todos los hombres entre 20 y 35 años y otro entre los 36 y 50 años),
por ejemplo.
5. Evaluar las distintas escalas de medida de las variables en relación con su
fiabilidad y validez.
6. De acuerdo con el fichero de documentación, realizar unos cálculos simples a
mano con sólo los 10 primeros sujetos del fichero de datos y comprobar que el
cálculo resultante al ejecutar el programa informático específico utilizando los
mismos sujetos coincide con los obtenidos a mano. Esta estrategia asegura que la
forma en que el ordenador ha leído los datos se corresponde en lugar y espacio
259
con los del fichero correspondiente.
…
000951234
000961045
000970027
000981135
260
las que no hay razones para que las proporciones de respuestas obtenidas en otras
variables sean claramente diferentes. A partir de aquí se establece la tasa de respuesta en
cada uno de los grupos y se usa el valor obtenido como ponderación de todos los datos
presentados en cada grupo.
En el caso de los datos perdidos, las distintas estrategias se han tratado en apartados
anteriores de este capítulo así como en capítulos específicos de este texto.
Por último, un breve comentario en relación con los datos fuera del rango o los
datos inconsistentes con el resto. En cuanto a los primeros queda el problema resuelto
volviendo a inspeccionar los datos originales del sujeto correspondiente, aunque como
es obvio hay que identificar el dato como fuera del rango. Esta tarea se facilita con el uso
de programas informáticos. Respecto a las variables nominales y ordinales, cualquier
valor fuera del rango indica al investigador el posible error; para variables con nivel de
escala de intervalos, el problema ya no es tan simple. En estos casos se ha de tomar
como referencia las distribuciones de las variables y la probabilidad de aparición de un
dato en concreto. Serán entonces los tests estadísticos los que catalogarían los datos
inconsistentes. Para esta catalogación a veces es suficiente con sólo el percentil de cada
valor. Por otra parte, en la actualidad la mayoría de los análisis presentan una opción
para el tratamiento y detección de este tipo de datos. Una última decisión sobre este tipo
de datos: ¿qué hacer con ellos una vez detectados? La mayoría de los investigadores no
dudan en eliminar y sólo se plantean mantenerlos en aquellas ocasiones en las que el
criterio de dato inusual no está del todo claro. En estos casos, antes de eliminarlo se
consideran las características del sujeto y se valora la importancia del mismo como
componente de la población a la que se quieren referir los resultados y, si es muy
importante, se mantiene. En tal caso deberemos determinar con qué valor.
Por imputación se quiere indicar el proceso o método que se sigue para asignar un
valor a los registros perdidos de uno o unos sujetos determinados, bien porque no
quisieron responder bien porque su contestación no fue anotada por el entrevistador o
por cualquier otra causa.
Existen diversos procedimientos de imputación. La base conceptual justificativa de
todos ellos radica en experiencias anteriores, en la deducción, en el tratamiento
estadístico, a veces en la intuición y en datos anteriores del mismo o parecido
fenómeno. Su objetivo es el de no tener que eliminar elementos de la muestra que
pudieran romper la representatividad de la misma. A veces se dispone de uno o de
261
varios elementos muestrales, de todos sus datos menos uno. En estos casos, ¿es
conveniente eliminarlos y perder el resto de su información? Si se mantienen es
necesario establecer un criterio para rellenar los datos perdidos, de tal manera que
dicha sustitución provoque el menor error posible a la vez que se evita el sesgo que
pudiera suponer la no presencia del mismo o de los mismos en la muestra definitiva.
Sin embargo, ningún procedimiento de imputación de datos asegura la reducción del
sesgo. Mirándolo fríamente, lo que se hace en definitiva es generar datos, no
recuperarlos; la cantidad de información disponible es la misma. Lo que sí se consigue,
de adoptar el procedimiento adecuado, es conservar toda la información recogida al
tiempo que se espera conseguir mejores estimaciones al incluir datos imputados.
La estrategia más adecuada de imputación es la que se sigue a partir de la
información que se tiene del conjunto de datos. Desde ellos se puede deducir el valor
que falta en un registro específico apoyándose en sus características concretas. Si de un
registro falta el dato de si el sujeto dispone o no de coche, y en otras de sus
contestaciones se recoge el dinero que gasta en gasolina, el que gasta en transporte
público y cuál es su tipo de trabajo, se podría rellenar el dato perdido con cierto grado
de seguridad.
Otro método de imputación, para aquellos datos no disponibles que por alguna
razón no puedan ser deducidos, consistiría en duplicar un valor de los existentes, la
elección del valor a duplicar se obtiene, básicamente, después de clasificar a todas las
unidades muestrales en grupos homogéneos en sí mismos y a la vez heterogéneos entre
sí, y a cada dato que falte se le asigna el de su grupo correspondiente.
También es muy útil, aunque costoso teórica y materialmente, el recurrir a técnicas
estadísticas, tales como la regresión a partir de unas variables de control. Lo estimado se
tomaría como el dato a imputar a una unidad muestral concreta de la que no se tuviera
información.
Por último, cabe citar el método de ponderación de grupos de datos ya recogidos. Se
trata de otro método bastante extendido al que ya se ha hecho referencia anteriormente
en este capítulo.
10.6. Conclusión
262
a) El Diseño de la muestra. Bajo este epígrafe se engloba todo lo referente a la
descripción de la muestra, del método de muestreo, procedimiento seguido para
obtener la muestra, la muestra resultante, variables usadas y ponderación, en su
caso, de las mismas.
b) El instrumento de recogida de datos. Copia de todos los instrumentos de recogida
de datos, con su referencia bibliográfica, si se trata de instrumentos ya
desarrollados. En el caso de instrumentos y procedimientos ideados por el
investigador responsable de la encuesta se deben presentar los resultados del
estudio piloto y de los cambios realizados a partir del mismo. También hay que
señalar las indicaciones sobre los procedimientos seguidos para el cálculo de la
fiabilidad y la validez.
c) Procedimientos utilizados para el control de calidad de los datos obtenidos por los
encuestadores, tipos de supervisión y materiales usados para el entrenamiento de
los entrevistadores.
d) Libro de códigos en donde queden recogidos todos los códigos asignados a las
distintas variables utilizadas en el estudio, así como los campos que ocupan cada
una de ellas.
e) Las decisiones tomadas en relación con los valores “perdidos” y con los valores
“extraños”, así como las transformaciones realizadas con los datos originales y las
estructuras de los nuevos ficheros. Sobre estos últimos se debe disponer de un
fichero documentado semejante a lo realizado con los ficheros originales.
263
BIBLIOGRAFÍA
264
Alianza Universidad Textos. Madrid: Alianza.
Azorín, F. (1969). Curso de muestreo y aplicaciones. Madrid: Aguilar.
265
Clemente, M. (Ed.)(1992). Psicología social: métodos y técnicas. Madrid: Eudema
Universidad.
Cochran, W. G. (1976). Técnicas de muestreo. México: Compañía Editorial Continental
S.A.
Cook, T.D. y Campbell, D.T. (1979). Quasi-experimentation: Design and Analysis Issues
for Field Settings. Chicago, IL.: Rand McNally.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. Nueva
York. Holt, Rinehart and Wilston.
Cyert, R.M. y Davidson, H. J. (1962). Statistical sampling for accounting information.
Nueva York: Prentince Hall.
Czaja, R. y Blair, J. (1996). Designing surveys. A guide to decisions and procedures.
Thousand Oaks, California: Pine Forge Press.
FAJER (1996). Estudio sobre la prevalencia sobre los jugadores de azar de Andalucía.
Sevilla: Consejería de Asuntos Sociales. Junta de Andalucía.
Fazeli, H., Granado, M. C., López Herrador, M., Manzano, V. y Sánchez García, E. F.
(1991). Tratamiento del factor humano en la investigación sobre la Calidad de la
Enseñanza Universitaria. En Actas Primer Congreso Internacional sobre la Calidad de
la Enseñanza Universitaria (pp. 87-97). Cádiz: Instituto de Ciencias de la Educación.
Feigl, P. (1978). A graphical aid for determining sample size when comparing two
independent proportions. Biometrics, 34, 111-122.
266
Fink, A. (1995a). How to design surveys. Thousand Oaks, California: Sage.
Fink, A. (1995b). How to ask survey questions. Thousand Oaks, California: Sage.
Fink, A. (1995c). How to report on surveys. Thousand Oaks, California: Sage.
Fink, A. y Kosecoff, J. (1989). How to conduct surveys: a step-by-step guide. Beverly Hills,
California: Sage.
Foddy, W. (1996). Constructing questions for inteviews and questionnaires. Cambridge,
UK: Cambridge University Press.
Fowler, F. J. (1993). Survey Research Methods. Newbury Park, California: Sage.
Fourez, G. (1994). La construcción del conocimiento científico. Madrid: Narcea.
Fowler, F. J. y Mangione, T. W. (1990). Standarized survey interviewing: Minimizing
interviewer related error. Newbury Park, California: Sage.
Frankel, M. (1983). Sampling Theory. En P. H. Rossi, J. P. Wright y A. B. Anderson
(Eds.). Handbook of survey research (pp. 21-67). Quantitative Studies in Social
Relations. Orlando, Florida: Academic Press.
Frey, J. H. (1983). Survey research by telephone. 2ª ed. Newbury Park, California: Sage.
Frey, J. H. y Oishi, S. M. (1995). How to conduct interviews by telephone and in person.
Thousand Oaks, California: Sage.
Fuller, W. A., Kennedy, W., Schnell, D., Sullivan, G. y Jin, H. (1986). PC CARP. Ames,
Iowa: Statistical Laboratory (Iowa State University).
Gallup, G. (1935-1971). The Gallup poll 1935-1971. Nueva York: Random House.
García Ferrando, M. (1993). La entrevista. En M. García Ferrando; J. Ibáñez y F. Alvira
(Comp.) El análisis de la realidad social. Métodos y técnicas de investigación. Madrid:
Alianza.
Ghiglione, R. y Matalon, B. (1989). Las encuestas sociológicas. Teoría y práctica. México:
Trillas.
Gómez, J. (1990). Metodología de encuesta por muestreo. En J. Arnau; M.T. Anguera y
J. Gómez. Metodología de la Investigación en Ciencias del Comportamiento. Murcia:
Universidad de Murcia.
González Río, M. J. (1997). Metodología de la investigación social. Alicante: Aguaclara.
Gorden, R. L. (1980). Interviewing: strategy, techniques and tactics. Illinois: The Dorsey
Press.
Groves, R. M. (1989). Surveys errors ans survey costs. Nueva York: Wiley.
Groves, R. M. (1990). On the path to quality improvement in social measurement:
developing indicators of survey errors and survey costs. En Proceedings of the section
on survey research methods (pp. 1-10). Alexandria, Virginia: American Statistical
Association.
267
Groves, R. M., Lyberg, L. E. (1988). An Overview of nonresponse issues in telephone
surveys. En R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II y J.
Walsberg (Eds.). Telephone survey methodology (pp. 191-211). Wiley series in
probability and mathematical statistics. Nueva York: John Wiley & Sons.
Grzib, G. (1991). Introducción a la psicología: aspectos conceptuales y metodológicos.
Addenda. Madrid: UNED.
Guenzel, P. J., Berkmans, T. R. y Cannell, C. F. (1983). General interviewing techniques.
Ann Arbor, N. J.: Institute for Social Research.
Guttman, L. (1950). The basis for scalogram analysis. En S. A. Stouffer (Ed.)
Measurement and prediction. Priceton, N. J.:Priceton University Press.
Jacoby, W. G. (1997) Statistical graphics for univariate and bivariate data, California:
Sage.
James, J. M. y Bolstein, R. (1992). Large monetary incentives and their effect on mail
survey response rates. Public Opinion Quartely, 56, 4: 442-453.
Jiménez, F. (1986). Psicología social. Madrid: UNED.
Jolliffe, F. R. (1986). Survey Design and Analysis. Mathematics and it’s applications.
Chichester: Ellis Horwood Limited.
Juárez, M. (Dir.) (1994). V Informe sobre la situación social en España. Madrid:
Fundación FOESSA.
268
Kerlinger, F. N. (1987). Investigación del comportamiento. Técnicas y metodología, 2ª ed.
México: Interamericana.
Kish, L. (1982). Muestreo de encuestas. México: Trillas.
Koti, K. M. (1988). Optimum stratified sampling using prior information. Ann Arbor,
Michigan: UMI Dissertation services.
269
publicada. Facultad de Psicología. Universidad de Sevilla.
Manzano, V., Rojas, A. J. y Fernández, J. S. (1996). Manual para encuestadores.
Barcelona: Ariel.
Manzano, V., Rojas, A. J., Padilla, J. L. González, A. y Pérez, C. (1994). Metodología de la
Encuesta. Dpto. de Sociología y Psicología social. Área de Metodología de las CC. Del
Comportamiento. Granada: Universidad de Granada (Texto no publicado).
Manzano, V. (1997). SOTAM: Sistema de optimización para tamaños de muestra. V
Congreso de Metodología de las Ciencias Humanas y Sociales. Sevilla: Universidad de
Sevilla.
Manzano, V. (1998). La calidad del muestreo en las investigaciones sociales. Revista
Electrónica de Metodología Aplicada (REMA). Vol. 3, n° 1, pp. 16-29.
Marsh, C. (1982). The survey method: the contribution of surveys to sociological
explanation. London: George Allen and Unwin.
Martínez Arias, R. (1995a). Las decisiones posteriores al muestreo. En M. T. Anguera, J.
Arnau, M. Ato, R. Martínez, J. Pascual y G. Vallejo (Eds.). Métodos y técnicas de
investigación en Psicología (pp. 485-510). Síntesis Psicológica. Madrid: Síntesis.
Martínez Arias, R. (1995b). Diseños muestrales probabilísticos. En M. T. Anguera, J.
Arnau, M. Ato, R. Martínez, J. Pascual y G. Vallejo (Eds.). Métodos y técnicas de
investigación en Psicología (pp. 433-484). Síntesis Psicológica. Madrid: Síntesis.
Martínez Arias, R. (1995c). El métodos de encuestas por muestreo: conceptos básicos.
En M.T. Anguera y otros (Eds.). Métodos de investigación en psicología. Madrid:
Síntesis.
Massey, J. T. (1988). An overview of telephone coverage. En R. M. Groves, P. P. Biemer,
L. E. Lyberg, J. T. Massey, W. L. Nicholls II y J. Walsberg (Eds.). Telephone survey
methodology (pp. 3-8). Wiley series in probability and mathematical statistics. Nueva
York: John Wiley & Sons.
McRae, T. W. (1974). Statistical sampling for audit and control. Nueva York: John Wiley
& Sons.
Melià, J. L. (1990). Introducción a la medición y análisis de datos. Valencia: Cristóbal
Serrano.
Miguel, A de. (1997). Manual del perfecto sociólogo. Madrid: Espasa.
Mills, F. C. (1969). Métodos estadísticos. Madrid: Aguilar.
Mirás, J. (1986). Elementos de muestreo para poblaciones finitas. Madrid: Instituto
Nacional de Estadística.
Morales, J. F. (1981). Metodología y Teoría de la Psicología. Madrid: UNED.
Morales, P. (1988). Medición de actitudes en psicología y educación. San Sebastián:
Ttarttalo.
270
Morales, J. F. y Moya, M. C. (1996). Tratado de Psicología Social (vol. 1). Madrid:
Síntesis.
Morsy, M. A. F. (1989). Multivariate sampling models. Ann Arbor, Michigan: UMI
Dissertation services.
Munn, P., y Drever, E. (1995). Using questionnaires in small-scale research. Glasgow:
SCR.
Musso, R. (1979a). Problemas y mitos metodológicos de la Psicología y Psicoterapia,
Buenos Aires: Psique.
Musso, R. (1979b). Falacias y mitos metodológicos de la Psicología. Buenos Aires: Psique.
Neyman, J. (1934). On the two different aspects of the representative method: the
method of stratified sampling and the method of purposive selection. Journal of the
Royal Statistical Society, 97, 558-606.
Nicholls II, W.L. (1988). Computer-assisted telephone interviewing: a general
introduction. En R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls
II y J. Walsberg (Eds.). Telephone survey methodology (pp. 377-385). Wiley series in
probability and mathematical statistics. Nueva York: John Wiley & Sons.
Noelle, E. (1970). Encuestas en la sociedad de masas. Introducción a los métodos de la
demoscopia. Madrid: Alianza Editorial.
Noelle-Neumann, E. (1986). The spiral of Silence: Public Opinion. Our social skin.
Chicago: University of Chicago Press.
271
CIS (Centro de Investigaciones Científicas).
Rincón Igea, D., Amal, J., Latorre, A. y Sans, A. (1995). Técnicas de investigación en
ciencias sociales. Madrid: Dykinson.
Robson, C. (1993). Real world research. A resource for social scientist and practioner
researchers. Oxford: Blackwell.
Rodriguez Osuna, J. (1991). Métodos de muestreo. Colección Cuadernos metodológicos,
n° 1. Madrid: Centro de investigaciones sociológicas.
Rodríguez, E. (1997). Cómo redactar bien informes económicos y financieros, Madrid:
Inversor ediciones.
Rodríguez Lara, (1992). La publicación de encuestas preelectorales y los MCM, Reis, n°
57: 191-213.
Rogers, C. (1942). Counselling and psychoterapy. Boston: Hounghton Mifflin.
272
Opinión Pública.
Stouffer, S. A., Suchman, E. A., De Vinney, L. C., Star, S. A. y Williams, R. M. (1949) The
American soldier: combat and its aftermath. vol II. Studies in social psychology in World
War II. Princeton, NJ: Princeton University Press.
Stuart, A. (1984). The ideas of sampling. High Wycombe, England: Charles Griffin.
Sudman, S. (1983). Applied sampling. En P. H. Rossi, J. P. Wright y A. B. Anderson
(Eds.). Handbook of survey research (pp. 145-197). Quantitative Studies in Social
Relations. Orlando, Florida: Academic Press.
Sullivan, J. L. & Feldman, S. (1994). Multiple indicators. En M. S. Lewis-Beck, (ed.).
Basic Measurement. Thousand Oaks (CA): Sage Publications.
Teijeiro, F. (1990). Técnicas de muestreo. En E. Ortega (Eds.). Manual de investigación
comercial (pp. 312-343). Madrid: Pirámide.
Trodahl, V. y Carter, R. E. (1964). Random selection of respondents within households
in phone surveys. Journal of Marketing Research, 1: 70-74.
Thurstone, L. L. (1928). Attitudes can be measured. American Journal of Sociology, 33:
529-544
Thurstone, L. L. (1929). Fechner’s law and the method of equal appearing intervals.
Journal of Experimental Psychology, 12: 214-224.
Torgerson, W. S. (1958). Theory and methods of scaling. Nueva York: John Wiley and
Sons.
Trochim, W. M. K. (1997). Survey Research. (on line). Disponible:
http://trochim.human.cornell.edu/kb/survey.html (1997, 22 de Mayo)
Tschuprow, A. A. (1923). On the mathematical expectation of the moments of frequency
distributions in the case of correlated observation. Metron, 2, 646-683.
Velilla Barquero, R. (1995). Guía práctica para la redacción de informes, Barcelona:
Edunsa.
Visauta, B. (1989). Técnicas de investigación social. I: Recogida de datos. Barcelona: PPU.
Yates, F. (1981). Sampling methods for censures and surveys. High Wycombe, Inglaterra:
Charles Griffin.
273
274
SERIE:
METODOLOGÍA DE LAS CIENCIAS DEL COMPORTAMIENTO
275
Índice
Título 4
Derechos de Autor 6
Índice 12
Introducción 18
CAPÍTULO 1: INTRODUCCIÓN A LA INVESTIGACIÓN
SOCIAL Cristino Pérez Meléndez, Antonio J. Rojas Tejada, Juan 20
Sebastián Fernández Prados
1.1. Introducción 20
1.2. Metodología de investigación 21
1.2.1. Metodología 21
1.2.2. Método científico 23
1.3. Métodos o tácticas 27
1.3.1. Experimental 27
1.3.2. Correlacional 28
1.3.3. Observacional 29
1.4. Técnicas 30
1.5. Elección del método y las técnicas 32
1.5.1. Criterios de seleccion del método y las técnicas 33
1.6. Las técnicas en sí mismas 34
CAPÍTULO 2: LA ENCUESTA COMO TÉCNICA DE
INVESTIGACIÓN SOCIAL Andrés Arias Astray, Baltasar 37
Fernández Ramírez
2.1. Introducción 37
2.2. Historia de las encuestas en la investigación social 38
2.2.1. La aritmética política 40
2.2.2. La estadística moral 41
2.2.3. El movimiento de Encuestas y Monografías Sociales 42
2.2.4. Marx y Weber 44
2.2.5. El estudio de las actitudes 45
2.2.6. Las votaciones particulares 45
2.2.7. Gallup, Roper y Crosslcy 46
2.3. ¿Qué son las encuestas? 47
276
2.3.1. La encuesta y las técnicas de investigación 47
2.3.2. La encuesta: una técnica para explorar, describir y explicar la realidad
48
social
2.3.3. Propuesta de una definición de encuesta 49
2.4. Tipos de encuesta 50
2.4.1. La encuesta personal 54
2.4.2. La encuesta de correo 55
2.4.3. La encuesta telefónica 57
2.4.4. Otros tipos de encuesta 58
2.4.5. La elección del tipo de encuesta más adecuada en función de sus
58
ventajas e inconvenientes
2.5. El proceso general de investigación mediante encuestas 61
CAPÍTULO 3: SELECCIÓN DE MUESTRAS Vicente Manzano
64
Arrondo
3.1. Abordaje directo de la población 64
3.2. Solución: encuestar sólo a una muestra 67
3.2.1. A la búsqueda de una solución 67
3.2.2. Representatividad de las muestras 69
3.2.3. Fases en la obtención de una muestra 70
3.2.4. Conclusión 73
3.3. Acerca del tamaño de la muestra 74
3.3.1. Importancia del concepto 74
3.3.2. Algunos consejos 76
3.3.3. Expresiones de cálculo 78
3.4. Muestras no aleatorias 80
3.5. Muestreo aleatorio 82
3.5.1. Muestreo aleatorio simple 83
3.5.2. Muestreo sistemático con arranque aleatorio 85
3.5.3. Muestreo estratificado 86
3.5.4. Muestreo de conglomerados 90
3.5.5. Variantes 92
3.5.6. ¿Cómo escoger un procedimiento de muestreo? 94
3.6. Errores de muestreo 96
3.6.1. El error muestral y sus expresiones asociadas 96
3.6.2. El error muestral y la estimación 100
3.6.3. Riesgo en la estimación 101
277
3.6.4. Un ejemplo concreto 102
3.7. Consecuencias del muestreo en el análisis de los datos 105
3.7.1. Ponderación 105
3.7.2. Varianzas 107
3.7.3. Modelos de muestreo en el sotfware al uso 109
3.8. Problemas prácticos 111
3.8.1. Problemas con la base de datos 111
3.8.2. Problemas con la ausencia de respuesta 114
3.8.3. Los encuestadores 118
3.9. Software para el muestreo: SOTAM 118
Anexo 1: Tabla de números aleatorios (3.000 dígitos) 121
Anexo 2: Rutina Basic para la selección de unidades 122
CAPÍTULO 4: SELECCIÓN DEL ENCUESTADO Vicente
124
Manzano Arrondo, Andrés González Gómez
4.1.
Introducción 124
4.2.
Encuestas por correo 124
4.3.
Encuestas por teléfono 126
4.4.
Encuestas cara a cara: muestreo por cuotas 127
4.5.
Encuestas cara a cara: muestreo por rutas aleatorias 129
4.5.1. Construcción de la ruta aleatoria 130
4.5.2. Selección del encuestado en la vivienda 137
Anexo 1: tabla de números aleatorios para el encuestador 140
CAPÍTULO 5: ELABORACIÓN DEL CUESTIONARIO José Luis
142
Padilla García, Andrés González Gómez, Cristino Pérez Meléndez
5.1. Introducción 142
5.2. ¿Qué es un cuestionario? 143
5.3. ¿Por qué utilizar un cuestionario? 144
5.4. Esquema conceptual para orientar la elaboración del cuestionario 145
5.4.1. Las variables son constructos 145
5.5. Pasos para la elaboración del cuestionario 150
5.6. El objetivo del cuestionario 150
5.6.1. El contexto de la encuesta 152
5.6.2. Los recursos disponibles 153
5.7. El diseño del cuestionario 153
5.8. Recomendaciones para hacer las preguntas del cuestionario 156
278
5.8.1. Recomendaciones para elaborar preguntas factuales 157
5.8.2. Preguntas abiertas comparadas con preguntas cerradas 163
5.8.3. Preguntas llave o filtro 165
5.9. Medición de estados subjetivos 166
5.9.1. Tests de ordenación 167
5.9.2. Tests tipo Likert 168
5.10. Revisión de las preguntas 170
5.10.1. Procedimientos subjetivos 171
5.10.2. Procedimientos empíricos 172
5.11. Preguntas demográficas 173
5.12. Orden y disposición de las preguntas en el cuestionario 173
CAPÍTULO 6: LA ENTREVISTA Andrés González Gómez, José
175
Luis Padilla García
6.1. Introducción 175
6.2. La selección de entrevistadores 175
6.3. El entrenamiento de los entrevistadores 177
6.3.1. Entrenamiento general 177
6.3.2. Entrenamiento específico 178
6.3.3. Materiales y procedimientos de entrenamiento 179
6.4. Acceso al campo 179
6.5. La entrevista en sí 179
6.5.1. Concepto y tipos de entrevista 179
6.5.2. La realización de la entrevista 181
6.5.3. La revisión de la entrevista 187
6.5.4. Supervisión y control 188
6.5.5. Feed-back 188
6.6. Guía de la entrevista 189
CAPÍTULO 7: TRABAJO DE CAMPO Juan Sebastián Fernández
192
Prados, Antonio J. Rojas Tejada
7.1. El trabajo de campo 192
7.1.1. Selección y formación de encuestadores 192
7.1.2. Coordinación, seguimiento y control del trabajo de campo 193
7.2. Material para realizar el trabajo de campo 194
7.2.1. Manual o normas para encuestadores 194
7.2.2. Cuestionario 195
279
7.2.3. Carné o acreditación como encuestador 196
7.2.4. Tarjeta de agradecimiento y/o de la empresa 197
7.2.5. Hoja de resultados o incidencias 198
7.2.6. Ficha de campo 198
7.2.7. Punto de inicio de ruta 199
7.2.8. Teléfono de contacto 200
7.2.9. Cuaderno de notas 200
Anexo 1: Normas para la aplicación del cuestionario 201
Anexo 2: Cuestionario 202
Anexo 3: Hoja de resultados 206
Anexo 4: Ficha de campo 207
CAPÍTULO 8: INTRODUCCIÓN AL TRATAMIENTO DE
209
DATOS Antonio J. Rojas Tejada, Juan Sebastián Fernández Prados
8.1. Introducción 209
8.2. Tratamiento de datos 209
8.2.1. Términos comunes 210
8.2.2. Codificación de datos 210
8.2.3. Formato de los datos 213
8.2.4. Escritura de los datos 215
8.2.5. Errores en los datos 216
8.3. Análisis estadístico de datos 217
Anexo 1: Principales análisis estadísticos que se aplican a los datos procedentes
217
de encuestas
CAPÍTULO 9: EL INFORME DE INVESTIGACIÓN Juan
219
Sebastián Fernández Prados, Antonio J. Rojas Tejada
9.1. Introducción 219
9.2. Aprendiendo de los informes publicados 219
9.3. Cuestiones y consideraciones generales 221
9.3.1. Cuestiones previas 221
9.3.2. Tipos de informes 222
9.3.3. Consideraciones generales 224
9.4. El informe técnico y su presentación 228
9.4.1. Estructura del informe 228
9.4.2. Elementos de un informe 229
9.4.3. Presentación de datos 231
280
CAPÍTULO 10: LA CALIDAD DE LA ENCUESTA Andrés
González Gómez, José Luis Padilla García, Cristino Pérez 243
Meléndez
10.1. Introducción 243
10.2. Errores asociados al muestreo 245
10.2.1. La no respuesta 245
10.3. Errores asociados con el cuestionario 250
10.3.1. Necesidad de hacer estudios piloto 253
10.4. Errores asociados con la entrevista 254
10.4.1. Errores asociados a los encuestadores 254
10.4.2. La importancia en la supervisión 255
10.4.3. Repaso a la entrevista y cumplimentación correcta de cuestionarios 255
10.5. Errores asociados con el tratamiento de datos 256
10.5.1. Errores en la codificación de datos 256
10.5.2. Errores asociados al registro o grabación de los datos 258
10.5.3. Errores en la preparación de los datos para el análisis 258
10.5.4. Imputación de datos a las respuestas perdidas y a las no respuestas 261
10.6. Conclusión 262
Bibliografía 264
281