Sunteți pe pagina 1din 166

UNIVERSIDAD CATÓLICA DE SANTA MARIA

FACULTAD DE CIENCIAS Y TECNOLOGÍAS


SOCIALES Y HUMANIDADES

TÉCNICAS DE RECOLECCIÓN DE DATOS Y


ESCALAS DE MEDICIÓN

Víctor Colque Valladares

AREQUIPA – PERÚ

2011
INTRODUCCIÓN

Uno de los componentes básicos en la investigación es el uso de técnicas y la


elaboración de los instrumentos de recolección de datos y para ello es trascedente el
manejo de escalas de medición, al cual no se le da la debida importancia.

Este componente, a su vez, está relacionado íntimamente con la validación de


instrumentos. Sobre este asunto existe bibliografía abundante. Pero no así sobre las
escalas de medición.

La intención es contar con materiales que realmente sean de ayuda para el manejo
adecuado de escalas de medición de manera que luego se viabilice, tanto la validación
de los instrumentos de recolección de datos como el establecimiento de la relación
estadística entre variables de un trabajo de investigación.

En esta dimensión es que se ha procedido a ordenar información sobre escalas de


medición. Con este trabajo se busca contribuir a un mejor manejo de escalas en la
elaboración de proyecto de tesis para, a su vez, mejorar la consistencia de la
información con las variables e indicadores y así garantizar una apropiada relación entre
los datos necesario de la tesis para el logro de los objetivos así como la verificación de
las hipótesis. De modo que los estudiantes cuenten con un documento de real apoyo en
la orientación de sus tesis de grado.

Sin embargo, esta es una primera versión del trabajo, quedando por revisar, corregir y
culminar el ordenamiento definitivo para su uso por estudiantes y docentes de
Metodología de la Investigación.

Arequipa, enero del 2012.


ESCALAS DE MEDICIÓN

Son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las
escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las
características de las variables. Estas escalas son: nominales, ordinales, intervalares o
racionales. Según pasa de una escala a otra, el atributo o la cualidad aumenta. Las
escalas de medición ofrecen información sobre la clasificación de variables discretas o
continuas. Toda vez que dicha clasificación determina la selección de la gráfica
adecuada.

Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens,


1951), esta definición es adecuada para el área de ciencias naturales, en el campo de las
ciencias sociales medir es “el proceso de vincular conceptos abstractos con indicadores
empíricos” (Carmines y Zeller, 1979, 10).

NIVELES DE MEDICIÓN

La medición de las variables puede realizarse por medio de cuatro escalas de medición.
Dos de las escalas miden variables categóricas y las otras dos miden variables
numéricas (Therese L. Baker, 1997). Los niveles de medición son las escalas nominal,
ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de las
variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de
análisis estadístico apropiado para el tratamiento de los datos.

Una característica esencial de la medición es la dependencia que tiene de la posibilidad


de variación. La validez y la confiabilidad de la medición de una variable depende de
las decisiones que se tomen para operacionalizarla y lograr una adecuada comprensión
del concepto evitando imprecisiones y ambigüedad, pues en caso contrario, la variable
corre el riesgo inherente de ser invalidada debido a que no produce información
confiable.

Como se dijo antes, la medición puede definirse como la asignación de numerales a


objetos o sucesos siguiendo ciertas reglas Stevens (1946). El autor de esta definición
desarrolló un método para clasificar los diferentes resultados de las mediciones en lo
que llamó niveles de medición. Un nivel de medición es la escala que representa una
jerarquía de precisión dentro de la cual una variable puede evaluarse, en función de las
características que rigen las escalas. Por ejemplo, la variable estatura puede analizarse
en diferentes niveles de medida. Un conjunto de personas pueden clasificarse en altos y
bajos, A y B respectivamente, creando dos grupos. Para ello no es necesario recurrir a
ninguna cinta métrica, simplemente basta observar quienes destacan sobre los demás (el
grupo de altos) y el resto completarán el grupo de bajos. El nivel de medición que
corresponde a esta forma de medir es nominal.

También podrían alinearse a los sujetos y ordenarlos según su altura, el primero sería el
más alto y el último el más bajo, el resto se organizaría de forma que cada persona
tuviese delante a uno más alto y detrás a uno más bajo. El nivel de medición en este
caso es ordinal. Hasta el momento no es posible decir cuánto es una persona más alta
que otra.

A través del número de personas que hay entre dos sujetos, por ejemplo, Andrea y Juan
en la fila ordenada anteriormente. En este caso, además del orden se conoce la magnitud
de la altura. Si en lugar de utilizar el número de personas se recurre a una regla se puede
ofrecer otra medida de la altura. Esta forma de medir es propia del nivel de intervalos,
que permite saber la magnitud de los elementos comparando unos con otros.

La cuarta posibilidad es utilizar un metro que sitúa el cero en el mismo suelo y, por lo
tanto, la altura se define en función de la distancia desde la cabeza al suelo (valor cero
absoluto donde se sitúa la ausencia de altura). En ciencias sociales es poco frecuente
encontrar variables en niveles de razón, normalmente son nominales, ordinales y en
ocasiones de intervalos, rara vez de razón. Una característica de esta clasificación es que
las propiedades de una escala se cumplen en el nivel superior.

En la estadística descriptiva y con el fin de realizar pruebas de significancia, las


variables se clasifican de la siguiente manera de acuerdo con su nivel de medida:

 nominal (también categórica o discreta)

 ordinal

 de intervalo o intervalar (continua)


 de razón o racional (continua)

Las variables de intervalo y de razón también están agrupadas como variables


continuas.

1) Medición Nominal.

En este nivel de medición se establecen categorías distintivas que no implican un orden


específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas
se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los
respondientes solo tienen que señalar su género, no se requiere de un orden real.

Así, si se asignan números a estos niveles solo sirven para identificación y puede ser
indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición:
1=F y 2=M. En resumen en la escala nominal se asignan números a eventos con el
propósito de identificarlos. No existe ningún referente cuantitativo. Sirve para nombrar
las unidades de análisis en una investigación y es utilizada en cárceles, escuelas, deportes,
etc. La B (A es diferente de B) relación lógica que se expresa es: A

El nivel nominal de medición, de la palabra latina nomún (nombre) describe variables


de naturaleza categórica que difieren en calidad más que en cantidad (Salkind, 1998:
113). Ante las observaciones que se realizan de la realidad, es posible asignar cada una
de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina
con un nombre o número de forma arbitraria, es decir, que se etiqueta en función de los
deseos o conveniencia del investigador. Este nivel de medición es exclusivamente
cualitativo y sus variables son por lo tanto cualitativas.

Por ejemplo, los sujetos que son del curso de A de 2º de ESO y los de B generan dos
grupos. Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de
calidad) y no cuantitativo puesto que indica donde está cada sujeto y no "cuanto es de
un curso y no de otro". En este ejemplo los números 2 y 3 pueden sustituir las letras A y
B, de forma que 2 y 3 son simples etiquetas que no ofrecen una valoración numérica
sino que actúan como nominativos.

En esta escala hay que tener en cuenta dos condiciones:


 No es posible que un mismo valor o sujeto esté en dos grupos a la vez. No se
puede ser de 2º y 3º a la vez. Por lo tanto este nivel exige que las categorías sean
mutuamente excluyentes entre sí.

 Los números no tienen valor más que como nombres o etiquetas de los grupos.

En este tipo de medidas, se asignan nombres o etiquetas a los objetos. La asignación se


lleva a cabo evaluando, de acuerdo con un procedimiento, la similitud de la instancia a
ser medida con cada conjunto de ejemplares nominados o definiciones de categorías. El
nombre de la mayoría de los ejemplares nominados o definiciones es el “valor”
asignado a la medida nominal de la instancia dada. Si dos instancias tienen el mismo
nombre asociado a ellas, entonces pertenecen a la misma categoría, y ese es el único
significado que las medidas nominales tienen.

Esta escala comprende variables categóricas que se identifican por atributos o


cualidades. Las variables de este tipo nombran e identifican distintas categorías sin
seguir un orden. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso
de un número es para identificar. Un número no tiene mayor valor que otro. Un ejemplo
son los números de las camisetas de los jugadores de un equipo de béisbol. El número
mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de
capricho personal a quien otorga el número.

Para el procesamiento de datos, los nombres pueden ser remplazados por números, pero
en ese caso el valor numérico de los números dados es irrelevante. El único tipo de
comparaciones que se pueden hacer con este tipo de variables es el de igualdad o
diferencia. Las comparaciones “mayor que” o “menor que” no existen entre nombres,
así como tampoco operaciones tales como la adición, la substracción, etc.

Ejemplos de medidas nominales son algunas de estas variables: estado marital, género,
raza, credo religioso, afiliación política, lugar de nacimiento, el número de seguro
social, el sexo, los números de teléfono, entre otros.

La única medida de tendencia central que se puede hacer es la moda. La dispersión


estadística se puede hacer con tasa de variación, índice de variación cualitativa, o
mediante entropía de información. No existe la desviación estándar.
2) Medición Ordinal.

Se establecen categorías con dos o más niveles que implican un orden inherente entre sí.
La escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en
función de la mayor o menor posesión de un atributo o característica. Por ejemplo, en
las instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se
desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación
lógica que B (A es mayor que B). Clasificar a un grupo de expresa esta escala es A
personas por la clase social a la que pertenecen implica un orden prescrito que va de lo
más alto a lo más bajo. Estas escalas admiten la asignación de números en función de un
orden prescrito.

Las formas más comunes de variables ordinales son ítems (reactivos) actitudinales
estableciendo una serie de niveles que expresan una actitud de acuerdo o desacuerdo
con respecto a algún referente. Por ejemplo, ante el ítem: La economía mexicana debe
dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las siguientes
alternativas:

 ___ Totalmente de acuerdo

 ___ De acuerdo

 ___ Indiferente

 ___ En desacuerdo

 ___ Totalmente en desacuerdo

Las anteriores alternativas de respuesta, pueden codificarse con números que van del
uno al cinco, que sugieren un orden preestablecido pero no implican una distancia entre
un número y otro. Las escalas de actitudes son ordinales pero son tratadas como
variables continuas (Therese L. Baker, 1997).

El nivel ordinal describe las variables a lo largo de un continuo sobre el que se pueden
ordenar los valores. En este caso las variables no sólo se asignan a grupos sino que
además pueden establecerse relaciones de mayor que, menor que o igual que, entre los
elementos.
Por ejemplo, se puede ordenar al conjunto de alumnos del módulo de diversificación
curricular en función de la calificación obtenida en el último examen.

Las variables de este tipo además de nombrar se consideran el asignar un orden a los
datos. Esto implica que un número de mayor cantidad tiene un más alto grado de
atributo medido en comparación con un número menor, pero las diferencias entre
rangos pueden no ser iguales.

Las operaciones matemáticas posibles son: contabilizar los elementos, igualdad y


desigualdad, además de ser mayor o menor que.

En esta clasificación, los números asignados a los objetos representan el orden o rango
de las entidades medidas. Los números se denominan ordinales, las variables se
denominan ordinales o variables de rango. Se pueden hacer comparaciones como
“mayor que”, “menor que”, además de las comparaciones de igualdad o diferencia. Las
operaciones aritméticas como la sustracción a la adición no tienen sentido en este tipo
de variables.

Ejemplos de variables ordinales son: la dureza de los minerales, los resultados de una
carrera de caballos, actitudes como preferencias, conservadurismo o prejuicio, el nivel
socioeconómico, orden de llegada de los corredores, entre otros. Las medidas de
tendencia central de una variable ordinal pueden representarse por su moda o su
mediana. La mediana proporciona más información.

3) Medición de Intervalo.

La medición de intervalo posee las características de la medición nominal y ordinal.


Establece la distancia entre una medida y otra. La escala de intervalo se aplica a
variables continuas pero carece de un punto cero absoluto. El ejemplo más
representativo de este tipo de medición es un termómetro, cuando registra cero grados
centígrados de temperatura indica el nivel de congelación del agua y cuando registra
100 grados centígrados indica el nivel de ebullición, el punto cero es arbitrario no real,
lo que significa que en este punto no hay ausencia de temperatura.

Una persona que en un examen de matemáticas que obtiene una puntuación de cero no
significa que carezca de conocimientos, el punto cero es arbitrario por que sigue
existiendo la característica medida.

El nivel de intervalo procede del latín interval lun (espacio entre dos paredes). Este
nivel integra las variables que pueden establecer intervalos iguales entre sus valores.
Las variables del nivel de intervalos permiten determinar la diferencia entre puntos a lo
largo del mismo continuo. Las operaciones posibles son todas las de escalas anteriores,
más la suma y la resta.

En este tipo de medida, los números asignados a los objetos tienen todas las
características de las medidas ordinales, y además las diferencias entre medidas
representan intervalos equivalentes. Esto es, las diferencias entre un par arbitrario de
medidas puede compararse de manera significativa. Estas variables nombran, ordenan y
presentan igualdad de magnitud. Por lo tanto, operaciones tales como la adición, la
sustracción tienen significado. En estas variables el punto cero de la escala es arbitrario
y se pueden usar valores negativos, no significa ausencia de valor y existe una unidad de
igualdad entre los valores. Las diferencias se pueden expresar como razones. Las
medidas de tendencia central pueden representarse mediante la moda, la mediana al
promedio aritmético. El promedio proporciona más información.

Las variables medidas al nivel de intervalo se llaman variables de intervalo o variables


de escala.

Ejemplos de este tipo de variables son la fecha, la temperatura, las puntuaciones de una
prueba, la escala de actitudes, las puntuaciones de IQ, conjuntos de años, entre otros.

4) Medición de Razón.

Una escala de medición de razón incluye las características de los tres anteriores niveles
de medición anteriores (nominal, ordinal e intervalo). Determina la distancia exacta entre
los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir,
en el punto cero no existe la característica o atributo que se mide. Las variables de ingreso,
edad, número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de
razón se aplica tanto a variables continuas como discretas.

El nivel de razón, cuya denominación procede del latín ratio (cálculo), integra aquellas
variables con intervalos iguales pueden situar un cero absoluto. Estas variables nombran
orden, presentan intervalos iguales y el cero significa ausencia de la característica. El
cero absoluto supone identificar una posición de ausencia total del rasgo o fenómeno.
Tiene características importantes:

 El valor cero no es arbitrario (no responde a las conveniencias de los


investigadores). Un ejemplo claro es la temperatura. La existencia de un cero en
la escala Celsius no supone la ausencia de temperatura, puesto que cero grados
centígrados está situado por arbitrio de los creadores de la escala. Por el
contrario, la escala Kelvin sí tiene un cero absoluto, precisamente allí donde las
moléculas cesan su actividad y no se produce por lo tanto roce entre los
componentes moleculares. El cero absoluto de la escala Kelvin se sitúa a unos
-273 grados centígrados.

 La presencia de un cero absoluto permite utilizar operaciones matemáticas más


complejas a las otras escalas. Hasta ahora se podía asignar, establecer la
igualdad (nominal), mayor o menor que (ordinal), sumar y restar (intervalo) a las
que se añade multiplicar, dividir, etc.

Los números asignados a los objetos tienen todas las características de las medidas de
intervalo y además tienen razones significativas entre pares arbitrarios de números.
Operaciones tales como la multiplicación y la división tienen significado.

La posición del cero no es arbitraria para este tipo de medida. Las variables para este
nivel de medida se llaman variables racionales. La mayoría de las cantidades físicas,
tales como la masa, longitud, energía, se miden en la escala racional, así como también
la temperatura (en Kelvins) relativa al cero absoluto. Las medidas de tendencia central
de una variable medida a nivel racional pueden representarse por la moda, la mediana,
el promedio aritmético o su promedio geométrico. Lo mismo que con la escala de
intervalos, el promedio aritmético proporciona la mayor información.

Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un


trabajo, la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de
variables racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala
de razón comienza desde el cero y aumenta en números sucesivos iguales a cantidades
del atributo que está siendo medido.
1. ESCALAS Y CUESTIONARIOS

Las Escalas suelen presentar afirmaciones o descripciones de conductas relacionadas


con las actitudes o valores y se solicita de los sujetos que se posicionen ante ellas. A
veces deben responder si están de acuerdo o no con dichas afirmaciones y en qué
medida. Otras veces deben responder si su propia conducta se asemeja a la descrita en
los items y/o con qué frecuencia realiza conductas como las descritas.

En cualquier caso, la característica común de las Escalas de actitudes es que accedemos


a las actitudes a través de las respuestas verbales de los sujetos evaluados.

Una característica importante de las Escalas es su nivel de elaboración, es decir, hasta


qué punto se trata de productos científicamente elaborados (con estudios experimentales
de validación) o bien de productos artesanos (elaborados por los profesores o
profesionales de diferentes campos para usos específicos). Las Escalas científicas
poseen un mayor rigor y capacidad de generalización. Las Escalas artesanas se
acomodan mejor a los objetivos específicos de cada tipo de evaluación y a los
contenidos actitudinales que se quieran estudiar.

Las Escalas o cuestionarios de actitudes pueden ser de diverso tipo. Las diferencias
entre un tipo y otro se refieren tanto a la presentación de las cuestiones como al tipo de
respuesta que se demanda. Entre los tipos principales de Escalas podemos citar:

1.1. Noción y notas de la encuesta

Sierra Bravo, en Técnicas de Investigación Social Teoría y Ejercicios, precisa: La


observación por encuesta, entendida esta palabra en sentido restringido y no como
averiguación o pesquisa en general, acepción que abarca todos los tipos de observación,
consiste en la obtención de datos de interés sociológico mediante la interrogación a los
miembros de la sociedad.

Frente a los demás procedimientos de observación, los rasgos que caracterizan a la


encuesta son los siguientes:
1) Consistir en la observación no directa de los hechos, como sucede en la observación
simple, sino a través de las manifestaciones realizadas por los propios interesados.

2) Ser un método de obtención de datos preparado especialmente para la investigación


sociológica, a diferencia de la observación documental, en la que se utilizan con fines
sociológicos datos y hechos recogidos de antemano y con otros fines.

3) Permitir, frente al carácter particular, propio de la observación limpie y experimental,


mucho más limitado en los hechos que puede abarcar, una aplicación masiva que
mediante los sistemas de muestreo puede extenderse a comunidades nacionales e
internacionales enteras, facultando además para la obtención de informaciones sobre un
amplio abanico de cuestiones a la vez y no sólo sobre un aspecto o problema definido.

4) Hacer posible que la investigación social se extienda a los aspectos subjetivos de los
miembros de la sociedad y, por tanto, de los hechos y fenómenos sociales.

Todas estas notas, especialmente la amplitud de sujetos y aspectos que puede abarcar,
así como la posibilidad de diseñarlo y modelarlo de la manera que se crea más adecuada
a los fines pretendidos, hacen de la observación por encuesta el procedimiento
sociológico de investigación fundamental y el más empleado de hecho en la realidad.

1.2. Clases de cuestionarios

El instrumento básico de la observación por encuesta es el cuestionario. Este no es otra


cosa que un conjunto de preguntas, preparado cuidadosamente, sobre los hechos y
aspectos que interesan en una investigación sociológica para su contestación por la
población o su muestra a que se extiende el estudio emprendido.

En el cuestionario se pueden distinguir tres clases: el cuestionario simple, la entrevista y


las escalas sociométricas. El primero es aquel que los encuestados, previa su lectura,
contestan por escrito, sin intervención directa de persona alguna de las que colaboran en
la investigación. En las entrevistas el cuestionario es aplicado a los sujetos investigados
por personas especializadas en esta tarea, reclutados y preparados por la dirección de la
investigación, quienes hacen a los encuestados las preguntas del cuestionario y anotan
en él sus respuestas.
Las escalas sociométricas son una forma especial de cuestionario, caracterizada porque
las preguntas o las diferentes contestaciones a las preguntas tienen atribuido un valor
numérico, lo que permite cifrar cuantitativamente y en cierto modo medir el nivel que
alcanza en cada caso la actitud o aspecto investigado.

Hay que advertir que, aunque el cuestionario sea la forma más corriente de las entrevistas
y escalas, las primeras se pueden verificar sin sujeción a un cuestionario predeterminado
y las segundas también pueden ser independientes de un cuestionario y estar ligadas,
como en las escalas de Chapín, Sevell y otros para medir el status socioeconómico, a la
observación simple.

El cuestionario y la entrevista representan distintas formas de aplicación del cuestionario.


Existe otra forma de administración del mismo, intermedia respecto a las dos anteriores.
Consiste en la contestación individual por los encuestados reunidos en un mismo lugar,
por escrito bajo la supervisión del investigador.

El cuestionario cumple una función de enlace entre los objetivos de la investigación y la


realidad de la población observada. Por ello, las condiciones fundamentales que debe
reunir, dependen de la investigación y de la población. Se pueden sintetizar, por una
parte en traducir los objetivos de la investigación en preguntas concretas sobre dicha
realidad, y por otra parte, en ser capaz de suscitar en los encuestados respuestas sinceras
y claras a cada pregunta, que puedan después ser tratadas científicamente, es decir,
clasificadas y analizadas.

Así como la observación ocupa un puesto central en el proceso de investigación,


igualmente el cuestionario, instrumento en la investigación por encuesta, tiene una
importancia central en ella. Así se ha podido afirmar por algunos que una encuesta no
puede ser mejor que su cuestionario, ya que, en general, las respuestas no pueden ser
mejor que las preguntas, de modo que si estas son vagas, las respuestas serán imprecisas,
y si son capciosas, las respuestas serán sesgadas.

La finalidad del cuestionario es obtener de manera sistemática y ordenada, información


de la población investigada sobre las variables objeto de la investigación. Esta
información generalmente se refiere a lo que las personas encuestadas son, hacen,
opinan, piensan, sienten, esperan, quieren o desprecian, aprueban o desaprueban, o a
los motivos de sus actos, opiniones y actitudes.

Sistematizando la enumeración anterior, se puede decir con C. Javeau (1971, p. 1), que
los objetos ordinarios de las encuestas sociológicas K refieren a tres grandes categorías
de datos: 1ª. Hechos (datos actuales) relativos: a) al dominio personal de los individuos
que forman el pupo social estudiado: por ejemplo, edad, grado de instrucción, b) al
dominio del ambiente que les rodea: por ejemplo, vivienda, relaciones familiares, de
vecindad, de trabajo, etc.; c) al dominio de su comportamiento. No podrá tratarse aquí
más que, evidentemente, del comportamiento reconocido o aparente. 2a . Opiniones, a
las cuales se juntan los niveles de información, de espera, etc., todo lo que uno podría
llamar datos subjetivos. 3a . Actitudes y motivaciones y sentimientos, lodo lo que
empuja a la acción, al comportamiento, y está a la base de las opiniones. 4a
Cogniciones, es decir, índices de nivel de conocimiento le los diversos temas
estudiados en la encuesta. Revela el grado de confianza a conceder a las opiniones sobre
juicios subjetivos.

1.3. Tipos de preguntas

El elemento básico del cuestionario, como se deduce claramente de NI i nombre y


definición, son las preguntas. Es por ello, que la bondad de un cuestionario no depende
de otra cosa sino de la clase de preguntas empleadas en él y de su adecuada
formulación.

Reviste, pues, especial interés en relación al cuestionario analizar los tipos de preguntas
existentes y las reglas para su formulación.

Desde el punto de vista de la investigación social, las preguntas de un cuestionario son


la expresión en forma interrogativa de las variables empíricas o indicadores respecto a
los cuales interesa obtener información mediante la encuesta.

Del mismo modo que las variables tienen que comprender, necesariamente para ser
tales, diversos elementos de variación o categorías, igualmente las preguntas de un
cuestionario comprenden diversas respuestas, por lo menos dos, que son los elementos
de variación o las categorías de la variable verbalizada por la pregunta.
Las preguntas del cuestionario pues, se subdividen en respuestas, que son los elementos
de variación o categorías de la variable a que se refiere la pregunta. Entre ellas el
encuestado debe elegir o indicar la que a él le corresponde, la que se ajuste a su caso.

Es fundamental en el cuestionario que las respuestas o categorías que se ofrezcan con las
preguntas reúnan dos condiciones esenciales: las de ser exhaustivas y excluyentes.

Serán exhaustivas si las categorías o respuestas de las preguntas abarcan todos los casos
que pueden darse, de modo que ningún encuestado pueda dejar de responder por no
encontrar su categoría.

Serán excluyentes, cuando no pueda darse el caso que un encuestado pueda elegir
válidamente dos respuestas distintas de la misma pregunta.

Los tipos de preguntas son múltiples y diversas sus formas de clasificación. Entre otras
formas se puede agrupar las preguntas según la contestación que admitan del encuestado,
según la naturaleza del contenido de las preguntas, según su función en el cuestionario y
según su finalidad.

Según la contestación que admiten del encuestado se distinguen las preguntas cerradas,
categorizadas y abiertas.

Las preguntas cerradas son las que solo dan opción a dos respuestas, la afirmativa o la
negativa, generalmente sí y no, y, en su caso, no sé y sin opinión.

Las categorizadas, también llamadas preguntas Cafetería, presentan como respuestas una
serie de categorías entre las que el encuestado debe elegir.

Las preguntas abiertas solo contienen la pregunta y no establecen previamente ningún


tipo de respuesta, dejando ésta, por tanto, al libre arbitrio del encuestado.

En general se puede decir que son recomendables las preguntas categorizadas, sobre
todo si se consigna en ellas una categoría genérica, por ejemplo, otros ¿cuáles? .
Suministran más información que el simple sí y no de las cerradas y evitan el coste y
trabajo que supone la categorización posterior de las abiertas.
En concreto, las preguntas cerradas son apropiadas cuando se trata de preguntas muy
precisas sobre cuestiones de hecho, o cuando sólo interese a los fines de la investigación
conocer el sí o el no, sin más especificación.

Como señalan Schuman y Presser (1981) la controversia entre las preguntas abiertas y
cerradas o categorizadas se ha resuelto en la práctica con la victoria de estas últimas, a
causa de su eficacia a efectos de la recogida de datos, la clasificación y el análisis.

Sin embargo, dichos autores estiman que las preguntas abiertas son esenciales para
conocer el marco de referencia del encuestado y para redactar después las alternativas a
ofrecer en las preguntas categorizadas. Por ello, su empleo se estima oportuno sobre
todo en el caso de estudios exploratorios o de preencuestas, y cuando no se puede presu-
mir con antelación las posibles opiniones y reacciones de la población a encuestar, ni se
conoce bien su vocabulario.

Respecto a las preguntas cerradas, se plantea la cuestión de su formulación equilibrada o


no. La formulación se considera no equilibrada cuando la pregunta se refiere de modo
expreso sólo a una de las dos alternativas. Por ejemplo:

¿Está Ud. a favor del aborto?

Si - No.

Por el contrario, las equilibradas recogen de modo expreso las dos alternativas. En el
caso anterior:

¿Está Ud. a favor o en contra del aborto?

— A favor

— En contra

Este tipo de equilibrio se llama formal para distinguirlo de aquél en el que la alternativa
ofrecida implica un contraargumento.

Por ejemplo:
¿Piensa que se debería poder abortar si lo desea una mujer embarazada o estima que no
se le debería permitir poner fin a la vida de un niño aún no nacido?

— Debería poder

— No se debería permitir

Los experimentos realizados, aunque no concluyentes, revelan diferencias a veces de


quince puntos entre estas distintas formulaciones.

En síntesis, los autores en cuestión estiman que se debe preferir la forma equilibrada a la
no equilibrada, pero teniendo en cuenta que si se ofrecen

Contra argumentos, éstos pueden contribuir a definir las preguntas y afectar de este
modo a las respuestas.

Por último, se ha de señalar que las preguntas categorizadas con muchas alternativas
pueden hacer muy difícil el juicio que supone la elección entre ellas, por lo que se
recomienda dividirlas en dos preguntas distintas.

En relación a la naturaleza del contenido de las preguntas se tienen las de identificación,


de hecho, de acción, de información, de intención, de aspiraciones, de opinión, de
expectativas ante el futuro, y de motivaciones y creencias y actitudes.

Las preguntas de identificación, son las que se refieren a las características básicas de
las unidades de observación. Por ejemplo, en el caso de las personas, edad, sexo, estado
civil, región de nacimiento y de residencia, profesión, estudios, ingresos, religión,
filiación política, número de hijos, nacionalidad, raza, etc.

Estas preguntas reciben en inglés el nombre de background, fundamentales, porque, se


refieren a las variables independientes principales, respecto de las cuales se puede hacer
la hipótesis o suposición que influyen en todas las demás, y en especial en la variable o
variables dependientes a estudiar.

Según su función en el cuestionario, se puede hablar, entre otras, de preguntas


sustantivas, filtro, de control, de consistencia, de introducción o rompehielos, de alivio,
amortiguadores y las baterías de preguntas.
Son sustantivas las preguntas básicas y las referentes a las cuestiones investigadas en la
encuesta.

Las preguntas filtro son las que se realizan previamente a otra pregunta, a fin de
eliminar a los que no les afecte ésta. Por ejemplo, si preguntamos sin más ¿piensa Vd.
comprarse TV. en color? muchos o algunos que contesten que no, puede ser porque ya
la tengan. Por lo tanto, antes se debe hacer una pregunta filtro del tenor siguiente:
¿Tiene Ud. TV en color? Si — No.

Las preguntas de control tienen por finalidad asegurarse del interés y buena fe del
encuestado y de la veracidad y fiabilidad de sus respuestas al cuestionario. Incluyen
respuestas con trampa o falsas, para ver si el encuestado cae en ellas.

Similares a las preguntas de control son las que tienen por objeto comprobar la
consistencia de las respuestas del entrevistado. Se trata de preguntas similares, pero
redactadas de distinta forma, que se sitúan espaciadas entre sí para ver si sus respuestas
a ambas preguntas son congruentes,

Preguntas de introducción o rompehielos son las que se hacen para Iniciar el


cuestionario, e interesar al encuestado en él, o para pasar de un lema a otro, y, en la
entrevista, para ganarse su confianza y romper el hielo del desconocimiento.

Preguntas muelle, colchón o amortiguadoras, son preguntas que abordan temas difíciles
o escabrosos, formuladas de tal forma que reduzcan su brusquedad y rudeza.

Las preguntas batería son un conjunto de preguntas sobre la misma cuestión, que se
complementan y completan unas a otras, enfocando diversos aspectos de ella.

A veces este conjunto de preguntas se disponen en forma de lo que se llama embudo de


preguntas, porque se empiezan por los aspectos más generales hasta llegar a los más
concretos y precisos.

Según su finalidad se puede hablar de las preguntas directas y las indirectas. Las
primeras son las que no buscan descubrir otra cosa que lo que expresan. Las segundas,
al contrario, pretenden averiguar algo distinto de los que se desprende de las palabras
usadas.
Por último, sabe recordar que se pueden utilizar en las preguntas de los cuestionarios,
técnicas proyectivas, cuando se quiere lograr una mayor profundidad.

Este tipo de preguntas es útil para captar las ideas, sentimientos, opiniones y actitudes
más profundas, a veces, incluso inconscientes para el individuo, que normalmente no se
pueden detectar mediante otro tipo de preguntas.

Estas técnicas pertenecen al área de la investigación psicológica-social y como tales no


parecen muy adecuadas para su aplicación en las encuestas sociológicas masivas, pues
exigen un análisis individual de cada caso pormenorizado, poco compatible con las
técnicas de proceso de datos.

No obstante, no se ve imposibilidad de que alguna o algunas de las preguntas del


cuestionario, en combinación con otras convencionales, pueden ser aplicación de estas
técnicas proyectivas.

Entre estas técnicas se encuentran:

1) La asociación. Se presenta una palabra, frase o dibujo y se pregunta que se exprese lo


primero que sugiera tal palabra, dibujo o pregunta.

2) Fantasía. Se invita al encuestado a inventar o contar una historia, 0 a discutir un


dibujo en términos imaginativos.

3) Conceptualización. Se puede descubrir los sentimientos y actitudes del encuestado


por la manera en que nombra, ordena y clasifica las cosas y personas.

4) Sentencia incompleta, que el encuestado debe completar con lo primero que se le


ocurra. Ejemplo: Mi cabeza si mi padre ....; o simplemente si ...

5) Interpretación libre de dibujos y caricaturas.

6) Presentación de historietas, para que el encuestado elija entre los tipos o conductas
que se contienen en ellas.

7) Preguntas pseudoactuales. Son preguntas sobre realidades sociales conocidas. Por


ejemplo: ¿Qué tanto por ciento de nazis hay aquí?
8) Adivinar quién son. Son preguntas de este tipo: Existen muchos ladrones en nuestra
sociedad. ¿Quiénes son?

En fin, también se pueden llamar proyectivas las chek-list, rating, inventarios y rejillas a
que se refiere Oppenheim (1966, 80 y ss.).

1.4. Reglas para la formulación de preguntas

En general una pregunta bien formulada, como señala Magdalena Grawitz (1975, p.
246), es aquella que a) no ejerce influencia en el sentido de la respuesta, b) no incita a
una respuesta inexacta, que no corresponde a la información buscada.

La influencia ejercida por la pregunta puede provocar, desde el error, si la pregunta


redactada en términos ambiguos es mal interpretada, hasta la orientación más o menos
fuerte del encuestado, en un sentido determinado. Esta influencia recibe el nombre de
sesgo, bias en la terminología anglosajona.

Existen algunas reglas, fundadas en el sentido común y la experiencia simple, que


contienen criterios a seguir en la formulación de preguntas de un cuestionario.

Como todas las reglas de este tipo no tienen un valor absoluto, sino indicativo. En
último término, es el equipo investigador el que debe decidir en cada caso las preguntas
a formular según las circunstancias de la investigación, entre las que cabe destacar su
objetivo, la información que interese recoger y el público que se va a encuestar.

Entre las reglas para la formulación de las preguntas del cuestionario son muy
conocidas las siguientes, formuladas por Bowley:

1) Las preguntas han de ser relativamente pocas.

2) Las preguntas han de estar hechas de tal forma que requieran siempre una respuesta
numérica o simplemente una afirmación o negación, o bien la elección de una
categoría propuesta.

3) Las preguntas han de ser sencillas y redactadas de tal forma que puedan
comprenderse con facilidad por las personas a las que van destinadas.

4) Las preguntas han de estar hechas de forma que no levanten prejuicios.


5) Las preguntas no deben ser indiscretas sin necesidad.

6) En lo posible, las preguntas que se hagan han de ser corroborativas.

7) Las preguntas habrán de estar hechas en forma que contesten directa o


inequívocamente al punto de información deseado.

Otros criterios a tener en cuenta a este respecto se pueden señalar:

No hacer directamente preguntas que obliguen a cálculos o esfuerzos de memoria del


encuestado, antes bien, en este caso se deben presentar de modo que se facilite la
memorización.

Redactar las preguntas en forma personal y directa, no impersonal. No realizar


preguntas embarazosas que puedan dejar al descubierto o p o n e r en evidencia al
encuestado y si hay necesidad de hacerlas presentarlas de forma que no hieran su
sensibilidad.

No presentar las preguntas en forma negativa, pues dan lugar a duda sobre el sentido de
la respuesta, ni tampoco en forma afirmativa, pues sugieren el contestar
afirmativamente. Es conveniente formularlas en forma neutral, ni afirmativa ni negativa.

No utilizar sin precisión palabras abstractas, por ejemplo, clase, especie, tipo, etc., ni
tampoco de tipo valorativo: mucho, escaso, bueno, malo, etc., pues se pueden tomar en
diferentes sentidos y cada uno les concede diverso alcance.

Formular las preguntas del modo más concreto y preciso posible, sobre todo en el caso
de que se refiera a unidades de medida o períodos de tiempo.

Evitar el empleo de la interrogación por qué.

Procurar que las preguntas, si son abiertas no presentan una opción alternativa, ni
impliquen en realidad dos preguntas y que ni siquiera contengan aclaraciones de su
sentido, porque en estos casos se puede dar lugar a confusión en el encuestado y se
oscurece el sentido de las respuestas.

Es muy importante que las preguntas sean cortas en lo posible, para evitar que sean
ambiguas y oscuras.
En fin, tener en cuenta al formular las preguntas el marco de referencia del encuestado,
es decir, la situación social en que se halla que ha de constituir el punto de vista de su
respuesta.

Por último, tan meticuloso debe ser la preparación del cuestionario que no se debe
olvidar que las palabras que se empleen en las preguntas han de ser elegidas
cuidadosamente.

Payne (The art of asquing quaestions. Princeton Univ. Press) aconseja preguntarse en
relación con las palabras:

1) Si significan exactamente lo que "se quiere decir”.

2) Si no tienen otro sentido, y en este caso, si el contexto lo precisa suficientemente.

3) Si no se prestan a confusión (oralmente o por escrito) con otra palabra.

4) Si no puede encontrarse otra palabra u otro giro más sencillo y claro.

1.5. Preparación de cuestionario. Etapas

La construcción de un cuestionario es una operación muy delicada y difícil. Es delicada,


ya que, dada la importancia central del cuestionario en la encuesta, importa que sea
realizada con la mayor perfección porque de ello depende el éxito de la encuesta.

Es difícil porque además de la gran dificultad que entraña siempre en la investigación


social el captar y expresar en indicadores concretos los aspectos de la realidad,
significativos en relación al objeto de la investigación, implica también muchos
problemas de otro tipo, entre los que cabe destacar los lingüísticos y psicológicos.

Este carácter delicado y difícil de la construcción de un cuestionario, exige que


normalmente su preparación deba ser una labor de equipo.

La investigación por encuesta debe traducir las variables empíricas sobre las que desee
obtener información en preguntas concretas sobre la realidad social a investigar, capaces
de suscitar respuestas sinceras y claras.
Supuesto lo anterior, las etapas que se pueden distinguir en la preparación del
cuestionario son las siguientes:

1) Formulación de hipótesis.

2) Determinación de las variables a observar con sus dimensiones e indicadores.

3) Planificación del contenido del cuestionario.

Como etapa previa a éstas, hay que mencionar la preencuesta que consiste
específicamente, en la realización de un primer contacto, por entrevistas no directivas y
de grupo, con la población que se va a 'estudiar para conocer su situación, mentalidad,
problemas, etc.

1.5.1. Formulación de hipótesis

En esta etapa de formulación de hipótesis se pueden distinguir tres niveles:

El primero, el establecimiento de la hipótesis o hipótesis generales elegida o elegidas


como respuestas probables a la cuestión general investigada.

El segundo, la especificación de las hipótesis generales en sub hipótesis que las


desarrollen y expresen en los distintos aspectos que comprendan.

El tercer nivel es el más propio y específico del cuestionario. Consiste en la concepción


de lo que se va a buscar con cada pregunta, de lo que K pretende saber o conocer por
su mediación, o sea prever su sentido o utilidad.

Que las preguntas del cuestionario impliquen hipótesis en este sentido es la condición
para que estas tengan un sentido preciso, respondan | una necesidad en relación a los
objetivos de la encuesta y sean, en último término, útiles y beneficiosas para los fines
perseguidos en el cuestionario.

Incluso las categorías de cada pregunta deben ser establecidas inteligentemente. Esto
quiere decir que deben obedecer a una intención determinada, o de igual forma, que
deben fundarse también en hipótesis.
1.5.2. Determinación de las variables

Todo trabajo de investigación que se nos propone es en su tema o título una variable
general. A fin de que pueda ser observada en la realidad es preciso operativizarla o
hacerla operativa, especificando sus dimensiones e indicadores.

Igualmente en la investigación social por cuestionario, el tema sobre el que versa se


refiere también a una variable general. Es preciso, pues, como se acaba de indicar,
hacerla operativa determinando sus variables intermedias y los indicadores.

La operativización de variables, entonces, puede y debe servir también para determinar


los puntos de información a obtener, mediante la encuesta y que han de ser
desarrollados dentro del cuestionario mediante las correspondientes preguntas.

Como es claro estos puntos de información que resulten de la operativización se deben


someter a juicio crítico sobre la oportunidad de su inclusión en el cuestionario. Además
se deben completar con aquellos aspectos no derivados de esta operación y que se crean
convenientes y de interés.

Todos estos puntos de información pueden constituir la base de lo que se llama guía del
cuestionario, que se suele utilizar como orientación para la redacción del mismo, y en la
que es lógico se comprendan también las decisiones a que lleguemos sobre la
planificación del cuestionario.

1.5.3. Planificación del contenido del cuestionario

La finalidad de ésta etapa es:

1) La especificación del tipo de preguntas más adecuadas, cerradas, categorizadas, etc.,


para obtener de la población encuestada los datos o informaciones que señalan los
indicadores establecidos.

2) Las categorías, en su caso, que más convengan a cada pregunta y a los objetivos que
se persiguen con ellas.

3) La determinación del número de preguntas y de su orden y disposición en el


cuestionario.
Los dos primeros pasos se deben realizar teniendo en cuenta:

a) Las hipótesis concretas previstas, es decir, lo que se busca con cada pregunta y sus
categorías, o sea, lo que se pretende saber o conocer con ella.

b) Las características de la población estudiada.

c) La naturaleza y aplicaciones de cada tipo de pregunta.

d) La forma de aplicación del cuestionario, por escrito o mediante entrevista.

El destino de los datos derivados de cada una de las categorías de las preguntas es su
agrupación y sistematización en tablas.

En una tabla, a cada respuesta debe corresponder una columna. Por ello, hay que tener
en cuenta en la planificación del cuestionario que un número excesivo de respuestas da
lugar a tablas de muchas columnas y por tanto difíciles de leer y analizar.

En cuanto al tercer paso, número y orden de las preguntas se pueden recomendar las
siguientes reglas:

1) El cuestionario debe contener todas las preguntas necesarias, pero ninguna más. Un
cuestionario largo, salvo caso de absoluta necesidad, es penoso tanto para el
entrevistador como para el encuestado.

2) No se debe empezar el cuestionario con preguntas difíciles y embarazosas.

3) Se debe evitar a toda costa colocar juntas preguntas en las que la respuesta a una de
ellas pueda influir en el sentido de la respuesta a la otra.

Si esto ocurre, se produce el efecto de "halo" o "contagio".

4) Se debe procurar que todas las preguntas sobre un aspecto figuren juntas en el
cuestionario, dispuestas así como los mismos temas, guardando un orden temporal,
lógico y psicológico.

5) Para evitar la monotonía y en cansancio y facilitarlos cambios de lema, es


conveniente intercalar en sitios estratégicos preguntas de alivio más o menos
intrascendentes, que supongan un cierto respiro.
6) Se ha observado, que, en el caso de las entrevistas, la curva de tensión de los
entrevistados se manifiesta plana al principio y al final, y suele alcanzar su máxima
intensidad en el segundo tercio de la entre v i s t a .

Por esta razón, las instituciones de investigaciones de mercado suelen comenzar las
entrevistas con preguntas interesantes para el entrevistado, que exigen una motivación
menor y terminan con las preguntas de identificación que requieren menos esfuerzo.

La tendencia es, pues, a incluir las preguntas más importantes en el tercio medio de la
entrevista, y a no hacer preguntas que puedan comprometer al encuestado, sino después
que se haya establecido una cierta relación de confianza con él.

Se considera que en temas importantes para la investigación es peligroso basarse en una


sola pregunta. Varias preguntas de diferente forma, redacción y contenido reducirán el
peligro de los diversos sesgos a que está sometida una sola pregunta.

Similarmente, se estima que las preguntas referentes a actitudes, o posiciones


permanentes y profundas de la persona, deben ser acompañadas por lo menos de otra
pregunta que mida la fuerza de la actitud en comparación con otros sentimientos o
actitudes, es decir, su intensidad, o bien su centralidad, o sea, la importancia que se
concede a la actitud expresada a la hora de tomar una decisión, por ejemplo, votar.

1.5.4. Elaboración formal del cuestionario

Planificada del modo indicado la construcción del cuestionario, es preciso proceder a su


elaboración formal. Destacan en ella la redacción formal de las preguntas y la
determinación de los aspectos formales del cuestionario y de sus elementos accesorios.

La redacción de las preguntas, según la tesis central del libro de Sudman y Badburn
(1982) es el elemento esencial para maximizar la validez de los datos obtenidos en la
investigación por encuesta. Ya desde los primeros tiempos de la encuesta, se conoce el
hecho de que cambios aparentemente pequeños en la redacción de las preguntas pueden
causar grandes diferencias en los diversos porcentajes de respuestas a la misma.

Reglas básicas en esta redacción son que no se pierda nunca de vista los objetivos de la
investigación y que, previamente a la formulación de cada pregunta, nos preguntemos
sobre la necesidad y oportunidad de la misma, y sobre el grado en que nos servirá para
lograr los objetivos propuestos.

Finalidad de los aspectos formales es que el cuestionario sea atractivo y adecuado a las
características de la encuesta. Su objeto es la programación de sus condiciones formales,
tales como papel a emplear, clase, color, tipo de impresión; espacios destinados a las
respuestas y a la codificación; márgenes a dejar a derecha e izquierda y en medio de las
preguntas y datos de identificación que deba contener el cuestionario.

Como elementos accesorios al cuestionario cabe destacar:

a) La carta dirigida al encuestado solicitando su cooperación a la encuesta rellenando el


cuestionario y dándole las gracias por su cooperación.

b) Las instrucciones para cumplimentar el cuestionario.

La carta deberá estar escrita de forma clara y sugestiva, y en lenguaje sencillo y


apropiado al destinatario. En ella se hará resaltar el interés de la investigación y los
beneficios directos e indirectos que representa su contestación.

Las instrucciones, que según Zarkowich (1970), son tan importantes como el
cuestionario, son el medio de obtener la normalización de las respuestas recogidas y de
evitar la introducción de elementos subjetivos en las mismas.

En ellas se expondrán las advertencias, que se consideran necesario o conveniente


realizar, sobre la forma general de cumplimentar el cuestionario y de consignar las
respuestas según los distintos tipos de preguntas que comprenda.

Las instrucciones se deben redactar con gran claridad y esmero. Se debe procurar que
sean completas y resuelvan todas las dudas que puedan plantearse. Sobre todo ha de
tenerse cuidado especial en no induc i r a confusión. En este caso podrían ser causa de
sesgo.

1.5.5. Juicio crítico de un cuestionario

Este juicio se puede dividir en dos partes, una sintética y otra específica.
Respecto a ambas se suelen destacar los siguientes puntos: Sintética. En ella se
examinará:

1) La adecuación de las preguntas o ítems del cuestionario a la finalidad u objetivo de la


investigación.

2) La estructura y disposición equilibrada y armónica o no de sus partes.

3) Se verá si no falta ninguna parte o conjunto de preguntas esenciales al fin que se


pretende.

4) Se examinará si es más largo de lo debido y si algunas preguntas son lucrativas o


superfluas.

Específica. Se analizará cada ítem por separado indicando el carácter de la pregunta, su


tipo, su función en el cuestionario y si su formulación se ajusta a las reglas enumeradas.

1.5.6. Cuestionarios no cumplimentados

Tanto en el caso del cuestionario simple como en el de la entrevista, hay por lo


general siempre un número más o menos elevado de cuestionario que no son devueltos,
o de entrevistas que no se pueden efectuar.

En los cuestionarios por entrevista es frecuente el porcentaje de las que no se pueden


efectuar, oscilen entre el 5 y el 15 % y que se eleven al 40 % o más en los cuestionarios
enviados por correo.

El hecho de que un porcentaje relativamente elevado de cuestionarios se frustre, plantea


un problema al equipo investigador, porque se puede suponer que los que no contestan,
precisamente por ello, son individuos de la población de características diferentes a los
que contestan. Su no contestación implica que una parte de la población, probablemente
distinta de los que contestan, no está representada en la muestra, lo que introduce un
sesgo o fuente de error en la misma.

Este sesgo de la muestra no se puede remediar aumentando su tamaño, para sustituir a


los que no contestaron. Esta solución no elimina el hecho probable aludido de que los
que no contestan son probablemente gente distinta de los que contestan, que
seguramente de haber contestado lo habrían hecho de modo distinto.

El único procedimiento que se considera válido para solucionar este problema es la


repetición de visitas a los que no quieran contestar a la entrevista y el recordatorio o
envío de nuevos cuestionarios por correo a los que no lo han devuelto, hasta conseguir
reducir al mínimo los cuestionarios no cumplimentados.

Otro procedimiento también válido es el llamado de Hanseñ que consiste en formar una
submuestra con parte de los que no han contestado el cuestionario, en representación de
todos éstos. Luego hacer todo lo posible cueste lo que cueste, hasta conseguir su
respuesta. Esta, se considera representativa de todo el grupo y que por tanto se extiende
a él.

También es factible la ponderación en los resultados de la encuesta del conjunto de


no-respuestas, lo que tiene por objeto lograr que la muestra no pierda representatividad
por este motivo, así como la imputación la cual pretende dar valores de respuesta a los
encuestados que no contestan a alguna de las preguntas del cuestionario, (Cf. Sánchez
Carrión 1995, 207 y ss.).

1.5.7. La no respuesta

Otro problema de los cuestionarios está constituido por la falta de respuestas a las
preguntas. Esta falta de respuesta o no respuesta puede adoptar dos modalidades:

1) La de los que contestan no sé y

2) La de los que no dan respuesta alguna a la pregunta o no contestan.

Existe tendencia a pasar por alto las no respuestas y a concederlas poca importancia. Sin
embargo, sobre todo en el caso de los no sé, implican una modalidad de respuesta, que
merece la atención de los investigadores.

El NO CONTESTA demuestra una actitud que hace que el encuestado, por neutralidad
o indiferencia, o por la razón que sea, se reserve su opinión y se niegue a manifestarla y
a colaborar en la encuesta respondiendo a la pregunta.
En cambio, los NO SÉ pueden tener distinta significación según los casos, que depende
de los tipos diversos (Zeisel, 1974) de no sé. En primer lugar, se puede distinguir los
que Zeisel llama "no sé" auténticos, que indican una falta de conocimiento de lo
preguntado y, por tanto, una incapacidad de dar una respuesta a la pregunta. Por
ejemplo, ¿quién es el director de tal película? En este caso, la respuesta no sé, forma
parte de la información que se desea obtener mediante la pregunta.

El no sé puede significar también tanto que no se está familiarizado con la cuestión


hasta el punto de dar una respuesta, como que, aunque sé esté, no sé tiene una actitud
definida respecto al mismo. ¿En su opinión es cierto que el café tal no perturba el
sueño?

En segundo lugar, están los no sé que indican un fallo en la respuesta. En el caso de


preguntas sobre la conducta del encuestado, de lo que hace, como, por ejemplo ¿vio Vd.
la TV ayer o en la última semana? ¿Fue a misa el último domingo? Este tipo de no sé
pueden ser reducidos mediante la actuación del entrevistador.

El no sé, en fin, puede significar una evasiva intencional, cuando se trate de preguntas
en la que los encuestados suponen que las respuestas que den pueden ir en detrimento
suyo.

Para interpretar los no sé, se puede suponer, cuando falta toda otra información, que se
reparten al azar respecto a las demás categorías de la pregunta y, por tanto, se pueden
distribuir proporcionalmente entre ellas.

Respecto a la inclusión de la categoría no sé, existen dos posiciones (Schuman y


Presser, 1981):

1) La que recomienda evitar dicha inclusión como una categoría expresa de respuesta a
las preguntas, y que se consigne únicamente si el entrevistado la formula
espontáneamente.

2) La de los que ven en el no sé una categoría de respuesta tan legítima como las demás e
incluso sostienen que se debe alentar.
En todo caso, es un hecho comprobado que la inclusión expresa de la categoría no sé
aumenta significativamente el % de los que dan esta respuesta a las preguntas.

1.5.8. Validez y seguridad del cuestionario

En el cuestionario, como en todos los instrumentos de observación, además del pretest o


prueba a que ya hemos aludido, para comprobar que las preguntas son comprensibles y
que las respuestas a ellas son significativas, en orden a la investigación pretendida, es
necesario también verificar su seguridad y validez,

Un procedimiento para comprobar la seguridad del cuestionario es el llamado retest, que


consiste en aplicaciones repetidas de aquél a las mismas personas, dentro de un breve
espacio de tiempo.

En cuanto a la validez, el único procedimiento seguro para verificarla, es comprobar que


los resultados obtenidos se ajustan a la realidad. Pero esto en los cuestionarios sólo es
posible en las preguntas de hecho, pero no en las de opinión.

Como procedimientos prácticos para comprobar indirectamente la validez de los


cuestionarios, se pueden utilizar las técnicas de los grupos conocidos, "know groups" y
la de "predictive validity", la "random probé" o prueba aleatoria y las
"cross-check-questions".

Según la primera técnica, el cuestionario se aplica a individuos que se sabe de antemano


presentan unos valores muy altos o muy bajos respecto a determinadas características,
que se pretenden conocer con el cuestionario. Si los resultados de esta aplicación
coinciden significativamente con los ya conocidos es un índice de validez.

En la segunda técnica, se observa la conducta posterior de los encuestados y se contrasta


con sus opiniones. Si son congruentes ambas, también se puede tomar con índice de
validez del cuestionario.

La "random probé" o prueba aleatoria consiste en preguntas situadas aleatoriamente en


el cuestionario. Tienen como finalidad precisar y desarrollar lo que las preguntas
significan para el encuestado. Sirven para aclarar sus respuestas y para saber el grado de
comprensión de la encuesta y la validez de sus respuestas.
Un final contraste de validez es el uso de "cross-check questions". En este caso se
incluyen preguntas que pueden ser contrastadas con fuentes independientes. Por
ejemplo, la pregunta ¿cuántos años ha estado en tal prisión?, puede ser contrastada con
el registro de la prisión.

Respecto a la validez, en general, de la encuesta es aplicable lo expuesto en el capítulo 7


sobre los tipos de diseño y las variables extrañas las cuales, si se producen, pueden
influir en los encuestados y alterar los resultados. De modo específico se debe evitar
caer en los defectos de redacción y en el orden de las preguntas a los que se ha hecho
mención a lo largo de todo este capítulo, pues todos ellos suponen sesgos que afectan a
la validez.

El mejor medio para asegurar la validez de los cuestionarios es procurar reducir al


mínimo los errores de todo tipo.

1.5.9. Ética de la investigación por encuesta

Toda investigación es, en sí, por ser tal, una inquisición, que cuando se trata de encuesta
ha de versar necesariamente sobre personas, e implica una intromisión en la intimidad
de sus condiciones de vida, conducta, opiniones y actitudes. Por ello plantea el
problema de los límites de su licitud, es decir, de su ética.

Con relación a esta ética, hay que partir del principio de que el investigador social no
tiene derecho a inmiscuirse en la vida de las personas, sin su conocimiento y aceptación
totalmente consciente y libre. Tampoco el investigador social tiene derecho a hacer uso
de las informaciones que obtenga de la encuesta, salvo estrictamente para los fines
conocidos y autorizados por los encuestados.

De estos principios se derivan tres exigencias éticas básicas en la encuesta:

1. Que se informe a los encuestados del origen, razón de ser, entidad que promueve la
encuesta, su objeto y finalidad, utilización de los datos y, en general, de todos los aspectos
que pueden influir en su participación.

2. Que se respete la plena libertad de los encuestados de participar o no en la encuesta y de


abandonarla en cualquier momento.
3. Que se haga con los datos el uso autorizado por los encuestados, y se observe
rigurosamente en todo lo demás el secreto de las respuestas y el anonimato de los
informantes.

En síntesis, es responsabilidad ética de los investigadores por encuesta (Sudman y


Bradburn, 1982, 11) informar a los encuestados de los objetivos de la encuesta tan
completamente como sea apropiado, explicar el contenido general de las preguntas y
contestar toda pregunta que el encuestado pueda hacer sobre quién patrocina la encuesta
o sobre el uso de los datos obtenidos.

Además, deberá informarle del grado en que se mantendrá la confidencialidad de sus


respuestas y se esforzará todo lo posible por asegurar que este grado de confidencialidad
será mantenido.

2. ENTREVISTA

El tratamiento que Sierra da al tema es interesante en cuanto hace varias precisiones


acerca de ésta técnica.

2.1. Noción e importancia

En toda observación social se pueden distinguir tres elementos: la situación o realidad a


observar, el instrumento de observación y el acto de observación.

Con relación a ellos la entrevista ofrece la particularidad de presentar características


peculiares. La realidad a observar son datos objetivos (características físicas,
económicas, profesionales, sociales, etc.) y subjetivos (ideas, creencias, opiniones,
actitudes, sentimientos, conductas) del encuestado.

El instrumento de observación es fundamentalmente el cuestionario, como en las


encuestas por cuestionario escrito, pero con importantes particularidades con relación a
éste.

La primera es que forma parte del instrumento de observación o cuestionario de forma


activa el observador o entrevistador. Es este quien formula las preguntas y anota las
respuestas, a diferencia del cuestionario escrito por el mismo encuestado.
La segunda es que este cuestionario no siempre es fijo y estandarizado, sino que puede
consistir a veces, según los tipos de entrevista, en el simple señalamiento de unos puntos
o temas de la entrevista.

EN cuanto al acto de observación, la entrevista presenta la notable particularidad de que,


el hecho mismo de la observación o entrevista, da lugar a que se produzca
necesariamente una relación social entre entrevistador y entrevistado, con la
consiguiente interacción o influjo social recíproco entre ambos. Esta relación social
también existe en la observación participante, pero en ella es genérica en relación a todo
el grupo, mientras que la entrevista es eminentemente concreta, personal, directa e
inmediata.

Estas peculiaridades de la entrevista alteran y modifican la inmediatez y pureza


necesarias en la observación científica.

A pesar de ello, la entrevista es uno de los procedimientos de observación principales en


las ciencias sociales.

En estas ciencias hasta ahora no existe ningún procedimiento para observar


directamente los datos subjetivos de los miembros de la sociedad. Es obligado recurrir a
la entrevista o algún procedimiento similar también indirecto.

Por otra parte, la entrevista representa un procedimiento cómodo y barato para obtener
datos objetivos de dichos miembros. Se podrían comprobar directamente pero con
mucho más esfuerzo, trabajo y coste.

De hecho, la entrevista es la técnica más usada hasta ahora en las investigaciones


sociales y la que sin duda ha contribuido más a los logros de la sociología empírica,
como señala Sheuch (1 9 7 4 , p. 2 6 6 ) .

2.2. La interacción social en la entrevista

Las relaciones sociales no son algo que se produce "ex-novo" sin ningún precedente.
Antes al contrario, cada uno en nuestras relaciones sociales, al entrar en contacto con los
demás, se forma una imagen personal y social de individuo con quien se relaciona. Se
hace así de acuerdo con su presencia y apariencia y la experiencia que tenemos de
contactos con personas del mismo tipo y grupo social.

Esta imagen que cada uno se forma, nos induce a hacernos determinadas expectativas y
a esperar por tanto un determinado comportamiento de nuestro interlocutor, y nos lleva
a adoptar por nuestra parte una actitud consecuente con la imagen formada y las
expectativas creadas.

La entrevista, a pesar de su finalidad científica no deja de suponer una relación social y


por tanto también actúa en ella el mecanismo social descrito. Este mecanismo puede
comprometer la finalidad de la entrevista que es la de obtener respuestas personales, no
sugeridas y veraces, que se ajustan a la realidad del entrevistado.

En concreto, por ejemplo, el entrevistador tenderá normalmente a suponer en el


encuestado unas opiniones y actitudes, en particular y ni su conjunto estructural,
similares a las de otras personas del mismo tipo y clase social que haya entrevistado e
interpretará en este sentido las contestaciones recibidas.

Además, como ocupa en la entrevista una cierta posición preeminente, es posible que en
algún modo imponga al encuestado sus propias opiniones y actitudes.

Por su parte, el encuestado tenderá a desplegar consciente o inconscientemente los


mecanismos psicológicos de defensa que está acostumbrado a poner en juego en su
relación con los demás.

Asimismo, identificará al entrevistador como miembro de un determinado grupo social.


En consecuencia, se inclinará a adoptar una posición ante él, consonante con la
experiencia que tenga de su trato anterior con personas de dicho grupo y con los
estereotipos existentes sobre ella en el grupo a que pertenece.

Consecuencia de todo ello, es que el equipo investigador y los entrevistadores han de


tener en cuenta esta interacción para neutralizarla en lo posible en cada caso concreto, e
interpretar según ellas los resultados de la encuesta.
2.3. Clases

En el Diccionario de Sociología de Fairchild se define la entrevista como "la obtención


de información mediante una conversación de naturaleza profesional".

Esta definición comprende tanto la llamada entrevista estructurada, formal o con


cuestionario, como los diferentes tipos de entrevista sin cuestionario o no estructuradas.

En las segundas, no existe un cuestionario al que se tenga que ajustar estrictamente el


entrevistador. A este solamente se le indica, además del objeto y fin de la investigación,
los diversos puntos sobre los que interesa obtenga información de los entrevistados. Por
tanto, queda en uno, a su arbitrio, el número y tipo de preguntas a realizar y el orden y
modo de formularlas.

E s t e tipo de entrevista se emplea, sobre todo, en los estudios exploratorios, previos a


investigaciones proyectadas, para obtener un conocimiento básico, del que se carece, de
la población y el campo de la Investigación, así como cuando la investigación se refiere
a un tema difícil y escabroso o el universo es muy heterogéneo. En estos casos no es
c o n veniente aplicar un cuestionario rígido, sino dejar en libertad de acción al
entrevistador para actuar según las circunstancias de cada entrevista.

Dentro del grupo de entrevistas no estructuradas se pueden destacar: la entrevista


clínica, la profunda y la "focal".

La primera se utiliza en psicoanálisis y en psicoterapia. En ella ni siquiera e s t á n


definidos los puntos a tocar. Al contrario, se trata de dejar plena l i b e r t a d al
entrevistado en la expresión de sus vivencias y recuerdos. Lo que se pretende es que
éste adquiera conciencia de sus complejos y se libere de ellos.

La entrevista profunda se orienta a investigar en profundidad una determinada cuestión


del entrevistado. Por ello el entrevistador debe procurar que las manifestaciones del
entrevistado giren alrededor de dicha cuestión. Hay pues una mayor intervención del
entrevistador que en la clínica.

La técnica de la entrevista focal "focused interview" ha sido desarrollada por R. K.


Merton. Su objeto o tema es una experiencia muy concreta. Por eso se llama focal.
Las personas a quienes se entrevista son las que han participado en una situación
específica que se quiere investigar. Por ejemplo, han visto un espectáculo determinado,
han leído una obra, han vivido una aventura.

Estos diversos tipos de entrevista se pueden combinar entre sí. En este sentido
Lazarsfeld y Merton en la obra "Continuities in Social Research" recomiendan esta
técnica:

1) Fase de exploración: conversación centrada o de respuestas libres de una muestra


restringida que permita descubrir los aspectos del problema y elaborar un cuestionario.

2) Aplicación del cuestionario a toda la muestra.

3) Retorno a la muestra restringida, con conversación centrada para profundizar los


puntos más significativos, revelados por el análisis de resultados del cuestionario.

Según la forma de su realización, se pueden distinguir las entrevistas en forma personal


y por teléfono. El contacto entre entrevistador y entrevistado tiene lugar en la primera
de forma directa e inmediata, cara a cara, mientras que en la segunda, dicho contacto se
realiza a través del teléfono.

En la actualidad, la entrevista personal se enfrenta con graves problemas, dado el


aumento continuo de los costes de personal y desplazamientos que exige, y el creciente
número de entrevistas que no se pueden realizar por la progresiva dificultad de acceder
a las viviendas particulares y la renuncia de la gente a admitir extraños en su casa.

Ante esta situación, existe hoy, especialmente en los Estados Unidos, una tendencia a
sustituir la entrevista personal por la telefónica. De este modo, se logra una sensible
reducción de los costes e, incluso, a veces, tasas de respuestas más altas.

Como es obvio, la encuesta por teléfono exige el empleo de procedimientos especiales


de elección de las muestras, que se basan, bien en las listas de números de las guías
telefónicas, o en la generación al azar de números para formar los números de teléfono
de la muestra a encuestar.

Entre los factores que están contribuyendo al uso creciente de las encuestas por teléfono
se encuentran los siguientes (Frey, 1983):
1) La extensión masiva del servicio telefónico. Hoy, en Estados Unidos, el 98 % de las
casas tienen teléfono.

2) La existencia de un amplio espectro de investigaciones y estudios sobre la realización


de las encuestas por teléfono.

3) La decreciente aceptación, por los motivos indicados, de los métodos tradicionales de


las entrevistas cara a cara.

4) Los avances en la tecnología del teléfono y en la práctica de la encuesta por teléfono.


El WATS (Wide-area telephone service) permite realizar llamadas a larga distancia con
facilidad relativa y a un coste dos tercios inferior al normal. La técnica CATI (entrevista
por teléfono asistida por computador) consiste en la conexión de los teléfonos a un
ordenador, lo que capacita para el inmediato proceso de las respuestas al cuestionario.
Así, en una noche se ha podido disponer de los datos de una encuesta realizada sobre un
acontecimiento ocurrido el día anterior.

Por último, otro tipo interesante de entrevista es la de grupo. Se reúne a un grupo de


personas, de 6 a 12, para que discutan abiertamente alrededor de un tema que les
propone el investigador. Este actúa de moderador y puede introducir determinados
estímulos para ver qué reacción provocan.

Se puede considerar como una modalidad de esta entrevista, el llamado grupo de


discusión, estudiado en España por el Profesor Ibáñez Alonso en su conocida obra "Más
allá de la sociología. El grupo de discu s i ó n . Técnica y crítica", Siglo XXI, 1 9 7 9 .
Los miembros del grupo se eligen de modo que sean representativos de la población que
se quiere estudiar. El investigador plantea genéricamente el tema sin participar en mi
discusión a fin de que el grupo cree su propio discurso de acuerdo con sus
preocupaciones e intereses. El análisis se efectúa con base en la transcripción literal de
las intervenciones recogidas en grabadora.

2.4. Ventajas de la entrevista

La encuesta por cuestionario simple presenta con relación a la efectuada por medio de
entrevista las ventajas principales siguientes:
1) Su menor coste y exigencia de personal.

2) Evita la diversa influencia que ejercen los entrevistadores en las respuestas de los
entrevistados.

3) Asegura de modo más perfecto el carácter anónimo de las respuestas y de la encuesta.

A su vez, la entrevista, por su parte, presenta, respecto al cuestionario simple, las


ventajas siguientes:

1) Posibilidad de aplicación a personas analfabetas o que leen y escriben con dificultad.

2) La mayor importancia que los encuestados suelen conceder a la entrevista con


relación a la frecuentemente escasa que conceden a los cuestionarios simples.

3) Es más seguro en ella obtener la cooperación del encuestado, lo que hace que sea
mucho más elevado, por lo general, el porcentaje de cuestionarios simples no devueltos
o no cumplimentados que el de entrevistas fallidas.

4) La entrevista permite, sobre todo, lograr una comprensión de las condiciones


psicológicas y ambientales del encuestado en la entrevista, y de su intención y
disposición de ánimo en la contestación de las preguntas, así como aclarar el sentido de
éstas cuando no sean suficientemente claras.

5) La entrevista permite obtener una información más completa, profunda y rica, sobre
todo en cuestiones comprometidas.

2.5. Condiciones formales de la entrevista

La naturaleza de observación indirecta que tiene la entrevista y la interacción social que


se produce durante la misma entre entrevistador y entrevistado, hace que la entrevista
sea una técnica que, en mayor grado, sin duda, que las demás técnicas de investigación
social, plantea problemas y dificultades para lograr su objetivo, obtener respuestas
válidas y veraces.

Por ello, la realización de la entrevista requiere el mayor cuidado y atención y una


escrupulosa programación de su desarrollo y ejecución por parte de los entrevistadores.
A este efecto, los manuales de investigación social y las obras sobre la entrevista suelen
contener normas que orientan sobre la preparación y realización de la entrevista.

Estas normas se pueden dividir distinguiendo las dos fases de la entrevista: la


preparación y la ejecución.

2.5.1. Preparación de la entrevista

Una vez elegida la muestra y seleccionadas las personas que han de ser entrevistadas,
conviene presentar al encuestador mediante una nota que anuncie su visita y explique
los motivos de la entrevista.

La entrevista se debe realizar en un tiempo oportuno, para lo cual es importante conocer


la distribución del tiempo de los encuestados. S i es posible, lo ideal será obtener una
cita de antemano.

Los entrevistadores deben tener un conocimiento previo del campo social en que van a
actuar. De este modo se facilitará el ajuste entre entrevistador y entrevistado.

Un contacto previo con líderes del grupo social a encuestar para darles a conocer los
motivos y objetivos de las entrevistas, puede facilitar el éxito de las mismas, si el líder
consiente en apoyarlas.

El entrevistador debe ser preparado específicamente para su tarea, mediante un cursillo


de capacitación en el que obtenga un conocimiento básico de la investigación social y
una información sobre la encuesta y de sus objetivos. Además es corriente entregarles
unas instrucciones y las normas a que se deben ajustar en las entrevistas.

2.5.2. Ejecución de la entrevista

En la ejecución de la entrevista se pueden distinguir los siguientes aspectos de la


entrevista: ambiente; contacto inicial entre entrevistador y entrevistado; formulación de
las preguntas; anotación de las respuestas y terminación.

Ambiente de la entrevista.- SI el entrevistador puede escoger el lugar de la entrevista,


éste debe ser agradable y acogedor, de modo que facilite la comunicación.
Sobre todo el lugar debe estar a cubierto de miradas y oídos indiscretos. Si faltan estas
condiciones, el sujeto puede sentirse inhibido en sus respuestas y puede resultar violado
el secreto de la entrevista.

La posición de los participantes en la entrevista debe ser cómoda, por ejemplo,


sentados y tomando un refresco o un café.

En el contacto inicial, el entrevistador debe causar una primera impresión a ser posible
agradable. Para ello deberá ser y mostrarse educado, simpático y atractivo.

Para que el entrevistado coopere adecuadamente a la entrevista es importante que


conozca y comprenda el objeto de la entrevista, lo que se pide de él, y los motivos que
justifican la entrevista y la hacen de interés para el encuestado y la sociedad.

Por ello en la toma de contacto, el entrevistador, después de presentarse, deberá explicar


claramente estos extremos al encuestado.

En este primer contacto se ha de destacar especialmente el carácter estrictamente


confidencial y el anonimato de la información.

Formulación de las preguntas.- El encuestador no tiene que dar la impresión de que la


entrevista es un examen o interrogatorio. Por ello tanto en sus preguntas como en las
respuestas debe evitar todo aquello que implique crítica, sorpresa, aprobación o
desaprobación en sus palabras o en sus gestos.

Si bien el encuestador debe tener en la mano el cuestionario y echarle una ojeada antes
de hacer cada pregunta, ésta ha de ser formulada en tono de voz natural y de
conversación, evitando el tono de lectura y centrando su atención en el encuestado y no
en el cuestionario.

Todas las personas deben ser interrogadas sin que se introduzcan cambios en el
enunciado de las preguntas, para evitar la influencia de las opiniones personales del
encuestador y la posible variación de significaciones debida al cambio de palabras o
giros.
Las preguntas deben ser formuladas en el mismo orden en que figuran en el
cuestionario, pues éste se halla dispuesto de modo que se evite el contagio o influencia
de unas preguntas sobre otras.

Es conveniente utilizar frases de transición al pasar de un tema a otro, "veamos ahora",


"le parece que sigamos con..."

Es necesario que el entrevistado vea que interesa y se da importancia a lo que él dice.


Para ello pueden usarse las expresiones que en el trato social son frecuentes, tales como
"bien", "claro", "si", "continué", "le escucho", y hacer algún comentario que no
exprese aprobación ni desaprobación a las opiniones del encuestado.

Con el fin de hacer las preguntas lo más espontáneas posible, es preciso que las
preguntas se sucedan con cierta rapidez, no dejando descanso entre pregunta y pregunta.

El entrevistador va a preguntar y no responder. Cuando se solicite su opinión personal,


debe excusarse cortésmente.

No hay ni que decir que ninguna clase de discusión es admisible.

Anotación de las respuestas.- La experiencia demuestra que la anotación posterior a la


entrevista presenta dos inconvenientes: los límites de la memoria humana que no puede
retener con fidelidad toda la información y la distorsión que se produce por causa de los
elementos subjetivos que se proyectan en la reproducción de la entrevista.

La anotación directa mientras se desarrolla la entrevista es lo más recomendable para


recoger con fidelidad y veracidad la información que proporciona la persona
entrevistada. Mejor aún, si puede contarse con el auxilio un grabador, pidiendo
consentimiento al interrogado.

Terminación de la entrevista. Se debe distinguir según se trate de un sólo encuentro o de


una serie de ellos. En todos los casos, el interrogatorio se debe terminar en un clima de
cordialidad. Cuando la índole de la investigación requiere posteriores entrevistas, debe
dejarse la "puerta abierta" para los próximos encuentros.

En el caso de que de modo claro el entrevistador se dé cuenta de que el entrevistado le


está mintiendo descaradamente o le está tomando el pelo, porque considera en broma la
entrevista, deberá hacerle ver que aquel es su trabajo con el que se gana la vida y que no
puede perder el tiempo. Le rogará por consiguiente, que tome la entrevista en serio. Si
no hay rectificación patente, el entrevistador debe terminar la entrevista, no olvidándose
de consignar el estado de ánimo del encuestado.

3. ENTREVISTAS E I NVENTARIOS DE ENTREVISTAS

A su vez, Kerlinger y Lee en Investigación del Comportamiento. Métodos de


Investigación en Ciencias Sociales, hacen las siguientes precisiones.

La entrevista es quizás la técnica de uso más frecuente para obtener información de la


gente. Ha sido y aún es utilizada en todo tipo de situaciones prácticas: el abogado
obtiene información de un cliente; el médico conoce sobre el paciente; el oficial de
admisiones o el profesor determina la adecuación de estudiantes a determinadas
escuelas, departamentos y programas. Sin embargo, sólo hasta hace poco se ha utilizado
la entrevista de forma sistemática para propósitos científicos, tanto en el laboratorio
como en el campo.

Los métodos de recolección de datos se clasifican de acuerdo a qué tan directos son. Si
se desea saber algo sobre las personas, se les puede preguntar directamente. Ellos
ofrecen o no una respuesta. Por otro lado, es posible preguntar de forma indirecta. Se
puede utilizar un estímulo ambiguo como una fotografía borrosa, una mancha de tinta o
una pregunta vaga, y después preguntar respecto a las impresiones de los estímulos,
bajo el supuesto de que los entrevistados darán la información requerida sin saber que lo
están haciendo. Esta técnica es bastante indirecta. La mayor parte de los métodos de
recolección de datos utilizados en la investigación psicológica y sociológica son
relativamente directos o moderadamente indirectos. En pocas ocasiones se utilizan
medios muy indirectos.

Las entrevistas y los inventarios (cuestionarios) por lo general son bastante directos, lo
cual representa tanto una fortaleza como una debilidad. Tienen fortaleza porque gran
cantidad de la información requerida en la investigación social científica se obtiene de
los entrevistados por medio de preguntas directas. Aunque las preguntas deben
manejarse con sumo cuidado, los entrevistados pueden, y generalmente lo hacen, dar
mucha información de forma directa. No obstante, existe información de naturaleza más
difícil que los entrevistados quizá no estén dispuestos a dar fácil y directamente —por
ejemplo, información sobre sus ingresos, relaciones sexuales y algunas actitudes hacia
la religión o hacia los grupos minoritarios—. En tales casos, las preguntas directas
llegan a generar datos que no son válidos. Sin embargo, si se manejan en forma
apropiada, aun el material personal o polémico puede obtenerse exitosamente por medio
de entrevistas e inventarios.

La entrevista es probablemente uno de los métodos más antiguos y más utilizados para
conseguir información. Posee importantes cualidades que las pruebas y escalas objetivas
y las observaciones del comportamiento no tienen. Una entrevista puede proporcionar
una gran cantidad de información si se utiliza con un inventario bien realizado. Es
flexible y se adapta a situaciones individuales, y puede usarse con frecuencia cuando
ningún otro método es posible o adecuado. Estas cualidades la hacen especialmente
adecuada para la investigación con niños. Los métodos y consideraciones sobre las
entrevistas con niños pueden encontrarse en Aldridge y Wood (1998) y en Poole y
Lamb (1998). Minkes, Robinson y Weston (1994) ofrecen explicaciones sobre la forma
de entrevistar a niños con discapacidades. Ellis (1989) describe cómo conducir una
entrevista con niños superdotados canadienses. Si un entrevistador sabe que el
entrevistado, especialmente un niño, no entiende una pregunta, puede, dentro de ciertos
límites, repetir o replantear la pregunta. Las preguntas sobre deseos, aspiraciones y
ansiedades pueden plantearse de tal manera que produzcan información precisa. De
mayor importancia, quizás, es el hecho de que la entrevista permite explorar el contexto
y las razones de las respuestas a las preguntas. McReynolds (1989) sintetiza el estado de
los instrumentos de medición clínica, de los cuales uno es el inventario de entrevista.

La mayor desventaja de la entrevista y de su inventario acompañante es de índole


práctica. Las entrevistas toman mucho tiempo. El obtener información de un individuo
llega a tomar tanto como una hora e incluso dos horas. Una gran inversión de tiempo
implica esfuerzo y dinero. Andrews (1974) determina los requisitos de un estudio de in-
vestigación bien conducido, que utilice la entrevista, en términos del reclutamiento, en-
trenamiento, selección y supervisión. Uno de los componentes importantes de la
entrevista es la supervisión. Andrews menciona por lo menos nueve responsabilidades
que un supervisor debe tener. Por lo tanto, siempre que una técnica más económica
responda a los propósitos de investigación, no deben utilizarse las entrevistas. Emory
(1976) cita investigación realizada respecto a las características del entrevistador. Tiles
estudios hallaron evidencia de que características triviales podían influir en los
resultados de la entrevista. Por ejemplo, Emory cita el hecho de que las mujeres son
mejores entrevistadores que los hombres, y que los hombres casados son mejores que
las mujeres solteras. También cita un estudio realizado por el Centro Nacional de
Investigación de Opinión (National Opinión Research Center, NORC) que relaciona
ciertas características con la calidad de la entrevista. El entrenar entrevistadores para
que produzcan el mismo nivel de calidad requiere de tiempo, recursos e inclusive quizás
de experiencia previa.

3.1. Entrevista e inventarios como herramientas de la ciencia

Las entrevistas e inventarios han sido utilizados, en su mayor parte, simplemente para
reunir los llamados hechos. El uso más importante de la entrevista debe ser el estudio de
relaciones y la prueba de hipótesis. En otras palabras, la entrevista es un instrumento de
medición psicológica y sociológica. Quizás más preciso, los productos de entrevistas
—las respuestas de los entrevistados a preguntas cuidadosamente elaboradas— pueden
traducirse en medidas de variables. Por lo tanto, las entrevistas y los inventarios de
entrevista están sujetos a los mismos criterios de confiabilidad, validez y objetividad
que otros instrumentos de medición.

3.2. Entrevista: propósitos principales

1) Como un dispositivo exploratorio para ayudar a identificar variables y relaciones,


para sugerir hipótesis y para guiar otras fases de la investigación.

2) Ser el principal instrumento de la investigación. En dicho caso, en el inventario de


entrevista se incluyen preguntas diseñadas para medir las variables de la investiga-
ción. Estas preguntas se consideran después como reactivos en un instrumento de
medición, más que como meros dispositivos para reunir información.
3) Puede complementar otros métodos: hacer un seguimiento de resultados inespera-
dos, validar otros métodos y profundizar en las motivaciones de entrevistados y en
las razones por las que responden como lo hacen.

Al utilizar entrevistas como herramientas de investigación científica, debe plantearse la


pregunta: ¿los datos del problema de investigación pueden obtenerse de una manera
mejor y más fácil? Lograr confiabilidad, por ejemplo, no constituye un problema
pequeño. Los entrevistadores deben tener un entrenamiento; las preguntas deben
probarse con anterioridad y revisarse para eliminar ambigüedades y redacción
inadecuada. ¿Vale la pena el esfuerzo? Tampoco la validez es un problema pequeño.
Deben realizarse esfuerzos especiales para eliminar los prejuicios del entrevistador; las
preguntas deben probarse para encontrar sesgos desconocidos. El problema de
investigación particular y la naturaleza de la información buscada debe, en el análisis
final, determinar si se utilizará o no la entrevista. Cannelly Kahn (1968, capítulo 15) y
Warwicky Lininger (1975, capítulo 7) proporcionan una guía detallada respecto a si una
entrevista debe o no ser empleada.

3.3. La entrevista

La entrevista es una situación interpersonal cara a cara donde una persona (el
entrevistador) le plantea a otra persona (el entrevistado) preguntas diseñadas para
obtener respuestas pertinentes al problema de investigación. Existen dos tipos generales
de entrevista: la estructurada y la no estructurada, o estandarizada y no estandarizada
(véase Cannell y Kahn, 1968). En la entrevista estandarizada las preguntas, su secuencia
y su redacción son fijas. Se permite cierta libertad al entrevistador al plantear las
preguntas, pero ésta es relativamente poca. El Manual del Entrevistador (1976)
producido por el Instituto de Investigación Social (Institutefor Social Research) de la
Universidad de Michigan establece que la perspectiva de la entrevista está
evolucionando de la perspectiva tradicional. La entrevista se considera como una
interacción, una relación de roles activos entre entrevistador y entrevistado, donde el
entrevistador es incluso un maestro. Cannell y Kahn (1968) y Dohrenwendy Richardson
(1963) ofrecen información adicional sobre este tema. El nivel de libertad se especifica
de antemano. Las entrevistas estandarizadas utilizan inventarios de entrevista que se han
preparado cuidadosamente para obtener información concerniente al problema de
investigación.

Las entrevistas no estandarizadas son más flexibles y abiertas. A pesar de que los pro-
pósitos de investigación determinan las preguntas planteadas, su contenido, secuencia y
redacción están en manos del entrevistador. Por lo común no utilizan ningún inventario.
En otras palabras, la entrevista no estandarizada y no estructurada constituye una situa-
ción abierta, en contraste con la entrevista estandarizada y estructurada, que es una si-
tuación cerrada. Ello no significa que una entrevista no estandarizada sea casual; debe
ser planeada tan cuidadosamente como la estandarizada. Green y Tull (1988) afirman
que las entrevistas no estructuradas obtienen información que las entrevistas
estructuradas no ofrecen. Con el modelo informal de la entrevista no estructurada el
investigador obtiene ideas respecto a las motivaciones del entrevistado. Las entrevistas
no estructuradas algunas veces se denominan entrevistas profundas. Son especialmente
útiles para realizar estudios exploratorios. El interés central aquí lo representa la
entrevista estandarizada. Sin embargo, se reconoce que muchos problemas de
investigación pueden requerir, y muchas veces es así, un tipo de entrevista en que el
entrevistador tenga permitido utilizar preguntas alternativas que se ajusten a
entrevistados particulares y a cuestiones particulares. El procedimiento real de la
conducción de una entrevista no se analiza en este libro.

3.3.1. El inventarío de entrevista

La conducta de entrevistar es, en sí misma, un arte, pero la planeación y la redacción de


un inventario de entrevista lo es todavía más. Es poco común que un novato produzca
un buen inventario, al menos sin considerable estudio y práctica previos. Existen varias
razones para ello; las principales probablemente sean el significado múltiple y la
ambigüedad de las palabras, la ausencia de un enfoque directo y constante en los
problemas e hipótesis de estudio, la falta de apreciación del inventario como un
instrumento de medición y la ausencia de antecedentes y experiencia necesarios.

3.3.1.1. Tipos de información y reactivos de los inventarios

La mayor parte de los inventarios incluyen tres tipos de información: información de la


carátula (identificación), información de tipo censal (o sociológica) e información del
problema. Con excepción de la identificación, estos tipos de información se analizaron
en un capítulo anterior. No obstante, debe mencionarse la importancia de identificar
cada inventario de manera precisa y completa. El investigador cuidadoso debe aprender
a identificar con letras, números u otros símbolos cada inventario y cada escala.
Además, debe registrarse de forma sistemática la identificación de la información de
cada individuo. Existen dos tipos de reactivos de inventario que se usan comúnmente:
de alternativa fija (o cerrada) y de preguntas abiertas. Se utiliza también un tercer tipo
de reactivo, de alternativas fijas: los reactivos de escala.

1) Reactivos de alternativa fija

Como su nombre lo indica, los reactivos de alternativa fija ofrecen al entrevistado una
opción entre dos o más alternativas. A estos reactivos también se les llama preguntas
cerradas o de encuesta. El tipo más común de reactivo de alternativa fija es dicotómico:
plantea preguntas que pueden responderse como sí o no, de acuerdo o en desacuerdo y
otro tipo de respuestas de dos opciones. Con frecuencia se añade una tercera
posibilidad: no sé o indeciso. Un ejemplo de un reactivo de alternativa fija sería:

¿Considera usted que el gobierno de Estados Unidos ya encontró una cura para el SIDA,
pero que la está ocultando?

Sí.....................................[ ]

No...................................[ ]

No sé.............................[ ]

A pesar de que los reactivos de alternativa fija poseen las claras ventajas de lograr una
mayor uniformidad de la medición y, por lo tanto, mayor confiabilidad, de forzar al
entrevistado a responder en una forma que se ajuste a las categorías previamente
establecidas y de ser fáciles de codificar, también tienen ciertas desventajas. La mayor
de ellas es su superficialidad: sin sondeo, generalmente no van más allá de la superficie
de la respuesta. También pueden irritar al entrevistado que no encuentre ninguna
alternativa adecuada para él. Peor aún, es posible que fuercen respuestas. Un
entrevistado puede elegir una alternativa para ocultar ignorancia o elegir alternativas
que no representan con precisión los hechos u opiniones. Tales dificultades no implican
que los reactivos de alternativa fija sean malos o inútiles. Por el contrario, se utilizan
con buenos resultados si se redactan de manera juiciosa, si se utilizan con un sondeo y si
se mezclan con reactivos abiertos. Un sondeo es un dispositivo utilizado para encontrar
información de los entrevistados sobre un tema, sus marcos de referencia o, más común,
para aclarar y establecer las razones de las respuestas dadas. El sondeo incrementa el
poder de "obtención de respuesta" de las preguntas, sin cambiar su contenido. Ejemplos
de sondeo son: "Dígame más sobre esto." "¿Cómo es eso?" "¿Puede explicarlo?" (véase
Warwick y Lininger, 1975, pp. 210-215).

2) Reactivos abiertos

Los reactivos abiertos o de final abierto representan un desarrollo extremadamente


importante en la técnica de la entrevista. Las preguntas abiertas son aquellas que
brindan un marco de referencia para las respuestas de los entrevistados, pero poniendo
un mínimo de restricción a las respuestas y a su expresión. Aunque su contenido está
determinado por el problema de investigación, no imponen ninguna otra restricción
sobre el contenido ni forma de las respuestas del entrevistado. Más tarde se darán
ejemplos.

Las preguntas abiertas tienen importantes ventajas, aunque también tienen desventajas.
Sin embargo, si se redactan y utilizan apropiadamente se minimizan las desventajas. Las
preguntas abiertas son flexibles; tienen la posibilidad de profundizar; le permiten al
entrevistador aclarar malos entendidos (a través del sondeo), establecer la falta de
conocimiento de un entrevistado, detectar ambigüedades, promover la cooperación y
lograr rapporty mejores estimados de las verdaderas intenciones, creencias y actitudes
de los entrevistados. Su empleo tiene también otra ventaja: en ocasiones las respuestas a
preguntas abiertas sugieren posibilidades de relaciones e hipótesis. Los entrevistados
algunas veces darán respuestas inesperadas que tal vez indiquen la existencia de
relaciones no anticipadas originalmente.

Un tipo especial de pregunta abierta es la pregunta de embudo. En realidad se trata de


un conjunto de preguntas dirigidas a obtener información sobre un solo tema importante
o sobre un solo conjunto de temas relacionados. El embudo inicia con una pregunta
general y se va reduciendo progresivamente al punto o puntos específicos importantes.
Warwick y Lininger (1975) señalan que el mérito del embudo es que permite la libre
respuesta en las primeras preguntas y después se reduce a preguntas y respuestas
específicas; y que también facilita el descubrimiento de los marcos de referencia del
entrevistado. Otra forma de pregunta de embudo inicia con una pregunta abierta general
y continúa con reactivos específicos cerrados. La mejor forma de reconocer las buenas
preguntas abiertas y de embudo es por medio del estudio de ejemplos.

Para obtener información sobre prácticas de crianza de niños, Sears, Maccoby y Levin
(1957) utilizaron varias buenas preguntas abiertas y de embudo. Una de ellas, con
comentarios del autor entre corchetes, es:

Ejemplo

Por supuesto que todos los bebés lloran. [Note que el entrevistador tranquiliza al padre
respecto al llanto de su hijo.) Algunas madres consideran que si se levanta a un bebé
cada vez que llora, se le malcría. Otros piensan que no se debe dejar llorar demasiado
tiempo a un bebé. [El marco de referencia se ha expresado claramente. También se ha
tranquilizado a la madre pues no importa cómo maneje el llanto de su bebé.] ¿Qué
piensa usted respecto a esto?

(a) ¿Qué hizo con X respecto a esto?

(b) ¿Qué hizo a la medianoche?

Este conjunto de preguntas de embudo no sólo evalúa actitudes, sino que también
sondea prácticas específicas.

3) Reactivos de escala

Un tercer tipo de reactivo de inventario es el reactivo de escala. Una escala es un


conjunto de reactivos verbales, a cada uno de los cuales un individuo responde
expresando grados de acuerdo o desacuerdo, o algún otro modo de respuesta. Los
reactivos de escala tienen alternativas fijas y colocan al individuo entrevistado en algún
punto de la escala. (Serán analizados con mayor profundidad en el capítulo 30.) El uso
de reactivos de escala en inventarios de entrevista es un desarrollo que promete mucho,
debido a que se combinan los beneficios de las escalas con los de las entrevistas. Por
ejemplo, se puede incluir una escala para medir actitudes hacia la educación en un
inventario de entrevista sobre el mismo tema. Las puntuaciones de la escala se obtienen
de esta forma para cada entrevistado y se verifican contra datos de preguntas abiertas.
Es posible medir la tolerancia hacia la inconformidad, como lo hizo Stouffer (1955), al
tener una escala para medir esta variable incluida en el inventario de entrevista.

3.3.1.2. Criterios para la redacción de preguntas

Los criterios o preceptos para la redacción de preguntas se han desarrollado a través de


la experiencia y la investigación. Algunos de los más importantes se presentan más
adelante en forma de preguntas. Se anexaron breves comentarios a las preguntas. Al
enfrentarse con la necesidad real de redactar un inventario, el estudiante deberá
consultar tratados más extensos, ya que el siguiente análisis, en congruencia con la
postura del resto del capítulo, pretende ser sólo una introducción al tema. Si se desea
una guía práctica véase Emory (1976, capítulo 8), quien proporciona un buen resumen y
puntos clave para elaborar el inventario; así como Noelle-Neuman (1970) y Warvvick y
Lininger (1975). Emory enfatiza la forma de probar el instrumento antes de usarlo
realmente, cómo secuenciar los reactivos o preguntas y qué hacer bajo ciertas
situaciones. Otras recomendaciones son Atkinson (1971), Beed y Stimson (1985) y
Mishler (1986).

1) ¿Está relacionada la pregunta con el problema y los objetivos de investigación?


Con excepción de preguntas de información factual y sociológica, todos los
reactivos del inventario deben estar en función del problema de investigación. Esto
significa que el propósito de cada pregunta es generar información que sirva para
probar las hipótesis de la investigación.

2) ¿Es apropiado el tipo de pregunta? Alguna información puede obtenerse mejor con
preguntas abiertas —razones para comportamientos, intenciones y actitudes—. Por
otro lado, otro tipo de información puede obtenerse de forma más expedita por
medio de preguntas cerradas. Si todo lo que se requiere de un entrevistado es la
opción preferida de dos o más alternativas, y estas alternativas pueden especificarse
con claridad, sería inútil utilizar una pregunta abierta (véase Dohrenwend y
Richardson, 1963; Schuman y Presser, 1979; Warwick y Lininger, 1975).

3) ¿El reactivo es claro y sin ambigüedades? Un reactivo o afirmación ambigua es


aquella que permite o invita a interpretaciones alternativas, de las cuales resultan
respuestas diferentes. Las preguntas denominadas de doble sentido, por ejemplo,
son ambiguas debido a que proporcionan dos o más marcos de referencia en lugar
de uno solo. Los entrevistados, aun cuando no se confundan con la complejidad y
alternativas ofrecidas por la siguiente pregunta, difícilmente responderían
utilizando un marco común de referencia y comprendiendo lo que se pide. "¿Cómo
le va a usted y a su familia este año? ¿La pregunta se refiere a finanzas, felicidad
marital, estado de salud o a qué?

Se ha realizado un gran trabajo respecto a la redacción de reactivos. Si se siguen


ciertos preceptos, esto ayuda al redactor a evitar ambigüedades. En primer lugar,
deben evitarse las preguntas que contengan más de una idea a la que el entrevistado
pueda reaccionar. Un reactivo como "¿Considera usted que las metas educativas de
la preparatoria moderna y los métodos de enseñanza utilizados para lograr estos
objetivos son educativamente adecuados?" es una pregunta ambigua, debido a que
al entrevistado se le cuestiona acerca de los objetivos educativos y de los métodos
de enseñanza en la misma pregunta. En segundo lugar, se deben evitar términos y
expresiones ambiguas. Es posible plantear la siguiente pregunta a un entrevistado:
¿piensa usted que los maestros de su escuela reciben un trato justo?" Se trata de un
reactivo ambiguo debido a que "trato justo" puede referirse a diferentes tipos de
trato. El término justo también puede significar "justicia", "equidad", "no demasia-
do bueno", "imparcial" y "objetivo". La pregunta requiere de un contexto claro, es
decir, de un marco de referencia explícito. (Sin embargo, algunas preguntas ambi-
guas se utilizan deliberadamente para producir distintos marcos de referencia.)

4) ¿La pregunta es de tipo conducente? Las preguntas conducentes sugieren


respuestas y como tales, amenazan la validez. Si se le pregunta a alguien "¿ha leído
usted sobre la situación de la escuela local?" se puede obtener un número
desproporcionado de respuestas "sí", ya que la pregunta implicaría que es malo no
haber leído sobre la situación de la escuela local.
5) ¿La pregunta demanda conocimiento e información que el entrevistado no posee?
Para contrarrestar la invalidez de una respuesta debida a falta de información,
resulta sensato utilizar preguntas de filtro de información. Antes de preguntarle a
una persona lo que piensa acerca de la UNESCO, primero debe preguntársele si
sabe lo que significa y es la UNESCO. Existe otro método: se le explica al
entrevistado brevemente lo que es la UNESCO y luego se le pregunta lo que piensa
de ella.

6) ¿La pregunta demanda material personal o delicado que el entrevistado pueda


negarse a proporcionar? Se requiere de técnicas especiales para obtener
información de naturaleza personal, delicada o polémica. Pregunte sobre los
ingresos u otros asuntos personales más tarde en la entrevista, después de haber
establecido el rapport. Si se pregunta respecto a algo que es desaprobado
socialmente, primero debe mostrarse que algunas personas piensan en un sentido y
que otras piensan en otro sentido. En efecto, no debe provocarse que el entrevistado
se desapruebe a sí mismo. Se le debe asegurar que todas las respuestas serán
confidenciales.

7) ¿La pregunta está cargada de deseo de aceptación social? La gente tiende a dar
respuestas que son socialmente deseables, respuestas que indican o implican la
aprobación de actos o cosas que son generalmente consideradas como "buenas". Se
le puede preguntar a una persona sobre sus sentimientos hacia los niños. Se supone
que todos deben amar a los niños. A menos que se sea cuidadoso, se obtendrá una
respuesta estereotipada sobre los niños y el amor. También, si se le pregunta a una
persona si vota, hay que tener cuidado, ya que se supone que todos deben votar. Si
se le pregunta a un entrevistado sobre sus reacciones ante los grupos minoritarios,
de nuevo se corre el riesgo de obtener respuestas inválidas. La mayor parte de las
personas educadas, sin importar cuáles sean sus "verdaderas" actitudes, están
conscientes de la desaprobación de los prejuicios. Entonces, una buena pregunta es
aquella donde los entrevistados no son conducidos a expresar meros sentimientos
socialmente deseables. Al mismo tiempo, tampoco se debe preguntar a los
entrevistados de forma que se enfrenten con la necesidad de dar respuestas
socialmente indeseables.
3.3.2. Valor de las entrevistas y de los inventarios de entrevistas

Cuando la entrevista se acompaña de un inventario adecuado de valor comprobado,


constituye una herramienta de investigación potente e indispensable que produce datos
que ninguna otra herramienta de investigación ofrece. Es adaptable, capaz de utilizarse
con todo tipo de entrevistados en muchos tipos de investigaciones y única por su
adecuación para hacer exploraciones profundas. ¿Pero equilibran sus fortalezas a sus
debilidades? ¿Cuál es su valor en la investigación del comportamiento, en comparación
con otros métodos de recolección de datos?

La herramienta más natural con la cual comparar a la entrevista es el llamado cuestio-


nario. Como se señaló antes, "cuestionario" es un término que se emplea casi para cual-
quier clase de instrumento que incluye preguntas o reactivos a los que responde un
individuo. Aunque el término se utiliza de manera intercambiable con "inventario",
parece estar más asociado con instrumentos autoadministrados que poseen reactivos ce-
rrados o de alternativa fija.

El instrumento autoadministrado posee ciertas ventajas. Siendo todos o la mayoría de


sus reactivos de tipo cerrado, se alcanza mayor uniformidad de estímulo y, por lo tanto,
mayor confiabilidad. A este respecto, tiene las ventajas de las escalas y pruebas escritas
de tipo objetivo, si se elaboran y se prueban previamente de manera adecuada. Una
segunda ventaja es que, si son anónimos y confidenciales, se alienta la honestidad y la
franqueza. Este tipo de instrumento también se aplica a muchas personas de manera
relativamente fácil. Una ventaja un tanto dudosa es que puede enviarse por correo a los
entrevistados. Además, también es económica: su costo por lo general es una fracción
del de las entrevistas.

Las desventajas de los instrumentos autoadministrados (cuando se envían por correo)


parecen sobrepasar sus ventajas. La principal desventaja es un bajo porcentaje de
recuperación. Una segunda desventaja es que quizá no sea tan uniforme como parece.
La experiencia ha demostrado que con frecuencia la misma pregunta tiene diferente
significado para distintas personas. Como se explicó antes, esto puede manejarse en la
entrevista. Sin embargo, no es posible hacer algo para resolver dicha situación cuando
se autoadministra el instrumento. En tercer lugar, si sólo se utilizan reactivos cerrados,
el instrumento muestra las mismas debilidades de los reactivos cerrados analizadas con
anterioridad. Por otro lado, si se utilizan reactivos abiertos, es posible que el
entrevistado se niegue a escribir las respuestas, lo cual reduce la muestra de respuestas
adecuadas. Muchas personas no son capaces de expresarse adecuadamente a través de la
escritura, y a muchos que sí pueden hacerlo, les disgusta.

Debido a estas desventajas, probablemente la entrevista sea superior al cuestionario


autoadministrado. (Esta objeción, por supuesto, no incluye las escalas de personalidad y
de actitud que están cuidadosamente elaboradas.) El mejor instrumento disponible para
estudiar el comportamiento, las intenciones futuras, los sentimientos, las actitudes y las
razones del comportamiento de las personas parece ser la entrevista estructurada, en
combinación con un inventario de entrevista que incluya reactivos cerrados, abiertos y
de escala. Por supuesto, la entrevista estructurada debe elaborarse y construirse con
cuidado, así como aplicarse únicamente por entrevistadores hábiles. Sus principales
desventajas son el costo en tiempo, energía y dinero, y el alto nivel de habilidad
necesarios para su elaboración. Una vez que se superan sus desventajas, la entrevista
estructurada se vuelve una poderosa herramienta.

3.3.3. El grupo focal y la entrevista de grupo: otro método de entrevista

Quizás este tema pertenezca a un capítulo previo cuando se expusieron los métodos
cualitativos. Algunos investigadores equiparan al método del grupo focal con la
investigación cualitativa (Calder, 1977). Algunos se han referido a este método como
entrevistas de grupo (Wells, 1974). Basch (1987) reporta que este método fue expuesto
por Bogardus en 1926, pero que sólo se utilizó ocasionalmente a partir de entonces
hasta los años ochenta. Quienes utilizaban primordialmente el método del grupo focal,
hasta hace poco, eran los investigadores de mercado y de negocios. Basch (1987)
considera que el método del grupo focal es prometedor en áreas diferentes de la
mercadotecnia. Él considera que podría ser una técnica de investigación para mejorar la
investigación, práctica y teoría de la educación para la salud. El método proporciona
una visión profunda de la gente. Sudman, Bradburn y Schvvarz (1996) creen que la
metodología del grupo focal sirve para determinar la manera en que los entrevistados
producen y procesan información.
La técnica del grupo focal implica entrevistar a dos o más personas al mismo tiempo. El
tamaño del grupo focal debe ser lo suficientemente grande para generar diversos puntos
de vista, pero lo suficientemente pequeño para ser manejable. Krueger (1994) reco-
mienda de siete a diez personas por grupo focal, lo cual permitirá a cada persona tener
la oportunidad de participar en la discusión. Existe un moderador que conduce la
discusión de forma abierta y libre. Este moderador o facilitador requiere estar bien
entrenado. Es función del moderador hacer que la discusión no se aleje demasiado del
tema de interés. El tema puede ser cualquiera. Las respuestas de los entrevistados no son
solicitadas de forma activa. No se dan sugerencias directas. En investigación de
mercado o de consumo el tema se referiría a un producto o servicio. En psicología el
interés sería, por ejemplo, el lenguaje utilizado por hombres homosexuales
afroamericanos (Mays, Cochran, Bellinger, Smith, Henleyet al., 1992). En el área de
salud, un grupo focal se utilizaría para determinar los temores acerca de los cinturones
de seguridad o las bolsas de aire. Una de las metas consiste en examinar las actitudes y
el comportamiento de la gente. La otra meta es descubrir lo que cada participante piensa
sobre el tema que se discute. Las opiniones y descripciones surgen de los entrevistados.
El investigador espera ser capaz de descubrir, a través de las discusiones, los
discernimientos importantes que después sirvan para resolver problemas. Calder (1977)
afirma que el método del grupo focal es útil para descubrir información que se utilice
para diseñar un estudio cuantitativo de investigación. Algunos han utilizado el grupo
focal como un medio para desarrollar cuestionarios. La investigación de grupo focal
también ayuda a los investigadores a desarrollar constructos que empleen en estudios
futuros. Calder lo llama "conocimiento precientífico".

Una de las ventajas de los grupos focales es su costo, pues cuesta muy poco
organizarIos. Los mayores costos residirían en conseguir y pagar al moderador.
Además, los participantes podrían recibir un pago simbólico por su tiempo. El grupo
focal también se realiza de forma rápida. Se dispone de las ideas de los entrevistados
rápidamente y se realiza una videofilmación de las sesiones para analizarlas después con
mayor profundidad. Es muy bueno para generar hipótesis para posteriores
investigaciones. En la investigación de mercado, el grupo focal permite al cliente
(fabricante) que encargó el estudio, ser un participante activo en la participación grupal.
Así, dicha persona es capaz de obtener la información de primera mano. Lo anterior es
posible debido a que los grupos se organizan de un tamaño que sea manejable. La
interacción entre los entrevistados puede generar intercambios estimulantes que resulten
en información útil, que no se obtiene con otros métodos de investigación. Además,
como se mencionó antes, los grupos focales son muy flexibles. Un moderador experto
va dirigiendo, y aun permitiendo que ideas prometedoras fluyan.

Sin embargo, el grupo focal no es muy recomendable para producir información con-
creta. Una decisión no debe basarse únicamente en la información reunida con dicho
método. Además, ha sido criticado por los investigadores cuantitativos como "no
científico" e indigno de confianza. Las preguntas no son estandarizadas y pueden variar
de un grupo a otro. Con el uso de grupos muy pequeños, los datos de los grupos focales
sufren en su posibilidad de generalización. A diferencia de la investigación de encuesta
estructurada, el grupo focal no implica mucho esfuerzo por asegurarse de que el grupo
sea representativo. Como sucede en la dinámica de cualquier grupo, siempre habrá unos
cuantos individuos que dominen la conversación. Entonces, el moderador necesita
contar con suficiente experiencia para minimizar la situación sin cortar el flujo de
comunicación. La entrevista de grupo focal requiere de mucha paciencia y habilidad.
Berger (1991) ofrece algunas sugerencias útiles para el moderador. También bosqueja lo
que debe contener un reporte sobre un grupo focal. Algunos participantes ven al grupo
focal como una oportunidad para ventilar sus emociones. Por lo tanto, los temas
sensibles no deben explorarse por medio de grupos focales. En la sección de sugerencias
de estudio se presentan algunas muy buenas referencias sobre los grupos focales. Estos
constituyen un método cualitativo de investigación, y como tales son capaces de ofrecer
información rica que no pueden explotar los métodos cuantitativos. Son muy adecuados
para conocer lo que desean los clientes o lo que la gente piensa acerca de ciertas
políticas y reglas. Los grupos enfocados han probado su eficacia en el estudio de
organizaciones.

Algunos ejemplos de investigación de grupos focales

Audience Studies Incorporated (ASI) es una compañía de investigación de mercados


que ha operado a las afueras de Hollywood, California, durante muchos años. Se invita
a los consumidores a una demostración, en la que se presenta un programa y
comerciales de televisión. Por su participación se sortean premios tales como champú,
crema dental, analgésicos, etcétera. Durante la demostración del programa y de los
comerciales, los participantes utilizan un dispositivo electrónico de calificación para
comunicar sus puntos de vista acerca de lo que están viendo. Las respuestas se graban.
Los participantes también completan cuestionarios después de cada comercial o
programa. A partir de este grupo se elige a varias personas para participar en grupos
focales. Los fabricantes de productos generalmente comisionan a ASI para que
conduzca estos grupos focales para obtener ideas sobre cómo funciona su producto en
relación con la competencia. En varias ocasiones participan representantes del
fabricante en los grupos focales, para obtener información de manera directa. Por
ejemplo, si un fabricante está pensando en desarrollar un nuevo producto, la
información obtenida de los grupos focales brinda ideas sobre lo que debe llevar el
producto en términos de manufactura y mercadotecnia.

Mayset al. (1992) utilizó un grupo focal que incluía hombres homosexuales afroa-
mericanos. El tema de discusión era la conducta sexual y el VIH. Con este método,
Mayset al. fueron capaces de recopilar el argot que emplean los varones afroamericanos
homosexuales. Estos resultados son útiles para comparar a los hombres homosexuales
afroamericanos con homosexuales americanos blancos, y también para construir
cuestionarios diseñados para descubrir la conducta sexual de varones homosexuales
afroamericanos. El conocimiento obtenido a partir de dicho estudio también serviría
para educar a consejeros y profesionales de la salud que tratan con homosexuales
afroamericanos. Mays y sus colaboradores (1992, p. 432) afirman lo siguiente:

Al utilizar la terminología presentada aquí, en la conducción de investigación


relacionada con el VIH, es importante recordar que los procesos lingüísticos y
cognitivos están inmersos en un contexto. Al evaluar la conducta sexual de hombres
homosexuales negros, el planteamiento de preguntas que incluyen su argot también
debe originarse desde el marco de referencia de su experiencia.

Sussman, Burton, Dent, Stacy y Flay (1991) publicaron que se debe tener precaución
con el uso de los grupos focales, pues consideran que tales grupos pueden inducir
ciertos efectosgrupalesque sesguen las respuestas. Su estudio exploró el extenso
procedimiento de los grupos focales, que incluye un cuestionario previo de grupo. El
cuestionario tiene material que se cubrirá durante la sesión del grupo y puede afectar a
los miembros del grupo al comprometerlos con una posición antes de que comience la
discusión grupal. Estos investigadores consideran que la gente depende de las respuestas
de otras personas, y de esta manera convergen en una norma colectiva. Es decir, algunos
entrevistados tendrán juicios más extremos después de las discusiones grupales.

Uno de los efectos de las normas colectivas es el efecto de polarización del grupo. El
involucrarse en un grupo puede sesgar a los participantes a responder de maneras más
extremas. Específicamente Sussman et al. (1991) buscaron una polarización de actitudes
(un efecto de sesgo por influencia del grupo). La discusión en el grupo focal se dirigió
hacia cómo reclutar adolescentes que consuman tabaco para una clínica contra el taba-
quismo. Se utilizaron 31 grupos focales; a cada uno se les administraron cuestionarios
de pretest y de postest. Los datos obtenidos apoyaron la existencia de un efecto de
polarización del grupo. Después de participar en un grupo focal, los entrevistados
manifestaron una evaluación más alta de las estrategias de reclutamiento autogeneradas.
También reportaron que si fuesen fumadores, dichas estrategias los inducirían a unirse
al programa. El estudio demostró que los grupos focales podrían no generan nuevas
estrategias. Sin embargo, sí parecen ser efectivos en inducir en los participantes una
actitud más favorable hacia las soluciones autogeneradas de problemas.

4. LA OBSERVACIÓN

4.1. Elección y construcción de medidas objetivas

El método de observación y recolección de datos más utilizado en las ciencias del


comportamiento es el de las pruebas y escalas. La gran cantidad de tiempo que pasan los
investigadores en la construcción o búsqueda de medidas de variables es tiempo bien
invertido, ya que la adecuada medición de las variables de investigación constituye uno
de los aspectos nodales del trabajo científico sobre el comportamiento. En general, se ha
puesto muy poca atención a la medición de las variables de estudios de investigación.
¿Qué utilidad pueden tener los intrigantes e importantes problemas de investigación, el
sofisticado diseño de investigación y el intrincado análisis estadístico, si las variables de
los estudios de investigación se miden pobremente? Por fortuna se ha progresado mucho
en la comprensión de la teoría de la medición psicológica y educativa, así como en el
mejoramiento de la práctica de la medición. En este capítulo se examina algo de la
tecnología que subyace a los procedimientos objetivos de medición.

4.2. Objetividad y métodos objetivos de observación

La objetividad, una característica central y esencial de la metodología científica, es fácil


de definir, aunque evidentemente difícil de entender. También es polémica. La
objetividad es el acuerdo entre jueces expertos respecto a lo que se observa. Los
métodos objetivos de observación son aquellos donde, cualquiera que siga las reglas
prescritas, asignará los mismos valores numéricos a objetos y conjuntos de objetos
como lo haría cualquier otra persona. Un procedimiento objetivo es aquel en el que el
acuerdo entre los observadores se encuentra en su nivel máximo. En términos de
varianza, la varianza de los observadores se encuentra en su nivel mínimo, lo cual
quiere decir que la varianza de juicio, es decir, la varianza debida a las diferencias entre
jueces en la asignación de valores numéricos a objetos, se aproxima a cero. Es posible
encontrar una extensa discusión sobre la objetividad en Kerlinger (1979, pp. 9-13 y
262-264). La importancia de la comprensión de la objetividad en la ciencia no puede
sobrestimarse. Es especialmente importante comprender que la objetividad científica es
metodológica y tiene poco o nada que ver con la objetividad como una supuesta
característica de los científicos. El hecho de que un científico como persona sea o no sea
objetivo no es el punto importante. Lo importante es que la objetividad científica es
inherente a los procedimientos metodológicos, caracterizados por el acuerdo entre
jueces expertos —y nada más—.

Todos los métodos de observación son inferenciales: se realizan inferencias respecto a


las propiedades de los miembros de conjuntos con base en los valores numéricos asigna-
dos a tales miembros, por medio de entrevistas, pruebas, escalas y observaciones
directas del comportamiento. Los métodos difieren respecto a si son directos o
indirectos, en el grado en que las inferencias son realizadas a partir de las observaciones
en bruto. Las inferencias realizadas por medio de métodos objetivos de observación, por
lo general, son muy largas, a pesar de que aparentan ser directas. La mayoría de dichos
métodos permiten un alto grado de acuerdo entre los observadores, ya que los
participantes registran marcas en papel y tales marcas están restringidas a dos o más
opciones de alternativas dadas por el observador. A partir de las marcas en el papel, el
observador infiere las características de los individuos y conjuntos de individuos que
hacen las marcas. En un tipo de métodos objetivos, el observador (o juez) hace las
marcas en papel, observa al objeto o los objetos de medición y elige entre las
alternativas dadas. En tal caso, también se realizan inferencias sobre las propiedades del
objeto o los objetos observados, a partir de las marcas en papel.

La principal diferencia reside en quién hace las marcas.

Debe reconocerse que todos los métodos de observación poseen cierta objetividad. No
existe una clara dicotomía, en otras palabras, entre los llamados métodos objetivos y
otros métodos de observación. Más bien existe una diferencia en el grado de
objetividad. Nuevamente, si se piensa en los grados de objetividad como grados de
acuerdo entre observadores, desaparece la ambigüedad y confusión que con frecuencia
se asocia con el problema.

Entonces existe el acuerdo de que lo que aquí se llama métodos objetivos de observa-
ción y medición no poseen el monopolio de objetividad ni de inferencia, sino que son
más objetivos y no menos inferenciales que cualquier otro método de observación y
medición. Los métodos que se expondrán en el presente capítulo por ningún motivo
abarcan todos los métodos posibles, pues el tema es grande y muy variado. Se
consideran únicamente como medidas de variables, vistas y evaluadas de la misma
forma que todas las demás medidas de variables.

4.3. Pruebas y escalas: definiciones

Una prueba es un procedimiento sistemático en el que se presenta a los individuos un


conjunto de estímulos construidos a los cuales responden. Las respuestas permiten que
quien realiza la prueba asigne a los examinados valores numéricos o conjuntos de
valores numéricos, a partir de los cuales se pueden realizar inferencias sobre si el
examinado posee aquello que se supone que la prueba está midiendo. Esta definición
dice un poco más que la que afirma que la prueba es un instrumento de medición.

Como ya se precisó antes una escala es un conjunto de símbolos o valores numéricos,


construida de tal manera que los símbolos o valores numéricos puedan ser asignados por
una regla a los individuos (o a sus comportamientos) a quienes se aplica la escala, y
donde la asignación indica si el individuo posee lo que se supone que mide la escala. Al
igual que una prueba, una escala es un instrumento de medición. De hecho, con
excepción del significado excesivo asociado con la prueba, se observa que prueba y
escala se definen de manera similar. Sin embargo, estrictamente hablando, la escala se
utiliza de dos maneras: para indicar un instrumento de medición y para indicar los
valores numéricos sistematizados del instrumento de medición. Se utiliza en ambos
sentidos sin demasiada preocupación por las distinciones. No obstante, se debe recordar
que: las pruebas son escalas, pero las escalas no necesariamente son pruebas. Es así
porque las escalas, por lo general, no tienen el significado de competencia ni de éxito o
fracaso que tienen las pruebas.

4.4. Tipos de medidas objetivas

La mayor parte de los cientos, quizás miles, de pruebas y escalas pueden dividirse en las
siguientes clases: pruebas de inteligencia y aptitud, pruebas de rendimiento, medidas de
personalidad, escalas de actitud y valores, y medidas objetivas diversas. A continuación
se discutirá cada uno de estos tipos de medida, desde un punto de vista de investigación.

4.4.1. Pruebas de inteligencia y aptitud

En la investigación psicológica y educativa con frecuencia se necesita de una medida de


inteligencia o aptitud, ya sea como variable independiente o como variable dependiente.
Para evaluar los efectos de programas educativos de uno u otro tipo sobre el
rendimiento académico, por ejemplo, generalmente es necesario controlar la
inteligencia, de tal manera que las diferencias encontradas entre los grupos de
tratamiento experimental no puedan atribuirse a diferencias en la inteligencia, más que a
los tratamientos. Existe un gran número de buenas pruebas de inteligencia que utilizan
los investigadores, quizás sea el caso de una de las llamadas pruebas de recopilación
(ómnibus). (Una prueba de recopilación es aquella que tiene diferentes tipos de
reactivos: verbales, numéricos, espaciales y otros, en un instrumento.) Dichas pruebas
por lo general son altamente verbales y se correlacionan de forma sustancial con el
rendimiento académico. Los manuales de Buros (1998) son guías útiles para dichas
pruebas. Anastasi (1988) ofrece una lista clasificada de pruebas representativas en su
libro, y divide cada prueba en clasificaciones separadas, tales como de inteligencia, de
personalidad, etcétera.

Una aptitud es la habilidad potencial para el logro. Las pruebas de aptitud se utilizan
principalmente para orientación y consejería. También se emplean en investigación,
particularmente como variables control. Una variable control es aquella cuyo efecto
sobre una variable dependiente quizá requiera anularse. Por ejemplo, al estudiar el
efecto de un programa correctivo de lectura sobre el rendimiento en lectura, puede ser
necesario atribuir la aptitud verbal a las posibles diferencias de grupo en habilidad
verbal. De forma similar, tal vez sea necesario controlar otras variables de influencia
potencial: habilidades numéricas y espaciales, por ejemplo. Las pruebas de aptitud
resultan útiles en tales casos.

4.4.2. Pruebas de rendimiento

Las pruebas de rendimiento miden la eficiencia, maestría y comprensión presentes, en


áreas generales y específicas del conocimiento. En su mayoría, constituyen mediciones
de la eficacia de la instrucción y el aprendizaje y son, por supuesto, enormemente
importantes en educación y en la investigación educativa. De hecho, como se mencionó
antes, con frecuencia el rendimiento es la variable dependiente en investigaciones que
incluyen métodos de instrucción.

Las pruebas de rendimiento a menudo se clasifican de varias formas. Para los propósitos
de este libro, se dividen, primero, en pruebas estandarizadas y en pruebas de cons-
trucción especial. Las pruebas estandarizadas son grupos de pruebas ya publicadas, que
se basan en un contenido educativo general común a un gran número de sistemas
educativos. Son los productos de un alto grado de competencia y habilidad profesional
en la redacción de pruebas y, como tales, por lo general son bastante confiables y casi
siempre válidas. Están dotadas con minuciosas tablas de normas (promedios) que
pueden utilizarse con propósitos comparativos. Las pruebas de construcción especial
son generalmente pruebas realizadas ex profeso por maestros para medir logros más
específicos y limitados. Por supuesto, también pueden ser elaboradas por investigadores
educativos para medir áreas limitadas de rendimiento.
En segundo lugar, las pruebas estandarizadas de rendimiento pueden, a su vez, clasifi-
carse en pruebas generales y especiales. Las pruebas generales son baterías de pruebas
que miden las áreas más importantes del rendimiento académico: uso del lenguaje,
vocabulario, lectura, aritmética y estudios sociales. Las pruebas de rendimiento especial,
como su nombre lo indica, son pruebas de materias individuales tales como historia,
ciencia e inglés.

Los investigadores rara vez eligen las pruebas de rendimiento debido a que los sistemas
escolares son quienes las seleccionan. Sin embargo, cuando a los investigadores se les
da la oportunidad de elegir, deben evaluar cuidadosamente el tipo de prueba de rendi-
miento que requiere su problema de investigación. Suponga que la variable de
investigación en un estudio es "el rendimiento en la comprensión de conceptos".
Muchas, quizás la mayoría de las pruebas utilizadas en las escuelas, no son adecuadas
para medir dicha variable. En tales casos, los investigadores pueden elegir una prueba
especialmente diseñada para medir la comprensión de conceptos, o ellos mismos diseñar
la prueba. La construcción de una prueba de rendimiento es un trabajo enorme, aunque
no es posible comentar aquí los detalles. Se refiere al estudiante a pruebas
especializadas. Por desgracia, existen pocos libros sobre la construcción de pruebas y
escalas para propósitos de investigación. La mayoría de los libros y otros textos sobre
medición se enfocan, casi siempre, en la construcción y el uso de instrumentos con
propósitos de aplicación. Sin embargo, los investigadores que necesiten construir
medidas de rendimiento de cualquier tipo encontrarán una excelente guía en los trabajos
de Adkins (1974); Cangelosi (1990); Gronlund (1988); Haladyna (1997); Hopkins
(1989), y Osterlind (1989). Los investigadores que necesiten construir escalas de actitud
encontrarán en el libro de Edwards (1957) un documento invaluable. Dawes (1972)
cubre algunos métodos que Edwards no cubrió.

4.4.3. Medidas de personalidad

La medición de rasgos de personalidad constituye el problema más complejo de la


medición psicológica. La razón es simple: la personalidad humana es extremadamente
compleja. Para propósitos de medición, la personalidad puede considerarse como la
organización particular de los rasgos del individuo. Un rasgo es una característica de un
individuo, revelada a través de comportamientos recurrentes en situaciones diferentes.
Se dice que un individuo es compulsivo o que posee el rasgo de compulsividad debido a
que se observa que esa persona es notoriamente pulcra tanto en su vestimenta como en
su lenguaje, siempre es puntual, desea que todo esté muy ordenado, y le disgustan y
evita las irregularidades.

El principal problema en la medición de la personalidad es la validez. Medir la validez


de los rasgos de personalidad requiere que se conozca qué son tales rasgos, la forma en
que interactúan y cambian, y cómo se relacionan entre sí, lo cual constituye un requisito
muy grande e incluso severo. La cuestión no es, como les gusta señalar a los críticos
ingenuos, que la personalidad no pueda medirse debido a que es demasiado esquiva,
demasiado compleja, demasiado existencia!, o que los esfuerzos de medición no hayan
tenido éxito, sino más bien que se ha logrado cierto grado de éxito en una tarea tan
difícil. No obstante, el problema de la validez es considerable.

Existen dos modelos generales para la construcción y validación de medidas de perso-


nalidad: el método a priori y el método teórico o de constructo. En el método a priori,
los reactivos se construyen para reflejar la dimensión de personalidad que se mide.
Puesto que el introvertido con frecuencia es una persona que se aisla, quizá se redacten
reactivos sobre la preferencia por estar solo. Por ejemplo, esto podría incluir reactivos
que indiquen la preferencia por evitar fiestas para medir la introversión. Como la
persona ansiosa estará nerviosa y desorganizada cuando se encuentre bajo estrés, se
podrían redactar reactivos que sugieran estas condiciones, para medir la ansiedad.
Entonces, en el método a priori el redactor de la escala reúne o redacta reactivos que
midan, de forma ostensible, rasgos de personalidad.

Este es esencialmente el modelo de los primeros redactores de pruebas de personalidad.


Aunque no existe nada inherentemente malo con el método —de hecho, tendrá que
utilizarse, especialmente en las primeras etapas de la construcción de pruebas y
escalas— los resultados llegan a ser confusos. Los reactivos no siempre miden lo que se
cree que están midiendo. En algunas ocasiones incluso se descubre que un reactivo que
se pensaba que medía, por ejemplo, responsabilidad social, en realidad mide una
tendencia a estar de acuerdo con afirmaciones socialmente deseables. Por tal razón, el
método a priori, utilizado de forma única, resulta insuficiente. Por lo anterior, las
pruebas de personalidad generalmente carecen de validez de contenido.
El método de validación que se utiliza a menudo con las escalas de personalidad a
priori es el método de grupo conocido. Para validar una escala de responsabilidad
social, es posible buscar un grupo de individuos con un alto nivel conocido de
responsabilidad social, y otro con un bajo nivel conocido de responsabilidad social. Si la
escala logra diferenciar con éxito a ambos grupos, entonces se considera que tiene
validez.

La medida de personalidad a priori y otras medidas continuarán empleándose en la


investigación del comportamiento. Sin embargo, debe evitarse su uso ingenuo y a
ciegas. Debe verificarse su validez de constructo y su validez relacionada con el criterio,
especialmente por medio del análisis factorial y otras formas empíricas. Las medidas de
personalidad, al igual que otras medidas, se han utilizado con frecuencia tan sólo porque
quienes las usan piensan que miden aquello que afirman que están midiendo.

El método teórico o de constructo de la construcción de medidas de personalidad


enfatiza las relaciones de la variable medida con otras variables, las relaciones surgidas
de la teoría que subyace a la investigación. Aunque la construcción de escalas debe ser
siempre, en cierto grado, a priori, mientras mayor sea el número de medidas de
personalidad sujetas a las pruebas de validez de constructo, mayor será la confianza en
su fidelidad. No es suficiente aceptar simplemente la validez de una escala de
personalidad ni aun aceptar su validez debido a que ha logrado diferenciar con éxito,
por ejemplo, a artistas de científicos, a maestros de no maestros, a personas normales de
personas neuróticas. A final de cuentas, debe establecerse su validez de constructo, es
decir, su uso exitoso en la predicción de una gran variedad de relaciones teóricas.

4.4.4. Escalas de actitud

Las actitudes, aunque se tratan de forma separada aquí y en la mayor parte de los
análisis de libros de texto, en realidad son parte integral de la personalidad. Los teóricos
modernos también consideran la inteligencia y la aptitud como partes de la
personalidad. Sin embargo, la medición de la personalidad trata principalmente de
rasgos. Un rasgo, como se mencionó en la sección anterior, es una característica
relativamente perdurable del individuo, a responder de cierta manera en todas las
situaciones. Si alguien es dominante, exhibirá comportamiento dominante en la mayoría
de las situaciones. Si alguien es ansioso, presentará una conducta ansiosa en la mayor
parte de sus actividades. Por otro lado, una actitud es una predisposición organizada a
pensar, sentir, percibir y comportarse hacia un referente u objeto cognitivo. Se trata de
una estructura perdurable de creencias que predispone al individuo a comportarse de
manera selectiva hacia los referentes de actitud.

Un referente es una categoría, una clase o un conjunto de fenómenos: objetos físicos,


eventos, conductas e inclusive constructos (véase Brown, 1958). La gente tiene
actitudes hacia muchas cosas diferentes: grupos étnicos, instituciones, religión, aspectos
y prácticas educativas, la Suprema Corte, derechos civiles, propiedad privada, etcétera.
Dicho en otras palabras, se tienen actitudes hacia algo "de afuera". Un rasgo tiene una
referencia subjetiva; una actitud tiene una referencia objetiva. Alguien que tiene una
actitud hostil hacia los extranjeros quizá sea hostil únicamente con los extranjeros; pero
alguien que tiene un rasgo de hostilidad es hostil hacia todas las personas (al menos
potencialmente).

Existen tres tipos principales de escalas de actitud: escalas de puntuación sumada,


escalas de intervalos aparentemente iguales y escalas acumulativas (o Guttman). Una
escala de puntuación sumada (un tipo de las cuales se denomina escala tipo Likert) es
un conjunto de reactivos de actitud, todos los cuales son considerados con un "valor de
actitud" aproximadamente igual, y donde cada uno de los participantes responde con
grados de acuerdo o desacuerdo (intensidad). Las puntuaciones de los reactivos de dicha
escala se suman, o se suman y promedian, para producir una puntuación de actitud del
individuo. Como en todas las escalas de actitud, el propósito de la escala de puntuación
sumada es ubicar a un individuo en algún punto de un continuo del nivel de acuerdo de
la actitud en cuestión.

Es importante hacer notar dos o tres características de las escalas de puntuación sumada,
pues muchas escalas comparten estas características. Primero, U, el universo de
reactivos, se considera un conjunto de reactivos con igual "valor de actitud", como se
indicó en la definición anterior. Ello significa que no existe una escala de reactivos
como tal; un reactivo es igual a cualquier otro reactivo respecto a su valor de actitud. Se
"clasifica" a los individuos que responden los reactivos. La clasificación surge de las
sumas (o promedios) de las respuestas de los individuos. Cualquier subconjunto de U es
teóricamente igual que cualquier otro subconjunto de U: se ordenaría a un conjunto de
individuos por rango de la misma manera si se utiliza U2o U1.

En segundo lugar, las escalas de puntuación sumada permiten la expresión de la inten-


sidad de la actitud. Los participantes pueden estar simplemente de acuerdo o estar
fuertemente de acuerdo. Esto conlleva ventajas, así como desventajas. La principal
ventaja es que resulta una mayor varianza. Cuando existen cinco o siete categorías
posibles de respuesta, resulta obvio que la varianza de la respuesta debe ser mayor que
con sólo dos o tres categorías (por ejemplo, de acuerdo, en desacuerdo y sin opinión).
Por desgracia, la varianza de las escalas de puntuación sumada con frecuencia parece
contener varianza debida a la fijeza de respuesta. Los individuos tienen tendencias
diferentes a usar ciertos tipos de respuestas: respuestas extremas, respuestas neutrales,
respuestas en acuerdo y respuestas en desacuerdo. Dicha varianza de respuesta confunde
la varianza de la actitud (y el rasgo de personalidad). Las diferencias individuales
producidas por las escalas de actitud de puntuaciones sumadas (y medidas de rasgos
calificadas de manera similar) han mostrado deberse, en parte, a la fijeza de respuesta y
a otras extrañas fuentes de varianza similares. La literatura sobre la fijeza de respuesta
es muy amplia y no puede citarse en detalle. La exposición de Nunnally (1978) está bien
equilibrada. Mientras que la fijeza de respuesta puede considerarse como una ligera
amenaza para la validez de la medición, su importancia ha sido sobrestimada y la
evidencia disponible no justifica las fuertes afirmaciones negativas hechas por los
partidarios de la fijeza de respuesta. En otras palabras, mientras se debe estar consciente
de las posibilidades y amenazas, no hay que paralizarse por el incremento del riesgo
(véase Rorer, 1965, para un análisis más profundo).

A continuación se presentan dos reactivos de puntuación sumada de una escala cons-


truida por Burt (1980, p. 222) para el estudio de actitudes hacia la violación. Tales
reactivos se desarrollaron para medir el estereotipo del rol sexual. Se utilizó una escala
de 7 puntos que va desde un fuerte acuerdo (7) hasta un fuerte desacuerdo (1). Los
valores entre paréntesis (y los valores intermedios) se asignan a las respuestas indicadas.

Hay algo malo con la mujer que no desea casarse y formar una familia. Una mujer debe
ser virgen cuando se casa.
Las escalas de intervalos aparentemente iguales de Thurstone se construyen a partir de
principios diferentes. Mientras que el producto final, un conjunto de reactivos de
actitud, puede utilizarse para el mismo propósito de asignación de puntuaciones
individuales de actitud, las escalas de intervalos aparentemente iguales también logran
el importante propósito de escalar los reactivos de actitud. A cada reactivo se le asigna
un valor de escala que indica la fortaleza de actitud de una respuesta de acuerdo para el
reactivo. El universo de reactivos se considera un conjunto ordenado; es decir, los
reactivos difieren en su valor de escala. El procedimiento de clasificación encuentra
estos valores de escala. Además, los reactivos de la escala final a utilizarse son tan
selectos que los intervalos entre ellos son iguales, lo cual representa una importante y
deseable característica psicométrica.

Los siguientes reactivos de intervalos aparentemente iguales, con los valores de escala
de los reactivos, provienen de la escala de Actitud hacia la Iglesia, de Thurstone y
Chave (1929, pp. 61-63,78):

Considero que la Iglesia es la mayor institución en Estados Unidos hoy. (Valor de


escala: 0.2)

Creo en la religión, pero en raras ocasiones voy a la iglesia. (Valor de escala: 5.4)
Pienso que la Iglesia es un obstáculo para la religión, ya que aun depende de lu
sobrenatural, la superstición y el mito. (Valor de escala: 9.6)

En la escala de Thurstone y Chave, a menor valor de escala del reactivo, más positiva
sería la actitud hacia la Iglesia. El primer y tercer reactivos son respectivamente el más
bajo y el más alto en la escala. El segundo reactivo, por supuesto, tiene un valor
intermedio. La escala total contenía 45 reactivos con valores de escala a través de todo
el continuo. Sin embargo, por lo general, las escalas de intervalos aparentemente iguales
contienen bastante menos reactivos.

El tercer tipo de escala, la escala acumulativa o Guttman, consta de un conjunto relati-


vamente pequeño de reactivos homogéneos que son unidimensionales (o que supuesta-
mente lo son). Una escala unidimensional mide una variable y sólo una. La escala
obtiene su nombre de la relación acumulativa entre los reactivos y las puntuaciones
totales de los individuos. Por ejemplo, a cuatro niños se les plantean tres preguntas
aritméticas: (a) 28/7 =?, (b) 8x4 = ? y (c) 12 + 9-? El niño 1, quien resuelve (a)
correctamente, tiene muchas posibilidades de resolver (b) y (c) también correctamente.
El niño 2, quien resuelve (a) de forma incorrecta pero (b) de forma correcta, también
tiene muchas posibilidades de resolver (c) correctamente. El niño 3, quien resuelve
correctamente sólo (c), tiene muy pocas probabilidades de resolver (a) y (b) de forma
correcta. La situación se sintetiza de la siguiente manera (la tabla incluye la puntuación
del cuarto niño, quien no resuelve ninguna pregunta de forma correcta):

(a) (b) (c) Puntuación total

Niño 1 1 1 1 3

Niño 2 0 1 1 2

Niño 3 0 0 1 1

Niño 4 0 0 0 0

(1 « Correcto; 0 = Incorrecto)

Note la relación entre el patrón de respuestas a los reactivos y las puntuaciones totales.
Si se conoce la puntuación total de un niño, se puede predecir su patrón, si la escala es
acumulativa, solamente si el conocimiento de las respuestas correctas de los reactivos
más difíciles predice las respuestas de los reactivos más fáciles. Observe también que se
escalan ambos reactivos y las personas.

De manera similar, es posible plantear a la gente varias preguntas acerca de un objeto


actitudinal. Si bajo análisis los patrones de respuesta se ordenan entre sí de la forma
indicada arriba (o por lo menos de manera muy similar), entonces se dice que las
preguntas o reactivos son unidimensionales. De esta manera, las personas pueden ser
ordenadas de acuerdo con sus respuestas en la escala (véase Edwards, 1957, capítulo 7,
para una mayor discusión sobre las escalas acumulativas unidimensionales).
Resulta obvio que estos tres métodos de construcción de escalas de actitud son muy
diferentes. Considere que métodos similares o iguales pueden utilizarse con otros tipos
de escalas de personalidad u otras escalas. La escala de puntuación sumada se concentra
en los participantes y sus ubicaciones dentro de la escala. La escala de intervalos
aparentemente iguales se concentra en los reactivos y sus ubicaciones dentro de la
escala. De manera interesante, ambos tipos de escalas producen casi los mismos
resultados en lo que se refiere a la confiabilidad y a la ubicación de los individuos en
órdenes de rango actitudinales. Las escalas acumulativas se concentran en la posibilidad
de escalar de los conjuntos de reactivos y en la posición de los individuos en la escala.

De los tres tipos de escalas, la de puntuaciones sumadas parece ser el más útil para la
investigación del comportamiento, pues es más fácil de desarrollar y, como se indicó
antes, produce casi los mismos resultados que la escala de intervalos aparentemente
iguales, de construcción más laboriosa. Utilizadas con cuidado y con el conocimiento de
sus debilidades, las escalas de puntuaciones sumadas se adaptan a muchas de las
necesidades de los investigadores del comportamiento. Las escalas acumulativas
parecen ser de menor utilidad y menos aplicables de manera general. Si se utiliza un
objeto cognitivo de corte claro, una escala acumulativa breve y bien construida genera
medidas confiables de un número de variables psicológicas: tolerancia, conformismo,
identificación grupal, aceptación de la autoridad, permisividad, etcétera. También debe
señalarse que el método puede mejorarse y alterarse de varias formas. Dawe (1972) y
Edwards (1957) describen la forma de construir y evaluar escalas acumulativas, así
como escalas de puntuación sumada y escalas de intervalos aparentemente iguales.

4.4.5. Escalas de valores

Los valores son preferencias de tipo cultural hacia objetos, ideas, gente, instituciones y
comportamientos (Kluckhohn, 1951, pp. 388-433). Mientras que las actitudes son
organizaciones de creencias sobre cosas "de afuera", es decir, predisposiciones a
comportarse hacia los objetos o referentes de actitudes, los valores expresan
preferencias por formas de conducta y estados de existencia (Rokeach, 196S). Términos
como igualdad, religión, libre empresa, derechos chiles y obediencia expresan valores.
Dicho de manera sencilla, los valores expresan lo "bueno", lo "malo", los "debería" y
los "debiera" del comportamiento humano. Los valores colocan las ideas, las cosas y los
comportamientos en un continuo de aprobación-desaprobación. Implican opciones entre
cursos de acción y de pensamiento.

Con el propósito de brindar al lector una idea de los valores, se presentan tres reactivos.
Se puede pedir a los individuos que expresen su aprobación o desaprobación sobre el
primero y segundo reactivos, quizás en forma de puntuación sumada, y que elijan una
de las tres alternativas del tercer reactivo.

Por el propio bien y por el bien de la sociedad, una persona debe ser controlada por la
tradición y la autoridad.

Ahora más que nunca debemos fortalecer la familia, el estabilizador natural de la


sociedad. ¿Cuál de los siguientes aspectos es el más importante para desarrollar una
vida plena: la educación, el logro o la amistad?

Por desgracia, los valores han recibido escasa atención científica, aun cuando éstos y las
actitudes conforman gran parte de la producción verbal de las personas y son, proba-
blemente, influyentes determinantes del comportamiento. Por lo tanto, la medición de
valores padece desatención. Sin embargo, los valores sociales y educativos tal vez se
conviertan en el centro de mucho más trabajo teórico y empírico en el futuro, ya que los
científicos sociales se han vuelto cada vez más conscientes de que los valores
constituyen influencias importantes en el comportamiento individual y de grupo (véase
Dulces, 1955; Haddock y Zanna, 1998; Hendrick, Hendrick y Dicke, 1998: Hogan,
1973; Lubinski, Schmidt y Benbow, 1996; Pitrel y Mendelsohn, 1966; Robinson, 1996).
Una fuente de escalas de valores es Levitin (1969). Un ensayo muy sugestivo y valioso
que apareció hace 45 años es el trabajo realizado por Kluckhohn (1951). Otro ensayo
sobre la medición de valores que aún es importante es el de Thurstone (1959).

4.5. Tipos de escalas y reactivos objetivos

Dos tipos generales de reactivos que se usan con frecuencia son aquellos en que las
respuestas son independientes y aquellos en que no son independientes. Independencia
aquí significa que la respuesta de una persona a un reactivo no está relacionada con su
respuesta a otro reactivo. Todos los reactivos de verdadero-falso, sí-no, de acuerdo-en
desacuerdo y de tipo Likert pertenecen al tipo independiente. El sujeto responde cada
reactivo libremente, con un rango de dos o más respuestas posibles, de las cuales puede
elegir sólo una. Por otro lado, los reactivos no independientes obligan al sujeto a elegir
un reactivo o alternativa que excluye la elección de otros reactivos o alternativas. Tales
formas de escalas y reactivos se denominan de elección forzada. El sujeto se enfrenta
con dos o más reactivos o subreactivos y se le pide que elija uno o más de ellos de
acuerdo con algún criterio, e incluso criterios.

Dos ejemplos simples mostrarán la diferencia entre reactivos independientes y no


independientes. Primero, es posible dar al sujeto un conjunto de instrucciones que
permitan independencia de respuesta; en segundo lugar, se le puede indicar un conjunto
de instrucciones contrastante, con opciones más limitadas (no independientes):

Ejemplos

Indique junto a cada una de las siguientes afirmaciones qué tanto las aprueba, utilizando
una escala del 1 al 5, donde el 1 significa "No lo apruebo en lo absoluto" y el 5 significa
"Lo apruebo muchísimo".

A continuación se dan 40 pares de afirmaciones. De cada par escoja la que apruebe más.
Márquela con una palomita (/).

Las ventajas de los reactivos independientes son la economía y aplicabilidad de la


mayoría de los análisis estadísticos a sus respuestas. Además, cuando se responde cada
reactivo se obtiene un máximo de información, donde cada reactivo contribuye a la va-
rianza. También se requiere de menos tiempo para aplicar las escalas independientes,
aunque quizá sufran del sesgo provocado por la fijeza de respuesta. Los individuos
pueden dar respuestas similares o iguales para cada reactivo: pueden apoyarlos todos
con entusiasmo o con indiferencia dependiendo de su predilección particular de
respuesta. La varianza importante de una variable llega, entonces, a confundirse por la
fijeza de respuesta.

El tipo de escala de elección forzada evita, por lo menos en cierto grado, el sesgo de
respuesta. Sin embargo, al mismo tiempo, sufre por la falta de independencia, y por su
costo excesivo y alta complejidad. No obstante, existen algunos investigadores, como
Comrey (1970), que han construido una escala del sesgo de respuesta dentro de la
prueba de personalidad. Las escalas de elección forzada en ocasiones también agotan la
tolerancia y la paciencia del sujeto, lo cual se traduce en menor cooperación. Aun así,
muchos expertos consideran que los instrumentos de elección forzada son prometedores
para la medición educativa y psicológica. Mientras que otros expertos se muestran
escépticos.

Entonces, las escalas y los reactivos se dividen en tres tipos: de acuerdo-en desacuerdo
(o aprobación-desaprobación o verdadero-falso, y similares), de orden de rango y de
elección forzada. Cada uno de ellos se analiza brevemente. En la literatura pueden
encontrarse explicaciones más detalladas (véase Edwards, 1957; Guilford, 1954).

4.5.1. Reactivos de acuerdo-desacuerdo

Existen tres formas generales de reactivos de acuerdo y desacuerdo:

1) Aquellos que permiten una de dos respuestas posibles.

2) Aquellos que permiten una de tres o más respuestas posibles.

3) Aquellos que permiten más de una elección de tres o más respuestas posibles.

Las dos primeras formas proporcionan alternativas como "de acuerdo-desacuerdo";


"sí-no"; "lo apruebo-sin opinión-lo desapruebo"; "lo apruebo mucho-lo apruebo-lo
desapruebo mucho"; "1,2, 3, 4, 5". Los participantes eligen una de las respuestas
proporcionadas para reportar sus reacciones a los reactivos. Al hacerlo, dan reportes
sobre sí mismos o indican sus reacciones a los reactivos. La mayor parte de las escalas
de personalidad y de actitud utilizan dichos reactivos. Si una persona está construyendo
un instrumento que utilice este método, es muy importante la manera en que se redacte
la escala. Por ejemplo, suponga que se elaboró la siguiente escala de Likert de 5 puntos:

1 = En desacuerdo

2 = En ligero desacuerdo

3 = Neutral

4 = En ligero acuerdo
5 = De acuerdo

El problema aquí se centra en la manera en que el lector interpreta el significado de cada


punto de la escala. Un sujeto puede elegir un "2" y otro puede elegir un "4". Ambos
pudieron haber hecho la misma interpretación. Si alguien está en ligero acuerdo,
entonces esa persona quizá también esté en ligero desacuerdo. De ahí surge la
confusión.

El tercer tipo de escala de este tipo presenta un número de reactivos: se dan instruccio-
nes a los participantes para indicar aquellos reactivos que los describen, reactivos con
los que están de acuerdo o simplemente reactivos que ellos eligen. El listado de
adjetivos es un buen ejemplo. Se le presenta al sujeto una lista de adjetivos, donde
algunos indican rasgos deseables como analítico, generoso y considerado; y donde otros
indican rasgos indeseables como cruel, egoísta y vulgar. Se les pide que marquen
aquellos adjetivos que los caracterizan. (Por supuesto, este tipo de instrumento también
sirve para caracterizar a otras personas.) Quizás una forma mejor sería una lista con
todos los adjetivos positivos de escalas de valores conocidas, donde se les pide a los
participantes que seleccionen un número específico de sus propias características
personales. La escala de intervalos aparentemente iguales y su sistema de respuesta
donde se marcan los reactivos de actitud con los que se está de acuerdo es, por supuesto,
la misma idea. La idea es útil, especialmente con el desarrollo de escalas factoriales, de
métodos de escalación y el creciente uso de los métodos de elección.

La calificación de los reactivos de acuerdo-en desacuerdo llega a ser problemática


debido a que no todos los reactivos, o los componentes, reciben respuestas. (Con una
escala de puntuación sumada o una escala de puntuación ordinaria, los participantes
generalmente responden a todos los reactivos.) Sin embargo, en general, se pueden
utilizar sistemas simples de asignación de valores numéricos a las diversas opciones.
Por ejemplo, de acuerdo-en desacuerdo puede ser 1 y 0; sí-no puede ser 1, 0, -1 o,
evitando los signos negativos: 2, 1, 0. A las respuestas de los reactivos de puntuación
sumada descritos anteriormente simplemente se les asigna del 1 al 5 o del 1 al 7.

El principal aspecto que los investigadores deben tener en mente es que el sistema de
puntuación debe producir datos interpretables, congruentes con el sistema de
puntuación. Si se utilizan puntuaciones de 1, 0, -1, los datos deben ser capaces de
proveer una interpretación escalada; es decir, 1 es "alto" o "mucho", -1 es "bajo" o
"poco" y 0 está en medio. Un sistema de 1, 0 puede significar alto y bajo o simplemente
presencia o ausencia de un atributo. Tal sistema puede ser útil y poderoso, como se vio
anteriormente cuando se estudiaron variables como sexo, raza, clase social, etcétera. En
síntesis, los datos producidos por sistemas de puntuación deben tener significados
claramente interpretables en cierto sentido cuantitativo. Se refiere al lector al análisis de
Ghiselli (1964, pp. 44-49) sobre el significado de las puntuaciones. No obstante,
algunos expertos han criticado el uso de 0-1 o de los sistemas binarios de puntuación.
Durante el desarrollo de sus escalas de personalidad, Comrey descubrió que los
reactivos que utilizan un esquema de respuesta binaria están sujetos a problemas y
distorsiones que no necesariamente se obtendrían si la escala tuviera 3 puntos o más.
Los resultados del estudio de Comrey sobre las escalas se resumen en Comrey (1978) y
Comrey y Lee (1992).

Se han desarrollado varios sistemas para ponderar reactivos; aunque la evidencia indica
que las puntuaciones ponderadas y no ponderadas dan en gran parte los mismos resul-
tados. Los estudiantes parecen encontrar esto difícil de creer. (Note que se habla acerca
de la ponderación de las respuestas a los reactivos.) Aunque el asunto no está
completamente establecido, existe fuerte evidencia de que en pruebas y medidas con el
suficiente número de reactivos —como 20 o más— la ponderación diferencial de
reactivos no genera mucha diferencia en los resultados finales. Tampoco la ponderación
diferencial de respuestas produce mucha diferencia (véase Guilford, 1954; Nunnally,
1978). Tampoco se produce ninguna diferencia, en términos de varianza, si se
transforma las ponderaciones de las puntuaciones de manera lineal. Se puede hacer que
los participantes utilicen un sistema, +1,0, -1 y, por supuesto, utilizar las puntuaciones
en un análisis. Sin embargo, se puede añadir una constante de 1 a cada puntuación,
produciendo 2,1,0. Las puntuaciones transformadas son más fáciles de trabajar, ya que
no tienen signos negativos.

4.5.2. Reactivos y escalas de orden de rango

El segundo grupo de tipos de escalas y reactivos es ordinal o de orden de rangos, que es


una forma simple y muy útil de escala o reactivo. Una escala completa puede ordenarse
por rangos; es decir, se le pide a los participantes que ordenen todos los reactivos de
acuerdo a algún criterio específico. Por ejemplo, si se desea comparar los valores
educativos de administradores, maestros y padres, se les presenta un número de
reactivos que presuntamente midan valores educativos a los miembros de cada grupo
con las instrucciones de que los ordenen de acuerdo con sus preferencias.

En su estudio sobre actitudes hacia la liberación femenina, Taleporos (1977) desarrolló


una escala de orden de rango de problemas sociales. Se les pidió a los participantes que
ordenaran los siguientes problemas sociales: adicción a las drogas, contaminación
ambiental, discriminación racial, discriminación sexual, crimen violento y asistencia
social. Taleporos esperaba que los dos grupos que estaba estudiando ordenaran los
temas sociales de manera similar, con excepción del tema de la discriminación sexual.
Se sostuvo su hipótesis. Su estudio representó un uso productivo de la escalación de
orden de rangos.

Las escalas de orden de rangos tienen tres ventajas analíticamente convenientes:

1) Las escalas de los individuos pueden intcrrelacionar y analizar fácilmente. Los


órdenes de rangos compuestos de los grupos de individuos también se
correlacionan fácilmente.

2) Los valores de escala de un conjunto de estímulos pueden calcularse utilizando uno


de los métodos de orden de rango de escalación (véase Guilford, 1954).

3) Las escalas escapan parcialmente de la fijeza de respuesta y de la tendencia a


mostrarse de acuerdo con los reactivos socialmente deseables.

4.5.3. Reactivos y escalas de elección forzada

La esencia de un método de elección forzada es que el sujeto debe elegir entre


alternativas que en apariencia se perciben casi igualmente favorables (o desfavorables).
Estrictamente hablando, el método no es nuevo. Las escalas de comparaciones de pares
y de orden de rangos son métodos de elección forzada. Lo que es diferente acerca del
método de elección forzada, como tal, es que se determinan los valores de
discriminación y preferencia de los reactivos, y se aparean aquellos reactivos que son
aproximadamente iguales en ambos. Así se controlan en cierta medida, la fijeza de
respuesta y la "deseabilidad del reactivo". (La deseabilidad del reactivo significa que un
reactivo puede ser elegido sobre otro simplemente porque expresa una cuestión deseable
reconocida comúnmente. Si a un hombre se le pregunta si es descuidado o eficiente,
tiende a decir que es eficiente, aunque sea descuidado.)

El método de las comparaciones apareadas (o comparaciones de pares) posee un largo y


respetable pasado psicométrico. Sin embargo, se ha utilizado principalmente con el pro-
pósito de determinar valores de escala (Guilford, 1954). Aquí las comparaciones de
pares se consideran como un método de medición. La esencia del método es que
conjuntos de pares de estímulos, o reactivos de diferentes valores en un solo continuo o
en dos continuos o factores diferentes, se presentan al sujeto con las instrucciones de
que elija un miembro de cada par con base en algún criterio establecido. El criterio
podría ser: el que mejor caracterice al sujeto o el que el sujeto prefiera. Los reactivos de
los pares pueden ser palabras solas, enunciados e inclusive párrafos. Por ejemplo,
Edwards, en su inventario de preferencia personal (Personal Preference Schedule),
apareó de manera efectiva afirmaciones que expresan distintas necesidades. Un reactivo
que mide la necesidad de autonomía, por ejemplo, está apareado con otro reactivo que
mide la necesidad de cambio. Se le pide al sujeto que elija uno de esos reactivos. Se
supone que la persona elegirá el reactivo que se ajuste a sus necesidades. Una
característica única de la escala es que los valores del deseo de aceptación social de los
miembros apareados se determinaron de forma empírica y los pares se relacionaron de
acuerdo con esto. El instrumento produce perfiles de puntuaciones de necesidad para
cada individuo.

De alguna manera los dos tipos de técnicas de comparaciones de pares, 1) la


determinación de valores de escala de estímulos y 2) la medición directa de variables,
constituyen los métodos psicométricos más satisfactorios. Son simples y económicos
debido a que solamente existen dos alternativas. Además, se puede obtener una gran
cantidad de información con una cantidad limitada de material. Por ejemplo, si un
investigador tiene únicamente 10 reactivos, cinco de la variable ,4 y cinco de la variable
B, se puede construir una escala de 5 x 5 o 25 reactivos, ya que cada reactivo A puede
aparearse sistemáticamente con cada reactivo B. (La puntuación es simple: asignar un
"1" a Ao a B en cada reactivo, dependiendo de la alternativa que el sujeto elija.) Más
importante aún, los reactivos de comparación de pares obligan a los participantes a
elegir. Aunque esto puede molestar a algunos participantes, especialmente si consideran
que ningún reactivo representa lo que elegirían (es decir, elegir entre cobarde y débil
para categorizarse a sí mismo), es en realidad una actividad humana acostumbrada.
Debemos elegir cada día de nuestras vidas. Inclusive se puede argumentar que los
reactivos de acuerdo-en desacuerdo son artificiales y que los reactivos de elección son
"naturales". En un estudio sobre el concepto del interés social de Adler (valorar cosas
diferentes al yo), Crandall (1980) utilizó comparaciones de pares para desarrollar su
escala de interés social (Social Interest Scale). Los jueces calificaron 90 rasgos respecto
a su relevancia para el interés social. Se utilizaron 48 pares, donde un miembro de cada
par tenía relevancia para el interés social y el otro miembro no la tenía. Entonces,
después de la realización de un análisis de reactivos para determinar cuáles eran los
reactivos más discriminantes, se desarrolló una escala de 15 reactivos. Por desgracia,
Crandall no reporta la forma de la escala. Sin embargo, la idea es buena: utilizó la
fortaleza de las comparaciones de pares para encontrar buenos reactivos para una escala
final.

Los reactivos de elección forzada con más de dos partes pueden asumir un número de
formas con tres, cuatro o cinco partes, las cuales son homogéneas o heterogéneas
respecto a lo favorable y a lo no favorable. Se analiza e ilustra sólo uno de estos tipos
para demostrar los principios que subyacen a dichos reactivos. Por medio de un análisis
factorial, un procedimiento conocido como la técnica de los incidentes añicos o algún
otro método, se reúnen y seleccionan los reactivos. Por lo común se descubre que
algunos reactivos discriminan entre grupos de criterio y que otros no lo hacen. Ambos
tipos de reactivos —llámense discriminantes e irrelevantes— se incluyen en cada
conjunto de reactivos. Además, se determinan los valores de preferencia para cada
reactivo.

Un reactivo típico de elección forzada es una tetrada. Una forma útil de tetrada consiste
en dos pares de reactivos, un par con un alto valor de preferencia y el otro par con un
bajo valor de preferencia, donde un miembro de cada par es discriminativo (válido) y el
otro miembro del pares irrelevante (no válido). Un esquema de dicho reactivo de
elección forzada es:
a) Alta preferencia-discriminante

b) Alta preferencia-irrelevante

c) Baja preferencia-discriminante

d) Baja preferencia-irrelevante

Se dirige al sujeto para que elija el reactivo de la tétrada que más prefiera, o que
constituya la mejor descripción de sí mismo (o de alguien más), etcétera. También se
dirige a esta persona para que seleccione el reactivo menos preferido o menos
descriptivo de sí mismo.

La idea básica detrás de este reactivo más bien complejo es, como se indicó antes, que
se controla la fijeza de respuesta y el deseo de aceptación social. El sujeto no puede
decir, al menos teóricamente, cuáles son los reactivos discriminantes y cuáles los
irrelevantes; tampoco se pueden elegir los reactivos con base en los valores de
preferencia. Así, se contrarresta la tendencia a evaluarse a sí mismo (o a otros)
demasiado alto o demasiado bajo y, por lo tanto, la validez presuntamente se incrementa
(Guilford, 1954).

Un reactivo de elección forzada de un tipo hasta cierto punto diferente, construido por el
primer autor de este libro con fines ilustrativos del uso de reactivos de investigación
real, es:

A. Consciente

B. Agradable

C. Respondiente

D. Sensible

Uno de los reactivos (sensible) es un reactivo A y otro (consciente) es un reactivo B. (A


y B se refieren a factores adjetivados.) Los otros reactivos son presuntamente
irrelevantes. Se puede pedir a los participantes que elijan uno o dos reactivos que son
muy importantes que un maestro posea.
Los métodos de elección forzada parecen ser muy promisorios. Aun así, existen difi-
cultades técnicas y psicológicas, entre las cuales la más importante parece ser la falta de
independencia de los reactivos, la quizás demasiado compleja naturaleza de algunos
reactivos y la resistencia de los participantes ante las opciones difíciles. Se refiere al
lector a los estudios de Guilford (1954) o de Bock y Jones (1968) sobre el tema: éstos
son de autoridad, objetivas y breves; y también a las revisiones de Scott (1968) y Zavala
(1965). (Para la revisión de referencias más recientes sobre reactivos y escalas de
elección forzada véase Borg, 1988; Bownas y Bernardin, 1991; Closs, 1978; Deaton,
Glasnapp y Poggio, 1980; Hymany Sharp, 1983;MayyForsyth, 1980; Presser y
Schuman, 1980; Ray, 1990; y Stanley, Wandzilak, Ansorge y Potter, 1987.)

4.6. Medidas ipsativas y normativas

Una distinción que se ha vuelto importante y que generalmente es mal entendida, en


investigación y medición, es aquella que existe entre las medidas normativas e ipsativas.
Las medidas normativas son el tipo común de medidas obtenidas con pruebas y escalas;
pueden variar de manera independiente, es decir, se ven relativamente poco afectadas
por otras medidas y, para su interpretación, se refieren a la media de las medidas de un
grupo, siendo que los conjuntos de medidas de individuos poseen medias y desviaciones
estándar diferentes. Las medidas ipsativas, por otro lado, se ven afectadas de manera
sistemática por otras medidas y, para su interpretación, se refieren a la misma media,
siendo que cada conjunto de medidas del individuo posee la misma media y desviación
estándar. Para terminar con esta más bien opaca palabrería, sólo piense en un conjunto
de rangos, del 1 al 5, donde el 1 indica "el primero", "el más alto" o "el más"; y el 5
indica "el último", "el más bajo" y "el menos", con el 2, 3 y 4 señalando posiciones
intermedias. Sin importar quién utilice estos rangos, la suma y la media de los rangos es
siempre la misma, 15 y 3, y la desviación estándar es siempre la misma, 1.414. Los
rangos, entonces, son medidasipsativas.

Si los valores 1 2 3 4 y 5 estuvieran disponibles para calificar, por ejemplo, cinco


objetos, y fueran cuatro personas las que calificaran los cinco objetos, se obtendría algo
como lo siguiente:
Personas

1 2 2 3

2 2 1 2

Objetos 3 4 5 3

4 3 5 3

5 5 4 2

Sumas: 15 16 17 13

Medias: 3.0 3.2 3.4 2.6

Note que las sumas y las medias (y las desviaciones estándar también) son diferentes.
Éstas son medidas normativas. Teóricamente con las medidas normativas no existen res-
tricciones en el valor que el individuo/) le puede asignar al objeto C—con excepción,
por supuesto, de los números del 1 al 5—.

No obstante, con las medidas ipsativas, el procedimiento —en este caso de orden de
rangos— ha creado restricciones sistemáticas. Cada individuo debe utilizar 1, 2, 3, 4 y 5
tan sólo una vez, y todos deben ser utilizados, lo cual indica que cuando cinco objetos
están siendo ordenados por rango y se asigna uno, por ejemplo, rango 1, sólo quedan
cuatro rangos por asignar. Después de que se asigna el 2 al siguiente objeto, sólo quedan
tres, etcétera, hasta el último objeto, al que debe asignársele el 5. Un razonamiento
similar se aplica a otro tipo de procedimientos y medidas ipsativos: comparaciones de
pares, tetradas y pernadas de elección forzada o metodología Q.

La limitación importante en los procedimientos ipsativos es que, estrictamente ha-


blando, no se pueden aplicar los estadísticos usuales, puesto que éstos dependen de los
supuestos que los procedimientos ipsativos violan sistemáticamente. Además, el
procedimiento ipsativo genera correlaciones negativas espurias entre reactivos. En un
instrumento de comparaciones de pares, por ejemplo, la selección de un miembro de un
par automáticamente excluye la selección del otro miembro. Ello significa una falta de
independencia y una correlación negativa entre reactivos, en función del procedimiento
instrumental. Sin embargo, la mayor parte de las pruebas estadísticas se basan en el
supuesto de independencia de los elementos que entran en las fórmulas estadísticas.
Además, el análisis de correlaciones, tal como el análisis factorial, puede distorsionarse
seriamente por las correlaciones negativas. Por desgracia, estas limitaciones no se han
comprendido o se han subestimado por los investigadores que, por ejemplo, han tratado
los datos ipsativos de forma normativa (Hicks, 1970). Se invita al lector a demostrar el
comportamiento de las escalas ipsativas estableciendo una pequeña matriz de números
ipsativos, generados de forma hipotética por medio de las respuestas en una escala de
comparaciones de pares. Utilice números 1 y 0 y calcule las r entre reactivos para los
individuos.

4.7. Elección y construcción de medidas objetivas

Una de las tareas más difíciles para el investigador del comportamiento, cuando se
enfrenta con la necesidad de medir variables, es encontrar el camino a través de un gran
número de medidas ya existentes. Si existe una buena medida para una variable en
particular, parece

tener poco sentido construir una medida nueva. De cualquier manera, la pregunta es:
¿existe una buena medida? La respuesta a esta pregunta quizá requiera de una gran
búsqueda y estudio. El investigador debe saber, primero, qué tipo de variable se va a
medir. Se ha tratado de ofrecer una guía dentro de la estructura recién proporcionada. Se
debe saber claramente si la variable es una aptitud, rendimiento, personalidad, actitud o
algún otro tipo de variable. E! segundo paso es consultar uno o dos libros de texto que
analicen medidas y pruebas psicológicas. Después, se deben consultar las bien
conocidas guías de Buros. Aunque Buros ofrece una excelente guía sobre pruebas
publicadas, muchas buenas medidas no se han publicado comercialmente. Por lo tanto,
debe buscarse en la literatura de aparición periódica. A pesar de que muchas escalas no
están disponibles de manera comercial, se pueden reproducir (con permiso) y utilizarse
con propósitos de investigación. Otras Fuentes valiosas son Andrulis (1977); Comrey,
Backer y Glaser (1973); Fischer y Corcoran (1994); Goldman, Saundersy Busch (1996);
Kevsery S\veedand(1987) y Taulbee (1983).
Fuentes valiosas de información sobre pruebas y escalas son las revistas Psychological
Bulletin, Journal of Psychoeducational Assessrnent, Applied Psychological^
leasurement, Educational and Psychological Measurement, Journal of Educational
Meamrement, Psychological Assessment y Journal of Experimental Education.

Tal vez un investigador encuentre que no existe una medida que mida el atributo
deseado. O, si existe una medida, quizá sea insatisfactoria para los propósitos. Por
consiguiente, el investigador debe construir una nueva medida o instrumento, o
abandonar la variable. La construcción de pruebas y escalas objetivas constituye una
tarea larga y ardua. No existen atajos. Un instrumento pobremente construido llega a
ocasionar más daño que beneficio, ya que puede conducir al investigador a conclusiones
erróneas. Entonces, el investigador que debe construir un nuevo instrumento tiene que
seguir ciertos procedimientos conocidos y guiarse por criterios psicométricos aceptados.

Se ha logrado un enorme progreso en la medición objetiva de la inteligencia, las apti-


tudes, el rendimiento, la personalidad y las actitudes. Sin embargo, las opiniones están
divididas, en ocasiones de forma muy marcada, sobre el valor de la medición objetiva.
El avance más impresionante se ha logrado en la medición objetiva de la inteligencia,
las aptitudes y el rendimiento. Los avances en la medición de la personalidad y las
actitudes no han sido tan impresionantes. El problema es, por supuesto, la validez,
especialmente la validez de las medidas de personalidad.

Dos o tres desarrollos recientes son muy alentadores. Uno es la creciente comprensión
de la complejidad que implica la medición de cualquier variable de personalidad y de
actitud. El segundo lo constituyen los avances técnicos para llevarla a cabo. Otro
desarrollo muy relacionado consiste en el empleo del análisis factorial como ayuda en la
identificación de variables y como guía en la construcción de medidas. Un tercer
desarrollo (que se estudió en un capítulo anterior) es el creciente conocimiento,
comprensión y maestría del problema de validez en sí mismo, y en especial la
comprensión de que la validez y la teoría psicológica están interrelacionados.

5. OBSERVACIÓN, MEDIDA Y ESCALAS

Sierra al respecto de la observación plantea lo siguiente.


5.1. La observación y sus tipos

Hecho el plan de la investigación a desarrollar, y resueltos los problemas que plantea el


muestreo en el caso de que no se puede abarcar a todo el universo, empieza el contacto
directo con la realidad objeto de investigación o trabajo de campo. Tiene por finalidad
la recogida de datos mediante los diversos métodos de observación.

La observación, pues, en este sentido amplio, engloba todos los procedimientos


utilizados en las ciencias sociales, no sólo para examinar las fuentes donde se
encuentran los hechos y datos objeto de estudio, sino también para obtener y registrar
éstos. Considerada de este modo, la observación proporciona al investigador la materia
de trabajo que ha de ser objeto después de tratamiento y estudio científicos, mediante
las siguientes fases de la investigación, la clasificación y tabulación y el análisis y
explicación.

La realización de la observación implica, en todo caso, los siguientes elementos: un


sujeto, un «objeto», el acto de la observación y el registro de lo observado.
Generalmente implica también la actuación natural o provocada de un estímulo con la
consiguiente respuesta del objeto observado, que se percibe y registra, dando lugar al
siguiente esquema:

Sujeto →
Estímulo →
Objeto →Respuesta →Percepción →
Registro

En todos los eslabones de esta cadena pueden intervenir factores ajenos y alterar la
pureza de la observación y la validez de sus resultados. Además, frecuentemente el
objeto está latente, oculto, y es observado por medio de expresiones externas que se cree
lo representan. En estas circunstancias se basan las dificultades y problemas que plantea
la observación, estudiadas en el capítulo 7 y la necesidad de su control.

Entendida así, la observación se puede clasificar, según su objeto, en los tipos


siguientes, que abarcan los procedimientos fundamentales actualmente existentes de
recogida de datos, y que serán objeto de atención sucesivamente en esta obra.
a) Observación directa por medio de los sentidos de hechos y realidades sociales
presentes. Si estos hechos se producen espontánea y naturalmente, se tiene la
observación simple. Pero si, por el contrario, su efectividad es provocada artificialmente
por el observador, o por lo menos existe una cierta preparación y control de éste sobre
las condiciones del fenómeno observado, se trata entonces de la observación experimen-
tal.

b) Observación documental, sobre documentos actuales o históricos de todo género en


cuanto recogen y reflejan hechos y datos de interés social.

c) Observación, mediante encuesta, entendida esta palabra en el sentido de interrogación


a los sujetos o protagonistas de los hechos estudiados. Puede tener lugar mediante
cuestionario, escrito, entrevista o escala sociométrica.

Esta observación puede realizarse mediante cuestionario dirigido a amplios sectores de


la población que éstos contestan por escrito. También puede efectuarse mediante
entrevista, en la que los encuestados contestan de palabra. Finalmente, puede tener lugar
mediante la aplicación a los encuestados, por cuestionario escrito o entrevista indistinta-
mente, de las llamadas escalas de actitudes.

En síntesis, se puede formar el siguiente cuadro de tipos principales de observación:

Observación directa Simple Experimental

Observación documental

Por cuestionario

Observación mediante encuesta Por entrevista

Por escala de actitudes

5.2. Observación y medida

A primera vista puede parecer que la observación y la medida son términos distintos que
no guardan una estrecha relación entre sí. Sin embargo, si se tiene en cuenta que los
datos, como indicamos en el capítulo segundo de esta obra, se refieren a una dimensión
de una variable en una unidad de observación determinada (por ejemplo, un dato es: el
encuestado X declara que pesa entre 65 y 70 Kg) y que, por tanto, los datos son la
expresión verbal o escrita de medidas realizadas, se revela entonces la íntima
vinculación entre la observación y la medida.

Resulta que sí, conforme a la definición expuesta, la observación científica consiste en


la recogida de datos, y si los datos no son otra cosa que la expresión de medidas, hay
que concluir que, según lo anterior, al ser la observación una recogida de datos, se
puede decir que es también una recogida de medidas.

Hasta no hace mucho, predominaba en las ciencias sociales una noción restringida tanto
de la observación como de la medida. Por ejemplo, en el término dedicado a la medida
en el Diccionario de Ciencias Sociales (1976, p. 187, v.2) se recoge una noción de
medida estricta, según la cual "medir una cantidad es compararla con otra de igual
naturaleza con objeto de averiguar cuantas veces la primera contiene a la segunda".

Igualmente la observación se suele limitar a la recogida de datos realizada mediante los


sentidos humanos, es decir, a lo que hemos llamado en la anterior clasificación,
observación directa.

No obstante lo anterior, no se ve razón alguna para no considerar observación toda


recogida de datos, aunque no se funde directa e inmediatamente en los sentidos del
investigador.

En cuanto a la medida, la definición que se ha impuesto actualmente y, sin duda, más


aceptable científicamente, es la recogida por S. S. Steven (1976, p. 17), según la cual
"medir es asignar números a objetos o acontecimientos de acuerdo con ciertas reglas".

Conforme a esta definición no sólo medimos cuando comparamos algo con una unidad
de medida y vemos las veces que la contiene, sino también cuando distinguimos y
clasificamos cosas distintas, y cuando ordenamos según más y menos las características
o variables de las cosas, asignando números a las distintas cosas y variables clasificadas
y ordenadas.
De ello se concluye que, científicamente, hay que admitir que existen no solo uno sino
diversos niveles de medida, como veremos después, y, por tanto, diversos niveles de
observación, según que en la toma de datos nos limitemos a distinguir y clasificar los
seres reales, según que, además, ordenemos sus características de más a menos, o, en
fin, según que no solo distingamos y midamos sino que obtengamos dimensiones
mediante su comparación con una unidad de medida.

Por otra parte, lingüísticamente (Baird) la medida es una afirmación resultado de una
observación y, por tanto, tiene carácter humano y falible. Por ello, no se debe decir la
longitud de esta mesa es de 1,6 m., sino se ha medido esta mesa y se ha obtenido un
resultado de 1,6 m. A este respecto, hay que distinguir entre contar, que permite una ex-
presión exacta y la medida que es falible.

En conclusión, se puede afirmar que existe un vínculo íntimo entre observación y


medida. Cuando al observar con los sentidos, distinguimos cosas y las clasificamos, ya
estamos midiendo; cuando medimos con la mayor precisión, seguimos observando. La
diferencia entre estos modos de medir no está en la esencia de la medida sino en el nivel
de precisión logrado.

5.3. OBSERVACIÓN DIRECTA SIMPLE

5.3.1. Noción y rasgos

La observación simple es la inspección y estudio realizado por el investigador, mediante


el empleo de sus propios sentidos, especialmente de la vista, con o sin ayuda de aparatos
técnicos, de las cosas y hechos de interés social, tal como son o tienen lugar
espontáneamente, en el tiempo en que acaecen y con arreglo a las exigencias de la
investigación científica.

La observación simple es el tipo de observación más puro de la investigación social, de


ahí su importancia e interés.

No obstante lo anterior, la observación presenta los siguientes inconvenientes en la


investigación social:
— La limitación de los sentidos humanos respecto a la extraordinaria amplitud de los
fenómenos sociales y sus múltiples facetas.

— La dificultad de captar en profundidades las relaciones sociales.

— Los frecuentes errores de percepción anejos a ella y difícilmente evitables en la


investigación social.

— Por último, el hecho de que el observador forma parte de aquello que es observado,
la sociedad, y por ello, nunca puede ser totalmente neutral.

La observación social simple todos la realizamos, diariamente, con más o menos


penetración, al entrar en contacto con fenómenos sociales.

Para que sea científica ha de reunir las siguientes condiciones:

1) Que sirva a un estudio ya formulado de investigación.

2) Que sea planificada y se realice sistemáticamente.

3) Que esté relacionada con proposiciones científicas más generales.

4) Que se empleen técnicas objetivas, es decir que aspire a observar, registrar e


interpretar los hechos en forma tal que otras investigaciones puedan verificar sus
hallazgos.

5) Que esté sujeta a algún control para la comprobación de su validez y fiabilidad.

Las formas de control que se suelen utilizar son: la realización de la observación por dos
investigadores distintos a la vez y la discusión de los datos obtenidos con expertos y
miembros del grupo. Asimismo, se recomienda tener en cuenta las reacciones,
sentimientos y estado de ánimo de los observadores en el momento de la observación.

5.3.2. Sus notas

Según la definición expuesta, se pueden distinguir los siguientes rasgos o notas


características de la observación simple:

1) Ser un procedimiento de recogida de datos que se basan en lo percibido por los


propios sentidos del investigador. Por ello, se diferencia de la investigación
documental y por cuestionario y entrevista, que se fundan en las percepciones
contadas de palabra o por escrito de otras personas.

2) Consistir en el estudio de fenómenos existentes naturalmente o producidos


espontáneamente y no provocados artificialmente como en los experimentos puros.

3) Ser un examen de fenómenos o acontecimientos actuales tal como son o tienen


lugar en la realidad del momento presente, y no sobre hechos o acontecimientos
pasados.

4) Que se realice con fines sociológicos, y con arreglo a los requisitos exigidos por la
investigación sociológica científica, según su naturaleza descriptiva o explicativa.
Esta condición distingue la observación sociológica de la realizada con otros fines,
incluso científicos, no sociológicos.

5) En fin, la observación simple, como procedimiento de recogida de datos típico de


las investigaciones sociales cualitativas, se caracteriza por ocupar en ella un puesto
destacado la inducción, el paso de los datos a la teoría, de modo que ésta surge de
aquélla, el enfoque holístico o global de las situaciones sociales y la comprensión o
la pretensión de aprehender las intenciones en las acciones sociales.

5.7. TRATAMIENTO DE LOS DATOS DE LA OBSERVACIÓN


CUALITATIVA

Si bien esta obra se refiere más específicamente a los llamados métodos cuantitativos de
la investigación social y aunque nada impide que gran parte de su contenido pueda ser
aplicado también, con las acomodaciones necesarias en las investigaciones sociales
cualitativas, a continuación se enumeran, de acuerdo con S. J. Taylor y R. Bogdan
(1986, 159 y ss.), los pasos básicos a seguir en el tratamiento de los datos de dichas
investigaciones cualitativas.

5.7.1. Análisis

1) Leer detenida y repetidamente los datos contenidos en los cuadernos de campo,


notas y en general documentos recogidos en la investigación.
2) Seguir la pista de temas, intuiciones e ideas surgidas durante dicha lectura.

3) Precisar los tópicos que aparezcan de manera recurrente en los documentos


examinados.

4) Elaborar tipologías o esquemas de clasificación.

5) Formar conceptos, dando un nombre a las actividades, situaciones o fenómenos


nuevos descubiertos.

6) Documentarse leyendo el material bibliográfico disponible que guarde relación con


el asunto investigado.

5.7.2. Codificación

1) Establecer las categorías pertinentes para efectuar la clasificación de los resultados


obtenidos en el análisis.

2) Codificar o asignar a los mismos un código de identificación.

3) Clasificar cada uno de dichos resultados en las categorías en las que encajen mejor.

4) Discutir más detenidamente a qué categorías se pueden asignar los datos sobrantes
del primer intento de clasificación.

5) Refinar todo el trabajo realizado, considerando conjuntamente y comparando entre


sí los resultados obtenidos.

6) Relativizar las conclusiones inmediatas que se deriven de la investigación, teniendo


en cuenta las circunstancias de su obtención y el contexto al que se refieren.

5.8. CLASES

La observación presenta distintos grados y modalidades, aunque todos ellos son de gran
interés para el sociólogo.

Existe, con relación a grupos sociales, además de la llamada no intrusiva que se realiza
examinando por ejemplo, restos, basuras, graffiti, y en general, vestigios de las
actuaciones sociales, una observación participante que se realiza enrolándose en el
grupo observado y una observación distante que tiene lugar manteniéndose al margen de
éste, aunque no tan alejado que se impida la observación pretendida. Además, según su
grado de nivel científico, se pueden distinguir los tipos de observación siguientes:
Precientífica, global, descriptiva y explicativa.

5.8.1. Observación participante

Este tipo de observación tiene lugar, como se ha dicho, cuando el investigador se


mezcla con el grupo observado y participa en sus actividades más o menos
intensamente.

Si la participación es más prolongada y se realiza conviviendo con el grupo observado,


durante un período más o menos largo de tiempo, entonces se tiene la observación
antropológica o etnográfica, que si la participación es más prolongada y se realiza
conviviendo con el grupo observado durante un período más o menos largo de tiempo,
entonces se tiene la observación antropológica o etnográfica, que constituye una de las
técnicas más importantes en estas ciencias sociales.

La observación primera, reportaje, tiene relación con el reportaje periodístico. Se


diferencia de éste porque debe reunir las condiciones indicadas para que una
observación sea científica. Además siempre se debe orientar a detectar aspectos de
interés sociológico, previamente fijados.

La observación participante antropológica o etnográfica, se realiza conviviendo con las


tribus o comunidades a investigar. Los estudios antropológicos existentes son, por lo
general, resultado de la convivencia de los antropólogos con los aborígenes estudiados,
a veces durante años. Primero se han de ganar su confianza y dejar que pase algún
tiempo para que pierdan el miedo y obren naturalmente delante del investigador.
Después deben ir observando y tomando notas de todas las particularidades de su vida
en el orden social, político, cultural y económico.

No es posible desarrollar aquí las particularidades de este tipo de observación, pero si se


puede recomendar la obra de S.T. Bruyn, La perspectiva humana en Sociología,
publicada por la Ed. Amorrortu.

Esta obra considera a la observación participante, como ejemplo del tipo de


investigación cualitativa, en contraposición a la cuantitativa, es decir, aquella que
pretende penetrar y comprender el sentido íntimo de un fenómeno o realidad social, más
allá de sus aspectos externos y cuantitativos.

En este sentido, se contrapone a la encuesta, que se suele considerar como forma típica
de la investigación cuantitativa.

Este procedimiento también se puede utilizar para estudiar comunidades de pueblos


avanzados culturalmente tales como aldeas, suburbios, etc., e incluso familias. Ejemplo
respecto a familias son los estudios de O. Lewis, La cultura de la pobreza y Los hijos de
Sánchez. Es famosa también la investigación de W.F. White, Street comer society,
efectuado en un barrio popular de USA, formado por inmigrantes italianos y sus hijos.
Igualmente la de Wilkie, Village in the Vaucluse, estudio sobre un pequeño pueblo
cerca de Avignon.

5.8.2. Observación precientífica

La observación precientífica, más bien que una técnica concreta, es una disposición de
ánimo, una actitud ante la realidad social. Se puede decir que constituye el elemento
fundamental del espíritu sociológico, es decir, de la aptitud para ver en todos los hechos
de la vida los aspectos de interés social, de la capacidad para calificarlos y juzgarlos
según categorías sociológicas y de la penetración para intuir los problemas de interés
que presentan para su investigación científica.

Este tipo de observación debe constituir una cualidad permanente del sociólogo, básica
no sólo porque toda investigación requiere un conocimiento lo más extenso y profundo
posible de la realidad social, sino también como fuente de hallazgo de cuestiones
científicas a investigar y de sugerencia de hipótesis significativas. Para adquirirlo se
puede re-, comendar la lucha por conseguir una atención permanente a los hechos
ofrecidos por la realidad, y el esfuerzo constante por aplicar a ellos y contrastarlos con
categorías y principios sociológicos.

5.8.3. Observación global

La observación global se puede considerar ya como una técnica sociológica, aunque


sólo sea previa y preparatoria de una encuesta posterior. Aparece desarrollada y
recomendada especialmente por J. Lebret, en su "Manual de Encuesta Social" (Madrid,
Edit. Rialp). Se puede decir que consiste en un primer contacto general con el área,
urbana o rural, donde se piensa desarrollar una investigación para obtener un conoci-
miento básico de la misma en sus aspectos fundamentales, que sirva posteriormente de
guía en la preparación y ejecución de la encuesta o estudio proyectado. Una forma de
observación global es la preencuesta.

Su finalidad es percatarse lo más profundamente posible del paisaje y ambiente natural,


económico, social y humano, a los que se va a referir el estudio, así como de las
condiciones genéricas que caracterizan a todo universo a estudiar de cualquier tipo que
sea.

A esta técnica se puede asimilar, el punto de vista en que insiste especialmente la


sociología marxista de la necesidad de conocer previamente a toda encuesta los diversos
intereses y conflictos de clase en la población investigada. Este es el medio para poder
detectar las fuerzas sociales que actúan en ella y obtener una visión dialéctica de la
misma.

Esta técnica, aunque no muy generalizada, se debe calificar de fundamental, pues un


presupuesto básico de cualquier investigación es tener un conocimiento global del
campo que va a abarcar. Se puede aplicar aquí lo que dice Caplow (1927, pág. 163).
"Nada puede reemplazar un contacto directo del observador con su campo de estudio,
ninguna técnica es capaz de sugerir tantas ideas nuevas".

5.8.4. Observación descriptiva

Los otros tipos de observación, descriptiva y explicativa, constituyen técnicas de


investigación sociológica independiente, y no meramente preparatorias como la
observación global, aunque se utilizan también como accesorias o complementarias de
otras técnicas. La distinción entre ambas radica en la finalidad descriptiva o explicativa
de la investigación proyectada. También radica en el objeto de estudio, pues mientras la
primera se refiere más bien a grupos o fenómenos sociales en conjunto (observación
general de una fiesta de sociedad, de una manifestación pública, de una banda de
jóvenes) en la explicativa es más reducido el fin de la investigación en cuanto tiende a
comprobar determinadas hipótesis formuladas previamente.
La distinción entre ambos tipos de observación se refleja en el diverso rigor científico,
exigida por una y otra.

En el caso de la observación descriptiva, como en los estudios de investigación de este


tipo en general no es siempre necesario establecer una hipótesis explícita previa. Puede
bastar determinar únicamente los aspectos del campo de observación que van a ser
objeto de nuestra atención, o, en términos más concretos, especificar las variables sobre
las que pretendemos obtener información.

La forma de proceder en este caso puede ser la siguiente:

1) Decidir el campo de observación y definirlo del modo más preciso posible.

2) Previo análisis de sus aspectos principales, es muy aconsejable a todos, pero


especialmente a principiantes, elegir entre estos aspectos los que se crean de
mayor interés limitando a ellos la investigación.

3) Especificar las dimensiones de los aspectos seleccionados y las variables


empíricas o indicadores de estas dimensiones. Estas variables deben ser
memorizadas por el observador.

4) Un ejemplo ya clásico de categorías e indicadores para la observación directa de


la dinámica de grupos, son las establecidas por Bales después ile pacientes
experimentos sobre los tipos de comportamiento en las reuniones de grupo. Son
estas:

5) Muestra solidaridad, anima. 2. Aparece relajado. 3. Aprueba. 4. Sugiere. 5. Da una


opinión. 6. Da información. 7. Pide opiniones. 8. Pide una evaluación, una
opinión. 9. Exige una orientación. 10. Rehusa, desaprueba, no participa. 11.
Manifiesta una tensión. 12. Manifiesta agresividad.

6) Construir como instrumento de observación un cuadro de recogida de datos. En él,


además de figurar los hechos descriptivos básicos de la unidad de observación:
nombre, domicilio, situación, extensión, etc. se comprenden columnas en las que
anotar la frecuencia e intensidad en su caso de los indicadores elegidos.
Este instrumento de observación debe ser ensayado o probado antes de empezar la
observación, para comprobar si es adecuado, válido y seguro.

La anotación de las observaciones debe realizarse en el momento de la observación o si


no es posible, después, pero lo antes que se pueda.

En la utilización práctica del instrumento de observación se plantea el problema de


cómo lograr recoger la secuencia temporal de las interacciones. Hay diversos
procedimientos. Acaso el más simple sea cambiar de hoja de observación cada cinco
minutos, por ejemplo.

5.8.5. Observación explicativa

Según Mayntz y colaboradores (1975, p. 123), la observación explicativa, que el llama


sistemática, se distingue de la no sistemática, por las siguientes características:

1) Sobre la base de una teoría explícita se aislan conceptualmente distintas clases de


variables de comportamiento y de variables que determinan el mismo.

2) El proceso de observación se estructura en categorías de observación definidas con


precisión, sobre las que se ordenan todas las observaciones relevantes. A este respecto,
las variables han de ser operacionalizadas por medio de indicadores accesibles a la
observación directa. Una dificultad especial se presenta frecuentemente al determinar
las unidades de observación, que generalmente son comportamientos, debiendo fijarse
al efecto lo que pudiera llamarse una acción "completa o cerrada"

3) Las condiciones situacionales de partida son sometidas a control a fin de posibilitar


observaciones comparables, o por lo menos han de ser normalizadas o especificadas
claramente

En el primer caso esto comporta por ejemplo la elección del grupo investigado, el
señalamiento de las actividades que tienen que realizar y el establecimiento de las
condiciones ambientales donde van a actuar, según criterios científicos.

Teniendo en cuenta estas características especiales y acomodándolos a ellas, los puntos


acabados de indicar para la observación descriptiva pueden ser válidos para la
explicativa.
5.8.6. Observación experimental

5.8.6.1. Noción

Como ya se ha indicado en la introducción a la observación simple, el experimento es


en sí una observación directa, en cuanto se basa en el estudio, mediante el empleo de los
sentidos del investigador, con o sin ayuda de aparatos técnicos, de hechos y fenómenos
de interés social, (liando tienen lugar en la realidad.

Sin embargo, no es una observación simple, en sentido estricto. Primero porque consiste
en el estudio de grupos y fenómenos, y ésta es sin duda su nota distintiva, preparados o
manipulados, es decir, controlados de alguna forma por el investigador. Segundo porque
el experimento es ti instrumento de investigación causal por excelencia, a diferencia de
la observación que, generalmente, es simplemente descriptiva. Y tercero porque implica
la contraposición bien de dos grupos o fenómenos similares, salvo en un influjo
producido o en una situación que se da por sí misma, bien del mismo grupo o fenómeno
esta vez en dos tiempos distintos después de haber sufrido un impacto determinado.
Precisamente la técnica del experimento se basa en la producción o preparación de esta
contraposición o contraste, de tal modo que en ella consiste principalmente la
manipulación del objeto de la investigación que supone el experimento.

En su desarrollo pleno la técnica del experimento comprende las siguientes fases: 1)


Preparación de dos grupos o situaciones idénticas o lo más similares posibles. 2)
Observación o medición inicial simple de ambos grupos. 3) Modificación de uno de los
grupos o situaciones, haciendo incidir sobre él una variable (estímulo). 4) Nueva
observación y medición de ambos grupos, especialmente en cuanto a la variación
producida por el estímulo en el grupo o fenómeno sometido a él. 5) Comparación de los
resultados obtenidos en los grupos mediante la medida de las diferencias entre la
situación final e inicial de cada uno de ellos.

Los elementos básicos que intervienen en la observación experimental son a) el


ambiente en general en el que se efectúa el experimento; b) los grupos que se
contraponen o comparan y c) el estímulo o variable experimental que se hace incidir
sobre el grupo experimental.
Cuando todos estos elementos están bajo el control y manipulación del investigador, se
tiene el experimento que se puede llamar puro o totalmente controlado.

El control del ambiente se realiza mediante el aislamiento experimental, es decir,


efectuando el experimento en un laboratorio donde el investigador puede controlar o
mantener constantes las variables ambientales: luz, temperatura, presión atmosférica,
etc., que pueden influir en los grupos sujetos a experimento. Este control del ambiente
es, sin duda, importante en los experimentos físicos y biológicos, pero en los ex-
perimentos sociales presenta el gran inconveniente de constituir el laboratorio un
ambiente artificial, que como tal puede influir física y psíquicamente de manera
importante en las personas sujetas a experimento.

Cuando no se pueden controlar algunas de las variables ambientales se recurre a su


aleatorización. Esta técnica tiene aplicación en el caso en el que se puedan realizar las
repeticiones del experimento que sean necesarias. En este caso, se hace que las variables
incontroladas intervengan en cada experimento con valores distintos, altos, medios,
bajos, lo que permite detectar su influencia en el experimento y eliminar la posibilidad
de influjo sistemático encubierto.

El control de los grupos con los que se realiza el experimento tiene lugar,
principalmente, por medió de la igualación de los grupos experimental y de control, de
la que se trata después, respecto sobre todo a las características básicas en orden a los
objetivos del experimento.

Por último, el control del estímulo o variable independiente es la mitad del investigador
de hacer incidir tal estímulo sobre el grupo que parezca conveniente y en el grado y
momento que le parezca oportuno

Este control del estímulo es, sin duda, como se ha indicado, lo mal típico del experimento.
Esto explica que D. Campbell y J.S. Stanley (1973, p. 9) entiendan por experimento
"aquella parte de la investigación en la cual se manipulan ciertas variables y se observan
sus efecto sobre otras".
En el experimento las variables independientes son las que el investigador hace variar y
las dependientes son las que observa para ver si varían a causa de la variación
provocada por el investigador en las variables independientes.

También principalmente en los experimentos, pueden intervenir otras variables que


Galtung llama relevantes e irrelevantes. Las primeras son importantes en relación al
fenómeno estudiado y, por ello, el investigador debe controlarlas manteniéndolas a lo
largo del experimento sin variación, a fin de que no puedan influir en la variación a
observar de las variables dependientes.

Las irrelevantes son las que se puede hacer caso omiso de ellas, bien porque se estima que
su influencia es despreciable, o bien porque esta influencia es aleatoria y se anula en
conjunto.

El experimento es la técnica de investigación científica más poderosa. Como dicen Yule


y Kendall, en su obra Introducción a la estadística matemática, deriva su poder de la
habilidad del experimentador para reemplazar los complejos sistemas de causalidad
reales por sistemas sencillos. Su fin es posibilitar el estudio del fenómeno en las
condiciones elegidas por el investigador.

Por ello, los experimentos bien hechos sirven para descubrir si una variable es
independiente respecto de otra, en el sentido indicado de que influye o es causa de la
variación observada en la variable dependiente.

En las técnicas no experimentales, llamadas correlaciónales, esto solo se puede establecer


con una cierta probabilidad, mediante el estudio matemático estadístico de las
correlaciones entre las variables y utilizando técnicas lógicas.

Sobre todo se basan en el experimento las ciencias físico-químico-n a t u r a l e s . En


sociología es también la técnica ideal, pero sólo se puede emplear por lo general de modo
imperfecto. Motivos humanos y morales piden en muchos casos su aplicación a los
grupos sociales y, aun supuesta su admisibilidad moral, no es posible por lo general en las
ciencias sociales el control científico riguroso del ambiente, de los grupos y de la variable
experimental como exige el experimento.
No obstante, conviene señalar con E.B. Wilson (1953, p. 56) que “es raro que solo un
experimento sea considerado como suficiente; usualmente las repeticiones se estiman
necesarias en orden a contrastar los resultados y como también como base de estimación
de la precisión de los resultados obtenidos. Este proceso de replicación es especialmente
necesario cuando la clase bajo estudio no está definida demasiado precisamente y está
por eso sujeta a amplias variaciones individuales". .

5.8.6.2. Tipos de experimento

Los experimentos pueden clasificarse según el ambiente en que se realizan, según su


desarrollo o perfección y según su naturaleza.

Según el ambiente, se distinguen los experimentos de laboratorio y experimentos sobre


el terreno o de campo.

Como escribe Caplow (1972, p. 187), un laboratorio es un lugar cerrado, sometido al


control de un investigador y dotado de un equipo que le permite efectuar las
manipulaciones y mediciones necesarias. El ambiente de laboratorio es, por definición,
artificial y como tal sólo reproduce aquellos aspectos del ambiente natural que el
investigador quiere resaltar. Además nunca se puede estar seguro que este proceso de
selección no introduzca modificaciones del contorno incontroladas.

La casi totalidad de las investigaciones sobre procesos sociales efectuados en


laboratorios son investigaciones de psicología social que afectan tanto a la sociología
como a la psicología.

El laboratorio típico de psicología social consiste en una sala de dimensiones medias,


equipada con mesas, sillas y pantallas, y con magnetófonos, cámaras y otros aparatos de
registro. Además debe tener una sala de observación insonorizada separada de la sala de
experimentación por un espejo que permita ver sin ser visto.

Los experimentos de campo o sobre el terreno son los que no tienen lugar en un
laboratorio. Los experimentos de este tipo si fueran rigurosos no deberían diferir de los
experimentos de laboratorio. También en ellos es necesario el control perfecto de la
situación social de origen. Pero, como esto es muy difícil de conseguir, la realidad es
que los experimentos sociales sobre el terreno son generalmente experimentos im-
perfectos. Un ejemplo de experimentos de esta clase es el realizado con personas
alojadas en barracas. Se les dio solo a algunos de ellos viviendas nuevas para ver qué
diferencias sociales se producían.

De acuerdo con el segundo criterio se pueden distinguir los cuasi-experimentos y los


experimentos propiamente dichos.

Los cuasi-experimentos se consideran formados por aquel tipo de investigaciones en el


que falta algún elemento importante, por ejemplo el grupo de control, o suponen un
control incompleto sobre los elementos señalados importantes en el experimento social:
los grupos observados y el estímulo.

Por el contrario, experimentos propiamente dichos son aquéllos en los que no falta
ningún elemento básico y el control del investigador alcanza tanto a los grupos
experimentados como al estímulo o variable independiente.

Todos los tipos de experimentos expuestos se pueden clasificar de reales en cuanto


implican la producción real, bien de manera espontánea o artificial, de un fenómeno
social.

Sin embargo, han adquirido gran importancia últimamente los llamados experimentos
simulados, que cada día tienen más aplicación en todas las ciencias, debido a la
dificultad y coste de los experimentos reales.

Este tipo de experimentos, en oposición a los reales, no se basan en la observación de la


incidencia de un influjo real determinado sobre una situación o grupo efectivos. Al
contrario, se basan en el estudio de las consecuencias sobre una situación simulada,
ficticia, a veces puramente teórica, de la modificación de algunos de sus elementos. La
situación teórica viene a ser la situación o grupo experimental de partida y la
modificación de sus elementos o factores se puede decir que constituye el estímulo del
experimento simulado.

En este tipo de experimentos se basan en síntesis en lo siguiente. Se construye un


modelo que como tal pretende ser una representación de la realidad. Entonces, en lugar
de estudiar la realidad directamente se modifican algunas de las variables que forman el
modelo y se estudian las transformaciones que se producen en el conjunto del modelo
por tal variación. Los resultados obtenidos se pueden verificar simuladamente mediante
series de valores que se obtienen por medio de los ordenadores.

Estos experimentos tienen aplicación sobre todo en estudios prospectivos que intentan
prever el futuro. Son muy útiles en política social y económica, para prever las
modificaciones que se producirán en la sociedad y en la economía si se actúa sobre
determinadas variables.

Por último quedan los llamados experimentos ex-post-facto.

Se producen cuando falta la situación inicial y el control del estímulo, ya que actúa el
investigador después de haber actuado la causa o variable independiente y de haberse
producido los efectos consiguientes.

Se puede decir que de experimentos tienen muy poco, salvo un cierto control imperfecto
que es posible en ellos de la elección de los miembros del grupo que ha sufrido el
impacto de la variable independiente y de los del grupo de control. Como señala el
Profesor González Seara (1971) estos experimentos se deben utilizar con mucha cautela,
pues las explicaciones ex-post-facto pueden utilizar los datos como mejor convenga.

5.8.6.3. Operaciones preparatorias del experimento

En cuanto a las operaciones preparatorias del experimento se pueden destacar: a)


Análisis de la hipótesis y determinación del estímulo, b) Formación de los grupos
experimental y de control, c) Medición de estos grupos, antes y después del estímulo. Y
d) Construcción del modelo del experimento y significación de los resultados.

a) El análisis de la hipótesis no ofrece particularidad especial en relación a lo ya


expuesto al tratar de ellas. El estímulo es precisamente la variable independiente, que
bien se hace incidir en el grupo, o bien ha actuado ya en él naturalmente.

b) Para la formación de los grupos experimental y de control existen tres


procedimientos principales. Los llamados control de precisión, control por distribución
de frecuencias y control por azar. En el primero se realiza la elección de los miembros
de ambos grupos, individuo por individuo. Seleccionado, por ejemplo, un miembro para
el grupo experimental se busca otro que reúna las mismas circunstancias tomadas en
consideración en el primero para el grupo de control, y así sucesivamente hasta
completar el número previsto. En cambio, en el control por distribución de frecuencias
esta igualación no se hace de modo individual, sino globalmente, de modo que la
composición de ambos grupos sea igual respecto a las características en cuestión. Por
ejemplo, si el grupo experimental está formado por un 30 por 100 de individuos de basta
quince años de edad, un 50 por 100 de dieciséis a dieciocho y un 20 por 100 de
dieciocho a veinte, el grupo de control deberá tener la misma composición por edades e
igualmente en relación a las demás características del grupo.

El procedimiento de azar se puede utilizar para igualar aleatoriamente los dos grupos.
Para ello se eligen dos muestras de igual número de sujetos de la misma población,
según se ha indicado ya. También se puede emplear para realizar la asignación de los
individuos a los grupos de control o experimental. En este caso, este procedimiento se
puede combinar con cualquiera de los dos primeros.

Se ha de señalar, que la igualación ha de hacerse sobre todo respecto a variables


independientes altamente relacionadas con la variable dependiente investigada.

c) Para la medición de los grupos después del experimento, y antes, i i i su caso, se


aplicarán las técnicas existentes en Sociología, por ejemplo, escalas de actitudes, tests,
entrevista, cuestionario, etc. Aquí es aplicable lo expuesto al tratar de la elección de los
métodos a emplear.

d) El modelo de experimento, en el caso de ciertos diseños experimentales y


cuasiexperimentales, es un diagrama formado por un cuadrado dividido en cuatro partes
iguales que corresponden a las medidas antes v después del experimento de los grupos
experimental y de control.

Como es obvio, cuando en el experimento solo hay un grupo, dos cuadros estarán
vacíos, así como cuando no hay medidas antes y sí o lo después. Esto se indica por una
línea de trazos discontinuos.

La diferencia de las diferencias entre las medidas después y antes 0 entre las del grupo
experimental y el de control, si no hay momentos antes, es el resultado del experimento,
el posible efecto del estímulo o variable experimental X.
Su significación es simple. Si esta diferencia es elevada quiere decir que el experimento
no revoca la hipótesis y lo contrario si es baja. Para ver si estas diferencias observadas
son significativas estadísticamente, se puede emplear la prueba t o el análisis de
varianza.

5.8.7. Observación documental

5.8.7.1. Noción y clases

Los hombres no sólo tienen sentidos que les permiten observar los fenómenos sociales
en el momento mismo en que se producen, sino que con la escritura expresan por medio
de signos estas observaciones con lo Me logran, hasta cierto punto, que se materialicen
y trasciendan su esencial fugacidad. En realidad, en las sociedades con escritura, donde
cada vez tiene menos importancia y fiabilidad la transmisión oral, para que perdure toda
observación es preciso que se recojan sus resultados por medio de la escritura o de otra
forma documental.

Pero, además, en las sociedades modernas el registro de los acontecimientos sociales de


todo tipo, con fines no científicos, sino informativos, se realiza de manera
institucionalizada y permanente por medio de la prensa diaria o periódica, cuya
finalidad es recoger y dar cuenta de los acontecimientos más diversos de la vida social.

Asimismo el hombre utiliza la escritura para consignar en diarios, memorias,


autobiografías, de un lado, y en novelas, ensayos, obras científicas y técnicas, de otro,
desde sus experiencias más íntimas hasta los conocimientos científicos y técnicos de
una época, pasando por su visión del mundo y de la sociedad y su juicio sobre ellos.

Por otra parte, en las sociedades actuales, se lleva por organismos públicos y privados,
cuenta ordenada y regular de los hechos más importantes de la vida social:
demográficos, económicos, laborales, sanitarios, educativos, financieros, etc. Esta
cuenta ordenada constituye la base de las estadísticas en las que se refleja y presenta de
manera sistemática y regular la extensión cuantitativa de los fenómenos y procesos
sociales más importantes.

Por si esto fuera poco, hoy las modernas técnicas capacitan al hombre para registrar y
conservar los sonidos e imágenes de toda clase de sucesos incluido el contenido de
cualquier documento, y permiten, mediante las técnicas informáticas y sobre todo la red
mundial de información, documentación y comunicación INTERNET, verlos y
obtenerlos en el momento en que se desee y cualquiera que sea el lugar donde se
encuentren.

Por último, incluso los objetos de toda clase, desde el más grandioso monumento hasta
el más simple utensilio, tiene un valor documental en cuanto son restos productos de
una sociedad determinada, cuya naturaleza, organización y nivel de desarrollo reflejan.

Todo este arsenal de escritos, películas, fotografías, reproducciones de sonidos y objetos


de toda clase son documentos y constituyen el objeto de la observación documental.
Esta se puede definir como aquel tipo de observación que versa sobre todas las
realizaciones que dan cuenta de los acontecimientos sociales y las ideas humanas o son
producto de la vida social y, por tanto, en cuanto registran o reflejan ésta, pueden ser
utilizados para estudiarla indirectamente.

De la exposición acabada de realizar se deduce claramente la gran multiplicidad y


diversidad de los documentos y la amplitud, por tanto, del campo que se ofrece a la
observación documental. Todos los tipos mencionados constituyen en su conjunto un
arsenal inmenso de fuentes para la investigación social prácticamente inagotables. En el
se encuentran recogidas y reflejadas, desde tiempos muy remotos, si bien de manera
dispersa, desordenada y fragmentaria, gran parte de las manifestaciones de la vida social
de la humanidad en su conjunto y en cada uno de sus sectores.

De ahí la importancia de este tipo de investigación. Es insustituible en los estudios de


carácter histórico sobre fenómenos sociales pasados. Estos necesariamente se han de
basar en los documentos existentes de dicho tiempo. En cuanto a las investigaciones
sobre la realidad social actual, además de constituir los documentos, especialmente las
estadísticas, un complemento indispensable de los demás medios de observación de la
realidad social, han de partir de las anteriores investigaciones realizadas de tipo similar,
que en relación a ellas constituyen también fuentes documentales.

Etimológicamente, documento se deriva del latín "documentum", que significa


enseñanza, modelo, prueba y éste de "docere", enseñar. De acuerdo con esta etimología,
son documentos todas las realizaciones obra del hombre, en cuanto son indicio de su
acción y nos pueden revelar sus ideas, opiniones y formas de actuar y de vivir.

Los tipos de documentos objetivamente se pueden clasificar según la exposición


anterior:

a) En documentos escritos entre los que cabría distinguir como categorías principales: la
prensa; los llamados documentos personales: cartas, diarios, memorias, autobiografías;
las obras de creación literaria: novelas, obras de teatro, cuentos, ensayos, y todas las
demás publicaciones impresas.

b) Los documentos numéricos o estadísticos de todo tipo.

c) Documentos de reproducción de la imagen y el sonido (cine, televisión,


magnetófonos, discos).

d) Documentos-objeto: toda clase de realizaciones técnicas y artísticas del hombre.

Un tipo de documentos autobiográficos que merece mención especial es el llamado


"biograma". Con él se designa las autobiografías escritas a petición de los
investigadores.

5.8.7.2. Fiabilidad de los documentos escritos

Los documentos escritos, en general, como fuente de observaciones sociales, tienen


carácter secundario, en cuanto no ofrecen los fenómenos sociales mismos que han
tenido lugar, sino el resultado de la percepción e interpretación de ellos por el escritor,
que siempre es parcial c incompleta. Por ello es obvio que presentan también un
carácter indirecto, ya que no permiten al que los utiliza un contacto directo con los
hechos, sino mediato, a través de los documentos.

Este carácter secundario o indirecto de los documentos, unido a que frecuentemente


están producidos o escritos por no investigadores y para fines no científicos, exige como
condición para su utilización en la investigación social un examen o juicio previos muy
rigurosos de su fiabilidad.
En la fiabilidad de los documentos hay que tener en cuenta una distinción importante,
por una parte entre los hechos y fenómenos que se describen y las interpretaciones que
se dan de los mismos, y por otra, entre las ideas, opiniones y actitudes contenidas y
expresadas al describir e interpretar los acontecimientos. Es obvio que la aceptación por
válidas de las primeras, requiere mucho más cautela que la de las segundas.

Puntos básicos a tener en cuenta en el juicio crítico de la fiabilidad de los documentos


son:

a) Su autenticidad.

b) Su alteración o no por interpolaciones o por lagunas.

c) La competencia del autor y su conocimiento directo o no del tema tratado.

d) Su marco teórico y su ideología.

e) La coyuntura política y social en que fue escrito.

f) La pertenencia del autor a algún partido político o grupo de presión.

g) El fin pretendido con la publicación del documento.

También hasta cierto punto, aunque en menor grado, sobre todo en algunos aspectos,
estas circunstancias son aplicables a los documentos estadísticos.

Por otra parte, en la utilización de documentos no son de menor importancia los


problemas anejos a la lengua en ellos utilizada y especialmente los referentes a su
sentido exacto en la época en que fueron escritos.

5.8.7.3. Análisis primario de documentos

En el análisis de los documentos se pueden distinguir el análisis primario y el


secundario, y dentro del primero el análisis pormenorizado del contenido de los
documentos y su análisis como un todo global.

El pormenorizado se basa en el establecimiento previo de las variables empíricas y las


categorías sobre las que necesitamos recoger información.
Una vez establecidas las variables y categorías se examinan sistemáticamente los
documentos, con el objeto de encontrar los datos contenidos en ellos referentes a cada
categoría. La finalidad pretendida es ver si los datos prueban o no las hipótesis
formuladas.

En esto consiste, en sustancia, a mi juicio, la aplicación del método científico a la


investigación documental en ciencias sociales, y a ello se dirige el análisis de contenido,
que examinaremos después más detenidamente.

No obstante lo anterior, los documentos constituyen por si hechos sociales. Como tales
pueden ser objeto, como un todo global, de diversos tipos de análisis sobre sus
características, con intención de deducir de ellas consecuencias de interés social.

Entre estos tipos de análisis Duverger (1962, p. 152 y ss.), destaca y expone en relación
a los documentos, los tipos de análisis interno, externo, psicológico y sociológico.

Se puede señalar como objetivo del análisis interno la determinación del mensaje de la
obra y de los principios y valores en que se funda.

Por el contrario, parece objetivo más propio del análisis externo, además del examen de
los aspectos formales, estilo, lenguaje, etc., la puesta en relación del documento con el
contexto histórico y cultural en que tiene lugar su aparición.

Sociológicamente, se pueden analizar en el documento, los puntos, con un enfoque social,


que señala Lazarsfeld. Quién habla: sus características sociales; para decir qué: mensaje
social; a quién: grupos sociales a que se dirige; cómo: la forma del mensaje, y con qué
resultados.

Desde un punto de vista psicológico se pueden estudiar la personalidad social de su autor


y sus actitudes y opiniones en relación a cuestiones sociales.

Una modalidad especial de este tipo de análisis es el análisis de los documentos-objeto,


consistente en estudiarlos en sus diversos aspectos, deducir de ellos las circunstancias
sociales y económicas con las que pueden estar relacionados. Por ejemplo, Duverger
(1962, p. 140), distingue en su estudio tres tipos de análisis: el material, que consiste en
examinar externamente el objeto en sí mismo; el tecnológico, que atiende al uso
práctico de los objetos e indica el nivel técnico que suponen. Por último, el análisis
simbólico que se orienta, según él, a investigar los significados y valores que los
hombres atribuyen a estos objetos.

5.8.7.3.1. Análisis de contenido. origen, noción e importancia

El análisis de contenido es la técnica, sin duda más elaborada y que loza de mayor
prestigio científico en el campo de la observación documental.

Su origen histórico es reciente. Su aplicación de una manera científica se puede decir


que data de la II Guerra Mundial. Durante ella fue utilizada por los aliados, de manera
regular, con éxitos notables, para el estudio de las informaciones dadas en los medios de
comunicación nazis.

Asimismo, Lasswell utilizó ésta técnica para el estudio de la propaganda bélica en la II


Guerra Mundial. Este autor en 1949 publicó la obra "Language of polines. Studies in
quantitative semantic."Junto a la de Berelson, "Contení analysis in comunication
researchs" de 1952 son las obras clásicas de esta técnica.

Desde 1970, la evolución del análisis de contenido (Bardin, 1973) | distingue por tres
rasgos: 1. El recurso al ordenador. 2. El interés por las comunicaciones no verbales y la
semiología. 3. Su confluencia con el gran desarrollo actual de la lingüística.

El autor indicado, Bernard Berelson, la define de la siguiente manera:

"Es una técnica de investigación para la descripción objetiva, sistemática y cuantitativa


del contenido manifiesto de las comunicaciones, con el fin de interpretarlas."

Según esta definición, las notas que caracterizan al análisis de contenido son éstas: ser
objetivo, sistemático, cuantitativo, sobre el contenido manifiesto y con el fin de
interpretarlas.

La primer nota, objetivo, supone el empleo de procedimientos d< análisis que puedan ser
reproducidos por otros investigadores, de modo i que los resultados obtenidos sean
siempre susceptibles de verificación.
La segunda nota, sistemático, exige la sujeción del análisis a una pauta objetiva
determinada, que abarque todo el contenido a observar.

La tercera nota, cuantitativo, pide que se puedan cifrar numérica mente los resultados del
análisis. En relación a esta nota hay que tener 1 en cuenta que, como describe D.P.
Forcese (1973, p. 186), el análisis de contenido es una técnica para cuantificar datos
secundarios: consiste básicamente en el aislamiento y recuento de unidades e indicadores
de los fenómenos en que estamos interesados.

Por ello, el análisis de contenido es, como afirma Bailey (1978, p 276), equivalente en el
estudio de documentos a la investigación por i encuesta y sus resultados se condensan,
como en ésta, en tablas numéricas.

La cuarta nota, manifiesto, indica que el objeto de éste análisis son los contenidos
expresos de la comunicación, en el texto de que se trate. Objeto inmediato de
observación, sólo pueden ser los contenidos manifiestos. De hecho, sólo éstos se pueden
observar directamente. Pero esto no impide que se pretenda también investigar
contenidos latentes, utilizando para ello indicadores manifiestos que sean reflejo o
expresión de los mismos.

Esta conclusión resulta implicada en la quinta nota: con el fin de interpretarlas. Lo que el
análisis de contenido pretende no es quedarse con el contenido manifiesto, sino inferir de
él consecuencias relevantes de naturaleza psicológica, sociológica, política, histórica, etc.
sobre el origen, destino y aspectos de los mensajes.

El objeto del análisis de contenido consiste concretamente en observar y reconocer el


significado de los elementos que forman los documentos (palabras, frases, etc.) y en
clasificarlos adecuadamente para su análisis y explicación posterior.

En las sociedades desarrolladas y masificadas modernas, la escritura y los medios de


comunicación ocupan una posición cada vez más destacada y predominante.

En estos medios se recogen y reflejan la vida de las sociedades modernas y los valores,
patrones culturales y actitudes ante los problemas del hombre y la sociedad, vigentes en
cada momento.
Por ello su contenido constituye un material indispensable para el conocimiento de estas
sociedades.

En consecuencia, es clara la importancia del análisis de contenido, en cuanto técnica


para el análisis científico de todos estos materiales.

5.8.7.3.2. Fases del análisis de contenido

El análisis de contenido no es otra cosa que una modalidad especial de la aplicación del
método científico en las ciencias sociales. Sus operaciones son por tanto,
fundamentalmente, las mismas indicadas al hablar de la investigación social en general.

Por ello me limitaré a ocuparme de las que por el objeto de análisis de contenido,
presentan particularidades más destacadas: el muestreo, la determinación de unidades de
análisis, la elección de categorías y la confección del cuadro de recogida de datos.

LA utilización de una muestra en el análisis de contenido, pueden ser muchas veces


indispensables en la práctica, dada la multiplicidad frecuente de unidades documentales
a observar. La particularidad que presenta el muestreo en este caso es que aquí no se
refiere a personas, sino a fuentes documentales, número o espacios de periódicos y de
revistas, ejemplares de libros, emisiones de radio y TV, etc.

LOS tipos principales de muestreo en este caso son tres que no se excluyen entre sí: de
fuentes, por ejemplo, elección entre los distintos títulos, de periódicos y revistas; de
fechas, muestreo entre los números de cada fuente; y de espacios: dentro de un mismo
documento, se pueden distinguir espacios iguales, numerarlos y sortear entre ellos.

Merece mención especial el muestreo de números o el de emisiones. En él hay que tener


en cuenta que, dado el carácter periódico de estas fuentes documentales, la base de la
muestra que se elija o forme, generalmente no será homogénea, y presentará diferencias
según los meses, años, estaciones, semanas y los días de la semana.

Una forma de obviar este inconveniente es adoptar un sistema de muestreo rotatorio, en


el que se vayan cambiando, por ejemplo, los días de la en los sucesivos meses.

Unidades de análisis.- Las unidades de análisis en el análisis de contenido son


modalidades especiales y particularizadas de las unidades DE observación.
SI en un análisis de contenido que verse sobre la prensa se puede decir que la unidad de
observación genérica es cada número del diario, las unidades de análisis concretas
dentro de cada número del periódico pueden ser muy diversas, según el objeto de la
investigación, por ejemplo: las palabras, las frases, los párrafos, los artículos, los temas
tratados, las secciones del periódico, los títulos de los artículos, etc.

Modalidades fundamentales de estas unidades son las unidades de contexto, las de


registro y las reglas de enumeración. Las unidades de contexto están formadas por las
partes o segmentos del contenido de los documentos necesarios para comprender el
significado de las unidades de registro. Puede ser el ámbito, espacio de texto entre dos
puntos y seguido consecutivos, el párrafo, el parágrafo, el capítulo, el documento
entero.

La unidad de registro es la unidad de significación que se busca en el texto, se extrae del


mismo y se codifica. Sus modalidades pueden ser también muy diversas, tales como
palabras, temas o afirmaciones sobre algo, asuntos generales tratados, personajes que
intervienen en el mensaje, los sucesos o acontecimientos que se narran en él, o el
documento mismo como un todo.

Las unidades de registro se cuentan en el análisis de contenido pero las maneras de


contarlas pueden ser muy diversas. De aquí la necesidad de reglas de enumeración que
precisan dicha forma de recuento. Entre ellas cabe destacar, como más común de todas,
la frecuencia o número de veces que se repite la unidad de registro en la unidad de
contexto; la simple presencia o ausencia de la unidad de registro; la gradación de la
intensidad de significación de la comunicación; el orden de aparición de las unidades de
registro; la co-ocurrencia o presencia simultánea de dichas unidades.

Uno de los análisis de contenido más simple y empleado, es el que versa sobre los temas
o asuntos. Por ejemplo, es frecuente analizar los contenidos de la prensa, emisiones de
radio y TV, clasificando este contenido según la importancia concedida y la extensión
que ocupan en estos medios informativos, cada clase de asuntos tratados: políticos, reli-
giosos, educativos, artísticos, musicales, deportivos, etc. En este caso las unidades de
análisis suelen ser el artículo, la noticia, el comentario, etc., completos.
También es corriente establecer una lista de palabras clave en una ideología, y sus
contrarias como base de referencia y comparación, y luego contar las frecuencias con
que se encuentran en los documentos estudiados. Aquí las unidades de análisis son las
palabras.

Un tipo de análisis intermedio entre éste y el anterior es establecer un conjunto de


proposiciones características de una actitud, doctrina, ideología, partido, etc. y revisar
las ideas expuestas en el documento expresando numéricamente la frecuencia de
acuerdo o desacuerdo con ellas. En este caso, las unidades de análisis son generalmente
los párrafos.

Para terminar, se puede igualmente analizar un texto fijándose en el tipo de aserciones


empleadas por el autor preferentemente: activas o pasivas, referentes al pasado, al
presente o al futuro; relativas al autor o a oirás personas. En este caso las unidades de
análisis son las oraciones.

5.8.7.3.3. Elección de categorías

En la investigación social, se llaman categorías a cada uno de los elementos o


dimensiones que comprende una variable cualitativa. Por ejemplo, la variable profesión,
comprende las categorías obrero, empleado administrativo, funcionario civil, militar,
etc.

Las categorías representan unos elementos más concretos, definidos y singulares que las
variables empíricas o indicadores. Constituyen cada uno de los elementos singulares que
vamos a buscar en la investigación, referentes a determinadas variables.

De acuerdo con esta noción, en el análisis de contenido se llaman categorías a cada uno
de los elementos o dimensiones últimos y más imples de las variables investigadas, que
nos van a servir para clasificar o agrupar según ellas las unidades de análisis del texto.

Es obvio que no se puede hacer una enumeración de categorías posibles en el análisis


de contenido. Por eso sólo aludiremos por ejemplo a algunos de los tipos más
frecuentes.
Categorías de materia o asuntos. Se refieren a los temas tratados por los documentos,
por ejemplo: políticos, económicos, sociológicos, laborales, religiosos, etc.

Categorías referentes al sentido de la comunicación en relación a aluna cuestión:


Ejemplo de estas categorías lo son las de favorable, desfavorable, neutral, etc.

Las categorías de valores, o de lo que la gente desea, quiere o busca. Son categorías de
este tipo, por ejemplo, el dinero, la salud, el amor, el éxito, etc.

Categorías sobre formas de acción posible. Entre ellas se encuentran, el análisis de los
hechos, la propaganda, la negociación, la organización, la utilización de medios
económicos, la violencia, etc.

Categorías referentes a los actores. Aquí se engloban todas las categorías referentes a las
variables básicas de identificación de los sujetos humanos. Son las referentes al sexo:
hombre y mujer; al estado civil: casado, viudo, soltero, etc.

Categorías que indican una toma de posición del autor, tales como la aprobación,
desaprobación, pesimismo, optimismo, afirmación, negación.

Las categorías como los indicadores, constituyen la red utilizada en la investigación. Por
ello de la perfección o imperfección del conjunto que se forme depende el éxito o
fracaso del trabajo emprendido.

Para el establecimiento de categorías hay que tener en cuenta el objetivo de la


investigación y el material a investigar. En relación a éste se recomienda releerlo varias
veces. Esta lectura facilitará la determinación de las categorías a emplear.

En todo caso se debe probar con ensayos previos la validez y seguridad de las categorías
elegidas.

El cuadro

El instrumento de observación básico de que se dispone hasta ahora en el análisis de


contenido es el cuadro.

El cuadro deberá comprender todas las categorías sobre las que se va a recoger
información en los documentos.
Cada categoría ha de tener los espacios necesarios para anotar en ellos la intensidad,
frecuencia y las características que se quieten registrar sobre cada una de ellas.

A cada unidad de observación o documentos independientes se dedicará un cuadro, o


más si son necesarios, en el que se consignarán los datos que identifiquen dicha unidad.

Si no se está seguro dónde clasificar un contenido, se puede tomar nota de él y después


decidir a que categoría antigua o nueva se atribuye.

Se recomienda anotar en cada contenido clasificado la categoría en que lo fue, para que
se pueda contrastar la exactitud y precisión de la clasificación.

Se deberá también contrastar la seguridad del cuadro, mediante la aplicación al mismo


material por distintos observadores, así como su validez.

5.8.7.4. ANÁLISIS SECUNDARIO DE DOCUMENTOS

Se entiende por análisis secundario de documentos o de datos documentales (Hakim,


1982) todo posterior análisis de un conjunto de datos primarios que ofrezca
interpretaciones y conclusiones adicionales o en forma diferente a la presentada en el
primer informe de investigación.

Según esta definición, el análisis secundario de datos implica dos requisitos:

1) Un análisis posterior o reanálisis de datos obtenidos y analizados anteriormente.

2) Que el nuevo análisis no sea una repetición de los análisis conocidos ya realizados con
los datos, sino que, por abarcar más datos que éstos, basarse en tratamientos diferentes de
los datos, emplear tipos de análisis diversos, ofrezca interpretaciones y conclusiones
adicionales o en forma diferente a las ofrecidas en el primer análisis.

Las fuentes principales de los datos que se emplean en el análisis de datos secundarios
numéricos son:

a) Las estadísticas de todo tipo.


b) Los protocolos que contienen el conjunto de resultados numéricos en los que se
concretan las investigaciones científicas realizadas, mediante encuestas, experimentos,
etc.

c) Los bancos de datos.

Dentro de las estadísticas, merecen mención especial las realizadas por los Institutos
Nacionales de Estadística. Estos organismos, encargados primero de realizar los censos
de población, suelen tener a su cargo en la actualidad la realización periódica de grandes
encuestas nacionales, por ejemplo, en España, sobre el empleo y los presupuestos
familiares.

En cuanto a los protocolos de investigaciones, en ellos se contienen las medidas de las


variables investigadas obtenidas en la observación y en general los análisis numéricos
efectuados y sus resultados. Esta masa le datos no es explotada o analizada
exhaustivamente en las investigaciones originales y, por tanto, puede ser objeto de
nuevos análisis secundarios.

Los bancos de datos se caracterizan por la aplicación de medios informáticos para el


almacenamiento ordenado y la recuperación de datos numéricos, que pueden proceder,
bien de fuentes estadísticas, o de protocolos de investigaciones realizadas. Por tanto, se
trata de una fuente complementaria de las otras dos indicadas.

EL análisis de datos secundarios puede tener múltiples aplicaciones, entre las que se
pueden destacar las siguientes:

a) La elaboración de informes tanto generales como particulares o referentes a un tema


muy específico.

b) Realización de análisis basados en un nuevo marco teórico distinto de los ya


empleados anteriormente en los datos.

c) Reanálisis mediante la aplicación de nuevas técnicas y para contrastar nuevas


hipótesis.
Sobre todo, se debe subrayar que también se pueden realizar investigaciones
importantes mediante la utilización de datos viejos o secundarios y que la originalidad
de una investigación no depende de que en ella se utilicen datos primarios.

Entre sus ventajas, señaladas por los autores (Hackim, 1982), se pueden destacar las
siguientes:

1) Es posible que el investigador creativo pero desorganizado no trabaje a gusto en el


equipo de una gran encuesta; si se especializa en el análisis secundario, puede
trabajar solo y utilizar los datos recogidos por un equipo bien organizado.

2) Los investigadores, que buscan evidencia empírica para teorías, pueden evitar la
nueva colección de datos valiéndose del análisis secundario.

3) Los investigadores interesados en el desarrollo de indicadores sociales se deberán


basar exclusivamente en datos estadísticos.

4) En el caso de falta de recursos económicos, la investigación académica, tesis


doctoral por ejemplo, basada en datos secundarios puede ser una alternativa al
pequeño estudio local o a la larga disertación teórica, dado que normalmente es
mucho más barata que la investigación empírica exigida por una nueva colección de
datos.

Por último, cabe subrayar por Boudon (1975), la necesidad para el desarrollo de la
investigación social y de las ciencias sociales de la formación de una contabilidad social
y el establecimiento de bancos do datos sociales.

5.9. ESCALAS EN LAS CIENCIAS SOCIALES

Con relación a la palabra escalas se utilizan en las ciencias sociales tres términos: uno
genérico, escalas sin más, y dos específicos, escalas sociométricas y escalas de
actitudes.

El primer término es genérico porque es común a todas las ciencias y no solo a las
sociales.
Es el estudiado en el primer capítulo de esta misma sección, dedicado a la observación,
a la medida y a las escalas.

Una escala en sentido genérico se define, según vimos, como la disposición conjunta de
cosas distintas pero comunes en algún aspecto.

Como las ciencias sociales se basan en el descubrimiento y análisis de relaciones entre


variables, que están formadas por diversas categorías o dimensiones, se puede decir que
operan también con escalas. En efecto, el conjunto de categorías o dimensiones de las
variables constituyen de hecho una escala que corresponden a algunos de los tipos
mencionados: nominales, ordinales, de intervalo y de razón, según la naturaleza de la
variable de que se trate. En esta correspondencia se basa la aplicación de los
procedimientos estadísticos de análisis en este campo de las ciencias sociales.

Con el nombre de escalas sociométricas se designa en las ciencias sociales los


instrumentos de medida propios de estas ciencias, constituidos por la disposición
conjunta en un cuadro o cuestionario de los distintos elementos o aspectos de una
característica o actitud, a los que se asigna convencional o empíricamente un valor
numérico, lo que permite cuantificar el grado de esa característica o actitud que se da en
un objeto o sujeto determinado.

Los distintos tipos de escalas, en sentido genérico, nominal, ordinal, de intervalo y de


razón representan diversos niveles de medida.

El nivel más bajo, el menos exacto, corresponde a las escalas nomina les, y el más
elevado y más exacto a las escalas de intervalo y de razón.

En gran parte los procedimientos de observación estudiados aquí corresponden al nivel


de medida más bajo, el nominal.

Frente a ellos, las escalas sociométricas pretenden ser instrumentos de observación y de


medida más rigurosos. En ellas se alcanza en todo caso el nivel de medida ordinal con
puntuaciones específicas para cada sujeto, que en algunos casos se consideran formadas
por intervalos iguales y se tratan como escalas de intervalo.
5.9.1. Escalas de actitudes

Aunque se utilizan escalas sociométricas para medir características diversas, las más
conocidas, numerosas y utilizadas son las escalas de actitudes, es decir aquellas que se
emplean para medir el grado en que se da una actitud o disposición de ánimo
permanente, respecto a cuestiones específicas en un sujeto determinado.

Las escalas de actitud tienen en la actualidad una gran aplicación en las investigaciones
sociales, bien de manera independiente, bien formando parte de cuestionarios simples o
de entrevistas. Dada su esencial condición numérica, como instrumentos de medida,
proporcionan al cuantificar los resultados de las observaciones, una precisión más
elevada y una mayor posibilidad de aplicación de las matemáticas a su análisis y
estudio, así como hacen más viable el contrastar y comprobar en nuevas investigaciones
los resultados anteriores obtenidos.

5.9.1.1. Fundamento de las escalas de actitudes

Desarrollando la noción que poco ha he apuntado, las actitudes se pueden definir como
disposiciones permanentes de ánimo formadas por Un conjunto de convicciones y
sentimientos que llevan al sujeto que las llene a actuar y expresarse según ellas en sus
actos y opiniones.

Según la anterior definición, las actitudes comprenden tres factores:

1) Un factor ideológico formado por ideas y convicciones determinadas.

2) Un factor sentimental que implica simpatía o antipatía hacia cosas I) personas.

3) Un factor reactivo que impulsa a pensar y obrar en las distintas situaciones sociales
en consonancia con las convicciones y sentimientos profesados.

Las actitudes pues se concretan y expresan en ideas, sentimientos hacia cosas y personas
y reacciones o modos de actuación diversos.

Por ello, sus manifestaciones en la vida social son múltiples y se puede decir que tiñen
todos los campos de la vida social.
Por ejemplo, supuesto un sujeto que sea progresista esta actitud, se reflejará en sus ideas
y actos en todos los campos de la vida social: familiar, educativo, político, económico,
religioso, cultural, recreativo, etc.

Todas estas manifestaciones constituyen los elementos o atributos de las actitudes. Si


fuera posible concretar y expresar todas ellas en un cuadro, en una serie de
proposiciones y reunirías en un conjunto, este cuadro sería representación perfecta de la
actitud en cuestión.

Sin embargo, aunque esto no es posible, si lo es reunir en un cuadro no todas las


proposiciones referentes a una actitud, pero si las que se crean más significativas. La
escala de actitudes no es otra cosa que este conjunto o cuadro.

Los elementos pues de las escalas de actitudes son las proposiciones, se les suele llamar
items, que consisten en expresiones que se refieren a ideas, sentimientos y actos en que
se concreta o manifiesta la actitud.

Los items o proposiciones de las escalas, hacen las veces de estímulos ante los cuales
los encuestados deben reaccionar de una u otra forma.

Estos elementos, proposiciones o items de las escalas no sólo concretan y especifican


las actitudes, también facilitan su observación al subdividir la actitud, genérica y
abstracta, en rasgos y atributos concretos.

Pero las proposiciones no son únicamente medios o instrumentos de observación sino


también lo son de medición cuantitativa, que es lo propio y distintivo de las escalas. Sin
ello no serían en sustancia otra cosa que un cuestionario simple.

Las proposiciones o items de las escalas de actitudes, igualmente que éstas tienen de por
sí, carácter cualitativo. Para transformarlas en instrumentos de medida cuantitativa, hay
que cuantificarlas.

Se realiza, por ejemplo, bien asignando a cada proposición un valor, en relación a la


actitud de que se trate, como en las escalas tipo Thurstone, o bien asignando no a cada
pregunta, sino a cada respuesta dicho valor, lo que se realiza en las escalas tipo Lickert.
5.9.1.2. Condiciones de las escalas de actitudes

Para que las escalas de actitudes sean útiles como instrumentos de medida deben reunir
ciertas características, difíciles de reunir, entre las que destacan la graduación, la
discriminatividad, la validez, la seguridad, la unidimensionalidad, y el estar formadas
por intervalos iguales.

La graduación supone que las escalas deben comprender todos los grados
fundamentales de la actitud de que se trate, desde los elevados a los medios y bajos y no
sólo parte de ellos.

La discriminatividad implica que sus items deben tener poder discriminante, deben
constituir estímulos capaces de distinguir y dividir, incluso en extremos opuestos, a las
personas en relación a la actitud de que se trate.

La validez y seguridad son condiciones que, como hemos visto ya se exigen a todo
instrumento de observación. Sin embargo, en las escalas revisten importancia especial,
dado su carácter de instrumentos de medida cuantitativa.

La validez es la aptitud real de la escala para medir lo que pretende medir. Exige que los
resultados obtenidos con la escala reflejen verdaderamente la extensión real en los
sujetos de la actividad investigada.

Por su parte, la seguridad pide que la escala en sucesivas aplicaciones a los mismos
grupos y en situaciones similares proporcione resultados iguales o similares.

En cuanto a la unidimensionalidad implica que la escala se refiera a una sola propiedad


o actitud. Si hace referencia a dos o más no se podrá conocer en realidad la verdadera
significación de los resultados obtenidos.

La sexta y última condición indicada, estar formada por intervalos IGUALES, en rigor no
la cumplen las escalas conocidas hasta ahora. No obstante pretenden reuniría y se
consideran en la práctica como tales, LAS escalas experimentales del tipo Thurstone.
5.9.1.3. Tipos de escalas de actitudes

Existen diversos criterios de clasificación de las escalas de actitudes; Sin embargo, hay
dos que parecen tener mayor interés.

El primero, es un criterio de clasificación antiguo, se podría decir Clásico, en cierto


modo superado, pero que conserva todavía interés práctico. Es el que divide a las
escalas según el procedimiento de su valoración en arbitrarias y experimentales.

Escalas arbitrarias son todas aquellas en las cuales el procedimiento DE valoración tiene
su origen en el convenio o arbitrio de los constructores de escalas. Por el contrario, en
las escalas experimentales, dicho procedimiento de valoración no es subjetivo, sino
resultado de un experimento.

El segundo criterio de clasificación es más moderno y tiene una fundamentación teórica


mayor. Se basa en qué están centradas las escalas de actitudes: los sujetos a través de
sus respuestas, los items o proposiciones, o ambas cosas a la vez.

Siguiendo al profesor Bugeda (1974, p. 46 y ss.) en el primer caso, a cada sujeto se le


adscribirá una cantidad de la actitud considerada, según su puntuación en las respuestas.
La mayor parte de las escalas son de este tipo, como las de Likert, Chapin, Sevell y en
general, las arbitrarias. Los estímulos o preguntas son aquí una simple repetición que
.sirve para ordenar las reacciones de cada elemento medido.

En el segundo caso se trata de medir y ordenar los diversos estímulos empleados o


proposiciones, con ayuda de un equipo de jueces. Se les denomina escalas de juicio. Las
escalas de Thorndike y de Thurstone son de éste tipo.

En el tercer caso, se trata de escalar tanto los estímulos como los sujetos. Ejemplo: los
métodos derivados de los escalogramas de Louis Guttman. En el primer tipo la
variabilidad de respuestas o de reacciones al estímulo de los items se atribuye a los
sujetos, en el segundo, a las diferencias de los mismos estímulos y en el tercero, "la
variabilidad de la reacción ha de explicarse ahora en base de las diferencias tanto entre
los sujetos, como en los estímulos".
También existe la distinción entre las escalas o tests de tipo A y los de tipo B. En los
primeros, los sujetos a través de sus respuestas se sitúan a lo largo del continuo de la
actitud variable. En los segundos, los sujetos sitúan un objeto a lo largo de dicho
continuo.

5.9.1.3.1. Escalas de actitudes arbitrarias

Entre las escalas de actitudes de esta clase se encuentran las siguientes: escalas de
puntos, escalas de clasificación, escalas de intensidad y escalas de proposiciones.

Las primeras consisten en una serie de palabras o proposiciones que se presentan al


encuestado para que tache o borre las que le sean desagradables, las que
espontáneamente le produzcan un sentimiento de repulsión.

Para puntuar estas escalas se pueden seguir diversos procedimientos. Uno de ellos
podría ser asignar a cada individuo en principio un número ESCALAS EN LAS CIENCIAS

SOCIALES.

5.9.1.3.1.1. Escalas de actitudes de clasificación

Las llamadas escalas de clasificación consisten en clasificar por orden de preferencia


una serie de proposiciones, palabras, ocupaciones, objetos, etc.

La puntuación en este caso se puede realizar sumando los números de los lugares que
ocupan en la clasificación, las proposiciones referentes a la actitud que se quiere medir.

5.9.1.3.1.2. Escalas de actitudes de intensidad

Se trata en ellas de elegir respecto a una pregunta o proposición entre varias respuestas
que expresan el grado de aceptación o rechazo de la pregunta en cuestión.

Normalmente las categorías de las preguntas en estas escalas suelen ser cinco o siete,
del tipo siguiente:

Muy conforme, conforme, indiferente, disconforme, muy disconforme.

En el caso de siete se añaden a las anteriores en los extremos los de absolutamente


conforme y absolutamente disconforme.
La puntuación en estas escalas se establece simplemente sumando al número de orden
de las categorías elegidas dentro de cada item.

En este tipo de escalas hay que tener en cuenta que la valoración dada a los items o
preguntas de la escala que representen la actitud opuesta a la que se mide se computa
inversamente. Es decir, que en ella el absoluto desacuerdo vale 1 punto, en lugar de 7, y
en absoluto acuerdo 7 en lugar de 1.

A esta clase de escalas de actitudes pertenecen las del tipo Likert, bastante conocidas y
empleadas.

Una objeción importante que se hace a las escalas de Likert es que en ellas se valoran
igual todos los items, a pesar de que unos pueden denotar una actitud más intensa que
otros.

5.9.1.3.1.3. Escalas de actitudes de proposiciones

Se caracterizan porque constan de una serie de actuaciones favorables y desfavorables, a


un grupo social, o en general a un fenómeno de interés social.

Dentro de esta especie de escalas es muy conocida la de Bogardus, utilizada mucho en


Norteamérica para medir la actitud hacia los negros, o la distancia racial hacia ellos.

Los items o categorías de esta escala de actitudes, que se pueden utilizar en relación a
cualquier grupo étnico o racial, son:

1) Aceptarlos incluso para casamiento.

2) Como amigos regulares.

3) Como compañeros de trabajo.

4) Como vecinos.

5) Como conocidos.

6) Les excluiría de mi vecindario.

7) Les excluiría de mi país.


Similar a la de Bogardus es la de distancia social de Dodd. En ella se propone una serie
de grupos sociales, por ejemplo, capitalistas, profesiones liberales, oficinistas, y se
pregunta que se señale respecto a cada uno de ellos la conducta que se escogería con
más agrado de las siguientes:

1) Si deseara casarme, lo haría gustosamente con uno de ellos.

2) Le invitaría gustosamente a cenar.

3) Prefiero considerarlas como personas a las que se conoce de vista, y con las que
se cambian algunas palabras al azar si se las encuentra.

4) No me resulta nada agradable el encuentro con una de estas personas.

5) Me gustaría que se suprimiera a todos estos individuos.

La puntuación en este caso se determina simplemente por el número de orden del item
elegido. Así por ejemplo, si alguien respecto a los obreros eligiera el item 1, se le
asignaría un 1 de distancia social respecto a ellos.

a) Escalas tipo Thurstone

Presentan diferentes reacciones actitudinales solicitando al sujeto que señale con cuál de
ellas se identifica más.

Le viene el nombre de su autor puesto que fue L. Thurstone (1929) quien construyó un
prototipo y teorizó sobre sus características. Lo que hizo Thurstone fue redactar un gran
número de reacciones actitudinales posibles. Esas posibles reacciones se sometieron
después al juicio de expertos para que las clasificaran en 11 grados distintos (de A a K)
según entendieran que se trataba de reacciones más favorables o menos favorables. El
punto medio o neutral se estableció en la F. Del listado inicial de ítems se eliminaron
aquellos que merecieron valoraciones más divergentes entre los jueces.

Las reacciones posibles que aparecen en este tipo de Escalas representan un punto
en el contínuum entre la actitud más favorable y la más desfavorable. Las diversas
frases tratan de reflejar sentimientos a intervalos aproximadamente iguales entre los dos
polos de la actitud.
Así, según van los sujetos identificándose con unas u otras de las afirmaciones de
la Escala podemos situarlos en una determinada posición con respecto a cada una de las
actitudes recogidas. En cada una de las actitudes los sujetos recibirán como puntuación
el valor medio de las reacciones con las que se identificaron.

b) Escalas tipo Likert

Estas Escalas recogen diferentes tipos de proposiciones individuales (con descripciones


de reacciones actitudinales, con conductas posibles, con opiniones, etc.) relacionadas
con las actitudes que se desea evaluar.

Lo que se le pide a los sujetos es que manifiesten su posición con respecto a la


afirmación que contiene cada ítem. Las respuestas pueden ser numéricas (señalando de
1 a 5, o de 1 a 7 el mayor o menor nivel de acuerdo) o descriptivas (marcando la frase
posicional con la que se identifique: Muy de acuerdo, de acuerdo, indeciso, en
desacuerdo, en total desacuerdo).

Por su sencillez y fácil elaboración, este tipo de Escalas son las más frecuentes en la
evaluación de actitudes.

c) Escalas tipo Guttman.

Estas escalas recogen diferentes posiciones (casi siempre distribuidas en 4 escalones) en


las reacciones actitudinales. Se supone que cada nivel superior de la escala engloba a los
anteriores, de manera tal que, si un sujeto responde sí al nivel tres, necesariamente
habría de responder sí a los dos anteriores.

El problema principal que plantea es la selección de las frases que reflejen contenidos
claramente acumulativos en relación a cada actitud. Guttman defendió que la selección
de las frases debe ser el producto de la intuición y experiencia del evaluador.

d) Escalas de distancia social (Bogardus 1925)

Este tipo de escala presenta diferentes actitudes de aceptación-rechazo hacia personas


ordenándolas en base al nivel de proximidad y cooperación que uno/a estaría dispuesto
a mantener con ella.
Los grados de distancia social que presenta la escala son 7 y van desde una vinculación
intima tipo matrimonio (en el polo positivo) hasta la expulsión del país (en el polo
negativo).

La estructura completa de la Escala es la siguiente:

«Aceptaría a tales personas a...

1. Una vinculación íntima (matrimonio o similar).

2. Mi club como camarada.

3. Mi calle como vecino.

4. Mi puesto de trabajo como compañero de profesión.

5. Mi país como compatriota.

6. Mi país como visitante turista.

7. Los excluiría de mi país.

En su origen se trataba de un tipo de escala destinada al análisis de las actitudes raciales


o hacia sujetos de otras nacionalidades. Sin embargo, como su estructura es muy diáfana
y versátil ha recibido muchas aplicaciones a ámbitos actitudinales muy diferentes.

e) Diferencial Semántico

Se trata de un tipo de instrumento que posee particularidades que la hacen diferente a


las otras escalas. Su estructura formal es también diferente: se propone a los sujetos un
listado de adjetivos contrapuestos (cada uno de los cuales define uno de los polos de la
actitud) y se les pide que sitúen la cosa que se esté juzgando en alguna de las posiciones
marcadas entre los adjetivos opuestos.

Un ejemplo de diferencial semántico podría ser el siguiente:

«Yo veo mi escuela así:

Mala ................................................................. Buena

Interesante....................................................... Aburrida
Segura .............................................................. Peligrosa

Pesada .............................................................. Ligera

Seria ................................................................. Alegre

Este tipo de instrumento de valoración de actitudes desarrollado por Osgood (1957)


parte del supuesto de que las personas, objetos, situaciones, etc. (en definitiva todo
aquello que puede constituir el objeto de una actitud) poseen varias dimensiones de
significado. Una dimensión denotativa u objetiva que puede ser descrita o valorada en
términos explícitos. Y una dimensión connotativa o emocional difícil de ser descrita
pero sí representable indirectamente mediante la atribución de una posición en relación
a adjetivos contrapuestos. En su opinión, a través del diferencial semántico se pueden
medir los componentes cognoscitivos y sentimentales de las actitudes.

Los análisis posteriores realizados sobre gran cantidad de escalas respondidas


identificaron tres factores generales presentes en las valoraciones: valorativo, de
potencia, de actividad.

- El factor valorativo se halla vinculado a pares de adjetivos del tipo bueno-malo,


bello-feo, dulce-amargo, limpio-sucio, sabroso-repugnante, valioso-no valioso,
piadoso-cruel; placentero-desagradable, dulce-ácido.

- El factor de potencia se halla vinculado a pares de adjetivos del tipo fuerte-débil,


grande-pequeño, pesado-ligero, grueso-delgado.

- El factor de actividad se halla vinculado a pares de adjetivos del tipo activo-pasivo,


rápido-lento, caliente-frío, agudo-obtuso.

Consideraciones a tener en cuenta a la hora de construir Escalas de actitudes y valores

Para evaluar actitudes y valores podemos utilizar Escalas ya elaboradas que estén
disponibles en la literatura especializada o en el mercado de tests y pruebas. Pero
también podemos decidirnos por construir nosotros mismos escalas que se adapten
mejor a las características de nuestra situación y a los propósitos de nuestra evaluación.
En tal caso, hemos de tomar en consideración las condiciones técnicas que deben regir
la elaboración de escalas de actitudes.

La mayor parte de los autores que describen los distintos tipos de escalas indican a
renglón seguido cómo debe actuarse para elaborar buenas escalas. Quizá el repertorio
más conocido y citado de consejos sea el de Edwards (1957) que ha señalado 14
«criterios informales» para elaborar los enunciados de las escalas de actitudes:

1) Evitar enunciados que se refieran al pasado y no al presente.

2) Evitar enunciados que sean propósitos o que puedan ser interpretados como tales.

3) Evitar enunciados que puedan ser interpretados de más de una manera.

4) Evitar enunciados que sean irrelevantes al objeto de evaluación que se considera.

5) Evitar enunciados que puedan ser aceptados por casi todo el mundo o por casi
nadie.

6) Seleccionar los enunciados que se piense que cubren la gama completa de la escala
afectiva de intereses.

7) Mantener en los enunciados un lenguaje simple, claro y directo.

8) Las frases deben ser cortas; no deberían exceder las 20 palabras.

9) Cada enunciado debe contener un único concepto completo.

10) Los enunciados que contengan universales tales como todo, siempre, ninguno o
nunca a menudo introducen ambigüedad y deben ser evitados.

11) Palabras tales como sólo, justo, meramente y otras de naturaleza similar, deben ser
utilizadas con cautela y moderación al escribir los enunciados.

12) Siempre que sea posible, los enunciados deben presentarse en forma de frases
simples y no de frases compuestas o complejas.

13) Evitar la utilización de palabras que puedan no ser comprendidas por los sujetos a
los que se aplica la escala.
14) Evitar la utilización de negaciones dobles.

Aún se podrían añadir otras recomendaciones al amplio listado de Edwards. En concreto


convendría tener en cuenta que:

- Si se utilizan tópicos, los sujetos van a tender a responder mediante respuestas


estereotipadas (tendencia a situarse con la mayoría).

- Los enunciados deben redactarse en positivo (para evitar el doble negativo).

- Si las frases reflejan posturas de valor explícito o enunciados construidos sobre


valores (por ej. «para mí la paz es muy importante») los sujetos van a tender a
asimilarse con ellas (nadie se identifica con un contravalor, aunque su conducta no
sea consistente con él).

- Por supuesto, las escalas, como cualquier otro instrumento de evaluación han de
responder a los criterios metodológicos clásicos: consistencia interna y validez,
representatividad, Habilidad, etc.).

Hay que prestar una especial atención a que la escala resulte válidamente
discriminativa, es decir, que las diferencias detectadas en la escala respondan realmente
a diferencias en la actitud que se posee y, de la misma manera, que iguales resultados en
las escalas se correspondan con posturas actitudinales similares.

Caso de no resultar así podríamos entender que la variación en las respuestas no ha


dependido de las diferencias en actitud sino de otros factores contaminantes: tendencia a
responder en la zona central, tendencia a dar la «mejor imagen» de sí mismo, tendencia
a adoptar la postura mayoritaria, dificultad para discriminar entre los diferentes rangos
propuestos, etc.

5.9.1.3.1.4. ESCALAS DE ACTITUDES EXPERIMENTALES

Son, como he indicado, aquellas en que cada item tiene un valor o puntuación
establecido experimentalmente.

Las más extendidas de estas escalas son las de Thurstone. Formalmente son similares a
las de intensidad, en cuanto consisten en un conjunto de proposiciones referentes a la
actitud de que se trata. Sin embargo se diferencian de las escalas de intensidad en que
cada item o pregunta tiene asignado un valor, el valor escalar, obtenido experimental-
mente. Los valores escalares de los items o preguntas deben cubrir toda la extensión o
continuo de estas escalas.

Estos valores escalares son causa de que exista una diferencia o distancia entre los
valores escalares de cada pregunta, por lo que se dice que estas escalas tienen distancia
y por ello se les llama de intervalo.

Para la aplicación de estas escalas únicamente se pide a los encuesta-dos que indiquen si
aceptan o rechazan cada item. La puntuación se determina sumando los valores
escalares de las proposiciones que aceptan y hallando su media.

Una de las críticas principales que se hacen a las escalas tipo Thurstone es que la
valoración hecha por los jueces puede no ser adecuada para el grupo a que se aplique.

Además, estas escalas de actitudes no discriminan a los sujetos que alcanzan un misma
puntuación, cuando los items que aceptan son distintos si bien suman lo mismo.

5.9.1.3.1.5. OTROS TIPOS DE ESCALAS DE ACTITUDES

Entre ellos se pueden destacar: el escalograma de Guttman y el diferenciador semántico.

El primero está formado por una serie de preguntas a las que se contesta simplemente si
o no, pero formuladas de tal manera y en tal orden que el contestar sí a una de ellas
supone normal y lógicamente contestar sí a todas las siguientes.

El propósito de Guttman fue construir escalas verdaderamente unidimensionales, en las


cuales sus preguntas o items formasen una jerarquía rigurosa, de modo que la
aceptación de una proposición implicara lógicamente la aceptación de las de nivel
jerárquico inferior.

En estas escalas están valoradas tanto las preguntas por su orden jerárquico, como los
sujetos, porque su aceptación o rechazo de las proposiciones permite conocer su puesto
en la escala.
La puntuación total de los encuestados se determina por el número de items o preguntas
a las que han respondido sí. También en esta puntuación se deben tener en cuenta el
número de fallos o de veces que los síes o noes rompen el orden jerárquico de la escala.

En el llamado diferenciador semántico, se presentan pares de calificativos opuestos,


fuerte-débil, grande-pequeño, etc., dividiendo cada par en una graduación de siete
puntos. Se debe a Osgood y es en sí originariamente una técnica semántica para medir el
significado que tiene algo para un individuo, aunque se puede utilizar también para
medir la actitud hacia ese algo.

Una de las funciones de este tipo de escalas es proporcionar una medida indirecta de los
sentimientos subyacentes, incluso inconscientes, hacia un término o palabra.

Se puede aplicar este tipo de escalas a diversos objetos o personas y permite captar la
impresión que causan en el encuestado, o sea su imagen. Se deben aplicar
comparativamente.

El análisis factorial de una gran cantidad de diferenciales semánticos ha descubierto que


con ellos se miden tres dimensiones básicas:

a) El valor (bueno-malo), o la evaluación que hace el sujeto de los entes propuestos.

b) El poder, (fuerte-débil), o la percepción por el sujeto de la potencia del ente en


cuestión.

c) La actividad (activo-pesado: rápido-lento), o sea la percepción del dinamismo del


ente en cuestión.

Como señala J. Padua (1980, 224), Osgood ha propuesto la escala universal siguiente,
que como tal puede ser usada para medir la actitud hacia cualquier ser: Bueno-malo;
débil-fuerte; exaltado-moderado; absurdo-significativo; blando-duro: pasivo-activo;
positivo-negativo; poderoso-impotente; frío-cálido. En estas escalas están valoradas
tanto las preguntas por su orden jerárquico, como los sujetos, porque su aceptación o
rechazo de las proposiciones permite conocer su puesto en la escala.

La puntuación total de los encuestados se determina por el número de items o preguntas


a las que han respondido sí. También en esta puntuación se deben tener en cuenta el
número de fallos o de veces que los sí es o no es rompen el orden jerárquico de la
escala.

En el llamado diferenciador semántico, se presentan pares de calificativos opuestos,


fuerte-débil, grande-pequeño, etc., dividiendo cada par en una graduación de siete
puntos. Se debe a Osgood y es en sí originariamente una técnica semántica para medir el
significado que tiene algo para un individuo, aunque se puede utilizar también para
medir la actitud hacia ese algo.

Una de las funciones de este tipo de escalas es proporcionar una medida indirecta de los
sentimientos subyacentes, incluso inconscientes, hacia un término o palabra.

Se puede aplicar este tipo de escalas a diversos objetos o personas y permite captar la
impresión que causan en el encuestado, o sea su imagen. Se deben aplicar
comparativamente.

El análisis factorial de una gran cantidad de diferenciales semánticos lia descubierto que
con ellos se miden tres dimensiones básicas:

a) El valor (bueno-malo), o la evaluación que hace el sujeto de los entes propuestos.

b) El poder, (fuerte-débil), o la percepción por el sujeto de la potencia del ente en


cuestión.

c) La actividad (activo-pesado: rápido-lento), o sea la percepción del dinamismo del


ente en cuestión.

Como señala J. Padua (1980, 224), Osgood ha propuesto la escala universal siguiente,
que como tal puede ser usada para medir la actitud hacia cualquier ser: Bueno-malo;
débil-fuerte; exaltado-moderado; absurdo-significativo; blando-duro: pasivo-activo;
positivo-negativo; poderoso-impotente; frío-cálido.

5.10. COSTRUCCIÓN DE ESCALAS

5.10.1. Construcción de la escala de Likert

En la construcción de las escalas se pueden distinguir, en general, las siguientes


operaciones básicas:
1) Búsqueda de las proposiciones, items o estímulos representativos de la actitud o
conceptos que se pretenden medir.

2) Prueba de cada uno de los items para contrastar si representan adecuadamente a la


actitud.

3) Establecimiento de un procedimiento de valoración de la escala, arbitrario o


experimental según el tipo de escala elegido.

4) Prueba de la escala completa para comprobar su validez y seguridad.

La construcción de las escalas de Likert consiste en primer lugar en pensar y formular


una serie de proposiciones, bastantes, pueden ser cien o más, referentes a la actitud en
cuestión.

En segundo lugar dichos items o proposiciones se someten a la prueba de aplicarlos a un


grupo, para eliminar los items inadecuados, que no se ajustan bien a la actitud que se
pretende medir.

Se averigua para todos los encuestados la puntuación total y se seleccionan de todos


ellos el 25 % que ha obtenido una puntuación superior y el 25 % que la haya obtenido
inferior. Se forman así dos grupos, superior e inferior de la escalas. Respecto a estos dos
grupos se analiza su forma de contestación a cada proposición. Este análisis se basa en
el supuesto de que si se trata de un item que se ajusta a la actitud en cuestión, la
puntuación media respecto a este item del grupo superior debe ser significativamente
más elevada que la del grupo inferior. Para comprobar esta significatividad de las
diferencias se utiliza comunmente la prueba estadística t.

Los items o proposiciones en los cuales las diferencias entre los dos grupos no sean
significativas se eliminan y sólo se dejan en la escala aquellos en lo que dicha diferencia
haya resultado significativa.

También se puede comprobar la consistencia de los items de esta escala correlacionando


las puntuaciones de los sujetos en el item X con sus puntuaciones totales en la escala
menos la del item X. (Ver ejercicio 145).
5.10.2. Construcción de las escalas de Thurstone

La construcción de las escalas de Thurstone consiste en síntesis en pensar un grupo


elevado de preguntas o proposiciones en relación a la actitud que se pretende medir,
favorables y adversas y neutrales en todos sus grados.

Estas proposiciones se someten a un grupo que hace de jueces y se les pide que señalen
la valoración que a su juicio objetivo, no personal, tiene el item o proposición respecto a
la actitud en cuestión.

Como existe la posibilidad de que los jueces cumplan mal su tarea, por ello se deben
analizar las evaluaciones de cada uno, y eliminarlas en el caso de que su trabajo sea
deficiente. Por ejemplo, se pueden eliminar los jueces que den el mismo valor a un
número elevado de ítems.

La valoración han de hacerla, según una escala continua de la 11 puntos, en el que el 1


significa el máximo acuerdo y el 11 el máximo desacuerdo con la proposición.

Valorados los items de este modo por los jueces, se halla, para cada uno, la media y la
desviación típica de las valoraciones que han dado los jueces.

La media constituye la ponderación o valor escalar que se da al item. En cuanto a la


desviación típica, los items en que ésta sobrepasa por ejemplo el valor de dos se
eliminan.

En lugar de la media y la desviación típica, se pueden utilizar la mediana y la dispersión


intercuartílica, lo que se estima más recomendable, ya que, matemáticamente, en
realidad, la escala es más ordinal que de intervalo.

Los items eliminados son, por tanto, aquellos en los que la dispersión de las
valoraciones de los jueces es mayor, y por tanto es menor su acuerdo respecto a la
significación del item en cuestión respecto a la actitud medida.

Suelen quedar unas treinta proposiciones. Se debe procurar que se distribuyan a lo largo
de la escala de modo más uniforme posible y cubriendo todos sus valores, sin huecos,
del 1 al 11.
5.10.3. Construcción de las escalas de Guttman

Se empieza igual que en los casos anteriores, formulando un número de preguntas o


ítems en relación a la actitud de que se trata que pueden llegar hasta 5 0 .

Este conjunto de preguntas se somete para su prueba a un grupo que debe contestar a
todas ellas sí o no.

Con las respuestas dadas a todas las preguntas, se forma una tabla, que se llama
escalograma.

En este cuadro consignamos la forma de respuesta de cada sujeto, designamos con una
X su aceptación de los items y con O su desacuerdo con ellos.

Seguidamente se computa la puntuación total de cada sujeto del grupo. Después estas
puntuaciones se ordenan de la más alta a la más baja. A continuación, con las respuestas
dadas a todas las preguntas se forma un cuadro que se llama escalograma. La finalidad
de esta operación se dirige a jerarquizar rigurosamente los items. En este escalograma
los items se disponen en sentido horizontal y los sujetos en sentido vertical, 0 sea, se
atribuyen a los primeros las columnas y a los segundos las filas de la tabla.

Después por aproximaciones sucesivas se forman las nuevas tablas que sean necesarias,
hasta que se consiga ordenar por orden jerárquico las proposiciones y las respuestas. A
la vez se van eliminando las preguntas que presentan respuestas muy desviadas que
infringen la jerarquización debida a las preguntas.

Se estima que la jerarquización de una escala de Guttman, es buena (liando su


coeficiente de reproductibilidad es al menos de 0 , 9 0 . Algun o s autores admiten
también a partir del 0 , 8 5 .

Este coeficiente se calcula según la fórmula siguiente:

R= 1-

En el que E es el número total de errores o fallos. Q el número de preguntas del


escalograma y S el número de sujetos.
Para computar según la técnica de Goodenough el número de errores, establecen, con
signos más y menos todos los patrones de respuesta posibles, tanto los que se ajusten a
la exigencia de jerarquización de l a e s c a l a como los que se apartan de ella. Después
se buscan en el escalograma los casos de sujetos que corresponden a cada tipo de
respuestas n o j e r a r q u i z a d a s . Este número multiplicado por el número de errores
que suponga cada patrón de respuesta no jerarquizada y su suma nos da el total de
errores.

Este escalograma nos ofrece una jerarquización global de la escala y en relación al


mismo se puede realizar una primera estimación de la bondad de esta jerarquización
calculando el coeficiente de reproductibilidad.

Sin embargo, la técnica anterior no nos dice nada sobre el grado de jeraquización de las
respuestas dadas por el grupo, respecto a cada item por separado.

Para remediar este defecto el mismo Guttmann ideó otra técnica de construcción de esta
escala, que recibe el nombre de Cornell, por la Universidad donde fue ensayada.

De acuerdo con ella, en la aplicación de la escala al grupo de prueba, cada sujeto debe
contestar a cada item como si fuera una escala de Likert, es decir, según diversos grados
de acuerdo, normalmente 5.

A continuación se halla la puntuación total de cada sujeto y se ordenan éstos por orden
de puntuación de mayor a menor.

Si hubiera una jerarquización perfecta dentro de cada item, entonces los que tienen una
puntuación más elevada en la escala completa, deberían tener en cada item una
puntuación no inferior a la que ostentan en el mismo items otros sujetos de puntuación
global inferior.

Esto se ve gráficamente también mediante la construcción de un escalograma más


complicado que el anterior. Si no ocurre así, se hacen igualmente que antes
manipulaciones en los grados de los items para mejorar su escalabilidad, a la vez que se
eliminan lOS items muy anómalos.
Para un mayor detalle sobre la construcción de esta escala y de las anteriores, se pueden
consultar la obra del Prof. Bugeda, La medida en las Ciencias Sociales (1975) y la de
Jorge Padua (1980).

5.11. Las curvas de opinión publica

En relación al análisis de los resultados de las escalas de actitudes presentan interés


especial las llamadas curvas de opinión pública.

Como escribe el profesor Bugeda (1974, 208), imaginemos, por ejemplo, que una
encuesta o escala de opinión sobre los esquimales se aplica a un grupo de universitarios
españoles.

Lo más normal es que muy pocos de ellos, si algunos, manifiesten una máxima
aceptación de los esquimales. También será lo más probable que muy pocos les odien
de tal forma que expresen en la encuesta su rechazo total hacia ellos.

Los grados de aceptación se acumularán más bien en las categorías intermedias. Girarán
en torno a la indiferencia y una moderada simpatía o antipatía hacia los esquimales.

La representación histográfica de una opinión semejante daría lugar a la formación de


una curva normal de probabilidades, o sea de las llamadas de campana de Gauss. En
realidad ésta es la representación típica de cualquier fenómeno natural.

Pero imaginemos, por el contrario, que a ese mismo grupo de jóvenes españoles le
planteamos, en vez del indiferente tema de los esquimales, una cuestión que les
apasione, como el feminismo, el divorcio, el aborto, la selectividad universitaria, etc.

Lo que ocurriría ahora sería una cosa muy diferente.

Las categorías de indiferencia estarán probablemente vacías. Tampoco estarán muy


llenas las que signifiquen aceptación o rechazo moderados. Lo más probable es que las
opiniones se concentren en las categorías extremas, máxima aceptación o máximo
rechazo o en ambas.
Esto indica que el grupo está dividido en cuanto a opinión o actitud sobre el tema,
aunque desde luego, esta división no tiene por qué ser en dos partes iguales, ya que
normalmente uno de los grupos de actitud predominará en cada tema sobre el otro.

Esta partición polémica de un grupo social en torno a una cuestión que considera
fundamental, es precisamente la señal de que estamos ante la opinión pública.

De ello se deduce que la opinión privada y la opinión pública dan lugar a distintas clases
de curvas.

Según he indicado, la curva típica de la opinión privada es la curva de Gauss, llamada


también normal. Las curvas típicas de la opinión pública no son del tipo de campana,
como las de las opiniones privadas, sino que aparecen más bien bajo la forma de
campana invertida, o de una rama de ésta. Por ello algunos las llaman curvas en U, J o l.

Las escalas de actitudes se refieren normalmente a opciones fundamentales de los


individuos, de ahí que interese examinar, en relación a los resultados de su aplicación, si
existe o no opinión pública en el grupo observado.

A este efecto, se pueden formar las curvas del grupo para la escala en su conjunto o
respecto a un item determinado, así como las curvas de frecuencias acumulativas.

Con relación a estas curvas de opinión pública se plantea también el problema


estadístico de determinar si la anormalidad de distribución que se interpreta como de
opinión pública es realmente significativa y no se debe simplemente al azar.

Para ello se puede utilizar uno de los tests estadísticos más conocidos y utilizados en las
ciencias sociales: el ji cuadrado.

5.12. PROBLEMAS EN LA OBSERVACIÓN DEL COMPORTAMIENTO

5.12.1. El observador

El principal problema de la observación del comportamiento reside en el observador.


Una de las dificultades de las entrevistas es que el entrevistador forma parte del
instrumento de medición. Dicho problema casi no existe en las pruebas y escalas
objetivas. En la observación del comportamiento, el observador es tanto una fortaleza,
como una debilidad crucial. Esto se debe a que el observador debe asimilar la
información derivada de las observaciones, para luego realizar inferencias acerca de los
constructos. El observador mira cierto comportamiento —por ejemplo, un niño que
golpea a otro niño— y debe procesar, de alguna manera, tal observación y hacer una
inferencia de que el comportamiento es una manifestación del constructo "agresión" o
"comportamiento agresivo", o incluso "hostilidad". La fortaleza y debilidad del
procedimiento es el poder de inferencia del observador. Si no fuera por la inferencia,
una máquina observadora sería mejor que un observador humano. La fortaleza radica en
que el observador puede relacionar el comportamiento observado con el constructo o
variables de un estudio al unir el comportamiento con el constructo. Una de las
dificultades recurrentes de la medición consiste en lograr cerrar el abismo que existe
entre el comportamiento y el constructo.

La debilidad básica del observador consiste en que se pueden realizar inferencias in-
correctas a partir de las observaciones. Considere dos casos extremos. Suponga, por un
lado, que un observador, que se muestra muy hostil ante la educación escolar religiosa,
observa las clases en una escuela religiosa. Queda claro que los prejuicios de esta
persona pueden invalidar las observaciones. El observador tal vez califique a un maestro
adaptable como inflexible debido a la existencia de un prejuicio o a la percepción de
que la enseñanza en escuelas religiosas es inflexible. O tal vez ese mismo observador
juzgue el comportamiento realmente estimulante de un maestro de una escuela religiosa
como insulso. Por otro lado, suponga que un observador pueda ser completamente
objetivo y no sabe nada sobre la educación pública o religiosa. En cierto sentido
cualquier observación que realice no estará sesgada; pero será inadecuada. La
observación del comportamiento humano requiere de un conocimiento competente
sobre dicho comportamiento y aun del significado del comportamiento.

Sin embargo, existe otro problema: el observador puede afectar los objetos de obser-
vación en tanto que forma parte de la situación de observación. Sin embargo, en
realidad y por fortuna, éste no constituye un problema severo. De hecho, representa un
problema para el novato, quien parece creer que la gente actúa de forma diferente,
inclusive artificial, cuando se le observa. Parece ser que los observadores ejercen muy
poco efecto en las situaciones que observan. Se percibe que los individuos y los grupos
se adaptan más bien rápidamente a la presencia de un observador y que actúan como
normalmente lo harían. Esto no quiere decir que el observador no pueda ejercer un
efecto. Quiere decir que si el observador es cuidadoso para no interferir y para evitar
que las personas observadas sientan que se están haciendo juicios, entonces el
observador, como estímulo influyente, es prácticamente anulado. Babbie (1995) afirma
que no existe una protección completa para el efecto del observador. Sin embargo, el
conocimiento y la sensibilidad ante este problema ofrecen una protección parcial.

5.12.2. Validez y confiabilidad

En la superficie, nada parece más natural cuando se observa el comportamiento, que


creer que se está midiendo lo que se dice que se está midiendo. Sin embargo, cuando se
da una carga interpretativa al observador, la validez puede verse afectada (así como la
confiabilidad). A mayor carga de interpretación, mayor será el problema de la validez.
No obstante, ello no significa que no deba darse una carga interpretativa al observador.

Un aspecto simple de la validez de las medidas de observación es su poder predictivo.


¿Predicen criterios relevantes de forma confiable? El problema, como siempre, reside en
los criterios. Las medidas independientes de las mismas variables son infrecuentes. ¿Es
posible afirmar que la medida de observación del comportamiento de un maestro es
válida debido a que se correlaciona positivamente con las calificaciones de los
superiores? Se podría tener una medida independiente sobre necesidades orientadas
hacia uno mismo, ¿pero sería esta medida un criterio adecuado para la observación de
dichas necesidades?

Una clave importante para el estudio de la validez de medidas de observación del


comportamiento parece ser la validez de constructo. Si las variables que se miden a
través de un método de observación están inmersas dentro de un marco teórico,
entonces debe existir cierta relación. ¿Verdaderamente existen? Suponga que una
investigación incluye la teoría de la autoeficacia de Bandura (1982), y que se ha
construido un sistema de observación cuyo propósito es medir la competencia en el
desempeño. En efecto, la teoría indica que la autoeficacia percibida, o la autopercepción
de competencia, afecta la competencia del desempeño real de una persona: a mayor
autoeficacia, mayor será la competencia en el desempeño. Si se encuentra que la
autopercepción de la competencia y las medidas de la competencia real observada al
efectuar cierta tarea prescrita son positivas y altas, entonces se apoya la hipótesis
derivada de la teoría. Sin embargo, esto también constituye evidencia de la validez de
constructo del sistema de observación.

La confiabilidad de los sistemas de observación es un asunto simple, aunque por ningún


motivo es fácil. Con frecuencia se define como el acuerdo entre observadores. A partir
de este punto de vista, los registros de películas, videocintas y audiocintas ayudan a
lograr una confiabilidad muy alta. No obstante, el acuerdo entre observadores tiene de-
fectos potenciales. Por ejemplo, la magnitud de un índice de acuerdo en parte se debe al
acuerdo por azar y, por lo tanto, requiere corrección. Quizás el camino más fácil a
seguir sea utilizar diferentes métodos para evaluar la confiabilidad, tal como se haría
con cualquier medida utilizada en investigación del comportamiento: acuerdo de los
observadores, confiabilidad repetida y el método de análisis de varianza. La evaluación
de la confiabilidad y el acuerdo entre observadores son problemas especialmente
difíciles de la observación directa, ya que los estadísticos comunes dependen del
supuesto de que las medidas son independientes —aunque con frecuencia no son
independientes—. La mayor parte del trabajo realizado en esta área proviene o se basa
en el trabajo de Cohén y Flciss sobre el coeficiente kappa (Fleiss, 1986; Fleiss y Cohén,
1973). El uso de la teoría de la generalizabilidad es prometedora en la medición de la
confiabilidad para datos nominales (Li y Lautenschlager, 1997). Algunos desarrollos
provienen de las ciencias de la salud, donde la observación y el acuerdo desempeñan un
papel importante en el análisis y en las decisiones (véase Dunn, 1989, 1992).
MedleyyMitzel (1963) ofrecen una profunda, pero técnicamente compleja, exposición
sobre la confiabilidad de valoraciones en un marco del análisis de varianza. Hollenbeck
(1978) y Rowley (1976) discuten acerca de la confiabilidad de las observaciones cuando
las medidas son nominales. Revisiones más recientes sobre la confiabilidad de las
observaciones y la confiabilidad intercalificadora se encuentran en Dewey (1989),
McDermott (1988), Perreault y Leigh (1989), Schouten (1986), Topf (1986), Zegers
(1991) y Zwick (1988). El artículo de Perreault y Leigh trata el tema desde el punto de
vista de la investigación de mercado. Topf revisa el uso de las medidas de confiabilidad
nominales en investigación de enfermería, y McDermott analiza su aplicación en la
psicología escolar. Chan (1987), Oud y Satder (1984), y Powers (1985) han desarrollado
programas computacionales para ayudar a los investigadores a calcular estadísticos del
acuerdo entre observadores.

Entonces, es necesario definir con precisión y sin ambigüedades lo que se va a observar.


Si se está midiendo la curiosidad, se debe decir al observador qué es un comportamien-
to curioso. Si se mide la cooperatividad, se debe explicar de alguna manera al
observador de qué forma se distingue el comportamiento cooperativo de otros tipos de
comportamiento. Esto quiere decir que se debe proporcionar al observador alguna forma
de definición operacional de la variable que se está midiendo; la variable debe definirse
en términos de comportamiento.

5.12.3. Categorías

La tarea fundamental del observador consiste en asignar categorías a los


comportamientos. Recuerde, del trabajo previo sobre particiones, que las categorías
deben ser exhaustivas y mutuamente excluyentes. Para satisfacer la condición de
exhaustividad primero debe definirse U , el universo de comportamientos que se van a
observar. En algunos sistemas de observación esto no es difícil de lograr. McGee y
Snyder (1975), para comprobar la hipótesis de que la gente que sala sus alimentos antes
de probarlos, percibe que el control del comportamiento está dentro del individuo
(control disposicional), más que en el ambiente (control situacional), simplemente
observaron la conducta de salar la comida de los participantes en restaurantes. En otros
sistemas de observación resulta más difícil. Muchos, o la mayoría de los sistemas de
observación citados en la enorme antología de instrumentos de observación de Simón y
Boyer(1970), Mirrorsfor Bebavior, son complejos y difíciles de utilizar. ¡Este trabajo
consiste de 14 volúmenes de instrumentos de observación del comportamiento! La
mayoría de tales instrumentos, 67 de 79, son utilizados para observaciones educativas.
Los lectores que pretendan utilizar observación de comportamiento en su investigación
deben consultar dicha información, en especial el volumen 1, que contiene un análisis
general en las páginas 1-24.

En concordancia con el énfasis de este libro —de que el propósito de la mayoría de la


observación es medir variables— se cita un sistema de observación en el salón de clases
del interesante y creativo trabajo de Kounin y sus colegas (Kounin y Doyle, 1975;
Kounin y Gump, 1974). El sistema reportado es más complejo que el sistema de
observación de salar y probar los alimentos, pero mucho menos complejo que muchos
sistemas de observación en el salón de clases. La variable observada fue la de
compromiso con la tarea, que se observó al videofilmar 596 lecciones y luego
observarlas en video para obtener medidas de compromiso. Las medidas se clasificaron
como alto compromiso con la tarea y bajo compromiso con la tarea. Los autores
también midieron la continuidad en las lecciones creando categorías que reflejaban
mayor o menor continuidad en las mismas. Cuando se observaba el comportamiento de
niños, utilizaron las categorías para registrar los comportamientos pertinentes
observados.

5.12.4. Unidades de comportamiento

Decidir qué unidades utilizar en la medición del comportamiento humano continúa


siendo un problema sin resolver. Aquí con frecuencia se enfrenta un conflicto entre las
demandas de la confiabilidad y la validez. Teóricamente es posible lograr un alto grado
de confiabilidad utilizando unidades pequeñas y fáciles de observar y registrar. Puede
intentarse definir el comportamiento de manera operacional al hacer una lista de un gran
número de actos de comportamiento, pudiendo lograr así, por lo general, un alto grado
de precisión y confiabilidad. Sin embargo, al hacer esto también puede reducirse tanto
el comportamiento que ya no guarde demasiada semejanza con el comportamiento que
se intentaba observar, con lo cual se pierde validez.

Por otra parte, pueden utilizarse amplias definiciones "naturales" y quizás lograr un alto
grado de validez. Se podría instruir a los observadores para que observen la
cooperatividady definir el comportamiento de cooperación como "aceptar los métodos,
sugerencias e ideas de otras personas; trabajar armónicamente con otros para lograr
metas" o alguna definición más bien general. Si los observadores han tenido experiencia
de grupo y comprenden los procesos grupales, entonces podría esperarse que pudieran
evaluar de manera válida el comportamiento como cooperativo o no cooperativo, al
utilizar dicha definición. Una definición tan general e incluso tan vaga como ésta le
permite al observador capturar, si le es posible, toda la gama del comportamiento
cooperativo. No obstante, su gran ambigüedad permite que se hagan diferentes
interpretaciones, disminuyendo probablemente su confiabilidad.
Algunos investigadores que siguen un modelo fuertemente operacional insisten en que
se realicen definiciones sumamente específicas de las variables observadas. Ellos
enlistarán diversos comportamientos específicos que el observador debe anotar; ningún
otro se observa ni se registra. Modelos extremos como éste pueden producir una
confiabilidad alta, pero también pueden perder parte del aspecto esencial de las
variables observadas. Suponga que se hace una lista de 10 tipos específicos de
comportamientos para cooperatividad y que el universo de posibles comportamientos
consta de 40 o 50 tipos. En efecto, se perderán aspectos importantes de la
cooperatividad. Aunque aquello que se mide puede medirse de forma confiable, quizá
resulte bastante trivial o irrelevante, en parte, para la variable.

5.12.5. Cooperatividad

Este es el problema molar-molecular de cualquier procedimiento de medición en las


ciencias sociales. El modelo molar toma "todos" de comportamiento más grandes como
unidades de observación. Unidades completas de interacción pueden especificarse como
blancos de observación. El comportamiento verbal puede separarse en intercambios
completos entre dos o más individuos, o en párrafos u oraciones completas. En
contraste, el modelo molecular toma segmentos más pequeños de comportamiento como
unidades de observación. Cada intercambio completo o parcial puede registrarse. Las
unidades de comportamiento verbal quizá sean palabras o frases cortas. Los
observadores molares empiezan con una variable general definida de forma amplia,
como se dijo antes, y observan y registran una variedad de comportamientos bajo la
única rúbrica. La interpretación que den al significado del comportamiento que
observan depende de la experiencia y conocimiento que tengan. Por otra parte, los
observadores moleculares tratan de sacar su propia experiencia, conocimiento e
interpretación de la escena de observación; registran lo que ven y nada más.

5.12.6. Inferencia del observador

Los sistemas de observación difieren en otra importante dimensión: la cantidad de


inferencia requerida del observador. Los sistemas moleculares requieren relativamente
de poca inferencia. El observador simplemente anota si un individuo hace o dice algo.
Por ejemplo, un sistema puede requerir que el observador anote cada unidad de
interacción, que puede estar definida como cualquier intercambio verbal entre dos
individuos. Si ocurre un intercambio, se anota; si no ocurre, no se anota. Otra categoría
podría ser "golpea a otro niño" . Cada vez que un niño golpee a otro, ello se anota. No
se hacen inferencias en este sistema —si, por supuesto, es acaso posible escapar a las
inferencias (por ejemplo, "golpea")—. Se registra el comportamiento puro lo más
posible.

Son escasos los sistemas de observadores con un nivel tan bajo de inferencia por parte
del observador. La mayor parte de los sistemas requieren de cierto nivel de inferencia.
Un investigador puede estar realizando investigación sobre el comportamiento del
consejo de educación, y decide que un análisis con poca inferencia se ajusta al
problema, y utiliza reactivos de observación como "sugiere un curso de acción",
"interrumpe a otro miembro del consejo", "plantea una pregunta", "da una orden a!
superintendente", y otras similares. Puesto que dichos reactivos son ambiguos
comparativamente, la confiabilidad de la observación necesita ser alta.

Los sistemas que requieren que el observador utilice altos niveles de inferencia son más
comunes y probablemente más útiles en la mayor parte de la investigación. Los sistemas
de observación de alta inferencia proveen al observador categorías denominadas, las
cuales requieren de mayor o menor interpretación del comportamiento observado. Por
ejemplo, suponga que se mide la dominancia, que se define como los intentos realizados
por un individuo para mostrar superioridad intelectual (o de otro tipo) sobre otros
individuos, con poco reconocimiento de las metas de grupo y de las contribuciones de
otros. Esto, por supuesto, requerirá de un mayor nivel de inferencia del observador, y
los observadores tendrán que entrenarse para que exista acuerdo sobre lo que
constituyen comportamientos dominantes. Sin dicho entrenamiento y acuerdo —y
probablemente sin experiencia en procesos grupales— la confiabilidad puede verse
amenazada. Weick (1968) presenta una sofisticada exposición sobre la inferencia en la
observación, y también analiza los sesgos en la observación y sugiere soluciones
metodológicas para minimizar los efectos del sesgo. Señalamientos similares son
pertinentes cuando se intentan medir muchas variables psicológicas y sociológicas:
cooperación, competencia, agresividad, democracia, aptitud verbal, rendimiento y clase
social, por ejemplo. Para revisar discusiones más recientes sobre observación e
inferencia en estas áreas se recomienda leer Alexander, Newell, Robbinsy Turner
(1995); Borich y Klinzing (1984); Chavez (1984); Ilartmann y Wood (1990); Jaffe
(1997); Nurius y Gibson (1990), y Timberlake y Silva (1994). Los artículos de Borich y
Klinzing y de Chavez se aplican a las observaciones en salón de clases. Martmann y
Wood tratan los sistemas de observación del comportamiento utilizados en modificación
conductual. Nurius y Gibson tratan la observación e inferencia clínica encontrada en el
trabajo social. En estrecha relación están los artículos de Jaffe y el de Alexander et al,
que tratan las observaciones clínicas. Timberlake y Silva tratan la observación e
inferencia obtenida al observar la conducta de animales.

No es posible realizar generalizaciones uniformes sobre las virtudes relativas de siste-


mas con diferentes niveles de inferencia. Tal vez el mejor consejo para el neófito sea
buscar un nivel medio de inferencia. Las categorías demasiado vagas, con muy poca
especificación sobre qué se va a observar, ponen una carga excesiva sobre el
observador. Es muy fácil que diferentes observadores den distintas interpretaciones al
mismo comportamiento. Las categorías demasiado específicas, aunque reducen la
ambigüedad y la incertidumbre, pueden tender a ser demasiado rígidas e inflexibles, e
incluso triviales. Lo mejor es que el lector estudie varios sistemas exitosos, poniendo
especial atención a las categorías de comportamiento y a las definiciones (instrucciones)
ligadas a las categorías para guía del observador.

5.12.7. Generalización y aplicabilidad

Los sistemas de observación difieren considerablemente en su generalización, o en el


grado de aplicabilidad a las situaciones de investigación distintas de aquellas para las
que fueron diseñadas originalmente. Algunos sistemas son bastante generales: están
diseñados para utilizarse con muchos problemas de investigación diferentes. El
reconocido análisis de grupo de interacción de Bales (1951) es uno de dichos sistemas
generales. Es un sistema de baja inferencia en el que todo el comportamiento verbal y
no verbal, presuntamente en cualquier grupo, puede clasificarse dentro de una de 12
categorías: "muestra solidaridad", "está de acuerdo", "pide opinión", etcétera. Las 12
categorías están agrupadas dentro de tres grandes conjuntos: social emocional positivo,
social emocional negativo y de tarea neutral.
Sin embargo, algunos sistemas fueron construidos para situaciones particulares de
investigación, para medir variables particulares. El ejemplo anterior sobre salar los ali-
mentos, es bastante específico y difícilmente se aplica a otras situaciones. El sistema de
Kounin y Doyle (1975), que aunque fue construido específicamente para la
investigación de Kounin, se aplica en muchas situaciones del salón de clases. De hecho,
la mayor parte de los sistemas elaborados para problemas de investigación específicos
se utilizan a menudo con ciertas modificaciones, en otros problemas de investigación.

Resulta necesario enfatizar que los "pequeños" sistemas de observación sirven para
medir variables específicas. Suponga, por ejemplo, que la atención de los alumnos de
escuela primaria sea una variable clave en una teoría sobre el rendimiento escolar. La
atención (como rasgo o hábito), por sí mismo, ejerce poco efecto sobre el rendimiento:
considere que la correlación es cero. Es una variable clave debido a que interactúa con
cierto método de enseñanza y tiene un efecto pronunciado indirecto sobre el
rendimiento. Asumiendo que esto es así, se debe medir la atención. Parece claro que se
tendrá que observar el comportamiento del alumno, mientras se esté utilizando el
método en cuestión y un método de "control". En tal caso, se necesita encontrar o
diseñar un sistema de observación que se enfoque en la atención. Para evaluar la
influencia del ambiente del salón de clases, por ejemplo, Keeves (1972) concluyó que
era necesario medir la atención al observar a los estudiantes a quienes les pedía que
pusieran atención a una tarea asignada por el maestro. Se asignaron puntuaciones que
indicaban atención o la falta de ella. Este "pequeño" sistema de observación era
confiable y aparentemente válido. Es probable que sistemas con objetivos específicos
como éste incrementen su empleo en la investigación del comportamiento,
especialmente en educación.

5.12.8. Muestreo del comportamiento

El muestreo, la última característica de las observaciones, estrictamente hablando no es


una característica. Es una forma para obtener observaciones. Antes de usar un sistema
de observación en investigación, debe decidirse cuándo y cómo se aplicará el sistema.
Si se va a observar el comportamiento de los maestros en el salón de clase, ¿cómo se
muestrearán los comportamientos? ¿Se observarán todos los comportamientos
específicos en un periodo de clase? ¿O se harán muéstreos de forma sistemática y
aleatoria de comportamientos específicos? En otras palabras, debe diseñarse y utilizarse
un plan de muestreo de algún tipo.

Existen dos aspectos del muestreo del comportamiento: el muestreo de eventos y el


muestreo de tiempo. El muestreo de eventos es la selección de la observación de las
ocurrencias integrales de comportamiento o eventos de cierta clase. Ejemplos de
eventos integrales son los berrinches, las peleas y disputas, los juegos, los intercambios
verbales sobre temas específicos, las interacciones entre alumnos y maestros en el salón
de clases, etcétera. El investigador que estudia eventos debe saber cuándo ocurrirán
dichos eventos y debe estar presente cuando sucedan, como con eventos del salón de
clases; o esperar hasta que sucedan, como en las peleas.

El muestreo de eventos posee tres virtudes: 1) Los eventos son situaciones naturales de
la vida y, por lo tanto, tienen una validez inherente que las muestras de tiempo por lo
común no poseen. 2) Un evento integral posee una continuidad de comportamiento que
los actos de comportamiento fragmentados de las muestras de tiempo no poseen. Si se
observa una situación de solución de problemas desde el inicio hasta el final, entonces
se está contemplando una unidad completa y natural de comportamiento individual y
grupal. Al hacerlo, se logra una unidad completa y realista más grande del
comportamiento individual y social. Como se estudió en un capítulo anterior, cuando se
expusieron los experimentos de campo y los estudios de campo, las situaciones
naturales impactan y se acercan a la realidad psicológica y social de una manera que los
experimentadores normalmente no logran. 3) La tercera virtud del muestreo de eventos
implica una característica importante de muchos eventos de comportamiento: en algunas
ocasiones son inusuales y poco frecuentes. Por ejemplo, se puede estar interesado en las
decisiones tomadas en reuniones administrativas y legislativas; o tal vez interesarse en
el último paso de la solución de problemas. Los métodos disciplinarios de los maestros
constituyen una variable. Dichos eventos y muchos otros son relativamente poco
frecuentes. Como tales, pueden perderse fácilmente por el muestreo de tiempo; por lo
tanto, requieren de un muestreo de eventos. Sin embargo, si se toma el punto de vista
más activo de observación promulgado por Weick (1968), es posible arreglar las
situaciones para asegurarse de la ocurrencia más frecuente de eventos que suceden en
pocas ocasiones.
El muestreo de tiempo es la selección de unidades de comportamiento para observación
en diferentes momentos del tiempo. Pueden seleccionarse de formas sistemáticas o
aleatorias para obtener muestras del comportamiento. Un buen ejemplo es el
comportamiento del maestro. Suponga que se estudian las relaciones entre ciertas
variables como el estado de alerta, la justicia y la iniciativa del maestro, por una parte; y
la iniciativa y cooperación del alumno, por la otra. Se pueden seleccionar muestras
aleatorias de maestros y después tomar muestras de tiempo de sus actos de
comportamiento. Tales muestras de tiempo pueden ser sistemáticas: tres observaciones
de 5 minutos en momentos específicos durante cada una de, por ejemplo, cinco horas de
clase, siendo las horas de clase el primero, tercero y quinto periodos de un día, y el
segundo y cuarto periodos del día siguiente. O pueden ser al azar: cinco periodos de 5
minutos de observación seleccionados aleatoriamente de un universo especificado de
periodos de 5 minutos. De hecho existen muchas maneras de establecer y seleccionar
muestras de tiempo. Como siempre, la forma en que se eligen dichas muestras, su
duración y su número debe estar determinada por el problema de investigación. En un
fascinante estudio sobre el liderazgo y el poder de la influencia grupal en niños
pequeños, Merei (1949) señala que el muestreo de tiempo sólo mostraría líderes dando
órdenes y al grupo obedeciendo; mientras que observaciones prolongadas mostrarían los
mecanismos internos del hecho de dar órdenes y obedecer.

Las muestras de tiempo tienen la importante ventaja de incrementar la probabilidad de


obtener muestras representativas de comportamiento. Sin embargo, ello es así sólo con
los comportamientos que ocurren con mucha frecuencia. Los comportamientos poco
frecuentes tienen una alta probabilidad de escapar de la red de muestreo, a menos que se
seleccionen muestras enormes. El comportamiento creativo, compasivo y hostil, por
ejemplo, quizá sea muy poco frecuente. Aun así, el muestreo de tiempo constituye una
contribución positiva al estudio científico del comportamiento humano.

Como se explicó antes, las muestras de tiempo carecen de continuidad, de un contexto


adecuado y, aun, de naturalidad. Lo anterior es cierto particularmente cuando se utilizan
pequeñas unidades de tiempo y de comportamiento. Sin embargo, no hay razón para que
el muestreo de eventos y el muestreo de tiempo no puedan combinarse algunas veces. Si
se estudian recitaciones en el salón de clases, se selecciona una muestra aleatoria de los
periodos de clase de un maestro en diferentes momentos, y se observan todas las
recitaciones durante los periodos que se muestrearon, en su totalidad.

Algunas referencias muy buenas sobre el muestreo de eventos y el muestreo de tiempo


se encuentran en Arrington (1943), Martin y Bateson (1993), Wright (1960) y Zeren y
Makosky (1986). El artículo de Zereny Alakosky es sobresaliente, pues describe un
ejercicio de salón de clases para enseñar a los estudiantes a realizar observaciones
sistemáticas de comportamiento humano espontáneo. Además se describen tres técnicas
de observación (muestreo de tiempo, muestreo de eventos y calificación de rasgos) y se
compara su uso en comportamientos simulados presentados en televisión. La actividad
en la clase incluyó una conferencia sobre métodos de observación, un ejercicio en donde
se utilizaba uno de los tres métodos y una discusión en la clase. El artículo expone cómo
enseñar el método científico para reunir datos de observación, la importancia de
elaborar definiciones operacionales precisas para el acuerdo intercalificadores y el
cálculo de coeficientes de confiabilidad.

5.12.9. Escalas de calificación

Hasta este punto, se ha hablado únicamente acerca de la observación de


comportamiento real. Los observadores observan y escuchan directamente a los objetos
en cuestión. Se sientan en el salón de clases y observan las interacciones
maestro-alumno y alumno-alumno. O quizá vean y escuchen a un grupo de niños que
resuelve un problema, frente a un espejo de doble vista.

Sin embargo, existe otra clase de observación del comportamiento que necesita
mencionarse. Este tipo de observación se denominará comportamiento recordado o
comportamiento percibido. Está clasificado convenientemente bajo el tema de las
escalas de calificación. Para medir el comportamiento recordado o percibido, por lo
común se les presenta a los observadores un sistema de observación en forma de escala
de algún tipo, y se les pide que evalúen una o más características de un objeto, cuando
el objeto no esté presente. Para hacerlo, ellos deben evaluar basándose en observaciones
pasadas o en percepciones sobre cómo es el objeto observado y sobre cómo se
comportará. Una forma conveniente para medir tanto el comportamiento real como el
comportamiento percibido o recordado son las escalas de calificación.
Una escala de calificación es un instrumento de medición que requiere que un califica-
dor u observador asigne al objeto calificado categorías o continuos que poseen valores
numéricos asignados a ellos. Las escalas de calificación son quizás los instrumentos de
medición más comunes, probablemente debido a que en apariencia son fáciles de cons-
truir y, lo más importante, son fáciles y rápidas de utilizar. Por desgracia, su aparente
facilidad de construcción es engañosa, y la facilidad de uso conlleva un precio alto: la
falta de validez debida a un número de fuentes de sesgo que entran en las medidas de
calificación. No obstante, con conocimiento, habilidad y cuidado, las calificaciones
resultan valiosas.

Para revisar un excelente estudio de las escalas de calificación, véase Guilford (1954),
Nunnally (1978), Nunnally y Bernstcin (1993) y Torgeson (1958). Si se desea revisar
una presentación relativamente poco técnica sobre las escalas de calificación se
recomienda leer a Selltiz, Jahoda, Deutsch y Cook (1961). Aunque las escalas de
calificación ya se mencionaron con anterioridad en este libro, no se analizaron de
manera sistemática. Al leer lo que sigue, el estudiante debe tener en mente que las
escalas de calificación son en realidad escalas objetivas y, como tales, deberían haberse
incluido en el capítulo 30. Su exposición se reservó para este capítulo a causa de que la
exposición del capítulo 30 está enfocada principalmente en medidas donde responde el
sujeto a quien se está midiendo. Las escalas de calificación, por otro lado, son medidas
de individuos y sus reacciones, características y comportamientos, realizadas por
observadores. Entonces, el contraste está en la forma en que el sujeto se observa a sí
mismo y cómo lo perciben los demás. Las escalas de calificación también sirven para
medir objetos, productos y estímulos psicológicos, tales como la escritura manual, los
conceptos, los ensayos, los protocolos de entrevista y los materiales de pruebas
proyectivas.

5.12.10. Tipos de escalas de calificación

Existen cuatro o cinco tipos de escalas de calificación, dos de los cuales se analizaron en
el capítulo 30. Se trata de los listados y los instrumentos de elección forzada. Ahora se
consideran sólo tres tipos y sus características: la escala de calificación de categorías, la
escala de calificación numérica y la escala de calificación gráfica. Son bastante
similares y difieren sólo en algunos detalles.
La escala de calificación de categorías presenta a los observadores o jueces varias
categorías, de donde ellos eligen la que mejor caracteriza el comportamiento o
características del objeto que se califica. Suponga que se califica el comportamiento de
una maestra en el salón de clases. Una de las características que se califica es, por
ejemplo, el estado de alerta. Un reactivo de categoría podría ser similar al que se mostró
en el primer ejemplo. Una forma diferente utiliza descripciones condensadas; un
reactivo de este tipo sería como el que se presenta en el segundo ejemplo

Ejemplos

¿Qué tan alerta es ella? (Marque una)

a) Muy alerta

b) Alerta

c) Poco alerta

d) Nada aletta

¿Emplea recursos? (Marque una)

a) Siempre emplea recursos; nunca le faltan ideas

b) Sus recursos son buenos

c) Algunas veces carece de ideas

d) No emplea recursos; rara vez tiene ideas

Las escalas de calificación numérica son, quizás, las más fáciles de construir y de
utilizar. Además, también producen números que pueden usarse directamente en análisis
estadísticos. Por otro lado, como los números representan intervalos iguales en la mente
del observador, pueden alcanzar la medición intervalar (véase Guilford, 1954, p. 264).
Cualquiera de las anteriores escalas de categorías puede convertirse fácil y rápidamente
en escalas de calificación numérica, simplemente añadiendo números antes de cada una
de las categorías. Los números 3, 2,1,0 o 4, 3, 2, 1 pueden agregarse al reactivo del
estado de alerta mencionado anteriormente. Un método de calificación numérica
conveniente consiste en el empleo del mismo sistema numérico, por ejemplo, 4, 3, 2, 1,0
con cada reactivo. Éste es, por supuesto, el sistema utilizado en las escalas de actitud de
puntuación sumada. Sin embargo, en las escalas de calificación, probablemente sea
mejor dar tanto la descripción verbal como los valores numéricos.

En las escalas de calificación gráfica se combinan líneas o barras con frases


descriptivas. El reactivo del estado de alerta, que se expuso antes, podría aparecer de la
siguiente manera en forma gráfica:

_______________________________________________________________

Muy alerta Alerta Poco alerta Nada alerta

Tales escalas incluyen muchas variedades: líneas verticales segmentadas, líneas conti-
nuas, líneas sin marcas, líneas divididas en intervalos iguales marcados (como la
anterior) y otras. Probablemente se trata de las mejores formas de las escalas de
calificación y las más utilizadas. Fijan un continuo en la mente del observador; sugieren
intervalos iguales, y son claras y fáciles de comprender y de usar. Guilford (1954, p.
268) las sobrestima un poco cuando afirma: "son muchas las virtudes de las escalas de
calificación gráfica, y sus fallas son pocas", pero su señalamiento se toma a bien.

5.12.11. Debilidades de las escalas de calificación

Las escalas de calificaciones tienen dos serias debilidades, una es extrínseca y la otra
intrínseca. El defecto extrínseco consiste en que son aparentemente tan fáciles de
construir y de usar, que se utilizan de forma indiscriminada, a menudo sin conocimiento
de sus defectos intrínsecos. No se hará una pausa para mencionar los errores que pueden
escabullirse en la construcción y empleo inadecuados de las escalas de calificación. En
lugar de eso, se alerta al lector en contra de su uso para cualquiera y todas las
necesidades de medición. Primero debe plantearse la pregunta: ¿existe una mejor forma
para medir mis variables? Si es así, es necesario utilizarla; si no, entonces se deben
estudiar las características de las buenas escalas de calificación, trabajar con esmerado
cuidado y poner los resultados de las calificaciones bajo prueba empírica y análisis
estadístico adecuado.
El defecto intrínseco de las escalas de calificación es su tendencia al error constante o
por sesgo, lo cual no es nuevo para el lector, por supuesto, pues dicho problema se
abordó cuando se consideró la fijeza de respuesta. Sin embargo, con las calificaciones
es especialmente amenazante para la validez. El error constante de calificación toma
varias formas, de las cuales la más penetrante es el famoso efecto de halo. Se trata de la
tendencia a valorar un objeto en la dirección constante de una impresión general del
objeto. Casos diarios de halo son, por ejemplo, creer que un hombre es virtuoso porque
nos agrada, y/o manifestar grandes elogios a los presidentes republicanos y condenar a
los demócratas.

El halo se manifiesta con frecuencia en la medición, especialmente con las calificacio-


nes. Los profesores evalúan más alta la calidad de las preguntas de una prueba de
ensayo de lo que deberían, porque les simpatiza el examinado. O tal vez califiquen más
alto (o más bajo) de lo que deberían la segunda, tercera y cuarta preguntas, debido a que
la primera pregunta estuvo bien contestada (o mal contestada). La evaluación que hace
el maestro del rendimiento de los niños, en la cual influye la docilidad o falta de
docilidad de los niños, constituye otro caso de halo. Al evaluar a los individuos con
escalas de calificación, existe la tendencia de que la calificación de una característica
influya en las calificaciones de otras características. Es difícil evitar el halo. Parece ser
particularmente fuerte en rasgos que no están claramente definidos, que no son fáciles
de observar y que son moralmente importantes (véase Guilford, 1954, p. 279).

Dos fuentes importantes de error constante son el error por severidad y el error por
flexibilidad. El error por severidad es la tendencia general de calificar demasiado bajo a
todos los individuos, en todas las características. Es el del duro crítico: "nadie obtiene
un 10 en mis cursos". El error por flexibilidad es la tendencia general opuesta de
calificar demasiado alto. Éste es el caso del buen amigo que estima a todos, y la
estimación se refleja en las calificaciones.

Una fuente exasperante de invalidez de las calificaciones es el error de tendencia


central, que es la tendencia general a evitar todos los juicios extremos y a calificar justo
en el centro de una escala de calificación. Se manifiesta particularmente cuando los
calificadores no están familiarizados con los objetos que se están calificando.
Existen otros tipos de error de menor importancia que no se consideran aquí. Es más
importante saber cómo enfrentar los tipos de error mencionados antes. Se trata de un
tema complejo que no puede estudiarse aquí. Se refiere al lector a Guilford (1954, pp.
280-288, 383, 395-397), donde se discuten a detalle muchas estrategias para lidiar con
el error. Los errores sistemáticos pueden tratarse en cierto grado por medio de las
medias estadísticas. Guilford ha creado un método ingenioso que utiliza el análisis de
varianza. La idea básica es que las varianzas debidas a los participantes, los jueces y las
características se extraen de la varianza total de calificaciones; entonces se corrigen las
calificaciones. Un método más fácil, cuando se califica una sola característica de los
individuos, es el análisis de varianza de dos factores (grupos correlacionados). La
confiabilidad también puede calcularse con facilidad. El uso del análisis de varianza
para estimar la confiabilidad, como se aprendió antes, fue una contribución de Hoyt
(1941). Ebel (1951) aplicó el análisis de varianza a la confiabilidad de las calificaciones.

Las escalas de calificación deben usarse en la investigación del comportamiento. Su uso


no garantizado, expedito e inexperto ha sido justamente condenado. Pero esto no debe
significar una condena general. Tienen virtudes que las hacen valiosas herramientas de
investigación científica: requieren de menos tiempo que otros métodos, por lo común
son interesantes y fácil de usar por los observadores, poseen un rango muy amplio de
aplicación, y pueden utilizarse con un gran número de características. Hay que añadir el
hecho de que es posible usarlas en conjunto con otros métodos, es decir, servirse de
ellas como instrumentos de ayuda para las observaciones del comportamiento, y
utilizarlas en conjunto con otros instrumentos objetivos, con entrevistas y aun con
medidas proyectivas.
BIBLIOGRAFÍA
AAKER, D.A. y DAY, J.S. Investigación de mercados. México. McGraw-Hill,
1989.
ADORNO, T.W., POPPER, K.R. y otros. La disputa del Positivismo en la Sociología
Alemana.Barcelona. Grijalbo, 1973.
ALCAIDE INCHAUSTI, J. Estadística aplicada a las ciencias sociales. Pirámide.
1975.
ALKER, H.R. Jr. Introduction a la sociologie mathematique. P.
Larousse. 1973.
ALMARCHA, A., y otros. La documentación y organización de datos en la
investigación sociológica. Confederación de las Cajas
de Ahorro. Madrid, 1969.
ALVIRA MARTÍNEZ, F. "Perspectiva cualitativa/perspectiva cuantitativa en la
metodologíasociológicaen Revista Española de
Investigaciones Sociológicas, año 1983.
ALVIRA, F., y otros. Los dos métodos en las ciencias sociales, Madrid:
CIS, 1979.
ANDER EGG, E. Técnicas de Investigación Social. Humanitas. México,
1969.
ANDRESKI, S. Las ciencias sociales como forma de brujería. Taurus.
1973.
ANGUERA, ARGILAGA, M. T. y otros. Métodos de investigación en psicología.
MadridSíntesis, 1995.
ARAUJO, M. Estadística y sociología. Buenos Aires. Nueva Visión.
¡973.
ARIAS GALICIA, F. Introducción a la técnica de investigación en
psicología. México: Trillas, 1971.
ARNAU, J. Diseños experimentales en psicología y educación.
México: Trillas, 1984.
ARNAU, J. Método de investigación en ciencias humanas.
Barcelona. Omega, 1978.
ARRUGA I. VALERI, A. Introducción al test sociométrico. Herder. Barcelona.
1983.
ARY, D. JACOBS, Ch. y RAZAVICH, A. Introducción a la Investigación Pedagógica.
Edit. Mc Graw Hill. México. 1994.
ASIMOV, I. 100 preguntas básicas sobre la ciencia. Madrid.
Alianza, 1979.
ASTI VERA. Metodología de la investigación. Kapesliu. Buenos
Aires. 1968.
BALCELLS I JUNYENT, J. Métodos en Ciencias Sociales. Barcelona: PPU 1994.
BARDIN, L.- L analyse de contenu. París:PUF, 1977.
BASTIN, G Les techniques sociometriques. PUF. París. 1961.
BAYES, R. Introducción al método científico en Psicología.
Fontanella. 1974.
BECHINI, A. El diferencial semántico. Teoría y práctica.
Barcelona. Hispano-europea, 1986.
BELL, J.E. Técnicas proyectivas. Buenos Aires, 1980.
BELTRAN VILLALBA, M. Ciencia y Sociología. Centro Investigaciones
Sociológicas. Madrid, 1979.
BEST, JOHN. Como Investigar en Educación. Ed. Aguilar. Madrid.
1974.
BLALOCK, H.M., Jr. Estadística social. F.C.E. México. 1966.
BOCHENSKI, J.M. Los métodos actuales de pensamiento. Ed. Rialp.
1971. 7a edición.
BORDIEU, P. y otros. Le métier du sociologue. Mouton. París. 1968.
BOSCH GARCÍA, C. La técnica de la investigación documental. Escuela
Nacional de CienciasPolíticas y Sociales. México.
BOUDON, R. Los métodos en sociología. A Redondo. Barcelona.
1970.
BOUDON, R. y otros. Metodología de las ciencias sociales. Vol. 1:
Conceptos e índices. Vol. 2: El análisis empírico de
causalidad. Vol. 3: Análisis de los procesos sociales.
Barcelona. Ed. Laia. 1973.
BOUDON. R. La crisis de la sociología Laia. 1975.
BRINGHAM, W.D. Cómo entrevistar. Rialp. Madrid. 1966.
BRUYN, S.T. La perspectiva humana en sociología. Buenos Aires.
Amorrortu. 1972.
BUGEDA'J. Manual de técnicas de investigación social. Segunda
edición. Instituto de Estudios Políticos. Madrid. 1974.
BUNGE, M. La investigación científica. Ariel. Barcelona,1972.
BUNGE, Mario. La investigación científica, Editorial Ariel. Barcelona.
1973.
CABALLERO, Alejandro. Guías Metodológicas para los Planes y Tesis de
Maestría y Doctorado. Edit. Ugrapg. Lima. 2005.
CAMPBELL, D. y STANLFY, J. Diseños experimentales y cuasiexperimentales en la
investigación social. Amorrortu. 1970. (Sexta
reimpresión).
CAMPO URBANO, S. La sociología científica moderna. I.E.P. Madrid, 1969
CAMPO URBANO, S., y otros. Los indicadores sociales a debate. Euramérica.
Madrid. 1972.
CAPLOW, T. La investigación sociológica. Ed. Laia. Barcelona.
1972.
CHEVRY. El cuestionario. Ariel. Barcelona. 1960
CHEVRY. Práctica de las encuestas estadísticas. Barcelona.
Ariel.
CHOU, Ya - Lum. Análisis estadístico. Editorial Intcraniericana. México.
1972.
COHÉN, M., y .EL, F. Introducción a la lógica y al método científico.
Amorrortu. Buenos Aires. 197
COLAS, P. y HERNÁNDEZ, F. Métodos de Investigación en Psicopedagogía. Edit.
Mc Graw Hill. Madrid. 1998.
COOK, T. D. Métodos cualitativos y cuantitativos. Madrid. Moratn,
1986.
COOLEY, W.W. Multivariate data analysis, Nueva York, J. Wiley.
1971.
CORBETTA, Piergiorgio. Metodología y Técnicas de Investigación Social. Edit.
Mc Graw Hill. Madrid. 2003.
CORTADA, N. y CARROL, J.M. Estadística aplicada. Buenos Aires. 1966
DAGUM.C. Introducción a la econometría. Siglo XXI. 1911.
DELGADO, J. M. y GUTIÉRREZ, J. (Coords.). Métodos y técnicas cualitativas de
investigación en Ciencias Sociales. Madrid. Síntesis,
1994.
DÍAZ MOZAZ. Teoría y técnica de la encuesta religiosa. Instituto
Social León XIII. Madrid. 1957.
DICCIONARIO DE CIENCIAS SOCIALES'. 2 Volúmenes. Madrid. Instituto de
Estudios Poli ticos, 1976.
DIEZ NICOLÁS, J. Entre el funcionalismo y la dialéctica. Guadiana,
1969.
DOMENECH, T.M. Métodos estadísticos para la investigación en ciencias
sociales, Herder. 1974.
DOREIAN, P. Las matemáticas y el estudio de las relaciones
sociales. Ed. Viccns y Vive-, Barcelona.
DURKHEIM, E. Las reglas del método sociológico. Ed. Dédalo.
Buenos Aires. 1964.
DUVERGER, M. Métodos de las ciencias sociales. Ariel. Barcelona.
1962.
EYSSAUTIER, Maurice. Metodología de la Investigación. Desarrollo de la
inteligencia. Edit. ECAFSA. México. 2002.
FESTINGER y D. KATZ. Los métodos de investigación en las ciencias sociales.
B. Aires: Paidós, 1978. 3a. ed.
FEYERABEND, P.K. Contra el método. Ariel. 1974.
FLOUD, R. Métodos cuantitativos para historiadores. Madrid.
Alianza. 1975.
FRAISE, P., y PIAGET. Psicología social. Paidos. Buenos Aires. 1970.
FRASER, D.A.S. Fundamentos y técnicas de inferencia estadística.
México: Limusa, 1976.
FREEMAN, L.C. Elementos de estadística aplicada. Euramérica.
Madrid. 1971.
FUNDACIÓN FOESSA. Tres estudios para un sistema de indicadores sociales.
Euramérica Madrid, 1967.
GALTUNG, J. Teoría y métodos en la investigación social. Buenos
Aires. 1971.
GARCÍA FERRANDO, M. El método. Madrid Centros de Investigaciones
Sociológicas, 1979.
GARCÍA FERRANDO, M. Jesús Ibañez y Francisco Alvira. El análisis de la realidad
social.Métodos y técnicas de investigación. Madrid:
Alianza Univ. Textos, 1986.
GARCÍA FERRANDO, M. Socioestadística. Madird: Alianza Univ. Textos: 1985.
GHIGLIONE, R. y MATALÓN, B. Las encuestas sociológicas. Teoría y práctica.
México: Trillas, 1989.
GIBSON, Q. La lógica de la investigación social. Tecnos. Madrid.
1968.
GILLI, G.A. Cómase investiga. Barcelona. Ed. Avance. 1971.
GIMÉNEZ, Luis. Manual de Orientación Educacional Para Profesores
Jefes y Orientadores. Santiago. 1999.
GINI, C. Curso de Estadística. Ed. Labor. 1953.
GLASS, G.V. y otros. Meta-analysis in social research. London: Sage,
1981.
GLASSÍ G.V. y STANLEY, J.C. Métodos estadísticos aplicados a las ciencias
sociales P. HallInternac. Madrid. 1974.
GONZÁLEZ SE ARA, L. La sociología aventura dialéctica. Ed. Tecnos.
GONZALVO MEINAR. Diccionario de métodos estadísticos. Madrid. Ed.
Morata, 1978.
GOODE, W. y HATT, P. Métodos de la Investigación Social. Editorial Instituto
del Libro. La Habana. 1971.
GRAWITZ, M. Métodos y técnicas en las ciencias sociales. Edit.
Hispano Europea. Barcelona. 1975. 2 Vols.
GREENWOOD, E. Sociología experimental. F.C.E. México. 1951.
GRISEZ, J. Métodos de la psicología social. Madrid. Morata,
1977.
GUTIÉRREZ CABRIA, S. Filosofía de la estadística. Valencia. Universidad de
Valencia. 1994
GUTIÉRREZ CABRIA. S. Filosofía de la probabilidad. Valencia. Tirant lo
Blanc. 1992.
HARRE, E.R. Introducción a la lógica de las ciencias. Barcelona:
Ed. Labor, 1967
HEGENBERG.L Introducción a la filosofía de la ciencia. Herder.
1969.
HERNÁNDEZ, R. FERNÁNDEZ, C. Y BAPTISTA, P. Metodología de la
investigación. Edit. Mc Graw Hill. México. 2011.
HOPE, K. Manual práctico de estadística avanzada. Ed. Trillas.
1973.
HOPE, K. Métodos de análisis multivariable. Madrid: Instituto
de Estudios Políticos, 1972.
HYMAN, H. Diseño y análisis de encuestas sociales. Amorrortu,
B.A. 1971.
IBAÑEZ, Jesús. Más allá de la Sociología. El grupo de discusión:
Teoría y Crítica. Siglo XXI, 1979.
ILLUECAS VALERO. L. La entrevista. El Magisterio Español. Madrid. 1971.
JACOBSON, V. El diálogo y la entrevista. Euramérica. Madrid. 1968.
KERLINGER, F. y LEE, H. Investigación del comportamiento. Métodos de
investigación en Ciencias Sociales. Edit. Mc Graw
Hill. México. 2001.
KISH, L. Muestreo de encuesta. Ed. Trillas. México. 1972.
KONIG, R. y otros. Tratado de sociología empírica. Tecnos. Madrid.
1974.
KUHN, T.S. La estructura de las revoluciones científicas. F.C.E.,
1975.
KUHN, T.S. La medida en las ciencias sociales. Confederación de
las Cajas de Ahorro. Madrid. 1975.
LACHENMEYER, Ch.W. El Lenguaje de la sociología. Ed. Labor. 1976.
LEBRET, L.J. Manual de encuesta social. Rialp. Madrid, 1961.
LEÓN, O. Y MONTERO, I. Métodos de Investigación en Psicología y Educación.
Edit. Mc Graw Hill. Madrid. 2003.
LININGER, Ch. A. y WARWICK, D.P. La encuesta por muestreo. Teoría y Práctica
Cl.CSAMéxico, 1978.
LÓPEZ CANO, J.L. Métodos e hipótesis científicas. México: Trillas, 1978.
.
LUNDBERG, G.A. Técnicas de investigación en las ciencias sociales.
F.C.E. México. 1949.
MADGE, J. Las herramientas de la ciencia social. Paidós. Buenos
Aires. 1969.
MANHEIM, J.B. y RICH, R.C. Análisis político empírico. Método de investigación
en ciencia política. Madrid: Alianza, 1988.
MANN, P. Métodos de investigación sociológica. Ed. G. del
Toro. Madrid, 1969.
MARTÍNEZ HERNÁNDEZ, M. Método y diseños de investigación en Psicología.
Madrid. Ed. Complutense, 1994.
Mc KINNEY. Tipología constructiva y teoría social. Amorrortu.
Buenos Aires. 1968.
MEIGNET, R. El análisis de grupo. Perspectivas existenciales.
Marova. Madrid. 1971.
MERTON, R.K. Teoría y estructura sociales. México: FCE, 1964.
MORA. Y MUCCHIELLI, R. EI cuestionario en la encuesta psicosocial.
Ibérico-Europea de Ediciones Madrid. 1974.
MUCCHIELLI, R. La dinámica de grupos, ibérico Europea de Ediciones.
1972. Tercera edición.
MUCCHIELLI, R. La entrevista en grupo. Conocimiento del problema.
Aplicaciones prácticas.Bilbao: Mensajero. 1978.
MUÑOZ, Carlos. Cómo Elaborar y Asesorar una Investigación de
Tesis. Edit. Pearson. México. 1998.
MURDOCK. Guia de clasificación de datos culturales. Unión
Panamericana. Washington. D.C. 1954.
NAMAKFOROOSH, Mohammad. Metodología de la Investigación. Edit. Limusa.
México. 2002.
NOELLE, E. Encuestas en la sociedad de masas. Alianza. Madrid,
1970.
PADUA, Jorge y otros. Técnicas de investigación aplicadas a las ciencias
sociales. México. F.C.E., 1979.
PARTEN, M. Encuestas sociales y de mercado. Barcelona. 1958.
PÉREZ SERRANO. G. Investigación cualitativa. I: Métodos. II: Técnicas y
análisis de datos.Madrid. La Muralla. 1995.
PÉREZ SERRANO. G. Investigación Cualitativa. Retos e Interrogantes. Ed.
La Muralla. Madrid. 1994.
PÉREZ. César. Técnicas de Análisis Multivariable de Datos. Edit.
Prentice Hall. Madrid. 2004.
PIAGET, J. Las explicaciones causales. Barral. Barcelona.
POPPER.K. La lógica de la investigación científica. Madrid:
Tecnos, 1973.
PORTUONDO, J. El test sociométrico. Biblioteca Nueva. Madrid 1971.
PULIDO SAN ROMÁN, A. Estadística y técnicas de investigación social. Ed.
Anaya.
RAUDÁBAUGH, J.N. y otros. Conducción y acción dinámica del grupo. Kapesluz.
Buenos Aires. 1962.
RICCARDI, R. El manual del entrevistados Interciencia. Madrid,
1966.
RODRÍGUEZ OSUNA, J. Melados de muestreo y Métodos de muestreo: casos
prácticos. Madrid. CIS 1991 y 1993.
RODRÍGUEZ, J. A. Análisis estructural y de redes. Madrid. CIS. 1995.
RUÍZ OLABUENAGA. I. I. y ISPIZUA. M. A. La descodificación de la vida
cotidiana: métodos de investigación cualitativa.
Bilbao. Deuslo. 1989.
RUSSEL, B. La perspectiva científica. Ariel. 1969.
RYAN, Alan. Metodología de las ciencias sociales. Euramérica.
Madrid, 1973.
SACRISTÁN, M. Introducción a a lógica y al análisis formal. Ariel.
1973.
SALKIND, Neil. Métodos de Investigación. Edit. Prentice Hall.
México. 1999.
SÁNCHEZ CARRIÓN, J. J. Manual de análisis de datos. Madrid. Alianza. 1995.
SÁNCHEZ CARRIÓN, J.J. Análisis de tablas de contingencia. Madrid: CIS,
1989.
SÁNCHEZ CARRIÓN. J. J. Análisis de datos con SPSS/PC+. Madrid. Alianza.
1994.
SÁNCHEZ CRESPO, J.L. Muestreo de poblaciones finitas aplicado al diseño de
encuestas. Madrid. INLE, 1976
SCHWARTZ, H. Sociología cualitativa.México: Trillas, 1984.
SEIFFERT, H. Introducción a la teoría de la ciencia. Herder. 1977.
SELLTIZ, C. y otros. Métodos de investigación en las relaciones sociales.
Rialp. Madrid. 1970.
SERRANO, J.A. La objetividad y las ciencias. Enfoque histórico
epistemológico. México: Trillas, 1981.
SHEUCH, E.I. "La entrevista en la investigación social", en
KONIG.R. y otros. Tratado de sociología empírica.
Ed. Tecnos. 1974.
SIEGEL, S. Estadística no paramétrica. F.C.E.
SIERRA, Restituto. Técnicas de Investigación Social. Teoría y Ejercicios.
Edit. Paraninfo, Madrid, 2001.
SIERRA, Restituto. Tesis Doctoral. y Trabajos de Investigación
Científica. Edit. Paraninfo. Madrid. 2004.
SPIEGEL, M.R. Estadística. M: Graw Hill de México. 1970.
SUMMERS, G.F. La medición de actitudes. México:"Trillas. 1976.
SURTHAME, O.V. Teoría de encuestas por muestreo. F.C.E. México.
TABGLIACARNE, G. Técnica y práctica de las investigaciones de mercado.
Segunda edición.Ariel. Barcelona. 1968.
TAMAYO y TAMA YO, M. El proceso de investigación científica. México.
Limusa. 1981.
TAYLOR. S. J. y BOGDAN. R. Introducción a los métodos cualitativos en la
investigación.Buenos Aires. Paidós, 1986.
TUÑON DE LARA. Metodología de la historia de España. Segunda
edición. Edicusa. Madrid 1974.
VAN DALEN, D.B. y MEYER, W.J. Manual de técnicas de investigación educacional.
Buenos Aires: Paidos, 1971.
VÁZQUEZ, J.M., y LÓPEZ RIVAS, P. La investigación social. Ed.OPE. Madrid,
1962.
VIET, J. Los métodos estructuralistas en sociología.
Amorrortu. B.A. 1972.
VINCENT, J.M. La metodología de M. Weber. Anagrama. Barcelona.
1972.
WAINERMAN, Ch. y otros. Escalas de medición en las ciencias sociales. Ed.
Nueva Visión. 1976.
WALLACE, W.A. La lógica de la ciencia en sociología. Madrid:
Alianza, 1980.
WARTOFSKY, M.W. Introducción a la filosofía de la ciencia. Madrid.
Alianza Univ. 1973.
WEBER, M. Sóbre la teoría de las ciencias sociales. Península.
Barcelona. 1972.
YOUNG, P.V. Métodos científicos de investigación social. Instituto
de Investigaciones Sociales. México. 1960.
ZALTMAN, G. BURGER, Ph. (eds.). Investigación de mercados. Ed.
Hispano-Europea, 1980. 2 V.
ZARKOWICH, S.S. Calidad de los datos estadísticos. Roma. FAO. 1970.
ZEISEL, H. Dígalo con números. F.C.E. México. 1962.
ZETTEMBERG, H. Teoría y verificación en Sociología. Nueva Visión.
Buenos Aires. 1965.

S-ar putea să vă placă și