Sunteți pe pagina 1din 26

CAPÍTULO 1

Campo de las pruebas psicológicas

Objetivos
1. Enumerar las principales categorías de pruebas presentando, al menos, un ejemplo de cada una.
2. Identificar los principales usos y usuarios de las pruebas.
3. Resumir los principales supuestos y las preguntas fundamentales relacionadas con las pruebas.
4. Bosquejar las características importantes de los principales períodos de la historia de las pruebas.
5. Identificar los seis principales acontecimientos que influyeron en el desarrollo de las pruebas.
6. Dar una definición de “prueba”.

Introducción

Este capítulo ofrece un panorama general del campo de al campo de las pruebas, es decir, lo examinamos des-
las pruebas. Desde luego, todos saben, al menos en ge- de diferentes ángulos o con distintos lentes. Primero,
neral, qué significa “prueba”. Todos tienen alguna expe- bosquejamos las principales categorías de pruebas,
riencia con diversas pruebas, por ejemplo, pruebas de las cuales, en su mayoría, corresponden a capítulos
admisión a la universidad, exámenes finales de cursos, de la segunda parte del libro. Al describir estas ca-
inventarios de intereses vocacionales y, quizá, algunas tegorías, presentamos ejemplos de algunas de las
medidas de personalidad. Sin embargo, al emprender pruebas más empleadas. En segundo lugar, identifi-
el estudio formal de este campo, es importante adqui- camos los principales usos y usuarios de las pruebas.
rir una comprensión más amplia y precisa de él. “Más ¿Quién las usa y con qué propósitos? En tercer lugar,
Copyright © ${Date}. ${Publisher}. All rights reserved.

amplia” implica considerar todos los tipos de pruebas y bosquejamos los asuntos primordiales que nos preo-
todos los temas pertinentes: no queremos omitir nada cupan en relación con las pruebas. Este bosquejo, es
importante. “Más precisa” significa adquirir el dominio decir, la lista de las principales preocupaciones, co-
técnico indispensable para los profesionales de la ex- rresponde a los capítulos de la primera mitad del li-
tensa área de la psicología y disciplinas afines: no esta- bro. En cuarto lugar, rastreamos las raíces históricas
remos satisfechos con sólo dar a conocer estos temas. del estado actual del campo de las pruebas. Distingui-
Ésta es una agenda ambiciosa para un capítulo; mos los principales períodos de esta historia e identi-
sin embargo, en este primer capítulo sólo intentamos ficamos algunas de las principales fortalezas que han
brindar un panorama general de estos temas, mien- moldeado este campo. Por último, examinamos al-
tras que en los restantes proporcionaremos detalles. gunos de los intentos de definir “prueba” y otros tér-
Hay distintos modos de cumplir con nuestro objetivo, minos relacionados. Después de haber revisado el
pero ninguno es el mejor, por lo que recurrimos a cin- campo de las pruebas desde estas cinco perspecti-
co perspectivas o aproximaciones para introducirnos vas, será posible tener un panorama general.

3
Resumen de puntos clave 1-1 desempeño en asignaturas escolares típicas. Otra
prueba de esta categoría es el SAT2, que se usa para
Cinco maneras de introducirnos al campo predecir el éxito en la universidad.
1. Categorías de las pruebas
2. Usos y usuarios de las pruebas
¡Inténtalo!
3. Supuestos y preguntas fundamentales
4. Períodos históricos y fortalezas Para profundizar más en una categoría, pasa a la
5. Definición página 291. Echa un vistazo rápido a las páginas
291 a la 300. Verás cómo los capítulos subsi-
guientes brindan detalles acerca de las pruebas
Principales categorías de las pruebas mencionadas en este capítulo.

Empezamos nuestra exploración del campo de las prue-


bas identificando las principales categorías en que se Hay muchos otros tipos de pruebas de capacidad
agrupan. Cualquier clasificación de este tipo necesaria- mental –casi podríamos decir infinitos–, como las de
mente tiene límites difusos, pues las categorías a me- memoria, razonamiento cuantitativo, pensamiento crea-
nudo se mezclan entre sí en vez de diferenciarse con tivo, vocabulario y capacidad espacial. A veces, estas
claridad. No obstante, un esquema organizacional nos funciones mentales se incluyen en pruebas de capaci-
ayuda a comprender la amplitud del campo. El Resumen dad mental general; otras veces, constituyen por sí mis-
de puntos clave 1-2 ofrece el esquema de clasificación mas pruebas específicas para medir tales capacidades
que usamos en todo el libro; de hecho, los capítulos 8 al de manera independiente.
15 siguen esta organización. Este capítulo introductorio La siguiente categoría principal abarca las pruebas
sólo toca las principales categorías, pero cada una de de rendimiento, las cuales intentan evaluar el nivel de
ellas será tratada en profundidad más adelante. conocimiento o habilidad de un individuo en un dominio
La primera categoría abarca las pruebas de capa- específico. Aquí sólo tratamos las pruebas elaboradas
cidad mental. En el campo de las pruebas psicológi- de manera profesional y estandarizadas, y excluimos
cas, el término “capacidad mental” incluye numerosas una amplia serie de pruebas hechas por maestros para
funciones cognitivas, como memoria, visualización usarlas de manera cotidiana en su labor educativa. In-
espacial o pensamiento creativo. A lo largo de la his- cluso excluyendo estas últimas, las pruebas de rendi-
toria, esta área se ha centrado en la inteligencia, de- miento se emplean con facilidad y son las más usadas.
finida ampliamente. Esta categoría se subdivide en La primera subdivisión de esta categoría incluye las ba-
pruebas de inteligencia de aplicación individual, prue- terías utilizadas en las escuelas primarias y secunda-
bas de inteligencia de aplicación grupal y otras prue- rias. Entre éstas se encuentran el Stanford Achievement
bas de capacidades distintas a las de inteligencia. Un Test [Prueba de Rendimiento Stanford], el Metropolitan
ejemplo de las pruebas de inteligencia de aplicación Achievement Tests [Prueba de Rendimiento Metropoli-
individual es la Escala Wechsler de Inteligencia para tan] y el Iowa Tests of Basic Skills [Prueba Iowa de Ha-
Adultos1, WAIS por sus siglas en inglés. Otro ejemplo bilidades básicas], las cuales constan de una serie de
clásico de esta categoría es la Escala de Inteligencia pruebas en áreas como lectura, matemáticas, lenguaje,
Stanford-Binet. Estas pruebas son administradas por ciencia y ciencias sociales. La segunda subdivisión in-
psicólogos bien capacitados para realizar evaluacio- cluye pruebas de un solo tema, es decir, explora una
Copyright © ${Date}. ${Publisher}. All rights reserved.

nes individuales, esto es, de uno a uno, con el objeti- sola área, como psicología, francés o geometría.
vo de proporcionar un índice de la capacidad general Un ejemplo de tales pruebas es la Prueba Psicoló-
mental de un individuo. Un ejemplo de una prueba gica: Graduate Record Examinations (GRE [Exámenes
de inteligencia de aplicación grupal es el Otis-Lennon de Registro para Graduados]).
School Ability Test (OLSAT [Prueba de Capacidad Es-
colar Otis-Lennon]), la cual se aplica a un grupo de 2
Por muchos años, esta prueba se llamó Scholastic Aptitude
estudiantes, por lo general en un salón de clases, Test [Prueba de Aptitudes Escolares]. El título se cambió de
para estimar la capacidad mental para tener un buen manera oficial a Scholastic Assessment Test [Prueba de Eva-
luación Escolar] en 1992 y después simplemente a SAT. Estos
1
En este capítulo, nos referimos sólo a la primera edición de antiguos nombres aún aparecen en muchas publicaciones.
las pruebas. En los siguientes capítulos, nos referimos a las Aquí se refiere en particular al SAT I: Prueba de razonamien-
ediciones más recientes y a sus iniciales correspondientes, por to. El SAT II: Prueba de materias es una serie de pruebas en
ejemplo, WAIS-IV, MMPI-2 y así sucesivamente. áreas específicas como literatura, francés o química.

4 Pruebas psicológicas. Una introducción práctica


Resumen de puntos clave 1-2 de aplicación individual ayudan en el diagnóstico de
trastornos como los problemas de aprendizaje.
Principales categorías de las pruebas La siguiente categoría principal abarca diferentes
Pruebas de capacidad mental pruebas diseñadas para obtener información sobre la
De aplicación individual personalidad humana. La primera subdivisión incluye
De aplicación grupal las llamadas pruebas objetivas de personalidad. En el
Otras capacidades lenguaje de este campo, objetivo significa únicamen-
Pruebas de rendimiento te que la calificación es objetiva, es decir, está basada
Baterías en reactivos que se responden con verdadero o falso
Tema único o en un formato similar. Ejemplos de estas pruebas son
Certificación, licencia el Inventario Multifásico de Personalidad de Minneso-
Programas con financiamiento gubernamental ta (MMPI por sus siglas en inglés), el Beck Depression
Pruebas de rendimiento individual Inventory (BDI [Inventario de Depresión de Beck]) y el
Pruebas de personalidad Eating Disorder Inventory (EDI [Inventario de Trastor-
Pruebas objetivas nos Alimenticios]). El MMPI ofrece un perfil que mues-
Técnicas proyectivas tra qué tan similares son las respuestas del examinado
Otros enfoques a las de distintos grupos clínicos. El BDI y el EDI, como
Intereses y actitudes lo indican sus nombres, miden depresión y trastornos
Intereses vocacionales de la alimentación, respectivamente. Por comodidad y
Escalas de actitud claridad conceptual, en los subsiguientes capítulos di-
Pruebas neuropsicológicas vidimos estas pruebas objetivas en las que miden ras-
gos de personalidad dentro del rango normal y las que
se diseñaron como instrumentos clínicos para medir
La tercera subdivisión incluye las innumerables los padecimientos patológicos e incapacitantes.
pruebas que se usan para la certificación y concesión
de licencias para ejercer una profesión, como enfer-
mería, enseñanza, terapia física o ser piloto de líneas ¡Inténtalo!
comerciales. Ninguna de estas pruebas es conocida
más allá de su ámbito, pero tienen consecuencias im- Parte de convertirse en un profesional de este
portantes en los campos vocacionales específicos. campo implica aprender las iniciales de las
En cuarto lugar, varias agencias gubernamentales pruebas, pues aparecen de manera rutinaria en
financian ciertos programas de pruebas de rendimien- informes psicológicos y artículos de revista, a
to, entre las cuales los programas estatales en temas menudo, sin referencia a su nombre completo.
básicos como lectura, escritura y matemáticas son los ¡Acostúmbrate a esto! Sin ver otra vez el texto,
más notables. De hecho, estos programas de evalua- trata de recordar a qué prueba corresponden las
ción estatal han cobrado gran importancia en años siguientes iniciales:
recientes como consecuencia de las nuevas leyes fe-
derales. En en algunos estados de EUA, graduarse del EDI WAIS
bachillerato depende, en parte, del desempeño en GRE MMPI
estas pruebas. Otros programas con financiamiento
gubernamental ofrecen información acerca del des-
Copyright © ${Date}. ${Publisher}. All rights reserved.

empeño nacional en distintas áreas. Los intentos más


conocidos son el National Assessment of Educatio-
nal Progress (NAEP [Evaluación Nacional de Progreso La segunda subdivisión principal de las pruebas de
Educativo]) y el Trends in International Mathematics personalidad incluye las técnicas proyectivas, que
and Science Study (TIMSS [Tendencias en el Estudio consisten en una tarea relativamente simple o no es-
Internacional en Matemáticas y Ciencia]), sobre los tructurada. Se espera que las respuestas del exami-
cuales se informa con frecuencia en los medios. nado revelen algo acerca de su personalidad. La más
Por último, hay pruebas de rendimiento que se famosa de estas técnicas es el Prueba Rorschach de
aplican de manera individual. Los primeros cuatro ti- Manchas de Tinta, a veces sólo llamada Rorschach
pos de las pruebas de rendimiento se aplican, por lo o prueba de manchas de tinta. Otros ejemplos son
general, en grupo; sin embargo, algunas de ellas se las técnicas de dibujos de la figura humana, frases in-
aplican de modo individual de manera muy parecida completas o reacciones ante imágenes. Incluimos en
a la de las pruebas de capacidad mental. Las pruebas las medidas de personalidad una tercera categoría,

Campo de las pruebas psicológicas 5


que rotulamos simplemente como “otros enfoques”, Resumen de puntos clave 1-3
para englobar la miríada de modos que los psicólo-
gos han concebido para satisfacer nuestra inagotable Otras maneras de clasificar las pruebas
fascinación por la personalidad humana. • Lápiz y papel versus ejecución
La siguiente categoría principal de pruebas abar- • Velocidad versus poder
ca las medidas de intereses y actitudes, cuya sub- • Pruebas individuales versus pruebas grupales
división más notable es la de medidas de intereses • Ejecución máxima versus ejecución típica
vocacionales. Estas pruebas son ampliamente usa- • Referidas a la norma versus referidas al criterio
das en el bachillerato y en las universidades para ayu-
dar a los estudiantes a explorar los trabajos acordes
con sus intereses. Ejemplos de estas pruebas son el
Strong Interest Inventory (SII [Inventario de Intereses
Sólidos]) y el Kuder Career Search (KCS [Búsqueda Pruebas de lápiz y papel versus pruebas de
de Carrera Kuder]). Esta categoría también incluye nu- ejecución
merosas medidas de actitudes hacia temas, grupos y
prácticas; por ejemplo, hay medidas para la actitud En una prueba de ejecución, el examinado reali-
hacia la pena capital o hacia los ancianos. za alguna acción como armar un objeto, producir un
La última categoría está conformada por las prue- discurso, llevar a cabo un experimento o guiar a un
bas neuropsicológicas, cuyo propósito es ofrecer in- grupo, mientras que en una prueba de lápiz y papel,
formación acerca del funcionamiento del sistema responde a un conjunto de preguntas, por lo general,
nervioso central, en especial del cerebro. Desde al- usando papel y lápiz, como lo dice su nombre. Mu-
gunas perspectivas, ésta no debería ser una catego- chas de estas pruebas tienen formatos de respuesta
ría separada porque muchas pruebas empleadas con de opción múltiple, de falso-verdadero u otros se-
este propósito vienen de otras categorías, como las mejantes; en la actualidad, frecuentemente se pue-
pruebas de capacidad y de personalidad. Sin embar- den realizar en una computadora haciendo clic para
go, empleamos una categoría separada para agrupar responder.
pruebas usadas de manera específica para evaluar las
funciones cerebrales. Las pruebas de memoria para el Pruebas de velocidad versus pruebas de poder
material verbal y visual, de coordinación psicomotriz y
de pensamiento abstracto son de especial interés. El propósito fundamental de las pruebas de velocidad
es ver qué tan rápido se desempeña el examinado. La
tarea, por lo general, es sencilla y la puntuación depen-
¡Inténtalo! de de la cantidad de reactivos o tareas terminados en
un tiempo límite o de cuánto tiempo (p. ej., minutos o
Aquí hay una prueba sencilla que usan los neu- segundos) requiere el examinado para realizar la tarea.
ropsicólogos; se llama cruz griega. Mira la figu- Por ejemplo, ¿cuánto tiempo tardarías en tachar todas
ra por un momento, luego, cúbrela y trata de las letras “e” de esta página? ¿Cuánto tardarías en re-
dibujarla de memoria. ¿Qué conductas y pro- solver 50 problemas sencillos de aritmética, como 42
cesos mentales crees que están involucrados + 19 o 24 × 8? Por otra parte, una prueba de poder, por
en esta prueba? lo general, implica material desafiante y no hay límite de
tiempo o éste es muy generoso. El punto esencial de
Copyright © ${Date}. ${Publisher}. All rights reserved.

estas pruebas es evaluar los límites del conocimiento o


capacidad del examinado (no importa la velocidad). La
distinción no necesariamente es tan tajante: velocidad
pura o poder puro. Algunas pruebas de poder pueden
tener un elemento de velocidad; no se puede contestar
Otras maneras de clasificar las pruebas el SAT eternamente; sin embargo, la capacidad mental y
el conocimiento, más que la velocidad, son los determi-
Hasta aquí, hemos clasificado las pruebas de acuer- nantes primordiales del desempeño en una prueba de
do con el tipo predominante de contenido; de hecho, poder. Algunas pruebas de velocidad pueden tener un
ésta es la manera más común y, para la mayoría de elemento de poder; se tiene que pensar un poco y, qui-
perspectivas, más útil de hacerlo. Sin embargo, hay zá, también hacer un plan para tachar todas las “e” de
otras, las cuales enumeraremos brevemente. Se pue- esta página. Sin embargo, esta tarea es primordialmen-
den ver en el Resumen de puntos clave 1-3. te cuestión de velocidad, no de conocimiento científico.

6 Pruebas psicológicas. Una introducción práctica


Pruebas individuales versus pruebas grupales Usos y usuarios de las pruebas

Esta distinción se refiere simplemente al modo en Un segundo modo de introducirse en el campo de las
que se aplica la prueba. Una prueba individual puede pruebas es identificar los usos y usuarios regulares de
aplicarse sólo a un examinado a la vez. Los ejemplos las pruebas. ¿Quién usa las pruebas ubicadas en las
clásicos son las pruebas de inteligencia en las que un categorías enumeradas en la sección anterior? ¿En qué
examinador presenta cada pregunta o tarea al indi- escenarios? Consideremos los siguientes ejemplos.
viduo y registra sus respuestas. Una prueba grupal • John es psicólogo clínico que ejerce en el ámbi-
se puede aplicar a varios individuos al mismo tiem- to privado, donde ve muchos clientes que sufren
po, es decir, a un grupo; desde luego, cada uno de de ansiedad y depresión. Algunos casos pueden
ellos recibe su propia puntuación. En general, cual- ser de intensidad moderada susceptibles de te-
quier prueba de aplicación grupal puede aplicarse a rapia conductual y cognitivo conductual de corto
un solo individuo a la vez cuando las circunstancias lo plazo, pero otros pueden ser más crónicos con
ameritan, pero una de aplicación individual nunca se síntomas que encubren un padecimiento poten-
puede aplicar a un grupo a la vez. cialmente esquizofrénico. Al principio de la eva-
luación de sus clientes, John emplea de manera
Ejecución máxima versus ejecución típica rutinaria el MMPI y, en casos muy complicados, la
Prueba Rorschach de Manchas de Tinta.
Ésta es otra distinción útil entre tipos de pruebas. Al- • Kristen es psicóloga educativa. Cuando un maes-
gunas buscan la ejecución máxima: ¿qué tan bue- tro le envía algún alumno, por lo general revisa
no es el desempeño del examinado cuando hace lo los registros escolares que incluyen las puntua-
mejor que puede? Por lo general, esto sucede con ciones del Otis-Lennon School Ability Test y el
las pruebas de rendimiento y capacidad. Por otro Stanford Achievement Test. Además, aplica la Es-
lado, a veces queremos ver la ejecución típica del cala Wechsler de Inteligencia para Niños (WISC) y
individuo, como en las pruebas de personalidad, in- alguna escala para evaluar la conducta.
tereses y actitudes. Por ejemplo, en una prueba de • Frank es consejero de bachillerato y supervisa la
personalidad queremos saber qué tan extrovertido aplicación anual del Strong Interest Inventory (SII)
es regularmente el examinado, no cuán extroverti- por parte de la escuela. Los resultados de la prue-
do puede ser si en verdad se esfuerza por parecer ba se reparten en los salones donde se pasa lista
extrovertido. a los alumnos. Ya que Frank no se puede reunir
con cada uno para entregarle sus resultados, pre-
Referidas a la norma versus referidas al criterio para materiales para los maestros que pasan lista
para que puedan ayudar a los alumnos a interpre-
Muchas pruebas tienen normas basadas en el des- tar sus informes.
empeño de los casos en un programa de estandariza- • Annika es psicóloga del desarrollo que se intere-
ción. Por ejemplo, si la puntuación de un individuo en sa en el estrés infantil que se presenta cuando los
el SAT o ACT está en el percentil 84, significa que su chicos y chicas pasan de la etapa prepuberal a la
puntuación es mejor que la de 84% del grupo nacio- adolescencia. En su estudio longitudinal, usa una
nal del que se obtuvieron las normas. Ésta constituye medida del autoconcepto (Piers-Harris Children’s
una interpretación referida a la norma del desem- Self-Concept Scale [Escala Piers-Harris de Auto-
peño en una prueba. En contraste, algunas interpre- concepto Infantil]) para rastrear los cambios en
Copyright © ${Date}. ${Publisher}. All rights reserved.

taciones dependen de algún criterio definido con cómo se sienten los participantes consigo mismos.
claridad que se usa como referencia y no de un con- También cuenta con puntuaciones de pruebas de
junto de normas; por ejemplo, un instructor puede de- inteligencia que toma de los registros escolares
cir: quiero que se aprendan todos los términos clave sólo para describir la naturaleza de su muestra.
que están al final del capítulo. Si en la prueba del ins- • Brooke es neuropsicólogo. En una demanda legal
tructor un alumno define correctamente sólo 60% de contra un productor de automóviles, un individuo
los términos, se considera insuficiente sin importar los declaró haber sufrido daño cerebral en un acci-
resultados del resto de los alumnos. Ésta es una inter- dente. En defensa del productor, Brooke presentó
pretación referida al criterio. En realidad, es el méto- evidencia, obtenida de distintas pruebas, de que
do de interpretación más que la prueba en sí misma lo no había tal daño cerebral.
que se puede calificar como referida a la norma o re- • Bill es asistente del director de recursos humanos
ferida al criterio. Exploramos esta distinción con todo en la compañía MicroHard, la cual contrata casi
detalle en el capítulo 3. 100 nuevas secretarias al año en sus diferentes

Campo de las pruebas psicológicas 7


sucursales. Bill supervisa la aplicación de pruebas • Más de 80% de los neuropsicólogos pasa cinco
a 500 candidatas cada año y trata de asegurarse horas semanales o más haciendo evaluaciones, y
de que tienen las habilidades tanto técnicas como una tercera parte de ellos pasa más de 20 horas
interpersonales que les permitirán ser miembros semanales en esta actividad.
productivos del “equipo MicroHard”. • Los psicólogos escolares pasan cerca de la mitad
• Joe trabaja para el Departamento Estatal de Edu- de su tiempo laboral en actividades de evaluación.
cación. La asamblea legislativa adoptó apenas un • Una muestra de 100 informes de neuropsicología
proyecto de ley en el que se exige que todos los forense llevados a cabo para evaluar casos de ti-
estudiantes aprueben exámenes de lectura, mate- pos específicos de daño personal, incorporó un
máticas y escritura para poder recibir su certificado promedio de 12 diferentes pruebas por informe;
de bachillerato. Joe –un psicólogo afortunado–, tie- en un informe se incluyeron hasta 32 pruebas.
ne que organizar la preparación de estas pruebas. • En un estudio de consejería psicológica, dos tercios
informaron usar pruebas objetivas y un poco menos
Todos éstos son ejemplos de los usos y usuarios de un tercio declaró usar pruebas proyectivas.
típicos de las pruebas, pero vamos a presentar un ca-
tálogo más sistemático. Como se enumera en Resu- Todos estos grupos emplean pruebas de inteli-
men de puntos clave 1-4, se identifican cuatro grupos gencia, pruebas objetivas de personalidad y técnicas
principales de usuarios; aunque hay una diversidad proyectivas; la mayoría también usa pruebas neurop-
considerable en cada grupo, cada uno es diferente sicológicas. Los psicólogos consejeros a menudo re-
en la manera en que emplea las pruebas. También curren a medidas de intereses vocacionales.
notamos que cada grupo usa casi todos los tipos de Una visión general de las investigaciones muestra
pruebas que se definieron en la sección previa, aun- que las pruebas tienen un papel destacado en la prác-
que alguno predomina en cada uno de ellos. tica profesional de la psicología. Debemos agregar
La primera categoría incluye los campos de la psi- que en todos estos campos se requiere una capacita-
cología clínica, consejería, psicología escolar y neu- ción especializada para aplicar e interpretar las prue-
ropsicología. Consideramos todas estas aplicaciones bas. El trabajo a nivel doctoral en áreas como la clínica,
bajo el rubro de uso clínico; en éstas, el psicólogo consejería y psicología escolar por lo general supone
trata de ayudar a un individuo que tiene (o puede te- diversos cursos completos en el uso de pruebas, lo
ner) algún tipo de problema, que puede ser grave (p. cual va más allá del nivel introductorio de este libro.
ej., esquizofrenia) o moderado (p. ej., elegir una carre- El segundo uso principal de las pruebas se presen-
ra). Las pruebas ayudan a identificar la naturaleza y ta en escenarios educativos, aparte del uso clínico que
gravedad del problema, y brindan algunas sugeren- hace el psicólogo escolar o el consejero. Aquí nos refe-
cias para enfrentarlo; también pueden ayudar a medir rimos primordialmente al uso de las pruebas de capaci-
el progreso de los resultados de dichas sugerencias. dad y rendimiento que se aplican de manera grupal. Los
Un sinfín de investigaciones han documentado usuarios reales de la información que proporcionan es-
el alcance de los usos clínicos de las pruebas. Aquí tas pruebas son maestros, administradores educativos,
ofrecemos ejemplos importantes de una selección de padres y público general, en especial funcionarios como
dichas investigaciones; para ver resúmenes de mu- legisladores y comisiones escolares. El uso de pruebas
chas de ellas, se puede consultar a Hogan (2005a). estandarizadas en escenarios educativos se resuelve en
En capítulos posteriores, describiremos los usos de dos subdivisiones. En primer lugar, hay pruebas de rendi-
las pruebas específicas. miento que se usan para determinar el nivel del aprendi-
Copyright © ${Date}. ${Publisher}. All rights reserved.

• Los psicólogos que se desempeñan en escenarios zaje del alumno. Incluso limitando nuestro recuento a las
de la salud mental y hospitales estatales pasan de pruebas estandarizadas de rendimiento (es decir, dejan-
15 a 18% de su tiempo en actividades de evaluación. do fuera un vasto conjunto de pruebas hechas por maes-
tros), podemos decir que cada año se aplican decenas de
millones de ellas. Las pruebas de rendimiento también se
Resumen de puntos clave 1-4 utilizan para documentar la competencia con el fin de ob-
tener una certificación o licencia en muchas profesiones.
Principales contextos en que se usan las pruebas En segundo lugar, en escenarios educativos las
1. Clínico pruebas se emplean para predecir el éxito en el tra-
2. Educativo bajo académico. Los principales ejemplos de esta
3. Laboral categoría son los exámenes de admisión que se apli-
4. Investigación can en universidades. Por ejemplo, en EUA cerca de
dos millones de estudiantes hacen el SAT cada año,

8 Pruebas psicológicas. Una introducción práctica


mientras que casi un millón hace el ACT; el Gradua- Por ejemplo, en un estudio sobre los efectos de la ca-
te Record Examination (GRE): General se aplica apro- feína en la memoria a corto plazo, el Wechsler Memory
ximadamente a 300 000 estudiantes cada año y los Scale [Escala Wechsler de Memoria] puede ser la de-
Law School Admission Tests (LSAT [Pruebas de Admi- finición operacional de “memoria”. En un estudio de
sión a la Escuela de Derecho]), a cerca de 100 000. Es diferencias de género en el autoconcepto, el Piers-Ha-
todavía mayor el número de alumnos de escuelas pri- rris Children’s Self-Concept Scale puede constituir la
marias y secundarias a los que se les aplican pruebas definición de autoconcepto. En un estudio longitudinal
de capacidad mental de aplicación grupal como par- de los efectos de un programa mejorado de nutrición
te de los programas regulares de evaluación escolar. en el desempeño escolar, el Stanford Achievement
La tercera categoría principal incluye la aplicación Test, aplicado del segundo al sexto grado, puede ser-
de pruebas al personal de trabajo o a los solicitan- vir como medida del desempeño. Hay varias ventajas
tes de empleo. Los principales usuarios en esta ca- importantes al usar una prueba existente como defini-
tegoría son las empresas y la milicia. Hay dos tareas ción operacional de una variable dependiente en tales
fundamentales. La primera es elegir a los individuos estudios. La primera es que el investigador no tiene
más calificados para ocupar un puesto: “más califica- que preocuparse por elaborar una nueva medida; la
dos” significa por lo regular “con mayor probabilidad segunda es que las pruebas disponibles deben tener
de tener éxito”. Por ejemplo, tal vez queremos ele- propiedades conocidas, como normas y confiabilidad;
gir de un conjunto de aspirantes a los individuos que y la tercera y más importante es que su uso ayuda a
tienen mayor probabilidad de tener éxito como ven- que otros investigadores repliquen el estudio.
dedores, gerentes, secretarias o vendedores telefóni- La segunda subcategoría del uso en la investi-
cos. Hay pruebas que pueden ser útiles en el proceso gación consiste en la descripción de muestras. Las
de selección, como las medidas de capacidad mental características importantes de las muestras usadas
general, habilidades específicas relacionadas con el en una investigación deben delinearse. La sección
trabajo o rasgos de personalidad. Desde luego, tam- del método de un artículo de investigación a menu-
bién se puede usar información que no provenga de do ofrece información acerca de la edad y género
las pruebas: cartas de recomendación y registros de de los participantes; algunas características se des-
empleos previos, como sucede de manera regular. criben valiéndose de información obtenida por me-
La segunda tarea en el área de empleo de per- dio de pruebas; por ejemplo, medias y desviaciones
sonal u organizacional, tiene un escenario inicial di- estándar de pruebas de inteligencia, rendimiento o
ferente. En el primer caso, teníamos un conjunto de personalidad. En un estudio con estudiantes universi-
aspirantes, de los cuales elegimos a los mejores, pero tarios, puede ser útil saber el promedio de las puntua-
en el segundo caso, tenemos un grupo de individuos ciones en el SAT o el ACT, mientras que, en uno con
que serán contratados y necesitamos asignarlos a pacientes ancianos de un hospital público, puede ser
distintas tareas para optimizar la eficiencia general de útil saber las puntuaciones del MMPI. Nótese que en
la organización. Éste es un objetivo común en la mi- estas instancias, las puntuaciones de las pruebas no
licia, donde se debe desplegar una gran cantidad de se usan como variables dependientes, sino sólo para
individuos. Una vez reclutados, ninguno será expulsa- describir las muestras de una investigación.
do, sino que será empleado de un modo u otro. Las La tercera subcategoría consiste en la investiga-
pruebas pueden aportar información útil acerca de la ción sobre las pruebas mismas. Como veremos en el
colocación óptima de los recursos humanos en este siguiente capítulo, revistas enteras se dedican a este
escenario. El Armed Services Vocational Aptitude Ba- tipo de investigación; además, la elaboración de nuevas
Copyright © ${Date}. ${Publisher}. All rights reserved.

ttery (ASVAB [Batería de Aptitudes Vocacionales de pruebas es una empresa importante de la investigación.
los Servicios Armados]) fue diseñado con este obje- Ya que las pruebas tienen un papel destacado en las
tivo. Entre los 1000 nuevos reclutas, algunos pueden ciencias sociales y de la conducta, la investigación con-
ser particularmente hábiles para las actividades me- tinua sobre ellas es una valiosa contribución profesional.
cánicas, otros en las labores de oficina y otros más
en tareas de comunicación exclusivamente verbales. Temas de gran importancia: supuestos y
La cuarta categoría principal del uso de pruebas, y preguntas fundamentales
en la que mayor diversidad existe, es la investigación.
Las pruebas se usan en cualquier área imaginable de Un tercer modo de introducirse en el campo de las prue-
investigación en psicología, educación y otras ciencias bas es examinar los supuestos y preguntas fundamen-
sociales y de la conducta. Por comodidad, es posible tales de él. Cuando los psicólogos piensan de manera
identificar tres subcategorías del uso en investigación. cuidadosa sobre las pruebas, sin importar el tipo de
Primero, a menudo sirven como variable dependiente. prueba, ¿qué aspectos le preocupan y qué suposiciones

Campo de las pruebas psicológicas 9


hacen? Describir estas cuestiones y suposiciones bási- Resumen de puntos clave 1-5
cas nos ayuda a entender qué se trata en este campo.
Cuatro supuestos cruciales
Supuestos básicos
1. Las personas difieren en rasgos importantes.
Empecemos este modo de explorar el campo identi- 2. Podemos cuantificar estos rasgos.
ficando las suposiciones que solemos hacer, que son 3. Los rasgos son razonablemente estables.
cuatro y, en parte, se traslapan aunque son distintas. 4. Las medidas de los rasgos se relacionan con la
Primero, asumimos que los seres humanos tienen conducta real.
rasgos o características reconocibles; por ejemplo,
rasgos de capacidad verbal, memoria, extroversión,
cordialidad, capacidad de razonamiento cuantitati-
vo, autoestima, conocimiento de la historia de Irlan- estudiamos. En su nivel más primitivo, la cuantificación
da y depresión. Además, asumimos que estos rasgos implica distinguir entre los objetos en el continuo; la dis-
o características describen aspectos potencialmente tinción puede ser sólo entre dos categorías etiquetadas
importantes de las personas y, en particular, que las como 0 o 1. En el siguiente nivel de sofisticación, se uti-
diferencias entre los individuos son potencialmente liza el concepto de “más o menos” a lo largo del conti-
importantes. Las personas somos iguales en muchos nuo, como se muestra en la figura 1-1. La gente se ubica
sentidos; todos necesitamos oxígeno, pues sin él mo- a lo largo del continuo de un rasgo. Examinamos estos
riríamos con rapidez; así que no diferimos en ese sen- conceptos de cuantificación con mayor detalle en el ca-
tido. Casi todos usamos el lenguaje en cierta medida, pítulo 3; por ahora, haremos notar el supuesto de que
lo cual es una característica humana distintiva. Sin em- tal cuantificación de un rasgo es una noción fundamen-
bargo, también somos diferentes de uno u otro modo; tal en nuestro trabajo. Este supuesto de la “cuantifica-
algunas personas son más altas que otras, algunas es- ción” es el que da origen al uso del término medida en
tán más deprimidas que otras, algunas son más inteli- el campo de las pruebas. De hecho, en muchos contex-
gentes. Asumimos que tales diferencias en los rasgos tos, “medida” se usa como sinónimo de “prueba”; por
que medimos son importantes y no triviales. ejemplo, la pregunta “¿qué medida se usa para evaluar
la inteligencia infantil?” es equivalente a “¿qué prueba
se usa para evaluar la inteligencia infantil?”
¡Inténtalo! Tercero, asumimos que los rasgos tienen cierto
grado de estabilidad o permanencia. No es necesa-
Ya hemos nombrado diversos rasgos humanos rio que sean estables por completo, pero no deben
(capacidad verbal, depresión, etc.). Trata de nom- fluctuar de manera drástica de un momento a otro. Si
brar más de ellos, algunos en el ámbito de la ca- el rasgo mismo no es lo suficientemente estable, no
pacidad y otros en el de la personalidad importa qué tan refinada sea nuestra prueba, pues no
podremos hacer mucho con ella.
Rasgos de capacidad: Cuarto, asumimos que los rasgos estables que cuan-
Rasgos de personalidad: tificamos con nuestras pruebas tienen una relación im-
portante con la conducta real en situaciones vitales.
Desde un punto de vista teórico, este cuarto supuesto
es el menos importante; es decir, como teóricos pode-
Copyright © ${Date}. ${Publisher}. All rights reserved.

Segundo, asumimos que podemos cuantificar es- mos estar satisfechos mostrando que podemos cuan-
tos rasgos, lo cual consiste en ubicar los objetos (en tificar un rasgo psicológico específico sin importar su
este caso, personas) a lo largo de un continuo. El con- relación con cualquier otra cosa. Sin embargo, desde
tinuo debe pensarse como algo que va de abajo ha- una perspectiva práctica, este supuesto es decisivo. En
cia arriba o de menos a más; corresponde al rasgo que términos pragmáticos, podríamos decir que no importa

Menos Más

Figura 1-1. El continuo que, asumimos, existe de un rasgo.

10 Pruebas psicológicas. Una introducción práctica


cuán elegante es el modo en que una prueba cuantifi- Resumen de puntos clave 1-6
ca un rasgo psicológico; si ésta no se relaciona con algo
más, no estamos interesados en ella. Preguntas fundamentales sobre las pruebas
• Confiabilidad
Preguntas fundamentales • Validez
• Normas
Ahora consideraremos las preguntas fundamenta- • Elaboración de la prueba
les acerca de las pruebas. En muchos sentidos, esas • Asuntos prácticos
preguntas se relacionan o son extensiones de los
supuestos que enumeramos antes. Anticipándonos,
haremos notar que estas preguntas abordan precisa-
mente los temas que cubren los capítulos 3, 4, 5 y 6,
donde aprenderemos cómo los psicólogos tratan de temas que nos preocupan en cualquier tipo de prueba;
responder a dichas preguntas. sin embargo, tenemos que agregar dos tipos de pre-
Primero, preguntamos por la confiabilidad de la guntas a nuestro catálogo de preguntas fundamenta-
prueba, la cual se refiere a la estabilidad de sus pun- les. Saber cómo se elaboró una prueba nos ayuda a
tuaciones. Por ejemplo, si hago la prueba hoy y ma- menudo a comprender mejor la confiabilidad, validez
ñana la hago otra vez, ¿obtendré aproximadamente la y normas; por tanto, la elaboración de las pruebas es
misma puntuación? Examinamos este tema con sufi- otro tema crucial. Además, necesitamos considerar un
ciente detalle en el capítulo 4. Debe notarse que esta gran número de aspectos prácticos. ¿Cuánto cuesta la
cuestión no es exactamente la misma que tratamos en prueba? ¿Cuánto tiempo se lleva? ¿Se consigue con fa-
nuestro tercer supuesto, la cual se refería a la estabili- cilidad? ¿Está disponible en otros idiomas aparte del
dad del rasgo mismo, mientras que la confiabilidad se inglés? Todas estas preguntas prácticas son importan-
refiere a la estabilidad de nuestra medición del rasgo. tes aunque no sean parte de la teoría de las pruebas.
Segundo, preguntamos acerca de la validez de la
prueba, la cual se refiere a lo que ésta mide en rea- Perspectiva diferencial
lidad. Si la prueba se propone medir la inteligencia,
¿cómo sabemos si, en efecto, mide la inteligencia? Como nota final, al considerar los supuestos y pregun-
Si la prueba se propone medir la depresión, ¿cómo tas fundamentales, queremos llamar la atención hacia
sabemos que mide la depresión? El área de la vali- lo que denominaremos la perspectiva diferencial. En
dez incluye el concepto de neutralidad, la cual es el muchas áreas de las ciencias sociales y de la conducta,
lado frívolo del sesgo, pues se refiere a que la prueba intentamos formular leyes o generalidades que se apli-
mida de una manera equitativa en diversos grupos, quen, más o menos, a todos; por ejemplo, ¿cuál es el
por ejemplo, entre géneros, edades, grupos raciales programa de reforzamiento skinneriano más eficaz para
o étnicos y distintas áreas geográficas. Esta pregunta, aprender una habilidad?, ¿cuál es el nivel óptimo de es-
en el fondo, se refiere a la validez de la prueba. Nos trés para realizar cierta tarea?, ¿el psicoanálisis cura las
dedicaremos con detalles a la validez en el capítulo 5 fobias? Formular estas preguntas sugiere que hay una
y a la neutralidad en el capítulo 6. respuesta que será, en general, válida para la gente. En
Tercero, preguntamos cómo interpretar las pun- contraste, la perspectiva diferencial asume que la res-
tuaciones de una prueba. Olivia obtuvo una puntua- puesta puede diferir para distintas personas; estamos
ción de 13 reactivos correctos de 20 posibles en una más interesados en la manera en que los individuos son
Copyright © ${Date}. ${Publisher}. All rights reserved.

prueba de aritmética, ¿es una buena calificación o es diferentes que en la manera en que se parecen. Esta
mala? Pete respondió “verdadero” en 45 de 60 reac- perspectiva diferencial permea en el campo de las prue-
tivos en una escala de depresión, ¿significa que está bas; tener en mente esta perspectiva ayuda a pensar
deprimido o eufórico? La interpretación de las pun- acerca de los asuntos relacionados con las pruebas.
tuaciones de una prueba, por lo general, depende del Un debate que está surgiendo en el contexto de la
uso de normas, las cuales se basan en las puntuacio- perspectiva diferencial se relaciona con cómo pensa-
nes de grandes grupos de individuos. En el capítulo 3, mos acerca de las diferencias: como síndromes o como
describimos los tipos de normas que se usan con las dimensiones (véase Widiger & Costa, 2012). Un síndro-
pruebas y cómo se elaboran. me describe un padecimiento específico, como tener un
Las preguntas relacionadas con la confiabilidad, va- tobillo roto o un tumor cerebral: se tiene o no se tiene.
lidez y normas son fundamentales en lo que se refiere El enfoque dimensional describe un continuo que va de
a las pruebas, y los intentos por responderlas constitu- menos a más o de abajo hacia arriba. Ejemplos muy cla-
yen el meollo de la teoría de las pruebas. Éstos son los ros son la estatura o la velocidad al correr un kilómetro,

Campo de las pruebas psicológicas 11


pues no son algo que se pueda o no tener. Pero ¿qué el espíritu de los diferentes períodos y transiciones en-
hay con la depresión? ¿Es un padecimiento específico tre ellos. Incluimos una juiciosa selección de fechas para
o simplemente el extremo inferior de algún continuo? destacar los eventos particularmente representativos
¿Qué hay con los problemas de aprendizaje? ¿Y qué de un periodo. El lector encontrará más fácil concentrar-
con...? Es obvio que esta lista podría continuar indefini- se en los temas que en las fechas exactas, pero es útil
damente. El debate síndrome frente a dimensión tiene aprenderse de memoria algunas fechas.
implicaciones importantes para nuestra manera de pen-
sar sobre los resultados de las pruebas psicológicas. Antecedentes remotos: hasta 1840

Perspectiva histórica El primer periodo es, en realidad, artificial; es tan exten-


so que casi desafía cualquier intento de hacer un resu-
Una cuarta manera de introducirse en el campo de las men serio, pero necesitamos empezar en algún punto.
pruebas es examinando sus orígenes históricos. ¿Cómo Identificamos tres puntos dignos de atención en esta
se llegó al estado actual? Saber esto, a menudo, es de- amplia extensión de tiempo. Primero, observamos que
cisivo para comprender los asuntos que se plantean en las raíces remotas de la psicología, como de muchos
nuestros días. Primero, bosquejamos los principales pe- otros campos, se encuentran en la filosofía. Entre los
ríodos y eventos en la historia de las pruebas; segundo, pensadores clásicos de las épocas antigua, medieval y
esbozamos algunas de las fortalezas más importantes moderna, había una clara falta de interés en el tema de
que han influido en el desarrollo del campo de las prue- las diferencias individuales o en la medición de los ras-
bas. Al armar esta historia, nos hemos valido de distintas gos. Si empleamos el método moderno de “frecuencia
fuentes, muchas de las cuales relatan los mismos deta- de citación” para definir la influencia de los autores de
lles, pero desde una perspectiva un poco diferente. Para hace 2500 años, sin duda Aristóteles, Platón y Aquino
saber más de los períodos más tempranos, se puede serían los tres más importantes (más allá de las sagra-
consultar a Boring (1950), DuBois (1970), Hilgard (1987), das escrituras). Examinar los escritos de estos tres gi-
Misiak (1961) y Murphy (1949). gantes, así como los de sus colegas, revela un interés
La historia de este campo puede dividirse, para ma- predominante en definir qué es lo común en los seres
yor comodidad, en siete períodos principales (véase humanos o qué es, en general, la verdad, más que las
el Resumen de puntos clave 1-7). La mayoría de estos diferencias entre ellos. Consideremos, por ejemplo, el
períodos tiene un tema dominante que ayuda a orga- Peri Psyche (también conocido por su nombre latín De
nizar nuestra comprensión del flujo de los eventos. Anima, traducido al español como “Acerca del alma”).
Trazamos límites cronológicos entre los períodos re- Escrito alrededor del año 350 a. de C., este trabajo se
dondeando los tiempos sólo por razones pedagógicas, cita a menudo como el primer libro de texto de psicolo-
pero a veces traspasamos estos límites autoimpuestos gía; de hecho, le dio nombre al área. En el libro inicial
para mantener la continuidad. Al bosquejar el desarrollo de este tratado, Aristóteles (1935) dice: “Intentamos
cronológico del campo, evitamos recitar fechas, lo cual examinar e investigar, primero, la naturaleza y esencia
puede adormecer la mente, porque preferimos capturar del alma y, después, sus atributos [esenciales]” (p. 9).
Ésta no es la sustancia de la perspectiva diferencial.
Platón, la otra gran luminaria del mundo antiguo,
Resumen de puntos clave 1-7 cuya influencia no ha disminuido, también se concentró
en lo general y, aun más que Aristóteles, en lo abstracto.
Principales períodos en la historia El escritor más influyente del periodo medieval fue To-
Copyright © ${Date}. ${Publisher}. All rights reserved.

de las pruebas más de Aquino; en lo que respecta a los temas de psi-


cología, recapituló mucho del trabajo de Aristóteles. De
1. Antecedentes remotos Hasta 1840 hecho, consideró su tarea principal reconciliar la teolo-
gía cristiana con la síntesis aristotélica, por lo que Aqui-
2. Creación del escenario 1840-1880 40 años no adoptó el concepto de Aristóteles de capacidades
3. Raíces 1880-1915 35 años humanas y manifestó el mismo desinterés en las dife-
rencias humanas, pues prefirió concentrarse en las ca-
4. Florecimiento 1915-1940 25 años racterísticas generales de la naturaleza humana. Desde
5. Consolidación 1940-1965 25 años luego, estos filósofos no eran tontos, sino agudos ob-
servadores de la condición humana. Hicieron comenta-
6. Pasado reciente 1965-2000 35 años rios ocasionales –siempre fascinantes– sobre los temas
de las diferencias individuales, pero siempre eran estric-
7. Actualidad 2000 al presente
tamente incidentales, no el centro de atención.

12 Pruebas psicológicas. Una introducción práctica


Después de la época medieval, el Renacimiento Primero, a lo largo de este periodo, tanto el interés
atestiguó un verdadero despertar a lo individual, pero científico como la conciencia pública de la enfermedad
este interés se reflejó primordialmente en las produc- mental aumentaron enormemente. Desde los primeros
ciones artísticas, la gloriosa profusión de pinturas, es- impulsos de Philippe Pinel en Francia, Samuel Tuke en
culturas y construcciones que aún nos dejan sin aliento. Inglaterra y Benjamin Rush en EUA, surgió un gran núme-
Los pensadores dominantes del Renacimiento tardío y ro de intentos para mejorar el diagnóstico y tratamiento
el periodo moderno temprano siguieron ocupándose de los enfermos mentales. Dorothea Dix (figura 1-2) per-
del funcionamiento de la mente humana. Por ejemplo, sonifica el lado humanitario de tales intentos; alrededor
Descartes, Locke, Hume y Kant plantearon preguntas de 1840 comenzó una cruzada prácticamente mundial
–y dieron respuestas– que forman parte de los antece- que dio por resultado mejoras en las condiciones de
dentes remotos de las raíces de la psicología, pero el cárceles y hospitales. Del lado científico, empezaron a
énfasis continuó puesto en lo que era común. surgir métodos para diagnosticar enfermedades menta-
En lo que respecta al modo en que se hacían los les, incluyendo el retraso mental; por ejemplo, aparecie-
exámenes en nuestro pasado remoto, DuBois (1970) ron métodos simples para evaluar la capacidad mental,
observa que los exámenes escritos no eran comunes como el tablero de formas de Seguin (Figura 1-3). Estas
en la tradición educativa occidental. La práctica más primeras medidas no tenían normas ni datos de confia-
usual en las escuelas en la Antigüedad, el Medioevo bilidad, pero, al menos, presagiaron los elementos de las
y, de hecho, hasta mediados del siglo XIX fue el exa- medidas que se desarrollarían más tarde.
men oral. Los vestigios de esta práctica persisten en Un segundo desarrollo significativo de este perio-
la actualidad en las defensas orales de las tesis de li- do fue la adopción de exámenes formales escritos por
cenciatura, maestría y doctorado; en inglés, cuando parte del Comité Escolar de Boston –en esencia, el
alguien presenta una de estas defensas, se dice “ta- consejo escolar de la ciudad– bajo la dirección de Ho-
king your orals” [tomar tus orales], como si se tratara race Mann, probablemente el educador más influyen-
de algún tipo de píldora de mal sabor (en realidad, es te de aquellos días. Mann defendió, no sólo en Boston
mucho peor que una píldora). DuBois menciona que sino en todo EUA, un mejoramiento sustancial en el
los exámenes escritos surgieron en las notables es- modo en que las escuelas evaluaban a sus alumnos.
cuelas jesuitas a finales del siglo XVI, que son las an- Tercero, llegó la era de Darwin. Su sorprendente obra
tecesoras de la red actual de escuelas secundarias, El origen de las especies por medio de la selección na-
colegios y universidades jesuitas de todo el mundo. tural apareció en 1859, pero quizá más importante para
El Ratio Studiorum jesuita, una especie de guía cu- el incipiente campo de la psicología fueron sus siguien-
rricular temprana, sentó reglas estrictas (¡estandariza- tes libros: El origen del hombre y la selección en relación
ción!) para llevar a cabo los exámenes escritos. al sexo de 1871 y La expresión de las emociones en los
Por último, algunos libros de texto informan del animales y en el hombre de 1872. Desde luego, estos li-
equivalente de los exámenes de servicio civil que se bros pusieron al mundo de cabeza, pero ¿por qué fueron
usaron de manera habitual en China desde el año tan importantes para la psicología? Porque hicieron que
2000 a. de C. Sin embargo, Bowman (1989) sostiene la gente pensara sobre las diferencias: primero, entre las
de modo convincente que estos informes se basan
en fuentes históricas inadecuadas (apócrifas, podría-
mos decir) y que la aplicación más antigua de tales
pruebas ocurrió probablemente alrededor del 200 a.
de C. No obstante, sea en el año 200 o 2200 a. de C.,
Copyright © ${Date}. ${Publisher}. All rights reserved.

se trata de un desarrollo histórico interesante; este


sistema continuó hasta principios del siglo XX y pue-
de haber tenido cierta influencia en las pruebas del
servicio civil en los países occidentales.

Creación del escenario: 1840-1880

Los hechos ocurridos entre los años 1840 y 1880 pusie-


ron el escenario para las estrellas que habrían de ser los
principales personajes del drama que se desarrolló des-
pués. Esta puesta en escena está constituida por un gran
conjunto de eventos inconexos; sin embargo, en retros- Figura 1-2. Dorothea Dix, paladín del mejoramiento de
pectiva, podemos ver cuatro hilos que se entretejen. las condiciones hospitalarias.

Campo de las pruebas psicológicas 13


Figura 1-3. Tablero de formas como el de Seguin.
Fuente: Archivos de la Historia de la Psicología de EUA.

especies y, luego, entre los individuos. En particular, hicie- 1880 y 1915, pues las primeras medidas que tuvieron in-
ron que Francis Galton pensara en las diferencias indivi- fluencia duradera aparecieron en él. Muchos de los te-
duales; hablaremos más de Galton en un momento. mas y métodos básicos emergieron en una forma más o
Cuarto, surgió la psicología experimental. El año que menos explícita. Al principio de este periodo, había pocos
tradicionalmente se considera su fecha de nacimiento –muy pocos– ejemplos que uno podría señalar y decir:
es 1879, cuando Wilhelm Wundt abrió su laboratorio en ésa es una prueba. En cambio, al final de este periodo,
la Universidad de Leipzig, ciudad alemana que actual- había un ejército de instrumentos, algunos de los cuales
mente cuenta con medio millón de habitantes y se ubi- son prácticamente idénticos a los actuales, excepto por
ca a unos 120 kilómetros al sur de Berlín. La psicología algunas palabras arcaicas. Al principio de este periodo, el
experimental fue una ramificación de la fisiología, cuya coeficiente de correlación y el concepto de confiabilidad
conexión fue la psicofísica. En sus inicios, la psicología no se habían inventado y, al final, estas piedras angulares
experimental fue, en esencia, sinónimo de la psicofísi- metodológicas de las pruebas no sólo se habían inventa-
ca. Su contribución al campo de las pruebas, para bien do, sino que se habían elaborado e incorporado a la re-
o para mal, fue doble; por un lado, como toda ciencia ciente teoría de las pruebas mentales.
de laboratorio, se concentró en la estandarización de Destacaremos los eventos y personalidades clave
las condiciones y la precisión de las mediciones. Por de este emocionante periodo; nos centraremos en cua-
otro, se concentró en procesos elementales, por ejem- tro individuos y, además, mencionaremos otro persona-
plo, sensación, umbrales, percepción y reacciones mo- je y luego un amplio conjunto de otros contribuidores.
trices simples. El laboratorio de Wundt fue elegido por La primera figura clave fue Francis Galton (figura 1-4),
muchos psicólogos de esa época para formarse, por lo a quien muchos consideran el fundador del campo de las
que sus intereses y métodos ejercieron gran influencia pruebas psicológicas. Señor británico acaudalado e inde-
en el naciente campo de la psicología. pendiente, nunca tuvo un trabajo real, ni siquiera como
Así llegamos a 1880: la psicología experimental es profesor universitario. Fue un diletante, pero lo fue a lo
una nueva ciencia, la evolución se discutía en todo el grande, con una impresionante creatividad y versatilidad.
mundo, hay un amplio interés en la enfermedad men- Digno sobrino segundo de Charles Darwin, Galton
tal, incluyendo el retraso mental, y algunos pioneros fue el primero en llevar la teoría de la evolución al na-
tratan de llevar la educación al terreno de la ciencia. ciente campo de la psicología. Su interés radicaba en
la herencia, sobre todo en la herencia de altos niveles
Raíces: 1880-1915 de capacidad. Él la llamó “genio” y la estudió en una
amplia variedad de áreas, como la música, la milicia,
Copyright © ${Date}. ${Publisher}. All rights reserved.

Las raíces del campo de las pruebas, tal como se encuen- el liderazgo político y la literatura.
tra en la actualidad, datan del periodo comprendido entre Al tratar de examinar las relaciones entre las muchas
variables que estudió, Galton inventó un gráfico de dis-
tribución bivariada; como consecuencia de esto, indujo
a Karl Pearson, un matemático británico contemporá-
Resumen de puntos clave 1-8 neo, a inventar el coeficiente de correlación. Galton tuvo
el tiempo, los recursos y la personalidad para lograr mu-
• Elementos de la creación del escenario chas cosas, pues, además, fue un proselitista. Difundió
• Aumento de interés en la enfermedad mental sus ideas sobre los métodos de la medición mental; a
• Adopción de los exámenes escritos pesar de que no ostentaba una posición de prestigio, al
• Amanecer de la era de Darwin parecer para 1910 todos conocían su trabajo.
• Surgimiento de la psicología experimental El principal contribuidor estadounidense para el
desarrollo de las pruebas fue James McKeen Cattell.

14 Pruebas psicológicas. Una introducción práctica


Cuadro 1-1. Lista abreviada de las 10 pruebas clave
de Cattell
1. Presión del dinamómetro [fuerza del agarre]
2. Tasa del movimiento
3. Áreas de sensación
4. Presión causante de dolor
5. Menor diferencia perceptible en el peso
6. Tiempo de reacción ante los sonidos
7. Tiempo para nombrar los colores
8. Bisección de una línea de 50 cm
9. Juicios de 10 segundos de tiempo
10. Número de letras recordadas después de escuchar-
las una vez
Figura 1-4. Francis Galton: diletante extraordinario y nexo
entre la teoría de la evolución y la psicología.

¡Inténtalo!
Después de un breve periodo en la Universidad de Pen-
nsylvania, pasó la mayor parte de su carrera profesional De las pruebas que aparecen en el cuadro 1-1,
en la Universidad Columbia en la ciudad de Nueva York. ¿cuál crees que podría ser el mejor predictor del
La preparación de Cattell era ideal para combinar dos éxito académico?
corrientes metodológicas. Por un lado, hizo su trabajo de
graduación primero con Wundt en Leipzig, donde refinó
sus habilidades en los estudios rigurosos de laborato-
rio de la tradición psicofísica. Por otro, después estudió Resumen de puntos clave 1-9
con Galton, de quien al parecer absorbió la fascinación
por recolectar datos sobre las diferencias individuales Personas importantes para establecer las raíces
en los rasgos humanos. De acuerdo con la noción pre- • Francis Galton
dominante en ese momento, Cattell creía que la clave • James McKeen Cattell
del funcionamiento mental eran los procesos elemen- • Alfred Binet
tales, por lo que creó una batería de 50 pruebas, de las • Charles Spearman
cuales 10 eran consideradas los pilares (véase cuadro • Creadores de las “pruebas nuevas”
1-1), pues cubrían áreas como agudeza sensorial, tiempo
de reacción, bisección visual de una línea y juicios en in-
tervalos cortos de tiempo. Cattell las aplicaba a grupos la formación avanzada en medicina y en ciencias na-
de estudiantes universitarios con el propósito de prede- turales. Durante la mayor parte de su carrera, Binet
cir el éxito académico –el abuelo conceptual de los ac- se concentró en investigar las funciones mentales;
tuales SAT y ACT– y persuadió a otros psicólogos para en contraste con Galton, Binet buscaba actividades
emprender proyectos similares. Las pruebas de Cattell mentales más holísticas, como usar palabras, encon-
fueron un colosal fracaso como predictores; sin embar- trar relaciones o captar significados. En esa época,
go, su trabajo tuvo gran influencia. En un famoso artículo las escuelas parisinas querían identificar a los estu-
Copyright © ${Date}. ${Publisher}. All rights reserved.

de 1890, acuñó el término prueba mental (Cattell, 1890), diantes que más probabilidades tenían de benefi-
el cual se usó para caracterizar el campo los siguientes ciarse de enseñanza en escuelas especiales que de
50 años. Como era debido, aparecía un comentario de programas en escuelas regulares. Un comité, del que
Galton después del artículo. Binet y Theodore Simon formaban parte, se creó para
La tercera figura de este periodo que tuvo in- elaborar un método que permitiera identificar a es-
fluencia fue el francés Alfred Binet (que se pronuncia tos estudiantes; el resultado fue la Escala Binet-Si-
Bă-nay’]. En su sección sobre las pruebas menta- mon,3 que se publicó por primera vez en 1905. En
les, Boring (1950) resume el tema de manera sucin- 1908 y en 1911, aparecieron formas revisadas, en las
ta: “La década de 1880 fue el decenio de Galton en
este campo; la de 1890, de Cattell, y la de 1900, de 3
Seguimos la práctica moderna de referirnos a ésta como la
Binet” (p. 573). Binet es el verdadero padre de las Escala Binet-Simon. En su propio trabajo, Binet no empleó un
pruebas de inteligencia; de manera inusual, su for- nombre oficial para esta prueba; simplemente se refirió a ella
mación original era en leyes, pero después terminó como la “escala” o la “prueba”.

Campo de las pruebas psicológicas 15


que se usó el concepto de “edad mental”. En el ca- surgieron las pruebas del nuevo tipo; tampoco había es-
pítulo 8, examinaremos el nieto de la escala de Bi- cáner para leer las hojas de respuestas. Los autores que
net, la moderna Escala de Inteligencia Stanford-Binet. trabajaron en el campo de las pruebas de rendimiento
Cuarto, también está el trabajo de Charles Spearman, en ese tiempo no estaban preocupados por la eficiencia
otro inglés, cuyas contribuciones fueron de un carácter en la calificación, sino que la confiabilidad de la califica-
distinto del de los otros tres. Spearman no quería inven- ción era lo que los apasionaba.
tar nuevos tipos de pruebas o de reactivos, no empren-
dió ningún proyecto novedoso de recolección de datos, Florecimiento: 1915-1940
sino que fue un gran teórico y amo de los números. En
1904, publicó un artículo en el que se anunció la teoría Desde sus humildes y más bien inconexas raíces de
“bifactorial” de la inteligencia. De una manera extraña, 1880 a 1915, el campo de las pruebas entró en un pe-
apareció en el American Journal of Psychology y no en riodo de crecimiento espectacular. Al principio de
una publicación británica. Spearman reforzó su teoría este periodo, había pruebas, pero pocas estaban es-
con el método de las diferencias tetrad, la forma más an- tandarizadas del modo en que pensamos de un ins-
tigua de la técnica estadística que con el tiempo se co- trumento actual; al final del periodo, en sólo 35 años,
noció como análisis factorial. Lo importante aquí es que miles de ellas estaban disponibles. Las primeras edi-
se trata del primer intento de brindar una teoría empírica ciones de la gran mayoría de pruebas que hoy se
de la inteligencia humana y fue fuente de inspiración de usan ampliamente nacieron durante este periodo.
nuevos métodos de la medición mental. Las teorías pre- Esto sucedió en cada esfera del campo de las prue-
vias eran, en esencia, filosóficas, pero ésta era un nuevo bas: capacidad mental, rendimiento, personalidad, in-
tipo de teoría, porque se basaba en resultados de prue- tereses. El grado de actividad era vertiginoso. Ahora
bas (la mayoría de tipo Galton) y se acompañaba de una examinaremos algunos de estos desarrollos.
nueva metodología matemática. De hecho, ésta era la La clara demarcación entre el periodo de las raí-
sustancia de una nueva ciencia. ces y el del florecimiento llega cuando las escalas de
El elemento final para establecer las raíces de las Binet atravesaron el océano Atlántico desde Francia
pruebas no está identificado con tanta claridad, pues no hasta EUA. Podíamos ubicar una fecha entre 1910 y
se trató de una sola persona, sino de un grupo de perso- 1916, pero, sin importar cuál sea la fecha exacta ele-
nas que perseguían la misma meta y del mismo modo. gida, lo importante es el trayecto transatlántico. El
Éste era el grupo de personas que construían con fervor trabajo de Binet recibió atención casi de inmediato
las primeras versiones de las pruebas de rendimiento en EUA; algunas de las nuevas versiones estadouni-
educativo. Respondían al mismo impulso que Horace denses fueron principalmente traducciones, de las
Mann: la necesidad de llevar la educación al nivel del cuales, quizá, la primera fue la de Goddard en 1910
mundo de la ciencia. Si la educación había de realizar- (DuBois, 1970; Murphy, 1949). También hubo otras tra-
se de manera científica, entonces se requerían medidas ducciones y adaptaciones; sin embargo, el evento de-
precisas, confiables. Éste era un interés diferente del de finitivo fue la publicación de la Revisión Stanford de
Cattell, que era la predicción. Estos investigadores que- la Escala Binet en 1916, que se conoce popularmente
rían medidas de los resultados de la educación. como Stanford-Binet. Organizada por Lewis Terman
Con un entusiasmo casi evangélico, un grupo de au- de la Universidad Stanford, la Revisión Stanford inclu-
tores de pruebas creó lo que llamaron “nuevo tipo” de yó nuevos reactivos (que casi duplicaron el número
pruebas de rendimiento. Su principal preocupación era original), una nueva investigación de prueba, un am-
la falta de confiabilidad del ensayo y los exámenes ora- bicioso programa nacional para obtener normas y el
Copyright © ${Date}. ${Publisher}. All rights reserved.

les. Las pruebas de nuevo tipo eran tan objetivas como uso de la razón CI: en conjunto, todo esto fue un exi-
era posible, lo cual significaba en la práctica que los re- tazo. Un investigador que lo examinara hoy se burla-
activos eran de opción múltiple, verdadero-falso y de ría, pero en su tiempo, fue un avión de propulsión a
llenar espacios. Estos reactivos se podían calificar de chorro, el primer hombre en la luna, el primer teléfono
manera objetiva y eran más confiables que los de las inteligente. En un lapso relativamente corto, la Stan-
pruebas del “viejo tipo”. La literatura actual está repleta ford-Binet se convirtió en la definición por excelencia
de referencias a las deficiencias de las pruebas del vie- de la inteligencia humana, un pilar de la práctica clí-
jo tipo. En los debates actuales, el problema es la con- nica y, quizá, el símbolo más distintivo de la contribu-
fiabilidad entre distintos calificadores. Muchas personas ción de la psicología al mundo moderno. Así empezó
suponen que los reactivos de opción múltiple y otros pa- el periodo de florecimiento.
recidos se inventaron para el procesamiento masivo de Uno de los eventos que más influyeron en la histo-
pruebas mediante computadoras; nada podría ser más ria de las pruebas fue el desarrollo de la primera prueba
absurdo. Las computadoras ni siquiera existían cuando de inteligencia de aplicación grupal ampliamente usada.

16 Pruebas psicológicas. Una introducción práctica


Esto sucedió en el contexto de los intentos de los psicó- • Las manchas de tinta de Rorschach aparecieron
logos para ayudar a evaluar la gran cantidad de reclutas en 1921. Para 1940, había diferentes sistemas de
para el ejército cuando EUA entró a la Primera Guerra calificación de esta prueba.
Mundial en 1917. Arthur Otis, como parte de su traba- • Strong y Kuder lanzaron su trabajo pionero sobre los
jo doctoral bajo la tutela de Lewis Terman (famoso por inventarios de intereses vocacionales (Donnay, 1997;
la Stanford-Binet), emprendió la creación de una forma Zytowski, 1992). Describiremos las versiones actua-
de la Stanford-Binet para aplicarse de manera grupal. les de estas pruebas en el capítulo 15.
El trabajo de Otis resultó en las pruebas Army Alpha y • El MMPI (véase capítulo 13) se ideó en este tiem-
Army Beta, versiones verbal y no verbal, respectivamen- po, aunque no apareció sino después de finaliza-
te, que se aplicaron a cerca de 2 millones de miembros do este periodo.
del ejército. En 1918, estas pruebas estuvieron dispo- • Thurstone y Likert intentaron por primera vez
nibles para uso general como Otis Group Intelligence medir de manera sistemática las actitudes. Des-
Scale [Escala de Inteligencia para Grupos de Otis]. Exa- cribiremos sus métodos, que aún se utilizan en
minaremos un descendiente directo de esta prueba, el nuestros días, en el capítulo 15.
Otis-Lennon School Ability Test, en el capítulo 9.
Las pruebas Stanford-Binet y Otis establecieron Anteriormente, relatamos el evento por excelencia
el uso de una puntuación simple para representar la que dio inicio al periodo de florecimiento: la publica-
inteligencia. El mayor reto para esta práctica surgió ción de la Stanford-Binet Intelligence Scale [Escala de
en el trabajo de L. L. Thurstone (1938), quien sostenía Inteligencia Stanford-Binet] en 1916. Un digno final para
que había (más o menos) siete dimensiones diferen- este periodo fue, quizá, la primera revisión de esta
tes de la inteligencia humana. El trabajo de Thurstone prueba en 1937; además, casi coincidió con la apari-
produjo una gran cantidad de pruebas de inteligencia ción de la Wechsler Bellevue Intelligence Scale [Escala
con puntuaciones múltiples en este periodo. de Inteligencia Wechsler-Bellevue] en 1939. David We-
Una oleada de publicaciones en el periodo rela- chsler, psicólogo clínico que trabajaba en el Hospital
tivamente breve de 10 años, 1921-1930, estableció la Bellevue de la ciudad de Nueva York, no estaba satis-
preferencia por las pruebas de rendimiento del “nue- fecho usando la Stanford-Binet –prueba diseñada para
vo tipo” (McCall, 1922; Odell, 1928; Ruch, 1924, 1929; niños– con sus pacientes adultos. Diseñó su prueba
Ruch & Rice, 1930; Ruch & Stoddard, 1927; Toops, 1921; para que fuera más adecuada para los adultos.
Wood, 1923). Aunque la etapa previa presenció el ini- Las primeras ediciones de tres publicaciones sir-
cio del desarrollo de una gran cantidad de pruebas de vieron como triples signos de exclamación cuando
rendimiento del “nuevo tipo”, ninguna llegó a usarse estaba por concluir este notable y fecundo periodo
de manera generalizada. La primera de estas pruebas en la historia de las pruebas. La primera fue la publi-
que en verdad fue estandarizada a nivel nacional fue cación de la revista sumamente teórica Psychometri-
el Stanford Achievement Test, el cual apareció en 1923. ka en 1936; después, se publicó la revista con una
Es interesante que uno de sus coautores fuera Lewis orientación más pragmática Educational and Psycho-
Terman, el principal arquitecto de la revisión en Stan- logical Measurement en 1941, y, por último, apareció
ford de la escala de Binet. La década de 1930 también la primera edición de Mental Measurements Year-
presenció el origen de diversas baterías de rendimien- book de Oscar K. Buros en 1938. En el capítulo 2, des-
to bien conocidas (p. ej., las series Metropolitan, Iowa y cribimos en detalle la actual edición de esta última
California), así como una multitud de pruebas de temas publicación.
simples en cualquier área imaginable.
Copyright © ${Date}. ${Publisher}. All rights reserved.

Las pruebas de personalidad, tanto objetivas como Consolidación: 1940-1965


proyectivas, también florecieron en este periodo. El
prototipo de los inventarios objetivos de personalidad Después del estallido de la actividad desde distintos
actuales, el Woodworth Personal Data Sheet [Hoja de frentes de 1915 a 1940, el campo de las pruebas entró en
Datos Personales de Woodworth], se elaboró para ayu- un periodo que bien puede denominarse como de con-
dar en los procesos de reclutamiento del ejército en la solidación o madurez, y tuvo una duración de 25 años:
Primera Guerra Mundial. En esencia, era una entrevista de 1940 a 1965. La actividad no se redujo; de hecho si-
de lápiz y papel, 116 reactivos en total, que se respon- guió floreciendo. Aparecieron nuevas ediciones revisa-
dían con “Sí” o “No”, para detectar individuos que re- das de muchas pruebas que se crearon en el periodo
querían un examen psicológico más completo. Muchos anterior, pero también se elaboraron pruebas nuevas.
instrumentos similares surgieron después de la Prime- El uso de las pruebas se extendió en la práctica clínica,
ra Guerra Mundial. Los siguientes son ejemplos de la las escuelas, las empresas y el ejército, así que las prue-
profusión de nuevas publicaciones en este periodo. bas ya no eran el niño nuevo en la cuadra. Se aceptaron

Campo de las pruebas psicológicas 17


en la práctica profesional y se asumía que tendrían un En 1950, apareció el libro Theory of Mental Tests
papel destacado en diversos contextos. Varios eventos [Teoría de las pruebas mentales] de Harold Gulliksen,
marcaron esta recién adquirida madurez. la entonces obra definitiva de la teoría psicométrica.
Al principio de este periodo, por supuesto, la Se- Casi al mismo tiempo se publicaron las primeras edi-
gunda Guerra Mundial (1939-1945) era el centro de ciones de dos libros de texto seminales sobre el cam-
atención de todo el mundo. Las pruebas, más que ser po de las pruebas: Essentials of Psychological Testing
creaciones nuevas como en la Primera Guerra Mun- [Fundamentos de las pruebas psicológicas] de Lee
dial, se usaron amplia y habitualmente para evaluar al Cronbach en 1949 y Psychological Testing [Pruebas
personal del ejército. Psicólogos destacados, ahora psicológicas] de Anne Anastasi en 1954 (figura 1-5).
entrenados en los métodos del campo de las pruebas Ambos libros aparecieron después en numerosas
desarrollados en el periodo anterior, llevaron a cabo ediciones revisadas, pero las primeras ayudaron a de-
estas aplicaciones. Además, los psicólogos clínicos finir un campo maduro de estudio. Así, el campo de
realizaron su trabajo en el tratamiento de los daños las pruebas llegó a la década de 1960 con un amplio
psicológicos relacionados con la guerra empleando, abanico de instrumentos, patrones de uso estableci-
en parte, las pruebas ahora disponibles. dos, una base teórica bien definida y publicaciones
La aparición de libros u otros documentos escritos de referencia en que se resumía todo esto.
definen, a menudo, este periodo histórico. Así, la De-
claración de Independencia significó el surgimiento Pasado reciente: 1965-2000
de una nación, aunque muchos otros eventos podrían
haber sido tomados como desarrollos más importan- Quien lea este libro dentro de 50 años –si es que alguien
tes. Quizá, la mejor evidencia de la consolidación del lo hace– se reirá, sin duda, del título “pasado reciente”;
campo de las pruebas en este periodo fue la aparición sin embargo, en este texto, el periodo de 35 años com-
de numerosos libros donde se resumía el estatus del prendidos entre 1965 y 2000 es “el pasado reciente”.
campo. Estos libros se convirtieron en clásicos justo Gran parte de lo que sucedió en este periodo es simul-
porque pudieron brindar un resumen del pensamien- táneo a la vida del lector de hoy, por lo que todo parece
to maduro acerca de las principales cuestiones del haber ocurrido apenas. De hecho, todo esto aún se está
campo. Veinte años antes, digamos en 1930, no ha- desplegando ante nuestros propios ojos, pues se mez-
bría sido posible escribir estos libros porque el pensa- cla de manera imperceptible con el presente. Este pe-
miento sobre dichas cuestiones no había madurado. riodo parece distinguirse por cuatro temas importantes.
Incrustado en este periodo de consolidación, hubo un Primero, la teoría de las pruebas ha cambiado sus-
lapso de seis años, 1949-1954, en el que apareció media tancialmente. El periodo de consolidación, en esen-
docena de libros que pronto se convertirían en clásicos. cia, resumió lo que ahora llamamos teoría clásica de
Entre estas obras estuvieron las primeras versiones (de las pruebas. A mitad de la década de 1960, apareció
1954 y 1955) de lo que serían los Standards for Educatio- la teoría de la respuesta al reactivo o “teoría moderna
nal and Psychological Tests [Estándares para las pruebas de las pruebas”, que consiste en un nuevo conjunto de
educativas y psicológias], una especie de biblia sobre lo métodos para examinar un compendio entero de temas
mejor del conocimiento de las cuestiones técnicas rela- relacionados con la confiabilidad, creación de escalas
cionadas con las pruebas. Citaremos extractos de este li- y elaboración de pruebas. El inicio del nuevo enfoque
bro a lo largo de capítulos posteriores. teórico quedó marcado, quizá, por la publicación de
Copyright © ${Date}. ${Publisher}. All rights reserved.

Figura 1-5. Autores de los primeros libros de texto sobre pruebas: Lee Cronbach y Anne Anastasi.

18 Pruebas psicológicas. Una introducción práctica


(Groos, 1962) y The Tyranny of Testing [La tiranía de
Resumen de puntos clave 1-10 las pruebas] (Hoffman, 1962) son muy representati-
vas. Algunas de estas críticas caían en lo puramen-
Características importantes: pasado reciente te quisquilloso; se derramaron litros de tinta sobre las
• Aparición de la teoría de la respuesta al reactivo 46 diferentes maneras en que se podía interpretar un
• Activismo legislativo y judicial determinado reactivo de opción múltiple. Esto estaba
• Críticas públicas al campo de las pruebas dirigido al público general, pero era una molestia cons-
• Influencia de las computadoras tante para los autores y editores de las pruebas, aun-
que no tuviera un efecto práctico en la creación o uso
de ellas. Sin embargo, esto dio origen a preguntas en
Statistical Theories of Mental Test Scores [Teorías esta- la conciencia pública sobre la validez de las pruebas.
dísticas de las puntuaciones de las pruebas mentales] El segundo tipo de crítica estaba relacionado con las
de Frederic Lord y Melvin Novick (1968), es decir, justo al diferencias étnicas y raciales en las puntuaciones de
inicio de este periodo. Este libro, anunciado como el su- las pruebas, lo que, en realidad, era parte de los temas
cesor de Theory of Mental Tests [Teoría de las pruebas legales y judiciales antes mencionados. Este tipo de
mentales] de Gulliksen, nos introdujo en una nueva era críticas propició una gran cantidad de investigación so-
de la teoría de las pruebas. Desde la década de 1970 bre los sesgos de las pruebas, de lo cual hablaremos
hasta el presente, revistas y libros de texto se dedicaron en detalle en los capítulos 6 y 16. El tercer tipo de crí-
a este campo impulsado por las aplicaciones de la teo- tica fue demoledor; en esencia, decía que las pruebas
ría de la respuesta al reactivo. Nos referiremos a estos indagaban en las cosas equivocadas, pues las pruebas
desarrollos con mayor detalle en posteriores capítulos. de rendimiento de opción múltiple pasaban por alto
Segundo, de mediados de la década de 1960 data dimensiones importantes del desarrollo del alumno.
el activismo legislativo y judicial relacionado con las Peor aún, se decía que el uso de tales pruebas promo-
pruebas y surgido principalmente, pero no exclusiva- vía los hábitos de enseñanza y aprendizaje equivoca-
mente, del gobierno federal de EUA. Hasta ese mo- dos. Para quien guste de la polémica, ¡el campo de las
mento, el campo de las pruebas no estaba legislado, pruebas es el lugar ideal en la actualidad! En los capí-
sea para bien o para mal, pero a partir de entonces tulos posteriores, podremos revisar todas estas críticas
la ley estableció requerimientos para algunos tipos y veremos cómo analizarlas.
de pruebas, mientras que otros tipos, o ciertos usos Cuarto, la influencia de las computadoras ha per-
de ellos, fueron prohibidos. Los usos de las pruebas meado en el campo contemporáneo de las pruebas.
fueron cuestionados en las cortes desde muchos Para el lector actual, puede ser una sorpresa que tal
frentes: para clasificar estudiantes, dar empleo, gra- influencia sea reciente. Las raíces, el florecimiento y la
duarse, etc. Por decir lo menos, este periodo de ac- consolidación del campo precedieron la era de la com-
tivismo legislativo y judicial presentó un conjunto de putadora; sin embargo, en los últimos 30 o 40 años la
desafíos muy particulares. Examinaremos casos es- práctica de este campo ha cambiado mucho a causa de
pecíficos en este entorno en el capítulo 16. las computadoras, pero reservaremos esta historia para
Tercero, el campo de las pruebas se convirtió en la discusión de las principales fuerzas que han influido
tema de críticas públicas generalizadas en este pe- en el campo de las pruebas en la siguiente sección.
riodo, dirigidas primordialmente a las pruebas estan-
darizadas de capacidad y rendimiento. Las pruebas Actualidad: de 2000 al presente
de intereses, actitudes y personalidad salieron, en su
Copyright © ${Date}. ${Publisher}. All rights reserved.

mayoría, ilesas. En los 50 años previos a este perio- Decir que estamos escribiendo una historia del pre-
do, este campo había sido visto como una herramien- sente es un oxímoron, por cierto, muy peligroso. Con-
ta científica nueva y valiosa. Para asegurarse de ello, siderar de manera errónea una irregularidad temporal
hubo debates, pero en su mayoría habían sido como como tendencia importante, o tener como punto cie-
pleitos dentro de la familia, pues estuvieron confinados go el surgimiento de una tendencia en verdad signifi-
a las revistas especializadas en psicología y educación. cativa, puede hacernos pasar por tontos. No obstante,
Sin embargo, a principios de la década de 1960, las concluiremos este bosquejo de la historia del campo
críticas provenían del exterior del campo, pero se in- de las pruebas identificando lo que parecen ser desa-
tensificaron en su interior, lo que llevó la situación mu- rrollos destacados en la escena actual. Identificamos
cho más allá de un pleito familiar. La lluvia de críticas cinco desarrollos; a manera de prólogo de la discusión,
tuvo tres formas principales. Primero, aparecieron va- haremos notar que las cuatro tendencias del periodo
rias obras populares con títulos pegajosos, de las cua- previo todavía están más que vivas y que lo que cla-
les The Brain Watchers [Los guardianes del cerebro] sificamos como desarrollos actuales son frutos de él.

Campo de las pruebas psicológicas 19


Primero, hay un aumento explosivo del número y Las áreas cuarta y quinta del desarrollo se rela-
diversidad de pruebas; cada día se anuncian nuevos cionan con las computadoras, pero de un modo di-
instrumentos o revisiones de las que ya existen. Este fe- ferente. La siguiente sección (Principales fortalezas)
nómeno de crecimiento parece afectar todas las áreas rastrea la influencia a largo plazo de las computado-
de las pruebas psicológicas y educativas; una notable ras sobre el campo de las pruebas. Ahí bosquejamos
subdivisión de la actividad se presenta en los programas estos desarrollos tardíos; sólo señalamos aquí que
estatales de evaluación, llevados a cabo primordialmen- ellos se relacionan con el gran aumento en la apli-
te por la reciente No Child Left Behind Act [Ley para que cación y los informes en línea de las pruebas y con
ningún niño se quede atrás] (NCLB), implementada en el desarrollo de programas de cómputo que simulan
2002. Como resultado, ahora cada estado es, en efec- el juicio humano en el análisis de las respuestas a las
to, creador y editor de pruebas, pero también estamos pruebas. Estos dos desarrollos recientes están revo-
siendo testigos de una profusión de nuevas pruebas de lucionando ciertos aspectos del campo.
personalidad, varios trastornos y capacidades mentales.
Incluso catalogar todas las entradas nuevas se ha con- Fortalezas principales
vertido en una tarea casi imposible, y evaluarlas de ma-
nera oportuna constituye un desafío desalentador. Hay una alternativa distinta de la cronológica para ver
Este crecimiento vertiginoso resalta la necesidad de la historia de las pruebas. Podemos examinar las forta-
la eficiencia en el uso de las fuentes de información so- lezas principales, tendencias o temas recurrentes que
bre las pruebas, que es precisamente el tema de nues- ayudaron a crear este campo y lo trajeron hasta el pre-
tro siguiente capítulo. También resalta la necesidad de sente. Es una aproximación más arriesgada, porque se
ser competente para evaluar la plétora de pruebas nue- puede pasar por alto una tendencia importante o juz-
vas, a lo cual aspiramos en los capítulos 3 al 6. gar mal la influencia de un hecho determinado, de modo
Segundo, la influencia del énfasis en el manejo cuida- que nos convertiríamos en presa fácil para la crítica. Es
doso o manejo responsable se ha generalizado; desde difícil pasar por alto un periodo cronológico. Sin embar-
luego, ésta no empezó en 2000, pero pasó desapercibi- go, para ofrecer a los nuevos estudiantes material para
da hasta los últimos años del periodo anterior. Ahora es la reflexión, esta segunda aproximación puede ser más
una de las fortalezas con mayor influencia en la prácti- beneficiosa; por ello, tomaremos el riesgo. Aquí identi-
ca clínica. El manejo responsable ejerce presión sobre el ficamos seis fortalezas principales que han moldeado
campo de las pruebas de distintas maneras. Exige prue- el campo de las pruebas como lo conocemos hoy.
bas más focalizadas: no uses una batería general de dos
horas si una prueba más focalizada de 15 minutos es su- Impulso científico
ficiente. El manejo responsable también demanda víncu-
los más cuidadosos entre el diagnóstico y el tratamiento La primera fortaleza que influyó en el desarrollo de
y, por otro lado, entre el tratamiento y los resultados. Por las pruebas es el impulso científico, que ha predomi-
lo tanto, los resultados de las pruebas deben indicar el nado a lo largo de toda su historia. Los escritos de
tratamiento, y los resultados de éste deben estar docu- Galton, E. L. Thorndike, Cattell, Binet y otros funda-
mentados. En la práctica, esto implica el uso repetido de dores están llenos de referencias a la necesidad de
una prueba para mostrar las mejorías, definidas como un contar con mediciones científicas. También los edu-
cambio en la puntuación de la prueba. cadores esperaban que el desarrollo y aplicación de
Tercero, una extensión del modelo científico-practi- las pruebas del “nuevo tipo” dieran a la tarea edu-
cante que se describe más adelante es la práctica ba- cativa el estatus de científica. El subtítulo del artículo
Copyright © ${Date}. ${Publisher}. All rights reserved.

sada en la evidencia (PBE): la noción de que cualquier de Binet y Simon de 1905 se refiere a “la necesidad
cosa que haga el psicólogo en su práctica debe estar de hacer diagnósticos científicos”. La primera oración
basada en evidencia sólida. Como señalaron Norcross de la introducción de Thorndike (1904) a la teoría de
et al. (2008), “desde los primeros años de la década de la medición mental establece que “la experiencia ha
1990, hemos sido testigos de un crecimiento exponen- mostrado de manera suficiente que los hechos de la
cial del número de artículos que hablan de la PBE. En naturaleza humana pueden convertirse en material
verdad, la PBE se ha convertido en un coloso interna- de la ciencia cuantitativa” (p. V). Esta preocupación
cional” (p. 2). Las pruebas psicológicas tienen un papel de ser científico, junto con la de la confiabilidad en-
decisivo en la PBE, pues mucha de su “evidencia” pro- tre calificadores, motivó la elaboración de las prime-
viene de ellas, como las que revisaremos más adelante ras pruebas de rendimiento. Por último, el campo de
en este libro. Además, comprender la evidencia requie- la psicología clínica, que trataremos de manera más
re precisamente la clase de conocimiento que expone- exhaustiva y que ha sido uno de los campos prima-
mos en los siguientes cinco capítulos. rios de aplicación de las pruebas, ha proclamado con

20 Pruebas psicológicas. Una introducción práctica


Resumen de puntos clave 1-11 para las escuelas parisinas; Wechsler quería una prue-
ba mejor para sus pacientes adultos de la clínica. El
MMPI pretendía ayudar en el diagnóstico de los pa-
Principales fortalezas en la historia de las pruebas cientes de un hospital. El SAT surgió como tarea en la
• Impulso científico que colaboraron varias universidades para seleccionar
• Preocupación por el individuo estudiantes con distintas experiencias escolares. Los
• Aplicaciones prácticas prototipos de las primeras pruebas de inteligencia de
• Metodología estadística aplicación grupal e inventarios de personalidad se de-
• Ascenso de la psicología clínica sarrollaron por la necesidad de procesar una gran can-
• Computadoras tidad de personal militar en la Primera Guerra Mundial.
Para estar seguros, podemos encontrar excepciones
a este patrón; en algunos casos se obtuvieron resulta-
dos notables de las consideraciones teóricas. Sin em-
firmeza su lealtad a la aproximación científica. Muchas bargo, el patrón general parece muy claro: las pruebas
otras profesiones, como medicina, derecho y trabajo se desarrollaron en respuesta a necesidades prácticas.
social, han hecho hincapié en la práctica; sin embar- A quien gusta del lado aplicado de la psicología le gus-
go, la psicología clínica siempre ha sostenido que es tará el campo de las pruebas. Aunque nuestros capítu-
parte ciencia y parte práctica, y se ha valido de lo que los 3 al 6 pueden parecer abstractos, los temas que se
el campo llama el modelo científico-practicante (véa- tratan ahí surgen de las necesidades prácticas.
se Jones & Mehr, 2007).
Metodología estadística
Preocupación por el individuo
El desarrollo del campo de las pruebas tiene una in-
El campo de las pruebas ha crecido alrededor de trigante relación interactiva con el de los métodos
un fuerte interés en el individuo. Esta orientación estadísticos. Por lo común se piensa que es una
es, quizá, inevitable, ya que en este campo se trata relación en un solo sentido: el campo de las prue-
con las diferencias individuales, lo cual es parte de bas toma prestados los métodos de la estadística.
la “perspectiva diferencial” que mencionamos antes. Sin embargo, varios métodos estadísticos se crea-
Recordemos que uno de los hilos en los anteceden- ron en respuesta a los desarrollos en este campo
tes inmediatos para establecer las raíces fue el fuer- y, después, se adoptaron en otras áreas. El primer
te aumento de la preocupación por el bienestar de ejemplo fue la exposición de resultados bivariados
los enfermos mentales. Muchas, aunque no todas, inventados por Galton. Para promover este trabajo,
de las aplicaciones prácticas de las que hablaremos Galton indujo al matemático británico Karl Pearson a
más adelante se relacionan con la preocupación por crear un coeficiente de correlación; después, Spe-
el individuo. El trabajo de Binet buscaba identificar in- arman inventó su versión, la correlación por rangos
dividuos que se beneficiaran más de las escuelas es- ordenados. Más importante, al formular su teoría de
peciales que de las regulares; la primera prueba de la inteligencia, Spearman ideó el método de la dife-
Wechsler intentó brindar una medida más imparcial rencia tetrad, el abuelo conceptual del análisis facto-
de la inteligencia de los adultos. Los SAT originales rial moderno, el cual fue un gran adelanto que llegó
pretendían eliminar o minimizar cualquier desventaja junto con el trabajo de Thurstone sobre las capaci-
que los estudiantes de las escuelas menos acaudala- dades mentales básicas. Muchas de las subsiguien-
Copyright © ${Date}. ${Publisher}. All rights reserved.

das pudieran tener al entrar a la universidad. Las me- tes elaboraciones del análisis factorial resultaron de
didas de los intereses vocacionales buscaban ayudar la guerra de palabras que siguió entre Spearman y
a individualizar la selección para el trabajo. Al leer una Thurstone y de los datos sobre la naturaleza funda-
selección representativa de manuales de pruebas y mental de la inteligencia, un campo de batalla que
de la literatura profesional del campo a lo largo de la aún sigue activo. Así, la historia de las pruebas ha
historia, es impresionante encontrar frecuentes refe- ido de la mano con la historia de, al menos, ciertos
rencias al mejoramiento de muchos individuos. métodos estadísticos.

Aplicaciones prácticas Ascenso de la psicología clínica

Cualquier desarrollo importante en el campo de las La psicología clínica es una de las principales áreas
pruebas fue resultado del trabajo sobre un problema de aplicación de las pruebas y también de la psicolo-
práctico. Binet trató de resolver problemas de este tipo gía. Esto es especialmente cierto si interpretamos el

Campo de las pruebas psicológicas 21


término clínico como un concepto amplio que incluye alrededor de 1980 y proliferaron a mediados de esa
la consejería psicológica, la psicología escolar y el lado década. Así, prácticamente todas las aplicaciones de
aplicado de la neuropsicología. Por un lado, las perso- la tecnología computacional para las pruebas ocurrie-
nas en la práctica clínica han requerido, presionado y ron sólo en la etapa histórica más reciente de las que
ayudado para crear una plétora de pruebas; por otro, bosquejamos antes.
conforme han aparecido nuevas pruebas, quienes es- Para relatar la historia del efecto de las computa-
tán en la práctica clínica las han utilizado. Los interesa- doras en el campo de las pruebas, necesitamos pri-
dos en la historia breve de la psicología clínica pueden mero distinguir entre el escáner y la computadora,
consultar a Routh y Resiman (2003), Trull y Prinstein pues hay mucha confusión en este punto. Un escáner
(2013, en especial el capítulo 2) y Tryon (2008). es un dispositivo eléctrico o electrónico que cuenta
Por lo general, se atribuye a Lightner Witmer la fun- las marcas en la hoja de respuestas de una prueba,
dación de la psicología clínica; como muchos psicó- por lo que a veces se le llama escáner o lector con
logos de su tiempo, Witmer recibió un entrenamiento sensor para las marcas. A pesar de la referencia po-
avanzado con Wundt, por lo que se empapó en la me- pular a las “hojas de respuesta computarizadas”, és-
todología de la psicofísica. Al aceptar tratar a la famosa tas no se meten en una computadora, sino en un
gente con “mala ortografía crónica” –lo cual, sin duda, escáner. El resultado del escáner puede (o no) ser in-
hoy llamaríamos problemas de aprendizaje– llevó los troducido en una computadora.
métodos de la psicología de laboratorio al tratamiento El primer escáner que se utilizó fue el IBM 805, que
de casos específicos. Esto ocurrió en 1896; después, apareció en 1937; era un objeto abultado, como del ta-
Witmer abrió la primera clínica psicológica, impartió el maño de un escritorio de oficina. Un empleado inserta-
primer curso de psicología clínica (ambos en la Univer- ba las hojas de respuestas una por una en una ranura
sidad de Pennsylvania) y fundó una revista dedicada a de la máquina, que funcionaba contando los circuitos
la psicología clínica. Sin importar las pruebas disponi- eléctricos completados. No se usaba ninguna compu-
bles en su tiempo ni cuán rudimentarias fueran, guia- tadora; de hecho, no se habían inventado. El IBM 805
ron el diagnóstico y el tratamiento. era, por mucho, más eficiente y exacto que contar a
La historia temprana de la psicología clínica se lee mano un registro de la prueba. Para los estándares de
de manera muy parecida a la de la historia tempra- hoy, desde luego, es un verdadero dinosaurio.
na de las pruebas: la de Binet, la de Rorschach, etc. El escáner típico de hoy (véase el ejemplo de la
Conforme aparecieron nuevas pruebas, los clínicos figura 1-6) funciona contando haces de luz, sean
las usaron; en muchos casos, era el clínico quien ela- transmitidos o reflejados; lanza haces de luz en los
boraba las pruebas, además de que también partici- espacios objetivo en la hoja de respuestas, mientras
paron activamente en la milicia durante la Primera y una clave le indica al escáner dónde buscar las mar-
Segunda Guerras Mundiales; después de la segun- cas. Cualquier marca oscura –lápiz, bolígrafo– servi-
da, el gobierno federal hizo una fuerte inversión en el rá. El escáner cuenta los haces de luz que atraviesan
entrenamiento de psicólogos clínicos. Esto llevó a un la hoja o rebotan en las marcas oscuras.
crecimiento explosivo de la profesión, lo cual también Los modelos pequeños de escáner ahora están dis-
provocó un crecimiento en el uso de las pruebas y la ponibles en la mayoría de escuelas, universidades, clí-
necesidad de otras más nuevas. Esta relación recípro- nicas, negocios y otras instituciones. Las versiones
ca continúa el día de hoy; en términos absolutos de potentes que usan los editores de pruebas, las agen-
pruebas empleadas, el campo de la educación enca- cias de gobierno y las corporaciones especializadas en
beza el campo de las pruebas. En términos de la ver- escanear pueden procesar 150 hojas de respuesta por
Copyright © ${Date}. ${Publisher}. All rights reserved.

tiginosa serie de varios tipos de pruebas disponibles minuto (9000/hr). El resultado básico del escáner sigue
en la actualidad, el campo clínico (entendido amplia- siendo el mismo: el conteo o registro de marcas. En al-
mente) ha sido el de mayor influencia. gunos casos, el conteo se imprime simplemente en un
documento de respuestas; en otros casos, junto con la
Computadoras ubicación de cada marca, se convierten en algún medio
electrónico, que puede procesarse en una computadora.
Las computadoras han tenido una profunda influen- ¿Las hojas de respuesta y el escáner serán los dino-
cia en el desarrollo de la pruebas; como se señaló saurios del mañana? Es muy probable, pues los exami-
anteriormente, éste es un fenómeno muy reciente. La nados ya responden directamente en la computadora
computadora electrónica se inventó en 1946 y se em- y ahí trabajamos con ellas. Esto se hace en los salones
pezó a comercializar en 1951. Sin embargo, el uso de de clase, clínicas, departamentos de recursos huma-
las computadoras no se generalizó sino hasta la dé- nos e incluso en centros ubicados en centros comer-
cada de 1960. Los modelos de escritorio aparecieron ciales. Además, con las mejoras en el reconocimiento

22 Pruebas psicológicas. Una introducción práctica


Resumen de puntos clave 1-12

Relación computadora-pruebas
• Procesamiento estadístico
• Informe de puntuaciones
• Aplicación de la prueba

decir, el número de respuestas correctas) empleando


la información de un escáner, convertía las puntua-
ciones naturales puntuaciones normativas e imprimía
listas de los nombres de los examinados y sus pun-
tuaciones. Antes, todas estas operaciones se tenían
Figura 1-6. Escáner moderno pequeño; escáner lector de que hacer a mano. Los informes impresos de la com-
marcas ópticas NCS Pearson OpScan®. putadora se generalizaron a principios de la década
Cortesía de NCS Pearson de 1960; para los estándares de hoy, tales informes
son primitivos: sólo usaban letras mayúsculas, todas
del mismo tamaño y tipo, copiadas con papel carbón,
de voz, las respuestas a las preguntas de la prueba (p. etc. Pero en su momento, fueron una maravilla.
ej., realizadas en líneas telefónicas) ahora pueden ser Las últimas etapas de esta fase evolucionaron de
orales. Las palabras habladas pueden descodificarse manera natural desde los primeros reportes sencillos.
y calificarse comparándolas con plantillas de las res- Los creadores de pruebas adquirieron maestría en la ha-
puestas aceptables. Sin duda, maravillas tecnológicas bilidad de programación y también vieron posibilidades
adicionales aún están por venir. creativas en los informes de computadora. A principios
Ahora, pasemos a las computadoras. Hay tres as- de la década de 1970, hubo una profusión de informes
pectos principales en la relación entre computadoras hechos por la computadora cada vez más elaborados.
y pruebas que tienen una secuencia histórica, pero Las capacidades de las impresoras también aumenta-
difieren más en carácter que en el orden cronológico. ron y aparecieron gráficas y variaciones en las fuentes
Además, aunque hay una secuencia histórica, es acu- de las letras acompañadas, ahora, de información nu-
mulativa; es decir, una vez que comenzaba una fase, mérica, lo básico de los primeros informes.
ésta se quedaba en el campo. Más que reemplazarla, La preparación de informes interpretativos fue
una nueva fase se añadía a la anterior. un desarrollo importante en esta fase. Los informes
En la primera fase, las computadoras eran sim- del desempeño en las pruebas ya no estaban limita-
ples auxiliares en el procesamiento estadístico de la dos a los números, sino que ahora podían describirse
investigación de las pruebas; esta fase empezó casi con palabras simples o, incluso, una narración con-
tan pronto como las computadoras estuvieron dispo- tinua, como si hubiera sido escrito por un psicólogo
nibles comercialmente. Esto fue de gran ayuda para profesional. En el capítulo 3, explicaremos cómo se
el campo de las pruebas, ya que permitió que se rea- preparan tales informes y ofreceremos ejemplos de
lizaran programas de investigación a gran escala y informes reales a lo largo de los capítulos posteriores.
se emplearan de manera habitual metodologías so- Los desarrollos en estas líneas continúan en la
Copyright © ${Date}. ${Publisher}. All rights reserved.

fisticadas. Este tipo de desarrollo continúa a un ritmo actualidad. Algunos lectores de este texto proba-
vertiginoso en la actualidad. Las computadoras de es- blemente contribuyan a los nuevos y mejorados infor-
critorio permiten a casi cualquier investigador realizar mes de este tipo.
análisis en unos pocos segundos que antes le habrían La tercera fase se relaciona con la aplicación de la
llevado meses a equipos enteros de investigadores. prueba por medio de la computadora. Desde la pers-
En ejercicios posteriores de este libro, podrás realizar pectiva de los creadores de pruebas, hay dos tipos
con facilidad análisis computacionales que habrían diferentes de aplicación mediante la computadora.
constituido una tesis de maestría hace 40 años. El examinado puede no darse cuenta de la diferen-
En la segunda fase, las computadoras preparaban cia. El primer tipo, aplicación de la prueba basada en
los informes de las puntuaciones de la prueba. Esto la computadora, presenta simplemente en la panta-
empezó con informes muy sencillos, útiles en espe- lla de una computadora (el monitor) las preguntas tal
cial para programas a gran escala. Un programa de y como aparecerían en un cuadernillo impreso. Sólo
cómputo determinaba las puntuaciones naturales (es se ponen las preguntas de la prueba en un archivo de

Campo de las pruebas psicológicas 23


texto y aparecerán de pronto en la pantalla. El exami- ¡Inténtalo!
nado responde con ayuda del teclado; no hay nada
extraordinario aquí, pero no se necesita papel. Para ver cómo es una prueba adaptable por compu-
El segundo tipo, la aplicación adaptable por com- tadora, visita este sitio: http://edres.org/scripts/cat
putadora, es revolucionario. Aquí, la computadora no Haz clic en “Let’s Get Started” [Empezar] y lue-
sólo presenta los reactivos, sino que también elige go sigue las instrucciones. No necesitas hacer la
el siguiente con base en las respuestas previas del prueba completa, sino que basta con responder
examinado. Podemos ilustrar esto con una prueba de algunos reactivos para que tengas una idea.
aritmética; la pantalla presenta un reactivo, digamos Marca esta dirección como sitio favorito, pues la
26 × 179. Si la respuesta es correcta, la computado- usarás otra vez más adelante.
ra elige un reactivo más difícil de su “banco” de reac-
tivos, digamos 1372 ÷ 86. Si la respuesta es correcta
otra vez, la computadora presentará otro reactivo aún
más difícil. Pero si la primera respuesta es incorrecta, denomina calificación automatizada, lo que significa
la computadora elegirá un reactivo más fácil, digamos que se ha desarrollado un programa de cómputo para
38 + 109. Los reactivos varían en dificultad hasta que simular el juicio humano al calificar productos como
la computadora “decide” que tiene un cálculo muy ensayos, planos arquitectónicos o diagnósticos médi-
exacto del nivel de capacidad aritmética del exami- cos. Tomemos, por ejemplo, un ensayo escrito por un
nado. Por eso, la aplicación adaptable por computa- alumno universitario. Por lo general, sería calificado
dora también se ha llamado aplicación a la medida: la por un miembro del cuerpo docente, pero en casos muy
selección de reactivos se hace a la medida, como un importantes, dos o tres de ellos pueden hacerlo y luego
traje, del examinado. Como puede imaginarse, se ne- se promedian las calificaciones. Con la calificación auto-
cesita mucha investigación sobre el desarrollo de la matizada, ¡un programa de cómputo califica el ensayo!
aplicación adaptable por computadora para que pue- Tales programas, introducidos hace muy pocos años, se
da funcionar apropiadamente. La investigación de- usan ahora en lugar de “calificadores humanos” para
pende en gran medida de la teoría de la respuesta al calificar ensayos y otros productos en programas a gran
reactivo antes mencionada. Ésta es una de las áreas escala de evaluación. Aquí sólo haremos notar que éste
de más rápido crecimiento en el campo de las prue- es un “nuevo juego de pelota”, que probablemente verá
bas; los interesados en la descripción de los métodos un gran crecimiento en la siguiente década con cada
pueden consultar a Parshall et al. (2002) y van der vez más áreas de aplicación. Por ejemplo, ¿qué hay de
Linden y Glas (2010). En los siguientes capítulos, ex- la calificación por computadora de las respuestas a la
ploraremos algunas de las teorías y métodos que sub- prueba de manchas de tinta de Rorschach? Para saber
yacen en la aplicación adaptable por computadora. más de este tema, se puede consultar a Dikli (2006) y
La tercera fase de las aplicaciones de la computa- Drasgow, Luecht y Bennett (2004).
dora está entrando a un nuevo escenario. En el pasa-
do reciente, la resolución en línea de las pruebas se Palabras finales sobre las fortalezas
ha hecho común; en un campo, la evaluación de los
intereses vocacionales, responder los inventarios e in- En esta sección hemos incluido sólo los hechos que
formar las puntuaciones se están convirtiendo en lo es- influyeron en la mayoría de los tipos de pruebas, si no
tándar. Otras áreas de aplicación no están muy atrás; en todas. Pero han habido otros hechos y tendencias
el tema principal aquí no es tanto la resolución de la más restringidas a un tipo de pruebas o a pocos de
Copyright © ${Date}. ${Publisher}. All rights reserved.

prueba, sino la entrega de la información de la prue- ellos; por ejemplo, la psicología cognitiva ha afectado
ba (informes, algunos muy elaborados) a individuos sin las pruebas de inteligencia. El movimiento de manejo
ninguna capacitación para interpretar esa información responsable ha afectado las pruebas de rendimiento.
y posiblemente sin acceso a la asesoría profesional. Reservamos el tratamiento de estas influencias más
Como veremos en capítulos posteriores, interpretar la restringidas a los capítulos sobre los tipos específicos
información de las pruebas no es siempre un asunto de pruebas, por ejemplo, la psicología cognitiva en el
sencillo; la psicología siempre ha hecho hincapié en la capítulo 7 y el manejo responsable en el 11.
necesidad de una capacitación adecuada para hacer-
lo. Los informes en línea, ajenos a la aplicación de la Definición
prueba, crean un escenario nuevo por completo. Para
tener un panorama general de los temas que están El último tema para introducirse en el campo de
surgiendo, se puede consultar a Naglieri et al. (2004). las pruebas es el de la definición. ¿A qué nos referi-
Por último, ha surgido una aplicación de lo que se mos exactamente con el término prueba? Desde una

24 Pruebas psicológicas. Una introducción práctica


perspectiva estrictamente académica, éste sería el pri-
Resumen de puntos clave 1-13
mer tema a tratar para introducirse en el campo; sin
embargo, también es un comienzo árido y aburrido.
Elementos de la definición de “prueba”
Así, preferimos llegar por otros caminos. Quizá más im-
• Proceso o dispositivo
portante, habiendo considerado los otros tremas que
• Ofrece información
hemos tratado hasta aquí, estamos en una mejor po-
• Conducta o procesos cognitivos
sición para reflexionar sobre algunas definiciones al-
• Muestra de...
ternativas y apreciar las diferencias en varias fuentes.
• Estandarizado
Encontrar consenso acerca de la definición de
• Cuantificado
“prueba” resulta ser sorprendentemente difícil, pues
esta palabra se ha usado de muchas maneras y en dis-
tintas fuentes; incluso centrándonos en las pruebas
psicológicas, donde pueden resaltar distintos aspec-
tos. Muchas definiciones son circulares, pues dicen Ahora necesitamos hacer una digresión para po-
que una prueba es lo que se usa al aplicar una prue- ner en claro una cuestión terminológica que puede ser
ba: en verdad inútil. No obstante, para guiar nuestro confusa. Hay tres usos del término estandarizado en
pensamiento más adelante, intentaremos abstraer de el campo de las pruebas. Primero, cuando se usa en
varias fuentes lo que parecen ser los elementos cla- la definición de las pruebas, se refiere a procedimien-
ve. Parece haber seis elementos en común en lo que tos uniformes para aplicarlas y calificarlas. Hay métodos
queremos decir con “prueba” en el contexto de las inequívocos, especificados con claridad para aplicar la
ciencias conductuales. prueba, y hay reglas para calificarla, y es fundamental
Primero, una prueba es una especie de procedi- que la prueba se aplique y califique de acuerdo con
miento o dispositivo. Todos concuerdan en este pun- dichos procedimientos. Segundo, en otros contextos,
to, pero puede ser útil para nosotros agregar que estandarizado significa que la prueba tiene normas;
brinda información. Aunque quizá es demasiado ob- por ejemplo, las normas nacionales basadas en miles
vio formularlo así, nos ayudará en discusiones poste- de casos. De hecho, el proceso de recolectar los da-
riores. Por tanto, agregamos esto como el segundo tos normativos a menudo se menciona como programa
punto: una prueba ofrece información. Tercero, el pro- de estandarización de una prueba. Es claro que éste es
cedimiento o dispositivo ofrece información sobre la un significado diferente al primero; se puede tener una
conducta; este aspecto de la definición es lo que se- prueba con instrucciones y procedimientos de califica-
para una prueba de, digamos, la medición física, como ción determinados sin tener ningún tipo de normas. Un
la altura o el peso, o de las pruebas médicas como las tercer significado, que se encuentra sobre todo en los
que se emplean para detectar un padecimiento viral. medios de información y en las discusiones públicas,
En tiempos anteriores, de orientación conductista, la considera equivalentes las pruebas estandarizadas y las
“conducta” era entendida de manera estrecha, pues pruebas de capacidad y rendimiento de aplicación gru-
incluía sólo la conducta observable externa; pero en el pal, calificadas con máquinas, de opción múltiple. Por
medio de la orientación cognitiva actual, entendemos ejemplo, el encabezado de un periódico puede infor-
el término de una manera más amplia para incluir los mar: “Estudiantes locales mejoran en las pruebas estan-
procesos cognitivos. De hecho, para hacer esto explí- darizadas” o “Haciendo trampa en supuestas pruebas
cito, ampliaremos el objeto de las pruebas para incluir estandarizadas”. O un amigo puede decir, refiriéndose
la conducta y los procesos cognitivos. al desempeño en las pruebas de admisión universitarias
Copyright © ${Date}. ${Publisher}. All rights reserved.

Cuarto, muchas definiciones hacen hincapié en que SAT o ACT, “No me va muy bien en las pruebas estanda-
una prueba ofrece información sólo de una muestra de rizadas”. Este tercer significado es obviamente mucho
la conducta. Al aplicar pruebas, por lo general no ha- más limitado que cualquiera de los otros dos. Es impor-
cemos un censo exhaustivo de toda la conducta o los tante que el estudiante de psicología distinga entre es-
procesos cognitivos de una persona, sino sólo tomamos tos tres significados del término estandarizado.
una pequeña muestra. Esta noción será crucial cuando Un sexto y último elemento en las distintas definicio-
consideremos la confiabilidad y la validez. Quinto, una nes es cierta referencia a la cuantificación o medición.
prueba es un procedimiento estandarizado y sistemá- Es decir, al final presentamos la información en forma nu-
tico. Ésta es una de las características más distintivas mérica. Este elemento es muy explícito en algunas fuen-
de una prueba, pues la distingue de fuentes de infor- tes y parece estar implicado en las otras; la cuantificación
mación como las entrevistas informales o las observa- puede ocurrir de una manera muy rudimentaria o muy so-
ciones anecdóticas, las cuales pueden ser fuentes de fisticada. Por ejemplo, una cuantificación cruda puede im-
información útiles, pero no son pruebas. plicar formar dos grupos (de deprimidos y no deprimidos

Campo de las pruebas psicológicas 25


o de competentes y no competentes). Una medición más términos son intercambiables. Por ejemplo, los están-
sofisticada puede implicar una escala cuidadosa pareci- dares para pruebas psicológicas (AERA et al., 1999) pa-
da a la que se usa para medir la estatura o el peso. recen combinar los tres términos definiendo “prueba”
Varias fuentes difieren en un aspecto de la defini- como “un dispositivo evaluativo” (p. 183) y “aplicación
ción de “prueba”, a saber, el grado en que la prueba de pruebas” como “cualquier procedimiento... para
es evaluativa. Algunas definiciones se detienen con la evaluar” (p. 180); estas definiciones se mantienen en la
información; otras incluyen referencias a una dimen- edición de 2013 de dichos estandáres. Nosotros no to-
sión evaluativa, una inferencia o conclusión derivada mamos una posición definitiva sobre este asunto; sim-
de la información. Algunos libros tratan este punto dis- plemente hacemos notar que distintas fuentes lo tratan
tinguiendo entre los términos prueba, evaluación y va- de manera diferente.
loración. Por ejemplo, algunos autores suponen que A partir de la discusión anterior, formulamos la
hay diferencias entre estos tres enunciados: aplica- siguiente definición: Una prueba es un proceso o
mos una prueba de inteligencia a Abigail, evaluamos dispositivo estandarizado que ofrece información
la inteligencia de Abigail o valoramos la inteligencia de sobre una muestra de la conducta o los procesos
Abigail. Sin embargo, en muchas fuentes, estos tres cognitivos de una manera cuantificada.

Resumen

1. Clasificamos las pruebas en cinco categorías principales: pruebas de capacidad mental, de rendimiento,
de personalidad, de intereses y neuropsicológicas. Cada categoría se divide en otras subcategorías. Utiliza
este acrónimo para recordar estas categorías: MERPIN.
2. Las pruebas también se pueden caracterizar de acuerdo con las siguientes características: a) son de lápiz y
papel o de ejecución, b) de velocidad o de poder, c) de aplicación individual o grupal, d) de ejecución máxi-
ma o típica y e) su interpretación depende de una norma o de un criterio.
3. Los usos principales de las pruebas son en las áreas clínica, educativa, laboral y de investigación.
4. Cuatro supuestos importantes apuntalan la empresa de las pruebas:
• La gente tiene diferencias en sus rasgos, las cuales son importantes.
• Podemos cuantificar estos rasgos.
• Los rasgos tienen un grado razonable de estabilidad.
• Nuestra cuantificación de los rasgos tiene relación con la conducta real.
5. Las tres preguntas fundamentales en el campo de las pruebas se relacionan con:
• Confiabilidad, es decir, la estabilidad de la medida.
• Validez, es decir, lo que una prueba en realidad mide.
• Normas, es decir, el marco para interpretar las puntuaciones de la prueba.
Estudiamos estos temas en profundidad en los capítulos 3, 4 y 5. El modo en que se elaboran las pruebas,
tratado en el capítulo 6, y las preocupaciones prácticas, como el tiempo y costo, también son aspectos im-
portantes a considerar.
6. Identificamos siete períodos principales en la historia de las pruebas. Comprender los temas predominan-
tes en ellos ofrece una perspectiva sobre los temas actuales. Los períodos y los nombres que les dimos son:
Copyright © ${Date}. ${Publisher}. All rights reserved.

• Hasta 1840 Antecedentes remotos


• 1840-1880 Creación del escenario
• 1880-1915 Raíces
• 1915-1940 Florecimiento
• 1940-1965 Consolidación
• 1965-2000 Pasado reciente
• 2000 al presente Actualidad
7. Identificamos seis fortalezas principales que influyeron en el desarrollo del campo de las pruebas tal y como
existe en la actualidad: el impulso científico, la preocupación por el individuo, las aplicaciones prácticas, la
metodología estadística, el ascenso de la psicología clínica y las computadoras.
8. Desarrollamos la siguiente definición de seis elementos de una prueba: Una prueba es un proceso o dis-
positivo estandarizado que ofrece información sobre una muestra de la conducta o los procesos cognitivos
de una manera cuantificada.

26 Pruebas psicológicas. Una introducción práctica


Palabras clave
aplicación adaptable por interpretación referida a la norma prueba individual
computadora medidas de intereses pruebas de capacidad mental
Binet, Alfred vocacionales pruebas de rendimiento
calificación automatizada normas pruebas neuropsicológicas
Cattell, James McKeen perspectiva diferencial pruebas objetivas de
confiabilidad práctica basada en la evidencia personalidad
ejecución máxima prueba de ejecución Spearman, Charles
ejecución típica prueba de lápiz y papel técnicas proyectivas
escáner prueba de poder teoría clásica de las pruebas
Galton, Francis prueba de velocidad teoría de la respuesta al reactivo
informes interpretativos prueba estandarizada validez
interpretación referida al criterio prueba grupal

Ejercicios
1. Por medio de la biblioteca de tu universidad, consulta el artículo de Cattell de 1890, donde acuñó el térmi-
no “prueba mental”. Busca en las referencias de este libro para encontrar los datos completos del artículo.
O también puedes encontrarlo en http://psychclassics.yorku.ca. Revisa la lista de pruebas que ahí se descri-
ben. ¿Qué piensas de estas pruebas como predictores del éxito académico?
2. Si sucede que estás tomando un curso de historia al mismo tiempo que lees este libro, trata de relacionar
algo de tu curso con los períodos del desarrollo en la historia de las pruebas. ¿Encuentras alguna tendencia
o fortaleza en tu curso que pueda haber influido en el desarrollo de este campo?
3. La mayoría de las universidades, incluso muchos departamentos dentro de grandes universidades, tienen
su propio escáner para procesar las hojas de respuesta de las pruebas. Intenta localizar un escáner para
que veas cómo trabaja. ¿Cuál es el “producto” del escáner?
4. Piensa en las pruebas que has contestado aparte de las pruebas en el salón de clases. Clasifica cada una de
ellas de acuerdo con estas distinciones: a) lápiz y papel o ejecución, b) velocidad o poder, c) de aplicación in-
dividual o grupal, d) de ejecución máxima o típica y e) referidas a la norma o al criterio para la interpretación.
5. Consulta la página http://psychclassics.yorku.ca/ para acceder al trabajo clásico de Alfred Binet New Me-
thods for the Diagnosis of the Intellectual Level of Subnormals [Nuevos métodos para el diagnóstico del ni-
vel intelectual de los subnormales], escrito en 1905. (Toma nota del uso de palabras como imbécil e idiota,
que hoy son considerados términos peyorativos, pero que entonces eran descriptores clínicos estándar.) A
partir de la lectura de los primeros párrafos de la obra de Binet, ¿qué crees que intentaba hacer?
6. Entra a la página http://www.nces.ed.gov/nationsreportcard para ver los resultados del National Assess-
ment of Educational Progress (NAEP). ¿Cuántos grados evaluó NAEP? ¿De cuántas materias escolares hay
informes disponibles? Accede a los informes de alguna materia que te interese. ¿Cuáles son algunos de los
principales hallazgos sobre esa materia?
7. Aquí hay tres rasgos: altura, inteligencia, cordialidad. ¿En cuál de ellos crees que la gente difiere más?
8. Recuerda nuestro comentario de que muchas pruebas se conocen principalmente por sus iniciales. Ve si
Copyright © ${Date}. ${Publisher}. All rights reserved.

puedes recordar los nombres completos que corresponden a las siguientes iniciales.
GRE EDI SII
LSAT BDI-II
9. Muchos documentos clásicos de la historia de las pruebas (p. ej., los de Darwin, Galton, Cattell y Binet) pue-
den consultarse en esta página: http://psychclassics.yorku.ca/. Revísala. Échale un ojo a algunos documen-
tos para hacerte una idea de cómo se acercaban los autores a sus temas.
10. Para ver una presentación gráfica interesante de las relaciones entre la gente que trabajó en las primeras
pruebas de inteligencia, revisa esta página: http://www.indiana.edu/~intell. Haz clic en Interactive Map. ¿En
dónde entra Piaget? ¿Qué hay de Anastasi? Puedes acceder a biografías breves de la mayoría de los per-
sonajes que aparecen en nuestra historia del campo haciendo clic sobre su nombre en el mapa interactivo.

Campo de las pruebas psicológicas 27


Copyright © ${Date}. ${Publisher}. All rights reserved.

S-ar putea să vă placă și