Documente Academic
Documente Profesional
Documente Cultură
Objetivos
1. Identificar las principales categorías y aplicaciones de las pruebas grupales de capacidad mental más usadas.
2. Enumerar las ocho características en común de las pruebas grupales de capacidad mental, sobre
todo en contraste con las de aplicación individual.
3. De cada una de las siguientes pruebas, dar el nombre completo, propósito, grupo meta, escala de las pun-
tuaciones y un breve resumen de su confiabilidad y validez: OLSAT, SAT, ACT, GRE-G, ASVAB y Wonderlic.
4. Describir los intentos de construir pruebas de capacidad mental que sean neutrales en términos
culturales y dar ejemplos de los tipos de reactivos que se emplean en dichas pruebas.
5. Discutir las seis generalizaciones respecto de las pruebas grupales de capacidad mental.
Algunos casos
• La maestra Vásquez da clases al quinto grado muchas tareas de escritura. También hay muchos
de la escuela St. Cecilia en Exeter. Este año, ella aspirantes provenientes de preparatorias priva-
es nueva en la escuela, por lo que no conoce das y de escuelas públicas suburbanas de alto
a los niños. Al final del cuarto grado, los alum- nivel socioeconómico. Al Colegio Ivy le gustaría
nos respondieron una prueba estandarizada atraer también a estudiantes de escuelas rurales
de aprovechamiento y otra de capacidad men- y de nivel socioeconómico bajo, que nunca ha-
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
tal. La maestra Vásquez planea hacer trabajar al yan tomado cursos avanzados, viajado a Europa
máximo a todos sus estudiantes; sin embargo, ni visitado un museo. Al mismo tiempo, el Colegio
está preocupada por identificar dos clases de Ivy quiere asegurarse de que estos alumnos ten-
alumnos. Primero, ¿tiene alumnos muy brillantes gan la capacidad básica para tener éxito en este
con un nivel mediocre de aprovechamiento? Si es plan de estudios dinámico. ¿Hay alguna prueba
así, ella quiere encontrar una manera especial de de “capacidad básica” que ayude a elegir a es-
motivarlos para que este año, “en verdad, sobre- tos alumnos?
salgan." Segundo, ¿tiene alumnos con una capa- • Este año, el Ejército de EUA reclutará a 100 000
cidad mental muy baja? Mediante su enfoque en jóvenes, hombres y mujeres, que se desempeña-
el que no hay lugar para el “no tiene sentido es- rán en 300 trabajos, que incluyen operador de ra-
tudiar", quiere estar segura de que estos alumnos dar, bombero, analista de inteligencia, mecánico
no se desanimen. La maestra Vásquez imprime en aviación, especialista en servicios de comida,
copias de las puntuaciones de las pruebas con etc. ¿Hay algo acerca de las capacidades menta-
estas preguntas en mente. les de estos reclutas que ayude a asignarlos a los
• El Colegio Ivy se precia de su ya tradicional distintos trabajos? ¿Qué incluirías en una prueba
plan de estudios liberal: muchas mucha lectura, para medir sus capacidades mentales?
233
Thomas, P. H. (2015). Pruebas psicológicas : Una introducción práctica (2a. ed.). Retrieved from http://ebookcentral.proquest.com
Created from bibliouniminutosp on 2019-08-20 09:07:33.
Todos estos casos ilustran situaciones que requie- Resumen de puntos clave 9-1
ren la aplicación de pruebas de capacidad mental de
aplicación grupal. En este capítulo, examinaremos las Principales usos de las pruebas grupales de ca-
características de estas pruebas y describiremos va- pacidad mental
rios ejemplos específicos. • En escuelas primarias y secundarias, junto con
pruebas de aprovechamiento
Usos de las pruebas grupales • Para predecir el éxito en:
de capacidad mental • la universidad
• programas de posgrado y de profesionalización
Las pruebas de capacidad mental de aplicación grupal • Elección de trabajo o ubicación en el Ejército y
que examinamos en este capítulo están entre las más los negocios
usadas de todas las pruebas. Aunque no hay disponi- • Investigación
ble ningún conteo, parece seguro estimar que cerca
de 50 millones de estas pruebas se aplican cada año
sólo en EUA. Para cuando un individuo típico llega a la
edad adulta, al menos en EUA y en muchos otros paí- Cuarto, las pruebas de capacidad mental de apli-
ses occidentales, se le han aplicado media docena de cación grupal se utilizan mucho para la investigación
estas pruebas o más. Este tipo de pruebas se dividen en ciencias sociales y de la conducta. Algunas de es-
en cuatro grupos principales; con base en esta división tas investigaciones se relacionan directamente con la
organizamos el esquema de este capítulo. naturaleza de la capacidad mental y su relación con
El primer uso importante se realiza en las escuelas otras variables, como edad, ingresos, resultados edu-
primarias y secundarias, donde las pruebas grupales cativos o variables de personalidad. En otros casos,
de capacidad mental se aplican a menudo junto con se incluye una medida de inteligencia simplemente
una prueba estandarizada de aprovechamiento como para describir la muestra que se emplea en un pro-
parte de los programas de evaluación escolares. Se yecto de investigación.
comparan los resultados de las pruebas de capaci-
dad mental y de aprovechamiento para determinar si Características en común de las pruebas
el aprovechamiento del alumno es razonablemente grupales de capacidad mental
consistente con su capacidad mental. Las pruebas de
capacidad mental también pueden emplearse como Las pruebas de capacidad mental de aplicación gru-
uno de varios criterios para elegir alumnos en progra- pal comparten varias características. De particular
mas especiales, por ejemplo, en uno para alumnos importancia son sus diferencias en relación con las
sobredotados o de educación especial. pruebas de aplicación individual que describimos en
El segundo uso importante de las pruebas de capaci- el capítulo anterior.
dad mental de aplicación grupal es para predecir el éxi- Primero, lo más evidente es que estas pruebas se
to en la universidad o en programas para graduados o pueden aplicar a grupos grandes. En teoría, no hay lí-
profesionales. Entre estas pruebas se encuentran el SAT, mites para el tamaño del grupo, pero en una situación
ACT, GRE y LSAT, acrónimos que son conocidos para la típica, hay entre 20 y 50 examinados por cada aplica-
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
mayoría de los lectores de este libro. Esta categoría se di- dor. Se pueden aplicar a grupos más grandes, de varios
vide en dos. Primero, están las dos pruebas predominan- cientos, con un aplicador principal y varios censores.
tes en la selección y ubicación de alumnos universitarios: El aplicador principal lee las instrucciones mientras los
el SAT y el ACT. En segundo lugar se encuentran nume- censores circulan para mantener el orden, evitar las
rosas pruebas empleadas para la selección de alumnos trampas, etc. Podemos notar que cualquier prueba que
para programas de posgrado y de profesionalización. se pueda aplicar a un grupo grande también se puede
El tercer uso importante de estas pruebas es para aplicar a un individuo, lo cual a veces se hace.
la selección de aspirantes a un trabajo o la ubicación
en contextos militares o de negocios. Cada recluta del ¡Inténtalo!
Ejército de EUA responde al menos una prueba de
capacidad mental. Recordemos del capítulo 1 (p. 16) Haz una lista de las pruebas de capacidad mental
que la evaluación de grandes cantidades de reclutas de aplicación grupal que has respondido en los
del Ejército estimuló el desarrollo de la primera prue- últimos cinco años. Piensa si estas pruebas coin-
ba de capacidad mental de aplicación grupal. Muchos ciden con las características que bosquejamos en
negocios también usan pruebas de capacidad mental esta sección.
como un criterio para elegir a sus empleados.
Cuadro 9-1. Ejemplos de reactivos con formato de respuesta libre y de opción múltiple
Usados típicamente en Pruebas de aplicación individual Pruebas de aplicación grupal
Formato Respuesta libre Opción múltiple
Vocabulario ¿Qué significa arrogante? Arrogante significa
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
a) tacaño
b) obeso
c) altivo
d) malévolo
Relaciones verbales El padre es al hijo lo que la madre es a... El padre es al hijo lo que la madre es a
a) la hermana
b) la sobrina
c) la hija
d) el tío
Razonamiento aritmético Jim compró 5 lápices a 12 pesos cada Jim compró 5 lápices a 12 pesos cada uno y 2
uno y 2 libretas a 80 pesos cada una. libretas a 80 pesos cada una. ¿Cuánto pagó?
¿Cuánto pagó? a) $220
b) $120
c) $232
d) $99
de luego, desde un punto de vista práctico, la predic- tas pruebas es su estructura multinivel. Podemos no-
ción a menudo se traduce en selección, por ejemplo, tar que la segunda columna del cuadro 9-2 indica el
para un programa de posgrado. Otras pruebas buscan número de niveles. Recordemos que las pruebas de
Cuadro 9-2. Pruebas grupales de capacidad mental usadas en programas de evaluación escolar
Prueba Niveles/Grados Puntuaciones Editorial Relacionado con
Otis-Lennon School 7 niveles K-12 Verbal, No Verbal, Harcourt Assessment Stanford Achievement Test
Ability Test (OLSAT) Grupos, Total Metropolitan Achievement
Tests
InView (antes, Test of 6 niveles, 2-12 Verbal, No Verbal, CTB/McGraw Hill Terra Nova
Cognitive Skills) Total
Cognitive Abilities Test 13 niveles, K-12 Verbal, Riverside Publishing Iowa Tests
(CogAT) Cuantitativa, No
Verbal, Compuesta
Prueba de Capacidad Escolar Otis-Lennon El cuadro 9-3 bosqueja la estructura del OLSAT8, que es
muy similar, aunque no idéntica, en los siete niveles de
La Prueba de Capacidad Escolar Otis-Lennon [Otis-Len- la serie. Un examinado responde uno de estos niveles.
non School Ability], Octava Edición (OLSAT8; Otis & Len- La selección depende del grado escolar, edad y/o
non, 2003), es la versión más reciente de la larga línea capacidad estimada del examinado. El cuadro 9-3
de pruebas de inteligencia de Otis. Recordemos del muestra los grados en que un nivel del OLSAT8 se
capítulo 1 que el esfuerzo de Otis por crear una forma de usaría comúnmente; sin embargo, dado el modo en
aplicación grupal de una prueba tipo Binet representó que la prueba se elaboró, es factible usar niveles atí-
un hito en la historia del campo de las pruebas. Las su- picos. Un aplicador escolar toma la decisión respecto
cesivas ediciones de la prueba de Otis han estado entre de qué nivel de la prueba emplear con un grupo de
las pruebas más usadas en el mundo durante casi 100 estudiantes; por ejemplo, un grupo muy brillante de
años. De acuerdo con el manual técnico del OLSAT8, segundo grado podría medirse de manera más efi-
caz con el nivel D que con el C, que sería más común
el OLSAT8 está diseñado para medir las habilidades para este grado, pues los estudiantes de este grupo
verbal, cuantitativa y de razonamiento figurativo que, podrían exceder el nivel C. La figura 9-1 ilustra cómo
con mayor claridad, están relacionadas con el apro- los diversos niveles cubren diferentes áreas del es-
vechamiento escolar. La serie OLSAT se basa en la pectro de la capacidad. A la izquierda del espectro
idea de que, para aprender algo nuevo, el alumno se encuentran los estudiantes de capacidad menor
debe ser capaz de percibir con agudeza, reconocer y/o más jóvenes, mientras que a la derecha están los
y recordar lo que ha percibido, pensar de manera ló- de mayor capacidad y/o de grados superiores. Pode-
gica, comprender relaciones, abstraer a partir de lo mos notar que los niveles de la prueba se superpo-
concreto y hacer generalizaciones a contextos nue- nen; por ejemplo, los segmentos superiores del nivel
vos y diferentes. (Otis & Lennon, 2003, p. 5) A cubren la misma área que los segmentos inferiores
del nivel B, y así sucesivamente. Este arreglo multi-
El OLSAT8 se usa principalmente en los programas nivel se aproxima al uso de las reglas de inicio y dis-
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
de evaluación escolar. Las normas de esta prueba se continuación de las pruebas de aplicación individual.
obtuvieron junto con la Prueba de Aprovechamiento Ahora, podemos notar las categorías de los reacti-
Stanford, Décima Edición. vos de la prueba. El OLSAT8 produce una puntuación
Figura 9-1. Ilustración de cómo una prueba multinivel cubre el espectro de la capacidad.
0 0 0 0
Reactivo figurativo muestra: El maestro lee: Mira las formas que están junto a la chinche.
¿Qué continuaría en el patrón?
El cuadernillo del alumno muestra:
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
0 0 0 0
Figura 9-2. Reactivos muestra similares a los que aparecen en las pruebas grupales de capacidad mental.
Figura 9-3. Informe muestra que incluye las puntuaciones del OLSAT8 y el AAC.
Fuente: Stanford Achievement Test Series, 10a. ed. Copyright © 2003 por Harcourt Assessment, Inc. Reproducida con auto-
rización. Todos los derechos reservados.
SAT
Puntuación escalar
500 x
499 x 23% superior
498 x
497 x
496 x
495 x
494 x 54% intermedio
493 x x
492 x 23% superior x
491 x x
490 x x
489 x x 23% inferior
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
488 x x
487 x 54% intermedio
486 x
485 x
484 x
483 x
482 x 23% inferior
481 x
Stanine del OLSAT 2 5
Figura 9-4. Metodología para obtener el AAC entre una prueba de capacidad mental y una de aprovecha-
miento (distribuciones ficticias).
Cuadro 9-4. Comparación de la muestra de estandarización del OLSAT8 y los datos del censo nacional
Variable de estratificación Nacional de EUA OLSAT de estandarización
Región geográfica
Noreste 19.7 17.0
Oeste medio 24.0 25.1
Sur 24.0 23.7
Oeste 32.3 34.9
Estatus socioeconómico
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
= 16). Ésta es una buena regla general: en el caso de nes. Por desgracia, el manual del OLSAT ofrece una
una prueba bien construida y de extensión razonable, mínima interpretación de estos datos.
el EEM, por lo general, será de un tercio de la desvia- Respecto a la estructura de la prueba, el manual
ción estándar. presenta correlaciones entre niveles adyacentes, entre
El manual del OLSAT8 no informa los datos de la puntuaciones verbales y no verbales y correlaciones bi-
confiabilidad de test-retest, lo cual es una omisión im- seriales medianas. El razonamiento y el análisis que se
portante. Al menos, el manual debía informar los da- usan en estas secciones del manual no están bien de-
tos de test-retest de las versiones anteriores de la sarrollados. Además, considerando las afirmaciones de
prueba. El manual argumenta en favor de la continui- que se trata de una estructura jerárquica, es notable que
dad de las ediciones sucesivas y presenta incluso co- no se presenten resultados del análisis factorial.
rrelaciones entre las ediciones séptima y octava. En Lennon (1985) se puede encontrar una descrip-
ción de las circunstancias que rodearon la elabora-
Validez ción de las pruebas Otis originales; incluso aparecen
fragmentos de una entrevista reveladora con Arthur
El manual del OLSAT8 aborda la validez al hablar de Otis. Robertson (s.f.) hace un recuento del desarrollo
contenido, relaciones con otras variables y estructura de las primeras seis ediciones de las pruebas Otis.
de cualquier otra prueba, las personas se sienten con- sin fines de lucro para la elaboración de pruebas con
fundidas con los términos que rodean al SAT. Examine- sede en Princeton, Nueva Jersey. El ETS, en realidad,
mos las fuentes de esta confusión para asegurarnos elabora el SAT y organiza su extensa aplicación. El
de que hacemos las distinciones apropiadas en rela- ETS hace esto por un convenio con el College Board;
ción con el nombre del SAT, el College Board y el ETS. el ETS elabora y vende muchas otras pruebas.
El SAT es una prueba. Desde sus orígenes y hasta
1988, el SAT fue acrónimo de Scholastic Aptitud Test Estructura y reactivos
[Prueba de Aptitud Escolar] y, después, de Scholastic
Assessment Test [Prueba de Evaluación Escolar]. Mu- Durante muchos años, las publicaciones del College
chas fuentes y referencias populares aún usan estos Board hicieron hincapié en que el SAT intenta medir
nombres. La sustitución de “aptitud” por “evaluación” capacidades muy generalizadas desarrolladas en un
fue resultado del esfuerzo de la profesión para evitar largo periodo; es decir, las pruebas no eran medidas
la implicación de que los rasgos que se miden son, de de “aptitud innata”. En años recientes, se han hecho
alguna manera, innatos. algunos intentos para mostrar que el contenido de la
El SAT es un grupo de pruebas. Primero que nada, prueba se basa en las habilidades que se deben de-
existe el SAT (antes SAT Reasoning Test [Prueba de sarrollar en la escuela, lo que la hace parecer más
Tiempo (min)
Área Tipo de reactivos Secciones Total
Lectura crítica Frases incompletas 25, 25, 20 70
Lectura de pasajes
Matemáticas Opción múltiple 25, 25, 20 70
Respuesta producida por el
alumno
Escritura Opción múltiple 35 60
Ensayo 25
Experimental (no se califica) Opción múltiple 25 25
Total 200
(3 hrs, 45 min)a
a
El tiempo total incluye el de la sección para familiarizarse, pero no para distribuir los materiales, leer las instrucciones ni
otras cuestiones de aplicación.
Ciencia 40 35
COMPUESTO 215 2 hrs, 55 min
Prueba escrita (opcional) - 30
Cuadro 9-8. Resultados típicos de los estudios de confiabilidad del SAT y el ACT
Tipos de puntuaciones r
Puntuaciones totales (p. ej., Compuesto del ACT, SAT-CR + SAT-M) .95
Pruebas principales (p. ej., Lectura, Matemáticas del ACT, SAT-CR, SAT-M) .85-.90
Subpuntuaciones (grupos dentro de las pruebas principales) .65-.85
Escritura (sección para escribir un ensayo) formas alternas .65-.70,
interjueces .80-.95
que ya han sido admitidos y, por lo tanto, suelen tener pre añade poder predictivo al índice del RB. A quienes
menor variabilidad que el conjunto entero de aspirantes no les gusta la idea de aplicar pruebas de admisión a
a la universidad. En el capítulo 4, revisamos la naturale- la universidad señalan que una correlación de .50 ex-
za de este problema y cómo hacer correcciones al res- plica sólo 25% de la varianza del FYGPA, lo cual deja
pecto. Los estudios de validez predictiva de las pruebas 75% a otros factores. Del mismo modo, los oponentes
Cuadro 9-9. Resultados típicos de los estudios de validez predictiva de las pruebas de admisión a la universidad
Correlaciones
Variables Sin corrección Corregidas por Corregidas por rango y confiabilidad
rango
FYGPA–PA .40 .50 .55
FYGPA–RB .40 .50 .55
FYGPA–(PA + RB) .50 .60 .65
traremos esta aplicación describiendo sólo un ejemplo, El GRE Prueba General consta, en la actualidad, de tres
el Graduate Record Examination: General Test [Examen pruebas separadas, Razonamiento verbal, Razona-
de Registros de Graduados: Prueba General]. Sin embar- miento cuantitativo y Escritura analítica, que se suelen
go, las observaciones sobre esta prueba, por ejemplo, representar como GRE-V, GRE-Q [Quantitative] y GRE-
respecto de su confiabilidad y validez, se aplican sor- AW [Analytical Writing], respectivamente.2 La figura 9-5
prendentemente bien a la mayoría de las pruebas que
aparecen en el cuadro 9-10. Debemos hacer notar que 1
Con fecha de agosto de 2011, una publicación importante del
algunas de estas pruebas estarían mejor clasificadas, al GRE (ETS, 2012) se refiere a la prueba como el “GRE revised
menos en parte, como pruebas de aprovechamiento más General Test” y no sólo como “GRE General Test”, distinción
de de capacidad general; por ejemplo, el MCAT y el DAT que con frecuencia se pasa por alto a lo largo del resto de la
abordan una mezcla de conocimientos sobre distintos te- publicación y que nosotros también solemos pasar por alto.
mas (p. ej., fisiología, física) y capacidades más generales 2
En 1977 se añadió la puntuación Analítica, que se convirtió en
(p. ej., capacidad verbal). Para obtener más información Escritura analítica en 2003. Antes de 1982, el GRE: Prueba Ge-
de las pruebas que aparecen en el cuadro 9-10, revisa neral se conocía como GRE Aptitud Test [Prueba de aptitudes].
sus sitios web, así como las fuentes usuales como el Men- Un sorprendente número de fuentes aún usan este título y no
tal Measurements Yearbook de Buro. distinguen la puntuación Analítica de la de Escritura analítica.
Analizar un tema
Analizar un argumento
Figura 9-5. Esquema de la estructura del GRE Prueba General revisada.
bosqueja la estructura de las pruebas actuales (ETS, también se proporcionan los percentiles. Los cambios
2012a, 2012b). de percentil por nivel de puntuación son, en verdad,
Durante muchos años, el GRE-G empleó un formato asombrosos en la mitad de la escala, pues aumen-
tradicional de lápiz y papel y extensión fija, pero aho- tan de 15 a 20 puntos por cada aumento de medio
ra la mayoría de los individuos responde un formato punto en el nivel de la puntuación. Por ejemplo, las
adaptable por computadora en un centro de evalua- puntuaciones de 3.0, 3.5 y 4.0 corresponden a los
ción Prometric; la versión en formato tradicional está percentiles 11, 30 y 49, respectivamente. El GRE ha
disponible para usarse cuando no esté disponible un manifestado su intención de introducir la calificación
centro de evaluación. El bosquejo de la figura 9-5 es automatizada (véase p. 23) de los ensayos en el futu-
de una versión adaptable mediante computadora por ro (ETS, 2012a).
sección, no por reactivo, es decir, se responde una sec-
ción entera y luego se pasa a una más o menos difícil.
En el sistema más conocido que es adaptable reactivo ¡Inténtalo!
por reactivo, el individuo es “dirigido” hacia arriba o ha-
cia abajo después de cada reactivo. El GRE Prueba por Para ver reactivos muestra del GRE Prueba General, en-
Temas sigue usando el tradicional formato de lápiz y tra a http://www.ets.org/gre/revised_general/prepare/
papel, aunque se están desarrollando versiones adap-
tadas para computadora.
La mayoría de los reactivos del GRE Prueba Ge-
¿Cuál es la capital del estado de Nueva York?
neral revisada sigue siendo de opción múltiple (OM) y
(Elige una de las respuestas.)
cinco opciones con una sola respuesta correcta. Sin
A. Albania
embargo, la prueba introduce algunos formatos de re-
B. Brooklyn
activos inusuales; por ejemplo, algunos reactivos pre-
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
C. Buffalo
sentan varias opciones (es decir, OM común), pero dos,
D. Ciudad de Nueva York
tres o incluso todas las opciones son correctas. En es-
E. Trenton
tos reactivos se debe elegir todas las opciones correc-
¿Cuáles de éstas son capitales de estado?
tas para obtener el crédito, pues no hay crédito parcial.
(Elige todas las que lo sean.)
La figura 9-6 muestra un ejemplo muy sencillo de es-
A. Albania, Nueva York
tos reactivos.
B. Chicago, Illinois
En otros reactivos se hace clic en una oración de un
C. Columbus, Ohio
párrafo para elegir una respuesta. En la prueba Cuanti-
D. Juneau, Alaska
tativa, en algunos reactivos, en realidad se introducen
E. Dallas, Texas
números en una casilla para indicar la respuesta.
F. Scranton, Pennsylvania
En la prueba de Escritura analítica, dos jueces ca-
lifican cada ensayo con una rúbrica holística de seis
puntos; si la valoración de los dos jueces difiere por Figura 9-6. Ejemplo sencillo de reactivos de opción
más de un punto, se recurre a un tercer lector (ETS, múltiple de una sola respuesta correcta y de más de una
2007). Las puntuaciones se promedian y se informan respuesta correcta.
en aumentos de medio punto, es decir, 4.0, 4.5, 5.0;
están volviendo locos, al menos durante esta fase de ETS, 2012a) ofrece información sobre la confiabilidad
transición, y estamos gastando montones de papel y validez, pero la de 2005-06 (ETS, 2005) presentó
imprimiendo toda clase de cuadros de concordancia. un resumen particularmente bueno. Los datos de la
He aquí un par de sugerencias. Si no te gusta la esca- prueba Escritura analítica provienen, en su mayor par-
la 200-800, sólo quita el dígito de las unidades (que te, de Schaeffer, Briel y Fowles (2001) y ETS (2009).
siempre es cero) y listo, tienes la escala de puntua- Antes de presentar algunas generalizaciones, una
ciones T con M = 50 y DE = 10 (véase figuras 3-10a y nota de precaución. Muchos de los resúmenes exis-
3-10b). Si tomamos la escala 120-180 y restamos 100 tentes dan información de la “antigua” prueba Analí-
de todas las puntuaciones, tenemos otra vez una es- tica, que ahora es irrelevante, mientras que hay poca
cala de puntuaciones T, que es casi el “estándar de la información disponible sobre la prueba Escritura ana-
industria” del campo de las pruebas de personalidad. lítica. Algunas fuentes sólo hablan de las pruebas Ver-
Otra alternativa sería que cada una usara la muy cono- bal y Cuantitativa; hay aun menos información acerca
cida escala de CI, pero es improbable que eso ocurra de la Prueba General “revisada”. Por ello, vamos a su-
porque la gente no quiere dar a entender que estas poner que la información de las “antiguas” pruebas
pruebas miden IQ, aunque en realidad hacen esto. Verbal y Cuantitativa se puede generalizar a las versio-
Las normas de rangos percentiles del GRE nes revisadas de estas pruebas, pero no suponemos
la productividad final como experto medida por el nú- 7. No estamos examinando el GRE Pruebas por Te-
mero de publicaciones 10 años después de concluir mas; sin embargo, debemos señalar que los da-
el programa? ¿O quizá algún otro criterio? tos muestran que estas pruebas son mejores
suficiente para desempeñarse con éxito en un tra- pruebas de manera cotidiana; durante muchos años,
bajo o en un programa de entrenamiento. El cuadro cada área del servicio empleó su propia prueba, de
9-12 enumera algunas de las pruebas más usadas de las cuales quizá la más famosa fue Army General
Cuadro 9-12. Algunas pruebas grupales de capacidad mental muy usadas en los negocios y el Ejército
Iniciales Nombre completo Fuente
GATB a
General Aptitude Test Battery Departamento del Trabajo de EUA
DAT Differential Aptitude Test Pearson Assessments
WPT Wonderlic Personnel Test Wonderlic, Inc.
ASVAB Armed Services Vocational Aptitude Departamento de Defensa de EUA
Battery
a
Algunas formas recientes del GATB se conocen como Ability Profiles, disponible por medio de O*NET, proyecto que se
describe en la página XX.
Classification Test [Prueba de Clasificación General subyacentes (ASVAB Career Exploration Program,
del Ejército] (AGCT). A inicios de 1976, todos los ser- 2010; Sands & Waters, 1997). Este resultado, sin duda,
vicios empezaron a usar el único ASVAB. En Larson es consistente con otras investigaciones sobre la
(1994) y Sands y Waters (1997) se puede encontrar estructura de las capacidades humanas. De hecho,
una breve historia del ASVAB y sus predecesores. A algunos informes recientes sobre el ASVAB propor-
finales de la década de 1990, un equipo emprendió cionan puntuaciones de los compuestos Verbal, Ma-
el proyecto de crear una versión adaptada para com- temáticas y Ciencia/Técnica. Tercero, podemos notar
putadora del ASVAB. Sands, Waters y McBride (1997) que algunas subpruebas son muy cortas, de las cua-
presentan una descripción particularmente completa les esperaríamos que tuvieran una confiabilidad bas-
de este proyecto. En la actualidad, la prueba está dis- tante limitada; en efecto, así es.
ponible en ambas formas: adaptada para computado-
ra y lápiz y papel.
¡Inténtalo!
Estructura y reactivos
Para ver ejemplos de reactivos de cada subprue-
El cuadro 9-13 bosqueja la estructura actual del AS- ba del ASVAB, entra en http://www.official-as-
VAB. Cuenta con ocho subpruebas con un tiempo total vab.com/samples_coun.htm
de aplicación de aproximadamente 3 hrs. Las edicio-
nes previas tenían otras subpruebas además de las de
la edición actual, por ejemplo, Velocidad de codifica- Características técnicas
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
dor de .80. Desde luego, el compuesto AFQT es muy pruebas incorporan el nombre de Wonderlic, por lo
confiable, con coeficientes arriba de .90 en la mayo- que, cuando alguien dice “usamos el Wonderlic”, es
ría de estudios. mejor indagar con exactitud a qué se refiere. Nuestra
Los escenarios militares ofrecen muchas oportuni- descripción se enfoca sólo en el WPT.
dades de estudiar la validez del ASVAB como predic- El WPT cuenta con una confiabilidad alta. Las con-
tor de éxito en diversos programas de entrenamiento. fiabilidades de consistencia interna, por lo general,
Los estudios en numerosos programas de entrena- superan el .90, aunque estas cifras están infladas un
miento militar demuestran una validez respetable, en poco por la velocidad que caracteriza a la prueba. Sin
especial de la puntuación compuesta AFQT. En mu- embargo, las confiabilidades de test-retest también
chos programas de entrenamiento (p. ej., controlador
del tráfico aéreo, técnico en electrónica, encargado 3
Muy recientemente, la editorial cambió el nombre de la
de la radio), el compuesto AFQT mostró correlacio- prueba de Wonderlic Personnel Test a Wonderlic Cognitive Test
nes corregidas por rango con un promedio de .60 con [Prueba Cognitiva Wonderlic], con ligeras variaciones en el
las notas finales de la escuela de entrenamiento y co- nombre de las versiones en línea y de lápiz y papel. Aquí se-
rrelaciones un poco más bajas, pero aún respetables, guimos usando el nombre tradicional WPT, incluyendo las re-
con el desempeño en el trabajo (Welsh, Kucinkas, & ferencias al WPT-R.
el trabajo, una correlación de .30 (entre el desempe- no es el que se prefiere en la actualidad, aunque algu-
ño en la prueba y en el trabajo) no es muy alta. nas fuentes emplean el término reducido en cultura.
Libre de cultura fue la denominación original de estas
pruebas, pero no tuvo que pasar mucho tiempo para
¡Inténtalo! que fuera evidente que ninguna prueba podría estar
por completo libre de todo atributo cultural. Por ejem-
Un detalle curioso acerca del WPT es que to- plo, usar papel, suponer una orientación de izquierda a
dos los jugadores de la National Football League derecha y de arriba a abajo en la página, dar respues-
(NFL) que estaban en venta lo respondieron. Los tas directas a las preguntas y aceptar restricciones de
resúmenes de estos resultados por posición (y tiempo son prácticas ligadas a la cultura. Sin embar-
en algunos casos por jugador) están disponibles. go, quizá podemos crear una prueba que sea neutral y
Introduce “Wonderlic y NFL” en cualquier busca- equitativa en términos culturales. Consideremos algu-
dor de internet para encontrar qué posición tiene nos esfuerzos para conseguirlo. Debemos señalar que,
la puntuación promedio más alta en el Wonderlic. aunque tratamos este tema en relación con las prue-
bas grupales de capacidad mental, también es perti-
nente para las de aplicación individual.
muestra un patrón (matriz) con una parte faltante, y la ta- De ningún modo el Raven es el único intento de ofre-
rea del examinado es elegir la opción que completa el cer una prueba culturalmente neutral, sino que hay
patrón. Lo importante de nuestra presentación aquí es numerosos ejemplos. Antes, en la descripción de las
observar la naturaleza de los reactivos tipo matriz. teorías de la inteligencia, mencionamos el artículo de
El Raven tiene varias características deseables. Es 1940 de Cattell en el que anunció una prueba cultural-
por completo no verbal; incluso las instrucciones se mente neutral. La prueba consistió en su mayor parte
pueden dar con pantomima si es necesario. De ahí que de reactivos tipo matriz. Con el tiempo, Cattell elaboró
+ + + + + + + + + + +
+ + + + + + + + + + +
+ + + + + + +
+ + + O O O X X + X
X X O X X O X X O X X O
X X O X X O X X O X X O
X X O X X O X X O
O X X X O X X X O O O O
+ + +
X X X
T T
X + T T T
la prueba en la publicación regular Culture Fair Intelli- neutrales (incluso libres de cultura) de la inteligencia,
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
gence Test [Prueba de Inteligencia Culturalmente Neu- lo cual es una noción intrigante.
tral] (CFIT). El trabajo inicial con estos reactivos tipo Sin embargo, la aplicación de las TCE ha estado
matriz fue parte del fundamento de Cattell para distin- confinada por largo tiempo a los usos de laboratorio;
guir entre inteligencia fluida y cristalizada. Se suponía además, tienen aún mucho que mostrar acerca de su
que el CFIT abordaría la dimensión fluida, mientras que valor como medidas de inteligencia.
pruebas más orientadas hacia lo verbal se encargarían Las siguientes tres conclusiones surgen de la revi-
de la dimensión cristalizada. Muchos otros autores han sión de un trabajo sobre pruebas culturalmente neu-
construido pruebas empleando reactivos tipo matriz, trales. Primero, las pruebas tienden a ser medidas de
relaciones figurativas, diseños geométricos y otros es- capacidad de razonamiento figurativo y espacial; esto
tímulos no verbales. La figura 9-8 presenta ejemplos puede ser de alguna utilidad, sobre todo cuando no
de estos reactivos. La esperanza, casi siempre, es que hay una posibilidad razonable de usar una medida
la prueba sea culturalmente neutral. más convencional de capacidad mental. Sin embargo,
Debemos señalar que las tareas cognitivas elemen- estas pruebas, evidentemente, no miden las mismas
tales (TCE) usadas en los modelos de procesamiento capacidades que las pruebas de referencia del funcio-
de información de la inteligencia (véase pp. 185- namiento intelectual general, de la manera tradicional
187) se han propuesto como medidas culturalmente como lo hacen las de Wechsler y Otis. Debemos ser
A B C D
Figura 9-8. Ejemplos de reactivos no verbales y otros distintos de los de tipo matriz.
cautelosos ante las afirmaciones de estos autores y Pruebas de inteligencia para microculturas
editoriales acerca de “una prueba no verbal, cultural-
mente neutral de inteligencia” por dos cuestiones. Pri- En el otro extremo de los intentos por construir prue-
mero, “la inteligencia” a la que se hace referencia en la bas de inteligencia culturalmente neutrales están las
afirmación es de una variedad mucho más circunscri- que se basan en subculturas sumamente específicas,
ta; si la afirmación implica que esta prueba no verbal lo que podemos llamar microcultura. Con frecuencia
puede ser sustituto de, digamos, el WISC, se trata de escuchamos acerca de tales pruebas de “inteligencia”;
una afirmación engañosa. Segundo, podemos deter- por ejemplo, una de ellas podría desarrollarse con ter-
minar por la simple inspección que una prueba es, en minología de navegación (puerto, virada, estribor, etc.),
gran parte, no verbal, pero no podemos determinar del de beisbol (toque de bola, fly de sacrificio, corredor
mismo modo que es culturalmente neutral. El hecho emergente, etc.) o del sistema de transporte subterrá-
de que una prueba sea no verbal no la hace de mane- neo (metro, torniquete, andén, etc.). A menudo, estas
ra automática culturalmente neutral; para saber si una pruebas se presentan para desacreditar las pruebas
prueba lo es se requiere investigación que muestre convencionales de capacidad mental, como el WAIS o
que funciona de modo equivalente en varias culturas. el SAT. Algún bromista señalará que una persona con
Segundo, cuando se usan para predecir el éxito un CI de 150 en el WAIS (que vive en Chicago) falló
escolar o laboral, las pruebas que son primordialmen- en una prueba sobre el metro de la Ciudad de Nue-
te medidas de razonamiento figurativo o espacial son va York, mientras que otra con un CI de 90 (que vive
claramente inferiores en relación con las pruebas de en el Bronx) pasó la prueba. Esto implica que el CI del
orientación verbal. Además, las pruebas figurativas/ WAIS no es importante, y los medios están encantados
espaciales agregan poco, si lo hacen, poder predic- de pregonar estos informes; sin embargo, es claro que
tivo a las pruebas verbales sencillas cuyo fin es pre- esta implicación es una tontería. Sabemos mucho acer-
cisamente la predicción. (Hay algunas excepciones ca de lo generalizable que puede ser el CI del WAIS,
muy limitadas de esta generalización, p. ej., predecir así que debemos hacer las mismas preguntas acerca
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
el éxito en arquitectura.) La razón de la superioridad de la prueba del metro que acerca del WAIS: ¿A qué
de las medidas verbales quizá es muy sencilla. Las ac- otra conducta se puede generalizar el desempeño en
tividades académicas y laborales tienen más deman- la prueba del metro? ¿Con qué se correlaciona? ¿Cuá-
das verbales que figurativas/espaciales. les son las normas de la prueba? ¿La puntuación es
Tercero, no se ha cumplido la esperanza de que las confiable? Por lo general, esta información no está dis-
pruebas culturalmente neutrales eliminen las diferen- ponible en estas pruebas para microculturas.
cias en las puntuaciones promedio entre grupos ma-
yoritarios y minoritarios o entre grupos de distintas Generalizaciones acerca de las pruebas
culturas. Algunas investigaciones muestran que es- grupales de capacidad mental
tas diferencias se reducen un poco en las pruebas no
verbales, en comparación con las pruebas más con- Nuestro examen de las pruebas grupales de capa-
vencionales con mucha carga verbal. Otras investi- cidad mental sugiere las siguientes seis generaliza-
gaciones muestran que las diferencias grupales son ciones, las cuales deben matizarse con información
aproximadamente las mismas en pruebas con fuerte específica de cada prueba y sus aplicaciones particu-
carga verbal y las no verbales. La búsqueda del vello- lares. Sin embargo, algunas tendencias son claras en
cino de oro habrá de continuar. varias de las pruebas que hemos revisado.
Excepto al predecir el desempeño en otra prueba porciona casi todo el poder predictivo de una ba-
(donde las correlaciones son muy altas), la validez tería de 3 hrs con múltiples subpruebas. Sin duda,
predictiva rara vez es mayor de .60. Por otro lado, es factible desarrollar una prueba de 50 reactivos
rara vez es menor de .30. para medir “g” con una confiabilidad de .90-.95;
Aquí hay mucho que pensar. La respuesta a la an- de hecho, no es tan difícil hacerla. Entonces, ¿por
tigua pregunta de si la capacidad mental general qué las personas siguen usando las baterías de 3
hace alguna diferencia o es irrelevante en la vida hrs y puntuaciones múltiples?
es “sí”. ¿La capacidad mental general hace algu- 5. Restricción de rango y confiabilidad imperfec-
na diferencia? Sí. ¿El esfuerzo, la determinación ta. La investigación sobre las aplicaciones de las
y el carácter hacen alguna diferencia? Sí. ¿Las pruebas grupales de capacidad mental invariable-
circunstancias hacen alguna diferencia? Sí. mente implica algún tipo de situación predictiva.
¿La suerte interviene en esto? Sí. ¿Hay error de En estas situaciones, necesitamos recordar el
medición? Sí, tanto de la prueba como del criterio. efecto de la falta de confiabilidad del criterio y, aún
La vida es compleja, y también las relaciones en- más, el de la restricción del rango. No es fácil re-
tre estas variables lo es. Señalamos este pun- cordar estos factores, pues no son evidentes para
to en el capítulo sobre las pruebas grupales de el sentido común. Los ajustes estadísticos no son
Resumen
1. Las pruebas grupales de capacidad mental tienen sus usos más comunes en escuelas de todos los niveles,
desde las escuelas primaras hasta las que ofrecen programas de posgrado y profesionalización, y en es-
cenarios militares y de negocios. Su propósito primordial es, por lo general, hacer predicciones acerca del
éxito en la escuela o el trabajo. Estas pruebas también se usan con fines de investigación.
2. Las pruebas grupales de capacidad mental tienen ocho características en común. La más obvia es que se
aplican a grupos, aunque también se pueden aplicar de manera individual. Son de opción múltiple y se cali-
fican de manera automatizada. Su contenido, por lo general, es paralelo al de las pruebas individuales. Por
lo común, tienen límites de tiempo y número de reactivos fijos, pero está aumentando la popularidad de las
pruebas adaptada para computadora que no tienen estas características. Los tiempos de aplicación caen
en dos bandos: los de 1 hr y los de 3 hrs. La mayoría de estas pruebas produce una puntuación total y va-
rias subpuntuaciones. Tienden a tener fundamentos de investigación muy amplios. El principal propósito de
casi todas las pruebas es la predicción.
3. A menudo se usa una prueba de capacidad mental de aplicación grupal junto con una prueba estandariza-
da de aprovechamiento en los programas de evaluación escolar. Describimos como ejemplo de estas prue-
bas la Prueba de Capacidad Escolar Otis-Lennon, Octava Edición, la más reciente de la larga línea de las
pruebas Otis.
4. El SAT y el ACT se usan mucho como predictores del éxito en la universidad. Aunque tienen filosofías, his-
torias y escalas de puntuación algo diferentes, estas pruebas son muy similares en su propósito, confiabi-
lidad y validez.
5. Otro uso de las pruebas grupales de capacidad mental es seleccionar estudiantes en programas de pos-
grado y profesionalización. Describimos el Graduate Record Examination: Prueba General (GRE-G) como
ejemplo de las pruebas de esta categoría.
6. Las pruebas grupales de capacidad mental también se usan para predecir el éxito en escenarios militares
y de negocios. La Batería de Aptitud Vocacional de las Fuerzas Armadas (ASVAB) ilustra este tipo de uso.
La estructura del ASVAB da un gran alivio al tema de usar varias subpruebas en este tipo de pruebas. En
fuerte contraste, el Wonderlic es muy sencillo y corto.
7. Los psicólogos han buscado por mucho tiempo pruebas de capacidad mental culturalmente neutrales. Has-
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
ta la fecha, las pruebas que han resultado de estos esfuerzos son principalmente medidas de razonamiento
figurativo/espacial. El muy citado Matrices Progresivas de Raven ofrece un buen ejemplo de estas pruebas.
8. Desarrollamos generalizaciones acerca de las pruebas grupales de capacidad mental en relación con su
contenido, confiabilidad, validez predictiva y falta de validez diferencial. Pusimos especial atención en la ne-
cesidad de ser sensibles a dos cuestiones al usar pruebas para hacer predicciones: la restricción de rango
y la confiabilidad imperfecta del criterio.
Palabras clave
1. Para observar las diversas maneras en que las pruebas de inteligencia se pueden usar en la investigación,
introduce “intelligence” como palabra clave en cualquier buscador de bases de datos electrónicas de ar-
tículos de ciencias sociales y de la conducta (p. ej., PsychINFO). Para evitar tener demasiadas referencias,
limita la búsqueda a sólo uno o dos años. Trata de determinar con exactitud qué prueba se usó en algunos
de los artículos que encontraste en la búsqueda.
2. Intenta con una prueba adaptadas para computadora; además de los temas cubiertos en este capítulo, en-
tra a http://echo.edres.org:8080/scripts/cat/catdemo.htm. Realiza todo el ejemplo como si fueras “en ver-
dad inteligente” y, después, “no tan inteligente”.
3. Aprende a usar los sitios web para acceder a los datos técnicos de las pruebas. Como ejemplo, accede a la
información del SAT en el sitio de College Board. Entra en www.collegeboard.com. Haz clic en Site Search
y escribe en la casilla de Keyword “reliability”. Examina algunos informes. Después, escribe “validity” como
palabra clave y revisa algunos informes. También puedes acceder a los datos nacionales y estatales más
recientes del SAT.
4. En la página 235, presentamos algunos ejemplos de reactivos convertidos de respuesta libre en opción
múltiple. Observa los reactivos muestra del cuadro 8-2. Trata de escribir tus propias versiones de opción
múltiple de algunos de esos reactivos.
5. Observa el informe de las puntuaciones del OLSAT8 de la figura 9-3. ¿Cuál es el SAI del estudiante? ¿A
qué conclusiones llegas acerca de este estudiante a partir del patrón de Comparaciones Anticipadas de
Aprovechamiento?
6. En el ejercicio Inténtalo de la página 234, hiciste una lista de las pruebas grupales de capacidad mental
que has respondido; escoge una de ellas. Compárala con las ocho características comunes de las pruebas
grupales de capacidad mental que se enumeran en la página 236. ¿Qué tanto se ajusta la prueba que es-
cogiste a estas ocho características?
7. Entra al sitio de ACT Assessment, www.act.org. ¿Cómo se describe el propósito del ACT en este sitio? ¿Pue-
des encontrar información sobre la confiabilidad de las pruebas ACT?
8. En la página 254, señalamos las bajas confiabilidades de algunas pruebas del ASVAB. Por ejemplo, la prue-
ba Comprensión de párrafos de 15 reactivos tiene una confiabilidad aproximada de .50. Empleando lo que
has aprendido acerca de la relación entre confiabilidad y extensión de la prueba (véase p. 90), ¿cuántos re-
activos debería tener esta prueba para alcanzar una confiabilidad aproximada de .85?
9. Usa los datos D1: GPA del apéndice D. Con el paquete estadístico de tu preferencia, prepara la distribución
bivariada (dispersograma) del SAT Total frente al GPA. Además, obtén la correlación entre SAT y GPA. ¿A
qué conclusiones llegas a partir de estos datos?
Copyright © 2015. Editorial El Manual Moderno. All rights reserved.
Thomas, P. H. (2015). Pruebas psicológicas : Una introducción práctica (2a. ed.). Retrieved from http://ebookcentral.proquest.com
Created from bibliouniminutosp on 2019-08-20 09:07:33.