Sunteți pe pagina 1din 344

MEDICiÓN Y EVALUACiÓN

EN PSICOLOGíA Y EDUCACiÓN
Robert L. Thorndike
Elizabeth P. Hagen MEDICiÓN Y
Durante el siglo xx se desarrollaron numerosas
técnicas de evaluación del individuo, aplicándose a
muchos aspectos de su personalidad y sus habilidades.
EVALUACiÓN EN
En esta obra se destacan las consideraciones más
recientes ~cerca de la forma correcta de hacer una
evaluación justa, en la que se combinen los elementos
PSICOLOG~ yEDUCACiÓN
útiles de las nuevas teorías de la medición psicológica
con los conocimientos desarrollados en las últimas
siete décadas en esta materia.
Los autores comienzan por hacer una aproximación
hacia el uso de las pruebas y, no obstante que este
libro trata sobre medición, dedican un capítulo a las
técnicas estadrsticas básicas por la relación que éstas
guardan con la medición psicológica.
A través de los diferentes capítulos se muestran al
estudíante de psicología, las cualídades deseadas en
los instrumentos de medición, las normas y unidades
utilizadas en la evaluación y se le orienta acerca de
cómo diseñar y construir pruebas específicas: de
aprovechamiento escolar, de inteligencia, de conducta
y de aptitudes laborales.
Además, se exponen cuestionarios e inventarios de
autoapreciación y se analizan los problemas sociales
y políticos de la evaluación al individuo evaluado por
otros, así como la manera de calificar las pruebas.

OTROS TíTULOS

ELABORACiÓN DE TESTS
Desarrollo e interpretació.'1 de los tests de
aprovechamiento
Dorothy Adkins Wood

En pocas páginas, proporciona los principios


básicos de medición, técnicas y estadísticas
aplicables a cualquier campo temático,
procedimientos específicos, sugerencias prácticas y
múltiples consejos para construir, analizar y calificar
" " . ".1 "
6 PREFACIO

qu~ contiene claves d~ nuestro texto publicada por John Wiley & Sons, Inc.
ASImIsmo, contlen~ lIstas maestras de conceptos clave con notas de página
ayud~s de estudIO, lectUlas complementarias, ejercicios de estudio v prueba~
de practIca. .
[71
RORERT L. T HORI\:DIH ,
LU
ELlV. Il~TH P. HAGEI\:
Indice de contenido

Prefacio 5

Cap. 1. Una aproximación hacia el uso de las pruebas 9


Cap. 2. . Técnicas estadísticas básicas 30
Cap. 3. Cualidades deseadas en los instrumentos de medición 61
Cap. 4. Nonnas y unidades utilizadas en la evaluación 115
Cap. 5. Dónde encontrar información acerca de pruebas específicas 153
Cap. 6. Pruebas de aprovechamiento escolar y decisiones educati-
vas 166
Cap. 7. Diseño y construcción de una prueba 196
Cap. 8. Pruebas de aprovechamiento estandarizadas 266
Cap. 9. Pruebas estandarizadas de inteligencia o de aptitud escolar 288
Cap. 10. Medición de aptitudes especiales 342
Cap. 11. Cuestionarios e inventarios de auto apreciación 383
Cap. 12. El individuo evaluado por otros 433
Cap. 13. Pruebas y observaciones de la conducta 476
Cap. 14. Planeación de un programa de pruebas escolares 517
Cap. 15. Calificaciones y forma de calificar 569
Cap. 16. Problemas sociales y políticos de la evaluación 589

Apéndices 607

7
Catalogación en la fuente
Thorndike, Robert L.
Medición y evaluación en psicología y educación. --
2a ed. -- México : Trillas, 1989 (reimp. 2006).
680 p. ; 23 cm.
Traducción de: Measurement and evaluation in
psychology and education
Incluye bibliografías e índices
ISBN 968-24-3144-1 Prefacio
1. Pruebas mentales. l. Hagen, Elizabeth P. 11. t.

D- 153.94'T773m LC- LB1l31 'T4.5 247

Cuando apareció la primera edición de este libro, hace 22 años, la educa-


ción y el público estadounidenses eran presas de un impulso apresurado por
alcanzar la excelencía, en respuesta a los triunfos espaciales de los rusos. Des-
de entonces han surcado los cielos muchos sputniks y han soplado muchos
vientos distintos sobre las mediciones psicológicas y educativas. Dentro de la
sociedad, la presión para la integración, por la igualdad de derechos para todos
y para el derecho al empIco ha llamado la atención acerca de la cuestión de lo
apropiado de las pruebas de admisión a la licenciatura y de selección de perso-
Versión autorizada en españoi División Comercial n:l!. Dentro de las escuelas, las propuestas revividas para la instrucción per-
de la edición publicada en inglés por Calzada de la Viga 1132 sonalizada han hec.ho que se reconozca que la comparación de un alumno con
John Wiley & Sons, Nueva York, N. Y. EUA C. P. 09439, México, D. f sus compañeros no siempre proporciona la información que se necesita para
Tel. 56330995 las decisiones educativas¡ sin embargo, la necesidad de contar con informa-
La presentación y FAX 56330870 ción objetiva'y confiable como base para tomar decisiones continua inalte-
disposición en conjunto de
MEDICIÓN y EVALUACIÓN EN
rable y los procedimientos de pruebas y medidas constituyen una fuente
PSICOLOGíA Y EDUCACIÓN www.trillas.com.mx importante de información.
son propiedad del editor En esta edición, que es la cuarta, destacamos las consideraciones recientes
Ninguna parte de Miembro de la Cámara Nacional de
acerca de una evaluación que sea justa, considerando los derechos de los indi-
esta obra puede ser la Industria Editorial viduos y las pruebas de criterio en las que se toma lo que es útil de lo nuevo sin
reproducida o trasmitida, mediante ningún Reg. núm. 158 acumularlo todo, combinándolo con los cimientos sólidos de la medición psi-
sistema o método, electrónico o mecánico cológica y educativa desarrollados a lo largo de los 70 últimos años. Nuestro
(incluyendo el fotocopiado, la grabación
o cualquier sistema de recuperación y Primera edición en español ES
propósito es hacer un tratamiento balanceado mediante el cual se consideren
almacenamiento de información), ISBN 968-24·0166-6 las preocupaciones de la dée¡lda de los setenta sin perder la fundamentación
sin consentimiento por escrito del editor (El, EA, EE, EX, EO, XR, XA, XM) sólida del pasado.
Segunda edición en español XO En esta edición partimos de la suposición de que las pruebas y las medidas
Derechos reseNados en lengua española ISBN 968-24-3144-1 ayudan a tomar decisiones acerca del tema principal. Hemos identificado un
© 1970, Editorial Trillas, 5 . A. de C. \1. (01; QM, QX, 51; 51) amplio rango de decisiones personales y educativas y nos hemos preguntado
Reimpresión, 2006 cómo pueden contribuir los procedimientos de pruebas y mediciones en cada
División Administrativa una de ellas. Parece que esto es la esencia de la materia. El valor de las pruebas
Av. Río Churubusco 385 y las mediciones está dado en 'la medida en que su empleo permite tomar
Col. Pedro María Anaya, C. P. 03340 Se imprimió en mejores decisiones. Si siempre se tiene en cuenta este fin, una valoración sóli-
México, D. f Rotodiseño y Color, 5 . A. de C. V
da de las pruebas como un medio para ello parece factible .
Tel. 56884233, FAX 56041364 AO 75XSS
También nos gustaría sugerir que si los estudiantes de psicología buscan
ayudas adicionales en el área de la medición y la evaluación, es conveniente
que lean la obra Perspectives in Measurement and Evaluation, que es una
guía-estudio elaborada por Daniel J. Mueller, de la Universidad de Indiana, y

.: , ....:...; ..:
Traducción: Elisa María González, maestra en psicología clínica por la
,
Universidad de las Américas, México

Revisión técnilia: Arturo Silva Rodríguez, maestro en psicología por la Escuela


Nacional de Estudios Profesionales-Iztacala, Universidad Nacional
Autónoma de México, y profesor e investigador en la misma
MEDICION, y
EVALUACION EN
institución

PSICOLOGíA YEDUCACiÓN
MEDICiÓN Y EVALUACiÓN
EN PSICOlOGfA y EDUCACiÓN
,.
Robert L Thorndike
Elizabeth P. Hagen MEDICION y
Durante el siglo xx se desarrollaron numerosas
técnicas de evaluación del individuo, aplicándose a
muchos aspectos de su personalidad y sus habilidades. EVALUACiÓN EN
PSICOLOG~ yEDUCACiÓN
En esta obra se destacan las consideraciones más
recientes ~cerca de la forma correcta de hacer una
evaluación justa, en la que se combinen los elementos
útiles de las nuevas teorías de la medición psicológica
con los conocimientos desarrollados en las últimas
siete décadas en esta materia.
Los autores comienzan por hacer una aproximación
hacia el uso de las pruebas y, no obstante que este
libro trata sobre medición, dedican un capítulo a las
técnicas estadísticas básicas por la relación que éstas
guardan con la medición psicológica.
A través de los diferentes capítulos se muestran al
estudiante de psicología, las cualidades deseadas en
los instrumentos de medición, las normas y unidades
utilizadas en la evaluación y se le orienta acerca de
cómo diseñar y construir pruebas específicas: de
aprovechamiento escolar, de inteligencia, de conducta
y de aptitudes laborales.
Además, se exponen cuestionarios e inventarios de
autoapreciación y se analizan los problemas sociales
y políticos de la evaluación al individuo evaluado por
otros, así como la manera de calificar las pruebas.

OTROS TíTULOS

ELABORACIÓN DE TESTS
Desarrollo e interpretación de los tests de
aprovechamiento
Dorothy Adkins Wood

En pocas páginas, proporciona los principios


básicos de medición, técnicas y estadísticas
aplicables a cualquier campo temático,
procedimientos específicos, sugerencias prácticas y
múltiples consejos para construir, analizar y calificar

. , .: -' -~. :-;". . : .:. .


1
Una aproximación hacia
el uso dela s pru eba s

e in-
Este mundo está lleno de decisiones, algunas de ellas a ni\"el nacional
política concern iente a los presupu estos
ternacional, que se relacionan con la
y tratados, a la energía ya la contam inación , pero esto no nos
preocupa por el
ciertas cosas, por ejemplo , si sería
momen to. Alguna s decisiones son acerca de es
bueno compra r un automó vil nuevo y de qué marca, pero estas decision
actual; sin embarg o, muchas de
tampoc o constitu yen nuestra preocupación
ual o en
estas decisiones conciernen a las personas, ya sea de manera individ
ión y medició n psicológ ica
grupos, y esto es lo que se relaciona con la evaluac o
y educacional. El maestro , el asesor, el admini strador escolar, e! psicólog
es
industrial o de trabajo constan tement e particip an en la toma de decision
El obje-
acerca de la gente o ayudan a ésta a hacerlo respecto de su propia vida. que
tivo de los procedimientos de medición es proporc ionar la información
permita tomar estas decision es de manera mris apropia da.

TIPOS DE DECIS IÓN ACER CA DE


LAS PERS ONAS
Existen diversos tipos de decisiones, algunas pueden ser instrucciol1a-
les, muchas de las que toman los maestros son de este tipo. En ocasiones esta,
clase de decisiones consideran al grupo de clase en su totalidad; por ejemplo
pres-
si se debe tomar el tiempo de la clase para revisar el concepto de "pedir
en una resta, o si la mayorí a de! grupo ya tiene una compet encia ade-
tado" an
cuada en esta habilidad. Alguna s decision es instrucc ionales se relacion
estudia ntes específ icos en la clase, por ejemplo , ¿qué libros
con algunos
habili-
serían recomendables para María, de acuerdo con sus intereses y su a-
dad para la lectura? Para que estas decisio nes se puedan tomar adecuad
ejempl o el nivel de habilida d que
mente es import ante conoce r en el primer
')
10 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS
11
tiene la clase para "pedir prestado" yen el segundo qué tan competente lec- PAPEL QUE DESEMPEÑA LA MEDICIÓN
tora es María. EN LA TOMA DE DECISIONES
En otras ocasiones las decisiones son de tipo curricular. Las autoridades
educativas de una escuela pueden estar considerando hacer cambios en el A lo largo de este libro la pregunta central será: ¡cómo pueden ayudar las
programa, como incluir el Phonetic initial teaching (método de enseñanza técnicas de medición educativa y psicológica a las personas para que tomen
fonética del alfabeto) para las etapas iniciales en la instrucción de la lectura. mejores decisiones? Todas las otras preguntas que surjan se desarrollarán y se
¡Debería llevarse a cabo este cambio? La decisión adecuada requiere que se retroalimentarán de esta pregunta central. Pero, ¡ qué propiedades deben tener
determine, ya sea por medio de la investigación directa dentro de la escuela o los instrumentos de medición para que nos ayuden a tomar decisiones sólidas
mediante la conjunción de voluminosos resultados de investigaciones ante- v confiables? N ospreguntaremos en qué forma deberán presentarse los resul-
riores, qué tanto progresan los niños cuando emplean este enfoque en lugar tados de una prueba, a fin de que nos sean más útiles en la toma de decisio-
del convencional. Esta investigación sólo puede ser satisfactoria en tanto lo nes. A medida que estudiemos las técnicas de evaluación que han sido diseña-
sean las medidas de habilidad para leer, por medio de las cuales se evalúan los dos nos preguntaremos para qué tipos de decisiones puede contribuir con
resultados de los dos procedimientos educativos mencionados. inf~rmación valiosa una técnica específica. También consideraremos una
También existen las decisiones de selección, que hacen las empresas o variedad de factores, como baja motivación, trastornos emocionales, escolari-
las instituciones educativas. Una universidad muy popular debe decidir, con dad inadecuada o antecedentes culturales, que puedan distorsionar la infor-
fundamentos, cuáles estudiantes admitirá en el primer año de licenciatura. mación proporcionada por las pruebas, los cuestionarios o cualquier tipo de
Los criterios para la admisión son múltiples y complejos¡ uno de ellos sue- evaluación¡ asimismo, analizaremos las precauciones necesarias para emplear
le ser que el estudiante admitido sea capaz de realizar con éxito el trabajo la información de cada técnica de evaluación en la toma de decisiones.
académico que le proporciona la universidad. Esta universidad busca infor- Por supuesto, los procedimientos de evaluación no toman las decisiones,
mación en parte por medio de los registros escolares, pero también median- ~ino que son las personas quienes lo hacen. Lo más que pueden hacer los pro-
te un p;ograma de pruebas que le permite juzgar cuáles de los solicitantes cedimientos de medición es ofrecer información relevante para tomar la deCI-
tienen probabilidades de alcanzar éxito en su programa. La decisión de selec- sión. Una prueba de aptitud escolar puede indicar qué tan bien podrá realizar
cionar a la gente surge en los empleos lo mismo que en la educación, y la Pedro tareas académicas en el nivel universitario y, al combinar esta informa-
empresa, en la búsqueda de identificar a los empleados potencialmente más ción con las demandas académicas de un programa de ingeniería en una uni-
eficientes, también puede encontrar que la ejecución típica en una situación versidad específica, la puntuación de la prueba puede proveer una estimación
de prueba controlada proporciona la información que puede mejorar la pre- aproximada acerca de qué tantas posibilidades tiene Pedro de estudiar el pro-
cisión y la objetividad de sus decisiones. grama de ingeniería, pero sólo Pedro puede decidir si quiere estudi~r dic?o
Algunas veces, las decisiones son de ubicación o de clasificación. Es pro- programa en esa universidad, pues ¿está realmente interesado en la mgeme·
bable que en una escuela secundaria se tenga que decidir si a un estudiante ría?, ¡tiene alguna razón personal para querer inscribirse en una deter~in,ad,a
debe colocársele en la sección de estudiantes de rápido aprendizaje o en la sec- universidad?, ¡cuáles son los factores económICOS dentro de esta declsJOn'l
ción regular del programa de matemáticas. En la Armada se tiene que decidir ¡a qué aspira Pedro en la vida? Tal vez a él le gustaría ser un granjero o un
si un nuevo recluta debe ser asignado a la escuela de técnicos en electrónica o haragán¡ quizá no tiene la menor motivación ni ningún interés por la educa-
a la de cocineros y reposteros. Para ubicar y clasificar, quien va a tomar la ción superior.
decisión necesita información que le permita predecir qué tanto aprenderá el El ejemplo anterior debe dejar en claro que las decisiones acer~a de las
individuo o qué tanto éxito logrará en programas alternativos. Las medicio- acciones que deben tomarse involucran no sólo a los hechos reales smo tam-
nes de aptitud, intereses y aprovechamiento previo pueden ser útiles para bién al sistema de valores. ¡Debe Pedro inscribirse en Siwash o en Harvard?
obtener esta información. Una prueba de aptitud escolar produce una puntuación o calificación que es
Finalmente, hay muchas decisiones cuyo mejor nombre es el de decisio- un hecho, el cual permite predecir que Pedro tiene cinco oportunidades de
nes personales, porque son opciones que tiene el ind~viduo acerca de s! mis- seis de ser admitido en Siwash y sólo una de seis de ser admitido en Harvard¡
mo en las múltiples encrucijadas de su vida. Al termmar la preparatOrIa, ¿el pero si Pedro considera a ésta 10 veces más deseable que aquélla, quizá aún sea
estudiante deberá ir a la universidad o a una escuela técnica?; ¡deberá buscar una decisión sensata dejarle que solicite su inscripción en Harvard en vez de
un trabajo?, pero ¡qué tipo de trabajo? De acuerdo con la decisión tomada, en Siwash, a pesar de que tiene más bajas probabilidades, de que lo ad~itan.
¡qué especialidad deberá cursar en una escuela técnica? Para contestar estas Así vemos que la prueba no proporciona ninguna información-en el conjunto
preguntas, el estudiante deberá preguntarse: ¿qué ~Iase de persona so~?, de valores, y esta información debe complementarse por medio de otras fuen-
;cómo podría compararme con otras personas?, ¡que debo hacer para satIs- tes antes de que se pueda tomar una decisión sensata.
facer los requisitos de este tipo de trabajo?, ¿me gustará? Las mediciones de Otro ejemplo, una prueba de aptitud puede permitirnos estimar la proba-
habilidades, intereses y temperamento pueden proporcionarle al estudiante bilidad de éxito para un estudiante negro o para uno hispánico, comparada
información suficiente que le permitirá obtener una respuesta fundamentada. con la probabilidad de estudiantes blancos, en algún tipo de entrenamiento
12 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS ASPECTOS DEl INDIVIDUO 13

profesional¡ sin embargo¡ una decisión con respecto a su admisión tendría que yigente en Centerville? Una investigación acerca de esta prueba de matemáti-
incluir¡ explícita o implícitamente¡ algunos juicios acerca de los valores relati- cas con normas en los niveles nacionales y regionales permitirá comparar a los
vos de la sociedad al incluir más personas blancas en esa profesión¡ en com- estudiantes de Centerville con los estudiantes del resto del país¡ además de
paración con el valor de incrementar la representación de negros o de hispá- que esta comparación puede combinarse con otra información respecto de los
nicos. Estos puntos acerca del sistema de valores suelen ser complejos y alumnos de Centerville y sus escuelas¡ para llegar a un juicio acerca de si este
controvertidos¡ y por lo general deben tomarse en cuenta en la toma de deci- progreso es satisfactorio.
siones. Es necesario reconocer la.importancia de este tema¡ así como que los El tipo de prueba de habilidad que describe lo que una persona ha aprendi-
procedimientos de evaluación sean demasiado precisos para que no puedan do a hacer se lIama prueba de aprovechamiento. Las pruebas de aprovecha-
culparse de las ambigüedades y los conflictos susceptibles de encontrarse en miento señaladas en los ejemplos anteriores son dos tipos de pruebas que con-
nuestro sistema de valores. u'astan marcadamente. La prueba de las consonantes iniciales y su sonido está
La función de la evaluación educativa y psicológica es sólo ofrecer in- reIJcion.lda con el dominio de una habilidad específica para un solo estudian-
formación en cuanto a las decisiones que podrían tomarse. Esperamos que te¡ y no surge ninguna pregunta acerca ~e si Óscar es mejor o peor que ningún
proporcionen información útil¡ Y que ésta sea mejor que otras opciones. El otro alumno; la única pregunta es si Oscar puede realizar esta tarea lo sufi-
estudio de la evaluación educativa y psicológica deberá permitirnos conocer cientemente bien para que sea adecuada a su lectura. Asimismo¡ la maestra de
con detalle los recursos y las técnicas disponibles para obtener información Óscar puede estar preocupada por el nivel de dominio de una habilidad espe-
acerca de las personas. Más allá de eso ¡ estos estudios deberán aportar criterios cífica del uso del inglés dentro de un grupo. Las pruebas que conciernen al
para evaluar la información que ya está provista mediante tales recursos¡ a fin dominio de habilidades tan definidas se suelen llamar pruebas referidas al
de determinar el grado de confianza que debe tener la información que apor- contenido o pruebas referidas al criterio¡ porque el enfoque se centra exc1u-
tan y para advertir las limitaciones inherentes a esa misma información. si\"amente en lograr un estándar de ejecución de una habilidad específica a la
Hasta 'aquí hemos considerado las decisiones prácticas que conducen a que se pretende medir por medio de los ejercicios de una prueba. Tal vez
actuar¡ pero la medición también es importante para proveer la información la mayoría de las evaluaciones necesarias para tomar decisiones instrucciona-
que guíe las decisiones teóricas. En estos casos¡ el resultado deseado no es la les t'on de este tipo.
acción¡ sino la comprensión. ~Leen más rápido las niñas que los niños? Se Con base en lo anterior¡ podemos contrastar la investigación acerca de la
necesita una prueba de lectura que proporcione la suficiente información en prueba de matemáticas que se utilizó en Centerville. En ésta¡ la decisión es si
la cual basar esta decisión. ¡Obtienen más baja calificaCión los estudiantes que Ccntcrville demuestra un aprovechamiento satisfactorio cuando se le com-
se angustian con las pruebas¡ en comparación con los que no se angustian? p,lra COIl otros pueblos parecidos. El punto de referencia no está dado en la
Para responder esta pregunta se debe usar un cuestionario acerca de la angus-
(J t¡lIT<l per se¡ sino en el desempeño en un grupo de referencia más general. Este
tia ante las pruebas¡¡¡ así como una prueba de aprovechamiento escolar. La tipo de pruebas se denomina prueba referida a la normal porque la norma
medición es fundamental para contestar prácticamente todas las preguntas para un desempeño aceptable se fija por medio de la comparación con otro
que formula la ciencia¡ no sólo las ciencias físicas¡ sino también las biológi- grupo. Una prueba referida a la norma se puede usar apropiadamente para
cas y las sociales. tom,lf decisiones en el curriculum de una profesión¡ en orientación vocacio-
n,II y en inycstigación. Más adelante se compararán y contrastarán las pruebas
de aprovechamiento referidas t'anto al criterio como a la normal en cuanto a
ASPECTOS DEL INDIVIDUO QUE SON sus aspectos de construcción¡ características deseadas v uso .
RELEVANTES PARA LAS DECISIONES Algunas decisiones que necesitamos tomar requier~n tener información
acerc\ de lo quc una persona puede aprender a haceL ¡Será capaz Elena de
Algunas de las decisiones en las que pudiéramos estar interesados están en dominar las técnicas de programación de computadoras, ¡ ¡qué tan rapido asi-
relación con la información acerca de lo que puede hacer en el momento de la llllla . Ricardo el cálculo: Las decisiones de selección y colocación implican las
evaluación una persona o un grupo de personas. Muchas decisiones instruc- prethCCIOBes ~c~rca del aprendizaje futuro¡ basadas en las características pre-
cionales en las escuelas requieren información de esta naturaleza. Por ejem- S~I.ltCS del mdlVlduo. Una prueba que se usa como predictor de alguna ejecu-
plo¡ si Óscar comete muchas equivocaciones al leer en voz alta¡ ¡podrá apa- clOn futura recibe el nombre de prueba de aptitud.
rear las palabras con su sonido consonante inicial? U na prueba breve acerca de Es ncc~sario scñ~lar que entre los predictorcs eficaces de un aprendizaje
esta habilidad particular puede ayudarnos a decidir si la falta de ella forma futuro cstan las medldas de aprendizaje logrado en el pasado. Por lo tanto,
,rarte del problema de lectura de Óscar. ¡Cuántos compañeros del grupo de par,1 los programas de computación y de cálculo¡ un predictor efectivo sería
Osear dominan la regla para escribir con mayúscula los nombres propios? UIl;l prueba quc midiera el grado de dominio logrado en álgebra¡ en la escuela
Una prueba para tal propósito puede proporcionar evidencia para guiar la prep;lratona. Tal prueba nos ayudaría a medir previamente el conocimiento i
decisión acerca de si se necesita más enseñanza de esta habilidad en especial. las habd!dades aprendidas¡ pero también podríamos usarla para predecir el
¿Produce un aprovechamiento satisfactorio el programa de matemáticas ;lprel1lk:alc futuro. Debe reconocerse que cualquier prueba¡ sin importar su
14 CAP. 1. APROXIMACIÓN Al USO DE LAS PRUEBAS INFORMACIÓN ACERCA DE UNA PERSONA 15

nombre, evalúa las habilidades presentes de una persona. No podemos medir situaciones naturales que ocurren en la vida cotidiana y situaciones de "prue-
directamente en una persona una habilidad "naturalH o lIinnata"; lo único que ba" especialmente estructuradas.
podemos medir es lo que una persona es capaz de hacer en el momento de la Es importante recordar, especialmente en un libro acerca de las pruebas y
evaluación. Así, esta información puede ser usada para evaluar su aprendizaje mediciones, que mucha de la evidencia por medio de la cual obtenemos las
pasado, como cuando se aplica una prueba de álgebra para decidir si Ricardo características de una persona proviene de eventos que ocurren de manera
debería obtener una calificación aprobatoria en su curso de álgebra, o bien natural. Un maestro observa a sus estudiantes diariamente en el. salón de cla-
para predecir su aprendizaje futuro, como cuando se usa con el fin de decidir ses a medida que interactúan con sus compañeros y con los materiales para
si Ricardo tiene una probabilidad razonable de completar el curso de cálculo efectuar las tareas del día. Un supervisor observa a sus empleados en el tra-
de manera exitosa. La diferencia entre una prueba de aptitud y una de aprove- bajo. Todos nosotros nos relacionamos con nuestra familia y con nuestros
chamiento r¡:¡dica más en el uso final que se le dará a los resultados de ambas, amigos tanto en el trabajo como en el juego. A partir de estas interacciones
que en la naturaleza del contenido de las pruebas mismas. nos formamos impresiones de la persona observada, las cuales suelen ser bur-
Algunas decisiones requieren la información de lo que a una persona le das y asistemáticas, pero están basadas en un amplio rango de situaciones de la
gusta hacer. En estos casos tratamos con la evaluación de intereses o de valo- vida diaria.
res. En las decisiones que toma un individuo en cuanto a su elección educativa Podemos tratar de sistematizar y usar estas observaciones de la vida dia-
o vocacional, es muy importante que pueda evaluar si un futuro en particular ria en varios modos. Cuando se pretende usar las observaciones acumuladas
le brindará satisfacción completa, así como juzgar si es probable que logre un que han ocurrido en el pasado, podemos tratar de organizarlas y cuantificar-
alto nivel de éxito. Los procedimientos sistemáticos para obtener de una per- las mediante algún tipo de reporte o registro. Los problemas y los beneficios
sona un catálogo de lo que le gusta y lo que desearía ser nos permite producir de usar procedimiento de registro se analizarán en el capítulo 12. Es posible
una calificación que indicaría la probabilidad de que se interesara en cual- observar la conducta como ocurre, por ejemplo, la conducta en un salón de
: ,
quiera de varias ocupaciones o actividades. clases de una escuela primaria o la conducta en un área de juego de un kín-
!. Algunas decisiones en relación con las personas requieren información der; pero la conducta natural es el conjunto complejo que reúne muchos
acerca de lo que cada quien hace típicamente. En interacción con otros, aspectos, por lo cual será necesario definir cuidadosamente lo que se va a
¡María toma la iniciativa y lucha para obtener el papel de líder?, o se conforma observar, a fin de utilizar procedimientos adecuados para registrar las carac-
con permanecer sentada y espera que alguien lo asuma. Bajo la presión de un terísticas deseadas y entrenar observadores para que apliquen las definicio-
examen o de algún evento importante ¿"se mantiene tranquilo" José o se nes y usen dichos procedimientos. Los problemas y procedimientos para
"pone nervioso"? Las evaluaciones del estilo de vida, del temperamento o de la evaluar aspectbs de una persona por medio de la observación directa tam-
personalidad, constituyen algunos de los instrumentos psicométricos más bién se analizan detalladamente en el capítulo 12.
variados, más interesantes y también más engañosos. De las varias ventajas que existen en basar las apreciaciones en la conduc-
Finalmente, algunas decisiones, sobre todo aquellas que se relacionan con ta que ocurre de manera natural, la primordial reside en que la conducta es
el entendimiento de la conducta humana, requieren medidas de estados inna- espontánea, y no artificial; es la manera como los individuos se comportan
tos y de rasgos de los individuos. Éstos son los constructos, es decir, los atri- cuando son ellos mismos y está libre de fachadas o distorsiones intenciona-
butos de los individuos que construimos expresamente para ayudamos a das. De esta manera, el individuo que es observado no muestra lo que quisiera
explicar o teorizar acerca de su conducta. Expresiones como angustia, intro- ser, sino a la persona que realmente es. No obstante también existen muchas
versión, dependencia de campo, autoritarismos y muchas otras, se refieren a desventajas. La observación es demandante y requiere mucho tiempo. La
aspectos de sentimientos, los cuales son útiles para algunos psicólogos a fin de memoria de la conducta pasada está sujeta a toda clase de distorsiones; la clase
comprender mejor la organización y la dinámica de la conducta. de conducta en la que podríamos estar interesados quizá no ocurra de manera
En los capítulos siguientes estudiaremos las medidas de habilidades {tanto espontánea de tal modo que podamos observarla o, por lo menos, tan a menu-
de aprovechamiento como de aptitud!, de intereses, de temperamento y de do que pudiera darnos una fuente de observación adecuada. Por estas razones,
constructo s que pueden ayudarnos a entender la conducta de las personas. Sin en,..múltiples ocasiones es más eficaz apoyamos en situaciones especialmente
embargo, primero consideraremos de dónde proviene la información acerca estructuradas y diseñadas para provocar aquella en la ·~ue estamos interesa-
de las personas, a qué se le llama un buen proc~dimiento de medición y cuáles dos, de tal forma que podamos observarla convenientemente.
son algunos de los puntos claves en la medición psicológica y educativa. . La prueba de aprovechamiento o de aptitud de papel y lápiz es un tipo de
situación específicamente estructurada de mediciones psicológicas y educati-
: .¡ . vas. En el capítulo 7 se analizarán la preparación de estas pruebas y en los ca-
SITUACIONES EN LAS QUE SE OBTIENE pítulos 8, 9 y 10, su aplicación. También podemos usar el formato del papel y
INFORMACIÓN ACERCA DE UNA PERSONA el lápiz para obtener una descripción de los sentimientos y las reacciones per-
¡De dónde proviene la evidencia por medio de la cual podemos evaluar las sonales de un individuo. Los inventarios de autorreporte son especialmente
características de una persona? Las fuentes.se dividen en dos tipos principales: importantes para evaluar intereses, actitudes, valores y características del
,, .

.... . .-.- .
. .
.. . .;
; ••, >.'.•. • . .... , 1°
16 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS PASOS ESENCIALES EN LA MEDICiÓN 17

temperamento y ajuste emocionaL Los instrumentos de este tipo se estu- longitud fue establecido hace mucho tiempo en la historia de la humanidad. A
diarán en el capítulo 11. pesar de que el dominio de los conceptos largo y corto pueden representar
Las situaciones de "prueba" artificiales no están limitadas a las que se pre- logros significativos en la vida de un niño en edad preescolar, los conceptos
sentan en un folleto de pruebas en un salón de clases o en un lugar semejante. son automáticos y axiomáticos en la vida adulta, pues todos sabemos lo que
La prueba puede requerir que los individuos demuestren poseer alguna habili- significa el concepto de longitud. Sin embargo, esto no siempre ocurre para
dad, por ejemplo, mediante una prueba de mecanografía; también se les puede todos los atributos físicos, porque ¿qué entendemos por durabilidad de una
poner en alguna situación interpei-sonal con una determinada tarea que se llanta de automóvil?, ¡resistencia al desgaste y abrasión por contacto con la
realice en grupo; o bien se les puede proporcionar herramientas y un televisor carretera; resistencia al deterioro y al desgaste con el paso del tiempo; resisten-
descompuesto y pedirles que localicen y corrijan la falla. Estas medidas de eje- cia a las ponchaduras con objetos puntiagudos, o una combinación de estos
cución son bastante menos convenientes que las tareas que pueden presentar- tres elementos y posiblemente algunos otros más? Hasta que no lleguemos a
se en un folleto, pero tienen una función relevante para evaluar las habilida- un acuerdo acerda de lo que significa durabilidad, no podremos hacer ningún
des de ejecución que son importantes tanto en los aspectos educativos como progreso respecto a su medición. En la misma proporción en que estamos en
en la vida misma. Algunos problemas peculiares de este tipo de pruebas se des- desacuerdo con lo que significa durabilidad, también estaremos en desacuer-
criben en el capítulo 13. do con los procedimientos para medirla, y si usamos diferentes procedirnien-
tos, estaremos en desacuerdo acerca del valor que obtenemos al presentar la
durabilidad de una marca particular de llanta.
PASOS ESENCIALES EN LA MEDICIÓN El problema de establecer acuerdos en lo que respecta a un concepto dado
es aún más complejo cuando consideramos atributos con los que trata el
En este libro nos referimos a la medición de habilidades humanas, de il).- psicólogo y el educador. Por ejemplo, ¡qué se define como inteligencia?, ¿qué
tereses y de rasgos de personalidad. Sin embargo, necesitamos aclarar lo que clase de conducta se considerará como inteligente?, ise definiría el concepto
implica la medición de qué requisitos debemos satisfacer para hablar de medi- principalmente en términos de ideas y conceptos abstractos que maneja el
ción de una manera válida. Es más, necesitamos preguntarnos qué tan bien individuo o tendríamos que inch,lÍ[ la forma en que maneja eventos concre-
satisfacen estos requerimientos las técnicas para medir los aspectos de las per- toS!, ¡se referiría principalmente a la conducta en situaciones novedosas o
sonas en los que estamos interesados. incluiría respuestas en ambientes familiares y habituales?, ¡no se refería la a
En cualquier campo la medición siempre implic·a tres etapas: rapidez y a la fluidez de sus respuestas, o al nivel de complejidad sin consi-
derar el tiempo? Casi todos tenemos una idea general acerca de lo que quere-
a) Identificación y definición de la cualidad o el atributo que se va a mos decir cuando caracterizamos una conducta como inteligente, pero
medir. existen muchos puntos específicos en lo que podríamos estar en desacuerdo
b) Determinación del conjunto de operaciones por medio de las cuales se cuando tratamos de elaborar una definición precisa. Esto pasa a menudo con
puede manifestar y percibir ese atributo. casi todos los conceptos psicológicos, aunque en distintos grados, y el primer
e) Establecimiento de un conjunto de procedimientos o definiciones para problema que afronta el psicólogo o el educador conforme trata de medir los
convertir las observaciones en enunciados cuantitativos de grado y atributos en los que está interesado es lograr una definición precisa, clara y
cantidad. aceptada universalmente del atributo que se propone medir.
Sin embargo, anterior a esto debemos decidir qué atributos son los rele-
Comprender cada una de estas etapas y las dificultades que presentan per- vantes e importantes de medir si nuestra descripción va a tener alguna utilidad
mitirá contar con bases sólidas para entender los procedimientos y problemas para nuestras necesidades actuales. Una descripción puede no ser útil para el
de la medición en la psicología y la educación. problema que afrontamos si seleccionamos características irrelevantes para
su descripción. ASÍ, para describir un cuadro que deseamos enviar a otra ciu-
dad debemos especificar su longitud, su anchura y su peso, y puede ser que lo
Identificación y definición de un atributo hagamos con gran precisión. Por otra parte, si nuestro propósito es caracteri-
zar el cuadro ~omo una obra de arte, la descripción anterior no tendría ningún
Nunca medimos una cosa o una persona. Las mediciones que hacemos yalor; los atnbutos del cuadro que acabamos de describir serán totalmente
siempre son de las cualidades o los atributos de las cosas o personas; por ejem- Irrelevantes en su calidad como obra de arte.
plo, medimos la longitud de una mesa, la temperatura de un horno, la dura- De manera similar, la descripción de una persona puede ser de muy poco
bilidad de una llanta de automóvil, el sabor de un cigarrillo, la inteligencia valor para .n~estro propósito si seleccionamos las características equivocadas
de un niño, la madurez emocional de un adolescente. Cuando tratamos con para descnbula. Por ejemplo, una compañía que selecciona empleados para
los atributos físicos más simples, como la longitud, rara vez nos preguntamos que ocupen el puesto de choferes de camión, puede poner a prueba las habili-
acerca del significado o de la definición de ese atributo. El significado de la dades de comprensión verbal y las de resolución de problemas cuantitativos
18 CAP. 1. APROXIMACIÓN Al USO DE lAS PRUEBAS PASOS ESENCIALES EN LA MEDICIÓN 19

de los solicitantes, y obtener medidas muy precisas de estas funciones· sin darizada. Si dicha definición se refiere a la resistencia a las ponchaduras con
e~bargo, es probable que esta información sea de muy poca ayuda para iden- objetos puntiagudos, n~cesitamos.aplicar fuerzas ~aduales de puntas. Si la
tifICar a las person~s que tendrían pocos accidentes en carretera y que fueran definición implica detenoro a partIr del sol, del aceIte y de otros agentes des-
esta~l~s en su trabaJo: Otros factores, como la coordinación ojo-mano, la per- tructivos nuestro procedimiento deberá exponer a los especímenes a esos
cepCIOn de profundIdades y no poseer impulsos agresivos incontrolados agentes"; proporcionar al~n. ípd~ce de la p~rdida de fuerza y de resistencia...
podrían ser mucho más relevantes en las tareas y presiones que tiene qu~ resultantes. Si nuestra defInICIOn mcluye mas de un aspecto, entonces debe-
afrontar un chofer de camión. . mos incorporar a cada uno de ellos, con sus valores apropiados, en nuestra
C:0nsidérese el caso siguiente: un maestro de música de secundaria que evaluación. .
examma con mucho detalle el conocimiento de sus alumnos acerca de datos La definición de un atributo interactúa con las operaciones que lo pro-
tales como quién esSribió el Concierto Emperador y si un andante es más rápi- vocan. Por un lado, la definición que hemos fijado determina lo ~ue acepta-
do que un allegro. Sm presentarles a sus alumnos nunca una nota musical ni remos como operaciones relevantes y razonables. De manera mversa, las
músi~ real, ni u~ .solo te~a O una melodía o una sola interpretación d~ su operaciones que seamos capac~s de diseña~ p~ra provo~a~ ~ ,mostrar ~l atri-
aprecIo P?r la musIc.a en VIVO! ,el maestro de música obtuvo una apreciación buto constituyen, en un sentido muy practIco, la defmIcIon del. atnbuto.
~uy c~nh~ble de la mformacIOn del gusto musical, obviamente la prueba no Habíamos entonces de una definición operacional, la cual implIca que la
tIene mngun valor, porque el maestro utilizó trozos de conocimiento factual serie de procedimientos que estamos ~ispuestos a ~ceptar, para de~o.s~r.ar
acerca de la música y los compositores, en vez de cualquier indicación de pro- la durabilidad de una llanta de automovIl, se conVIerten en una defmIcIon
greso en la apreciación del campo musical mismo. eficaz de la durabilidad. . - .
Durante este siglo la historia de la medición psicológica y educa~IV~ ha
sido en gran parte la historia de la invención de instrumentos y procedImIen-
Identificación de operaciones para toS para mostrar de manera estandarizada y en condiciones uniformes las
medir un atributo conductas que sirvan como fndicadores de los atributos relevantes de l~s per-
sonas. Así la serie de tareas diseñadas por Binet y sus sucesores constItuyen
El segundo aspecto de la medición es encontrar o crear una serie de opera- operacion~s para medir conductas que son indi~adoras de la inteligen.ci~ ..Tan-
ciones que aíslen el atributo en el que se está interesado y que así se nos mues- to la prueba de Stanford-Binet como otras mas han propuesto defIn~cIOnes
tre con claridad. El sistema para medir la longitud de un objeto (por ejemplo, operacionales de la inteligencia. El que no haya una sola prueba umversal-
mente aceptada y las diferentes pruebas varíen de alguna mane~a en ~as tareas
una mesal_se postuló .~n las primeras etapas de la historia de la humanidad, y
se lo ensenamos al mno muy temprano dentro de su educación escolar. La que incluyen y en el rango en que colocan a ~as p~rs0Il:as, es eV1dencIa de que
no existe un consenso acerca de lo que es la mtehgencIa, por un lado, o de lo
regla, el metro y las medidas están uniformemente aceptadas como los instru-
que serían los procedimientos apropiados para provocarla, p<;,~ el ~tro',E~ta
mentos apropiados, y sólo ponerlos a lo largo del objeto es un procedimiento
falta de consenso es característica del estado actual de la medIclon pSlcologlca
apropia.do para mostrar la lo~gitud de la mesa, del escritorio o de cualquier
y educativa. Debido a que existe mucha ambigüedad en nuestras ?efinicio-
otro obJe~o que .estem<;>s estudIando. P~ro las operaciones para medir la longi-
nes y se han diseñado una gran variedad de instru~entos pa~a medIr las con-
tud o la dIstancIa no SIempre son tan sImples. ¿Por medio de qué operaciones
ductas pertinentes, distintos instrumentos que miden un mIsmo rasgo colo-
podeI?os medir la distancia entre Nueva York y Chicago?, ¿de la Luna al So!?,
can a las personas en un orden bastante distinto. Por.ejemplo, consideremos
¿del sIsteI?a solar ~ la nebulosa espiral gigante de Andrómeda?; ¿cómo pode- el rubro de "buena conducta" que aparece como un rasgo que debe calificarse
mos medu la longItud del bacilo tuberculoso o el diámetro de una neurona?
en un gran número de boletas de reporte escolares. i Qué significa tener buena
La ciencia física ha progresado más allá de un enfoque directo y simple de
conducta para los niños de edad escolar?, ¿qué tanto podríamos ponemos de
poner una vara de medir a lo largo de un objeto, al desarrollar tantos instru-
acuerdo para definirla? Inclusive, después de haber hecho un buen esf?erzo
m~ntos ~ue ~an ampliado las capacidades de nuestros sentidos como procedi-
para definirla, ¿qué operaciones debemos diseñar para evaluar la presencia o la
mIentos IndIrectos que nos hacen accesibles las cantidades demasiado grandes
.o pequeñas. Las operaciones para medir la longitud O la distancia se han vuel- ausencia de ella?
to indirectas, elaboradas y muy precisas, y han sido aceptadas porque dan
resultados consistentes, verificables y muy útiles.
Si reconsideramos el ejemplo de durabilidad de la llanta de un automóvil Cuantificación del atributo en unidades
podremos ver que las operaciones para evaluar este atributo dependerán de l~
"

:'¡
de grado o de cantidad
definición que hemos aceptado para ella. Si nuestra definición es en térmi-
no~ de resistencia a la abrasión, necesitamos desarrollar algún procedimiento Después de haber aceptado una serie de operaciones para mostrar un atri-
um.forme y estándar para aplic~r una fuerza abrasiva a un e~pécirnen y medir buto, la tercera etapa consiste en expresar el resultado de esas operaciones en
el ntmo al que la llanta se detenora: una prueba de carretera simulada yestan-

. 0
.... '- .- ' . ", o "
..... - ,. ;-.
. 0 '., ', '
20 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS CUALIDADES DESEADAS 21
términos cuantitativos. Al respecto, cabe preguntarnos: ¿cuánto o cuántos? mas tener un rango de interpretación. ¡En qué medida nuestra definición
En el caso de la longitud de una mesa, la pregunta se convierte en: ¿cuántos debería incluir las siguientes características?
centímetros? Un centímetro representa una unidad básica, y podemos demos-
trar que un centímet~o es igual a otro si se ponen uno alIado del otro y se com- a) Velocidad de lectura.
prueba su igualdad. Esta es la prueba más directa y clara de la prueba de igual- b) Habilidad para convertir los símbolos visuales en sonidos.
dad para algunas de las mediciones físicas más simples. Para otros ins· e) Obtención de significados literales de un texto.
trumentos de medición, como el termómetro, la igualdad de las unidades d) Obtención de inferencias con base en lo que se afirma en el texto direc-
depende de una definición. Así, definimos que a incrementos iguales de tem- tamente.
peratura les corresponden cantidades iguales de expansión de un volumen de e) Tener conciencia del sesgo del autor o de su punto de vista.
mercurio. Una amplia experiencia con esta definición ha mostrado su utili-
dad, ya que proporciona resultados que se relacionan de manera ordenada y A medida que tratamos con conceptos más complejos.e intangibles, como
significativa con muchas otras medidas físicas. cooperación, ansiedad, ajuste emocional o rigidez, podremos esperar mayor
Ninguno de nuestros atributos psicológicos tiene unidades cuya igual- diversidad en las definiciones.
dad pueda demostrarse mediante una comparación directa, de la manera Segundo, encontramos problemas para diseñar lo.s pr?cedimientos qu.e
como pueden compararse el centímetro o el kilo. ¿Cómo podemos demostrar midan los atributos relevantes. En algunos atnbutos pSlcologlCOS hemos tem-
que el problema aritmético X es iguaC en cantidad de la habilídad aritméti- do bastante éxito al descubrir las operaciones que se requieran para que un
ca que representa, al problema aritmético?, y ¿cómo podemos demostrar que individuo muestre el atributo y nos permita observarlo bajo condiciones uni-
un síntoma de angustia es igual a otro indicador de angustia? Por lo tanto, en formes v estandarizadas. Esto es especialmente cierto en el área de las ha-
las cualidades que conciernen al psicólogo y al educador, siempre es necesario bilidade~ donde se han desarrollado pruebas estandarizadas en las que se pide
tener alguna definición que .nos proporcione una forma de cuantificación. al sujeto que tenga comprensión de la lectura, perciba relaciones de cantidad o
Con frecuencia consideramos a una serie de tareas como semejantes -definir indentifique las formas correctas de expresión idiomática.
palabras, resolver problemas aritméticos o hacer analogías- y contamos las También existen muchos atributos en los que claramente no hemos teni-
respuestas correctas de un individuo en la serie. Para un prueba referida al cri- do tanto éxito. iPor medio de qué operaciones estandarizadas seríamos capa-
terio acerca de una habilidad específica, podemos establecer el porcentaje de ces de mostrar, de forma en que podamos evaluarlas, la iniciativa potencial de
éxito ¡por ejemplo, 80 o 90) como nuestro criterio de 'ejecución y determinar un empleado, la angustia de un niño escolar o la adaptabilidad de un soldado
si el individuo alcanza o no el estándar. Para una prueba referida a la norma, para el combate? Con una investigación continua y más ingenio podríamos
las puntuaciones crudas de las tareas ejecutadas correctamente se convierten diseñar mejores tareas por medio de las cuales se logren manifestar algunas de
en un enunciado referente a la edad o al grupo o grado al que la persona perte- estas cualidades. Pero se supone que aún hay muchas más cualidades psicoló-
nece, o acerca de cómo se coloca dentro de ese grupo, por medio de los pro- gicas para las que la identificación adecuada de las operaciones de medición
cedimientos que se estudiarán con más amplitud en el capítulo 4. permanecerán como un problema.
La suma de tareas realizadas correctamente o de determinadas opciones Finalmente, aun las mejores unidades de medición psicológica tienen
de un cuestionario proporciona una definición posible y manejable de can e inconvenientes. Por definición, las unidades son iguales. Una definición
tidad, pero no tenemos evidencias adecuadas reales de la equivalencia de las puede tener cierto grado de certeza, pero la igualdad de unidades no puede
diferentes tareas o de las distintas respuestas al cuestionario. ¡Con base en qué establecerse directamente de la definición. Por lo tanto, la adición, la sustrac-
afirmamos que un reactivo de serie de números, como" 1 3 6 10 15 .. :", mide ción y la comparación de puntuaciones siempre serán, de alguna manera,
la misma cantidad de habilidad intelectual que, por ejemplo, un reactivo ana- dudosas. Más aún, la precisión con que se ev,11úa el atributo, la confiabilidad
logía verbal, como "el calor es al frío como lo húmedo es a lo .. ."? de una ocasión a otra o de una apreciación a otra, suele ser desalentadora-
Entonces, la definición de tareas equivalentes y, en consecuencia, de uni- mente baja.
dades para pruebas psicológicas es bastante débiL Por ejemplo, cuando revi-
samos la calificación de un maestro acerca de la cooperación de un niño o la
evaluación de un supervisor de la iniciativa de un empleado, en la que se utili-
zan categorías tales como "superior", "muy buena", "buena", "satisfactoria" e CUALIDADES DESEADAS EN EL
"insatisfactoria", el significado de las unidades en las que se expresan estas PROCEDIMIENTO DE MEDICIÓN
calificaciones es aún más endeble.
En la medición psicológica y educativa encontramos problemas en rela- De las tres etapas que acabamos de considerar para el desarrollo de un
ción con las tres etapas que acabamos de describir. Primero, tenemos pro- procedimiento de medición se deducen las principales cualidades de éste para
blemas para seleccionar y definir claramente los atributos a los que debemos ayudar a que la gente tome mejores decisiones: proporcionar información
avocamos. Aun para algo tan evidente como "habilidad para la lectura" pode- relacionada con la decisión que se tome y proveer una información precisa.
22 CAP. 1. APROXIMACiÓN AL USO DE LAS PRUEBAS TEMAS ACERCA DE LA MEDICiÓN 23
Para algunos tipos de decisión, no es posible detenninar directamente su nicas de medición de manera sistemática, éstas han tenido demasiadas criti-
relevancia, sino a través del análisis de la tarea que se asigna al examinado o cas muchas de las cuales han estado justificadas como respuesta a algunos
la clase de respuesta que produce. Así, si deseamos contratar a una mecanó- ent~siasmos ingenuos de los teóricos de la medición, a otras aplicaciones con-
grafa y sabemos que la principal parte de su trabajo consistirá en transcribir a cebidas erróneamente ya las interpretaciones de los resultados de la medi-
máquina de manera limpia y precisa un borrador defectuoso, esta tarea nos ción. Al analizar la interpretación de una prueba y su uso en los capítulos ulte-
proporcionará la infonnación necesaria para tomar la decisión de emplearla o riores, tendremos en cuenta las criticas previas y los problemas más técnicos
no. A fin de decidir si un grupo necesita instrucción para aprender a poner el concernientes a la confiabilidad y validez de los resultados de la prueba.
punto decimal en las multiplicaciones, aplicar un conjunto de problemas, A continuación identificaremos y comentaremos brevemente algunos temas
como 11.33 X 4.5 = 50985, en el que se pide al examinado que coloque el que han sido de una preocupaCión especial en el pasado reciente.
punto decimal en el lugar apropiado, es el mejor procedimiento para tomar
una decisión.
En otros casos, la evaluación de la relevancia es bastante más compleja. Aplicación de pruebas a gmpos minoritarios
¿Sería relevante basarse en la ejecución de lectura de Elena para tomar la deci-
sión de aceptarla o no en la Escuela de Derecho deSiwash?, ¿un inventario que Un tema que ha recibido mucha atención recientemente es el uso y la
evalúa la ascendencia social será relevante para decidir si Jaime debería buscar interpretación de las pruebas con los grupos minoritarios y con otras personas
trabajo como vendedor de seguros de vida?, ¿una prueba de habilidad para en- cuya experiencia y cultura diferían de lo que es típico de la población de Esta-
contrar las figuras ocultas de un complejo "camuflado" será adecuada para dos Unidos en general. Por supuesto, hay toda clase de subgrupos en la socie-
identificar a los individuos con "dependencia de campo" en un grupo, a fin de dad estadounidense, que difieren unos de otros de muchas maneras; empero,
estudiar la relación que existe entre la H dependencia de-campoR y la sociabili- las minorías étnicas y lingüísticas son probablemente los ejemplos más claros
dad? N o es fácil encontrar la respuesta a esta interrogante, pero la que se dé es de esto, y son aquellos para los que se discute lo apropiado de las pruebas y
central en la evaluación de la utilidad de los procedimientos de medición que los cuestionarios diseñados para la clase media blanca típica.
se ofrecen dentro del campo de la psicología y la educación. Los problemas Surgieron algunas inquietudes en relación con las pruebas de aprovecha-
para valorar la relevancia o pertinencia de la prueba y. la medición que den miento mediante las cuales se realizaba la evaluación de lo que ha aprendido a
como resultado decisiones educativas y psicológicas se considerarán con más bacer un estudiante. En parte, las discusiones se centraron en el grado en que
detalle en el capítulo 3, bajo el encabezado de "Validez de la prueba". se mantenían .los mismos objetivos educativos para los grupos de las minorías
La evidencia es que el procedimiento de medición debe ser no sólo perti- culturales. ¿Es importante para los niños negros, hispánicos o indios com-
nente sino también exacto y representativo. Si un candidato para el empleo prender al leer el inglés estándar?, ¿es tan relevante para estos grupos como lo
como mecanógrafo escribe 70 palabras por minuto en una prueba de mecano- es para los niños de la clase media blanca que están en el octavo grado, el cono-
grafía, el personal de la oficina quiere tener cierta seguridad de que esta cifra es cimiento de la Constitución de los Estados Unidos? De alguna manera, en lo
ciertamente representativa del ritmo de trabajo del solicitante y que no ten- a
que respecta las habilidades básicas de lenguaje y de los números, muchos de
dría en una segunda prueba una velocidad de 40 a 100 palabras por minuto. Si los mismos objetivos se aplicarían, pero a medida que analizamos el conte-
Viviana obtuvo nueve reactivos correctos de lOen una serie de problemas de nido de las áreas de historia, literatura y otras, debe haber más divergencia.
punto decimal en un lunes, y el maestro decide que ella domina esta habili- Parcialmente, las preguntas se enfocan hacia los materiales específicos
dad, queremos tener la suficiente seguridad de que Viviana obtendrá más de por medio de los cuales se exhiben las habilidades básicas. ¿El mismo capítu-
cinco o seis respuestas correctas si se le aplica una prueba semejante el viernes. lo de un libro acerca de la vida de los esquimales sería apropiado como una
Por supuesto, no hay una sola medida que sea completamente precisa -aun prueba de lectura para un chico de un ghetto o de una reservación india?, o
cuando se mida algo tan simple como la longitud o el peso-, pero es necesario ¿deberían elaborarse materiales específicos para la vida y las experiencias de
saber qué tanta variación podremos esperar en nuestros procedimientos de cada uno de estos grupos~ Debido a que todavía sabemos muy poco acerca del
medición y, en consecuencia, cuánta confianza podemos tener en las califi- efecto de los factores de contenido específico en la ejecución en áreas como
! . caciones que obtengamos. Estos problemas también se estudiarán más de- la comprensión de la lectura, debemos investigar más para determinar su im-
talladamente en el capítulo 3, bajo el encabezado de "Confiabilidad". portancia.
Por otra parte, estos temas se refieren a la motivación de los grupos mi-
noritarios para tratar de responder correctamente las pruebas en el medio
ALGUNOS TEMAS ACTUALES ACERCA DE escolar. ¿Acaso no han desalentado las experiencias desafortunadas con las
LA MEDICIÓN pruebas escolares a los miembros de los grupos minoritarios, de tal manera
que se apartan de la tareé! y ni siquiera la intentan? Tal vez éste sea un desafío
Las evaluaciones educativas y psicológicas están muy lejos de llegar a la para todo el sistema escolar, así como para la selección de los instrumentos de
perfección. Desde que se hicieron los primeros intentos para desarrollar téc- prueba, a fin de equilibrar razonablemente experiencias exitosas y satisfac-

.:..... : '.
'. > \ ~ . .. ,. " . '. ~ .'.' , .'.' . , .
24 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS TEMAS ACERCA DE LA MEDICIÓN 2S

torias en la escuela con todo tipo de tareas escolares. Las tareas y las pruebas vacidad no es importante. Sin embargo, cuando la información se obtiene
deben adaptarse a las capacidades actuales y a los intereses del estudiante in- para ciertos objetivos institu:i~nal~\ es decir, para el usó de ~?a institución
dividual. educativa o para el uso de la CIenCIa, entonces la preocupaClOn por el dere-
Cada vez surgen muchas preguntas más serias conforme se emplean las cho a la privacidad del individuo sí es importante y se deben equilibrar los
pruebas como base para tomar decisiones acerca de lo que un individuo puede valores personales y sociales de éste. Por ejemplo, un mayor número de estu-
aprender a hacer, es decir, de las medidas de aptitudes. La inferencia de que diantes que de empleados de ba~co (7 S c?~tra 34) a~eptaron cont~star un
una persona puede "aprender a hacer" con base en la puntuación obtenida cuestionario diseñado para medu la establhdad emOCIOnal de un pIloto de
en una prueba en el tiempo 1 es más "dudosa" que la inferencia que afirma avión. Los derechos del individuo no son absolutos, pero con frecuencia se
solamente lo que él puede hacer hoy. Existen muchos eventos que pueden afirma que tales derechos no han sido reconocidos totalmente.
hacer que la predicción se invalide y, consecuentemente, hay más posibilida-
des de que factores prejuiciados o sesgados distorsionen de manera sistemáti-
ca la predicción para los miembros de los grupos minoritarios. La informa- Uso de comparaciones normativas
ción actual que implica una predicción para la mayoría puede involucrar una
predicción muy diferente para miembros de grupos minoritarios cuyas expe- Otro aspecto diferente ha surgido en relación con el énfasis en la interpre-
riencias anteriores a la aplicación de la prueba diferían mucho de las típicas. tación de la prueba o en la comparación de la ejecución de un estudiante con
Nuestro problema consiste en determinar qué tipos de inferencias pode- la norma representada por la ejecución típica de una muestra de estudiantes
mos hacer apropiadamente para los individuos con antecedentes diferentes a en el nivel grupal e incluso nacional. Este tema ha sido demasiado polémico
los de la mayoría, y qué clases de ajustes o modificaciones debemos hacer que hasta afirmar que las decisiones para las que se usan estas pruebas, especial-
produzcan las inferencias y decisiones más precisas y equitativas para estas mente las decisiones instruccionales, no son necesarias ya veces sólo produ-
j'
personas. cen confusión cuando se realizan comparaciones con otras personas. La infor-
mación esencial se limita a verificar si el estudiante puede realizar una tarea
específica; ésta es la información que debe guiar las decisiones acerca de qué es
Invasión de la privacidad lo que debe enseñársele o qué tareas debería realizar.
Por supuesto, existen ciertas situaciones en las que la comparación con
Una segunda preocupación que con frecuencia se ha expresado recien- otras personas es esencial para tener un juicio sólido a fin de tomar una deci·
temente se relaciona con la invasión de la privacidad. ¡Qué clase de infor- sión. ¡El último solicitante es un buen mecanógrafo?, ¡de qué otra manera
mación es razonable que se pida a un individuo acerca de sí mismo y en qué definiríamos el concepto "buen mecanógrafo" si no en términos de la ejecu-
circunstancias? Este problema se plantea en relación no sólo con las pruebas, ción de los otros solicitantes al mismo trabajo? Un ritmo de 40 palabras por
sino también con todo tipo de información acerca de una persona. ¡Qué minuto con dos errores no tendría ninguna significación, a menos que
tipos de registros deben conservarse y para quién deben estar disporiibles? En supiéramos que el egresado promedio de una escuela comercial puede escri-
un extremo de la escala existen pruebas para medir el conocimiento y las bir 50 palabras por minuto, aproximadamente, con tal vez un error en ese
habilidades para el trabajo, como las pruebas de mecanografía, a las que tiempo. La empresa necesita un empleado que logre los estándares de una
nadie debería poner objeciones si la habilidad es clara y está directamente ejecución típica, y estos estándares sólo pueden fijarse en comparación con
relacionada con la posición para la que la persona hace una solicitud. En el la ejecución de los demás. De la misma manera, un sistema escolar que trata
otro extremo de la escala están algunos de los instrumentos de imtodescrip- de evaluar el aprovechamiento en lectura de los niños del sexto grado de pri-
ción que conducen al uso de inferencias acerca de la estabilidad emocional o maria como "bueno", "satisfactorio" y "necesita mejorar", debe tener un
a una diversidad de pruebas con las que se trata de evaluar la honestidad; por promedio con base en el cual comparar el desempeño en su propia escuela.
ejemplo, poner al individuo en circunstancias de tentación de mentir o de No existe un estándar absoluto en cuanto al desempeño en la lectura, por lo
robar, a fin de obligarlo a dar una información acerca de sí mismo sin tener tanto, sólo podemos determinar si es o no razonable que estos estudiantes
conciencia de los datos que aporta o de cómo se empleará esa información. comprendan un determinado artículo de Selecciones con base en el prome-
Entre estos extremos están varios instrumentos que incluyen diversos gra- dio de comprensión de lectura de los alumnos del mismo grado en el nivel
dos de información personal. nacional; es decir, si éstos son capaces de comprender dicho artículo.
En este punto se cuestiona no sólo la información obtenida, sino también En ocasiones las comparaciones con la norma de un grupo de referencia
el propósito para el que se obtiene. ¡Se ha obtenido esta información para externo empleadas con el fin de guiar las decisiones, han tenido muy poca o
brindarle al individuo alguna ayuda con sus problemas personales o vocacio- ninguna relevancia. En la actualidad, existe una reacción en contra del uso
nales o por razones terapéuticas? El que la persona solicite ayuda implica que equivocado de estos datos normativos y se ha dado una gran importancia a
tiene la voluntad de dar la información que se necesita para poder recibir ayu- las pruebas referidas al contenido, las relativas al criterio y las de dominio
da, y que está dispuesta a ser inspeccionada; en este caso la invasión de su pri· de una habilidad. Estas pruebas son muy importantes para algunas cla-
PREGUNTAS Y EJERCICIOS 27
26 CAP. 1. APROXIMACIÓN Al USO DE LAS PRUEBAS

ses de decisiones, peru no para todas. Es necesario saber qué tipos


de com- S. Los hechos y los valores implica dos en cualquier decisión son com- de
paracio nes son útiles para cada situació n. ¿Cuánd o debemo s pregun tarnos si plejos. Un procedi miento de medició n puede proporc ionar sólo algunos
una tarea informa ción debe ser comple men-
un estudia nte puede desemp eñarse satisfac toriame nte al realizar los hechos. Para la toma de decisiones, esta
específica, y cuándo debemo s pregun tarnos qué lugar ocupa en relació
n con tada con hechos posterio res y el análisis de los valores implica dos.
sus compañ eros~ . 6. El conoci miento profundo de quien decide es primordial. En reali-
valio-
dad, aunque los instrum entos de medici ón proporc ionan informa ción
debe
sa, el conocim iento profun do del usuario juega e! pape! clave. El usuario
ción que aportan las pruebas y cualqui er otra
organizar y analiza r la informa
UN PUNT O DE VISTA ACTU AL fuente para establecer e! marco de referen cia de los valores, en el cual
pueda
realizarse la decisión final.
seis
Para conclui r este capítul o, a continu ación present amos brevem ente que
premisa s que represe ntan las bases para un punto contem poráneo acerca
de la El objeto de este libro es aument ar la eficiencia de los que tienen
lo cual se proporc ionan mejores bases para elevar los
medició n psicológica y educati va y el papel que desemp eña en las escuela
sy tomar decisiones, para
significa
socieda d. Estas premisa s están estrech amente relacion adas con el propó- diferentes procedi mientos de medició n, así como para saber lo que
en la describi-
sito de este libro. . cada uno y qué tanta confian za puede tenerse en ellos. Para este fin,
criterio s
remos los procesos de elabora ción de reactivos¡ desarro llaremo s los to-
generales de validez y con fiabilida d por medio de los cuales se evalúan
l. Es necesario tomar decisiones. Un maestro debe decidir qué haráa r las
medicin dos los tipos de medidas¡ present aremos las distinta s manera s de reporta
durante el periodo de lectura del día siguiente; en una escuela de evaluar e-
tos admitir á, y un joven de 17 años calificaciones obtenid as en las pruebas¡ por último, describ iremos y
se tiene que decidir a cuánto s candida mente
decidir si present ará solicitu d de admisió n a la univers idad y, en mos varias de las técnicas y los instrum entos que se emplea n común
tiene que ísticas humana s. Nuestr o éxito se medirá por medio
Todos éstos son ejemplo s de los tipos para apreciar las caracter
caso de que así sea, en q\lé univers idad. n ati-
que deben tomarse , sobre cierta base, día a día. del grado en que nuestro s lectores emplee n los resultad os de la medició
de decisio nes las decisio nes que se les pida que tomen.
nada y congru enteme nte en
2. Mientras más adecuada y precisa sea la información, mejor será
la decisión. En cierto sentido , esta premisa se basa en la creencia de que cuan-
la igno-
to más sepamo s de la situació n, la control aremos mejor. Se afirma que PREG UNTA S Y EJERC ICIOS
ón, sino una tontería . Por supuest o, la informa ción
rancia no es una bendici es que usted
no puede ser equival ente de la sabidur ía. Saber más o con mayor
precisión 1. Enumere algunos ejemplos, preferiblemente recientes, de las decision
formó par-
acerca de una situació n no garanti za que una persona actuará sabiame
nte. El ha tomado o de las que otros han tomado por usted en cuyos resultados instruc·
tomar deci- te alguna clase de medición psicológica o educativa¡ clasifíquelos como:
al
conocim iento es una condici ón necesar ia pero no suficien te para es.
cional¡ bl de selección¡ el de colocación o clasificación, o dI personal
siones conven ientes. considere que
2. Describa uno o más ejemplos de decisiones personales en las cuales
3. Los instrum entos y procedimientos de medici ón proporc ionan una medición psicológica o educativa le pudo haber servido, pero no estuvo
dispo-
nes.
recursos que mejoran la inform ación disponible para la toma" de decisiotoma nible. ¡Sobre qué base se realizó la decisión?
ia sobre la que se basa la icas como guías
Se puede demost rar que mucha de la evidenc 3. ¡Cuáles son las alternativas para las medidas educativas o psicológ
le. A pe-
de decisiones tradicio nalmen te es subjetiva, parcial y poco confiab en las decisiones siguiente s?
de la perfecc ión, los instrum entos de medició n psicoló gica y
sar de estar lejos al ¡Cuánto tiempo se debe enseñar fonética en el primer año de un programa de
llados aument an de manera
educati va cuidado sament e planead os y desarro lectura?
para la
significativa la validez y confiab ilidad de la informa ción disponi ble bl ¡Cuáles de cinco de los 15 solicitantes deberían contratarse como empleados de
toma de decisiones. estadística?
4. El usuario de cualquier tipo de información para la toma de deci- el ¡Debería alentarse a Pedro G. en sus deseos de inscribirse en la escuela de Dere-
siones necesita saber 10 que significa la información y hasta dónde puedey cho para ser abogado?
confiar en ella. Cuand o alguien nos dice que la carrete ra entre Oxford to usted en
si esto 4. ¡Cuáles son las ventajas y desventajas de las alternativas que ha propues arios?
Wentw orth es "un poco estrech a y con curvas", necesit amos saber la pregunta anterior, si se compara n con algunos tipos de pruebas y cuestion
de trán-
signific a sólo que no es una carrete ra interest atal o que es un camino 5. Con base e~ las tres decisiones enunciadas en la pregunta número 3,
¡en qué medi-
n necesit amos saber si nuestro inform ante ha viaja-
sito para cabras. Tambié
así es. Asimis mo, en los da. y de ~ue manera estarían implicados los valores en cada caso?
do por esa carrete ra o solame nte ha oído decir que 6. De un ejemplo de cada uno de los siguientes tipos de pruebas:
ión de las persona s, el usuario debe saber qué tipo
proced imiento s de evaluac
de inferen cia se puede hacer de ellos, bajo qué condici ones y con cuánta
con- al Prueba de aprovechamiento referída al criterio.
fianza. bl Prueba de aprovechamiento referida a la norma.

, " •. .. '.' ,' 'c:- " ' ,' •...~.', .. . :.' ."..-•. '.:'.,~.' " • ..'~ '1 \ '" .' ~ ..... _ . ', ." . . .... , ..
"
28 CAP. 1. APROXIMACIÓN AL USO DE LAS PRUEBAS LECTURAS ADICIONALES 29
e) Prueba de aptitud. Linden, J. D. y Linden, K. W., Test on trial, Guidance Monograph Series (Seríes III:
d) Medida de gustos y preferencias. Testing', Houghton Mifflin, Boston, 1968.
e) Medida de un rasgo o de un constructo. Linden, K. W., Linden, J. D. Y Bodine, R. L., "Test bias: Fuss n' facts" en Measure-
ment and Evaluatíon in Guidance, 7, 1974, págs. 163-168. '
7. Para cada uno de los atributos que se nombran 'enseguida indique cómo se debe: l. MiIler, L. P. (dir.', The testing of black students: A symposium Prentice-Hall Engle-
definir el atributo; 2. fijar un procedimiento para hacerlo observable, y 3. cuantifi- wood Cliffs, N. J., 1974. "
carlo. Sarason, S. B., "The unfortunate fate of Alfred Binet and school psychology", en Tea-
chers College Record, 77, 1976, págs. 579-592.
a) Pensamiento científico. "The responsible use of tests: A posii:ion paper of AMEG, APGA, and NCME", en
bl "Buena ciudadanía" en un niño,de cuarto grado de primaria. Measurement and Evaluation in Guidance, 5, 1972, págs. 385-388.
e) Sociabilidad. Thorndike, R. L., "Educational decisions and human assessments" en Teachers
d) Competencia como chofer de automóvil. College Record, 66, 1964, págs. 103-112. '
Tittle, C. K., "Sex bias in educational measurement: Fact or fiction", en Measurement
8. La utilidad de las pruebas para la toma de decisiones que incluye a un grupo de las
minorías, puede depender del tipo de decisión que se tome. ¿Para qué tipos de deci-
siones sería más recomendable una prueba?, y ¿para qué tipos de decisiones sería
más t.:uestionable?
I and Evaluation in Guidanee, 6, 1974, págs. 219-226.
Wolf, T. H., Alfred Binet, University of Chicago Press, Chicago, 1973.

9. ¡Cuáles de los siguientes ejemplos considera usted aceptables y cuáles considera


que atacan la privacidad? ¿Qué factores influyen en su decisión?

al Pedir a los solicitantes de una escuela de medicina que tomaran: l. una prueba
de aprovechamiento de biología; 2. un cuestionario diseñado para evaluar la
estabilidad emocional, o 3. una escala de actitudes hacia la socialización de
la medicina.
b) Pedir a los solicitantes de un trabajo secretarial que tomaran: l. una prueba de
inteligencia en general; 2. una prueba de velocidad y precisión para escribir a
máquina, o 3. un cuestionario diseñado para apreciar la dependencia.
el Dar a un niño de 10 años de edad que tiene dos años de retraso en la lectura: l.
una prueba no verbal de habilidad intelectual; 2. una entrevista acerca de las
condiciones de su hogar, o 3. una serie de pruebas diagnósticas de las habilida-
des específicas para la lectura.

LECTURAS ADICIONALES

Airasian, P. W. y Madaus, G. F., "Functional types of student evaluation", en Measu-


rement and Evaluation in Guidanee, 1972, 4, págs. 221-233.
Barday, R., Controversial Issues in Testing, Cuidance Monograph Series (Series III:
Testing), Houghton Mifflin, Boston, 1968.
Buchwald, A. M., "Values and the use of tests", en loumal of Consulting Psyehology,
29, 1965, págs. 49-54.
Coffman, W . E., "Concepts of achievement and proficiency", en Payne, D. A. Y
McMorris R. F. (dirs.', Educational and psychologieal measurement, General
Learning Press, Morristown, N. J., 1975.
Cronbach; 1. J. Y Gleser, G. c., Psyehological tests and persollnel decisiones, Uni-
versity of Illinois Press, Urbana, Ill., 1965.
DuBois, P. H., A history of psychologieal testing, AlIyn and Bacon, Boston, 1970.
Ebel, R. L., "The social consequences of educational testing", en Proceedings of the
1963 Invitational Conference on Testing Problems, Educational Testing Service,
Princeton, N. J., 1964.
Glaser, R. y Nitko, A. J., "Measurement in learning and instruction/l, en Thorndike, R.
1. (dir.), Edueational Measurement, American Council on Education, Washing-
ton, D. c., 1971.
..~.~
.~,

;~ 31
'!

-'
~~
'i- Toblo 2.1. Hoja de registro poro los alumnos del sexto grado de la escuela X
=4
~~
Puntuaciones de prueba
:~.,
;-,
t'(
~ Nombre lectura Aritmética Ortografía
~i
(1

"
~
~ 1. (orol A. 32 3 27

2 ff
~
~
~
2. Mary B.
3. Ruby C.
4. Alíce D.
27
31
36
27

18
9
26
23
32
~ 5. Theresa E. 47 21 38
~ 6. Ido F. 42 24 38
~ 7. Vivion G. 22 4 13
Técnicas esta díst icas ~
~
8. Groce H. 50
20
42
18
46
12
~ 9. Opol!.
bás icas 10. Ursula J.
11. Bealóee K.
37
25 10
2 36
21
12. Karen L. 37 13 30
13. Susan M. 2B 20 lB
14. Jone N. 34 15 32
15. Dorolhy o. 31 19 28
16. Frances P. 21 2 17
Los maestros Catheri ne Johnson y Peter Corder o querían conoce r más 17. Elizabelh Q. 35 48 30
una
sus respectivos grupos de sexto grado, por lo que decidieron aplicar dic- 18. Pearl R. 59 41 54
un
prueba de lectura, una prueba de revisión de un libro de aritmética y s 19. Joon S. 44 41 39
tado para probar la ortografía, basado en las palabras que ambos maestro 20. Noney T. 32 40 28
enseñad o durante las últimas seis semana s. Éstos califica ron las prue- 56 24 54
habían 21. Judilh U.
cio-
bas, contaro n el número de aciertos en cada una y anotaro n las puntua 22. Edilh V. 38 24 37
s hiciero n una lista que contení a las tres puntua ciones para cada 18 30
nes. Despué d 23. Louise W. 38
alumno , yen ese momen to se dieron cuenta de que tenían una gran cantida 24. Helen X. 29 12 24
de número s y se pregun taron cómo debería n organiz arlos. 25. Mor/ha Y. 24 26 22
si
Las pruebas generan puntua ciones en forma de números; por lo tanto, 26. Doris Z. 36 12 28
puntua ciones de las pruebas , debemo s pensar en cómo 33
deseamos analizar las de 27. James A. 36 29
trabajar con los números. Por medio de los números las puntua cionesbas- 28. Albert B. 21 16 13
prueba pueden organiz arse para dar la respues ta a un rango de pregun tas 27 7 24
29. Donald C.
s saber
tante amplio, sin embargo, anterio r a este proceso, primero debemo 30. Peler D. 37 29 31
r. Una vez que hayamo s establec ido cuáles son 37
qué tipo de preguntas formula 31. Samuel E. 46 36
las pregunt as, empeza remos a cuestio namos de qué manera se pueden organi- 32. George F. 33 10 31
zar los números para obtener las respuestas. los
33. Roger G. 17 14 14
En la tabla 2.1 se presentan los número s (puntuaciones) asignados a 34. Newlon H. 35 18 30
niños de sexto grado de los dos grupos. ¿Qué pregun tas pudiero n haberse 35. Korll. 30 12 25
s?,
hecho a la señorita Johnson y el señor Cordero para esta serie de númeroque · 36. Isidore J. 22 30 17
¿qué preguntas podría hacerse el lector? Antes de continu ar, supong amos 37. John K. 43 9 37
el lector estudia esta serie de puntua ciones y escribe las preguntas en relación 38. Benjamin L. 31 15 29
con tales puntuaciones. Vea el lector cuántas preguntas puede hacer. 39. Tbeodore M. 50 38 48
Al principio, el lector puede plantearse préguntas generales, como ¿cuál 40. Michae/ N. 34 20 27
an?,
es el patrón general de esta serie de puntuaciones?, ¿cómo se organiz a 41. Herman O. 30 15 29
¿cómo podríamos, por ejemplo, analizar la serie de puntua ciones de lectura
tas
fin de tener una idea del grupo en su totalidad? Para contest ar estas pregun

30

... ..
ORGANIZACIÓN DE UNA SERIE DE PUNTUACIONES 33
32
uo que
dos habilidades en el mismo individuo?, ¿es probable que el individ
Tabla 2.1. (Continuación.) es superior en una de estas habilidades también lo sea en la otra? Para
medir
Puntuaciones de prueba en las pregunt as necesita mos familia rizarno s
las características señaladas
con las medida s de correlación. .
-
Nombre Lectura Aritmético Ortografía . Pueden surgir muchas otras preguntas respecto a un conjun to de puntua
cuales las más importa ntes se refieren al estable cimient o de con-
ciones de las
42. Charles P. 52 39 47 clusio~es generales de los datos en un grupo limitado. Por ejemplo, ellosprome- niños
43. Patrick O. 40 33 33 dio de lectura de las niñas de este grupo es de 35.0, mientras que el de tales
44. William R. 42 6 33 es de 34.1. Éste es un hecho descriptivo verdadero para dicha prueba con
17 ar. Pero sería interesa nte saber si podríam os conclui r
17 26 niños y niñas en particul
con seguridad que la poblaci ón total de niñas a la que corresp onde e~ta
45. Mortin S. mues-
32 20 23
46. Frank T. es un
47. Ralph U. 38 20 30 tra sobrepasaría a la poblaci ón total de niños en esta misma prueba. Este
cam-
Thomos V. 29 29 33 problema infere?cial¡ este tipo de problemas forman la mayor p.arte del
48. mo~ent o ~o.los estudIa remos p~es
49. Henry W. 36 25 44 po de la estadístl~a avanzada, per? por el
IO-
50. Oscor X. 43 19 45 hasta ahora no mfluyen en las mterpretacIOnes basIcas de las puntuac
19 35 nes obtenidas por un individ uo o un grupo en la prueba.
51. Edword Y. 27 los
52. leonard l. 39 19 44 Los procedimientos que se han desarrollado con el fin de organizar
anterio res y otras pregunt as constit uyen lo que se
números para contestar las
estadíst ica descrip tiva. Este término (y, de hecho, la sola posibili dad de
llama
recuer-
puntua - trabajar con números) parece asustar a algunas personas, quienes aún
es necesario.cons iderar formas simples para organiz ar y graficar las dan las dificult ades a las que se enfrent aban al resolver una división grande en
te, en la actualid ad muchos de
ciones. el quinto grado de primaria. Afortun adamen
Posteri orment e, surgirá n las siguientes preguntas: ¿cómo ~s este grupo, estos problem as se' solucio nan median te una calculad ora de bolsillo que se
por otro
en promedio? . qué tan similares son los resultados a los obtemdos puede adquirir fácilmente; por ello, podrem os concen trarnos en las pregun tas
grupo de sext~ ~rado?, ¡cuál es el ~!ve! típico de desemp eño en el grupo? Estas
y en las maneras como se ordena n los número s para contest
arlas.
~te en su tota- -
pregun tas requieren una puntuacIOn un?ca que represe al grupo
con- Eri la práctica, gran parte del trabajo estadístico se realiza en las calcula
es decir una medida que proporC IOne el promed IO del grupo. Para en las comput adoras. Los cálculos manual es para obtener
lidad doras electrónicas y
testa; las pregun tas anteriores tenemo s que familia ~izarno s con lo~ pro,ceso s
medias, desviaciones estánda r y coeficientes de correlación son tan obsolet
os
que nos permita n represe ntar el promed IO o la puntu~cIOn tlplCO. ca en la casa. En la actualid ad en la que casi todas las perso-
estadíst icos como en la aritméti
des-
Después, para describir al grupo q~izá ellec.t or sienta la necesIdad de nas tiene una calculadora de mano para elaborar sus declaraciones de impues
-
medida en la cual las puntuac IOnes se dIspers an alreded or del prome- la suma de los produc tos compra dos en el mercad o, parece inne-
cribir la n tos o realizar
dio. 'Todos los niños del grupo han alcanzado el mismo progreso o muestra cesario aprender los procedimientos manuales para calcular las estadíst
icas
un r!ngo amplio de aprovec hamien to?, ¿se pod~ía esperar de ellos que P!ogre-
básicas; sin embarg o, es import ante para el princip iante saber por qué y cómo
?,
sarán casi al mismo ritmo, o podríam os predeCIr un progreso muy vanabl~ hacerlo, puesto que todavía existen situaciones en las que no hay calcula s
dora
este grupo con los otros del mismo grado respecto ~ la dIS- estas razones , aún se enseña n los proceso
¿cómo se compar a ni computadora disponi bles. Por
e un
persión de las puntuac iones? Para contest ar estas pregun tas se reqUIer computacionales establecidos desde hace tanto tiempo. .
estudio de las medida s de variabi lidad.
El lector podría preguntarse dónde se ubiea un individ~o en particul~r
en
alguna de las tres pruebas . Así, quizá el lector quiera saber SI el alu~no ?~me­ FORM AS DE ORGA NIZA R Y REPR ESEN TAR
ro 27 se ha desemp eñado bien o deficientemente en la prueba de ant.~
etl~~, y .... GRÁF ICAM ENTE UNA SERIE DE
si el lector decide que la puntua ción de este alumno es una buena cahfIcac lOn, •~UNTUACIONES
querría compro barlo. Por ejemplo, podría pregunt ar~e S! ~l alumno obtuvo
puntuac iones que obtuvie ron los 52 alum-
mejor resultado en la prueba de lectura que en la de antmet lca. Para contest
ar . . 'c/;!.:::,), .En la tabla 2.1 se muestr an las Observ emos la column a corresp ondient e a
estas pregun tas es necesaria una medida común en término s de la cua~ se pue- . -~r:t;;,j ~Jl~ .de sexto grado en las pruebas .
da expresar el desemp eño en dos áreas diferentes. Entonces, se re9UI~r uo.
~ una ..:~i·:i,· ·r;?gt!lra y consideremos cómo se puede reordenar para tener de
una ideq más
lectura.
· · ,f~~~<:~\g!~psa acerca del desempeño de los alumno s en la prueba
manera uniform e de expresar e interpre tar el desemp eño de un mdIvId hacer una lista
¿Cómo se desemp eña él respecto al resto del grupo? . . '!,>;,~::::i,j¡,: La forma más sencilla de organiz ar estos datos consiste
lista se
en
present a a con ti-
Otras pregun tas serían: ¿en qué medida los alumno s que son excelen
tes .......•.'T;<:~i::.~p.~ ,:~ya de la puntuación más alta a la más baja; esta
. 1.(~:; ~paclOn.
aritméti ca?, ¿en qué grado se corresp onden estas
en lectura tambié n lo son en
(:';
' /:-'!
1' 34
35

59 43 37 34 30 22 Toblo 2.2. Distribución o frecuencias de las puntuaciones de lectura


56 42 37 33 29 22
52 42 36 32 29 21 {Dolos sin agrupar}
50 40 36 32 28 21
50 39 36 32 27 20 Puntuación de prueba
47 38 36 31 27 17 Frecuencia
46 38 35 31 27 17
44 38 35 31 25 59 1
43 37 34 30 24 58 O
57 O
56 1
Este ordenamiento nos da una mejor idea de la fonna como se organizan 55 O
las puntuaciones. Fácilmente podemos localizar las puntuaciones,más altas y 54 O
más bajas: 59 y 17. También es fácil observar que la persona ubicada en medio 53 O
del grupo obtuvo una puntuación alrededor de 30. Asimismo podemos obser- 52 1
var que la mitad de la puntuación se halla comprendida en el intervalo entre el 51 O
30 y 40. Pero eSte ordenamiento simple de puntuaciones todavía es muy'deta- 50 2
llado y no nos pennite apreciar claramente el patrón general, tampoco es un
método conveniente para realizar cálculos; por ejemplo, si tuviera datos de
500 alumnos, sería bastante impráctico. Por lo tanto necesitamos organizar
estos datos de una manera más compacta.
20 1
19 O
Elaboración de una distribución 18 O
de frecuencias 17 2

Un procedimiento más para organizar las puntuaciones es construir una


distribución de frecuencias, la cual consiste en una tabla que muestra la fre-
cuencia con la que aparece una puntuación. Se hace una lista de cada valor y
se anota el número de veces en las que se presentó cada uno. En la .tabla 2.2 se Toblo 2.3. Distribución de frecuencios de los puntuaciones de lectura
muestra sólo una parte de la distribución de frecuencias para la prueba de lec-
tura del ejemplo que hemos utilizado¡ sin embargo, esta tabla no es un buen {Oalos agrupados}
método para registrar los hechos, pues es demasiado larga y un tanto ambi-
gua. La tabla completa tendría 43 líneas, varias puntuaciones con frecuencia Inlervalos de clase
de cero y variaciones muy marcadas en la columna de Frecuencia de una pun- Marcas Frecuencia
tuación a la siguiente.
Para mejorar un poco más esta forma de presentación se agrupan las pun- 58-60 1 1
tuaciones en categorías más amplias. En nuestros ejemplos podemos agrupar 55-57 1 1
tres punt\laciones adyacentes, de manera que cada una incluya tres puntos de 52-54 I 1
calificación. En la tabla 2.3 se muestra la presentación de las puntuaciones y 49-51 11 2
se especifica cuántas personas hay en cada grupo o intervalo de clase. Así, 46-48 11 2
hay ocho individuos en el intervalo 34-36, pero no sabemos cuántos de ellos 43-45 11/
obtuvieron 34, cuántos 35 y cuántos 36¡ hemos perdido esta información con 3
40-42 111 3
el agrupamiento. No obstante, suponemos que los individuos están reparti- 31-39
dos de manera proporcional a lo largo de intervalos, por lo que no existen H+f 11 7
34-36 H+f 111
bases para creer de antemano que una calificación ocurrirá más frecuente que 8
otra. En este sentido, debido a la presentación compacta de la distribución de 31-33 H+f 11 7

",
36 37

Tabla 2.3. (Continuación.) Representación gráfica

(Oatos agrupados) Es útil representar los datos de la tabla 2.3 en una gráfica. Un ti~o común
d presentación gráfica es e! llamado histograma, mostra~o en la fIgura 2.1,
e re e supone es equivalente a 11 agrupar los cuerpos". Los mtervalos de clase
Intervalos de close Morcas Frecuencia ;:~~estran a lo largo de la línea horizontal (abscisa), mie~tras que la línea
. 1 de las columnas (ordenada) representa la FrecuenCIa de casos. En el
28-30 HH 5 vertIca
dia rama se observa que hay dos puntuaCIOnes . en e1 mterva
. 1,o 16- 18 , tres en
25-27 1111 4 1. gt rvalo 19-21 etc. En esta figura
eme
se muestra que la mayona de las puntua-
22-24 /11 3 ciones se agrupan, alrededor .del numero
'O 3 con una 11 co1"1
a arga y ap1ana da
19-21 11/ 3 que corre hacia las puntuaCIOnes altas.
16-18 11 2

frecuencias se tiene más beneficios que desventajas al organizar las puntua-


ciones de acuerdo con este procedimiento. 1
En la práctica siempre nos enfrentamo.s al probl~ma de ?ecidir qué tan
amplio debe ser el intervalo de clase¡ es decIr, la amphtud de est~ ~,ebe ser de ~6~-+--4--4~-+---~~V77t~i---r--t--t---¡-~--t-~
o
tres cinco 10 o cualesquiera otros valores. Para tomar una declSlon se debe
esta~ cons~iente de la cantidad de infonnación que se esté dispuesto a perder ~5~-+--4--4~-+~~77~~1.7~--r--t--t---¡-~--t--¡
-o
para obtener una representación conveniente y compacta de los resultados. ~4 ~-+--~~~~~n777~~771---r--t--1---¡--t--t--¡
Un intcrvalo más amplio pierde más detalles, pero condensa los datos en una E
forma más compacta. Una regla sencilla es seleccionar un inter:valo de clase ~3~-b~~~~~~~f7.7t~"7t~t--t--t--t--t--¡
que divida al rango total de puntuaciones en 1S grupos, aproxIII~adamente.
2
En nuestro ejemplo, la puntuación más alta es de S9 y la más baja de 17¡ el
rango de puntuaciones es de 59 - 17 = 42. Si dividimos 42 entre 1S, obten-
dremos 2.8 cuyo valor total más cercano es de tres¡ por lo tanto, agruparemos
los datos e~ intervalos de clase con una amplitud de tres unidades. Además, la 16- 1819·2 1 22-2425-2728-3031-33 34-363 7-3940-4243-4546-48 49·51 52·5455-5758-60
"regla de los 1S", creemos conveniente construir distribu,ci~nes de frecuencia Intervalo de puntuación
cuyo número de intervalos de clase sean CIDCO, 10 o muluplos de 10. Dado
que e! propósito de agrupar puntuaciones es pres.entarlas adecuadamente, Figura 2.1. Histog-ama de los puntuaciones de lectura.
siempre debe considerarse e! factor de convemencIa:
Es necesario señalar que algunas veces no se reqUIere agrupar los datos en
Otra forma de representar gráticamente los mismos datos es mediante un
categorías más amplias¡ es decir, si las puntuaciones originales abar~aIl: un
rango no mayor de 20 unidades, no seria conveniente agrup.l rlos en dIstnbu- polígono de frecuencia, que se muestra en la figura 2.2, en la que se ha hecho
ciones de frecuencia. una marca en el punto medio de cada intervalo de clase. La altura en la que se
En la práctica, para organizar una serie de datos, el primer paso es decidir ha anotado el punto corresponde al número de casos o frecuencia 1fI, del
acerca de! tamaño o la amplitud del intervalo de clase. Después se construyen intervalo. Estos puntos se unen con una línea y la forma resultante da una
los intervalos de clase de las puntuaciones, como se muestra en la columna de figura diferente de los mismos datos presentados en la figura 2.1 .
la izquierda de la tabla 2.3. Posteriormente, se representa a cada individuo por Cuando se incluyen dos grupos en la misma gráfica, el polígono permite
una marca, como se indica en la columna intermedia (es más fácil seguir la que los datos se vean más claramente que el histograma. De no ser por esto, la
huella a las marcas si se cruza con una línea diagonal cada grupo de cuatro opción entre ambas gráficas es completamente personal, pues son formas
marcas precedentes). La columna con e! encabezado Frecuencia se obtiene intercambiables de mostrar los mismos hechos.
por medio del conteo del número de marcas en cada intervalo de clase.
J En algunos tipos especiales de estadísticas sociales, como el reporte de los ingresos, ciertos
MEDIDAS DE TENDENCIA CENTRAL
valores son más probables que otros, por ejemplo, $2000, $3 000, $5 000, etc. Es necesario
tomar precauciones especiales para agrupar material de este tipo. En particular, se debe luchar por A menudo necesitamos una medida estadística que represente típicamen-
obtener valores populares cerca de la mitad del intervalo de clase. te al conjunto de puntuaciones¡ esta medida bien puede ser el promedio o la
38 MEDIDAS DE TENDENCIA CENTRAL 39
8~~--~-+--+--+--+--+~+--+--+--+--~-+--+-~--~-i

71--+---+---t---+---~-/-
una calificación de 27 o menos, etc. Como ya se indicó, deseamos identificar
el punto por debajo del cual se ubica el 50% de los casos, y puesto que el 50%
~ 6 I--f---f----+--+---+-- de 52 es 26, debemos identificar el punto por debajo de donde se ubican los 26
a
alumnos.
~ 5 ~~--t--+--+--t­
-u
e 4 f----!---t---+~+-
el> Tablo 2.4. Distribución de frecuencias y frecuencia acumulativo poro los puntuaciones de
E
;¿3 lectura
2 Intervalo de clase Frecuencia Frecuencio ocumulotivo

58·60 1 52
16-1819-2122·2425·2728-3031-3334-3637-3940-42 43-45 46·48 49·5152-5455-5758·60 55-57 1 51
Intervalo de puntuación 52·54 1 50
49-51 2 49
Figura 2.2. Polígono de frecuencia de los puntuaciones de lecMa.
46-48 2 47
43-45 3 45
mediana. Una manera muy simple de identificar la puntuación típica es selec- 40-42 3 42
cionar aquella que ocurre con más frecuencia, la cual se llama moda. Si exami- 37-39 7 39
namos la matriz de puntuaciones de la tabla sin número del apartado anterior, 34-36 8 32
encontraremos que la puntuación 36 ocurre cuatro veces¡ por lo tanto, la 31-33 7 24
moda de estos datos es 36. También puede observarse'que los valores de las 28-30 5 17
puntuaciones 38,37,32,31 y 27 ocurren tres veces cada uno. Por ejemplo, si 25-27 4 12
hubiera un 36 menos y un 27 más, la moda cambiaría en nueve unidades. La 22-24 3 8
moda es muy susceptible de sufrir cambios al reordenar los datost por lo que 3 5
19-21
se le considera un indicador bastante inestable y no muy útil para representar
al grupo de puntuaciones. En la tabla 2.3, en la que se muestra la distribución 16-18 2 2
de frecuencias, el intervalo modal es el intervalo entre 34-36, que ~s lo más
aproximado que podemos identificar a la moda cuando presentamos de esta
manera los datos. En la tabla 2.4 se muestra que 24 individuos tienen puntuaciones de 33 o
menos; por lo tanto, necesitamos incluir dos casos más para obtener los 26
requeridos. Nótese que en el próximo intervalo (34-36) hay ocho individuos,
Mediana pero sólo requerimos 2/8 o 1/4 de estos individuos. Ahora, ¿cómo se distribu-
yen estos casos en el intervalo de clase del 34 a136? Como ya se indicó previa-
Una forma mucho más útil de representar la puntuación típica consiste mente, una suposición razonable es que los casos están dispersos de manera
en encontrar el valor en la escala de calificaciones que separa a la mitad supe- uniforme a lo largo de todo el intervalo. Entonces, para incluir 1/4 de las pun-
;.
rior de los datos de la mitad inferior, la cual se llama mediana. En nuestro tuaciones tendríamos que tomar 1/4 del intervalo de clase 34-36.
ejemplo, en el que hay 52 casos, esto significa separar a los 26 alumn,?s supe- .En este punto es necesario aclarar qué queremos decir con una puntua-
riores de los 26 inferiores. El valor requerido puede calcularse a partIr de las ción de 34. Primero, debemos señalar que no obstante que las puntuaciones
puntuaciones que se muestran en la tabla 2.3. Si empezamos con la puntua- de la prueba van de unidad en unidad (34, 35, 36), consideramos que la habili-
ción menor, contaremos hasta sumar los primeros 26 casos. De manera siste- dad tiene una distribución continua y toma todos los valores intermedios.
mática, se recomienda empezar a contar desde abajo, como se muestra en la Podríamos comparar las puntuaciones obtenidas en la prueba con un reloj
i.
tabla 2.4, en la que se presentan tanto la frecuencia acumulada como la fre- digital, que, aun cuando el tiempo sea continuo, salta de minuto a minuto
cuencia por intervalo. Los números de la columna la Frecuencia acumulada cuando la unidad básica es el minuto.
indican el total de personas que tienen una puntuación igualo menor que la Lo anterior está ilustrado en la figura 2.3, en la que la línea gruesa repre-
más alta del intervalo; es decir, hay cinco casos que tienen una calificación de senta el continuo de la habilidad. Definiremos el"34 H como más cercano al 34
21 o menos, ocho que obtienen una calificación de 24 o menos, 12 que logran que al33 o al 35; por lo tanto, en dicha figura se representa como un segmen-

:. " ,: . ' . .'J .... ..


: ~" ''''': ' >~ -: ;'.::; .~ . >,.
41
40 CAP. 2. TÉCNICA S ESTADíSTICAS BÁSICAS

to que se extiend e del 33.5 al 34.5. No obstante que esta definición de puntua
- Para calcular la median a En nuestro eiemp10
acepta en la mayor parte de la
ción es arbitraria, es bastante razonab le y se
e des- Número de casos que se necesita añadir ) Número de puntas )
bibliografía acerca de la estadística. El intervalo de clase 34-36 se extiend
io-
de el 33.5 al 36.5, como se muestr a en la figura 2.3. No obtenem os puntuac
siguiente en el intervalo
( Número de casos e~ el intervalo (
porque esos niveles de habilid ad no exis-
nes que están entre el 33 y el 34 no
s valores
tan, sino porque nuestro instrum ento de medición no registra alguno 5. Añádase esta cantidad al límite 5. 33.5 + 0.75 = 34.25
entre el 33 y el 34. superior del intervalo identificado
en el paso 3, para obtener la mediana
Intervalo de clase

37 Percen tiles
Puntuación 33

ción
32.5 33.5 (34.25) 34.5 35.5 36.5 37.5 Se puede emplear el procedi miento anterio r para encont rar la puntua
reciben
! I I I I I I I por debajo de la cual se ubica otro porcen taje del grupo. Estos valores
-
33 34 35 36 37 e! ,nombre de percentiles. L~ mediana es e! percentil 50; es decir, la puntua
quü¡ié-
Continuo de habilidad CIOn por debajO de la cual esta representado el 50% de los individ uos. Si
ción
ramos encontr ar el percent il 25, tendría mos que encont rar la puntua
habilidad . c~al se ~aIla ,el 25% de los alumno s . El 25% de 52 es 13, y 13 ca-
Figuro 2.3. Relación entre las puntuac iones y el continuo de debajo de la
cinco
sos nos llevana n mas alIa de! mtervalo 25-27 e mcluirÍan a uno de los
e ma-
o casos del intervalo 28-30. Así, el percent il 25 se calcula de la siguient
Debido a que requerimos 1/4 de los casos conteni dos en e! interval nera: 27.5 + (115)3 = 27:5 + 0.6 = 28 . l.
entre 33.5 y 36.5; es decir, tenemo s 1/4 (52) =
34-36, debemos ir 1/4 del camino
valor de Com~ otro ejemplo, considérese el percent il 85. Tenem os (0.85)
(36.5-33.5) = 1/4 X 3 = 3/4 = 0.75 . Debem os añadir 0.75 al 44.2. DebIdo a que 42 casos nos llevan hasta la parte superio r del interva lo
los dos interva los. Entonce s, la mediana 42.5 + [(44.2-
33.5, que es la línea limítrofe entre 40-42, y hay tres en el interv:a lo siguient e, para el percent il85 :
para esta serie de puntuac iones es 33.5 + 0.75 = 34.25.
42)/3)) (3) = ~4.7 . De la mIsma manera se pueden encont rar otros percent
i-
tIenen mucho s usos, especia lmente en relació n con las normas
les, los cuales
En nuestro eiemplo . de una prueba y la interpre tación de puntua ciones.
Para calcula r la mediana

l . Calcúlese el número de casos que 1. El 50% de 52 es 26


representan el 50% del grupo total
Media aritmé tica

2. A partir de la puntuación interior, 2. Como se muestra en la tabla 2.4, las Otra medi~a. estadíst ica frecuen temente empleada para representar
al
acumúlense las puntuaciones hacia frecuencias acumuladas son 2, S, 8, g~po es el tradICional promed io que conoce mos de nuestra experien cia coti-
arriba a lo largo de cada intervalo de 12, 17, etc. ten-
dlan~. Ya que el conoce dor de estadística se refiere a todas las medidas de
puntuación de~~Ia central como promed ios, identifi caremo s a éstos como la media arit-
s por e!
m,etlca, que es la si.mple suma de todas las puntuac iones dividida
3. Encuéntrese el intervalo para el cual 3. La acumulación en el intervalo numero de puntuaCIOnes. ASÍ, la media aritmét ica de 4, 6 y 7 es:
la frecuencia acumulada es menos 31-33 es de 24
que el número requerido de casos
4+6+ 7
3 = 5.67
4. Encuéntrese la distancia de 4. (2/8)(3) = 0.75
puntuaciones que debe añadirse a la
parte superior de ese intervalo, para
incluir el número requerido de 52 . Ed'
e~Jjemplo mencio nado podemos sumar todas las puntuac iones de losd
casos, mediante la operación e t m ~~I hOs del grupo, lo cual da un total de 1 798. Al dividir esta cantida
este
siguiente: n re ,o tenemos 34.58 que es el promed io o la media aritmética para
l'
i
42 CAP. 2. TÉCNICAS ESTADíSTICAS BÁSICAS 43
grupo. La computadora también realiza este procedimiento, pero si el gru- Secuencia de pasos Simbolismo2 Ejemplo
po es pequeño es más recomendable hacerlo a mano, especialmente si conta-
mos con una máquina sumadora; sin embargo, para hacer el cálculo de grupos 1. Escójase A A=35
grandes a mano existen procedimientos disponibles más eficaces, basados en arbitrariamente algún
la distribución de frecuencias mostrada en la tabla 2.3. intervalo de clase para Para x = 34-36, x' = O
Dichos cálculos están basados en el procedimiento que se denomina fijar el punto de inicio
u origen. El" punto
media supuesta. Se selecciona un intervalo de puntuaciones que parezca estar medio de' este intervalo
a la mitad del grupo, y se suman las desviaciones positivas y negativas a partir escogido
de este punto. A partir del intervalo de origen se ajusta el exceso de desviacio- arbitrariamente lA) se
nes positivas y negativas, con el propósito de obtener el valor de la media. La llamará cero en
aplicación de este procedimiento para los datos de la prueba de lectura de nuestros cálculos
nuestro ejemplo se muestra en la tabla 2.5, y los pasos se presentan a con-
tinuación. 2. Al intervalo que x' Por lo tanto, al intervalo
continúa hacia arriba 37-39 se le anota + 1 y al
se le asigna el valor 40-42 se le asigna + 2,
+ 1, el que está por etc., corno se muestra en
Toblo 2.5. Distribución de frecuencia de los puntuaciones de lectura, que muestro dos posos encima de él + 2, etc., la columna encabezada
y a los intervalos que corno x' en la tabla 2.5
poro calcular lo media aritmético y lo desviación estóndar están por debajo del
origen - 1, - 2, etc.
Intervalo Frecuencia
de clase { x' {x' {(x17 3. Para cada hilera, {x' Por lo tanto, 1 x 8 = 8,
multiplíquese el 1 x 7 = 7, etc., corno se
número de casos muestra en la columna
58-60 1 8 8 64 (frecuencia) por el encabezada corno fx' en la
55-57 1 7 7 49 número asignado en el tabla 2.5
52-54 1 6 6 36 paso anterior (x')
49-51 2 5 10 50 4. Súmense los valores de 'Lfx' 'Lf(x' )+= + 61
46-48 2 4 8 32 la columna ¡x', 'Lf(x')-= - 68
43-45 3 3 9 27 teniendo en cuenta los 'Lf(x') =-7
40-42 3 2 6 12 signos positivo y
37-39 7 1 7 7 negativo, (Se evitan
equivocaciones si las
+61 desviaciones con signos
34-36 8 O O O positivos y negativos se
suman por separado, y
31-33 7 -1 -7 7 las dos sumas parciales
28-30 5 -2 - 10 20 se combinan para
obtener el total)
25-27 4 -3 - 12 36
22-24 3 -4 - 12 48 5. Súmense las 'Lf=N 'Lf=52
19-21 3 -5 - 15 75 , frecuencias de la
16-18 2 -6 - 12 72 columna con el
- 68 encabezado Frecuencia
(// para obtener el
número total de casos
:.;; : Tolol 52 -:::¡ m en el grupo, que
, ,:, : normalmente se

, 2 Una lista ~e símbolos estadísticos comunes y de su significado aparece al final de este capí-
tulo. La referencIa a estas definiciones puede ayudar a la lectura restante de este capítulo.

'", ; . . ,

....; " .. . ' .


" ., ' .. . .
~

. !·; ~··.·, ·..~h·. '.:' .. ,r;.,:' .'~. ~'·.·I , ..-';> o"" ........ . > ~,.... :.: JO', "'~: ' , '" '.~', " ," .', ' ~ ' " .. ~ H ' , . ' •
44 MEDIDAS DE VARIABILIDAD 45

Secuencia de pasos Simbolismo Ejemplo cias no hay ninguna diferencia acerca de cuál será el intervalo que empleare-
representa con el mos como punto de inicio. Con excepción de los errores aritméticos, el resul-
símbolo N tadO sería idéntico para eualquier intervalo como punto de inicio.
La media aritmética y la mediana no corresponden con exactitud, pero
6. Divídase la suma de los 'Lfx' -7
-=-0.135 normalmente no difieren mucho. En este ejemplo, los valores son 34.60 y
valores fx' por N para N 52 35.25, respectivamente. La media y la mediana pueden diferir sustancialmen-
obtener el promedio de te sólo cuando el conjunto de puntuaciones sea asimétrico, es decir, cuando
las desviaciones a hava una acumulación de puntuaciones en un extremo y muy pocas en el
partir del origen ot;o. En la figura 2.4 se muestran tres distribuciones que difieren en la canti-
arbitrario (en unidades dad y la dirección de la asimetría_ La figura 2.4 a es positivamente asimétrica,
de intervalo)
es decir, la cola (frecuencia) tiende hacia las puntuaciones altas. Obtenemos
7. Multiplíquese por la
amplitud o el tamaño
3 (-7
52
)=3(-0.135)
= _ 0.405
una distribución como ésta para los ingresos personales en Estados Unidos,
debido a que hay muchas personas que tienen ingresos bajos y moderados y
del intervalo para . sólo unos pocos tienen ingresos más altos. La figura 2.4 b es negativamente
expresar la desviación asimétrica¡ una distribución como ésta sería el resultado que obtendría un
en unidades· de urupo al que se aplicara una prueba muy fácil, por lo que las frecuencias se api-
puntuación larían en las punt~aciones de perfecto o casi perfecto. La figura 2.4 e es simé-
35 + (- 0.405) = 34.595 o trica v no tiene asimetrías para ningún lado¡ muchas variables fisiológicas y
8. Añádase el resultado al
A+l. ('LfX')
- - 34.60 psicoÍógicas dan este tipo de distribución simétrica. En las múltiples diStrihu-
punto medio del . N
intervalo de origen ciones que son aproximadamente simétricas, la mediana O" la media servirán
p;1Ta representar el promedio del grupo, pero con las distribuciones asimétri-
cas generalmente es preferible la mediana, pues está menos afectada por unos
cuantos C,1S0S en el extremo.
Al resumir todos los pasos, podríamos decir:
.. . ( suma de ¡x' )
Media = ¡amplitud del mtervalo de ongen) -- - ..-N·------- MEDIDAS DE VARIABILIDAD

+ punto medio del intervalo de origen Cuando se describe una serie de puntuaciones suele ser significativo
reportar qué tan variable son y qué tanto se dispersan alrededor de la media
o, en nuestro ejemplo: las puntuaciones altas y bajas¡ por ejemplo, dos grupos de niños, ambos con
una edad promedio de 10 años, representarían situaciones educativas muy
Media = 3 (~¡-) + 3S =34.60
diferentes si uno tuviera una dispersión de edad de nueve a 11 ai'los, mientras
que el otro la tuviera de seis a 14 años. Una medida de esta dispersión es un
índice estadístico importante para describir a ese grupo.
En conclusión las desviaciones con signo negativo excedieron ligeramen- ,." La JTledida más simple de variabilidad es el rango de puntuaciones de cada
te a las desviacion'es con signo positivo. Hubo un exceso de siete unidad~s '. ',;:srppo; Este es simplemente la diferencia entre la más alta y la más baja de las
negativas. Nuestro punto de inicio estaba un poco elevado, por lo que tUVI- . puntuaciones. En nuestra prueba de lectura, sería 59 - 17 = 42¡ sin embar-
mos que cambiarlo hacia abajo en 7/52 de intervalo o 7 (~2 .X 3 umdades de :. go¡ debido a que el rango depende solamente de estos dos datos extremos en el
puntuación para encontrar el verdadero punto de eqmlIbno. DebIdo a q~e _.-gr,ppo total, la medida es muy poco confiable, ya que podría modificarse bas-
nuestro punto medio del intervalo de origen correspondía a una puntuaclOn \ t4pte por la adición u omisión de un solo caso extremoso.
, •••• o ,.
":, ..,-, .
de 35, tuvimos que moverlo 21/52 puntos por debajo del 35 para obtener el

';:r~:':~:,:f!{~~~gO
verdadero punto de equilibrio, que es la media aritmética correcta.
El valor de 34.60 que obtuvimos de esta manera es casi el mismo que semiintercuartilar
34.58, que resultó de sumar todas las puntuaciones y dividirlas entre el núme·
ro de casos. Normalmente, la correspondencia no es perfecta, debido a que las )/?;i;,;.;;;~· ~~:~:~Una medida mejor de la variabilidad es el rango de puntuaciones que
distribuciones de frecuencia agrupan las puntuaciones dentro de intervalos _ ';'. /:~?~:i!Bf;l~YC una parte específica del grupo total, normalmente el 50% central. Este
de clase, pero los valores obtenidos mediante los dos métodos suelen estar de ~c :::i: ·-./.:'i,fu~r~n~a¡~ de casos en un grupo es aquel que seencuentra entre los perc~ntiles
acuerdo estrechamente. Cuando trabajamos con una distribución de frecuen- .'. ;~:);'¡'·-\~;/t(}~ }:J· l odemos calcular estos percentIles SI segunllos los procedImIentos
MEDIDAS DE VARIABILIDAD 47
46
2.5 se muestran dos distribuciones que tienen la misma media, el mismo
número total de casos y la misma forma en general, y sólo difieren en que la
variabilidad de uno es el doble de grande que la otra.

(o)

- -_ ......._.~::::::_-----_._-_..::::_~._~-"""""'-
""'-""""''''''''''''''''''''I!!!!!!
(b)

(e) Figura 2.5. Dos distribuciones que difieren sólo en variabilidad: o) variabilidad gande y
b) variabilidad pequeño.
Figura 2.4. Distribuciones de frecuencia que difieren en simetría: o) positivamente asimé-
trico; b) negativamente asimétrico. y e) simétrico.

Desviación estándar
descritos anteriormente. Para nuestro ejemplo, hicimos el cálculo de que el
percentil 25 tenía un valor de 28.1. Si se .calcula el percentil ?S, se encontrará .• El rango semiintercuartilar pertenece a la misma familia de las medidas
que su valor es de 39.5 Y que la distancIa entre los percennles 25 Y 75 es de estadísticas que la mediana. Su cálculo se basa en los percentiles, pero hay
medidas de variabilidad que pertenecen a la familia de la media aritméti-
11.4 unidades de calificación. . que están basados en la desviación de las puntuaciones. Supóngase que
Los percentiles 25 Y 75 se llaman cuartilas, debido a que el pri~ero sepa.ra
la cuarta parte inferior del grupo y el segundo la cuarta par~e supen~r.. La dIS- ·,eJlel1n.oscuatro puntuaciones: 4, 5, 6 Y 7¡ si las sumamos y las dividimos entre
eHni'lml~T() de puntuaciones, obtendremos:
tancia entre ellos se llama rango intercuartilar. Una medIda estadlStlCa que
suele reportarse como medida de variabilidad es el rango seI11:iinte~cuartilar
(Q 1, que es la mitad del rango intercua~tilar Y re~resent~ la dIstanCIa ~rome:
dio desde la mediana hasta los dos cuarnles¡ es decIr, eval ua, en promedlO, que 4+5+6+7 =-ª-= 5.5
tan lejos se hallan los valores de los cuartiles con respecto a la mediana, En 4 4
nuestro ejemplo, el rango semiintercuartilar es .
da la media aritmética¡ pero ahora nos preguntamos qué tanto se
. Q = 39.5 - 28.1 = 5.7 puntuaciones alrededor de la media. Supóngase que encontra-
H.C:;JXJlI¡;la entre ~da puntuación con respecto a la media, es decir, que
2.
puntuaclOn de 5.5. Entonces, tendríamos - 1.5, - 0.5,0.5 Y
represe~tan las desviaciones de las puntuaciones con respecto
Si las pu~tuaciones se distribuyen lo doble, Q sería dos veces más gr~nde, Cuanto mas grandes sean las desviaciones, más variabilidad habrá
pero sise distribuyera sólo la mitad, Q sería la mitad de grande. En la fIgura

• -,. ",-"' , :.' : ' ~ • • •" , ' , -'o _.¡-t ,' ,o, ...... .:-':, •• ' ..
MEDIDAS DE VARIABILIDAD 49
48 CAP. 2. TÉCNICAS ESTADíSTICAS BÁSICAS
cación con-
io de última columna se puede calcular más fácilmente por medio de la multipli que todos
en la serie de puntuac iones, y lo que requeri mos es cierto tipo de promed junta de todas las entradas en las dos columna s, es decir, x' por Ix'. Nótese
total de la variabil idad. signos negati-
estas desviac iones que den una medida
pues los signos de esta columna son positivos, debido a que al multiplicar dos
Si sólo sumam os las cuatro desviaciones de arriba, el valor es cero, vos se obtiene un signo positivo.
os la media aritméti ca como el punto donde se equilib ran exactam en-
definim
hacer algo
te todos los valores positivo s y negativ os. Entonc es tendrem os que Eiemplo
que los estadíst icos han diseñad o para maneja r estos Símbolo
más, y el procedi miento
desviacio-
signos positiv os y negativos consist e en elevar al cuadrad o todas las
dé más). Un
nes, para obtene r solamen te valores positivo s (menos por menos 3. Obténgase la I:f(x' F 535
de la suma
promed io de estas desviac iones cuadrát icas se obtiene por medio suma f(x')2 en
de este resultad o entre el número de casos. Para la columna
de todas ellas y la división
uales, debe-
compen sar el haber elevado al cuadrad o las desviac iones individ
. La medida
mos obtener la raíz cuadrad a de este valor promed io que se calculó 4. Divídase esta I:f(x' F 535 = 10 288
52 .
ica resultan te se denom ina desviac ión estánda r (DE o s ) y es la raíz suma entre el N
estadíst
las desviac iones cuadrát icas a partir de la media. número de
cuadrad a,'\ del promed io de
nuestro ejemplo de los cuatro casos, los cálculo s son como ·sigue: casos
Para

~ (- 1.5)! + (- 0.5» + (0.5)2 + (1.5)'


I:lx' -7
DE = 5. Dividase la -=-0.135.
4 suma de la N 52
columna Ix'
entre el
2.25 + 0.25 + 0.25 + 2.25 número de
casos
4

fTTS 1.12
6. Elévese al --7 )2=(-0.135)
cuadrado el ( 52 =0.018
valor obtenido
en el punto
Cálcul o de la desvia ción estánd ar a partir anterior
de una distrib ución de frecue ncias
La desviac ión estánda r tambié n puede calcular se a partir de la distribu
ios se muestr an en la
-
tabla
7. Réstense los
valores de los
535- ( -
- - 7)2 =(10.288
ción de frecuen cias agrupad as. Los pasos necesar 52 52 - 0.018)
puntos 6 y 4
2.5. En la column a con el encabe zado f (x' F cada valor represe nta
el número = lO.pO
icados por el cuadrad o de la desviac ión (x' ) de ese interva-
de casos (f) multipl
io. La suma
lo de puntua ciones con respect o al interval o de origen o arbitrar 8. Obténgase la "10.270 = 3.20
os de
de los valores en esta column a da como resultad o la suma de cuadrad raíz cuadrada .
or de un
las desviac iones, sin embarg o estas desviac iones se hallan alreded del valor
es ne-
origen arbitrar io y se expresa n en unidade s de interval o. Por lo tanto, obtenido
unidade s de
cesario hacer varios ajustes para expresar las desviac iones en
se des-
puntuac ión y en término s de la verdadera media aritméti ca. Los pasos
criben a continu ación. ~> Multiplíquese 3(3.20) = 9.60
'" el resultado
ca. .; por la
1. Llévense a cabo las operaciones para calcular la media aritméti
2. Prepárese la columna con el encabezado I (x' )2. Cada valor en esta columna es amplitud o el
, esta
la frecuencia (f) multiplicada por el cuadrado de la desviación (x'); sin embargo tamaño del
.. .. interval o de
";" clase
3 Con muchas calculadoras modernas sólo se necesita presionar la tecla designada, para
obtener la raíz cuadrada de un número.
"~
I
¡ ';
:
50 CAP. 2. TÉCNICAS ESTADíSTICAS BÁSICAS 51
o y
En resumen, al presentar todos los cálculos' para nuestro ejempl
emplea r las fórmula s dadas en el paso 9, tendrem os:

DE = 3 -J52 -
535 -7
( 52 )2 = 9.60

Interp retació n de la desvia ción estánd ar


Es casi imposible decir con palabras simples lo que es la desviación están-
io,
dar o a lo que corresp onde en términos gráficos o geométricos. En princip
r es una medida estadíst ica que caracter iza a una distri-
la desviación estánda
me a la
bución de puntuac iones, y se incrementa en proporc ión directa confor
ciones individu ales. Cuanto más grande sea la des-
variabilidad en las puntua n- Figuro 2.6. Ejemplo de uncí CIXVO normal (ajustad a a los c;Jatos
de lo pruebo de lectura).
viación estándar, mayor será la dispersión de las puntuac iones. Los estudia una
es una desviac ión estánda r pequeña ?, ¿qué es
tes suelen preguntar: ¿qué ,
grande? Realmente no hay respuestas para estas preguntas. Por ejemplo 10; y ca~i todo~ el~o~ se ubicará n .entre +
3 y - 3 desviaciones estánda r de la
estánda r del peso es de están-
supongamos que para cierto grupo la desviac ión
car medIa. Un .mdlvIduo qu~ obtIene una puntua ción de una desviación
para determinar si esta desviación es grande o pequeñ a es necesario especifi a da~ por arnba. de la medIa ~obrepa sar~. al 84% del grupo¡ es decir, pasará al
os, así como si nos referim os la media
si se habla de onzas, de libras o de kilogram 50% que se ~bI~~ de la ,medIa haCIa abajO y al 34% que se ubica entre
pesos de ratones, de hombres o de mamutes. y + 1 desvIaclOn estanda r.
-
La desviación estánda r obtiene su significado más claro para una distribu
de puntua ciones en particul ar, y esta distribu ción se llama distribu ción
ción
normal , la cual se define por una ecuación matemática; pero para el usuario es
cotidiano, se define más bien por sus cualidades gráficas. La curva normal Toblo 2.6. Pro~orción de cosos que se ubicon dentro de ciertos límites de desvioción
de campan a; es decir, la mayorí a de los
una curva simétrica que tiene forma estondor poro uno distribución normal
medida
casos se agrupan alrededor de los valores medios de puntuac iones y a cia
que uno se aleja del centro en cualquiera de las dos direcciones, la frecuen Porcen/aie
primero lentame nte y después de manera más aguda, has-
de casos disminuye, Lími/es den/ro de los cuales se ubica cada caso de casos
de una
ta que los casos forman una cola larga en los extremos. Un ejemplo
en la figura 2.6. Esta curva es la curva normal
típica curva normal se muestra
que mejor se ajusta a los datos de la prueba de lectura que hemos emplea
la misma desviac ión estánda r y la
do
mis- Enlre +
fo medio y ya sea 1.0 o - 1.0 DE 34.1
como ejemplo; tiene la misma media, Enlre fa medio y ya sea + 2.0 o - 2.0 DE 47.7
histo-
ma área total (númer o de casos) que los datos de la prueba de lectura. El que Enlre fa medio y ya sea + 3.0 o - 3.0 DE 49.9
grama de la prueba de lectura aparece en las líneas puntead as, de manera
reales Enlre + 1.0 Y- 1.0 DE 68.2
pueda verse cuán estrechamente se ajustan la curva y las puntua ciones Enlre + 2.0 Y- 2.0 DE 95.4
de la prueba. Entre + 3.0 Y- 3.0 DE 99.8
Para la curva normal hay una relación matem ática exacta entre la des-
casos
viación estánda r y la proporción de los casos. La misma proporc ión de
siempre se encont rará dentro de la misma desviac ión estánda r. Esta relación
de
se muestr a en la tabla 2.6. Por lo tanto, en cualqu ier curva normal , cerca
+ 1 Y - 1, es
' btici~sta reIac~~ invariable ~e ~,:s unidades de desviaciónado
las dos terceras partes de los casos (68.2%) se ubicará n entre estánda r de la distri-
ente el
decir la primera desviación estánda r de la media. Aproxi madam : vierte~ norm ~ a la deSVlaclOn estándar un signific estándar. se con-
media,
95% de los casos caerán entre + 2 y - 2 desviaciones estándar de la grupos ~ d~: me~Ida ístable a partir. de la cual es posible compa rar diferent
es
ora, los procedi· ,No Obstant ermIna r e est.a,tus que tIene u~ individuo con respecto al grupo.
una persona que usa una calculado ra electrónica o una computad
e qd la relac~on
4 Para
la suma de los cua·
ue entre las umdade s dee desviación estánda r en
mientos de cálculo eficaces serían distintos. En la calculado ra se acumular ía dis.·tribUCl·O nes e puntuaClOne que ~o ~Ien~~ . .
N. De éste valor se restarla el . . ~ una lorma normal son lIgera-
drados de las puntuaci ones individuales y se dividiría esta suma por mente diferente f
cuadrado de la media. La raíz cuadrada del valor resultante daría la desviación estándar. s, con recuenCla la dIstnbuclOn de puntua ciones de prueba u

::. ... ' . .,.:


MEDIDAS DE RELACIÓN 53
52 CAP. 2. TÉCNICAS ESTADíSTICAS BÁSICAS
·das que acabamos de considerar, es decir,las uni-
otras medidas se acercan a la curva normal lo suficiente para que la desviación . d· r las dos c1ases de me d1 d ·
in lca ·1 las unidades de desviación están ar, qu~ proporCIOnan un
estándar tenga el mismo significado. dades de perfenu y el que se puede observar e! desempeno de un~ pers~~a
El significado de estar determinada a una cantidad de desviación estándar marco de re e~encla en. , 1 ·em lo ue hemos considerado, SI un mno
por arriba o por debajo de la media se puede expresar en términos de porcenta- específica. (\Sl, en re!bacIOn con e c:lific~ció~ de 48 en la prueba de lectura,
je de casos en e! grupo a partir de los cuales el individuo puede sobrepasar. En de nuevo mgr~so o tuVO una
el apéndice uno aparece la tabla que muestra el porcentaje de casos que se ubi- podríamos deCIr que:
can por debajo de los diferentes valores de la desviación estándar en una curva b ' 90% a todo el grupo, es decir, se ubicó e~ el percentil ~O, o
normal. Dicha tabla facilita comprender y traducir cualquier puntuación
expresada en unidades de desviación estándar en su percentil equivalente
b\ ~~ :~i~Ós~n una desviación estándar de 1.4 por enCIma de la medIa.
sobre la curva normal. Considérese la serie de puntuaciones de prueba de lec- . ra de los dos enunciados proporciona un significad? a s~ califi-
tura para las que habíamos calculado la media de 34.6 y la desviación estándar Cua1qUle . _ está muy por encima del promedIO, solo una
de 9.6. Supóngase que una persona tiene una puntuación de 48 y, debido a . 'n en el grupo·, este nmo .madamente tiene mejor
caclO . promed·10 que e'} .
que la media del grupo es de 34.6, se ubica en 48 - 34.6 = 13.4 puntos por décima part~ del ~ruPh;r:::~~ decir lo mismo, deb~do a que aJ?bas están
arriba dela media de! grupo. El punto 13.4 por e! que dicha persona sobrepasa Entonces, etIste~ os tuaciones. cada una tiene Ciertas ventajas sobre la
a la media es igual a 13.4/9.6 = 1.4 desviaciones estándar. Debido a que esta
persona está 1.4 desviaciones estándar por arriba de la media, podemos supo-
~~::~f~ ~ea:x~~rn:~t;~s con.má; detalle en el capítulo 4.
ner que sobrepasará al 92% de los casos de nuestro grupo, aproximadamente.
¡Si lo hacemos en realidad, el conteo muestra que esta puntuación es mejor
que el 47/52 = 90.4% de las puntuaciones en-nuestra serie de datos.) MEDIDAS DE RELACIÓN
Una puntuación expresada en unidades de desviaciones estándar tiene el d· na medida estadística para expresar la relación que
mismo significado que una serie de puntuaciones en otras unidades. Por lo Ahora estu Iar~mos ud untuaciones Así en nuestro ejemplo teníamos
tanto, si un niño se ubica en la mitad de la primera desviación estándar por existe el!-t.re d?,s conjuntos e p na de arit~étic~ para cada alumno. ¿En qué
encima de la media de su grupo en aritmética y tres cuartas partes de una des- una ~ahhcayon de lectu~d~s~mpeñaron bien en aritmética también lo hicie-
viación estándar por encima de la media en lectura, podremos concluir que es medIdi lo~ a u;n~oess~u~asso tenemos dos calificaciones para cada individuo 'IY
mejor estudiante en lectura que en aritmética. Si el mismo niño estaba a la ron en ec ura: l' de dos dimensiones el cual se muestra en a
mitad de una desviación estándar por encima de la media del grupo en aritmé- podemos grahc~r1as en pano d uestro grupO C~rol A. tenía una califica-
tica en el tercer grado, pero ahora sólo está un cuarto hacia arriba de la media
en e! sexto grado, podemos decir que ha disminuido su aprendizaje en aritmé-
f~~ra 2.7 . La Pbn~eía perso:;:
ClOn en la prue a e ectura
3;; una calificación en la p~ueba de aritmética
X en la figura 2 7 marcadas
tica en relación con su grupo. La desviación estándar transforma las medidas de 3. Sus c~li~icacio.net d~ [:~;~:f:~~le~~~r~~acon 3 en el eje ho~i~ontal d~ l.a
en unidades, mediante las cuales las puntuaciones se pueden comparar direc- con 132 en e. eje,Vt.ertlcEa la misma figura hay un punto que representa las cahfi-
tamente de una prueba .a otra y de una ocasión a otra. esca a d e antme lca. n
En resumen, las medidas estadísticas más empleadas para describir la
variabilidad de las series de puntuaciones son los rangos semiintercuartilares caci~e:n~: ~:~~~~~~ desempeña bien en aritmética y en lecn~ra, ~uf faJi-
y la desviación estándar. El rango semiintercuartilar está basado en los percen-
, t d s por un punto en la parte supenor e a o
ficaciones estan, r~presen a i~o ue se desempeña deficientemente en ambas
derecho de la :rafI~a. ~~ ~arte fnferior del lado izquierdo. Cuando. existen
tiles, específicamente en los percentiles 2S y 75, y se usa con más frecuencia
cuando se escoge la mediana como medida del promedio de! grupo. La desvia- pr~e?as,. se u Icara en na rueba bajas en la otra, las puntuaclOnes se
ción estándar es una medida de variabilidad que está relacionada con la media cahhcaclOnes altas. en u P ~. en las partes superior izquierda e
,.i aritmética y es muy útil en el campo de las pruebas y las mediciones, primor- ubican en las esqumas r~stantes, es ecu,. 1 f ra 2 7 se observa cierta

:~~d'~~~~~~~~:~ri:t;!:::;!E ~~~~~j.,~~ ¡;;~l~::~~f;ia:~


! dialmente porque proporciona una unidad estándar de medida que tiene un
significado comparativo de una prueba a otra.
supenor eree, 'iones la relación está muy lejOS de ser per ecta.
embargo, hay ~ucdhas exdcoepcporlo q'Je necesitamos una medida estadística que
INTERPRETACIÓN DE LA PUNTUACIÓN Todo es cuestIon e gra ,
DE UN INDIVIDUO expr~~~:~I~g::~~Í~~:~l~~i~~~alú~ ~l grado de relación se denomina co~fi-
. d I · ' () Este coefICIente puede tomar valores que fluctuen
Los problemas para interpretar las puntuaciones o calificaciones de un ci1edte +e fo~ret ac~nl rÚn coeficiente de + 1 significa que la persona que
'¡ individuo se tratarán con más detalle en e! capítulo 4 cuando estudiemos las
normas de las pruebas y las unidades de medición. Por ahora, será suficiente o~~u~o las c~~f:Cacio~es más altas en una prueba también las obtuvo en la
r
1
I( 60 MEDIDAS DE RELACIÓN 55
• · n bastant e y no se ubican directamente sobre la línea de bajo-
56 nes. se dlspersa '
1 lto Es necesario señalar que las puntuacIOnes
baJO a a to-a . o cal'f"
1 IcaCIOnes
• den a un coe f"IClente d
52

48
,- marca das en la fl
+ .,..
numen co, en e a 1
'gura

pe'
2

ndice
..
7 corresp

dos se
on
O 46 Para los lectores. que quieran realIzar
describ en
. 1
los
e iaCIOn
corre ' , de
os ca.'1c~1os como un eJemp
.
procedImIentos para calcular el
1
o
• • coeficiente de correlacIOno .
44
I
i;
0
5
TI • • • 4
Alto Alto
~ 40
• • • •••
•••
c: l-
Q)

• • 4
• ••••• •••••
~

. ..-:.:..-.........
36 ••••• ••••• •
: .. :..-..
.e ._ .- •••_ •
t: c:
o
• • •• • ......
....... ..\ :::::: ~:
'g 32
::>
c:::> • ~
•• • .- .- .-:::: ::.-
.. ..-:. :..: ... . ....
:::: :..-.
el. 28
• • •
• •• •••
• • •••
•• • ••••• •••••
24
• • • • • • ••• •
•• •
:"~
20

16
. '


Boja
Boja
• • •
(o) Alta
Boja
Boja
• • •
lb) Alto

......-:--..
• ••
12 O Alto.. .------ --.--.- .-;·;-. ' Alto
.~ . 4 8 12 16 20 24 28 32
Puntuaciones en aritmétic a
36 40 44 48 52
....-. .
Figuro 2.7. Punteo de los puntuac iones en lectura. en oposición o los
puntuaciones en
• • a :.: ••••
. :.:::::... .
... .
..::.
:
-:-..
..
. .... .
•••••• •
..
........
1
aritmético, -

1..
' :' ; .•_:::-1:: .a •
::..:
~

I •a .•••••
_ • • • •••• ...-- ..
· .. :.• :•....

otra prueba, y que la siguiente persona con calificaciones más altas en •
• •••••
II prueba también lo fue en la otra, y así sucesivamente. Una correla ción de
-
una
. :....
• •••••
significa que las calificaciones estarían en una relación totalme nte inversa 1 a ••••
la anterior; es decir, la persona con la calificación-más alta en una prueba a
dría la más baja en la otra, y así sucesivamente. Una correlación cero ten- Boja
• ••• le· •
repre- Bajo Baja

I Alta Alto
senta una falta completa de correlación. Los valores intermedios de r Bajo (e) (dI
miden
l ' la relación que existe en puntua ciones discrepantes. I entativos del coeficiente de
! En la figura 2.8 se represe ntan cuatro niveles de relación. En la figura Figuro 2.8. ~istribución de ,~undtuaocioO~~S:) o~~~~~~ ~~~~30; e) correlaci ón de +0,60;
2.8 a, la correlación es cero y los puntos se dispers an sin ningún patrón correloClon: o) correloClon e . . c
defini- d) correlación de +0.90,
1"" . do, más bien forman un círculo¡ aquí se encuen tran todas las combinaciones
alto-alto, bajo-bajo, alto-bajo y bajo-alto. La figura 2.8 b corresponde
correlación + 0.30; en esta figura se puede observ ar casi imperceptiblem a la Existen tres situaciones import antes len las qd~~ los cOLefiCpi:::~:=i~~~~~
una tendencia de los puntos a agruparse en una dirección bajo-bajo, alto-alto
ente
., , . 1 d con las prueba s y as me IClones. a ~
~r~~jl~:!~~i~i~~~~:~~~~~~e::~nbo~:r1~e:~[{i:~~=~~~~~I~~:~~~
.
Esta tendencia es más marcada en la figura 2.8 e, que representa una correla-.
ción de + 0.60, Y aún más en la figura 2.8 d, que representa una correlac
ión
de + 0.90. Nótese que si las correlaciones fueran de - 0.90, la dispersi d la medida de velOCIdad de una prue a m an 1
ón de
~e los niños corran la misma distancia dos vec~s, tal ~ez en do~' ,d'l~~!~~:::~.
,
los puntos sería muy semejante, pero los puntos se distribuirían a lo
largo
de la otra diagonal, de la parte inferio r derecha hacia la parte superio r izquier- ~os. Al correlacionar las dos series de datods.tdendnamos~!b~:~~locidad. La
da. No obstante, aun con una correlación tan alta como ésta, las puntuac la precisión y la confiabilidad de esta me 1 a en esa p
io-

_1 .\ ' , . \ '
. . ......... , .. ... . ...: , ." ... .
, , ·. · .•.:> : . ';1.(.·. ', ·. •. , . " •.• . ', ' " .•. . • •
56 CA P. 2. TÉCNICAS
ES TAO íST ICA S BÁS
ICAS
segunda sit ua ció n es aqu 57
diferentes pa ra evaluar ella en la que ~e est ud ia la relaci?n ent~e do s
una pru eb a de ap titu d a co mo predlctor de la otr a. AS1, po dn am os medi~as
~
~c~o~e~lic~ie~n~te~s~de~c~or~re~lo~ó~ón~p~a~ra~v~ar~ia:b:le~
un
esc
versidad. La correlación ola r co mo pre dic tor de las cal ific aci on es en udiar
est Tab
_ lo 2] . s~s:el:e=cc~io~n~a_d_as__ __ __~~::::_____
de la pru eb a con las cal la uni- (oeficiente
indicador de la utilidad ific
de la pru eb a como pre aciones pro po rci on arí a un
La ter cer a situación es

organiza la co nd uc ta. ¡Q
bales y las de ha bil ida d
en trabajos me cán ico s
relación en tre los ritmos
ste en tre variables pa ra

espacial?, ¡qu é tan cer can


y la co mp ren sió n de
a
dic

co
tor .
po r la rel ac ión qu e exi pu ram en te descriptiva . A menudo no s intere
ué co rre lac ion es en co ntr mprender me jor cómo se
am os entre las me did as
samos

es la relación en tre el inte


los diseños me cán ico s?,
ver-
rés
- Lo eslO turo
de gemelos idénticos
Variables

b de inteligencia en gemelos
PuntuoClones edn los p~ue dO\e idénticos
puntuaCiones e prue o e cturo en el tercer grado en oposición con el
de correlación

0.95
0.88

de de sar rol lo físico y de sar rol lo int ele ctu al? ¿ex istirá 0.80
problemas de la invest sexto grado
iga
esto es po sib le, po r me ción de la conducta hu ma na pu ed en est ud chos
Mu Ron o en uno eIose de secun doria en oposición con las calificaciones del
arrollan en sit ua cio ne s
dio de las relaciones ob iar
ser va da s a me did a qu se, si ~oestro de hábitos en el trobo~o. 0.73
na tur ale s. e se des- _ eso en niños de 10 anos
En cad a ca so , no s en fre tstotbura y Pco' . . 0.60
qu e ob ten em os . Supóng nta mo s al pro ble ma de
evaluar las co rre lac ion Prue o de lculos aritm .
éticos en oposición con lo prue
bo de inteligenCIa
.
50 me tro s pro po rci on ase qu e do s series de pu ntu aci on es en la car es no verbal (octavo grado) 0.54 ..
an un a co rre lac ión 0.8 rer a de de hermanos ajustado o su
Supóngase qu e las pru 0¡ ¡será sat isf ac tor ia Estatura. edad 0.50
eba o no?
un ive rsi tar ios ; ¡estaríam s de ap tit ud se co rre lac ion an 0.60 co n los PuntuaCiones de prue b' o de inte ligencia en oposición o nivel ocupaC.
os co nte nto s' o de san gra dos ional
hallan, en pa rte , en los
dia gra ma s de dispersió im ad os? Las res pu est as se de los pa.dres
Fuerzo de agarre en oposició
0.30
alt a sea la co rre lac ión , n de la figura 2.8 . Cu an n con lo velocidad de carrero 0.16

pe nsa mo s qu e las discre s ce rca na estará una va ria ble respecto de la to más , I o ·en oposición
o CI de
pancias qu e se alejan de otr ;:sla ur ., "tre el largo y el anc Binet 0.06
y alta-alta so n "er ror es" la lín ea diagonal de ba a. Si Prop0[(1on e ho de lo cabezo en oposición o . .
, ést os dis mi nu irá n a me ja-baja inteligenCia 0.01
má s alta. Sin em ba rgo
, estas dis cre pa nc ias so did a que la co rre lac ión sea rur¡\uOllOne~ oe prueoa ... reciutos en ia prueba de ca ,./.
.
n . .•
de íos
¡¡oc.. d la
. I •
/
do ras aun co n un coefic n
iente de co rre lac ión alt tod av ía ba sta nte desalenta- Fuerza Armada en oposlClon con el número de grados repelido/ons ene lo
2.8 c. Es im po rta nte o, po r ejemplo, el de la
que sie mp re ide nti fiq
co mo que co mp ren da mo ue mo s estas dis cre pa nc figura escuela
Interés del artista en oposició . . - 0.27
ias
ba de ap titu d y calific s qu e co n co rre lac ion es co mo 0.60 en tre un , así n con el ¡nleres del banquero - 0.64
aciones esc ola res , hab
pe ño escolar dif ier a en rá mu ch os niños cu yo a prue-
ma yo r ca nti da d de lo qu e se ha ap desem-
pru eb a. rec iad o en una
Sin em ba rgo , tod o es RE SU M EN
interpretarse en co mp ara relativo y cualquier co efi cie nte de co rre lac ión
ció n co n los valores qu debe . '1
La tabla 2.7 co nti en e un e co mú nm en te se ob tie Al inicIO de est e ca plt -.1
los diferentes tip os de nú me ro de correlaciones qu e ya han rep or tad ne n. u o sena ~mo s las diversas cla
t star en lo qu eses de pre gu nta que
var nos p 1an tea na' mo s v, qu e no s gu sta na se refiere a un asser
pu ntu aci on es qu e se co iables, en las que se de scr ibe la na tur ale za o para de untuaClOncs de un co n e
. 'b. A on tin ua ció n
rec on sid era mo s est as .
Ie
rrelacionan y el coefic de las ¡;u :ta s y veremos qu é a pIDe a. e ple-
análisis de esta tab la no ien
s dará alg un os anteceden te qu e se ha rep ort ad o. Un respuestas po de mo s dar
.
cie nte s de co rre lac ión . tes pa ra int erp ret ar los ,
El
me did a que el lec tor se coeficiente tendrá gra du alm en te más sig nif coefi- l . zCómo se "comport~ .
est ud iar y tra ba jar má encuentre co n coeficientes de diferentes tam ica do a n las, pun;~fzc~ro::~s"~u:t~aué ci~
se pa rec en ", Para
s con las pru eb as. añ os al co nte sta r esta pre~nta,
P?demOS, or~ficarlas en nes en un a distri-
bu ció n de frecuenClas un his tog ram a (fi gu ra
(ta
2. :C uá l es la puntuaC bla ,2.3) 'Ji gr 1 2.1) .
lOlJ tIp lca d e grupo.!! :cu ál pu ntu ac ión rep res en -
ta la l:ditad del grup~?
Pt
la me dIa na ~el percen r~~eprles~~~~a;~~~~tt~~~~~;odicir, el pro
L
od em os cal cu lar
t.l ;) o a t s pu ntu ac ion es? me dio .
'La s palabras en est 3, ¿Q ué tan to se dlsp~r , ¡cómo se di$ tnb u-
Cu and o una correlació e enunciado imp lica n que queremos quc las ven? Pa ra representar san !:u es T un tua cio ne s los est íst
n exp res a la confiabilid las
par a predecir los res ulta ad o la consistencia de correlaciones sea n altas.
una
la d.l.
de sar rol lad o el rango sem sperslOn df ~e es la mi tad de la disadtan ico s ha n
sea la correlación, má s
dos de interés para nos
con
otr os, es cie nam ent e vál prueba o su pre cis ión
ido que ¿na nto má s alta el pe rce nti l 25 y el 75 , llm~erC1!-art~ ar, s~ándar un cia en tre
tien e correspondencia con for me s quedaremos. Sin embargo, en otr os ya . esvlaClOn e tip o de pro me dio de las
lo "bu eno ', y pue de ser contextos, lo "gr and e" de svi aci on es de las pu . la 'media,
to al tam año de la cor no
rela ció n, e inclusive que que no tengamos nin gun a preferencia en cua nt.uaclOnes respec~o :ci
prefiramos una má s peq n- 4. iC óm o se ter mm a ón ind ivi
que da.p~~~s de tal lad du al es alta o baja? A
pesar de qu e estede pro ble ma se estun
ueña.
u tar a am en te en el cap ítu lO
4,
.
58 CAP. 2. TÉCNICAS ESTADíSTICAS
BÁSICAS
59
hem os vist o que las pun tuac ione
s indi vidu ales adq uier en su sign
med ida que se les trad uce en rang ifica do a PR EG UN TA S Y EJERCICIOS
o de perc enti les, es deci r, el porc
suje tos del gru po que sob resa enta je de
len, o en una pun tuac ión está . de punt uaci ones indicada
cuá ntas desv iaci one s está nda r se nda r, es deci r, 1' Para ca da sene
5. ¡En qué grad
ubic an por arri ba o por deb ajo de
la med ia. .mter 1 d clase más conv enie nte s abajo'
el
selecciónese la que parezca que es.
f '
o son sem ejan tes va o e y establezcase una orm a para registrar 1as
grado los mis mos indi vidu os alca dos seri es de pun tuac ione s?, ¡en qué puntuaciones: ,
med ida de rela ción se obti ene con
nzan pun tuac ione s alta s o bajas?
Una
el coef icie nte de corr elac ión, el cual
índi ce num éric o que indi ca cóm es un Sím bolo Núm ero de casos Ran go de pun tuac ión
o cov aría n dos vari able s. Este índi
tant e para desc ribi r la prec isió n o con fiab ilida d de una ce es imp or-
que una pun tuac ión de pru eba pru eba ; el grad o con Aritmética 84 De 8 a 53
pred ice otro s fact ores (com o cali Comprensión de la lectura
esco lare s o éxit o en el trab ajo) I Y fica cion es- 57 De 15 a 75
la rela ción de cier tos rasg os ent re Inventario de mtereses 563 De 68 a 224
indi vidu os. un grup o de

E ada una de las distribucione


SÍM BO LO S ES TA DÍS TIC OS
l , '/
al
2. d n c . b el pun to de los inter s siguientes, indíquese: e~ tam año del inte.rvalo
valos mos trad os, y el los hml tes reale
e case s de los mter -
El estu dian te que lee man uale s valo s (es decir, las líneas diVls
"
onas entr e e11 OSI:I
de prue bas, libr os o revi stas edu
trat an acer ca de las prue bas, se cati vas que
enc ontr ará con vari os sím bolo
nale s que se refi eren a los con cep s con ven cio- (al 4-7 (bl 17-1 9
tos esta díst icos o a las ope raci one (el 50-59
nua ción se pres enta n algu nos s. A con ti· 8-11 20-2 2 60-69
de los sím bolo s más com une s.
defi nici one s ayu dará a leer los Esta tabl a de 12-1 5 23-2 5 70-79
cap ítul os pos teri ores , así com o
exte rnas . las refe renc ias

Sím bolo Defi nici ón


N Núm ero total de caso s en un grup
o. Con base en las punt uaci ones de orto
f Frecuencia. Núm ero de casos con grafía dadas en la tabla. 2.1, h~gase
3. bución de frecuencias y un histo unaldistri-
erior e infe rior así como la med ia a .. Ca~c~lense la medlan.a y o~ cdartl es su-
una pun tuac ión específica en un gram
inte rval o de clase particular.
x Pun tuac ión crud a de alguna media. in los info rme s del Bureau of Cen sus antm etlc a y la desvlaclon esta n aL
x Pun tuac ión de desviación que indi 4. romedio . ¡Por qué se usa ésta se usa la me~ian~ pa~are~ortar los
ca la ubicación de! individuo en en vez mgresos
rela ción con la med ia del grupo. tna prueba de vocabulario de 50 reac de la medIa antm etlca .
x' Pun tuac ión de desv iació n a partir 5. ciones ue se obti enen varían desd tivo s se aplica a 150 alum nos y las
de un
rio, a menudo expr esad o en unid ades punt o de refe renc ia arbitra- e 18 hast a 50. Se ublca~ 97 alum~os. puntl¡a-
40 50Q unto s. ¡Có mo sería esta distr e,ntre os
Amp litud o tam año de un intervalo de intervalo. ibuc de puntuaclOn~s!, ¡que dma ~llec-
tor~espfcto a la adecuación de esta prueb~ ión
i
para ~l gru!~l, {ua l
Xo M de ciase.
que!, ¡que me I a e van~eb~ j¡~aT~~~~fa~~
Med ia de grupo. tendencia cent ral más adecuada!, ¡por
Md Med iana del grup o. a
Q, Cua rtil inferior, e! percentil 25. 6. t~%:estro de secundaria aplic
0., Cua rtil superior, el percentil 75. ó la mism apru eba de aritmética a dos
un grupo. Los resultados fueron los secciones de
Q Ran go semiintercuartilar. La mita sigUIentes:
p d de la diferencia entr e Q, y Q,.
PercentiL
Un subíndice Mod ifica a un símb Secc ión A Sección B
olo y dice cuál es e! valo r o el indi vidu
al que nos referimos¡ por ejemplo, o específico
P
pun tuac ión crud a para la persona 1Il es el décimo perc enti l y Xi es la Mediana
64.6 64.3
DE o s Desviación está ndar para una serie
¡. Media
de puntuaciones. 65.0 63.2
(J
Desviación está ndar de la població Perc enti l75 70.0
n, 69.0
para referirse a una mue stra en part aunq ue algu nas veces se usa Percentil 25
61 .0 54.0
Porc enta je de suje tos que obtienen icul ar. Desviación está ndar 10.5
un reactivo de prue ba corr ecto . 6.0
Porc enta je de suje tos que obtienen
un reactivo de prue ba incorrecto. A . t' r de esto s dato s :qué pued e
Coeficiente de corr elac ión. deci el lecto r acerca de estoS subg,rupo
Coe ficie nte de confiabilidad. La corr inf~~c~ciones tien en ~;tos datos en la rense s?, iqué
ñanz a de los subg rupo s,
vale ntes o dos aplicaciones de una elac ión entre dos prue bas equi-
prue ba. En una prue ba de biología que se
"Tó mes e la suma de ... "
7. obtu vier on una med ia de 52 y una aplicó a 2 500 estu dian tes de sexto, grad~ se
desviación está ndar de 10.5 . ¡A cuan
tas es-

b . ...
" • • j , •... . • -
60 CAP. 2. TÉCNICAS ESTADíSTICAS BÁSICAS

viaciones estándar por arriba o por abajo de la media se coloca a los alumnos
siguientes?

Alicia 48 Enrique 60 Jorge 31


Alberto 56 Juan 36 Óscar 84
8. Si la distribución en el ejemplo anterior es casi normal, ¡aproximadamente qué
porcentaje del grupo sobrepasó cada uno de estos alumnos?
9. Si las puntuaciones están normalmente distribuidas, ¡qué proporción de casos se
ubicaría por debajo de cada una de las puntuaciones siguientes para una prueba
con una media de 72 y un'1 desviación estándar de 121 a) 64, b) 75, e) 89.
3
10. Explíquese el significado de cada uno de los siguientes coeficientes de correlación: f ~ __ •.

al La correlación entre las calificaciones de una prueba de lectura y una prueba de


inteligencia es + 0.78.
bl Las calificaciones de los alumnos en "buena ciudadanía" y en "agresividad"
Cualidades deseadas en
muestran una correlación de - 0.56.
el Las correlaciones entre la altura y la calificación en una prueba de aprovecha-
miento es de 0.02.
los instrumentos de medición

LECTURAS ADICIONALES

Downie, N. M. y Heath: R. W.; Basic 5tatistical methods, Harper and Row, Nueva
York,19 7 4.
. '. os usar una prueba para recopilar información a fin
Guillman, E. S., Statisties foz- teachers, H'irper and Row, Nueva York, 1973. SIempre que quelam .. _, ' . "al roblema de cual
Guilford, J. P. y Fruchter, B., Fundamental statisties in pyscholog y and edueatiOll, de ayudarnos a tomar deCIsIones, nos c~trentaremo~. d P ., to'mar la dcci-
McGraw-HilI, Nueva York, 1973. ' usar o SI. rea 1mente h ay- u na pruel1a. que nos '1¡¡,'~l·d.
P rueba ti e
d de influir en ia
<1

Koosis, J., Stati8tics, John Wiley &. Sons, lnc., Nueva York, 1972. ., h d' -. d ' 'as pruebas que tienen POSI)ll a _
SlOn. Se ¡¡n Isena? \ ar¡l . . Iq iera de ellas nos ayudará a contar con
decisión. Nos gustana sa )er SI eua, u " " 'd sar~ :cómo
información úti!: ~n cuyo caso ;cua1 sera la melOl que po amos u " ,
hacer la selecelOn: . . ~ 'f' _. _. n ,,_ en clIenta
Lxi-mil 'TI"chas cons!deraclOnes esped Jeas a tvmal. _.
en la e'i,)-
h _ ... ) .
:-: ~ ~ ..-~.~,,: ',,, 0'1 este j·e--.::to las englobaremos hajo ,res enca~,eL<!,_,n~

'; :~~prt(''i ~-1~ -j'jS prl'ebas de cvaÍtwción se conS1Clcraran Oel,\ili.lG~lln(;n , l '" ,_.,,'
~~~;;~~csuprÓ~.;ii;'a~. ~

VALIDEZ
. , . pOl'ta~tc
r·.l pnn1cravrnasnn "'I·'S·;O' n "¡uc ~~.dehe uno ~pLl
~. í1tCárSf con 1" >"l :"
pect~C;, cualquiér procedimiento de prueba ~e rehere a su Y,l~;de:::, r';~ ' ;';
1.1 · L. ........ .. u '- "",",. , 1"'1 " 1
1
;L· " _"".l

61
b
62
CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓ N VALIDEZ 63

debe,mos contest ar las siguien tes re n '. lllde '


medIr?, ¡en qué grado lo mide l ~m: t~!,
so o o
líque
la¡rueb a 10 que deseamos
eseamos medirl
petcnci a; Pr~mero debemo s llegar a un acuerdo en cua!1to a las habilidinglés,
los conocim Ientos que compre nde el uso correct o y efIcaz del idioma
ades y
Cuando medim os COn Una " zl d
Despué s tenemos que e~~minar la prueba para ver si las ~abilidades,
el cono-
para conocer su longitu d no te~~g a ~ acero la ~arte superio r de un es'critorio
Fmalm ente, tenemo s
nSIOn se encuen tran present adas.
mide la longitu d del escritor io ~os amen? ! uda de que la regla, de hecho cimien to Y la compre
cionada con nuestra decisión Yu~ e ~<?s dara m formac ión directa mente rela~ que igual,ar el análisi s .del conten ido d~ la pru~ba al conten ido
del curso y
rio en medio los objetIvo s mstrucc lOnales y ver que tan bIen represe nta el primer o al
?e dos ventana s de la habitac' iJIn [U lera ,ser J?oner este escrito dos como
segund o. En la extens ión en que nuestro s objetiv os, acepta
Instrum entos de medidas ha co~f a eden~nfla acumul ada con este tipo de será
curso, estén represe ntados en la prueba, la prueba
una her~amienta para medir la Io~;:ud o SIn ugar a dudas su validez como metas para nuestro
Dado que el análisi s es esencia lmente
vam r ' válida para usarse en esa escuela . al o
Supongase ahora que
prueba de lectura para medir el raciona l y lleno de juicios , esto se llama alguna s veces validez racion
aprovec hamien to en un grup~~ a aI? _lcar una
seleccionen ciertas respues
marcas de papel en una hoja d
tas ba:a~~~ o:, r
sta pru~ba requiere que los niños
n os pasajes de lectura y que hagan
lógica . El término valide z de conten ido tambié n se
se hace en gran parte en términ os del conten ido de la prueba, Sin porque
de maner a
usa,

tan
ya que

estrech
el

a,
análisis
embar-
ido
l~l?iz adas correct ame~::s :yestas : Contam os el n~mero de marcas de go, no debemos pensa~ en el conten
conte-
contest
es aSlgna mo~ a los rüños como califica- puede ser que estemo s mteres ados en un proces o tanto como en el
ClOn el número de sus respues tas nido simplem ente. Así, en el campo de la expres ión idiomá tica del inglés,
cación Como una medida de s corre~~as. ASI, consideramos esta califi- del
noS pueden interes ar elemen tos del "conte nido", tales como reglas e
por sí misma no es la compre:sf~:pre~ro~ de la lectura, pero la califica
ción s con "ej"
uso de letras mayús culas, comas o la ortogra fía de las palabra
?uct~, Entonces, cualqui er juicio ~:~ sr~so e registr o de una I1!I?-estr a de Con- ados en
compre~,slOn tendrá que "je" en sus combin acione s; pero tambié n podem os estar interes
mfer~rsea partir de esta calificación, La vaI1~~~od ea /a a PUntuac lOn no es.una evi- habilid ades de "proce so", como el arreglo de ideas en orden lógico, escri-
de?cla dIrecta, pero es algo que debem presen ten un solo pensam iento unifica do o escoge r la
os tomar en cuenta para establecer una bir oracion es que
eVIdencia adecuada, palabra más apropi ada para represe ntar el signifi cado deseado . En un sen-
lo que
Considérese otra vez el inventa rio tln;,.~o. d ~ persona lldad tido, conten ido es con lo que el alumno trabaja , y el proces o es
l' .

porclOnar una apreciación del ajuste emocIO 1/ .' _ .....


p
que busca pro-
. e1eva1uado COntesta una serie d nal" . En eSt e tIpo . de 'mventa- hace con ello.
. d -
no, ientos El problema de apreciar la validez de conteni do está vinculado estrecha
o de la conduc ta que le Son caract e ,enyncla os acerca de SBS sentim rá en el capí-
Con base en varios tipos de procedo er~stIco s f
que no le son caracte rísticos mente con el de pr.eparar los planos de la prueba, el cual
tulo 7, y después constru ir una prueba que se ajuste a esos planes. La haga
se estudia
propia
damen te en el capítul o 11' ¡mlentos, os cuales analiza remos detalIa~ se
nal Se o'bct!er tas respues tas s?,n clave COmo indicad ores de prueba de un maestr o tiene validez de conteni do en la medida en que
desajus te emocio una puntua clon po med'10 de la observa- un análisis concien zudo y detallado de los objetivos del curso y que
éstos se
" d ' . lene ' ,r , la
ClOn e cuantas respues tas de e'sta s sel un mdivid u<?' pero h acer cier- incluya n en el plan de la prueba, así como en que se ejerciten el cuidado
ta s m~rcas en el papel está bastan te le' eCClOna d ir los reactivo s de prueba que puedan dar
l )OS e mostra r en realIdad un disturbio habilid ad y el ingenio para constru
emocIOnaL Debem os enCont as de validez para una determ inada escuela o para un program a en
que la ejecución en la prueba ;:~l:n~u~ modo de establecer la extensila con-
ón en muestr
nte a los
medir 'C' n e corresp onde a}a cualida 9 de particu lar, en tanto el contenido de la prueba corresp onda y represe
ducta que deseam os os aceptad os para esa escuela o para ese program a,
proced imiento de medició~/ omo podemos determ Inar la validez
de ese objetiv ial-
Debe quedar claro que la validez de conteni do o racional es primord
nte para las medida s de aprovec hamien to, En particu lar, la
mente importa
con el dominio de uno o de más
Tipos de valide z validez de una prueba formativa concer niente
o referida
objetiv os educativos específicos, el tipo de prueba que hemos llamad de la
l' al criterio o al conten ido, se evaluab a sobre la base de qué tanto las tareas
Una prueba puede relacio narse c os; pero para las pruebas de aprove-
en cualquiera de. los siguientes t on ~ gu~ aspe~to de la conduc ta humana prueba representan los objetivo s definid
ados en
sedtldos, a) valIdez de conten ido, bl vali-
dez relacionada al criterio y e) V:I~d ez chamie nto referidas a la nonna, tambié n tendrem os que estar interes ra-
juicios más profund os conside
remos cada uno de los tip~s de val' d e con.stru~to, A Continuación analiza- qué tan bien la prueba represe nta lo que los
on-
apropia da ~ae:a ~~~c~~n :lI~:. a fin de determ inar para rían que fuera un conocim iento y una habilidad importa ntes. Si la corresp
qué clase de prueba es io,
dencia es buena, la prueba se conside rará como de alta validez; si, al contrar
ia es deficien te, la prueba tendrá que ser califica da como de
la correspondenc
Valide z de conten ido validez muy baja,
uso
Al constru ctor de pruebas respons able de su publicación y del amplio
' dificult a mucho ueterm inar las metas amplia mente acepta-
.Considérese una prueba diseñad a que se le dé se le
del IdIOma inglés. ¡Cómo podem os d I?ara ~edlf la ~ompetencia en el uso muchos
eClr que tanto mIde la prueba esa com- das de instrucción en el campo en que se constru yó la prueba, Existen
64 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN
rr 65
~~~~~~e fuentes a las que frecuentemente recurre; entre ellas se pueden men-
Validez referida al criterio
a) Los libros de texto más am 1ia frecuentemente nos interesa usar una prueba relacionada con una deci-
b) Cursos recientes de estudio p ar:;ernte usad~s en el campo. ,ión que implique predicción acerca de resultados futuros específicos. Elabo-
estados, condados v sístemaPs de g¡ andeds dumdades escolares, es decir rJJl10S una prueba escolar de aptitud para predecir qué probabilidades tiene un
R ' . a cm él
e) eportes de grupos de estudios esPe .. 1. . .
'
. l',tudi,mte de preparatoria de tener éxito en una universidad determinada,
los anuarios de algunas socJ·edade . cdJa es, que a menudo aparecen en donde el éxito está representado, por lo menos aproximadamente, en un pro-
di G s e ucatJvas.
J11ediO de calificaciones de grado. Aplicamos una prueba de selección de per-
rupos .de maestros que dan instrucción d .
e) EspeCIahstas universitarios de los de a e e~e Curso. sonal para escoger a los operarios de máquina que puedan tener éxito, según
dad que se interesan por el entrena¡rffe rtam~nto~ d,e1 Est~do o de la ciu- un criterio representado por lo que sería alta producción con poco desperdicio
tros en ese campo. nto y a supervlslOn de los maes- \. un mínimo de fa ltas de asistencia. Para este propósito, nos interesa muy
i1 oco la apariencia de esta prueba.; Estamos interesados casi por completo en
el grado en que la prueba se correlaciona con algunos de los criterios escogidos
Colectar información de estas fuentes d . . rara medir el éxito en el trabajo. Así, se toma alguna otra medida, como el
pruebas la poslbilidad de h"lCer l. desarrolla en el constructor de
la 1
P n, preparar os reactivos para la rueba O d. " .en_ .;t'ermmos
e un p an e prueba v . d criterio de "éxito", y juzgamos una prueba en términos de su relación con
e ese esa medida criterio. Cuanto más alta sea la correlación, mejor será la prueba.
comllI?~dad a otra, no se puede pUblic;r a. as .Ias valIaClOnes de una ri La evaluación de una prueba como predictora es principalmente una eva-
tnbuclOn que se ajustara exactame . un 1 )r.o a nn·el nacIOnal para su dis-
cu.rso de estudio local. En este senti~~e ~ los ~bJe~lvo~ ~ al Contenido de cada luación empírica y estadística, por lo que este tipo de validez ha recibido el
C10n él mvel nacional es siemp¡'e me ' ~aI·dP' ueba dJsenada para tener aplica- nombre de validez empírica o estadistica. El procedimiento básico consiste
que una prueba diseñada especific nos va 1 a. para una comum·d ad específica en aplicar la prueba a un grupo de personas que ingresan a un trabajo o a un
go, la prueba comercial bien hechmentdepara una SItuaclOn locaL Sin embar- programa de entrenamiento y, posteriormente, seguirlas observando para
aparecen'rl .. a pue e tener comnnnpntpc ~~ __ ... . obtener de cad~ una, una medida criterio de éxito específica, en el trabajo o en
, - . .repetl~amcnte en jos diferentes libro d ' .- - -~, .. ~v '-VlJl U!le~ que el programa de entrenamiento, y luego calcular la correlación entre la puntua-
estudlO, de manera que es posible ca .. s e texto y en lo s cursos de
Componentes. Esto rcpresen~arí; el n stfUl1 una ?rueba .~e1acionélda con tales ción de prueba y la medida criterio de éxito. Cuanto más alta sea la corre-
t Í3ción, más efectiva será la prueba como predictora.
patrones locales específicos. ema ceno al comun de los dJferentes
Dicha relación puede graficarse de varias maneras; por ejemplo, en la grá-
, , Entonces, la relación entre enseñanza v j. _ '. fica de barras de la figura 3.1 se muestra el porcentaje de personas que fallaron
lllUy estrecha El conten'd d· 1 l el construCclOn de pruph·,s "S
¡ , . 1 l o e a vrue)<1 se 'ncriva:l ' h _,.,a~_ en el entrenamiento como piloto de Fuerza Aérea en cada uno de los nueve
o (le lO que sc propone ens"n-" 1=1" . - . '"'. . l e LO que se _a enseñado
.' Id " _, ,,r ..~ plo"lama 'n- tr" -c 1 1 ,.
déL e 'os materiaies de 'l r',r,h. _, / .,' .. ':.....: ..' ! ! : , .,L lona es ú1 rucnte origi-
niveles de puntuaciones en una batería de pruebas de predicción. La gráfica
r. I . t· -U'-~. d , I d19ul l('" \t:C':-' l'e~1S' . t.
muestra un incremento constante en las fallas de entrenamiento a medida que
c_ onGucll-JpensarenelctlTsr'rf'=-;~stl'd~ -~:~; ~ ~',' . .:t-. !. d ren lln~-lpruel")apuede
':amos de puntuaciones altas a las bajas; por lo tanto, terminar exitosamen-
te el entrenamiento está relacionado con el nivel de aptitud. La relación que se

n.o CGr.7~3-
;TIuestra en csta gráfica corresponde a un coeficiente de correlación de 0.49.

El problema del criterio


Anteriormente se mencionó que la validez predictiva puede ser estimada
1<1 ... e., . í10 exr,,;'e l.1 r. Sl'··t~ .. ~.-..... ~ =- . -\..~ . . e,.' -".:":' ~ a n te ne íJhJctr\1'"("":':: r"'11'P'~C1~ al determinar la correlación entre las puntuaciones de la prueba y una medi-
. " . .•• . L - - " ¡[L!LV UC lIn I'xa m en:l' . i': ' ., . ' . .-v - -u u-
reaLes dl':- i a nruei. . ~l ljna nrl' 'l.:' - J.··J ·, t ( te! UIQO ...¡ CUI:Jadoso dI:"' 1a~ t'U f'dS rla criterio de éxito adecuada para el trabajo. La dificultad aquí sería encontrar
F ut:"1 (l nueCle d'f'¡;rWY'j"1'~ 1- ' ~ ("'
_4

- -.
fo'r- ,. .. -. .
... .l .... OS. Dcro !l(' '"equj,,",p;) ~l'-:'"l; -. . : <... ~ ; ,.C1" " ~",, ae concevtos ·. . la.;..elr.;
A J••
',C: ..-
la "medida de criterio adecuada". Uno de los problemas más difíciles que el
- J~~ .. ~ . '>( ~ O(!eufl:1'-;¡"T l e";c.d .~ - : -~
....... . . , .....t.l t · ~1U.·
lno,' una rHUenéi. -ie Cr)mn¡·".· ." . "i.~ ,_ .. . . . t;JjH.lClone.s de. tEPYÚno~" '''~~nlis inves tigador de selección de pruebas afronta es la localización o la creación de
i r: .... . ~ J.~ . el1S1on (.lf"'l;;.! lect·~·.r-':-)u'~' .: '...... . r,"l,")u:. ,.

:a.5 ,p reguntas conCCT~'IÜ::;11tc~ .1 .i Ct.:'~ .- . '.... t tl}. ene requerir solo re~pUeSt(l~ '1
Las tareas que 3e l'reK~t~~ ~:;';~s T~:~~':i~~~'~~'I?CiiS q.~c ,~p;l!(c.en en el pasa;:. I Esto no es totalmente cierto. El "cómo se ve" una prueba puede ser de importancia para
pruel);!, y aquel que ;uzO'''~ U ',,- )' d' _', '. -mente. de,men io que 2nide " n·) determinar su aceptabilidad y racionalidad para aquellos que son evaluados. Así, un grupo de
01) ., ~,. .- . ' h '- , .. ,·,.ld' eL de Sl.¡ c.on~i"nid' .... . - .U . _._ iuturos pilotos pueden tener más voluntad de aceptar una prueba de aritmética referente a los
~ el . . ar mlnUCl'=S"111 1 C-.,r-,c, ! ..... ' .. U pala .':Il.. pr00T·:l11"'l''! ¡"'-ir'. . '..
~!.)"~ re:.tCtl"':,~DS lndn';cb.Jél1es. ,-:-: .. .H."
h...
~ ..... ,. ( - .1J L'w ~ 1': '-¿_ . h ,
cambios del viento y al consumo de combustible, que si esos mismos problemas esenciales estu·
·¡ieran ejemplificados en términos de costos de las cosechas o recetas para hornear pasteles. Esta
apariencia de racionalidad algunas veces recibe el nombre de validez aparente.
66
VALIDEZ 67
al
._
o V)

o o
-e u
O o sino también de la condición de su equipo, de lo adecuado de la iluminación
al
u~
'- ID donde él trabaja o del color del hilo que debe tejer. Las ventas de un vendedor
O al .§] de seguros están en función no sólo de su propia eficacia como vendedor, sino
a.. "U Z.2
también del territorio que debe abarcar y de la supervisión y asistencia que
9 ~~:~ 5.5% 722
reciba.
Dada la ausencia o las carencias de registros de desempeño, el psicólogo
de personal suele depender de algún tipo de calificaciones hechas por un
696 supervisor como una medida criterio. Estas calificaciones pueden ser parte de
la rutina de los procedimientos del personal en la compañía, como cuando un
empleado recibe un informe de eficiencia semi anual, o las calificaciones pue-
7 i~~f~1l38~~;'t:. 1274 den recolectarse especialmente para la investigación de selección. En cual-
"U
.~ quiera de estos casos se encontrará de manera típica que dependen tanto de la
8- 6 :;:;~:4:i.~~~J,~!T~}~~'i persona que da las calificaciones como de la persona que es calificada. Las cali-
"U
al ficaciones tienden a ser erráticas e influidas por una serie de factores que no
tienen nada que ver con el desempeño en el trabajo. Los problemas al usar los
:ve 5
procedimientos de calificación para describir y evaluar a las personas, se estu-
O
'0 dian con más detalle en el capítulo 12.
~ 4 ~~,(~4í~6~;,~#~flg?f/!~;:}{~;j.i'>;i? Siempre hay muchas medidas criterio que.se pueden obtener y usar para
'O validar una prueba de selección. Además de los registros cuantitativos de
U
desempeño y de las calificaciones subjetivas, que, ya se han mencionado,
3 i;';;<kiXz~E2 podemos usar posteriormente pruebas de pericia. Este es el tipo de procedi-
miento que se incluye cuando una prueha de matemMicas para ingresar a un
colegio se valida en términos de su capacidad para predecir la ejecución poste-
rior en un examen de comprensión de matemáticas. AqUÍ, el examen de com-
prensión sirve como la medida criterio. Otro tipo común de medida criterio es
el promedio de grados en algún tipo de programa educativo o de entrenamien-
to. ASÍ, las pruebas para seleccionar ingenieros pueden validarse mediante los
grados cursados en la escuela de ingeniería.
Figura 3. 1. Porcentaje de cadetes eliminados del entrenamiento poro pilotos en codo Todas las medidas criterio son parciales en cuanto que miden solamente
nivel de aptitud. El <DefiCiente de <Drrelación poro estos datos es d e 0.49. una parte del éxito en el trabajo o las partes preliminares del desempeño de
trabajo real. Esto último es cierto en los grados de la escuela de ingeniería
mencionados con anterioridad, lo cual representa un criterio relativamente
una med!da satisfactoria del éxito en el trabajo, que pueda usarse como medi- inmediato pero parcial del éxito que se tendrá como ingeniero. El último cri-
da cnt~no para la valid.ación de una prueba. Parecería una cuestión simple terio debería ser alguna apreciación del éxito de vida del individuo en su
d~:ermmar alguna medI~a del ntmo d.e producción o algún tipo de califica- profesión. En la vida real tal criterio es inaccesible, y el investigador debe con-
ClOn hecha por los ~upenores que SIrvIera como medida criterio, Desafortu- formarse con sustitutos de él, los cuales son sólo parciales y nunca completa-
na~aI?ent~, n~ es aSI, pues encontrar o desarrollar medidas criterio aceptables mente satisfactorio. El problema siempre consiste en escoger la medida más
sule e ImplIcar ~n,vestigación en el campo de las pruebas y mediciones con pro- satisfactoria o la combinación de medidas de entre aquellas que parecen posi-
b emas muy dlflcIles.
bles de obtener. Entonces, el problema se convierte en decidir cuál de las
. Cada pO?ible ~ipo de m~dida criterio presenta sus propios problemas. Un diversas medidas criterio disponibles sería la más satisfactoria. iCómo deci-
reg?stro de e¡~CUCIOn real tIene mucho atractivo, por ejemplo, el número de dir esto?
artIcl!los fabncados, la falta de errores para un cajero, la cantidad de seguros
Vf~dltOS, etc. P~ro hay muchos trabaj?s, como el del médico, el del maestro,
e b' e. a secretana o e! de la reCepCIOnIsta, que no proporcionan un registro Cualidades deseadas en una medida criterio
o ¡~tIVO del desemp~?o o de la producción¡ y en el caso de que existan estos
regIstros, la producclOn. suele estar i~fIuida por un rango de factores que esca- Existen cuatro cualidades deseadas en una medida criterio. En orden de
pan al coI?-trol ~el traba¡ad()r. p regIs.tro de producción de un tejedor de telas importancia son: a) atingencia¡ b) que esté libre de s,::sgos¡ e) con fiabilidad, y d)
dependera no solo de su propIa habIhdad para ajustar los marcos o enhebrar, disponibilidad.

,. , ,:. . - ..
,•...:., .• .... ·'\' ...·H·.·:.···. ··, ,·.· ~
68 CAP . 3. CUALIDADES EN INST
RUMENTOS DE MED ICIÓ N

Se considera que un crit erio es atin


I
t
~.
. a una rueb a de aptit~d es~ol~r, y
VALIDEZ 69

crit erio corresponde con o ejemplifi gen te en la media en que esta med ida el cr~terio sea el ~ro
ItanOS del pnm er grad o. ¡Co~ed io d.~
el predIctor se d
atin gen cia de un criterio deb emo s
ca el éxit o en el trabajo. Para apre
ciar la vec ham Ient o ePes t u dian tes Uillvers d mo decI
tener en cue nta nue vam ente conside apro . .1 eba era un bue n pre Icto .?
nes racionales. No existe una evid r.
encia emp íric a que pue da decirnos racio- diremos SI a pro las dem ás variables con .
stan tes, mIe ntra s mas . 1
atin gen te sería la calificación prom qué tan ObVlament~, con . 1 ba alta sea a
edio de un estu dian te univ ersi tario .. En este sent ido nue
mer grad o, por ejemplo, com o indi del pri- corre l¡¡Clan,. mej .
or sera a pru e .
. n rela ción con otro s pOS.Ibles '
stra base para eva lu,u
univ ersi dad . Para prue bas de apro
cador de hab er logrado los objetivo
s de la cualquIer predI~tor e~ta e pro ce d·lml~
· d
ntos e pr~-
vec 1perfecto de Pedro ¿dio un coehcIen
mej ores juicios profesionales disp ham ient o es necesario apo yarn os en los dicciór:. El predlct~r ; pers~~aotra
s
te de ...,-a11-
onibles para dete rmi nar si el con teni dez mas alto o mas faJO q .. talespru eba s que está n disponibles?, ¿có mo
una pru eba representa de man era
precisa los objetivos educativos. De do de . s tipo s de m orm aClO com o los grados de la prep arat ona
ma man era, respecto a las med idas la n O las
criterio, tam bién es necesario apoyarsmis - sena.n otrO .d 1 dire ctor de la escuela? Pref enre
C<lhf¡cacJOnes da as por e. . artic
.
mos cualqme · d·
los juic ios profesionales para tene e en r
ular sea más que algu na medida prev . 1- me
r
med idas criterio parciales sean atin la apre ciac ión del grad o en que algu nas da cuya vah dez para un cn~=:I~ Pde
ue
la-
gentes para un criterio últi mo de mente diSPolllblf~ aun a r ~alide; la med ida no sea perfecta.
un pro gram a educativo o en un éxito en
trabajo. repr esen tativ os se mue stra n en la
Un segu ndo fact or imp orta nte en Alg uno s cae lCIent~s d e 1 tam año tabl
la med ida criterio es que esté libre 3.1, los cua les dan una Id~ d1ase
de las corr elac ione s que se han obtea
sesgos¡ es decir, la med ida deb ería de s diferentes. Por sup ues to, el i~1V -
ser
mis mas opo rtun idad es de obte ner aqu ella en la que cad a pers ona tien e las
una bue na pun tuac ión. Ejemplos
nido en trabajOS prevIos
.
c
d· especial o en un trab ajo espeCIfIco esti gado :
tore s de sesgo son la vari ació n eri de fac- mte resa do en un curso d e estu . 10 de alid ez prev iam ente enc
deb era
del ven ded or de seguros¡ vari acio
la salud de un dist rito al otro , para
el caso hnniliarizarse con los cae f·ICle ntes ontr a dos. para.
nes en la cali dad del equ ipo y de las J¡¡ medida crit eno part Icul
v
cion es de trabajo, para el caso del con di- ar que emplee. .
obre
los jefes que califican a sus secr etar ro¡ vari acio nes en la "generosidad" de
ias priv ada s, o la vari ació n en la cali
de la ens eña nza recibida poi los
estu dian tes en sus dife rent es grad dad Toblo 3.1. Validez de pruebas seleccionados como predictoros de ciertos criterios educativos
med ida en que las cali fica cion es os En la y vococionoles
dep end en de factores en las con dici
la eva luac ión de trabajo: más que
en 1:1 com pete ncia misma en ese trab one s o
hay un significado real de la corr elac ajo, no Coeficiente
ión entr e los resu ltad os de la prue
med ida crit erio . ba y la Variable de criterio de validez
Prueba
El terc er factor, la con fiab ilida d,
este cap ítul o, más adelante, pero en se estu diar á en térm inos generales en
blema es el siguiente: una med ida lo que toca a las medidas criterio, el pro- Prueba de inteligencia lorge-Thorndike Pruebas lowa de habilidades básicas
de éxito en el trabajo debe ser esta (puntuación total-cuarto grada)
repr odu cibl e si ha de ser pred icha ble o (verba~ 0.78
por algún tipo de prueba. Si la med
rio varí a día con día, de man era que ida crite- Prueba para estudiantes de universidad Grados universitarios-Inglés 0.54
en el trab ajo una semana y uno baio una pers ona mue stra un alto desempeño estadounidense
calificación de un sup ervi sor y una la semana siguiente, o que recibe una alta índice de programo de pruebas Grados universitarios-Matemáticas 0.44
posible enc ontr ar una prue ba que baja calificación de otro , ento nce s no es Prueba de memoria Tonal Seashore Pruebo de desempeño paro instrumentos de
prediga esta pun tuac ión. Una med
plet ame nte inestable no se pue de ida com- cuerda 0.28
pred
Fina lme nte, al escoger una med idaecir por ning ún med io. Prueba corta para obtener empleo
blemas prác tico s de con ven ienc ia y crite rio siem pre enc ontr arem os
disponibilidad. i Qué tant o tend rem pro- (alificación de conocimiento de Índice de producción-SO operarios paro
esperar para obte nr una pun tuac ión os que
costará en dine ro o en la inte rrup ciónde criterio para cada individuo?, ¡cuá nto palabras máquinas de contabilidad 0.10
te que un prog ram a de inve stig ació de las actividades normales? No obstan- Puntuación de conocimiento de Grado de empleo- 106 estenógrafos 0.53
n
tancial de este esfuerzo para obte ner del pers ona l pue de pagar una part e sus- palabras
límite prác tico . Cualquier opc ión buenos dato s criterio, siem pre existe un Calificación de habilidad aritmética Índice de producción- SO operarios paro
estos lím ites prácticos. de medida crit erio debe tene r en máquinas de contabilidad 0.26
cue nta
Puntuación de habilidad aritmética Grado de empleo - 106 estenógrafos 0.60
Pruebas de aptitud diferencial (octavo
Inte rpr eta ció n de los coe fici ent es grado)
de val ide z Gredas de inglés 3 1!2 años después
Razonamiento verbal 0.57
Sup óng ase que hemos cole ccio nad Relaciones espaciales Grados de inglés 3 1/2 años después 0.01
grupo de indi vidu os y que hem os o prue bas y medidas crite rio para
calculado la corr elac ión entr e ellas un Razonamiento mecánico Grados de inglés 3 1/2 años después 0.17
. Tal vez
70 CAP. 3. CUALIDA DES EN INSTRUM ENTOS DE MEDICIÓ
N 71
La utilidad de una prueba como predict or depende no sólo de qué 2 Tabla de dos por dos de pruebas y éxito en el trabajo
correla ciona con una medida criterio, sino también de cuánta informa
tanto Tablo 3..
ción
nueva provee. Así, se encont ró que la prueba de razona miento verbal, Desempeño en el trabajo
com-
prendid a entre las prueba s de aptitud diferen cial, correla cionaba con
un pro-
medio de 0.48 con los grados de inglés de la escuela secund aria, y que
la prue- Mitad inferior Mitad superior
ba de uso de oraciones correla cionaba 0 .51 con los mismo s grados.
Pero las "Fracasos" "Éxitos"
dos prueba s tienen una interco rrelació n de 0.62. Ambas se traslapa
n y, por lo
menos en parte,l a inform ación que propor ciona cualquiera de estas
dos prue-
bas es la misma que la propor cionad a por la otra prueba. El resultad Mitad superior
o neto es
que óbtene r informa ción de las dos prueba s puede dar un coeficie nte (Aceptados) 100
de vali-
dez de no más de 0.55. Si las dos pruebas no estuvieran correla cionada
s, cada Calificación
una dando una inform ación comple tament e indepen diente de la otra,la
com- por Mitad inferior
binació n de ambas habría dado un coefici ente de validez de 0.70. 2 100
selección (Rechazados)
Eviden temente , cuanto más alta sea la correlación entre una prueba
otro predict or y una medida criterio, más satisfechos estarem os¡ pero u en 10 pruebo
además 100 100 200
de este estánda r relativo nos gustaría tener uno absoluto. ¿Qué tan
alto debe
ser el coefici ente de validez para que sea útil la prueba?, ¿qué es una
validez
"satisfactoria"? Esto es como pregun tar ¡qué tan alto es arriba? ; sin
embargo,
tratarem os de dar alguna clase de respues ta.
Para una organiz ación que use una prueba como base para decidir
si 3 Porcenta ·,e de asignaciones correctos cuando se debe seleccionar 01 50% del
Tabla 3..
admite a un solicita nte de trabajo particu lar o admite a un estudia
nte deter- grupo
minado , la pregun ta signific ativa es: ¡qué tan más frecuen te tomare
mos la
decisión correct a acerca de quién contrat ar o :ldmitir si.cmpl eamos Validez del procedimiento Porcentaje de selecciones
esta prue-
ba que si operam os al azar, o con base en alguna medida ya disponi correctas
ble pero de selección
menos válida? La respues ta a esta pregunt a depend e de la propor ción
de indi-
viduos que se aceptarán. Un proced imiento de selección puede hacer
mucho 50.0
más por nosotro s si debemo s aceptar solame nte al individuo que parece 0.00
ser el
mejor de cada 10 solicita ntes, que si debemo s escoger nueve de cada 0.20 56.4
10; sin
embargo, para dar un ejempl o específico, supond remos que aceptar 0.40 63.1
emos a la
mitad de los solicitantes. El modelo de la tabla 3.2 contien e 200 persona 0.50 66.7
s en
total, 100 en la parte superio r de la prueba y 100 en la parte superio 0.60 70.5
r en el
trabajo. Si no hubiera absolut amente ningun a relación entre la prueba 74.7
y el tra- 0.70
bajo, habría 50 personas en cada una de las cuatro celdillas de la tabla. 79.5
Si defi- 0.80
nimos el "éxito" como íos que están en la parte de arriba del trabajo
, la razón 0.90 85.6
del éxito sería de 50 a lOO para aquéllos aceptad os, y tambié n la misma
los rechazados. No habría diferen cia entre ambas y la correla ción para
sería cero.
En la tabla 3.3 se muestr a el porcentaje de opciones correct as ¡estO
es, de
"éxitos") en tre aquéllos aceptad os por las correlaciones de diferen Esta tabla muestr a no sólo la precisió n para cuallquierl·dcoezrrdelealcpiOr'~df~~~'
tes tama-
ños. La meiora en nuestro "po rcentaje de bateo" <1 medida que las correlac .. . d .. , SI mejora mos a va l
io· sino tamblen 1<1 gananCla e preClslOn · na validez de 0.40 por uno.
nes van hacia arriba se muestr a en esta tabla. Por tanto, para una correlac , . d· , eempla zar un pre dIctor con u
de 0.40, escogim os bien el 63.1 % del tiempo¡ con unacor rclació n ión ASl, SI pu leramo s r . ' e l orcenta je de decisio
porcentaje de decisión correct a sería de 79,5 :' así por el estilo.
de 0.80, el con una validez de 0.60, mcrement~nan;~~s p~rcentajes se refieren nes correc-
ta.s de63.1 a 70.5. Por supuest o, to , ose. revios. sin embarg o, laa las reglas
baslcas que se est~~leclcron en parrafo s p m ¡ender los efectos tabla :3.3
de un pro-
da unadreprelsent~cIOdnesbdaes~tnp~!~e~: ~i~~: d~ liagenc ia de empleo
.2 Lu ) pHJC,:,,'ui111ü:ntnS estadístic os se han disl':ililL10
de t~11 nlancra que nos penniten determi-
nar 1<1 meior pundcr,¡c ión para dar e los dos o más predicwr es " s o de cer-
resultará de eSE" cmnhinac ióE. Lu> procedim ientos discñ,¡do;; con
p'u,: calcular la correlación que grama e se eCClOn
el ¡in de calcul ar las pDIl<!cr;,·
clones paTa CDJnpon:. .'rltcs : . cpJ:-J.dos ¡llclJnado:; coeficie ntes
de regresH5JJ i y la corrcL.!l.:íón ¡C()1'~'2'­ tificación. .. d I · · la gananc ia puede ser crudam ente
loción múltiple ! que rc ·~ tdt ;J de hl c(Hn l!iJl<t ció~; : quedan más allá dtI
p(:!llOral'D~ de t:stl.: C5tuditJ.
En mucha s SitUaCIOnes e se eC~IO.ntanto si a una compa ñía le cuesta
pero i-i'; pur.den cnc(Jnt .r ~~r ~n los text os de l.!s!: ;Jdb( ¡C~1 c.,tándaL traduci da en ahorro s moneta rlos. 01 , .

z· .... ...
:'
72 CAP. 3. CUA LIDA DES EN INST
RUM ENT OS DE MED ICIÓ N
,
f
i. 73
S 500 emplear y entr ena r a un trab
ajad or nuevo has ta el pun to de que . dd I d' cción poro los diferentes valores del coefi
una prod ucti vida d útil , un pro ced tenga Tabla 3.4. Exoctltu e o pre I ciente de
imi ento de sele cció n que incr eme .
corre IOClon
"' (1 000 CO$O$ en codo hiler
porc enta je de éxit o de 56.4 a 63.1 nte el )
dará un aho rro de los gastOs de entr o o columno
mie nto sola men te de S 335 0 por ena -
100 personas emp lead as. Esto no
cue nta la pos ibil idad de que los tien e en r = 0.00 r - 0.60
trab ajad ores sele ccio nad os med iant
pru eba pud iera n ser tam bién me;
ore s trabajadores desp ués de que hube una
com plet ado su entr ena mie nto. Por iera n Cuarto en criterio Cuarto t·n rriterio
sup uest o, tales aho rros tend rían
equ ilib rado s con tra el incr eme nto que ser Cuarto en
de los costos al apli car un pro ced Cuarto en
de selección nue vo. imi ento
predicrién 40. 30. 20. )0. predicción 40. 30. fe . ) c.

-
Otr a forma de apre ciar el sign ific
laci ón, y tal vez es el más imp orta ado práctico de un coeficiente de corre-
nte desde el pun to de vista de la
que se pon e a pru eba , se mue stra pers ona 10. 250 250 250 250 10. 45 141 27i 537
en la tabla 3.4. Las hile ras en las
tabl as interiores repr esen tan las cua peq ueñ as 20. 250 250 250 250 20. 141 264 318 277
estu dian tes pote ncia les o emp lead rtas partes de un gru po de soli cita
os con respecto a la prue ba de pred ntes , 30 250 250 250 250 30. 277 318 264 141
Las colu mna s indi can el núm ero icci ón. 250 250 40. 537 277 141 45
de caso s que se ubi can en cada cua 40. 250 250
la pun tuac ión crit erio . Obsérvese rto sob re
la peq ueñ a tabla que corr espo nde
cien te de validez de 0 ,50. Nótese al 070
que aqu ello s que se ubic an en la cua coefi- r = 0.40 r=
te más baja en el pre dict or 480 de rta par-
más baja en la pun tuac ión criterio,DAD, o 48.0%, se hall an en la cua rta part e
1 Cuarto en criterio
Cuarto en criterio
2,7.9% en la sigu ient e Cuart,l par
baja , 16.8% en la sigu ient e cuarta te más Cuarto en Cuarto en
par
más alta . Las entr ada s diagonales te hac ia arriba y 7 .39-ó en la cua rta part e predicción 40. 30. 20. )o. predicción 40. 30. 20. 10.
cae n en la'm ism a cua rta parte, en "negritas" repr esen tan los caso
tan to en el pred icto r com o en el s que
Cua nto más nos alej amo s de la diag crit erio .
entr e el. pred icto r y su resultado.
ona l, mas grandes será n las disc repa 1- '0'
IV~
,n'
171 277 426 lo. n 107 270 60\
Los caso s en la diag ona l o cerc ano ncia s
I V.

repr esen tan los ejem plos en los 20. 191 255 277 277 20. i07 270 353 270
que el pred icto r est? ba en lo corr s a ella 277 277 255 191 30. 270 353 270 107
casos que caen lejos de la diagonal ecto 30.
repr esen tan los ejem plos en los que ; los 428 277 191 104 40. 601 270 107 22
dict or ha estado equ ivoc ado . el pre- 40.
Esta tabla destaca no tant o las \"en r = 0.80
ción en el éxito en el trab ajo, que tcljas de usar el pred icto r como la f = 0.50
aún perm ane ce para aqu ello s que vari a-
lares en las pun tuac ione s de predicci son sim i- Cuarto en criterio
o las empresas, lo imp orta nte es el ón. Des de el pun to de vista de las escu elas
Cuarto en criterio
incr eme nto en el por cen taje de dec CliOito en Cuarto en
"cor rect as" mostradas en la tabla isio nes
3
pue de obte ner ventaja si se cuenta .3. Si tratamos con gran des núm eros , se predicción 40. 30. 20. ¡o. predicción 40. 30. 20. ) o.
con
que los proc edim ient os usad os actu cua lqui er prcJ icto r que sea más váli do
alm ente . Desde el pun to de yi&ta del
to indi vidu al, las múl tipl es discrepa suje 253 6~c

s marcadas entr e el éxito pred icho - . lo. 73 lé8 279 480 lo . 6 66 /J

real que se muestran en la tabla ncia


3.4 yel 20. 168 258 295 279 20. 66 27l 410 253
imp orta ntes . Si ei indi \'idu o ha teni pue den parecer por lo menos igua l de 30. 279 295 258 168 30. 253 410 27l 66
do un desempeño defi cien te en la
un soli cita nte puede que dar menos pru
imp resi ona do por el hec ho de que eba , 40. 480 279 16S 73 40. 675 253 66 6
bab ilid ad es que él e;;té por debajO la pro -
del pro med io en el trabcljo que por
de que él pudiera hac erlo muy bien el hec ho
excepción. . De cua lqui er man era, él siempre
serí a la ,
OtrO pun to puede desta~al.sc ~~mo ' nclusión. La vali dez es siem pre
Exi sten varios fact ores que tienden
a distorsionar los coeficientes de vali específica par a un prog rám a partlcU o )cl~a un trabajo dete rmi nad o. CUá
dez ya com plic ar su inte rpre taci ón. - a~e;~ rucb a es váli da, siempre resu n-
pred icto r y del criterio que se predicc¡
Uno de ellos es la poc a confiabilida
d del do un aut or o un edl~~~ procl.a~na lta
apropIado preg unta r. ,\ah dd para q" UnaPnrucba de apro vec ham tenw par a
mente. El otro factor es la restricc los efec tos de esto se estu dian pos teri or- que ...í 1 con teni do v los ob¡c
ión
algún tipo de preselección; este efec del rang o de hab ilid ad en el grup o por estudios SOC.la 1es ~lue rcpre sen ta con precIslO n tl\"os de
to
· ., ede ser tota lmeente inap rop iada
,
confiabilidad, por un lado , o la pres se estu diar á en el cap ítul o 10. La baja un pro gram a de mstrucclO~ pu
"rama en una com unid ad dLe rcnt U . eb'l de aprovcchalTI
para un pro-
valores que se obtienen en los coefelección, por el otro , tend erán a baja r los ,.,debe 1 d c .. na pru 'un prog ram a cst)elent o SIempre
cifico de ins-
icientes de validez . ser eva ua a com~aI . 'and o los obJetIVOs d e
uue ción . Una vez mas, una bate , 1 . t' tudcs váli da para ti"
n a (e ap I sc eCClOn.lI

.... ------~~----
74 CAP. 3. CUALID ADES EN INSTRUM ENTOS DE MEDICI ÓN VALIDEZ 75
emplea dos vended ores para una tienda de departa mentos , que serán ' . . vesti adores proced ieron a pregunt ar: i. con ~ué estaría
bles a los clientes , inform arán acerca de su mercan cía y harán las
agrada- En esencla':~~~ida d~ motiva ción para el aprovecham~ento~ HICIero
transac cio- n;i;¡c1onada un d" n
nes comerc iales de manera precisa , puede ser totalm ente inútil para algunas de las cuales son las slgmen tes:
identifi- una serie de pre ICClOnes,
car a los vended ores de seguros, eficientes, para encont rar o crear
nuev"os .
negocios. La validez siempre debe evaluar se en relació n con la situaci a motiva ción alta para el aprovec hamien to debería n
similar como sea posible a aquella en la cual se usará dicha medida
ón tilll a) ~os .suJetos con unersid ad en relació n con sus aptitud es
escolares.
¿Para qué clase de pruebas es import ante la validez relacion ada con
. ¡r bIen ~n l~, umv , vecham iento debería ser mayor ~n los es~u-
el cri- bl La motlvac lOn, padrahelbapro I plícado pruebas que se les diJO medIan
terio? Obviam ente, esta clase de validez es de lo más import ante diantes despues e a erse es a
para una .
prueba que se utilizar á como predict or acerca de los resultad os represe
ntado.s su intelige ncia, . " de
por medidas criterio bien claras y definidas. Cuanto más rápido identifi , aprove chamie nto debería n comple -
mos un criterio de desemp eño que represe nte incuest ionable mente
que- el Los SUjetos co.n alta motlvaClOnba ue motivar a la velOCI. dad .
los resul- tar más reactivos en una prue h q. to debería ser mayor para
tados finales en los que estamo s interesa dos, más nos apoyar . ., . ra el aprovec amlen los
emos en la dI La motlvaC lOn p.a. d
evidenc ia de que las correla ciones entre una prueba y las medida
s criterio niños cuyas famIlIas promOV.ieran l.a indepen dencia tempra .
na e sus
guiarán nuestra s decisiones acerca de si debemos usar la prueba. En
este enun- miemb ros.
ciado hay dos elemen tos: predicc ión y medidas criterio claras y definid
as, y la · . . b basado en una especie de "teorÍa de
princip al limitac ión para usar la validez relacion ada con el criterio
de la pre- Cada uno de estOS predlct ores esta ~ h iento académ ico se considc ra-
dicción se halla en la adecua ción de medidas criterio disponibles.
la conduc ta human a"; p?: tdnt~~~if~:~v~cesf:rzo. Es posibe que
los sujetos
ha como una com?InaClOn e , alta de'sarrollarán más esfuerz o
con una motlVaClOn de lo.gro mas, y volunta d
VaJide z de constr ucto 1 arán calificaciones mas altas. Un
SI' la habilid ad perman ece Igual, asdI comodOg r
Alguna s veces no estamo s interesa dos en pregun tarnos respect o "1
razonam iento Slml ar cor respon e a' ca alau mavorí na de las otras predicciones. .
de una a de sus predicciones reCl-
prueba psicológica iqué tan bien predice esta prueba el éxito en el En general , McClel land encont ro que '1 ''-'ue las puntua ciones
trah;¡jo ', ni Je la
¡ qué tan bien represe nta el curricu lum;, sino ¿qué signific an
las puntua ciones bían apoyo d e sus res,! hados expenm enta es. '-<:
evento s tal como se prediJO, . .. .
de esta prueba?, ¡qué revela la califica ción acerca del individ uo?, icorres rueba estuvie ran relaclOnadas c,oln otrOS al del rasgo que la prueba permit e
ponde P . f e a un ana IS1S raClOn preten-
a algún rasgo o constru cto' que nos ayude a compre nderla? Para estas . .
pregun -
tas acerca de si la prueba revela algo significativo respect o de las persona
condUlr que! con.orm
día medir, dicho Instrum ento apoyo
, la validez del proceso de prueba como
s, se cto cuyas caracte rísticas esencJales
usa el término validez de constru cto. medida de un rasgo slgmfIc anvo o con;~;~n ~ra el aprend izaje.
Examin aremos un proced imiento de prueba específ ico y veremo s se resume n con el nombre d: m?tIv. v e% menor medida algunas
cómo prueba s
fue establecida su validez como medida de una calidad psicológica
o de un Mucha s otras pruebas pSlcologlCas , l' l'd des de un individuo. Ra-
constru cto. McC lelland (1953) diseñó un proced imiento de prueba .' d' rasgos genera es o cua l
para eva- educatlvas, mtenta n me Ir ., . l ' .abilidad introyerSlOn a . , . , .
e mteres
luar las necesidades o motiva ciones de un individ uo para tener éxito
y hacer zonaml. ento yerb a, 1 \-'lcuahz
. v. . aclOn espacIa , SOC1de rasgos. , Lu; pruebas d t '5
bien las cosas. La prueba contení a dibujos como los que se usan en .' . deSlgna
' . cJOnes de constrUctoS o ,
.
e es ;.,..
la prueba mecamc o son .ten de la manera que l ' esper
ca)[la . ,ll .'
de apercep ción temátic a (véase capítul o 13). Se le pedía funciones son yálidas en tanto se compelI
al individ uo que
inycnta ra una historie ta acerca del dibujo que se le present aba y que se cOlnpo, nara este rasgo.
que dijera d :,,:
qué habÍJ pasado y cómo había sucedid o todo. Sc diseñ ó un sistema
de califi- Un,¡ teona accrca de u'n l~rasgo con UClHI".. p¡'cdic6' 0ne:; de 105 · si~uic.nt e s
,
cación para estas historietas, hasado en el conteo de frecuen cia en
el que los tipos, los cuales pueden cya uarse para (1c"cr'n L
inar <:u <Trado de certeza:
i ., '" • . '
temas de logro, de éxito, de maestrí a y de aprove chamie nto aparece
rían en el . .. . .. 'lacion es. L¡ natural eza ctcl rasgo y ,
materia l de la historie ta. Así, cada individ uo recibia una califica l. Predicc lOIles acel.ca de las ~()lle. d'carian que
ción que debe estar rc\aclO na·
represe ntaba la fuerza de su moti,'a ción para obtene r éxito. Ahora, da \-·lllda del lU,smo
por fanto. , una me d.¡ 'd
111 I d,' .
icómo d ',
E ' . .
. . me d'10l
'IS pu eden
. "a 11'11Jcr SI o acepta. "".-
haremo s para determ inar si esta medida tiene alguna validez en el uo con ciertas medl ~iS. s;as otras . _. O', e .ta manera .' ' 1
sentido de muchas pruebas
como lnc d I'd as d''- l·· tenClon respecti
describ ir verdad eramen te un aspecto significativo de la estruct ura l '::
del indi- va. e s , ···1 ;
'. ,o,<1¡'UI)OS han SI'd o \'",1 l·d. d.¡s en parte n " ";
SU5 coue ae. ? ' -".
I ,1 _< , h prueba, por
<1 ,
viduo' Veremos cómo procedi eron McClel land y sus colabor adores. . l'Igencla
mte . p,ua d'IY1'd ua 1 S"'l"f()l
'1 d .
111 ., " ''''-
1 lJ01"ld 'lS' .sobre tO o C'.1n , . l.

.; El term ino COllstructo se usa en p5ieología p¡¡ra referirse a algo que . prue Jas .va
CO '1
'. e a " '.' . ~s' puel,en ¡ . ' . . u'l"l~ con las C¡liC el' r""t-- ., ..<T(''
que literalme nte <':5 C()ll .\tru ido por el iD\'cstiga dor pJr'l resumir o explicar
no es observab le, pero Binet. Tambl en hlS otras m"~ dll~l ,', .' A' l.'s
ser ,lq e "
pruebas de
v
inte]¡¡:o;e
• .
nc1;.1 han ~l c'
.'d.
las
ciOIl<:s que el ob:;.:rn en la conducta . Por tanto, ];¡ mayoría de los nombrcs regularid ades () reJa·
, l'
est".:· na dod"ln anera oglca. SI, ,,-,
de rasgos se refieren ,1 re aC1011
'. das, en a. ~ol'n)cdl . ' d .. 'l" ~ : ()'leS . ' 1 "
con el CXlt o en .<1 e~ " .J - , , ~ rl' " ! '1'''
con structos. f'Llbhmo s de );¡ "SOCi'lhiEdad" de un'l persona como ya!llh! pane, p .. "O esusco nc <id . "~'' "r':onc.;
-"
hs medid,) s dc aptitud l11ccal1lca, .pOl.",uS. r, co n \.:.¡ p c r~.!>' :¡, ;.- '''.,.L·.
una manera de rcsumir la con· ;.: : .. .,
,,·
slstcncúl Ob~l'rYd.(hl '_'Ji q ~ conduct~l r~l.<::;!da en fl.'lc1ción con hv; personas
y en la organiz,Jc ion dc ~Oll_l,,-,. ·· .
un~ predicciór:. ace rca de CÓ lTI O se dt:'5C111pC!l.!rú
t:n ocasione':; futuras. il en tr<.Ü,<¡jo5 mecánicos.

...::.,.. . ... " ..


...• . ', "' ,.:.- ~ .
,'
76 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICI ÓN

Una forma de estudia r los constru ctos o atribut os que mide una prueba
estudia r conjun tament e las correla ciones de esta prueba con otras. es
,
t .
CONFIA BllIDAD

. ando un produc to final, ya sea un,l prue-


edir cuando estamoS cons1der . asado de un individ uo o al¡;un
77

\·;1 .1 1~ sirva para descnb1 r el aprend1z~l~;


lllt1J-
de estas correla ciones hace posible ver cuáles prueba s miden algún
El patrón ¡- criterio . Así, la elabora ción de una
factor \1,1 qu e hemos aceptad o como m e . , robar la validez de Ul1<l metlJ-
común . Un exame n de las prueba s que tienden a agrupar se en un c,ldo r qu . de la cual se pueda decidu .como p .
factor sim-
ple puede servir para aclarar la natural eza y el signific ado del factor
y de las
··1 ·1 partlT , .
[I::oy, ~n constrU cto psicolo glCo,es un e)erC1clO raclOna1. En contras te , cuan-
pruebas que lo miden¡ sin embarg o, esta validez interna o "factori nto de selecció n para predeci r algu-
al" necesita tI;l le """05 una prueba como un mstruI ?e se
evidenc ia de relació n con los eventos de la vida fuera de las pruebas lo US,111 convier te en un proceduTIlento
edida cnteno acepta d a, la yahdaC
1
lOn
para 1a me d·d·
mismas, l
• •

, hemos constrU ldo . d


si el factor va a tener mucha vitalida d. n,l Indo ·co. v para verifica r la teona que 1a e
Tambié n puede ser apropia do predecir que la medida del constru CSt<l 1St! " . . erie de pasos empíric os. EljUl-
cto X os contar con una s .,
mostra rá correla ciones bajas o poco relevan tes con las medida . Igún constru cto, necesn am . 1 empres a de la validaClon.
s de ciertos ,1, • l. evidenc1a se Juntan para a
otros atributo s, es d ecir, este constru cto es diferen te de ellos. Así, Cl0~'a
una prueba
diseñad a para medir la compre nsión mecánica debería mostra r sólo
una corre-
lación modest a con una prueba de habilidad verbal. Una medida
bilidad no debería mostra r una correla ción muy alta con una medida
de socia-
de aser-
e ONFIA BILlD AD . .
t a los proced1m1entos de
La segund a cuestió n que plantef·m~~ r~:p~h~ra n~ noS pregun
tiyidad, si las dos evalúan genuin amente dos constru ctos diferen
tes.
2. Predicción acerca de diferen cias de grupos. Una teoría suele sugerir · ., se refiere a que tan con la d·d· d lo que medimo s. ,Cual ~am05
ne d1Clon , s la me 1 a e es la
que ciertas clases de grupos debería n calificar especia lmente alto ¡qué medimo s, sino que tan e~~cta e ultante ' 'con qué exactit ud podna ', .
o bajo en .. , d stra puntuaClOn res replO-
algún rasgo y, en consecu encia, en alguna prueba que lo mida. ., , ,
Así, parece preclSl on e nu~ l· d· . d
razonab le que un grupo de vended ores debería obtene r altas califica
ciones en ducirse si mid1eramos a III 12'1 uo T~'arias veces, .-
os a evaluar a todos los mnoS en U~J.
ascendencia, asertivi dad, y que un grupo de bibliote carios debería Supóng ase que hoy y manana "\ am, tan lejos puede lanzar
obtener cada mno
estas califica ciones bajas. Probab lemente predeci ríamos que los clase de la escuela para observa r fi~~a de salida en el campo, damos
hiios de a ca~a
padres profcsi onistas u hombre s de negocios serían más ascendi
entes que una elota de futbo1. Mar~am~o~srl~:::~ - n un asistent e para mayear donde
aquello s cuyos padres fueran emple,l dos o estuvie ran en ocup.\c iones
scmica- chiC~ una pelota de futbo!, ffidlhudl UVS l:nce la pelota lo más lejos que pued¡- cae a
iificadas. Para cualqu ier rasgo dado, el conocim iento general de nuestra
socie- pelota y le decim? s al much~c o ~u~. tancia desde la línea de sahda
dad y de los grupos que forman parte de ella sugerir ían un amplio Con una cinta metnca , med1mos a 1S. stente Hacem os que los Ch1COS hasta a
rango
diferen cias de grupos . Al aplicar una prueba a estos grupos, el investig de ca que puso sobre el p1S0 nuestro ~SI .
tlren
ador
descub re qué tan consist ente es el apoyo a sus predicc iones. ~~a;elota una vez hoy y otra vez ~~~~~~~nes para el mismo niño eI!contra~
3. Predicc iones acerca de la respuesta a los tratam ientos o las interve Cuando compar amos las dos p . uales. Los dos lanzam 1entos dÜ1eren
ciones experim entales . Una teoría puede establec er que la manife stación n- ue casi nunca son exactam ente 19 . . e ueña, algunas llegan a se!
, y.
una caracte rística human a puede ser modific ada como resultad
o de ciertas
de
~O;qc;e la mayorí a de las diferenClas sea ?as~~~t~~e1rande s. Estas diferen.c¡as
condici ones experim entales o tratami entos. Así, se puede predeci ligeram ente grandes y ul1: as cuantas se~;confiable como medida
r de manera de la habl}l-
razonab le que una persona increm entará su nivel de ansieda d muestr an que un lanzam1ent.? no es ~s~ltados son en cierto grado,n
momen tos :cons!s -
,llltes de ser interve nida quirúrg icamcn te. Se ha propue sto a la tasa
de estreme - dad de lanzam iento de un ~llno. L~~r . 'se debe ~sta inconsistcnCla
cimien to' que una persona present a como un indicad or del ni,-el de tentes con ambos lanzam 1ento s. ~ d que ; .
ansieda d. que intenta n exphca r la 111con-
En un estudio (Buhler , 1953) se encont ró que, como se prediio , el
urnbral de podemo s identifi car tres cl ases e r.az,"onesr
estreme cimient o fue más haio antes de la operaci ón que después sistenci a de los lanzam ientos de un dla " OLO.
, cuando la . '
person a ya estaba relajada.
Para alguna prueba que intente medir un rasgo o una cualida d podem
. ' biado en realidad
1. Puede ser queJa persona ~ay a c~~ que otrO i uno dede un dJa.~l otro : ~J
os íos dos dI as pue~e
formul ar una estruct ura teórica que conduz ca a conclus iones definiti nii10 puede estar mas descansa~o fn ~ar con mayor fuerza la pelota,
vas que o un tha
puedan ser probad as. En cuanto estas predicc iones sean confirm adas estar más motiva do para tratar .e an~special co~ su padre entre las
lece la validez de la prueba como una medida del rasgo o constru
se forta-
pudo haber tenido un entrena mIentO as es de meses en vez de un ~os pru;-
cto¡ en la uGb d1a, pueuc.
medida en que dichas predicciones no puedan ser verifica das dudare baso Si el interva lo entre la.s dos I?.r reaí v la magnit ud de tal creOIDICnIO
mos de
la validez de la prueba , de nuestra teoría o de ambas. haber ocurrid o un creC1m1ento hS1CO b.' Nuestr o eiemplo sólo
menClOna
diferir de niño a niño entre la~ do~ pr:e :r~ es fácil pe~sar en cambio
s sl~l!a­
La evidencia de la validez es, como hemos visto, en parte raciona cambio s que afectan la e)eCU~l?n hSlC~~bas de habilid ad mental o
l y en a un 1l1\ien-
parte empírica. Las conside racione s raciona les son la parte central res en categor ías que se aphcan an a P d los estados de ánimo o
de lo que se tario de autoinf orme que trate ya sea e de los mte-
. ..
4 Ritmo en el que la alternanc ia de estimuJ.¡ción ne¡:ra y blanca se funde
en un ¡:ris estable.
reses . . 1 haya sido diferen te en las dos med1c1. 0nes. Por
2. Es pos1ble que a tarea
78 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓ N
'.t(, CONFIA BIUDAD 79

ejemplo, la pelota que se usó un día pudo haber estado más inflada que t ·d f bIes también implic an que el individ uo perman ezca en
Las med I as con la l
se usó al día siguiente, lo cual permiti ó al niño un agarre diferen te de
pelotas; asimism o, es posible que un día el examin ador haya permit ido
a los niños hasta llegar a la línea de lanzamiento, mientras que el examin
la que
las dos
correr
t o El mucha cho que califica como el más alto
el mismO lugar entro lde 1r~~ l~ primer a vez debería tambié n ser uno
en la prueba de anzar a pe ~ada ersona en el grupo debería quedars de los
e.más
ador más altos la selplnda ve!". '! En ~ capítul o 2 mencio namos que el coefICi o
del segundo día pudo haberles permiti do sólo uno o dos pasos. Estas menos en s~.mlsma Pos?clon_ 'n dice estadístico de la medida en que ente
variacio- dos ca·
nes pueden haber ayudado a alguno s niños más que a otros. En las pruebas de correla clOnpr oporclO na un 1
de ho ba·o con bajo. Si las dos cosas que
lápiz y papel suele usarse en forma de prueba p'ara una ocasión y una
paralela
para la otra ocasión , y los reactiv os específicos pueden ser algo diferent
es, así
saS varían conjun tament e, all? co.n a le 1;
misma medida , la correla ción
correlacionamos s<?n dos ap lc~cldnesde la confiabilidad el cual podem
como algunos alumno s pueden tener mejores oportun idades para os
manejar resulta nte proporCIOna u~ mdlC¡ ?:nte de confiabilidad. Las caracte
una muestra de tareas, mientr as que otros obtiene n mejores resulta designar co.n. el nombr e e ~?e lel rísti-
dos en la alizamos en el capítul o 2 Yen nuestro
segunda muestr a. cas del coefICIente de c?drela~lon l~s an la relación está constituida por
3. La muestr a limitada de conduc ta puede dar como resulta do una las dos
estudio acerca de l.a vah. ez. ero a o~~ medición. Cuanto más cerca
tuación inestab le y poco confiab le. Aun si hacemo s que cada niño ejecute
pun-
medida s con el mismo lllstrumento se co~o­
los · ·1 rla segund a vez más alta sera la
dos lanzam ientos con la misma pelota y las misma s instruc ciones, uen los individuos en orden de rang? Slilll a b '
con sólo
cinco minuto s de descanso entre ellos, las dos distancias muy rara
vez ¿orrela ción y .más conffi~~f resl~t:~~;~sft~::que un individuo per:nan
exactamente las mismas . Un solo lanzamiento es una muestra pobre serán Una medIda es con la e ~n. ece
de con- d ' como resultado un bajO error
ducta. Esa muestr a y su evalua ción están sujetas a toda clase de influenc
azarosas. Puede ser que se resbaló el dedo del niño; tal vez éste combin
ias casi igual en medici ones repetIdas, lf'
q.ue a~ con fiabilidad· pero ¿qué tipo
estánda r de medició.n o un alto coe IClen~estimador apropi~do del
ó la grado de
coordinación de sus piernas y su brazo; o quizá la pelota se tomó
un poco de dato exacto ne~e~l,tamOs para ~?~~~~r ~ continu ación consideraremo
s tres
atrás de donde se debe tomar o un poco adelante; es probable que el califica
dor estabili dad o p~eclS1on ehn la m~ ICIOta~ sus similitudes Y diferencias
estaba distraído en el momen to en que el niño lanzó la bola y no vio posibilidades dlstllltaS, aClen .o ndo y eva-
donde d
cayó; quizá había un poco de viento cuando hizo el lanzam iento. tuando las ventajas y desventajas e ca a una de ellas·.
Pudiero
haber ocurrido cientos de situaci ones, algunas favorables y otras desfavo n
bles, pero todas influyen en el resulta do final. U na pequeña :rp.uestra ra-
ducta no da una caracterización confiable y estable de un individ
de con- a) Repe~ic.ión d.e, la misma pruebJ °f:r~~dJ~ prueba "equiva
uo, inde- lente"-
pendien tement e del tipo de muestr a utilizada . b) AdmmlstraClOn de unabsegun a ás fraccio nes equivalentes.
e) Subdivisión de la prue a en d os o m
Hay dos formas en las que podem os expresar la confiabilidad o precisió
de un conjun to de medidas o, desde el punto de vista inverso, de n
la varia- . . , de l·a misma prueba (test-re test)
ción dentro de este conjunto. Un enfoqu e indica directamente la cantida RepetlC IOn
d de
variación que cabe esperar dentro del conjunto de mediciones repetid
as de un , f bl mente podem os evaluar los lan-
solo individuo . Si fuera posible que Juan lanzara la pelota 200 veces
(supo- Si deseamos encont rar que tan con l~ríaemos haberlo puesto a prueba dos
niendo que esto podría hacerse sin incluir elemen tos de fatiga o de práctica
), zamien tos de pelota de un mdlVl?,UO, po able haber tomado las dos
produciríamos una distribución de frecuencias de las distancias lanzada
s. veces. Hubiera SIdo una pre.cauclOn razon n el ro ósito de que la medl?~s
distribución de frecuencia tiene un valor promedio, mismo que conside Esta medlclOn
ramos por dos personas i.ndependlenteme.nte, ~~fluv~ enIJ.a medición de la
como e! valor aproxim ado de la distancia real a la que Juan puede segun? a
lanzar la del primer lanzalm~!1to n? c~ntahl~~ ~e las d~s prueba s se realizaran
pelota; también tiene una desviac ión estándar, que describe la dispers
ión de puntua ción. Tamble n sena esea en d¡a~
estas distancias. Llamaremos a esta variación error estándar de medid 1 . terese pues si queremos saber que
a, dado diferen tes, lo cual depend e de lo que nor l;osibl~mente un conjun to
que es la desviac ión estándar de los "errores" de medición de la de
distancia tan exactam ente u~ solo lanzamlentoenOun unto específico de! tiempo lan-
de lanzamiento .de una persona.
zamien tos) caracte nza a ~na person~ , la~
Con los datos psicológicos normal mente no podemos hacer toda d· iament e después de la otra. ASI,
una dos medida s deberán realIzarse una mme l~ . causa de variación
serie de medidas para cada individ uo. Existen efectos de práctica y o 11 error"
además , el tiempo no permitiría administrar 200 pruebas de lectura
de fatiga; sabemo s que la pers0!1,a es 1a mld'
·sma y que 1a umca
d . ha ersona. Si queremos saber q~e. ta~
o 200 consist e en la operacl On .de me Ir a . lC u~a ersona día con día, es
inventa rios de interes es. A menud o somos bastant e afortun ados si declf, que
podemos precisa mente cIerta medIda caracte~za a t~ación la próxima semana a par-
obtene r dos puntua ciones para cada individuo. Pero si tenemos un
par de tan cercana mente podem os ~redeclT ~ud~u;edirlo en dos ocasiones separad
medida s para cada individuo, podrem os hacer una estimación de cuál as.
habría tir de la que tenemo s hoy, sena apro~la ., d 1 individ uo de un punto
sido la dispersión de puntuaciones para la persona promedio si hubiéra Aquí estamos interes ados en la yan~eldnb ·da a la operación de medici
en el
hec.ho las medida s una y otra vez. mos ón.
tiempo a otro, así corno en la vanaClOn e ,1 .

.:..... :
'. ..
~ "
. ,",',. , ..
:"' . ',.~

. " ..... .. _., .. ...... , .... , .. " ..


I
80 CAP. 3. CUA LIDADES EN INSTRUMENTOS DE MEDICiÓN
CONFIABllIDAD 81
, Algunas veces estamos interesados en 1 T ' ' i ' d l' ' .
dlél, y otras veces no. Podemos re a "\ ~~lac.on ~ mdI~-lduo día Can a) Variación de ensayo a ensayo en respuesta a la tarea en un momento
medidas caracterizan a S en estePm guntarnos. 'lcon que ,exact!tud nuestras particular.
exact l't U dI a me d'd omento en e tIempo· o bIen ' .
I a que tenemos hov de SI d 'b"" _ . ¡ca? que
, r! b) Variación del individuo de un tiempo a otro.
semana o el próximo mes? Ambas soy{ o escn Ira manana, la prOXlma e) Variación que se origina de la muestra particular de tareas escogidas
pregunta. Los da tos que debemos col:c~egu~t~s sensatas, pero no es la misma para representar un dominio de conducta.
ta son diferentes de fa s que necesitamo~r ~~:;,lccontestar la pnmera pregun-
Para estudiar la con fiabilidad de las ca~a ,o~testa; la segunda. Aplicar al individuo la misma prueba en dos ocasiones distintas puede
(como su peso o su t>t~tura), la re etición ~~enstlc~s f¡~lcas en una perso~a reflejar los dos primeros tipos de "error", pero este procedimiento no pue-
dnecta ysatlsfactoria, que tambié~ es a r bl a medlClOn es una operaClOn de evaluar los efectos del tercer tipo, Además, pueden existir efectos de
de la conducta como : 1 u"locidad d '. p lC~ e a algun::,s aspectos simples memoria y práctica a los que ya nos referimos anteriormente.
que se ejemplifica en ei'l,;;zamiento ~~el:cc~on o el opo de habilidad motora
estamos interesados en 1;] confiabilidad
lectura. Supondremos que esta rueba
¡ lota de futtboL Supongamos que
e una. pr~CJa de ~omprensión de
e Aplicación de formas paralelas de prueba
tura en cinco preguntas cada u%o de elf c~nstá uyo .~on seIS pasaJes de lec-
vez e m~ediatamente la administramos 0J~ n~~vml~ll>t~a~os ~~ prueba una En lo concerniente a este tercer tipo de variación, es decir, la variación
te, el nmo no releerá el ni Jterial que acaba de 1 o, ¡que pasara, Clen~men­ debida a una muestra de tareas particulares escogidas para representar un
parcJal, pero en un gra do considerable su eer o 10 puede hacer en torma dominio de conducta, existe otra serie de procedimientos para evaluar la con-
marca damente influidas D üT lo que s Jessufstas la segunda vez estarán fiabilidad . Si el muestreo de los reactivos puede ser una fuente significativa de
vez anterior y prob ablem'eme las el:~~~~re a e . as preguntas que escogió la "error" y si, como normalmente sucede, queremos saber con qué exactitud
nar la pI:imera vez, ahora podrá tra bafar UI nue\' o': ~I nd'~lfue capaz de termi- podemos generalizar de una puntuación específica basada en una muestra de
y trata ra de pasar el ' l'empo '-un el
, ''- matena oco m as a ~ ante
. 1 Pnue-'
, , la segunda
'
vez tarcas a un dominio más amplio que supuestamente está representado por esa
l
I:nmera vez. Esto s mismn,<; " f prt r-. s s ~ ~ __ .:. 'o que tema sm c0111pletar la muestra, debemos desarrollar algunos procedimientos que tengan en cuenta
despu~s de un d ete r mi-;;;d ;';i~~ o" 'R al Jl¡eJl~~ en CI eno grado incluso la variación debida a la muestra de tareas. Podremos hacer esto si correlacio-
como esta, aplicad a p or se unda v!z' esu ta eVIden te que. ~ n a prueba namos dos formas equivalentes de una prueba.
tuvo la primera vez. g , no present a la m Isma dmcuItad que La forma equivalente de una prueba debe considerarse como una forma
Existe otra consideración en ¡ ' 1 "e ' ti " d construida de acuerdo con las mismas e:;pecificaciones, pero compuesta de
f
prensión de la lectura Supóno- ,:s ~u. pe ._CJO~ una prueba como la de Com-
trata de beisbol v uno' de ~os ",d , _\.O que u~o e os cmco pasajes de la prueba
muestras separadas del dominio definido de conductas. ASÍ, dos pruebas
de lectura equivalentes deberían contener pasajes de lectura y preguntas del
extrem<1 dament~ fá cil para él ~'~,~foes e~rego e~ ese deporte, El pasaj e será mismo nivel de dificultad¡ se deberían plantear el mismo tipo de preguntas, es
manera que dicha prueba sob/ee<;ti'n ~.u,a o. ~eln ra un a puntuación alta, de decir, el mismo equilibrio de preguntas de hechos específicos y de ideas ge-
lectura. Pero nótese que esto 'u - 1 ~1 ~ ~u DlvC gen eral de comprensió n de la nerales; sc deberían representar lo s mismos tipos de pasajes de lectura, esto
ClO nes de prueba, si el ma terial e~~~ ~~ilS~ m;nera conSISl~nte. en am bas situa - es, expositorios, argumentativos, estéticos, etc., pero los pasajes y las pregun-
error constante en las dos prueb" o - , J o. tI error pal a ellllQl'ndu o S será un tas específicos deberían ser diferentes.
tuaciopes de la misma manera h;~i·_; a ~,~oi ~~e es ~e erro r afectará a ambas pu n- Si tenemos dos formas de una prueba, podremos dar a cada alumno pri-
ll1con tiable, "ll l ~ .a " rue Da parezca mas confia ble (lUe mero una prueba y después la otra. Pueden ser aplicadas una en seguida de la
, EI~. unas úeas Como la habili dad " 1 1 ' • otra, si no estamos interesados en la estabilidad a lo largo del tiempo, o se pue-
pOSlbllJd ad de que el desempeño jI" " , Pa~ad a ectura, de~emos reconocer la den administrar por separado en caso contrario. La correlación entre ambas
"sp"'f
c.
'
CCI ICOS, expenencias L- -" l J]1\' l ,UOno seaun'to vme S .
v antecede!') ' ""' ;c d o - , - t ,u s lJ1tereses formas proporcionará un coeficiente de confiabilidad apropiado. Si se ha deja-
'.,.,
Á •

ya gue una prueba panic{¡lar es sól~ .~~:·'o a.'j, :n~~ t o rt a~ez a o mas debilidad, do un intervalo de tiempo entre las dos pruebas, las tres fuentes de variación
se ~esempeña el individuo S en una ~~l~/ue.\ ,ru ,~ .un arca totaL Qué tanto tendrán la oportunidad de manifestar sus efectos; es decir, la variación que
proba bkmente depende en cl'erto dr- ' ; Ola, comp 1ado con Otras personas
c1
surge de la medición misma, la variación del individuo a lo largo del tiempo y
, ' gra o (le a mue-tr p , 1 d '
se escogIeron para representar el dominio d 1 h'?'; ~ am e:.l ar e tareas que
n

1 la variación debida a la muestra de tareas.


que tratamos de apreciar Si la .c a , aOllJaad o de la personalidad Preguntar si una prueba rinde resultados consistentes bajo estas condicio-
d ' . muestra PS la 'TIlsma pa' b d'
con ucta sera casi idéntica que ,i 1 _, ,~,.. 'd la al~ as me Idas, su nes es el estándar más riguroso que podemos fijar, y si queremos usar los
Nótese que hasta ahoro hemo ida ül~'~~~ tra e tareas vana.
c
resultados de la prueba para generalizar acerca del desempeño de Juan en otra
d - d. SI entü lcado tres f- t d ' ..
esempeno que tenderán a reducir 1 "r ' o'" uen es e ":a.n aclOn en el tarea de este tipo la próxima semana o el mes siguiente, entonces éste será el
como una descripción del individu~:}-_eCl.JlOn de una pUntuaclOn panicular estándar apropiado por medio del cual evaluaremos una prueba. Para la
mayoría de las situaciones educativas, ésta es la forma en que queremos usar
82 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓ N CONFIA BllIDAD 83
los resulta dos de la prueba ; por tanto, la evidencia basada en formas ,1 d'd Cuanta más conduc ta registremos, menos depende-
valente s de prueba debería recibir normal mente el peso princip al en equi- · ble sera a me 1 a.
con fla dida de elementos azarosos en la con ducta del'1lld'lVl'd'!~ o e~ ,la
luación de la confiabilidad de una prueba. la eva- rá nuestra m~ 1 d t as Las respuestas correct as hechas por adJVma
El uso de dos prueba s paralel as proporc iona una base muy firme para muestra partlcu ar eá;:~s de atenció n se pueden balancear ~ás fácilmeclOn
esti- o los lapsos mo ent . d de la prueba que dan las puntuaclOnes dentronte.
mar la exactit ud de una prueba educativa o psicológica; sin embarg o,
cedimi ento tiene alguno s problem as práctic os, pues deman da que
este pro- d
Cuando ~~s os mIta es . alentes dbtend remos un estimad or insesga de
do
formas paralelas de prueba disponibles y que el tiempo de prueba
haya dos una correl~Cl?~ rdeadl, slon equtv total ~ partir de la correlación entre
para cada d la conhab lhd e a prue a las dos
person a sea el doble. Alguna s veces no existe una forma paralel a de la e. des 'l
prueba , o no se puede encont rar el tiempo para aplicarla si existiera.
primera mIta . Este estimad or está dado en la formu a
Adminis-
trar una segund a prueba, separad a, suele representar una deman da
abruma - (1 )
dora sobre los recursos disponibles. Estas consideraciones práctic as para T" =
zar las cosas expeditas han hecho a los constru ctores de pruebas reali- 1 + r""h
recepti vos a otros proced imiento s con los que se obtiene un cálculo más
de la con- la confiabilidad estimad a de la prueba total y
fiabilidad de la admini stració n de sólo una forma de prueba ; sin donde r" es 1
estos proced imiento s son compro misos cuando mucho. La correlación
embargo, r es a corre1ac'o'n
1
real entre las dos mitades de la prueba .
dos formas paralelas de prueba , normal mente admini stradas con un entre En:'~~ces si la correlación entre las dos mitade s de una prueba es de 0.60,
lapso
varios días o semanas, represe nta el proced imiento preferid o para calcula de
confiab ilidad.
r la de acuerdo c~n la fórmula 1 tenemo s:

2(0.60) = 1.20 = 0.75


Divisi ón de una prueba r ll = 1 + 0.60 1.60
" 'd 1 fórmul a
Por consideraciones práctic as con frecuen cia se calcula la confiab Esta fórmul a es conOCI a como aadores y porpredict iva de Spearman-
median te la aplicación de la prueba en una única ocasión. Un proced ilidad la función que cumple) y
Brown (recibe este nombre Plor suf·cb d para una sola admini stración
imiento
amplia mente usado para hacer esto consiste en dividir la prueba existen con ella es posible calcular a con la 1\d 1a
de
dos mitade s supues tament e iguales o equivalentes. Estas mitade s de te en
prueba una prueba. .' d d' iento de partir en dos mitade s una prue-
pueden separarse con base en un examen detallad o del conten ido y Lo convem ente e este pr~ce 1m
de la difi- . en muchos tipos de manuales de
cultad de cada reactivo, haciend o un esfuerz o sistemático para equilibr ba ha hecho 9-ue se le u~t amph.amdet~~!fi~~nte de confiabilidad. Desafo
conten ido y los niveles de dificult ad de ambas mitades. Un proced ar el pruebas que lllfor~a.n e e~te tIpo" r mitacio nes que examin aremos rtu-
imiento a con-
simple que suele usarse para obtene r mitades equivalentes, es colocar namente, este coefICIente tlene vanas 1
los reac-
tivos nones en una mitad de la prueba y los reactivos pares en la otra
mitad. En tinuación. h b ' do dos puntua ciones
general, éste es un proced imiento simple, dado que los reactiv os de
forma, Primero, cuando emos o tem . d" 'duo como esde una sola prueba,
él en un
conten ido y dificultad similar tienden a agrupa rse juntos en una prueba. ambas necesar iament e represent~n al 10 ,:VI nos cuantos minuto smomen to
una prueba razonab lement e larga (por ejemplo , de 60 reactiv os o más), Para determinado. ~un event.os qu~ u{a~nS~t~a~ alabras, las variacio~~s
afectan a
dividir de un
la prueba de esta manera tenderá a equilib rar factores tales como forma
del ambas puntuaClO~es caSI por 19ua · fl jarie en este tipo de coehcle nte de
reactivo, conten ido cubiert o y nivel de dificult ad. Las dos mitade s de individuo de ul} dla ~ otrO no pue den '~e;cia acerca de la precisió n
la prue- con que
ba tendrán buenas probab ilidade s de constit uir pruebas equiva lentes, confiabilidad. Este solo pued~ dar eVl momen to específico del tiempo.
las que se definieron en la sección anterior. Los proced imiento s que como podemos aprecia r a dicho ~uleto en un a las dos mitades más parecid
estamo s as que
analiza ndo dividen a las prueba s en mitades sólo para la calificación, Un se~n~~ factor hara a gunas va~~~~las separadas. Si la prueba
mas no
para la admini stración ; es decir, se da una sola prueba en una sola
ocasión y lo que sena val~do de dOd formas p t rial de referencia común , incluye
con un tiempo límite; sin embarg o, se derivan de ella dos puntua ciones: grupoS de reactIVOS basa os en un mal e asaje o reactivos de ciencia es declI,
de la calificación de los reactiv os nones y otra de la calificación de los una reactivos de lectura . ba.s~dos e~ ~~;~xo b-imen to, etc., el desemp eño
que
reacti- sobre
vos pares. La correlación entre estas dos puntua ciones propor ciona se refieren a la d~scnpclOn ~e ~
dida de la exactit ud con que esta prueba mide al individ uo.
una me- al u!a extensi ón del acto
todos estos reactIvOS depen era e~ gp t to el examinadocomún de ~o~­
Sin embarg o, debe hacerse notar que la correlación calcula da es entre . les de referenC Ia. OI an , que tiene eXlto
las prender 1os. materIa . ' , .
'robab ilidad es de alcanza r el exlto 1
dos mitade s de la prueba, y este valor no se aplica directa mente a la prueba en un reactlVO de la sene, tIene mas P en o~
en 'menta lmente indepen dientes , y SI
su totalida d, que es el instrum ento real que se preparó para emplea subsecuentes. Los ~eactivos n~ son expe~~s dos mitades de la prueba,
rse. En como
general, cuanto más grande sea la muestra de la conducta de la persona dividimos estas senes de reactlVOS entre
, más
84 CAP. 3. CUA LIDA DES EN INST
RUM ENT OS DE MED ICIÓ N
CON FIAB ILIDA D 85
pasa ría en uI?- coeficien:e. de co~fiabi
mos un coefIcIente IlegItImo e mfla lidad de los reactivos non es, prod ucir ía- donde es el esti mad or de confiabilida
(l
riales, el procedin:tiento apropiad
do entr e ambas mita des. Con esto
s mat e- n es el núm ero de reactivos en lad,
o, prueba,
alte rnad as de reactIvos a las dos mita rara men te emp lead o, es asignar seri es s, es la desviación está nda r de la prue
des de la prueba. Si las correlac L significa /ltómese la sum a de" ba, .
l~s dos mita des de la pru eba
prop orci ona n un esti mad or apro piad iones entr e y abar~a n reactIvos,
fIabIlIdad de l.a prue ba .en su total o de la con - s es la desviación está nda r de un
i.dad, las dos mitades deb ería n ser I reactIvo.
men talm e?te IndependIent~s y eqU experi-
Ivalentes¡ esto es, no deb ería haber Cua ndo cad a reactivo se califica ya
traslap~mIento de los reac nin gún sea com o 1 o O, esto es, com o corr ecto
t?vos de
cad a mItad de prue ba deb ena estar una pr~eba con los reac tivo s de la otra , y o incorrecto,
con stru Ida con las mis mas especific
que la prue ba en su tota lida d. aciones
Terc~ro,unc?eficiente de con
en algo SIn sIgmfIcado cua ndo una
fiabilidad de mitades de pru eba se con
vier te
S;= pq
prue ba se da a alta velo cida d. Sup don de P es la prop orci ón de reac
que una prue ba con tIen e reactivo
s de arit mét ica simple, hec hos de óng ase tivos correctos, Y
q es la prop orci ón de reactivos
blem as com o 3 + 5 = ?, Y que esta 100 pro - inco rrec tos.
t~ ,de tiem po de dos min utos
prue ba se usara con adu ltos con un
. Obt end ríam os eno rme s dife renc lími-
CIon en esta prueba, pero esta ias de pun tua- Entonces, la fórm ula se con vier te
s en
velo cida ?: Los errores serí an un factdiferencias serían prim ordi alm ente en
pun tuac IOn de 50 reactIvos prob ableor men or. La pers ona que obtuviera una
cua les 25 serían non es y 25 pare men te sólo inte ntó 50 reactivos
s. En otra s palabras las dos mitad~sde los
r = (n ) (S; - L
n-l
pq ) (3)
pru eba parecerÍa~ perf ecta men te
11
de la S;
consistentes, dado q~e la opo rtun Esta fórm ula llamada Kuder-Richa
In~entar los reactIVOS de man
era auto mát ica estaría equ ilib rada idad para bre de sus creado'res y del núm ero rd son. fórm ula 20 en virt ud del nom
mIt ade s de la prue ba. por las dos de su artíc ulo original, prop orci ona -
P~)Cas pru eba s dep end en
. tima dor de lo Que se llama con sist
enc ia inte rna de una pmeba¡ es deCI u~ es;
com plet ame nte de la velo cida d com grado en que t¿do s los reactivos mid r, el
esco gIm os para acla rar este pun to¡ o ésta que
SI~
d.o ~e. velOCIdad. Este fact or de velO emb~rgo, m~chas imp lica n algún gra - na. Cua ndo la prue ba es hom ogé nea en la mis~a característica de uI?-a pers o-
, en el senu do de que ~ada reactIVO
hab Ihd ad basa dos en el proc edin CIdad tIen de a mfl ar los cálc ulos de con - los mismos factores generales de
hab ilida d o de personalIdad que c. mI.de
lien
can tIda d de sob rees tima ción dep end to de divi dir la pru eba en mitades . La otro reactivo, el coeficiente alfa y u alqm er
la misma inte rpre taci ón que el coef Kuder-Richardson tI~n~n esenCIalmente
la
ver la pr,!eba, SIendo ~ayor para e del grad o de rapidez ped ido para resol- icie
dese mpe na un pap el p~mcIpal¡ no
aquellas prue bas en las que la velo de considerar. De la misma man era, nte de la prue ba dIVIdI?a que acabamos
obs tant e, la velocidad incl uye de cida d el
ne en cue nta la variación del indi vidu esti mad or de Kuder-Rlchardson no tie-
muy mar c,ada en la estI mac ión de man era o de ocasión a oca sión y es inap ropi
la con fiab ilid ad de las dos mita des, para pruebas de velocidad; den tro ado
que d~ber.a tom arse en cue nta de por 10
algu
deb ena n InSIstIr a los edIt ores com na man era. Los usu ario s de las prue bas cálculo con serv ado r del tipo de con estas dos limitac.io.ne~, propo~ciona .un
de
erci ales que les pro por cion en los cálc u- fiab ilida d de la dlvlSIon en mItades.
los de con fiab ilida d basa dos en '
formas para lela s de pru eba s.
.
Com par ació n de mét odo s
Est ima ció n de la con fiab ilid ad
a par tir
de los rea ctiv os de la pru eba Una com para ción sum aria de los dife
la confiabilidad se presenta en el cua rentes proc edim ient os para calc ular
El mae stro o el inve stig ado r que usa
muc
ho las pruebas y que lee extensa- tro factores que pue den hacer de unadro 3.1 . En este cua dro se mue stra n cua-
~ente los man uale s de prue inexacta de la ejecución nor mal de sola pun tuac ión de prue ba una
ba~ se. ~ricontrará con uno u
dlmIe~to p~~a calc ular la c~m~ otro tipo de pro ce- un indi vidu o. La tabl a indica cuálesimagen
IabIhdad de una prueba a part son las
~dmmIstrac~on. Este proc edIm ir de una sola Ó Una fórm ula que impl
ica cálcu los más simp les (la fórm
Ient o depend e de la consistencia del desempe- que da una apro xima ción más razo ula 21 de Kuder. y Rich ardso n) Y
no del mdl vldu o de un reac tlvo al nabl emen te cerca na, pero cons erva
otro, y está basa do en la desv iaci ón dora a la form ula 20, es:
de la pru~ba y en la desviación está está
nda r de los reactivos por sepa rado nda r
form a mas general, se llama coe fici . En su
~)]
ente alfa, el cua l está dad o por la fórm
ula n [ M,( 1 -
(l = ( n
n - 1
) (S; -S2 LS~) (2)
r 11 =

dond e M csla punt uaci ón de la mcdi


-;;- =¡ 1 - St
, dado anter iorm ente .
a del grup o y los otros símb olos tiene
n el mism o signi ficad o

..........------------
86 CAP. 3. CUALIDADES EN INST
RUMENTOS DE MED ICIÓ N CON FIAB ILlD AD 87
f':l:ntes de erro r que se reflejan en
~a,
bIlIdad que hem os estu diad o cada .. . Si se dan dos torm as de pru eba
proc edIm Ient o para calc ular 1 en el mis mo día, la correlación en-
~~Iha.
la "t!m ació n de la conliabTI?l:dn;¡"I, . p
[fe
rll c1hls
Cba revelara, con que
' gra d o
iuntO de tare~~ de pru eba ~ otro con
cuantas má,?, haya en un: de con f'I.anza po d em,?s generalizar
de un con -
por implicacIo , con que grado destrU Id? con las mIsmas especif~caciones y,
eCI.r, mas baja. Puede obs erva rs
e una pru eba sera más con serv
~alr
eqUlvaleútes, pue s sólo la ad . :
que .l?s dIfe rent es proc edim ient osado Um·

'i~~fiC~~~~;~t~t~:::~~ulfu:a:~:algu,y:nas~~nf~~d"~~font~~~nasari~pa"~:ó~lelaec~~
n inio con fIan za pod emo s gen erah zar de
s con m:'~n:~n
penoite que ra, es puntuación al dom tota l de tare una
todas las ción de una prue ba se hac e en dife as mue stre ada s por la prue ba. Si la aplica-

t p~evecebas, disimula la varia~~~~~6id,:,,~r La aplicación de laqmis, :'~ Cad, un~


rent es días, obte ndr emo s evidenci
l\c un dominio de las ocasiones; ade a acer
más de esto aplicamos dist inta s form c_a
~~:b'
prueba se tend rá evidencia acerca as de
o, tareas ~omo de las ocasiones. Si se del grad o de generalización tant o de las
a m~estra de reactivos. Cad a v
:fe% ~~'i ~
.a se aplIca
dü con día. Cuando~';'::~~::~ ~~li
en un solo m adm inis tran dos prue bas diferentes
¿o'
pero
v"i ad: :n~~í
a similares con la inte nció n de med ir
el
'" ígnoca la evidencia de generalización de pru mis mo rasgo o con stru cto, se obte ndrá
a ~omo una umd ad con un dominio aún más amp lio que incl uyeeba a prue ba. Aho ra consideramos un
hechos ImIte, se encubre la variación de la v
lúe 1 q~e se mue stra n en esta no
tabl
prun b os atos pa~a la con fiab ilid a deben t elocIdad para responder. Los ;Icuerdo con un plan o un diseño com sólo mue stra s de tareas escogidas de
ad que s ene rse en cue nta cua ndo diseñOS preparados por varios auto ún, sino tam bién una serie de plan
e as o. en los mformes de un estu es y
dio de e.ncuen.tra~ ,en los manuale
se eva-
de lo que se con side ra ord inar iamres. Ent onc es esta mos esti man do más allá
e mveStlgaclOn. s de ente com o con fiabilidad, para entr
terreno de la vali dez de con stru cto. ar al
Cuadro 3.1, confi
Fuenabilid
tes deadvariación re pres d j?;eneralización de una prue ba a otro Por sup uest o, es posible considerar la
s
. entes procedimientos
enta os en difer poro calcular la las autodescripciones o las califica indi cad ores del mis mo atrib uto, com o
ciones de los com pañ eros de la
edad, las de los supervisores o las mis ma
. La generalización abarca tant o de los mae stro s.
la con fiab ilid ad com o la validez de
Procedimiento experimental poro calcular lo con tructO, e indica que difieren sola men cons-
Fiabilidad
Test- tom an las generalizaciones. Com o te en la amp litu d del dom inio en el que se
se
Test- retest
Forma Formo situación com o aqu ella que semeja mue stra en la figura 3.2, podemos ver la
de prueba de pruepa Alifades ias cap as de una cebolla, y pregunta
para cua lqui er prue ba qué tan bien
refest después del paralelo paralela de nones noS perm ite generalizar a situacio rno s
inmediato, intervalo, niveles sucesivos o rem otos a part nes en
sin con y pares de (oeficiente ir del núc leo central.
misma mismo intervalo intervalo
Fuente de variación una solo alfa para
prueba prueba de tiempo de tiempo pruebo pruebo
Oué fanto se puede
esperar que fluctúe lo form as olter notiv os de
cal;F;wción debido a: uno prue bo
Variaciones que surgen
dentro del proceso de
medición mismo x Otro s form as y oc os ione s
Cambios en el individuo
- x x x x x
de dío con dío
Cambios en los muestras
x x
~ Otro s prue bas poro el
específicos de toreas ~ mismo rasg o o cons truct
Cambios en lo velocidad x x x x o _
de trabo jo del individuo x x x x rr:.;.- .']
·. · ·;.;.
Ap,~"><¡""" I~,o de
prue bo del mismo rasg o o
.. ~.... ..-.- . cons truct o
Tra slap
'd amlen
' to ent re con fiab ilid
y val 1 ez ad

~na man era de considerar la


util id d d
do ~e eruna pru~ba es preg unta rse
medIda se pue de generalizar de mo
Figu ra 3,2, Copo s d e gene rolizo
en qué
gu o a part Ir de una pun tuac ión ción o port ir de los punt uoci
de ones de prue bo.
88

Interp retació n de los coefici entes


,
r
CONFI!\ BllIDAD

la escuela elemen tal. Nótese que raun


89

con
üños en Jos grados sUfe~~f~es/r~lativamente alto es posible
¡ . comete erroares
de confia hilidad
s en la minorí a de los casos. Con ur: a es-
Cis,t nedició n apreclab~es
1, e coeficiente de.con la II a
por lo me~o sperar cambio s de cinco a 10 ul1ldades
~ión 1
a
Supóng ase que el análisis de los datos obtenid os en una escuela primari n encia debido justamente a los erro-
n~
académ icas ha dado un coeficien_ estánda r de 1::> o 16 se pue e
COn la aplicación de una prueba de aptitud es (.c,

~e lI:n:r~~~I~tarfa,
a rueba a otra con bastant e . recu . or una diferencia de puntua-
te de confiabilidad de 0.85. ¿Cómo interpr etarem os este resultad
o?, ¡qué
(.I~s ~~
\1,1
entre dos person as o dos
tr~te
n de la puntua ción de un individu o?, niedición. Cualqu iera que
significa en 10 concern iente a la precisió al pensar que la prue-
mlsm~dPedrso ~osteriores
1 e, n de cinco unidad es y e 1 na se e uivoca
C1~
mos estar satisfec hos o insatisf echos de haber obtenid o un coeficie nte
¿debere
de ese tamaño ? ocaSl • 'ones de prueba la
. ., para en reah a no pos .
I ee . , d iones de la
aplicac

resulta,do~. ~un~~~~
e una pun-
t1,~,
ntes . ne una preCISlO n que . 1 ier interpre taclon
Ya hemos tratado de dar algún conten ido y significado a 19s coeficie inverti r los Cua qu c' ones de prueba debe hacerse
pr~~i:n
han mos- ha podrían
de correla ción en la figura 2.8 yen las tablas 2.7,3.1 ,3.3 y 3.4. Estos medició n. .
er;o~::~;!edición
de prueba o de comparaClOn e
~~~
puntua -
trado valores típicos de coeficientes de correla ción, la dispers ión de se relacion a con el coe{¡-
con las una aguda concien cia del
La manera e~ gue el error estan la tabla 3.5. Nótese que ~a r:ragl1l
ciones de correlaciones representativas y la exactitu d de la predicc ión
la interpre - tud de
correlaciones de diferentes tamaño s. Una Contrib ución ulterio r a
que existe . . 'nte de confiab llrdad se muestr a en . cl'emen ta la conhab llrdad,f' pero .n
tación de la confiabilidad de una prueba se encuen tra en la relació n n. eJC erro
1 ..
uve a me
dida que se In 'able tamaño aun con coe ICle
d _
entre el coeficiente de confiabilidad y el error estándar de medició os res dlsm1l1
eden ' o r e
d
s
O
de
95.
aprecl
Al interpr etar la pu.nt~a clOn
.,
e un
n. Un rang~
la des- p.u encont rar err
Se recorda rá que el error estánda r de medici ón es un estima dor denes todavía se
viación estánda r que se obtend ría por medio de una serie de medicio del tes de conhab lhdad de 0.90 o e. '1 error estánd ar de medlclOenCIma o pOI
) . El error estánda r individ uo se debe tomar en cuenta e tándar de medición por
mismo individ uo (que se supone no cambia al ser medido
ue se extiende a part~~ de dos errores e~oduci rá una banda de!ltro de la cual
puede calcula rse a partir del coeficiente de confiabilidad por
de medici ón fórmula
d se ubl-
~demos razonablementesegur~s e~sí
medio de la bajo de la puntua clOn obtemd a, o p ( 19 de 20 oportul1ldadesl,
en el caso de la prueba de ap-
~a puntu~c:ión v~rda?era ~n
estar
.Jl-r JI la del lVI uo°ciem¿s pensar que una puntuaCiOTI
S=S lOres, P de los 80 v 100. Si pensam os en esos
m t
titud descrito en parralo s antel
donde S es el error estánda r de medición, de 90 signific a que se ubIca e~tr1· cerc:os al interpr etar y usar los resultad .
os
término s, seremo s mucho mas lscre
S~ es la desviación estándar de las pUntuaciones de la prueba, y , .ones de prueba de un 111 . d'lVl du o es
r" es el coeficiente de confiabilidad. de las pruebas.
Cuando interpr etamos las puntua cI , d a r de medición y ser de alguna
ión deseable pensar en términos del error estan
Supóngase que la prueba tiene una confiab ilidad de 0.85 y una desviac
estándar de 15 pUntos. Entonc es tenemo s
ad
s =
m
15.J 1 - 0.85 - = 15.JO TS = 15 (0.387) = 5.8 Tabla 3.5. Error estándar de medición poro distintos valores del coeficiente de confiobilid
una Error estándar de medición
En este ejemplo, un conjun to de medida s de una sola person a tendría ión de
desviación estánda r de 5.8 unidade s. Recuér dese que una proporc
dentro de un númer o dado de uni- Expresión
observaciones bastante uniform e se ubica Coeficiente
para esta Cuando S,' = 10
dades de desviación estánda r a partir de la media. Ciertos valores nor-
de (onfiabilidad genera;
relación se dieron en la tabla 2.6, en la cual se muestr a que para una curva
los casos o cerca de uno de cada tres difiere n de la media
mal el 31.8% de 0.71 s: 7.1
están- 0.50
por más de una desviación estánda r, 4.6% en más de dos desviaciones uni- 0.63 S: 6.3
al caso en que el error estánda r de medici ón es de 5.8 0.60
dar. Si esto se aplica 0.55 S, 5.5
de que la 0.70
dades, se podría decir que hay por 10 menos una Oportunidad en tres 0.45 S, 4.5
individ uo difiera de la puntua ción "verdad eraH en 5.8 0.80
PUntuación dada a ese en 20 0.39 S, 3.9
unidades (un error estánda r de medición) y cerca de una OPOrtunidad 0.85
0.32 S, 3.2
que difiera en 11.6 unidad es (dos errores estánda r de medici ón). 0.90
que 0.95 0.22 S, 2.2
Los valores numéri cos de 0.85 y 15 Son bastant e represe ntativo s de lo 0.14 5, 1.4
ciones estánda r de una de las prueba s de apti- 0.98
podría enCOntrarse para PUntua
a los
tudes académicas de grupo comerc ialment e distribuidas que se aplican
• S ,epresenfO lo desvio(ión eSfóndor de lo pruebo.
90 CAP. 3. CUALID ADES EN INSTRUM ENTOS DE MEDICiÓ N CONFIA BllIDAD 91

manera más humild e para llegar a conclus iones a partir de una puntua , ebas diferentes lo cual se estudiará en los párrafos
ción de fiabilidad de dos o mas pru ,
prueba . Pero al hacer compar aciones entre las prueba s y para varios
tipos de si¡?;uientes.
análisis de prueba, el coeficiente de confiabilidad será más útiL Cuando
medida s estén expresadas en diferentes unidades, como la altura en las
pulgadas
y el peso en libras, el coeficiente de confiabilidad propor ciona la única Rango del grupo
posible para compa rar con precisión. Dado que las prueba s de compet base .
encia en . T d d .ndica ué tan consist enteme
un campo dado (como la lectura) tienen probabilidades de usar tipos C010C,1
de
tuacion es que en realida d no son comparables, el coeficiente de confiab pun- El coeficiente .de .C?ci habl l al 1. ón co~ los otros dentro de nte
ilidad una prueba cada llldlVl. uo en re aCI ba a la segund a aplicación deun grupo.
la misma
normal mente represe ntará la única base satisfactoria para la compar
ación de cuando hay poco cfamblOBdelun~fi~e:te de confiabilidad es alto y vicev~r
prueba s. Si todas las otras cosas son iguales deberá preferirse la prueba
con el de la forma A a la orma ,e ~o . sa,
s cambie n de lugar depend e de
coeficiente de confiab ilidad más alto; es decir, la prueba que proporc
iona un pero la medida en que los llldIVld~~cisa de mediciones muy adecua que tan
rango de orden más consist ente del individuo dentro del grupo. similares sean las p~ebas. No se P das para
de los niños de segund o grado que
Otras cuestio nes que quizá no sean iguales son las conside racione s diferenciar la hablh?a~ para ladlectura
minare s de la validez y la utilidad práctica. La validez, hasta donde sea: preli- mucho más difícil colocar a cada
ara los niños del sepumo gra o, per es o de su propia clase.
apreciarla, es un requeri miento crucial en un proced imiento de medició
posible
n. La d
~iñO del segund o g~ado exactam ente entr an 'untos, podríam os esperar
confiabilidad es import ante sólo como condici ón necesaria para
que Si los niños de dIferentes grados se ,agr~p ~r ejemplo el manua l paraun
medida tenga validez. El tope para la validez posible de una prueba queda una coeficiente de confiabilidadt1~ho mas a a~ilez la habilidad mental
la
fija- -Beta-
do por su coilfiabilidad. Una prueba debe medir algo antes de que prueba Otis-Le nno n para caSI lcar cfn r tivas para grupOS de grado
pueda únicos
medir lo que queram os que mida. Un instrum ento de medició n con reportó con fiabilidades Pdra¿6~a~ ~r~~ un valor promed io de 0
una con- .78¡ pero
fiabilidad de 0.00 sólo refleja factores del azar, pero no correla ciona que estaban en un :ango e .
con ella c'oU: leto de grados {4-91, se neceSIto un
misma y no puede correla cionar con ningun a otra cosa.
para ~na agrupaCl~n d~ un ra;8~6 . Es~os datos son para la misma
El valor teórico máxim o para la correla ción entre dos medida s es la coehclente de conhab lhdad d pru~~~ ;
cuadrad a del produc to de sus confiabilidades¡ por tanto, si una pruebaraíz "
efiejan la misma precisión. A,u n a:;l, el cae f 1<.;1t:
,: -n<e - ara 10 5 gíUpOS COffiUUH' -
ue II 1-'
selección tiene una confiabilidad de 0.80 y un conjun to de califica
ciones ~os es sorprendenteme~t~ mas ~lto. nfiabilidad reportado debe tenerse en
hechas por el supervi sor tienen una con fiabilidad de 0.50, el valor Al evaluar un coeÍlClente e co
rriáximo rueba Si el coeficie
teórico para la correla ción entre ambas será .J (0.80) (0.50) =:J cuenta el rango de habilidad del gruPbo. pu~s,to daePgrupo~ de edad o nte de
0.40 . .' d de grado
= 0.63. Eviden temente , aquÍ el límite para la predicc
ión queda fijado por la conhab lhda esta' b asa d o en una
f com lllaClOntina como se vio con anteno . n'd d
a ,
confiabilidad baja de la medida criterio, más que por la prueba predict escolar, deberá descontarse en ormJe~~~~ene;se en cuenta la variabi
ésta suele ser la situació n que afronta mos. Pero si la confiab ilidad de iva, y pero aun en casos I?-enos dtrem fs b'lidad para grupoS de edad tendera
li?ad del
la prue- n a ser
ba hubiera sido sólo de 0.40, por contras te, el valor de la predicc talento. Los coehClentes e con ida 1 . 1, es porque el grupO de edad
ión
una correla ción de 0.45. A menud o no es posible hacer demasiado acerca sería más altos que para gru P . os de gra
", os esco ar ,
del talento que uno de gra do esc?-
nor-
de la
con fiabilidad de una variabl e criterio, excepto obtene r inform ación
acerca de malmen te contien e una. dl~perdlOn i~~;d~ un rango socioec onómic
ella, pero podemo s dar algunos pasos para asegurar una confiabilidad o ampho
razona- lar. Una muestr a constltUlda en f" b'l'd d ma's altos que un grupo
ble en las pruebas predictivas. · . de
tenderá a dar coe f IClenteS . con la 1 1 ba l · muy
debemos tener en cuenta e upo
Lo contrar io de la relació n que acabam os de present ar no es cierto.
Una· homog éneo. Al compa~ar :lfe~tnt1~~d~~0:sde la confiabilidad, h asta
prueba puede medir con gran precisió n y sin embarg o no tener ningun de muestr a en que estan asa os h donde
a vali- tados y juzgar más severamente
dez para nuestro s propós itos. Así, podem os medir con gran exactit
ud el esto puede determin~rse .de dIOS h~c s
ci
re~rbasad~ en los datos de un grupO
tamaño de la cabeza, pero esta medida no tiene ningún valor como indicad la prueba cuya conhab lllda estlma a es
de la intelige ncia. La validez es algo que va más allá de la pura exactit or
ud en la más heterog éneo.
medici ón.
Las consideraciones de costo~, de conveniencia y similares tambié n
den algunas veces conduc ir a usar pruebas menos confiables. Podem pue-
os acep- Nivel de habili dad en el grupo .
tar una prueba de 40 minuto s menos confiable como preferencia a .. ,
una . .,
confiab le que se requiera, porque tres horas de prueba es un tiempo muy más dio de una prueba puede
La preclslon de me~lclon por me nas ue se miden; sin estar relaclOna-
pesa- embarg o, n?, se
do desde el punto de vista de los propósi tos de la prueba . da con el nivel de hablhda~ de las fr~~~tabl~er la naturaleza de esta
relaclOn
Dentro de las limitac iones estudia das en los párrafo s precede ntes preferi- puede formul ar una regla Slmp e P o se constru yó una prueba en partlcu~ ,
mos la prueba más confiable; sin embargo, debemos tener en cuenta sino que depende de la for~a cIm ar.
varios b esultó difícil, y por lo tanto adm-
factores antes de que podam os compar ar con justicia los coeficientes Para aquellas persona s a qUleneS a prue a r
de con-

" ",--:-,:,;, : '.•.:.' .


92 CAP. 3. CUALIDA DES EN INSTRUM ENTOS DE MEDICI ÓN CON FIABILID AD 93
naron muchas respues tas la pre,cisión probab lemente será baja. En del tamaño de la misma . Si supone mos que la calidad de los rcacti-
el
extren: o, SI una prueba es muy facII para un grupo, de manera que casi otro 1 . d.de
lepen . ad
la prueba v la natural eza los examm
sus ,mIembros pueden contest ar con facilidad la mayorí a de los reactivtodos q)S e
os sonI '
as mIsmas , entonce s la
' . lhda
relación entre }a conhab ., d y e I tamano
- d e Ia prue b a pue d
posIble que esa prueba sea meficaz para discriminar entre los miembr os es e expresarse por
os de 'ese medio de la formul a:
grupo., Cuando todos puedan contest ar fácilmente los reactivos es
como si
se hubIera acortado la p~ueba, ~ad~ 9~e las diferencias están basadas
mente en aquellos reactIv os mas dIhcIle s que alguno s pueden contesjusta- r :::1 (S)
otros no.
tar v 1 + (n - 1) r!l
' d
!~mbién ~s posibl~ que una prueba varíe en exactit ud a es la confiabilidad de una prueba n veces más grande que la prueha
diferentes niveles don e r,,,,
de dIfIcu,ltad lDtermedI?,s. El constru ctor de prueba meticul oso reporta origina l,
error estanda r de medIcl On para su prueba a distintos niveles de califica rá el ..
r" es la confiabilidad de la prueba ongma l, y
ciones. 1l es, como se indicó, el factor median te el cual
Cuand o se reportan los valores separad os de los errores estándar de medici se increm enta el tama-
ón
en el n:anual , seprop orciona una base para evaluar la precisión de ño de la prueba.
la prueba
p~ra dIferentes tlI?os de grupos, así como se obtiene
un estimador más apro- Ésta es una forma más genera l de la fórmul a (1).
pIado de la exactItud de una puntua ción del individ uo en particul .
ar. Supóngase que tenemos una prueba de ortografí~ de 20 re.actl"o
Cada puntua ción del individuo puede interpre tarse en relación con s guc
error estánda r de medici ón para lasyunt uacion es en ese nivel; por el ticnen una confiabilidad de 0.50. Querem os saber que tan conh~ble
ejempl o, sera la
los resultad os de la prueba de habIlIdades cognoscitivas verbal nivel prueba si la amplia mos 100 reactiv os compar ables con los 20 ongmal
A se es. La
expresa n en "puntu aciones de edad estánda r (PEE)" con una desviac respuesta es
ión d~ 16 .
puntos , y reportan el error estándar de medición a diferen tes puntua
crudas como sigue: ciones 5 (0.50) 2.50 = 0.83
. _ _o

1 + 4 (0.50) 3.00
Puntua ción cruda Error estánda r de medició n en unidades SAS A medida CJue se increm enta el tamaño de la prueba, l~s errores ue ;nedi-
ción debidos al azar más o menos desaparecen; la puntuaClOn depend
15 era cada
4.3 "cz más comple tament e de las características de la persona que se mIda,
25 y se
3.6 podrá obtener una apreciación más adecuada de ella.
35 3.1 . .
45 Por supues to, cuántas veces podrem os aument ar la prueba que~a
2.1 lImI-
55 tado por varias consideraciones prácticas; por ejemplo, por .la cantida
2.3 d d.e
65 tiempo disponi ble para la sesión de prueba, por factores de fa~~ga y de
miento por parte de los examin ados, y algunas veces tamble n por abum-
2.8
75 4.8 nuestra
incapacidad para construir más reactivos igualm ente bucnos . Pero dentro
todos estos límites , es posible aument ar la conhab ¡hdad lo necesarI de
Esta prueb~ mide con mucha mayor precisión (cuand o las medida O por
expresa n en umdade s de desviación estánd ar del mismo tamaño) a s se
aquello s medio del alargam iento de la prueba.
al~mnos que obtUVIeron ~e~ca d~ la mItad de los 100 .
Un tipo es'pecial de alargam iento consiste en increm entar el ~umer.o
reactiy os correct de
a aqucllo s que tuVIeron eXIto solo con unos cuantos reactivos o os que examinadores que califiquen a un individ uo o .~ un productO. de este.
con casi En la
t??os. Este resultado fue produ~ido intenci onalme nte por medio de medida en que la inconfiabilidad de una evaluaclOn se deba a la mc~~sls
con que se juzga una muestra de conduc ta, esta fuente de mconhabl~ldatencl<l
la selec-
cJOn de :x-uchos reactIv os de.d¡flcult~d modera da que discrim inaban
de habIl~dad en el rango medJO y relatIva mente pocos reactiv os muy grados de reducirse median te el increm ento del número de Jueces. SI vanos
d pue-
fáciles o jueces
muy dI{¡clles. En efecto, una prueba más larga evalúa de una manera están a disposi ción y tienen la misma experiencia ~on los materiales
más efi- que
caz a los alumno s en el rango medio que a los alumno s que se ubican
en los van a calificar a una familiaridad igual con lo calIfIcado, SI las calIhcac se
~xtremos, de esta forma la media es más exacta cuando
lOnes
son de una persona , entonce s la fusión de sus calificaciones pro~uci
mtermedJO.
se evalúa el grupo
valor más confiab le; la fórmul a (5) mide este increm ento e~ la conhab
rá un
l]¡dad.
Por ejemplo, si un par de jueces evalúan muestr as de es~n~ura y se
observa
una correlación de 0.40, entonc es cabría esperar que las calIfIcaCIOnes
Tamañ o de la prueba cOnJun-
tas de los tres jueces correla cionara n con otros tres como sigue:

Como ya vimos. a~1teriormente, al estudia r el coefici ente de confiab


ili- _3~(0_.4_0_)_ = _1_.2_0 = 0.67
dad de la prueba dIVIdIda en dos mitade s, la confiab ilidad de la + 2 (0.40)
prueba 1.80

~-
" _ - _o
94

Operaciones empleadas para la estimada


,
¡,
CON FIABILIDAD 95

que a ~enudo surge ~~¡ respuesta general a esta pregunta; si debemo,s to.mar
í.j. . 'cuál es la con fiabilidad mínima que puede aceptarse?
r
Qué tan grande será el valor del coeficiente de confiabilidad depende tam- ¡ En realIdad,
bién de cuál de los distintos conjuntos de operaciones experimentales se usará d . " no hay aCClOn
o alguna . , re specto a un individuo , lo haremos
, en termInOS
una eCIs!O~ ., t ngamos sin importar que esta no sea muy con-
para estimar la confiabilidad. En el cuadro 3.1 vimos que los distintos proce- de 1;1 mejor mforI?-aclOn que e al men~s su confiabilidad es mayor q~e cero
dimientos tratan diversas fuentes de variación qe modo diferente y que sólo el fiable, pero consldera~ddo q~; rucial siempre es la validez de la medIda). La
to la conSI eraClOn c . tér
(por sup~,es ,
uso de las formas paralelas de una prueba con un periodo de tiempo entre eUas
e d' d cualquiera que ésta sea, surge SIempre en _
incluye las cuatro fuentes de variación del "error"; es decir, este procedimien_ 'lpreciaclOn de la nuev~ n: 1 a, los ue compite. Así, una prueba escolar
to de calcular la confiabilidad representa la definición más exacta de la habili- ;ninos de otros procedImIentos c~n ¿
un coeficiente de confiabilidad de
dad de una prueba para reproducir las mismas puntuaciones. ASÍ, el individuo de matemáticas para la secund~na, ~oh bl'era disponibles otras pruebas con
debe mostrar consistencia tanto para una muestra de tareas como para otra 'd ía poco atractlva SI u d' .
O 80 se con SI erar. . . d d O 85 a O 90 Por otro lado, un proce lmlento
CO
y de un día para otro. En la tabla 3.6 hemos reunido algunos ejemplos que · eficientes de confIabIllda e.. 'na 'confI'abilidad de no más de 0.60
muestran los coeficientes de confiabilidad para la misma prueba cuando éstos . }'Td o" que tuvIera u . IT
se han calculado mediante dos procedimientos diferentes. para Juzgar e 1 erazg. ' } lt rnativas fueran un conJunto de ca I lca-
~iones
odría parecer muy atractivo SI as a e nfiabilidades de 0.45 a 0.50.
no controladas que tuvIera.n co ínimo absoluto para la confiabili-
Tabla 3.6. Comparación de los coeficientes de confiobilidad obtenidos de formas de pruebo A pesar de que no podemos l¡ar,Un :demos indicar el nivel de confia-
equivalentes y de fraccíones de uno pruebo simple dad de un procedi~iento dí medlc~~~~~ de exactitud específicos al des~rib~r
bilidad que se reqUIere para og~ar m hemos dado una prueba a dos mdI-
a un individuo? u,: I?rupo. Sup0I?-g~se ~leercentil 75 del grupo, mientras que
Prueba
Formas
equivalentes
Prueba
simple
viduos y que el IndIv~d~o A sle ubICO e1 56 .Cuál es la probabilidad de que A
el individuo B se ubICO en e perce~tl . . 1 eba otra vez? En la tabla 3.7 se
Prueba de inteligenria Lorge.Thorndike
todavía sobrepase .a B SI se le~'l~r~~~:sav;k:res del coeficiente de co~fiabili­
Prueba verbG!~ nive' (
0.91 muestra la probabIlidad p~:a l i t e exactamente una oportumdad de
Pruebo no verbol-nivel ( 0.94 dad. ASÍ, donde la correlaclOn es ~'~~~~~usos sea invertido. Cuando la correla-
50-50 de que el orden ~e. lod ddoS lIn. I sión es más de uno en tres. Para una
Pruebo lowa de habilidades bósicos 0.87 0.94
Pruebo de aritmética- grado 5 ción es 0.50, la probabIhd~ e a mver ortunidad en 12 de que obtenl$amos
Ortografío-grado 5 0.87
0.86
0.90 correlación
una inversión 0.90,
de en todav13, ha!e lna
la repetlClOn o~ba . Para tener cuatro oportumdades
a pru
Pruebo de lec/uro Gates-MaeGinitie-Encuesta O 0.90
Vocabulario-grado 4
Comprensión-grado 4 0.85 0.88
Tabla 3.7. Porcentaje de veces, que "fa' dl~e(~~nqu: s: u~~on en los percentiles 75 Y 50
0.83 . .. d , d'f renda se invertirá en los pruebas
0.94 subsecuentes poro os ca I ICOClon

Porcentajes de inversiones con pruebas repetidas


Los dos procedimientos comparados en la tabla 3.6 son correlaciones de
formas paralelas y correlaciones hechas de pruebas divididas a partir de una (oeficiente Puntuaciones de Promedios de Promedios de
sola forma. Debe notarse que las formas paralelas tienen correlaciones más de con fiabilidad individuos solos grupos de 25 grupos de J 00
bajas en cada caso. Esto es congruente con el análisis anterior, en el que seña-
lamos que el procedimiento de forma alternativa constituye una prueba que
demanda más precisión de un instrumento. La diferencia entre los dos proce- 0.00 50.0 50.0 50.0
dimientos varía de una prueba a otra, yes tan pequeña como 0.03 en un caso 0.40 40.3 10.9 0.7
y tan grande como 0.11 en otro; pero en cada caso es necesario eliminar la 0.50 36.8 4.6 0.04
correlación de los pares y nones.
0.60 32.5 1.2
0.70 27.1 0.1
zQué tanta confiabilidad debe tener una medición? 0.80 19.7
0.90 8.7
Obviamente, si otras cosas permanecen igual, cuanto más confiable sea el 0.95 2.2
procedimiento de medición más satisfechos estaremos con él. Una pregunta 0.98 0.05
96 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓ N

de cinco de que nuestra diferen cia se quede en la misma direcció n,


mos una confiabilidad cerca de 0.80.
En la tabla 3.7 también se muestra la situaci ón cuando compar amos
requeri-

dos
I
I
!
.
ReactJvo 6. E uso
1 d "but" después de la cláusula "altbou gb".
e
. e he was late, he still attended the meetin~.
(11 Becaus h as late he still attended the meetIng ..
CON FIABILID AD 97

grupos Ipara grupos de 25 o de 100); por ejempl o, si en la clase A, de


25 alum- • (21 AlthOUg~ h~ ~as late; but he still attende d the me~tlng.
nos, el promed io cae al percent il 75 de algún grupo de referencia más (31 Althoug h was late but he still attende d the meetmg.
grande, (4) BecauSe e
mientras que en la cIsc B el promed io cae en el percentilSO, ¿cuál serála "
proba-
bilidad de obtene r lo contrar io si se repitiera la prueba? Aquí todavía
tenemos
una oportun idad de 50-50 en el caso extrem o en que el coefici ente de
confia-
bilidad fuera de 0.00; sin embarg o, la segurid ad de nuestras conclus Número correcto-Forma A
iones se
increm enta mucho más rápidam ente con grupos que con individ uos
a medida Total
que la con fiabilidad de una prueba resulta cada vez mayor. Con una Número correcto-Forma 8 O 2 3 4
confiabi-
lidad de 0.50, la probabilidad de una inversi ón baja a uno en 20 para
grupos de
25 y de uno en 2 500 para grupos de lOO, Con una correlación de 0 .70, 2 2 6 36 47
la
babilidad es sólo de uno en 1 000 para grupos de 25 y es pequeñ ísima pro- 4
1 1 4 7 14
grupos de 100. Por tanto, una prueba con una confiabilidad relativa para 3
1 1 1 1 1 5
mente 2
baja permitirá hacer estudios útiles y llegar a conclus iones exactas 1 1 1 1 7
acerca de 1 3
los grupos, en especial aquello s de tamaño considerable, pero se necesita 21 3 1 1 27
una O
confiabilidad mucho más alta si se requiere derivar conclusiones confiab
les de
individuos. 28 7 6 13 46
Totol

El concep to de confia bilidad aplicad o


a las prllebas forma tivas de domin io . • s en ' 1
lU E'l' "SO de "mose con nomore
ReactlVO ,u. .
pmra .
1 The most of the student s must study three hours every
Todas las consideraciones acerca de la con fiabilidad mencio nadas
supuesto la medició n de una variable continu a que no tiene límite han
o "tope".
.bl Most students must study three hours every mtht.
(3) Most student must study three hours every mg ~. h
night .

Hemos excluido la idea de un desemp eño "perfec to"; sin embarg o, en (4) Most of student must study three hours every mg t.
evalua-
ciones formativas enfocadas con agudeza , cuando se diseña una prueba
medir alguna habilidad específica, es razonab le esperar que una buena para
propor- • La respuesta correcta está marcada con un asterisco .
ción de estudia ntes puede obtene r puntua ciones perfectas en la prueba.
Considérese una prueba diseñada para emplea rla con estudia
extranj eros del idioma inglés, con el fin de evalua r su domini o acerca ntes
de
tas ,constru cciones específicas del inglés. En esta prueba Blatchf ord cier-
Número correcto-Forma A
11970)
evaluó el domini o de cada una de las 10 constru cciones del inglés, 4 Total
para lo Número correcto-Formo B O J, 2 3
cual utilizó cuatro opciones para cada constru cción. Se diseñar on
dos for-
mas de la prueba y se admini straron a grupos de estudia ntes con un
intervalo 4 12 18 38
de una semana entre las dos aplicaciones , Los reactivo s de opción 4 1 3
múltipl e 3 5 5 16
que ilustran dos de estas constru cciones se muestr an abajo. Se requerí 3 1 2
el estudia nte escogiera la que era correct a en inglés. Cada reactiv o a que 1 3 2 10
tiene 2 2 2
tabla que muestr a el porcen taje de los estudia ntes que obtuvie ron cero, una 1 4 4 1 1 1 11
dos, tres o cuatro opciones correct as en cada una de las dos prueba uno, 1 3 1 25
s; esto O 15 5
la entrada en la fila de arriba y de la primer a column a para el reactivoes,
6 24 27
muestr a que 2% del grupo obtuvo cero respues tas correctas en la forma Totol 23 16 10
Ay
cuatro correct as en la forma B.
Ahora centrar emos la atenció n primero en el reactivo 6. Nótese que
36%
de los estudia ntes obtuvie ron calificaciones perfectas en ambas pruebas . , U ' a arece con un comple to domini o del
21 % obtuvie ron cero en ambas pruebas. Para este 57% dd grupo, y consist ente e m~qUl~oca.. n grupo el~tro parece estar comple tament e en el
la prueba uso correct o del mgles, n:;¡entras <;lu~
pequeñ a de cuatro opciones proporc iona una informa ción perfect
amente lado opuesto . El otro 43'tu mostro a gun a inconsi stencia ya sea dentro de una
98 CAP. 3. CUALIDADES EN INSTRUMENTOS DE _
MEDIClON
CONFIABILJDAD 99
~rueba. O entre ambas pruebas. 'Cómo d '
slstencI~ o de inconfiabilidad? l po namos expresar el grado de incon. veroS y flexible, respectivamente. Este reactivo proporciona una base menos
Lo Importante que debe recordarse es e confiable para dar respuesta a la pregunta central: ¿ha dominado la habilidad
usa para decidir si un estudiante ha d q.u ~na .prueba como la descrita se el estudiante?
Podríamos fijar un estándar severo aomIna o, CIerta habilidad específica. Respecto a una prueba que se usa sólo para decidir entre "dominio" o "no
-cuat~o correctas de cuatro- como in~ic~d~~aJ S~10 ~1I~ desempeño perfecto dominio", el porcentaje de decisiones consistentes es tal vez el mejor índice
mos dIspUestos a aceptar un estánda ' e. OnunIO¡ o tal vez estuviéra_ de confiabilidad. Desafortunadamente, este índice está en función tanto de
des~mpeño satisfactorio, reconociendom~ relajado de ~res de cuatro Como las características del grupo como de la prueba. Si muchos estudiantes estuvie-
algun factor extraño puede atribuírsel q e a una ense~anza deficiente o a ran cerca del umbral de dominio por haber aprendido a medias cierta habili-
mos, la cuestión a preguntarse es" e, este error. CualqUIer estándar que fije- dad, habría muchas probabilidades de inversiones de una aplicación a otra de
situación en la otra prueba 1 'cuá~~que tan mbenudo se hubiera invertido 1~
don a "reprobadoh o 10 co;;t~ario? as veces a damos cambiado de "aproba~
h la prueba. Por otro lado, si muchos hubieran aprendido la habilidad muy bien,
o muchos nunca la hubieran aprendido, las inversiones serían relativamente
Los resultados del reactiv 6 infrecuentes. Por tanto, es importante evaluar la confiabilidad de una prueba
dares. o se muestran en seguida para los dos están- formativa de dominio con grupos de estudiantes que han alcanzado cerca del
mismo grado de seguridad en el dominio de la habilidad, como con aquellos
para los que la prueba se empleará eventualmente.
Ahora necesitamos contar con alguna forma de decidir qué porcentaje de
Estándar severo decisiones consistentes representa una prueba satisfactoria. En un extremo,
(las cuatro correctas) Estóndar aceptable con dos opciones (por ejemplo, «aprobado" o "reprobado") el azar debería pro-
Forma A (tres o cuatro correctos) ducir un acuerdo en el 50% de los casos. Si la prueba no da resultados más
Forma A consistentes que echar un volado, obviamente no tiene valor. En el otro extre-
Formo B Reprobado mo, si hubiera un acuerdo del 100% entre las dos formas en la decisión a
Aprobado Forma B f?eprobado Aprobado tomar, la confiabilidad de esta decisión sería claramente perfecta. Los porcen-
Aprobado lJ tajes intermedios, que casi siempre ocurren, requieren ser evaluados. Los por-
Reprobado
36 Aprobado centajes de acuerdo de 79, 86, 71 y 75 que se encontraron para las dos pruebas
43 10 8 53
Reprobado 33 de cuatro opciones para los dos estándares de dominio ¿son buenos, sólo to-
6
lerables o insatisfactorios?
Es difícil dar una respuesta general a la pregunta anterior, pues depen-
.S.i ,hubiéramos utilizado el estándar h' de del tamaño de la prueba, por un lado, y de la seriedad e irreversibilidad de
decIslOn para ambas formas para el 79~~vero, ;.bnamos obtenido la misma
para ,el 21 %. Con el estándar más fle ·1,1 e stu lantes y la decisión opuesta
habnan sido 86 y 14. Xl e os porcentajes correspondientes
t la decisión por el otro. Cuando más corta sea la prueba, mayores inversiones
podremos esperar, y cuanto menos crucial sea la decisión, mayores inversio-
nes podremos tolerar. Con base en que las pruebas que analizamos estaban
Las decisiones para el reactivo 10 pueden expresarse de 1 . constituidas por cuatro opciones, las consistencias que estuvieran en un ran-
a mIsma manera. go entre el 70 y el 85% son probablemente tan buenas como cabría esperar. Si
los resultados se usaran sólo para revisar y guiar una instrucción de remedio,
este nivel de consistencia podría haber sido tolerable, debido a que los errore~
Estóndar severo de la decisión inicial se habrían corregido en una aplicación posterior de la
(los cualro correctos) Estóndar aceptable prueba. Los constructores de pruebas no han estudiado de manera sistemática
Forma A (tres o cualro (OrreClos)
las propiedades de las pruebas cortas enfocadas agudamente a un problema.
Forma A En consecuencia, hay muy poca teoría disponible en cuanto a qué porcentajt!
Formo B Reprobodo Aprobado Forma B de consistencia puede esperarse con pruebas de cinco a 10 reactivos, o aun
Reprobado Aprobado hasta de 20, o cómo se relaciona la consistencia con lo limitado de la defini-
Aprobado 20 ción de los objetivos.
18 Aprobado
Reprobado 53 14 40 En los ejemplos anteriores se utilizaron datos de formas de prueba parale-
9 Reprobado 35 IJ las aplicadas con una semana de intervalo. Por supuesto, habría sido posible
dividir una prueba y obtener dos puntuaciones de una sola aplicación de la
prueba; puntuaciones que se podrían tabular para determinar la frecuencia de
Evidentemente, el porcentaje de inversi inversiones de la decisión de "aprobadoh¡ sin embargo, con los estudiantes
que para el reactivo 6. Hay 29 y 25% d . ones.es mayor para el reactivo 10
e InVerSIOnes para los estándares se- que se encuentran en el umbral del dominio,los cambios de una prueba a otra

. . . . . . " .:> '~. ':. ' ' .'.


'. '.' .' .. '.-' ~ " ,, :'; ,.~., ." ., ........", - . ...... ,,:.
', ' ., .' , ..~ . .~ . ; ..
-, '
" : .. ,'. ... , .. ,-.'- . . .""., ;'::" -,..'.,-. ,-.,'' :;: : ;:. (:.:~;::~ ,,:. . >.:.;:.< ;. , .... " .
100 CAP . 3. CUA LIDA DES EN INST
RUMENTOS DE MED ICIÓ N
101
serian muc ho más com une s que aqu
Bla tchf ord enc ontr ó coeficientes de éllos con una pun tuac ión más baja. Así
de cua tro opciones apli cad a una sola confiabilidad med iano s para una prueb~ Prue bo de aptitudes
laci ón med iana entr e las formas aplivez, que eran de 0.80, mie ntra s la corre-
sólo de 0.61 . Este resu ltad o sugiere cadas con una sem ana de intervalo era
que dos pruebas muy cort as aplicada
diferentes días pue den prop orci ona s en
r una base más con serv ado ra y prob
men te muc ho más sóli da para deci able-
dir acerca del dom inio de una habilida
una pru eba más gran de aplicada d que
una sola vez. 1
1
Prue bo de: lectura
Con fiab ilid ad de la dife ren cia ent
re pun tua cio nes
.1
Alg una s veces esta mos menos inte 1

que en la relación entr e dos pun tuac resa dos en las pun tuac ione s simples 1
1
ferencias entr e la apti tud escolar y ione s. ASÍ, nos pue den interesar las
di-
po de alum nos , o quiz á pod amo s el apro vec ham ient o en la lect ura en un gru-
l ·
lo resto dejo
dese
tura de una prueba apli cad a en octu ar que los estu dian tes mejoren su lec-
bre a una prueba pos teri or aplicada
siguiente may o. En esto s ejemplos
es la diferencia que existe entr e amb
el hec ho significativo para cada indi

os las características de ambas prue


en el
viduo
qué tan confiable son nue stra s estimas pun tuac ione s. Deb emo s preg unta rnos
pun tuac ione s, una vez que conocem aciones de estas diferencias entr e las dos
I
fl'
i
sus com pon ente s. bas y
Des afor tuna dam ente es cierto que
dos pru eba s suele tene r confiabilida la apreciación de las diferencias entr e !l
madas por separado. Esto se debe des más bajas que las de dos pruebas to- f,
a los siguientes factores:
• 3 3 Naturaleza de uno difer enci
FIguro . ' o de puntuación.
a) Los errores de med ició n en amb
as
en la diferencia de las pun tuac ioneprue bas por sepa rado se acu mul an .,
des estándar de pun~uaclOn men~~ la untu ació n de la prue ba de apti tud
b) Cua lqui er cosa que sea com s.
ún a amb as medidas se cancela en expresada en estas mIsmas um dad
..
E!
esta barra los factores com une s .han
la prueba de lect ura y con el SIgn
renc ia de las pun tuac ione s. la dife- desaparecido y aparecen c<:m un sIg
no: ued an cancelados. Solamente o
inverso en la prue ba de apt1~fd, por
maneeen los factores espeCl ICOS y t~s~e ~ror de medición ¡los factores que
per-
Pod emo s ilus trar esta situ ació n pur
gura 3.3). med io de un diagrama (véase la fi- determina la diferenCIa de puntuaC . , j. esto s últi mos hac en un volu men
, lOn 'b Si dos prue bas mid iera n exac-
Cad a barr a en la figura 3 .3 represen
ta el desempeño en una prue ba (o más
relativamente mas gran de en esta tercera 'loarra
los
.
erro . .,
res de medlclO
prec isam ente , la varianza en la ejec tamente los mis mos factores com~ne n perm ane -
s, s~ dife renc
núm ero de part es que repr esen tan ución de la prueba) con stitu ida por un eerían en la diferencia de puntuaClOn
es Y as
ias tend rían exa ctam ente
los
La prim era barr a representa una prue factores que prod uce n este desempeño. una confiabilidad de cero .. f . t dos medidas expresadas en pun
prue ba de lect ura. Nót ese que hem ba de apti tud escolar y la segunda una La con fiabilidad de la eren Cla tua-
os
la lectura. Una parte, den omi nad dividido en tres partes el desempeño en eiones está nda r puede obtedIners ;n re
e me lant e un
a fórmula bas tant e simple com o
a
habilidades intelectuales gen eral es Factores com une s, es un complejo de la siguiente:
que ope ran para la prueba tant o de
com o de apti tud escolar. Una segu lectura
nda
la lect ura , son habilidades que apar parte, llam ada Factores específicos de 1/2 (r ll + ru) - r n
(6)
cera part e, den omi nad a Error, es ecen sólo en la prueba de lectura. La ter- rDif/. = 1 - r l2
el
milares que dan indicadas par a la error de med ició n al azar. Tre s partes si-
prueba
Aho ra exa min arem os la terc era barr de aptitud_ donde r es la confiabilidad de una
a que representa la diferencia de pun medid¿!
tuaciones; es decir, la pun tuac ión de r ll es la con fiabilidad de la otra me d
lectura expresada en cier to tipo de unid -
a- r22 es la correlación entr e ambas me y
las .
d· J'
12
CON FIABILIDAD I UJ

102 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN


(Ora que Berta. C~~l,quier difere~cia ne~esjta ser interpretada a la luz del error

~de~a f eci.1e 0.9~, y la correlación :n:r~e~ ~e °d Ó~ confiabilidad de la


ASÍ, si la confiabilidad de la pru b 80 estándar de medIclon de esta dIferencIa.
Se encontrará que muchas diferencias son relativamente pequeñas com-
a e a 1 erenCla de puntuaciones tendremo~s e . O, para la confiabili- paradas con su error estándar y, en consecuencia, muy poco confiables. La
interpretación de los perfiles y de las puntuaciones de ganancia tiene lugar
cuando se aplica específicamente esta precaución.
1/2 (0.80 + 0.90) - 0.60

0.25
1 - 0.60
,
i:
Influencia de la falta de confiabilidad sobre la
correlación entre variables
= 0.40 = 0.62 t
Existe un efecto de la falta de confiabi1idad que amerita nuestra atención
debido a que afecta nuestra interpretación de las correlaciones entre diferen-
En la
de tabla
1/2 (r3.8+ser muestra
) y r Pel va1or de. rDiff. para varias combinaciones d
~os prueb~s a~ o.dó~ 1~~~~f:~b·I~Jl confiabilidade~
valores tes medidas. Supóngase la existencia de una medida de comprensión de lec-
de las es ddomedi.o de las tura y una de razonamiento aritmético. En cada una de estas pruebas las
nes, sera de 0.80 cuando las dos pruebas: 1 aan e la ?lferencia de puntuacio- diferencias individuales en la puntuación se deben en parte a la habilidad
sera 0.6~,cuando la intercorrelación s JnB una m:ercorrelación de 0.00· "verdadera" y en parte a1/1 error azaroso de medición". Pero si los errores de
correlacIOD sea de 0.80. Es claro ue ~i e .5.0, y sera 0.00 cuando la inter~ medición fueran realmente materia de azar, los errores de la prueba de lec-

~~~t~Ú~d~JIJ:l~d~~~e~c~~sd~op;~o~fi~~~~~;~~~fiahlí[~;~C!~~a~~~~s
n uaCIOnes dIsmmuye su valor.
li:
'
tura y los de la prueba de aritmética no se correlacionarían. No hay relación
entre lanzar al aire una moneda ahora y volver a lanzarla un poco después.
ASÍ, tenemos estos errores sin correlación en las puntuaciones totales. Esto
significa que deben diluir cualquier correlación que pudiera existir entre las
Toblo 3.8. Confiobilidod de uno diferencio de calificoción puntuaciones verdaderas¡ es decir, las puntuaciones reales son una combina-
ción de las puntuaciones verdaderas y las de error, de manera que la corre-
Promedia de confiabiliJad de das pruebas lación entre las puntuaciones reales es una combinación entre la correlación
[orrelación entre 112('11 + r22 ) de las puntuaciones verdaderas subyacentes Yla correlación 0 .00 que carac-
das pruebas
teriza a los errores.
A menudo nos gustaría obtener una estimación de la correlación entre las
('12) 0.50 0.60 0.70 0.80 0.90 0.95
puntuaciones verdaderas subyacentes de nuestros datos obtenidos, p ara
entender mejor cuánto tienen de común las dos funciones implicadas. Afor-
0.00 0.50 0.60 0.70 0.80 0.90. 0.95 tunadamente, podemos hacer esto de manera bastante simple, pues un esti-
0.40 0.17 0.33 0.50 0.67 0.83 0.92 mador de esta naturaleza es posible gracias a la fórmula
0.50 0.00 0.20 0.40 0.60 0.80 0.90
0.60 0.00 0.25 0.50 0.75 0.88 I (7)
010 0.00 0.33 0.67 0.83
0.80 0.00 0.50 0.75
0.90 0.00 0.50 rl",h es la correlación de las puntuaciones "verdaderas" subyacen-
0.95 0.00 donde
tes,
r 12 es la correlación de las puntuaciones obtenidas, Y
r\l y In son las confiabilidades de las dos medidas bajo considera-
ción.
~::~ ~~~~~:~ti!'".U~a~i~~ :~~:ct~:¡~:~anl~t~ilr::n~~: ~':,~~:~r " 1,
. Algo que el psicólogo 1 d d .
6 El error est:indar de la medición de una diferencia es aproximadamente igual a
dIa~nóstico. Así, la afirmació~ d~e ~eseamos usar patrones de prueba ~::e:i
aptItudes e~colares, es un juicio q! dlb le~tura de Roberto es secundark a sus
'¡S;, I + S;'2
ClO a~erc~ ac su aptitud escolar o su gr:d~ da¡erse con más cuidado que un jui- donde S es el error estándar de medición de una prueba, y Sm es el error estándar di
conc USIOn de que Marisa ha me' orad e ectura t,omados por separado La
malmente un juicio tentativo, rriás qU~ ~llect~
que ansamas ahora
que Berta debe
es una ser lec-
mejor ~or- medició';;.l de la otra. 2

E
• ' , i. · ::" ;:"': ' ',', ,', '~, • " ,.
104
CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN
FACTORES EN EL USO PRÁCTICO 105
. P?r tanto, si se encontrara qu 1 l '.
~r~tretbca90es de 0.56. y los coefici~n~~~d:ec~~fi~bmJe ~a~ pruebas de1ectura y 1l-cerIas damos tanto como lo que recibimos. Algunas pruebas pueden estar
. y. ,respectIvamente, tendríamos a e as pruebas fueran a , de manera l'Igeram~nte mas
diseñadas ' fe.lcaz,
' d e ta I mo do que d an medIdas
. un
poco más confiabl~s, por ~muto de tlempo de pru~ba, per?, de c:ualquier
r = 0.56 nanera una reduccIOn del tiempo de prueba se lograra al precIO de perdida de
Ixh J (0.71)IO.90} = 0 .70 f ~X;lctit~d O de la posibilidad de .ob:e~er.una buena concl~sión. _ .

I
Un tercer aspecto, bastante sIgmfICatiVO, de la economIa es la faCIlidad de
-Nuestra estimación es que la l' , calificación. El trabajo de un empleado de calificar una batería de pruebas a
de lec~ura ya libres de error seríac~:r3 ~ZIO~entre las medidas de aritmética y mano puede convertirse en una carga si tiene que hacerlo un maestro, ya dr
aprop~do pensar que la correlación e~tre' eU comaa~ar estas/unciones sería por sí ocupado, o ~<.>stoso si se realiza por medio d.e empleados contrata~o:
,-
pesar e que las pruebas correlacionan sólo a~.~6. e .70, mas que de 0.56, a para este fin especIfIco. Como resultado, los usuanos de pruebas se confIar__
cada vez más en la calificación mecanizada y los editores de pruebas producen
pruebas que se puedan 'procesar ~~diante ~D: equipo cada vez má~ completo.
~~g~O~ESQUE INFLUYEN EN EL El usuario de pruebas tIene la opcJOn de cahfIcar a mano sus propIas pruebas,
RACTICa QUE SE LE DÉ A fijar un arreglo en su unidad de calificación mecanizada o mandar las pruebas
UN INSTRUMENTO DE EVALUACIÓN a algunos de los servicios de calificación de pruebas que se especializan en un
procesamiento de. alta velo~idad . . .. .
N? Obstante que la validez la f b' . Existen agencIas profesIOnales que proporcJOnan calIfIcaCIOnes de prue-
en los ~nstrumentos de medida c~anJoJ? la lhdad Son de capital importancia bas y reportes muy eficaces. El equipo básico consiste en un lector de docu-
b
tos de I~vestigación, la aplicación de ~i~~t~s van ser empleados Con Propósi- mcntos fotoeléctrico combinado con una computadora digital. El lector de
en un SIstema escolar, relega a un se s ~ru~ as en los salones de clases o documentos responde a las marcas de una hoja de respuestas e inclusive a los
dez para ceder el paso a las venta¡'as g~n~o tedrm mo l~ confiabilidad y la vali- libritos de pruebas reales. El uso de una hoja de respuestas por separado es
trador es fácil n ",.. rl _ . practIcas e su aplIcación P r ",1 -d-' . conocido por la mayoría de los universitarios estadounidenses graduados,
-1- -- r?n~. ueulaslaua atención en 1 h f" _.a.a~. 1l11lllS-
el

o en as economIaS de tiempo ue ha . os a. orros- mancIeros pequeños que han tomado una variedad de pruebas durante su formación educativa.
1 0
estándar de clase sin tener ~ue ef!:t~~~~lbleb~¡u,sJarhuna ~rueba a un perio-
~ctores de economía y conveniencia ta a.~ lOS e oranos; aun aSÍ, estos
Pero estas hojas de respuestas por separado no son satisfactorias en el caso de
niños pequeños, debido a la complicación de encontrar una respuesta en un
aun, otros factores se relacionan ca 1 mbJedn tJenen su Importancia, Más protocolo de prueba, mantener en la mente la letra código de la respuesta
pruebas que, por ejemplo pueden ~alf/apJ ez ~on la que se apliquen las cscogida mientras se localiza el lugar apropiado en la hoja de respuestas, para
partIr de su uso diario y de la soJ'd Jca[se e mter1?retarse fácilmente a después marcar en el lugar preciso de esta hoja, lo cual significa pedir demasia-
de ellas. J ez e as conclusIOnes que se deriven do a los niños pequeños en los primeros grados; sin embargo, los equipos
modernos permiten usar protocolos para estos niveles y después se pueden
borrar al tapar el lado de las páginas del protocolo y poner hojas separadas
Economía mediante un discriminador, o se puede imprimir la prueba en protocolos
doblados como abanicos que se pueden desdoblar y correr a través de la uni-
. La importancia que tiene reducir a . dad de discriminación (scanner).
¡IVa o en una empresa, no requiere se; e~fs;. yadsea en una II1stitución educa- En los servicios de calificado de grandes volúmenes, la información a par-
as pruebas depende del costo or c . a Iza a. L~ ~~onomía en el caso de tir de un discriminador óptico se alimenta a una computadora digital, donde
de l?ruebas varias veces, En losgr~dos ~JJa ~e la pOSIbIlIdad de usar bloques se compara con las claves que se han registrado en la memoria de la compu-
dana y bachillerato, es posible ad ' . penores de la escuela primaria, secun- tadora. Una o más calificaciones se determinan y se imprimen en una forma
respuestas separadas y Usar varias :~~~~tr l!na pí,yeba por medio de hOjas de de registro o en una etiqueta sensible a la presión. La computadora también
se va a usar en años sucesivos o si se mI~~O ock de prueba. Si la prueba puede programarse para producir varios Índices estadísticos, como las medi-
b
¡anera que las escuelas diferentes rec~uedt fIjar n horario de pruebas de tal das de la clase, las medias y las desviaciones estándar del sistema escolar y los
~ ectuarbuna e~onomía importante por ~e~'p~e1 a en días dist~ntos, se podrá percentiles locales. Por tanto, el servicio de calificación provee no sólo las cali-
e prue as vanas veces. 10 e uso de los mIsmos bloques ficaciones de las pruebas para los individuos, sino también un rangot:ompleto
.~n segundo aspecto de la econ ' de información estadística acerca de los resultados de la prueba que son de in-
¡raClO~ ?e las pruebas; sin embargo °e~I~ es ~l ahorro de tiempo en la adminis- terés para el sistema escolar local.
a sec:IOn antenor vimos que la c¿nfiab~li~ eJ~ una falsa economía, pues en La mayoría de los sistemas escolares locales no pueden mantener el so-
tamano. En lo concerniente a las pruebas a 1 ~ una prueba depende de su fisticado equipo que acabamos de describir; sin embargo, varios diseños de
y a tIempo que se necesita para discriminación de calificaciones ópticos se pueden rentar o comprar para todo
106 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICl ON FACTORES EN EL USO PRÁCTIC O 107

un sistema de escuelas de la ci1}dad o del Estado que podría manejar . . oco el número de unidade~ 9.ue
enonn fácil de aplIcar 51 es P l'mite no es muy cntlco.
volúme nes de calificaciones. Estos discriminarían o rastrea rían una
hoja JS 2. Una prue~:e:stiempo s límite Y el tle~~~cc~ones de minuto es un
tra-
respu~stas (no u.n protoco lo) y apuntar~an una calificación sobre ellas
o pre~ requieren ?lfe~~ de varias subprueb~ 'bi~:~nte esta toma de t~empo
parana n una tarjeta perfora da como reglstro que puede ser procesada Tornar el t~em se hade
más taro esado, y muY pro a cronóm etro dispomble
de en un equipo de procesa miento de datos. b¡Jjo !abon~S?, Y; menos que se te~ga u~ sta ocho o 10 partes, y para cada
ca a
ASÍ, una prueba que debe ser económ ica para su uso a gran escala en con irnpreclsl~f nas pruebas connen en, amucho más fácil usar una una
gramas de prueba se produc irá en un format o para que sea calificada pro- pru~­
por los · e:<arninad¡r'dos~ tres minutoS, pero s~:mpos límite de cinco, 10 o mas ml-
diferentes tipos de equipo s de calificación o de rastreo. Casi todos los
tipos de requiere ~ or tres o cuatro partes con 1 .
hoja de respuestas separad as pueden calificarse a mano, de manera '.
relativa_ ha formada p da una- . eba sobre la página tlene muchJSl-
mente eficaz, por medio de un esténcil que la cubra. Alguno s editores nutOS para. ca ' ción de los react1VOS de pru ba Los reactivos en 10.s que
de prue- 3. La dlstnb~ f ilidad de contest ar esa p.rue 1: a aquéllo
bas provee n estos esténciles en forma de máscaras de plástico , otros s con d1agra-
usan Un J110 que ver con :s ~Cesta están jun.tas en la rtllS~:t;~:~ontonados y
tipo especial de hojas de respuesta que se hacen con dos hojas pegadas l?s que
sobre otra; la superior permit e una copia al carbón. Las claves están
Una
!¡JS opCl~)lleS de r yPpequeñas o ilegIbles, los :tf~ 'lla tarea para el examm
en la parte trasera de la primer a hoja y a medida que el examin ado
impresas J11¡JS o fIguras m,u .na a la otra, hacen muy 1 lCi laros Las opcion es ado.
de
frente, la cubierta de carbón transfiere su marca a la parte de atrás de
marca el pasan de una par dibujos deben ser grandes Y~ das ias partes de un res-
la hoja reacti-
donde pueden contarse los número s que se ubican en los espacio s clave LoS impresos Y a~sbien separadas u?a de la otra. l~ figura o pasaje de
impre~ puesta deber eS~eactivos que se reheren a una sodistribu ción a doble
le,et.ura
sos. En alguno s tipos especiales de pruebas las respuestas se marcan al pagma.
picar un va Y todos os
alfiler el lugar corresp ondien te de las respuestas selecci onadas de la la misma página o tener una esenta marcas negras en
hoja de deben aparecer e~ en algunos de estos'punt~s rtP~r dad de contest
respuestas. Una vez más, la clave está impresa en la parte interio r de arla.
una
ma de respues tas compleja, y la prueba se califica median te el conteo for-
número de hoyos de alfiler que se ubican dentro de los círculo s impreso del "t
s en la
1 CualqUler carenCia b en lo que se rehere a a ac l
contra de una prue a,
forma de respuestas. i·r
El compra dor potenci al de una prueba querrá determi nar qué tipos de -l-tan la interp retació n
for- , . s que f aCll
mas de respues tas y qué servicios de calificación están disponi bles para
quier prueba que quiera usar.
cual- caractendsetlf:s calific acione s
y el uso
. s este punto se olvi?~, que un~
Parecería axiomátic~~a~~ql:a~~~~~fss~e~! a us~r la ~a~~~ca:eb'a ~~:::~
Caract erístic as que facilit an la prueba se construy ; J~ signifk ado. El auto~ Yfl ~d;~~~~ción Jue le
admin istraci ón de prueba s interpre tarse} tene permita
ro orciona r al usuano a m., con sus necesidades Y
la responsabihd~d ?~: sótda de la prueba eD: [ela~i~:)üde cada individ
uo. Esto
Al evaluar la utilidad práctic a de una prueba , un factor que debe tenerse hacer u~a aprefl~c~~ficado apropia do a la cah ildclo~ueba Y otros materia
en cuenta es la facilidad de administración. Una prueba que puede ser
da de manera adecuada por un maestro con no más de una sesión o algo
maneja-
proporClO?ar e d S1
1
ente median te un m~nua 1 e p ba 'Qué puede espe~ar
se hace pnmor la m aran ara acampa nar a a prue l'~~to con los
les
matena-
jante de tiempo especial, es mucho más rápidamente ajustab le al program
seme- colaterales que se rr:~ario las prueba s en ellmanuad!s que creemo
s que el le
pruebas que aquella que requier a administradores especia lmente entrena a de razonablemente e u .
1 A contmu aclOn
. , describiremos as ayu
dos.
Varios factore s contrib uyen a esta facilidad de escoger y aplicar una prueba. les de apoyo. uede esperar.
usuario de prueba s P diseñó la prueba y de
l. Una prueba es fácil de aplicar si tiene instruc ciones claras y precisas . d las funcion es para las que se d 'o de los cuales se
Las instruc ciones para el admini strador deben ser muy precisa s, de . l. Un enuncJ ado e cedimi entoS generales por me ~onsidera que
está
manera cóm? ~edir1as y lll~:t~te es el enunci ado q~e el/d~ofos pasos apro~ia
qüc el examin ador no necesit e explicaciones extras para seguirl as.
Las ins- realIzo su desarro la evidencia de que se an a de a rovechamlentO,
dos
truccio nes para el examin ado tambié n deben ser completas y proporc
ionarle
ejercicios práctic os apropia dos. La cantida d de práctica que debe proporc validando su pru~ba y Particu larmen te pa~a las prueba s so d~ su validaci
narse depend e de qué tan novedo sa es la tarea de prueba para person as io- para lograr esa.vahdez. bre todo el contemd<? y el roce les hizo la óD:, ,el
selecclon
sümete n a ella. Cuando son el tipo familiar de tarea o tienen instruc
que se en las que nOS l!lteresar~~edimientos por medlO de ~d~~aSi no tiene
ciones la volun-
simples y directa s, no se necesit a dar más de un ejemplo; sin embarg autor debe.declf lfs Pálisis de las funcion es que s~ J?1 'tieo tal vez estarem
un format o de reactivos poco comune s o para una tarea de prueba
o, para del contem do o e an samiento a nuestrO escrutlfuOlOd~~l d d~ su pensam os
un poco tad de expon,er ~u pe; la minuci osidad o la pro n 1 a iento
rara, sería deseable más práctica_ un poco esceptlCOS e

....... ..~: ...... :


. ", " ,", ," ,. " . . .. . ,.;,. '",." . ~ " ,' .: .:, " ... . .. ~ .. . .
"' '- ," ~.\.,' .' .; .
108 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN
r
¡ GUíA PARA EVALUAR UNA PRUEBA 109
I

El proceso ~mplica no sólo los procedimientos racionales por medio de los 7. Evidencia de la relación de la prueba con otros factores. En cuanto a
cuales se seleccIOnaron los rangos de contenido o los tI'pOS d b"
" I d' . , . e o ¡euvos SIno
. que la prueb~ se emple.ará com? un instrumento. predict~vo, las correlaciones
tam blen os proce ImIentos empmcos mediante los cuales se . ' con las medIdas cnteno constItuyen la eVIdencIa esencIal acerca de qué tan
b d' " reVIsaron pro
aron y Iscnn:maron los reactivos hasta su inclusión final en la ~eba- bien cumple la función de predecir. La formación completa debe darse sobre
se ., 2. InstrucclOnes detalladas para la administracl'o'n de la
. d" prue ba. PEn una. la naturaleza de las variables criterio, los grupos para los que hay datos dispo-
cCl<;>n ante~I~r estu. I~mos la necesIdad de contar con esta ayuda para la uni nibles y las condiciones bajo las cuales se obtuvieron esos datos. Sólo así el lec-
formldad y facIl admmIstración de la prueba por los maestros u otros q - tor podrá estimar con facilidad la validez de la prueba como predictor.
gan que usarla. ue ten- A menudo es deseable reportar las correlaciones con otras medidas de la
3. Claves de c~l~fic~ción e instrucciones específicas de la ru b L misma función como evidencia colateral en la que se <i1poya la validez de
problem,as de la cahfJcaClón también se han estudiado bajo el en~ab:za~o ~! la prueba. Así, correlaciones con puntuaciones de prueba de inteligencia indi-
e~onomla. El manual y los m,:tenales de apoyo deben proporcionar instruc- viduales son apropiadas en el caso de una medida de inteligencia de grupo.
CIOnes detalladas acerca de como realizar el cómputo de la ru b ' Finalmente, a menudo son muy útiles las indicaciones acerca de la rela-
deben trata.r~e l~s, errores y cómo deben combinarse las untuIci e a, co~o ción de las puntuaciones de la prueba con la edad, el sexo, el tipo de comu-
11~~~;~ cahúcacrr: ~inaL Las claves de calificación y los ~sténcilesodnebe~a:~::; nidad, el nivel socioeconómico y datos similares acerca del individuo o del
p °ds para aCI!I~ar, .t,anto como sea posible, la tarea onerosa de califi- grupo, ya que proporcionan la base para estimar qué tan sensible es la medida
car cuan o esta cahfJcacIOn la va a hacer el usuario locaL a los antecedentes del grupo y las circunstancias de su vida y de su educación.
~', Normas Pdara ~os grupos de referencia apropiados, junto con la infor- 8. Guías para usar la prueba e interpretar los resultados obtenidos con
ma~lOn acerca e como se obtienen y las instrucciones ara _.. ella . Se supone que los constructores de una prueba conocen cómo usar la
capItulo 4 se consIderarán con detalle los tipos de normas d~ pru::: uso. En el prueba razonablemente y cómo deberían evaluarse los resultados obtenidos
PorJa~to, en este punto es suficiente señalar la responsabilidad dei~~~~t~~~ con ella, pues son especialistas en esa prueba; pero para que la prueba tenga
tor e a p~eba debdesarrolIar normas adecuadas para los grupos con los que la máxima utilidad para otros, en especial p ara el maestro que tiene un entre-
se va a usar a prue a. Las normas generales son nna npcesid~d l namiento espccializado limitado, se deben proporcionar sugerencias acerca
adecuadas par~ una co~unjdad específica, grupo; ~c~;acion:l~sY ~~~~r~b~ de las maneras como deben usarse los resultados de la prueba para el diag-
9rupos con mas hmItaclOnes le añadirán utilidad a la prueba en ~uchos de nóstico del individuo, evaluar las deficiencias del grupo, formar equipos
1os casos. ' dentro de la clase, organizar la educación correctiva, asesorar al individuo o
5. E,:idencia en cuanto a la confiabilidad de la rueb '. cualquier otra actividad apropiada para que esté basada en ese tipo particular
f ebe
mdlc~r no sólo las estadísticas de confiabilidad e; detafl'e~:;~oe;~:bi~~
as oper~c~one~ em~le~das para obtener los cálculos de confiabilidad y las
de instrumento.

1~:al~~~!~~C:~e ~~c;;fa~~~~:d~~~as~í~~~~~ ~~~~~;~~~~ ~~~b;~e eS~á~ basa- GUÍA PARA EVALUAR UNA PRUEBA
~f;:laf~~!t;~~;:, ~~s=~~i~~~eC~~~qc~i~:t&~~odr::i:=~~rJ~~~:: ~fI~;fJL~
. . ' I a prue a a puntuaCIOnes parCIales y en particular se ro Como ayuda al usuario potencial de una prueba, teminarenlOs el estudio
UtilIcen estas puntuaciones, los datos de la confiabilidad d {; pone que se de este capítulo con una guía para evaluar una prueba. Esta guía consiste
:::aa:r~ 1~~se~~~~~~~~~~es separada~ . .~s un ?uen procedimie~t~r~~er~f~~t:;; en una serie de preguntas basadas en gran parte en los estándares para las
bilidad. Un autor que in~ar de I?l edlclIOn, aSI c<?mo los coeficientes de confia- pruebas y los manuales educativos y psicológicos, preparados porun comité
de los '. Ica cua e~ e err?r estandar de medición en cada uno conjunto de la American Psychological Association (1974) junto con la Ame-
do deby~Ilos Dlveles .d'f puntu~clOn esta particularmente bien recomenda- rican Educational Research Association y el N ational Council on Measure-
la pruebao~a~~fe~~~~ne~~~ft~~~ muestra sobre qué rango de puntuaciones ment in Education. Se recomienda un estudio cuidadoso y completo de los
estándares para el usuario común de pruebas.
prueta ~~~~;~;~n~ev~~fa!~~bc~:;t~~C!Ol1es de las subpunt~aciones
.. Si la Nótese que muchas de las preguntas de la guía se relacionan con la dispo-
nibilidad y la adecuación del reporte de información acerca de la prueba. Que-
evidencia de las intercorrelacio~es de ~~~nesÉ el manual de,b~ra proporCIOnar da una segunda pregunta implícita, como una secuela de muchas secciones de
la interpretación de las sub untuac' as. sta es una gUla Importante para
tanta confianza se puede t~ner en ¿~nJfY' pa~lcularm~nte, para estimar qué la guía, especialmente aquellas que se relacionan con la validez y con la con-
fiabilidad, a saber: dado que se provee la información, iqué tan satisfactoria
Si las puntuaciones están correlacionad~ erencJaS egtre as su?puntua~iones.
parece ser esta prueba en comparación con otras, así como con los estándares
tod,as m!den lo mismo, las diferencias e~t~~ ~Ha~r~a~~~:~~nJ~alm'epsodetclr, 9ue absolutos, para el uso que queremos darle? Varias preguntas se refieren a la
sera n mmterpretables. r ancla,y
adecuación de las normas y a la conversión de puntuaciones. Éstos son temas
110 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN GUíA PARA EVALUAR UNA PRUEBA 111

que. consideraremos delIpróximo


. , en " capítulo y el lector encontra rene
a' b f··
IClOSO ca qué aspectos del desempeño del criterio no se reflejan adecuadamente
reVIsar esta porclOn e a gUla despues de leer el capítulo 4. en estas medidas?
el ¿Están adecuadamente descritas las muestras usadas para el cálculo de la
validez relacionada al criterio, y son apropiadas a ese propósito?
Información general de identificación f) ¡Los análisis estadísticos para la .validez relacio.nada al criterio están pre-
sentados en una forma que perimta al lector estImar el grado de confianza
al ¿Cu~! es el nombre de la prueba? que puede tenerse al hacer inferencias acerca de los individuos?
bl ~~~I~rs~o~~I!~S autores, su nombre y cargo, si es que esta información gl Si la prueba está diseñada para medir un constructo teórico (esto es, un ras-
go de habilidad, de temperamento o de actitud), ¡la interpretación pro-
el ~Qu~én publica la prueba. y cuándo se publicó? puesta está claramente enunciada y diferenciada de otras interpretaciones
dI lCu~ntas formas alternativas hay disponibles? teóricas alternativas?; ¿la evidencia para apoyar esta interpretación está
el ¿Cu~nto cuesta la prueba? clara y detalladamente presentada?
f 1 ¿Cuanto se tarda para administrarla?
En resumen, ¿en qué extensión la evidencia respecto a la validez justifica
los usos de la prueba sugeridos en el manual, o el uso que quisiera darse a los
Información acerca de la prueba resultados de la prueba? .
a) ¿Hay un ma~ual para la prueba (o cualquierotra fuente similar) diseñado
b) ~ara 'propor~lOnar la mformación que necesita su usuario otencia}?
lque ta~ reCIentemente se revisaron la prueba y el manua}l ?h
Confiabilidad
.
rndo mas de 10 años desde su última revisión? ·,l an transcu-
al ¿El manual presenta los datos adecuados que permitan al lector estimar si
las puntuaciones son lo sufiCientemente confiables para los usos recomen-
Ayudas para interpretar los resultados dados?
b) ¿Las muestras acerca de los datos con que se obtuvo la confiabilidad están
bien descritas, de tal manera que el usuario juzgue si los datos se aplican a
al ¿~~ manual ~roporciona un enunciado claro de los propósitos y la aplic -
ClOn que se mtentan con esa prueba? a su situación?
e) iLos datos de la confiabilidad están presentados en los índices estadísticos
b) ¿El ranualbProP?rciona un enunciado claro de lo que se necesita para apli- convencionales de coeficientes de confiabilidad producto-momento y de
car a prue a e Interpretarla correctamente?
e) La ~ru~ba, el manual,. las formas registradas y los materiales acom añan- errores estándar de medición?
dI Si se produce más de una forma de prueba, ¡habrá datos que permitan esta-
tes llgUldan adlo1s usuanos hacia una interpretación sólida y correct!de los
resu ta os e a prueba? blecer la comparación de las diversas formas?
el Si la prueba se propone medir un rasgo homogéneo generalizado, ¡se cuen-
d) En el ma,nu~l ¿están los enunciados que expresan las relaciones rese
~a~en term~~<?s cuantit~tivos, de manera que el lector pueda faber ~~~ ta con la evidencia reportada acerca de la consistencia interna (las correla-
ciones interreactivos o interparte) de las partes que conforman la prueba?
uanta preCISIon o confIanza se les puede tratar? f I i El manual de la prueba proporciona los datos acerca de la estabilidad en el
desempeño de la prueba a lo largo de cierto periodo?
Validez
En resumen, ¿en qué medida los datos de con fiabilidad proporcionados
aJ iE~ mapua1 repofrta al1?una evidencia acerca de la validez de la prueba para en el manual justifican los usos para los resultados sugeridos por los autores o
~a a tIpO e 1~ erencI~ para la que se recomienda esa prueba?
el uso que el lector quisiera dar a los resultados de la prueba?
b) l~~ manulaldevllta refenrse a las correlaciones entre reactivos y la puntua-
c~on tata e a prueba como evidencia de la validez 2
e) ~Ila prutba está diseñada como una muestra de dominio específico de con- Aplicación y calificación
d uct~s. es~o es, una p:ue?a de aprovechamiento), ¡define el manual el
ommIdo c ~r~m2ente e mdIca los procedimientos para el muestreo a partir al i Las instrucciones para la aplicación están suficientemente detalladas y
de ese ommlO. claras, de tal manera que el administrador sea capaz de duplicar las condi-
bf
d) fuan~o im~lic~ una validez relacionada al criterio, ¡describe el manual ciones bajo las cuales se establecieron las normas Yse obtuvieron los datos
para la validez y la confiabilidad?
as vana es entena con claridad, comenta acerca de su adecuación e indi-

er ~. .... ;
",,:
.~ .: ;
112 CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN
LECTURAS ADICIONALES 113
b} ¿Los procedimientos para calificar están ex
det~l!e, de modo que maximicen la eficacia ;tce;~o.s de ma~e!a ~lara y COn 5. Con la tabla 3.4 determínese ¡que porcentaje de los seleccionados estarían por
babIlIdad de equivocarse al calificar? lIfIcar y mInImIcen la pro· encima del promedio en el trabajo si se empleó un procedimiento de selección con
una validez de OAO y sólo la cuarta parte superior fue aceptada para el trabajo?;
¡qué porcentaje estaría por encima del promedio si se hubieran seleccionado las
Escalas y normas tres cuartas partes de superiores?; ¡cuáles serían estos dos porcentajes si la validez
fuera de O.SO?; ¿qué se encontraría si se hiciera la comparación de los cuatro por-
centajes?
a} ¡Las escalas empleadas para reportar las . 6. Si los psicólogos del personal de la Fuerza Aérea realizaran una investigación acer-
lladamente descritas, de tal manera ue Pf?tu,acIones están clara y deta. ca de diversas pruebas con el fin de seleccionar a un grupo para entrenarlo como
entenderlas por cO.m pleto y ser ca q d e mterp.rete dela prueba pueda mecánicos de máquinas jet, ¡qué podrían usar como medidas criterio del éxito
exammado? . paz . e comUnIcar la mterpretación al como mecánico?, ¡cuáles serían las ventajas y las limitaciones de cada una de las
bl ¡Están r~portadas las; ¡ormas en el manual d 1· f . . posibles medidas?
pUntuacIOnes estánáo;l" o rangos pe t"1 e a Olma apropIada, ya sea en 7. iQué ventajas y desventajas tiene el estudiante de nuevo ingreso con su promedio
cuados? '. e rceI) 1 es en grupos de referencia ade. de puntos de grado como medida criterio para validar una pregunta de admisión a
la universidad?
e) ¿Las poblaciones a las que se refieren la o ' ,
8. Un manual de pruebas contiene el enunciado siguiente: "La validez de la prueba X
das y descntas v son p eblacI' o 1" nOlmas estan claramen te defini· se muestra porque correlaciona 0.80 con la Stanford-Binet". ¡Qué información
' , , - nes con as que la . , ' d 1 .
po d nan comparar sus datos' . '- ma} ona e os usuanos adicional se necesita para evaluar esta afirmación?
d) SI hay más de una forma disD~nibl . l _ 9. Obsérvense las evidencias presentadas acerca de la confiabilidad en los manuales
t~blas disponibles que ml1~stren l~~nc uye~d.o tormas ~evisadas, ¡existen de dos o tres pruebas. ¡Qué tan adecuados son?, ¡cuáles son sus carencias? .
dIStIntas formas? pUntuacIOnes equrvalentes para las 10. El manual para la prueba T presenta varios datos de confiabilidad basados en: al
el ¿El manual analiza el p08ible valor de la . 1 aplicar de nuevo la misma prueba una semana más tarde; b} eorrelacionar los reac-
alguna ayuda para prepararlas? s normas locales y proporciona tivos nones con los pares, y el correlacionar la forma A con la forma B; las dos
pruebas se aplicaron con una semana de diferencia. ¡Cuál de estos procedimien-
toS cabria esperar que rindiera el coeficiente más bajo?, ¡por qué 1; ¡cuál rendiría
el estimador más útil de confiabilidad?, ¡por qué?
PREGUNTAS Y EJERCICIOS 11. Se aplicó a un estudiante la prueba de inteligencia Stanford·Binet cuatro veces
durante su carrera escolar, y su registro acumulativo muestra los CI siguientes:
l. Si el ~dueational Testing Suviee desarrollara 98, 107, 101 y 95. ¡Qué significado se debe atribuir a estas fluctuaciones en
CIenCIa para los estudiantes de pre . una encuesta general acerca de la el CH
la v~li?ez de la prueba? paratona, ¡qué harían ellos para establecer 12. Una escuela planea aplicar la forma A de una prueba de lectura en octubre y la for-
2. ¡Que tipo de validez está indicada para cada u '. ma B en mayo para estudiar las diferencias individuales en cuanto al aprovecha-
pudieran encontrarse en un man 1 d nbo de los SigUientes enunciados que miento durante el año. Se sabe que la confiabilidad de cada forma de la prueba es
ua e prue as?
de 0.85 para un grupo de un grado. La correlación entre las dos formas fue de
a} Calificaciones en la prueba de . 0.80. ¡Qué tanta confianza se puede tener en las diferencias individuales en la
las calificaciones acerca del a .~~;:~nahd!'ld X que correlacionan + 0.43 con cantidad ganada?, ¡qué factores distintos de las diferencias reales en el aprendizaje
b} Los objetivos que se apreciará~ d' moclOnal hechas por el maestro pueden explicar las diferencias individuales en la ganancia?
cados por orden de importanc~~~a~t~¿a prueba de lectura y y fuero~ califi- 13. Supóngase que el lector considera u sar tres pruebas de lectura en su escuela. Hasta
e) PUntuaciones en una prueba d~ a ti;u maestros. donde puede juzgar el lector, las tres son igualmente válidas. La confiabilidad de
+ 0.57 con las calificaciones p!stasd par~ emplead~s Z que correlacionan cada una de ellas se reporta como de 0 .90. ¡Qué más necesita conocer el lector
meses en el trabajo. por os supervIsores después de seis para seleccionar la prueba idónea?
dJ La prueba de inteligencia W da . 14. Examínense varias pruebas de aptitud o de aprovechamiento que serian adecua-
la prueba· de CI de Stanford_B ·puntuaclOnes que correlacionan + 0.69 con das para una clase que el lector enseñe o podría enseñar. Escríbase una evaluación
el La batería de pru b d meto . de una de estas pruebas, con base en la guía para evaluar una prueba, expuesta en
. e as e aprovechamiento V t' b d
textos amplIamente usados y 100 c d es ~ asa a en un análisis de 50 este capítulo.
dos Unidos. ursos e estudIO de todas las partes de Esta-

3. Coméntese el enunciado' "El


u b d . maestro es el único qu d .
~a prue a e aprovechamiento est d . d e pue e eStImar la validez de LECTURAS ADICIONALES
4. Veanseenlosmanualesded an anza a para su clase".
de . d 1d os o tres pruebas de dif . .
nCla evai ezpresentan1 'quét d d erentestIpoS;jquéclasedeevi_
prueba? ., l an a ecua a es cada una de ellas para cada American Psychological Association, Standards lor educatiollal and psyehologiea.l
tests, American Psychological Association, Washingtoll, D. C , 1974.

..----------------
~
:f,'
T
114
CAP. 3. CUALIDADES EN INSTRUMENTOS DE MEDICIÓN

Bauer, D. H ., "Error Sources in aptitude and h'


recammendation",enMeasurementand~c jeveI?ent test SCores: A review and
28-34. va uatlOn In Guidance 6 1973 .
Cronbach , 1..,J "Test valIdatian"
. en Th d'k e " , pags.
E reEnt, American Council on 'Educat~r:: ~ 1. (dir.), Educational measure_
qua mployment Opponunity Com . ! as Ington, D. e, 1971
tv r
i.
selection procedures" en Federalm;.sslf~n (EEOC), "Guidelines ~n employe f
12336. " eglSter, 35 (149), 1970, págs. 12333~ ,,':
Farve~, A. S., Sedlacek; W. E. y Brooks G C " '.
slty grades for ?lacks and whitesn' e~!vi Jr., LongItudmal predictions of univer-
. ce, 7, 1975, pag's. 243-250
Fmcher, e, "Differential validit' a d
págs. 481-500.
' easurement and Evaluation in Guid
."
y n test bIas, en Personnel Psychology 28 1975
an-
f
,':,
4
Stanley, r. e, "Reliability", en Thomdike ' " ,
Amencan COUllcil on Educatian W h~' L. (du.), Educational measurement
, as mgton, D. c., 1971. '
Normas y unidades utilizadas
en la evaluación

NA TURALEZA DE UNA CALIFICACIÓN

Supóngase que Juan obtuvo una calificación de 15 en su prueba de orto-


grafía. iQué significa esto y cómo debemos interpretarlo? En realidad, este
dato por sí solo no tiene ningún significado y es completamente ininterpreta-
ble. En el nivel más superficial, ni siquiera sabemos si este número representa
una calificación perfecta (esto es, 15 respuestas correctas de 1S reactivos) o un
porcentaje muy bajo (por ejemplo, 15 respuestas correctas de SO). Pero aun si
supiéramos que son 15 respuestas correctas de 20 y, por tanto, es el 75%,
entonces ¿qué significaría?
Obsérvese el cuadro 4 .1 que muestra dos pruebas de ortografía de 20 pala-
bras. U na puntuación de 15 en la prueba A tendría un significado muy dife-
rente de la misma calificación en la prueba B. Una persona que obtuvo sola-
mente 15 respuestas correctas en la prueba A no sería sobresaliente en una
clase de los grados segundo o tercero. Intenta ahora la prueba B con algunos
de sus compañeros o amigos, y probablemente encontrará que muchos de
ellos no pueden escribir correctamente 15 de estas palabras. Cuando se dio
esta prueba a una clase de estudiantes de licenciatura, sólo el 22% escribió 15
o más de estas palabras correctamente. Una puntuación de 15 en la prueba B
es buena entre estudiantes de licenciatura.
Así, por sí sola, una puntuación de 15 palabras correctas, o aun el 75% de
palabras correctas, no tiene un significado directo y sólo obtiene significado si
hay algún estándar con el cual compararla.
Para un grupo de pruebas que hemos mencionado con el nombre de refe-
ridas al criterio, o referidas al contenido, el estándar está previsto por la defini-
ción del objetivo específico que la prueba intenta evaluar y por el nivel de
desempeño que el maestro, la escuela o el sistema escolar está de acuerdo en

115

. . " ,, ', ', '¡ l •• : ; '.,:. . ... . '. ¡~ , ',') . . \ ; ..... " ·;-,-.,o H '. ;.; . : ~c ..;,·· .:)' ;.. , -: . ~ .'" ,., . ', " ,:.. . :. , . ..
116
TIPOS DE NORMAS 117
Cuadro 4.1. Pruebas de ortografía de dictado de 20 palabras Sin embargo, el estándar interno de un maestro es muy subjetivo poco
Prueba A preciso e inestable¡ ~~s aún! no propor~~ona ningun~ base para co~parar
Prueba B diferentes clases o dIstmtas areas de habilIdad. Tal metodo de medición no
bar puede dar respuestas a preguntas como ¿son los niños de la escuela A mejor en .
boroque lectura a los de la escuela B?, ¿es mejor el desempeño de María en lectura que .
col
cotorro en artimética?, ¿está estudiando tan bien el álgebra Juan como cabría esperar
form
formaldehyde de él? Necesitamos estándares de referencia más amplios, más uniformes,
jar
jordiniere objetivos y estables, si queremos ser capaces de interpretar los instrumentos ·
nap psicológicos Y educativos con los que se aprecia algún rasgo o se hace un ras-
nophlha
dish treo acerca de la competencia en alguna área más amplia de los programas
discemible
fOI escolares. En la parte principal de este capítulo se describen y evalúan los
faliguing
sack diversos marcos de referencia empleados para dar un significado estándar a
sacrilegious
rich las calificaciones o puntuaciones de las pruebas.
ricochel
sit
citrus
leel
feasible TIPOS DE NORMAS
oct
occommodalion
role
inougurole Podemos estudiar el problema de un marco de referencia para interpretar
inch
insignia los resultados de una prueba desde dos puntos de vista diferentes. Uno se
renl
delerrenl enfoca sobre las tareas mismas y el otro sobre el desempeño típico de las per-
lip
eucolyplus sonas. Considérense las 20 palabras de la prueba de ortografíaA. Si sabemos
oir
queslionnoire que estas palabras se han seleccionado al azar de las palabras que se enseñan en
r1m el tercer grado según el programa de ortografía oficial, y estamos de acuerdo
rhylhm
musl en los mismos puntos (hasta ahora sin especificar) de que el 80% de palabras
ignoromus
red correctas representan un estándar aceptable para el desempeño en ortografía
occrued
cuando estas palabras se presentan como dictado con oraciones ilustrativas,
entonces podremos interpretar la puntuación de Elena de 18 respuestas
correctas en la prueba como un indicador de que ha alcanzado el criterio de
que representa un nivel de dominio aceptabl b· . dominio de competencia de la ortografía para el tercer grado y que la puntua-
me que la prueba referida al contenido ilustr~f¡~:ade:te o ¡euvo. !"sí'lse presu- ción de Pedro de 12 es un indicador de que él no alcanzó los estándares ci-
nombres de lugares, proporciona una m poner ~ayuscu as en los tados. Tenemos aquÍ una prueba referida al criterio y una interpretación de la
requiere es~a habilidad específica. Si ace utestra r?resentatlva de tareas que prueba. Esta prueba es referida al criterio en lo siguiente:
representatIvas, y si estamos de acuerdo p amos a omuestra ~e tareas como
la tarea es el mínimo aceptable ento en que el80 16. ~e exactItud en realizar
Las tareas se han obtenido y relacionado de un objetivo de instrucción
correctamente subrayadas definirá ~f~~~~~puntuaclOn d~ 10 de 12 palabras específico .
. En la prueba normal del salón de el ar en un sent~do absoluto.
tipo de estándar opera indirecta o im ~ ates para la evaluaCIón continua, este La forma de presentación de las tareas y las respuestas a ellas están fija-
h
de maestro de las tareas con las ue r ejtamente, en parte por la selección das de acuerdo con el objetivo definido.
El nivel de dominio aceptable está definido de antemano, y con él se
dares para evaluar las respuestas q El ace a P1eb~ y en parte por los están-
apropiadas para representar los a·prenmd~es~rodse eCClOna tareas que considera comparará el desempeño de cada niño.
. . . lzaJes e su grupo pe . ,
tro en su sano JUlClO aplicaría la prueba B d tí ' ro ~ngun maes-
grado o la prueba A a estudiantes de e orto~ra a a los mnos de tercer Para algunos tipos de decisión instruccional, este marco de referencia del
varían en calidad Como en los ex' prepara tona. Cuando las respuestas "dominio" puede ser el apropiado¡ por tanto, las decisiones acerca de qué
estándares por m~dio de grados qamenes por edsayo, el maestro establece sus material y métodos deberían emplearse para una instrucción posterior en
nable esperar del grupo Muchas ue corresp0l! en a lo que él considera raza. ortografía para Elena y Pedro podría tornarse en una cuestión acerca de si han
gunta ¿cuáles fueron la; causas derf:~u::;:: g~f~~el~¡s se Pbueden dar a la pre- alcanzado o·no el criterio específico de dominio para el programa de ortogra-
un muchacho de noveno grado o de d· ., ~ ca ~ esperar vanas de fía del tercer grado. Aún más, en una materia secuencial como es la aritmética,
historia. un estu lante umversltario que estudie la decisión de empezar una unidad que implica "pedir prestado" en la sustrac-
ción o resta, podría depender de si el estudiante ha alcanzado el criterio de

-........------------
TIPOS DE NORMAS 119
118 CAP. 4. NORMAS Y UNIDADES

dominio en una prueba de restas de dos dígitos que no requiera pedir prestada psicológica y educativa. Si se I?onen juntas a do~ person~s con un coefici~~te
la decena. intelectual inferior al promedIO, no se obtendra un gemo, y un par de mnos
El lector po~ría p~~gunt~r: ¿de ~ónde proviene el nivel de criterio que que tienen mala ortografía no se pueden juntar para ganar un concurso de
representa una ~JecUClO? satlsfactona? Idealmente, este nivel debería estar ortografía. .. ., . ' ..
b~sado en estudIOs empmcos que mostraran los niveles específicos de domi-
Básicamente una cahflcaclOn cruda tIene sIgmfIcado solamente por
mo. que se re~u!eren s~ se d.esea qu~ el estudiante haga un progreso satisfac- medio de la refe;encia a algún tipo de g~po o grupos. U.na calificación en ~a
tono ~n la proxlma umdad mstruccIOnal. La evidencia debería indicar que los prueba típica no es alta ni baja, buena m ma~a. en ~n sentid? absoluto, es mas
estudI~ntes que han llegado a los estándares especificados sí logran los progre-
alta o más baja, mejor o peor que otras cahfIcacIones. EXIsten dos maner~s
sos satlsfactori?s de m!lnera típ!ca ~n la siguiente unidad, y que los que se ubi- generales de relacionar la calificación de una persona a un marco de referenCIa
caron por debajo del mvel de cnteno no alcanzan el progreso satisfactorio· sin más generaL Una forma es compararla con un conjunto de ~rupos de diferen-
embargo, debe admitirse que en gran parte de las pruebas que actualmen~e se tes grados y ver a qué grado se parece. Cada grupo en ~l ~onJunt~ ~uele repre-
usan de l~s. llamadas orientadas al criterio, esta evidencia empírica es incom- sentar un grado escolar particular o una edad cronologlca espeCIfIca. L~ otra
forma es encontrar dónde se ubica la persona dentro de un grup~ en partIcular
pleta o d~bIl. .El nivel de criterio de dominio se fija la mayoría de las ocasiones
muy arbItran amente con base en un Ujuicio profesional" y suele tener muy en términos del porcentaje del grupo a los que supera o en termmos de la
poca justificación empírica. media y la desviación estándar de.l ~rul?? Así, .en~o~tramos cuatro patrones
principales para interpretar la cabfIcacIOn del mdIv~duo, los cuales se mues-
. El otro marco de referencia para interpretar el desempeño en una prueba tran de manera' esquemática en el cuadro 4.2. ConSIderamos cada uno en su
esta basado n~ s.ólo ~n un est~?dar definido arbitrariamente como represen-
tante del domlmo, smo tamblen en el desempeño típico de la mayoría de las turno, evaluando sus ventajas Y sus desventajas.
~ers~nas. Esto representa una interpretación referida a la norma, y así las cali-
~cacIOnes de Elena y Pedro pueden interpretarse en relación con el desempe- Cuadro 4.2. Principales tipos de normas poro los pruebas educativos y psicológicos
n? ~e un gran grupo de referencia de niños del tercer grado o de estudiantes en
dlstmtos grados escolares. Su desempeño se considera no en ténninos de Tipo de (ompoffldóJI Tipo de grupo
d.ominio e~ oposici~n a falta de dominio, sino como superior al promedio, en Tipo de "Ofma
el promedIO o mfenor al promedio, y se buscan las maneras de perfeccionar Grupos de grado sucesivos
esa escala de ejecución rela tiva de tal modo que todos los grados de excelencia Normas de grodo Individuo apareado a un grupo
puedan ser expresados en términos cuantitativos. cuya actuación igualo
. Al buscar una escala para ~epresentar los grados de excelencia, nos gus-
tana reportar resultados en umdades que tengan las propiedades siguientes: lo mismo que el tiempo de Grupos de edad sucesivos
Normas de edad
comparación anterior
. l . Significado uniforme de prueba a prueba, de tal manera que se propor-
ClOne .una base con la cual se puedan comparar diferentes pruebas (por ejem- Ponentaje del grupo que Grupo único de edad o de grado
Normas de percentil al que pertenece el individuo
plo, dlstmtas pruebas de lectura, una prueba de lectura con una de aritmética sobrepaso el individuo
o una pru.eba de aprovechamiento con una prueba de aptitud escolar).
2. Umdades de tama:?? unifor~e, tal que una ganancia de 10 puntos en Número de desviaciones estándar lo mismo que el tipo de grupo
una parte ?e la escala sIgmfIque lo mIsmo que la misma ganancia de 10 puntos Normas de puntuación anterior
estándar en el que el individuo se ubico
en cualqUIer otra parte de la escala. yo seo por arriba o por debajo
3. Un punto cero real que signifique "ausencia de" la cualidad a medir de de la medio de grupo
tal manera que podamos pensar legítimamente en calificaciones que repre:en-
tan "lo doble de" o "tercera parte de".

Los diferentes tipos de normas que se han diseñado para las pruebas re-
presentan un marcado progreso hacia los primeros dos objetivos citados. El N ormas de grado
tercero pl!ede ser q':le nunca se logre con las medidas psicológicas y educativas
que conCIernen a ciertos rasgos. Podemos poner cinco panes de 450 gramos Para cualquier rasgo que muestre u~ ~cremento progresivo y relativa-
cada uno en un lado de un par de escalas, y balancearán los contenidos de una mente uniforme de un grado escolar al SigUIente, se puede prepara~ un con-
bolsa de harina que pese 2.5 kg en el otro extremo. Que "no hay peso D equiva- junto de normas de grado. En e~te senti.do, la no~a pa.ra cualqUIer grado
le a "no hay peso" y las unidades de peso pueden sumarse juntas. Pero no tene- escolar es la puntuación promedIO obtemda por los mdlVlduos e~ ese grad~.
mos este tIpO de punto cero o esta forma de adición en el caso de la medición Un proceso de delimitación sencillo para establecer nonnas conSIste en aph-

en ,' J
... ,....... "-''"'' "I~:':": ',, : . . .: "l' . "
., ...> , -; ..~•.; ;: .: . ..; ".
120 CAP. 4. NORMA S Y UNIDADES TIPOS DE NORMA S 121
car la prueba a una muestr a represe ntativa del grupo de alumno 'valente s de grado para las puntua ciones más extrem as. Esto
s en
grado escolar consecu tivo, calcula ndo primero el promed io para cada cada los eqUlal consid erar equivalentes las puntua ciones del nivel de la pruebasuele
en la
despué s examin ando los equival entes de grados para las puntua cionesnivel y hacersetamOS trabaJa . ndo, con as I ·IOnes d e 1as prueb
puntuac as en un .
medias . De esta manera , una prueba de significado de párrafos del
inter- qu~ es e I·nferior de las mismas series, formas que ya se han dado nIvel su-
tipo de la en grados
prueba del aprovechamiento Stanford, interm edia 1, puede aplicar Penar.ores y posteno ' . res. D I
e esta manera · 1entes d e gra d o se extlen-
, os equlVa .
se en antennbaJ·o como 2.0ytan alto como 9.5, y se prepara una tabla comple
octubre a los alumno s de los grados tercero, cuarto, quinto y sexto con ta de
resul- denta ciones . 1entes d
tados como los que se muestr an enseguida.
. crudas para eqmva e gra d o.
pun~Norma obtuvo una puntua ción cruda de 38 en esta prueba , le daría
un
. lalente de grado de 5.6,10 cual podría traduci rse como "se desemp eña
e~Ul:omo el niño promedio que ha comple tado seis meses del quinto tan
Promedio de puntuaciones crudas Nivel de grado 1en es una grado" .
9Esta interpr etación simple bastante sugesti va del desemp eño de un
. . d d .
. _ pero tiene una sene e esventaJas, como veremos en segul·da.
19 3.2' nIllOÚna primer a ~uestión ace~ca de las n~)fmas de grado es si pod~mo
27 s consi-
4.2 derar que proporCIOnan las umdade~ precIsas o aproXI madam ente Iguales.
35 5.2 , sentido el increm ento en la habIlIdad de lectura del grado 3.2 al grado ¡En
43 6.2 qu~ ual al increm ento del grado 6.2 y 7.2~ Las bases para asumir igualda 4.2
d son
es Ig débiles. Cuand o la habilid ad se ha enseña do a lo largo de todos
• El nivel de grado se muestra como 3.2, etc., porque se hizo lo pruebo en el segundo los años
mes del oño escolar de 10 muylares puede haber una razón para esperar que el aprendizaje en un
meses. Algunos veces, el nivel se verá escrito sin los puntos decimoles, es decir, 32, 42, esco año en
etc. un nivel de grado escOl ·19ual
ar s~a Id
o cercano ··
a apren IzaJe d e1 ano
- en otro
. el Existe alguna evidencIa de que durante la escuela elemen tal-y
La prueba establece los grados equival entes para las puntua ciones crudas poslble-
mVn~e en la secund aria- las unidad es de califica ción de grado sean iguales
de 19,27, 35 Y 43; sin embarg o, los equivalentes de grado también me o
se
tan para las puntua ciones que quedan en medio. Éstas se determinan necesi- estén lo suficien tement e cercana s para s.er bastar:~e ut!
'·1 · em.b argo, aun en
es; sm
aritmé- este rango Y para las áreas .en las que la mstrucClOn ha SIdo c~ntmua
ticame nte por interpo lación, aunque algunas veces los puntos interme , la_ Igual-
dios . dad es sólo aproxim ada. SI estamo s mteresados, c.on la maten a de espanol
pueden establecerse por medio de aplicar la prueba en otros momen tos , en
duran-
te el año escolar. Despué s de la interpo lación, tendrem os una tabla parecid I que la instruc ción no comIen za de manera tlplca hasta la escuela secunda
la siguiente: aa ~ o en biologí a, para la cual la instrucción se concen tra en un solo grado,l -
. . na~ivalentes de grado se convie rten en algo casi sin significado . Además os
,
~¿strucción de muchas hab~lidades, ~omo las habilida?es básicas en lectu~a lay
·tmética dismin uye Ycasl se termma en la secund ana, por lo que las
Puntuación Grado Puntuación Grado ades n ,
de grado carecen casI. por comp Ieto d · d o en este . I P umda-
e sentl
cruda equivalente cruda mve. or esta
equivalente azón mucha s baterías de prueba s de aprovec hamien to muestr an un
equiva-
rente de grado de + 10.0 o + 11.0 como represe ntativo de la parte
19 3.2 31 superior
4.7 total de las puntua ciones crudas . Cuando se reI?0rtan equival er:tes
20 3.4 32 de gra~o
4.8 tales comO 12. S, éstos ya no representa~ en realIda d e~ ~esempeno promed
21 3.6 33 de los estudia ntes exammados en la mItad del duodeclmo grado, l,o
4.9 smo mas
22 3.7 34 5.0 bien una extrapo lación ficticia de la e~c,ala de calif~caciones, de tal manera
23 3.8 35 que
5.2 pueda propor cionar alguna puntuaclOn conver tIda para reporta rse
24 3.9 36 con los
5.3 niños más capace s de los grados octavo o noveno .
25 4.0 37 5.4 Una precau ción más debe tenerse respecto a la interpre tación de las
26 4.1 38 nor-
5.6 mas de grado . Considérese el caso de un niño brillante y muy avanzad
27 4.2 39 o del
28 5.7 tercer grado y supóngase que en una prueba estandarizada de aritmét
4.3 ica él
40 5.9 obtuvo una puntuació~ para la. cua,l ~l equival ente ~e grado es !'. 9. Esto
29 4.4 41 no ~ig­
6.0 nifica que el niño ~om~~e la antmet lca que se ensen.a en el qU?~to grado,
que tiene una califIcaClon tan alta como la :que obtiene un mno promedI~mo
30 4.6 42 6.1
43 O al
6.2 final del quinto grado; pero esta calificación alta seguramente ha sido
obteni-
da en parte por el desempeño superio r de sus estudio s del tercer grado.
El niño
. Debido a que las puntua ciones crudas en esta prueba en particular pueden promedio se ubica bastante lejos de lo que sería una calificación perfecta
en
vanar en un rango desde O hasta 60, se necesit a algún métod o para los temas que se han enseñad o en su propio grado. Así, el niño capaz
estable cer puede
122 CAP. 4. NORMAS Y UNIDADES
TIPOS DE NORMAS 123
obtener puntos adicionales de calificación (y, en consecuencia, un. equivalen_
te de grado más alto) solamente por el completo dominio de su material. Vale . lente en edad es la puntuación promedio de los
Por supuesto, un dq';td obtiene al aplicar una prueba a muestras
individuos en una e~: a a'c~~enueve o 10 años, y así sucesivamente .. ~n
la pena recordar esto. El hecho de que un niño obtenga un equivalente de gra-
representativas d~ n~nos te o ivaÍente de grado escolar descrito e~ ~a ~ecclOn
do de 5.9 no significa que esté listo para ser promovido, tal vez al sexto grado ¡
sino sólo
cación el reflejo de una calificación y no revela el modo en que esta califi~ t1¡.
fueesobtenida. estete respecto, es SImIlar a edul e uivalentes de grado, u~a ~uestJon Imp~r-
l d en el caso
an rior y. ' como sar dee manera
os q raz. onable que el '
creCImIento
" en un
d ano
1
Finalmente, hay una razón para cuestionar la comparabilidad de los equi- tante es SI po emos pen . d d ifonrie y estándar. SI el creCImiento , ~ OS
valen tes de grado de una materia escolar a la otra. ¿Estar un año adelantado (o uede representar u.na um a u~. to entre los 10 Y los 11 años, ¿sera SlmI-
retrasado) del nivel de grado que le corresponde en uso del lenguaje representa creclIlll;~
f~r ~ca
p.neo a los seis años Iguala al medida que ascendemos en la escala,
la misma cantidad de avance (o retraso) como sería la misma desviación en los para cada edad en nuestra a. ver con claridad que esta unidad de cre-
conceptos aritméticos? Existe una gran cantidad de evidencia de que esto no es un momento, algunas veces e~tre el
así, 10 cual consideraremos posteriormente. El incremento en distintas ma-
terias se logra a diferentes ritmos, dependiendo del énfasis intraescolar y el
~i!iento
e amos a un punto donde po. emos
anual ya no es aI?rop~ad~5~e;~s
en que el crecimiento en casI cual-
rincipío de 13; a~olescencIa y os idiencÍo empieza a hacer~e m~~ lento y .a
aprendizaje extraescolar. Por ello, la comparación indiscriminada del equiva-
lente de grado de un alumno en las diferentes materias escolares puede dar
~uier caractenstlca que
detenerse finalmente.
erf~os ~
1 vemos cómo esta dísmmuclOn de creCI-
En ~ Igura 'des pués de la edad de 14 años, pues se ve
como resultado conclusiones que confundan. miento toma lugar repentmamente
Las normas de grado son relativamente fáciles de determinar, dado que
están basadas en los grupos administrativos ya establecidos en la organiza-
ción escolar. En las áreas directamente académicas de aprovechamiento, el 90
concepto de nivel de grado es tal vez más significativo que el de nivel de edad.
En cuanto esta ubicación de grado, se tiene la posibilidad de interpretar el ,-
,-
80
desempeño de un niño y actuar al respecto. Fuera del encuadre escolar, las ,-
normas de grado tienen muy poco significado. ,/
""
Para resumir, las normas de grado que se relacionan con el desempeño del
individuo para aquel desempeño del niño promedio en cada nivel de grado, 70 ,- "" ""
Son útiles primordialmente porque proporcionan un marco de referencia con ,- "
el fin de interpretar el logro académico de los niños en los grados de la escue-
la elemental. Para este Propósito son relativamente convenientes y signifi- 60 ~
cativas, aun cuando no podamos tenerles gran confianza en la igualdad de '"
o V
unidades de grado o en su equivalencia exacta de una materia a otra. "O
o
0>5 O
V
:;
Q. V
N ormas de edad
e
Q)

O
:;
4O .LV
g V
Si un rasgo es aquel que cabe esperar que se muestre continuo y relativa-
mente uniforme en su incremento respecto a la edad creciente, podría ser
UJ

3O 1.
apropiado convertir la PUntuación a la edad equivalente como un tipo de esca-
la de calificaciones comunes. Durante la infancia podemos observar el creci-
20
V -
miento continuo en altura y en peso, en varios índices de madurez anatómica
y en el amplio rango de desempeños perceptual, motor y cognoscitivo. Es un
poco crudo describir a un niño de ocho años como aquel que es tan alto como
10
un niño de 10 años, que tiene una fuerza Como la de un niño de nueve años, y
con un vocabulario como el de un niño de seis años. Durante los primeros
diseños de las pruebas de inteligencia y de aptitudes, las PUntuaciones crudas
O
se convertían de manera típica en equivalentes de edad yen términos de "edad o 2 4 6 3 10 12 14 16 18 20 22 24
mental", que fue un término incluido en el vocabulario del experimentador Edad
de la inteligencia y del laico en general.
figuro 4.1. Normos de e d a d p oro lo estoturo de los niños (adapta da de Boynton. 1936).

.. . .. . ': .';~ ' .,


124 CAP. 4 . NORMAS Y UNIDAD ES TIPOS DE NORMAS 125

que un año de crecimiento después de los 14 años es mucho menor d edad son primor dialme nte apropiadas para
que Un por supues to, las normas edela curva general de crecimi ento. Un
año de crecimi ento anterio r en la escala. Despué s de los 14 o los 15 rasgo
concepto de edad-al tura deja de tener significado. El mismo problem
años, el bs características que d~penda~tinua con el rango de edad (como la
a de apla- e na muestr e una mejora co , . os de unidad es de una escala de agudez a
namien to del crecimiento en la curva se ve, variand o solame nte en la edad.
edad qUuall nO puede expresars~ en dt~rml In t de ciertas experiencias educati
que ocurre y en lo repenti no, para cualqui er característica que quisiéra en VIS d de pnmor la men e vas
mos Un rasgo que epen 1 f T d d para las operaci ones antmetl cas,. . ,. ,
medir. El fracaso de la unidad "un año de crecimi ento", para que tuviera esta razo-
ficado, es más evidente a medida que conside ramos los extrem os
signi- específicas, tale~ como . a a~1 I a el marco de referencia educatI
en edad, vo _de los
pero no hay ningun a garantí a de que esta unidad tenga un significado ablemente mas relaclOna 10 con de referen cia biológico de los
unifor- n dos escolar es que con e marco anos de
me ni aun en el rango interme dio. gra . . ·
crecimiento. . ne de manera dlIecta al consum d d
El problem a implicado por esta curva de crecimi ento aplanad a es más Finalm ente, aunque no conCler d sde el unto de vista l or e
evi- del produ,: tor
dente cuando conside ramos al individuo que se ubica muy por encima
ruebas, vale la pena hacer notar qU:ta~ al n~s problem as práctico
promedio. ¡Qué edad equival ente le asignar emos a una chica que tiene del
1.75 P pruebas , las normas de edad prese d deguramente represe ntativa s :>en.o~.
metros de estatura ? La mujer promed io nunca llega a ser tan alta a de de Indlvl-
edad. Si vamos a asignarle cualqu ier valor de edad, debemo s inventa
ninguna Suele ser d I' f'ICI'1',un t ar una
. muestr
dA a" ver aisiéram os una seCClOn . , transve 1de
r algu- duos de una edad determm~ a. SI, SI %U rsa
na extensi ón hipotética de nuestra curva de crecimi ento tal como a algunos de ellos en la escuela
la línea los niños de 12 años, tendna mys que ~~~~e secund aria. ~stos tendría
puntead a de la figura 4.1. Esta línea hace supone r que el crecim iento
de los 14 años continú a a casi el mismo ritmo que era común hasta
después
la edad de
elementa~ y a algu~os otros en e
ser escogIdos de bastant es r~ng?
;d:1 er
rados escolares. HaCIa las e~ades. supe~
rar estaría amplia mente dlsemll
n que

riores, la muestr a que neceslt anamo s ~; otros.en la univers idad, algunoslad~.


14 años. En esta curva extrapo lada, la estatura de 1.75 metros se asigna
a una
persona cuya edad es de 16 años 6 meses, pero esto es comple tament mas
cial y arbitrar io en cuanto equival ente de edad, pues no corresp onde
e artifi- algunos en la escuela elemen tal, algun
T t Y otros en e1campo del traba,· o . Para lograr una
a la esta- en un estableC.ImIento .
mI I ar -
. a de muchac hos de 18 anos, por eJem- .
tura promed io de los muchac hos de 16 1/2 años, ni a la estatur a promed
ninguna edad; simplem ente significa "más alta que el promed io". io de mu estra verdad ,
eramen te represe ntayv
h·b·tiva razo' n más de por qué el uso de
Este mismo tipo de equival ente de edad artificial se debe u sar para
plo esto sena una tarea pro 1 I . Esta es , una'a a medida que avanza mos en
las no;mas de edad para las pruebas no es aaecua o
pruebas de habilid ad y de aprove chamie nto, con el fin de expresa r el
desempe- la adolescencia. d d d basada s en el desemp eño de la I?ers~:)J~a
ño de los alumno s superiores en su adolescencia. El crecimi ento mental En resume n, las normas e e a,
tam- . n un marco de referenCIa facll-
bién muestra una nivelación de la curva similar a la lIustrada en la figura romedi o en cada nivel de edad, propo rClona de un individ uo en particu
4.1 . P lar;
Después de los 14 o 15 años, los incrementos son cada vez más pequeñ 'bl . terpreta r e l esta tuS
os y mente compre nsl e para 1ll . dades de edad está abierta a senos . '
desaparecen gradual mente. El increm ento de la edad de 15 a 18 años cuestlO -
puede
ser mayor que aquel entre los 11 y los 12, y despué s de los 18 sólo puede no sin embarg o, la igu~ldad en las u~ld 1 adolesc encia a la adultez , la
haber namien tos, Y a medIda que se. aa~a e ,a . nos de la cual se pudiera edad deja
un pequeño aumen to o casi nada. Por tanto, cuando reporta mos expresa r el
mental de 18 o de 20 años en una prueba mental del tipo de la Stanfor
una edad de tener significa~o como Ulll ,a den ~e:rslon muy apropia das para los
años de
no queremos decir que este individ uo se desemp eña como un chico
d-Binet, nivel de desemp eno . Las norma~ ~ ~ es ue crecen como parte del
desarro -
de 18 o de 20 años . Estos equival entes de edad represe ntan una extensi
promedio la escuela elemen tal y para las hal~~~~:S~ica;físicas y fisiológicas, como.
ón arbi- llo general del IndIVIduo. las cara la esta-
traria a la conver sión de puntua ción a edad, como la que se muestr a eso v la dentici ón, Y los rasgos I:SICO . lógicos como la mtehge nCla,
en la línea • p .
,
puntead a en la figura 4. l . Tales valores artificiales y arbitrarios son necesar
ios ~~~~c;~ ~er l~s adecua dos para este tipO de normas .
si queremos tener una manera de representar el desempeño de la
parte su-
perior de nuestra población adolesc ente y adulta, del mismo modo
que
equivalentes de grados artificiales se requieren para represe ntar el aprovec los
miento de los niños más capaces de octavo y del noveno grados. ha-
Norma s de percen tile s
También es verdad que las curvas de crecimi ento no son compar ables
por
entero para las diferentes funcion es . De una prueba a otra, el ritmo d las normas de grado escolar y de las
miento y el tiempo para alcanza r un máxim o difieren sustanc
de creci-
ialment
Acabam os de ver q~e en el caso .¡. .,untuac ión de un individ uo
normas de edad el siglllhca~o de l~ cahd~a~{o~oO!edio del grupO de
¡Cómo podrem os compar ar puntua ciones de edad en pruebas de vocabu e. edad o de
y de planeación en laberintos, por ejemplo, si la primer a continú a increme
lario está dado por la comparacl~n de esta C°rten~ce el individ uo; pero
a menud o
tándose hasta los 20 años, mientra s que la segund a alcanza su máxim n- grado escolar a~ que supues tament e Pc~n el rupo de su propio ~ado
primero s años de la adolescencia? Para un niño de 10 años que ya haya
o en los tiene mucho mas sentido compar arlo . o alg ue se le puede conSIde escolar
rar como
zado el nivel del niño de 12 años, puede represe ntar aprecia blemen
alcan- o de su propIa edad, es deCIr! ~on u !1.g1 u P 1 tiqpo de comnar ación hecha
te dife- un miemb ro de manera legItlma. E.ste es e cuan-
rentes grados de superioridad para los distintos rasgos. .
do se usan las normas de percentlles.

--
.... . . . .------------~---
c1
126 CAP. 4. NORMAS Y UNIDADES
TIPOS DE NORMAS 127
En el C;':lpítulo 2 vim.os cómo podemos calcular, para cualquier conjunto razonamiento abstracto, una puntuación de 31 corresponde al percentil 50.
de puntuaCIOnes, la medIana, los cuartiles y los percentiles. Para cada valor de Dicha puntuación representa el mismo grado de excelencia de una puntua-
punt.uación, podemos ~~lcular el ~orcentaje de casos, p, que se ubican por ción cruda de 21 en la prueba de razonamiento verbal. .
debajo de esa puntuaclOn. CualqUIer persona que obtiene esa puntuación Nótese que la tabla 4.1 no contiene todos los percentiles. Para la mayoría
sobr~pasa ~l porcentaje p ?e1 grupo en el que se calcularon los valores del per~ del rango, los percentiles están escalonados de cinco en cinco, y algunas veces
c.entll. DecImos que se ubIca en el percentil p o que tiene un rango de percen- varios puntos de la calificación están en listados de manera opuesta al valor del
tll de p.
perceptil dado. Si se dieran tablas más detalladas, las·puntuaciones correspon-
. En la tabla 4.1 se muestran las normas de percentiles de los jóvenes en el derían a los diferentes percentiles¡ sin embargo, ninguna puntuación es exacta
p~lm~~ semestre del grado noveno probados con cada subprueba (y una com- (consúltese el capítulo 3), de manera qu~ ~n la m~yo_ría del ra?go de p~nt.u~­
bmaclOn de dos s~bpruebas) de la bat~ria de pruebas de aptitudes diferencia- ciones o calificaciones se acepta para deCISIOnes practlcas locahzar a un mdlVI-
les, forma L. Observese la columna baJO el encabezado Razonamiento verba1. duo dentro de los cinco percentiles más cercanos al que supuestamente le
Las :I?tradas en esta columna son puntuaciones crudas, por lo que una pun- correspondería. . .
tuaclOn de 30 o 31 corresponde al percentil 75 en esta prueba. En la prueba de Las normas percentiles son ampliamente adaptables y aplIcables: se pue-
den usar cada vez que un grupo normativo apropiado se pueda obtener para
Toblo 4.1. Normos de percentiles poro los pruebas de aptitudes diferenciales. (Reproducida con servir como instrumento de medición; son apropiadas tanto para los jóvenes
como para los viejos, para las situaciones industriales o educativas. Sobrepa-
permiso de The Psychologicol Corporalion) sar al 90% de un grupo de referencia significa un grado comparable a la exce-
lencia, ya sea que la función medida sea de qué tan rápidame?te se pueden
Formo 1. Grodo Vi resolver ecuaciones simultáneas o qué tan lejos se puede escupIr. Las normas
de percentiles se usan ampliamente, y si no fuera por los dos p.untos que tam-
Oloño (Primer semesl,t) "'111m de percenti!ts bién debemos considerar, proporcionarían un marco de trabajO muy cercano
(ludas
a lo ideal Dara interoretar las puntuaciones de prueba. .
El p ri:riJ.er problema que afrontan las normas de percentiles es especific~r
Roz. Hob. Raz.
verbo numo
S y A- ROl. Rel. tU+ tUJI, al grupo normativo. lEn qué tipo de grupo deberían basarse las normas? EVI-
IV + H' oh,. lo",""" mee. esp. Orlog. Gram. dentemente, necesitaremos diferentes grupos de normas para cada edad o
99 44·50 38·40 77·90 44·50 75·100 61 -68
para los distintos grados en la población. Un niño de nueve años debe ser eva-
91 54·60 93-100 48·60 99
42-43 36-31 13·16 43 61·14 60 51·53 89-92 45-41
luado en términos de las normas de los niños de nueve años; un niño de sexto
9S 39-41 34-35 68·72 91
90 36-38 32-33 64·61
42 62·66 58-59 48·50 85-88 41·44 95 grado, en términos de normas para el sexto grado¡ un so~icitante para un tra-
41 59·61 56-51 44-41
85 34-35 30·31 61-63 39-40 56·SI 54-55 41-43
81-84 31-40 90 bajo de almacenista, en términos de las n o rmas que se aplIcan a los almacems-
80 32-33 77-80 35-36 85
28-29 58·60 38 5!-SS 53 38·40 74-76 33-34 80
tasoEl grupo normativo apropiado es, en cada caso, el grupo al que pertenece
75 30-31 26·27 54-57 31
el individuo y debe ser evaluado en términos de su estatus. Por ejempl(),.no
S3 51 -52 36·37 72-73 31 ·32
70 28-29 2S 51·53 36 51-S1 50 34-35 69·71
7S tiene sentido evaluar el desempeño de un solicitante a la escuela de medlcma
65 26-21 24 49-50 30 lO
60 24-25 23
35 50 49 32·33 67-68 28·29 65
con una prueba de biología por medio de la comparación de las puntuacio-
41·48 33-34 48·49 48
55 22-23 22 44·46 32 4Hl
30·31 64·66 27 DO nes con normas basadas para los muchachos de preparatoria. Si la prueba se va
47 28·29 62-63 26 55
SO
a usar en la escuela de medicina, el usuario deberá encontrar o diseñar las nor-
50 mas para los aspirantes a dicha escuela. ., , .
45
30 44 44
Si se usan las normas de percentiles, generalmente se necesItaran multI-
40 18-19 24·25 58·59 23·24 45
35
18-29 43 43 22·23 S6·S7 21-22 40
pIes conjuntos de normas. Debe haber normas apropiadas para cada tipo dis-
II
30 15-16
26-27
24-25
4l 42 20·21 54-55 20 35 tintivo de grupo o de situación con las que se deberá usar la pru~ba . Esto ya. lo
40-41 40-41 19 52-53
25 14 22-23 38·3' 38-39 11·18 SO-51
19 3D han reconocido los mejores editores de pruebas, y por eso no solo proporcIO-
18 25
20 13 ·13
nan normas para grupos de edad y grados escolares, sin~ también para ~ipos
21·28 19-21 36·31
15 11-12 12 25-26 14-18 34·35
36-37 15-16 41-49 15·17 20 especiales de poblaciones educativas u ocupacionales. Sm embargo, ~xIsten
33-35 13-14 44-46
10 '-lO 10-1\ 22-24 11· 13 31·D 30-32 12 41-43
13-14
11-12
15 ciertos límites para el número de grupos distintos para los que un edIto~ de
S 8 8-9 ID
3 6-7 6-7
11-21
15·11
8-10 25·30 27-29 11 311-40 9-10 5 pruebas puede producir normas, por lo que las normas de perc~ntlles pubhca-
S-l 11·24
1 O-s 0-5 11-14 0-4 0-16
23-26
0-22
10 JO.3S 7-8 das suelen ser complementadas por el usuario de la prueba, qUIe~ pued~ co.n~­
0-9 0·29 0-6
Medio 22.4
truir grupos de normas particularmente ade~uadas a sus necesld~des m~Ivl­
20.9 43.3 29.3 45.6
Of 9.9 8.0 16.6 10.6 11.9
44.8 27.9 61.3 25.2 MtJit duales. ASÍ, para un sistema escolar determInado a menudo sera ventaJ<?s?
9.5 11.1 lS.2 9.6 Df diseñar normas de percentiles locales para sus propios alumnos. Esto permlt1-

b5 ··
. ',:,
. '." ., : .... ' ." . . ' . ~" . . ' .:
128 CAP. 4. NORMAS Y UNIDADES
TIPOS DE NORMAS 129
rá que las puntuaciones individuales sean i d
po local, uná comparación que puede ser ~~;.re~f. as ~n relación con el gru. ". '" a los percentiles 90 y 95 que cuando estamos cerca de la mediana. Cuanto
locales que la comparación con las no Ign~ IcatIva para las ' . " " noS acercamos a las colas, más extrema se hace la situación.
empresa que usa una prueba Con una caterrna~ nacI?nales. Por ejemplo, Una , '" por tanto, las unidades de percentil son desiguales típica y sistemáti-
bajo pued~ encontrar útil acumular los rfs~h~sartlcular de solicitante de tra. CluJlente. La diferencia entre ser el p~ero o <:1 segundo en un grupo de 100
grupo partIcular de personas de man ,os ~ pr,eI?arar normas para SU esJIluchas veces ta~ g!ande como la dIferenCIa entre ser el. 50 o ~l. ~as di-
solicitante mediante estas n'ormas etr~ que se:a mas facII evaluar a un nuevo
El segundo problema en relación es nctamente locales ' ferencias de percentIllguaIes no representan, en general, dIferenCIas Iguales
con las '" en cantidad. Cualquier interpretación de los rangos de percentiles debe te-
v~r con l.a cuestión de la igualdad en las uni:~ma~ de percentIles tIene que ner en cuenta que este tipo de escala tiene muy pocos casos a ambos extremos
CInCO umdades de percentil de una e 1 a es. zPoden:os pensar que las
largo de toda ella? ¿Es equivalente la d1
a rel?resentan la mIsma cantidad a lo
diferencia entre el 90 y el 95 1 P 1 erenCla entre el percenti150 y el 55 a la
y la mayoría de los casos se encuentran en el centro. Laura, quien se ubica en
el percentil 50 en aritmética y en el 55 en lectura, muestra una diferencia tri-
la manera en que las puntuacio~es aJ! contestar esto, debemos hacer notar
vial entre estas dos habilidades, mientras que Alicia, con percentiles de 90 y
95, muestra una diferencia más marcada.
agrupan de modo normal. Ya vimos u~~~~a para un grupo de .individuos se
g:u P? en el capítulo 2. Esta figura represe t
dlstnbuyen las puntuaciones en
ama
°r
debPuntuaclOnes para Un
h n a astante len la manera como se
casos alrededor de la puntuación ~~~ os, casos. Hay un agrupamiento de Bandas de percentiles
vertirse en l/colas" a ambos 1 d d ella y estos se van reduciendo hasta con
puntuaciones es el llamado dae lOS e a curva. El,modelo ideal de este tipo d~ Cualquier medida proporciona sólo una estimación del nivel verdadero
'1 a curva normal que t b" .
e1 capItu o 2 y que se muestra en la fi r 4 ' am len se consIderó en de habilidad de un individuo. Este tema se estudió con más detalle en la sec- '
~od~lo matemático idealizado pero gu ~ , .2: La cdurva normal exacta es un ción del capítulo 3 que trató de la confiabilidad. Al considerar el error de
dIstnbuyen a sí mismos de u ' muc os tIpOS e pruebas y de medidas se medición que caracteriza a las puntuaciones de una prueba, algunos editores
'
N otese na manera que seap' 1 han elaborado tablas de normas en forma de bandas de percentiles. Para cada
el agrupamiento de la ' d rOXlma a a curva normal
los extremos y el patrón sim~~~r~~ 1: l~~:v~os en la mitad, las colas haci~ puntuación cruda, el manual reporta, en vez de un percentil específico corres-
" 'l pondiente a esa puntuación, una banda de percentiles dentro de los cuales
se presume que se ubica la habilidad del examinado. Una sección de estas
tablas para la prueba de lectura STEP se muestra en la tabla 4.2, la cual puede
{
, ¡
leerse como sigue: se puede presumir que un alumno del final del quinto gra-
do con una puntuación cruda de 50 tiene la habilidad que Se ubica en algún
¡ lugar en el rango desde el percentil 76 hasta el percentil 91 del grupo de re-
ferencia.
!i
El objetivo de usar bandas de percentiles es mantener al usuario de la
prueba al margen de asignar una precisión no garantizada a su puntuación
, ; de prueba y hacerlo consciente de que el desempeño del alumno puede variar
día con día y de una fonna de prueba a la otra. La banda que normalmente se
reporta se extiende a un error estándar de medición a cada lado de la puntua-
ción obtenida. Entonces, si interpretáramos una puntuación cruda de 50 de
P50 P55 P90 P manera detallada, diríamos algo así como: "Hay dos posibilidades en tres
95
Figura 4.2. ClR'VO normal que m de que el nivel verdadero del examinado en esta habilidad se ubique entre los
veslro los puntos de percentiles seleccionados. percentiles 76 y 91". Pensar en términos de una banda en lugar de punto nos
ayuda a ver qué diferencias son lo suficientemente grandes para un alumno
En la figura 4.2 se han marcado cuatro u d " .,
son, en orden: los percentiles 50 55 90
e15% dejos casos -el porcenta'e' ,
9l
n,tos e cahfJcaclOn, los cuales
y . Notese que cerca de la mediana
entre sus diferentes materias o bien para una materia entre distintos alumnos
tal que podamos tener alguna confianza en su realidad y sentir la necesidad de
en u~ área alta y estrecha. Ha¿a~~f::le:í ~s ~rce~~iles 50 y 55- se úbic~
e prestarles alguna atención.
-e! 5 %. entre el percentil 90 y el 95- h a , Istnbuc~on, el 5% de los casos Para concluir, las nonnas percentiles proporcionan una base para inter-

.,.(¡
mas baJa. Este 5% de los casos se d'
amplio del rasgo en el segundo ca:ace un area relatIVamente más ancha y
ersa
en Ut
r~ngo considerablemente más
puntos de percentil corresponde a t que en e ~nmero. El mismo número de
pretar las puntuaciones de un individuo en términos de su desempeño dentro
de algún grupo en particular. Para que el percentil sea significativo se debe
escoger un grupo con el cual resulte razonable y apropiado compararlo. Nor-
res veces mas el rasgo cuando nos acerca- malmente, es necesario tener varias tablas de normas de percentiles basados
en diferentes grupos, grados escolares u ocupaciones. Mientras se proporcio·
TIPOS DE NORMAS 131
Toblo 4.2. Bandos de percentiles correspondientes l . '
de lectura STEr o os puntuacIOnes crudos de lo prueba 4A ' "', "', significado a lo largo del rango total de valores. Las escalas de puntua-
': ción estándar se han diseñado para servir a este propósito.

----- ,
Nivel óe graóo . En el capítulo 2 nos familiarizamos con la desviación estándar como una
Puntuación " medida de dispersión de un grupo de puntuaciones. La desviación estándar
Primavera 3 era la raíz cuadr~da del prom~dio del cu~drado de la~ ,desviaciones de las pun-
cruda Primavera 4
Otoño 4 Primavera 5 tuaciones a partIr de la medIa. CualqUIer puntuaclOn se puede expresar en
Otoño 5
Otoño 6 , desviaciones estándar que se alejan de la media. Así, en la tabla 4. 1, la puntua-
60 99-99+
59 99-99+ ción de la media de la habilidad numérica es de 20.9 y la desviación estándar
99-99+ 99-99+ eS de 8.0, de tal manera que la persona que obtuvo una puntuación de 25 se
58 99-99+
99-99+ 99-99+ ubica de la siguiente manera:
57 99-99+
99-99+ 98-99+
56 99-99+
99-99+ 98-99+ 25 - 20.9 = 0.51
55 98-99+
i 99-99+ 96-99 8.0
I
¡ 54 98-99+ 93-98
99-99+ 97-99
I 53 99-99+ 91-96 unidades de desviación estándar por arriba de la media. Una puntuación de 1S
I
I
~
52
51
98-99+
98-99+
95-99
93-98
86-96
82-94
sería de 0.73 unidades de desviación estándar por debato de la media, y llama-
ríamos a estas puntuaciones + 0.51 Y - 0.73, respectivamente. .
50 91-97 Supóngase que hemos aplicado la prueba de aptitudes diferenciales a
97-99+ 78-92
89-97 algunos alumnos de la clase del noveno grado y que dos alumnos obtuvieron
76-91
las puntuaciones siguientes en habilidad numérica y en ortografía:
,I
, ¡
! .¡ 18 5-40 Habilidad
i~ 17 3-36 2-23 1-12
numérica Ortografía
'1I 16
15
2-32 1-20
1-17
(1 - )- IJ
(1 -)- 10
1-28 (1 Enrique 25 75
;1
': r
14 1-24 - )- 15 (1 - )- 8
José 32 70
13 (1 _ )_ 21 (1 - )- 13 (1 - )- 7
I, d ¡ 12 (1 _ )_ 13 (J - )- 10 (1 - )- 6
. r¡ 11 (1 _ )_ lO (1 - )- 6 (J - )- 4
" 10 (J _ )_ 7 (J - )- 5 (J - )- 3 Ahora veremos cómo podríamos usar las puntuaciones estándar para
9 (1 _ )_ 3 (1 - )- 3 (1 - ).:. 2 comparar el desempeño de un individuo en las dos pruebas o el desempeño de
0-8 ( (1 - )- 1 (1 _ )_ 1 los dos individuos en la misma prueba_
• 1 -}- 2 (1 -) 1 (1 ) 1 La media y la desviación estándar para la habilidad numérica y la ortogra-
. Adapla~a del Teache,'s Manual para la serie 11 de STEP lo • fía son como sigue:
Educallona' Teslm9 Service. Todos los deremos rese od D" rmos 4A y ~B, pags. 4-25. Copyright © 1971 del
rv as.•elmpreso con permISO.

nan los percentiles para los gro os a . d . Habilidad

dIftcil porque constituye una escala sist


í
~e,n~e aplicable, pero la interpfetaci~~oS~~ os, ste tI~O de no~as es amplia-
e p~r~ntil se hace más
o,s ya ores
numérica Ortografía
des son de un rango pequeño e l ematlcamente elastlca, cuyas unida-
n e centro y grandes en los extremos. Media 20_9 61.3
D"esviaci6n eslóndor 8.0 15.2
Puntuaciones estándar
Dado que las unidades de un siste d .
centiles Son tan desiguales neces' t ma be puntuacIOnes basadas en los per- En habilidad numérica Enrique está 4.1 unidades por arriba de la media o
, l a m a s uscar alguna unidad que tenga el
4.1/8 = 0.51 desviaciones estándar por arriba de la media, mientras que en

., >.'
13 2 CAP. 4. NORMAS Y UN
IDADES

ortografía est á 13 .7 un
13 3
ida de s 01 3.7 /15 .2 =
arriba de la me dia . Enriq d
0.9 0 desviaciones están t
qu e en habilidad nu mé ue est á cerca de cu atr o décimas me jor en ortdar por Toblo 4.3. Equivalentes e pun UOCIO"n estándar poro lo pruebo de habilidad numéric
a, noveno

-
d h b es dio de lo puntuaC.
(Me Ión estondor = 50, DE -- 10)
'
ric a. Pa ra José los cá lcu og 9ro o, om r .
los co rre spo nd ien tes sonrafía
: ,:;
Ha bil ida d nu mé ric a 32 - 20 .9 Puntuación Puntuación Puntuación Puntuación Puntuación Puntuación Puntuación PuntuacióII

Or tog raf ía

po r tan to, En riq ue lo ha


8.0
70 - 61 .3
15 .2
1.39

= 05 7
.
- cruda

49
48
estándar

85
84
cruda

37
36
estándar

70
69
cruda

24
23
estándar

54
53
cruda

12
11
estándar

39
38
he ch o casi tan bien en ha 47 83 35 68 22 51 10 36
lo ha hecho en ort og raf bil ida d nu mé ric a como 46 81 34 66 21 50 9 35
ía,
de José está cerca de un mi en tra s qu e la pu ntu ac ión de ha bil ida d nu José 45 80 33 65 20 49 8
a mi tad de desviación est méric 34
fía de Enrique. án da r me jor qu e la ortog a 44 79 32 64 19 48
ra- 7 33
El nivel de excelencia de
un ida de s de desviacion ca da alu mn o est á 43 78 31 63 18 46 6 31
es est án da r se coloca sVexpresado res pe cto a cuántas 42 76 30 61 17 45 5 30
de ba jo de la me dia de l ejecución po r en cim a
gru
me dic ión que tie ne el mi po de comparación. Es ta es un a un ida d están o po r 41 75 29 60 16 44 4 29
int erp ret ar el gra do de sm o significado de un a dar de 40 74 28 59 15 43 3 28
excelencia representado pru eb a a la otra. Pa ra ayudar a 73 27
la tab la 2.6. po r el pu nta je est án da r, 39 58 14 41 2 26
véase
00 :! El tipo de pu ntu ac ión en
un ida de
38 71 26 56 13 40 1 25
'( de pre sen tar es satisfact s de desviación est án da r 25 SS O 24
qu e aca
: ¡. req uie re el uso de los sig orio, ex cep to po r do s pu nto s de convenien bamos
o': r. o no verse co n cla rid ad no s má s y me no s que pu ed en copiarse cia: al .
¡i po ne rse eq uiv oc ad am en , y bl im pli ca el uso de l pu nto decimal qu
err ón eam en te
les al multiplicar ca da dete. Po de mo s deshacernos de l uso de pu nto s puede
e Las pu ntu aci on es 'estax:
. bl 4
dardenl la ta .da d~3yest án ba sad as en un a ec ua
:l
¡r ció n
dec . le ue cambia el
:¡ co ns tan te, y de sh ac em svi aci ón est án da r po r el nú me ro 10, o cu alq uie ima~ sunp qEn forma simbó tam an o e as U~l a . la loc ali zac ión de la me dia
de
a cad a pu ntu ac ión un a os del us o de los signos de má s y de r otra grupo. lic a, la ecuaClon es.
.1
h
me no s al
pa ra Enrique ten drí am co ns tan te conveniente, co mo sería el 50 . En añadir
grafía co mo sigue: os sus pu ntu ac ion es en ton
ha bil ida d nu mé ric a y en ces,
orto- Z 10 (X D.- E.X) + 50
=

donde Z es la pu ntu ac ión est


X es la pu ntu ac ión cruándar,
Habilidad X la media de las da, .
numérica D.E. :ss la desviación estpuntuaClOnes crudas,. y d
Ortografía ándar de las puntuaclOn
es cru as.
Medio de lo distn1wción de pun .
tuaciones
Desviación estándar de lo dist
Puntuación crudo de Enrique
ribución 20.9
8.0
61.3
15.2
La esc ala de puntu~clO
estrecha de manera cO~ nesden ur:t tab la como la an ter ior
do de la desviación est
Junta ( :penu~efO) perosi est
se am plí a ~ ~
án da r on gl-
Puntuación de Enrique en unidade 25 nal es má s grande.o ma a a am pli aci ón y est e estr
s s pe [u í: ~scalas de pu ntu aci on es. _e-
Puntuación de lo desviación está de desviación estándar + 0.51
75 ch am ien to son um for me
s a o rgo
q de las
Más uno cantidod constante (50 ndar por 10 + 0.90 de las un ida de s cam~ia, .f rme a lo largo de todEl tam an o
la de pu ntu ac ion es. SI estpe ro ~e ma ?e ;ar~:~n~ada en un ida de s iguale esca-
+ 5 a la
) + 9
55 59 a esca a es~ r p no se s co n las
que em pe zó , tod~vía las ha
conJervaraí pe roación an he ch o nada pa ra ha ce r a
las un ida de s más Iguale ter ior es la de la lín ea rec
este tip o de transformacl s: ~adO que t a ae~~nes se ta,
On e pun u lla ma conversión o tra
Un a tabla de pu ntu ac nsfor-
est a conversión, en la qu ion es est án da r para la ha bil ida d nu mé ric a ba ma ció n lin ea l.
d ntuaciones est án da r son
. _
10, se mu est ra en la tab e la media se fija igual a 50 y la desviación sad a en Fre cu en tem en te, .la s esc
la 4.3. est án da r a me dia nte los percentlle alas e i~: :tes a las pu ntu ac ion es cru en ad as
dls
nie nd o qu e el rasgo qu s con:esp~nd das, su po-
e se mIde tiene un a d'IS t 'bu ció n no rm al; esto se lla ma
n
134 CAP. 4. NORMAS Y UNIDADES 135

área de conver sión de puntua ciones . ASÍ, en la prueba de habilid numéri


ca, se encont ró que el 35% de los niños del noveno grado se ubicanad por debajo
.
Estanueve Rango de desviación estándar Rango de pereentil
de una puntua ción de 17. En una tabla de una curva normal , el valor
línea base en una curva normal bajo la cual cae el 35% de los casos de la
- 0.39 desviaciones estánda r. Consec uentem ente, asignarÍamo~ a una es de 9 + 1.7 5 en adelante 96-99
tuación cruda de 17 una puntua ción estánda r de - 0.39. Si se expresailUn. 8 + 1.25 o + 1.75 89-95
resulta do en una escala en la que la desviación estánda r es de 10 Y la este 7 + 0.75 a + 1.25 77-88
media de + 0.25 o + 0.75 60-76
50, tendremos: 6
5 - 0.25 a + 0.25 41-59
4 - 0.75 o - 0.25 24-40
T = 10 (- 0.39) + 50 = - 4 + 50 = 46. 3 - 1.25 a - 0.75 12-23
2 - 1.75 o - 1.25 5-11
La designación de puntua ción Ty el símbolo T se han emplea do a menu- 1 Menos de - 1.75 1-4
do para identifi car este tipo particu lar de escalas de puntua ciones estánda
normal izada, las cuales tienen sentido cada vez que parece posible que res
po sea comple to y que no ha sido cortado por eliminaciones sistemá el gru- . ' ero de distintas escalas de puntua cio-
ticas
los extrem os inferiores o superiores. Más aún, tienen sentido siempr en La relación que eXiste e~~re ~n ~d~una con los percent iles y con la curva
parezca posible que la escala de puntua ciones crudas original no represee que nes estandarizadas y la rrlafIOn ~c Por debajo de estas relaciones está
la escala de unidad es iguales. Mucho s constru ctores de prueba s nte a 3
normal se muestr an en a .Igura .. d untuac iones estánda res comune una
planean escala de p~rcentiles y v:anas e~alas e ~ntuaciones en los difereI'.tes s.
incluir sistemá ticamen te en sus pruebas mucho s ,reactivos de dificult
, median a y algunos reactivos fáciles y otros difíciles . El efecto de esto ad Esta figura Ilustra la e<;l~llvale?cd d~ li~ llege Board de 600 represe ntana s~ste­
es dise- mas; aSÍ, una puntuaclO~ estan ar. ,e o: al 'n grupo de referencia común) el
ñar pruebas que se dispersen y hagan discriminaciones finas entre el
80 o el
90% de los alumno s, mientra s que las discriminaciones más gruesas
queden a mismo nivel de eJ{?elenc;a ~en d~\a~~~:::~o de ~O, que una puntua ción
están-
los extremos; es decir, las unidad es de puntua ciones cru'das en el rango que una puntuaclOn estan ar ) d 7 o un rango percentil de 84. La
corresp onden a increm entos reales más pequeñ os en la habilidad que medio M
dar de 6 O de 1~ ann, ' a que un estanue ve e
d untuaci ones es arbltran . '
se mide selección partIcular dfe la esdla e ~odas las instituciones encarga a.
que las unidades de puntua ciones crudas en los extremos. La distribu das de la
ción real Es bastant e desa ortuna o que d' d onerse de acuerdo acerca
de la habilidad tiende hacia una distribu ción de un tope plano de puntua
nes. La operaci ón de normal izar la distribución invierte este proceso cio- elaboración de prue~,as no h~yan ,po 1 b~go el punto import ante de una
. unidad de puntuacIOn com~n; sm em es que
Podríam os haber usado valores que no fueran 50 ni 10 para fijar la ~s normat ivos compar
versión en puntua ciones estánda r convenientes. El ejército ha utilizad con- la misma escala de puntuaCIOnes Y sus .grup, dada de tal manera ables se
que los
escala de puntua ciones estánda r con una media de 100 Y una desviac o una usen en to d as l as pruebs a en unab orgamz
aClOn ,
.dan ser directa mente compar bl
a es.
tándar de 20 para reporta r los resultad os de sus prueba s. La College ión es- resultados de las diferentes prue as PU al igual que los percentiles, basan
Entrance dar
Examin ation Board (Institu ción de exámenes para ingresar a la Univers
idad) En resum<:t;t, las puntuacIO~~g:~:lindív iduo acerca de su dese~J?eño en
,t" ,
,
"' , j'
:
ha usado desde hace mucho una escala con una media de 500 y una desviac
estánda r de 100 en tanto que la Marina ha empleado el sistema de 50
Un tipo de puntua ciones estanda rizado normal izado que se ha hecho
ión
y de 10.
su interpretacIOÍl en la pun¡u a.
relación con un grupo de!e erenCla J::
ticular. Estas puntua ciones dlfi.eren de
en unidad es presumiblemente Iguales .
los percentiles en que estan .exp:esa , d r del ru o de referencia, y
la pun-
La unidad básica es la desVlacIOn estan al ,gerop de desviaciones estánda
", ~

muy popula r para las prueba s educativas en los años recientes, es la r


puntua ciones estanu eve. 1 Las unidad es estanueve represe ntan cadallamada . dI' d"d
tuacio~ e m IVl ~o s 1 e expresa como e num
día del grupo. Las puntua ciones estan 'd'
una de , ar estan
ellas 1/2 desviación estánda r de la dimens ión del rasgo básico. La por amba o por abajO d~, a re 1 un área de conversión (normah~a.dora) .
relación basadas en una converSlOn mea .0 en t' ndar numéricas han
de unidad es estanue ve a las unidades' de desviación estánda r y a los percent sido utihzad as
iles Las diferentes escalas de puntuaCIOnes es a
se muestr a en la tabla de la página siguiente.
Las puntua ciones estanueve, al igual que las bandas de percentiles, por diversas agencias de pruebas .
den a desaparecer las diferencias menore s en la puntua ción y a expresa tien-
r el des·
empeñ o en categorías más amplias, de tal manera que la atenció INTE RCAM BIAB ILIDA D DE LOS DIFERENTES
n tiende
a enfocar se en las diferencias que son lo suficie ntemen te grandes para
esta- TIPOS DE NORM AS
blecer la diferencia.
, . . d . rma ue se use, el editor de la p~eba
lUna condensa ción de la frase 'standard nine·poin t scaleW (escala
puntos'.
estándar de nueve No import a cual sea el tipO e no ~
puede elaborar una tabla de normas que mos r ará. las' diferentes puntuaCIOnes
..
136
131
. • poro lo prueba de lectura Gates-MacGiniti
Normos de comprenslo n e - primaria B*

--
Porc entaj e Nivel de grado 2.1 (oc/ubre)
de coso s boja
porci ones de
lo curvo norm al
Puntuación Puntuación
Puntuación
estándar Percen/il de grado Es/anueve
crudo
:... ---
1
2 30 2
3 32 4
Equiv alent es 4 34 S,
de perce ntil
5 35 7 1.2
38 12 1.3 3--
6 3 -- ~,
7 39 14 1.4
'"o 18 1.4 3 ..¡.
.~
~ Puntuacio- 8 41
44 27 1.5 4 .;..
o
nes z 9
,-o
10 46 34 1.6 4' T
c:
Punt uacio -
~., nes T
20 30 40 50 60 1.6 4' +
70 80 11 47 38
46 1.7 5 .,-
12 49
50 50 1.8 S./'
13 5/'
14 51 54 1.9
52 58 2.1 5 / ".
15
16 53 62 2.2 Ha
17 54 66 2.3 6<P
18 55 69 2.4 6~
19 56 73 2.5 6 ~ t.
57 76 2.5 6 C:. •
20
21 58 79 2.6 7
22 58 79 2.7 7
23 59 82 2.8 7
24 60 84 3.1 7
25 61 86 3.4 7
FIgura 4.3. Vaios tipos de esca
las de punt uaci ones estándar en
les ti con lo ClXVa norm ol (rep relación con los perc entj-
roducido con permiso de lo Psyc 26 62 88 3.6 7
tion) . hological (arp ara·
27 63 90 3.7 8
28 64 92 4.0 8
29 65 93 4.3 8
crudas posibles de la pru eba junto
pon dien tes en el sist ema de normascon las puntuaciones equivalentes corres- 30 66 95 4.5 8
que
cionan tablas que dan más de un tipo se utilizará. Mu cho s editores propor~ 96 4.7 9
ejemplo de esto se pro por cion a en de equivalencia de puntuaciones_ 31 68
la Un 70 98 4.9 9
normas para la prueba de com pre tabl a 4-4, en la cua l se mue stra n 32
nsió n de lectura Gat es-M acG init las 99 5.1 9
maria B. Se muestran cua tro tipos ie, pri- 33 72
de 75 99 5.4 9
en un gru po de seg und o grado al que nor mas . Los perc enti les están basa dos 34
Las escalas de pun tuac ione s estánda se le aplicó la pru eba con anterioridad. • Reproducido por permis~ de la Teome(s (00ege Press.
r asig nan una media de 50 y una desv
ia-
138 CAP. 4. NORMAS Y UNIDAD ES COEFICIENTES 139

Las discrepancias que se observan en el ejemplo anterio r se deben


ción de 21 puede caracten~zan d o grado. Así, un niño que obtenga u
ción estánda r de 1Óal grupo de se
puntua
rse como: na '' ,~:~, en la variabilidad de! desemp eño y al ritmo de aprendizaje
...P11C.l:tS
a las
y en la aritmética. La lectura muestr a una dispers ión más ampliaen la
den-
de un sol? grupo de grado, r~lativa al cambio ~e grado a grado. Alguno
b) Que tiene .un grado equivalente de 2.6. niños del qumto grado leen mejor que el promedIo en los grados octavo s
) Que se ~blca en e! percent il 79 en el o
e) Que rec~be una puntua ción estánda r j~PO de segund o grado. noveno, por lo que un grado de lectura equival ente de 8.0 o aun de 9.0
no está
d) Que recIbe un estanue ve de' 7. (llera de perspectiva entre los niños del quinto grado. De hecho, un
58. grado
equivalente de 8.0 corresp onde al percen til95 de los alumno s en el grado
por contras te, un alumno de quinto grado casi nunca se desemp eña 5.2. '
tan bien
n:'-~s En la tabla
distintas de4.4 es fácil
expresar lover
m~mo
ue l ' 'f '
os dI erentes sistemas de normas son for-
en aritmét ica como si estuvie ra en oCtavo o noveno grado, en parte porque
conoce los temas o no se le han enseña do muchos de los temas que se no
CIOn en otra. Por tanto, un niño q~ y qu~ podem os transfo rmar una
segu~do grado, tiene un
le pre-
u~ puntu - sentarán en el quinto, el sexto, el séptim o Y el octavo grados y que se incluye
dife~e 1Vale~te un/pund~
n
qu~
rada e se u Ica en el percen til66 en el gru o en las prueba s para esos niveles de grados. Por tanto, los niños de quinto
tuacIOn estánda r de 54. ros a 2.3 corresp onde a grado
se desemp eñan de modo más homog éneo respecto a la aritmética¡
mutu.amente para diferentes prop:~s sIstemas de mterpre tación se en otras
apoyan palabras, en la aritmética podemo s ver avances más rápidos del quinto
alocta-
Sm embarg o,los distinto s sistemasoJ' ormas O
d vo grado que lo que los mostra dos en la lectura.
I
Pd h
tIntes a medi?a que cambia mos de untipe Es import ante tener presente lo anterio r, sobre todo cuando se compar
~ .gudas funcH;mes madura n más rápida o e e a ason enteram ente consis-
<?tro. E~to se debe a que los equival entes de grado para cada materia . Un niño sobresaliente an
d~~s;odlaro
e la .dIspers ión de puntuaciones~~~~a :d~~ dando al sIguie~te, depen- aparecer más avanzado en lectura Y en lenguaje, menos en aritmét ica
suele
1, a a o a un mve! de gra- grafía, cuando los re~ultados se reporta n en equivalentes de grado. Esta Y orto-
I Lo anteno r se aprecia manera m' rencia puede ser el resultad o, en todo o en parte, de las diferencias dife-
rensió n de la lectur~ y e! de cálculo arit~~~
~s pares de puntuacIOnes que se muestr ~nt~11e n~e si se cO~I?aran la como en
aprendizaje de las materias, y no necesar iamente significa patrone s dispare el
O. enomen o esta Ilustrado por de progres o en el niño. Por esta razón, la mayoría de los especialistas jos
na de pruebas del aprovechamiento S~n en la tabla 4.5, basados en bas son bastant e críticOS de los equival entes de grado y expresa n una
en prue-
la bate-
Prueba a tres niños en los últimos dos d atfo~d. Se supone que se preferencia por los pércentiles o por algún tipo de puntua ción estánda a
marcad
mto aplicó la r.
Jyuan obtuvo puntua ciones iguales al e q.u grado. En ambas pruebas
estaba cercano al percen til50 par trOred IO¡ su grado era equival
,,'

haber entrado al quinto grado E a. os a umno.s evaluados a los dosente a 5 i


meses de
e~bar~o'lcómo es la compara~iÓ~r~~~: mostro un d~sempeño superio r¡ sin
COEF ICIEN TES
VIsta, e! se desemp eña igual de bien e ~as dos matenas? Desde un punto de
en ~u ubicación de grado aun cua edn am ~s, p~ro está adelant ado por En las primera s épocas de las prueba s diseñadas para medir la habilid
ad
un año
rr¡eJor en ~ritmética que ~n lecturan e~t en termI~os de pe~centiles está
mental, después de que ya se habían usado las normas de edad por
algunos
mucho años, se conside ró necesario convert ir las puntua ciones de edad con un
Í fercenUl 74. Por otro lado, Jorg~ se ~b's, en e rer~ent11 89 compar ado
con que expresa ra e! ritmo de progreso. Un niño de ocho años que tuviera índice
a ectura como para la aritmética. sin em Ica en e mIsmo percent il tanto
te para la lectura es de 7 3 y par'a 1 . bar9?, en su caso el grado equivalpara equival ente de edad de 10 112 años era, obviam ente, mejor que el promedun
. a antmet lca de 6.3. en- pero ¿qué tanto mejor? Se necesitaba contar con cierto índice que conside io,
rara
la edad cronológica (tiempo real de vida), así coma un equival ente
en la prueba (nivel de puntua ción alcanzado). Lo anterio r se logró de edad
Toblo 4.5. (omporoo"on de equivalentes de grado con percentiles al dividir
el nivel de puntua ción alcanzado en la prueba por la edad cronoló gica
real del
sujeto. Este proced imiento se aplicó más extensa mente con las pruebas
inteligencia, en las que el equival ente de edad en la prueba recibía el de
Significado de un párrafo (ólculo aritmético
de edad mental y el cocient e corresp ondien te se llamó coefici ente nombre
de inte-
John Hen,y Wi/I John Henry WiII ligenci a. .
La fórmul a para calcula r el coefici ente de inteligencia se muestr a ensegui
-
da y se ilustra para un niño de ocho años que alcanza el nivel de 10 112
Puntuación crudo años en
28 36 46 14 20 21
Equivalente de grado 5.2 la prueba :
6.2 7.3 5.2 6.2 6.3
Percentil de grodo S.2 52 74 90 S6 100EM 100 (10.51 = 131
89 90 CI fC 8
¿Có mo adquiere sen tido o sign
prim er lugar, por la form a com o ificado un coeficiente de mt;eli:gerlci~llt , ltese el capítulo 91 está n basadas en 141
pro med io seria de 100 para cua lquise estableció el coe fici ente (con~ud r de 15 mientra una media d
s que la Binet y la may oría deel 100
er estan a
de 10 año s, por ejemplo, debe ubic gru po de edad, ya que el ,
basadas en una medIa.
de 10O.y d·· , as P
Y Una
cua lqui er prueba si los equivalente
arse exa ctam ente en el nivel de ruebas está n normadas a dIfeuna
rent
eSVlaCIOn estánd rueb as
s
men te. Pero, ¿qué tan bue no es un de eda d han sido establecidos p proc edim ient os de mue stre o, es pun tos en el ~re de 16.
l.' ISUl1'~'" en las norm as
lo que también tl lllp o y
gun tas sólo pueden con test arse si se125?, ¿qué tan pob re es un 80? y, consecuenteme~te, en la distribn
arroja una prueba en part icul ar.
con oce la dist ribu ción de coeficien
te . arrojan par a cualquier escu ela o com ~,!-ce a
umdades dadas. UClon de
El coeficiente de inteligencia fue dise
las pru eba s de inteligencia individu ñad o orig inal men te en relación
ales del tipo repr esen tado por la
Stan ford -Bin et (véase el cap ítul o 9).
cien tes de inteligencia a par tir de Las circunstancias que hicieron
prue bas com o la Stanford-Binet , diversos tipos de norm as que hem
men te interpretables, eran que su os considera~o prOporCio
med
cían relativamente unif orm es de eda ia y su desviación está nda r'JJerrn:n,;. expresar las pun tuac ione s de pruebas
significa cerca del mis mo esta tus rela d a edad. Por esta razó n un de tal man era que pueden compara~~ ~u~ ~lfe~entes en Un~n los
e slgmftcatlvalllente n1dades
niño , aun que se obtu vier an para un tivo a un grup o de eda d de la directa de com para r una puntuaClOn
de 30 p.alabras OrtO N<? hay
no era necesariamente cier ta aun para niño de cinco o de 15 año s. Esta ~"""\
;1101 r'íi1.anera· s con una pun tuac ión de
esta prueba, pero en muc hos casos .-~ ...:. .escnt a
, 20 problemas antméticos °&rafica_
coeficientes man tení an el mis mo ambas se exp resa n en termmos ~. d . 1 d rad o resU
los diferentes grupos de eda d lo sufipro med io y disp ersa ban los valores o en térm ino s de por.centa)elllve es , e g eSColar a 1 eltosi
una inte rpre taci ón com ún era apro cien tem ente cerc ano s de tal manera ~ií~~::~~:~puntuacion por debajo de e~e de algu n gru po cOlllún deo~ qUe
Para todo s los inte ntos y propósitos,a a todo s los niv~les de edad.
piad ~V~,Mlíil1jar~LCI()ll significativaes. El punto, entonce.s es POsi firndo
con junt ? dIferentes puntuaCl?~es
tipo de pun tuac ión está nda r. La revi estos coeficientes representaban individuo, exp resa das en umdde de ble una
ade s c?munes de medICIón, CPrue
Stanford-Binet prod ujo una pun tuacsión que se hizo en 193 7 de la prueba erfil de cali fica cion es. Las puntuaCl .bas
mad ame nte 100 Yuna desviación estáión está nda r con una med ia de Pa su comparación en forma tub ular QP!~ separadas PUedenOnStltu_
nda r de alrededor de 16 en una IDlle al eiilistar los valores de Presen_
general de niño s esta dou nide nses . i::n sfor mad os. Un a forma de regi
Esta relación de coeficientes a las nnnhsltráiJ 'd:,¡"" , •• ~n"""
stro que muestr~ ,las PuntJaU~tua-
cio~es ~stán~ar es~á exp lícit "~'~ se apre cia en la tabla 4.6,
de desempeño se hace visu alm entey la comparac~on de las d~lones
ame nte reco noc ida en la may oría
de mtelIgencIa reCIentes. Para esta de las
s pruebas, las tablas de equivalente clara por medIO de Una r' l~eren_
han sido fijadas para cad a nivel de eda s de En las figuras 4.4 Y 4.5 se mue stra n
dos maneras de de~cribi~ aflC
mue stra n una forma d~ ~eglstro d~er ~ de
den la mis ma media y desviación está d y se han con stru ido de tal manera :·¿:.nc:I.llJE'n~"I·a tabla 4.6 y la figu ra 4.4 se
hecho, en la edición actu al de la prue nda r para todos los gru pos de áfica de perfiles indi vidu al de la pru ftles.
eba Iowa de habIlIdades b .clase y
pun tuac ione s estándar diseñadas de ba de Stanford-Binet tam bién se errlplc!all' ¡p;¡¡;-";;,¡,,gr,tTO de la clase revela
la forma en que se repo~~n l~s, dato ós
y la desviación estándar es 16 en cada tal man era que la med ia siempre por una de las organizaciones de s de reinIcas . El
nivel de edad, más que la prcmorcic .,. -,;-<,,,m." a gran escala. Las pun tuac cahf tc~c I~n d~ Prueba greso a
de edad men tal/e dad cron ológ ica, ln'¡: ione s de la part e supenor ~zquIerda
apareció. que era la base para el CI son equivalentes de grad o, y dado que re s calcu_
:Ei¡:á!.UffifIOS ya habían pas ado dos mes la I?ru.eba se dIO despUés d~Ortadas
La noc ión del coeficiente de inte es e~ el ?epumo grad o, l~ n01111a qUe
en la hist oria de la con stru cció n de ligencia o CI está fuer tem ente arraigada su totalidad serí a de 72.2 Las califtcac los
nidense del siglo xx. La exp resi ón pru pruebas y, de hecho en la cult ura estad ¡;;;.ix.~ a.eCllUa recuadro son ran gos de perc lOnes en l~ part~ Inferior lar a el
ou- entiles para las cahftcacIOnes de Ot~:
de nues~ro l~nguaje com ún, lo cua eba de CI se ha c¿n vert ido en una parte · sé!)tu·no grado. echa
l hace que prob able men te hay amo s • la figura 4.4 se mue stra n lps dato .
do ese term mo, pero aho ra y en el acepta- ' no en
3.2 ,4.2 ,5.2 ,6.2 Y 8.2. L.a llamada a ClllCO ~ruebas de Un niñ
CI en la may oría de los casos comfutu ro deb emo s con side rarl o y utilizar los . s par
o pun esca esta ~dar a la qUe no~ en
En vari as pruebas recientes de inte tuac ione s está nda r. escal~ de eqUlvalen~es de grad~efel~s
hacia la izquierda es en rea~Idad una la
que se reportaD: ~on p~ntuaciones ligencia las pun tuac ione s convertid . ' Por tant o este alum no tem a un voc n­
as '
de transformaclOn de area nor mah.estándar n?rmalizadas, basa das !!n el tipo .4.1 cua nd¿ fue eva luad o en el terc abu lano con un eqUIValente d esco_
zad a estu dIad o ante rior men te. Esta er grad o. En el cua rto año SU equ~ &rad
ben algu nas veces el nom bre de coe s reci- : de grado era de 4.8 y en el quinto o
fici ente s de inte lige ncia de desviació grad
(CID), d~do. ~ue son b.ásicamente n ' Los resultados mue stra n que este niñ o, de 5.9. \talen_
una desvlaclOn por arnb a o por deb pun tuac ione s estándar expresadas promedio nacional en su calificación o ha estado !?enerallllente
ajo com o: de vocabulano, a pesar de qPO~ arriba
Por desgracia, la escala de pun tuac de una media de 100 . .
.
exa ctam ente el mismo significado ione s para repo rtar los CI no tiene Uese ubi-
de prue ba a prueba. Las series de prue . 2 El punt o decimal se omi te
bas .. Anthony G. (en la tabla 4.6) debe
en la impresión, así que el 66 en la prue
ba de vOC;¡b
ría leerse como 6.6. .
ulan o para
.~- ~"J .•.. ~ ~J.""":,.,.:_, ...",.-:-.o" . :_.:-- .:-=':': ;.. '

'''''~;;;';'~::':~':': '''-~''<_';'._o_._"
--~'-::", :,~, ~-;:" '.~-;:.:;~;=::';!, ...
. • - ·. n· , __ . _; . ~ .~, .
0,:':0::'::'::":::'::::::::.

.. ~

Tabla 4.6. Co.)


Hoja de registro de clase para las pruebas lowa de habilidades básicas. (Reproducido con permiso de Houghton Mifflin

Ho;a de registro de clase ...


.¡:,.
N
Pruebas lowa de habilidades básicas
litad. ~ S.mOl're (primtro • ,egund.) primero ¡difici. OIcolor Shepard ¡echo 11(6(66 ¡OIm. ~
Ciudad o di,tri'. Woodford ConcIoclo Erie fI,ad. N. Y Mo",ro
Mr. Peters

Su. PfUlh. P".h.


Ed.d r I P",h.l

I
H.hilidad" d. I"g"i' P",h. W
H.hilidad,s d.lf.h.j. d. estudio P".h. A
/N4mhr. d. olilnlflO
..
a:- :s .g
.... ~~
f §.
~.. e ..~ 7i!~ ¡¡
. H.¡UWad,s OIilmllicas

lo!! i :~
...1
o ~
~.~

if i j ,..51
E ..o :;0...01),;:;
o
t ~:Sl ~ ~.J
¡i! ! .
.s ,5 .:¡
1 .:3.:¡ -8 ! -8 -8;;; .~ ~il
e S E _ oS! H -8 .:3--
,§ j i
~
al

loo. '§.a~
v
-8
·H
'

l·1 l·2 l·3 l·4 W·I W·2 W·3


Anthony G. A·l A·2
M 12
Grant O. M
8 I ~391 64 36
1 75 57 1 95 84 / 37 7 / 78 60 / 71 5 d 58
26
/ 68
43
/6°
29
/ 62 / 77 / 83 /8° / 69
12 80 73
33 63
65 46
..... 4 1,289/10197/ 8° / 9°78 /87 76 / 8876/8677/ 10598/9894/10298110298/10298/ 8888/9595/ 95.
Glenna O. F 13
91
Janet G.
2 17149/6844 I 76 58 / 102 93 / 8166 / 6744/82701 75 / 67 1,3 1 75
57
1 81
71
/8169 / 79 / 79
F 13 67 69
:.,: .' 53 40 57 58
Gustav J .
8 15825/6°29 / 221
47 13 / 44 13 / 583115°151 69
46
/ 5725140 3 / 55 / 48 6 / 59 1 55 131
M 12 78 18 54
65 61 25 20
Robert C.
10 1 1 76 1 8°651 105961104961 7860 /92 87 1 9087 / 5117/6742 / 69 79 / 77 1 69/ 78 I
M 13 48 67 66
78
22 66
3 I 56 / 63
34
/ 69 47 / 55 24 / 4413 54 29 / 55 23 / 72
52
73
54
/6°
29
/ 68 I 68 1 63 /66 / 62 I I
46 42 32 39 33

L,. ~ 01. InL t L$~l


I
. j (j~"iiitJilHJ . ir ,Xiii
IPruebo Pruebo
ro " ~ ,'.""., :;_''' __ . !'::;''-... ,,,," "-

V R Habilid~d:bSO ~erbales Habilid~d;~d~. tra~al~~l't~:I~~~~ii1:~~~~


de estudio ' . antmeIlCOs",~;,' o ....

1 ..Q'" 'e VI
°'gQ) r 18
'.
el
...:.,' Registro acumulativo individual ~ 2 o. ~ ~ e .g '>
o

de desempeño en las pruebas c: o~;j o. ~ g


>-\)
.E ~ o. el. ~Q) < o
.g :g 3 o ~ c: ..Q (l) (l) 1,1) ~ -:2 o J2 In VI ~ § ti
de habilidades bósicos de
lowa. Edición multinivel.

.D
!)
c: Ü . : ;
~3
a.
e E ~Qou
el" Q)
(l)
"'O
\)
'o
~
"'O 8 's as 'O
o ~ .- - c: -o
~'OUO<l)">
Q) 2 8 c: o
stu'Q)·üo
' ;: 'O!,l1 .2
Q)
""t1
:>
Q)
~
Q
E
8 e J2 2 o 2 0]-' U u~gE.!]> C:~..2E Be. o
~ e~ o :s 2 :S~.2 ~ ~>-e~~~.2 eoJl~ ~o
.. ""'. '... ;.. ,¡~ . '.~'
u
';". .
Regis'ro de pruebas
~~~.~.~.~Y'-.l o ' W.I W.2 W·3 · ~/ ,,<';.r~'Y "''1/~;'
o

Fecho _ _ _ _ _ _ _ _ __ ~ .~ ~ -; ~ -; ::
7. Grado Clave _ _ __ 120 ~ ~ ~ 120
Edilicio _ _ _ _ _ _ _ __
~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~
fecho _ _ _ _ _ _ _ __ 110; ; ; ~~ ~ ~ ~; ~ 110

kfrrllttm1liA
6. Grado ___ Clave _ _ __ / ~ ~~ o......; .; ~
Edilicio _ _ _ _ _ _ _ _ __ - ~ ~j_ 100

fecha 1 0 - 5 - 69 90 90
5. Grado 8. 2 Clave ~ 1001
Edilicio ~ Lo3 róp~'1 e r 80
Fecha 1 \3 - 1 Ü • 67
70
4. Grado 6. 2 Clave ~
Edilicio ~J i 1 son
60
Fecho 1<3-8'66
3. Grodo~ Clave ~ 50

=IOOtfN2NlM
Edilicio J.j i 1 son

Fecho 1'3 -7'65 40


2. Grado 4. 2
Edificio l·! i 1 s o "
Clave ~
. :
30
fecho 1>3 - 1 2 • 64
l . Grado ~ Clave ~
20, 20
...
', ":'
:r.."
Edificio_ lo.! i lson L lOw - - - 10
.¡:,.
W
o,'
Figura 4.4. Carta de perfil del alumno para las pruebas lawa rlP, habilidades bósicos
-t (reproducida con permiso de Houghton MiFFlin Co.) .
144 CAP. 4. NORMAS Y UNIDADES Año· Formo Grado Sexo - - ,
63F 08 M

có por debajo en la prueba que se le hizo en el sexto grado. Una vez más, Un 8
:¡ o
examen de este perfil para el octavo grado indica que tuvo un desempeño o E 2 --gj
-o o Uso del lengooie

mejor en las habilidades para el lenguaje y uno más deficiente en las habilida. E
.~]
il
"o <
'C

.~
o
M -00.
=
:o"
E
¡: o
.~
o 'o
"E
]
. ~
g,
o
,~
.;;
des aritméticas. Algunos de los problemas de poner mucha atención en las o ~ o" c v
~o Z e o O E
e ">
:;: 0.0
o r E O"
E o 2 o
pequeñas alt¡¡s y bajas de un perfil pueden verse en la comparación de su ~
N N

.s. r ~ S ~ O <3
desempeño en las pruebas sucesivas. ASÍ, la ortografía parece haber estado a
su máximo en el perfil para el tercer grado, justo en el promedio un año des.
pués; las gráficas y tablas ae lectura son las más próximas a lo más alto en el
tercer grado,pero muestran una caída real entre los grados tercero y cuarto, y
" ' es el punto más bajo en el perfil del cuarto grado. Hay varias otras inconsis.
tencias de una aplicación a otra de una prueba. Es posible que algunos de estos
cambios sean significativos, pero muchos de eUos se originan del error de
medición en las subpruebas que son bastante cortas, por lo cual, no muy Con.
fiables.
En la figura 4.5 se muestra un tipo de carta de perfiles para las pruebas que
constituyen la batería de pruebas de aptitudes diferenciales. Mediante esta
batería se aprecian los diferentes aspectos de habilidad que sus autores consi-
deraron importantes en un programa de guía de las escuelas secundaria y pre-
paratoria. Nótese que en este caso cada prueba está representada por barras 95 95
95 95 95 95
separadas, más que por puntos conectados por una línea. La escala empleada
es una escala de percentiles, pero al señalar los valores de percentil se hicieron
90 90 90 90 90 90
<~ ajustes apropiados 'p ara compensar la desigualdad de las unidades de percen- 90

;/ til; es decir, los puntos de percentil habían estado separados de tal manera que
!l
,, aparecían Como los de una CUrva normal, lo cual les haCÍa estar más separados 80 80 80 80
80
¡i ¡! en los extremos superiores e.inferiores, más que en el rango medio. Esta escala 75 75 75 75 75
f: de percentiles corresponde a la escala llamada de equivalentes de percentil, 70 70 70 70 70
, que se muestra en la figura 4.3. Por medio de estos ajustes, los valores de per-
centil para un individuo están destacados en una escala de unidades iguales. 60 60 60 60 60
Una distancia lineal dada se puede considerar de manera razonable como el ~
1/ , representante de la misma cantidad de habilidad, ya sea que se ubique alto,
1550 50

bajo o cerca.del centro de la escala. Por tanto, la misma distancia puede consi.
..." 40
~

40 40 40 40 40
derarse equivalente de una prueba a otra.
30 30 30 30 30 30 30 30
,. : Nótese que en la figura 4.5 las barras han sido señaladas haciá arriba y 25 25 25 25 25 25 25 25
': hacia abajo del percentil 50. Para este tipo de norma, el promedio del grupo 20 20 20 20 20 20 20 20 20
constituye el punto de anclaje de la escala, y las calificaciones individuales se
pueden referir a este nivel base. En este tipo de figura se destacan con mucha
claridad las habilidades y las deficiencias del individuo. 10 10 10 10 10 10 10 10
10
'1 :i La carta del perfil hace más eficaz la forma de representar las calificacio.
"1 ¡¡, nes de un individuo, pero los perfiles pueden y deben interpretarse Con pre-
,!j¡ '; caución. En primer lugar, los procedimientos para señalar los perfiles asumen
5 5 5 5 5 5 5

que las normas para las diversas pruebas Son comparables. Para que esto sea

.' i ; ¡!,
,: ¡f cierto, la edad, el grado o las puntuaciones de percentiles deben estar basados
en grupos equivalentes para todas las pruebas. Por supuesto, la mejor garantía
de equivalencia es una muestra común para normativizar a todas las pruebas. N,ormos empleados _ _ _ __ !si no hoy enfrado. los percentiles estón basados en kJ norma nocionoO
i."
I :l Normalmente, éste es el caso para las diferentes subpruebas de una batería de
• F_ Primero evolvoc.iÓt'l semestrot lotoj¡ol y pe.r cenliles: .
pruebas, Las normas para ellas se establecieron al mismo tiempo con base en S- Segundo evoluodón , ......01 Ip<;mov..o' y peocen,;!e" ,, •
evaluar al mismo grupo. La garantía de comparabilidad de las normas para los
distintos componentes de pruebas es una de las características más significati- 5 C t de perfil del alumno sobre los pruebas de) aptitudes
' diferenCIales
Figura 4.. or Q con permiso
(reproducido ' d e la Psyehological Corporotion
. , ,
146 CAP. 4. NORMAS Y UNIDADES
PRECAUCIONES AL EMPLEAR LAS 147
NORMAS
vas de una bate ría inte grad a. Si las
pruebas se han diseñado por separado . ti! 75 mie ntra s que una esc';1ela ~yo
go se señ alan en un perf il, por lo y lue- "., .' ~ 2 se ubIca en el pere en.
gen
que los gru pos en los que se esta eral lo únic o que ,pod ríam os esperar es , lent e al u eqUlval' te pro me-
blecieron las normas fue ran com dio '.
de lectura nen e u!l gr ado en al pn'ncipio del qum to ano de 6.2 se
y que el perf il fuera una ima gen no para d las escu elas . Los valo res de la tabl
sesgada del apro vec ham ient o relat bles a11 ría en el perc enu l 94 ,e d 11 a 4.7 m':le~tran
cada cam po. Cua ndo,es nec esar io
ma de esta r segu ro de tene r gru pos
usar pru eba s de dist inta s fuentes,
de
locales sob re una pob laci ón com ún nor mas equivalentes es diseñar norm as
ivo en
una for- es .escolar en su ofic ma eentra a:i
b titrd acíó n de man~r~ mas eta1 d Cua ndo un dire ctor o un adm mls tra-
interesado con la irlterpretación
es de la escuela, las normas para del
min os de esas normas. y señ alar los perfiles indi vidu ales
en tér-
~~!ernpeño promedi? dela~0:p~:p7;d~~ par los ¡:>ro-
a usarse, Y es razonable esp erar que
· scol
Un seg und o problema serí a decidir . Illed10.S e darespru sen an
eba s lo prop orC
.
IOn en.
altas y baja s den tro del perf il. No toda qué tant a atención se deb e poner alas los editores e
s
son significativas, ya sea en el sent las diferencias que apa rece n en el perfil
i\
decidir cuá les diferencias mer ece n
ido esta díst ico o en el prác tico . Deb
emos 4.7. Normas promed~o individuales Y escolores
nue poro lo pruebo de lectura ITOS 01
blema surg e por que las calificacion stra aten ción y cuáles igno rar. Este pro - Toblo principio del qUinto grado {5.2) .
exactas. El prob lem a de la confiab es de la prue ba no son com plet ame nte
ilidad y del erro r de med ició n en Pere8nlil por
tuac ión de pru eba ya se con side ró una
en el cap ítul o 3. Reportar las puntuac pun - Equivalenfe Pereen/il por
promedio escolar
en ban das de perc enti les( pág s. 129 iones de grado individuo
y
ma. Si mar cára mos una ban da de 1301 es una manera de trat ar este proble~
r .. percentil en vez de un pun to de pere
específico com o en la figu ra 4.5,
pod ríam os ver qué ban das se trasl entil 6.5 83 99
cuáles que dan clar ame nte separada apan y
lar la dist anc ia vertical apro piad a s. Un proc edim ient o alte rna tivo es calcu- 6.0 73 92
de la esca la de pun tuac ione s estánda 61 73
gráfica de perf iles que corr esp ond r de la 5.5
usar una regl a para esti mar qué difeel erro r está nda r de med ició n y después
e 47 41
5.0
para que mer ezc an nue stra aten ción rencias son lo sufi cien tem ente grandes 4.5 35 19
(para la figu ra 4.5 esta dist anc ia vert 7
'¡'. : ,, \ es apro xim ada men te de 1 1/2 cent ical 4.0 24
ímetros). Por supuesto, no hay un
,¡ i , mágico en el cua l de repe nte una
cedora de aten ción , y una regl a de
diferencia de pun tuac ión se con vier tam año
te mere-
3.5 15 2
. '1¡ bols
.' . Pero las dife renc ias deben ser 10 sufi illo es cua ndo muc ho una buena guíá .
cien tem ente grandes par a que pod
estar razo nab lem ente segu ros de que amos
luar a la pers ona , y hagan una dife todavía esta ría ahí si volv iéra mos a eva- PR EC AU CIO NE S QU E DE BE
rencia prác tica , antes de que empecem N TE NE RS E
inte rpre tarl as y a tom ar acc ione s os a
sobre AL EM PLE AR LA S NO RM AS
Ent onc es, organizar las pun tuac ioneellas. .
duo den tro de una gráfica de perfiles s de pru eba sepa rada s de un indi '
pun tos alto s y bajo s en un pat rón es una form a muy efic az de realzar vi- Par a una pru eba que evalua , 'n ras o o com pete ncia en CIerta
algu . . gla bas e para irlterpre area
de los . ' 1 tar las pun-
siempre que las calificaciones d~ cadacalificaciones. Este perf il se debe marcar . del conoclIlllento, as norr nas pro por clon an
Si se con vier ten las puntuaC . nes
prue ba esté n expresadas en las mism tuac ione s de un indi vidu o o de un
unidades; sin embargo, un per fil as gruP en equ ival ente s de.edad o lO
debe inte rpre tars e con mu cha prec para cualquier pru eba tomada P?r do de ~~a­
. :: porque aun las diferencias no conf
iables pue den lucir muy imp resi ona
aución, seP:
do, en pereentiles o en pun:uacI~ner ~:ándar se perm itirá la mterpretalclon
.1:
. ¡.' ntes. viduo en ~sa pru eba particular. Co
., '1' del nive l al que se dese mpe na.el md oc:u
jun to el conjunto de puntuacIOne~ ra un irldividuo en una u~dad com u}
NO RM AS PA RA LOS PR OM ED isapun tuac ione s en un perfil, mue
IOS ESC OL AR ES de med ició n y tal vez mo~trar stra e
nive l relativo de desempe~o dees . d' iduo en cad a área. .
ese m IV se ara un grup o en una
Cua ndo eva luam os el apro vec ham El desempeño prom edIo Pd~a ~n~ escu ela o
par a los niños de un grad o me Ian ~~is:e~a esco lar, puede report~rsd de
relación con los de otras escu elas , ient o de los alumnos de una escu
algunas veces resu lta útil ten er nor ela en e er el nivel pro med io del des:empeno
los prom edio s escolares. Deb ería que mas para man era similar. Ent onc es, pfude~os en-
habilidad o el apro vec ham ient o promdar claro que la variación de escuela en la tro de un grupo en algu na nCl<~n V. mpl e o el des emp eño relatlvo del ~Pl
de alum no a alum no. Nin gún pro edios es mu cho menor que la vari SI n un marco de referenc
med io esco lar llega siquiera a esta ación en cad a área. Las nor mas proporCIona ia den tro de cua
s artes a la mis ma imagen a un mar
al nivel de su estu dian te más cap az, r cercano pue de verse esta ima ge? y ll~far tod
co com ún. Ahora, ¿qu e Slgn~ lca esa ~:g~n y qué deberíamos hacc:r con ella?
y ningún pro med io se ase mej a a ning -
lugar cercano al desempeño de los ún
alum
alum no al prin cipi o del qui nto grad nos men os capaces. Por tan to, un solo Obviamente, no es poslbl~ en u nas cuantas pág inas dar una m~erpr~~a-
o que obti ene un grado de lect ura equi . ción par a cada serie de puntuaC d' ran obte ners e en una SltuaClon
va- IOnes que pu le
.
148 CAP. 4. NORMAS Y UNIDADES RESUMEN 149

de prueba práctica¡ sin embargo, podemos exponer algunos lineamientos y sólo el potencial individual para el aprendizaje-, sino también las circunstan-
principios generales que permitan reforzar algunas interpretaciones poco , cias familiares y los apoyos que facilitan que algunos niños aprendan mejor
convenientes para los resultados de las pruebas. que otros. Las aspir~ciones ~e los padres. p~ra el ~iñ.o, .las habilidades de la
El punto más general es que los resultados de prueba, presentados en tér- familia para la tutona y la gula del aprendIzaJe, la dlsclphna y el control fami-
minos de equivalentes de grado o de edad, percentiles o puntuaciones están- liar los patrones lingüísticos y los recursos culturales en el hogar forman par-
dar son una descripción de 10 que es, más que una prescripción de 10 que ; • te de estos factores tan ciertamente como lo son las características biológicas
debería ser¡ permiten comparar al individuo o a la clase con otros individuos del organismo del joven. Más aún, el grupo de compañeros y las actitudes de
u otras clases en lo relativo a uno o más aspectos del aprovechamiento o de la la comunidad son una parte adicional, real, aunque posiblemente modificable
personalidad, pero no revelan en ningún sentido absoluto si el individuo o el de estos factores.
grupo trabajan "bien" o "mal"¡ no proveen esta información por varias razo- Todavía no sabemos con certeza cómo medir dichos factores. Algunos de
nes, las cuales señalaremos enseguida. los enfoques sobresimplificados a este problema se analizarán en el capítulo 9,
cuando consideremos las "tablas de expectancia" para analizar el aprovecha-
. l. Las puntuaciones transformadas dan una información relativa más miento de un niño a la luz de su desempeño en una prueba de aptitud. Por el
que iln~ absoluta. Dichas puntuaciones revelan si un alumno tiene un apro- momento, debemos conformamos con reconocer que la apreciación adecua-
vechamIento tan alto como el de los otros alumnos o si las puntuaciones de da de estos factores no es un tema sencillo y, en correspondencia, la apre-
una clase son tan altas como las de otras clases, pero no dicen si se han domi- ciación del resultado final como "satisfactorio" e "insatisfactorio" es algo que
nado los conceptos básicos de los números o si los alumnos leen lo suficiente- debemos tomar sólo con una modesta confianza.
mente bien para comprender las instrucciones dirigidas a llenar una forma de 3. El resultado final debe evaluarse en relación con los obietivos. El
pago de impuestos. Más aún, proporcionan muy poca guía acerca de qué tan- diseño, el contenido y las normas para las pruebas estandarizadas-publicadas
to aprovechamiento podríamos esperar de todos los alumnos si nuestro siste- están basados en la percepción de los autores de los objetivos programáti-
ma educativo fuera 100% eficaz. cos nacionales más comunes. Los temas que se incluyen, su énfasis relativo
Debe recordarse que, por la misma naturaleza de las puntuaciones relati- y los niveles a los que se introducen reflejan el patrón nacional general.
vas, habrá casi el mismo número de casos por arriba del promedio como por Entonces, en la medida en que un sistema escolar dado se desvía de sus objeti-
debajo. C':l~~do "la n?~a" significa el promedio de un grupo de referencia, es vos y de los énfasis programático~ del patrón nacional, como lo interpretó el
una condlclon estadlStlca de que cerca de la mitad del grupo esté ya sea en diseñador de la prueba, el resultado final en cierto grado puede esperarse que
mayor o menor gradopor debajo del promedio, a menos que todas las diferen- se desviará de las normas nacionales. Si las habilidades para efectuar operacio-
cias individuales hayan sido eliminadas. Ha habido poco acierto, tanto en las nes aritméticas reciben poco énfasis, es razonable que las facilidades para rea-
escuelas como en la legislación a nivel nacional, acerca de aplicar a los alum- lizar cálculos numéricos serán mínimas. Si la lectura de mapas se ha retrasado
nos .l~s unorma~ de grado". Esto se hUbiera podido hacer temporalmente si más allá elel nivel de grado al que se incluye en una prueba, es razonable que la
hubIeramos temdo una enorme y repentina mejoría de la eficacia educativa parte relativa que apoya esta habilidad en la prueba se alterará. La disparidad
pero entonces la próxima vez se establecerían las normas nuevas para la prue~ del perfil local en relación con las normas nacionales siempre hará que nos
ba y se tomaría un nivel de desempeño absoluto más alto para "leer al nivel de preguntemos si los puntos bajos representan fracasos del programa local para
sexto grado", por ejemplo, de tal manera que otra vez el 50% de los alumnos lograr sus objetivos o reflejan una desviación planeada del énfasis de lo que es
se ubi~aría por en.cima del p!omedio y el 50% restante se hallaría por debajo típico en las escuelas de manera más general.
del mlSI~o. !=-n la unportancl.a que reCIentemente se le da a las pruebas referi- Si se tienen estas consideraciones en la mente y el interpretador de prue-
das al cnteno, se ha reconocIdo la naturaleza relativa de las normas. Cuando bas mantÍene una actitud de respeto hacia el error estándar de medición cuan-
un maestro o una escuela están interesados en el dominio o la destreza de do está interesado por los resultados de un solo individuo, los resultados de
algún objetivo inst~ccional muy específico, sería más útil diseñar ejercicios la prueba, como se le reportan al maestro, al director, al superintendente o a la
de pru~ba que apreCIaran ese objetivo, establecer algún estándar que represen- mesa directiva de una escuela, se interpretarán y utilizarán con creciente con-
te un mvel aceptable de su desempeño y determinar cuáles estudiantes tienen veniencia, sabiduría y restricción.
esa destreza para el objetivo específico y cuáles no la tienen.
2. El resultado final debe evaluarse tomando en consideración una gran
cantidad .~e factores. T~pi~amente, los resultados de la prueba dan una re- RESUMEN
prese~taclOn del aprendlZ~Je, ya sea de un individuo o de un grupo en el
momento presente, despues de un periodo de exposición al esfuerzo educati- Una puntuación cruda por sí misma rara vez tiene algún significado. Se
vo¡ emJ?er? ¿qué podemos decÍ! ,acerca de <?tros factores que contribuyen a ese puede dar significado a una calificación o puntuación por medio de la compa-
apre?dIzaJe? Esta es u~a cuestlon compleja y un tanto sutil que debe incluir ración con un estándar de desempeño que se fija antes de que se aplique la
no solo el esta tus antenor acerca de la habilidad en particular que se mide -no prueba¡ por ejemplo, que se contesten correctamente el 90% de los reactivos.
150 CAP. 4. NORMAS Y UNIDADES PREGUNTAS Y EJERCICIOS 151

Este método de dar un significado a una puntuación cruda se llama interpre- 2. ¿A qué se debe que en las pruebas estandarizadas diseñadas para usarSe con los
tación referida al criterio, interpretación que es adecuada para las pruebas estudiantes de la escuela secundaria y preparatoria casi nunca se usan normas de
que se enfocan en un solo objetivo y para cuyos estándares de desempeño se edad o de grado?
pueden derivar de manera empírica o lógica. 3. ¿Qué limitaciones tienen las normas nacionales para usarse en un sistema escolar
Debido a que la mayoría de las pruebas se han diseñado para apreciar más rural en Virginia Occidental?, ¿qué podría hacer el sistema escolar local acerca de
de un objetivo y los estándares absolutos significativos de desempeño no esto?
están disponibles para la mayoría de las pruebas, una puntuación cruda obtie- 4. ¿Cuál es la suposición o las uposiciones n que se basa el ~iseño d~ las normas d.e
edad, el de las normas de gra o esco ar y el de las puntuaclones estandar normalI-
ne significado por medio de la comparación con algunos grupos de referencia.
zadas?
Este m étodo de dar significado a una puntuación cruda se ha llamado inter- 5. En la figura 4.3 ¿por qué las puntuaciones estandarizadas están uniformemente
pretación referida a la norma. La comparación puede hacerse con: espaciadas, mientras que las puntuaciones de percentiles están espaciadas de
manera no uniforme?
al Una serie de grupos de grado escolar (nonnas de grado'. 6. Supóngase que el lector es un asesor guía y se le ha dado la forma L de la bateIÍa de
bl Una serie de grupos de edad (normas de edad). aptitudes diferenciales para que la aplicara al grado noveno en octubre. Con base
e' Un solo grupo, indicando qué porcentaje de ese grupo sobrepasa la
puntuación (normas de percentiles' .
en la tabla 4.1 prepárese un reporte resumido y una interpretación para el alumno
con las puntuaciones siguientes:
. ~ d, Un solo grupo, indicando las desviaciones estándar por arriba o por
debajo de la media del grupo (puntuaciones estándar'. Razonamiento verbal 18
Habilidad numérica 23
Cada alternativa tiene ciertas ventajas y limitaciones que ya hemos con- Razonamiento abstracto 31
siderado. Relaciones espaciales 39
Para obtener un índice único que exprese el grado al que los individuos Razonamiento mecánico 54
se desvían de un grupo de edad se han diseñado coeficientes tales como el coe- Velocidad del empleado y eficiencia 45·
ficiente de inteligencia (CI,. Dado que las puntuaciones del tipo de los coefi- Ortografía 48
Oraciones 22
cientes tienen todas las limitaciones de las normas de giado y de las normas de
edad más otras, han sido reemplazadas por las normas de puntuaciones están-
dar. En sentido estricto, el término CI no debería usarse para referirse a las 7. La escuela A aplica una batería de pruebas de aprovechamiento cada mayo a los
pruebas de habilidad general o a las puntuaciones que se derivan de ellas. alumnos de cada grado desde el tercero hasta el sexto. El nivel de gra~o mediano
en cada materia en cada clase de cada maestro se le reporta al supenntendente.
Si las normas disponibles para varias pruebas diferentes son de la misma
¿Deberían reportarse? Si es aSÍ, ¿qué ~ás debería incluirse en el ~epo~e?, ¿en qué
clase y están basadas en grupos comparables, todas las pruebas pueden expre- forma podría usar los resultados el mspector escolar para que unphcara alguna
sarse en términos comparables. Entonces, los resultados pueden mostrarse ventaja?, ¿qué usos deberían evitarse? .
gráficamente en la forma de un perfil. Los perfiles destacan las diferencias en 8. La maestra B se enorgullece de que cada año el 90% de su grupo de qumto grado
L las puntuaciones dentro del mismo individuo. Cuando se usan los perfiles, se obtiene calificaciones usuperiores a la norma" en cada materia. ¿Qué tan deseable
i'
1;' debe tener mucho cuidado en no malinterpretar los incrementos o lo~ decre- es esto como un objetivo educativo?, ¿qué limitaciones o peligros implica?
mentos. 9. La escuela e funciona con una política de asignar estudiantes transferidos a ).1ll
La:; normas representan un marco de referencia descriptivo para interpre- grado con base en su grado promedio que se obtiene en un~ ~atería de pruebas de
i
tar la puntuación de un individuo, un grupo de clase o algunos agregados aprovechamiento. Por tanto, un al?m~o con una puntuaclon .de. grado de 6.~ en
.f una batería como una totalidad sena aSignado al sexto grado, sm unportar cuál es
¡I.~.! mayores; sin embargo, antes de que se puedan emitir juicios acerca de si el
su edad o su grado en la escuela anterior. ¡Qué valores hay en este plan?, Nué limi-
' ,; individuo o el grupo se está desempeñando bien o deficiente, se debe permitir
taciones existen? . .
tener en cuenta los niveles de habilidad, los antecedentes culturales y los énfa- 10. El inspector escolar de las escuelas en la ciudad D notó que los al.umnos de la
sis en el programa. La norma es sólo un promedio, no una camisa de fuerza en escuela E se ubicaban consistentemente cerca de 1/2 grado por debajO de las nor-
la que se debe forzar a los individuos a ajustarse. . mas nacionales en una batería de pruebas de aprovechamiento. El superintendente
estaba preocupado porque ésta era la más baja de cualquiera de sus ~cuelas en su
ciudad. ¡Qué tan justificada es su insatisfacción?, ¿qué más se neceslta saber para
PREGUNTAS Y EJERCICIOS contestar esta pregunta?
11. Los integrantes de la mesa directiva sobre educación en la ciudad F se percataron
de que los grados segundo y tercero de su comunidad se ubicaban por debajo deJas
l . Un alumno que cursa el sépti~o grado recibió una puntuación cruda de 13 en la normas nacionales en aritmética aunque alcanzaban la norma d~ otras matenas.
prueba métropoUtana de lectura, nivel intermedio. ¿Qué información adicional Se propusieron estudiar esto cor:. más detenimiento. ¿Qué información adicional
se necesitaría para interpretar esta puntuación? necesitan?

. ..
" ', . " .
. ..' , . ~
", . ~." '

:; .' , "". ' ..


.... ,." .' .•... ... .
152 CAP. 4. NORMAS Y UNIDADES

12. Los maestros de tercer grado en la escuela G


vos ~ara aprec~ar el dominio acerca de las °
pr~pararb? .una prueba de 20 reacti_ .
ación. :
¿Que puntuacIón deberían aceptar como peracI.one.s aSIcas de la multiplic
io" sobre est .
operaciones?, ¿cómo debería detérmi constItu tIva de udomin
ventajas de re ortar ef~rse esta puntuac ión? as
13. ¿Cuáles son las
estanueve y de bandas de per~entilesl .ese~pebl en las pruebas en términos de
de e~tas formas de reportes normativ~sllque pro emas surgen de usar cada· .
Una
, .
14. Observese el manual para buscar a l 'prueba y estudIese la información que se .
da acerca de las nonnas. guna

aJ ¿Qué tan adecuado es la población nonnatIv ' . .


a?, ¡se da mformación adecuada
5
acercfI de esto?
bJ C:a~culese la puntuación de azar (es decir la ..
hICIera una ~O?j~tura a ciegasJ para cada' ruePbntuac!on que esper~ríamos si se
y n~telnse sus eqUIValenteS de
~rad? .i que .lImItaciones sugiere esto pfr ~1auso
eJ ¡Que lUmtaclOnes hay en la utilid d a e a prueba? Dón de enc ontr ar
mo superior de su rango? a que pudIera tener esa prueba en el extre.
dJ ¿Cuántas unidades de puntuación crud
una escala de equivalentes de grado? a corresponden a un año entero sobre
.
info rma ción ace rca de
pru eba s esp ecif icas
LECT URAS ADIC IONA LES

Angoff, W. H., "5cales, nonns and e u · 1 " por


Th~mdike, R: L. (dir.J, Edu: La produc ción de prueba s educativas y psicológicas se ha desarrollado
cational measur ement, Ameri~~v~~~~~~~~~ É~nucanon, Washmgton D e se han produc ido literalm ente miles de
l 97 l . más de medio siglo, durant e el cual
. . ' . ., tes. Una bibliog rafía comple ta que se extiend e a partir de 1945
Angoff, W. H. y Anderson, S. S., HThe stand a d' pruebas diferen
una
c~l tests", en Payne, D. A. y McMor ris ~ ~atIo? of educatlo nal and psycholo gi_ contiene entrada s para 5 294 pruebas diferen tes. Buros (1974) elaboró
General Lea . 'p' . (drrs.J,. EducatlO nal and psycholo . pruebas para hablant es nativos del idioma inglés que estaban
gIcal measur ement, bibliografía de
Bayless, D. L., Bergsten, 1. W., Lewis L~ng ~~ss, Mornst own, N. J., 1975.
disponibles por los editore s público s en 1974, Y la lista contien e 2 470
entra-
dures in nationa l norming: An il1~st~:ti rth,. R. 7., Considerationsent and proce-
01 career das. Alguna s de ellas ya no se encuen tran en el mercad o, pero desde entonc es
and ACT career plannin on usmg theACT assessm reempl azaron a las anterior es, y
develop ment se han produc ido muchas prueba s nuevas que
~m,
~geP74°rt No. 65, The American College 4ef~~ggr rogram, Owa Cuy, Iowa, julio
GradeIs 8-11,. ACT Research
el número actual de prueba s que pueden conseg uirse es superio r a las 2 000,
. la biblio-
B .
eggs, D. 1. Y HIeronymous A N "U"f . sin contar aquellas que sólo han sido instrum entos que aparece n en
G. H., Hopkins, K. D. ~ Stanley ;11 ~~~ty of achievement growth" , en Bracht grafía de investigación.
psychologieal measur ement P' ~ . . k
Iíf"J, Perspec tives in educati onal and Es grande no sólo el númer o de prueba s en su totalida d, sino también
mien-
la
Loret, P. G., Seder, A., Bianchini ' ¿en ~e- a , Englewood Cliffs, N. 7.,
1972 variedad de éstas, pues las prueba s varían amplia mente en sus procedi
and norms tables lor seleet~Jre~rn ale, C:. A., Anchor test study. EquivaÚ
de
nce tos, en su conteni do y en el grupo para el que se designa n. Hay pruebas
nal Center for Educatio n Statistics U g;c~Ieve ment test~ (qrades 4, 5, 6) Natío
papel y lápiz, de desemp eño individu al, escalas de califica ción, instrum entos
ton, D. C, 1975. . . overnment Pnntmg Office, W~shing- de autorre porte, proced imiento s observacionales y técnica s proyectivas.
Exis-
es, para los interes es, para el temper amento , para
ten medida s para las actitud
nal person al, para el intelec to, para las aptitud es especiales
el ajuste emocio
y para todos los aspectos del aprove chamie nto escolar. Hay
pruebas diseña-
das para lactante s, para niños en edad preesco lar, para niños en edad escolar ,
para adolesc entes y para adultos .
s de las
. Ningú n libro puede conten er alguna s muestra s represe ntatíva
las clases de conteni dos para
pruebas de todos estos tipos, que abarcaran todas de
todos los niveles de edad. En los siguien tes capítulo s se incluir án algunas
as de todas las pruebas se
las más importa ntes, y las más amplia mente conocid dar
s de muchas otras·. Pero en este libro no se puede
estudia rán como ejemplo
área de
un tratam iento comple to de ningún grupo de edad particu lar o de un
153
154 CAP. 5. DÓNDE ENCONT RAR INFORM ACIÓN
LIBROS DE TEXTO 155
el Los artículos acerca de las pruebas en las. revistas profesionales
~teria, y existen tantas situacio nes es ecial
m~eresa do o para las que tal vez necesitP es en~as que el lector puede estar dI Los catálogos de los editores de pruebas.
cnt~s quizá no incluyen siquiera una d:t na prue ~,que !as prueba s aquí des- el Cada prueba en sí misma acompa ñada por su manua l. .
partIcul~res. as que se aJustanan a sus necesidades f) Los artículos en las revistas profesionales que revisan amplios campOS
DebIdo a que es imposible enlistar de la investigación con pruebas.
de las pruebas que podrían ser interesa~!:aluar todas y ni siqu!er a la mayoría gl Las series índice Ylos resúmenes educativos Y psicológicos.
do~, enfocaremos el problema desde unt para .un g~po con lllteres
guIar al lector a las fuentes en las u p os de VIsta diferentes. Tratarees varia- Cada uno de estos recurso s se considerarán en su oportu nidad, los puntos
enlistadas (yen algunos casos ev;l:a~~~t e?cont rar las prueba sdisponibl~
que I?uede localizar. En este capítul o se ~si· como par~ evalua r las pruebas
mos d
más útiles se identificarán Y la información que se obteng a de cada tipo
de
l~cahzar l~s pruebas y obtener infonn aci' a Izan matenales y recurso recursO se indicará.
dIO una on~?tación acerca de los factor on a,:r~a de ell~s. En el capítuls para
la adecuaclOn de una prueba part' l es que e en co~s~derarse para o 3 se LIBROS DE TEXTO Y DE REFERENCIA
evaluar
El conoci miento acerca de ad ~cud ar pa~t un proposlto específico
las pruebas de un tipo en particula~n ce, acu Ir jara encontrar algo
es probablemente más import ante ~ omo ~va uarla~,cuando se encuen de ac~rca EN ÁREA S ESPECIALES

prueb~ en particu lar. Las prueba s~~hl~a mformacIO~


tran
'previa acerca deun~
Existen varios libros de texto Yde referencia que abarca n las áreas especia
lizadas de aplicación de prueba . Cuando el panorama es tan limitado que
-
usuano de las pruebas por lo . ~ como ~amblen los propósitos del sólo
r~querirá para algunas'necesidid:sefu~posl~le .antIcipar qué tipo de prueba se
incluye las pruebas de la escuela elemental, pruebas para diagnosticar
ajuste emocio nal del individ uo o pruebas para la ubicaci ón vocacioel des-
fI? de encont rar las pruebas disponib~~:s. o Import ante es ~aber qué posible abarcar el campo con más detalle. Un libro que trata de ciertas prueba
nal, es
como evaluar sus méritos relatI' hacer a s
H para aquella necesIdad que sUIJ'a Y en particu lar proporciona una buena introdu cción general a los materia
.. vos . campo. Este libro normal mente familiariza al lector con una selección les del
c~on
. , ay vanos tipOS de pregun tas acerca d
p.ara}as que podamos buscar respuesta~ uXf pruebda o de un área de medi-
tIpO SIguIente: sentativa de pruebas establecidas en el área, es decir, aquellas que el autor
repre-
. gunas e las pregun tas son del sidere que vale la pena mencionar. Ademá s, normal mente se da alguna con-
luación de cada prueba, indicando los propós itos para los que podría aplicars eva-
bien, así como lo que el autor considera que son sus ventajas, sus desvent e
al actual?
¡Qué prueba s se han diseñad o que po d nan
' servIr
. para mi propósito y sus características distinti vas. El libro suele contener tambié
ajas
n algún estudio
de los problemas de la aplicación de prueba s en el campO que abarca, aparte
bl ¡Q~é de
el ¡Comonuevas
es
pruebas hay en el ca d
" la prueba A d e 1a que h m~o e mI Interes?
.. ,
e Oldo habla ? . analizar las pruebas específicas.
No es posible hacer una lista de todos los libros que podrían ser útiles
para. que propositos se disen-o'?
l' ., . '1 . r., zpara que' grupos o
zqmen lector; sin embargo, se incluye una breve lista en las referencias bibliog
al
ap lIC,ar a y cuanto cuesta?, ¡quéhabilid da hIZO?·,z'C~anto
' d
se tar a para ráfi-
dI ¡Que han dicho los especialistas en el a es se decesltan para usarla? cas al final ·del capítulo. Los criterios para incluir los títulos cuando existían
la aprueb a A?, ¡cómo la evalúan en campo . ~ las prueba s acerca de varias alternatívas fueron la novedad y la calidad de tratami ento estimad
a;
las que compite? comparaCIOn con las técnicas con además, se ha intentado abarcar un amplio rango de intereses especializados.
Una limitación de un listado de libros de este tipo será evidente si
el ¡Qué materia l básico tenemo s en la ru b se
estadíst icas? ¡cuál es la rel ., p e .aA., ? ' examinan sus fechas de publicación. En la época en que se seleccio
¡cuáles son sus ventajas naron
fI ¡Qué investigaciones se ha~h~~hque eXIste cd~n otras medidas? (1975J, cada uno fue estima do como el mejor y más recient e libro publica
do
ba A? o para estu lar o para usar la prue- en su campO, y aun así varios de ellos ya eran bastante viejos. Cuando
dimos a esto el tiempo que ha transcurrido en la preparación y la publica le aña-
ción
de este libro, es fácil ver que una revisión de los libros de un campo no
A continu ación examinaremos cuáles ser muY confiable en lo que respecta a materiales reCientes. El libro depuede
10$ que contam os para tratar de d son 1os matena. les dispon ibles con. típico proporciona inform ación acerca de las pruebas aceptadas y bien texto
recursos incluyen: respon er a pregun tas de este tipo. Estos esta-
blecidas, pero es probable que los diseños publicitarios recientes o las técnica
que estaban aún en etapa de experimentación no aparezcan. Existe un retrasos
de varios años entre la producción de un instrum ento o plan y el tiempO
al Libros de texto con referenCla
prueba. . a areas
, especiales de aplicac ión de transcu rre en que se le reporte en libros en los que se revisa un área de pruebaque
s.
Otra car.acterística de la mayoría de los libros en los que se investig
bl Los Anuari
mentar ias. os de las medidones menta1es y sus monografías comple- campo, qu~ algunas veces es una ventaja Y otras veces una desventaja, a un
es que
COMPENDIO DE INSTRUMENTOS 157
156 CAP. 5. DÓNDE ENCONTRAR INFORMACIÓN

comercial son pocos. Una lista de los instrumentos .más valiosos aparece al
son selectivos. Deben serlo, pues el autor no puede analizarlo todo sino
que debe seleccionar los reactivos que desea presentar. El autor selec'ciona final de este capítulo.
para su estudio las pruebas que considera más valiosas, y en tanto que su jui-
cio es sólido hace un verdadero servicio al novato en el campo que por tanto
se enfrenta directamente al material más importante y más valioso: sin embar~ MENTAL MEASUREMENTS YEARBOOKS
go, esto significa que el lector no puede esperar que el libro de te~to sea una
fuente que le perm~ta conocer todas las pruebas que haya en el área y com- Probablemente la única fuente más importante para la persona. qu~ ~ece­
pararlas. Para ~na lIsta completa de las pruebas de cualquier tipo particular sita hacer selecciones o planear programas en el campo de la aphca.clOn de
el lector tendra que buscar en otras referencias bibliográficas. ' ruebas sea la serie de los Mental Measurements Yearbooks (Anuanos para
f medición mentall diseñados por Buros (1938, 1941, 1949, 1953, 1959,
:965 19721. Estos anuarios han sido complementados (Buros, 1975) por un
núm~ro de monografías más especializadas .que !rata~ con las p~ebas de las
RECOPILACIÓN O COMPENDIO DE áreas específicas más delimitadas (lectura, mtehgencIa, personalidad, voca-
INSTRUMENTOS ción y materias escolares aislada~I. ,. . '.
En los anuarios aparecen las hstas de una o mas revl~lOn~s francas y cnU-
, . Desde mediados de los sesenta se han producido varias recopilaciones de cas de cada nueva prueba estandarizada que se h~ pubhcado. Un ~umeroso
'j
mstrumentos de medición. El formato de estas recopilaciones varía considera- grupo de revisores han cooperado en la pre~araclOn de est,os volumenes, y
~lemente.~na de otra, per,? en cada una de ellas se intenta hacer disponible la
cada revisor evalúa dos o tres pruebas en un area en.la que ~~ es c?mpe~ente:
mformaclOn acerca de los mstrumentos, tanto los publicados comercialmen- Las pruebas que se considera han tenido más ampl~a dIfuslOn e mte~e~ son
te cO?lo los púI:>licados no comercialmente que se han diseñado para apreciar analizadas por dos revisores y algunas vece~ por mas de dos: Las reVISIones
l?s dIversos ~tnbutos o constructos del individuo. En algunas de las recopila- son bastante completas y se señalan las ventajas y las desventaJ.as ~e la prueba,
CIOnes, por ejemplo Measures 01 Social Psychological Attitudes de Robin- las cuales se comparan con otras dentro del mismo campo Yse lOdlcan los pro-
son y ~haver (1973), se presentan instrumentos reales, así como u~ análisis de pósitos para los que el r~v~s,or considera 9.ue. s~rían útlle~. 'por supue~to, una
los mIsmos y una exposición general del constructo calificado por dicho ins- revisión representa la opmlOn de un solo mdIvIduo especIhco ~ debena leerse
truI?ento. En otras recopilaciones, como en el caso de Measures lor Psycho- con el reconocimiento de la posibilidad de fallas humanas; sm embargo, el
lC?gl~al A~sessment, de Chun, Cobb y French (19751, sólo se presenta una
revisor es un extraño desinteresado que probablemente no gane nada con
bIbhografla de todas las medidas de cierto constructo. el éxito o con el fracaso de esa prueba. . ., .
El primer valor que adquieren estas recopilaciones es que cada una reúne Además de la revisión critica de las pruebas, los anuanos tambIen mclu-
en u.n s.olo libro ya sea todos los instrumentos que se han empleado para yen los puntos factuales ac~rca de cada prueb~ que po.dría necesitar el usu~rio
potencial; puntos como qUIén es ~l autor, .ql:uen el edItor, la fecha de pubhca-
L ~i
,
.:; ,: medIr CIerto constructo, o las referencias bibliográficas exhaustivas de todas
ción el costo el tiempo que reqUIere admmIstrarla, los grados para los que se
las medidas que se han utilizado hasta la fecha de la recopilación. A menudo
¡ ¡'
estas fuentes le ~ern:li~i~án conoc~r l?s. instrum~ntos no publicados que, d~ reco~ienda ..; el número de formas disponibles. Finalmente~ para cada prue-
jl¡, otra manera, sena dIfIcIl que un mdlVlduo pudIera localizar. ba, los anuarios contienen una bibliografía acumula~a de hbros ~ a~tIcul~s
'í:;
La mayor desventaja de todas es~as recopilaciones es que pasan de moda, a que han aparecido y que tratan de esa prueba en partIcular. Tal bIbhograha
menos que se hagan esfuerzos contmuos para mantenerlas actualizadas· sin es bastante extensa y llega al caso de que para una sola prueba tenga 4 580
embargo, si se desea ela~orar una lista completa de los instrumentos q~e se títulos. .
han empleado para aprecIar un constructo particular, se podría combinar una Los anuarios tienen dos características que le añaden v:llor para emplear-
de esta~ recop~aciones con una investigación ERIC (véase pág. 1621 para obte- los. una es una sección acerca de libros y monografías relac~onados con l~s
ner la. lis~a de Instrumentos actualizada. Otra desventaja de algunas de estas . pr~blemas de medición. En esta sec<?i?~ se incluye? en una.hsta todos l~s h-
!eCOpilaclOnes es que no son críticas. Los autores se abocan a dar una lista bros significativos acerca de la medIcIon en ~l peno do cubIerto y ~demas se
mtegrada, comI?let~, de tal manera que se registran los instrumentos buenos, ofrecen extractos de las revisiones de esos hbros que han apareCIdo en las
los malo.s o los In~Iferentes . .I~or fort."na, ~a mayoría de los autores explícita- revistas educativas y psicológicas. La bibliografí~} las revisiones c~~icas dan
me!1te dIcen en la mtroducclOn del lIbro SI han aplicado un criterio selectivo una guía para la publicación en el campo y tamblen.l?ara su ~valua~lOn. Tam·
bién muy valioso es el índice completo y la seCClOn de dIrectono, la cual
o ~I no !o ~an hecho, y el lector sabrá si cada instrumento tiene propiedades
pSIcometncas deseables. . incluye:
A ~ar de ~us limita~~ones, la.s bibliografías y las recopilaciones son fuen- a) Un directorio y un índice de los editores de pruebas y de los libros y las
~es valiosas de. I~!ormacI,?n, partIcularmente para los investigadores y en el
area de la medIClOn de actItudes, donde los instrumentos editados de manera medidas revisados en ese volumen.
158 CAP. 5. DÓNDE ENCONT RAR INFORM ACIÓN 159

b) Un directo rio y un Índice de las publicaciones periód icas ": .VISIO NES DE REVIS TAS DE PRUEBAS
.
..~.
que han ··
incluid o revisiones de pruebas o de libros acerca de pruebas. que afronta r el proble ma de obtene r información de las
el Un Índice de títulos de libros y de pruebas. :" . Todaví a tenemos
. b d 1 último s diseños de pruebas. U na manera de man te-
dI Un índice de nombre s que ocurren en cualquier conexi ón. ú1tin1~s prue a~oYdeela~snoticias más recient es es median ~e la. revisión
el Un índice clasificado de pruebas organi zado por conten ido o portipo. ·netse Infonn . al En diferentes momen tos de su hIstona , cada de. las
. tas pro f eSIOn es. reVIsta
revts . 1'· . 1 e revisiones cntIcas , . de 1as
pruebas. La revI·s -
educativ~ y pSICO oglca mc u(975 fue probab lement e el Tournal 01 Educat io-
Estos índices permiten localiz ar cualqui er prueba o tipo de prueba,locali. talllás útil en este aspecto en 1 Journal 01 Counseling Psychology
zar el origina l completo de cualqu ier revisión de prueba extract ada, y " tambié n
ponerse na! Measur~me~ aunque . s~ones de prueba s que pueden ser de interés para
en contact o con el editor de cualquier prueba . incluye ocaSIona ente reV1deberían ser de alguna ayuda para manten
er al
Cuando surge una pregun ta acerca de una prueba o de un tipo de prueba los ase:sores. Estas fuente~ nte en lo ue respecta a las prueba s educa~i
los Mental Measu rement s Yearbooks son los volúmenes que uno consulta lector llltonna~o y ~f<:ortnl·Ve as durant~el año de su publica ción o en el
vas y
d~ tiempo
manera inmedi ata. Todo individ uo u oficina que deba contes tar pregunt psicolÓgicas mas s~~! lca
frecuentes acerca de las prueba s o de la aplicac ión de pruebas debe contar as cercano a su apanclOn.
dichos anuario s. Con
Otras dos publicaciones comple mentar ias amplían la utilida d de
anuarios. Una es la conocid a como Tests in Print (Pruebas en imprentlos EDITORES DE PRUE BAS
(1961,19741, en la que se elabora la lista de todas las pruebas comerc ialmenta)
disponibles que se usan en idioma inglés. La última edición (19741 e La informació~
más actual en lo d!~;o~;:e~~ocd:l:~:rie:~':de~~::~
también obtenerse de los edItores d~ pruebas, y~ d ; editores ara dar aquí una
actualiza la inform ación bibliográfica y de otros tipos para cada prueba. lista de
otra publ~cación es una serie de monografías que reúnen la inform La mediante sus catálo~osb EXIsten :f~tt::c~pilar la inf~rmación de todos
ación de ellos, por lo que ~ena astant~ 1 IC
I ellos;
tales áreas de especialización, como son las prueba s de person alidad ublica extensi vament e en el campo
19751, las prueba s de lectura (1968, 19751, las prueba s de intelige ncia
(1970, sin embarg o, el numerol~e ~dldtor~ ~:spde los editores más importa
(19751, de prueba s es basta~te .lmIta o. a ntes se
las pruebas vocacionales (1975 I y las prueba s en cinco áreas de materia
colares (l975). Dentro de este campo, cada prueba es comple ta y hace
s es- mencion~n .en ~l apedd{ced~res. d prueba s como fuente totalmente sesgad.a
obvia Las hmItacIOnes e e ltor e 1 estricciones de sus propias pubh-
la necesidad de verificar por medio de series comple tas de los anuario de inform ación acerca de los val?res k a:~s de Marco Antoni o, podríam
tiene una inform ación comple ta acerca de una prueba específica o de s si se caciones son, por supues to, O~Vlas. os
pruebas r b no a enterra rlas; sin embarg o,
de un tipo determ inado.
Nonna lmente , una nueva prueba se revisa en el primer anuario decir que el editor llega fuprecld~ ~~f!~:ct;~ más que de evaluació~
de las
aparece despué s de que fue publica do y las revisio nes también pueden que en lo que respecta a ser ,eüt~ el capítul o 3 hemos conside rado que
apare- pruebas, puede ser muy .ut . n puede
cer en volúme nes subsecuentes. Las limitaciones de espacio no permite ueva or sí mismo a la luz de la infor-
nrevi- hacer el lector para apre<:la~unda pruera nruebaPmisma y de otras fuentes
sar el anuario de 1938 de todas las pruebas más antiguas que se conside mación obtenib le del dIsena or de a p .

merecían revisar se y las revisiones de algunas de estas primeras prueba
s apare-
': .:
cieron en volúme nes ulteriores.
.'. Aun el conjun to de volúme nes tomado s todos juntos no abarcan
de
PRUE BA Y MAN UAL .
manera exhaus tiva todas las prueba s de un tipo dado; sin embarg d . t mplear una prueba en partIcu -
reúnen los materia les de las series completas, probablemente se encontr
o, si se Si ell~ctor está c~nsidera~~b~:~~~ ; :1 manual adjunto que el editor
apreciaciones para cualquier prueba que el lector desee usar y que se arán lar, tendna que exarnm~ la p 1 ditor indica el precio por el que se
editó en pueden
obtener clert~s especunenes d e ~ p ·ones ara aplicar la y la forma COI~­
el tiempo en que se completó la planeación para el último anuari o. ha prepar. ado. Cada <;atalogo de da rueba. El conjun to de especímenes
Losdo~
primeros anuari os incluyen las pruebas publica das hasta 1939, el de
abarca el period o desde 1940 hasta 1947; el cuarto trata con los materia
tercero tiene una ~opIa de la prueba, laslmstru~;iales ¿omple mentar ios disponi cah-
les ficarla aSI como parte d e to d os os ma . bles al .
desde 1948 hasta 1951; el quinto abarca hasta 1958¡ el sexto hasta 1964, .' d 1 b 1
ra ayudarl
séptimo hasta 1971. Para cualqu iera de los campo s abarcados por las ye! usuano e a prue a pa . e
1
a mterpr etar a. .
rios incluid os en un con¡un d
grafías específicas, una estrategia más eficaz es usar esa monog rafía,
mono- L~ cantida d ~e matenaá~s comPt ::a-fec tor puede esperar to e
que el edi.t?r
, ya que especlm enes v~na de un e lt?r a o ue ie propor cionará n toda la informa
reúne en un solo lugar el materi al que aparece en los siete anuari os. clOn
r·.': l
incluya un conjunto de malte~t ~. ~ ue desee de acuerd o con la
¡
que necesit e para tomar a eClSlon q adecua -
·1
,
I Se encuentr an listadas en la obra Mental Measure ments Yearboo
ks.

: ., .

.-;,.\-:.-.
160 CAP. 5. DÓNDE ENCONTRAR INFORMACIÓN
RESÚMENES E íNDICES 161
ción de la prueba a sus propósitos. El lector debe ser bastante escéptico
emplear cualquier prueba cuya información complementaria está incomple_ . .,',. . i',' tres años una revisión de pruebas y mediciones-en !a revista R;eview of
ta; sin embargo, debe reconocerse que cuando una prueba se ha utilizado , .~da . al Research. sin embargo, desde 1970, los artlculos pubhcados en
EducatlOn, , . l' d Al d II
ampliamente y se ha elaborado una gran cantidad de investigación al respecto ' . revista se han relacionado con temas m3:s ~~pecla lZ~ ?s.
.... o'. gunos e e os
los resultados de la investigación pueden, cuando mucho, ser muestreados ~ esa acerca de ciertas cuestiones de medlclon espeCIalizadas. . . ,.
resumidos en el manual adjunto a la prueba. . tratan d 1950 la Annnal Review of Psychology ha hecho revlSlone~ cntl-
Para obtener conjuntos de especímenes deuna prueba a partir del editor : cas Al Des le ha' aportado algu' na bibliografía en temas selectos de pSIcolo-
normalmente se debe presentar cierto tipo de credenciales, para las que bast~ L " , anua es y ., d' 'd l 11
nos capítulos, que reCIben el tItulo de DI erenClas In 1":1 ua es y
lI'f"
.
una carta con membrete oficial de la oficina de la escuela, del departamento iJ gta.
JlTeona ,guY t'cnica
e de la evaluación"
. . sugieren
', . ser fuentes de matenal de POSI-
de psicología o de cualquier institución en la que se emplee la prueba. Una 1 interés para el exammador pSlcologIco. ., _ .
nota de la universidad donde estudia el lector puede cumplir esta función. Las . b e Una bibliografía anotada cerca de la lectura apareclO en anos recle~tes en
limitaciones que el editor impone acerca de la distribución de sus materiales elTourna1 of Educational Research que trata de pruebas de lectura, aSI como
dependen de la naturaleza misma de los materiales. A menudo las institucio_ d otros problemas de la lectura. . '1 . d
nes educativas se rehúsan a distribuir pruebas para las cuales se requieren e Una fuente adicional de revistas que pue~e ser de .m~eres a usu~no e
habilidades especiales que califiquen al lector para poder usar esos materiales. b que trata especialmente con la valIdez predi~tlva de las dIfere~-
Si el lector desea examinar varias pruebas diferentes sin comprar un conjunto prue as:as es una sección denominada HSección de estudIOS acerca de la vah-
de especímenes de cada una, puede encontrar un archivo de pruebas en la des ~~~e aparece en números alternados de l.a Educational and PfYcho1o-
bibliotec~ o en el departamento de consulta de su universidad. ::aí Measurement. Una sección similar tambIén aparece para I~n numero.de
Un examen detallado de la prueba-misma permitirá al lector juzgar el con- g. an-os en Personnel pVI
vanos ovcho10gy bajo el encabezado de IntercambIos
. n
tenido de una prueba y la forma de los ejercicios de la prueba que corres- de la información acerca de la valIdez .
pondan a sus objetivos y a las funciones que desee medir. Los materiales
adjuntos a los que hemos llamado manual de prueba son una parte importan-
te de cualquier prueba y varían enormemente en calidad y alcance de una RESÚMENES E ÍNDICES
prueba a otra. En algunas de las mejores pruebas actuales este material adjun-
to se convierte casi en un libro, pues proporciona mucha infoÍmación impor- Finalmente, el estudiante serio querrá saber al~o acerca de las fue~tes bi:-
tante para usar e interpretar la prueba. En el capítulo 3 (págs. 107-109) indica- bliográficas básicas, las cuales son: lo~ Psychologlcal ~bstract~ (Resumenes
mos los tipos de información que un usuario de pruebas tiene de~echo a en psicología), el Educationa1 Index (Indice de educaclOn) y el sl~tema ERIe.
esperar en el manual de pruebas_ Un manual que proporcione esta informa- Los Psycho10gical Abstracts hacen una lista y nc;m~almente In~luy~~ un
ción completa se convierte en una fuente muy significativa de información resumen de todas las publicaciones actuales, tanto tecmcas ~omo cle,:lt1fICaS,
acerca de la prueba. del campo de la psicología, incluyendo, por supuesto, aquellas.relaclOnadds
Los manuales difieren no sólo en la integración del material, sino también con las pruebas y la evaluación psicológicas. Algunas de las seccIOnes de cad.a
en la imparcialidad y lo completo del mismo. Probablemente no haya un solo número en las que los artículos se relacionan con las pruebas y con la me 1-
manual de prueba que esté libre de un elemento promocional; sin embargo, ción son las siguientes:
algunas veces el manual se convierte, en gran medida, en un plan promocio-
nal enfocado a incrementar las ventas de la prueba. El lector casi siempre debe
estar alerta en cuanto a este aspecto del manual y procurar descontar apropia- a) Psychometrics and Statisiics (psicometría y ~~tadística). .
damente todos los reclamos hechos para esa prueba. Algunas veces aparece b) Test Construction and Validation (construcclOn de pruebas y valida-
una relación inversa entre la magnitud de las reclamaciones que se hacen para ción). ( . l '
esta prueba y la evidencia presentada en el manual en la que están basadas. El el Educational Psychology - Counseling and Measurement pSlCO ogIa
lector haría bie{l en no desviar su atención y mantenerla enfocada en la evi- educativa - asesoría y medición).
dencia presentada en el manual, considerar tales reclamaciones a la luz de esa dI Applied Psychology - Occ~pati?nal Guid~nce and !,ersonnel Se~~c­
l .!
.¡ ~ evidencia y ser extremadamente suspicaz acerca de una prueba cuyo manual tion and Training (psicologIa aplIcada - gula ocupacIOnal y selecclOn
.. : ~ . y entrenamiento de personal.
. ·f ".
. ¡¡:
hace semejantes proclamaciones de una prueba que presenta tan pocos'datos.
i :. i ;
j
..
. {;. ~
·r"..: REVISIÓN DE ARTÍCULOS EN REVISTAS . Sin embargo, el lector debe ver primero el encabezado .de materias en el
, Índice de materias semianual, a fIn de encontrar el mat~nal en ~l, tema en
",
A veces e~ útil referirse a los resúmenes de los artículos que incluyen el que esté interesado. Recientemente, es posible obtener m~orm~cI~m dd lo¡
desarrollo reCIente de las pruebas y su aplicación. De 1932 a 1968 aparece Psychologica1 Abstracta por me~io de la ~om.putadora e Impnmi- to . o :
material con Índices bajo un conjunto de termInos clave, pero la e lcaCla e
162
r ..
CAP. 5. DÓNDE ENCONTRAR INFORMACiÓN
( UDdoS 1 Apreciación de las fuentes de información para las pruebas y su aplicación
este procedimiento dependerá de la aplicabilidad de una o dos frases clave del
problema en el que esté interesado.
- Por descubrir, en cualquier campo

El Education Index abarca un rango considerablemente más amplio Qué


de material, dado que trata con toda el área completa de educación e incluye investigación
materiales conocidos y profesionales, así como aquéllos de una naturale- Lo que hay
za más técnica y científica. Sólo da referencia, pero no proporciona ninguna los Qué respecto 01
información acerca de la naturaleza y el contenido de ningún tema. El mate- Qué especialistas evidencia problema
rial está diseñado de manera temática y si se buscan cuestiones en temas tales Qué pruebas Cómo piensan se tiene Ye,,{o
como pruebas de habilidad, medidas educativas, pruebas mentales y pruebas pruebas nuevas es lo de la de la aplicación
de personalidad, se encontrará la mayoría de los materiales que se relacionan Fuentes existe" existen pruebo X prueba X prueba X de pruebo
con la medición en educación.

':'
.' .
Una de las fuentes especialmente útil para los nuevos materiales y que no
aparece en las revistas ni en los libros es la Education Resources Information
Center (ERIC) -Centro de información de los recursos educativos-, estable-
Textos acerco de
óreas especiales de
· · ? · ·
medición
cida bajo los auspicios del National Institute of Education (Instituto nacional
'11
¡
para la educación'. Cada centro ERIC recibe materiales de Índices y de resú-
menes en un campo especializado de la investigación educativa. Desde 1975
aparece un ERIC para pruebas y mediciones en el Educational Testing Service
Recopilaciones de
instrumentos
· ? · · ·
'd
:: j
(Servicio de pruebas educativas' en Princeton, Nueva Jersey. Esta organiza-
ción no sólo alimenta los resúmenes de materiales específicos en el sistema Mental Measurements .. ? · .. · ..
ERIC, sino que también realiza el ensamble y la revisión de la bibliografía Yearbooks
;!H
,rf1 1
ir
acerca de los temas de medición seleccionados. Los números mensuales y
anuales del Research in Education proporcionan un índice y un resumen de Textos en proce~j) .. · ·
los materiales actuales. Este índice puede buscarse personalmente o con algu- de publicación .
nas frases seleccionadas que sean claves para el IItesoro l1 adjunto a un índice
ERIC, y tener este cuerpo de entradas que buscará la computadora. Revisiones en · · .
revistós
profesionales
RESUMEN actuales

Al principio de este capítulo se sugirieron varias preguntas de las que el (atólogos de editores · .. ·
usuario de las pruebas quisiera obtener respuesta. Las fuentes de información
importantes acerca de las pruebas y de su evaluación ya se han estudiado. Machotes y
.. .. ·
Como resumen, trataremos de relacionar las fuentes y los recursos a las pre- manuales de
guntas, para 10 cual hemos elaborado el cuadro 5.1, en cuya parte superior se pruebas
listan las diversas preguntas que podrían formularse acerca de una prueba, del
tipo de prueba y de los problemas de su aplicación. A un lado se listan las Artículos de revisión ? ? ? ..
fuentes de información más importantes acerca del material a los que se refi- en Review 01 Educ.
rió este capítulo. En cada celdilla hay un símbolo que representa la medida en Reseorch, etc.
que la fuente de información puede ayudar al lector a contestar su pregunta.
El símbolo ** se usa para designar una de las fuentes que probablemente sea la
más útil y a la que deberíamos recurrir en primer lugar. Las fuentes marcadas
Resúmenes de · · ..
psKoIogla ·
con un asterisco (*' son las que también podrían contribuir a contestar la pre-
gunta. Las fuentes marcadas con un signo? son las que podrían ayudar a cap-
tar alguna información útil. Cuando no hay ningún símbolo, es probable que
esta fuente no sea útil en esta conexión. El estudio crítico de este cuadro, con
fndke educativo · ·
los análisis de las razones para las diversas entradas en él debería dejar al lec- • Üt'
tor bien preparado para obtener la información que necesite, con el fin de •• Muy út'
? Posiblemente útil

b) . ... .. . . :: .... :. .. .... ----~--~----~-~


. , . . ........ ,.. . .. _1.·... .. · .. . .. . . . . .. ' ' . ' .'¡ , ., ;. ,", .:~" ' :: . . ' '.: ~" " . .. :-" . '." .. ,.'~.,~ .. , '.:' ~' . ':';:".¡ ·.r.·:
164 CAP. 5. DÓNDE ENCONTRAR INFORM ACIÓN 165

selecc:i«;mar una prueba o como anteced ente para un problem LECTURAS ADIC IONA LES
a de pruebas i
especIfI co.
Beatty, W. H. (dir." Improving educational assessm ent and an invento
ry
res 01 affectiv e behavior, National Educati on Association, Association of measu-
for Super-
PREG UNTA S Y EJERCICIOS vision and Curriculum Deve1opment, Washin gton, D. C., 1969.
Bojean, Ch. M., Hill, R. J. YMcLemore, S. D., So~io.1ogica1 measu!e ments:
tory 01 scales and indices , Chandler pubhshm g, San FranCISCO, 1967. An inven-
1. Medi.ante el e?Ipleo de las fu~ntes de información indicada s en el
texto, elabórese
u~a bsta lo mas comple ta posI~I~ de las p~ebas estan~arizadas Cattell, R. B. Y Warburton, F. W., Objective persona lity and motivat
actualm ente dispo-
mbles para_un grado y un propOSItO específIcos (es deCIr, pruebas para el theoreti cal introdu ction and practical compen dium, Universityion tests: A
primer gra- of Illinois
do de espan?l, pruebas de rapIdez para la lectura, pruebas acerca de la historia Press, Urbana , Ill., 1967.
Estados Umdos para el grado duodéci mo, etc. l. de los .
Comrey, A. L., Backer, T. E. Y Claser, E. M., A sourceb 90kfor mental
health measu-
2. Det,ermí~ese qué p~ebas de investigación. están disponibles en la bibliogr res, Human Interaction Research Institute , Los Angeles, 1973.
algun atn~uto que mt.e~ese al lector (por ejemplo, autocon cepto, actitude afía para Chun, K., Cobbs, S. y French, J. R. P. Jr., Measur es for psychological
assessment: A
s hacia la guide to 3000 original sources and their application, Institute
gu~~ra, estIlo COgnOSCItIVO, etc.I, con base en las recopilaciones for Social
y las fuentes biblio-
grahcas a las que nos referimos en este capítulo. Research, University of Michigan, Ano Arbor, Mich., 1975.
3. Med~ante el uso de los Mental Measur ements Yearbooks, busque lo Johnson, O. G. y Bommarito, J. W O,Tests and measur ements in child
develop ment:
res pIensan acerca de una prueba particul ar en la que el lector estéque los reviso- A handbo ok, Jossey-Bass, San Francisco, 1971.
4. Con b.ase en el empleo del séptimo M.ental Measur ements Yearboo iIiteresado Lake, D. G., Miles, M. By Earle, R. B. Jr. (dirs.), Measuring human behavior
k, señale lo q~e for the assessment of social function ing, Teachers College Press, Nueva: Tools
han dI~ho o han comenta do los reVIsores acerca de uno de los tímlos York,
siguientes
que le mteresen: 1973.
Miller, D. C ., Handbook of research design and social measur ements, .
David McKay,
al Allen, R. M. Y Allen, S. P., Intellec tual evaluat íon of the mentall Nueva York, 1970.
y retarded Robinson, J. Po, Athanasion, R. Y Head, K. B., Measures of occupat
chlld: A handbo ok. ional
bl Barrett, R. S., Performance rating. and occupat ional characteristics, Univers ity of Michigan, Institute attitude s
for Social
cl Bower, E. M., Early identifi cation of emotion ally handicapped Research, Survey Research Center, Ann Arbor, Mich., 1969.
childre n in Robinson, J. Po, Rusk, J. C. y Head, K. B., Measur es of poli tic al attitude
school. s, Univers
dI Catte~l, R. B. Y Butcher, H. J., The prediction of achieve ment and creativi ty. of Michiga n, Institute for Social Research, Center for Political Studies, ity
Ann
el Denms, W., Group values through children's drawings Arbor, Mich, 1968.
f l Fle~shman, E. A, The structur e and measur ement of physical fitness. Robinson, J. P. y Shaver, P. R., Meassures of social psychological attitude
s, Univer-
gl CUlldford, J. P., The nature of human intellige nce. sity of Michigan, Institut e for Social Research, Survey Research Center,
Ann
Arbor, Mich., 1973.
5. ¿~ q.ué fu~n~es re~rriría ~Ile~tor si tratar~ de contestar a cada una Rosen, P. (dir.l, Test collecti on bulletin : A quarter ly digest 01 inforInl
ltion on tests,
sIguIentes., za cual acudma pnmero?, ¿que esperaría encontr ar en cadade las preguntas
,. i una de ellas! Educational Testing Service, Princeton, N. J.
Shaw, M. E. Y Wright, J. M., Scales for the measur ement of attitude s,
Mt:Craw-Hill,
al ¿Qu~ prueba usaría para estudiar el progreso de dos Nueva York, 1967.
clases de. alumno s que Wylie, R. c., The self-concept: A review 01 method ologica l conside rations
;! empIezan a estudiar francés? and mea-
bl ¿Qué tipos de normas hay disponibles para la prueba del aprovec suring instrum ents, vol. 1, University of Nebraska Press, Lincoln, Neb.,
Stanford? hamiento 1974.
..
cl ¡Tiene la. pru~ba de Rorschach algún valor como predicto r del éxito
en la umversIdad? académi co .
dI ¿Se ha publicado una nueva revisión de la escala Wechsl er de intelige
adultos? ncia para
el ¡ 9ué tipos de pruebas de inteligencia se han diseñado para aplicarla
~t ;
CIegas? s a personas
;1; -1
" f I ¡Cuáles son I.as diferencias significativas entre las pruebas metropo
litanas de
! - ~pro,vechamlento y las pruebas comprensivas para las
habilidades básicas?
gl zCu~nt.o cuesta la prueba de habilid ad mental Otis-Le nnon 1
h) ¿Que pI~nsan los espec~alistas en pruebas acerca del inventa rio de preferen .
ocupaclOnales de Bramard? cias

6. Léanbe d~s o t~ cat~logos de ,editores de pruebas y compár ense los


prue ~s . el IDlsmo tIpo. ¿Que tan adecuad a es la informa ción que anuncio s de las
proveen 1 • ué
tan objetiva es la presenta ción de los valores de la prueba y de sus limitaci
,.
;
one~l zq
DECISIONES INSTRUCClONAlES CONTINUAS 16 7

pruebas para guiar las decisiones instruccionales. Siun alumno está estudian-
. do a un ritmo individual un tema o una habilidad particular, se necesita algún
procedimiento que proporcione información acerca de qué tanto ha domina-
do ese tema o esa habilidad, de tal manera que el maestro (o el estudiante' pue-
da decidir si necesita estudiarlo aún más o si puede avanzar de manera ven-
tajosa hacia la unidad siguientes. Esta clase de irIformación es especialmente
adecuada para las materias que son, hasta cierto grado, secuenciales¡ es decir,
6 el progreso en el tema B dependerá de la adecuada comprensión del tema A.
Por supuesto, las matemáticas constituyen el ejemplo primordial de este tipo
de materias, por lo que muchas ilustraciones de pruebas instruccionales de
este tipo son tomadas del campo de las matemáticas.
Una prueba que mida la competencia en una habilidad o en un tema espe-
Pruebas de aprovechamiento cial es, evidentemente, una prueba muy específica o muy enfocada; trata con
el contenido del tema específico y el usuario suele fijar algún criterio, por lo
general bastante arbitrario, com? representativo del grado de ~decuació~ o d.e
escolar y decisiones competencia. Esta clase de propIedades han hecho que se aphquen los termI-
nos de pruebas referidas al criterio o pruebas referidas al contenido para las
educativas pruebas de este tipo. Tales pruebas se han diseñado para presentar una mues-
tra representativa de tareas de un dominio definido estrechament~. Dado que
el dominio es relativamente estrecho, los reactivos de la prueba tIenden a ser
redundantes y es razonable esperar que una persona sea capaz de contestar
.Para muchos tipos de decisiones o para las personas que se hallan dentro o todos o casi todos los reactivos o que no esté desempeñándose mejor que si lo
~uera de .l~s escuelas, las pruebas de aprovechamiento proporcionan una hubiera hecho con un nivel de azar.
mf<?~acIOn adec~ada. En este capítulo identificaremos diferentes tipos de Como ejemplo, en los párrafos siguientes mostramos dos pruebas referi-
de.clsIOnes y est':ldIarem?S cada u~a d; ~llas para cada medida de aprovecha- das al criterio hechas por un maestro. La primera es una prueba para com-
illlento que pudIera dar mformacIOn utIl para guiar esa decisión Al respecto probar si los estudiantes de quinto grado poseen el concepto de número pri-
~odremos co~parar las pruebas hechas por los maestros con aqu~llas que h~ mo.! La segunda es una prueba del uso de mayúsculas con los nombres
sIdo estandanzadas; pruebas referidas al criterio con pruebas referidas a la propios, diseñada para identificar a los estudiantes que tengan problemas
norma¡ .pruebas de diagnóstico con pruebas de sondeo, y pruebas orienta- con esta clase de habilidad.
das haCIa la es.cuela con pruebas orientadas hacia el empleo. Cada una de
estas pruebas tIene característi~~s distintivas y desempeña su función propia
en el panorama total de las deCISIOnes académicas, vocacionales y personales. Prueba de números primos
Instrucciones: ¿Sabes lo que es un número primor Fíjate en los números que se
DECISIONES INSTRUCCIONALES CONTINUAS muestran a continuación seis de los cuales son números primos. Ve en cada uno de
ellos si es un número pri:Uo. Si lo es, dibuja un·círculo alrededor de él, y si no, déjalo
. Un pape.! .muy importante de las evaluaciones del aprovech<tmiento es sin marca.
gUIar las decIsIO~e~ que se toman día con día en el salón de clases donde el 31 47 143
maestro debe deCIdIr qué enseñar, qué se tiene que estudiar o qué d~be practi- 33 49 293
ca! el alumno X o toda su clase. La prueba de ortografía semanal, que deter- 35 51 415
illlna las palabras qu; d.ebe~ revisarse -y que tal vez tengan que escribirse 38 59 763
1 :: i ' :; ~ 25 ve~es-, es una pr~ctIca Importante y tradicional del salón de clase. Las 41 97 942
i pruebltas en ortografIa, en gramática o en aritmética han sido preparadas y
empleadas por los maestr~s. para guiar !as decisiones acerca de la lección de Prueba del uso de mayúsculas
manana.o las tareas especlfi(;~s. para JaIme y para Luisa.
. . ~arcI~mente, como ~n sub~po del interés renovado por la instrucción Lee:: d párrafo siguiente::. La puntuación es la correcta y las p;uabras q~e empiezan
¡ :

l~d1Vlduabzada, que ha SIdo facIhta~a por el diseño de los materiales instruc- una oración tienen mayúscula, pero no se les ha puesto la mayuscula a nmguna otra
cIOnales programa.dos y por la. ~isp<??ibilidad de computadoras para manejar ! Un número primo es aquel que no puede dividirse con exactitud, excepto entre sí mismo o
algunos de los regIstros de cahflcacIon, ha habido un interés creciente en las la unidad. Algunos ejemplos son: 11,13 017.

166

,::. ....
DECISIONES INSTRUCClONALES CONTINUAS 169
168 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR

palabra, algunas de las cuaJes deben llevarla. Dibuja una línea bajo cada palabra que 2, Los ejercicios de la prueb~ ~eberían. estar.libre~ de dificultades irrele-
debería empezar con mayuscula. A . probablemente sena maproplado mclUlr en la prueba de los
v~ntes, SI" os nu'meros como 15017 16541 Y 17013, porque la carga
numeros pnm , 'd"
Vimos a maría ayer. Dijo que había ido a chicago, ilIinois a ver a su tía elena. . al de dl'V1'dl'r estos números entre ca a numero pnmo en turno
computaclOn
Su tía la llevó en coche por la orilla del lago míchigan. Por el camino pasaron . li . d'f' ltades que realmente no con11evan una re1aC10n ., 1 .1
fea a SI os
1mp cana
· 1. 1CU f" 'd 'f' . '
la hab¡'ll'dad básica de de lmr e 1 ent! 1car numeros pnmos. .
enfrente del conrad hilton hotel, donde trabaja josé, su tío. María dijo que había estudIantes tIenen
disfrutado mucho del viaje, pero que estaba contenta de haber regresado a casa d b ' hacerse para cada prueba es: ¿son os otros aspectos d e
1
con sus propios amigos. La segund a que e ena . l ' d 1 no que se evahía que la
la tarea suficientemente SImples para e tIpO e a. u~ d d dI h 'bil' d d
única causa probable de fracaso sea la compet~nC1a ma ecua a e a a 1 a
Las pruebas anteriores son muy cortas: hay 15 números en la primera y del concepto que se desea poner a prueba, . . ' f' .
nueve palabras que deben subrayarse en la segunda. Si se establece un nivel o 3 Las pruebas para 1a toma de decisiones dIanas debenan ser lod su 1C1en-
.. d 1
criterio de 90% de respuestas correctas en cada prueba para considerar una e~te cortas ara que fueran prácticas en su preparaclOn y su uso entro e
competencia adecuada, el examinado puede equivocarse en un reactivo, pero ~~ión de clases ~ero lo suficientemente largas para que. el 3:1umno te~ga poc3:s
errores más frecuentes implican un conocimiento inadecuado del concepto o probabilidades. de lograr una puntuación satisfactona sm tener e conOCI-
la habilidad. Estas pruebas muestran un extremo de la amplitud o de la pano-
rámica para una prueba y están claramente relacionadas con juicios bastante miento requendo.
específicos acerca de lo que ha aprendido un alumno¡ asimismo, muestrean Varias tareas que impliquen las habilidades espe~íficas puede~ perm~r
dominios específicos explícitamente estrechos, los cuales son relativamente sólo dos respuestas alternativas, como en .los dos eJe~plos anterp1~r:~~a s~
fáciles de definir. , . pues puede factonzarse¡ aSImIsmo, una ..
En muchas pruebas escolares, el dominio representado por una unidad de nU~bero es mpnamyu?scoulnaoo' no En el caso de pruebas de alguna longitud especlfI-
instrucción está mucho más revuelto y, en consecuencia, el almacén de pro- escn e con ' . d ' tar qué po-
cada y del número de respuestas alternatIvas, po namos pre~n
blemas admisibles o de preguntas está definido mucho menos explícita y sibilidad hay de que el alumno obtenga 80 o 90% de los refctlv~s ~fectos
claramente. Por ejemplo, considérese la unidad acerca de la ley de los dere- or medio de adivinación, Los resultados se muestran en a ta . a . .
chos. Podríamos probar la habilidad de un individuo para identificar o para P En la figura 6.1 se muestra el porcentaje que podría esperarse eI?- una¡de-
recordar cada uno de los 10 capítulos de la Constitución¡ pero si estuviéramos
interesados en el significado y la aplicación de estos 10 artículos en la América
ba de 10 reactivos para cada puntuación posible en el caso de reactIvOS ~
ciones En la tabla 6.1 y en la figura 6.1 podemos ver cuan o e
°i
contemporánea, ¿qué tan significativamente podríamos definir y muestrear ~s~f:~~~ ~~ desempeño se fija en 80 o 90% de respuestas ~orrectas, un~{rue~a
nuestro dominio? En este ejemplo, la noción de "dominio" se nos escapa de las de 10 reactivos con respuestas de dos opciones por reactIVO es poco a ecua a
manos, ya que podemos cuestionar si aun los jueces de la Suprema Corte de para diferenciar entre los alumnos que adivinan la .respuesta correcta. Y aquí-
Justicia han logrado realmente un dominio completo de dicha habilidad. 110s que realmente saben, pero que con un reactIvo de cuatro opCIOnes a
Cuando es imposible definir con claridad los límites de un dominio, prueba de 10 reactivos puede ser bastante adecuada.
simultáneamente resulta imposible determinar lo que constituye una mues-
tra representativa de ejercicios para evaluar el grado de desempeño de ese
dominio. Diferentes constructores de pruebas pueden producir distintas cla-
ses de ejercicios de prueba. En este punto, el concepto de prueba referida al Tablo 6,l. Porcentaje que expone lo habilidad aparente por medio de la selección al. ozor
contenido con un criterio específico de desempeño que represente el nivel Porcentaje que olconzo el 80% Porcentaje que alconza el 90%
definido de "ejecución" pierde mucho de su significado. Una prueba hecha Opción
Opción Opción Opción Opción Opción
por un maestro puede proporcionar alguna información útil para'guiar deci- Opción Opción quíntuple
siones acerca de la enseñanza ulterior, pero la información no es tan fina ni cuádruple quíntuple doble triple cuádruple
doble triple
está bien enfocada como la de los dos ejemplos anteriores. Hay mucha ambi-
güedad en lo que significa una determinada puntuación en cuanto a lo que un Cinco reactivos 0.1 0.03
estudiante ha aprendido y puede hacer. 4.5 1.5 0.5 3.1 0,4
de pruebo 18.8
¿Qué guías podemos fijar para la construcción de pruebas referidas al 10 reactivos de
criterio? Podemos sugerir tres: ' 5.5 0,3 0.04 0.01 1.1 0.03
prueba
15 reactivos de
l. Los ejercicios de la prueba deberían ser ampliamente representativos 1.8 0.003 0.05
prueba
del dominio que se muestrea. Por tanto, si el dominio es el uso de las ma- 20 reactivos de
yúsculas en los nombres propios, la prueba debería incluir los nombres de las 0.6 0.02
pruebo
ciudades, los ríos, las montañas, etc., así como los nombres de las personas.
170
DECISIONES CONCERNIENTES A lOS ESTUDIANTES 171
demanda competencia para una habilidad completa, sólo puede evaluarse efi-
cazmente en los ejercicios de prueba que implican la habilidad en la que es
probable que el estudiante "menos perfecton cometa equivocaciones. El pro-
o blema de seleccionar los reactivos específicos se convierte particularmente
o
v agudo en las investigaciones a nivel estatal o escolar en los que sólo se pue-
Q)
"U den usar uno o dos ejercicios que representen un área completa de la ha-
CI)
'0 bilidad. . .
~
Q)
Una de las cuestiones que tienden a tratar de manera madecuada los pro-
v
(; ponentes de las pruebas referidas al cri~erio es cómo decidir acerca de un nivel
"'- de criterio apropiado. Cuando las umdades subsecuentes se construyen so-
?i ~ bre el dominio de las unidades anteriores, es posible determinar, por medio de
j,
una investigación que requiere mucho tiempo y cuesta mucho trabajo, qué
T nivel de ejecución en la prueba de la unidad A se requiere para que sea proba-
0.0001
ble (en algún nivel específico de probabilida.dl que ~l alumn<;> alcanc~,al~n
9 10
Puntuación
nivel de criterio en la unidad B dentro del penodo estandar de mstrucclOn¡ sm
(01 embargo la investigación para dar esta información es la excepción, y en la
mayoría 'de los casos los niveles crite~io se .fija.n de manera arbi~~aria. Por
supuesto, sería posible establecer un mvel cnteno de los que l~s mnos d~~e­
rían lograr con base en la experiencia previa, de lo que la mayona de los mnos
24.6
sílogra. Pero ta~ pronto como hagam?s esto, da~~s una inter-?reta~óR.eom­
parativa o refenda a la norma, y se pIerde la nOClon-aeUnñlvel cnteno ab-
o
~ 20 soluto. . . d ..
u
Q)
En el pasado, las minipruebas altamente específic~s para guiar las eCISlO-
"U
Q)
nes instruccionales las producían de modo pnmordIal los maestros para su
'0 propio uso· sin embargo, en los últimos años, una gran variedad de editores
e
Q) de pruebas 'han empezado a producir conjuntos de este tipo de pruebas c?mo
o 10
u

"'-
ayuda al maestro del salón de clases. Estas pruebas ~on de una sola hOJa de
papel con 10 o 20 reactivos. En algunas se usa el ~elatlvamente nov~doso pro-
ceso de imprimir la imagen latente. Se da al exa~mado una crayola lmp~:gna­
da químicamente o una prueba con punto de fIeltro para marcar la opClOn de
0. 1
0. 1 su respuesta. Cuando se ha marcado esta opción, aparece una letra impresa r~
O o F, Ro W) y se da al examinado la retroalimentación inmediata acerca ?e SI
10
Puntuación ha hecho una selección correcta o no. Un conteo de los errores proporcIOna
(b) una puntuación inmediata, sin ningún trabajo ulterior por parte del maestro.
Algunas de las pruebas disponibles de este tipo se mencionan, con una peque-
figuro 6.~. Distribuciones. de los calificaciones de la elección 01 azor en una pruebo con 10
reocttvos. o) Reactivos con cuotro opciones. b) reoctivos con dos opciones. ña descripción, en el Apéndice IV.

Por supuesto, es una sobresimplificación dividir a los estudiantes entre DECISIONES CONCERNIENTES A LOS
los ,que /{ adivina~" y los qu~ sabenll • Aun en un campo tan homogéneo como
11
ESTUDIANTES
sena el de ~~s numero s pnmos, los ejercicios específicos difieren marcada-
mente en dIfIcultad. Por tanto, cuando un estudiante comete uno o dos erro-
res al identificar los números como primos, los errores se acumulan más sobre Las pruebas del salón de clases se necesitan no sólo para informar acerca
51,97,143 Y 293. Dentro del grupo que cometió de uno a dos errores el 56% del nivel de dominio de ciertas habilidades específicas de un alumno o de un
de las respúestas a estos cuatro reactivos estaba equivocado, comparado con el grupo, sino también como un cuadro más general del.~rogreso en una parte
del programa escolar. Cada maestro tiene la respo~sabIhdad de reportar, para
12% de las respuestas en los 1 I reactivos restantes. Entonces, considerar a un
alumno como poseedor de una competencia satisfactoria o no aun en estos la información del estudiante y de sus padres, aSI como para el uso en una
ejercicios tan homogéneos, depende de las tareas que se le pr~sentan. Si se variedad de decisiones dentro de la escuela, qué tan bien progresa cada uno ~e
sus alumnos en la adquisición de una amplIa gama de habilidades, conOCl-

.-,~ : '

. :' , 00.:1' , ''; ~' .. , " ' " . . _ , , .: o: .:.''''o'' ":0 ~.';, o,;:.• ;. :,,;~'t _;~~" :I;<~~\:'o;:'; ~.... ~~~..: ~~.:..¡..:\ ..~....-~o::,.r. ;,:~ ,..;::·.0. ' . .;, ,',
172 CAP. 6. PRUEBAS DE APROVE CHAMIE NTO ESCOLAR EVALUA CIÓN DIAGNÓ STICA 173
mientos y compre nsiones que representan los objetiv os del curso o bl Recono cer las formas visuale s de las letras del alfabeto_ .
mentos similares en el program a de la escuela. En esta evaluación es de seg. .
rmar las formas visuales de las letras y de las combm aclones
impor_ T rans f o
tante d~terminar no sólo lo que ~a domi.nado un estudia nte, sino tambié el d' .
ha podIdo manten er por determ mado tIempo ese desempeño de las n que :' de letras en sus equival entes au ltIVOS. , .
habilida. .
des y los concep tos que represe ntan los objetiv os específicos del curso.
... dI Recono cer los espacios de un texto como los hmItes que separan a las
por · palabras.
este propósito, son necesarios los exámenes de la unidad, del semest el Dar los valores fonéticos apropiados a las 1etras mICla
. . . 1 f' 1 d 1
re y los · es y ma es e a
integrados y comple tos. Debido a que estos exámen es tienen como
función unidad de palabra. .
típica determ inar qué tan bien ha aprendido y retenid o un individ uo fI Analiza r y combinar los elemen tos Vlsua~e . al
rial que se le enseñó en un curso específico o en un programa, normal
el mate· s que constIt uyen una p a-
son preparados mejor y más apropia dament e por el maestro o por
mente bra y darles los valores fonéticos apr<?~lados. .
de maestros que han diseñado y presentado la instruc ción. La planeac
el grupo gl Asignar significado a los patrone s fonetIcoS que constIt uyen las pala-
ión de
este tipo de prueba s de aprovec hamien to, y la escritu ra de los ejercici
ellos, se estudia rán en el capítul o siguiente. Las prueba s de los editore
os para hl ~~~ar significado a la secuencia de palabra s que constit uyen una
s rara oración .
vez son apropia dos para apreciar el grado en el que ha aprendido un estudian i I Recono cer el papel que desempeña la puntuacI<?n ., 1 d 's
· Y e uso e mayu
te lo que se le ha enseñado en un curso específico con un conten ido
y unos culas en la organización de las palabras y las oraCIOnes en el mensaje. -
objetivos determ inados, como serían las pruebas preparadas con sólo
el
tivo final. La relació n de los resulta dos de la prueba para la asignac obje· Éste es un análisis breve y relativa mente superficial de los proceso s qu~
ión del se
curso o los grados se estudiará en el capítulo 15. desarrollan cuando se empieza a leer. Aun así, sugiere n algunas de ~is
. ósticas ue podrían ser de utilidad para compre nder los pro emas prue as .
~~!la tener u~ alumno en particu lar con el desarrollo tempra no de las habih- q.u.e
EVAL UACI ÓN DIAG NÓST ICA PARA TOMA R
dades para la lectura .
DECIS IONE S CORR ECTIV AS 'Tiene el alumno alguna dificult ad para manten er una on.entac. .,
I.~n con-
Las decision es que se relacio nan con la instruc ción correctiva constitu
sist~nte de izquier da a derecha dentro y entre las palabras.?Ladone~tbclOn ?e~­
yen d la ro ia alabra puede poners e a prueba con una hsta e pa a ras Slgm-
un s:ubgrupo de las decisiones instruccionales. Las pruebas de diagnós
admInIstradas con el propósito de ayudar con aquella s decisiones son tico }r~at~as;ya;eaPque se lean de izquierda a derecha o al revés, pares de palabras
simila- tales como:
res a las pruebas referidas al conten ido o al criterio ; una tiende a enfocar
competencias específicas y la otra trata de identifi car las deficiencias las
específi- (En español:
cas. Sin embargo, las pruebas de diagnóstico no están basadas ordinar pat tab sol los
iamente was se
en la instrucción pasada inmedi ata, sino que crecen a partir de los problem saw es
educativos de los niños, tales como una lectura inadecu ada, y con ellas as bad dab Eva
se pre- Ave)
tende compre nder las dimensiones y las raíces de esa dificultad present La evidencia de la dificultad de orienta ción de izquierda a derech atrre
e.
!ti i~~ qu~ una prueba referida al contenido, para que sea útil como prueba las palabras puede aparecer en inversiones de secuenCIa de palabra s en
a ec-
de dIagnOStICo esta debe estar enfocad a de manera específica. Cada prueba tura oral y evaluar se con un ejercicio de lectura oral.
dar eY.idencia acerca de las ventajas y desventajas de una habilidad específi debe . Puede·recono cer el alumno las formas visuale s de las letras del al.fabeto 1
ca y, .
colectIvamente, una batería de prueba s de diagnóstico deberá abarcar la
mayoría Es b~stante simple enseñar a un alumno las letr~s, una por una, y pedlr~e
o todas las habilidades específicas en que se basa una habilidad más general las nombre_ Para una prueba como ésta quiSiéramos estar seguros I},ue
es la llamada lectura , divisiones largas o compos ición escrita. Mientr as , que e~­
y ye~f¡­
que las cluir las letras que se confun den fácilmente, como la b,la d,la p y la q,
pru~bas Ínstruccionales diarias están basadas primord ialment car especialmente si el alumno las mezcla o las confunde, lo que
e en la búsque
decrr, preguntan: ¿cuál es el objetivo siguiente?), las pruebas diagnósticas da (es cidentalmente una forma de inversión de letras.
sena, lll-
basadas en la búsque da de lo que ya pasó (preguntan: ¿cómo se desarrolló están _Puede el ~lumno igualar los sonidos de las letras o d~ las combm. acIOne .
cultad presente?). la difi- s
de l¿tras con las formas visuale s de estas letras? ~l examm ador puede
Los ~imi~nt?s sobre los que debe construirse cualqu ier program a de prue- hacer
notar la letra o las combinaciones de letras y pe~u al alumno q~e ~arq~e
bas .d.e dIagnOStICo se h~cen median te un análisis preciso y comple selección apropia da de un conjun to de alterna tIvas, como la SIguIen su
to de las te. .
h~bIlIdades que se reqmeren al efectua r una tarea comple
ja que se esté estu-
dIando . Por tanto, un alumno que está aprend iendo a leer debe: Estímulo (hablado) Selecció n (impreso)
al ~~ntener una orientación de izquierda a derech a a medida que desco- b-~ dpbg
dIfIca las palabras y las pone juntas en una oración. bl _black (blusa) B pI el bl
tr - tr fly tie try pry
174 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR
EVALUACIÓN DIAGNÓSTICA 175
~e. la mism~ ma~e!a, las pruebas pueden diseñarse ara cad
especIfI~a qu~ ~e Identifica como un contribuidor o un re ~isito a ""I'UI(I:III' Otras pruebas para el diagnóstico de la lectura aparecen en una lista breve
compleja ~abihdad. para la lec,tura. La atingencia y la efi~cia '.ii1[":(~rita en el Apéndice IV.
que constItuye toda una batena dependerá de la manera má '( d ,., Las pruebas de diagnóstico para evaluar el inicio de la lectura han sido
~:hatliJ:d:: ~~álisis de la tadrea compleja y del f~accion:~~~~~ d~ ésta ;j]~nsalDlc~nlte desarrollados, en parte por la importancia de esta habilidad
y porque esta habUidad ha sido analizada con detalle. No hay
mponentes¡ e manera secundana depend ra'd 1 .
para pre~entar estas habilidades componentes· en u~a se' . e .Ul}[t:nln,~ d carlUClaa comparable de pruebas, por ejemplo, para las habilidades de
h rueba
brpJes efi~aces. En el caso de la lectura, un buen ~~m~r¿e:~~~~s
y
an pu lca o b atenas de pruebas de diagnóstic b d I ' " ores
, (caligrafía), debido a que dichas habilidades (que no se refieren a la es-
, . gramaticalmente correcta) no están tan bien identificadas por el análi-
t~re~ ~e l~er y en la identificación de las destreza~ oah;bilide~ os análIsIs de la 'sis y porque es más difícil generar un formato de prueba por medio del cual se
slgmfIcatlv!lS' Como ejemplo, la prueba Gates-McKill d d~s cOI?P?nentes pudieran mostrar las hab~idac;I~ que l~ constit.uyen. . .
la lectura mcluye las subpruebas siguientes: op e wgnostlco para Algunas pruebas de dIagnOStIco estan esenCIalmente refendas al cnterio,
en cuanto que es razonable esperar desempeños perfectos y muy cercanos a la
I Lectura oral' siete ' f d d"f I perfecci?n. Así, pa:a el segundo o tercer grado, cabría esperar que el alumno
. que los ~ea. Las pal!'b::: e:pl:aJa~c~r~p:~~~~::~~¿h:~nt~~~1 ~studiante para promedIO reconOCIera todas las letras del alfabeto, y fracasar en reconocerlas
el estu.d~ante cometa errores y muestre sus habilid d L p. ru~ad~s 'p~ra que sería indicativo de la deficiencia en una habilidad básica. Otras pruebas de
lo sufiCIentemente complicados para des f
escuelas elementales.
eS' os pasajes, mas dlftciles son'
a lar a os a1umnos mas capaces de las
i diagnóstico evalúan las habilidades que pudiefan existir en un rango conside-
rable de niveles. ASÍ, las habilidades para decir el vocabulario o para reconocer
2. faa~:::d::a~:en~~~i~:~~J~n;á~ee~;~:~d~ ~~b~f:~ul~~f~ creclientel se exponen a :
palabras son algunas de las que varían ampliamente en grado entre los alum-
noS de la escuela elemental (primaria); por ello, casi no tiene sentido pre-
3. Presentación de 1b . l' . d ' en I Icar a pa abra. guntamos si algunos alumnos han adquirido el l/dominio" de los componen-
cultad y compleji~:dac;::i:~~e:~lt:Xa~~~~Po: el e~aminado lc:e palabras de difi. , " tes de la lectura. La pregunta que sería razonable formular aquí es si el alumno
dos de lectura usados por el ex~mihado. or mantIene un regIstro de los méto- "
se está desempeñando como cabría esperar de una persona de su nivel en
4. Frases; presentación instantánea' el exa . d d b 1 f
palabras después de 1/2 segundo d' e e ~~ o e e eer rases de dos a cuatro cuanto a edad, grado escolar o madurez intelectual. Desde luego, lo que
5 C " XpOSlClOn. podríamos esperar queda establecido por lo que los otros niños sí hacen, por
. onOClmlento de las partes de la palabra:
lo cual, para estas pruebas, debemos considerar una interpretación normati-
va. No obstante que las normas suelen estar basadas en datos limitados, por lo
5.1. Reconocer y combinar las partes c d 1 general están disponibles para las pruebas de diagnóstico publicadas.
una lista de palabras sin sentido q~::S~:~ h:c~a~a~~b:oan: I~dloexadminaldob lee En el campo educativo existe una variedad bastante extensa de pruebas
comunes. s e pa a ras
que llevan el nombre de diagnósticas o que son promovidas por sus potencia-
5.2. fab~t~ sonido de las letras: el examinado da los sonidos de las letras del al- les diagnósticos. En un sentido, cualquier prueba que proporcione más de una
5.3. Nombrar letras mayúsculas. sola puntuación puede reclamar ser considerada como una prueba diagnós-
5.4. Nombrar letras minúsculas. tica. Cuando el lector se encuentre con este tipo de prueba, deberá formular
dos tipos de preguntas, a saber:
6. Reconocimiento de fonuas visuales de sonidos.
1. Estadísticamente, ¿qué tan distinguibles son las diversas puntuaciones
que arroja una prueba? Si tenemos en cuenta la falta de con fiabilidad de cada
6.1. ~~l~~~~:d~~:~~~~~~~~:xp':~t:a=tidfica la forma escrita de las palabras puntuación ¿miden realmente algo distinto?; por ejemplo, en la prueba Stan-
6 2 Letr '" 1 1 a oro lord de diagnóstico para la lectura, una prueba titulada Sonidos iniciales y
P;¡~b~~~;~Oe;~:C:d~!~~d~ i::=':d~/orma escrita de la primera letra de
. . la finales 'm uestran una correlación de 0.81 con una prueba denominada com-
6.3. ~:t;~~f~l:~:~~~~~ado identifica la última letra de la palabra pronuncia- binaciones. No obstante que cada prueba es bastante confiable, ambas pare-
cen medir la misma habilidad, de tal manera que habría muy pocos casos en
6.4. ;'::~:¡d~.examinado identifica la vocal empleada en la mitad de'una palabra que se podría garantizar que un alumno se ha desempeñado mejor en una de
estas pruebas que en la otra.
2. ¿Qué tan claramente corresponden las subpruebas alas habilidades
7. Combinacion auditiva: el examinado pronuncia u al b enseñables, de manera que la deficiencia de una prueba permitiera tomar
ha dado en partes, por ejemplo, ch-ile. Ademá d na p a qu~ <:1 examinador le
p~ebas complementarias: de ortografía' voC:b ~ e~tas proe as bas~~as, hay cuatro
b acciones para dar una solución? Si un niño que tiene dificultades con una uni-
, dISCriminación auditiva. ' u ano oralI separaClOn de sílabas y dad de matemáticas acerca de la factorización fracasa rotundamente en una
prueba de los números primos, hemos identificado una fuente probable de su

. ~,. '-, \ , ' :' ',' ' : ~ '¡', '. ~ :: .':" . '''>'f)< . "'.\ '. ,~< ". "'~ - l.' ',-,: ..:,..:.....',~: ...." ... '.t . • . . ' :
. :,' ~~ :' , .' :.'; ,'o ~ :; ; . . :.: .... -." ..,. .:> . . , ~.:.
176 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR DECISIONES DE COLOCACIÓN 177
dificultad con la unida~ de factorización y localizado un concepto clave que que se inicia un programa de instrucción individualizada o que un estudiante
falta y que pued<: :nse?arse de manera directa. Por contraste, si un alumno transferido debe ser acomodado en un programa que está en marcha. El pro-
contesta con defIciencIa una prueba para comprensión de oraciones (que blema es entonces, ¿dónde debe participar cada perSOna en cuanto a las unida-
es una s.ubprueba de la prueba Iowa d~Jectura en.silencio" ¿qué guía nos des secuenciales programadas y a las actividades de aprendizaje?
prop'orcIO;alest~ ~ara tomar unala. acclOn?, ¿le obhgaremos a leer muchas Tal vez sea más apropiado preguntar: la quién benefician las decisiones
o.raclOnes ., ¿ e eXlgtremo~ que an Ice las estructuras gramaticales de las ora- que se tomen en cuanto a la colocación? La respuesta inmediata y obvia es que
c~o.nes? Una ~rueba de dlagnó.s~ico específico és útil en la medida en que su la decisión que se tome para Sara será para proporcionarle las mejores oportu-
dlfl.cl!1ta~ radIca en la subhabihdad ~impl~ identificada, de manera que una nidades de aprendizaje, lo cual es cierto, aunque sea una sobresimplificación.
deficIencIa en una prueba da una pIsta dIrecta para la enseñanza especial. Las decisiones de colocación se toman en parte respecto a la preocupación por
los otros estudiantes que estarían en la misma clase a la que sería asignada
No ~~stante qu~ ~as pruebas de aprovechamiento enfocadas en las face- Sara, y en parte en lo concerniente al maestro de esa clase. Colocar a Sara, que
tas esp~cIficas de habilIdad son ayudas sigrIificativas en el diagnóstico educati- es una escritora mínimamente competente, en una clase de redacción creativa
V?! es Importante. reconocer que proporcionan sólo una parte de la informa- podría ser perjudicial para ella, ya que aprendería y progresaría menos que si
ClOn que. s~ necesIta. Una pregunta b~sta~~e o~via, y que algunas veces pasa estuviera en la clase de problemas especiales, diseñada primordialmente para
desapercIbIda por los educadores, es SI el nmo tIene una visión y una audl·cI·o' ayudar a resolver las diferencias básicas en las habilidades para la escritura, o
n?rma1es. Al gunos nmos.- "1 entos n han permanecido en la escuela durante n quizá no; pero su presencia en la clase podría constituir una fuente de irrita-
anos antes d~ que se des~ubra que han perdido parcialmente la audición. ción para los otros alumnos de la clase si sus preguntas y problemas fueran
Una medIda de la aptitud académica general, 'preferiblemente una medida muy diferentes de los de ellos, si se le dedicara demasiado tiempo para contes-
que no sea de ~ectura, ayud.a a indicar si la dificultad académica es específica de tar a sus preguntas, para las·cuales el resto de la clase ya conocía las respuestas
al~na maten a escola~ o SI es el. ~eflejo de una dificultad general en el pensa- o si se tuviera que enfrentarse a ciertos problemas que otros ya hubieran
miento abstracto. La mformaclOn acerca de las condiciones del hogar, los resuelto. Su presencia podría ser frustrante para el maestro, cuyos esfuerzos
recursos con que se cuenta en casa yel apoyo que se recibe para el aprendizaje para tratar con el grupo más o menos como una unidad se verían bloquea-
pued~n a?,uda,r ~ dar una imagen más completa del problema académico. El dos por la necesidad de dar atención especial e instrucciones distintas para
estudIO dIagnostIco de una dificultad académica implica un análisis del niño esta estudiante. Entonces, la motivación para la colocación de los estudiantes
en el que la~ p~ebas que se enfocan de I?anera muy específica para las habili~ que se desvían de la norma en grupos especiales son motivaciones mixtas que
dades academIcas fundamentales constituyen una parte importante. implican no sólo el bienestar del estudiante individual, sino también la me-
joría de los otros estudiantes y la conveniencia del maestro. Los diversos mo-
tivos en que se basan muchas decisiones de colocación descartan los proce-
DECISIONES DE COLOCACIÓN dimientos más precisos y claros para optimizar la decisión.
Reconsidérese el Caso del estudiante específico acerca del cual se toma
Hay muchísimas ocasiones en la educación en que se está en disponibili- una decisión de colocación. Asignarlo al tratamiento A (un curso particu-
dad de escoger entre -:arias opciones o programas y se debe tomar la decisión lar, una sección de la clase, un punto de ingreso para la instrucción) en vez de
par~ o por <:ada estudiante. en cuant? a cuál es la mejor opción que éste debe al tratamiento B podría parecer ventajoso porque los dos tratamientos difie-
elegu¡ .por eJe~plo, en el .nIvel del pnmer grado universitario, varias universi- ren, ya sea completos o en parte, en cuanto a las metas hacia las que están
°
dades.ue~~n dIferentes n!veles de cursos en inglés en matemáticas abiertos a dirigidos, o porque difieren en cuanto a las normas o los medios para alcan-
l,?s pn~cIpIantes. ¿Debe?a colocarse a S~a en la sección de composición espe- zar la meta común. Por tanto, la meta primordial de una sección de inglés
CIal, mIentras que podna t~mar la seCClOn regular en inglés o debería tomar especial a nivel universitario podría ser el tratamiento especial en cuanto a
una cla~. espeCIal en r:daccI?n?, ¿debería Julia pasar a la sección del curso de corrección y claridad en la redacción simple, mientras que la meta primor-
matematIc~s que req~ll~rc: s.olo una co~petencia mínima en el álgebra de la dial de la clase de redacción creativa podría ser la originalidad y los efectos de
preparato~a, o d~?ena InICIar el estudio de los principios fundamentales de dramatización en la prosa o en la poesía. Cada meta se considera apropiada
l~ geo.m etna anahtJca, o~~ un curso que trata directamente el cálculo diferen- para los dos grupos. Por el otro lado, las metas tanto de las colocaciones en
cla~ e mtegra~? Otras decIs!ones de colocación surgen en el nivel de la prepara- las secciones regulares como las avanzadas del curso de matemáticas de la
tona como dl.f~~entes opCIOnes en la programación y en las secciones disponi- preparatoria, podrían ser el progreso hacia el dominio de un campo que
b~es. La adm~sIOn a las secciones de ."~studios avanzados" de los cursos de designamos como análisis académico, pero con la expectativa de que el gru-
myeles ~penores para.preparar y cahficar para exenciones de los cursos del po de colocación avanzado buscaóa ciertos temas con mayor profundidad y
P?mer an~ de umversldad es un caso al respecto, y el problema acerca de a un ritmo más rápido. Entonces, un procedimiento de evaluación común
como'y cuando dar un ag~upamiento homogéneo en la escuela elemental es podría ser el indicado para revelar cuánto han progresado los miembros de
otro elemplo. Una clase dIferente de problema de colocación surge cada vez cada grupo hacia una meta común.
-- . . . u. r"UCISI\~ UE APROVECHAMIENTO ESCOLAR

DECISIONES DE COLOCACIÓN 179


., En esta última situación fa re
Clon tendría más probabilida'des ~ gunta 'por plantear es; ¿en qué ti .
so? Supóngase que dimo d n ~tudiante de alcanzar el m';".;~Po de de regresión está más inclinada) para el tratamiento B que para el
ah ' saca aestudlanteu b d ~!o A. Los estudiantes que lograron muy poco en el décimo grado lo
prov~ anuento en matemáticas al fin na I?~e a e sondeo en .
que temamos que tomar las decision al del declmo grado, en el .. ~:rel'ati'valme.nte mejor bajo el tratamiento A que bajo el tratamiento B
namos a algunos estudiantes al azares acerca d.e la colocación . .r.;.U~url('P. que aquellos que .eran ~os que má~ lograban en el grado décimo l~
algunos otros el tratamiento B {l e.l,tratalDlento A {la sección relativamente mejor baJO el tratanuento B. El punto donde se cruzan
te, al, final del duodécimo gradoal!:cdlOn enriquecida o acelerada]. se indica como la puntuación X de la medida del grado décimo. Si
comun, basada en el ran o com 1 amos .u~a prueba completa e esta situación, los estudiantes que obtuvieran puntuaciones por
tratamientos. Es muy pr~bable pu~t~ de obJetIVOS que s.e buscaban e!!nne~rr~.lr:¡ en el grado décimo podrían colocarse con ventaja en el tratamien-
que se ~uestra en la figura 6.2: ncontremos una sltuaci6n pareCida a que aquellos que estuvieran por encima de X estarían mejor
El dIagrama revela que en rom d" tratanl1Íelrlto B (este tipo de relación recibe algunas veces el nombre de
apr~)Vechamiento en el d~imt ad e lO, lo~ estu~lantes que tenían Un de tratamiento del rasgo).
al final del grado duodécim E,gr o ~odaV1a teman mejor apl~ov'eclballnie;;;~l figura 6.2 ilustra las circunstancias bajo las cuales la colocación en
embar d ' o. ste sena el caso de . --'. tratamientos puede contribuir claramente a un mejor aprendizaje;
g?, es ~ mas interés com arar las Iín manera .casI universal. mlbarJ1;c), la situación no es siempre tan clara como ésta. En la figura 6.3 se
vechanuentp fmal e inicial {llam~das línea e;s que se .~elaclOnan con el a' ro. otros modelos de lo que podrían ser los resultados. En el modelo 1
~od.A y B. Estas se muestran juntas en el s e ~eslOnJ para los tratamkn el aprovechamiento es el mismo para ambos tratamientos en todos
ID lca que la relación del aprovechamien~&a 1 °
'c ~~ la figur~ 6.2, el euai "~·'I'l'r: ••;"'.I.... de habilidad inicial. Los estudiantes que inicialmente son los más
o o a a1lDIClal era mas cercano (
~~ o
Re e~ o o
~-o
o Ol Tratamiento A o o o o
ií cO
~E
Q~
Tratamiento B
Modelo I a.~
oC>
Modelo 11
¡I ~~
EOl
ca
~~
: ¡j o '~
~~ ~ .~Eu
.~ 'eo 'a>

.ii ~g ~~ ~-o
>~ va v o
e~ ~~ Q)
> -0
::>
Q~ 0-
o ~ ~ ~ 0
~
-
Q)
-OcCD
Q) a.~
OU)
a. -o
o ", '
.,li" 00 CD2 Q) Q)
; '.
~~ ]~ -Oc
o.Q
.[ . 2 -:;; Pruebo. de aprovechamiento poro ~ ij .D -O
~ ~ Prueb~ de aprovechamiento poro
<1> :>
estudIantes del décimo grado Pruebo de aprovechamiento poro Pruebo de aprovechamiento poro
a.. Q)
estudiantes del décimo grado ~~ estudiantes del décimo grado
(o/ estudIantes del décimo grado
(b/ (al (bl

o o o o
~-o
"-O
o0. ..o
0 01
Modelo 111
°oC>o
a.~
Modelo IV

- o
~ E ~~
'e0'41'ü 'e :~
~""O
0-0
va
Q) ::>
-50
<1> :>
>""0 >-0
.. "
0-
0.-0
o ..
0
~
-
<1>
Q-o
oa> '"
Q) Q) CD
-Oc -oc
o .Q o .Q
.Jl-o .D -o
Prueb~ de ap~ovechamiento poro
. estudIantes ael d&cimo grado ....
CI) ::>
::>-
a..Q)
Pruebo de aprovechamiento para
estudiantes del décimo grado
CD :>
: > - Pruebo de aprovechamiento paro
. ~ CG estudiantes del décimo grado
(d (e) Idl
Figura 6.2. A-omedio de aprovechamiento f i n a l ' .
del tratamiento educotivo en flXlCión del aprovechamiento inicial y figura 6.3. Div~ patrones de aprovechamiento finol enfu1ci6n del aprovechamiento
inicial '1 del tratamiento educativo. o) Modelo 1. b) modelo JI. e) modelo 111; d) mode-
lo IV .

...... .
.:.: :.:. .' ,;.:. ~ ,.' .: ' " .
...Jt" · 180 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR
DECISIONES DE GUrA y DE ASESORíA 181
:pr· capaces lo hacen mejor, sin importar lo que se les asigna, pero el que se les r&,rtlJlllÍcladles de aprendizajeyara e~e.estudiante y, por tanto, para guiarlo
exJJeTlleniCH1S que le seran gratJfIcantes y productivas. Existen otras
loque en un tipo de tratamiento o en el otro no constituye .ninguna uu't:::re-n¡,
que las buenas medidas de aprovechamiento pueden contri-
cia. El modelo 11 (fig. 6 .3b), ilustra el caso en que un tratamIento (aquí
nado como el Al es mejor para todos los niveles e igualmente bueno a rgí~fiCllltIv·anle~~te.en las decisiones de guía y asesoría para o por los estu·
se relacionan con la aceptabilidad del progreso académico
los niveles· el modelo III (fig. 6.3c), muestra un caso en el que las v ...nr.".,~
estudiante y con los planes para el futuro del estudiante.
tratamien~o A son cada vez mayores en los niveles más altos de la "-'J<UU"'",.
el modelo IV ¡Hg. 6.3d), ilustra un caso en el que se hace menor en los
más altos de habilidad, pero en ambos modelos la estrategia mejor sería
vía colocar a todos los estudiantes bajo el tratamiento A, porque todos de la aceptabilidad
.. A.,.raAp..·..~v· . .

den a aprender más bajo este tratamiento. El propósito de n:ostrar estos a r OI(,grleso académico
plos es señalar que sólo en las condiciones mostradas en la fIgura 6.2 ubicar
diferentes tratamientos tiene algún sentido, así como destacar que lo que . importante para el estudiante, para los padres y para la escuela saber
daderamente necesitamos es la clase de información que se muestra en ". estudiante en particular está haciendo progresos satisfactorios en su
gráficas si queremos juzgar de manera correcta si la colocación de 'U~;UIIUll escolar. Para el estudiante, la evidencia de su aprovechamiento y sus
estudiantes en uno o en otro tratamiento tiene sentido. es una fuerza motivadora sustancial y la evidencia de las dificultades
A lo largo de los años ha parecido razonable usar algunas pruebas de -eslpeC:!Il1cas le dan una pista para buscar la ayuda que le permita sobreponerse
vechamiento inicial como la base o una parte de la base para tomar (1e(:IsI'onl~S~ dificultades. Las pruebas enfocadas a este respecto analizadas en la
de colocación en las que cada estudiante se coloca bajo diferentes "U'",UJl.l.";;,u· sección de este capítulo proporcionan una forma importante de
tos para facilitar su aprendizaje Iy el aprendizaje de los otros miembros ~('frfitrc)alimenl:ac:'lon para guiar a los estudiantes y al maestro para identificar'
cada grupo); sin embargo, la evidencia de investigación acerca de las ';;:,::::..,"C.101i ",'lJIUU.•V~ no cubiertos en el conocimiento o las habilidades que exigirán
de esta colocación es bastante confusa. Un número de factores contribuye ==";:¡.,.". estudiO o una práctica adicionales.
ambigüedad de los resultados. Las bases sobre las cuales se han realizado : En la mayoría de los casos, los padres están profundamente interesados
agrupamientos han variado de estudio en estudio. El agrupamiento ha i>Vl1UU" , \ sus hijos progresen en la escuela. Por supuesto, las familias difieren
hacerse bajo ciertas apreciaciones generales del desempeño académico o las . "rtllUC:nO en cuanto a la profundidad de este interés y aún más en cuanto a los
aptitudes académicas, más que sobre el esta tus de ingreso en ciertas habilida· . ":Y.i>rllIY~(·I~ que les proporcionan para apoyar su aprovechamiento escolar y para
des específicas orientadas hacia la materia. A menudo no es claro qué · los esfuerzos del niño para el aprendizaje. En un extremo, los padres
¡ f.',;·",,,,,,,,!!y
o de qué manera ha variado el tratamiento para cada grupo, y si no hay .! hllf'c1en desempeñarse como maestros muy bien informados y capaces de
adaptación notoria al tratamiento, no hay una buena razón para esperar ",U.,.,,"'O', en el otro, no tienen posibilidades de ofrecerle nada al niño o sólo
rencias en los resultados. Asimismo, no estamos seguros de hasta dónde '-"'''; ~''~T poco como tutores y tienen condiciones sociales y físicas inadecuadas
objetivos comunes caracterizan a los diferentes tratamientos o de hasta dónde apoyar los esfuerzos del niño en cuanto a su aprendizaje. Pero los padres
tienen la verdad diferentes metas, por lo que ningún instrumento común para " " .. ~.1." • .,... considerarse los aliados de la escuela en las actividades de aprendi-

evaluar el aprendizaje sería el apropiado. Sin la capacidad para documentar las " '··':'''H~1;'':''·;o del niño, y si van a ser aliados eficientes necesitan saber, tanto en lo gene·
creencias de cualquier manera sistemática, nuestra convicción es que las prue· . . como en lo específico, cuáles son los progresos de su hijo elJ. cada materia
bas tienen más probabilidades de permitir tomar decisiones de colocación , :~ éScolar y en cuál de ellas el niño tiene dificultades.
constructivas cuando: al las pruebas se relacionan con un conocimiento ini· . . '!:.!': Los resultados de las pruebas de todas clases proporcionan una base tangi-
cial muy específico y con habilidades para un área de alguna lI1ateria particu· '••:~ :i;' ble para la comunicación entre la escuela y los padres, así como permiten
lar, y b) los tratamientos instruccionales alternativos difieren sustancialmente c' interpretar el progreso y las dificultades del estudiante. Como veremos, las in·
en método y en contenido, así como en el ritmo. Esto implica que las pruebas. térpretaciones pueden ser de dos tipos" El maestro o la escuela puede propor-
de colocación más útiles tienen más posibilidades de centrarse en un área de la cionar una interpretación referida al criterio que le reporte al padre algunas de
materia del conocimiento. Los exámenes de las pruebas editadas pueden iden· las competencias específicas que el niño ha desarrollado recientemente en un
tificar uno o más tratamientos cuyo contenido se enfoca en las habilidades . '. nivel satisfactorio de dominio o algunas habilidades detenninadas con las que
iniciales deseadas, y si esto fracasa será necesario diseñar una prueba local que .'. tiene problemas. Por el otro lado, se puede ofrecer una interpretación referida ¡ :

tenga el enfoque deseado. J>;tIa norma para que tenga una base de comparación del nivel de desempeño
.'. ~ , general del niño en una materia dada con respecto al de toda la clase, la escuela
li O una referencia regional, estatal o nacional más amplia del grupo de referen-
DECISIONES DE GUíA Y DE ASESORÍA . ..;:cia. Su desempeño también puede compararse con el nivel de desempeño
La decisión para colocar a un estudiante en una sección de la clase o en un esperado a la luz de lo que se sabe acerca de los potenciales del aprendi·
curso o programa debe orientarse primordialmente hacia la optimización de . zaje escolar.
182 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR DECISIONES DE GUiA Y DE ASESORIA 183

El personal de la escuela también necesita juzgar si el progreso de un niño Aun con las pruebas referidas al criterio puede haber una comparación.
es aceptable a la luz de lo que se conoce acerca de las habilidades para poder . Entonces, la compar~ci~n está represe?~ada p~r el r!tmo a} que. el in~ividuo
decidir si se debe poner al niño bajo un régimen de estudios especiales o si alcanza el nivel de cntef:'0 para las habilidades do~nad~s..en cle~o tIempo.
puede continuar con los normales. Si el progreso se halla muy por debajo de lo Este tipo de interpretacIOnes deben poners.e a la dlspombihdad SI los padres
que podríamos esperar, se necesita hacer estudios diagnósticos más intensivos preguntan: ¿cómo va Elena?, ¿debo estar satIsfecho o preocupado con sus pro-
para tratar de discriminar las fuentes de dificultad y elaborar un plan y un pro- esos? Desafortunadamente, en mucho del en~us!asmo actual acer.ca de las
grama para una acción correctiva. . fruebas referidas al criterio se da poco reconOCImIento a esta necesIdad y se
Con base en estas necesidades afro~tamos el problema de determinar si desarrollan pocas acciones para satis~acer1a. Por lo D?-enos, una escuela ? ~n
. un niño está mostrando un progreso aceptable, lo cual constituye un proble- maestro . necesitan algunos registros mformales del nt~o de pr~gre~o tlpICO
ma engañoso, problema controversial y políticamente sensible o aun un pro- de la instrucción individualizada y de las pruebas refendas al cnteno, de tal
blema muy delicado. A continuación analizaremos tres definiciones de manera que se puede establecer algún tipo de comparación o estándar para
desempeño aceptable que hemos clasificado como: desempeño en relación definir el progreso típico. .
con la perfección, desempeño en relación con sus compañeros y desempeño En el capítulo 4 estudiamos ~~rias.clases de pu.ntuaclOnes transformad~,
en relación con el potencial. . .. usando diferentes escalas de cahfIca~lOnes y dls~mt?~ marcos de referencIa
para reportar las puntuaciones obtemdas po~ un mdlV1duo. ~presa~os una
preferencia general por los rangos de percentiles, las pun~uaclOnes est~?dar o
Desempeño en relación con la los estanueve para representar el desempeño de un estudIante en relaclon con
perfección el desempeño de los otros miembros del grupo al que pertenece. Lo que pro-
bablemente tiene mayor significado inmediato para un padre o para otra
Ésta es la medida estándar que se aplica de manera típica a las pruebas persona que no posee la~ ~omplejidades pa~ic~lares acerca d.e ~?S tema~ de la
referidas al criterio similares a las estudiadas en la primera sección de este medición es la puntuacIon reportada en terrmnos de la pOSICIon r~latIv~; es
capítulo (págs. 167-168). ¿Qué tan cerca estuvo el estudiante de mostrar una pun- decir, I/e~ el percentil 15", lI en los dos déc~os" o "en el cuarto mfenor".
tuación perfecta en una prueba que le dimos? Podemos interpretar dicha Hay dos aspectos con problemas en este tIpO de reporte, uno de los cua-
puntuación como l/dominio o maestría completa", pero ésta es una interpre- les es que resulta posible (aunque tal vez no ~uy comun) que ~entro de u~a
tación peligrosa, aun en el caso de habilidades enfocadas de manera muy . clase específica las diferencias en el d~sempen.o s0f:' ta"n pequenas qu~ la dIS-
estrecha, y es completamente inapropiada para una prueba que abarca un tinción entre el" cuarto superior" y el cuarto mfenor .nl? t1~nen una Impor-
dominio bastante amplio. En este último caso, siempre hay tareas más difíci- tancia práctica; es decir, tal vez estemos forzando las dIStInCIOneS cuan~o en
I les que las que podría haber desarrollado el examinado, y nunca podemos
decir que sabemos todo acerca de una materia del conocimiento. Aun con
realidad no existen. El otro aspecto es que el uso del grupo com~ ,;n estand~r
significa que debe haber siempre un 50% del ~rup~ to;al que e.ste ~or ~~ba)o
tareas tan específicas, como la identificación de los números primos, algunos del promedio" 25% que esté en el "cuarto mfenor , en la ImphcacI0!l.de
se toman bastante más difíciles de descubrir que otros. Así, la uperfecciónll se que de alguna ~anera ha "fracasado". Aquí :frontam.os"u!l p~~blema baslco
ve sólo en una muestra específica de tareas que se usan para representar el en nuestro uso del lenguaje, en cuanto a que prOme?l? Slgt.l1Ítca de manera
dominio de estos números primos. Interpretar 1/80% de respuestas correctas" estadística "la mitad del grupo", pero en el habla COtldI~na tIene una CO~1DO­
en la prueba normal hecha por el maestro como IIconocer el 80% de la mate- tación de "mínimo aceptable" de manera que cualqUler cosa que este por
ria", es completamente absurdo; cuando mucho, la interpretación debería ser debajo del promedio implicaría la connotac~ón de uinaceptable". De algún
uconoce el 80% de las respuestas que el maestro piensa que un alumno debería modo, las dos interpretaciones de I/promedI?" deben qued:t r separadas en
saber". Por otro lado, esta medida estándar de "lo que el maestro espera" es nuestro pensamiento, de manera que el estudIante que se ubIca en el percen-
muy real y puede ser muy importante para el alumno y para sus padres. til20 o 30 de su grupo en alguna medida no sea co?slderado c0!ll0 fracasado.
Con una prueba publicada, lo.s, datos no~atlvos pr?porcIOnado~ por el
. editor permiten que la comparaclon sea refenda a algun grupo regtonal.o
Desempeño en relación con sus nacional, o el sistema escolar puede d~rrollar sus no~~s a todo lo amplio
compañeros de su sistema. El uso de las normas naCIOnales puede ongtnar 9ue e~ algunas
escuelas situadas de manera afortunada que se desprenden pnmordIalmente
Por este desempeño entendemos una interpretación referida a la norma de las comunidades privilegiadas, la mayoría de los niños se acerq?~n o ex~:
de lo que es una puntuación de prueba. En este caso,la adecuación del desem- dan los promedios nacionales; sin embargo, si se usa esta co~p~raclOn, servu:a
peño se define por el desempeño de los otros. Para una prueba hecha por el para acentUar el sentimiento de fracaso en escuelas de los dIstntos o com~­
maestro, puede ser la posición de su alumno respecto a su clase. Para el editor dades que están por debajo en la escala de los. recursos culturales y econo~­
de pruebas, es la posición que guarda el niño respecto a un grupo de referencia cos, donde una gran proporción de los estudIantes no alcanzan el promedio
más amplio, tal como todos los niños de esa edad o de ese grado escolar .

. .:' ,' \ ':. '~, \;':" .. ::...


DECISIONES DE GUiA Y DE ASESORiA 185
184 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR
. . al . t al grado de lectura. Así, un alumno de sexto grado con una pun-
regional o nacional. Una aplicación arbitraria de las normas nacionales, ya sea
para las escuelas o para los individuos, no puede fallar en emitir juicios reales d
. equIy, e eSdad estándar1- en la prueba de habilidades cognoscitivas de 70 o
tuaClo n . e e n equivalente de grado de lectura de 4.4, que está un poco por
y, por tanto, conducir a la frustración. .b duene
menos 1 u dio Este mismo nivel de 1ectura se u b·lca en e1percentl·125 d e
. arn : ~eo:;án ~n la banda de puntuaciones de edad estándar de ~0-89, y
Uo
aque erc~ntill Ode aquellos que están en la banda de PEE d~ 90-99. S1 ac~pta­
Desempeño en relación con el potencial en el Prueba de habilidades cognoscitivas como una medIa del potencial (y
mo s l~ p . d an si) el equivalente de grado en lectura de 4.4 es tan
El reconocimiento de la desigualdad de la evaluación del desempeño en éste sigue slen °b u1}gros esp'erar para un niño del sexto grado con una PEE
bueno como de enam ..-
. 70 t ' por debajo de las expectatIvas para un nmo con una
relación con la comparación uniforme e invariable ha conducido a los USua-
rios de pruebas y a los evaluadores educativos en general a tratar de expresar el 1
infeno r a d' q~e es a te muy por debajo de las expectativas cuando la PEE
PEE de 80, e .mlt1vamen niño cuya PEE es superior a 110. Tablas similares
desempeño en relación con el potencial. Esta orientación rechaza la idea de ma1o para un
que todas las personas son idénticas e intercambiables y que la misma compa- es de 90 '.Y casI d . d b
. t das por varios editores de pruebas estan anza as que a arcan
son sumlDlS ra d i · 1 de grado
ración es aplicable a cada una de ellas¡ más bien trata de establecer una com- todas las áreas de materias escolares en to os os mve es .
paración para cada persona. Al respecto, se formula la pregunta siguiente: a la
luz de todo lo que conocemos acerca de este niño, ¿qué nivel de desempeño Pruebas de lowa de los equivalentes de grado de lo pru~ba de habilidad básica en
sería razonable esperar de él? Tabla 6.2. la lectura de los percentiles seleccionados paro los estudIantes de sexto grado,
. Ésta es una pregunta fácil de plantear, pero cuando empezamos a anali- poro el nivel de lo calificación no verbal estándar poro eso edad en lo prueba de
zarla encontramos que la respuesta se vuelve engañosa y plantea trampas, con habilidad cognoscitiva (PAe)
una amplia gama de preguntas técnicas y éticas. ¿Cómo decidimos qué nivel
de aprovechamiento podemos esperar razonablemente de un individuo? Bando de lo PA( poro lo calificación no verbol estóndar paro dicho edad
Esta expectativa puede estar contaminada por lo que sabemos acerca de
una persona y que es fácilmente demostrable si consideramos el factor de su Percentil 120· 129 130+
70·79 80·89 90·99 100-109 lIO·ll9
edad. Ya sabemos que es poco razonable esperar que un niño de ocho años sal- de lectura Inferior a 70
te tan alto o corra tan aprisa o haga problemas de aritmética en el rango de un
niño de 12 años. Tal vez es poco razonable esperar que un niño de ocho años 8.3+ 9.0+ 9.6+ 10.1+ 10.6+
99 6.1+ 7.1+ 7.6+
que sea de talla pequeña salte tan alto como otro niño de la misma edad que 8.4 8.9 9.4 10.0
5.7 6.5 7.0 7.7
95 9.0 9.6
sea excesivamente grande para su edad. Por la misma razón, los niños de ocho 5.4 6.1 6.6 7.3 8.0 8.5
años difieren en su desempeño en las pruebas diseñadas para medir su des- 90 8.4 9.0
5.3 5.9 6.6 7.3 7.9
75 4.9
arrollo intelectual general. Tal vez sea poco razonable esperar el mismo nivel 5.1 5.8 6.5 7.1 7.7 8.2
50 4.2 4.7
de desempeño aritmético o linguístico en un niño que obtiene calificaciones 5.1 5.7 6.3 6.9 7.5
25 3.6 4.0 4.4
bajas en pruebas de aptitud escolares que en aquellos que obtienen calificacio- 4.9 5.5 6.1 6.7
3.1 3.4 3.8 4.4
nes altas. Como un hecho observado, no hay ninguna razón para suponer que 10
5.1 5.7 6.2
2.8 3.1 3.5 3.9 4.5
los niños que obtienen calificaciones bajas en pruebas diseñadas para evaluar 5 5.2- 5.7-
2.6- 3.1- 3.5- 3.8- 4.4-
las aptitudes escolares en general tiendan a desempeñarse menos bien en 2.5-
medidas de lectura, de aritmética y de otros aspectos del aprovechamiento
académico. Nuestro problema básico es decidir si estos niños tienen menos
potencial para el aprovechamiento académico.
En un sentido estadístico, la respuesta es sÍ. Como un hecho estadísti- El /1 aprovechamient_o esperad~/I puedde dletermi~a~r~bil1~~~~: ~!;~~=
co, hay una correlación sustancial entre las medidas diseñadas para evaluar las eño de los grupos en dIferentes Olveles e a prue .a e a . _ . -
habilidades intelectuales en general y las medidas diseñadas para evaluar el ~ les sino también por las escuelas que atienden a mnos de d1stmtos
aprovechamiento académico. Los niños con CI bajos tienden a obtener una ~~:I~:d~~og~áficOS. En la tabla 6.3 se mues~ran los valorels de percent~ paía
calificación baja en lectura y aquellos con CI altos tienden a ser buenos lecto- las escuelas de diferentes ambientes. Las pnmeras ~o~ co umnas reve an .a
res. Podríamos elaborar una tabla de expectativas que mostrara el nivel pro- extensión de las diferencias entre las dos regiones pnncIPale~tn E~ta~os ~n:­
bable de aprovechamiento pardos individuos de diferentes niveles de CI. Par- dos Las diferencias son reales, aunque no sean muy.gran es. a slgUlen e
te de una tabla como ésta se muestra en la tabla 6.2, la cual revela los rang~~ de col~mna muestra los resultados obtenidos en grandes CIudades, y el desempe-
percentiles en la prueba Iowa de habilidades básicas para la lectura para los ño más bajo es el más notable. En las dos columnas finales se compara un gru-
alumnos del sexto grado de diferentes niveles de aptitud en la prueba de habi-
lidades cognoscitivas, no verbal. En esta tabla se muestran las puntuaciones 1- Puntuaciones estándar con una media de 100 Y una desviación estándar de 16.
186 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR DECISIONES DE GUIA Y DE ASESORIA 187

1 dI' .
po de escuelas suburbanas con un grupo d d~ la . . , individuo y de ~scuela a esc:uela, con y~ri~ble~ ~ndamentales para
interpr etar
ciud~d que son vecinda des privada s de rec:r: ~~ea~~ í e a parte lntelor
p supuesto, as dile- . A mvel del mno mdlV1d ual las decisio nes prácticas
serí ,or .. d aprovechamIento? l
renClas son muy grandes. Una puntua ción ue
en las escuelas suburbanas se ubicaría en efpercenat~x9a9centamenteelpro!lledio inmediatas son de dos tipos, a saber:
. otros ambIentes.
l . ¿Qué mensaj e se debe dar a los padres acerca del aprove chamie nto esco-
Tabla 6.3_ Equiv~lentes de grado de lo prueba de lectura ITSS de los percentiles lar cuando las aptitud es del niño parece n estar claram ente por debajo
(o por
selewonodos poro los estudiantes de sexto grado de varios grupos demográficos arriba) de todos los demás niños del grupo?
Grupo demográfico 2. ¿De qué manera se deberían modifi car los planes para los diagnósticos
conoci-
. especiales o para los programas de instruc ción especial median te el
del niño o su nivel de desemp eño en una
Escuelas alejad; miento acerca de los antecedentes
Peree/ltil Regió/I Regió/I Ciudad de los prueba de aptitud ?
are-
de lectura I 2 gra/lde Suburbios veci/ldarios. Algunas consideraciones más acerca de estos problemas las encontr
capítul o 9, después de revisar la natural eza de las prueba s de aptitud
mos en el
:: 99 9.8+ 9.8+ 9.2+ 10.6+ 7.8+ escolar.
95 9.0 9.2 8.7 9.9 7.5
90 8.5 8.7 8.2 9.5 7.3
75 7.6 7.8 7.3 8.7 6.2 Planea ción del futuro educa tivo
50 6.4 6.7 6.2 8.0 4.9
25 5.4 5.6 de
10
5. I 7.3 4.0 El niño progre sa en el sistema escolar hasta alcanzar ciertos puntos el
i; . 4.6 4.6 4.3 6.7 3.3 acerca de sus planes educat ivos futuros . El aprove chamie nto en
i decisión
5 en estas
3.9 4.2 3.9 6.4 3.0 pasado es, ciertam ente, un tipo de inform ación que debería influir s pre-
1 3.4- 3.4- 3.4- 6.0- 2.2- decision es. Las medida s de aprove chamie nto present es son de los mejore
campo.
dicto res que tenemo s del aprove chamie nto en el futuro para el mismo acerca
El nivel general de aprove chamie nto es signific ativo en las decisio nes
aprove-
de qué tan alto debe abocarse un plan en el esquem a educativo, y elen cuan-
debe~:ni~:~~t:~ab¡;:;~~:n~~~~~: ~~ómo deber~mos interpretar y qué uso chamiento relativo en cada campo puede ser un factor en la decisió n
es pro-
ll~ eldaprove- to a qué especialización perseguir en un nivel dado. Los logros escolar más
¡ .l' chamie nto y CÓmo difiere como u;" fu~c~~~~ae ~~fd:~ ~e~arroaputu es esco- porcionan un indicad or del aprove chamie nto y de los indicad ores
lares o como una función de los hechos d 'f e as o dentro
. 1:
It
la escuela ? 'debe ,emogr a IC?S acerca de la comun idad adecuados, pero la variabilidad de los estándares de maestro a maestr s
en la que está inserta de una escuela o de escuela a escuela limita el valor de los logros escolare
que están relacionadas con la c~Íiiicaci~lamos cOf!s;:;erar a aq':lellas variable
r (; ;
,. s tienen
!; .
ental n como s~ ~r~n medIda s del poten- como guía para planea r el futuro académico, ya que estos estánda res
cial de algo en un sentido fundam rizadas,
estí- un significado person al y local. Por esta razón, las pruebas estanda
marla Como algo que le pone un límite o tal vez bIOlogIco?¡ ¿deberíamos con normas amplia mente representativas y normas que son compar
ables de
ide~ería.mos consi~erar a las medidas I~pi~~~e!:~~~~/grar o
de ;~rovec har?¡ uri área de conten ido a la otra, propor cionan una base más uniform e y
univer-

;~e~~~ ~~t~ ~~~~~? ¡J~~:~ ~:~~r: s~~fct ,!~~I:pSr;~~~~::~::nstcooída~~sl


e a
!~l~
guna
sal para apreciar el nivel de aprove chamie nto en su totalida d y las ventaja
desventajas específicas.
sy

manera mas general es de . d'd ible de m . Se deben evitar dos tipos de errores al usar los resultados de las
pruebas
· ,CU , unad'd me I a que 'es tan suscept eJoraro
de declmar como lo so 1 dI de ellos es tomar decisio nes de manera
¿deberíamos fijar el mism~ ::tá~d I as e as ar~ a~a.dém icas específicas?, para propósitos de planeación. Uno
n el desemp eño present e predice el
grupos? Negar la realidad del indiV1a~dPuaoraytdodo s ldo~/ndl vl.duos y para todos los prematura, pues los individ uos cambia y
es mal aconsej ado cuando deja de
· e ldas herenCIas . .
de grupo en cuan- futuro de manera imperfecta. Un asesor
ingre-
t o al aprove c h aIDlento parece escapar al
. . mun o en que V1vtrnOS¡ pero aceptar considerar las opcion es premat uramen te, como en el caso de si se debe
el mundo en qu " gativo
l~~t~ble s~ría neg~r !a posib~dad de que sar o no en la univers idad. El otro error es el uso predom inantem ente-ne
las reform as SO~i~;;~~~~° J:a~ol de los resultados de las pruebas. Las puntua ciones de prueba son más . Es
cons-
mundo para mejorar. No es fácil mante:eru~~~Vq~ili1,~oneanntrCeaemlrea blal~ nuestrlo tructivas si se emplea n a puertas abierta s que si se usan a puerta cerrada
Ismo y a car el
esperanza. muy import ante que los resulta dos de las prueba s sirvan para identifi
.
¿Cuál es un enfoque científicamente soT d 0 1 eduCd~ftIvam~nte cc;>nstructivo y alentar su desarro llo posteri or para redirigi r a aquello s para quienes
talento
y éticame nte defendible que se pueda usa r con 1
estas 1 erenCIas de mdividuo a la educación univers itaria típica parece una meta poco realista.

.. '.,:
.., .
' . ... ..., .'. ........ ...'... . ..
~ .; ... , .. . , .. '·1.' ;..; : '·.: .:: t .·~ ... .-.. . -,
188 DECISIONES CURRICULARES 189

DECISIONES DE SELECCIÓN see más que con base en sus potenciales para adquirir nuevas habilidades.
~~ podrían enc~mtrar ejempl.o~ en casi c~a~quiera,de las habili.dades artesaI?-a-
Mientras que las decisiones de colocación representan intentos por lograr · . como carpmtero, maqUInIsta, electncIsta, aSI como en dIversos trabaJOS
l ' fo, contador o programa dor de computaclOn. .,
lo máximo para e! individuo al ubicarlo en uno o en otro tratamiento (aquí se des,oficina, como mecanogra
emplea el término tratamiento en el amplio sentido de programas educativos e Existen pocas pruebas de pericia en el trabajo publicadas, primordialmen-
así como en e! más estrecho de tratamiento de educación especial) las decisio: para las habilidades de oficina; sin embargo, para la mayoría de las situacio-
nes de selección representan intentos por seleccionar a las personas que serán (ees una prueba de pericia tendrá que ser diseñada de manera local. Los pasos
más útiles en una organización. El término utilidad se emplea en un sentido ~n ~I diseño de una prueba de pericia son, esencialmente, los siguientes:
económico general de valor recibido, en cualquier en que pueda expresarse.
Así, el valor que tendría un empleado que se contratara como mecanógrafo 1 Hacer un estudio crítico y cuidadoso de trabajo, para determinar lo
podría expresarse como el número de líneas libres de errores de texto que . a que la persona debe saber y qué habilidades debe poseer para efectuar
mecanografiara en un día de labor promedio, mientras que el valor para Un sus obligaciones en el trabajo.
estudiante universitario se podría expresar (tal vez de manera más cruda e b) Seleccionar ciertos aspectos del trabajo que sean tanto importantes
incompleta) como el promedio de calificaciones obtenidas en el primer grado como susceptibles para ser apreciados por una prueba.
de universidad. En términos más simples, el propósito de un sistema para e) Desarrollar un plan de prueba. En la medida en que se quiera evaluar el
las decisiones de selección es emplear o admitir a los individuos que ofrezcan conocimiento del trabajo, el plan puede tomar la forma de un diseño
el máximo de valor total o de utilidad a la institución. similar al de las pruebas de aprovechamiento, que se describirán en el
Es necesario señalar que la noción de utilidad o de valor es difícil y com- capítulo 7. Cuando se trata de medir una habilidad, como la mecano-
pleja. Cualquier indicador simple, como las líneas mecanografiadas o el pec, grafía o conducir un vehículo, el plan debería poner en marcha de
es, a lo máximo, una aproximación gruesa y pragmática a la verdadera utili- manera detallada la naturaleza de la tarea que se presentará, el equipo
dad de una persona para una organización, ya sea que ésta sea una oficina o que se utilizará, las condiciones bajo las cuales la tarea se realizará y las
una institución educativa. Los problemas de medidas criterio ya se han anali- bases para calificar e! desempeño o e! producto.
zado con cierto detalle en el capítulo 3, por lo que aquí no se estudiarán. El d) Elaborar ejercicios de prueba, instrucciones para la administración y la
punto que debe reconocerse es que los aprovechamientos en e! pasado, repre- calificación, así como los materiales de acuerdo con el plan.
sentados por el desempeño en el presente, suelen tener mucha validez como e) Elaborar pruebas preliminares, tal vez con un grupo de empleados,
predictores de una utilidad futura. Por tanto, se ha comprobado que los gra- para permitir la revisión, la edición y la selección de los ejercicios de la
dos de la escuela secundaria y preparatoria están consistentemente entre los prueba, a fin de aclarar cualquier problema de la administración de
mejores predictores de los futuros grados universitarios, y que las habilidades la prueba (especialmente para las pruebas de desempeño) y la califica-
para el trabajo mostradas al solicitar empleo proporcionan una buena indica- ción de! desempeño o del producto.
ción de lo que serán esas mismas habilidades dentro del trabajo. f) Administrar la prueba a una muestra de personas empleadas en ese
La razón para usar una prueba objetiva de aprovechamiento en una o más trabajo, para determinar qué nivel de desempeño representa un están-
de las materias académicas para reemplazar o suplementar los grados de la dar razonable de competencia.
escuela preparatoria como predictores del éxito universitario, es que este tipo
de prueba proporciona un conjunto unifonne de tareas para todos los solici-
tantes y, por tanto, proporciona una forma de igualar o equilibrar los diferen- DECISIONES CURRICULARES
tes estándares de cada escuela preparatoria. Sin embargo, esta valoración tam-
bién puede hacerse por medio de las medidas de las habilidades escolares más Las medidas de aprovechamiento se necesitan para la evaluación de los
generalizadas encontradas en pruebas de aptitud escolar. Más aún, estas medi- materiales curriculares alternativos o para los diseños instruccionales. En la
das tienden a depender menos de lo que se ha enseñado específicamente en educación hay un flujo constante de proposiciones para el cambio¡ es decir,
cada escuela. Por ello,las pruebas de admisión ampliamente utilizadas para la cambio en los énfasis curriculares, en los materiales instruccionales, en los
universidad (pruebas de aptitud escolástica de la dirección de universida· procedimientos instruccionales, etc. Si se quieren incluir las innovaciones de
des, pruebas del programa para evaluar las universidades estadounidenses) manera racional más que al capricho y si la educación va a mostrar algún pro-
se han basado en habilidades de lectura general, verbales y cuantitativas. greso acumulativo en cuanto a su eficacia más que en cuanto a la variación
En el campo del aprovechamiento académico y laboral, las pruebas des· entre una moda u otra, es imperativo la evaluación sistemática de los resulta-
empeñan un papel relativamente pequeño como instrumentos de selección. dos de cualquier cambio. Realizar los estudios adecuados para evaluar cual-
No obstante, las pruebas de pericia para las habilidades laborales específicas quier cambio propuesto es muy difícil. Muchas investigaciones educativas no
tienen un potencial importante. Esto es especialmente cierto para aquellos son concluyentes como resultado de las complejidades técnicas implicadas,
trabajos en los que la persona es contratada con base en las habilidades que ya pero sin los estudios de investigación evaluativa, las decisiones para el cam-

,¡p .
190 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR DECISIONES CURRICULARES 191
bio se toman de manera arbitraria, apoyadas sólo por la elocuencia del pro- currículum general, más que de uno especial o local, pero mucho del con teni-
ponente. do de la educación cambia paulatinamente y hay mucho que es común en los
Un primer requisito para una investigación evaluativa es la especificación objetivos de programas educativos que difi.erenen forma y en contenido espe-
clara de lo que una innovación propuesta se propone lograr¡ es decir, necesita- cíficos. De esta manera, vale la pena exammar las pruebas existentes antes de
mos una propuesta de los objetivos del programa que sea completa e integrada poner en marcha los recursos d;.tiempo, habilidad y dinero, con el fin de pro-
y que abarque un rango completo de resultados'buscados por el nuevo progra- ducir una nueva prueba espeCIfIca para el proyecto de evaluación local.
ma propuesto, así como aquéllos buscados por el nuevo programa. Por tanto Como ejemplo, considérese el análisis de conceptos de aritmética que se
si un programa de matemáticas revisado está planeado para producir mejotía~ muestran en el cuadro 6.1 empleados para planear los reactivos de las pruebas
en la comprensión del sistema numérico, y el programa reemplaza a aquel que Iowa de habilidades básicas. Para clasificar cada reactivo en la prueba se utili-
había destacado las habilidades para realizar cálculos matemáticos, es impor- zÓ este esquema. Una persona interesada en el nivel evaluativo del dominio
tante que una evaluación de los resultados de ambos programas sea compara- de conceptos aritméticos con niños en algún grado escolar específico puede
da tanto en la comprensión del sistema numérico como en las habilidades usar este código para comprobar qué aspectos del área están incluidos en la
para efectuar cálculos matemáticos. Una decisión entre los dos sistemas pue- prueba en ese nivel de grad? y determinar si estos aspectos corresponden a los
de tomarse sólo sobre una base racional si conocemos qué tan bien logra cada mismos con los que trabaja su escuela.
programa no solamente sus propios objetivos focales, sino también los objeti- La única manera confiable de evaluar lo que una prueba publicada mIde es
vos focales del otro. Entonces, podremos estimar la importancia de los diver- examinar con detalle el protocolo de la prueba y su manual. El manual (o el
sos aspectos del aprovechamiento en términos de un sistema de valores espe- material complementario disponible del editor) suele enunciar reactivo por
cífico y tomar una decisión en cuanto a cuál conjunto de resultados será el reactivo lo que en cada uno de ellos está diseñado para evaluar ya sea conoci-
preferido. mientos o habilidades. Todo lo razonable que esta propuesta pueda ser es fac·
La forma más pertinente en que pueden expresarse los objetivos se estu· tibIe de verificarse mediante el examen del reactivo mismo. Si los objetivos
diará con cierto detalle en el capítulo 7, en el cual se destacará la necesidad de principales y la representación de ellos en las tareas presentadas por medio
redactar los objetivos en términos de conducta observable¡ sin embargo, los de los reactivos específicos concuerdan de manera razonablemente buena con
objetivos pueden redactarse en niveles de generalidad muy diferentes. La Írase los obíetivos definidos en el programa que se compara, la prueba pubiicada
"comprensión del sistema numérico" representa una propuesta muy amplia, quizá sea la mejor opción para incluirla en el estudio de evaluación. Por
la cual sería útil para resumir un área principal de interés, pero podría especifi· supuesto, si uno!) más de los objetivos es lo suficientemente distintivo de tal
carse mucho más si va a guiar la planeación de los procedimientos de evalua- manera que ninguna de las pruebas publicadas pueda representarlo de manera
ción o los instruccionales. El objetivo general puede incluir un número de adecuada, entonces sería necesario construir un nuevo instrumento específi-
desempeños explícitos, tales como "dado un número de cuatro dígitos como camente diseñado para representar a ese objetivo.
el7 362, identifique el número de los millares, de las centenas, de las decenas Una de las características de las evaluaciones curriculares o cualquier aná-
y las unidades en ese número". Estos desempeños más específicos sirven para lisis que conduzca a una decisión aplicada a toda la clase, escuela o sistema
definir en términos de un arreglo completamente razonable de ejemplos lo escolar, es que no se requiere que cada alumno sea evaluado en cada ejercicio
que queremos decir por "comprensión del sistema numérico". Entonces, de prueba. Por ejemplo, si hay diferentes ejercicios de prueba o los suficientes
. mientras pensamos qué programa se diseña, tendemos a organizar nuestro para abarcar varios objetivos de un programa escolar que requirieran cuatro
pensamiento alrededor de su conjunto pequeño y manejable de categorías horas a un alumno para responderlos y si sólo tiene disponibles 30 minutos,
generales. Sin embargo, para que las categorías generales adquieran una sus- sería posible dividir el material en ocho formas de prueba y dejar que cada
tancia y un significado reales, cada una debe estar elaborada en un rango alumno tome alguna de ellas. Entonces, si la escuela tiene 120 alumnos de
de especificidades amplio que nos dirá lo que debe enseñarse y lo que debe sexto grado, aproximadamente, 15 alumnos tomarán cada una de las ocho
evaluarse. f?rmas. Para la escuela en su totalidad sería posible determinar el nivel prome-
Una vez que los objetivos de un programa instruccional han sido pro- diO de desempeño para la prueba completa, ya que todos los reactivos se
puestos, con el suficiente detalle y especificidad para guiar la instrucción y la habrían utilizado y'todos los alumnos habrían sido examinados_Este procedi-
evaluación, podremos preguntarnos si algunos o todos estos objetivos pue- ~iento, que se denomina muestreo de reactivo, proporciona una forma prác-
den evaluarse apropiadamente por medio del uso de las pruebas publicadas tica de abarcar un amplio rango de objetivos curriculares mediante el uso de
existentes. Por supuesto, hay cierta economía de tiempo y de esfuerzo al usar ~n gran número de examinados cada uno por un periodo relativamente corto¡
las pruebas existentes, así como una ventaja en la disponibilidad de los datos Sl.~ embargo, el muestreo de reactivos requiere el ensamblaje de pruebas espe-
normativos. Preparar el diseño para una prueba publicada implica un análisis CIfIcas para determinada ocasión, ya sea por medio de los esfuerzos locales o a
bastante completo del contenido y de los objetivos de ese campo que debe partir de los archivos de reactivos de los editores comerciales. Es necesario
abarcar. Puede ser que este análisis se haya hecho unos cuantos años antes de i!l~istir en que con el muestreo de reactivos no obtenemos una puntuación
que la prueba haya sido publicada y quizá se haya efectuado en términos de un unl o significativa para ningún alumno en particular.

-. . : .•.. ~. .... ,
....;..-., :..... . ... '-' .'., '
.0
192 DECISIONES POlÍTICAS Y PÚBLICAS 193

Cuadro 6.1. Anólisis de lo pruebo A-l, conceptos aritméticos, en los pruebas lowa de puesto de ~ada comunidad y de c~da estado. L?s ciudadanos quieren saber si
habilidades básicas ~c está haCIendo buen uso de sus Impuestos, como se mantienen sus escuelas
~on respecto a las de su estado y las del país en su totalidad, qué tan bien
(/asificación de habilidades
aprenden los niñ?s de su comuni~ad las cuestio~es que ello~, ~omo padres y
M-Medidos ciudadanos, conSIderan que debenan saber los mnos. Las deCISIOnes escolares
(-Monedo (dinero)
M-l fontidodes que están a ~isposición de los. ciuda~anos son bastante limitadas y frecuente-
(-1 leer y escribir cantidades
M-2 Tiempo (decir lo hora, los zonas de mente negatlvas. Puede ocurnr que estos desaprueben un presupuesto escolar
(-2 Contar . o un puntO de apoyo a las escuelas, o bien que organicen protestas a personas
(-3 Valor relativa de los monedas tiempo, el calendario)
M-3 Temperatura programas o políticas. De manera inversa, por supuesto, pueden decidir apo~
(-4 Hacer conversiones
M-4 Peso var el desarrollo de la escuela con más dinero, más tiempo o más aprobación.
M-5 longitud (uso de regla, precisión) Lo que hagan dependerá, por lo menos en parte, de lo que conocen de esas
D-Decimales
0-1 leer y escribir decimales M-6 Área y volumen escuelas.
M-l (opacidades líquida y seco Conocer algo acerca de las escuelas es parcialmente cuestión de saber
D-2 Tamaños relativos
M-8 Operaciones fundamentales con qué está pasando dentro de ellas, qué actividades están disponibles para que
D-3 Redondear cifras
D-4 Equivalentes de fracciones, decimales y denominadores compuestos los niños participen en ellas, qué recursos están disponibles para ayudar a los
niños con su aprendizaje y qué nuevas ideas se están desarrollando¡ pero para
porcentajes
D-5 Maneras de realizar los operaciones N-Humerales y sistemos numéricos los padres y para otros ciudadanos interesados es, por lo menos, saber qué tan-
N-1 (ontar to están aprendiendo los niños_ Por ende, en sus relaciones con el público,
fundamentales
D-6 (álculo de resultados de los operaciones N-2 Ordinales cada sistema escolar afron ta el problema de presentarle cierta imagen del pro-
fundamentales N-3 Valor según el lugar y el cero como greso de sus estudiantes.
indicador del valor Un enfoque para reportar el progreso escolar está en función de las com-
H-4 Numerales romanos petencias específicas. La escuela puede reportar: "7R% de los <1Iumnos al final
E- Ecuaciones
N-5 Húmeros pares y nones clel tercer grado son capaces de -identific;r los números por milIares, cente-
N-6 Húmeros positivos y negativos rias, decenas y unidades en un número como el 7562/1; pero este tipo de
F-Fracciones
F- 1 Parles del entero y de un grupo reporte tiene poco significado incluso para un ciudadano informado. La reac-
F-2 Tamaños relativos P-Porcentajes; uso y significodo ción más probable sería preguntar: iY eso es bueno o es malo?, ¡qué porcentaje
F-3 Reducción debería hacer lo mismo?, ¡cómo se comparan estos datos con los del año pasa-
F-4 Términos R-Razones y proporciones do?, ¡cómo se comparan con el pueblo vecino? Si se reportan los aprovecha-
F-5 Maneras de realizar los operaciones mientos específicos, debe haber tantos de ellos que no sólo el maestro, sino
fundamentales también el ciudadano queden anonadados en un conjunto de detalles. Por
F-6 Cólculo de resultados de los operaciones W-Números enteros ende, para reportar al público es necesario hacer un tipo de resumen, el cual
fundamentales W-1 Escribir y leer implicaría por su misma naturaleza, comparaciones; es decir, comparación
W-2 Tamaños relativos con el desempeño del año pasado, con las normas nacionales con algún grupo
G-Geometría W-3 Redondear de escuelas similares o de comunidades análogas. Para un sistema escolar sería
G-1 líneas paralelos y perpendiculares W-4 Participación y medición; pramedios posible diseñar su propio conjunto de instrumentos de evaluación yemplear-
G-2 Reconocer los tipos de los figuras W-5 Operaciones fundamentales: términos los en los años sucesivos, así como comparar el desempeño del presente año
geométricas W-6 Operaciones fundamentales: hechos co,: ~l de los aiios anteriores, pero éste es un tipo de comparación limitado y
G-3 Angulos y triángulos numéricos qUlza n? sea muy satisfactorio para el público_ Normalmente se desea alguna
G-4 Dimensiones, perímetros y áreas de W-l Formas de realizar los operaciones base.mas amplIa para la comparación, lo cual sólo puede suministrarse por
polígonos fundamentales medIO de una prueba para la cual haya datos normativos disponibles. Por tan-
G-5 Parles y óréas del círculo W-8 Cólculo de resultados de los operaciones t?, uno de los papeles significativos de las pruebas estandarizadas es propor-
6-6 Uso del transportador y del compás fundamentales Cionarlas bases por medio de las cuales la comunidad pueda compararse con
ella mIsma, con otras comunidades, así como con el país en su tOtalidad o
como una parte definida de éste.
Un nivel intermedio de comparación es el que hace posible un programa
DECISIONES POLÍTICAS Y PÚBLICAS d~ evaluación a nivel estatal que ha estado en operación en los años recientes.
Cada comunidad está interesada y preocupada acerca de su sistema escO- DIcho programa varía de estado a estado, pero en varios estados los resultados
lar. Los gastos para la educación representan un punto principal en el presu- se reportan a las comunidades locales en una forma que permite a cada comu-
194 CAP. 6. PRUEBAS DE APROVECHAMIENTO ESCOLAR LECTURAS ADICIONALES 195

nidad compararse a sí misma con el estado en su totalidad o con otras comuni- Ebel, R. L.,."Some limitations of critex:ion-referenced measurement", en Bracht, G. H.,
dades dentro de cierto tamaño o tipo dentro de ese mismo estado. Hopkms, K. D. Y Stanley,]. .C. (dlrs.), Perspectives i!1 educational and psycholo-
La prueba que constituye la base más apropiada para presentar los resulta- gical measuTement, Prenuce-Hall, Englewood Chffs, N. ]., 1972, págs. 144-
dos escolares al público es aquella que representa mejor los objetivos educati_ 149.
vos de la escuela_ Por tanto, no hay criterios nuevos ni diferentes para selec- Gaynor, J. Y Milham, J., "Student performance and evaluation under variant teaching
and testing methods in a large college course", en Tournal 01 Educational Psycho-
cionar una prueba diseñada para dar información pública¡ la misma prueba logy,68, 1976, págs. 312-317_
sería la más apropiada y útil para apreciar el nivel de aprovechamiento de cada Hambleton, R. K. Y Novick, M. R., Toward and integration 01 theory and method lor
alumno . criterios-TefeTenced tests, ACT Research Report No. 53, The American CoIlege
Una vez que se haya proporcionado y calificado la mejor prueba, será Testing Program, Iowa City, Iowa, septiembre 1972.
necesario reunir los datos y presentarlos en una forma que comunique clara v Klein, S. P. y Kosecoff, J., Issues and procedures in the development 01 criterion-
fielmente los resultados al público. Lo "fielmente" se relaciona con el grup~ relerenced tests. (TM RepoTt 26), ERIC Clearinghouse on Tests, Measurement
de comparación apropiado, y "claramente" pe relaciona con la forma de pre- and Evaluation, Educational Testing Service, Princeton, N. J-, 1973.
sentación. Las formas en que un sistema esc61ar podría reportar sus logros en Meskouskas, J. A., "Evaluation models for criterion-referenced testing: Views regar-
aprovechamiento al público se consideran con cierto detalle en el capítulo 14. ding ma,stery and standard-setting", en Review 01 Educational Research, 46,
1976, pags_ 133-158.
Millman, J., "Criterion-referenced measurement", en Popham, W.]. (dir_), Evaluation
in education, McCutchan, Berke1ey, Calif., 1974.
PREGUNTAS Y EJERCICIOS $ax, G., nThe use of standardized tests in evaluation", en Popham, W . J. (dir.J, Evalua·
tion in education, McCutchan, Berkeley, Calif., 1974.
l. Elabórese una breve prueba con referencia al criterio, para medir alguna habilidad
específica en aritmética en el uso del lenguaje o en cualquier otro campo, de acuer-
do con las guías dadas en las páginas 168 y 169 de este capítulo.
2. ¿Qué puntuación de la prueba mencionada en el punto anterior aceptaría el lector
como representativa del dominio de la habilidad?, ¡cuál es la base para su deci-
sión?
3. Elabórese una lista de habilidades específicas acordes con la escritura caligráfica.
Diséñese un procedimiento para probar una o dos de ellas.
4. iPor qué una prueba que resultó adecuada para medir el aprovechamiento pasado
tiene un valor limitado para una decisión de colocación?
5. ¿Por medio de qué procedimientos puede una sección de una universidad admitir a
los alumnos de! primer año en un curso de inglés?, ¿cuáles serían los objetivos de
haber seccionado?, ¿qué ventajas y desventajas podrían esperarse?
6. En abril del sexto grado, Elena tenía un equivalente de grado en lectura en las prue·
bas Iowa de habilidades básicas de 6_2. ¿Cómo debería interpretarse esto si su PU
en las pruebas de habilidades cognoscitivas no verbales fuera 85, 115 Y 1351
7. ¿Cómo cambia la respuesta a la pregunta anterior a medida que e! lector cambia de
enfoque: de "desempeño en relación con el potencial" a "desempeño en relación
con el compañero"?
8_ ¿Qué quedaría implicado al preparar una prueba de pericia para reparadores de apa-
ratos de televisión?, ¿qué forma podría tomar esa prueba?
9_ ¿De qué manera un programa de pruebas para evaluar un currículum de matemáti-
cas modificado podría diferir de un programa diseñado para colocar a los estudian-
tes en la sección de matemáticas apropiada?

LECTURAS ADICIONALES

Bloom, B. S., Hastings, J. T. YMadaus, C. F., Handbookon formativeandsummative


evaluation 01 student learning, McGraw-Hill, Nueva York, 1971.
Dustin, D., nS ome effects of exam frequency", en The Psychological RepoTt, 21,
1971, págs. 409-414_ .

. .
PLANEAClÓN DE LA PRUEBA 197

al ¿Qué función o funciones intentan evaluarse con esta prueba?, ¿sirve


para guiar una decisión instruccional inmediata en cuanto a qué ense-
ñar o reenseñar y a quién?, ¿para evaluar un nivel general de compe-
tencia, y tal vez para asignar una calificación?, lPara evaluar la eficacia
de algún segmento del programa escolar?
b) ¿Qué objetivos tratan de lograr el maestro o la escuela en el área que
abarca esta prueba?
e) ¿Qué contenido se ha expuesto en el campo abarcado por esta prue-
7 ba?, ¿qué tanto énfasis se ha dado a cada tema?
d) ¿Qué tipos de ejercicios de prueba pueden ser tanto prácticos como
eficaces para proporcionar evidencia de aprovechamiento de aquellos
objetivos identificados en el inciso b?

Como ya se indicó, el primer punto es aclarar la función para la cual fue


Diseño y construcción diseñada la prueba. Si esa función es evaluar el grado de dominio de alguna
habilidad específica, para tomar una decisión acerca de qué enseñar o estudiar
de una prueba en seguida, una prueba pequeña enfocada directamente a la habilidad, como
la prueba de los números primos o la del uso de mayúsculas (ambas pruebas .
analizadas al principio del capítulo anterior), es la que necesitamos. Como ya
lo enunciamos en los análisis anteriores acerca de las pruebas referidas al crite-
rio, es importante definir precisamente la habilidad que se evalúa, diseñar una
forma de ejercicios de prueba por medio de los cuales la habilidad puede mos-
En el capítulo 6 consideramos los diversos ~ipos de decisiones e.durativas lfárSe de manera simple y eficaz, y estar de acuerdo respecto cid nivei que se
v personales que podrían contribuir en las medIdas de apro:rechamle~,to ac~­ aceptará como indicador de una ejecución satisfactoria de esa habilidad.
démico con una información útil. Para algunas de ellas, !a mformaclOn mas Cuando la función de una prueba es apreciar el nivel general de compe-
recomendable podría provenir de las pruebas estandanzadas empleadas. a tencia de algún segmento más amplio del programa, la planeación resulta
nivel nacional y normalizadas con muestras amphamente representatIvas¡ sm algo más compleja. Entonces es más importante diseñar una propuesta más
embargo, para otras decisiones es ~ás adecuado que el evaluad?r construya completa y razonable de objetivos para ese curso o para esa unidad. Una
su propia prueba. Cuando se necesIta evaluar el gra~o de maestna o de domI- formulación clara de objetivos sirve para guiar tanto a la enseñanza como
nio de una unidad específica que el maestro ha ensenado, para evaluar la com- a la evaluación.
petencia en lo enseñado en un curso ~specífico ,o aprec~ar el progreso haCIa
metas programáticas localmente dehmdas, es mas apr~pIado una prueba que
se diseña en casa de manera particular que una que pudIera encontrarse en los Definición de objetivos
catálogos de los editores. Pero las pruebas diseñadas particularmen.te, ya sea
que las haga un maestro para su clase o sean un esfuerzo cooper~tlvo de un Para u n maestro, un grupo de maestros o cualquier otro grupo que dise-
grupo para darles un uso un poco más amplio, deben ser pruebas bIen hechas. ñe una prueba, el primer paso y el más importante es clarificar lo que se espe-
¿Cómo se puede lograr esto? ra que un estudiante sea capaz de realizar como resultado de un segmento de
Las mejores pruebas pueden ser el resultado ?-~ una ade~ua~a.planea­ la instrucción . Una de las mejores maneras de estar seguro de que se tiene
ció n y de las habilidades necesarias en la preparaclOn de los e¡erCIClOS d~,la una idea clara de lo que se trata de lograr es escribirlo en una forma que es
prueba. A continuación se analizarán estos dos aspectos de la cpnstruCCIOn entendido por los demás. Si e11ector es capaz de hacer esto, puede estar segu-
de pruebas. ro de que tiene la idea bien clara, y si no lo puede hacer, es poco probable que
estas ideas tengan la claridad necesaria para guiar los pasos posteriores para
la preparación de la prueba.
PLANEACIÓN DE LA PRUEBA En casi todos los ambientes educativos se encuentran las propuestas, las
metas y los objetivos de la institución. Éstos normalmente son muy generales
Múltiples pruebas hechas de manera particular tienen deficiencias en su y globales, y se supone que sirven sólo como un gran marco de referencia para
planeación, y algunas carecen totalmente de e.ll~, al empe~ar a redactar los desarrollar los programas, organizar las experiencias de aprendizaje y selec-
reactivos de la prueba. Antes de empezar a escnbIr los reactivos es apropIado cionar los métodos de enseñanza. Incluyen metas tan amplias como "ciuda-
contestar de la mejor manera las siguientes preguntas:

196
198 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PLANEAClÓN DE LA PRUEBA 199
danía eficaz", "uso pertinente del tiempo libre", "habilida~ para emplear el hacer selecc~one~ cOI?venientes de alimentos". En este enunciado, la frase
método científico", etc. Dentro de este marco tan amplIo, el maestro es "tener segundad es Inobservable; es una de las características cubiertas del
el responsable de desarrollar los objetivos instruccionales para un grupo en estudiante. No se puede o~servar ~n sentimiento de seguridad, sino sólo la
particular de individuos en un área de estudio específica. No obstante que conducta y ta~ v~z hacer lllferenCl~s acerca de la seguridad del estudiante.
el maestro puede recurrir a las guías programáticas, a los anuarios de las 4. Los obJetIVOs deben enuncwrse con toda precisión, usando térmi-
asociaciones nacionales, a las taxonomías de los objetivos educativos dise- IlOS 9 ue tienen un s~g!1ificado uniforme. Por ejemplo, en el objetivo
ñadas por Bloom (1956) Y Krathwohl (1964) Y a muchas otras fuentes para 'f EntIende la ~esponsabIlldad de la comunidad en e! control de las enferme-
buscar ayuda en la identificación de los objetivos apropiados, la responsa- dades contagIosas", la palabra entiende significa muchas cosas diferentes
bilidad última para seleccionar estos objetivos para el grupo de estudiantes para ~uchas personas distintas. Para un maestro puede significar que los
a su cargo y anunciar esos objetivos de manera que puedan guiar la instruc- estudIantes son capaces de nombrar diferentes agencias en la comunidad
ción y la evaluación recae en el propio maestro. que tienen la. r:sp.on~a.bilidad de contro}ar las enfermedades contagiosas;
La mayoría de las propuestas de objetivos escritas por los maestros son para otro, qUlza slgmflque que e! estudIante al que se le dé un problema
demasiado vagas y genéricas para ser útiles como guías en la enseñanza y la novedoso ~cerca de una el1:fermedad contagiosa puede identificar la agencia
evaluación . Para servir a este propósito, un conjunto de objetivos debe tener o las agenC13S de la comunIdad apropiadas e indicar los servicios o las accio-
las características siguientes: nes que se pueden esperar de esas agencias.
'! ~~ios términos empleados. P?r los maestros conducen a confusión y
l . Los objetivos deberán enunciarse en términos de la conducta del amblguedad al formular los obJetIvos. Algunos de ellos aparecen enlista-
estudiante v no en términos de actividades de aprendiz aje o propósi tos dos en la ~olumna i~quierda del cuadro 7.1. En contraste, algunos de los
del maestr~-. Por ejemplo, la oración {{Observar las bacterias a través del vanos actIvos que tIenden a enfocar la atención en la conducta de! estu -
microscopio" no es un enunciado satisfactorio de un objetivo. Esto descri- diante s~ muestran sin ningún orden en particular, en la columna derecha.
be una actividad de aprendiza je. ¿Para qué quiere el maestro que los alum- Los plamftcadores de pruebas tienen nuestra aprobación para usar las pala-
nos observen las bacterias en el microscopio ? Un análisis de las actividades bras de la columna derecha, y otras parecidas a ellas, y dejar claro que tales
y los contenidos del curso de estudio en e! que el obj etivo parece indicar amlJigüeJaJes de ios términos no observables como los de la columna
que el m aestro qu iere que el alumno conozca las caracterís t ica s de los orga - izquierda deben evitarse a toda costa . .
nismos que causan enfermedades, y la ob~erva ción de las bacterias, es inci-
dental con este objetivo. Sería mejor enunciar el objetiv o ant erior de la Cuadro 7.1. Muestras de inicios pobres y buenos pora enunciar un objetivo
manera siguiente: Mencione las características de los organismos que cau-
ff
No los use al enunciar
san enfermedades". Recomendados para usarse al
ob¡etivos enunciar ab¡etivas
2. Los objetivos deben empezar con un v erbo activo qu e indiquela con -
ducta que el estudiante de be m ostrar cu ando trate con el co n tenido. Este Comprende ... . Defino ...
formato tiende a garantizar un enfoque acerca del estudian te y lo que él hace. Aprecio ... Dé ejemplos de ..
El objetivo no debería consistir en una lista de contenido; por ejemplo, el Pienso de manero crítico acerco de ... Compare .. .
enunciado: "El escorbuto f el beriberi f la pelagra y el raquitismo son causados Estó consciente de ... Describo ...
por falta de "itaminas en el cu erpofl, es de con tenido f no es u n o bj etivo~ El Siente lo necesidad de .. Clasifique .. .
objetivo podría establecerse de la siguiente manera: "Identifique ciertas enrer· Crece su habilidad paro ... Resuma ...
medades cuyas condiciones están causadas por la fal ta de vitam inas u . . Se familiarizo con ... Aplique en uno nuevo situación ..
3. Los objetivos deben e nul1ciarse en térm inos de con ducta observable Adquiere el significodo dE'; ... Resuelvo un problema en el que ...
del estudian te. Por ejemplo, un objetivo for mulado como Practicar siempre
'f rstó interesado en ... Exprese interés pOL ..
hábitQs de buena salud par a prevenir la difusión de la en fermedad'; no está Siente lo necesidad de ... Digo qué horía en el coso de ...
enunciado en términos observables. La inclusión de la palabra siempre en la
formulació n sign ifica que es imposible reunir evidencia necesaria para juzgar
el logro del estudiante. No siempre se puede estar observando al estudiante.
O tro ejemplo sería el enunciado siguiente: "Po ner lo mejor d e su parte pa;·a 5. Lns oDietivo5 d eben ser unitarios: cada en u n ci ado debe relacionar-
crear una buen a atmósfera emocional durante las horas de las comidas en el se eon u n solo proceso. Por ejemplo, el obietivo "Conoce los principi os ele-
hogar" . La conducta especifica da en este enunciado ocurre en una situación mentale.s de ja inmunización y la acepta voluntariamente" contiene ~lo,) pro-
fuera d{; la escuela, en la que el maestro no tien e la posibilidad de observa.r al ceso;:; : uno cognosci tivo de recordar una información v otro afect ivo de
estudiante . Es poco probable que él vaya a obtener evidencia adecuada acere,l aceptación de una acción. Ambos procesos son diferen tcsy requieren dis tin -
del logro en e.st,= objetivo. (Jtr o e jem plo es el enu n ciado "T ener seguridad p?.ra tos prOCC60S j~v al uatiy"o s p ara obtene r L~. evidencj.a de su. 1.ogre. Si ~.lT;.bos son

-
200 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PLANEAClÓN DE LA PRUEBA 201
objetivos instruccionales importantes, deberían enunciarse como dos objeti- semanas para una clase del octavo grado. En el cuadro 7.2, la primera colum-
vos separados_ " . na muestra los objetivos como aparecen en la descripción del curso del maes-
6. Los objetivos deben enunciarse al mvel apropwdo de gen~rahdad. tro; la segu?da indica ~a~ deficiencias (s! es que las hay) de cada objetivo, y la
Por un lado, el enunciado de un objetivo no debería ser tan general nI tan glo- tercera sugICre las reVISIOnes de los objetivos donde se necesitan.
bal como para que pierda su significado, ni por el otro lado, ser tan estrecho y
específico que el proceso educativo parezca estar constItUIdo de :pa~tes aJsla- Cuadro 7.2. Objetivos poro una unidad acerco de lo nutrición para uno clase de! Qctavo
das de información. En este último caso, una lista adecuada de obJetlvos sería grado
demasiado larga y dispersa para emplea~se de manera efic~z. P~r ej~mplo, ~!
objetivo "Conoce la nutrición" es demasIado vago para s~r:vlr a nmgur: propo- Objetivos como se
sito útil· asimismo una serie de enunciados como "IdentifIca la funclOll de las escribieron originalmente en
proteín~s en el cuerpo", "Identifica. la función de las g,;a~as ene~ cuerpo", una guía programática Comentarios Revisión sugerida
"Identifica la función de los carbohldratos en el cuerpo, IdentIfIca la fun-
ción de las vitaminas en el cuerpo" e "Identifica la función de los minerales en
l. (onoce los términos y el 1. lo palabro "conoce" 'es l. Recuerda o reconoce definiciones
el cuerpo" no sólo se convierte en una lista aburrida de leer, s~no que es inne- vocobulario empleado en
cesariamente específica. En un nivel apropiado de generalIdad, todos los vago. ¿En qué nivel se de términos y de vocabulorio
lo nulrición supone que el
enunciados específicos podrían combinarse en un solo enunCIado que se leye-
ra del modo siguiente: "Identifica la función de las cinco clases de nutrientes estudiante los conoce?
en el cuerpo". . 2. Tiene un conocimiento 2. ¿Oué es un
7. Los objetivos deben representar los resultados dIrectos deseados en 2. Recuerda o reconoce nombres
rudimentario de los "conocimiento de los nutrientes esenciales y
una serie planeada de experiencias de aprendizaje. Por ejemplo.. es obvio nutrientes alimenticios y rudimertario"7 ¿Oué de sus funciones en el cuerpo
que nunca se debe escribir como un objetivo educativo para los niños del octa- de sus funciones clase de conducto
vo grado el enunciado "Incrementa su est~tura", s:mplerr~ente~orq~s las ins-
muestro un p.~tlJd¡on!e
trucciones para la salud no Llenen el plOpOSll0 de nJcef>J lOS mnos oel octavo
que tiene un
grado más altos. De manera análoga, es común encontrar enunciados de obje-
"conocimiento
tivos que tratan con actitudes en los programas para los cuales no se han
rudimentario"?
hecho esfuerzos instruccionales particulares haCIa el desarrollo de actltudes.
En estos casos! el objetivo que concierne a las actitudes debe!ía omitirse o la 3. Valoro lo protección de 3. El término "volora" es
instrucción debería rediseñarse de tal manera que la atenClOTI se dedlque al 3. a) IdenJifica buenas fuentes de
lo salud provista por vugo. ¿Cómo difiere este varios nulrientes alimenlicios
cambio de actitud. Esto nos per-mite observar que la clarificación de objetiyos buenos hábitos dietélicos objetivo de los objelivos b) Identifica los efectos de dietas
puede influir no sólo en los procedimientos de evaluación! sino también en la
7. 9, 11 Y J3? pobres
forma del contenido de la instrucción. 4. Comprende el proceso 4. El término "comprende" 4. a) Identifica partes del sistema
8. Los obietiFos deben ser realistas, en términos del tiempo disponi- de lo digestión
ble para la eIlSeíianza y las caracterlsticas de Íos est,udiantes. Un eiemplo es vago. ¿Cómo muestra digestivo y las funciones de
de objetivo irrealistJ sería "Comprender lab razones de por que las personas un estudionte que codo uno
se vuelven drogaJictas", ),a que oaale SJ be por qué las personas ~se convier- comprendió? b) Identiíico los procesos de la
ten en drogadictas; por tanto, es imposible enseil,n nada para alcan::ar eSe digestión paro codo nutrien.te
objetivo. e) Reconoce factores que inlertieren
Otro ejemplo de un objctiyo que terminaría por ser irreal para 105 niños con lo digestión
5. Planeo sus comidas y 5. Objetivo bien enunciado. 5. Sin revisor
del OCtavO grado dice: "Entiende los principios de la inmunización". Los prin-
cipios de la inmunización son extremadamente complejos, y entender Lt sus refrigerios, paro lo Lo conducto deseodo del
naturaleza de la inmunización está probablemente mas allá del niycl de expe- cuol oplico los principios estudiante queda cloro;
ri.encias de estos estudiantes. Este objetivo oeberÍ:! reexaminarse y probable- de la buena nutrición enunciodo en un nivel
men te reenunciarse en la forma del conocimiento de diferentes tipos de imnu- de generalidad apropiado
nización, o de conocer algunos métodos empleados que se han diseiiado para 6. Se do cuenta de que 105
inmunizar a las personas contra algunas enfermedades. 6. El término "se do 6. Identifico factores que influyen
patrones de alimentación cuento" es vago. El en clases y cantidades de
difieren en varios partes objetivo es muy especifico alimentos que lo gente (ame
Ahora examinaremos un ejemplo real de un conjunto de objetivos que de Estados Unidos y del
fueron preparados para una unidad de nutrición con una duración de selS mundo

-
202 203

Cuadro 7.2. (Continuación) Cuadro 7.2. (Continuoción.)

7. Tiene voluntad de 7. Lo voluntad poro hacer 7. Selecciona un desayuno b) Identifica los fuentes de
seleccionar uno dieto oigo quedo encubierto. adecuado en la cafetería es(olor información autorizados
adecuado Se puede observar si el acerco de lo alimentación y
estudiante hoce algo, los dietas.
pero no si tiene 13. Aprecio estor saludable 13. El término "aprecio" es 13. Eliminar el objetivo
voluntad poro hacerlo ·vago. ¿Qué conducto
debe mostrar un
8. Comprende que lo guío 8. Lo último parte del 8. Eliminar el objetivo estudiante cuondo
poro el alimento diario objelivo es un hecho aprecio estor sano?,
esló basado en lo específico. ¿Qué es lo ¿cómo se enseño o un
investigación científico que debe comprenderse? estudiante o que aprecie
Lo porle esencial del estor sano?
objetivo eslá. incluido en
el objetivo 12

9. Uso lo información 9. ¿No lo hoce lodo lo 9. Eliminar el objetivo Como se puede ver, los ' objetivos estuvieron escritos originalmente
acerco de ia nuirición genie? Esto es uno con muchas fallas, pero la lista revisada de objetivos proporciona una
diario esperanzo más que un mejor guía tanto para la enseñanza como para la evaluación. Las revisiones
objelivo. Véase el de los objetivos se hicieron después de estudiar la guía programática deta-
comentario del objetivo 3 llada. Los objetivos eliminados fueron aquellos para los que no se daban
experiencias de aprendizaje específicas en la guía programática.
10. Persuade o otros 10. ¿Es esla razonable?, 10. Eliminar el objetivo
miembros de lo familia ¿cómo se puede obtener
o desarrollar buenos evidencio de que este Especificación dd contenido que debe abarcarse
hóbitos nulricionales objetivo se ha logrado?,
¿es éste el resultado Cuando el propósito de una prueba es apreciar lo que ha aprendido cada
directo de lo enseñanza? estudiante de una sección principal· de un curso o de un programa, un segun-
do paso en la planeación de la prueba es especificar el contenido que debe
11. Reconoce los follas en su 11. Obietivo doble; contiene 11. Eliminar el objetivo abarcar. El contenido es importante porque constituye el ':chículo por medio
diela y deseo eliminarlas do~ conductos diferentes. del cual se logran los objetivos procesados. Si un maestro ha diseñado una dc.s-
Lo primero parte de cripción detallada o una serie de lecciones como plan para un curso, esto,>
este objetiVO . materiales podrían guiarlo en cuanto a las especificaciones del contenido. De
corresponde o los otra manera, una descripción de contenido debería prepararse con base en las
objetivos 2 y 5, Y ia secciones apropiadas de un libro de texto o de una guia programática. o el
segunda al 7 constr;.lCtcr de pruebas puede indicar el contenido que debe abarcarsc con
sólo marcar las secciones apropiadas en el libro de texto.
12. tstá consciente de que 12. Ei término "esté 12. al Distingue enunciados acerco
los enuncias y los consciente de- es vago. de los alimentos y ias
piOpagandos ¿Qué conductos debería dietas que estón bosados en Preparación del plan de la. prueba.
comemientes a ia mostrar el estudiante? una buena evidencio
ai¡meilTaci6n nc: siempre científica de aquellos que no El contenido y una propacsta de lot: objetivos' de pr!)I:CSO rcprcscn r<.li1 L.'::;~
están basndss ~n hechos !o estón dos dirnensioncs en las CT-:'C. debe diusí:~lr) c 1~n plan de prl.i. cb ;,l il¿1r~l u rt.;). '::'C:>

.... : . .... .
• • = . . . . . , •• ••.. '.
:..',~.I: ', ' ". ¡ ...
204 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PLANEAClÓN DE LA PRUEBA 205
ción principal de un curso o de un programa. Estas dos dimensiones necesi-
tan ponerse juntas para mostrar qué objetivos se relacjonan específicamente como no solamente a la preparación de una prueba sobre ba 'l·d .
.'1 - d . ses so 1 as S1l10
con qué segmentos del contenido y para proporcionar un marco de referen. tamblen a a ensenanza e la umdad en sí misma Una vez qu '1
. 1 b· d ,. e estos panes
cia completo para el desarrollo de la prueba. Al hacer la planeación para la estan comp etos y len prepara os, podran usarse hasta que se h
evaluación total de una unidad, el maestro haría bien en elaborar un plan ' f · 1
bios de en aSlS en e programa o que cambie el programa mismo
agan cam-
que abarque a todos los objetivos y añadir una columna a ese plan, indican- El examen de dICho plan alll~gar a este punto debería dejar clar~ ai lector
do el método o los métodos que se emplearán para evaluar el progreso del que cualqUIer prueba puede ser solo una muestra de conductas del est d·
· d I ·d . d U lante
re laCJO l1a as clon e Contem o re~Isa o en la clase. Primero, los obietivos
1
estudiante hacia el logro de cada objetivo. Sin embargo, al elaborar el plan
preliminar para una prueba, sólo deben incluirse aquellos objetivos que pue-· mclUl dos en e p l an representan solo aquellos que son adecuados pa _
. b d 1 1 1' · ra apre
dan evaluarse de manera total o parcial por una prueba de papel y lápiz. Cl~rse en ~na prue a e papel y ~pIZ . Segundo, las entradas en las celdillas
En una lista de objetivos, cualquiera de ellos que requiera un pro<;eso cog- baJO cada area de contemdo son ejemplos qUe muestran pero no d
. 1 ·d 1 , e manera
noscitivo puede evaluarse por medio de una prueba de papel y lápiz_ Estos SOn ex haustlva, e c<?ntem ? .tota - Tercero, e:x:iste un número ilimitado de pre-
objetivos que especifican procesos, tales como recordar, reconocer, identifi· ~untas q~e podnan escnblrse para el m.atenal que queda incluido en el plan. El
car, definir, aplicar, analizar, sintetizar, generalizar, predecir o evaluar. En la tiempo dlspon!ble pa~a l.a prueba es SIempre limitado y solamente se puede
lista de los objetivos revisados del cuadro 7.2 todos ellos, excepto el 7, pueden formular un ~umero lImItado de preguntas de todas las posibles cuestiones. Si
evaluarse por medio de una prueba de papel y lápiz. El objetivo 7 no se puede se qu!ere que la prueba refleje exacta y verazmente el énfasis en las metas de la
evaluar así porque implica la selección real de los alimentos. La medida en que ensenanza, el constructor de pruebas deberá escoger cuidadosamente la mues-
este objetivo se ha logrado se puede determinar sólo por la observación siste· tra de ~eactlvos que representen el dominio que se evalú a.
mática de los estudiantes en la cafetería de la escuela. Ej.emplos de otros tipos A fm de compl~tar este plan de prueba de manera que sea una o-uía ade-
de objetivos que no pueden evaluarse por medio de pruebas de papel y iápiz cuada para constrUlrla y que realmente represente el énfasis de la en~eñanza,
son aquellos que implican conductas afectivas, tales como intereses v actitu· el constructor de la prueba debe dar alguna respuesta a cada una de las siguien-
des, es decir sentimientos favorables o desfavorables hacia un objeto, un. gru- tes cuestiones, antes de escnblr los ejercicios de la prueba.
po o una institución¡ este tipo de objetivo debe e\T3.!u~rse por medio de 105
autorreportes o la observación, y el maestro debe tener presente que ninguna aJ ¡Cuál es el énfasis relativo que debería recibir cada área de contenido v
prueba simple o ningún instrumento de evalu ación pueden medir todos los c~?a objetivo de proceso en la prueba? En otras palabras, ¿qué propo¡:-
objetivos que esté tratando de lograr. ~lon de todos los reactIVOS de la prueba debería escribirse para cada
En el cuadro 7.3 se muestra un plan para un examen final acerca de la area de _contemdo '/, dentro de cada área de contenido para cada obJ·e-
salud dirigido a una clase del octavo grado. Tal como ha sido planeada, con las Uva del proceso? '
especificaciones de que debe. contener 60 reactivos, este ejemplo se basa en bJ ¡Qué tipo de reactivos sería el más apropiado para utilizar en la
una decisión de que la prueba está diseñada para con tener respuestas cortas o prueba?
bien una prueba objetiva con un gran número de reacti\"os separados. Espe· el ¡Qué ,tan larga debe ser la prueba?, ¿cuántos reactivos o preguntas
cialmente para este tipo de prueba es muy útil un plan formal; sin embargo,la debena tener la prueba completa?, ¡cuántos reactivos deberían escri-
sel ecc ión de cinco o seis preguntas para una prueba de ensayo podría tambicn bme para cada celdIlla del plan?
mejorarse por la clase de pensamiento que conduce a la formulación de un dJ iCuá~ sería la dificultad de los reactivos para lograr adecuadamente el
plan . Los puntos implicados en la decisión acerca del tipo de ejercicio de prue· propOSIto de la prueba? .
bas que se debe usar se considerará más adelante (cuadro 7.4, página 2511
En el pian, los objetivos de proceso tanto para la unidad de nutrición
como para las otras unidades aparecen en lista en la columna izquierda. Los Determinación del énfasis relativo
títulos de cada una de las tres unidades se han centrado como encabezados de las áreas de contenido de los
en bs otras columnas. Cada caja o celdilla contiene cntradas que se relacio· objetivos del proceso
nan con el objetivo opuesto a la celdilla, baio el encabezado de ia unid,¡d. El
plan completo especifica el contenido que se ha estimado importante e indica lo d L? proporción de la.s pre~untas de la prueba en cada área de contenido
que sc espera que el estudiante sea capaz de hacer con el contenido. ebena corresponder al enfaslS mstruccional dado al tema y la proporción de
La preparación de esta descripción bidimensional es una tarea exacta ~:~c:i:~s que se reqUleren para cada objetivo del proceso'debería correspon-
que requiere mucho tiempo. El maestro de clases, por lo general tan ocupa· ceso a ImPI°rtanCla que el eon~tructor de la prueba considera que tiene el pro-
do, suele quedarse corto para lograr un análisis tan comp1eto¡ sin embargo, que s~ t~a e I1lvel de los .estudIantes que van a ser evaluados. Las decisiones
no queda la menor duda de que intentar el análisis lo llevará muy lejos en tivas El m~n al elaborar las preguntas de la prueba son necesariamente subje-
cuanto a la clarificación de sus objctivos de una unidad en particular, .¡si
man~en prtcIplO en qu~ se basan ~stas decisiones es que la prueba deberia
er e mIsmo eqmIrbno en el enfasls relativo tanto del contenido como
N
Cuadro 7.3. Plan preliminar poro el examen final en lo materia de salud poro alumnos Q
del octavo grado Q'I

Áreas de contenido

B, Enfermedades C. Enfermedades Húmero


Objetivos contagiosas, 40% no contagiosas, 20 % de reactivos
del proceso A, Nutrición, 40%

Nutrientes Proteínas incompletos Inmunidcul Epidemias ,Gota


1, Reconoce términos y Enfermedades de deficiencia
Vitaminas Proteínas completos Virus Patogenia
vocabulario Diabetes
Enzimas Aminoácidos Portador Endemia
Antícuerpos Protozoarios Enferinedades cardiovasculares
Metabolismo Glicógeno
Oxidación Carbohidratos Periodo de incubación Caries
Cuatro o cinco reactivos Dos o tres reactivos 12
20% Cuatro o cinco reactivos

Nutrientes esenciales para lo salud Enfermedades contagiosas Enfermedades específicos


2, Identifico hechos causadas por falto de
"
específicos Buenos fuentes de nutrientes alimenticios comunes
Portes del sistema digestivo Incidencia de varios vitaminas
Procesos de digestión de codo nutriente enfermedades Desórdenes específicos
Fuentes de información acerco de los Métodos de dispersión de los causados por desequilibrios
alimentos y lo nutrición enfermedades hormonales
Tipos de inmunización Incidencia de enfermedades
Síntomas de enfermedades no contagiosos
contagiosos comunes Enfermedades no contogiosos
comunes en los
adolescentes y en los
adultos jóvenes
Siete u ocho reactivos 1res o cuatro reactivos 18
30% Siete u ocho reactivos

Soses poro uno dieto bien balanceada Principios en los que se basa Presión dentro del sistema
3, Identifico principios, cardiovasculor
conceptos y Reocciones enzimóticas . el control de las
\ Qene,a\i'Z.o c\Qt'l8'So lran$feren do de materiales
Mn,,,o.,.,, .. ",n .. .. h.tn.
entre celulas enfermedade s
1\ .. .. ¡ n. H~ .. "ro In .. ~I", i h ; ... ,i r o ...
(ontrol d. lo diob.t.s
II, ) '*OI I(' ¡" ti ... r o ,u/ ;e-;n,I(' ''¡ I
,
)
r r

,
.

30%
¡ Funcione, de lo, nul,ienres en el (uerpo

Siete u ocho reoctivos


I
Defensa, corporales (Onlla la
enfermedad
Reacciones de inmunidad en
el cuerpo
Siete u ocho reactivos
(reümiento anolmal
células
de la;
\
1res o cuatro reactivos lB
. ' . ~'

. 4, Evalúo la información y
la publicidad acerca de
lo salud
Analizo los anuncios de alimentos y de
dietas
Interpreta las etiquetas de los alimentos
Distingue entre evidencias
adecuadas e inadecuadas
Identifico errores que pueden
conducir a uno información
poro las medicinas falsa en el material de lo
. Identifico buenas fuentes de información
acerca de los alimentos y las dietas
Identifica los anuncias de
medicinas que pueden estor
salud
Identifico fuentes apropiadas
equivocados de información para los
' . .~ problemas de la salud
10% Dos o tres reactivos Dos o tres reactivos Uno o dos reactivos 6
5, Aplico los principios y Identifica las dietas bien balanceadas Reconoce las condiciones que Predice los consecuencias de
los generalizaciones a Calculo las calorías necesarias poro una probablemente resulten en combios en lo secreción
situaciones novedosos dieta de ganancia o pérdida de peso un incremento de de ciertos hormonas
Predice los consecuencias de los cambios enfermedades contagiosos Predice la probabilidad de
en los enzimas del sistema digestivo Identifica los métodos heredar condiciones
.- Identifica los servicios y lo protección apropiados paro esterilizar anormales
provisto por el Acto Federal de los objetos
,-
Alimentos y Drogas Proporciono los rozones
apropiados paro los
, . regulaciones, los procesos o
los tratamientos
10% Dos o tres reactivos Dos o tres reactivos Uno o dos reactivos 6
". ",' Número de reactivos 24 24 12 60
" Tiempo total paro resolver la pruebo: 90 minutos N
,; ...:. Total de reoctivos: 60 Q
~

t'
208 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PLANEACiÓN DE LA PRUEBA 209
del proceso mental que el maestro trata de logra.r por medio d~ l~ instrucción. influir en Ja decisión, son el contenido y la habilidad del maestr _
La elaboración de diferentes cantidades de reactIvos para los dIstmtos temas y truir los dIferentes tIpOS. o para cons
objetivos del proceso es una forma (y quizá la más deseable) de ponderar los
temas y los objetivos diferencialmente. en la prueba. . .
Ponderar tanto las áreas de contemdo como los obJetIvos del proceso se Determinación del número
hace inicialmente por medio de la asignación de porcentajes a cada ~rea de total de reactivos de la prueba
contenido y a cada objetivo del proceso, de tal manera que el porcent~Je total
a lo largo de las áreas de contenido sume lOO y el total de los porcentajes para
los objetivos de proceso también sume 100. Ez:t ,el plan que se muestra el el: El const~,!-ct~ro de la pf1 eba debe decidi!, el ?úm~ro total de reactivos para
7
cuadro 7.3, el constructor de la prueba decIdIO que el tema A, NutnclOn, la mIsma. SI ~1 ma...stro dec"de usar el tIpO de eJerCICIO de ensayo que req '0 ó

debería tener un peso de 40%¡ el tema B, Enfermedades contagiosas, debería '1 d"
re~pues t as ex t ensas, s~ o ten ra tIempo para unas cuantas preguntas. Cuanto
UI ...r '-'
también recibir un peso de 40%, yel tema C, Enfermedades no contagic:sas, mas elaborada se reqmere que sea la respuesta, menor será el número de _
un peso de 20%. Ya que el tiempo de instrucción tanto del tema A como del B . •• b - 40 . reac
0;05: por ~,anlo, una prue a dt:; mmutos en la escuela secundaria tendría
fue de 5 semanas y para el tema C sólo 2 semanas, la distribución de los por- solo Lr~s o cl!atro preguntas, caaa una de las cuales requeriría una respuesta de
centajes corresponde cercanamente al tiempo de enseñanza. ~na O dO,S pagmas mIentras ~ue un examen de tres horas en una escuela supe-
Para los objetivos de] proceso del cuadro 7.3, el constructor de la prueba nor pue?e t~ner el;nIsmo numero de preguntas pero requerir respuestas muy
decidió que el 20% de todos los reactivos deberían distribuirse para ~l objeti,,~o elabora~.as. tI equlilbno de esta seCCIón supone que el constructor de pruebas
1 el 30% tanto para los objetivos 2 y 3, y ell 0% tanto para los objetIvos 4 y J . h~ declmdo usar ~a respuesta Corta o los reactivos de objetivos, y considera el .
E~tas distribuciones implican que el maestro ha puesto más énfasis en la ense· numero de reactIVOS oentro de este contexto.
ñanza de los objetivos que se relacionan con la memorización y el recuerdo de . El número to~al de reactivos ~ncluidos en una prueba debería ser lo sufi-
términos, hechos específicos, principios, conceptos y generalizaciones. En clentement~. granae pa~a proporClünar una muestra adecuada de la conducta
otras paiabras, el interés se ha puesto primordialmente en el incremento dei de los estudIantes a lO largo de las áreas de contenido v OP. loe; nhiPtivAC rlQJ
fundamento de conocimientos de los estudiantes, y se ha dado menos aten- proc~so. Cuanto más grange sea el número de áreas de ~o~te~id~;:d~'o~bi~i:
ción a la habilidad de los estudiantes para usar esta información en situacio- vos del proce~o que se medIrán en una prueba, más larga será ésta. Úna p~eba
nes novedosas. Si ia distribución de reactivos de los objetivos de proceso ver- 5~mana¡ p~eGe seruna prueba cc:~ta~ porque tanto el contenido como los obje-
daderamente reflejara el énfasis del maestro puestO en la enseñanza, entonces tIVOS por evaluarse son bastante lImItados, mIentras que una prueba bimestral
esta distribución sería apropiada. Podríamos cuestionar el énfasis del maestro o un eX,arr;en fmal deben t~ner un número más grande de reactivos porque tie=
puesto en la enseñanza, pero, dado ese énfasis, no podemos decir que la distri- nen ma.s areas c:Je contemdo y más objetivos por evaluar.
bución de los reactivos de la prueba sea inadecuada. El tI:mpo ~Isponible para .la aplicación de la prueba es un factor práctico
que hmILa el numero de reactIVOS en una prueba. La mayoría de las pruebas
hechas por los m~estros deben ser ~ruebas de. c~mocimientos y no pruebas de
Determinación del tipo o los tipos veloocIdad¡ es dec!r, deben tener el tIempo sufICIente para que por lo menos el
de reactivos que deben usarse 80Yo de los estu~Jantes puedan contestar cada reactivo. Existen pocas áreas en
1;,
la~ que v~locIdad de l¡¡ ~espuesta es un aspecto relevante del aprovecha-
Hay un gran número de reactivos diferentes que pueden usarse en una mIe~to , Ll nu~e.ro de reactIVOS de una prueba que puedan preguntarse en und
prueba hecha por el propio maestro . Cada tipo de reactivos puede pertenecer cantIdad espeCIfIca de tIempo depende de múltiples factores, tales como:
a dos categorías principales: al el tipo en el que el estudiante produce su pro-
pia respuesta, y b) el tipo en el que el estudiante selecciona su respuesta de l. El tipo de reactivo que se usó en la prueba. Es probable que un reacti-
una serie de opciones proporcionadas por el constructor de la prueba. Los vo d~ resp~est:l corta en la que el. estudiante tiene que escribir su respuesta,
ejemplos del primer tipo son las preguntas de ensayo que requieren u.na res- reql!~ere ~as. tIempo que un reactIvo de enunciados falsos o verdaderos o dé
puesta extensa por parte del estudiante, la pregunta de respuesta corta que OpClOn multlple, en la que se requiere que el estudiante solamente escriba O
requiere sólo una o dos oraciones pará su respuesta, y el reactivo de #c.or.ple- marque el numero o letra que indica su respuesta.
tamiento" que requiere sólo una palabra o una frase para la respueSla. Los mer 2. La ~dad y el nive! ~ducativo del estudiante. Los estudiantes de los pri-
ejemplos del segundo tipo son las respuestas alternativas, tales como los a d os graoos cuyas. hablhd~des para la lectura y la escritura apenas empiezan
Quee~arrollars~ reqUIeren I?as tiempo para contestar los reactivos de la prueba
enunciados falsos o verdaderos, los reactivos de opción múltiple y los reacti-
vos de correspondencia. ?~ estudIantes que
La decisión acerca de qué tipo de reactivo se debe usar depende en gran Los mnos ' - tienen habilidades
. más desarrolladas en estas áreas .
tos al ' mas pe9.~enos tampoco t~enen la habilidad para permanecer aten-
medida de los objetivos del proceso que se midan. Otros factores que pueden a mIsma actIVIdad durante penados muy largos. Por tanto, el tiempo de

-
210 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PlANEAClÓN DE LA PRUEBA 211
aplicación de la prueba debe ser menor para ellos, lo cual a su vez reducirá el
número de reactivos. debe~ían ser del tema A, 40% (?tros 24 reactivos) del tema B y el 20% (12
3. El nivel de habilidad de los estudiantes. Los estudiantes con altos reactlvos) del te~a q. Estos numeros aparecen en el renglón inferior del
niveles no sólo tienen habilidades para la lectura y la escritura mejor desarro- plan. El porcentaje aSlg~ado a cada objetivo del proceso se multiplica po el
lladas que los estudiantes con pocas habilidad:s, sino ~ambién ge~eralmente núme!o total. ~e reactIvos p~ra determinar el número de reactivos :ue
tienen mejor dominio de la materia de estudlO y mejores habIlIdades para debenan escnbrrse para medIr cada proceso; así obtenemos los números
que aparecen e~ la colu~na del extremo derecho del plan . .
resolver problemas. Como regla general. los estu~iantes con gran hab!lidad
pueden contestar más preguntas por umdad de tlempo que los estudIantes . Para dete~mmar el numero d~ reactivos ,de cada celdilla del plan, multi-
con poca habilidad de la misma edad y del mIs.mo g~ado. . pl~camos el numero. to.tal de reactIVOS e? un area de contenido por el porcen-
taJe aSIgnado al. objetIvo en cada reglon; por ejemplo, para determinar el
4. La longitud y la comp1eiidad del reactIVO. SI los reactIVOS de pr~:­ número de reactIVOS para la primera celdilla bajo el tema A Nutrición mul-
ba se basaran en un pasaje de lectura, en tablas, en un mapa o en un~ graf¡-
tiplicamos 24 por 0.2 (20%/,10 cual da 4.8 reactivos. Debido a que el ¿úme-
ca se debería permitir a los alumnos más tiempo para leer y exammar el ro 4.8 se encuentra entre el4 y el 5 / ~ebemos notar que tenemos que escoger
m~terial de estímulo. Cuanto más material de estímulo de este tipo se pro- entre 4 o 5 para aba.rcar este contemdo y este objetivo. El número de reacti-
porcione en una prueba, menos reactivos se podrán preguntar en Cierta vos en las otras celdIllas del plan se obtuvo por medio del mismo proceso. sin
cantidad de tiempo. . embargo, ?ebe reco~ocers~ que los resultados de ciertos procesos pu:den
5. El tipo de objetivo del proceso a ser eva1~a~0 .. Los reactivos que estar relacIonados pnmordIalmente con determinados aspectos del conteni-
requieren sólo memorización pueden cont~st~rse mas rapld.ame~~e que aque- do. Por tanto, en un examen de ciencias sociales, un objetivo que se relacio-
llos que requieren la aplicación del conocl~mento a un~ sltuaclOn nueva. ne con la lectura de un mapa puede ser evaluado en una unidad de contenido
6. La cantidad de cálculo o de pensamIento requendo para contestar el acerca de rec~rsos naturales, más que en una de recursos humanos. Esto
reactivo. La mayona de los individuos trabajan con más leI?-titud cuando tra- pue~e condUCIr a que el constructor de la prueba modifique la entrada a las
tan materiales cuantitativos que cuando tratan con matenales verbales; por celdIllas, de tal ~anera que se puedan ajustar a estas congruencias particu-
tanto, si los reactivos requieren un cálculo matemático, de~erá permitirse lares del contemdo y del proceso. Más aún, probablemente sea deseable indi-
consumir más tiempo por reactivo que para contestar el reactIvo puramente car el ran~o de n~activos para cad~ ~eldilla, como en nuestro ejemplo, para
verbal. dar fle?nb¡]ldad s~ se encue~tran dIfIcultades al escribir reactivos aceptables
para clert~s celdIllas. El numero de reactivos planeado para cada celdilla
Es imposible dar reglas seguras y concretas ac~rca del n.úmero de reactivos debe conSIderarse I?ás bien co~o una guía, no como una regla.
que deben incluirse en una prueba para ci:rta canud,ad ~e tlempo. Un n:aestro Cuando se escnban los r.e actlvos de una prueba, será mejor escribir cada
que se familiariza con la clases ~e es~udlantes ser~ mas cap~z de estImar el uno por separado en una tarjeta de cinco por ocho centímetros o en una tira
número de reactivos que puede mclUlr en de~ermmada cantIdad de tI~~po. de papel. Esto hace más fácil tanto la revisión de los reactivos como descartar
Como una regla no escrita bastante aproxImada, los estudJantes tlpICOS algunos '( reorden~r1os para acomodarlos enla prueba. Después de que todos
requieren de 30 a 4S segundos para leer e intentar dar una respuesta a ~n reac- los reactIVOS han SIdo conshuidos, el maestro deberá hacer una verificación
tivo de opción múltiple que trata de un hecho SImple o a un e~uncrado de final por medio de ~gualar los reactivos al plan de prueba, para estar seguro de
falso o v erdadero, y requieren de 75 a 100 segundos para leer e Intentar dar que la prueba se ajusta a su plan. .
una respuesta en un reactivo de opción múltiple bastante complejO que re·
quiere la resolución de problemas. La ca!lt.Idad total de tIempo que se
requiere para un número de reactIvos sufICIente para dar una cobertura Determinación del nivel apropiado
adecuada del plan de una prueba, algunas veces puede ser mayor que el de dificultad de los reactivos
tiempo de un periodo de clase. La solución más satisfactoria a este proble·
ma es dividir la prueba en dos o más subpruebas separadas que se puedan
aplicar en días consecutivos. La decisión final qll:e debe tomarse en la planeación preliminar para una
Para el examen final ejemplicado acerca de la salud para los alumnos prueba, trata 1~ conce.n:nente aJa di~icultad deseada de los reactivos de la prue-
del octavo grado, el maestro tenía 90 minutos para aplica~ l~.I:rueba. Al ba. Una vez.mas, la dIfIcultad ImplIca algo diferente para una prueba de ensa.
considerar todos los factores mencionados, el maestro decIdlO mclUlr 60 yo q~e ~eqUIere una respuesta extensa, que para una prueba de respuesta corta
preguntas en la prueba. Ahora reconsideraremos e~ plan para deter~Illar u obJetIva. Una pregunta de ~ificultad apropiada para un reactivo de ensayo
cuántos reactivos debieron escribirse para cada celdIlla del plan. Lo pnme· es aquella para la que cada mIembro de la cIase puede producir algún tipo de
resp~esta que muestra, por lo menos, un conocimiento mínimo del tema, y
ro que debe hacerse es determinar el número total de reactivos para cada
área de contenido y para cada objetivo del proceso. El p~an del cuadro 7.3 qu~ mduzca respuestas que varíen en grados de complejidad y organización
especifica que el 40% de los reactivos, o sea, 24 reactIvos (0.40 X 60/, de Ideas. En el caso de un reactivo objetivo, la dificultad tema definición más
estrecha y se puede definir como el porcentaje de examinados que contestan

.-"¡ ;" ~ .' . ~ . :.', ' -", .'. .. .~ " '. . ..''., .,,:
212 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PLANEACIÓN DE LA PRUEBA 213
correctamente un reactivo; por ejemplo, si un reactivo particular en una prue- calificación promedio para todos los estudiantes fue d 25 .
ba es contestado de manera correcta por el 40% de los estudiantes evaluados, Da~o que e~ .promedio de calificación para el gru o fue ~eactIvos correctos.
diremos que el reactivo tiene 40% de dificultad.
La dificultad promedio más adecuada y la dispersión de dificultad de
tema ~na dIfIcultad promedio de 50% (25/50 =p 50o/c) ¿
de 50, la prueba
este met~do para expresar la dificultad en términos o e~~ci:ando se emplea
los reactivos de la prueba dependen, en gran parte, del propósito de la prue- porcentaje de todos los estudiantes que contest Pb. nales, es deCIr, el
. . aron len un react · h
ba. Cuando una prueba se diseña para medir la maestría o el dominio de encontra d o que e1 SIguIente esquema proporciona una ;VO, se a
los puntos básicos del área, las preguntas deberían estar limitadas a esos constructor de pruebas con el fin de empezar a p 1 buena gula para el
. d·f· reparar as pruebas q
puntos básicos. Si se ha enseñado bien una unidad, tOdos los reactivos tienen 1 erentes tIpos de reactivos (Lord, 1952). ue con-
resultarán muy fáciles para el grupo . En este tipo de pruebas, un maestro
podría esperar tener puntuaciones perfectas o muy cercanas a la perfección
para la mayoría de los estudiantes, con sólo algunos estudiantes o ninguno Tipo de reactivo Dificultad promedio
que fallara en algunas de las respuestas. Para este tipo de pruebas, un gran (porcentaje correcto)
número de puntuaciones perfectas proporcionan la información deseada React!vo de comI?l,etamiento respuesta corta
de que los estudiantes verdaderamente han aprendido el contenido de la React~vo de elecc~~n m~lt!ple de cinco opciones 50
Reactivo de elecc~~n m~lt~ple de cuatro opciones 70
unidad. En una prueba de diagnóstico cuyo propósito sea identiÍicar indi- 74
viduos aislados que tengan dificultades especiales, también es razonable Reactivo de elecclOil muluple de tres opciones
Reactivos de dos opCIOnes o de falso-verdadero 77
esperar un gran número de puntuaciones perfectas o cercanas a la perfec- 85
ción y relativamente muy pocas puntuaciones bajas. Por otro lado, supón·
gase que queremos aplicar una prueba antes de dar las instrucciones acerca Estos porcentajes permiten obtener res ue . .
de un nuevo tema para encontrar qué tanto saben nuestros estudiantes y para los hallazgos típicos de que muchos feac~~~~rf:~fas pOí adIvmación
acerca de éL En este caso: dado que el materiai todavía no se ha enseñado,
no nos sorprendería encontrar múltiples puntuaciones cercanas a cerní en
guos y no discriminadores entre los estudiantes má:
capaces. Para seguir con nuestro ejem~lo su-ón a'
12 es sue en ser ambI-
~pac.es'y los menos
otras palabras, esperaríamos que esta prueba fuera muy difícil para imes- calificación promedio para la clase fu {Ya de fa g ~e que SI qmsleramos que la
tíOS estudiantes. tivos de la..prueba serían de completamiento (O~~~c~v~soc~r~c~o) s, los 60 reac-
En las pruebas de maestría o dominio, en las pruebas de diagnóstico o en . te, SI qUlsIeramos que la calificación promedio f . Por otra par-
las prepruebas antes de la instrucción, no nos preocupa mucho la dispersión correctos, los 60 reactivos serían de elecciónue~~~~;pclaenada 452 reactIVOS
de las personas. Aun si casi todos los alumnos obtienen una puntuación per- (0.70 X 60 = 42). e opcJOnes
fecta u obtienen una puntuación de cero, estas puntuaciones nos dan ia infor- Los porcentajes que se muestran en el es 1
mación que buscábamos con ese tipo de pruebas. Por otro lado, cuando el pro· los maestros que están a b d quema a gunas veces molestan a
pósito de una prueba es discriminar los niveles de aprovechamiento para ¡os do" y de "reprobado" en tc.ost':lm rda lOS a pensar en calificaciones de "aproba-
ermmos e porcentaje de t" 1 .
diferentes miembros de una ciase o de un grupo les decir, que sirva como una tes contestan correctamente en una b E reac IVO~ que o~ estudlan-
base para establecer rangos o grados), entonces queremos que esta prueba pro- °
guna relación con la aprobación 1:;::e a . ~t,as su~erencIas no tIenen nID-
porcione una dispersión de puntuaciones; deseamos ser capaces de discrimi· Ios estudiantes es un problema entera!.ro b t aCá,?n! aSIgnar marcas o g,rados a
nar realmente a los estudiantes de aprovechamiento más alto de los de aprove, capítulo posterior. Los porcenta· es u en e .Istmto y, se exa~mara en un
chamientomás bajo, pasando por todos los grados intermedios. No queremos serie de puntuaciones de la pruebJa quqe e s~ s~gIel renlaqm tenderan a dar una
que nadie obtenga una puntuación perfecta en este tipo de prueba, porque . . seran u tI es a máxim 1
que qUIere dIscriminar niveles de aprovechamie t o para e maestro
requ~~:~~~c~~~ ~;:I~~V:sch~:rnto, d:d~fi~~~~:J~~oe~~~~~~:~e
entonces no podríamos estar seguros de que obtuvimos la medida adecuada
de qué tanto han aprendido; sin embargo, no nos gustaría obtener el cero, o el nivel
puntuaciones al nivel de azar, de ninguna persona, porque no habríamos difíci.les que sólo los co~tesfen def j~ealI4~~esJrolelabore algunos rea~tivos
obtenido su niveL En resumen, no queremos que un reactivo sea contestado reactIVOS de cuatro opciones o alternativas o e os alum?os (supomendo
correctamente por todos, como tampoco que un reactivo sea contestado mal ten correctamente del 85 al 90% de 1 1) y algun.os n:uy facIles que Contes-
por todos, simplemente porque ninguno de ambos reactivos contribuirían a d,e los reactivos se acercaran al nivel ~~~~~:~e~~;~~s~;f~°?c q~e mudchbos
hacer las discriminaciones entre los estudiantes de acuerdo con su nivel de nan estar escntos con esa meta en m e · . 0, estos e e-
~~~~i~e;~~~e~~~;~~;:o:~!Oili~~~~~; i~1~~~~í!~u~~ ~~~~~::i~~:o;~
aprovechamiento.
Normalmente, cuando hablamos acerca de la dificultad de una prueba,
nos referimos a ella en términos de dificultad promedio; por ejemplo, supón· mayor frecuencia por los estudiantes' orma que sea contestado con
gase que hacemos una prueba de 50 reactivos y aplicamos esta prueba a un capaces (una cuestio'n que co·d mas car:;aces que por los estudIantes menos
grupo de estudiantes. Cuando calificamos las pruebas encontramos que la . ' nSI eraremos mas adelant I .
conSIderar la cuestión acerca de 1 d·f· ul d d I e i y. es menos Importante
a 1 IC ta e os reactIVOS.

_
..
214 CAP. 7. DISEÑO Y CONSTRUCCiÓN DE UNA PRUEBA
CÓMO REDACTAR 215
En resumen, el plan de la prueba en esta etapa incluye lo siguiente: do, habrá suficientes ejercicios de donde escoger. Una vez ma's este 1
mento I e d ara' mayor l"b d . , comp e-
1 erta para ajustar la composición de la prueba al lan
a) Una delimitación del contenido y de los objetivos del proceso. prehmmar. p
b) Sugerencias específicas de lo que debería incluirse bajo cada combina-
ción de contenido y de objetivos del proceso. Ahora centraremos nuestra atención en l!>s diversos formatos de los reac-
e) Una selección de porcentajes de la prueba total por medio de las áreas tivos de la prueba .de respuesta estructurada: Estos son los reactivos en los que
de contenido y de los objetivos del proceso, así como una estimación las.respuestas pOSibles ~e presentan al ~xamInado y la tarea de éste consiste en
del número total de reactivos. escoger una entre las dlvers~s alternativas disponibles. Los más conocidos de
d) Una decisión acerca de los tipos de reactivos y del formato que se estos formatos ~on los reactIVOS de falso-verdadero, los de opción múltiple y
empleará y un cálculo del número de estos reactivos necesarios para los de apareamIen.t? Lo~ r~activos de respuesta estructurada, particular-
cada celdilla del plan. me~te los de ?p~lOn multl~le, pu~den usars~ para apreciar una amplia
e) Especificaciones de la dispersión de las dificultades de los reactivos. van.edad de obJetl':os educa.tI.v0s .. Dichos ,reactn:os son eficaces y, minuto
a mlfluto, proporcIOnan calIficaCIOnes mas confiables que los reactivos de
respuestas hb~es¡ s.1n er:nba~go, las ven.tajas de los reactivos objetivos pue-
CÓMO REDACTAR den lograrse solo SI estan bIen constrUidos. ~n las secciones siguientes pri-
LOS REACTIVOS DE LA PRUEBA mero.prese~ta.remos algu~as sug:renclas aphcables casi a cualquier tipo de
react.lvo. objetivo y despyes conSideraremos los diferentes tipos de reacti-
La siguiente tarea es preparar los reactivos de la prueba definitivos .. Exis- vos, mdlcan?o las ventajas específicas y las limitaciones de cada uno y dan-
ten ciertos objetivos del proceso para los cuales las preguntas de ensayo tIenen do sugerenCias para su redacción y edición.
grandes ventajas¡ sin embargo, supondremos. la existencia de ~n~ ~ otro de los
formatos para los reactivos calificados relatlvamen~e con obJe~IvId~d que se Sugerencias generales para escribir
usarán. Algunas de las guías para preparar esos reactivos se analIzaran en esta reactivos objetivos
sección y al final del capítulo se harán algunas consideraciones breves para las
preguntas de ensayo. . . . 1. Mantenga la dificultad en la lectura y el nivel de vocabulario de los
A continuación se enuncian algunas advertenCIas generales para aplIcarse
reactivos de la prueba tan ~i:n~les ~omo sea posible. Por lo general, no que-
más o menos con igualdad a todas las clases de ejercicios de la prueba¡ repre- remos estructuras de la oraClOn Imphcadas o palabras innecesariamente difíci-
sentan las prácticas seguidas casi automáticamente por los constructores de les que puedan interferir con la capacidad del estudiante para demostrar lo
pruebas profesionales y pueden aplicarse, aunque de manera menos formal y que s~be. Cuando se ha ~n~eñado vocabulario técnico en un curso y ese voca-
elaborada, en la construcción de pruebas particulares. bulano es uno de !os objetivos del curso, pueden usarse de manera apropiada,
pero el vocabular~o osc.~ro de modo gen~ral debe evitarse. En el ejemplo que
l. Mantenga el plan de la prueba en la mente, y probablemente a la vis- se muestra a contmuaClOn y que fue escTl.t? para los niños de octavo grado, la
ta, a medida que se escriban los beneficios de la prueba. El plan representa su ~orma de .redactar la pregunta en la oraClOn es compleja y contiene palabras
plan maestro y debería estar a disposición inme~iata para guiar las tarea espe- mnece~a,Tl~s¡ además las palabras "promiscuo", "pernicioso" y "nocivo" son
cíficas de la escritura y la revisión de los reactivos. muy dl[¡clles para este nivel de edad.
2. Haga un borrador de los eiercicios de la prueba con anticipación.
póngalos en un estante por unos días y después revíselos. Es sorprendente la Ejemplo
frecuencia con que un enunciado o una pregunta que par~cían completame~­
te claros a medida que se escribían resultan ser muy ambIguos o tener sIgmfI- Deficiel!te: El uso promiscuo de aerosoles, aceites y antisépticos en la nariz durante
los resfnados agudos es una práctica perniciosa, porque puede tener un efecto nocivo
cados alternativos cuando se reexaminan después de cierto tiempo. sobre:
3. Haga que uno o varios colegas le examinen y critiquen los ejercicios
de la prueba. Cuando esto puede hacerse es bastante preferible a la revisión Al Los senos paranasales
personal. Una lectura completamente nueva reél:lizad.a por o~ra persona ~ro­ B) Los glóbulos rojos
C) Los glóbulos blancos
duce una gran variedad de preguntas y sugerencIas_ .SI es pOSIble, este revIsor O) El nervio olfatorio
deberá seleccionar y dar respuestas a las preguntas (SIn ver la clave) de manera
que pueda verificar y estar seguro de que hay un acuerdo entre pregun ta y res· Mei~rado: El uso frecuente de aerosoles, aceites y antisépticos en la nariz durante un
puesta. , . resfnado agudo puede dar como resultado:
4. Prepare una cantidad adicional de eierc:icios de la.p~eb~ . As~, SI
alguno de los ejercicios no resulta congruente baJO un escrutlmo mas dehca· A) Dispersión de la infección en los senos paranasales
B) Daños en el nervio olfatorio

-- . ' , ,
216 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 217
C) Destrucción de los glóbulos blancos . 4. Asegúrese de que cada reactivo es independiente . La respuesta a
DI Congestión de las membranas mucosas de la narIZ UIl reactivo no debería requerirse como condición para resolver el reacti-
1'0 siguiente. Cada individuo debería tener una buena Oportunidad de con-
2. Asegúrese de que el reactivo tiene una respuesta correcta o por 10
testar cada reactivo como se le presenta. Por tanto, en el ejemplo que se
menos la mejor respuesta en el que están de acu~rdo los expertos. Ord!na. muestra a continuación a la persona que no conozca la respuesta a la pri-
riamente,los enunciados de naturaleza controversIal n~ s~n buenos ~eactlvos mera pregunta le será muy diÍícil contestar la segunda.
objetivos, aunque hay algunos casos en que el c.onoclmlento d~ dlferentes
puntos de vista acerca de un punto contro,:,ertldo puede ser J.mportant~.
EjemplO
Cuando éste es el caso, el reactivo debe anunCIarse claramente acerca de cual
opinión o qué autoridad se est~ usando como base p~ra la respuesta. No debe Deficiente: l. El escorbuto es causado por la falta de:
erigirse al estudiante una opinión o un punto de vIsta partIcular como un
hecho indiscutible. Ai Vitamina A
B) Vitamina B,
Ejemplo C) Vitamina Bn
12) Vitamina e
Deficiente: y. F El alcoholismo es una enfermedad. .
Mejorado: y. F De acuerdo con el libro de texto, el alcoholIsmo es una enfermedad. 2. Una buena fuente de esta vitamina es:

3. Asegúrese de que cada reactivo trate un aspecto importante d~l Al El jugo de naranja
área del contenido, y no algo trivial. Algunas veces los maestros tratan oe Bi El aceite de hígado de bacalao
incrementar la dificultad de una prueba por medio de basar los reactIVOS en e) El hígado
detalles oscuros o triviales. El primero de los ejemplos mostrados, escrito D) El arroz integral
oara una orueba de niños del octavo grado en la prueba acerca de la salud,
plantea u~a pregunta acerca de ~n deta~!e :sp~cífic?y trivial, conocimien· También es importante asegurarse de que el enunciado a una pregunta no
to que no puede hacer ninguna dIferenCIa slgmhcanva POSi ble en la compe- proporcione la respuesta para la próxima pregunta.
tencia acerca de la salud en un alumno de! octavo grado. El segundo eJem· 5. b.rite preguntas capciosas en una pregunta de aprovechamiento. Los
plo es un ejemplo de cómo se formula un enunciado de un libro de texto, y reactivos objetivos tienden a ser reactivos capciosos cuando el estudiante tie-
la mejor respuesta a éste es: "Sí, y qué". ne que escoger una palabra o numerar una oración que parece estar enfocada
completamente a otra cosa, a un punto totalmente distinto. En el ejemplo que
Ejemplo 1 se da a continuación, el reactivo tiene una clase de falso, porque el agente
inmunizan te para la difteria es e! toxoide o la antitoxina, mas no la vacuna¡
Deficiente: En 1967, la tasa de defunción por accidentes de _todos ti.!?os por cada sin embargo, el enunciado hace pensar al estudiante acerca de la efectividad de
100000 habitantes en la población del grupo de edad entre b y 24 anos era de: los procedimientos inmunológicos contra la difteria. Si el propósito de la
pruc;ba es comprobar si el estudiante conoce correctamente el uso de la pala-
A) 59.0 bra vacuna, el reactivo debería parafrasearse como se indica. Las preguntas
B) 59.1 con engaño tienden a conducir falsamente al mejor estudiante, quien se enfo-
CJ 59.2 ca más acerca del significado del enunciado que a verificar cada palabra.
D) 59.3

Mejorado: En 1967, la causa principal de muerte en el grupo de edad entre 15 v 24 Ejemplo


años fue:
Deficiente: V f. El uso de la vacuna de la difteria ha contribuido a disminuir la tasa de
AJ Las enfermedades respiratorias defunción por esta enfermedad entre 1900 y 1968.
B) El cáncer Meiorado: V f El material empleado como inmunizador para. prevenir la difteria se 11<1-
C) Los accidentes ma vacuna.
D) El reumatismo cardiaco
6. Asegúrese de que el problema planteado es claro yexplicito Ésta es
Ejemplo 2 una advertencia general, algo así como 11 que no se peque más" y quizá no sea
más eficaz que eso; sin embargo, es cierto que la ambigüedad de un enunciado
Deficiente: y. F La manufactura de drogas de prescripción es una industria altamente y su significado es la falla más persistente cn los reactivos objctivof: de las
científica. pruebas.
218 CÓMO REDACTAR 219

Ejemplo 1 de clases de las formas verbales como "Ni Juan ni Jaime (a) tiene (b) tienen
suficien~e dir:ero para comprar .un an,illo" es. un reactivo de respuesta
Deficiente: Y F La diabetes se desarrolla después de los 40 años. alternativa; SIn embargo, el.reactIvo mas.amphame?te usado de este tipo
es el que presenta un enunCIado declarativo y reqUiere que el examinado
Este reactivo tiene una clase de verdadero,"per? iq~é signif!ca~ ¿Significa indique si es falso o verdadero.
que "solamente después de los 40 años~; edad, ~ si~~lftca q?e ~asJrecuen. El reactivo de falso-verdadero ha tenido amplia popularidad en las pruebas
temente después de los 40 años de edad ?; ¿que Sigmhca el termmo. desar~o­ hechas por los maestros, probablemente en gran parte porque parece ser fácil de
lla" en este contexto? Se pueden obtener datos ~cerca de la frecuencia rel~tIva preparar; pero esta facilidad es engañosa, porque se logra a costa de producir
del diagnóstico de diabetes en las personas de diferentes edades, per~ los tIe~­ muchos malos reactivos. El reactivo de falso-verdadero es más adecuado para
pos del diagnóstico y del desarrollo ~e la enfer.medad no s~n los mIsII?-0s. lA evaluar el conocimiento de hechos que son inequívocamente falsos o verdade-
qué clase de diabetes se refiere el reactivo: a la dwbe,tes ~ellltus o a la dlabe.tes ros. Es particularmente adecuado en aquellas situaciones en las que existen sólo
insipidus o a alguna otra forma? Reactivos como este tienen todas las p.osibl- dos opciones contrarias, por ejemplo, acerca de las bacterias que pueden ser
lidacles de' causar problemas al estudiante más inforrr:ado y no al menos mfor- patógenas o no patógenas, enfermedades que pueden o no ser contagiosas; pero
mado. El reactivo no puede revisarse para hacerlo mas adecuado y, por tanto, sólo una pequeña fracción del conocimiento en un campo es de este tipo, y
debería eliminarse de la prueba. mucho de lo que se ajusta a este patrón es relativamente insignificante. En con-
secuencia, muchos de los reactivos que aparecen en pruebas de falso-verdadero
Ejemplo 2 son cuestionables, se amoldan a un punto debatible en el formato de una ver-
dad universal o se relacionan con hechos que, aunque inequívocos, son de una
Deficiente: ¡Cuál de las siguientes sustancias es más esencial para el hombre? importancia marginal. Como el enunciado que constituye un reactivo aparece
típicamente aislado, fuera de contexto, no se da un marco de referencia dentro
Al Proteínas del cual la verdad o la falsedad del enunciado puede estimarse, lo cual agrava el
13.1 Agua problema que afronta el estudiante, y tal vez el estudiante más capaz.
q Vitaminas Un problema de un tipo diferente surge del papel tan grande que
D) Minerales
desempeñan la conjetura y la "suerte" dentro de los reactivos de dos opcio-
La respuesta clave de este reactivo es B, pero todas las sustancias son.esen- nes. Dado que el alumno tiene 50% de probabilidades de obtener la res-
ciales para el hombre, por lo que para contes.tar est~ pregu~ta el :xa~mnado puesta correcta por medio de adivinación en un prueba de falso-verdadero,
tiene que conjeturar lo que el autor del ~eactlvo qUiera deCIr ~on J?as esen- este formato proporciona una información menos precisa acerca del estu-
cial". En esta pregunta, el autor del reactlvo trat,aba de det~r?lmar SIlos ~stu­ diante por reactivo que la que dan otras clases de reactivos, y se necesitan
diantes sabían que las personas saludables pod!i~n s,obrevivlf p~r un p~no~o mucho más reactivos para proporcionar una apreciación igualmente preci-
bastante largo sin comer, pero podrían sobreVl~lr solo unos.cu.antos dlas sl,n sa de las competencias de cada estudiante. Por tanto, las pruebas de falso-
tomar agua. La pregunta ya rev!sa~a para este tIpO de conOCImIentos tendna verdadero deberían tener un número relativamente grande de preguntas y
mayor claridad de la manera Siguiente: debería darse el suficiente tiempo para que todos los alumnos las leyeran
y las contestaran.
Ejemplo
En una sección posterior se examinarán las variaciones que se han utiliza-
do con el fin de hacer el tipo de reactivo más eficaz para apreciar el aprovecha-
Mejorado: Una persona saludabl~ se encuentra en una isla desiert~. Para sobrevivir, la miento, pero el problema inmediato es escribir buenos reactivos de falso-
persona necesita encontrar caSl mmedwtamente una fuente de. verdadero.
A) Proteínas para mantener las células del cuerpo
13.) Agua para beber . l. Asegúrese de que el reactivo. cuando ya se ha escrito. pueda clasifi-
q Vitaminas para mantener el metab?l:smo del cu~rpo carse como falso o verdadero de manera inequivoca . Cada enunciado debe-
DI Carbohidratos o grasas que le sumllllstren energla ría ser lo suficientemente verdadero o lo suficientemente falso para que los
expertos estén de acuerdo de manera unánime en la respuesta. Muchos
enunciados que supuestamente son verdaderos causan dificultad porque la
Elaboración de reactivos de respuestas alternativas persona más informada puede pensar en múltiples excepciones o razones
por las que el enunciado no es universalmente verdadero. Véase el siguiente
Cualquier pregunta o reactivo para la que se den ~l estudiante do~ ejemplo: no obstante que el enunciado tiene una clave de verdadero, el estu-
opciones a fin de seleccionar su respuesta, es un reactivo de respue~t~ diante con mayor información sabe que la penicilina es eficaz contra cierto
alternativas; por ejemplo, el reactivo frecuentemente empleado en el sa on tipo de neumonías, pero no para otros tipos. Este estudiante podría muy

..... , : .... ,.. " ,'

. ' " .: .....,. ; ",: . ,'

,; ' ( .,' :'.


220 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 221
bien marcar el enunciado como falso. El enunciado revisado elimina la
ambigüedad. ~n proceso.ld·nverso n:-ás.bien implica~o def!~zonamiento para desenmara-
nar .su
, n sentl
d .' o y sernanucamente
1 es.mas
, dI. lcil ' Además" los estud'I'a. n tes h'
aJo
Ejemplo . , - ed'
preslO Llempo
len ' e examen pueoen facilmente
. no darse cuenta de l.a neoa- .
ClOno LOS ob es negativos pueden ser partlcularmente difíciles. "
Deficiente: y. F La penicilina es una droga eficaz para el tratamiento de la neumonía. Ejemplo 1
Mejorado: y F La penicilina es una droga eficaz para el tratamiento de la neumonía
por estreptococos. Deficiente: V E La resistenc.ia al sarampión ol)te n ida mediawQ elrso d ~ ¡ 1 \
tra el saT<lmpión no se llama inmunidad Q~ti\;~. "~' ''' ",lcuna COIl·
2. Evite el uso de "determinantes específicos". Los enunciados que E La resistencia al sarampión obtenida por 'nedio rlel uso 1" \'"~
incluyen palabras como "todos", "nunca", "ninguno", "siempre" u otros tér-
Meforado:
. ."
saramplOn
V 11
se "ama . "d d .
InmUlll a paSl1:a.
~ . . . de 1..1 d 1
w .... una e.

minos de inclusión total, representan generalizaciones tan amplias que lo más


probable es que sean falsas. Los enunciados que incluyen términos como Ejemplo 2
"normalmente", "algunas veces", "en ciertas circunstancias", "tal vez", tienen
más probabilidad de ser verdaderos. Los estudiantes que saben contestar las Delicje~te: ~ F La tuberculosis 110 es una enfermedad no contagiosa.
pruebas ya saben esto y usan este tipo de claves para obtener el crédito por un Me/oraao: i F La tuberculOSIS es una enfermedad contagiosa.
conocimiento que no poseen en realidad. Los términos "todos" o "ninguno"
pueden usarse algunas veces con ventaja en ciertos enunciados verdaderos, .5. Com~ regla, ·li.IY!ite los en uncjados fajso-verdadero a una sola idea.
Lo~ enu~c¡adoS complelos que incluyen mas de una idea son frecuentemente
porque quien adivina tenderá a marcar F y, por tanto, obtendrá el reactivo
como incorrecto. dlfIcIles?e leer y de entender. Un enunciado que contiene una idea verdadera
y una falsa se encuentra en la categoría de un reactivo capcioso. Este tiDo de
Ejemplo
reactlVO tiende a ~~r una medida d~ las habilidades para la lectura, más q{¡e del
con~clmlent~ del area deconteI1l~i ~ . Los enunciados complejos pueden usar.
lJeficiente: V t Todas las bacterias causan enfermedades. se SI la atenClOl1 del eStudIante esta dmglda hacia la parte del enunciado que él
y. F Todas las bacterias patógenas son parásitos. tlene que esnmar como falsa o verdadera.

3. Evite términos indefinidos o ambiguos de grado o de cantidad. Ejemplo


Las expresiones como "frecuentemente", "mayormente", "en grado consi· Deficiente: V t El sangrado ~e las encías se asocia con la gingivitis, la cual puede curar.
derable" y "en la mayoría de los casos" no son interpretados de la misma se por el que la padece medIante el cepillado diario de sus dientes.
manera por todos los individuos evaluados. Un reactivo cuya respuesta Me;orado: V f El cepillado diario de los dientes puede curar la gingivitis.
dependa de la adivinación de lo que el escritor del reactivo tenía en mente,
tiene más posibilidad de ser insatisfactorio y frustrante para los estudian- . 6. Mantenga los enunciados falsos y verdaderos aproximadamente
tes. En el ejemplo siguiente, el estudiante puede tener problemas por el uso Iguales en cz.:an~o al tamaño. En una prue.ha hecha de manera particular exis.
del término "frecuentemente" porque en la actualidad el método se emplea te la ~endencla Oe que los ellunclados verdaderos sean más largos que los fal-
sólo para las frutas. sos. ~~n~raln;ente, el mayorlargo ~e los eI?unciados verdaderos se deben a la
necesIda~ de ,nclUlr calIfIcatIvos y nmltaclOnes que hagan que el enunciado
Ejemplo sea meqUlvocamente verdadero. Un enunciado ocasionalmente largo y verda-
dero no .es seno SI. ~e aparea con enunciados ocasionalmente largos v falsos y
Deficiente: y. F El secado se usa frecuentemente para preservar la comida (la deshidra- SI no eXIste una dIferencia consistente de largos entre las dos categorías del
tación). enunCIado.
Meiorado: Y.. F Las frutas se pueden preservar por medio de la deshidratación.

4. Evite el uso de los enunciados negativos y particularmente la Variaciones de los reactivos falso-verdadero
doble negación. Wason (1961), al trabajar con adultos, y Zern (192. 7), al
trabajar con niños de la escuela elemental, mostraron que el tiempo que I?iversas variaciones se han considerado en un intento por mejorar los
se requiere para contestar a un reactivo redactado de manera negativa es react.lvoS de falso- verdadero. La mayoría de ellas tratan de lograr uno o más de
más largo que su equivalente redactado de manera afirmativa y que se Ios SIgUIentes puntos:
cometen más errores en los reactivos que se redactan de manera negativa.
Ambos investigadores usaron pares de enunciados, como "36 no es un a) Reducir la ambigüedad de los reactivos_
b) Reducir los efectos de la adivinación en las puntuaciones.
número par" y "36 es un número non". El enunciado negativo requiere
e' Dar mformación más específica acerca de qué tanto sabe el estudiante.

-
222 CAP. 7. DISEÑO Y CONSTRUCOON DE UNA PRUEBA
COMO REDACTAR 223
Las tres variaciones que se usan con más frecuencia se describen a conti.
nuación. eficaz para
. apreciar
1'· la .comprensión, la interpretación, la extrapo laClOn
., y e1
razonamIento .ogIco SI se usa un material estímulo
. . apropiado Y SI. los reactl-
.
l. Subrayar una palabra o una cláusula en el enunciado. Ésta es la vos se han escnto para provocar estas habIlIdades. A cOntinu ., f
.
un e¡emp 1o d e este tIpo
. d e reactIVO.
. aClOn se o rece
variación más simple e intenta reducir la ambigüedad por medio de enfocar
la atención del examinado en la parte importante del enunciado.
Ejemplo
Ejemplo
Instrucciones: En la gráfica siguiente se muestra cómo se gasta cada dólar lId
. Observe con CUJ·d ad o 1a gra' f Ica
. pu·bl·lca. · y despues en a sa u
' lea cada enunciado cuidadosamente.
l . Y F La malaria es trasmitida por el mosquito Anopheles.
2. V f Si se congela la comida, las bacterias dañinas morirán.

Las instrucciones para este tipo de reactivo deberán quedar claramente


indicadas para que el estudiante juzgue la veracidad o falsedad de la porción
subrayada en relación con el resto del enunciado. Lo subrayado permite
emplear enunciados más complejos.
2. Pedir a los estudiantes que corrijan los enunciados falsos. Un
estudiante que marca correctamente un enunciado falso como falso quizá
haya hecho una adivinación acertada, pero tal vez haya escogido esta res·
puesta con base en una información inadecuada; por ejemplo, en el reacti·
va "La insulina es segregada por la glándula pituitariallun estudiante puede
marcarlo como falso porque piensa que la insulina es secretada por las
glándulas adrenales . En este caso . su información incorrecta Te hac.e rl ~ r
;na respuesta correcta. Para aseg{¡rarnos de que el estudiante cono~~ l~~
hechos verdaderos en que se basa el enunciado falso y para reducir la adivi·
nación se le debe pedir que proporcione la respuesta correcta cuando mar·
que un enunciado como falso . Esto funciona bien cuando se combina con
el subrayado descrito en la primera variación, pero es posible que dificulte
la calificación si no se le añaden restricciones al reactivo. Nuestro ejemplo
podría haberse corregido mediante el cambio de la insulina por una de las
hormonas pituitarias, o por medio de cambiar "es secretada" por l/no es
secretada", o mediante el cambio de "glándula pituitaria" por "glándula
endocrina", o "páncreas". Parece innecesario mencionar que si se usa esta
variación, todos los enunciados, falsos y verdaderos, deben tener una por· ~
Servicios
médicos
02J Medicinas
y aplicaciones
D Otros cuidados
médicos
ción subrayada. La parte del enunciado que se subraye debe ser el conteni·
do específico que el maestro está tratando de evaluar. Así, en el ejemplo, si
el maestro tratara de determinar si el estudiante conocía el nombre de
la hormona secretada por la glándula pituitaria, debió haber subrayado la
mm Servicios
de hospital
11 Dentistas 11 Seguro
de salud

palabra l/insulina". Si el maestro hubiera estado interesado en determinar si


el estudiante sabía el nombre de la glándula que secreta la insulina, debió Marque V si los datos de la figura apoyan este enunciado.
haber subrayadó la frase "la glándula pituitaria". t:Iarque F SIlos datos de la figura c~ntradicen el enunciado ° si no hay datos en la figu-
3. Basar los reactivos falso-verdadero en el material de estímulo espe· ra ya sea para apoyar o contradeCIr el enunciado.
cífico provisto para el estudiante. El reactivo falso-verdadero tiende a ser
más eficaz y más útil cuando está basado en algún material de estímulo dado, fY) 1. La ~~yor parte,d~l dólar dedicado a la salud pública se gasta más en los
como puede ser un mapa, una tabla, una gráfica, un diagrama o un pasaje de servICIOS del me.dIco que en ninguna otra categoría de gastos.
fE12. Pocos estadoumdenses tIenen seguro médico.
lectura. En esa situación, se le pide al estudiante que responda al reactivo sólo fE) 3. L.os estadounidenses gastan 24 centavos de cada dólar que ganan en medi-
en términos del material dado; por tanto, normalmente tiene un marco de cmas y utensilios médicos.
referencia más definido en términos del cual estimar la veracidad o falsedad IY) 4. Al, sumar lo~ servicios médicos y hospitalarios, esto representa un poco
del enunciado. Este tipo de reactivo falso-verdadero puede usarse de manera mas de la mItad del dmero que se gasta en la salud pública.

-
. .." , ... , ... ,.:....
.. J • .• . .
.
;. ," ".: . :"
.
. .'.-; ';. -" .~
' .
.. '. • '.: >:..;..... ... ,','.1 . • '
224 CAP. 7. DISEÑO Y CONSTR UCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 225
(y) 5. Se gasta menos dinero en cuidado mental que en servicios del ¡nédico.
manera ,eficaz para evaluar el conocim
¡y) 6. Cerca del 25% del dólar que se gasta en salud pública se emplea en servi· iento de categorI'a el 'f' .
cios de enferme ría en hospita les.
.
car,lctenstlcas Y para apLIcaC 1'"
IOnes sImples · es particu larmen, t aS! ICaClOneS °
1 " t 'r,
luar un" p ar e P"rtIcUIc<r e un tema con' CIerta
ro'. d . , e e f'Icaz Dara - -eva-
'd prOfund -¡'dad.. E "
Esta forma de reactiv o algunas veces resulta más comple ja porque reduce 1<l eantl a d. de . 1
. eetllra que debe hacer el estudia nt y i, .. ste rormato
se pide . . , ) .• ~; ._" ., '.. 'r' ,: ~ •., [ .' ,.,,~ . , ~ o' ·
p
-
~
al estudiante que contest e en cuatro o cinco ca.tegorías, tales como" definiti· CUt ]] '- '-'., - ., ...."- ,. c.J ,;'- ,,,,.e[,,uC
aa' ~() l. "_at' pregun
l ' d ta ,.SIrve
,
lÓ paúl "stuuar la verac¡·j
' .. ,_ .¡ , 1 0' _. " ';:' 1 .~ 1...... ;. _.
.

.'
a seaa .' enml-.
vamen te cierto". "probab lement e cierto" , "datos insufici entes para nand() i!S, <11",0 '.1<: "" a.ub,gu edad de lOS enunCI ados 1 . ... ...\.. ':' d.
de falso -verdadero.
detenni.
nar si es 'cierto 'o falso", l'proba blemen te falso" y :t definiti vament
e falso".
en este formato el reactiv o se convie rte en uno de opción múltipl
e, más que Elaboración de reactiv os de opción múltip le
en uno de falso-ve rdadero .
4. Agrupe .¡os reactivos cortos de falso-verdodero bajo una pregunt
común o un encabe zado de enunci ado. Dos ejempl os de esta variaci a
¡ .'
ón son
,os sIguIent es:

Ejempi o
¡ nstrucc iones: Escriba una V enfren te de cada opción que sea
una respues ta correc·
ta a ia pregunta. Escriba una F para cada opción que sea una respuest
a incorre cu a
la pregunt a.
A. ¡Cuáles de las siguientes enferme dades son caus<1da
s por virus!
(YJ i . Saramp ión (y¡ 5. Paperas
!F! 2. Difteria (y¡ 6. V,uieda
(YJ 3. Influen za LE) 7 . Tuberculosis
LE) 4. Malaria CE j 8. Tifoidea
B. Una niña de 14 años de edad comió lo siguient e durante un
periodo de 24
horas:

Desayuno Comida Cena

U na taza de café Un vaso de Coca-C ola ('228 g) Un bistec ¡250 g)


Una hambur guesa ¡110 g) con Papas en puré (112 taza)
pan Un vaso de leche (228 gi
Papas fritas (20 piezas) Un pastel de manzan a (una
pieza)

¡En cuál de los nutrien tes que se mencion an en seguida estará deficien
te su
dieta?
¡y) 1. Calcio (E) 5. Niacina
(E) 2. Calorías (E) 6. Proteína
(E) 3. Carbohi dratos (y) 7. Vitamina A
(y) 4. Hierro (y) 8, Vitamina C
El formato de esta variación se ve como un reactiv o de opción múltipl l
pero la tarea que desarro lla el estudia nte es tener que juzgar si cada e "\j O
°
falsa verdade ra en relación con la pregunt a origina l; por tanto,
opción es
es básica·
Ei 2 GOn
~ l 2 ::00
°
mente una serie de reactivo s de falso verdadero . La variació n puede
ser una "Di 3 UOO

-
226 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 227
Me;orado: ¡Cuántas calorías son recomendables diariamente para una adolescente de 14
años, con una estatura de 1.55 m, que pesa 49 kg Y que sea moderamente acuva? series ya existentes; ~l final d~ este capí~ulo se dan referencias seleccionadas de
colecClOnes de reactIVOS de dIfe::ntes areas. de conteni.~o. El análisis paso por
A) 1 500 paso del proc~so de la ~onstrucCI?n de reactIVOS de opClOn múltiple aparece en
B) 2 000 el hbro Multlple-C~ol~e Ques~l(?ns: A Close Look (Educational Testing Ser-
~) 2 500 vice, 1963). En las sJgu~entes pagmas se ofrecen una serie de sugerencias para
O) 3 000 mejo,rar ta?t? el enuncIado de reactivo como las opciones de las preguntas de
opcion muluple. .
Este reactivo revisado probablemente será más difícil de contestar que el
original porque las opciones están más cercanas en cuanto a su valor. ~a difi- l. Asegúrese de que el enunciado del reactivo formule claramente un
cultad del reactivo de opción múltiple depende de lo que evalúa el reactIvo, así problema. El enunciado debe estar escrito de tal forma que el estudiante
como de la cercanía de las opciones. Considérese el conjunto de tres reactivos entienda claramente qué problema o pregunta se le está planteando antes de
que se muestran a continuación, todos relacionados con el significado del tér- que lea las opciones. Véase al ejemplo a continuación, en el que cuando se aca-
mino alimento fortificado. Podríamos predecir que la versión 1 será relativa- bó de leer el enunciado, solamente se sabe que el reactivo está relacionado con
mente fácil la versión 2 un poco más difícil y la versión 3 todavía más difícil. una parte del páncreas, y no se puede tener una idea acerca de lo que se trata
En la versiÓn 1 el enunciado es una copia directa de la definición alimento hasta que se han leído las opciones. Las opciones de respuesta que se dan son
fortificado del Íibro de texto y las otras opciones no son términos empleados heterogéneas en contenido, es decir, una se relaciona con la estructura otra
para indicar la adición de nutrientes a la comida. La diferencia entre 1 y 2 es con su función, una con la permanencia y otra con su localización. Este ~jem­
que el enunciado del 2 reconstruye la definici~n del libro de texto en.una fo!- plo es realmente cuatro reactivos de falso-verdadero con las palabras "los islo-
ma novedosa y requiere un proceso mental dIferente del de 1. La dIferencIa tes del páncreas" en común. El reactivo revisado contiene tanto un problema
entre 2 y 3 está en la cercanía de las opciones. claramente formulado en el enunciado como un conjunto de opr;ones de res-
puesta más homogéneas.
Ejemplo
1. Cuando un nutriente que no estaba presente en el alimento original ha sido Ejemplo
añadido se dice que el alimento está:
Deficiente : Los islotes del páncreas
Al Fortificado
B) Procesado
C) Pasteurizado
Al Contienen ductos
~) Producen insulina
Ol Refinado
C) Desaparecen a medida que se envejece
2. En el procesamiento de la leche para ponerla a la venta, se le añade un concen- Ol Están localizados a la orilla del páncreas
trado de vitamina D para proveer por lo menos 400 unidades USP por cuarto. Enton-
ces, se puede establecer legalmente sobre el envase que la leche está: Me;orado: Los islotes del páncreas secretan la sustancia:

Al Fortificada Al Tripsina
Bl Procesada ~) Insulina
C) Pasteurizada C) Secretina
O) Refinada O) Adrenalina
3. En el procesamiento de la leche para ponerla a la venta, se le añade un concen-
trado de vitamina D para proveer por lo menos 400 unidades USP por cuarto. Enton- 2. Incluya tanto del concepto como sea posible en el enunciado y man-
ces, se puede establecer legalmente sobre el envase que la leche está: tenga las opciones tan cortas como se pueda. Por interés en la economía el
espacio, el tiempo de lectura y la claridad para plantear el problema, trate' de
Al Fortificada presentar y organizar las palabras de tal manera que las opciones puedan man-
B) Enriquecida tenerse relativamente cortas. Si las mismas palabras y frases se repiten en
C) Irradiada t?~as o en casi todas las opciones, como en el ejemplo que se da a continua-
DI Restaurada ClOn, reescriba el enunciado del reactivo para incluir las partes repetidas, lo
cual hará que el reactivo sea más claro_ Las opciones de respuesta que son lar-
Las buenas preguntas de opción múltiple requieren tiempo y habilidad gas en relación con el enunciado frecuentemente ocurren porque se fracasó en
para construirse. Una forma de ahorrar tiempo es sacar los reactivos de las formular un problema con claridad en el enunciado.

' . "0.'".
CÓMO REDACTAR 229
228
Cuando el propósito del reactivo de la prueba es apreciar si el examinado
Ejemplo puede diferenciar los datos necesarios p.ara resolver un problema o apoyar un
argumento de aquellos que es mnecesano o madecuado, deben incluirse d atos
Defic ie n te : El ,¿rmino calórico-yacio para un alimento designa: extras para plantear el problema. En este caso, el material extra es central Dafa
que pueda medirse el proceso, entonces, no sería inadecuado. .
l.~ : :"'T n dli~-:r;.cnIo 4u e tiene .p ocos nu trienles eS~il.ciaie~ p~ro t3.1 t~, ,~alor ca1 6Tic!)
.B~ Un ali Il: en to i..iUC no tiene n Lltrien~es esenClélles ni valor [,HOnCO 4. []se los negativos esporádicam ente en el enunciado de un reactivo
C¡ Un ali mento que , icile a~to valor nutritivo y caló,rico, ' . Los enunciados neg~tivos combinados con las opciones de respuesta pueden
D \ Un alimento que tiene alto valor nmntlvo, pero oajO valOr calonco present ~ r. ~ los estudl~ntes problemas de lectura difíciles. Los reactivo ~ negati·
vos tamblen proporCIOnan al maestro poca información en lo concerniente al
Aleiow ao: El término calórico-vacío se aplica a los alimentos que son: conocimiento positivo que tenga el estudiante.
A veces es importante para los estudiantes conocer las excepciones e
A) Balas en nut rientes y altos en calorías ser capac~s de detectar errores. Para este propósito se podría justificar algu-
E} Balos tan to en nutrientes como en calortas noS reactlvos con las palabras "no" o "exceptollen el enunciado, particu -
el Altos tamo en r: üt rientes CDmo en calorías larmente cuando la sobreinclusión es un error común en los estudiantes.
D i Altos en nu trientes y b ajos en c::¡lorías
Cuando se usa una palabra negativa en el enunciado , debería estar subraya-
J. I!l.cl7.2YCl en el enuncia do solamen te el material necesari o para pla n- da y/o en mayúsculas para llamar la atención de los estudiantes. '
te !ir el ;Jroc.Únw de m anera clara y especifica . Los reactivos con u n mate!~.a l El siguiente ejemplo fue escrito para medir si los estudiantes conocían la
c,ce coñüene dem asiadas palabras que son inadecuadas para el problen:1.¡l; tie- función de los canales semicirculares, pero el reactivo se escribió de tal manee
:-le:: to d.as las :rcsibilidades de reduc ir la efic;1cia de la prueba. Prunen\ el ra que no mide este aspecto del conocimiento del estudiante. El ejemplo revi-
.'!).at ~ri.2.i añ adido in cremema la carga de lectura de la prueb a, con lo cuc.1 es sado mide más directamente lo que el maestro quería evaluar. En el segundo
'n.ds difícil óep :.:ro.r la habilida~ g~neralizad a ,de lectura de la compe~en(:i ;l. e sr~­ ejemplo mejorado se muestra un uso inás apropiado del enunciado negativo,
..: .~: ii.( ::.l :;l~e ::e ~:--<~..7::.:·¡. t:l~' el_ire':'l d e Li ?:Y::. a t e~EL .')egunG0 , nlcremen t a el t l e~.~!.~"\::" el: debido a que el erro r m ás común que cometen los estudiantes acerca de íos
deberes de la Food and Drug Administration es incluir la inspección de la car-

~~,~/!j\{~~[~~fi~~f!~:~}~{;~i~iiiJ7:1~~~~jjj~l~~~,i:~ ~
ne, que en realidad es un deber del Department ofAgriculture¡ y sería difícil
obtener t res opciones que conduzcan a error posible si el reactivo estuviera
enunciado de manera afirmativa.

~l~1~~~:~:~!~~í;~~~I~:~~;~;~});~!~~~~~::~:~~~~;~.~;~~~~i7yll~.:(;)!;~~i7.e~~~;~:~;:,:
Ejemplo

Deficient e : ¡Cuál de las siguientes es tructuras del oído n o tiene que ver con la
audicion 1

Al T ímpano
B: Veiltan a oval
el Canales sem icircula res
I)! C:~ 6 cl ea

A1 e i or (j¿~) ! . ~ C u ál de las estructuras 51guicn:es dej oído 3Yi..lda a manten e! el e:r.l:-


....:.. '.
librio'

A) T ímpano
Bj Ventana oval
s:.¡
Cana!.es semicircuiares
Di Cóclea
2: ¿CU.dJ. el::: L!.s siguientes ac t~ \~id .ad e5 n·:; ;~ ~ re ~\p o ~ 3 :;:h1E d.:-:. d de ~ ~~ ;:-~; .') :: .2.!":I.d ~.::r::. ~ _~..:i:7.-':' ~ '
llIstrat iC1i1 [Admin istración de Alim entos y D w gas! : :
... " T~:? nd o n e s
:;denoiJc-.s y anginas
\ le:i11b ranas 111UCOSas
D Canila¡ws
230 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
231
q Inicio de acción en la corte para retirar del mercado un alimento adulterado 450
D) Evaluación de muestras de alimentos para la venta interestatal g 400
g 350
s. Use material novedoso al formular los problemas para medir la Como : ~ 300
prensión o la habilidad para aplicar principios. La mayoría de las pruebas o o
hechas de manera particular se enfocan con demasiada frecuencia en medir la Cl.~ 250
al E
memorización del material o los textos presentados en el salón de clases y SOn ~~ 200 .1 I
deficientes con respecto a la medición de la habilidad para usar esa informa.
ción. Los reactivos de opción múltiple están bien adaptados para medir la
::> e:
E Q) 150
Q) Q)
1 J
comprensión, pero debe presentarse al estudiante una situación nueva si se
-o" 100
S;
I
quiere que utilice más que su memoria informativa para contestar la pregun. ~ 50
,..... - ~
tao En la segunda y tercera variaciones del ejemplo de la página 00, se muestra \ .:",r
O
un intento de alejarse de la forma clásica en la que el concepto se enunció para ~ o
una prueba del octavo grado acerca de la salud. A continuación se dan dos o 'e: '<T N'<T <:-
C'? '"
<:- <:- '<T ~ ~

áj o -;- .;, <:- <i) 'Ü "- 0


.;, .;, .;, .;., .;., 'e:o
'0
E
ejemplos que ilustran CÓmo un reactivo puede estructurarse a fin de apreciar ::E-
ro
N C'? <:- <i) -o <i) >-
la habilidad para usar información. -u
Edod
"-

Ejemplo .6. Asegúrese. de que s61? hay, u.na re,sl!uesta correcta o claramente la
melor. E,n el reactIVO de opCIOn multIple tIpICO se le pide al examinado selec-
Memoria informativa: l . ~Cuál de los siguientes alimentos rendirá el mayor número
de calorías cuando se le metabolice en el cuerpo?
cIOnar
. d soloiuna· respuesta. . Después de haber dado estas·IDS t ·
ruCcIOnes e1exa-
mma ,o s~ eccIO,na la mejor respuesta, y el constructor de pruebas esd obliga-
A) Un gramo de grasa ~~ ;~ ~:r_:.~~o_ ~~~ ~a,r~ ca,da ~eactlvo. Est<=! parece obvio, pero muchos reactivos
Bl Un gramo de azúcar Ul. 1<1~ p' U':'Ud:> uc ~alUn oe Clases tIenen dos o más respuestas igualmente bue-

C) Un gramo de almidón ?as o no tIenen respuestas buenas. Así, en el siguiente ejemplo la respuesta B
DI Un gramo de proteínas es la que tIene la clave de correcto, pero ~~mbién existen posibilidades de que
tanto e como E sean correctas. La verSIOn revisada elimina esta falla pero
Aplicación: ~Cuál de los siguientes alimentos daría como resultado mayor reducción probablemente hace que el reactivo se vuelva demasiado fáciL '
de calorías si se le eliminara de una dieta cotidiana?
Ejemplo
Al Una cucharadita de m antequilla
Bl Una cucharadita de azúcar granulada Deficiente : Un niño daltónico hereda ese rasgo de su:
C) Una rebanada de pan blanco, enriquecido
Al Padre
Dl Un huevo hervido
Bl i'vladre
C) Abuelo(a) ma terno (al
Mem oria informativa: 2. La muerte por neumonía y por influenza es más frecuente
entre: DI Abuelo (al paterno(a!
El Ancestro remúto
Al Los bebés y los ancianos
. Bl Los bebés v nirlos escolarizados Mejora do: Un niño daltónico probablemente hereda este rasgo de su:
C) Los adoleséentes y los ancianos A) Padre
DI Los adolescentes y los adultos jóvenes 12) Madre
C) Abuelo paterno
Interpretación: Observe la gráfica de la página siguiente en la cual se muestra la tasa de D) Abue la paterna
defunción O(! la enfermedad A para un grupo de edad.
e :A-d,.em á~ d:. a~egurarse, de que sólo haya una respuesta buena o la mejor, el
1scrIto. ~e,:e:~~lvoS d~bena conSIderar que una respuesta c;s inequh-ocamente
ha~¡~e¡;l;
d
",1 )c,:>ponsa oIl¡dad es usar mejor su nivel académico asÍ come 5U
)1j¡(/,, -1 ·) ~ r ' ··"'d·'''r·· ~ d . . ,
r i i ~·':~ :'.a.: .~ ~~ a.~.a.,r enUDda os y opclO~es de respuesta, para preXlUé:ir U D
c~ T Lbcrc.d c)::i.5 P OD .,~.wa.
acuerdo . :. ~' u. ,.espues[a de tal manera. oue~
J.0 5 expertos en el C~ '-("Y' " '." "''-' ..¡~
,- - c " . '--'-
:..;: .::~!. f(":.n:;. ,~:: d ;.H.~ ~.: ;]. rdj ~.C.':.l
. » .. ' .'. .. . • , ..

- .: :. ... . .: . . .~. ", '


232 CAP. 7. D/SEÑO y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 233
7. Asegúrese de que haya opciones incorrectas posibles. Una de las ver,.. correcta como e? el enunciado; el número 2 contiene un determinante especí.
tajas principales de los reactivos de opción múltiple es que requieren que. el fico qUe: eJerce el ¡nlsmo efecto en las opciones múltiples como en los enuncia.
examinado seleccione una respuesta de tres, cuatro o CInco opCiOnes, re,]¡¡. do~ ~e talso;veraadero; en el nur,ner.o 3 la respuesta corrCCla es mucho más
ciendo así la posibilidad de adivinar la respuesta; sin embargo, las opciones de grande que las otras op~lOnes; el numero 4 es un ejemplo de una clase de
respuesta incorrecta deben estar construi?a~ de tal ,manera que atraigan la inco~gruencla gramatlCal en la cual la palabra "un" en el enunciado imn!ica
atención del examinado que no posea la mtorrnaClOn correcta o que tenga un termmo smgular, yero las opClOnes A y e están en plural. -
sólo parte de ella. Para lograr esto, las opciones de respuesta incorrecta debe· Los reactlv?~. revIs,ados ~uestran cómo cada una de estas faL:s pueden
rán ser lógicamente congruentes con el enunciado y deberán representar e~T? corregme con el tm ~e nace;' el r~a~t¡vo potencialmente más eficaz r a :';, medir
res comunes hechos por los estudIantes en un grado partIcular o un l1lyel Cíe el conOCImiento, mas que la habilIdad para contestar pruebas.
habil·idad. EstO se relaciona con el punto que ya se trató anteriormente acerca
de la dificultad. . Ejemplo
En el primer ejemplo, las opciones A y e son compuestos no ~lementos;
por tanto, no son congruentes con el enunciado. En el segundo ejemplo, las Deficiente.: Asociación de campana
opciones e y o son imposibles. L La función de las plaquetas en la sangre es ayudar a:

Ejemplo A) El acarreo de oxígeno a las células


B) E! acarreo de alimento a las células
Deficiente: l . l Cuál de íos elementos siguientes se encuentra en las proteínas pero DO .el E! coagulado de la sangre
en los carbohidratos ni en las grasas?: D) La lucha contra la enfermedad

A) Bióxido de carbono Deficiente: Determinantes específicos


B) Oxigeno 2. ¡Cuál de lo siguiente es car~cte;ístico de las bacterias anaerobias/:
CJ Agua
Q) Nitrógeno Aj Nunca viven en la tierra
13.) Pueden vivir sin oxígeno molecular
2. El gas que se forma en las células después de la oxidación del alimento y que se Iieva C) Siempre causan enfermedad
a los pulmones para ser exhaladó es: Dl Pueden realizar la fotosíntesis
A) Oxígeno Defici~nte: Pistas acerca del tamaño de la opción
BI Bióxido de carbono 3. El termmo efectos colaterales de una droga se refiere a:
C) Helio
D) Cloro A) Beneficios adicionales de la droga
Bl El ~fecto en cadena de la acción de la droga
8. Asegúrese de que no se den pistas inintencionales para la respuesta C) La mfluencIa de la droga sobre el delito
correcta. Los consuucrorcs de prueba inexpertOs frecuentemente dejan ir una Q) Cualquier acción de la droga en el cuerpo que no sea la q:.:(~ el doctor Quería
pista que permita al examinado eliminar una o más.de las respuestas incorrec· que tuvIera la droga .
tas de las que deben considerar. Dunn y Goldstein í1959) han demostra~o
Deficiente: Incongrue.n cia gramatic $I
que los reactivos que. contienen pistas inadecuadas o determinantes especiti- 4. La penicilIna Se obtien e de un:
cos hacen que las respuestas correctas sean congruentemente más· largas que
las incorrectas, y que las incongruencias gramaticales entre el enunciado y las A) Bacteria
opciones hacen m2.s fácil la eliminación )', por tanto, son más fáciles que Bl Hongo
los reactivos que no tienen esta falla. Chase (1964) demostró que los examina· C) Carbón
dos pueden aprender a usar la opción más larga como una pista para la res· D) Árbol tropical
puesta corrccta, r \Vahlstrom y Boersma (1960: han demostradc que lOS
niños del DOyenO g~ado puden ser ensenados a usar varias fallas de la escri: ura Ñ1e;orado: L iC::uál de las siguien:es est,ucturas de la sangre ayudan a la formacir:in de
de los reacti'-'os , a fin de mejorar f·lio c"lificaciones en las pruebas de reac:i,'o5 Costras o coagulos1:
de opción multiple.
Al Glóbulos roios
A cominuaCÍón se proporcionan ejemplos de algunos tipos de piSt!E i!Jin· Bi Línfociws
tencionadd5. EJ. ;1u111ero 1 es un e¡ ~.lJ'1 pj o de una l1sociació n de Call1 p j l :;:¡¡ es (;;i Plaquetas
decir; 1~ i'cpeticlon de Ullá. paLÚJrd . l.i.na Ír.::. se o un sonido t an t o en la respuesta D) Mo~ocitüs
234 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 235
2. La única característica que distingue a todas las bacterias anaeróbicas es su habi.
lidad para: bra una función de la planta, yel efecto del doble negativo de la opción y
del "nunca" del enunciado dificulta comprender el significado del reactivo,
Al Soportar variaciones extremas en la temperatura del aire No hay forma de revisar el r~activo para hacerlo mejor, dado que cualquier
RI Vivir sin oxígeno molecu~a~ función de la planta la reahzan los tallos de algunas plantas.
q Vivir sin saprófitos o parasltos . . . Algunos estudios acerca del uso de "ninguno de éstos" como una opción
DI Reproducirse en células vivientes o en medIO de CUltIVO no VIVO han indicado que el empleo de esta opción hace al reactivo más difícil y más
discriminador (Boynton, 1950, Hughes y Trimble, 1965), pero otros estudios
3 ' C ' 1 de los siguientes si ocurriera, sería el efecto colateral de la aspir~na para Un
h~:nbr~ que estuviera to~ando dos aspirinas cada tres horas para combatu un fuerte han fracasado en confirmar estos hallazgos (Wesman y Bennett, 1946, Rim-
land, 1960).
resfriado con algo de fiebre?:
Si "ninguno de éstos" o su equivalente se emplea como una opción en los
Al Temperatura del cuerpo I?-0rmal reactivos que requieren soluciones cuantitativas o en pruebas de ortografía,
Bl Reducción en la frecuencIa de la tos debería usarse tan frecuentemente para la respuesta correcta como cualquier
C) Respiración más fácil otra opción de respuesta o el enunciado del reactivo debería ser redacta-
12) Zumbido en los oídos do como una pregunta. En estas pruebas, la opción funciona mejor si se usa
corno la respuesta correcta en algunos de los reactivos más fáciles al principio
4. La penicilina se obtiene de de la prueba para reforzar la instrucción de que "ninguno de los anteriores" es
Al Las bacterias algunas veces la respuesta correcta.
RI Los hongos El siguiente ejemplo representa un uso incompleto de la opción "nin-
C) Los carbones guno de los anteriores" en un reactivo que requiere una respuesta numéri-
D) Los árboles tropicales ca, porque se dan sólo aproximaciones, más que las cantidades exactas.
No obs t a nte que la opción B es la que lleva la clave de correcta, la opción E
9 Use las opciones "ninguno de éstos " o "ninguno de los ;:mteriores" es la mejor respuesta, dad o que los cá lculos del volumen de la sangre P ,H 3
sólo 'cuando la respuesta clave pueda cl.a,sificarse m eq~lvoca~eme un adulto promedio varían desde como 10 hasta 16 pints. Se podría
como correcta o incorrecta . Este tipO de opClOn la han empleado lo~ ,-s<;n- subray ar la importancia de que un estudiante de secund aria' sepa este
tores de pruebas experimentados en las pruebas de oItografIa, de matematJ· hecho e n particular.
cas y de habilidades de estudio. En estos tipos de prueba se puede ofrecer
una respuesta absolutamente correcta. En otros tIpOS de pruebas en las que Ejemplo
el estudiante debe escoger la mejor respuesta y en las que la respuesta clave
es la mejor respuesta, pero no necesaria ni absolutamen~~ co~recta, el uso Deficiente: ¡Cuántas pints de sangre tiene un adulto humano normal de un peso
de éstos" o de "ninguno de los antenores es mapropIado. promedio?:
d 11 •
e nmguno d . , . d' . , d mente y
Los maestros tienden a usar este tipo e opClOn m Iscnmm.a a .' AJ 3 pints
en las pruebas hechas por ellos la, opción ?uele fallar porque no tiene sentldo~ -ª) 13 pints
debido a que el enunciado no esta gramatlcalmente comple~o, c~mo se mues Cl 3 0 pints
tra en el reactivo siguiente, que apareció en una prueba de blOlogla para alum- Di 50 pints
nos del décimo grado. El Ninguna de las anteriores
Ejemplo Me;orado: ¡Qué porcentaje aproximado del peso corporal de un adulto humano salu-
dable es sangre?:
Deficie n te: De las siguientes opciones, la única que nunca es función del tallo de la
planta es: A) De 3 a 5%
-ªJ D e 8 a 9%
Al La conducción C) De 12 a 15%
Bi El almacenamiento de alimento DI De 20 a 25%
C! La fotosíntesis
DI El apoyo lO . Evi te el uso de "todos éstos" o "todos los anteriores" en el reactiTIQ
1;) Ni::1guna de las antcrir)]"roS típico de opción múltiple. Normalmen te, cuando se u sa la opción "todos
T . . - ¡I -~""'a l'''''''a {J- ~ 1" 5
.._. ~i. OpC1Gl t HJ.!~ ,~ ;.iJ.~ .....í. ..... :"'::;.:.
" nt-i':" no"
c.. .
''
!.. _
pc:~'
: ~.no
... ....
,c;;;O· .1. O
.. •
es ' T n..I,.c1~,.....tl'ca1lJF
"--~
¡ · 'gla.l . ,'
;;re sino
~ .. .. ""~""
J: '>'"lO nO ln .
1Pint ('~; una ~nedida in;:;Icsa de cap<!Lidad, corrcspondi . !:1tc. !;1ÚS ~~ ~·1('!1(\S. <l ~: n Ge tc!'.*C
·l~~ m! . . . ie'
.! J.LI r l' n"":'"~""'
.. -'_! l n1 ;~t'"\1
\.. r~ J.·_ U"''''~~ ''''' ~; P
~ l. '' r: . ... '"~
_ Oi'!
_ ~ ~gnj
_ entc
.... con e.: en unClac o. La 0lj CI On 1:. .\L . .~ a¡lÍr. iN. cid T.).

- . .....
236 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 237
éstos" en las pruebas hechas por los maestros, ésta es la respuesta correcta
Los reactivos que usan está opción tienden a ser bastante fáciles, ya que ei tipo de reactivo es tan~~ más ?ifícil como má~ discrim~nador que la forma típi-
examinado puede ser inducido hacia la respuesta correcta aunque sólo tenga ca de reactlVO de opclOn multIple que evaluan el mIsmo conocimiento.
una información parciaL Obsérvese el siguiente ejemplo. Supóngase que se En el segund? e¡em~lo se muestra un uso defi~ie~te del reactivo de opción
le ha pedido a un estudiante marcar sólo una respuesta y que él sabe que tan. I1lúl~lple compl~J~ y var~a~ fallas e?- la ::on~trucc:.lO? d~l react ivo . No obstante
to el peso como la edad se usan para calcular los requerimientos basales de que l1ay mu~tlples Slg~O", oe una ;:lTCUlaClOn danada , las opciones son CGrG1S;
energía . Entonces; el estudiante marca D para su respuesta, en cuyo caso por tanto, el conOCImIento podna ser ~va.luado de .manera más eficaz con el
obtendrá el crédito por tener una información completa aun cuando no la uso de un ~on:?-ato normal.como en el ultImo reactivo de la sección anterior.
tenga. En la versión revisada, deberá tener la información completa para Las fall~s tecDlcas d~l reactlvo son que no se presenta un problema esoecífico
poder dar la respuesta correcta. al exarnwado y lo~ SIgnos nu~erados 1,2 Y 3 se usan en todas las opc{ones de
La opción "todos los anteriores" es mucho más eficaz si se usa como una respuesta que se pIden al estudIante, por lo que éste sólo tiene que determinar
variación del reactivo de opción múltiple complejo descrito en la sección si los números 4 Y 5 son los .c orrectos. Otra falla técnica del reactivo eS que el
siguiente. método de J?reser;tar las opCIOnes (contraste entre la opción y las o pciones B e
v D) es vanado, 10 cual crea al estudiante dificultades innecesarias.
Ejemplo , Los reactivos de opción múltiple complejos deberían usarse 10 menos
posible en las pruebas hechas de manera particular.
Deficiente: ¿Cuál de los factores siguientes debe considerarse para calcular los requeri.
mientas basales de energía?: Ejemplo 1

A) Edad Eficaz: Obsérvese cada proceso de alimentdción .) de dctividades de prolÍucción


B) La estatura siguientes:
C) Peso
Q) Todos los anteriores 1. Un am". de casa h"ce mermelada y la vende en su pueblo natal.
2. ün carnIcero hace saichichas can carTle de n:..:er¡-"o v } C1~ \'enct p ·s()lamer-¡..· ("'n ", ;
M eiorado: ¿Cuál de los factores siguientes debe considerarse para calcuiar los requeri· estado de 1'vIarvland. ...;" . . . " '- .lo .... , . .. .L l L... ' •• ! .... l

mientas basales de energía l : 3. Un 'proces:.ido!"~ de alimentos hace ¡nermelad2 er.! CJ.jjfornia v Id 'veT",de en ;'\.J"!le-
Ya York. . .. .. . ' -'
A) Peso 4. ~Jn rastro en Chicago distribuye. 1a Cdfjie . ~ ~:,~dc~ ]()S r':.5t~H:1.0.s .
B) Edad 5. ~3o~gf~~<;U~~~,~d;~ed~r~!~:. cí t ricl]S ;>r·:-,du·:r, ;'<!l.i!J1aS en ¡=lorid'l v las er!'¡ia ".
C) La estatura y el peso
D) La edad y el peso
1:,) La edad, la estatura y el peso

Val"iaciones de los reactivos de opción múltiple l·..) :: - !t.


.e) ",
.~- I

...... .i ,:,
Un número de variaciones de los reactivos estándar de opción múltiple se 1.1J
J.

. - e
han empleado a menudo en las pruebas. Gerberich (19561 da ejemplos de la
t.J r·. ;' ~.it}::
mayorí;' de estas variaciones, y una de las que más se us;m es la de aparear
reactivos, lo cual se examinará en la sección siguiente. En esta sección estudia· Ejempio '1
remos dos de las variaciones que se usan con frecuencia.

1. Reactivo de opción múltiple compleio. Esta variación obtiene su


nombre del formato y de las combinaciones de opciones que se usan para las
respuesta6. L;;. "ariación es más eficaz cuando se emolca Dara aoreciar el cono'
L Frío A -\cio rn1t::cln1ü:n te: .:. iJérdid.1 :_~~
cimiento o la habilidd para aplicar o interpretar causaciones, efectos, funcio·
nes o u sos múltiples. En el primer ejemplo se muestra un uso eficaz de este 2. Embl::inquecilniento .:l Hinch~tzón motilidaJ
tipo de rC8ctivo, porque requ iere que el estudiante discrimine entre 1.a ciase de Ai Todos
a1imcn,o~ y 1<, clase de mercancías que se hallan b,qjo la jurisdicción de la Food B) 1,2.:> V 4
and DruS Ai¡::ü,ú,rr,Eion Hugnes y Trimble (1965 ) han demostrado que este C) Todos, ~xcepto 5
D) 1,2, -3 Y 5
238 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
C Ó MO REDACTAR 239
2. Uso de apareamiento de enunciados como estímulo. Esta variación
medición relativamente superficial. Obsérvese el si · .
se ilustra a continuación. miento que apareció en una prueba acerca de la sal~Jenr h~e:nplo de aparea-
Ejemplo nos del octavo grado. En dicho ejemplo se muestra la~: ~~:~e )ara alum-
comu~es que s~ pueden cometer al construir los reactivo?a ar e os er~ores
Instrucciones: Los reactivos del 1 al3 están basados en apareamientos de enunciados. ro, las mstrucCI?neS son vagas; pues no especifican la base d~l aeados . ~nme­
Léase cada enunciado cuidadosamente. En la hoja de respuesta marque]o siguiente: Segundo, el conJunto de estímulos es demasiado het ' pareamlento.
ser un buen ejercicio de apareamiento .. cuántas o :rogeneo para que pueda
A) Si la cantidad en el enunciado 1 es mayor que en el enunciado 1I. columna JI son respuestas ¡ógicament~ lposibles p~~~~lesr~e respuest~s en la
B) Si la cantidad en el enunciado 1I es mayor que en el enunciado 1. mer
CJ Si la cantidad en el enunciado 1 es igual a la del enunciado 11. la columna E, iY para la segunda? Los enunciados en la coPlu eInl;lnclado de
com ' . mna tIenen muy
m) 1. 1. Valor calorífico de una cucharadita de azúcar de caña. poco en un, excepto que se relaCIOnan con los dientes c l I d
11. Valor calorífico de una cucharadita de mantequilla. tal en general. Tercero, el conjunto es demasiado largo lY on .a sa Ud den-
' Y as opCIOnes e res-
(A) 2. 1. Los requerimientos diarios de calorías para un leñador de 1.82 m pues t a en 1a co1umna JI no estan arregladas en orden . t ,. A
de estatura, con un peso de 85 kg y una edad de 25 años. examinado sabe la respuesta al enunciado tiene queSISb emat¡lco. undsi el
· , Uscar a en to a la
II. Los requerimientos diarios de calorías para un empleado de ofici- co Iumna 11,o 1 cua1 1e 11 eva tIempo. Cuarto algunos de 1 . d .
na, de 1.82 m de estatura, con un peso de 85 kg Y una edad de 25 .
vagosiPOre¡empo" I 9 11 '
y 12enlacolumnaleI LyM 1os enunCIa
1 os son
años. vaguedad dificulta justificar la respuesta marcad'a c en a ca umna In. Esta
(A) 3. I. Los requerimientos diarios de hierro para una muchacha de 16 , '1 . ., d omo correcta por e maes
troi m~s aun, a px:eClSlon el número 12 podría cuestionarse Quinto ha 16-
años. enuncIados en la columna J y 16 opciones de respu t I · l , y.
II. Los requerimientos diarios-de hierro para un joven de 16 años. . d· b 15 , . es aen acoumnaII·slel
estu lante sa e ,automaucamente contestará bien la 16. '
El formato de enunciados apareados es un modo eficaz de medir juicios Ejemplo
acerca de las cantidades relativas, de los efectos relativos de cambio de condi-
ciones o cronología relativa. Este formato se debe usar preferentemente para De(i,ciellie: Instrucciones: Colóquese la letra correcta l · . d d , .
los contenidos que manejen valores cuantitativos establecidos; por ejemplo, Unhcense las letras sólo una vez: a a lzquler a e cada numero.
usar un par de enunciados como "1. El número de horas de sueño que necesita Columna 1
un adolescente de 14 años" y "II. El número de horas de sueño que necesita un Columna 2
hombre de 30 años" sería inapropiado, porque no hay valores empíricamente I~' 1. Número de dientes
A. Maloclusión
determinados para el número de horas de sueño que se requieren para ciertos permanentes
grupos de edad. I!) 2. Vitamina O B. Alimentos desgarrados
I~' 3. Vitamina C C. Inflamación de las mucosas de la
Elaboración de reactivos apareados boca
I~) 4. Esmalte D. Enderezamiento de los dientes
La característica que distingue a los reactivos apareados de los reactivos de Iº' S. Encías sangrantes E. Agujero en la mandlbula
opción múltiple ordinarios es que hay varios problemas cuyas respuestas 19 6. Angina de Vincent F. Contiene nervios y vasos
deben tomarse de una lista única de respuestas posibles. El reactivo apareado sanguíneos
se ha empleado con más frecuencia para medir información factual, como el Iº' 7. Ortodoncia G. Moler la comida
significado de algunos términos, las fechas de eventos, los logros de algu- I~' 8. Alveolo H. Corona
nas personas, los símbolos de los elementos químicos y los autores de libros. I~) 9. Prognatismo
La forma de aparear los reactivos eficazmente puede hacerse por medio de la 1. Rayos de sol
I!' 10. Pulpa J. Instrumento de limpieza
construcción de _una base para colocar los reactivos en una carta, en un mapa, IMI 11. Ácido
en un diagrama o en un dibujo. Las características de esta figura pueden K. Sustancia más dura
numerarse y el examinado tiene que aparear los números de la figura C'1n los
19 12. Bajo porcentaje de caries L. Primitivos
@ 13. Cúspides
nombres, las funciones, etc. Este método para construir reactivos aparea- M. Caries
dos es particularmente útil para las pruebas que tratan de medir las habili- 19 14. Molares N. Frutas cítricas
dades de estudio en ciencia o tecnología (por ejemplo, identificación de las l!:i) 1S. Parte visible del diente
o. Gingivitis
estructuras de las células en una prueba de biología)_ 111 16. Hilo dental
P. 32
El apareamiento de los reactivos en las pruebas hechas de manera particu-
lar suele tener fallas técnicas y como resultado tiende a ser instrumento de Prucb~~ta: Las respuestas u correctas· son las que designó el maestro que construyó la

..
, :, '. ,-
240 CAP. 7. DISEÑO Y CONSTR UCCiÓN DE UNA PRUEBA CÓMO REDACT AR 241
. aClOn
A contmu . , s e pyopor cionan las <Tuía~ para escribi r buenos reactivo s Al Apelación a los sentimientos de miedo y de inseguridad.
". b' -
.31 Exaltación a lo esnob y a la identificación con un grupo particul
de apaream iento: ar, pequeño o
:ndividual
Ci ,:"pelación al deseo de gustar a los otros, de unirse al "carro de
la victoriaK

DI Exaitaó ón a la autoridad.

Los enuncia dos del! al6 son anuncios de productOs imaginarios. Lea
ciado cuidadosamente. Para cada enunciado marque la letra de las opcionecada enun-
tas, ias cuales se pueden usar más de una vez. s propues-
,
(hJ 1- N o deje que una sangre cansada por falta de hierro lo deprima. Mantenga
su vigor, entusiasmo y vivacidad. Tome lnlantol.
()d) "
L. La investigación ha demostrado que las Píldoras letales de .la Pequeña
Luey son 10 veces más eficaces que los analgésicos ordinarios.
::a) 3. Zoyla Barriga, belleza internacional, se lava la cara dos veces al día con el
aceite de tortuga A1yrtle .
ml 4, Hombres: ¡ya se cansaro n del olor del desodorante femenino? Sea un
hombre : use Nosude . Déjele ese produc to débil al
ml j. Al precio de SI 629.21 dólares, ellogge r Interno nosexo opuesto.
puede sercualquie-
ra. ¡Solamente algunos seleccionados pueden estar orgullosos de poseer
uno! ~Es usted uno de ellos?
¡S:;l 6. Sea uno de la multitu d. Beba y sirva Popsie Cola.

Prepar ación de la prueba objeti vá para su uso

Las prueba s objetivas, particu larmen te las de opción múltip le,


deben
ser reprodu cidas de manera que cada examin ado tenga su propia
copia. La.
admini stración oral de las prueba s obietiv as no es satisfac toria.
Mucha s
escuelas tienen duplica dores de esténci l o máqui nas "Ditto" que
son muy
adecuadas para reprodu cir las prueba s para grupos de tamaño
modera do.
Para grupos más grandes, es preferi ble el mimeó grafo o las copias
offset.
Más import ante aún que el proces o de duplic ación es el de la
calidad del
trabajo, tanto para organiz ar como para distrib uir la prueba
y luego la
mecanografía de ella para hacer la copia maestr a. A continu ación
se exami-
narán los puntos más import antes en la ordena ción de los reactiv
os de una
prueba.

l. Ordene los reactivos de la prueba de tal manera que puedan leerse


fácilme nte. Por el interés de la persona evalua da, los reactiv
os no deben
amontonarse en las hojas de papeL Las llregun tas de opción múltip
le son más
fáciles de leer si cada opción de respues ta aparece en una línea por
separado.
Debe evitarse coloca r parte de un reactivo en una página y la otra
parte en la
página siguien te, ya que este tipo de present ación puede confun dir
a los exa-
minados. Si varios reactivos se refiere n al mismo diagram a o cuadro
, trate de
ordenar la prueba de tal manera que el diagrama o el cuadro y todos
los reacti-
Ejemplo: A.paleú miento maestro vos estén en la misma página.
2. Planee la distribución de la prueba de tal modo que se pueda usar
una hOja de respue stas por separa do para anotar las respuestas. Lo anterior
es conveniente para que el estudia nte anote sus respues tas y para
la persona

-
242 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 243
que califica la prueba, ya que una prueba objetiva se puede calific~r mucho dón est~ limitado, de tal manera que a~gunos de los reactivos en la prueba no
más rápida y eficazmente si las respuestas se anotan en una hOJa aparte. intentaran contestarlos todos los estudiantes. Estos reactivos no l' t d
Muchos maestros piensan que usar una hoja de respuestas por separado pro· ' ser 1os. mas
de benan 'd'f"l n enta os
1 lCl es, o sea, los que el examinado hubiera tenido
duce que los estudiantes tengan más dificultades para conte~t~r; SIn embargo, menos oportUnIdad de contestar correctamente, aun si hubiera tenido el
aun los estudiantes de tercer grado pueden aprender muy rapldamente a usar tiem~o de leerlos y tratar de cont~starlos. En las pruebas de capacidad
una hoja separada de respuestas y por lo general tienen poca o ningun~ ~ifi. este tIpO de orden se supone que tIene cie:~as ventajas psicológicas par~
cultad en usarla. El uso de una hoja separada de respuestas es una hablhdad alentar a los estudIantes, so~re to~o a los mnos pequeños y a los estudian-
que debería enseñarse a los estudiantes des~e los primeros grados escolares. tes menos capaces para contInuar mtentan~o los reactivos de la prueba en
En la figura 7.1 se muestra parte de una hOla de respuestas elaborada por un vez de desalent~rs.e.y aband~nar la ta~ea; sm embargo, esta práctica está
maestro, que es adaptable tanto a los reactivos de falso-verdadero como a los ¡¡poyada p~r el JUiCIO. profeslO~al, mas que por la evidencia empírica.
de opción múltiple. 6: Escnba un conl~nto de l~struccit?nes específicas para cada tipo de
reactIVo .. ~n buen conJ:Into d~ mstrucclOnes proporcionará al examinado
mformaclOn acerca de co~o ~eglstrar sus respuestas, la base para seleccionar
sus respuestas y los procedlmlentos de calificación que se emplearán para las
respuestas.
Curso _ _ _ _ _ _ _ _ _ _ __ Nombre _ _ _ _ _ _ _ _ _ ___ Para una prueba constituida por reactivos de opción múltiple en la que no
Exornen _ _ _ _ _ _ _ _ _ __ Fecho _ _ _ _ _ _ _ _ _ _ __ es !mportante que el alumno adivine la respuesta y para la que se usará una
~oJ~ de respu~stas I??r separado, deberán seguirse las instrucciones que se
Instruccione s: lea con cuidado las instrucciones de la pruebo y sígalas
mdlcan a contmuaClOn:
exactamente. Para cada reactivo de la prueba morque su opción
para la respuesta correcta con un tache a la letra que corresponda . I~strucciones: Lea cada reactivo y decida cuál es la opción que mejor completa el
enunCiado o la respuesta a.1a pregunta.
Reactivo Respuesta Reactivo Respuesto Reactivo Respuesto
Marque su respuesta en la hoj~ de respuestas por separado que se anexa. No mar-
1 ABCDE 26 ABCDE 51 A BCD E qu~ l~s respues~as en el protocolo de la prueba. Para indicar su respuesta, rellene con
2 ABCDE 27 ABeDE 52 A BCD E ellaplz e~ la hOJa de respuestas la letra correspondiente a su opción; es decir, si piensa
3 A Be D E 28 AseDE 53 A BCD E que la m~Jor respuesta p.ara el reactivo 1 es B, marque con negro la letra Ben la hilera
4 A BCD E 29 ABeDE 54 A BCD E del reactivo 1 en su hOJa de respuestas.
Su ~ali~icación será el número de respuestas correctas, por lo que, por su propia
Figura 7.1. Parte de uno hoja de respuesta hecho en caso. convemencIa, conteste todas las preguntas, aun si no está muy seguro de cuál es la
respuesta correcta.
Asegúrese de que su nombre aparezca en laho;a de respuestas.
3. Agrupe los reactivos del mismo forz:nato (tal~o-verda~ero, opció.n
múltiple o apareamiento). Cada tipo de reac~lvos objet~vos reqUIere una se~e Para una prueba,que consta de preguntas de falso-verdadero, en la que las
res~uestas se ano.t~ran en el. p.apel. ?e la prueba y en cuya puntuación total se
de instrucciones distintas. Agrupar los reactivos del mIsmo formato permite
har.a una cC!rrecclOn por adlvmaclOn, se podría aplicar el siguiente conjunto
escribir una serie de instrucciones claras y precisas a lo largo de esa parte de la de InstruCCIOnes:
prueba. Las diferentes clases de reactivos también requieren con!untos de res-
puestas o enfoques distintos para ese reactivo por parte de~ exammado. El exa- l~strucciones: ~ea con mucho cuidado cada enunciado siguiente.
minado tiene más capacidad de mantenerse en un conjunto de respuestas
SI todo el enunCIado o una parte de él es falso, encierre en un círculo la F enfrente
apropiadas o de enfocar su atención si los reactivos del mismo tipo están agru· del enunCIado.
pados por categorías. . Si el e:llunciado es completamente verdadero, encierre en un círculo la V enfrente
4. Dentro del mismo tipo de reactivo. agrupe aquellos que se relacIO' del enunCIado.
nen con la misma área de contenido. Esta práctica ayudará a los estudiantes.3 . Su :alificación será el número de respuestas correctas menos el número de res-
rechazar la idea de que la prueba carece de unidad. o de cohen:,?-cia y les p,errru- puestas Incorrectas, por 10 que no le conviene conjeturar a ciegas. Sí usted no está
tirá tener un enfoque más integrado de los reactivos, Tamblen ayudar~ para razonablemente seguro de la respuesta, omita contestar la pregunta.
que tanto el estudiante como el maestro ~e percaten de las fallas y los aCIertos Asegúrese de que su nombre aparece en su prueba.
del primero cuando trata con el contenido. . .
5. Ordene los reactivos de tal manera que el grado de dl/lcu1tad vaya 7. Asegúrese de que un reactivo no proporciona pistas para contestar
de lo fácil a 10 difícil . Esto es muy importante cuando el tiempo de evalua- otro u otros reactivos. A menos que se sea muy cuidadoso cuando se ensam-

" ' , . . .
. ... ','" ;..;. ' ;': ; '" '~)~"<":';. ~ > . ~,~~I • ;.:.:: "." . .... , .... ·. ·,.;. l.. '. · ·.
244 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 245
blan los reactivos para una prueba, puede ser que la respuesta a un reactivo diferencias reales en entre los estudIOan t es. U no d e los
va se hava dado en un reactivo anterior. Todos los reactivos que se seleccio_ ' . . el aprovechamiento
1. .
.PrOPOsItos
- que se .mtentan
' 1 a InstruIr a .los examinados a no a d··
lVInar v a
1
~en deberán veriÍicarse cuidadosamente, porque es posible que un reactiyO Imponer una sanClOn por as respuestas mcorrecta~ es tl'ata d ¡ ..

de Íaiso-verdadero o un reactivo de completamiento ofrezca la pista para J d' · ~, r e que 'a con-
ducta. oe a lVInar sea cada vez menos posible para todos lO' : d
contestar un reactivo de opción multiple o viceversa. En el siguiente ejem- W aters (196 7)· d" 1 r • S examma os
(. estu 10 os erectos de difep"n·es fórmu'las d l·f· .,.
. l· d . . . - e - . e ca 1 IcaClOn
plo, el reactivo de falso-verdadero proporciona una pista para responder el so lJrc
.. e numero
1 d e reactIvoS '1 , l a s e ca '1 t'·1-
oillmdos de una prueba. Las ro ' rmUl' . d ,.
reactivo objetivo. c~clO:-: emp ea as eran: so o las respuestas correctas; las correctas me~os
1/4 (le Incorrectas¡ I, .
las Correcta~~ rnenos las. in C ()rl'ect~s d i
l' as correctas
Ejemplo mcno .~ d os ~or laS Incorre~tas! y las correctas menos cuatro Dor las in-
Corrcelas. Waters e:r;conrro que el número de omisiones auin:::nraha a
1. Y.. F Las esporas de las bacterias que causan el botulismo están presentes er. el medIda1
que l~ sanClOn
d por las
.. ' respuestas. incorrectas se increment' ~
aoa , ¡:..ero
suelo v en el aire. que. lOS examma os que reClb¡an sanCIOnes de calificacl· (J' n ma'· s·e "o'
2.· ¡Cuál de las bacterias siguientes forma esporas? . , ._ ' , .. . "v~Ias no
omJt1an
. 1'" tantosT b·reactlvOs
. como, deoenan , SI es quo~. ¡'Dan a- l'ogI'ar la c al·f· 1 IcaclOn
.,
Al Estafilococos que causan "intoxicación por ingestión de alimentos" mas a. ",a. am ¡en encontro que el numero promedlO de reactivos correctos
era
. 1ma:;
. . o menos . , el mIsmo para . . todos los patrones de calificac¡'o' n . P arece que
lH Los bacilos que causan
el botulismo
Los bacilos que causan la tifoidea
C) nI .a l?strucclOn para no adIVInar, con u:r;a amenaza de multa o de castigo por
DI Neumococos que causan la neumonía las respuestas lD~orrectas, m la mstruccIOil para contestar todas las preguntas,
va
' sea qued se Ieste
· seguro de la respuesta o no , -persuade . a las pers onas a com-
8. Asegúrese de que las respuestas correctas forman esencialmente portarse .e (Ta mIsma manera en una prueba objetiva. La probabilidad d~
un patrón al azar. Algunos maestros intentan calificar más fácilmente por correr e1nes o o parece depender mucho de la personalidad del individuo así
medio del establecimiento de un patrón regular de respuestas correctas; como d~ las InstruCCIOnes de la prueba . '
norejemnlo. en un nrueha de reactivos falsos o verdaderos. pueden usar un La formula para la corrección por adivinación Clue SI": 11~" o(Tpnpr"l~",~~o ..., .. . . ...............
n_

p;trÓn- ~~·p~titivo c~mo V, V, F, F, F, o en una prueba de 'o 'pc¡ón múltiple


- 'J. ' - - --- ..l .l. ... .I. ..... J . .1 l ...... \..,:)

emplear un patrón como A, B, e, D. Cuando se hace esto, algunos estu· Puntuación corregida = R - W
diantes que ya han contestado muchas pruebas descubren el patrón y lo n -1
usan como medio para contestar los reactivos que realmente no sabían. En
las pruebas que tienen reactivos de opción múltiple con cuatro opciones donde: ~ es el n~mero de preguntas contestadas correctamente,
hay una tendencia a que las respuestas correctas aparezcan con más fre- \Iv es el n~mero de preguntas contestadas incorrectamente v
cuencia en el segundo y tercer lugares, que en el primero y el último. Es n es el numero de opciones de respuesta para cada reactj~o~
deseable que una prueba de opción múltiple tenga las respuestas correctas
en cada lugar posible cerca del mismo porcentaje para cada uno¡ por eiem- Nót;se que las p~eguntas para las qUe los eX,aminados no dan la respuesta
plo, en una prueba de reactivos de opcióI?- múltiple de cuatro opciones que no cue~:an en esta formula. En uI?a p~ue~a de talso·verdadero en la que sólo
contenga 50 reactivos, se deberían verificar las posiciones de respuestas h~y d~~ .espuestas p,oslbles, n -:- i en 12 formula se convierte en un 2 - 1 lo
correctas para comprobar que cada posición contiene no menos de 10 reac- sca, 1,. y/a~orrecclOn por adiVInación es el número de respuestas correc::~s
tivos y no más de 15. menos e. numero de respuestas Incorrectas.
d f ~os dos ejemplos que aparecen a continuación, uno basado en una prueba
e a s?-verdadeTo y el otro basado en una prueba de opción múltiple mues-
Calificación de la prueba objetiva tran como funclOna la fórmula. I

Una decisión básica que debe tomarse antes de aplicarse la prueba es Ejemplo 1
determinar si se va a hacer una correción por adivinación o no. Si así es, debe
decirse a los estudiantes, porque esto puede influir en su estrategia para con- Desempeño del estudiante
testarla prueba. Los expertos en pruebas no están en completo acuerdo acerca
de la utilidad de la corrección por adivinación. Tipo de prueba n R w Omisiones
Desde hace mucho tiempo se sabe que hay marcadas diferencias entre los Falso-verdadero 2 48 20 7
estudiantes en su tendencia a adivinar en una prueba objetiva cuando no están
seguros de una respuesta. Estas diferencias en el patrón de adivinación inclu-
yen algunas variaciones en las calificaciones que no están relacionadas con las Puntuación corregida = 48 - ~ = 48 20
-1- = 28
2 - 1

----.-.
246
CÓMO REDACTAR 247
Ejemplo 2
je de la clase y lo~ fracasos en ese aprendizaje que pueden guiar la enseñanza
Desempeño del estudiante futura y el estu~I?; En segundo .lugar, las respuestas para cada reactivo por
separado y la revl~lOn de los reactIVOS a la luz de estas respuestas dan u a b
Tipo de prueba n R w Omisiones para prep~~a~ m~J~res pruebas para los años siguientes. ' n ase
Opción múltiple 5 48 20 7 El anahsls basIco. que se necesita consiste en organizar las respuestas
dadas para cada reactlvo de la prueba. Necesitamos saber cuántos alumnos
20 contest~ron correcta~ente cada reactivo, cuántos seleccionaron cada res-
Puntuación corregida = 48 - 5 _ 1 = 48 - 420 = 43 puesta Incorrec~a posIble.y c~ántos omitieron cada reactivo. Podremos
compren~er meJ?r el ~eactlvo SI tenemos esta información para las fraccio-
En la fórmula se supone que una persona conoce la respuesta c?rrecta o la nes s~penores e I~fen.o,res del grupo, y tal vez para aquéllos del centro. De
adivina, es decir, que nunca responde sobre la base .de estar erroneamente este tipO de orgam;z:aclOn podremos contestar preguntas como las siguien-
tes para cada reactlvo:
informado, y todas las opciones son igualmente atractl~as 'par~ ~a persona que
no conoce la respuesta. Estas suposiciones rara vez estan JustlfIcadas. Por un a) ¿Qué tan difícil es el reactivo?
lado un buen constructor de pruebas formula opciones erróneas con el fin de
que ~ean contestadas por los estudiantes mal inform.ado~¡ por el otro, la perso. b) ¿El reactivo establece la diferencia entre los mejores estudiantes y los
peores?
na con una información parcial o con alguna expenenCla en contestar reactl.
vos objetivos normalmente puede eliminar una o dos opciones de su con~ide. e) ¿Toda.s las opciones atraen respuestas, o hay algunas que son tan poco
atractIvas que no importaría incluirlas o no?
ración Por tanto la corrección de la fórmula es cuando mucho un ajuste
aproxi~ado e ine~acto que puede ~ompensar las diferencias significativas en
la capacidad para marcar los rea~tlvos. . S.e puede preparar una forma simple para anotar las respuestas de cada
La adivinación de los reactlvos presenta uno de los problemas mas cea.cuvo, como la que se muestra en l~ figura 7.2. Esto se puede poner en una
serios en las pruebas con restricción de tiemp? q~e tienen l:eactivos de tar¡eta por separado para cada reactIVO y acumular la información en un
sólo dos opciones. Las calificaciones. que se ?btleI?-e!1 de este tIpo~: prue· arc~~vo d~ r~activos p~rmanente. La forma está planeada para un reactivo de
bas probablemente serían más cO~!lable,s ~I se hICIera la cor~ecclOn por opClOn multlple con CInCO opCIOnes, pero se puede usar también para reacti-
vos falso-verdadero usando sólo las columnas A y B.
adivinación. En las pruebas de opClOn multIple con cuatroy ClnCO OpCIO'
nes y con tiempos suficientes para permitir q~e todos o caSI tod?~ los exa·
minados intentaran contestar todos los reactIvos, una puntuaclOn que es
simplemente el número de respuestas correctas ~esulta basta~~e satisfa~.
toria y no hay ventaja, o sólo muy poca, si se aplIca la correCClOn por adl' Reactivo: ¿Cuál de los estados siguientes estaba formado por el territorio
vinación. .. . . noroccidentol?
. Ha habido múltiples sugerencias para patrones de cahfIcaclOn~s mas
A. Indiano
complejos para las pruebas objetiva~, particularmen~e para los r~~ctIv.~s de B.lowo
opción múltiple. La mayoría de ellas IOcrementan el tiempo de cahEIcaclon y, C. Montana
en cierta medida también el tiempo de aplicación de la prueba. Algunas de D.Oregon
ellas parecen producir ciertas ventajas .en la precisión d~ la med~ción por ~eac·
tivo, pero no queda claro que proporcIOnen una gan~cI~ por mmuto de tlem· Opción
po de aplcación. Los lectores interesados en estas vanaClOnes pueden consu!. A B C D E Omisión
tar los tratamientos especiales que se han dado a este problema (Ebel, 196:>;
Superior 25% 10
Davis, 1959¡ Combs y colaboradores, 1955). Enmedio 50% 17 2
Inferior 25% 5 3
Análisis y aplicación de los resultados
de las pruebas objetivas Figura 7.2. Forma pora registrar los datos del anólisis de reactivos.

U n análisis de las respuestas de los alumnos a los reactivos de una prueba


puede servir para dos propósitos i~~ort~ntes: E!1 primer luga~, la re5pue5t~ ~~ . ~~ra mostrar el tipo de información que se proporciona por medio de una
reactivo proporciona una informaclOn diagnostIca para estudiar el aprendiza anahsls de los reactivos, a continuación presentamos ciertos reactivos de

.
.. ..
' . '-J." . . " ,-

. . ... , ' ..... , \ ,. ,..... ' .,• ..... : . .:


248 CAP, 7, DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
CÓMO REDACTAR 249
una prueba de estudios sociales, junto con el análisis de respuestas para cada
reactivo, Esta prueba se aplicó a 100 estudiantes de preparatoria que habían Éste es ul}- re~ctivo difícil, Fero muy eficaz; es difícil porgue sólo J 3 de 50
Ilumnos lo obtUVIeron correclamente v efIcaz porque l'()< ' 3 ou
llevado un curso acerca de Jos problemas actuales de los Estados Unido;, ,e contestaron
corrcctilment~ pertenecen al grupo SUPcno'- Todas las o' "CI'on" ' '
" l, , ," J

Había 95 reactivos en la prueba, y la calificación más alta que se Obt~'.-0 " , 1 ,,-, ~ ,',-, " - , /', , ,-' 1 ~,S Incorrectas
;ltnllCTOD a gUl,d~ le~pueS,Lds eJ,1 el b"TUPO mreno, v mas ~"'l' "'CCl")ne" (J"C 1 "
fue de 85 y la más baja de 14, Las hojas de la prueba se ordenaron en un orden - .. U ; , v .... '- '~..(.:Jo I 1 ,,( ~

inferior que C,I grupo supe:cior. Incidemalmen~e, un reacl'lv(' rr)~n(' " 1' l'~ " ' ; ' , .
(J

de puntu;'ción total, desde la puntuación 8S,hasta 14, Las primeras 25 b~ia\ -, ' ,0' 1-,'- ,-,-,';' ~ -," - ~"'_ - , 'd d" , , ' " -.
¡'¡¡¡do 1,111"~,,,", _¡U~ ddca"a"',6, e;, !'a j ea ro' adiVInar <1- Clerra-" -'uan"(
,~, J l~ dC11CI0-
,
se seleccionaron para representar al grupo mas alto (las pumuaClOne.s estao"T, 1. '...1': U;.l r:':.::act'-
¡~
. ".. _..... b ..... L
\'0 esta escnto de maner" um enca;;; ' 1:n este reartl'vo Jl1 d,'r'l'í" -' ,1 '
en un ram;o de 59 a 85) y las últimas 25 para representar al grupo más hajo ;ia' • ' . . , ~~ la ," ,_ ~~ a~.:>. ~!r1jUO
• ..... 1
infenor se concentro en la 0P' Clan eOUlvo'-'adó. !Que i'r~ 1'a n1a" .:Jo.. 1.DO boJU,;'1,'[_' •
puntuaciones estaban en un rango de 14 a 34), El conteo de las resplle~ta, oC . -' a.
J. '-' t.:.
basó en los 25 casos del gruDO superior y en los 25 casos del grupo intc~i(iL
Las respuestas contestadas para cada reactivo por cada individuo en los gru, Ejcmpic
pos superior e inferior fueron contadas para obtener la frecuencIa ?,e
selecciór:
l<euct ivo. 3: BaTO el. (jacto de practicas c.:o rruntas" pj co¡nit~ '13(""1"")-1'11 AL> lln n 'l .~; ~ l '
de cada opción, Estas frecuencias se muestran a la derecha , LaopclOn conee';; . • i . . -
[itO (Cnona pt.:Tlnlt~.Oa I(! acep tación por contrihución:
- '. • '-, ...... 1.. Á r , ;. u ,,- ~" . • ),;:l. J (l()
. ' . .... ~
p.-l. ~_

está subrayada, y cada reactivo iba seguido de un breve análisis de los datos del
reactivo,
Al !O (lOO dÓJ;,T':S dci ¡¡eño!' Jones [ ::; (:
Ejemplo BI 1 000 di)lue¡; ~h~ la Corpor,lcHín ele Somhré rosABC 4 6
Reactivo 1: "Todos están cambiando a los cigarrosA.1iento de primeNera" es un e¡em, Q :; OOG dólares tie la AsociaCIón Nacional de Manufactureros 2 6
plo de .la técnica de propaganda lJamada: D) 500 dólares de íondos sindic:<ies de un sindicato locai -4 e
¡Omisiones) O O
Superior fnfe .f.!Or
Este reactivo Drobó ser muy de(.iciem<· Prim<'ro
~...... . ..
D(ll'QUP1 c<; -{)"S['
\,... ~.
t
ó. an e GHICll:
l' ,', "
l\} La generalidad brillante o ...L ,

solo OC110 de
, •

" í l esmdlantes, (O sea el ]6~{)! ]0 COll[' CS-L"""n Co¡'r"ct'


.- '""t - • , " " - t- '-.,.. 1 -'

.''-

fu El carro de la victoria 25 20 S
,egun d0, ~l' rCélCtlVQ '.", ' ,
G1SCnnuna de manera. negativa e' dcel'l' J~' o ' ,
''''J ~ amen,c,
e
,-'"r

C) Testimoniai O 2 , , , l , r _ l" ¡ ",s h ,:;pue:'lc ':.


concctaS iueron 111aS trecuen tes en el gruDO inferio!' q'l~ en el ' ' H
Dj Folklórica O ,'-
J os Cxp1lcaClOnes . ~ 1 L , - - . : . supenor. L av
pOSibles para el análisis de roactí\,o ' ~J el j'eaC[l'vo "', . 'b '-
¡Omisiones) O o guo cspCCJall11ente
'1
para
I
os estudiantes qu másP
'-
sa1)J
,u
'an "cel'~a del t
daa.1111-
-,
<
;1
-

1os cstu dlames " , , ~, '- '"" L 1 cma o D'


, .. " '1.;;
no hablan, ,,
aprendidn
' u
01
'-
significarlo
, ' - _ ,
de '!ac' LO
d e practlcas'
' !,
Este es un reactivo fácil, dado que todos los 25 en el grupo superior y 20 c?nup:a~ : _f; Sd?,SmO~ ¡eXISten dos ~ucstlOnes que hacen Suponer que la
dd grupo inferior lo contestaron correctamente; sin embargo, hace una dite- s~¡;unda eX~JL~a'-I?D es la mas prob<iDle: la concemración de respuestas de:,
rencia en la dirección deseada, ya que los errores que hubo los cometió el gru, ,gJ lIpO :up_e¡ 1~1 en la, OpclO~ A. y las aparemes respuestas al azar del grupo inte-
po inferior. El reactivo también es bueno en que todas las opciones de respues, rior que lJ1dlCan adI\'maClOu, Para cor;testar correctamente este ¡:oact: .. o pi
ta incorrectas funcionaron; es decir, cada opción de respuesta incorrecta fue L:studl"n'e te'"" "'L1- s b
• d L
. ;' ,
... ~_d. '....r t: ~ler eJ. ~l!nlte DUeSto SO Drc ]2S "'011 tribu"'-i nnr.>(· ,-1 '"" )n.,; ",;
'-' ,1' ,~ ..
n·lcionald'·~ ' ·'rD:'l"- ·- ·d · 1'- . -" _ .. '-vd J!.:':"
seleccionada por una o por más personas en el grupo inferior. Dos o tres reac- • , ~ u. " , c.l el O pUúrICO, a qUIen se prohibe hacer r-on '-ribur'ones" ~1<'
'-'o - \0 .. _ ...... i.." ..I.J ..

tivos fáciles, como el mencionado, serían idóneos para /;romper d, hielo" ai clases (le,:~,r~:l,i2;Z~~i,~? ~s i,~ A;>ociaCión Naciün~¡ de M;)nl~fa;~urel~~.s"Ei ~:!c~::
empezar la prueba, tro ~nd¡ 1,,: >u~ hd.~c., dlSCu UQO este rtdCtlVO en la ddse p;:¡rs. determinar dón¿',.,
esta¡ a lda'fdlt1cul~éld, p~ro es fácil imagindl' que J05 pumos 1 v -3 son los que cal~~
Ejemplo san a 1 ¡cuItad en el grupo superior. - , -
Reactivo 2: No hubo ingresos federales por impuestos antes de 1913, porque antes de Ejemplo
este año:
Superior Inferior Reactivo 4: El término dinero fácil empleado en economía significa:
A) El presupuesto federal estaba equilibrado 3 5 Superior
B) Los impuestos sobre la propiedad privada proveían Inferior
suficientes recursos al gobierno A) La ?abil~dad para pedir dinero prestado a bajas tasas
9 15 de mteres
g El impuesto sobre los ingresos era inconstitucional l3 O g), gividendos que se pagan por acciones comunes 21 17
DI El ingreso del trabajador promedio en Estados mero que se gan;¡ en concursos O O
U nidos era demasiado bajo para ponerle un impuesto O 5 O O
(Omisiones)
DI Dmero pagado por compensación por desempleo
O O 4 8
(Omisiones) O O

--,
250 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PRUEBAS DE RESPUESTA RESTRINGIDA 25 1
Este reactivo muestra poca discriminación en la dirección deseada 121
contra 17), ya que la diferencia no es muy marcada. El patrón de respuestas examen de ensayo proporciona una evaluación de una confiabl'll'd d i '
mente baja, . en par te deb'd ..
loa 1as vanaClOnes dentro y entre los le at re atIva-
es bastante común. Sólo dos de las cuatro opciones funcionaban, pues nadie 1 t " l . d 11 C ores Y en
seleccionó la opción B ni la C. Si deseáramos usar este reactivo otra vez, tra. parte por as mues ras ag utIna ,as que dan como resultado formular' unas
taríamos de sustituir la opción B por "Salarios pagados por un trabajo senci. cuantas .. preguntas. para I d ' m una ela-
abarcar todo un campo del conocimiento S'
110" y la opción e por "Dinero que se da a las personas como welfare"!. La boraClOn posten<?r, en e cua ro 7.4 se muestra un resumen de nuest
"' di
clOn e as 'ven t ajas .y Iasdb"esventaJas
' del ensayo de los reactivos de ra percep-
repetición de la palabra "fácil" en la opción B y la idea de obtener dinero por d 1 , respuesta
no trabajar en la opción e podrían hacer este reactivo un poco más difícil v corta Y e os reactIvos o Jetlvos. Para concluir damos algunas suge .
· d i " d . ' renclas
discriminador. ' re laCJOna as con ~ prepara.clOn e tipos de reactivos, como los de respuesta
Las estadísticas del reactivo, como las mencionadas, pueden usarse no corta y completarruento, y fmalmente algunas sugerencias para la escritura la
lectura de las preguntas de ensayo. y
sólo para evaluar los reactivos, sino también para guiar las revisiones y los
repasos del material con la clase. Los reactivos que fueron difíciles para la cla.
se en su totalidad proporcionan caminos para una nueva exploración. La dis. Cuadro 7.4. Resumen de la evaluación de tipos de prueba
cusión de estos reactivos con la clase debería aclarar la naturaleza de lo no
comprendido. Estas fallas en la comprensión pueden aclararse por medio Respuestas
de un análisis posterior, aunque en algunos casos es más recomendable hacer corta y de
Factor Ensayo comple/amiento
una revisión más completa del tema. Si la política local lo permite, es deseable Objetivo
dejar que los alumnos tengan una copia de su hoja de respuestas y de la prueba Puede medir la habilidad poro resolver
y prestarles la clave de respuestas, de manera que puedan volver a usar la prue. problemas novedosos
ba como una guía para la revisión y aclaración de los puntos que perdieron. ++ + ++
Puede medir lo habilidad poro
Este análisis puede enseñar tanto como una prueba.
organizar, integror o sintetizar ++ +
Puede medirlo originalidad de enfoques
PRUEBAS DE RESPUESTA RESTRINGIDA innovadores. o los problemas ++ +
Puede aislar habilidades específicos en
Hasta aquí hemos dirigido nuestra atención sólo a las pruebas hechas con el órea de los habilidades generales
respuestas estructuradas en reactivos objetivos, pero tal vez haya ocasiones en de lo escrituro, lo ortografía y el uso
que también se pueda hacer una prueba particular con ciertas ventajas que de la lengua
consista en reactivos de respuesta libre. La característica distintiva de todos Tiene valor potencial para el diagnóstico
los ejercicios de prueba de respuesta libre es que la respuesta es producida por Puede muestrear odecuodamenle los
el examinado para contestar la pregunta o el problema que se le presenta. La objetivos de lo instrucción
respuesta puede ser muy breve -una sola palabra o un número-, en cuyo caso Puede muestrear adecuadamente el
el reactivo se aproximará a la objetividad de los reactivos de respuesta estruc· contenido de lo instrucción
turada, o en el otro extremo, la respuesta se puede extender hasta constituir Oueda libre de los oportunidades poro
un pequeño o un largo ensayo. conjeturar lo respuesto
Existen ciertos objetivos educativos que sin cuestionamiento se pueden Proporciono calificaciones consistentes de
apreciar de manera más exitosa por medio de respuestas de ensayo. Éstosson colificador o calificador
los objetivos que se enfocan en la selección, el ordenamiento y la organiza·
ción, la expresión de ideas y aquellos que se abocan a producir soluciones a Es preciso poro diferenciar los niveles de
problemas que sean originales e ingeniosas; sin embargo, podemos cuestionar competencia entre los examinados
si la práctica de estos objetivos para los que se usan las preguntas de ensayo lo puede calificar un empleado sin
de manera típica determina qué calificación debe dar el lector a una respues- entrenamiento o uno máquino
ta de ensayo. El conocimiento de los hechos, la corrección y la eficac~a en el Puede ser colificodo rápidamente
uso del idioma y la legibilidad de la escritura a mano son aspectos que pueden Requiere muy poco tiempo redactor los
influir en la calificación de las pruebas de ensayo, de manera demostrable. reactivos
Aún más, leer cierta cantidad de exámenes es una tarea laboriosa, subjetiva. Un
2Término que designa un dinero que se recibe del gobierno cuando no se tiene empleo El ejercicio de respuesta restrictiva puede darse en forma de pregunta (res-
(N. del T.l.
puesta corta) o de un enunciado con líneas en blanco para llenar (completa-

~ .- . '
. .. ,'.; "
", ', : ':, ,,,, ,'.' ,, ,
252 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PRUEB..... S DE RESPUESTA RESTRINGIDA 253
mientol. Generalmente estas dos formas son intercambiables; es decir, se pue.
de Dresentar el mismo problema como una pregunta o como un enunc!ado
con líneas en blanco para que se complete la il7-formación. P~ra que ur;o re~c~i.
vo se clasifique como de respuesta restrictiva, la pregunta o ,el cnunclado debe
responderse con una palabra, un daro, UD número, una .trase~ una l!st~ de
\'a;ias naIahi2s o, cuando mucho! con no Iy;-.as de; dos o ~ref, oraCIOnes. La p;e.
"'Unta 'dl' l""Spuest2 restrictiva no es muy tlexlblc y deoe usarse poco er. las
~r';eb;lS -he~ha.s de manera varticular. Los n::activos de este,tipo son má~ ade·
~uados Dara evaluar el conocirnientO de vocabulano, DOml)~'<:s: fechas. Como
DfCTJ.sioi1 si1nple de conceptos y habilidades para resolver pr~)bl~J:nas cuan.tl!a.
riyos ..Los problemas cuantitativos que arrojan una ~oJ1J.cJ.on DUi.llCnC'l
específica son de I.'respuesta cortd.}; ~or su propia na.tu~aleza. ' .
No obstante oue ¡as Dreguntas de respuesta corta tienen una estructura Ejemplo
simple ,. directa, t-odaYia'sc ¡,mdueen mucho~ ejerc!~i()sma¡os de este iipo,
::::scrltos
. por constructores oc prueOéb" SIn C~'\1-¡'
' 1 1 _ .... 10.. ; O" j·a1l·,s
.. ~e"lenr"" J. ' : ' m"s
;...;c..\:) , • ~O'-"l"'"
.!~1. ::~tJ
C'. . . . . . . . .

cue se encuúltran en los reactivos hechos de manera parncular son la a;ntn· Deficiente: Respuesta cO.rta: ¿Qué contiene la hoja del tabaco? ¡Nicotina.)
Completamiento: La hoja del tabaco contiene ¡nicotIna!. .
<'~'l' ,,,:',,; "D e.l "l' C">unificach
,. , la falta de ...vrecisión_ para enunciar la pregun~c. y la
Meiorado: R~sp,:esta co:t,,:. iCu~I es el. nombre'cí'ela sustancia \renenosa que se
('~~ . ..... \.ta .... ~ -. ", • 1

trivi<ilidad del conrenido que se mide. Cuando construyen reactlvos oc como encuentra en las hOJaS del tabaco' ,N¡cotma ¡
plctamiento, los maestros'suelen tomar una oración de un libro de Icxto y le ., l ' . ' . ,
Completam!ento: La sustanCIa '.·enenosa que se encuentra en la~ hojas del tabaco se
suprimen una o dos palabras. Esta práctic~ es indese.abie por dos razone~: una llama ¡mcº-tIn~!i.
oración fuer2 de contexto pierde; mucho úe su sIgmtlca~o y se. reqUl,;re ~~ma·
siado esfuerzo en la rnen10ria inrOrlnatlva q1..1C rellene el lTlaterlal de lOS Jlbros 3. Asegúrese de que la respuesta Que ,oe vide tll (>.ot71r1innrQ ,nn ¡:"~.•- •.-i
de texto. En la siguiente sección se ofrecen algunas sugerencias,par2 mejorar mente correcta. Vea los ejemplos deficien;es' ~u~ s~ d~~;~'~;'~;i;~:~ió]~Ui"~
ia construcción de los r~activos de respuesta corta y de complcr<!rIlícmo. respu~st2 q?e los constructores de pruebas querían era 11 cirrosis del híga do",
pero el alconOi per se no causa la cirrosis del hígado, sino la deficiencia nutrÍ-
clOn,al, q~e frecu~nteI1!eI:te se asocia con la excesiva ingestión de alcohol (1Ue
Elaboración de preguntas de respuesta restringida proouce la C1TrOS1S del hIgado. •

l. Ase g1..írese de cue cada .reactivo se relaciona COl] Ul1 contenido Ejemplo
jmfJ(l1'tant~;110 mida tri;;w1idades. La información que tien.e o que se pide
rec-ordar a un estudiante dclierú'. scr la más importdme en el área. Evite e) tipo De!icie;'lte:Respuesta cort.a: ~Qué enfermedad orgánica del hígndo es causada por el
de n:.acnvo Que lustjficJolemente. Dodria ser contestado con un 1, ty d. quién]e alcohol, ¡Clrros:s del hIgado.l .
~ompleta.mlevto:
~~[~~~~~:;~. S;~~l<;hl~~~~~ac,~~c¡~ld~;~~::~~~~!~~;jaC;;i~: ¡l~~ J~~~~~~:~e:Fll;~~~~~~l;: ~:~;~ hlgado. El alcóhol causa una enfermedad orgánica qu.e se ilarna ¡'cirrosis)
__ .__ . del
consjdcrand~). Los ejen1D!OS de preguntéls deficientes que se dar1 en s~:guida y Meiorado: Respuest: ~oTta: ¿Cuál,es J" enfermedad r.:rgánica dei higado que es común
la üüoímación triyi~l q~c se midl; 'aparecieron en una prueba hech" por un entre l~s personas que oeben grannes cdntIdades de alcohol y que tfenen dietas inade-
cuadas, ¡CIrroslS del hígado.!
maestro que media conocimientos acerca de la saluda aluml;l.Os del octavo
Completamiento: Las ~ers0I1;rs q~e beben grandes C<lmidades de alcohol y que tienen
grado. No se sugiere ninguna revisión sobre estos re~ctl\'oS, d~dO 9uelal~for.
mación que requieren para ser contestados no podna ser de nmgun sIgmfIca· hd~etads
19a madecuadas suelen surTIr de una enfermedad orgánica llamada ícirrosisj del
O. _ _ __
do en la comprensión delas prácticas de la salud, ni dela salud en general para
los alumnos del octavo grado.
4. Asegúres~ de que e! lenguaje que se usa en la pl'egunta sea preciso V
Ejemplo
~~acto en re1aclo.n con el orea dela materia que se está evaluando, El reactÍ-
de completamlento de muestra que apareció en la prueba para alumnos del
~~ta:o grado acerc~ del tema de la salud, revela que desde el punto de vista
Deficiente: Respuesta corta: ¡Cuántos casos de sarampión ocurrieron en Estados Uni· ,lOloglco, el enunCladore~ulta impreciso al llamar "partículas" a los genes e
dos en 195m ¡Respuesta: 39).
Deficiente: Completamiento: En 1965, sólo uno de cada ¡lO) estadounidenses rum'
.
~nexa~to
rcceslv
al usar los adJetlvos "fuerte" y "débil" en vez de "dominante" _.
L 11 ." d I " y
ron una adecuada higiene dental. de - o, a,reY1Slo.n e. a pregunta muestra como pudo haberse enunciado
manera mas preCIsa SIn tener que descartar la respuesta.

-"
..
254 PRUEBAS DE RESPUESTA RESTRINGIDA 255

Ejemplo
8. En un reactivo de comp1etamiento ponga los espacios 1 ¡ . 1 d 1
enuncJa. do. en vez d
e aIpnnC1pIO_
· · . El estud·lante debería saber qué apregunta
ma se e
Deficiente: Algunas de las partículas adentro de los cromosomas son más fuenes que le formula antes de que encuentre el espacio para contestarla.
otras. Se dice que las más fuertes son las (dominantes), mientras que las débiles son las
.(recesivas). Ejemplo
Mejorado : Una madre tiene sangre de tipo A y el padre tiene sangre de tipo O . Cuatro
hijos de ese matrimonio tienen todos sangre de tipo A. De esto se podría concluir que Deficiente: La g!ándula es un ejemplo de glándula endocrina.
los genes para el tipo de sangre A son (dominantes" con respecto a los del tipo O. Me¡orado: Un ejemplo de una glándula endocrina es la glándula _ _ __
. 5. Si el problema requiere una respuesta numérica. indique las unida-
des en las que debe ser expresada. Esto simplificaría el problema de la califi-
cación y retiraría una fuente de ambigüedad de la respuesta del examinado. En Preparación de la. prueba para su aplicación
el ejemplo que aparece a continuación, la respuesta puede ser cuatro tazas, 2
"pints" o un cuarto de galón, y si el estudiante no distingue las unidades en las Los objeti~os 'principales que deben buscarse al preparar una prueba de
que da su respuesta, el maestro quizá tenga dificultades para determinar si el resp~esta restnnglda para su ad.ministración son que el formato de la prueba
estudiante en verdad sabía la respuesta o no . sea facIl de compre~der y segmr para los examinados, así como que las res-
puestas sean convemeI!tes para que el constructor de pruebas las pueda califi-
Ejemplo car. Algunas sugerencIas que le ayudarán a lograr estos objetivos son:
Deficiente: ¿Cuál es el requerimiento mínimo recomendado de leche para un mucha·
cho de 14 años de edad? . 1. Si se usan. tanto las preguntas de. respuesta corta como la de co~pleta­
Mejorado: El requerimiento mínimo recomendado de leche para un adolescente de 14 mIento en l.a m1sma prueba, coloque ¡untos todos los reactivos del mismo
años de edad es de (1) tazas. tipo. C~da tIpO de pr~gunta requiere un conjunto de instrucciones diferente y
un conjunto de funclOnes mentales distintas de los estudiantes.
6. En el rea.ctivo de completamiento omita sólo las palabras clave. La 2. Haga que los estudia~tes escriban sus respuestas en una hoja sepa-
.línea en blanco del reactivo de completamiento debería requerir del estudian- rada de respuestas. Lo ~ estudIantes deben tener un amplio espacio para ano-
te que aplique un hecho o un término que es importante en el area que se está tar sus resI?uestas. DebIdo. ~ que e~ tamañ~ de la escritura a mano varía según
considerando. No deje fuera el verbo en el enunciado de completamiento, a cada estudlant~" es muy dIfICIl estimar que tanto espacio necesitará cada uno
menos que lo que se quiera medir sea el conocimiento de las formas verbales. de ellos. Tamblen para el maestro puede ser más fácil calificar pruebas si las
En el reactivo de muestra, el maestro tiene que decidir si quiere evaluar el respuestas se anotan de !?anera unifor~e. Pa!a las preguntas de respuesta
conocimiento de la palabra "glucógeno", del lugar donde el exceso de glucosa corta se pueden usar hOjas de papel e lllstrmr a los estudiantes para que
es almacenada en el cuerpo, o de una función del hígado, y entonces debe numeren sus respuestas de manera que correspondan con el número de la
escribir ei reactivo de acuerdo con ello. pr~gunta . ~ara los ~eactivos de completamiento se pueden fotocopiar o
r~JlmeografIar l~s hOjas que con~engan el número de cada pregunta, con una
Ejemplo Imea que se extienda desde el numero sobre el cual el estudiante pueda ano-
Deficiente: El hígado ¡almacena) el exceso de glucosa como glucógeno. tar su respuesta_
Mejorado: En el metabolismo de un cuerpo normal, el exceso de glucosa en la sangre se 3. Escriba un coiunto d.e instru~ciones par? cada tipo de reactivos que
almacena en el hígado en forma de (glucógeno). :Ie us~n en ~a prueba. Las lllstrucclOnes deberan ser simples y completas,
IndUJ.r cuestIOnes tales CO!?? d~~de y cómo deben anotar sus respuestas los
7. En una prueba de aprovechamiento no deje demasiados espacios en est~dlantes, el valor de cahhcaclOn de cada pregunta y si la ortografía se ten-
el enunciado que se va a completar. El fracccionamiento excesivo de un dra el? c~anta para)~zgar .10 adecuado de la respuesta. Para los problemas
enunciado reduc~ la tarea del examinado a un juego de adivinanzas. Los enun- ~uan~ltatlvos debera lllstruuse al estudiante acerca de si debe mostrar todo su
ciados fraccionados excesivamente pueden ser apropiados cuando se trata de rabaJo ? solament~ an~t~r su r.espuest~. Para las preguntas de respuesta corta
apreciar la creatividad o la originalidad con las palabras, pero no cuando se el estudiante debera reclbu las lllstrucclOnes acerca de si sus respuestas deben
trata de evaluar el conocimienw fáctico . quedar escritas en oraciones completas.
4. Mie!1tras sea posible, agrupe los reactivos que tratan acerca del mis-
Ejemplo mo~o~tell1do o la misma habilidad. Al hacer esto, puede ayudar a reducir el
Sentl~lento de que la prueba está construida por partes de información sin
Deficiente: Los (1) cuya (2) primaria es (J) son (:!J (Respuesta: 1, dientes; 2, función; reIaclon entre ellas. El examinado también tendrá la posibilidad de concen-
3, cortar, y 4, incisivos). trarse en una sola área del contenido, más que tener que cambiar o dar saltos
Mejorado : Los dientes cuya función primaria es cortar son los llamados (incisivos).

. ..
"' , ' . '.
256 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
257
de un tipo de contenido a otro entre las diferentes áreas de contenidos ..Mas PREGUNTAS DE ENSAYO
;~ún, será mas fácil para el maestro calificar:: analizar ¡os resultados de la prUe-
ba para el gr'.lpO <J para el individuo, dado cIue será capaz ele ver a primera viSta A pesar de que los estudiantes en todos los niveles de educo ., .
si los errore:::: ~on !11ás fr~cuentes en un úrea de contenido que en otr~l.. , . a f'In de d esarro11 ar h'
practlca aDI'1'ldades para la redacción es maClOn d necesitan
d
- 1 d" : uy U oso que
un examen sea e me 10 apropIado para obtener esta práct¡'c M~ b'
' 'd 1 .
po dflamos conSI erar que a mayor ventaja de la pregunta que a. 1 "'s . ¡en
Calificación de Ia prueba - ., d' . . reqUIere un
ensayo pala.~u contestaclOn ra lca ens,u P?tencIalyara medir las habilidades
que. el estudIante tlene
1 . enf la organlzaclOn
., . I
mtegraclon y sl'ntesI's d e su conOCl-.
l. '/eTifique su da-¡'e de respuestas con una muestra Je pruebas üntes IDlent.o para usar a. m ormaClOn a fm de resolver problemas novedosos y
de calificar alguna áe ellas. Vedicar la clave preparada contra unas CUJn- para ser ongmal e mnovador en su enfoque a las situaciones pre t d'
¡as pruebas, preferiblemente aquellas que sean las de los meiores estudiantes; en los pro blemas. P ara l'd ent¡'f'Icar este potencial se requiere que cada pregunta
sen a as
puede descartar uno o más reactivos, sobre todo en los que los alumnos COn- sea cUldados~mente red~ctada de tal manera que el estudiante manifieste esta
sistentemcme dan una respuesta distinta de la que se anotó en ia cla\'e. Esto c1as~ de habIlIdad. El s~mple hecho d~ forrm~lar una pregunta para que se
puede surgir por un error al preparar la prueba o al interpretar la pregUnta escnba un ensayo a partl: de ella no qUIere deCIr que automáticamente se está
hecha Dor ios estudiantes que difiere de la que el instructor imentaba ,1<n!e. asegurando que se podran evaluar esas habilidades .
Cuando esto ocurre v si la interpretación alternativa es definible, la c].n-e Considérense las dos preguntas siguientes que 'conducen a ens ayo.
óebeúa corregirse o c~tenderse para incluir a la variante. En un reactivo Como
"Dé un ejemplo de una enfermedad contagiosa", sería correcto dar varios Ejemplo
lipos de reSpl¡esta. Algunas veces, al hacer la clave original, el maesao no
piensa en algunas respuestas posibles, y al corregir la clave necesita incluir Pregunta 1: ¡Qué métodos s~ han empleado en Estados U nidos para prevenir y contro-
otras respuestas a medida que avanza en el proceso de calificación. lar las enfermedades contagIOsas?
2. Si se va a calificar la orio:~rafíú o la estructura de la oración. así :~~~t.r:n:a 2: ~,x~min~lo? datos.que ~parecen.er: la siguiente tabla y explique cómo los
como la precisión del contenido. dé una calificación separada paTa cada '-"¡~lUJO~ en <:;1 conUClmIento, la 'practIca medIca y las condiciones de vida en Esta-
una de ellas. dos Umdos entre 1900 y 1967 mfluyen en los cambios en la tasa de defunción.
3. · Corrija errores :v haga comental"ios acerca de cada pregunta a medi-
da que califique o dé un coniunto de respuestas para cada estudiante cuan- Causas de muerte y tosos poro codo uno de ellos en 1900 y 1967
do regrese las pluebas. Esta práctica proporciona mejores instrucciones para
el aprendizaje que los estudiantes pueden obtener de una prueba e incrementa Tasa de defunción por 100 000 personas
la motivación para que éstos aprendaD_ Causa de muerte
4. En general. califique CLlda pregunta ya sea como correcta o como 1900 1967
incorrecta yasígnele una ponderación igual a cada pregunta. Una pre- 1. Neumonía
gunta bien escrita que requiera una respuesta corta plantea un problema 175.4 2L8
2. Diarrea y enteritis 139.9
muy específico para los estudiantes y debería calificarse O para incorrecto y 2.0
3. Enfermedades del corazón 137.4
1 para correcto. OtOrgar créditos parciales crea dificultades para la callfica- 4. Cóncer 399.9.
ción. Este punto de la calificación parcial generalmente surge en aquellas 64.0 160.9
5. Difteria 40.3
preguntas que presentan un problema cuantitativo y en aquellas preguntas 0.02
de completamiento que incluyen más de un espacio_ No obstante que dar
calificaciones parciales por un método correcto de trabajo en un problema
cuantitativo o por llenar correctamente algunos de los espacios en los reac-
¡nf Para c?ntestar .la. pregunta 1, el estudiante sólo necesita recordar la
tivos de completamiento, puede hacer más cordiales las relaciones entre
los maestros y sus alumnos, contribuye nada o muy poco a la eficacia de rb or~aclOn y escnbIrla de la misma manera en que se le presentó en los
1 ros. e texto o en la clase_ Por otro lado, la pregunta 2 requiere que el
medición de una prueba.
~~~~~a~tJ recuerde al~o más acerca de las características de cada enfer-
La práctica de tener algunas preguntas con más importancia que otras en t . }, e las condl~I<:,nes que las producen y acerca de los métodos de
su totalidad sobre una base puramente arbitraria, no contribuye en nada a la r~sm¡s.on o las condICIOnes que afectan la incidencia de la enfermedad
prueba e incrementa las dificultades de calificación_ Si el maestro cree que son as~ como relaCIOnarlas con cuestiones tales como la inmunizacio' n la qu;~
mloterapl l " d '
a, as meJo~~s en sam ad y la proporción creciente de personas
1
más importantes algunos contenidos que otros o algunas habilidades que ancian
otras, deberá hacer más preguntas acerca de esas áreas de contenido. as en la poblaclOn. La pregunta 2 es claramente más apropiada para
una respuesta de ensayo.
258 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA
PREGUNTAS DE ENSAYO 259
Identificar el valor de las preguntas de ensayo en el aprecio de la habilidad contestar el examen, El maestro o el constructor de prueb d b d
para usar información, para organizar los materiales o para emplear eficaz. .
tan comp1etamente como sea pOSIble las clases de respuestas del
as e e enten er
d.
mente el lenguaje, depende no sólo de cómo redactar las preguntas apropiadas que represen t an 1a h a b1·l'd d I · h b·l· estu lante
para producir estas habilidades, sino también de la capacidad para estructurar . 1 . l ' 11a o as a 1 Idades . que se medira'n
, an t es d e d eter-
mmar e matena estlmu o que se necesIta para producir esas respuestas. Por
situaciones de tal manera que otros factores no disminuyan la apreciación cJemplo, el.maestro que desee usar las pregu?~as de ensayo Con e! fin de eva-
deseada. En el examen de ensayo típico, las diferencias de conocimiento del luar la habIlIdad para pensar de manera cntIca el tema de la I·nf .,
material básico fáctico encubren las diferencias en la habilidad para usar v acerca de 1a sa1u d d e 105 a1umnos de! octavo grado puede identI·fI·ormaCIOn
organizar esos hechos y las presiones de tiempo frecuentemente disminuye~ ·d . d " . , car como
eVI encla e este pensamIento cntIco las habilidades para evaluar 1 d
la capacidad del estudiante de producir su mejor respuesta. ., d ·d d a a ecua-
ClOn., e d una·auton
· · a , reconocer
d . sesgos
, o factores emocionales en l apresen-
El examen de libro abierto se ha sugerido como un medio de empare. taclO.~, Istmgmr entre a.t?s venfIcables y no verificables, reconocer la ade-
jar estas diferencias por lo menos parcialmente en el conocimiento fáctico. En cuaclO~ de l?s datos, venfIcar enunciados contra otros datos conocidos y
esta forma de examen, los estudiantes tienen acceso a cualquier dato en sus det~r~mar SI los datos apoyan. su conclusión. Ona vez que e! maestro ha
libros de texto y en sus notas. No es recomendable esperar borrar las diferen· deCIdIdo que estas competenCIas deberían apreciarse puede seleccio a
. 1 '1 ' n r,
cias en conocimientos por medio del examen con libros abiertos, pues el estu· ¡¡ dap t ar O crear m~t.ena es estlmu o que requerirán que los estudiantes
diante más capaz sabe cómo buscar una información en un libro y dónde se muestren estas habIlIdades,
encuentra, mientras <jlue el estu~iante . con poco talent~ puede pasarse Un 2. Use material novedoso u organización de material para redactar las
periodo completo hOjeando un lIbro SID meta alguna; SID embargo, parece preguntas de ensayo, E.n. general, deseam.os que mediante las preguntas de
haber ciertas ventajas en los exámenes de libros abiertos. Feldhusen (1961 j cnsayo .se ap~ecle la ha?Ihdad de los estudIantes para usar información. Para
reportó que los estudiantes universitarios a quienes se daban exámenes de ~et~rmmar SIlos e~tudlantes'pueden hacer esto, debemos exigirles que no se
libros abiertos sentían que este tipo de examen era más eficaz para promover hml~en a reprc:duclr el matenal que ha aparecido en los textos o en las confe-
el aprendizaje y reducir las trampas. También reportó que, aun cuando los ~e~~las del salan de clase y en las discusiones. Las preguntas que aparecen al
estudiantes tenían que pasar menos tiempo memorizando hechos materiales mlC!? de este apartad~ son buenos ej.emplos de este punto. La preg'..lnt3 1 no
y concretos al prepararse para un examen de libros abiertos que para uno de reqUler~ que los estudIantes usen la mformación, sino que sólo la reproduz-
libros cerrados, gastaban mucho más tiempo en las revisiones generales del can, mIentr~s que la pregunta 2 sí requiere que los alumnos la empleen,
material. ~. ~mpIece 1~~ p';e~untas de ensayo con palabras o frases como "com-
Las presiones de tiempo de la situación típica de prueba de ensayos ~are '. con:rast,~ ,; de las razones para", "dé e;emp1os originales de",
pueden disminuir si se asignan las preguntas de ensayo como un examen "explIque. c:?~? ' h~?a una predicción de 10 que sucedería si", "critique",
fuera del salón o si se tienen tiempos límites muy amplios. Si hacemos lo dlfe~encle, Ilustre: etc, El uso de palabras o frases como las anteriores,
anterior, no sólo minimizamos las presiones de tiempo, sino que también combmadas con matena! novedoso, ayudará a presentar tareas que requieran
ganamos las ventajas del examen de libro abierto. En estas condiciones el que .los alumnos seleCCIOnen, orgamcen y empleen su conocimiento. No
estudiante tiene tiempo no sólo para escribir con más cuidado, sino tamo c~plece las p~eg~ntas de ensayo con pa~abras como "qué", "quién", "cuándo"
bién para cuidar su redacción, y el maestro obtiene muestras de su mejor o haga una lIsta , pues ~stas palabras tlenden a conducir a tareas que requie-
redacción en las condiciones óptimas; sin embargo, un examen fuera del ren solamente reproduclf la información, .
salón de clases implica otros problemas, como la posibilidad de ayuda de .4 .. Escriba la pregunt~ de ensayo de tal manera que la tarea quede
los padres o de otras personas. Nunca podemos estar seguros de qué tanto def¡mda para .c~da.~xammado claramente y sin ambigüedades, Quere-
el producto final es el resultado de los propios esfuerzos del estudiante ~os que la cahf¡~aclOn que obtenga ,e~ estudiante, sea un reflejo de qué tan
y de qué tanto se debe atribuir a los demás. Por esta razón, algunas pruebas bIen p~ede~ realIzar una tarea especIfIca, y no que tan bien e! estudiante se
de ensayo deben continuar haciéndose en condiciones de supervisión, lo pueda Imagmar lo que ~~ supone que es la tarea. En los programas de prue-
cual no resta importancia al examen de ensayo fuera del salón de clases bas a gran escala, tamblen queremos que la tarea la perciban de la misma
como una técnica muy valiosa de la enseñanza. ~~nera todos ~os estudiantes que son evaluados, de manera que la califica-
ClOn del estudlan~e. no result~ ~f~ctada o lo sea en la mínima parte por la
Elaboración de preguntas de ensayo ~ersona que la cahflc~, La pOSIbIlIdad de adivinar la respuesta.deseada y los
esa~uerdos en la calIdad de las respuestas producidas pueden reducirse
Las siguientes sugerencias se presentan como guías para la redacción de medIante la .re?acción de las preguntas de ensayo que fijen una tarea cla-
preguntas de ensayo más eficaces. ramente defInIda para el examinado,
Por tanto, un reactivo como "Discuta la organización que contribuye a la
1, Antes de empezar a elaborar la pregunta tenga en la mente con toda ¡salud de la comunidad", es global, vago y ambiguo. Primero ¿'qué quiere decir
claridad los procesos mentales que usted quiera que el estudiante use al a pa lab ra "d'IScuta" "1'
i1mpl Ica
· acaso h acer una lIsta
. de las organizaciones
' y sus

.. .....
260 CAP, 7, DISEÑO Y CONSTRUCCiÓN DE UNA PRUEBA
PREGUNTAS DE ENSAYO 261
actividades una crítica v una evaluación de lo que hacen o identificar las fallas con argumentos lógicos",
en la estruc'tura de la o;ganización? Segundo, ¡el maestro espera que los estu- ' 1 En- este
" tipo de reactivo ' el maestro de b
al estu d¡ante no por a pOSIClOn que adopte, sino con base e
ena' ca l'f'
"l ¡ lcar
'
diantes consideren solamente las organizaciones gubernamentales o que Con- defiende o apoya su posición, n que tan )Ien
sideren la gama completa de organizaciones públicas y privadas que contribu_ 6, Asegúrese de que la pregunta de ensayo l"equiera que d
se pro uzcan
yen a la salud en la comunidad? Tercero, ¡qué quiere decir el maestro COn con duetas que uste d reo1mente quiere que muestren los estudiantes, Las
"contribuve a la salud de la comunidad"?, ¿acaso quiere que el estudiante limi- preguntas de ensayo de las pruebas hechas por los maestros Contl'e '
te su resp{¡esta a las clases de contribución que im~lica el ~eforzamiento ? el " ,'" , " " nen ¡nterro-
gantes com~ 1os S¡~lentes" De su mejor deh~lClOn de ?uena salud"; "¡Qué
acatamiento de las regulaciones de salud, el tratamIento dIrecto de las en ter-
medades y la medicina preventiva o quiere que e! estudiante incluya contribu- "pIcnsd ustea' " de ,la dIferenCIa
'f entre Inmumdao
", paSIva e ¡nmun¡'d' ao actIva ' ", ~ i
En sp OPoInlOn, Zque _actores han contnbUIdo a dIsminuir el número de casos
ciones mediante la educación y la investigación? De la manera como está de dmena entre los anos 1900 'y ' 1967 en Estados Unidos'" ' , Normal mente en
redactado este reactivo requiere que el estudiante adivine lo que e! maestro estas preguntas e1 maestro esta Interesado no en cuál pueda ser la opinió~ de
L_

desea co~o respuesta, y lo más probable es que la calificación dependa de qué los estudlántes, SInO en SI' el estudIante conoce o no los hechos real ~s, o 1: <
.... nlon-
tan afortunado fue el estudiante para atinarle al deseo del maestro, ces, 1as preguntas deberran redactarse de las maneras siguientes' "De!: ,. 1
Una mejor manera de redactar esta pregunta de tal modo que cada exami- b'
concept~ ,;-rena,sa u j
1 d" "Exp l'Ique 1 "
as diferenCIas entre la 'inmunidad , uDdSiY;Jn d ev
nado la interprete de la misma forma es la siguiepte: b actn'a i ¿Que factores han contnbuido a disminuir el número de casos d~
dIftena entre 1900 y 1967 en Estados Unidos 1 ". Es evidente que estas Dree-UIJ-
Con base en el ejemplo de la tuberculosis, indique cómo podría esperarse que cada taS son demaSIado apegadas a los hechos en su naturaleza como para .ue ~ean
una de las siguientes organizaciones contribuyera a prevenir o curar esta enfermedad, buenas preguntas de ensavo, q -
7, Adapte el tamaij(j}r la compleiidad de la Te'ipUe~ta al' nI'TTol- ~'" m d'
o al cuidado de personas que la padecen,
" d 1 d' 'e , ~ u~ ,_Cl u-
raC1011 _c os estu Jantes, No obstante que en todos jos niveles el valor di s-
a) Departamentos de salud locales y estatales,
b} United States Public Health Service ¡Servicio de Salud Pública de los Estados
tlntIí'O de la pregunta de ensayo SI' ba~~
. • , . ." ~
1:> ha'o;I¡'dau1 que rOn"¡
~ _
Pro
...... .u. '-'o ":" '- _
_,
1. 1 C1:(' Darél
'
Unidas), requenr d~ \OS esrudJantes que sel,eceiom:n y organicen sus propias idc¡s de:
eJ Departamento de Agricultura, , maneIa11autunoma, la orge1I11zaC 1 on ;: 1'" pY
1 • - .
', rr'~l'o'n que pod~:a-mo
- -''\.1- -'-"'"
r_ 1.1
1.... '
.'
S e.S.p f-"' YJ"
raZOI1JOlemente ae un mño de escuela c,!'cmenta 1 o dr , un est d' .'" , "
d) The National Lung Association ¡Asociación Nacional del Pulmónl, • J" - , 1 '-- , u l<!l1te ep J~
e) The American Public Health Association (Asociación Estadounidense para la escue¡a¡secunoana
P. .
estan bastante restriwTidas
'":l",
en .
1"
a
can·;";'lo' -, n_ c', :__ ¡ - -
l ... , - , - , ) I....·ü .. nJ.\"e.l con-
Salud Pública), ceptu,á',' l'leifLl¡T1tas cO,mo lós pr;:sCntódá& al inicio de este apanado pueden ser
dema~Iado e,aooradas; muy sonstJcadas conceptualmente v demasiado L,.,cc ~
La manera como se ha redactado esta pregunta proporciona una base más para ese grupo, ' - "-'."ae
común para su respuesta, sin sacrificar la libertad del estudiante para contes-
tar la pregunta, (Esta pregunta revisada también indica claramente que
la tarea será difícil para e! estudiante típico de! octavo grado en términos de Preparación de la prueba de ensayo para su uso
quien concibió el plan original de prueba presentado en el cuadro 7,3,)
5_ Una pregunta acerca de algún punto controvertido debería evaluar-
se más en términos de la presentación de la evidencia para tomar una posi-
ción determinada. que por la posición que se tomó, En muchas cuestiones
que afrontan los individuos y la sociedad no hay respuestas en las que todos
estemos de acuerdo_ No obstante, estos puntos constituyen mucho de lo que
es genuinamente vital en la educación, En estas áreas no se puede exigir
al estudiante que acepte una conclusión o una solución específica; sin embar-
go, es razonable evaluar qué tanto conoce del tema y qué evidencias utiliza
para fundamentar su conclusión, Por tanto, preguntas como "¿qué leyes debe-
ría aprobar el Congreso para mejorar los cuidados médicos de todos los ciuda-
danos de Estados Unidos?" no tienen una respuesta generalizada en la que
todos estén de acuerdo; pero sí podríamos pedir al estudiante de manera razo-
nable que responda a una pregunta como la siguiente: "Se ha sugerido que el
costo de todos los cuidados médicos provistos por los médicos y el costo de
todas las medicinas deberían ser sufragadas por los fondos provistos por el
gobierno federaL ¿Está usted de acuerdo o en desacuerdo? Apoye su posición
262 CAP. 7. DISEÑO Y CONSTRUCCIÓN DE UNA PRUEBA PREGUNTAS Y EJERCICIOS 263

sino también que sean sólidas y congruentes en cuanto al juicio de la calidad al Hacer carteles que muestren los hábitos para la buena salud.
b) Demostrar tener conciencia saludable.
de las respuestas .. , . , . , . el Señalar las relaciones que existen entre las mejoras en higiene y el decremento
La investigacIOn formal proporcIOna .muy pocas gUlas sIstematIcas para en la ocurrencia de enfermedad.
mejorar la calificación de las pruebas de ensayo, pero se ofrecen las siguientes d) Apreciar el papel crítico de las bacterias para la salud y la enfermedad.
sugerencias que se originan de la experiencia acumulada por lo~ profesi<?nalcs. e) Mostrar conocimientos y dar mejorías permanentes en los hábitos de la
Estas sugerencias pueden ayudar al maes~ro a mantener un es~andar mas COn- salud.
gruente para estimar las respuestas medIante todos los estudIant~s .y h~cerlo
más concisamente consciente de las bases que emplea para sus calIficaCIOnes. 7 Observe el plan preliminar para un, exa~en acerca de una .unidad de la salud que
Lo anterior permite que se ofrezca retroalimentación y se produzcan comen- aparece en el. cu~~ro 7.3. ¡Para que celdillas dt?1 p!a~ prelImmar sería apropiado
emplear: a} eJerCICIOS de respuesta extensa, b} eJerCICIOS de respuesta restringida y
tarios 'más específicos para los estudiantes en cuanto a su desempeño, así el reactivos de respuesta estructurada?, ¡qué factores influirían en su decisión?
como permite ayudar a éstos a reducir los factores inapropiados que puedan
influir en su juicio de la calidad de las respuestas. 8. ¡Para cuál de las siguientes pruebas sería importante corregir las calificaciones por
adivinación? Dé la razón o las razones para su decisión.
a) Decida de antemano qué cualidades considerará para estimar la ade-
cuación de una respuesta. Si puede distinguir más de una cualidad al Una prueba de 100 reactivos de falso-verdadero. Todos los estudiantes contes-
para ser apreciada, haga evaluaciones separadas para cada una. taron todos los reactivos.
b) Prepare una guía de respuestas o una respuesta modelo por adelanta- bl Una prueba de opción múltiple de 70 reactivos acerca de relaciones espaciales.
Cada reactivo tenía cinco opciones. Para cada reactivo podían ser correctas una
do en la cual muestre los puntos que deben quedar incluidos. o más opciones de respuesta. Todos los estudiantes contestaron todos los reac-
e) Ca'tifique todas las respuestas a una misma pregunta antes de proceder tivos.
a la siguiente. e) Una prueba de 50 reactivos de opción múltiple con cuatro opciones de respues-
d) Después de calificar la respuesta a una pregunta en todos los exáme· ta, en la que sólo una es la respuesta clave. Solamente el 40% de los examinados
nes, b<ldje1os antes de empezar a calificar la respuesta siguiente. completaron todos los reactivos.
e) Califique las respuestas ignorando, en lo posible, .quién las escribió. dI Una prueba de 60 reactivos de opción múltiple con cuatro opciones de res-
f) Si va a regresar los exámenes, escriba comentarios y corrija los errores puesta, de las cuales sólo una es la respuesta clave. El 90% de los estudiantes
de las respuestas. contestaron todos los reactivos.
9. Un maestro universitario ha dado una prueba objetiva a una clase numerosa, cali-
ficó los exámenes y anotó las calificaciones en el registro de la clase. ¡Qué otros
PREGUNT AS Y EJERCICIOS pasos debió haber dado este maestro antes de devolver los exámenes a los alum-
nos" ¡por qué,
10. Coleccione o reúna algunos ejemplos de reactivos deficientes que haya visto en las
l. Prepare un enunciado de los objetivos para un curso o una unidad de un curso que pruebas. Indíquese qué es lo incorrecto en cada uno de estos reactivos.
usted esté enseñando o vaya a enseñar. 11. Construya cuatro reactivos de opción múltiple para medir la comprensión o la
2. ¡Cuál de los objetivos en el punto anterior se podría medir eficazmente por medio aplicación de alguna materia en la que usted esté interesado.
de una prueba escrita?, ¡cuáles sólo parcialmente y cuáles no podrÍán ser evalua· 12. Prepare una prueba objetiva corta para una unidad pequeña que usted esté
dos" ¡por qué es inadecuada una prueba escrita para estos objetivos!, ¡cómo enseñando o planee enseñar: Indique los objetivos que trata de evaluar en
podrían apreciarse estos objetivos de una meior manera, . cada reactivo.
3. Con base en los obietivos identificados en la primera parte del punto antenor y en 13. Critique las siguientes características de una prueba de ensayo preparada para una
la descripción del curso, prepare un phlll preliminar para una prueba con el fin de clase del noveno grado acerca de estudios sociales:
evaluar la unidad o el curso.
4. En una escuela secundaria un maestro tomó la responsabilidad de preparar el exa- a) Habrá 10 preguntas en la prueba.
men final para todos los grupos de ciencia general. Dicho maestro desarrolla el b) Cada estudiante contestará cinco preguntas.
examen sin consultar a los otros maestros. ¡Qué ventajas y desventajas ve usted en e) Cada pregunta tendrá un valor de 20 puntos.
este procedimiento" icómo podría mejorarse? .. d) Se quitará un punto por cada palabra mal escrita y por cada error gramatical.
5. Un objetivo que a menudo se propone en los pro¡;ramas de estudiOS SOCiales pa~a el Se dará un bono de cinco puntos por limpieza.
la escuela secundaria es incrementar la "reacción crítica del alumno para las notl· f) El tiempo de la prueba será de 40 minutos.
cias en los diferentes medios masivos de comunicación". ¡Cómo podría formu-
larse mejor este objetivo, de tal forma que pudiera medirse este progreso, 14. Critique cada una de las siguientes preguntas de ensayo:
6. Los siguientes objetivos fueron incluidos en una formulación deun sistema esco·
lar de una unidad para la salud. Critique cada uno de ellos y conSidere SI es pOSible al En vez de hablar sólo acerca de la agricultura y la industria en Francia, nos refe-
mejorarlos. rimos a ellas como parte del Mercado Común. ¡Cuáles son las ventajas para

. . ". .
:'.~ .. •• ~",",
• .. \ f _ '_ "1l·; ':.", .:. ' :. . . ,",' ",.' , ':. '.: ";< .~{ •.,~<,_, ¡. ;.; ';>:;·'.:V:' ~~,:,,~;'.~ ; ~~.:.,~~/ ,'..;!--••.~;: <,.,'--; ';': ':,," ':~ .<" ,. :.:. '.:~ , ". . ........ ,.':...... . . , . -:.': ....
264 CAP. 7. DISEÑO Y CONSTRUCCiÓN DE UNA PRUEBA LECTURAS ADICIONALES 265

Francia de ser miembro del Mercado Común?, ¡con qué pr?ductos, materias K¡IOSUP, W. y Hakstian~ A. R., N.A comparison <;lf severa1 methods of asscssing partial
primas y productos agrícolas contribuye Francia al Mercado Común 1 (Estu. kn(lwledge In mulnple-chOlce tests: l. Sconng procedures", en T(Juma1 oi EtiUCil-
dios sociales, noveno grado.) tio!l1.11iVleasurement, 12, 1975, págs. 219-230.
b) ¡Qué deberían hacer los científicos a fin de asegurarse que sus descubrimiento, Kihkr, R. l., Cegala, D. J., Barker, L. L. Y Miles, D. T., Obiecti·,c': {OY instru c tinll anri
serán usados para beneficiar a la humanidad y no para dest ruirla, ¡Ciencia. CI'<I]uatioll, Allyn <1nd Bacon, Boswn, 197'1..
octavo grado.! Kr;lt!1\\'(lhl, D. R., Taxollomy oi educatiollal obiectives, Hl.1ndbook n: A.ifecti'·e
el Seleccione un personaje de una novela o de un CUEnto cortO que haya leído CSt~ dOlllain, McKav, Nueva York, 1964.
año. DÉ ei nombre dd personaje, el titulo y el autor de la obra en la que arare. Kr¡Hhwohl, D. R. y Pa\'ne, D. A ., NDefinin¡:; and asscssing educationa! ohi !.'<:,i IT';". en
ció. En un párrafo bien escritO, explique cómo este personaje ha influido en SlI Thorndike, R. L. ¡dir.), EducatioJJal measurement, American Counc¡' ,l i, Educa-
vida (literátura inglesa, decimosegundo grado!. ¡ie¡r" W ashington, D. c.. 1971.
d\ Analice pruebas de ensayo iestud,ante universitario eD Í;.l clase acerca de prUe· Kn-psin, \\¡. J. y Feldhusen 1 J. F. , DeFel()ping Cll1SS!'OOn.l tests: ~4. guide fo;:' '\,- !'i~! nx une.!
bas y mediciones\. . evaluating te·s1 items, Burgess Publishing Company, Minneapolis, Minn., i97 <
lYh¡gcr, R. F., Prepann,?; instructioIJal ob!ectil'es, Fearon, BelmolH, Cali.f .. ;. S)7 ,~ .
MetÍl:ssel, !'J. S., Ivlichaei, 'vV. B. Y Kirsner, D., "InstrumentJ.tion (jf the Taxc,nom y ;ji
LECTURAS ADICIONALES Educ¡itiol1al Obiectives in behayioral termó", en I'ayne, D. A. y;\'tcMe)!';:::; R. F.
¡dirs.1¡ EducDtion:11 ¿ind psych01ogic.:11 nlCQ3Urenient . (~e:1cril1 LC;Jrnin::: p ;·~s:;;.
Adkins, D . c., Te.\¡ cons trucUOl? , Charlc~ E. Ivlerril, Columbu5, Ohio, i 9 7 4. MOi'rist cl\\;'J1 ¡ N. J./ 1. 975.
CoHman . W . E.. "Essa\' examination,,". en Thorndike, R. L. (dir.;. Eauc:1tion,ú !?'C,'· Morse , H. T. Ylv'lcCunc, G. B_. Sele ctc c fterns {()r the testin.<; or' :~t.!1dr skill.\ L;n,':~ .:riti-
s ure~em, Amerié8i1 Councii on Education, \Na.5hington, D c., 19 7 ] caj thinking., NationaI CpuncH fUf tht., Social Studies¡ \,Vashü1.gron , D. C .: l~': 7 ~
Colwell, R., The evalua tion of m:.mc teacbing and leaming" Prentice-f:-L¡)1. En)::,. .rvtucller, ~). J... H}\.r. é.lSSeSSln~r:t nt thf'~ ~~ffec!i·~·ene5~ of cOlnplcs J!tcrnati·,: es in l11tdtú')lc
wood Clifís, N. r, ]'iCO. choÍce: ,!chic\:c1'i1ent t~s~ :Tcins", en Ed~l~'.Jtion~:l Ll1id Psyciu)logicdl j\jea:.;~~~:c­
Ebel, R. L.: IIHo~~ tu \ . .-rite. true-false ~cst itenls ll , en Education al ünd P.~ycj·:( ·,~' :~.r ~~~: (.::i lnent , 35,19 7 .5 . pJ.gs, J.35-141.
1\·leasure.~nellt , 31 ; 19 7 1 págs. 4] ""·426 .
1
Mut:lkr, D. ;. ,- Shv,~:,~del: !\. "Sc.Hl1e CO !'!'C'hl:~S uf pe::: gdl n resuhan i { r~i !11 ~}nS\\'c r .:.:l!:'!l;"
Ebel, R. L., HEvah;ai.ion aná educatiol1.dl obiccü\;es¡:r en journa l o/ Educati Ctl: .\ I c.:J'::u- ~~¡;;t\: ri.~:);le(~~¡~t' ;lclile-;;~l:~~~;e;; l ¡,":111";·· , \:n io:.:n :aj of EdLic..!tjo ncl Ajea,:;:,!.'·

uCh;m/;~:~nitiJj ;)~\S\\Tr> ,n~!bJ'le-choice achicTC!l:.'.'I1C


rement, 10 19 /3, ptigs. l'? 3-¿ " Y.
nr
1

Ebel, R. L. J "Can teachel5 \",·-rite good nut.> E~ds~ iteills?':, !uurn c.': Educail ()r~ "\ l2:J '; ';.: . !'<Isca!c, P. L. e" tes,,' cí:
:ement, 12, 19 7 5, págs. 3],·35. ,1\ '1ct:Jqp'C~1'10r1!' ::11''; E\'nl~ " ,ti()l" i,~ {.:U ·:,.i,,11 ro 6 197 .1 ·')·ÍP'I:; ") ~f-7 ~R

Educational Testing Ser\·1cc .. ~\lul tipie-C !l~;ic e questiolls: #4 clo,:;c lo(i.k.. Edu c :l'::io¡~~l~ l'¡lYli~)~:i~~¡i'tt~~'~'~ <J~~;:;,1~]~'¡;~}~~~~!l1'; 'é~;;li¡iF~ únd-rA;~~i;,;~ D.-C. Heat h ,1, ',;
Testing Service, Princeton, l\i. j., 19:·5.
Frisbie D. A., uM.uh iple-choice ve.rsu~ true -false: .A. cOlnpdrison of reh(ibH itit~5 :1 !ld
1
Peterson: C. C. y PetersoD ¡ i. L., "Lingulstlc. de.ter:nl Ül <:lnt:S of tite difficult\' O! true-iJíl;('
concurrem validities", en joürnal uf i.ducatio1Jal Measurement, 10, i 9 -:- 3 , ,'úg,. ;~~ _i~~~¡S Y , eE Edu~'at1OJwJ ¡¡¡¡d PsycilO)ogJcai ,\ie:15uremU¡( , 36, 1')7 [~, ¡'.1>::' .
297 -30.!
Frisbie, D. A., "Tlle efÍect or ite m ¡orma, '.!ll reliabilit\, and \'ahdit y: . c.. stud\' o; ;oEil;;- Scl1\,,'arz. P. ·:....· 1 ';rr edictior~ i~!< n.l¡n ~I:. ts i D;: educat;.ur:¿d ou tconll' : ':1 en ThDrndiI.;.c . F.
pie-choice and trut:-ia1se aduevemem tests", en Educatiolla i ünd [Jsvei;o );- >')c,¡] ;'~)¡;Jil~"i~ C: :J¡~:~~::()J) d l;]~·:,'·c;' e :¡¡e;:: .~,m~ric an CDuncil'j¡: EduC:.\tioT1. \,\';l:;!' ir;,z,
l;¡leasurelneni, 34, 1974, Dágs . t\i) )-89 2. .
G:-onlu nd , N. E. , Statir2g Bc1JL1~Fiorai ¡)b!f:ctf':¡!:·s ior claSSrOOl1J Jns r.ructl(,l !~, ~\.'~ J.'~'jl!j­ Slak ~t'r, .~vl ~,\, C~·C. h':l :.~ K, D .. ::!_~.-'r:.g i~I:! :.E '!-::1 1 :-;r ud jc::. Di risk t;'l ki!~ .c: { );'l Clj)i /..:'!·~ j\·::: '::X~~::T:.~ ·
Han, ·To!"onto. ;9 7 0. n~1t; ;)n(;" ~:!: E d¡~(;J:iG.ncJ ~? ~i,:} F ..:.rc.!L")lf)~l.jc~; ~\ ·j ea:} ur'!..'n e ; Jt. 35, .; \).,: . ~-· d !.>.
GronlunG . ~j . L . .i;~#r:.;'C1 rlns. crilcnoll·rcrereli.ce.c te.,t.~ t·().~· cla.~ ,:; .roo n: Jl.¡':;;:i·L.'C:!.;(¡l : 9-·<)::.
IvIac:ni1.1an, I\;UC.';i. "(or1-: 1S)7.j. Synd. H U ~: ¡,'\.::~i.'·d . .~. : . h.~h~.'''; (J ;·.:. ;.1 ()bí· ~ ,:,.':·;¡!e ·; o;,;..J ~'\:~! ,IU.:: L; (.~;; z::e(].:;u rc , . ~"'.~ .-. .... .

~~::I\;:I~~¡:S:7:!;E~~~~~~~~~¡f~!~~~~E~>: ~;¡~~:::~:~~~',~i!fii~(:~:j~,J~~'· !,:.~ ,{ ~ ~:;:: "-


HakstlaI1 . .r\.. R. v Kan sup , \;\'-., I' A COtnp~lnS(}n ot .severai rnetbods oi Jsscss jng pjrrj;¡)
.kno\,,; led~e in lTluitiple-cholce tests: I j. Testing ~1!'ocedures ':, en journJ.l :)t E¿:1~.: ¡,"
!lCllCÚ ..\ ,ü~j,!urer::cr1t . 12 , 19 7 5 . f.'ú.c :~ , 1 . ~} -239 .
Tin
H,ües, L. Y\-. YToka.!'¡ E. ... /tibe effeCi.: oi rhc ql1ahty of precedin g responses o r~. t11l .~r~!­ \VcS1!1~!n: .~~ .i:; " :(\ \'r¡~ ln~ i.ht test ltt.'ln" ., en l-horndik~~, R. L. ¡dir. i, Ec1uca:,,1() .: Ja .~ ??1t::.
de ~ ass.1gned t:...·· :.ubsequcnt responses t() an ·:,,:·ssay question'.'. en íoufl1a; of Educ.;J ' s un:l1H:n t, .A.I'!lcricJ.!1 COUi'!cll O!} Education. \\"élsbin,gton. 1). C ., 1 '.)-:-~.
tiont11 ;\-Jeasurernent, 12 . 1975, P<ü:s. 1 15-1 J. '7.
Hm~:~a;~o~~¡ :;;~~.'~:~::1;1:'~~~_i~1~lct~\~2(2~~~t~u~~:~;~~:i: :'\ ~~t ' DI ¿~ ,'C ; ,1.::1,1;;
HeD~:5\~ej¡~,:\;~~a~:.~~fril~L~~~~:~~;,c~~d~;~~~i~:¡~a~:~~~~:/~;~~1~'~~~~t~:~~¡~,::::~~:ir~~~
ton , D. e. , ~971
H.Llck! S. y BOU11ds, \:...:., ::E 5say grades and intcraction het\.veen grade.rs' h8r:(h~·!·~t:n.g
clarjt~\· aí1d the nC3tness or eX~llnir..ati()n papers". er: .4nJerican Educút}:):Jo ]
Reseol'eÍl ¡ouma1, Ix, 1972, págs. 279-283.
PRUEBAS ESTANDARIZADAS 267

¡icación estadística de cómo funcionan los reactivos en la realidad v ensam-


blar un co~junto equilibrado de rea~ti~os probados previamente. En' segundo
lugar, debIdo a que la prueba se dIsena para usarse en muchas localidades,
¡¡lgunas veces bastante apart~das unas d~ otras, la prueba estandarizada se
construye alrededor de los objetos educatIvos comunes que son compartidos
ampliamente por muchos sistemas escolares, por lo que hace a un lado lo local
v lo idiosincrático en favor de lo conocido y universal. La tercera característi-
8 ~J, y la más distintiva de la mayoría de las pruebas estandarizadas, es la dispo-
nibilidad de las normas. El término prueba estandarizada implica la disponi-
bilidad de los datos normativos, y los editores' de estas pruebas proporcionan
un rango de información normativa que ayuda a dar significado a las puntua-
ciones de prueba.
Pruebas de aprovechamiento Los datos normativos proporcionan un tipo particular de significado en el
que destacan la comparación con otros¡ permiten que se enuncien cuestiones
como de qué manera se desempeña Elvira en relación con otros niños de su
estandarizadas edad, otros niños de su grado u otros niños del mismo tipo de sistema escolar
en que ella está inscrita¡ cómo se desempeña Elvira en matemáticas en rela-
ción con su desempeño en lectura o en una prueba de aptitud escolar, y hacer
¡¡firmaciones acerca de cómo funciona la escuela de esta niña en comparación
con otras escuelas del país, las escuelas de un tipo particular o las escuelas en
un tipo particular de comunidad. La función primordial de las pruebas estan-
En el capítulo 7 se estudiaron las pruebas que se construyen particu· darizadas es comparar a no individuo con otros, ;} un grupo con otros o dife-
larmente las cuales son preparadas por el maestro o por un grupo de maestros rentes aspectos del desempeño de un individuo o grupo.
para apli~arlas en sus propias clases. En este capítylo se analiza~~n las pruebas Si tenemos en cuenta estas características y las relacionamos con el
elaboradas por editores de pruebas y por .agenClas .~e evalua;IC?n estatale~ ° anúlisis hecho en el capítulo 6 acerca de los tipos de decisiones en las que
serían de gran ayuda los resultados de las pruebas de aprovechamiento,
nacionales con el fin de darles una ampha aphcacIOn en mulo pies escuelas
v distritos ~scolares. No obstante que las formas de los ejercicios de prueba en obtendremos las siguientes conclusiones acerca de para quién o para qué
~stas dos categorías de instrumen~o ~uelen se~ ,muy simi~ares, .a,m bas t!enen serían muy útiles las pruebas estandarizadas:
diferencias fundamentales en su dIseno y funCIOno A contmuaCIOn analIzare·
mos esas diferencias. a) Las decisiones instruccionales diarias deben depender primordial-
mente de las pruebas construidas de manera particular, más que de las
encuestas estandarizadas¡ sin embargo, en la actualidad se preparan
CARACTERÍSTICAS DISTINTIVAS DE LAS unas mini pruebas para distribuirlas a nivel nacional.
b) Las decisiones de apreciación de los estudiantes deberían basarse de
PRUEBAS ESTANDARIZADAS modo primordial en las pruebas construidas particularmente, abar-
cando lo que se ha enseñado de manera especifica en un curso o en
Las pruebas estandarizadas difieren de aquellas que son diseñadas por el una unidad dada.
maestro de manera particular en tres grandes aspectos: uno es una cuestlOn de e) Las decisiones de diagnóstico y de educación especial pueden usar con
grado y los otros dos una cuestión de cl~se: , .. . ventaja tanto la información que se recabe por medio de pruebas diag-
En primer lugar, se emplea mucho mas ue?1po y mas habIhda~ profeslO' nósticas publicadas como las pruebas enfocadas al problema diseña-
nal en la construcción de una prueba estandanzada o en una batena de p~c· das particu!cumente¡ estas pruebas se analizaron en el capítulo 6.
bas oDado que el editor desea y espera que su producto ten~a un ,!so amphoy dI Las decisiones de colocación requieren una apreciación más amplia en
que s.u aceptación se mantenga durante varios años, desea mv.e~t?r cantIdades un área y a menudo consideran el uso de pruebas estandarizadas para
sustanciales de dinero y de tiempo en todos los pasos de la reV1Sl0n de los p:o· identificar los niveles de entrada de desempeño en una escala de califi-
gramas, como la preparación de los planes preliminares de c0l1:t~mdo y ~abl!l' caciones uniforme. Este uso de describió en el capítulo 6.
la
d<ld redacción de los ejercicios de la prueba, efectuar las reVISIOnes edItoDa' el Las decisiones de asesoría y de guía normalmente requicren compara-
les de los reactivos par<l aclarar las ambigüedades y garantizar que siempre ciones normativas que hacen posible usar sólo las pruebas estandari-
haya una respuesta mejor, completar el análisis de reactivos para hacer la \'en· zadas; cste punto se consideró en el capítulo 6.

266

..
.~ . o; .
. .. ... ..
~

.... ,', ;,,~:.: .:•.' ," . . . o', .•~ •.', .


h .: . ,' :. . "'" ;.; ~ ~ ; , ~ ; ~ :"'., i , '. .~;':'~f:"~H:": -.:~_. ~~;~'!':':"
( ;. .. v :~! '-1': " :"
·,{!: •.:(.>Y... , l. • ' .o.' ". ".
268 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
269
f) Las decisiones de selección tienden a implicar comparaciones COn ~

otros, y para tales comparaciones son muy importantes las normas


adecuadas ico nsúltese el capítulo 6).
gl L1S decisiones programáticas entre los programas alternativos impli. ~
~
~

.-=
~
J
~
]
§
Vi
o-
~
'"
"'" "'"
o.:
~ u1
'" '"
o.: c:-=
'" M M
M
..,.,
o.: '" o.: o.:
,;.. ~ u1 u1
..,.,
"'" o.: c:-=
u1 ""!
'" ~
..,.., ~

~
o:-
c:-= ..,..,
..,..,
~
o-
~
"'"
§-
can comparaciones con bases muy amplias, en las que las medidas
estandarizadas pueden desempeñar su papel, y suelen ser complemen_
tadas por medidas diseñadas de manera particular para los distinto~ ~
~ ..,., "'" ..,.,
obietivos especiales. Las pruebas para estos propósitos se considera_
ron en el capitulo 6.
!Ji Las decisiones públicas \" políticas, al igual que las programática;.
~
~
o

'"
¿:: 1
~
~
v-.
~
0
c:-= '"
o.:
~
'" o.:
o.: o.:
~ ~
'" o.:
~ u1 ~ u1 ,;.. ..;., u1 0
""' o.:
"'" c:-=
"'" o.:
~
"'" "'" c:-=
..,: 0
,;..
'"
..,. ..,.
'"
requieren un pumo de Yist,1 comparativo e integrado y comprcnsi:
YO de Cl UC: tan bien funciona una escuela: para ello , el amplio SOn-
deo \" id comparación que permiten las pruebas estandarizadas tie- o-
"'" o;:
..,: o;: '" o.:"'" '" ..,.,
'" o.:
o.: o.: '" o.:
'" "'" '"
o.: o.: '" o.:
o.:
nen nI? yal?r m u y significa tivo . Reexaminaremos este puma en el ...:. "! ..... ..;., ,;.. ,;.. ,;.. ...:. ..;., ,;.. o
M M M ~
CapltU I0 1-+. "'" "" ~ ~ ~
'"
~..;

-o
'"
o
o
TIPOS DE PRUEBAS ESTANDARIZADAS ~:::> '" o.:
'" o;:
"'" o.:
'" c:-=
'" "'" "'" ~
<? "'"
o.: "'" '" o.:
o.: o.: '" '"
~ ~
o- M
Q) "'! ~ "'! ~ "'! ~ ~ ~ ~ ~
Mucho, de: los primuos obietivos diseilados en las pruebas de arwn:cha- .,
E ~
miento fuero)O pruebas de una sola materia, sin ,-ínculo en su concepc:'c"n \. su E
.2
estandarización con las pruebas de otras mate rias. Un poco desm 1.C:'. ('~r:" Ci.
E
pruebél5 separ,ldas sin coordinación; fueron complcme"ntad as P:}l" b;'tcr¡;; o

preparadas por un solo editO;· o por un equipo de a u to res. Estas batcrias Coor- '"
-o
=== ==
.,.., =
E ~ <:> <:>
dinádas ricner, ,:emaiás impon,mtes. La planeación. es integrada v los compo- o ,;..
'" ~ ..;., ,;.. ,;.. .,.., .,..,
"'" ~ ,;..
nentes están d isel1ados de tal lI1anera que los aut ores consideran que prop-or- .,
E ~ ~ ~ ~ ~ ~ '" ~ ~ '" ~ ~ '"
cionan una cobertura integrad" de las habilidades académicas principales o de 'E
o
[as áreas programátlcas más importantes. Cada parte está planeada con con- -5 Q)
>
ciencia de C1UC: o:isten las OCIas )-'<lnes, de tal fonna que se minimiza ia du,11ica- o
ción v se h~~cc un a cobertur~1 coni unta de m ateriaí 'irnportante, lo cual c.~ut:da o..
o = C'o/
..,: <:>
garal~tizad o En reconocimiento d.c etue el juicio humano es falible v de ~uc la Q)
~
..,.., u1 ,;..
C'o/ C'o/ C'o/
'" C'o/ ~

f""u '1 ;IClb-


~
..,.., o
~'igil~nci " hU'Y'élna " S ; rnD" r!:C!"~_! nr,dq"""YloS
, _ _ .. (.L _~ . . . . . . ~ v
,-,-, _ u .... _
J. . cST'e
.:-.1 . r"r
... :: .... .1.c.:. clue'lo"
_ ... 1"" 1'·¡d,-,'
" __ ...... '-(. .. .....
~, ...... " '"
.~
....: "!
~
u1 '" 0 u1
r;]n b,lSt;;P1tC lelOS del ideaJ, 1'",cro sj asi es en cüónto ;J. Ja tneta e~t;¿blccida ., por Q)
<:;
tOti n1eno~ PUdC1D!.):-; dprOXJ.lT.1~l.rntY:·. ..o

C;tdi~~,~~i~,~/,::l~~:~l~~~-i[~I~-~:~~~~\~~~-c:~l~'~¡~~~1:~;!~:~~d~lu,:~~~t~~~rt~~}~;~~~1a~i:~~
picldos de la.~ pruehas C5télndé-lflZcldas: hClncL~ hcc.ho repetidas referei'1ci as ,1 la
comparación: comparación dentro v entre íos individuos , y comparación
dentro \. entre los gru pos. Esta~ comparacionet> son relativamente directas
cuando ias normas nara cada parte de la bateria estún basadas en ei mismo gru-
no de estudiclntcs ; ~e '-uelven. lJ.1ucho n128 (rengaii.osas Jf cuando el ~Tun~ de
~
;-eferenciJ cambia de prueba él prueba. Por supu'CSto, hay posibles de~Ye~tájas t
:>

en las pruebas de un a bat cria completa_ Si compar,¡mos diferentes baterías, '"


..o ~
podemos preterir];¡ prueba de antméticá de un.a de ellas, la prueha de IenguJir w
o
~ ~
de otra y la prueba de lectura de una tercera, con base en la correspondencia de ....: ..§ ~
~ ~ ~
nuestros pror;Llmaf v objctiw)5 particulares. ¡'-lo obstante lo ante rio r, para los ~ .~
tipos de comp,;;-ación para 105 cuales las pruebas estandarizadas :s(: t:'11plcan Jg ~
:¡¡
.,
~""
-~
apropiatLmemc: . las ventaias de las normas unificadas íy del diseño de la prue- t'"
c::.
~
~
.~
e
j
.:;:::
~
.:;:::
270 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
TIPOS DE PRUEBAS 271
ba) parecen pesar más que cualquier pérdida de tener que aceptarlas POr
paquete cuando uno o dos elementos de ella se estiman como menos ideales. Sonido de letras (ocho reactivos}: Marca bajo la letra qu _
J que empieza la palabra trompo. e representa al somdo con
En la tabla 8.1 se muestra un resumen tanto de la estructura y el conteni.
do como del rango del grado de seis de las baterías de aprovechamiento más g n _t
ampliamente utilizadas. Todas estas baterías abarcan del tercero al noveno' s
grados, en los cuales se realizan las tareas más pesadas al aplicar pruebas de O o o o
aprovechamiento. Todas las baterías incluyen las habilidades básicas de lcc-
tura, aritmética, ortografía y uso del lenguaje. Estas áreas de habilidades Sonido de palabras (nueve reactivos) : Marca bajo la pal b . t 11 H .
ul11 boyo a ra a. e lS a
tienden a ser las que tienen los objetivos más uniformes y más universales de .
un sistema escolar a otro. Las pruebas metropolitanas de aprovechamiento lall tell tall
y las pruebas de aprovechamiento Stanford proporcionan pruebas designa. ta1k
das como Ciencia y Estudios sociales, pero estas baterías también son pro. · O O O O
vistas como baterías "básicas" sin tales subpruebas de contenido. Existe bas- Lectura
tante menos acuerdo acerca de lo que debe enseñarse en estas áreas de
contenido; en consecuencia, no hay una prueba uniforme a nivel nacional o' Reconocimiento de letras (11 reactivos): Marca debajo de la R.
es menos probable que aparezca una que pueda usarse apropiadamente en
una situación particular. R P B w
Algunas baterías proporcionan niveles de prueba para aplicarse en el pri- O O
mero y segundo grados, y la metropolitana ofrece además una prueba para O O
emplearla al final del ciclo preescolar. Naturalmente, estas pruebas iniciales . APalredabm~e~to de palabra ydibuio (17 reactivos): ¡Cuál es la palabra que nos dice
tienden a ser muy diferentes de las pruebas de los grados elementales y supe- que es e 1 UJO! _
riores, tanto en el énfasis como en la manera de presentación. La presentación '
es oral en gran medida, y el material empleado queda en manos del adminis- .
trador de la prueba. Dado que todavía no se han establecido habilidades bási- O ratón
cas para la lectura, mucho del material de la prueba es pictográfico. En los

~mD~
niveles más tempranos, las prueba~ tienden a ser bastante limitadas y sólo O casa
ofrecen habilidades simples de lectura y de manejo de números_
Para dar una idea acerca de cómo la forma y el contenido de una prueba O sombrero
cambian de los niveles más elementales a los más avanzados, en el ejemplo
siguiente mostramos reactivos similares (pero que en realidad no están en uso)
O grito
en las partes de la metropolitana que se relacionan con la lectura.

Ejemplo .1 Apa:edamiento de ~ibuio y enu~ciado (cinco reactivos): Marca en el espacio junto


~ enunCIa o que descnbe lo que hay en el dibujo.
Primer nivel (grado K a 1.4)
Escuche los sonidos
O Los pájaros están volando
Sonidos de dibujos (22 reactivos): Observe los dibujos de la pelota, del papalote)-
del árbol. ¡Cuál empieza con el sonido de l/papa"? Pon una marca debajo de él. O Los pájaros están sentados
O Los niños están brincando
".r
.......................................... ~

~. Primaria 1 (grado 1.5-2.4)


Conocimiento de palabras

\t\Y D' Apa~ea~~ento de palabras y dibuios (ver primer nivel) (35 reactivos}
lscnmmaclOn de palabras .
o o o Sonidos de palabras (ver primer nivel) (35 reactivos)
Lectura .

.. , .
...... : -.; .... . . · . : : .. .
,
, I

CAP. 8. PRUEBAS DE APROVE CHAMIE NTO ESTAND ARIZADA


272 S TIPOS DE PRUEBAS 273
Aparea miento de oración y dibujo (ver primer nivel) (13 reactivos las p¡llabras Y,a las .habilidades de desc.od~ficación, ~i~n.tras que en los
) niveles
Historie tas 133 reactlVOs): . _, ,upcriores el enfasls recae en el conOCimiento del slgmhc ado de las paiabra
A Ju<m y Maria les gusta Jugar a la pelOta. sy
~n la lectura de u~ texto c<;mti~uo. LC?s ejemplo s anterio res
juan tira ia pelota. no pueden , por
supuesto' ,dar una Im;g~n de co~o se I~crementagradualmente el tamaño
María atrapa la pelota. la complejIdad de las hlstone tas que tIenen que leerse, o de la varieda y
d cada
o pelota vez mayor en las pregun tas de compre nsión que se basan en ellas.
En dicho análisi s resalta n dos cuestio nes. Primer o, existe un cambio
;A qué le gusta jugar a María? o muñeca progresivo en la nat~raleza de lo que se evalúa en las pru~bas de
chamie nto estand anzada s que se compa ra con las capacid ades aprove -
O madura -
mataten as cionalcs de los estudia ntes. Segund o, especia lmente en los niveles
supe-
riores, las prueba s propor cionan un sondeo amplio de habilid
complejas, más que un análisi s específ ico de compe tencias definid ades
Primari a Il (grado 2.5-3.4) as
COlloci miento de palabras tajantem ente. En genera l, estos enunci ados serían válidos para otras
bate-
rías de prueba s y en otras áreas de materia s.
Aparea miento de pala bra y dibujo (ver primer nivel) (17 reactivos). Las prueba s de aprove chamie nto están diseñadas básicam ente para rendir
Sinónim os (23 reactivos) puntuaciones bastant e confia~les. I?ara cada individ uo en cada área de
habili-
dades (los coehcIe ntes de conhab Ihdad entre 0.80 y 0_90 son muy comune
"Golpea r" es O pegar () llorar O caer O saltar así como es posible que propor cionen una evaluac ión compu esta altame s),
confiable del promed io de aprove chamie nto obtenid o de todas las nte
Análisi s de palabras áreas de
." . habilidades. La puntua ción compu esta del total de batería propor ciona
Sonido de palabras (ver pnmer mvel) 135 reactivo s). índice de si un niño está obtenie ndo un nivel superio r, el promed io o un
un nivel
inferior por progres o total en las habilid ades educati vas básicas -este
Lectura Índice se
puede compar ar con medidas anterio res, con las de los compañ eros de
clase y
Aparea miento de ?ración y dibuio {ver primer nivell (13 reactivos con la evidencia de su potencial académ ico. Las deéisiones para las
) que pue-
Historie tas (ver pnmana 1) (31 reactivos) den ser útiles estas evaluaciones globale s son limitad as. Entre ellas están
iden-
tificar a alguno s niños que deberían ser alentad os para que empiecen
en una educac ión de nivel bachillerato; identifi car niños que inicialm a pensar
Elemen tal (grado 3.5-4.9) .
Sinónim os (ver primaria 11) (50 reactlvoS) ente pre-
sentan los problem as de aprendi zaje más serios, o ayudar en la colocac
ión o
Discrim inación de palabra en oración de comple tamient o (36
transferencia de un estudia nte que cambia de escuela.
reactivos) Para la mayorí a de las decisiones para las que se usa la batería de prueba
el interés tiende a centrar se en las puntua ciones de las subpru ebas y en s,
Por favor _ _ _ _ y ponle llave a la puerta. el perfil
de las capacidades y limitaciones. Si el aprove chamie nto de Pedro
corre cierra sierra cielo nivel más bajo que el de sus compañ eros, ¿de dónde provien en sus tiene un
deficien-
cias?, ¡cómo es su progres o en lectura?, ¿cómo progres a la clase del
profeso r
Lectura Sainz en cuanto al domini o de los concep tos aritmét icos, si se le compar
las habilidades para efectua r cálculo s aritméticos?, ¿en qué aspecto a con
Historie tas (ver primaria l) (44 reactivo s) s las es-
cuelas de Coyoac án tienen calificaciones más altas que el promedio?,
¿en qué
aspectos muestr an deficiencias? Las diferen cias que se reflejan, ¿son
Interme dio (grado 5.0-6.9) una con-
secuencia del énfasis program ático o indican una situaci ón que debería
ser
Avanza do (grado 7.0-9.5)
causa de preocu pación y de un esfuerz o por remediarla?
Sinónim os ¡50 reactivo s) Cuando se utilizan las decisiones instruc cionale s del salón de clases,
Historie tas (45 reactivos) las puntua ciones de las subpru ebas en una batería de aprove chamieaun
nto
escolar propor cionan una ayuda limitad a. Si Pedro está un grado comple
Median te la compar ación de los niveles sucesivos p~demos ver que la por debajo del grado en el que en realida d se halla acerca del uso de to
pre- las ma-
sentaci ón cambia de un f~Jrma~o oral-auditivo presenta~o por el ma~estro yúsculas, ¿qué se puede hacer al respecto? La clase del profeso r Sainz
:c~~ muestr a
format o totalme nte escnto leIdo por el. ~lumno. Los dlbU}<?s s~ ~sdn u~ promedio de grado equival ente a medio grado por
~ se debajo en los concep tos
en los primeros niveles, donde las habilIdades de descod}fIca~lOn ar~tméticos que en el cálculo aritmét ico. ¿Qué pasos
ap:~~S
están desarro llando. En los primero s niveles se pone gran enfasls al anahsls de
debe dar el profeso r
SalOz? ¿qué debe enseña r o reenseñar? Una manera de buscar una respues
ta es
274 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
PRUEBAS DIAGNÓSTICAS DE APROVECHAMIENTO
275
observar las preguntas específicas acerca de la prueba de mayúsculas en la que maestro tan pronto como sea posible después de la prueba. Cuando los 1-
Pedro falló· o las de los conceptos aritméticos específicos que muchos de los [;Idos de la prueba se procesan centralmente como tiende a 1 resu
niños de Id clase del profesor Sainz no conocieron. Mediante sus servicios I1ran parte de 1as pruebas estan d anzadas· actuales' existe I'ne'serble caso para
computarizados de calificación de pruebas, los editores de prueba repOrtan " d . . ' VIta emente un
retraso e vanas semanas entre aplIcar la prueba y recibir los resultad d
una información cada vez más detallada acerca de las respuestas de un niño o ella, para que puedan llegar a las manos del maestro. Cada semana ~s e
de toda la clase. Así, hay formas de reportar que indican exactamente qué añade al retraso hace que los resultados sean menos Oportunos q el se
reactivos contestó mal Pedro en cuanto al uso de las mayúsculas en la sub. .. . . l ' para tomar as
deCISIOnes mstrucclOna es concermentes a los niños específicos 1 d
prueba, por ejemplo, tal vez agrupándolos mediante la regla del uso de ma. ·
la elase, ya. que para entonces se h an ensenado - cosas nuevas los o amgrupo
t . 1e
yúsculas que ellos ejemplificaron. Entonces, el maestro puede comprobar si ,tpren dI' os
d '
preVIamente . 'h
qmza ayan ' SIdo olvidados y los detalles, da 'ena . es
Pedro cometió errores al usar las mayúsculas al principio de un enunciado, en de 1a prue ba se h an vue1to menos exactos Por tanto es I'mpOrt escnpuvos t
los nombres de personas, en los nombres de lugares, etc. El'prof~sor Sainz conSI'd eren to dos 1os d eta11 es con la mayor prontitud
. , hacer más
para an expedito
e que se
puede verificar la frecuencia de errores en cada una de estas SItuaCIOnes para el programa de pruebas, el ensamblado de las hojas de respuesta de las 1
todos los estudiantes de su clase. .. l ' d I '. escue as
partICIpantes y e envIO e os matenales a la agencia procesadora. A partir de
Este tipo de micro análisis de los resultados de una prueba tiene e! poten. esc momen~?, la prueba.q.ued~,a merced del correo y de la agencia que realiza
cial de identificar específicamente las dificultades y proporciona la pistas la preparaClOn de la cahhcacIOn y del reporte.
determinadas para la instrucción. Por medio de estos reportes, el editor trata ~s probable que el problema del tiempo que se pierde en este proceso sea
de ayudar a los maestros a buscar las puntuaciones de prueba normativas COn parttcularmente seno en los programas de prueba a nivel estatal . . 1
el propósito de identificar los ejercicios de prueba específicos con los que el .. de que
reqUisIto ·· e1 ana' 1"ISIS de a prueba se I
realice hasta el '
final una SIeeXIste e
individuo v la clase en su totalidad tienen dificultades. .
hayan re~o 1ecta d o 1os d atos d~1 SIstema , v z que se
escolar. Ha habido casos en que el
Este an'álisis detallado de éxitos o fracasos en los reactivos específicos puco procesamIen,to seyrolong~ debIdo a puntos técnicos y políticos que retrasan
de ser muy sugerente para guiar al maestro¡ sin embargo, las limitaciones dc el reporte m~s alla de un ano en el que se obtuvieron los resultados de la prue-
una prueba sondeo para este propósito son muy real~s: En prim~r. lugar, en ba. Para el tIempo en que estos resultados llegaron a fianos de los maeSlrus
muchos casos uno o dos reactivos tratan de una habIhdad especlÍIca. Cual· c~~ d~masIado tarde para darles cualquier uso o no servían ya para la planea~
quier niño, d~ manera individual, puede obtener el reactivo correctamente clOn mstrucclOnal de los alumnos específicos. .
mediante una adivinación o fracasar al distraerse por algún otro elemento del
problema que no fuera realmente adecuado como habilidad b~sica que se
supone que la prueba está diseñada para medir. Uno o dos reactIvos no son PRUEBAS DIAGNÓSTICAS
suficientes para tomar una decisión confiable acerca del "dominio" o de la
11 falta de dominio" para un solo niño. El fracaso en un reactivo puede alertar al
DE APROVECHAMIENTO
maestro acerca de la necesidad de probar esa habilidad de manera más comple·
ta, con una miniprueba enfocada e~pecíficamente a esa h,abilidad que s~ s~po· El d!agnóstico s~ :ela<:iona primordialmente con el sujeto individual solo
ne estaba representada en ese reactIvo en e! que se fracaso. De manera SImIlar, ~ara obt,I~ne una cal~fIcaclón baja en una prueba de comprensión de la lectura :
el fraca so en contestar un reactivo por parte de un pequeño número de estu· .por 9ue , Pedro obtIen~ una puntuación baja en la sección de aritmética de l~
diantes en una clase, sugiere la necesidad de probar esa habilidad de manera batena de aprovechamIe~to . ¡Cuáles son las causas de la dificultad? Muchas .
más detallada a fin de tener las evidencias para juzgar de modo conhable quc proba.blemente la lr:ayona de las pruebas de diagnóstico se realizan con alum~
el pequeño n~mero de alumnos de! grupo realmente carece de dominio en csa nos aIsla?os despues de haber determinado una prueba de sondeo o de las
habilidad. observaCIOnes d~rectas del maestro, el cual se percata de que el alum~o no está
En relación con el porcentaje de éxito o de fracaso de la clase sobre un ~rogresando satIsfactonamente en lectura, en aritmética o en cualquier Otro
reactivo también es necesario considerar si la clase debería saber esa respues· ;.c i mento del programa escolar. Las partes de una prueba de diagnóstico para
tao Por t~n lado, ¿se ha enseñado la habilidad recientemente o hace ya algún ~ ectt~ra aparecen brevemente ~escritas en e! capítulo 6¡ sin embargo, están
tiempo?¡ por e! otro, ¿cuál es la tasa de éxito típico de los estudiantes.de.cse d¡spombl,es algu.?-as pruebas que mtentan servir como función de diagnóstico
grado? La primera pregunta sólo puede contestarse si se tiene un conocIml~n­ ~i que estan dlsenadas p.ara. administrarlas a un grupo. l. continuación aescri-
to particular de lo que se ha enseñado en la clase actual y en los grados anteno· remos una de eIl~s e mdlcaremos qué se propone realizar y qué problemas
res. Alguna ayuda para contestar la segunda pregunta pu~de d~rl~ el editor, surgen al usarla e mterpretarla.
quien es capaz de elaborar tablas que muestren el porcentaje de eXIto para un ñad La prueb~ Stanford de di~gnóstico para aritmética. Nivel IlI, está di se-
reactivo, para cada grado. ba : para .aphc~~la desde la mitad del octavo grado. Como ejemplo de la prue-
Si e! microanálisis de la prueba da como resultado una ayuda para el maes- ca~o ~ontmu.acIO~ s~ muestra un.a ~ist~ de las subpruebas y se ofrece en cada
tro y si queremos que de verdad lo sea, entonces tendrá que estar en manos del n reactIvo SImIlar (pero no ldentlco) a uno de los primeros y uno de los

-
...... , ... . " .... ... . .......... . .', .:' ~ . ... . .:- ';. " ~ ,,,'
.
: ::- . ," , .. ,' .' ~ ' " ,",:' " . :'-,' . '
276 CAP. 8. PRUEBAS DE APROVE CHAMIE NTO ESTAND ARIZADA
S 277
. b b· Tambi se muestr an el número de reacti· l'rueba 5: Cálculo s mentale s (presen tados oralmen te)
últimos reactIvOS de esa su prue ~. . . d én
vos en cada subprue ba Y la aSlgnaclOn e1 tiempo de prueba. porte A: Suma (26 reactivos, 5 minutos)
Prueba 1: Concept os de número s y numera les 4+5=' 7+8= 1
Parte ..1: Sistem,ls numéricos Y oper,lCiones ¡30 reactivos, 20 minutos )
Parte R: Resta (26 reactivos , 5 minutos)
o X S = 5 8-5= ? 12-7 =1
\3 X 41 X 5 = 3 X \4 X O)
Parte H: Ubicación del puntO decimal (26 reactiyos, 20 minutos Parte C: Multiplicación ¡26 reactivos, S minutosl
l
4X6= ? 8X7= ?
2 000 +
500 + 70 + 3 =
7 200 ..;- 100 = Parte D: División (26 reactivos, 5 minutosl
al 7.2 bl 72 c1 7'0
,_ dI 720 000
36 ..;- 4 = ? 48 ...;- 6 = ,
Prueba 2: Cálculo con llúmero s ellteros
Parte A: Suma y resta (20 re¡lctivOs, 12 minutos} Parte E: Operación mixta (26 reactivos, 5 minutos)

36+6 =,
436
759 1135
___ 75<i. Con base en esta descripción de prueba s compie mentada por el estudio
._+ 285
de un manual de prueba , se aclaran varios puntos . En primer lugar,
las
puntuaciones diagnó sticas, ocho basada s en el materi al de prueba impres 13
oy
Parte B: Multiplicación (18 reactivos, 20 minutosl cinco presentadas de manera oral como ejercicios mentale s, corresp
;¡proximadamente a las áreas de los concep tos aritmét icos y al cálculo onden
arit-
340 méticO como se presen tan en las batería s de aprove chamie nto. No
se preten-
__0 24 de evaluar la aplicac ión de las habilid ades para efectua r cálculos aritmét
icos
alos problemas enunci ados en forma verbal. Es decir, saber qué hacer
no se
evalúa; la prueba se limita a la fluidez para realiza r un ejercicio aritmét
Parte C: División (18 reactivos, 30 minuto s) claramente enunci ado. Si deseamos probar deficien cias especificas ico
en el aná-
lisis de problemas y determ inar qué secuencia de operaci ones tendría
dectuar se, necesit amos una prueba de una clase totalme nte distint que
9 162 3811 746 a. Las
pruebas diagnósticas explora n sólo alguna s de las fuentes de dificul
tad en un
úrea programática .
Prueba 3: Fracciones comune s
Una segunda observ ación consist e en que la admini stració n de la batería
Parte A: Comprensión (22 reacti\'os, 20 minutos} requiere una cantida d de tiempo sustanc ial. Si se incluy e el tiempo
para dis-
tribuir los protoco los y volver a recoger los, los autore s estiman un
.. 24 requeri ·
miento de tiempo de 4 horas y 10 minuto s. Ellos recomi endan que
Reduzca a su mínima expreslOn 36 prueba en siete sesione s; por tanto, su aplicación requeri ría una seman
se dé la
a o un
poco más. Este tiempo puede estar bien invertido si al principio del
PdTte B: Cálculo (28 reactivos, 28 minutosl año el
maestro desea conoce r cuál es el nivel de conoci miento s de sus alumn
os de
manera individual y grupal en cuanto a las habilid ades aritmét icas.
Enton-
~'3. + .!.. = ? 3..;- '-3 =,, ces, es necesario contar con suficiente tiempo para tener una evaluac
ión ade-
5 3 4 cuada de cada habilid ad (la confiab ilidad de las subpru ebas separad
as está en
el rango de los 0.80 y 0 .90) . Queda claro que los requeri miento s de
Prueba 4: Fracciones decima les y porc entajes (48 reactivos, 35
minutosl tiempo
nos hacen conscie ntes de que las prueba s de diagnó stico son empres
as que
3% de S60.00 = , consum en mucho tiempo , ya sea para un solo individ uo o para todo
1.4 X 200 = , el gru-
278 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
PRUEBAS DE APROVECHAMIENTO . ..
279
po. Esta inversión de tiempo se justifica sólo si los resultados de la prueba más adaptada esté una prueba para mostrar deficienc· . , .
van a analizarse con minuciosidad y usarse para guiar la instrucción que se ta será para identificar el nivel de excelencia. Así 1 las sbna;' mas Incomple_
planee posteriormente. d~ número~ enteros no distingue entre la mitad s~p~~~~e~ e sumas y restas
Por último, las puntuaciones, especialmente la de las ocho subpruebas nIvel <:le. qUl~tO gr~do. Hay una incompatibilidad esencial e;rupo de gr~do al
impresas, constituyen sólo un paso inicial en el diagnóstico. Si las puntuacio. de defICIencIa de dIagnóstico y la evaluación de todos los rad tre las funcIo~es
nes de Pedro se comparan con las normas de su grupo y se ubican muy por La prueba ,q~e es buena para un propósito, es poco protabl~s ~~ excelenCIa.
debajo de las normas en la multiplicación de números enteros, aún no sabría.
mas qué es lo que le causa problemas. Tenemos alguna guía acerca de hacia
otrO pro~osIto, pues normalmente una prueba de diagnósti q d 0 s~a p.ara
ñarse mas como una prueba referida al criterl·O O co e ena dl se _
1
dónde deberíamos enfocar nuestros escrutinios posteriores, pero toda\·ía dommlO. . , d como una prueb d
o maestna, e tal manera que las puntuac¡
. , perfecta y que ·ones d as estuv
a oe
necesitamos hacer un microanálisis de los errores de Pedro en los problemas ran muy cercanas · a l a puntuaclOn no · espera
h u b lera un ampli Ie-
de multiplicación, para comprobar si existen algunos errores identificables en go de l?~ntu~clOnes de pares inferior al promedio para expre I o ran_
la concepción o en el procedimiento que fueran las causas de los errores repe. de defICIencIa. sar os grados
tidos, o si estos errores parecieran surgir de la deficiencia en conceptos numé.
ricos básicos. En otras palabras, una vez identificada tentativa mente un área Tabla 8.2. P~ntu?e~ones crudos de los subpruebos de lo prueba Stanford de aritmético
de deficiencia, necesitamos observar el proceso del funcionamiento del alum.
no en esa área para determinar con exactitud qué es lo incorrecto y formular dlOgnos/lca (forma W) correspondiente o los pereentHes 50 y 25
una hipótesis que explique su comportamiento. Un estudio diagnóstico
minucioso implica la observación del proceso, así como del producto del Pereen/il 50 Pereen/il 25
desempeño del alumno. Número
Si la deficiencia en una sub prueba determinada es peculiar a una perso· de 4.5- H- 6.5- 1.5- 4.5- H- 6.5- 1.5-
na en la clase, buscamos las deficiencias que puede haber en el aprendizaje Subprueba reactivos H 6.5 1.5 8.5 H 6.5 1.5 8.5
de esa persona. Si la clase en su totalidad se ubica en un niv el de puntuacio·
nes especialmente bajas en alguna subprueba, nos preguntamos si la ense· Sistema numérico y
ñanza de esas habilidades o su comprensión se ha hecho de m anera muy operaciones
pobre, o si se ha retrasado la inclusión de ciertos temas en el programa
30 15 19 22 23 10 14 15
Volor del lugar decimal 26 17
locaL Una discrepancia entre el desempeño local y las normas nacionales 14 17 19 21 9 14 15
Sumo y resto 20 17
significa un problema sólo si el programa local es paralelo al nacional en el 17 19 19.5 19.5 14 17 17.5 18
tiempo en que se debió incluir el tema en cuestión. Si un tema (como las Multiplicoción 18 JO 14 15 16 6 12 13 14
fracciones) no se ha enseñado a una clase particular, obviamente no hay División 18 4 13 15 16 2 9 13 13
ninguna razón para preocuparse si este tema no se ha dominado. La inter· Frocciones:
pretación de los promedios de la clase y de los perfiles de estas baterías de Comprensión Z2 4 10 13 17 2 6 9 12
diagnóstico debe hacerse a la luz de la historia instruccional del grupo y del Cólculo 28 3 10 18 22 I 5 9 16
énfasis instruccionaL Frocciones decimales y
Debido a que las subpruebas en una batería proporcionan pistas diagnós· porcentajes 48 9 16 21 28 4 IJ 16 20
ticas significativas sólo cuando el material cubierto por una subprueba ha sido
enseñado a los alumnos, podríamos cuestionar si el material acerca de las frac·
ciones y los decimales proporciona una información diagnóstica para los gru·
pos del cuarto y del quinto grados. No es posible identificar el desempeño
deficiente en una subprueba si el desempeño promedio es de cero o muy cerca· PRUEBAS DE APROVECHAMIENTO
no al cero. Las puntuaciones crudas correspondientes a los percentiles SOy 25 PARA LAS ESCUELAS SECUNDARIAS
se muestran en cada subprueba para cada rango de grado en los cuadros de Y PARA LA UNIVERSIDAD
normas contenidos en la tabla 8 .2, junto con los números de reactivos en cada
subprueba. En esta tabla se observa que las subpruebas en la división denúme·
ros enteros, las fracciones y los decimales no tendrían ningún valor diagnósti· den ~n e} nivel elemlental ~~ escolaridad, las pruebas estandarizadas tien-
ca en los grados cuarto y quinto. El alumno promedio obtiene sólo unos núm en ocarse en as hablhdad~s básicas para operar con palabras y Con
cuantos de estos reactivos correctos, y no quedan muchos espacios para dife· Sitari~~S~s~~ la ;sc.u e1a s~c.undtna (y preparatoria) yen los niveles univer-
ticular;s ' n as~s cam la a a s~stancIa de las áreas programáticas par-
renciar entre el alumno promedio yel deficiente. En la tabla 8.2 también se
muestra otra característica de las pruebas de diagnóstico: en general, cuanto Vez má ¡
f aun J?1':r a cursos partIculares. Dado que el programa es cada
s 1 erencla o con un centro que sería común a todos los estu dian-

.-:-::,--~""~ ." ,
"
.. .'
. "...,- :-; ~::. ;.: ; ~j; ·:~·r:- ~~~~~~f.!fH ~~~.:~~:··~~'::·~<:; ~ ) ; ;': .
CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
PRUEBAS DE APROVECHAMIENTO .. . 281
280
tes, el cual representa sólo una pequeña fracci?,n del total, ha-;: cada vez d) Lectura.
menos una función para efectuar una evaluaclOn u.mforme e mt~grada. el Matemáticas.
Las baterías de pruebas se siguen usando en los .m:elcs secundanos, .de ;) Literatura.
modo que comentaremos brevemente dos patrones dIstmtos para las batenas .
de la escuela secundaria y examinaremos algunas pruebas y senes de prue· Como se desprende de estos títulos, la batería contiene una comhinación
bas que están disponibles para las m,aterias y los cursos por separado. 1 de habilidades (lectura, redacción y, tal \'ez, matemáticas) y de comcnido
Una batería de pruebas que surglO de una necesIdad, al fmalde la Segunda (estudios sociales, ciencia y literatura) ; sin embargo, aun en las áreas dc conte-
Guerra Mundial para evaluar y dar créditos por las expenenCl,:s educatl\"<ls ' nido hay mucho énfasis en el conocimiento funcional, por ejemplo, la inter-
obtenidas en las fuerzas armadas, es la conocIda como pruebas lm",lQ para el pretación de los datos y los diseños experimentales en ciencia. Estas adapt ,l-
desarrollo educativo, la cual fue diseñada ongm.almente para e.va!u~n Ls ciones se apegan más al núcleo central de 12. educación secundaria y la haccn
experiencias que pudieran haber tenido un contem?o de gran v:nedac1,_" de mús útil para comparar diferentes programas y escuelas y más propia para
varios tipos; por tanto, las pruebas de este tipO tendlan.~ destaca". los C0l1oe1- tomar decisiones relacionadas con un estudiante en particular; no ohstante, la
mientos generales y la habilidad para leer c~n comprenslOn matenales de dlle- hacen menos útil como medida de lo que se ha enseñado en cualquier curso
rentes campos del conocimiento, y este mismo formato se ha n:ante11l?0 en específico.
varias ediciones subsecuentes. En su versión presente, la batena nombrada Ademas de las baterías como las descritas, existe una serie de pruebas
consta de las pruebas siguientes: CUYOS titulos corresponden de manera más apropiada el aquellos cursos espe-
cíficos. Una serie bastante extensa de estas pruebas fue diseñada por la Coope-
al Compresión de conceptos socia~es básicos. . r,nive Test Divis!on (DiYisión cooperativa de pruebas) perteneciente al EduGi-
bl Antecedentes generales en las ClenCla~ naturales. tional T esting Service (SerYicio de pruebas educativas\. La naturaleza de las
el ' Corrección y propiedad en la expreslOn .. pruehas queda sugerida por los títulos de la s pruebas en el campo de las mate-
dl Habilidad para el pensamiento cuantItativo. .' , ' máticas: eS éru cturas del sistema numér ico , aritmét ica, álgebra 1, II Y III. ,2:(,:0 '
el Habilidad para interpretar matenales de lectura-estudlOS SO CI'll~S . rnctria, trigonolnerl"1é1 . geometría éln;.J.1itic~t y cúlculu. en:ra serie qUCC"1él repre-
f j Habilidad para interpretar materiales ~e lectura-CIenCIaS naturales. sentada en las Evaluation ami /1.d ju stm ent Series ¡Series de e\'aluación y
g,\ Habilidad para interpretar matenales de lectura-lltcratura. equilibriol , pubíicadas por Harcourt, Bracc y Jovanovich, las cuales incluye;,
h) Vocabulario generaL títulos en q uírnie" , física, biología, bistor12 de los Esta dos Un idCl>', álgebra,
j) Fuentes de información. geometría \. comprensión auditiva, entre otros. De man era típiG\ , las pruehas
de estas series están diseñadas para los estudiantes que han com.plctado algún
El énfasis para obtener, interpretar)' usar el material de,vario_s tipos y des· curso específico: álgebra para principiantes, biología, histOria universal, etc.
de fuentes diversas es evidente en los títulos de estas pruebas .. CasI todas las Las normas están basadas generalmente en un2. muestra de estudiantes que
subpruebas implican una demanda sustancial acerca de las habIlIdades para J.¡ han complet ado estos cursos, con cualquiera de los factores selectivos
lectura, v la mavoría de ellas están altamente correlaclOnadas unas c0n.0tr,~s. que hayan podido entrar en su selección. Se han becho pocos intentos por
Como r~sultadó . mientras que la prueba proporciona una buena preC1lcclon mantener la comparabiJid ad d e la escala de calificaciones de un campo del
de un desempeño académico posterior,; las subpruebasno son muy ehcac;, conocimi ento al otro , de modo que las comparacioncs á 10 hngo de todo s los
como medios de diagnóstico y no corresponden lo sufICIentemente cerca a ' 0 cainpos <;0 "" 'n;.Í s l-,i " n cuestinnah1ps .~ "e("es el cor·tcnido de l ·, p "1Y'ba Ducdr'
que se ha enseñado en ningún curso específico para que tuvle:-an Y¿¡lm J. ..... . . .. _ .L _ '-'
l'
csta ~-' '.1D ~~ 1'e' ~'ldJ; r)-' ~, .~().~ltel1ioJ ,.~~ 'd,,:,>"ll ~"u' ~~s"o' ,1 r: -s';, fl'-L~ 'J t::',~'te·, ;-:"'i"'1j t r.' ~I")~ ~: n·· }~' <'·~li-·.. 'C.,' t..~.~,
("l . . .... _ .. V LA _J J _ '. , . ..... ~ . .. . .. . ~ ..... } .. _.... ...,,-,.
J
1
~ 1 ·~
i...1.I.. • •• •

como medidas de resultados de algunos cursos. Esta batería podria te ner prueba desempu1e el papel en la evaiuación del fin deal10 para cada estudian ·
valor como indicador de qué tan eficaz ha sido un programa escoLn ~ot ,l¡ tc, pero este paso debe reviS<lrse antes de darse.
para desarrollar una alfabetización informada. Un p,,-pe] que se ha sugerido que desempei'ian las pruebas diseñadas par;;
Más convencionaies y representatiyas de otras baterías de pruebas para.e! aparearse él cursos específicos es que se puede eximir dc un requerimiento de
nivel secundario son las pruebas del progreso académico diseñadas para."pl!· curso específico. Debido <1 qu e muchos ióvenes han recibido entrenamiento
carse en los grados del noveno al decimosegundo. Hay seIs pruebas en la [Jate· deY~rias clases en las fuerzas ,mnadas:: como reconocimiento de que alg unos
ría que se distribuyen de la manera siguiente: individuos pueden haber recihido educación por otros medios que la escolar j-
zación tormal, es decir. mediante la lectura personaL el radio. la tcÍe",isión (1
al Estudios sociales. por ciertas experiencias, se hs comprobado como algo deseJl~j e que al.gu no ~
b) Composición- educadores apliquen exámenes detallados como un recurso para acreditar est"
el Ciencia. cxperiencia El College Level Examjnabon Program (CLE!' ) [Progr~lJ11<, de
I Las p!ucb~s ¡]c a¡]misión a las universid'1des, de la batería del programa de pruch'l:; pa,'1i.l'
exámenes para nivel universitario) del Servicio de pruebas educativas co nsti-
universidades estadounidenses, corresponden a cuatro de las pruebas lTED . tuye uno de ('.stos recursos.

-
282 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
PROGRAMAS DE PRUEBAS A NIVEl ESTATA L
283
El CLEP se organizó para ofrecer un procedimiento uniforme a nivel
nacional con el fin de evaluar la experiencia que pl:ocla~a~an tene~ .algunas escuela o de~ sistema de escuelas, pero resultaría inapropiado para evaluar
,1 alumnos aIslados.
personas y que sería equivalente a! de un curso uDlversltano. especIflc.o. Los
exámenes se han preparado en 35 areas que van desde c<?ntabIl~d.ad ~ ?Istona
afroamericana hasta pruebas y mediciones, trigonometna y.cIvIlIzaclOn o~ci. Muestreo de reactivos
dentaL Los datos normativos se han obtenido de los estudIantes UDlVerslta.
rios que han terminado estos cursos, así co~o de las muestras que se han Por lo general, el tiempo de prueba está estrechamente limitado y un pro-
tomado de pruebas equivalentes. Las puntuaclOnes se presentan como puno grama por mandato externo sería más aceptable a un sistema escolar local si
tuaciones estándar que varían de 200 a 800, con 500 ~om? !epresentauvo de nO requiere más de una hora, más o menos, del tiempo del alumno. Por otro
la puntuación promedio para la población de referencIa basl~a. La manera <'n lado, el número de los diferentes objetivos específicos que puede identificar
que los resultados de estas prueb~~ pueden usarse es determmada por la un!. un comité de planes preliminares en sólo un área programática, es bastante
versidad a la que el estudiante solIcIte mg!esar y de la que desee obte.ner el ere. grande. i Cómo se podría re~olver este conflicto entre la finalidad de una prue-
dito equivalente. Al igual que c.o~, cualqUle! otro examen pa:a acredItar? I?ara ba breve y altamente manejable y una cobertura programática integrada? Se
obtener la licenciatura, la declSlon de que es lo que constltuy~ un IT.JlDlln? han producido varias formas de una prueba, tal vez 10 o 12, cada una de las
aceptable resulta bastante arbitraria. A pesar de los datos normativos dIspom. cuales muestrea un dominio total del programa . Entonces, cada niño toma
bIes para las personas que hayan tomad.o el c':lrso del cu~l el examen es un &Us. ¡¡Iguna forma de la prueba, pero estas formas se rolan de tal manera que den-
tituto, es probable que no haya datos ~1~po~Ibles especIhcamente para la um. trO de una clase dada, de una escuela o de un sistema escolar, todas las formas
versidad a la que un individuo solIcIta IDgres~r: EI!~onces, es necesano se representan por iguaL Como cada niño ha tomado una forma de prueba
determinar de manera intuitiva a qué nivel de cahhcaclOn se hallan los cam· todos los niños én una clase o en una escuela están igualmente ponderados e~
bios en el balance en favor de la ganancia en tiempo ganado y fuera de! nes.go el promedio y, ya que las formas de prueba se han rolado, todos los reactivos
de promover a una persona preparada i~adecu~~amente. ,El uso de exa:ncncs de prueba están igualmente representados en el promedio. Los resultados
para obtener la licenciatura y ~l respectIvo,c~rtIhcado esta muy extendIdo en conjuntos obtenidos por la apreciación de una muestra amplia representativa
nuestra sociedad, y las bases 10gIcas y empmcas sobre las ~uale~ se han ?crcr. del programa, y aun las calificaciones de las suhpru ebas que corresponden
minado estas calificaciones suelen funcionar, en gran medIda, SIn un mlDlmo a segmentos bastante estrechos del programa, pueden estar representados por
de cuestionamiento. los suficientes reactivos de prueba para dar una cobertura razonablemente
completa y variada de ese segmento. El término muestreo de reactivo se ha
aplicado a este procedimiento, debido a que cada forma de prueba es una
PROGRAMAS DE PRUEBAS muestra de un conjunto total de reactivos. Este procedimiento permite obte-
DE APROVECHAMIENTO ner un diagnóstico completo de las deficiencias y los logros de una escuela
A NIVEL ESTATAL particular o de un sistema escolar, expresando los resultados para un área defi-
nida de habilidad, ya sea en términos de dominio absoluto o en relación con
otras escuelas o sistemas escolares dentro del estado.
En los años recientes ha habido cierta tendencia a ampliar los programas A nivel nacional, la técnica de muestreo de reactivo se ha empleado en la
de prueba que mandan los estados. De maI?-era típica, en estos progra· National Assessment of Educational Progress (Evaluación nacional del pro-
mas todas las escuelas públicas de un estad? tIenen .que aplIcar una prueba greso educativo), en la que el examinado es evaluado con sólo una fracción del
específica o una batería de pruebas en determmados Dlve!es de grado. En algu· conjunto total de reactivos. Los análisis de la Evaluación se realizan inicial-
nos casos se han utilizado pruebas ya publIcadas, pero mas a menudo las prue· mente al nivel del reactivo aislado, y los datos se agregan por región, tipo de
bas han sido producidas por y para el estado por el Departamento de educ,a. comunidad, sexo, grupo étnico y de otras maneras. Entonces se hacen compa-
CIOn. Con frecuencia, estas pruebas se han basado en una formu~a~lOn raciones entre los diferentes estratos Isubgrupos) y entre los mismos estratos
sistemática de objetivos relativamente específicos elaborad?s por comItes de en distintos periodos¡ por ejemplo, el porcentaje de párrafos que se considera-
educadores dentro del mismo estado, en un inte~lto por aJusta~ las pruebas ron coherentes en ensayos cortos escritos por estudiantes, dentro de las prue-
de manera más cercana a los objetivos y la secuenCIa de mstrucclOn den~ro. del bas realizadas en 1969 y repetidas en 1974, fueron como sigue:
estado. Se ha involucrado a los maestros en el d~se~,o de los planesyre.h:nma·
res de pruebas, con el fin de contrarrestar la obJeclO,n de que_los eJerCidOS de
11 años /3 años 9 liños
prueba no son similares a los que las escue.las. hablan ensenado. .
En la mayoría de los casos, el punto pnnclpal de los progra~as ha s~do 1969 1974 1969 1914 1969
a nivel estatal acerca de la evaluación del nivel de la escuela, o a Dlvel de slste· 1914
Hombres 87 75
ma escolar, y las formas de las pruebas se han diseñado con e~ta meta: Un pro· 76 76 54 41
Mujeres 84 78 73
grama de pruebas puede ser formulado y sería altamente efIcaz al Dlvel de la 79 60 45

.~ . - .. . ... .. .
'. , ", " ,", -;. ' '\:-; ', \~. ;1; ", :, :'~~:<';' ; ~~ v ;; : v,;~; ~ :.:-"., :.: ,", .' . ,. ;-, .. .' .-.' ..... :'
284 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS
PREGUNTAS Y EJERCICIOS 285
Los datos anteriores proporcionan una imagen, en :ste caso un poco desa
lentadora, de las tendencias en una faceta del desempen? educatIvo por agru. prueba de h~bilidades común.pebi?o a que s~lo hay inte::és por una decisión
pamientos dc edad y de sexo en las escuelas estadoumdenses. . en un !1l\'cl oe habIlIdad espeClhco, la prueba aehena chsenarse para quc 'uu'a
. La técnica de muestreo de reactivos, especIalmente, y cualqUIer proce. scnsitiY<I;l ese l1~v.el en un grado máximo. No es necesario incluir en la prueb,;
dimiento que trata de muestrear con amphtudlos elementos_del PI ograma, los rC<lCtlVOS (iJf¡clles que establecen la dIferenCIa entre una competencia pro-
en general tienen un valor limitado para apreCJaY el desemyeno de alumnos medio y una superior, así como los reactivos muy fáciles que pudieran COntcs-
aisiados. Con el muestreo de reactivos cada alumno habra tomado dIferen. [.Ir correctamente aun aquellos individuos con una competencia muy baia en
tes pruebas. En cualquier programa por mandato que ,deba alust~rse a Un 1<1 habilidad en cuestión, Los reactivos podrían dirigirse apropiadamente a un
tiempo limitado, el muestreo de reactlvos de un obJ,,:t~vo educatl"\ o .e~pecl. pcqueilo ~ampo de dificultad, y deberían diferenciar tan tajantemente c,~mo
fico normalmente será tan limitado que una conclusl?n respecto del uoml. lucra pOSIble entre aquellos que se ubIcan por debajO y por enClIDa de la ¡mea
nio que tiene Susana acerca de talo cual aspe~to, ser~a t,an IJ1conf¡~ blc que di\'isoria mágica. Ya que no es posible hacer esto con precisión, inevitable-
sólo daría la base más engañosa para cualqUIer decIslOn de ensenanza. mente la prueba diferenciará sobre un rango bastante amplio de competencia,
pero cuanto mejor sea la prueba er: la diferenciació~ de la mínima competen-
cia y la dclmepto SII1 remedIO, mas mcomp1eta sera para expresar los grados
de excelencia.
Evaluación de la ejecución mínima

Un tipo de nrograma por mandato que en la actualidad se aplica en.un RESUMEN


buen número d~ estados es el que se ha designado como compet,enclG lTIJ/)j.
ma en ciertas áreas programáticas centfdle~: Como unareaCClOn contra la La mayoría de las pruebas estandarizadas son medidas amplias de áreas de
política de promoción automática y de gratUIcar con un dIploma SIr: l;llngun.1 aprovechamiento y están disponibles en el mercado, así como algunas prue-
consideración de la competencia demostrada, ~osestados han estal"JlcCldo o bas que pueden ser clasificadas como diagnósticas. Las pruebas de sondeo son
estimado varios procedimientos de evaluación diseñados para garantl~:lfcler. utiles primordialmente en relación con las decisiones de selección, coloca-
to niyel de competencia en todos jos graduado.s y otorgar el dIploma S~10 alos ción, guia, programa y política ai público. Las pruebas de diagnóstico adecua-
alumnos que demuestren haber logrado ese nIv~L Como .~ucede ~,~,munmcn. das requieren mucho tiempo y, de manera típica, se reservan para aquellos
te los 1cc-isladores que establecen por ley que algo debellO hacel J':': tamblen alumnos que muestran serias deficiencias en algunas áreas amplias del apro-
~u'clen d;r "sugerencias" acerca de cón:o debería hacerse. El ~esarro :l~ de UIi \'cchamien to.
examen para evaluar la competenCIa mlI1lma presenta una selle de plOolcmas En los niveles secundarios y universitarios, las pruebas de aprovecha-
bastante serios. . " '¡- miento producidas centralmente se han necesitado para dar evidencia tanto
El primer problema dehería ser: ¡competencIa en ~u.e" ¡en que amp .I,OS de la competencia sobresaliente, a fin de que sirvan de base a una colocación
segmentos del programa se demanda la. eompetenCIa~, ~so.Iamente:D clcr: avanzada, como para la competencia mínima como una base de los resultados
tas habilidades básicas, como lectura, lenguale o matema,tlcas:.o en un.!s de la escolaridad. Los programas de pruebas a nivel estatal se encuentran en
mas amplias: como el dominio del conOCImIento hUlI!ano; Supongase 9uC un estado de flujo a medida que los educadores vacilan entre los intentos por
esta nregunta ya se conte~to .. ,.y que una. d·>e 1as areas
: • s obre las . esta, de
" que. ~e hacer interpretaciones con referencia a los objetivos del aprovechamiento en
acuc~do' seríar; las matemáticas. El siguiente problema,s~na prec!sar, que es ]¡IS escuelas locales y los intemos por hacer apreciaciones globales de la efica-
lo ouc constituve una competenci<l mínima en ~Datematl~as. iD~})e[],a ~st,lr cia de cada escuela y cada sistema escolar.
rep~esemada po r la l~aestría ~),el dominio (en a,~fun Dlve! especlflco~ Qeu~
catálogo de habilidades especltlcas, tales como la suma de tres DumdOsdt PREGUNTAS Y EJERCICIOS
dos dígitos enteros" o "la cOlwersión de fracciones} como mItades, tercIOS,
cuanr;s, quintos, a decimales": ¡¡debería defimrse normatIvamente c~mo
L ¡Para cuál de los siguientes propósitos sería útil una prueba estandarizada1, ~para
dcscmDcflu sobre una prueba de aritmética representativa ~n un lm~mo cuál sería mejor que el maestro hiciera su propia prueba!, iPor qué?
'11 ;"" 1' ';Jua¡ ·.ji del estudiante promedio del sexto grado?,
AJ \ ...... . J.(.-,. _.. . l ¡O debena
' deÍImr·
se de cualquier otra manera!; ¡y si csta definición resuita ser poco realista, a) Determinar qué alumnos ya han dominado la suma y la resta de fracciones.
Dar ambiciosa, y una gran fracción de íos estudiantes,de la escuela secunda· b) Determinar cuáles son los alumnos en la clase que están por debajo de las
~ia fracasan en aicanzarla!, zcuál sería el impacto polmco dc CSto , y que [,In expectativas en el cálculo aritmético.
posible sería hacer los ajustes apropi~d.os'. ,. . el Determinar las materias en las que cada alumno de la clase se desempeña meior
y peor.
La preparación de las pruebas de,ef¡clen~!a muumas no ~resent~.rl~~I:~
mas especiales, una vez que hay una oehmclOn del don:,uDlo y dell:J\ ~l,~ , . dI Determinar para una clase qué aspectos del uso de mayúsculas y de la puntua-
ha alcanzado¡ sin embargo, este tIpO de pruebas debenan ser dlfe¡enlc~ de J.¡ ción requieren más enseñanza.
e) Formar subgrupos en una clase para la enseñanza de la lectura.
286 CAP. 8. PRUEBAS DE APROVECHAMIENTO ESTANDARIZADAS 287
2. Obtenga una guía programática que abarque el contenido y los objetivos de Una LECTURAS ADICIONALES
materia que ust~d esté enseñando o esté planeando ~nseñar: Examine u~a prUtha
de aprovechamIento estandanzada para esa materIa. ¡Cual de los objetivos tic !:hd, R. L., /lStandardized achievem~nt tests: Uses and limitations", en Aiken, L. R. ) r.
la guía programática están adecuadamente medidos en la prueba?, ¡cuáles no: ¡dir.l, Readings in Psychologlcal and EducatlOnal Test111g , AlIyn ami Bacon,
¡qué tan adecuado es el contenido que abarca la prueba? "
Boston, 1973.
3. Haga una comparación crítica de dos baterías de pruebas de aprovechamiento lor¡;Cnso n , G. W ., "An analysis of teacher judgm~nts of reading level", en American
para el mismo grado. ¡Cómo difieren?, ¡cuáles son las ventajas de cada una destlt . Educational Research Toumal, 12, 1975, pags. 67-75 .
su punto de vista? S;IX, G., "The use of standardized tests in evaluation'~, en Popham, W. J. ¡dir.), El'altw-
4. El manual de la prueba W dice que puede usarse con propósitos diagnóstico, tion in EducatlOn, McCutchan, Berkeley, Cahf., 1974.
¡Qué debería usted buscar para determinar si de verdad esta prueba tiene un Yalo; ShoCm¡lker, D . M' l "Toward a framev.:0rk for achievement testing", en Reviel\' ol Edu-
como ayuda diagnóstica) cational Research, 45, 1975, pags. 127-147.
5 . ¡Por qué deberíamos estar especialmente preocupados acerca de la confiabilidad "Thc scoring of children: Standardized testing in America", en The National Elemell'
de las puntuaciones de prueba resultantes de una serie de pruebas diagnóstica,;, tary Principal, 54, julio-agosto, 1975.
¡qué implicaciones tiene esto para usar e interpretar tales pruebas?
6 . Una escuela preparatoria, cuyos alumnos provienen de tres escuelas secundari;ls,
tiene un programa especial avanzado para matemáticas. ¡Cuáles son las ventaias \"
las desventajas de seleccionar a los alumnos para que lleven este programa C 'J~
base en una prueba de aprovechamiento estandarizada en matemáticas dad;] ,,1
final del noveno grado l
7. Supóngase que usted es maestro y se le ha dado una batería de pruebas de aprOR
chamiento estandarizada en octubre para su clase del cuarto grado. ¡Cómo podría
usted' usar los resultados?
8. Con base en un servicio de calificación centralizado, una escuela compra datos dc
análisis de reactivos que muestran el porcentaje de alumnos que contestan correc·
tamp.nte (".~lda reactiyo para cada g!2do y par:! co.dé1 clase de la escuela. iCómo
podría la escuela, como una unidad, usar estos resultados?, ¡cómo podría usarlos
cada maestro individualmente?
9. En la secundaria H, donde se asigna a los alumnos a las secciones de inglés sobre
una base presumiblemente al azar, el director encuentra que hay marcadas discre·
pancias en la distribución de calificaciones otorgadas por diferentes maestros.
¡Cómo podrían los re~ultados de una prueba estandarizada ayudar al director ;1
afrontar este problema?
10. La señorita Carson, maestra del sexto grado, dice: liNo me interesa tanto el niycl
de desempeño de mis alumnos como el progreso del que dan muestras mientras
están en mi clase/l. Desde el punto de vista de la medición, ¡qué problemas impli·
ca esta opinión?
11 . El sistema escolar de Centreviile ha propuesto poner en marcha un programa de
matemáticas rev isado sobre una base experimental en las escuelas elementales
seleccionadas. Las autoridades escolares desean evaluar la eficacia del programa
antes de ponerlo en marcha en todo el sistema. ¡Qué tan adecuada sería una pruc·
ba de aprovechamiento estandarizada de matemáticas para la escuela elememal
para esta evaluación;, ¡qué problemas surgirían?, ¡cómo podría tratarse esto:
12. Una legislatura de estado ha aprobado una ley que requiere que todos los estu·
diantes muestren una competencia adecuada en las habilidades necesarias pará la
vida cotidiana antes de que se les otorgue el diploma de secundaria. Para implantar
la legislación, ¡cuál es el primer problema que debe resolverse?, ¡cu<lles serían las
ventajas y las desventajas de usar: a) pruebas construidas por el Departame¡1to de
educación del estado, b) pruebas construidas de manera particular por cada es·
cuela, el una prueba de aprovechamiento publicada a nivel nacional para deter'
minar la competencia adecuada?
13. Dé un ejemplo de una situación en la que sería apropiado usar técnicas de mues·
treo de reactiyos en un programa de pruebas, y un ejemplo de una situación en la
que sería inapropiado usar la técnica de muestreo de reactivos.

.' ...... : ... , " , '.- ;.;, '. '., '. ~ ,". ','
.-.,", .
lA HABILID AD INTELEC TUAL 289

LA bales, así como, por supuesto, todos los desemp eños que se domin an
que el niño ingrese en la escuela .
. Debe destaca rse que cualqu ier desempeño depende, en algún grado,
antes de

IL J las experiencias de la vida, y no sólo de las experiencias escolar es. Cualqu de


prueba verbal requier e que la person a deba haber aprendido a hablar
ma. cualquier prueba gráfica requier e un conoci miento de los objetos
ret:atan; cualqu ier prueba de todo tipo requier e que la persona haya
ier
el idio·
que se

9 do a poner el suficie nte esfuerz o y tratar de desempeñarse lo mejor


situaciones de prueba . Por lo mismo , cualquier desempeño depend e,
na medida, del potenc ial genético de la persona, es decir, de su potenci
aprendi-
en las
en algu-
al
tico como ser human o y de sus genes específicos como individ uo. Por gené-
las pruebas de aptitud que analiza remos en este capítul o y el siguien te tanto,
difieren
Pru eba s esta nda riza das de las pruebas de aprove chamie nto que se estudia ron en el capítul o
8,
en que son menos dependientes de los segmentos específicos de la instruc sólo
escolar y al emplea rlas se obtiene n inferencias acerca del futuro, más ción
de inte lige ncia ode clusiones referid as al pasado. Estas pruebas no se pueden consid erar que con-
medidas
puras de potenc ial innato para el aprendizaje.
apt itud esco lar
LA HABI LIDA D INTEL ECTU AL GENE RAL
COMO UN CONS TRUC TO PSICO LÓGI CO
iQUÉ ES UNA APTI TUD!
Desde los comien zos de la medici ón psicológica, los psicólo gos se intere-
En ca ítulos anterio res nos habíam os interesado en las pruebas, como , saron por evaluar la habilidad genera l para tratar y manipu lar el domini
medida s le los resulta dos finales de la instrucción es,:olar . En este ~apátulo y
en el si iente tratare mos con las prueba s como predIctoreS ~e al!?lln
las ideas y las relacio nes entre ellas. Aunque el princip al interés era la
pación científica de entender y describ ir el funcion amient o intelec tual,
o de
preocu-
eño ~uro del individ uo; sin embarg o, ya sea que n.u estro mteres se esem· bién existía la necesid ad práctica de identificar a los niños con déficit tam-
centre intelec-
~n los resultados del aprendizaje pasado o en el potenCIal para el futuro, tuales para quiene s seria difícil progre sar nonnal mente en la escuela
o,
nivel más severo, para los individ uos que tendría n gran dificultad para en un
:¡ lo que
odemo s probar es el desempeño actu satisfa-
p Los desempeños actuale s están ligado sal.. en vanado s grado~ de cerca~la a
' cer las demandas intelectuales básicas de la vida -en un caso extrem o,
para las
la instruc ción escolar organizada. Así, en caso de que el .estudIante personas que no tuviera n "la sensate z suficiente para resguardarse
nidens e que pueda descifr ar el signific ado de Arma vJrumque cano o~.
esta cuando
estuviera lloviendo".
o e Las pruebas diseñadas para evalua r el nivel general de funcion amient
cognoscitivo se han llamado prueba s de intelige ncia en la bibliografía o
psico-
lógica, o pruebas de el en las discusiones popula res; sin embarg o,
hasta la
fecha, los psicólogos no han podido ponerse de acuerd o en una definic
ión pre-
cisa de inteligencia, o en qué es exactam ente lo que incluye y lo que no
ye este ténnino. En años recientes ha habido una tendencia a subesti inclu-
mar
podem os estar casi seguro s de que lo aprendió en la escuela, en su
clas~ ~e ténnino intelige ncia, dado que implica un excede nte tanto de signific el
latín en el primer caso y en su clase de taquigrafía en el segu~do, y el
~ormmo como de sentim iento, yen su lugar se habla de habilidades cognos ado
en estas tareas sirve sólo como indicad or del progres? obtemd o en a citivas
mstruc~ generales o de aptitud es escolares. Este último términ o conlleva específi
ción sistemática. Otros desempeños depend en conJuntamen~~ de
l!s mente la función que tienen estas pruebas como predictores del desemp ca-
riencia s escolares y extraescolares, por ejemplo! de la. comprenslOn d~ ex,s: escolar. eño
as p .
bras, de los problemas cuantit ativos y de se~lf el ntm.? de pensam Indepe ndiente mente de la designa ción, hay mucha eviden cia que indi- ; ,
Ie1tos en
un pasaje de prosa comple ja. Tal~ expt:ri~nclas se en~enan en la escue ca que una amplia varieda d de tareas que depend en del almace naje
a! pero . de
se perfecc ionan en las experienCIas COtIdIanaS de la VIda. Otras se relaclOn
an propias y de la facilid ad de trabaja r con relacio nes entre grupos de ideas
con lo que se enseñó en la escuela sólo de manera remo~a, com~ ~as tareas ideas se
q~~ unen para formar una habilidad general izada en el funcion amient
o
implica n soluciones de problemas con materiales espacIa les, graficos
y nove noscitiv o. Esta habilid ad influye en el desemp eño en un amplio rangocog·
de
288
290 CAP. 9. APTITUD ESCOLAR
291
tareas de prueba y tiene implicaciones en el funcionamiento escolar y

~ ~~
en las tareas más amplias de la vida misma. En este capítulo considerare.

~ ~
mos las formas que han tomado estas pruebas, la evidencia de su generali-
dad sobre un rango de tareas y su estabilidad a lo largo del tiempo, puntos
concernientes a su validez para los criterios escolares y no escolares y a pro-
<::> C>
blemas de uso e interpretación. C> C> C>

(01

PRUEBAS GRUPALES DE FUNCIONAMIENTO


COGNOSCITIVO
La mayoría de las pruebas de habilidad realizadas en Estados Unidos se
hacen con pruebas grupales y se aplican a una clase completa al mismo tiem-
po. A continuación describiremos una serie de pruebas grup~les para ~ostrar
algunas de las características de los instrumentos de este tIpo. Una hsta de
4f<::>
, C>
ri Al
C> C>

otras pruebas de este tipo ampliamente utilizadas, con sus características cla- (bl
ve, se puede encontrar en el apéndice 4.
Las pruebas de habilidad cognoscitiva, diseñadas por Thorndike,
Hagen y Lorge (1968, 19721, están compuestas de cuatro partes distintas.
Para el uso en los grados primarios, hay una prueba que no es de lectura
en la que las instrucciones se dan oralmente. Para los grados del cuarto al
decimotercero, hay una prueba verbal, una cuantitativa y una no verbal.
Cada prueba consta de varias subpruebas, dentro de las cuales los reacti-
vos tienen la misma forma y van de lo fácil a lb difícil. Cada una de ellas
está disponible en varios niveles, de tal manera que proveen pruebas de (el
dificultad apropiadas para las personas de diferentes niveles de madurez
intelectual.
La primera prueba tiene cuatro subpruebas: vocabulario oral, conceptos
de relación, conceptos multimentales y conceptos cuantitativos. El material fIIl /rIl
en el protocolo de prueba es totalmente gráfico¡ en la figura 9.1 se dan mues·
tras de estos reactivos. Las tareas que se presentan a los alumnos se hacen oral·
~ lJ.J!J
mente. Para los cuatro reactivos de la ilustración, las instrucciones orales son
sustancialmente como sigue: (dI

Fi9ur~ 9. 1. Re activos de muestro de los prue bas d e habilidad cognoscitivo: o) vocabula.


Vocabulario oral: uRellena el óvalo bajo la figura que muestra la rata ... la rata. no oral: b) co~ceptos d e relación: e) multilineal: d) conceptos cuantitativos (re produci.
Conceptos de relación: URellena el óvalo que muestra la pelota que está sobre la silla... do con permiso de Houhgton MifFlin Co.) .
la pelota está sobre la silla'. .
Multimental: uObserva la hilera de dibujos. Uno de ellos no tiene relación con los
demás. Uno es diferente. Rellena el óvalo que está debajo del dibujo que no perte-
nece a los otros". ..-
Conceptos cuantitativos: uEncuentra la caja que tiene dos montones de dos palitos... . .
, alu~nos tan pequeños. co~o los de cuarto grado y tan grandes como los
dos montones de dos palitos. Rellena el óvalo debajo de esa caja". . que Ingresan ~n la umversldad (que significa lo suficientemente difícil
para la mayo na de los adultos), esta prueba se ha construido en un forma-
t? ~e nivel múltiple. Los reactivos de cada subprueba van en un rango de
La prueba verbal incluye cuatro subprnebas. diseñadas, respe~t~va· faciles para el cuarto grad~ hasta difíciles para el decimotercer grado¡ sin
mente, para el vocabulario, para completar oraCIOnes, para la claSIfica- -embargo, los alumnos de cIerta edad o de un grado específico toman sola-
ción verbal y para las analogías verbales. Un ejemplo de cada tipo de reac- mente parte de !as tareas, empezando y deteniéndose en diferentes luga-
tivo se muestra en la figura 9.2. La respuesta correcta se ha subrayado .' res. Hay o~ho mvele~ que se traslapan en la prueba. Así, para la prueba de
para cada reactivo. Con el fin de asignar tareas que sean adecuadas a vocabulano, el patron normal de evaluación sería cópto sigue:

,- ....... , .... '., : ': .. -'


292
293

Grado Nivel tomado Empieza en el reactiva Termina en el reactivo Comparación cuantitativo


Columna f Marco A si I es más que n
Columna JI
4 A 1 25 Morco B si I es menos que JI
5xO Morco C si I es igualo 11
5 B 6 30 5
6 ( 11 35 Series de números
7 D 16 40
8 E 21 45 18 16 14 12 ID
F 26 50 A.7 B.8 C.9 D.IO
9 E.12
10-11 G 31 55
Construcción de ecuaciones
12-13 H 36 60
8 9 +
A.O B.3 C.8 D.9 E.18

Cada alumno es evaluado con 25 reactivos de vocabulario, los cuales se


pueden seleccionar para que sean los más apropiados para el nivel de habilidad Figuro 9.3_ Reactivos de muestro de prueba cuantitativa como los que se emplean en las
del grupo. La prueba total consta de 100 reacúvos, 25 de cada uno de los cua- pruebas de hobl{¡dodes cognoscitivos.
tro tipos que se muestran en la figura 9.2.
Para medir el razonamie?to que no requiere de habilidad verbal y que no
deman~a de manera específIca ninguna ha~ilidad para la lectura, se provee
Vocabulario
un~ sene no verbal. ,Muest~as de esto~ ~res ~IPos de. reactivos, se presentan en
Grosero la figura 9.4: analoglas de fIguras, claslhcaclOn de figuras y síntesis.de figuras
A. Infeliz B. Enojado C. Sin fe D. Rudo E. Hablantín ~n los primeros. dos debe seleccio~arse la respuesta correcta. En la síntesis d~
fIguras, el exammado debe determmar si al colocar las "piezas dadas" una jun-
Completar oraciones to ~ la otra, puede lograr cada 11 figura completa". La prueba no verbal también
A Marcos le simpatizaba mucho su maestro de ciencias, pero no le _ _ _ _ _ su
esta p~eparada en el formato de nivel múltiple, lo cual permite al evaluador
maestro de matemáticos. seleCCIOnar el rango de dificultad más apropiado para el grupo.
A. obedecía B. discutía C. preocupaba D. deseaba E. caía bien

Clasificación verbal

Do
Palomo Halcón Reyezuelo Gorrión
A. Polomillla B. Murciélago C. Goviota D. Abeja E. Ardilla

Analogía verbol
El chícharo es o frjiol como el durazno o
A. Hueso B. Árbol . C. Comer D. Cáscara E. Manzano

Figura 9.2. Muestro de reactivos de prueba verbol como los que se emplean en los prue·
bas de habilidades cognoscitivos.
D o
Debido a que la habilidad para manipular ideas y relaciones de natura-
leza cuantitaúva parece ser diferente de la habilidad para trabajar con ideas y
relaciones verbales, se ha preparado una prueba separada de habilidades cuan-
titativas. Los tipos de reactivos que se usan en esta prueba se muestran en la
figura 9;3. En la primera subprueba, el examinado debe determinar cuál de las
dos cantidades es más grande; en la segunda, debe encontrar la opción que
continúa lógicamente la serie, y en la tercera, debe ordenar los números y los Figuro 9.4. /lAuestra de reactivos no verbales como los que se emplean en las pruebas
signos de las operaciones para producir una de las opciones de respuesta. de habilidades cognoscitivos.
294 CAP. 9. APTITUD ESCOLAR PRUEBAS GRUPALES DE FUNCIONAMIENTO 295

La evidenci~ de la existencia de una habilidad cognoscitiva general, pre- los diseños ?pt~cos de rastreo electrónico h~sta el'punto de que es posible cali-
sente en esta sene de tareas de prueba con un rango bastante amplio, se halla ficar por maquma aun en las pruebas del mvel pnmario, en las que el alumno
en las correlaciones sustanciales entre las cuatro baterías dentro de un grupo ha marcado su respuesta en el protocolo de la prueba misma.
de grado. Al respecto, se encontró que son aproximadamente como sigue: Una variedad de pruebas grupales de inteligencia aparecen en una lista
con una caracterización breve, en el apéndice 4, sección A. Ahora centrare~
mos nuestra atención en dos pruebas individuales que se utilizan ampliamen-
:i te¡ pruebas que deben aplicarse al examinado en un solo momento cara a
Verbal (uantitativo No verbal cara, en un encuadre de tipo entrevista. '

Primario· 0.60 0.58 0.66


Vemal 0.75 0.66 LAS PRUEBAS DE INTELIGENCIA
'~ ,
Cuantitativo 0.72 STANFORD-BINET, REVISADAS

• PlISÓ un puñado de dos años entre lo aplicación de lo pruebo primario y los otros pruebas, Las otros tres pruebas se La prueba individtlal que a lo largo de los años ha tenido el uso más
aplicaron al mismo tiempo, amplio con niños es la Stanford-Binet, puesta en marcha por Lewis M. Ter-
roan en 1916 como una adaptación de la investigación preliminar de Binet y
Por tanto, es evidente que todas las pruebas abarcan en una extensión Simon en Francia. Una versión revisada de la prueba fue publicada por
considerable algunas habilidades comunes del funcionamiento cognoscitivo· Tennan y Merrill¡ luego volvió a ser revisada en 1960 y reestandarizada en

¡ sin embargo, como veremos en seguida, las confiabilidades de las pruebas po; 1972 (Terman y Merrill, 1973). La revisión actual, que considera los mejores
I
separado están alrededor de 0.90, lo cual significa que también es cierto que reactivos de las dos formas de la prueba publicada en 1937, se conoce como
cada medida funciona de alguna manera diferente de aquellas medidas por las forma L-M, la cual consta de una serie de subpruebas para cada uno de los 20
otras. La singularidad de cada prueba es suficiente para permitir que tengan niveles de habilidad, empezando con pruebas adecuadas para niños de dos
algún significado distintivo aparte de las otras. Todas Jas pruebas muestran años y continuando a cuatro niveles adecuados para diferenciar las habilida-
una buena correlación con las medidas de aprovechamiento escolar; pero des de los adultos promedio y superiores. Para mostrar el contenido de la
para la mayoría de las materias, las pruebas verbales son las mejores predicto: prueba, hemos seleccionado cuatrO niveles en diferentes puntos de la escala y
'. !:; ras. Sin embargo, la prueba verbal requiere de la lectura y de la facilidad para elaborado una lista de las subpruebas en cada nivel con descripciones breves.
i' .'
hablar el inglés, de modo que cabría esperar que la prueba no verbal propor-
'.: cionara un cuadro más adecuado del nivel de habilidad de un niño provenien- Nivel de 2 1/2 años
te de ambiente donde se hablara el español, o de un niño que hubiera experi- 1. ldentificación.de objetos por su uso (tarjeta con seis objetos pequeños pegados).
mentado una dificultad particular para aprender a leer. La prueba cU<Íntitativa
tiene ventajas para predecir el desempeño en matemáticas y las áreas relacio- IIMuéstrame la que sirve para beber", etc.
nadas con el desempeño académico. Tres de 'seis para obtener crédito.
Las pruebas de habilidad cognoscitiva, y varias otras, siguen un patrón
de diversas subpruebas con tiempos separados. También hemos mencionado 2. Identificación de partes del cuerpo (muñeca de papel grande).
ya los formatos graduados a nivel múltiple. Algunas pruebas combinan todos
los tipos de reactivos en lo que se ha llamado arreglos de ómnibus (Henmon- HEnséñame el pelo de la muñeca", etc.
Nelson, Otis-Lennon). Muchas pruebas se publican en tres o cuatro niveles Seis de seis para obtener crédito.·
distintos, cada uno de los cuales está diseñado para usarse en un rango de
3. Designación de objetos (cinco objetos pequeños).
varios grados y, por tanto, debe contener algunos reactivos lo suficientemente
fáciles para los alumnos más lentos en los grados más bajos y algunos reacti- "zQué es esto?", (silla, coche, etc.).
vos lo suficientemente difíciles para los alumnos más destacados de los grados Cinco de cinco para obtener crédito.
más altos. '
Las pruebas para los niños en los niveles primarios normalmente requie- 4. Vocabulario de dibujos (18 tarjetas con dibujos de objetos comunes).
ren respuestas que deben marcarse en los protocolos de prueba. En los grados
elementales superiores suelen usarse hojas de respuesta separadas, aunque II¡Qué es esto~, ¡cómo se llama~"
también se emplean en gran extensión los protocolos de prueba que se consu- Ocho de 18 para obtener crédito.·
men al ser contestados. La mayoría de las pruebas para los grupos más grandes
de niños mayores requieren hojas de respuesta separadas. Se han desarrollado • Calificado también en uno o más niveles.

~;.i; " " ;


. '. . . ,.:, ..:
, ', '.' i \1:, '.".. . ' . . :'.' : . , ",. '; " ." ;" :. : ~', ' r ...: ';H ,' ; 1<: ~ j; ';\.~~: :'~~" '.~: .;,! ' ':-'. :..~c <.~""';'~ F ..... .. " .., .....' , . .. . " ,. .
296 CAP. 9. APTITUD ESCOLAR PRUEBAS GRUPALES DE FUNCIONAMIENTO 297
5. Repetición de dos dígitos. , , Absurdos verbales (cinco enunciados).

"Escucha, di 2¡ ahora di 4, 7", etc. "Los pies de BiII Jones son tan grandes que tiene que jalarse los pantalones por arri-
Uno de tres para obtener crédito. ba de la cabeza. ¿Qué te parece tonto de esto?"
Cuatro correctas de cinco para obtener crédito.
6. Obedecer órdenes simples (cuatro objetos comunes en la mesa).
"Dame el perro."
,3. Absurdos de dibuios.
"Pon el botón en la caja. 11 Dibujo que muestra la sombra de una persona que va en la dirección equivocada.
Dos de tres para obtener crédito. "¿Qué te parece tonto en este dibujo?"
Nivel de 6 años
" 4. Repetición de cinco dígitos al revés.
1. Vocabulario (lista graduada de 45 palabras).
"Voy a decirte algunos números, y quiero que me los digas al revés."
"Cuando yo diga una palabra, tú me dices lo que significa. ¿Qué es u.na naranja?" Uno de tres para obtener crédito.
etcétera.
Seis palabras para obtener crédito. Palabras como tap (tapón) y gown (bata).' 5. Palabras abstractas.
2. Diferencias. '¿Qué quiere decir piedad?"
Tres de cuatro para obtener crédito.
"¿Cuál es la diferencia entre un pájaro y un perro?, ¿entre madera y vidrio?"
Dos correctas de tres para obtener crédito. ' 6. Completar enunciados (cuatro enunciados con palabras faltantes).
3. Dibujos mutilados (cinco tarjetas de objetos con una patte faltante). "Escribe la pal~bra que falta en cada línea. Pon sólo una palabra en cada es-
pacio." '
"¿Qué falta en este dibujo?, o ¿qué parte no está?" Tres de cuatro para obtener crédito.
Cuatro de cinco para obtener crédito.

4. Concepto de números (12 cubos de 2.5 cm cada uno). Nivel superior 11. Adultos

"Dame tres cubos. Ponlos aquí." l. Vocabulario (el mismo que para el nivel de seis años)
Cuatro de cinco números diferentes correctos.
26 palabras para obtener crédito.
5. Analogías de oposición. Palabras como mosaic (mosaico) y flaunt (ostentoso) .
"Una mesa está hecha de madera; una ventana de ____ " 2. Encontrar razones (dos partes).
Tres de cuatro correctas para obtener crédito.
"Dé tres razones para que el hombre que comete un delito grave deba ser casti-
6. Laberintos (con el comienzo y el final marcados). gado."
Ambas partes correctas para obtener crédito.
"El niñito quiere ir a la escuela por el camino más corto sin salirse de la banqueta.
Enséñame cuál es el camino más corto."
Dos correctas de tres para obtener crédito. 3. Proverbios (dar margaritas a los asnos, etc.).

Nivel de 12 años •Aquí hay un proverbio y se supone que usted debe decir lo que significa."
Uno de dos correctos para obtener crédito.
1. Vacabulario (el mismo que para el de seis años).
, 4. Ingenio.
Quince palabras correctas para obtener crédito. Palabras como tuggler (malabaris-
ta) y brunette (morena). "Tiene usted una lata de 2 1/2 litros y otra lata de 1 112 litros para obtener exacta-
mente un litro de agua."
• Calificado también en uno o más niveles . Tres de tres problemas correctos para obtener crédito .

.,r i '
·1
298 CAP. 9. APTITUD ESCOLAR
PRUEBAS GRUPALES DE FUNCIONAMIENTO 299
5. Diferencias e~enciales.
e~ CI. LdOS C1I parda I~ revisión actua~ de la prueba de Stanford-Binet son
¡Cuál es la diferencia principal entre juego y trabajo!·
11 k:..ña,cicmt:s e C .i e~, eCIr" son puntuaCIOnes estándar para las que la media
Tres correctas de treS para obtener crédito. 100 y la deSVIaCI?n estandar es de 16 para cada nivel de edad. Hasta don-
los grupo~ nonnatIvos sean adecuados y comparables de una edad a t
6. Repetición de un pensamiento de un pasa;e. el tiene s~mpre el mismo significado en una edad como en otra. Las t~bí:~
convertlr EM a CI ~e ~r~veen desd~ la edad ~e 2 años cero meses (2-0)
Párrafos cortos acerca de los valores de la vida. la de 18-O· Para losl ~n?lVldduos de mas de 18 anos de edad, la tabla empie-
Cuatro de siete ideas esenciales deben ser reproducidas para obtener crédito. con una ed ad crono ogIca e 18 años.

Los ejemplos anteriores muestran la variedad del material incluido en


prueba. Nótese que algunas pruebas específicas varian de un nivel al otro >- LAS ESCALAS WECHSLER DE INTELIGENCIA
que muchas de las pruebas en los niveles más bajos son bastante concretas y
refieren a objetos pequeños y a dibujos. En los niveles superiores las
suelen ser más abstractas y verbales. Las pruebas variadas incluyen :'; .•..•.• La segunda se~e pr~ncip~ de pruebas de habilidad individual son las Esca-
requieren el despliegue de aprendizajes pasados, percepciones de · las Wechsler d~ mtelIgenc~a. Wechs~~r trabajó inicialmente para elaborar
juicio, interpretación, atención sostenida, memoria inmediata y otros una escala destmada a medIr las habIlIdades cognoscitivas en los adultos
sos cognoscitivos; sin embargo, el interés está enfocado en la parte mientras que las e~calas de Binet se habían diseñado y eran apropiadas para lo~
común de las habilidades cognoscitivas que se desplaza a lo largo niños. Para seleccIOnar el conten~do ~e las ~echsler Adult Intelligence Sca-
tareas, las cuales se combinan para dar un índice total y único de la HdU11Iluaa les (WAI S) -~~calas W ~chsler de mtehgenc~a para adultos- (Wechsler, 1 955 ),
mental. . sepuso atenclOn e~pecIal~ente en lo apropIado que pudieran ser para aplicar-
Las tareas se seleccionaron de manera que fueran de una las.a adultos. Al illlS~O ~Iempo, la prueba se organizaba en el fonnato de una
apropiada para el niño promedio en el nivel de edad al que se le ~~e de subp:uebas dIstmtas,. cada una de las cuales empezaba con reactivos
Cuando se pone a prueba a un niño, el investigador empieza con el f~ciles y contmuaba con reactIvos cada vez más difíciles de la misma clase. Los
que es probable que el niño tenga éxito. Si el niño fracasa y da muestras de ~tulos de las subprueb.as se dan a c~n.tinuación¡ en cada caso la subprueba está
desaliento, el evaluador puede recurrir a un nivel más bajo, más fácil¡ pero . ilust~ada I;>0r un !eactIvo d~ u?a dIficultad promedio aproximadamente (los
si no es así, podría continuar presentando los reactivos que siguen, .• .rea~tI~os Il~stratIvos son SImIlares a los de la prueba, pero en realidad no
tras nivel, hasta que alcanza el nivel al que el niño fracasa en la prueba. >c. estan mclUIdos en ella).
Cuando ya se estableció este límite superior, el examinador tiene que '.
gurarse de reconsiderar su enfoque y establecer el I)ivel en que el niño . Subescala verbal
hacer todas las pruebas. Al final suelen darse unos pocos reactivos táciles.; II.
para no perjudicar la moral del niñ.o. l. Información general
Se acredita al niño con una edad basal, que es la del nivel en que pasa
las pruebas, más un crédito por las pruebas pasadas en niveles más altos. . ¡Qué día del año se celebra la Independencia?
prueba pasada en un nivel dado acredita al niño con el mismo número
meses de edad mental. Así, cuando hay seis pruebas en cada año de . Z. Similitudes
de edad, pasar una prueba más proporciona un crédito de dos meses de
mental. Por ejemplo, el niño A ¡En qué forma son similares la lana y el algodón?

Pasó todas las pruebas en el nivel de seis años = 6 años de edad basal 3. Razonamiento aritmético
Pasó tres de seis pruebas del nivel de 7 años = 6 meses de crédito
Pasó una de seis pruebas del nivel de 8 años = 2 meses de crédito Si una docena de huevos cuesta S2S0, ¡cuánto cuesta un huevo?
Fracasó todas las pruebas del nivel de 9 años = O crédito
Resultado de edad mental 6 años, 8 meses . 4. Vocabulario

El nivel de aprovechamiento es expresado como edad mental, al UUl~st:llC;-, Diga el significado de "corrupto".
.-:
ga como se indica en el párrafo anterior. La edad mental describe el nivel
que se desempeña un niño, sin tomar en cuenta la edad cronológica del niño.. 5. Comprensión
El desempeño en relación con el grupo de niños de su misma edad se expresa .
¡Por qué compran las personas un seguro contra incendios?

.... .
...... . ........ ."
.,.,~ .:
'. ;:'~ . ,;. "" ':;.~: : ;.:.... ,'"",' ,", . ,', . ',;':," , . ., ": ', , .,:. "".
300 CAP. 9. APTITUD ESCOLAR PRUEBAS GRUPALES DE FUNCIONAMIENTO 301
6. Dígitos Ensambla;e de objetos (rompecabezas)
Escuche atentamente, Y cuando yo termine repita los números que dije. Si se pone~ e.stas piezas de manera correcta, algo aparecerá. Acomódelas en su
lugar tan rapIdo como pueda.
7 3 4 r 8 6

Ahora mencionaré unos números, pero quiero que los repita al revés.

3 8 4 6

Subescala de desempeño

7. Completación de figuras
Le vaya mostrar un dibujo al que le falta una parte importante. Dígame qué
falta.

1968
o l M M J V s
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 2 .1 22 23 24 25 26
27 28 29 30 31

8. Ordenamiento de figuras (secuencias)


Las figuras que aparecen a continuación corresponden a una historieta. LO'lOaue· ·.... ~..
las en el orden correcto.

c., ",
-. ; "',

... 11. Sustitución de dígitos por símbolos

9. Diseño con cubos

Use cuatro cubos para hacer un diseño igual al siguiente.


Prueba
302 CAP. 9. APTITUD ESCOLAR
PRUEBAS QUE NO DEPENDEN DEL LENGUAJE 303
Cada subprueba de la WAIS proporciona una calificación separada ~;~it:frllca:;os, lo cual se considera emocionalmente perturbador para algunos
después se convierte en una puntuación estándar para esa subprueba. , tens.os. Los CI verbal y de desempeño separados de la
puntuaciones estándar de la subprueba se combinan en tres up:lmI·e:ntIIU:-j podnan ser muy valIosos en algunos casos para entender a los niños
diferentes para que se den las puntuaciones totales, de las desarrol~o verbal es muy acelerado o muy retrasado, y pueden tener
leer tres diferentes tipos de CI de las tablas de normas, que son: al CI :""'~VaJ'L" diagnóstico para al~nos niños con inhabilidades educativas. sin embar-
de las subpruebas de la uno a la seis; bl CI de d~sempeño en las subpruebas . prueba Binet e.s un l1~stru~ento de medición más confiable (aunque no
la siete a la 11, ycl CI total de todas las subpruebas. Los CI verbal y de desem_ ' d~tos co~parat~vos dlspo~bles). ~a base última para escoger la prueba
peño separados pueden tener significado diagnóstico en el caso de ciertos' W';2ÓJ~OpIIa(la sera la valIdez de las InferenCiaS que se puedan hacer de cada situa-
individuos con impedimentos verbales, académicos o culturales. Los CI de las la que se usen las pruebas. La predicción para el éxito académico puede
WAIS son también puntuaciones estándar, pero éstos tiene~ una media de ' aparentemente ~gual de bien de cualquiera de las dos pruebas y parece
100 Y una desviación estándar de 15 en la muestra normatIva. ~·"'·",·i'lO:SlDJlC que ambas sean Igualmente valiosas para los niños con edades menta-
Como lo hemos indicado, la escala Wechsler de inteligencia original fue '.
diseñada para adultos, no obstante también es adecuada pa~a usarse con ado-
°
de siete más años.
lescentes y adultos de todas las edades; sin ~mbargo, postenorm~nte el mate-o
rial se amplió a fin de hacer pruebas para mños. Se ha usado el mismo patrón . '- PRUEBAS INDIVIDUALES ABREVIADAS
general de subpruebas, aunque las tareas cambien un poco a medida que se _
desciende a los niveles de edad más pequeños. De hecho, cabría preguntar si ' Un problema p~incipal al usar prue~as individuales de inteligencia es que
el paralelismo entre la naturaleza de las subpruebas para los niños de 4 años y . consumen mucho tIempo de los examInados. Esto ha hecho que se diseñen
para los adultos es real o sólo superficial, Los dos niveles de las pruebas dispo- adaptaciones abreviadas de la Binet o de la Wechsler, así como otras pruebas
nibles para niños son la conocida como Wechsler Intelligence Scale for Chil- más simples o más cortas. Las versiones abreviadas de la Binet y de la Wechs-
dren (WISC) -escala Wechsler de i~teligencia para niños-, .originalmente .·lér omiten ciertas subpruebas (Doppelt, 1950) o una fracción de reactivos de
publicada en 1949, que se ha reedItado en una forma reVIsada en 1974 prueba (Mogul y Satz, 1963; Slossoll, 1963) y se correlacionan bastante bien
(Wechsler, 19741 Y que el editor recomienda que se use con chicos de seis a 16 con la prueba completa pero son menos confiables, como es de suponerse
años; y la Wechsler Preschool and Primary Scale (WPPSI) -escala W.echsler '. eri una prueba más corta.
para preescolar y primaria- (Wechsler, 1967), que se ofrece para aplIcarla a . . De todas las subpruebas en la Binet yen la Wechsler, la que muestra con-
niños de cuatro a seis años y medio. . sistentemente correlaciones más altas con las puntuaciones totales es la prue-
Las características que distinguen a la WAIS de la Stanford-Binet son: . ba de vocabulario, por lo cual varios constructores de pruebas han producido
pruebas gráficas y de vocabulario como diseños de prueba abreviados.
a) Reactivos de prueba originales específicamente diseñados para adul- La prueba de vocabulario de rango completo (Ammons y Ammons, 1948)
tos. consta de una serie de 16 láminas con cuatro dibujos cada una. Se dice una
b) Organización por subpruebas, más que para niveles de edad. palabra y el examinado indica a cuál de los cuatro dibujos se refiere el exami-
el Proporciona por separado CI verbales y no verbales. nador. Las láminas se vuelven a usar con palabras de dificultad creciente, has-
ta que pueden probarse un total de 60 palabras. El mismo procedimiento
Estas características parecen ser adaptaciones sólidas en una prueba para , ge~eral se sigue en la prueba Peabody de vocabulario y dibufos (Dunn, 1959),
adultos. Probablemente, la mayoría de los psicómetras estarían de acuerdo' excepto que se usa un conjunto de dibujos diferente para cada palabra evalua-
en preferir la WAIS como medida para los adolescentes'y adultos, aunque su • da. ASÍ, los materiales requeridos se mantienen muy simples y se puede obte-
relación con el éxito académico tal vez no se ha estableCIdo claramente como . n.er una estimación rápida de la habilidad evaluada. Por supuesto, la puntua-
la de la Stanford-Binet. (De hecho, en estas edades, una prueba grupal Clón. depen~e del tipo de habilidad verbal limitada, pero el procedimiento. 'f

impresa normalmente se consideraría más apropiada para la predicción aca- . funCIOna eficazmente dentro de sus limitaciones. 11
1:
démica.) , ;~
Con la adición de la WISC y la WPPSI la serie Wechsler ahora puede usar-
se con niños tan pequeños como de cuatro años de edad. La WPPSI es relativa- . .. PRUEBAS QUE NO DEPENDEN DEL
mente nueva y la evidencia acerca de su validez es muy limitada. Por tanto, ,. .' LENGUAJE O DE LA CULTURA
para niños hasta de seis a siete años de edad se debe considerar la Stanfor~. .'
Binet como el instrumento estándar. Para chicos de siete a 15 años, la decl- . '.' . . . 'La mayoría de las pruebas de habilidad cognoscitiva generalmente usa-
sión entre cuál de las dos pruebas us'a r no es fácil; la Stanford-Binet es algo . das ~ep~nden, hasta cierto grado, del lenguaje e incluyen tareas presentadas
más difícil y consume más tiempo administrarla, además de que con ella ~l ... en.termInos verbales; también presuponen un conocimiento previo de los
individuo examinado llega a un punto en el que ha acumulado una larga sene objetos y las actividades de una cultura particular. Probablemente es eficaz

,:>", ' ' ..: o:: '


.'
'; \'.' ; ' ,', "
.
' ," " " . .. '
304 CAP. 9. APTITUD ESCOLAR
305
evaluar el funcionamiento cognoscitivo de la mayoría de las personas
tro de una cultura común de esta manera, porque, hasta un grado ,"VJU¡)',ut:ra_
ble, nuestro funcionamiento mental se realiza por medio del lenguaje
involucra el mundo con el que estamos familiarizados; sin embargo, para
algunos grupos o para algunas situaciones esto no es así. El ejemplo más "
obvio es el de aquellos grupos que no hablan un lenguaje común o lo hablan
sólo ligeramente. Cuando un individuo tiene poca fluidez al hablar el inglés :,
los resultados de una prueba verbal dada en inglés son, en gran medida, ",
significativos. Un caso menos obvio, pero igualmente importante, es el indi- "
viduo cuyos antecedentes culturales son diferentes de aquellos representa_
dos en la prueba (por ejemplo, una persona que nunca ha poseído nada para
lo que pudiera haber comprado un seguro contra incendios). Para estos gru-'
pos de individuos, los constructores de pruebas han intentado producir
pruebas que abarquen estas funciones cognoscitivas importantes, sin depen-
der del lenguaje o de un antecedente cultural específico. '
Ya se ha hecho referencia a la escala no verbal de las pruebas de habilida-
des cognoscitivas y al CI de desempeño de las serie de Wechsler. Éstas son no
verbales en el sentido de que el lenguaje se usa sólo para dar las instrucciones,
las cuales se pueden traducir a cualquier otro idioma para el examinado. Tam-
bién se pueden mencionar otras dos pruebas que se han utilizado ampliamen-
te en estudios transculturales como medidas de madurez cognoscitiva: la
prueba de matrices progresivas (Rave, 1956) y la prueba de dibujo dela figura '
humana (Harris, i963) .
La primera prueba presenta tareas de la forma que se muestra en la figura
9.5. Cada serie bidimensional de figuras estímulo se presenta en una celdilla ,
(en este caso la inferior derecha) vacía. Entre las opciones que se le dan, el
examinado debe escoger la que seria adecuada para la celdilla vacía¡ asimis-
mo, debe percibir la relación de las figuras sucesivas en cada dimensión e ,
identificar su opción que sería la adecuada para ambas (o múltiplesf re1acio· "
nes. El reactivo más sencillo incluye patrones y color y es una tarea relativa- '
mente sencilla de apareamiento perceptual. El reactivo difícil incluye rela· '
ciones abstractas de forma, direccionalidad y cambio de números de '
maneras complejas.
Las matrices progresivas se originaron y desarrollaron en Inglaterra, y
mucha de la investigación al respecto se ha realizado en países africanos,
peos y asiáticos. Así, hay poca evidencia de cómo se correlaciona esta
con las pruebas empleadas en Estados Unidos O cuál es su validez
dicción del éxito escolar, del desempeño en el trabajo o de otros
vida en los encuadres estadounidenses. Su aparente libertad de usar el bl
"
je y su independencia, aunque limitada, de las variables culturales la ha ,' , ~urQ 9.5. Aeoctivo~ de matrices.
un instrumento muy popular para utilizarla en países en desarrollo o con
pos de culturas diversas.
,::&~s;~~~ción y l~ d-bd';1rez que s,! ejecuc~ón implica. se pueden obtener
:detalle de r: por 1 14u, JO de los.~Jos: 1) ?Jos pre~entes, 2) cejas o pestañas, 3)
La prueba de dibufo de la figura humana es tal vez la más simple en ASÍ,
to al procedimiento. Se pide a un niño que dibuje primero un hombre y
una mujer; las instrucciones son: flHaz el dibujo de un hombre lo mejor , ¡,,,íiiirada. pUpl a, proporclOn vertlcal-horIzontal y S) dirección de la
puedas¡ toma el tiempo necesario y trabaja cuidadosamente ... Asegúrate
,dos 3~~0 se;:só ~n una larga investigación con niños y adolescentes en Esta-
dibujar al hombre completo, y no sólo la cabeza y los hombros". Existe
esquema de calificación para proporcionar los puntos por lo completo de la ' entre do o;t ~r~s, 197d4)~ esta prueba arrojó correlaciones promedio de 0.84
s 1 UJos. uno e una persona" y el otro de 11 sí mismo fl, y este valor
306 CAP. 9. APTITUD ESCOLAR
PRUEBAS PARA PREESCOLARES
307
puede considerarse como un estimador de la confiabilidad de formas altemas. en la conducta que muestra. Una revaloración desp , d
Las correlaciones promedio para los niños en un grupo de edad con una '. . 1'- , . ues euncorto
revela SI e mno esta consIstentemente bien en su ni 1 d d
versión abreviada de la WISC fueron cercanos a 0.45. Estimamos que las S.i ya ha avanzado en una evaluación tenderá a avanzar eVnel e esdempe-
d' , ao t ra entro
correlaciones con la versión completa de la WISC hubieran sido de 0.50 o
más altas. Es interesante señalar que para esta prueba la diferencia entre los .'
°
Unos pocdos dIas semanafs: Lbo s dPat~on~s. del desarrollo proporcionan una
mo era amente con la l e el mdIvIduo en un punto particular del
niños blancos y negros en Estados Unidos fueron sólo de una tercera parte Las escalas d.e desarrollo abarcan un rango de edad desde los dos hasta
de la diferencia que se encontró para la WISC abreviada. En la medida en meses y han SIdo ensambladas subsecuentemente por Cattell (1960)
que el dibujo es una expresión de la madurez intelectual, presenta una ima. ¡ '. . 11969). y
gen mucho más favorable de la habilidad de los niños negros que cuando se ... •••.. . . ~. ¿Qu~ significado ti~ne ~cele~ar o ~etardar ~l desarrollo durante el primer
usan pruebas verbales más convencionales y tareas más abstractas. .•• ano de VIda para p.redecIr la Inte!lgencla postenor? La respuesta para los niños
La validez de las pruebas no verbales y de las pruebas diseñadas para . ~¡j~ales en ambIentes .hogarenos r:o~ales se muestra en la tabla 9.1, que
depender lo menos posible de una cultura específica, no ha sido total y deta- ;.AontIene, para un estudIO bastante tIpICO, las correlaciones de las pruebas de
lladamente explorada. Para predecir el éxito escolar del niño estadounidense . ínfan!es, dadas a las ed~des de uno a 12 mese.s, con las pruebas de inteligencia
normal, estas pruebas son menos eficaces que las pruebas verbales mucho · ·. ·.. a vanas, edades l?ostenores. Para aqu~llos mfantes normales, sin ninguna
más utilizadas; su validez para otros criterios que no sean los escolares toda- .' . patologIa en partIcular, las pruebas de mfantes proporcionan una predicción
vía debe determinarse en su mayoría; su valor parece radicar primordial- ·· bastante buena de s~ estatus de de~a~rol1o unos cua~tos meses después, pero
mente en el uso con niños, individuos o grupos atípicos. Un niño que es un '. · ~u valor como predIctores decae ra~Idamente a medIda que se incrementa el
lector deficiente a menudo se desempeña muy mal en las pruebas verbales de . mte~a~o temporal. Las p~ebas de mfantes esencialmente no proporcionan
aptitud y su calificación en las pruebas no verbales puede proporcionar una .. :predicclOnes de esta tus de Inteligencia a la edad escolar.
pista dd si sus incapacidades son exclusivamente verbales o si hay déficit cog-
noscitivo más general. Para grupos con lenguajes y, tal vez, culturas distin- . .... Tabla 9.1. (orr~Iación de !os pruebas de inteligencia durante el primer año de vida (on
tas, las pruebas no verbales sobrepasan la barrera del lenguaje y, quizá, la
diferencia cultural. ". medidos postenores.* (Correlaciones basados en los dotas sacados de pruebas
. sucesivos)
Edad en la prueba inicial
PRUEBAS PARA PREESCOLARES E INFANTES ". '. Edad en la
1, 2, 3 Meses 4, 5, 6 Meses 1, 8, 9 Meses 10,11, 12 Meses
Las primeras pruebas de inteligencia fueron hechas para niños en edad
escolar; sin embargo, no pasó mucho tiempo antes de que los psicólogos espe- . (5, 6 meses 0.57
cializados en el estudio del niño y las necesidades prácticas del cuidado de los 7;8, 9 meses 0.42 0.72
niños, así como las agencias de colocación, estimularan los intentos por dise- 10, 11, 12 meses 0.28 0.52 0.81
ñar procedimientos para apreciar las habilidades cognoscitivas de los niños Ij, 14, 15 meses 0.10 0.50 0.67 0.81
preescolares e inclusive de los infantes (bebés). Obviamente, cualquier apre-
ciación con infantes o niños pequeños debía tener un procedimiento indivi- , 18, 21, 24 meses - 0,04 0.23 0.39 0.60
dual para su admi.n istración y estar basada más en la conducta mostrada de . 27; 30, 36 meses - 0.09 0.10 0.22
..• 4~, 48, 54 meses 0.45
manera espontánea o que pudiera provocarse de los niños en estudio. Por tan· - 0.21 - 0.16 0.02 0.27
to, las pruebas con infantes deben tener un carácter muy diferente de las apre-
ciaciones posteriores. Amold Gesell (1940) fue el primero en diseñar pruebas - 0.13 - 0.07 0.02 0.20
basadas en la observación postural, perceptual, manipulativa y de ..' - 0.03 - 0.06 0.07 0.19
tas sociales del niño. ¿Ya se sienta el niño?, ise para?, icamina?,ivoltea a verla 0.02 - 0.08 0.16 0.30
luz?, ¿advierte una cara?; ¿puede sostener un cubo?, ¿una cuchara?, ¿una pelo- - 0.01 - 0.04 0.01 0.23
tita?, iPor medio de qué tipo de movimientos?; ¿cómo reacciona a los '. 0.05 - 0.01 0.20 0.4J
extraños?, i a otro bebé? . ,.
Las observaciones de un gran número de infantes mostraron que eXlsua . '. 'oc: ' ~~ pruebas. empleados fueron: 1 a 15 meses, escala mental de [ali'omia poro el primer año; 18 meses o 5 años escala ~ ~
un desarrollo típico secuencial en los diferentes aspectos del desarrollo . :'. ,.,l!'ISI.O e [a!ifotnlo; 6 afios y más, Stan/ord·Binet (Boyley, 1949). ' f
niño. El desempeño B seguía del A y el e seguía del B. Se establecieron nonnas.
para representar la edad promedio a la que debía manifestarse una cond':lcta . '~e Sin embargo ~ c~ando hay algun~ cIase. de neuropatología, la situación
en particular. El niño puede ser asignado a un desarrollo de edad partlCU- P de ser muy dIstmta. En un estudIO longItudinal de infantes realizado en

\·v . . ... .. .

. ....: .. :. " .' ..: ,: ~~._.: ' ; .'-' .~ .. ,


308 CAP. 9. APTITUD ESCOLAR
PRUEBAS PARA PREESCOLARES 309
un hospital normalmente por causa de alguna patología del sistema npr"'~ft_ .•.• La escala preescolar de Minnesota (Goodenough y colabo d 1940
central (Kn~block y Passamanick, 1967), la correlación entre el COI~Tl(:lelne·.' otro ejemplo de prueba diseñada para los grupos preescolare~a Lore;6 )
de desarrollo Cesell en una edad entre las 16 y las 52 semanas y . de esta escala son más parecidas a las de Binet Seis prueb' as Jrue¡
Stanford-Binet para el CI a los seis ya los 10 años de edad fue de 0.70. de una forma de esta escala se describen bre~emente a caos tt~ma ~~ a
obstante la muestra de 135 casOs incluía 40 que, según se consideró, . ' . n muaClOn.
algu'n tip'o de condición patológica yun CI promedio de 55. Por tanto, Prueba 2: Señalar ob;etos en dibu;os. Esta prueba consta de una 1" 1
que los patrones para la observación sistemática de l os In . f antes . de un hombre, una SI'11 a, una manzana, una casa y una flor. Se pidamIna
1 ._con as
1 'f'lcaran
valor para identificar niños que más tard e se caSI , ~~mo mC!nIa1rnelllte l~ cada una a su tumo. e a mno que
deficientes, pero no tienen ningún valor en el extremo pOSItIVO para prever los ' ." ~rueba 5: ~ib,!~o dr ix::itación.. f:l experimentador hace una línea venical y des-
grados del talento intelectual. , . ._ .' .•pues a cruza. e PI e a mno que ImIte cada trazo a su tumo
Se han realizado múltiples pruebas para aphcarlas a mnos IJH"")I_Ul'dlt;:>. Prueba~: lmitaci~'m. Se Prop?rciona~ 4 cubo~, e.n los cuales'el experimentador da
-
decir, en una edad que tienen un rango d e 1 8 meses hasta 5 anos. De una secuenCIa
b determmada.
1 Se pIde al mno que mute la secuenCI·a.
como ya lo hemos visto, la escala de inteligencia Stanford-Binet --,....'...u<,,,.
pruebas para niños tan pequeños como de dos años de edad y pueden ~~,u .."u"_.,,, 3ZU , rosa,
l4:
1Prue ab eo orf~' ~sta .~ru~ba. consta de tarjetas de colores diferentes: rojo
anco y ca e. e PI e a mño que nombre los colores. '
rarse como pruebas para niños preescolares. Estas pruebas se compararían . Prueba ~O: Pape! _doblado. E! examinador dobla un papel con tres dobleces conse-
cutIvos. Se pIde al nmo que copIe exactamente lo que hace el examinador.
manera muy favorable con las otras pruebas disponibles para estos . '.' '. ~rueba 24: Dar las palabras opuestas. Se pide al niño que nombre los antónimos
de edad, aunque son más verbales que muchas otras. La mayoría de las : 4e fno, malo, grueso, seco, Oscuro y enfermo.
bas para niños preescolares tienden a alejarse del material verbal que !ln!lTP'I''' ;
abrumadoramente en las pruebas de grupo-para niños mayores y "UUUJ',-u . Los materiales ~e prueba son bastante simples. El copiado, la imitación y
la Stanford-Binet. . la respuesta a relaCIOnes verbales simples forman parte de varias pru b
Una prueba para niños preescolares que ha tenido mucho uso es la Esta. escala parece ser un poco más confiable que la Merrill-Palmer~ t:~
Merrill-P almer (Stutsman, 19311, que es la más adecuada para los niños . c?rrelac~ones entre dos forma.s_de esta prueba administradas con pocos días de
los dos y los cuatro años, aunque puede aplicarse a niños ligeramente Tn<"'",rPO''''li¡¡¡¡¡' '. 'ldJf~rencla fueb~e 0.89 'IPar~ nmos menores de tres años, esta prueba no corre-
y menores. La prueba consta de 38 subpruebas pequeñas, de las cuales aCIOna muy len ~on a Bmet~ pero las pruebas Minnesota dadas a los niños
cuatro requieren respuestas verbales del niño. Buena parte de las tareas de tres a cuatro ~nos proporCIOnan una correlación con las Binet a la edad
requieren una coordinación motora gruesa (como pararse en un piel o escolar ded~·60¡ ~l? embarg~, los el de la escala preescolar de Minnesota tie-
coordinación visomanual más fina (como construir torres de cubos o ;¡nen una IsperSIOn muy dIferente d~ aquellas de Binet, por lo que un el
tar con tijeras). La percepción de formas y objetos y el control motor se p~eescolar e~ esta prueba no se puede Igualar automáticamente al desempeño
nan en varios tableros con formas en las que deben aparearse los recones . Bmet postenor (qo<:denough y Maurer, 1942).
los agujeros apropiados. En la aplicación de las pruebas se usa una variedad .. ' U?a prueba dlsenada para los niños preescolares que tiene posibilidades
materiales interesantes para el niño, como cubos, dibujos, tijeras, muy mteresantes es la escala McCarthy de habilidades de los niños
etc., de manera que normalmente se obtiene cooperación, lo cual es un (Mceart~y, 19721:, Esta prueba proporciona no sólo un índice cognoscitivo
blema con niños de estas edades. general, smo t~m~Ien puntuaciones separadas para los desarrollos verbal per-
La escala Merrill-Palmer ha sido satisfactoriamente ceptual! cuantItativo, de memoria y motor. Las puntuaciones que repres~ntan
todo después de los 30 meses de aplicación. Las correlaciones con estos dIversos aspectos del desarrollo se traslapan y muestran correlaciones
nes seis me_ses después han sido reportadas (Ebert y Simmons, 1943) unas co? otras¡ pero tambi~~ tienen algunas partes distintivas,
sigue para los diferentes grupos de edades: qt;e mIden con ?astante utIlIdad los aspectos distinguibles de la
:.' maUlIre:z. ASI, en un est~dlO (Kaufman, 19731 de un pequeño grupo en el
Edad Correlación .las correlac~o?es con la lectura posterior y las puntuaciones de
;.i}: aprmre(:h~lmjeIlto matematIco fueron como sigue:
24 meses 0.63
30 meses 0.76
36 meses 0.78 Desarrollo lectura Matemáticos
42 meses 0.80 773 Verbal 0.20 0.27
774 Perceptual 0.49
775 0.48
La correlación con la prueba Binet para la edad escolar es de cerca de Cuantitativo 0.42
para la prueba Merill-Palmer a la edad de dos años, y aproximadamente 776 De memoria
0.57 ..
:
0.33 0.55
0.45 o 0.50 para la edad de cuatro años. 777 Motor 0.05 0.07
31 0 CAP. 9. APTITUD ESCOLAR PRUEBAS GRUPALES VERSUS•.. 311
El tamaño tan pequeño del grupo IN = 31) indica que estos la prueba ~etropolít~na de ~provechamiento al final del cuarto grado.
no pueden tomarse con mucha seriedad, pero sugieren que las pruebas de mtelIgencIa se aplIcaron durante el quinto grado a 18 alumnos
prueba pueden diferir en su validez como predictores del logro acaloel:nicl cada grupo de lectura. Los CI de las pruebas son como sigue:
La prueba es demasiado nueva y los resultados publicados de su
siado limitados para'permitir una conclusión acerca del valor de sus
puntuaciones. Seguramente será atractiva para el administrador de lorge·Thorndike WISC WISC WISC
bas orientado hacia la clínica, que considera los patrones de logros y verbal verbal desempeño total
ciencias como pistas importantes para comprender al niño.
Ledores buenos 113 110 106 109
.' ledores mediocres 95 96 96 96
PRUEBAS GRUJl ALES VERSUS PRUEBAS 'lectores deficientes 82 89 94 90
INDIVIDUALES COMO MEDIDAS
DE INTELIGENCIA
Ya hemos visto que las pruebas de inteligencia se ubican en dos •... La prueba del grupo.':erbal t~ene mucha más relación con la prueba de lec-
principales: las pruebas grupales y las individuales. Los tipos de tareas tura que con la puntuaclOn parcIal o total en la prueba individual. La diferen-
tados al examinado se parecen bastante en ambos patrones¡ sin embargo, . '.' <, cia entre los lectores buenos y los deficientes es de 31 puntos de CI para la
dos procedimientos tienen ciertas diferencias significativas que se resumen . prueba grupal y de 12 a 21 para la prueba individual.
continuación. Los resultados que se muestran en líneas anteriores son probablemente
algo .extre!ll0sos, porque la.habilidad para leer estaba definida por una prueba
Pruebas grupales Pruebas individuales que mclma la lectura relaclOnada y el conocimiento de palabras mismo que
también está medido directamente por la prueba de Lorge- Tho~ndike. Más
Los problemas son presentados en Los problemas son presentados aún" e~ estudio se realizó cO,n niños de escuela elemental, para los cuales la
un protocolo impreso, leído por el oralmente por el examinador en una mecamca d~ la lect~ra todavIa presenta algunos problemas. Se hubiera encon-
examinado. El contacto con el situación cara a cara trado una dIferenCIa menor para los estudiantes de secundaria o de universi-
examinador es un requisito mínimo
dad. Algunas pruebas grup~les que se usan en la actualidad son parcialmente
Tareas normalmente presentadas Problemas presentados en forma verbale~.o no en su contemdo y.resultarían relativamente independientes de
con un tiempo de prueba como unidad, individual, normalmente sin . .las habilIdades para la lectura¡ SIn embargo, este estudio señala con claridad
o tiempos límites separados para cada de tiempos límite 9ue hay que te~er precaución con e~ desempeño en las pruebas grupales y que
subprueba estas deben ser Interp~etadas con CUIdado para una persona que se aleje marca-
El individuo normalmente El individuo normalmente , da~ente del proinedlO en sus habilidades para la lectura. Una puntuación
responde por medio de la selección de responde de manera libre, dando bala de prueba g~upal par~ un lector deficiente no se puede tomar como un
una serie limitada de opciones de cualquier respuesta que le parezca val~r, absoluto, smo que SIempre deberá verificarse por medio de la adminis-
respuesta impresas en el protocolo de apropiada traclOn de una prueba que no requiere de lectura.
la prueba L~ presentaci~? de los proble~as ~~ fo~ma individual en el tiempo por un
exammador tambIen es un factor sIgmftcatlvo para determinar los resultados
Estas diferencias en procedimiento tienen implicaciones ·Tn,r".. ,ct ..,tP< . ~e la prueba. Sobre todo con los niños pequeños, mantener una atención con-
para realizar la evaluación y para los resultados que se obtienen .• tmua y el esf~e~zo para que terminen una prueba grupal puede ser un proble-
mo. En primer lugar, cuando las tareas de prueba se presentan de . ma, y las vanaClOnes en ~ste aspecto son significativas sobre la puntuación de
oral al sujeto y éste no tiene que leerlas él mismo, su desempeño es , ~rueba. Cuando el exammador presenta por separado cada problema se faci-
menos dependiente de su habilidad para la lectura. El niño que se o lIta restablecer ~a orientaci~n del niño a la tarea y puede ayudarlo a m'antener

sado en adquirir esta habilidad no recibe ninguna sanción por este su esfuerzo .. Es I~ualmente Importante que el examinador pueda observar los
específico. lapsos en el mteres y el esfuerzo y tenerlos en cuenta para interpretar los resul-
El efecto de la incapacidad de la lectura sobre el desempeño en una tados.
de inteligencia se muestra claramente en un estudio (Neville, 1965) La prueba de inteligencia individual consiste en una situación de entrevis-
el cual se comparan las puntuaciones de la prueba individual WISC ta estandarizada. Las tareas que se presentan al examinado son formuladas de
puntuaciones de prueba de la prueba verbal de Lorge-Thorndike para los manera precisa y proporcionan estándares detallados para evaluar sus res-
tores buenos, mediocres y deficientes en una clase de quinto grado. Los puestas¡ sin embargo, en la entrevista, prevalece una relación cara a cara lo
pos de lectores fueron definidos por las calificaciones de la sección de It:l.LU1·~,, ' cual ofrece al examinador atento muchas buenas oportunidades de obse~ar

;> ...

. , .• ... . ,' , \ · .. .' i ( ",: :,:...~ . :.,' ~~:, .\~ ,.,; ;!' ~ ,. , ~.... :... ;. . '.'. ,,} . ~ .. " .- .
312 CAP. 9. APTITUD ESCOLAR
CONFIABIlIDAD y ESTABILIDAD 313
al examinado y tomar nota de su motivación pobre, de su falta de atención, Los resultados son, en cada caso resumidos del m 1d 1
señales de angustia y ansiedad y de su molestia, así como de otras pistas :~~ -,,,.:;;:¡,,..~ 1a prueb a y estan' basad '
os generalmente anua e os autores
en las muestras .
ayudarán a interpretar el desempeño real en la prueba. Al mismo tiempo, El procedimiento para calcular la confiabilidad e t .r~Pdr~sedntatlvas
i . ; demandas sobre el examinador son de mucha más responsabilidad. Si ... ~~ •.._- casos, 1os ca' cu
1osIpro
d 'UCI
dos por cada procedimies ta In lca o y.' en
mos que la prueba sea válida, las tareas deben presentarse de manera estanda. . para su comparación. n o aparecen ¡un-
rizada, se debe mantener el esfuerzo y la cooperatividad, así como aplicar un "
estándar uniforme en la evaluación de las respuestas. :
También es posible que algunos examinados se sientan más a gusto y rela. 9.2. Confiabilidades representativas de los pruebas de habilidod generol
jados en e! anonimato de la prueba grupal. Una sesión de prueba individual es '
un periodo de una interacción social intensa, y e! niño o e! adulto que Pruebo Procedimiento Edad (orrelación
problemas para relacionarse con otras personas puede mostrar introversión .. ... ::_:i~-:-_~_ _ _ _ _ _ _ _ __
en el contexto altamente personal que implica la sesión de evaluación. . .·?:t~alo mental Werner y 80yley
El reactivo de respuesta libre en la prueba individual se ajusta a un encua.
,':.:~': Edición 1933·1935 División en mitades 1-15 meses
dre de entrevista de dicha prueba y refuerza sus puntos fuertes tanto Como '.:~f' 4"/~~.¡· :
. . 0.83'
limitaciones. Potencialmente, la respuesta libre de! examinado tiene que reve. . Retest, un mes 1-15 meses 0.82"
lar más acerca de él que el mero registro de cuál es la opción que ha escogido . ;'J; Edición 1958·1961 KR#20 1-15 meses
'..: General cognoscitivo de 0.90'
dentro de un conjunto de cinco opciones. En este caso se puede apreciar más División en mitades 3 años 0.94
calidad de su propia conducta disponible, qué es lo que debe hacer para definir · . Mc(artby
5 años 0.94
una palabra, ya-sea que se le ocurra por clase o por diferencia tes decir, la 7 112 años
naranja es redonda, anaranjada y una fruta cítrica) o por su uso (una naranja 0.94
Retest, un mes 3-3 112 años 0.91
sirve para comerse), así como tener en cuenta la velocidad y seguridad con
5-5 112 oños 0.89
afronta la tarea que le plantea el problema; pero también tenemos que
der del examinador para interpretar y evaluar las respuestas, y en ese momen· . 7 112-8 1/2 años 0.90
·.WPPS/ . División en mitades
to es posible que la subjetividad quede implicada en el problema de examinar.. 4 años 0.92
Se debe dar una atención muy cuidadosa a las muestras estándar que proveen ' 5 años 0.93
e! manual de prueba, y se prefiere que la experiencia se realice bajo ' -"::' 6 años 0.94
antes que el examinador pueda otorgar una puntuación acerca de Retest, 11 semanas 5 112 años 0.92
·¡}I/S(·' División en mitades
de inteligencia individual, de tal manera que rinda resultados ('()rrl1"'''''"hlp,,~ 7 112 años 0.95
: ! con los de otros examinadores. 11 112 años 0.96
En general, las limitaciones de las pruebas grupales son más agudas y 15 112 años 0.95
ventajas de las pruebas individuales son más pronunciadas con niños Retest, un mes 6 112-15 112
ños. Las pruebas grupales impresas no se pueden usar de manera exitosa .' CAT para primaria 0.95
KR#20 K
niños con una edad inferior a la edad escolar, ya que éstos no pueden 0.90
Retest, 13 meses Gr. 2
todavía y tienen dificultades para manipular un lápiz, seguir ' Ul.-'l.-J·lVU\.O 0.90
mantener una atención sostenida durante el periodo que requeriría la K-Gr. 1 0.72
ción. Estos mismos factores constituyen hasta el presente serios pro Gr. 1-2 0.80
para evaluar a los alumnos de los primeros grados; sin embargo, el factor Gr. 2-3 0.82
costos hace que las pruebas individuales sean poco prácticas para usarlas KR#20 Gr. 3 0.96
gran escala, por lo cual la abrumadora mayoría de las pruebas que más se 6 0,94
para evaluar habilidades de individuos adultos son las pruebas 9 0.94
de papel y lápiz. 3 0.93
6 0.92
CONFIABILIDAD y ESTABILIDAD 9 ,0.92
DE LAS MEDIDAS DE LAS HABILIDADES 3 0.95
COGNOSCITIVAS 6 0.93
9 0.93
En la tabla 9.2 se muestran datos que proporcionan una idea de la
bilidad de las medidas de la habilidad cognoscitiva general en edades dlt,erelli • Mediano de correlaciones poro grupos de edad particulares.
314 CAP. 9. APTITU D ESCOLAR
315
CONFIA BllIDAD y ESTABIUDAD

medi~i?n I?~ícológ~ca
e alta la consis-
Aun con las prueba s ~ara
l
n~n?~iadas
°d .- equeños es bastantte
individ ualmen de funciona_ más confiables; sin embargo, los
tencia interna d~ .las medIdas a l ~:~~s escalas Bay1ey para ~l desarro
llo " los instrum entos de
errores azaroso s en una cahfIca clOn del tIpO de un el son aÚn bastantes como
partici ón por mItade s de cero a la disper-
. miento cognOSCItIVO. El manua l ' ones de . para ser cautelo sos en S? interpr etación . En la tabla 9.3 se muestr
infanti l (Bayley, 1969) r~orta corre a~:o meses de edad. Para los niños
prees. espera r de la forma M de)a Binet, si esa forma se
sión de los el que cabna
ca de 0.90 para niñ~s de solo tr~i~i~~a or mitades cognosc itiva . ente el
para la escala hubiera dado a un grupo de alumno s que hubier an recibido exactam
d~pa h d 1abilid ades de los niños (McCan hy, ,. que la dispers ión de los el se halla sobre un
colares , las correlaCIOnes
genera l de las escalas Mc art y Et
manual para la revisió~ r~c~ent e de las mismo el con la forma L. Nótese
rango de más de 25 minuto s, y que menos de una tercera p·a rte de ios estas
casos se
1972) se reporta n cerc~ 1 de ~.94. . ra niños indica conÍlab lhdades para ..
ubica en el interva lo central de 5 puntos; además , debe recorda rse
que
escalas Wechsler de mte 1gen~~~~~io de 0.96.
. , una de las prueba s más confiab les.
cifras son para la prueba de Stanfor d-Binet
niños en edad escolar con ~n p d las pruebas anterio res provee n formas un el de 100 signific a "exacta mente 100",
Por tanto, no debe pensarse que
terminar qué tan consistentement~ Un :
Desafo rtunada mente, nIngu%!
alternativas, por lo qu_e no es po SI fd
~a diferente un día distinto , por eJem. .
sino más bien "proba blemen te entre 9S y 105, muy probab lemente .entre 90 y
lOO, y casi con seguridad entre 85 y 115".
niño podría desemp enarse en uI?-a ~ t s datos estuvie ron disponibles para!as
plo, una semana o unmesdesp~est ~e~man y Merrill , 1973) y las correlaclO. •
Tabla 9.3. Distribución esperado de lo formo M de los C/ de /0 Stanford-Binet paro
todos los
formas L y M de la Stanfo rd-Bm~ 5 ( ara los diferen tes grupos de e~a.des. Para cosos con forma L CI de 100
nes tenían un rango ?e ~.8S a O. ) ., median a fue de 0.88, mIentr as que
las edades de dos a seI~ an,?s,la co~el:c~~diana fue de 0.93.
" (f
primero .en el )a!dm de f
para las edades de seIS anos Yd: ser admini stradas
Las pruebas g~~ales pue. mbar o muestr an una conSIst encIa mterna
niños con alguna dIfIcultad; sm e. 1 ~ " el manua l para la prueba
de bobí•. 113+
razon~blemente alta aun este ~n ~llve.. 7,fhorndike Hagen y Lorge, 19681: 108-112
3
9
lidades cognoscitivas, nIvel pndmarRi I~ hl -dson de 90 para los jardines
er- c a l .
b l
de 103-107
23
r. b'l' d d de Ku
nfiabili dades de las pruebas grupa es . 98-102
reporta una contIa 1,1 a
~~a~~e es, . 30
niños. En niveles mas altos, las pruebas individ uales. Entonc 93-97
acercan, aunque no ~lc~~zan,
23
der-Richardson para las prueba s de 88-92
cálculo s para la confIab1hdad d~kKuH en y Lorge 1972) para el tercer
-.~A.'...... 9
1idades cognoscitivas (Thornd I e'd t8
94 para la prueba verbal, de 0.92
.•
87 Y menos 3
y para grados más .alt<;,s es de cerca 3 e a;a la prueba no verbal.

1
las pruebas cua!1.tItatlv~ de O'~lt~r nativas para prueba s grupale s ~on ;
Las confiab lhda?es e oIma~ ulos ara una prueba simple. ASI, .
Además de conoce r la precisi ón con que la prueba de intelige ncia aprecia
a
ente más
ciablemvel baJashque J?~ C~¿~rge thornd ike y Hagen, 1966), los .
un individuo en cuanto a sus habilid ades en un momen to dado, quisiéra mos
multini de Lorge- T orn 1 ~ 1 • ' .
su gru-
res de la median a son como SIgue. saber qué tan consist enteme nte el individuo mantie ne su posició n en ¿Qué
po de un año al siguiente o a lo largo de un period o conside rable de años.
á un
tan confiable mente podrem os predeci r la aptitud escolar que mostrar eño
en edad de estudia r en la univers idad, de su desemp
Verbal No verbal :: individuo cuando esté
la edad de dos, seis y 10 años? La evidencia en este punto se
'7 en una prueba afiguras
presenta en las 9.6 y 9.7.
0.93 0.93 En la figura 9.6 se muestr an los hallazgos de un extenso estudio en el que
Pores-nones d-Binet en
Formo alternotiva 0.90 0.84 . .. ·· se emplearon prueba s individ uales. La prueba final es la Stanfor
. · ,cada caso, mientr as que la prueba inicial es la escala preescolar de
California
t para niños de más de esa
para niños de hasta cinco años y la Stanford-Bine y
las primer as pruebas , la predicc ión es más bien pobre
edad. Nótese que para
que aument a el interval o. Una prueba a la edad de dos años
, b' con formas alternativas, lo cualde .. a medida
calculos mase1 ea~?s
,
eabe esperar cada vez <J.ue Itor ap
orte evidenc ias únicam ente .. . sólo 0.37 con una a la edad de 6, y 0.21 con una a la edad de 14 o
tenerse en cuenta Una correla ción tan baja como ésta indica que una prueba para niños
luaciones con una fo~a. ~d~ld' las medidas de la habilidad cognOSC
ItiVa Una edad de dos años es esencia lmente inútil como indicad ora de la po-
:,.~,isición
..
En general
bastant
c~nfIab
, latona,
e satisfac
ih a e
y las prue
bas al respect o se encuen tran dentro . que tendrá el individ uo durant e sus años escolares; sin embargo,
progres
a
i-
/ 'fuedida que ascend emos en el rango de edades, las correla ciones son

l." ,

'" ..... <,,': ... .. ... . ... .


. ,, :
316 CAP. 9. APTITUD ESCOLAR CONFIA BllIDA D y ESTABILIDAD 317
vamen te más altas y el descenso es menor. Una prueba dada a niños de los niños a lo l~rg~ de u.o peri~do de varios años y qué tanto se debe
de
nueve años correla ciona 0.88 con una aplicada a niños de 10 años .'. . . en el matena~ mclUldo en las pruebas . Desde un punto de vista
y
ciona todavía hasta el 0.86 con una aplicad a a adolesc entes de 14 o . .. la fIgura 9.7 sugIere que una p.rueba de inteligencia grupal nece-
Para los niños normal es en un ambien te típico, una prueba ' complement~rse con nuevas evaluaCIOnes cada tres
o cuatro años si se
aplicad a a niños de ocho ¡J nueve año~ proporcion~ una predicció~ . que los regIstros de los alumno s den una indicación exacta del nivel
casi de
sa de la habilidad al final o cerca del fmal de los anos en secund ana,
como n"'''JlJ.ua'~ actual.
haría la misma prueba aplicada varios años después.

1.00 , I
Pruebas a los
I 1,'
1.00

,1
Pruebas a los 10 años
il-~ y 9 años ~ EstUdi/ ,
)00'---
--~.::-:-

0.80
Pruebas a los
Pruebas a los - - - - -
~~ñO~ 0.80

/'
......- -- -- ._,

/
V)
Estudio B
o
4~fOS
--. ---'2 ,- -"" y/
..a L~
al
=>
-L
;--- ."...,""'" ~-
o. 0.60
~
eal
T
Pruebas a los '0
e
0.60 ~ ~ ........
,- -'
30 y 36 meses '0
e o
'0 J.,.;.. ";!p.- --'""i !J.. .. ~
1 O
0 .40
(D-~ ~y
~~ :J-.-- __
.......
...........
'{ .
U
O
0.40
U Pruebas o los
21 y 24 meses

0.20
~
0.20

I I I I
O
6 7 8 9 10 12-13 14-15
O
Edad en lo evaluac ión posterio r
10 9 8 7 6 5 4 3 2 o
Figuro 9.6. Ef ecto de la edad en lo evaluac ión inicial y en Años entre pruebas
e l intervalo entre
re pruebo acerco de lo predicción posterio r del (f Stanford -8inet
de lo primero ,:F1guro 9.7: Efecto del intervalo entre uno pruebo y otro prueba en lo predicci
(adopta do de Hanzik, McForlanea y Rilen, 1948). ón de la inte·
'f,;,. hgenCla de gupo al final de lo secunda ria a partir de
pruebas gupales anteriores
, (estudiO R: adaptad a de J. E. Anderson, 1939; estudio 8 : adoptad
a d e R. L Thorndi-'
Dos conjun tos de datos acerca de la estabilidad del desempeño en ke,1947). .
prueba grupal se present an en la figura 9,7. Los dos siguen el mismo
general, aunque difieren bastant e en detalle. A medida que se n'lCI,em,en D~1Tan.te io~ años de madure z, la estabili dad del desemp
lta eño de una prue-
interva lo de tiempo, el coeficiente de correla ción tiende a caer más de mtelIgencIa es marcad a aun a lo largo de interva los grande s. Al evaluar
o
estable mente. Las primer as pruebas dadas alreded or de los grados ~uevo a los ~studi~ntes de l~ Univer sidad del Estado de
cuarto correla cionan tal vez 0.50 a 0 ;.6 0 con la prueba del final de la Iowa (Iowa State
tremta anos despues, c1.lando ya tenían cincuen ta años Owens
ría, pero para una prueba de los grados noveno o décimo la correlac , en~ontró una correlación de 0.77 con,sus puntua ciones co~o alum-
0.70 a 0.80. En estos estudio s de prueba s grupales se usaron diferentión es . " . del_pnmer grado univers itario. En otro estudio longitu dinal
es de veinti-
bas para cada edad. Por ello, no está muy claro qué tanto de las Cln.cO anos (Bradw ay y Thomp son, 1962) se obtuvie
ron las siguien tes corrc-
más bajas median te los interva los más largos se debe al cambio por l. aClones:
el

,.
~ ., . ..... '.
,
318
PRUEBAS DE HABILIDAD COGNOSCITIVA 319

Binet 1941 Binet 1956 WAIS 1956


--,' en las pruebas de aptitud y las que obtiene un niño particular en la

Se han encontrado correlaciones más altas en las escuelas elementa-


Binel preescolar (1931) 0.65 0.59 0.64 en las escuelas secundarias, y más en las escuelas secundarias que
··.:,,'. ·. ·" · . . . . 0

Binel adolescencia (1941) 0.85 0.80 universidad. Los estudios pasados han indicado un descenso en la corre-
Binel adulto (1956) 0.83 de tal vez 0.70 en la escuela primaria a 0.60 en las escuelas secundarias
0.50 en la universidad, el cual puede explicarse probablemente por el des-
en el rango de habilidad intelectual en los grupos universitarios. Un
. porcentaje relativame!1 te ~equeño de la mitad inferior de la población escolar
Probablemente se combinen varios factores para producir la falta de esta- . .••. ha ingresado en la unIversIdad, y las universidades específicas seleccionan de
bilidad a 10 largo del tiempo observado en las primeras pruebas de iI?!eligen- uri rango de habilidad todavía más restringido. No obstante que cada vez más
cia. Primero las diferencias individuales para mantener la atencIOn y el ' ..'.•ge~te joven.in~res.a en la universidad, el ~lumnado d~ ~as universidades espe-
esfuerzo sor: mucho más importantes en los niños pequeños que en fechas CífIcas contmua SIendo bastante homogeneo en habIlIdad, lo cual da como
posteriores. Segundo, los tipos de desempeño que s~rvían para marcar la natu- resultado correlaciones bajas.
raleza de los cambios en inteligencia desde la infancIa hasta la edad ~~ulta, son 3. El aprovechamiento escolar previo ha dado correlaciones con el éxi-
cada vez más verbales abstractos y simbólicos. Finalmente, en un mno peque- to escolar posterior tap. altas o más altas que las puntuaciones de prueba
ño aún no se desarr¿lla una parte importante del creciI?iento int~lectual, de aptitud. Al predecir, por ejemplo las calificaciones de la universidad, los
mientras que en el adolescente la mayoría? to~o el ~ambIO ha.~curndo. Por registros de las escuelas secundarias han mostrado ser por lo menos tan altos
tanto la correlación entre una prueba de mtehgencla dada a Jovenes de 15 como aquellos que resultan de una prueba de aptitud escolar al ingreso.
años ~ aplicada al mismo grupo 10 o .20. años ~ás tarde es alt~, por9ue aproxi-
madamente a los 15 años el creCImIento mtelectual esta caSI completo
4. La prueba de aptitud combinada con el aprovechamiento da una
(Bloom, 1964).
meior predicción. Al reunir la información del aprovechamiento escolar pre-
vio y la puntuación de la prueba de aptitud, la correlación con el aprovecha-
miento escolar posterior puede aumentar por encima de las que arroja-
IMPORTANCIA PRÁCTICA DE LA HABILIDAD ron cada una de eStas medidas por separado. Estos dos tipos de información se
COMO MEDIDA DE PRUEBAS DE complementan uno con otro, pues las calificaciones escolares proveen evi-
HABILIDAD COGNOSCITIVA dencia acerca de la motivación y las habilidades de estudio y los hábitos de tra-
bajo, así como de la habilidad básica; la prueba de aptitud, objetiva y unifor-
. En qué extensión las diferencias individuales que se manifiestan en las me, compensa la variabilidad en los estándares de aprovechamiento de
pru;bas de habilidad cognoscitiva general son io:po.rtantes para los asu~­
escuela a escuela.
tos prácticos de la vida?, ipermiten acaso hacer predIccIones a un grado. de utI- . s. Las pruebas de aptitud correlacionan más alto con las medidas
lidad de cómo se desempeñará un individuo en la escuela, en el trabajO o en estandarizadas de aprovechamiento que con las calificaciones escolares.
otros aspectos de la vida? Las correlaciones entre la puntuación de la prueba de aptitud escolar y las
. puntuaciones totales de una batería de aprovechamiento son frecuentemen-
te~e0.70, e incluso alcanzan 0.80. Por tanto, para muestras representativas
Pruebas de aptitud y éxito escolar de 500 en cada grado, las Cognitive Ability Tests (CA T) -pruebas de habili-
dad cognoscitiva- dieron correlaciones con las pruebas lowa de habilidades
Primero consideraremos el éxito académico. De los muchos cientos de básicas, promediadas mediante todos lo grados, como sigue:
investigaciones acerca de las puntuaciones de prueba ~e aptitud ~scolar en
relación con el éxito académico, se pueden obtener vanas conclUSIOnes con
seguridad, las cuales se resumen a continuación. [Al CAl CAT
lowo verbol cuantitativa nD verbDI
l. La correlación de las puntuaciones de las pruebas de aptitud ~on .'
las calificaciones escolares es sustancia1. Si observamos todos los cien- Vo<obulorio 0.81 0.66 0.55
tos de coeficientes de correlación que se han reportado, podremos tomar Lectura 0.80 0.66 0.56 .
como una cifra altamente representativa la de 0.50 a 0.~50. Aunq~e esto lenguaje 0.78 0.69 0.57
constituye una relación muy definitiva, s~lo es necesar~o reexammar la '. Habilidades de estudio 0.77 0.74 0.65 .-1.'
figura 2.7 yel análisis acerca de las correlac~ones, del. capItulo 2, para dar~ MImética 0.73 0.77 0.62
nos cuenta de que todavía hay marcadas dIscrepancIas entre las puntua- Composición 0.85 0.77 0.68

Sbr 'i . ; 1 '

.,..•.•....
320 CAP. 9. APTITUD ESCOLAR
PRUEBAS DE HABILIDAD COGNOSCITIVA 321
6. El grado en que las pruebas de aptitud escola! están relacion~das .~ En la tabl~ 9.4 se mue~tran las medidas y los cuartiles para cada una de
el éxito académico depende deja materia de estudlO. Como es ObVIO, ' 24 ocupacIOI?-es seleccIOnadas co~o representativas de los principales
tras más materias académicas dependen más completamente de algunas de ocupacIOnes ~n Estado,s U mdos. Los datos están reportados en
de símbolos verbales o numéricos, como aquellas que componen en gran . ' ,', esc.ala de J?untuaclOnes estandar para la cual la media es de 100 Y la
te las pruebas de aptitud escolar, darán las correl~~iones más a.Itas. ASÍ, Un , . ,' ,. desviaCIón estandar de 20. Como se puede observar, las diferencias ocu-
mer resumen acerca de los estudios en la educaclOn secundana y ~l1r\Prlr.r ' .. pacionales son reales y bastante significativas en múltiples casos. Más

John, 1930) reportó una correlación promedi~ de 9.46 con los grado.s de .,•. aún, las diferencias probablemente deberían considerarse Como estima-
cias naturales y una de 0.38 con los grados de mgles y lengu~ ex~ranJera! . . . "",""~ >. dores mínimos, debido ~ que .todos los grupos habían llegado por lo
u' .. • , ••

sólo 0.28 con el trabajo artesanal y 0.22 con los grados de cIencIa domestIca. '. .. inenos hasta el grado declmopnmero y los dados de baja de la escuela en
algunas ocupaciones no estarían incluidos en estos datos, y para los nive-
Es incuestionable que las pruebas diseñadas para evaluar la inteligencia se . les más altos de ocupación, éstas eran personas aún en entrenamiento
correlacionan con el aprovechamiento académico y con el progreso escolar, .' . para la ocupación, ~on la posibilidad de una discriminación posterior
debido a la forma en que las pruebas están ensambladas. La forma en que antes que l?s candIdatos lograran llegar a su meta ocupacional. Sin
podrían capitalizarse estos hechos para la planeació~ educativa y l~ guía indi: '. . embargo, mIentras que notamos un rango de valores de la mediana desde
vidual, es un poco más problemática, lo cual reconSIderaremos mas adelante 119 para los maestros de matemáticas de escuela secundaria hasta 91 para
en este mismo capítulo.
Tabla 9.4. Cólculo de lo habilidad intelectual general en los diferentes ocupaciones.
Sexo Número 0. Mediana Q3
Habilidad cognoscitiva general en
relación con el nivel ocupacional Ingeniero eléctrico m 713 105 114 124
Muestro f 421 110 119
Ahora centraremos nuestra atención en los logros extraescolares y consi-
128
EnférmerQ f 2260 101 109
deraremos cómo las puntuaciones de una medida de la habilidad cognoscitiva 120
Médico m 591 109 118
general se relacionan con el aprovechamiento e~ el mundo d~l trabajo. De 128
CO/ltador público titulado m 728 99 109
aquí surgen dos tipos de preguntas, a saber: a) iCO~O los tra?~Jadores en los 120
Gerente de manufacturas m 235 98 109
diferentes tipos de trabajo se comparan con la medIda de habIlIdad?, y b) den- 119
Empleado m 508 99 110
tro de cierto trabajo, ¿en qué extensión la aptitud está relacionada con el éxito 120
Trabajador social f 758 99 110
en el trabajo? 121
Respecto a la primera pregunta, podemos observar los datos s~leccio- . Abogado m 1 110 106 115 125
nados del Proyecto talento, aparecido en el Career Data Book (LIbro de · Bibliotecario f 293 103 ll3 125
datos acerca de carreras) (Flanagan y colaboradores, 1973). El Proyecto Artista, escultor f 156 101 ll2 122
talento es un 'proyecto en el que 5% de una muestra de estudiantes en las Maestro de músico f 223 101 ll2 121
escuelas secundarias en Estados Unidos fueron evaluados en 1960 y des- Técnico en electrónico m 720 93 104
de entonces están en seguimiento. El 'Career Data Book reporta los resul- 114
Técnico de laboratorio f 441 90 103
tados de un seguimiento de cinco años d~ los estudiantes que estaban en los . ll5
. Propietario de negocio m 811 88
grados decimoprimero y decimosegundo cuando se realizó la primera eva- '. 100 113
. Vendedor (misceláneo) m 961 88
luación. No obstante que sólo un tercio de los estudiantes completó el . 101 113
Maquinista m 680 87
cuestionario de. seguimiento, éste todavía es, en todos los sentidos, el estu- . 98 111
'. Mecánico de autos m 270 82
dio longitudinal a gran escala que se ha realizado, y un número muy ~rande . ClÍrpinte{a
95 109
de personas fueron identificadas como empleados o que se sometIeron a " m 180 83 95 106
entrenamiento para un amplio rango de ocupaciones. . " PIomera m 224 82 94 106
La batería de talento de las pruebas incluía pruebas entre las cuales •. . ... ~taria f 2830 91 103 114
na estaba específicamente diseñada para medir la habilidad intelectual gene- Iénedor de libros f 399 90
. ':' reinadora
102 114
ral; sin embargo, un compÓesto de varias pruebas proporcionó puntuación f 719 85 97 109
que era una aproximación razonable a esta medida de habilidad general. Para Obrera m 927 80 91 104
producir esta composición, obtenemos medidas de comprensión de la lectu- .
ra y de razonamientos abstracto y aritmético. . • EscoJo: medio = 100, desviación estándar = 20.

~.c •.",., .
r, '-t, .

322 CAP. 9. APTITUD ESCOLAR CÓMO EVALUAR A PERSONAS 323


,,
! '
los obreros, también deberíamos notar el traslape sustancial para diferen_ el trabajo, es posible q~e el indic~~or sea inco~~iable y sesgado por varias
tes grupos ocupacionales. Un 25% de los obreros obtuvieron puntuacio_ . . que no tIenen r~laclOn con la efl~lencia real del trabajador.
nes tan altas en este compuesto intelectual como el promedio de los técni- . Hasta donde esto. es verda~, d~ mnguna prueba aplIcada al iI}dividuo se puede
cos electricistas y, a su vez, un 25% de éstos obtuvieron puntuaciones tan '.' que predIga tal cnteno.
altas como el promedio de los ingenieros eléctricos. Aunque las diferen_ Sin emba~go, las deficiencias en el criterio son sólo una parte del proble-
cias entre los grupos era real, la variabilidad dentro de cada grupo fue sus- Un amplI~ ~ango d~ f~ctores que no son de habilidad para manejar ideas
tancial. <ábstractas par~lc~pan pract~camente en cualquier desempeño laboral, así mis-
. . iDO, en los multIples trabaJOS que son de naturaleza rutinaria y repetitiva la
. .. ,.. fluidez para trabajar con ideas, más allá d~ un nivel mínimo básico, puede ~er
Puntuaciones de prueba de habilidad , . .• un logro dudoso y a~n, en algunos amblen~es laborales, una desventaja.
cognoscitiva y éxito laboral .' '.' En ese orden de Ideas, podemos conclUIr que las medidas de habilidad
. •. ... ' cognoscitiva general están relacionadas con la membrecía de un grupo ocu-
iQué podríamos decir acerca de la relación que existe entre la habilidad
pacional y aunque la relación entre la puntuación de prueba y el éxito en el
cognoscitiva representada en una puntuación de prueba y el éxito dentro de trabajo suele s~r positiva, prob~blemente sea bastante baja. La predicción para
un trabajo particular? Un resumen de estos hallazgos reportados en varios el aprovechamIento en el trabaJO parece ser bastante menos precisa que la pre-
dicción para el aprovechamiento escolar.
estudios diferentes se presenta en la tabla 9.5.

Tabla 9.5. Validez de los pruebas de inteligencia como predictoros de los criterios de CÓMO EVALUAR A PERSONAS
entrenamiento y de pericia· DE CULTURAS DIFERENTES
Entrenamiento Pericia
.. Se ha debatido bastante acerca de cómo ¡si es el caso) deberían aplicarse
las pruebas de habilidades cognoscitivas generales a los grupos que difieren
Ejeculivos y odministrodores 0.30 de los blancos, a la clase m~dia y a hablantes nativos del inglés, que es el
Superintendentes 0,25 grupo para el cual la mayona de los constructores de pruebas han elabora-
:¡ do éstas y que han constituido el punto de referencia para desarrollar la
¡ ~: : Empleados 0.48 0.30
- 0.10 mayoría de los diseños de pruebas. Se ha dicho que las pruebas son injustas,
" Empleados de ventas inadecuadas y, en todas formas, inapropiadas para las personas que perte-
Vendedores 0.33
.¡i Servicio de protección 0,53 0.25
necen a grupos minoritarios; es decir, para las personas cuyo idioma mater-
no no es el inglés o que han estado privadas en términos de su ambiente
Servicio personal 0,50 0.07 temprano.
Operorios de vehículos 0.18 0.14 Existe evidencia abundante de que el desempeño en una prueba de apti-
Artesanías y mercado 0.41 0.18 tud está influido por los antecedentes culturales generales: Los reclutas en
Trabajadores industriales 0.38 0.19 el Ejército de Estados Unidos mostraron una ganancia equivalente a casi
una desviación estándar completa entre la Primera y la Segunda Guerras
• Adaptado de E. E. Ghiselli, 1966. Mundiales (Tuddenham, 1948). En 1940, los niños de las montañas de
Tennessee mostraron CI promedio 10 puntos más altos que los que se
j ,"
encontraron en esa misma área 10 años antes¡Wheeler, 1942). Aun un
Cuando el criterio que se predecía era el éxito en un programa de entrena- poco después de la Segunda Guerra Mundial, las reestandarizaciones de
miento, las correlaciónes promedio tendieron a ir desde DAD hasta 0.50 ¡con . . ... las pruebas de habilidad encontraron una corriente que tendía a elevar las
la única excepción de 0.18 para los operadores de vehículos), y estos valores .' .. ;'., normas de la población general. 1 Estos cambios están asociados con un
l ' ¡ '.: complejo de cambios sociales que incluyen más años de escolaridad para
'. ¡ no son muy distintos de los valores obtenidos para el éxito en la escuela. :
; !'
Cuando el criterio es de eficiencia en el trabajo, las correlaciones son unifor- '. los niños y para sus padres, mayor accesibilidad y movilidad de las perso-
memente más bajas: desde 0.10 para los empleados de ventas hasta 0.33 para n~s. -:especialmente aquellos de las áreas rurales-, el desarrollo y la dispo-
los vendedores, y el promedio es 0.20 para todas las ocupaciones. En parte, las •. : ;Dlblhdad casi universal de la radio y la televisión, y, tal vez, la mejoría en
correlaciones más bajas pueden ser causa de las limitaciones en el criterio del .' .' ; los materiales y los procedimientos educativos.
éxito de trabajo. Ya sea que el éxito se mida mediante calificaciones hechas ~?r
los superiores, como normalmente sucede, o por algún índice de producclOn 1 Ha habido alguna evidencia de la inversión de esta tendencia en la última década .

.
.' ,' ;
. .:
. .... ¡.: ... :. \','
324 CAP. 9. APTITUD ESCOLAR
325
Chinos Judíos Negros Puertorriqueños
Los cambios que acabamos de desc;ibir ~on cambio~ favorables que refle~ : M B M B M B M B
j .. jan las experiencias extendidas y ennquecIdas, espe~~almente en los .años ,
preescolares, así como documentan los efecto~ pOSItIVOS de .un ambIente
que provee experiencias relacionadas con las .h~bIlida?es requendas para COn- . ----------------~-
testar las pruebas de habilidades cognoscitivas; sm embargo, hay otros 60 - - - - - - - - - - - - - - - - Ñ:"
ambientes que proporcionan anteceden~e.s adecuados p~ra hacer frent~ a las
tareas implicadas en las pruebas de habilIdad cognOSCltIV~..Tales ~m~lentes . 58 ------E~- ~ - - ------ - - - -------
pueden caracterizarse por algunas (o todas) de las condiCIones SIguIentes: N- R,E ________ y_
56 ------R~----------

a) Un lenguaje materno en el hogar, que no sea el inglés, ya sea un idio. 54 ------------------ -v


- - - - - - - - R-
ma extranjero o un dialecto. . . . E-
. -.l
E
b) Valores del hogar que pongan poco énfasis en el aprendIZaje adquiri. ; 52 ---- - - y"::: :'Ñ- ---- - - - - - - -.- - - - N-
¡ do en los libros y en el adelanto en la escuela. ':"R -N
e) Presiones del hogar (sociales y económicas) que dificultan a los padres .' 50 - - ----------- - ---- - - - - - - - , E- ___ _ _ _
'.

proporcionar un ambiente estable y de apoyo para sus hijos. . -R N-


,. 48 ------- - ---------- - --------- R-
d) Padres que no han aprendido a desenvolverse como maestros para SUS " - - - - - - - -y - - - - - - -
-E
hijos. . 'l'd d ,. ' 46 - -------:.y--------
e) Escasez de las posesiones matenales ~ falta de ~stabI 1 a e~~nomIca -E
para dar a sus hijos juguetes, libros y Juegos, aSI como condICIOnes de '. 44 ------------------ - - - - - - - - - - -y - - - - - - - -
vida relajadas y confortab~e,s. .., . -N
fl Una sensación de separaClOn y de enaJenaClOn de la cultura dOlll1- 42 - -- - -- - - -- - - -- ---- --- - -- - -- - R-------- -R - - ----
nante. 40 -- ----- - ---- ----- - -E
- - - - - - - - - - Ñ- - - - - - - - '::v - - - -
En la medida en que algunos grupos definibles (como los negros o los .' 38L-----~------ __L __ _ _ _ _ _~_ _ _ _ _ _ _ _~_ _~
niños de habla hispana) están caracterizados generalmente por algunos de
l ' estos factores se puede afectar la habilidad reflejada en las puntuacio- . Figuro 9.8. Aprove chamiento relativo d e los niños de diferentes gupos é tnicos de clases
nes de prueba: Una larga serie de estudios (Loehlin y col~boradores, 1?!5) .' .
',> . ,'
medio (M) y bajo (8), N. número;
de l esser. FiFer y Clark. 1965),
R. razonamiento; E. esp ecial; V. verbal (adoptado
han documentado las puntuaciones de prueba mas bajas para los mnos .
negros de Estados U~idos, y parece que hay muy po~o que preguntar~e. e~
cuanto a que parte sustancial del déficit se debe consIder~r com? un dehcn ;·m,edí,das de habilidad presente y los resultados futuros son tan altas para
del ambiente de los tipos mencionados. El que toda la dIferenCIa se pueda alUlUUIUIi de antecedentes limitados como para la generalidad de los alum-
atribuir a las condiciones de vida es probablemente. incontestable per? '.' ... . . .P~ra una puntuació~ d~da, i cuál debería ser el propósi to?, i cómo debería
de ninguna forma definit~va. La deficiel}cia no es ~ecuharmente, o aun pn- .. ". modIfIcarse por el conOCImIento de que esa puntuación fue la que obtuvo un
mordialmente de la medIda verbal. ASI, Lesser, FIfer y Clark (Lesser y co- . >', alumno que proviene de un ambiente pobre? Debido a que la puntuación de
laboradores, f965) estudiaron el desempeño.sobre prueba~ _de varios . , '.' , alumno se pudo mantener baja por las limitaciones ambientales, ¿debemos
de medidas de habilidad para las clases medIa y baja de mnos de .
un desempeño escolar en la secundaria o un desempeño laboral para
judías, negras, puertorriqueñas y chinas_ L_~s resultados s~ ", ....·."".uqalll.c: que para aquel compañero de clase más favorecido en el ambien-
figura 9.8, en la cual se puede ver que los mnos negros tUVIeron u~ tiene una puntuación inicial similar?, i debemos predecir el mismo
peño relativamente mejor en la~ prueb.as verbal~s que en cualqUIer "I""UiLi1UlV para ambo~ o concluir que, con base en la experiencia, el niño que
También puede notarse que las dIferenCIas en el mvel entre las clases
de un ambIente más limitado regresará al nivel final más bajo~
y baja aparecen en cualquier grupo étnico y l?arecen ser grandes, com¡)ar,a· ., ; Estas preguntas son fáciles de hacer, pero no tan fáciles de contestar. Esto
das con las diferencias entre los grupos étmcos. debe, en parte, a que la respuesta puede variar mucho, lo cual dependerá
. Cualquiera que sea el patrón original de la causación, en ellllomento la edad en que se obtuvo la medicióri inicial. La respuesta también depende
que el niño ingresa en la escuel~~ y aún ~ás cuando es candi~ato para la . marcadamente de lo que le pase a la persona en el intervalo entre los
sión a un programa de educaClOn supenor o para un trabaJO, las '. '. ' .'. . de las evaluaciones inicial y final. Dado que durante un periodo
están presentes. La cuestión se convierte en: ¿qué significan los resultados de. ' .. la política pública desalentaba la práctica de mantener registros
las pruebas en el caso de las personas que provienen de grupo~ privados, en .'".~parados por niveles socioeconómicos y raza, hay menos información que la
,; 1
, cuanto al potencial para el aprovechamiento futuro?, ¿las relaCIOnes entre las '. ':, que nos gustaría tener acerca de la exactitud predictiva de las medidas de prue-
326 .CAP. 9. APTITUD ESCOLAR 327
bas de aptitudes para los alumnos negros y para los alumnos de grupos en
general de familias de nivel socioeconómico bajo. . Alto r---!!:2:~~--~
Los estudios acerca de las predicciones del aprovechamiento académico
en las universidades predominantemente negras (Stanley y Porter, 1967) pro- o
eID
porcionan correlaciones del mismo tamaño que las obtenidas en otras institu_ E
ciones. Una vez más, cuando se investiga en colegios de educación integra- o
.c
u
da, cierto nivel de puntuación de prueba de aptitud parece predecir casi el mis- ID
mo nivel de aprovechamiento para los estudiantes blancos que para los negros o>
(Clearly, 1968). Las pruebas de madurez que se aplican a los niños que ingre- a.
«
san en el primer grado predicen el aprovechamiento para el final del año tan
bien para los negros, como para los mexicanos, los orientales o los caucásicos Bajo"""""""",~~
(Mitchell, 1967). Cuando no se hace nada para mejorar las condiciones bajo Bajo Alto
las cuales crecen los niños de los ghettos, el pronóstico parece ser menos favo- Aptitud Aptitud
rable para los niños del ghetto que para los de clase media que empezaron al (al (b)
mismo nivel de prueba. Hay una tendencia (Coleman, 1967) para que los
niños negros de bajo nivel socioeconómico se coloquen en la parte inferior de
la distribución de sus compañeros de edad a medida que crecen. Los progra- Promedio
mas para romper este círculo de empobrecimiento y de pérdida de habilidades
Clave
han sido muy numerosos en los últimos años y, en casi todos los casos, tien·
~~~ Aprovechamiento abajo
den a destacar la intervención temprana¡ es decir, aceptan que la intervención
""~.,.,.,=.,. de lo esperado
eficaz debe tomar lugar muy temprano en la historia de la vida del individuo,
mientras se establecen los patrones de lenguaje y pensamiento iniciales. En Aprovechamiento muy por debajO
estas circunstancias, ha sido posible producir cambios apreciablemente positi- de lo · esperado - "infroaprovecha-
vos en las curvas de crecimiento mental, aunque todavía no queda claro qué dar" ·
tan permanentes serán estas ganancias.

Boja
APROVECHAMIENTO ESPERADO Bajo Alto
Aptitud
Uno de los problemas que debe afrontar cada maestro o cada asesor es (el
conocer en qué nivel de aprovechamiento se puede esperar razonable- Figuro 9.9. Tres concepciones del aprovechamiento esperado.
mente que se sitúe cualquier niño y, como corolario a esto, si el niño está
desempeñándose tan bien como razonablemente cabría esperar. La biblio-
grafía acerca del infraaprovechamiento podría llenar una biblioteca gran- Las diferencias se muestran en nuestras medidas de aptitud académica, así
de, y mucha de ella no tiene ningún sentido. En el nivel más crudo, como en otras medidas que podamos aplicar a los niños. ¿Cómo podríamos
podríamos fijar el mismo estándar de expectativas para todos los niños de tener en cuenta estas diferencias al fijar nuestras expectativas y al concebir el
una edad determinada -en cierto sentido, esto es lo que hacen las escuelas bajo aprovechamiento? Una posibilidad sería esperar que cada niño aprove-
cuando admiten a los niños a una edad de seis años y esperan que todos che en la escuela al nivel que se ajuste exactamente a su desempeño en las
aprendan a leer en el primer grado-o No hay ningún atemperamiento de medidas de aptitud académica. Entonces, cabe esperar que el niño que se ubica
las expectativas que se incluyera basado en otros factores ya conocidos en el percentil 99 de aptitud se ubicará en el percentil 99 de aprovechamiento;
acerca del niño: sus antecedentes familiares o su desempeño en una prue- el que se ubica en el percentil 75 también lo hará en estos niveles en el aprove-
ba de aptitud académica. Cualquier niño que se ubica por debajo del pro- chamiento, yel que está muy bajo en la prueba de aptitud se espera que esté
medio de todos los niños es considerado como un desaventajado y los muy bajo en la prueba de aprovechamiento. Cualquier discrepancia por
esfuerzos educativos y la preocupación pública se enfocan en que todos medio de la cual el aprovechamiento se halle por debajo de la aptitud se conci-
los niños alcancen el nivel promedio, es decir, ula normano Esta concep- be como un aprovechamiento bajo; esta concepción se muestra en el diagrama
ción de lo que cabe esperar se ilustra en el diagrama (al de la figura 9.9. (bl de la figura 9.9.
Ahora ya sabemos que todos los niños de seis o diez años no son iguales, Sin embargo, esta concepción es tan defectuosa como la concepción de
por lo menos con respecto a su dotación genética o sus experiencias vividas. que se deberían fijar los mismos estándares para todos. Esta segunda concep-

..'.'.:'..:........~, •... \' .


-... , : "
"', .
. <.. .. , .:.:.. :- .:, .
'.~ ~
r<-IFf~'
~:.-....."
t·::- ;¡ Distribución de percentiles de los equivalentes de grado IlBS poro 10 puntuación
328 CAP. 9. APTITUD ESCOLAR
!" de ~dod estándar de los pruebas de habilidades cognoscitivos: Quinto grado, no
ción implica una correlación de + 1.00 entre las medidas de aptitud verbal
'.¡' y las de
aprove chamie nto, y simple mente estas correla ciones no existen , ni Nivel PEf: Menos de 70
mos buscarlas. Si hacemos a un lado por un momen to los errores de medició debería.
que son muy reales en las medida s tanto de aptitud como de aprovec n
hamien~ Le<.
to, estas dos medida s implica n cuestiones diferen tes. Especialmente
cuando
consideramos las calificaciones hechas por los maestro s, éstas reflejan
esfuerzo, habilid ad para compre nder lo que el maestr o quiere y habilidinterés
ad par~
agradarlo, así como la capacidad ~n algunos segmen tos especiales del 99
do académico. Así, la correla ción entre la aptitud y el aprovec hamien comeni· 98 99
to es 98 99 99 99 98
positiva pero muy lejana de la perfección, y los alumno s que se encuen
tren en 97 98 98 98 98 99
la parte superio r en la aptitud media estarán por arriba del promed 96 98 98 98 99 97
io, 99
normal mente no se hallarán en la misma posició n en aprovechamien pero
98
95 97
\ to. La 99 94 97
97
96
97 98 96 98 98
96 98 95 99 97
"::¡ situación real se muestr a en el diagram a (el de la figura 9.9. Un niño 98 93 96
97
en un nivel de puntua ción de una aptitud dada debe considerarse en situado
95 95 99 97 93 98 96 96 99
_" relación
98 92 94 94 94 98 96 92 97 99 95 94 98
97 91 93 92 "
'- con el promediO de aprove chamie nto de todos los alumnos en su 93 98 95 90 96 98 93 93 97
nivel
aptitud. Podría considerarse con bajo aprovechamiento si se ubica muy de 96 89 92
por 90 92 97 94 88 94 97 92 91 96 99
debajo del desemp eño promed io. 95 88 91 89 91 96 92 86 92 96 90 88 94 98
93 86 89 87 89
Varios editore s de prueba s que ofrecen medida s tanto de aptitud 95 90 84 90 94 87 85 92 97
lar como para el aprove chamie nto académico, provee n algún tipo de esco·
92 84 88 84 88 93 88 82 88 92 84 82 90 96
90 82 86 82 86
normas 92 85 79 85 89 81 80 87 95
conjun tas en una tabla que indica el nivel de aprove chamie nto esperad 88 80 84 79 84 90 82 75 81 86 78 77 84 94
o
una persona que se ha desemp eñado en un nivel particu lar en una pruebapara 85
82
78 81 77 81 88 79 72 77 82 74 73 80 92
aptitud. Las tablas suelen presen tarse por separad o para el grado escolar de 75 78 74 79 86 75 69 72 77 70 69 76 90
79 72 75 70- 76 83 71 65 67 72
o para 76 71
65 65 71 87
la edad cronoló gica. Estas tablas se han diseñado para ayudar al maestro 69 67 73 30 67 6i 6l 67 60 61 6S 84
asesor a juzgar si en una prueba de aptitud el alumn o se desemp eña de o al
acuerdo 72 66 68 64 70 77 63 58 57 61 56 58 60 79
con los objetiv os establecidos. 69 63 64 60 66 73 59 54 53 56 51 54 55 73
Los datos básicos a partir de los cuales se prepar an las tablas de aprovec 65 60 60 S6 63 69 SS 50 49 50 47 50 50 65
miento esperad o son gráficas bidimensionales en las que se marcan el ha- 60 56 57 52 60 64 51 45 46 45 42 47 46 57
.¡ aprove- ss 52 53 48 56 58 47 41 42 40 38 43 41 SO
chamie nto y la aptitud , del tipo de las estudiadas en el capítulo 2.. Si 50 48 49 44 53 51 44 38 38 35 35
tomamo 40 37
un segmento de esta descripción, podremos encont rar el aprovechamien s
44
45 45 46 41 50 45 40 35 34 30 31 37
i í 32 38
promedio para un nivel dado en una prueba de aptitud y este valor promedito
40 42 42 37 46 40 36 32 31 25 27 34 27 31
36 39 38 33 42 34 32
es ciertamente nuestro mejor estima dor del valor esperado; sin embarg o 31 36 35 30 39 28 28
29 27 21 24 30 23 25
27 24 17 21 26 19 20
o, muy
pocos niños se ubican exactam ente en el valor promed io, por tanto,
debemos 27 33 31 27 35 23 25 24 21 13 18 23 16
considerar la import ancia de que la persona se ubique lo suficien tement 24 30 28 24 31 18
16
por arriba o por abajo del promed io de alumnos en su nivel de prueba e lejos
22 21 18 10 15 20 13 12
20 28 25 21 28 15 19 19 15 8 13 18
de 11 9
tud. Algunos editore s han produc ido tablas de percent iles reales de los apti- 17 25 23 19 24 12 16 17 13 11 15 9 7
niveles 15 23 20 17 21 10 14 15 11 9 13 7 5
de aprove chamie nto para la aptitud . En la tabla 9 .6 se muestra una fracción 13 20 17 15 18 8 12 13 9
de 11
7 11 5 4
una de estas tablas, basada en las pruebas de habilidades cognoscitivas, 18 15 13 16 6 10 11 7 5 10 4 3
no 10 16 12 11 13 S 10 6
verbales y las pruebas Iowa de habilidades básicas. 8 14 10 10 11 4 8
3 8 3 2
7 2 1
Debido a que es un poco difícil entender la inform ación present ada 6 12 9 8 10 3 7 S 1
la tabla 9.6, a continu ación daremo s unas indicac iones para su lectura. en
La 10 7 6
tabla consta de cuatro secciones, cada una de las cuales se aplica a los 8
quinto grado en un rango de puntua ciones de edad estándar (PEE) de niños de 6
6 5
5 4
la prue· S
ba de habilidades cognoscitivas, no verbales: la primer a sección con PEE 4 4 3
por 4 3 3 2
debajo de 70, la segund a de 70 a 79,la tercera de 80 a 89 y la cuarta de 3 3 2
La tabla comple ta incluiría seccion es adicionales para 100-10 9, 90 a 99. 2 2 1
1
1l0-1l9 , 2 1
12.0-129, 130 Y más así como, por supuesto, para otros grados. 1
Dentro de cada sección, la column a de la extrem a izquier da muestra
el
equivalente de grado (EGI, pero sin punto decimal; por ejemplo, una
entrada

k"
Tabla 9.6. (Continuación) 9.6. (Continuación)
~~~~~------~---------------------------------------------- .
Nivel PEE: 70-79 Nivel PEE: 80-89

roc. lec. 'IU.ba 1, I.nguoj. 'IU,ba r, I/obojo·",udio Ptu,ba M: Matemáticas (


-
.... roc. le<. 'Iu.b. ¡, I,nguoj. PtU,bo 1/, I"bajo·,,'udio Plueb. Al, Mo'.móti,", Comp.

r , I 11.31 l·' r·, I "-2 I r·3 "., I M-I


" l·
r , I I {-3 I I I M-2
fG

6S
l·'
99
1-2 I-f M·' M-2
-r. ..
E'
74
l·'
99
1-1 H 1-1 1/." '-1 "·3 1/.' M·' M·' C.

64 98 99 n 98 99
63 98 99 98 70 97 99 99 98
62 97 98 99 98 99 68 96 98 98 98
61 96 98 98 98 98 61 95 98 98 97 99
60 95 97 98 97 98 66 99 94 97 91 97 98
59 99 94 97 97 97 99 99 97 99 99 99 6S 98 94 97 97 96 98 99 99
58 98 99 93 96 97 96 98 98 96 98 98 98 64 98 99 93 96 96 96 98
57
56
98
97
98
98
92
91
95
94
96
95
96
95
98
97
98
97
95
94
98
97
98
97
97
96
99
98
." 62
91
91
98
98
92
91
95
95
96
95
95
95
97
97
99
98
98
98
98
91
98
98
91
99
98
99
98

55 96 97 90 93 94 94 97 96 93 96 99 96 95 98 6\ 96 97 90 94 94 94 96 91 96 97 98 97 99 99
54 94 96 89 92 92 93 96 95 91 95 98 94 94 97 99 60 95 96 89 93 93 93 96 91 95 96 99 91 96 98 98
53 93 94 88 91 91 92 95 94 89 94 97 93 92 96 98 59 94 95 88 92 92 92 95 96 94 96 98 96 95 98 98
52 91 93 86 89 90 90 94 92 87 92 96 91 90 95 98 58 93 94 87. 91 91 91 94 95 93 95 98 95 94 97 97
51 90 92 84 88 88 89 93 90 84 90 94 89 87 94 97 57 92 93 86 90 90 90 93 94 91 94 91 94 93 96 96
SO 88 90 82 86 86 88 92 88 81 87 92 87 84 92 96 56 91 92 84 88 89 88 92 93 90 92 96 93 92 95 95
49 86 88 80 84 83 86 90 86 78 84 90 85 81 90 94 55 89 90 82 87 88 81 91 92 88 90 95 91 90 94 94
48 83 86 78 81 81 84 88 84 75 81 87 82 77 87 93 ~ 81 88 81 85 86 86 90 90 85 88 94 89 88 92 92
47 81 83 76 79 78 82 86 81 72 77 83 79 73 83 92 S3 85 86 79 83 84 84 89 88 83 8S 92 87 85 91 91
46 79 80 74 77 76 80 84 78 68 73 79 75 70 79 90 52 82 84 76 81 82 82 87 85 80 83 90 85 82 89 89

45 76 77 71 74 73 77 81 74 64 69 75 71 66 75 81 SI 80 81 74 79 80 80 85 82 16 80 88 82 79 86 81
44 73 74 68 72 70 75 79 70 60 65 70 67 62 70 83 SO 71 79 72 16 78 • 78 a2 79 73 76 85 19 75 82 85
43 70 70 65 69 67 72 76 66 56 61 65 62 58 65 19 49 75 76 69 14 15 1& 80 7S 70 73 82 16 71 18 83
42 67 66 62 66 63 69 73 62 53 56 60 57 55 59 14 48 72 13 66 11 72 74 18 71 61 10 78 72 67 74 80
66 69 58 49 52 54 53 SI 53 47 69 70 63 ·
41
40
39
63
60
56
61
57
53
59
56
52
63
60
57
59
56
52
63
60
64
59
54
50
45
42
48
45
49
43
48
43
48
44
48
42
"
61
54
46
4S
66
63
67
64
60 .
57
68
65
62
69
66
63
72
69
61
75
72
69
67
63
S9
64
61
58 ·S8
66
62
73
68
63
68
64
59
63
59
55
69
64
59
71
73
69
38 52 49 49 53 48 56 54 46 39 41 37 39 41 37 41 44 60 60 54 59 59 64 65 56 54 53 58 55 51 55 6S
37 49 45 45 49 44 53 49 42 36 37 31 35 37 32 41 43 57 57 51 SS 55 61 61 52 50 49 52 50 47 50 60
36 46 41 42 46 40 50 44 38 33 33 26 31 33 27 35 42 54 53 48 52 51 58 57 48 47 45 45 46 44 45 54
i
35 43 37 40 42 36 46 38 35 . 30 29 22 28 30 23 29 41 50 49 4S 48 41 SS 53 45 44 41 39 42 40 40 48
34 40 34 37 38 33 43 32 31 28 26 18 24 27 19 14 40 41 44 42 44 . 43 52 48 41 40 37 34 38 36 36 42
33 36 30 34 35 29 40 27 28 25 23 15 21 24 16 19 39 44 40 39 41 39 48 43 38 36 33 29 34 33 31 31
12 18 21 13 38 40
32
31
30
33
30
28
27
24
21
31
28
25
31
28
25
26
23
20
36
33
30
22
18
14
25
22
19
23
20
18
20
17
15
9
7
16
13
19
16
11
9
"
13
10
37
36
37
34
36
32
29
36
34
31
31
34
30
36
33
30
45
42
40
38
34 ·
30
3S
31
28
33
30
28
30
26
24
19
30
26
30
26
26
21
32
27
23 15 22 23 17 21
29 25 18 23 22 18 27 II 17 16 12 5 II 14 7 7 ~ 31 26 28 27 21 37 25 25 25 20 12 18 21 14 16
28 22 16 20 19 16 24 9 15 14 10 4 9 12 6 5 34 29 23 26 2S · 24 34 21 22 22 17 9 15 18 11 12
27 19 14 18 16 14 21 7 12 12 8 3 7 10 4 3 33 26 20 23 22 22 32 17 20 20 15 1 13 16 9 9
26 17 12 16 14 12 18 5 10 10 7 2 5 9 3 2 32 23 17 21 19 19 29 13 11 11 12 6 10 14 7 6

25 14 10 14 12 11 15 4 8 8 6 1 3 7 2 1 31 21 15 19 11 16 26 10 14 15 lO S 8 12 5 4
24 12 8 12 10 10 13 3 7 7 4 2 6 1 30 19 13 17 15 14 24 7 12 13 8 4 6 10 4 3
23 10 6 10 8 8 II 2 5 6 3 1 4 29 16 II 15 13 12 21 5 lO 11 7 3 5 8 3 2
22 8 5 9 7 7 9 1 4 S 2 3 21 l. 10 13 11 10 18 4 8 10 5 2 4 7 1
2
21 6 4 8 6 6 8 3 4 2 2 27 12 8 12 9 9 16 3 6 8 4 1 3 6 1
20 4 3 6 S 5 6 2 3 1 1 2' 10 1 10 8 8 14 2 S 1 3 2 5
19 3 2 5 4 4 4 1 2 25 8 6 9 7 7 12 2 4 6 2 1 4
18 2 2 4 3 3 3 1 24 6 4 1 6 6 10 1 3 5 2 3
17 1 1 3 2 3 2 23 4 3 6 5 5 8 2 4 1 2
16 2 1 2 1 22 3 2 S 4 4 6 2 3 2

15
14
2
1
1 21
20
19
2
1
2
1 •
3
3
2
3
2
5
4
1 2
1
1
2 1 2 3

"
17
I 1 2
1

.....:.. .. :.,,:."'
, ........ .' ... , .:....-: ...• ';.:":.. " ..,"
Tablo 9.6. (Continuación)
Nivel PEE: 90·99 APROVE CHAMIE NTO ESPERADO 333
debe leerse como 4,5, es decir, a cinco meses del cuarto grado.
V'L ¡oe, Pruebo W, Trabaio,esludi< ""'...."~~...,,Plas otras column as se refiere a una de las subpru ebas de la prueba Cada
'deha'OlJuu.UUlt"'> básicas, esto es, vocabu lario, lectura, etc. Las entrada s enIowa
estas column as son percentiles. cada
.
99 99 na vez conoci da la PEE de un niño, selecci onamo s la sección de
99 98 99 la
98 que corresp onda a esa PEE y, dentro de la sección , selecci onamo
98 97 98 97 s
97 96 97 96 99 corresp ondien te a la subpru eba en la que estamo s interes ados
96 96 97 96 98 hilera corresp ondien te al equiva lente de grado del alumno para
99 99 96 95 96 95 98 esa
98 98 95 94 96 94 97 99
99
98
Por tanto, si Luisa, una niña de quinto grado, ha obtenid o una
98 98 94 94 95 93 97 98 de 95 y su equiva lente de grado de lectura es de 4.5, la tabla muestr
98 99 a
97 97 93 93 95 92 96 98 97 98 99 99 su aprove chamie nto está en el percen til42 dentro de su grupo PEE.
97 97 92 92 94 91 96 97 97 98 98 98 signific a que Luisa está un poco por debajo del desemp eño prome
· las niñas en su nivel de PEE. Un equiva lente de grado de 3.4 habría dio
67 96 96 90 91 93 90 95 97 96 97 99 98 98
66 95 95 89 90 92 89 94 96 95 96 98 97 97 99 caído a un percen til14, dada la PEE de Luisa, y nos habría hecho
65 94 94 88 88 91 88 92 95 94 95 98 96 96 98 ' ella tiene un serio proble ma de aprove chamie nto; sin embarg o, sicreer que
64 93 93 86 87 90 86 91 94 93 94 97 95 95 98 Susana ,
63 92 92 85 86 88 85 90 93 92 94 con una PEE y en la medida de aptitud de 68, tuviera un equiva
62
93 96 94 97 lente de
91 91 83 84 87 83 89 92 90 91 95 93 92 96 ·grado en lectura de 34, estaría en el percen til 45 para su grupo de
61 89 89 81 82 86 82 87 90 89 90 94 91 habili-
60 88
91 94 dad, y el desemp eño sería congru ente con lo esperad o para una person
59
58
86
84
87
85
83
79
77
75
80
78
84
82
80
18
85
83
89
87
87
85
88
86
93
91
90
88
90
88
93
92 su habilid ad. a de
76 80 76 81 85 83 84 89 86 86 90 .. : . ' Una tabla comple ta como la 9.6 es la mejor manera de obtene
r conclu ·
81 80 73 siones del aprove chamie nto esperad o dispon ibles a los usuario
74 74 s de
pruebas. Gracia s a ella se ve directa mente no sólo si el alumno está las
78 79 83 80 81 87 83 84
19 78 71 71 76 72 77 80 78 '78 84 80 81
76 75 68 6~ 13 70 74 77 por
75 76 82 77 78 arriba o por debajo de lo que se había predich o de su conoCi miento
72 72 66 67 71 67 72 74 72 73 79 74 74 o de su
69 69 64 64 68 65 69 70 aptitud de las puntua ciones de prueba , sino tambié n qué tan extrem
-las desviac iones de su promed io de grupo. Sin embarg o, estas puntua as son
69 70 15 70 71
66 66 61 61 65 62 67 66 66 67 71 66 67
62 62 58 58 62 60 64 62 63 ciones
19
63 67 62 63 ·discrepantes son tambié n poco signific ativas, por lo que deben tratarse
56
58
SS
SS
52
SS 59 S7 60 58 60 59 63 58 58
mucho cuidad o. con
52 56 S4 57 SS 57 S6 58 54 54
S2 SO
52 49 53 52 54 51 54 52 53 SO SO " Primero, ningun a prueba de "aptitu d" es una medida pura del potenci
innato, sino que es una medida de lo que algunas veces se ha llamado al
49
46
49
45
47
45
47 SO SO 50 48 SO 48 48 47 47 46
dades desarrolladas, las cuales están influid as por mucho s de los mismo habili-
44 46 47 46 44 46 44 44 43
tpres que influye rren el rendim iento académ ico. Un ambien te hogare s fac-
44 42
43 42 42 41 43 44 43 40 43 40 40 40 41 39
40 39 40 38 40 42 40 37 40 36 36 37 38 ño esti·
37 37 37 35 37 40 36
3S mulante y de apoyo¡ buena habilidad para el lenguaje, interés por la lectura
aplicación al aprendizaje escolar, son alguna s variables que tendrán efecto y
33 37 33 31 33 35 31
3S 34 35 32 34 38 32 3D 34 3D 27 30 32 27
32 31 33 29 31 36 29 27 31 27 23 27 29 23 las medidas de aptitud , de la misma manera que afectan el aprove chamie en
30 28 30 27 28 33 26 24 28 24 19 24 26 19
acádémico. Así, cuando fijamos una expecta tiva baja para el aprovechamie nto
27 26 28 24 25 31 23 21 26
25 23 26 22 23 29 20 18 23
21
19
16
13
21 23 16
!obasados en una "aptitu d" baja, decimos que "debido a que este niño n-
18 20 14
no tiene
,Un buen aprove chamie nto, no podem os esperar que lo alcance
22 21 23 20 20 27 17 16 21 16 10 16 11 ", y con esta
20 18 21 17 18 25 14 14 19 . actitud perpetu amos en nuestra expectativa el fracaso pasado de aprendi
3S " 16 19 15 16 23 12 12 17
14
12
8 13 9
de ese niño. zaje.
6 11 8
34 16 14 16 13 14 21 10 10 15 11 4 8 6
33 14 12 14 12 12 19 8 8 13 9 3 6
Segundo, dadas justam ente las correla ciones sustanciales entre las medi-
4
32 12 10 12 10 10 17 6 7 11 7 2 4 3 das de aptitud es escolares y las de aprove chamie nto académico, las discrepan.
31 11 9 11 9 9 15 4 6 10 6 2 3 2 .~ias entre ellas se estiman como con un nivel de confiabilidad
bastant e
.Así, los valores de percentiles reporta dos en la tabla 9.6 son mucho bajo.
30 10 7 10 8 7 13 3 S 8 5 1 2 1
29 a 6 8 7 6 12 2 4 7 4 1 menos
28 6 S 6 6 S 10 1 3 6 3 c,onfiables que los percentiles que se reporta rían para un grupo de grado
. ;p,let,o o para un grupo de edad comple to. La confiab ilidad de estas diferen com-
27
26
S 4 8
:de puntua ciones está en un rango que va desde cerca de 0.50 hasta 0.70 para cias
4 3 7
24
22
2
1
2
1
5 las diferentes secciones de la prueba de aprove chamie nto, mientras que las
3
20 confiabilidades de las prueba s de aptitud y de aprove chamie nto por separad
1 o

. 1
334 CAP, 9, APTITUD ESCOLAR
DECISIONES ESCOLARES 335
están alrededor de 0,90, Entonces, sólo a medida que el individuo muestra
una desviación extrema, en términos de percentil, del valor promed,io de la , , de la Universidad de RadcIiffe tienen pUntuacI'ones e ' 1
' , , de CI d e 130 o mas,
deSVlaClOnes " Este es un caso extremo qUlva entes a
PEE de su grupo podemos decir confiablemente que su aprovechamiento se " elec(IVOS, e1 90%o se u b'Ica por encima de una desviación
, pero en
ubica por arriba o por debajo de lo esperado. ,.":,,,: ,." AA"',O,no;: muy s deotros
CID
.eqUIvalente a 120, '
, ,: Obviamente, el ritmo al que puede proceder la instrucción el t' d
"
ntate~Ia'1 d e 1ect ura que pued e usars~ y l? abstracto con que puedan' presentar-
IpO e
PRUEBAS DE HABILIDADES COGNOSCITIVAS
y DECISIONES ESCOLARES sel~s Ideas verbales, c<?I?o las c1uantltatlvas, son muy diferentes en estas insti-
tuCIOnes en comparaclOn con as de las universidades estatales del Sur e 1
" pro~e d'10 es equivalente a un CID de 93. No existe mucha
que 1a puntu,a,clOn , n as
Existe un amplio rango de decisiones acer~~ de los estudia~t~s o por los ' documentaclOn especIÍlc,a acerca de la manera en que la instrucción en las
estudiantes, para quienes las pruebas ,de h~?Ihda~es cognoscItlvas ya, han ', ~!leIas aItament~ sel~ctlyas desde los grados primarios hasta la universidad,
sido utilizadas o podrían usarse. A contmuaCIOn reVlsa~emos a~gunas de estas .. ~ifl~~e de la de las InStItUCIOnes no ~lec,tiyas que admiten un amplio rango de
y consideraremos las ventajas y los problemas que podnan surgu de tal uso, ,~abihdad. Se pued~ pensar que e~ mas facIl enseñar en una escuela muy selec-
,tIVal q?e el e~tl~d}an~e que s~ aJ?st~ a}as demandas de ésta aprenderá más:
teera mas, escn~Ira ma~, trabajara mas mdependientemente, se desenvolverá
Decisiones de admisión e~ u~ rango mas amplIo de cu1t~ra acumulada. Depende de la concepción
P!?pIa de !o que es una bu~na socIedad, este progreso acelerado de una frac-
En todos los niveles del sistema educativo, algunas escuelas son selecti- , clOn relatIvamente pequena de la población puede considerarse un bien
vas, EIrel nivel elemental, esto tiende a ser privativo de e~cuel~s de gran repu, .' , social, así como un bien individual.
tación, donde hay más de un solicitante para cada lu9ar dIsp~m~ble, En el mvel ' ' ',' . Las d~c~sion~s de a?misión están manipuladas de manera típica en un
secundario estas escuelas privativas se unen a un numero lImItado de esc~e­ lllVeI ad?1~mstratIvo, y es~~ debe ser aSig?ado 'a una persona o a personas que
las especializadas que son secundarias pública~ per? que enfocan su atenCl?" ", .. se~peclahzan,en tal funcIOn, Esto permIte un grado de estabilidad en los cri-
en la preparación académica intensiva en las c~e,~cIas o en l~s artes y,que ~le­ ~enos y los estandares q~e es bastante menos probable para algunos usos más
nen una gran cantidad de candidatos par~ ad~IsIOn , En los m:veles umve~slta. :' mformales y descentrahzados de los resultados de la prueba,
rio , de posgrado, la mayoría de las InStItuCIOnes son selectIv~~ ~asta,cIeno
grado y algunas muy selectivas, aunque el concepto de admlsIon ablen~ a ,
todos los graduados de educa~ión secu?,d~ria es aceptado en algunos '-VJ,<.):.J'U'," :Decisiones de colocación
y universidades de la comumdad o pubhco~, "
Cuando la admisión es selectiva, se reqUIere algun tIpO de prueba de ".' ' ~., En una escuela puede haber una gran cantidad de decisiones de coloca-
tud académica como un punto de información que l~ escuela. deb~ cOlnsÍl:leT<I(~n ' ClO~, las cuales, se requieren cuando hay varias alternativas en los cursos dis-
para tomar la decisión de admiti~ o ~echazar. En los mveles pnmanos, " pom~les (P?r ejemplo, álgebra e? oposición a aritmética para los negocios) o
escuelas privadas se apoyan pnncIpalmente en los resultados de la , ~mbla e~ n~mo dentro de un mIsmo curso (por ejemplo, álgebra en un solo
Stanford-Binet, aunque también pueden emplear las pruebas de , ,ano academIco o dura~te dos año,s), Aunque la colocación probablemente se
académica estudiadas en el capítulo 10, Las pruebas grupales se , , >,base en ~I aprovecha~lento anten,or en la,materia específica o en una prueba
ralmente en nivele~ más altos, y algunas veces l;s prueb;s que ~stan a ,', ,de pronostICO espec:fl~a, en oca~lOnes mnguna de las dos está disponible,
ción en los comercIOs y que suelen ser pruebas seguras se revlsa,~ cada ' "Entonces, puede s~r ,util ~na medida general de funcionamiento cognoscitivo
se preparan especialmente para este tipo ~e programas ~e evaluacIon, El ayud,ar a decIdIr ~~al es el ~rograma ? .tratamiento más adecuado para
cio de Pruebas Educativas produce en el mve~ secundano la~ pru~bas de candIdato, o tamblen la medida de habilIdad puede recibir alguna ponde-
sión para las escuelas secundar~as y par~ el mgreso a la ~mversldad la ,como un complemento ,al aprovechamiento previo,
de aptitud escolar de la direccion de examenes para, ~llllgreso en l~ " EXIst~n dos for?Ias de c\,locación, En una, las metas de ambos programas
sidad. (Otro de los principales programas de ,evaluaclOn p~ra la admlslon a las nusmas y solo ~~mbla la forma de lograrlas¡ por ejemplo, en la selec-
universidad es el orientado al aprovechamiento, es declf, el programa entre la presentaclOn de uno o de dos años de álgebra inicial. El aprove-
pruebas de evaluación para la Universidad estadounidense.) pr~vio en,aritmética~ P?siblemen~e complementado por una prue-
Cuando se usa una de las pruebas mencionadas, que suelen pronostICO en algebra, qUlza sea la mejor base para tomar una decisión
con una revisión del aprovechamiento escolar previo, normalmente este caso: ~n la segun?a forma, tanto las metas como los caminos para He-
mayor homogeneidad de la población estudiantil resultante. ~l a ellas dlfIe,ren¡ por eJemplo, en la selección entre el álgebra y la aritmética
las puntuaciones de la Dirección de Universidades SAT a la mIsma lo~ negOCIOS, Un~ medida de habilidad general podría ayudar a determi-
se .usa para la prueba Stanford-Binet se calcula, por ejemplo; que el 90% que metas educativas generales parecen realistas para el individuo¡ por

,
j'} ,', ...
l' ." '~.
L:
336 CAP. 9. APTITUD ESCOLAR

337
. . ., . ersitaria es un objetivo apropiado, y que
eje~plo, SI la edu~agorr ~n~~s cursos específicos que el individuo "VU"JIUelre'
pudiera, a su vez, In u .
;ni~cÍ!¡iOllleS dentro del salón de clases

apropiado
L d tomar.
.. es de col · ' ·In ternas a una escuela sond·
ocaClOn responsa
d . '.'.' Las decisiones referentes a las admisiones, la colocación y el agrupamien-
as eCISlOn ' d la persona o las personas eSlgna as en ·t~ ocurren prí~cipalmente a. nivel .administrativo dentro de la escuela. Las
el departamento correspon len e, d
dad del personal de aseson ? : cori mayor o menor participación del'
. . ' . decisiones que lllvolucran pnmordlalmente al maestro, para quien las prue-
:, bas de habilidades generales podrían tener algún valor, son aquellas que se
estudiante. .
. ·refieren al diagnóstico, a la solución y a la referencia. En el nivel más crudo,
con un juicio de diagnóstico se pretende saber si el niño está apr9vechando la
"" educación en el nivel en el que apropiadamente cabría esperar. Este es un jui-
Decisiones para formar grupos · do que tiene sus propias trampas, y ya lo hemos estudiado en alguna medida
": en la sección anterior. El diagnóstico adquiere sus ventajas por medio de la
' gandes :: comparación de lo semántico (verbal) y lo figurativo (no verbal) en medidas de
En la mayoría de las escuel as m~s r . hay losos suficientes
del mismoniños
gradoa .... . habilidad, lo cual proporciona la evidencia de si el niño tiene habilidades no
d d dad a de manera que se necesitan vanos grup d di .
e a, d· ·1 L pos se pue en or enar a verbales que sugieren otros caminos para el aprendizaje. Por supuesto, la
satisfacer la demandad~st~ lant~·t O~tf; Un enfoque ampliamente .. ' ..· apreciación de las habilidades verbales y no verbales representa sólo un primer
mediante algún proce lmlento SIS ,e~s" Cuando se ha intentado el '.' " paso en el estudio diagnósti~o par~ .determinar si el. ni~o exhit;>~ muestras de
es tratar de log~ar "grupos ho~Og~:ple;do las medidas de habilidad . retraso mental o de alguna mhabIlIdad del aprendIZaje espeCIfIca.
miento homogeneo, a veces se an o una de las bases para ese . Si se decide que el niño tiene una inhabilidad de aprendizaje específica, el
citiva general como una base o com amiento es que el maestro capaz patrón de puntuaciones.en una pz:ueba ~e habilidad puede proporc~onar pis-
La razónele~
adaptar que yseelfunda
ntmo e~~e ~g7J( nstrucción a las características de la clase.
~onten! o e al
tas para hacer un trabajo correctIvo. SI el problema parece ser mas agudo,
el patrón de los resultados de la prueba de habilidad, en combinación con
que se le encome?d? ens~r;:r·_os se han realizado estudios con los que . 'medidas de aprovechamiento y observaciones dentro del salón de clases de la
Durante los ultI!ll0~ an d· s atrones de agrupamientos llu.1l1U, ... ... . , co~ducta del niño, puede sugerir al maestro la necesidad de Contar con una
it;tenta aprecibr ~~r~~~C~~t~~ l~~uár~~sfue~on revisados por ~indley y ayuda especializada y lo apropiado que sería enviar al niño a un programa de
geneos o por a 1 l . . d tratar de aplicar agrupamIentos llU1UtJ1'.<O: instrucción correctiva o efectuarle un estudio diagnóstico más intensivo.
en 1971. En ge~erdal'lla ven~Ja t es es que la mitad del 95% parece haber En sentido positivo, el maestro puede emplear las medidas de aptitud
neos a la mayona e os estu Ian e 1 miento escolar general para considerar con un estudiante los futuros planes educati-
do poco efecto o ha.ber si~o ~~~~~if~~~: ~~r;:~~:~~~~u~IT;~lase, y "_" ~""" vos y vocacionales de éste. Especialmente en los niveles secundarios, los resul-
~~n~~~~K:e~~~=í d~l~::::ul:ados de investigación ~ugiere qU~~S tados de una o más pruebas de aptitud escolar pueden ayudar a identificar a
áquellos estudiantes a quienes se debería dar atención e información acerca de
ones
noque
sonhacen .o~ maestros ~n
l
lo suFICIentemente
espuesta al agrupamIento no s Sm;rall1(;l;aJt:li'hJl:'l~'
r t an tes para obtener mejorías notables en
Impar
ingresaren la universidad y, tal vez, continuar con estudios de posgrado que
requieren una gran demanda cognoscitiva por parte del individuo.
aprovechamiento escolar. . en el .
Las ~~ases especiales para 10~ldes:I~tfu~e:~.e~0~1 extremo más bajo
cognoscItlvo.r~prdesenltlan un pro :::; en el que parece que el niño no es
ango de hablhda se ega a un pu l.
de be?eficia~se. ~: ~~a~~~~í:: e~;:d~~e:se::
de la instrucción la paso or;a!.mcu¡; .; Las pruebas de habilidad cognoscitiva general tienen una función obvia
d
trucclOnal dlstmto. Poner a un nm b hacerse a la ligera. La evidencIa ¡~n el programa educativo Como fuentes de información importantes para las
y las decisiones para hac~r. esto no e e n . uede ad uirir por . responsables de la asesoría y de la ayuda al niño con problemas de
funcionamientó cognOSCItIVO es bastante °bbVIa y ~~ p del niñ~ dentro de personal y social, para desarrollar actividades de educación especial
~~~i~~t~:~oi~r~~eb~: la~ est~
b ' o mediante l a o servacIOn
a que el desempeño en pruebas in2::do él, ayudarlo a decidir los objetivos educativos apropiados y trabajar con
' a fin de formular los planes vocacionales. En los planes y las decisiones de
el lenguaje, los antecedentes soci~~es y .la ~daP.~clI~~ a~~~::::~~ de' tipo es importante tener una imagen clara de las habilidades intelectuales
p~:~~~~t:!~~e~~~b~~~ ;!r~~f~~~~~i~~~~a~~lases !specia.l~s, si~Onto alumno como un aspecto de su concepción total como individuo.

~~~~~:a::iad;e~~fó~d:~~~~:~~a~;~~~I~nu~n~a~l~s~ue:g:~~1~:;110s
. . En la asesoría educativa la información acerca de la aptitud escolar es
.. importante. Esta información debería ser fundamental para
decidir los objetivos educativos apropiados para el alumno; es decir, si és-
con retraso mental.
.~edesea ingresar en la universidad y, si así es, qué tipo de universidad escoger o
1 .

338 CAP. 9. APTITUD ESCOLAR


PREGUNTAS Y EJERCICIOS 339
qué clase de programa de escuela secundaria seleccionar. En la asesoría VOCa_
· es con el aprovechamiento académic S'
cional es deseable realizar otras pruebas de habilidad más '
que consideraremos en el capítulo siguiente, como un complemento de la '.
.' ·. . sustanciales en el desempeño de l'
In ebbargo, también existen
'. tipo ~e trabajo. Más aún, el éxito orlo: prue a entre ca?a persona y
prueba de inteligencia general; pero estas pruebas especializadas no son . se relaCiOna con las habilidades cog'~osc ' f enobs en algunos tIpOS de traba-
importantes en la planeación educativa: Para comprender a un niño que cons' , · . . 1 Ivas a stractas medidas por tales
tantemente tiene problemas en la escuela, ya sea·éon el trabajo escolar o '. , " Las diferencias de grupo en laspunt " d ones'
su ajuste personal, es básico calcular su nivel intelectual. Como ya menciona' . .,¡ • uaCl .
•deCIr, el sexo, la raza y la edad) deben inte e prueba de m.tehgencia (es
mos, las pruebas individuales y no verbales son complementos altamente vista de las diferencias de los antecedentes rpíetarse z.nuy. tentatlvamente en
deseables al grupo común de pruebas cuando se sospecha que hay algún impe; . distintos; sin embargo, las diferencias ind' ~d a íxpen~ncIa para estos grupos
dimento en la lectura o en el lenguaje en geqéral. importantes que necesitamos usar sabi IVI ua es en as pruebas son hechos
l~grar su ajuste en los mundos escolar ;iae~:af.ara ayudar al individuo a
RESUMEN
PREGUNTAS Y EJERCICIOS
Aunque las pruebas de aptitud suelen depender de la enseñanza eS¡:leCítíca
de manera menos directa que las pruebas de aprovechamiento, debe reconó~ .... J. Se ha propuesto que todas las pruebas d ' T .
cerse que ~ualquier prueba de desempeño es, en algún grado, una función de aptitud escolar. ¿Cuáles son los méritos e Ir te ~ge.ncI~ deberían llamarse pruebas de
l
2. ¿En qué aspectos es preferible confi y as IbltaclOnes de esta proposición?
la experiencia y los antecedentes del individuo. Las pruebas de aptitud se dis-
tinguen, por lo menos en parte, por su función, es decir, por predecir los .' mar la inteligencia de un alumno ar ~n una ue na p~«?ba ~e aptitud para esti-
. maestro? ' mas que en las calIfIcacIOnes hechas por el
logros futuros.
Entre las pruebas exploradas más detalladamente y que más se usan como .• 3. En cada situación siguiente 'ele irí
prueba individual?, ¿por q~é? g a usar una prueba grupal de inteligencia o una
pruebas de aptitud están las de habilidades cognoscitivas que se aesilgnan .:flfi.
genéricamente como pruebas de inteligencia o pruebas de el. A medida qm: ·".~! . a) El estudio de un niñ '. '. .
se han desarrollado estas pruebas, han tendido a destacar habilidades b)) LLa seIecc~ón de estud~a~~~s s;~~~s 1~~~~~~hte~!0:n1:~a~la.
citivas abstractas, habilidades que tratan con ideas y símbolos, y se les pue- ' e a asesona para los planes de e l ' d' ena.
de considerar primordialmente como pruebas de aptitudes escolares. d) El estudio de los niños me~~: as secun tn!l, preparatoria y vocacional.
Los dos patrones principales de estas pruebas son las pruebas &'U'IJ'U'"' Arizona. nos en e SIstema escolar del estado de
las individuales. Las primeras se asemejan a las pruebas de apro'.ec:ha:mi(!nt(' ~ e) El trabajo con un grupo de delin . . .,
de respuesta corta en el formato, son mucho más económicas para usarse . '" fJ La identificación de fuentes de difuelt~ Jn una.:nstltUCIOn estatal.
leer. ICU ta e un mno que no puede aprender a
más satisfactorias para muchos propósitos cuando los examinados son .
normales de edad escolar o más grandes; sin embargo, las pruebas In'llVI<1UlaIenl~. ; 4. S.i ust~d aplica rutinariamente una rueba d ' ,
tienen muchas ventajas y son particularmente útiles con niños peIIUf:fio:s"
casos con perturbaciones emocionales y casos con incapacidades t;UIUl;.ll1V,a~~
.'. SItuaCIOnes usaría las matrices de
BineH, ¿por qué?
¿ e ap~ltud, ¿en cual de las siguientes
ven y en cuales otras la prueba de Stanford-
específicas.
Las pruebas especiales se han diseñado para los grupos preescolares y a) Para evaluar a los niños puertorri - . '
de Nueva York. quenos que mgresan en la escuela en la ciudad
los infantes, para grupos con impedimentos educativos y de .
b) 'Para seleccionar niños para u cl '
como para grupos con culturas y clases sociales diferentes. Estas pruebas e) Para evaluar la inteligencia ennaun ase esPleclal de niños superdotados.
den tener un valor práctico en casos especiales, aunque más a menudo d) P d' ._ a escue a para sordos
como instrumentos de investigación. ara estu lar a los nInos que tienen problemas de lect~ra.
Los resultados de dichas pruebas con los niños de edad escolar son .•..""5. ¿Las pruebas grupales de inteligencia so "i1
.
confiables como lo pueden ser otros instrumentos de medición PSl·.coIIÓgJlca~ '
.' deran las ocupaciones profesion 1 n mas yt es para lo~ estudiantes que consi-
Las pruebas individuales ampliamente utilizadas son la escala de Im:ell.geLI[;II! ,. .' ~mpos de entrenamiento de habifiJa~:s;r~ os qU~lconslderan Ocupaciones en
Stanford-Binet y las escalas de inteligencia Wechsler, probablemente ..'.. 6. zCu,á1es son las conclusiones rinci 1 ., zpor ql!e.
confiables que las del grupo típico, aunque las diferencias no sean muy .• ..• ... ¿cuáles son las limitaciones dP 1 sa es que podna usted sacar de la tabla 9.4?,
des. A pesar de la alta confiabilidad, se pueden esperar diferencias COJ1S1clera,
'Jf-.
En un artículo noticioso se inf:~~ atos pr~sentados en ~sta tabla?
" . para enfermos mentales porque teníi~~ ~~aJ~~~hqb: h~bla estado en un hospital
bIes entre una evaluación y la otra.
Cuando las puntuaciones de prueba de habilidad general se estudian
" el hasta 118 en los tres años que ella h b' d a lit
., e~ónea en este enunciado noticiosol ~ la, esta o con n~da ahí. i.Cuál es la parte
do capaz de aumentar su
relación con el aprovechamiento en el mundo, el vínculo más claramente . Clas entre los dos CI? ., zque factores podnan explIcar las diferen-

. ... - , . ': .. '


340 CAP. 9. APTITUD ESCOLAR
LECTURAS ADICIONALES 34 1
8. ¿En qué aspectos las pruebas de int.eligencia s~n. mejores qu~ las. . Public Health Service, Govemment Printing.office Washington D C d' .
obtenidas en secundaria como predlctores del exlto en la uruversldad?, ¿en 1971. " . ., IClern-
aspectos son menos buenas? W., Soto D ., Parks, M ., Ngissah, P. y Jones R "Motivation rac .1 l
9. ¿Por qué las pruebas de inteligencia muestran más altas correlaciones con las Q" ,en , ouma1 of Ed ~catlOna
. 1 ' ., , e , socIa c ass
Psychology, 68, 1976, págs. 273-285 '
bas de aprovechamiento estandarizadas que con los grados escolares? J. M., Assess~ent of mtelligence, W. B. Saunders Co., FiladeIphia i974
10. Comente el enunciado: "Los encargados de la admisión a la universidad rlt ..,.,..,,,,vu, L. c., Schoolmg and subsequent success: Inlluence of ability b k' ti
descontar las puntuaciones de prueba sobre aptitud escolar de los solicitantes formal educatíon, ACT Research Report No. 57 The America¿ ¿cll gro~n ,
provienen de grupos socioeconómicos bajos". ting Program, Iowa City, Iowa, abril, 1973. ' - o ege es-
lI. Si suponemos que usted es un maestro del cuarto grado y que acaba de recibir myth of measurability", en The National Elementary Principal 54
resultados de su clase de una administración a nivel nacional de las abril, 1975. ' , marzo-
habilidades cognoscitivas en el cuarto grado, ¿qué uso podría dar a TbOfJ10l.Kt:, R. L., The concepts 01 over-and under-achievement Bureau of P bl" _
dos?, ¿qué información adicional ~e~~sita~a? . . Teaclhelrs College, Columbia University, Nueva York: 1963. u lca
12. Un estudiante del octavo grado reclblO las sIguIentes puntuacIOnes de edad
dar sobre las pruebas verbales de habilidades cognoscitivas: cuarto
sexto grado, 116, y octavo grado, 104. ¿Cuál seria la mejor cifra que re))reSerltariiJ"1
el nivel de aptitud escolar uverdadero" de ese niño?
13. Una escuela en una comunidad próspera aplicó las pruebas de inteligencia
ford-Binet a todos los niños que ingresaban en el jardín de niños y a
. , niños del primer grado que no habían sido evaluados en el jardín de niños
de la primera o segunda semana de clases. ¡Qué tan deseable y útil es este
miento?, iPor qué?
14. Un sistema escolar quería fijar los procedimie!1tos para identificar a los alumnos
que recibieran instrucción especial en lectura. Estos serían los alumnos cuya lectu-
ra se ubicam por debajo del potencial para aprender a leer. ¡Cuál sería el .
miento adecuado para lograr esto? '

LECTURAS ADICIONALES
Anastasi, A., "Common fallacies about heredity, environment, and human "CILla'fUlr- "
'.¡ en, ACT Research Report No. 58, American College Testing Program, . ~: .'

Asbury, Ch., A., "Selected factors influencing over -and underachievement in YU\JI~·J" I.
school- age children", en Review of Educational Research, 44,1974, págs.
428.
Bradley, R. H., Y Caldwell, B. M., "EarIy home environment and changes in
test performance in children hom 6 to 36 months", en Developmental1'8vc~lo- ~lf.
logy, 12, 1976, págs. 93-97.
Butcher, H. J., Ulntelligence and creativity", en Kline, P. (dir.), New Approaches
Psychological Measurement, John Wiley &. Sons, Nueva York, 1973.
Casler, L., l/Maternal intelligence and institutionalized children's developmental
tients: A correlational study", en Developmental Psychology, 12, 1976,
64-67.
Churchill, W. D. y Smith, S. E., "Relationships between the 1960 Stanford-Binet
and group measures of intelligence and achievement", en Measurement and
luation in Guidance, 7, 1974, págs. 40·44.
Cunningharo, W. R. y Birren, J. E., 11Age changes in human abilities: A 28-year
tudinal study"., en Developmental Psychology, 12, 1976, págs. 81,82 . .
Hopkins, K. D. Y Bracht, G. H., "Ten-year stability of verbal and nonverbal IQ
res", en American Educational Research foumal, 12, 1975, págs.
. ''':'~;'''
Loehlin, J. C" Lindzey, G. y Spuhler, J. N ., Race differences in Intelligence, W.
Freeman and Company, San Francisco, 1975.
National Center for Health Statistics, Intellectual development 01 children by
graphic and socioeconomic factors, DHEW Publication No. (HSM) 72-

,-
'j' JI,
.,
'

PRUEBAS Y BATERrAS 343


los psicólogos empezaron a estudiar el área laboral fue eVI·d t
,requen.a , d·f h b·l·d d ' en e que
1 erentes a 1 1 ~ t?s especiales y distintos niveles de
lial~I11,aaa C;U.l:,IlU':;l,;l'~,lIV.'a general. El me<;amco automotriz requería un buen
~¿;Iloc:imliellto mecamco, .~ero poca flUIdez verbal, mientras que el abogado
. comprenSlOn verbal, p~ro no ha?~idad mecánica. El bibliote-
ne,l,;c:,Jl,tUiI tener una buena h~bIh?,ad numenca, mientras que el relojero
~!í'ie~~SI1Ca['3 .te~er una buen~ ~oordlllaclOn_ el! los movimientos de los dedos.
requenmIentos de habIlIdad de los dIstmtos trabajos diferían a lo 1
10 las diversas dimensiones especializadas.
Al m~smo tiempo, la i~ve.stigación demostró que las habilidades humanas
argo

en CIerto grado, e.speclahzadas. Esto ~e ha demostrado en los estudios de " '

'COITe13I,;JIUU entre las diferentes prueb~s_ Considérense las correlaciones que se


• .. en la tabla 10.1 entre las seI~ pruebas de una b~tería empleada para
Medición de , cl~siÍlcar a los hombres. en la Fuerza Aerea d~ Estados U mdos (DuBois, 1947).
, Notese que las correlaclOnes entre las dos pnmeras pruebas son relativamente
aptitudes especiales altas, mucho más altas que las correlaciones de las cuatro pruebas restantes.
Estas dos p~e~as son verbales en su naturaleza y aparentemente definen un
factor de habIllda~ ~ara man~jar relaci~nes verbales. Las pruebas tres y cuatro
: ' s?n prueb~s numencas ~ estan sustanCIalmente correlacionadas. Las pruebas
, c~nco Y seIS se correlaclOnan entre sí e implican rapidez de la percepción
visual.

Las pruebas estudiadas en el capítulo 9 son pruebas de habilidad cognosci- Tabla 10.1. Intercorrelaciones de los pruebas de aptitud de lo Fuerzo Aéreo seleccionados
tiva general que, en muchos casos, proporcionan como resultado una sola
puntuación que representa una apreciación total de las habilidades del indivi- ' 2 3 4 S 6
duo para manejar ideas y relaciones abstractas¡ sin embargo, varias de ellas
producen dos o más puntuaciones de una naturaleza más especializada que, 1. (omprensión de la lectura 0.50 0.05 0.23 0.13 0.11
están diseñadas para proporcionar información más específica y analítica ' 2. Información 'del copiloto O_50 0.16 0.25 0.17 0.15
acerca del individuo, por ejemplo, las escalas Wechsler de CI verbal y de , 3. Operaciones numéñcas 0.05 0.16 0.44 0.27 0.11
desempeño- Como resultado del interés acerca de una información más espe- ' 4. Lectura de cuadrantes y tablas 0.23 0.25 0.44 0.39 0.23
cífica o segmentos más restringidos del dominio de habilidad se han diseñado ' 5. Identificación de velocidad 0.13 0.17 0.27 0.39 0.43
baterías de pruebas y pruebas particulares para medir las aptitudes especializa~ ,
das. En este capítulo analizaremos tales pruebas y centraremos nuestra aten- 6. Oñentación espacial 0.11 0.15 0.11 0.23 , 0.43
ción, primero, en las baterías y pruebas diseñadas para la orientación y se-
lección vocacional¡ después estudiaremos las pruebas especializadas para la ,
predicción y el pronóstico en las materias escolares individuales y en tipos
especiales de escuelas¡ finalmente, examinaremos de forma breve los cam~ Durante los últ~mo.s. 50 años se ha realizado demasiada investigación
pos espepializados del arte y de la música, así como los esfuerzos por evaluar acerca de la orgamzaclon y estructura de las habilidades humanas. En
la ~~y'oría de esta investigación se ha empleado una técnica conocida como
la "creatividad". anall~l~ .de factores, que trata de buscar los factores de habilidad básicos_
, El analisls de factores'empieza con un tabla de correlaciones como la mostra-
PRUEBAS Y BATERÍAS DE APTITUD , da e~ la tabla 10.1, pero ordinariamente es mucho más grande e incluye una
, ~~Idad mucho más. considerable de variables de prueba. Por medio de proce-
VOCACIONAL dimIentos computaclOnales, de los cuales no entraremos aquí en ningún deta-
,Ue (para una introducción acerca del análisis de factores consúltese la obra de
Uno de los primeros puntos prácticos que afrontaron los psicólogos
la guía de los jóvenes en los tipos de trabajo que podrían proporcionarles
~ronbach, 1970~, ~l análisis de factores ~ntenta identifi~ar un número peque-
no de factor.es baslcos que puedan explIcar una serie completa de relaciones
cidad y éxito, así como seleccionar una empresa para las personas que " , entre las vanables de prueba. Cada prueba tiene una carga de cada factor, que
eficientes y satisficieran los requisitos del trabajo pm.:desempeñar. A medi- •

342

~-,,-
'-' . ' ..... :. : ... .... ...
. , .. , . .... ; .. " ...'"
.'
344 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES
345
corresponde a la correlación de la prueba con el factor, y el analista trata de .
obtener un patrón de cargas de factores que sea simple y psicológicamente sig-
nificativo. Las correlaciones en la tabla 10.1 pueden representarse por una
serie de cargas de tres factores, como se muestra a continuación:

Factor

2 3

(omprensión de lo lecturo 0.72 0.04 0.04


Informoción del copiloto 0.70 0.14 0.08
Operociones numéricos 0.08 0.71 0.00 (01
lecluro de toblos y cuodrantes 0.28 0.57 0.30 (bl
Ropidez de identificoción 0.13 0.37 0.58
Orientoción especiol 0.13 0.02 0.63

l'

Nótese que la Comprensión de la lectura y la información del copiloto


tienen cargas sustanciales en el primer factor que podría identificarse co-
mo un factor verbal. Las Operaciones numéricas tienen cargas apreciables
sólo en el factor dos, que podríamos llamar factor numérico. La Lectura de
tablas y cuadrantes tiene su carga mayor en el factor dos (numérico', pero es
una prueba compleja que también requiere, en alguna medida, los tres facto-
res. Las últimas dos pruebas, que son primordialmente de velocidad de pero
cepción visual, tienen su carga más grande sobre el factor tres, por lo que lo
llamaremos factor perceptual¡ sin embargo, la Rapidez de identificación
también tiene una carga apreciable en el factor dos y, debido a que esta prueba
no tiene ninguna relación con números, dicha carga·sugiere que nuestra inter·
pretación del factor 2 como un factor numérico necesita modificarse para
incluir el aspecto de la rapidez. La interpretación de factores es algo en lo que
debe contribuir el investigador, ya que es importante la comprensión que teo·
ga de la naturaleza de la prueba que muestra y que no muestra cargas en un
factor detenninado.
La investigación ha indicado que se pueden distinguir bastante bien varios
factores de habilidades especiales, como la comprensión verbal, la fluidez de
palabras, la fluidez numérica, la rapidez perceptual, el conocimiento numéri·
co, la visualización especial y los razonamientos inductivo y deductivo. Asi- .
mismo, la mayoría de estas habilidades están relacionadas entre sí, en cierto " . ~
grado. Las pruebas de habilidad cognoscitiva general estudiadas en el capítulO ' "Figura 10.1. Mari d b' I h ..
,. ',: lo·, b era e (Once Ir as abllidades cognoscitivas: o) estructura jerór uico'
anterior reflejan un conjunto de varios de estos factores por separado, jun· ':'),\ ~ estructura de foctores múltiples. y e) estructura tridimensional de GUllford~ .
to con la acentuación de un núcleo común.
Los datos acerca de las habilidades cognoscitivas o intelectuales conducen '
por sí mismos a varias interpretaciones alternadas, las cuales se observan eola
figura 10.1, de acuerdo a cómo consideremos el núcleo de traslape entre cada • . . · 'i96~na interpretació? más .váli?a ~~cha por psicólogos ingleses (Vemon,
prueba. . . media muestra }~s dIferenCIas mdlVlduales en habilidades cognoscitivas
nte una gra[¡ca que semeja un árbol con ramas, en el cual el tronco prin-

,.
.: .. ..4
') . .

346 CAP. 10_ MEDICIÓN DE APTITUDES ESPECIALES


i I
PRUEBAS Y BATERfAS 347
cipal es la habilidad intelectual general, dos grandes ramas representan las '
habilidades escolares opuestas a las habilidades Uprácticas", y las ramas meno- ' ',' ,~e~ido a que la ~~>nfiabiIidad de las partes es de 0.90 obv' ,
res corresponden a las habilidades más especializadas (verbal, numérica, espa. '
: roas de una habIlIdad por separado. A continuación ~e d Ian:bnte s~ medIa
, brevemente las ocho subpruebas.' escn en e Ilustran
cial, mecánica y otrasJ. Una segunda interpretación, que ha sido defendida '
por Thurstone (1938) en Estados Unidos y seguida por sus muchos discípu_ 1. Razonamiento verbal. Los reactivos son de doble analo ' S d .
!
¡ , los, muestra un número limitado de factores por separado, cada uno aparece 'co pares de palabras para completar la analogía. gla. e an CID-
en algunos tipos de pruebas y desempeños en la vida, con cada medida depen_ "
diente de sólo dos o tres de una serie de factores. Ninguno de los factores de ' Ejemplo
Thurstone se consideraba que tuviera una naturaleza general o un rango '
_ - - - es a noche como el desayuno es a _ _ __
mayor a todos los demás factores. Thurstone identificó originalmente siete '
factores, pero este número se ha incrementado gradualmente a medida que AlCena-esquina
otros investigadores trabajaron con otra clase de pruebas. En 1951 se revisó la B) Gentil-mañana
investigación acerca de las pruebas de habilidad y se identificaron tentativa. , C) Puena-esquina
mente 59 factores distintos de todas clases (Franch, 1951 J, como los que DI Fluir-gozar
habían encontrado los investigadores hasta esa fecha. " El Cena-mañana
En un análisis sistemático que precisó más la noción de los factores espe- 2. Habilida4,num,ériea. Co~siste en problemas numéricos que desta-
cializados, Guilford (1967) propuso que el intelecto podría analizarse en tér. ca~ .la comprenslOn mas que la SImple facilidad para efectuar cálculos arit
minos de una estructura tridimensional, basada en: aJ con qué tipo de mate- metIcos. -
rial se trabajaba; b) qué acciones se realizaban con él, y e) qué productos se
obtenían. Guilford propuso una estructura de 4 X 5 X 6 que daba como Ejemplo
resultado 120 celdillas; asimismo, realizó un programa de investigación 3 = ?% de IS
monumental del diseño de pruebas y de análisis, para comprobar si las prue-
bas se pueden generar de tal modo que correspondan a cada celdilla identifica- ' AJ 5
da de manera lógica. BJ 10
Mediante la investigación teórica acerca de la naturaleza de las habilida- C) 20
des, por un lado, y la investigación aplicada acerca de la validez de las pruebas DI 30
específicas para los trabajos específicos, por el otro, los psicólogos han diseña- El Ninguno de éstos
do baterías de pruebas de aptitud para aplicarlas en las asesorías educativa y .. ~', Razonamiento ~bstracto. Una serie de figuras problema establece una
vocacional, así como para seleccionar y clasificar al personaL Desde 1940, , relacIon ? ~nal secue!lcIa, en la que el examinado debe seleccionar la opción
aproximadamente, estas baterías han ocupado posiciones bastante centrales ' qU¡; contmua as senes.
en la investigación acerca de la evaluación, por lo que es necesario estudiarlas
con algún detalle. Primero, examinaremos dos de las baterías más ampliamen- Ejemplo
te utilizadas, una orientada primordialmente hacia las escuelas y otra hacia el :
uso industriaL Después revisaremos alguna evidencia acerca de la validez y "

1[J1C1IQI~1
consideraremos las ventajas y las limitaciones de una batería de este tipo.

Diferential Aptitude Test Battery (DAT)-


Batería de pruebas de aptitud diferencial
Esta batería fue promovida y patrocinada por The Psychological Corpo- ,
ration (Corporación psicológica) en 1947 como una guía para aplicarla en las ,
escuelas secundarias; las formas revisa~as y resumidas de esta batería se pro- '
dujeron en 1963 y 1972. En el diseño de la batería se pretendió obtener prue-,
bas separadas con bajas correlaciones entre ellas, pero el enfoque principal
/D!LJ!bJ!CJ!O/
A BCD E
centró en obtener medidas que fueran significativas para los asesores esco-
lares_ Como resultado de esto, con excepción de la prueba para empleados de"
rapidez y exactitud, las intercorrelaciones son cercanas a 0.50¡ sin embargo, . I Reproducido con penniso Copyright 1947 © 1961 6
poration Nueva York N Y T ' d I d h ,19 2, 1972 porla Psychological Cor-
, , . . o os os erec os reservados.

~ ... .' .: ..
t

" ~ ~ '.'.. ' , "" ..


348 CAP. 10. MEDICIÓ N DE APTITUDES ESPECIALES
349
4. Relaci ones espacia les. Se muestr a ,el.diagra:n.a de una fi!}ura
El examin ado debe visuali zar e indicar que figura sohda se podna
rI':J'Tnil .. '··
cir por medio del doblad o de la figura plana, como se muestr a en el
te ejempl o.

Ejemplo

A B

5 Razona miento mecán ico. Se muestr a el diagrama de un diseño mecá-


nico ~ de una situación y el examinado debe indicar cuál es la opción 7. US? dell~nguaie: ortografía. Se da una lista de palabra s, algunas de las
verdade- .
ra para la situación. cuales estan , esc~ltas de ~anera l~correcta, y el examin ado debe indicar
palabras estan bIen escntas y cuales no. qué

Ejemplo Ejemplo

Correcta Incorrecta
"
Dlna JI
11

A B . 8. Uso dellenguaie: oraciones. Se da una oración dividid a con marcas


cuatro subsecciones. El examin ado debe indicar qué sección contien e en
si no hay error, marcará una E.
el error·
'

11 11 11 11 JI

iVas a ir I juntosl a la escuela Ila próxima semana? "


JI
JI

11
" 11

. A BCD " 11

A B e D E
Las prueb~s de aptitu.d~~ diferenciales son podero sas con excepción
de la
de rapIdez y pre~IslOn del ~mpleado. El tiempo límite es, en la mayo-
. ,.. ' de l~s casos, ?e 30 mmuto s. El tlempo total para la evaluac ión
6. Rapide z Y precisi ón del emplea do. Cada reactivc;» consta de .... es d~ ClllCO a ClllCO horas y media, aproxim adamen te, debido adelola cual
batería
se
serie de combin acione s de símbol os, una de las cuales esta subraya
10 tanto, el examin ado debe marcar la misma combin ación en su hOJa
respues tas.
da:
as
. . ~eqUleren por lo menos dos sesiones de evaluac ión por separad o.
~e percent iles está~ disponi bles para cada grado desde el octavo
Las nor-
uodeclmo. Se proporCIOnan nonnas para cada subpru eba y para la combinhasta el
a-

:.. : .; .,.. . . .
~
. - - -_.. ..._.•......•._.-
. • .._.. _-
350 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES
PRUEBAS Y BATERíAS 351
ción razonamiento verbal de (RVI y habilidades numéricas (HNI, que pueden
emplearse como pruebas de aprec~ación gen.eral de aptitudes escolares. En la ó ~. APtit1d espa~ia!., LadPrueba n~mero 3: Espacios tridimensionales se
figura 4.5 se ejemplifica una forma de perfIl en la que pueden marcarse los ,tblrlsildeI·.a en a aI?r~cIacI~n e esta aptitud. El examinado debe indicar cuál de
resultados. .tres fIguras tndImenslOnal~s .se pued~ pr?du~ir mediante el doblado de la
hOJ~ pl~na de una forma especifica, con mdIcaclones de dobleces en los un-
.. toS mdIcados. p
General Aptitude Test Battery (GATB):"
Batería.de pmebas de apti~ud general
La GATB fue producida por el Buró ~e Seguridad p~ra el Empleo, del
Departamento del Trabajo de Estados Umdos, en los pnme~os an~s de la
década de los cuarenta. Dicha batería estaba basada en el trabajO preVIO en el
que se habían preparado baterías experimenta~es para c~?a tr~ba10: El anális!s
de más de 50 pruebas diferentes para.los tra,baJos especIflcoS md,lco que ha~Ia
una gran cantidad de traslape entre CIertas .a reas de e~las y que solo se medIan
10 factores de habilidad distintos por medIO del conjunto completo de prue-
. 1 bas. La GATB se diseñó para obtener medidas de estos .diferentes fac~ores, y en
su forma más reciente incluye 12 pruebas y proporcIOna puntuacIOnes para
nueve factores distintos. Uno es el factor de habilidad mental general ¡C} que
resulta de las puntuaciones de tres pruebas ¡V~cabu~ario, R~z?na?!iento arit- 4. Percepción de fo~ma. Esta aptitud incluye la percepción rápida yexac-
mético y Espacio tridimensional) que tamblen reCiben cahflcaclOn para fac. ta de f?rmas y patrones vI.suales. En la GA TB se aprecia por medio de las prue-
. basnumero 5: Aparean:l.ento de her~amientas y número 7: Apareamiento
tores más especializados. Los otros fa~tores. ~ las pruebas que contnbuyen a
cada uno de ellos se describen a contmuaClOn. de formas, las cuales dIfieren en el tipo de estímulo visual proporcionado.
: ,. .; Ca~a una d~ estas pruebas requiere que el examinado encuentre entre una
sene de opClOnes de respuesta la que es idéntica con la forma estímulo.
,! ; 1. Aptitud verbal. La puntuación est~ bas.ada ~n. 1a prueba número 4:
Vocabulario. Esta prueba requiere que el sUjeto IdentIfIque un par de palabras.
Ejemplo: Apareamiento de herramientas
de un conjunto de cuatro que son sinónimos o antónimos.

Ejemplos
A 8 C D
al Precavido bl Amistoso e) Hostil d) Remoto I

aJ Apresurado b) Depravado el Expedito d) Desaprobado


~~~~
2. Habilidad numérica. La apreciación de esta aptitud se basa en dos
pruebas. La primera de éstas, la número 2: Cálculo aritmético, inCluye la
rapidez y la precisión en el cálculo simple con números enteros.
Ejemplos .'
Restar ( - , 256 Multiplicar ( X' 37 ';1'
"

-ªª- 8

La segunda prueba que forma parte de la calificaci~n de la habilidad ,'


numériCa es la número 6: Razonamiento aritmético, que mcluye problemas .' 3 'O 5 ~
enunciados de manera verbal. O c=:=>.
Ejemplo
~ {)ó
Juan trabaja por 1.20 dólar la hora. ¡Cuánto cobrará por las 35 horas que trabajó a la '
semana?

",,:.l..:, h" jo/ . " .;


'.
.... ...... ).' • . ' .. .. ; .. , .. ~ \ ..• :.. ·.'.:'1 .. , ,) .:.: ;:' .: ~;..: ~: .. -.. .. : , ...... :~ .. ' . .: ... .. , ' .. ....... ;./..' .. , .:... ,' .... :: ., .. , ... ~-:- .. :-: .. ~ .. ·o:':·;rr:,; .:):>:' . ",:
352 CAP. 10. MEDICI ÓN DE APTITUDES ESPECIALES
PRUEBAS Y BATE RiAS 353
5. Percepción para el emplea do. Esta aptitud tambié n incluye una pero' ', El sujeto ensamb lará tantos rem~che;; y arande las .como pueda en
cepció n rápida y exacta, pero en este caso el material estímu lo es lingüís " , :' dos. Durant e el desensamble, qUItara el ensamb laje y regresará la 90 segun-
vez de puramente espacial. La prueba número 1: Comparación de tico en ,el remache a su lugar origina l. La puntua ción es el númer o dearandel ay
nombres reactivos
presen ta parejas de nombre s y requier e que el examin ado indique ensamblados y desensamblados, según sea el caso. Los aparato s de la prueba
si los dos '
miemb ros de la pareja son idéntic os o si difieren en algún detalle. arreglan de tal manera que al comple tar ésta el equipo regresa a su condici se
original y está listo para evalua r a otra person a. ón
Ejempl os " . Si compa ramos la CATB con la DAT percibi mos que la segund a contien
. pruebas de compre nsió!l mecán ica y de lengua je de las que carece la e
primera
, mientras que la CATB mcluye percepción de forma y varios t ipos de
John Goldste in &. Co. - John Goldston &. Co. motoras que le faltan a la DAT. Por tanto, la CA TB está más orienta
prueba~
Pewee Mfg. C. - Pewee Mfg. Co. da hacia
el trabajo y menos hacia la escuela , en su cobertu ra total. La inclusió
, varios tipos de prueba s motora s da como resulta do que las correlaciones n de
6. Coordinación motora . Este factor está relacio nado con la velocidad sean
de ' bajas, en prome dio, para la CA TB, aunque las prueba s "intelectuales"
la respues ta motora que, aun cuando sea simple, resulte precisa; correla-
se evalúa cionen casi tan alto como aquélla s de DAT. Las correlaciones entre
con la prueba número 8: Cómo hacer marcas. La tarea del examin ado las dife-
consis· , rentes calificaciones d~ aptitud de la CATB se muestr an en la tabla 10.2,
te en hacer tres marcas de lápiz dentro de una serie de celdillas en un grupo de 100 estudIantes de preparatoria. Con excepción de las correlac para
una hoja io-
de respuestas para comple tar el diseño simple. La puntua ción es el número , nes con G, que incluyen las misma s pruebas que aparecen en V N
celdilla s correctamente llenadas en un periodo de prueba de 60 segund de y S las
1 correlaciones fluctúa n en un rango de - 0.06 hasta 0.66. Los t~es
fact~res
i
os. Los
resulta dos aparecen aproxim adamen te como sigue: motores muestr an marcadas correlaciones entre sÍ, pero están práctica
¡: te sin ninguna relació n con el resto de las prueba s. Los factores percept men-
uales e
1, intelectuales tambié n muestr an bastante correla ción uno con otro lo
Ejempl o más marcado entre los dos tipos de factores perceptuales. cual es
I

Toblo 10.2. Intercorrelociones de los puntuaciones' de aptitud de GATB poro 100 estudianfes
de preporatorio '

~I ,G-Inteligendo
G V
0.73
N
0.74
S P a K F
0.70 0.43 0.35 - 0.04 - 0.05 - 0:06
M

V-Verbol 0.73 0.42 0.40 0.34 0.29 0.13 - 0.03 0.06


N-Numéñeo 0.74 0.42 0.34 0.42 0.42 0.06 - 0.03 0.01
Hspociol 0.70 0.40 0.34 0.48 0.26 - 0.03 0.01 - 0.03
7. Destreza manua l. Este factor incluye rapidez y exactitud de
nos movimientos de las manos bastan te complicados; se evalúa por algu· P-p'ercepdó~ de forma 0.43 0.34 0.42 0.48 0.66 0.29
medio de 0.27 0.23
dos tablero s de pijas, la número 9: Coloca r y la númer o 10: Dar vuelta. Q-Percepción del empleo 0.35 0.29 0.42· 0.26 0.66 0.29 0.20 0.16
primer a prueba, los examin ados usan ambas manos para mover una En la Hoordinoción motora - 0.04 0.13 0.06 - 0.03 0.29 0.29 0.37 0.49
serie de , F-Destrezo digitol
pijas de una serie de hoyito s de un tablero a otro. En la segunda prueba - 0.05 - 0.03 - 0.03 0.01 0.27 0.20 0.37 0.46
, el exa- M-Destrezo manuol
minado usa su mano preferida para seléccionar la pija del tablero, darle - 0.06 0.06 0.01 - 0.03 0.23 0.16 0.49 0.46
vuelta de 180 grados y reinser tarla por el otro lado de la pija en el agujerouna
dan tres ensayos para cada una de estas pruebas y la puntua ción es el . Se
número
total de pijas movidas de lugar o que se alcanzó a darles la vuelta. ,. .; Existen correla ciones bastan te sustanciales entre los factore s corresp
8. Destreza de dedos. Este factor presenta un tipo más fino de destreza dlent~s de la DAT y de la CATE. Los valores represe ntativo
on-
que la requerida en el factor anterio r. En las pruebas númer o 11: Ensamb s tomado s de un
estudIO (U.S. Emplo yment Service, 1967J son los siguientes:
númer o 12: Desensamblar se usa la misma pieza de equipo , que consistlory :
e
un tablero con 50 hoyito s en cada una de las dos seccion es. Cada hoyito en ' '
ocupad o por un remach e pequeño. En un huso se apila un conjunto está "
de aran- Verbal 0.74
delas. Durant e el ensamb lado, el examin ado selecciona un remach Numérica
mano y una arandela con otra, pone la arandela en el remache y e con una Espacial
0.61
coloca el 0.65
ensamb laje en su lugar corresp ondien te en la parte no ocupad a en el Emplea do 0.57
tablero.
354 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES 355

Sin embargo las correlaciones son bastante bajas, de manera que es ~Pr,edijCCI0n diferencial del éxito académico
tante claro que l~s pruebas no pueden considerarse idénticas. Una UU,<:H::nM~l'
importante consiste en que las pruebas de la DAT son, en la mayona de Hemos comprobado que las pruebas de aptitud escolar tienen una vaIl.-
casos, pruebas de capacidad, mientras que algunas pruebas de la CATB son . total bastante buena para predecir el éxito académico. Lo que podría-
rapidez y muy aceleradas. esperar de una batería de aptitud es que nos dijera en qué áreas un
. tiene más probabilidades de éxito. ¿Cristina será mejor en inglés
m~ltejm<Hll~a:,,:, ¿en ciencias o en francés?, ¿en dibujo mecánico o en his-
Otras baterías de aptitudes >l'' ' " :"'~~' Una batería puede responder estas preguntas en la extensión en que
prueba de la batería sea válida para las diferentes materias. ¿Cuál es
Debido a que el uso de la CATB está limitado a los servicios de extensión? .
estatales vale la pena mencionar una b'ltería que suele estar El manual de la DAT provee datos extensos de las corrrelaciones de cada
para darÍe un uso principalmente .ind~~trial: inv~stigación de n1'l. tn,'¡o con el aprovechamiento en varias materias escolares. Algunos de
empleado diseñada por la orgamzaclOn denommada PsychologIcal "····,,,. ..··--resultados se resumen en la tabla 10.3, en la cual se muestra el valor de la
ces, Inc. ¡Í963). Esta batería se diseñó con la final~dad de evaluar de .' ",:u nt;.,,,,,,,a de las correlaciones; esta tabla también está en un rango de ocho sub-
manera práctica en la industria, por lo que la,m.ayona de estas pruebas ~ólo . pruebas e incluye las combinaciones de las verbales y las numéricas respecto a
tienen cinco minutos de duración. La batena mcIuye pruebas denomina· sus correlaciones con cada área académica.
das de la manera siguiente: . .' Es importante señalar que ciertas subpruebas están entre las más altas de
" iwdas las materias. Así, el Razonamiento verbal y la Habilidad numérica
al Comprensión verbal 'están cada una entre las mejores predictoras para todas las materias. Al reco-
bl Habilidad numérica " ~'nocer esto, los autores de la DAT obtienen una puntuación simple al com-
el Búsqueda visual ". . binar estas dos subpruebas. En la tabla 10.3 podemos ver que el RV + HN es
d) Rapidez y exactitud visual ""' tan buen o mejor predictor que cualquiera de las subpruebas para todas las
e) Visualización espacial '. materias, incluyendo la mecanografía y las artes industriales. En una exten-
f I Razonamiento numérico .' sión considerable, las habilidades en las que se basa la habilidad académica son
g) Razonamiento verbal > generales, y una prueba de aptitud escolar común dará tan buenos resultados
hl Fluidez de palabras ........ como predictor como cualquiera de ellas que podamos conseguir.
i) Rapidez y exactitud manual Al mismo tiempo, en la tabla 10.3 se muestra una pequeña indicación de
j) Razonamiento simbólico · . validez diferencial. La ortografía y la gramática son predictores más útiles
,' de los grados de inglés que de las artes industriales y, de manera inversa, el
En el manual técnico se proporcionan las norm~s de los grupos . ' . " : Razonamiento abstracto y las Relaciones espaciales son más útiles para
nales para las personas que estén trabajando en 5 2 dIferent~ ocupa~lOnesi y la · '.. 13s artes industriales que para el inglés. Pero ésta es la distinción más mar-
validez de los datos para muestras de cerca de 30 o~upaclOnes . Est~ es una .. que aparece en la tabla. Aun en este caso, la validez de la batería de
. batería que tiene muchas probabilidades d~ ser muy útIl.para l<?s selec~IOnado. · ,; prueba como un predictor de la diferencia en aprovechamiento entre el
res de personal en varios tipos de negocIos y de ambIentes m~ustnal~s. . '. inglés y las artes industriales no es mayor de 0.20 a 0.25. Por tanto, somos
Muchas otras baterías se han diseñado en los pasados 30 anos, vanas .. capaces de predecir el nivel general de aprovechamiento educativo; la pre-
las cuales se describen brevemente en la sección B del apéndice cuatro. · .. , dicción diferencial del desempeño en un área más que en otra debe hacerse
sólo muy tentativamente.
Validez de las baterías de aptitud
Ahora debemos preguntamos acerca de la utilidad ~~ las baterías ,de apti- , : Predicción del éxito en el trabajo específico
tud, como la DATy la CATB así como hasta qué ~xtenslon u~a batena como
I

éstas puede damos la información que nos per~lte hacer. mejores . Ahora debemos preguntarnos qué tan exitosas son las baterías de prue-
nes más variadas y más diferenciadas que aquellas o?temdas a partll de de aptitud para predecir el éxito de los trabajadores en un empleo espe-
pru~ba de habilidad cognosciti,va gener~~ o de aptitud .escolar. Los
pruebas tienen la validez suficiente para ser útiles tanto para el
Empleo del Estado como para cualquier empresa que selecciona
de predicciones que tenemo~ mas probabIhda~~s de exammar son las
dones del éxito en las matenas escolares especlfic~s. o en los ~~pos '. .' , ¿las diferentes pruebas predecirán éxito para cada trabajo? El
les, en empleos determinados para los que un indIVIduo es sohcItante y en manual de CATB proporciona un rango de datos impresionante acerca de
.·las diferencias entre los trabajadores en distintos empleos y las correlacio-
campos generales del mundo laboral.

. ' ,'

: > ..- . "', . ", ' .''' ~ :,,'.:.. .. ..... . ....•: . , . ... . . '. ',' •. . ,- -.• • ":-:.- .. .:~{.I,.-.;. ," . : :', ..
,r PRUEBAS Y BATERfAS 357
356
nes de las pruebas con el éxito, ya sea en programas de entrenamiento o en
el trabajo. Los datos suelen ser insuficientes para resultar ideales, porque la
Q)
-o
-----
~r:::-:;:-o::o
....,. ,...."
NN('I")---~
cocioo
~ o-. c:::t
validación es concurrente (más que predictiva), los datos son para trabaja-
dores ya empleados más que para solicitantes, las muestras son pequeñas y
V>
o pueden estar limitadas a los trabajadores de una sola planta o compañía
·C
.l!! y no hay una validación cruza~a ind~pendiente.2 Sin e~bargo, la 3lcumu-
o
E lación de los datos es bastante lmpreSIOnante y proporCIOna el mejor con-
;:::::""=o:-r;::;-c;,
junto de datos disponibles en los que una batería común fue validada
0::,0-:;;;:-::0-0
C"'?("o.I""C"")~
contra un criterio de éxito en un amplio rango de trabajos diferentes.
ccic:::icici Hemos hecho una selección de un rango total de 23 trabajos en los que el
número de casos era por lo menos de 100 Y en los que estaban disponibles las
correlaciones de las puntuaciones de prueba con el criterio de trabajo.
Los resultados se presentan en las tablas 10.4 y 10.5, Y para cuatro de estos
~~==§: trabajos en la figura 10.2. En la tabla 10.4 se muestran las puntuaciones están-
-o _ oo:T"'"
~~..,.,C'oI dar promedio (con base en un sistema de normas en el que la media es 100 Y
coco la desviación estándar, 20) para cada grupo ocupacional. Las diferencias de
grupo están claramente marcadas, tanto en nivel como en patrón. Así, los
programadores de computadoras son los más altos en las puntuaciones de fac-
----
ee:::..~
o-. o-- t.n r -
~~ LI"'lC"'?
tores que representan la inteligencia general (C) y la numérica (N), y de estas
dos escalas se ubican más de 1.5 desviaciones estándar por encima de la media
dcicici de la población. En contraste, los ensambladores electrónicos se ubican bas-
tante abajo del promedio de la población en N, Y son más altos en coordina-
ción motora y destreza manua!, donde se hallan más de una media desviación
estándar por encima del promedio de la población en general. Para obtener el
NM:::---;:;:;-
C5-;X;-:;OCS
V'\ v
0000
"""" -.::r
-----
o:::"c:;o-t::"'::o--:;;:--
~coq_co.....c:>
NNC"")l"'I?oo::r
00000
patrón, la puntuación promedio más alta para cada ocupación se muestra en
la tabla con números en negritas.
En la tabla 10.5 se muestran los coeficientes de validez para cada factor en
contra del criterio de éxito en el trabajo para cada ocupación. En la mayoría de
los pasos, el criterio fue algún tipo de calificación de un supervisor. En las pri-
_'"'1~_ meras nueve columnas de la tabla se muestran los coeficientes de validez para
~!::..=--e las puntuaciones de factores simples, incluyendo todos los coeficientes que
c:=t~C"oI~
-.:t'"U"')"'" oo::r
0060 difieren de manera significativa del cero. Por tanto, es posible ver cuáles prue-
bas dieron las predicciones para cuáles trabajos y qué tan buenas eran. En cada
V>
...E
caso, por lo menos uno de los nueve factores se correlacionó con el éxito en el
CD
trabajo en un nivel significativamente distinto de cero, aunque muchas de las
-o
o correlaciones sean pequeñas. La mayoría de los factores están en los 20, aun-
r::
o que algunos suben hasta los 40 y 50. Evidentemente, hay una buena cantidad
-U
Q) . de patrones diferenciales de los coeficientes de validez. Por tanto, el factor
E
espacial tiene correlaciones de 0.50 con el éxito como asistente dental y como
...E
Q) maquilador, pero no está significativamente relacionado con el éxito en 13 de
-o
V>
los 23 trabajos. La destreza manual es un factor significativo para los trabaja-
Q)
r::
o
dores de bordados elegantes y para los que trabajan en servicios alimenticios,
-g o .pero no para 12 de los trabajos. En ocho trabajos el factor de inteligencia gene-
""Q);:;
~2 ral fracasa en mostrar una correlación significativa.
o V>
'--' el>

2 Especialmente en los estudios exploratorios en los que una batería de·pruebas que se está
evaluando, es importante verificar las valideces descubiertas en un estudio inicial por medio de la
verifi~ción de las mismas pruebas con una nueva muestra independiente, un proceso al que se ha
aplicado el término de validación cruzada.

,. -
"i'-- .••.. _.:.. / ¡ ' ._ • .:. " . .:-:~ "-. :. . .: ...'
."; ~'::..!':: :
.! ...... ,~

Toblo 10.4. Puntuaciones de factor de lo medja de GATB' poro ocupaciones específicos


w
Foctor CJ1
=
Código de Inteligencio Percepción Percepción Coordinación Destrezo Destreza
ocupación Título general Verbal Numérica Espacial de forma del empleado motoro digital monuol

020 Programador de computadoras 132 125 131 122 120 128 117 109 113
078 Técnico médico 126 127 122 117 126 130 122 114 117
079 Asistente dental 104 105 102 107 116 117 114 112 114
Técnico quirúrgico 97 102 93 97 107 108 108 106 107
193 Especialista de control de trálico aéreo 118 114 115 113 109 111 112 101 106
195 Linotipista 116 120 112 105 102 119 115 99 98
202 Estenógrafo, mecanógrafa 106 104 106 108 119 113 114 105 103
208 Tipista, perforador, operaria 110 113 106 104 107 120 114 102 101
212 Cojero de banco 111 111 110 107 115 120 114 107 101
213 Operario de máquina tabuladora 111 109 112 106 110 116 112 106 107
219 Empleado de oficina general 108 109 III 101 114 123 117
,
"
241 Ajustador de reclamaciones 116 109 116 114 108 111 107 97 107
.~: 276 Vendedor de maquinaria poro lo
-}.;
construcción 113 109 107 111 100 104 102 96 98
80 91
.~~ 317 Obrero en servicios alimenticios 82 85 85 91 91 87 97
319 Empleado de fuente de sodas 95 98 95 95 101 104 104 99 102
:{
355 Ayudante de enfermería 89 95 85 91 91 100 100 86 94
Ayudonte de psiquiatría 95 97 90 95 88 94 96 91 91
375 Patrullero 112 110 106 112 108 106 112 101 117
1:"
529 Separador de espárragos 96 99 91 96 97 99 101 97 108
601 Maquiladar 109 100 105 119 111 101 104 106 1I5
690 Bordador de zopatos 93 93 91 94 96 99 101 95 101
1écnico de loborotorio dentol 96 96 91 102 98 96 99 98 108
95 100 89 100 104 105 111 10B

.....
,

Toblo 10.5. Validez de puntuaciones de factor de GATB y los patrones de aptitudes ocupacionales paro ocupaciones específicos.
Factor

(ódigo Inteli-
de Percepción Percepción (oordi-
gencia de del nación
ocuparión Título Destreza Destreza Patrón de
general Verbal Numérica Espacial forma -empleada motora digital manual aptitud ocupacional

J
::)
020
078
Programador de computadoras
Técnico médico
0.36 0.40 0.24 0.28 #1 0.28
< 0.22 0.22
.\ 079 Asistente dental 0.57 0.32 0.40 0.51 0.28 0.22 0.21
:~ . Técnico quirúrgico 0.34 0.28 0.24 0.32 0.20 0.22
193 Especialista de control de tráfico aéreo 0.21 0.27
195 0.19 0.19 #3 0.23
ünotipista 0.22
202 Estenógrafo, mecanógrafo 0.39 0.37 0.41
#3 0.27
208 0.20 0.42 0.30 0.18 0.18 #36 0.18
Tipista, perforador, operario 0.30 0.21 0.31
212 Cajero de banco 0.25 0.17 #36 0.25
213 Operarlo de máquina tabuladora 0.34 0.45
0.22 0.36 0.20 0.15
219 Empleado de alicina general 0.26 0.22 0.23
#9 0.21
..... 241 0.15 #13 0.16
Ajustador de reclamaciones 0.20 0.20 0.32
276 0.26 0.31 #6 0.24
Vendedor de maquinaria para la
.' .
construcción 0.32 0.19 0.29 0.23
317 Obrero en servicios alimenticios 0.22
319 Empleado de fuente de sodos 0.22 0.26 0.35
355 Ayudante de enfermería 0.23 0.21 0.28 # 32 0.19
0.15 0.25 0.18 0.21
Ayudante en psíquiotria 0.31 0.25 0.29 0.23 0.23
375 Patrullero 0.24 0.19 0.19 0.22
529 0.20
Separador de espárragos 0.19
601 Maquilodor 0.60 0.23 0.17 0.18 #34 0.20
0.30 0.48 0.50 0.40 0.36
690 Bordador de zapatos 0.28 0.19
0.16
0.30 0.29 0.50 0.45 0.53 0.49
712 TécnKa de laboratorio dental 0.32 0.46 # 31 0.47
0.21 0.20 0.32 0.22 0.21 0.24
726 EnsambladO! electrónico 0.23 #28 0.43
0.19 0.22 0.20 0.28 0.29 # 16 0.17
w
CJ1

..
\,Q

•.' ;. 'oO'

, L
360 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES
361
En la última columna de la tabla 10.5 se muestra l~ validez de los patro- .·
nes de aptitud ocupacional para 13 de las 23 ocupaCIOnes pa~a l~s ~ue •. (alifieados por su trabajo
reportó esta información. En el uso ~riginal ~~ la GATB I?a!a dlscnmInar a
los individuos que solicitan un trabaJo especIfIco., ~l S~r;IClO, d~ Empleo de .' éalifieados por pruebas
Estados Unidos estableció puntuaCIOnes de cahfIcacIOn ~mIm~s en los : Inaceptable Aceptable
dos tres o cuatro factores de aptitud que parecen ser los mas efectIVOS para
dif~renciar a los trabajadores exitosos en el empleo de aquellos qu~ . ' Aceptable 15 52
, ex 'I'to o que no eran contratados. De esta Inaceptable
teman d manera,
dI' paradla especlah_
' ., 18 15
dad ocupacional de programador de computa oras e area e negOCIOS, .
las untuaciones fueron: G, 115; V, 105; N, .11~, yS, 105: Pa!a ~esa!:ollar
un; asesoría más manipulable y un ~rocedlmlen~~ de dlscnmmaclOn, el
S .. o de Empleo agrupó las ocupaCIOnes en far~l1has en las q~e,. Con base :
e~l~~ldatos de validez o en un .~nálisis del trabaJO, l?~ requenmlentos de . Entonces, con las definiciones de aceptable e inaceptable dadas en el ejem-
aptitud se juzgan similares. Se fIJa un total ~e 36 fal;uhas, ca~a una C~ln un . g
plo anterior, el 7~% e los sujetos que pasaron las pruebas resultaron ser acep-
patrón singular de puntuaciones de corte_ ASl el. patron ocup,aC:lOnal numero .' tables en, el trabajO SI se les compara con el 45% de aquellos que fallaron en la
uno que incluye a los ingenieros de todos los tIpOS, a los medl~os, a los pla- .prueba. Este es un ejemplo de la eficacia de la batería de pruebas como un pre-
nifi~adores urbanos y a los programadores de computad~ras, tIene ~untua­ .'dictor del desempeño laboral.
ciones de corte fijos en: G, 125 ¡N, 115, ~~, 11 S. El patr<!n 36, qu.e .•' , Las cuatro gráficas de la figura 10.2 representan cuatro trabajos que
un amplio rango de estenógrafos, estenotlpIsta.s, y mecanografos, tIene pun- . hemos ensamblado a fin de proporcionar una evidencia relativa de la eficacia
tuaciones de corte fijos en: G, 105, Q {percepclOn para el empleado/, lOO, y dela batería de pruebas para diferenciar el grado de éxito en cada trabajo. Cada
K {coordinación motora), 90. ;. .' ' una de estas gráficas muestra la evidencia relacionada con un trabajo. Las nue-
Las relaciones entre la calificación en el pat~or:?~ aptlt~d y ser " ' . ve hileras de cada gráfica indican los datos para las nueve puntuaciones de fac-
do como exitoso en el trabajo se muestran ~n la u1tm~a c.o~urr:na Oe la ta~la. tores de la batería GATB. Para cada hilera hay dos barras: la superior repre-
10.5; estas relaciones son positivas y estadístIcamente slgmfIc~t~vas, pero nlll- .. senta las puntuaciones de los trabajadores que fueron considerados exitosos y
guna de ellas es demasiado grande. El ran~o total de ~ ~6 C?~fIClentes de .' • la inferior corresponde a las puntuaciones de los trabajadores que se conside-
dez para los trabajos para los que la vah?ez de cl~slflcaclOn es .aceptado .' raron sin éxito. La barra incluye un rango de + 1 a - 1 desviación estándar,
rechazado, se realiza con base en un patron de aptItudes ocupacIOnales pro- . Yla marca larga en la mitad representa la media del grupo. Por tanto, en la pri-
; puesto, de la siguiente manera: "i mera gráfica que corresponde al grupo de los programadores de computado-
i
i' .'. ii ras, se observa que éstos son muy superiores en todas las medidas, pero que su
superioridad se hace mucho mayor, en promedio, en la inteligencia general y
Número de . en la habilidad numérica. En estas pruebas no sólo es alto el promedio, sino
Validez coeficientes . que además los grupos son relativamente homogéneos {es decir, las barras son
'. cortas). Más aún, en estos dos factores hay una gran diferencia relativa entre
los trabajadores que se consideraron exitosos y los que se estimaron sin éxi-
0.60 + 9 to. Los estenógrafos difieren menos del promedio general y en su caso las
0.50 - 0.59 23 ;' diversa~ líneas de evidencia indican que las medidas perceptuales son especial-
0.40 - 0.49 42 mente Importantes. Los patrulleros son los más sobresalientes en la destreza
0.30 - 0.39 62 manual, pero los más homogéneos en la inteligencia general. Los ensambla-
0.20 - 0.29 51 .' . :' d.ores electróI;ticas muestran un pico sobre la destreza manual, lo que diferen-
0.10 - 0.19 9 '.' ·. CIa a los trabajadores buenos de los malos, pero las barras largas indican que el
. grupo es bastante heterogéneo.
•' . ¡ Una comparación de las cuatro gráficas dará un cuadro razonable del gra-
La mediana de estos 196 coeficientes es 0.36. Con el propósito ~e
>: do en el que las diferentes habilidades describen ocupaciones distintas y predi-
, cen el éxito en ellas. ~
trar lo que este nivel de validez significaría en el caso de u~ ~rabalo en . '.. . GhiseIli (1973/ ha resumido un gran número de estudios de pruebas de
cual una tercera parte de los individuos evaluados fueran calIfIcados . ·, a~tI.tud en relación con el éxito en el trabajo. Donde un número de fuentes
inaceptables con base en las pruebas y una tercera part~ de los ' dIstIntas provee correlaciones entre puntuaciones sobre el mismo tipo de
fueran calificados como insatisfactorios por su supervIsor, se presenta ' prueba y el éxito en una categoría general de trabajo, Ghiselli combinó todos
tabla siguiente:
los datos disponibles para producir una especie de índice de validez compues-

,
... \ .... ~ ---_.~ _. __.-
I , , I , I I ' , , I , DIFERENCIACIÓN Y PREDICCIÓN 363
Inteligencia
generol
I '. Las relaciones de su reporte se muestran en la tabla 10.6, en la cual cada
Verbal , es un promedio, a menudo de varias correlaciones.
1- I
Numérico ., Tablo 10.6. Validez promedio de los diferentes clases de pruebas poro el desempeño en el
" trabajo en amplios categorías de ,trabajos. (Adoptado de Ghiselli, 1973)
I
Espacial
Habilidades
I Percepción Habilidades mecanico· Precisión Habilidades
de lo formo
inlelectuales espaciales perceplual moloras
Percepción
del empleado
, 'Ejecutivos, administradores 0.30 -0.23 0.24 0.13
Coordinación
motora
Superintendentes 0.26 0.22 0.27 0.15
'Ocupaciones del empleado 0.28 0.17 0.29 0.16
.. 1. Destreza Empleado en ventas - 0.03 0:14 - 0.02 0.09

. . digi'al

Des'rezo
, Vendedores
'SelVicio de protección
SerVicio personal
0.19
0.22
0.27
0.18
0.18
0.13
0.04
0.21
0.10
0.12
0.14
0.15
manual
I I I I I I .Operarios de vehiculos 0.16 0.20 0.17 0.25
80 100 120 140 160 60 0.14 0.19
Artesanias y oficios 0.25 0.23
(o) Programador de computadoras (b) Estenógrafo
.'Ocupaciones industriales 0.20 0.20 0.20 0.22

I I I I I " I I I I I I ,
Inteligencia
r_ ,b ,·= Las correlaciones conjuntas reportadas por Ghiselli no son mayores de
general
0.30. Las correlaciones de 0.10 Yde 0 .20 son muy comunes. Para una deter·
'.' .
Verbal
,minada categoría de trabajo, la variación en la validez de un tipo de prueba
'-'-~-~"I'---- _--':_ -f-- -- :a otro es bastante modesta. Así, estos resultados presentan un cuadro menos
",... ~t,,~ optimista del valor de las pruebas de aptitudes especiales que el mostrado en
Numérico los resultados de la CATE en la tabla 10.5.
El cuadro menos prometedor puede originarse, en parte, a partir de los
Espacial resultados confusos que resultan de la combinación bastante enredada tan·
' to de los trabajos como de las pruebas dentro de un solo coeficiente. Sin
Percepción , embargo, puede suceder que la gran cantidad de casos representados en las
de lo forma
, ",: correlaciones de composición de Ghiselli sean más estables, estén menos
Percepción sujetos a las fluctuaciones aleatorias y, en consecuencia, tengan me-
del empleado ",nor probabilidad de producir correlaciones altas, que las muestras, más
!--- -II--- -I - - - +- - '-I , . pequeñas, del Servicio de Empleo de Estados Unidos. El verdadero
Coordinación
motora de la validez de las pruebas como predictores de éxito en un traba-
¡....-.--+ _._-I---'-.I----._. determinado y de la especifiCidad de las diferentes habilidades como pre-
Deslreza uu.. para cada tipo de trabajo, probablemente se encuentra entre los
'.VJ, ... .,
digital
presentados en las dos últimas tablas.
i. .
-- -f-·_.. _-+---~_.
Destreza
manual
II I I I I 1'1 I I I ERENCIACIÓN y PREDICCIÓN
60 80 100 120 140
(el Potrullero (d) Ensamblador electrónico
: ;. Existen dos maneras diferentes y complementarias de pensar acerca
Figura 10.2. Perfiles de habilidad p o ro cuatra ocupaciones . . ' de los resultados de una prueba (o de cualesquiera otros datos) en relación

......,!•.
. .... .........:.., ..
364 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES
365
con los trabajos y la selección de un trabajo, las cuales se denominan ·
modelos taxonómicos y modelos predictivos. A continuación describi_ Tobla 10.7. Percentiles de mediana de los estudiantes de derecho, ingeniería y mecánica
remos ambos modelos con base en dos grupos: los estudiantes de la escue_ . automotriz sobre medidas de habilidad e intereses, y diferencias entre los
la de Ingeniería y los estudiantes de la escuela de Derecho. grupos .

Percentifes de mediana Diferencias de grupo


Enfoque taxonómico
Estudiantes Estudiantes
En el enfoque taxonómico nos planteamos preguntas como las siguien- de de Mecánicos Ingeniería- Ingeniería-
tes: ¿de qué manera son diferentes estos dos grupos?, ¿qué hechos que pudiéra- derecho ingeniería automotrices derecho mecánica
mos saber de ellos nos servirían para distinguirlos más clara y tajantemente?
En relación con un solicitante de asesoría personal, la pregunta correspon_ Pruebas de habilidad
diente sería: qué es más probable, ¿que una persona sea estudiante de ingenie- Inglés 85 77 31 8 46
ría o de derecho? Se ha diseñado una rama especial del análisis estadístico, . Comprensión de lo lectura 83 74 35 9 39
llamado análisis discriminatorio, para contestar estas preguntas. Creatividad 75 77 50 2 27
Con base en un cuerpo de datos de los dos grupos de nuestro ejemplo, Comprensión mecónica 62 79 50 17 29
podríamos buscar los reactivos en los que ambos grupos son más diferentes;·Y· Visualización (tridimensional) 62 76 50 14 26
trataríamos de combinarlos de tal manera que incrementáramos todavía más Razonamiento abstracto 70 77 43 7 34
la separación entre los dos grupos. Los datos que muestra la tabla 10.7 se Razonamiento aritmético 79 79 45 O 34
tomaron de The Career Data Book (El libro de datos de las carreras) del Pro- Introducción a las matemóticas 84 87 38 3 49
I yecto talento (Flanagan y colaboradores, 1973) y representan los valores de Cólculo aritmético 73 69 31 - 4 38
percentiles promedio para dos grupos (así como un tercer grupo de mecánicos
de autos) sobre varias medidas de habilidad y de intereses. La evaluación se funtuocíones de intereses
hizo mientras los estudiantes estaban en la escuela secundaria, por lo que los Ciencias físicos, matemóticos 63 84 37 21 47
datos indican la extensión en que los datos de la escuela preparatoria podían Ciencias biológicos, medicino 66 61 33 - 5 28
predecir a los miembros del grupo cinco años más tarde. - Servicios públicos (político) 76 47 34 - 29 13
Hay varias diferencias de-trabaJO moderado entre los estudiantes de dere- Literatura-lingüístico 76 50 28 - 26 22
f~
,- cho y de ingeniería sobre las pruebas de habilidad¡ la más notable esla superio- Servicios ·sociales 59 43 34 - 16 9 ,.
ridad de los ingenieros sobre las pruebas de comprensión mecánica y visuali- Artísticos 55 53 36 - 2 17
zación espacial. Sin embargo, la verdadera gran diferencia entre los grupos Musicales 59 54 50 - 5 4
estaba en sus intereses expresados. Los estudiantes de ingeniería estaban dra- Deportivos 48 37 32 -11 5
máticamente más arriba en los intereses tecnicomecánicos (38 puntos de per- . Cocería-pesca 36 36 46 O -lO
centil), así como en el interés en las ciencias físicas y las matemáticas. Los Negocios 63 38 30 - 25 8
estudiantes de derecho estaban sustancialmente más <lrriba en sus intereses Ventas 57 37 40 - 20 - 3
públicos (políticos) y en las actividades lingüístico literarias, en los negocios y De .cálculo 56 58 42 2 16
en las ventas. Oficina 46 48 47 2 1
¿Qué tan bien podrían separarse los dos grupos por medio de una compo- Técnicas-mecánicos 24 62 74 38 - 12
sición de estas medidas? En otro Proyecto talento, Cooley y Lohnes (1968) Habilidad comerciol 23 37 65 14 - 28
reportaron el diseño de una puntuación compuesta basada tanto en las habili- Granjas 32 38 57 6 - 19
dades como en los intereses mostrados en pruebas, a lo que denominaron téc- Obrero 26 35 65 9 - 30
nicos en oposición a socioculturales. Ésta es la única dimensión más impor-
tante que se dispersa en aproximadamente 24 campos principales del estudio
universitario. De esta puntuación compuesta, el estudiante de ingeniería típi-
co se ubicaba en elpercentil 84, mientras que el estudiante de derecho se bastante eficaz en la escuela secundaria por medio de una combinación de
encontraba en el 31. Sólo aproximadamente el 7% de los estudiantes de de- . . habilidades e intereses, con un énfasis primordial en las medidas de intereses.
recho daba una puntuación tan alta como la del estudiante de ingeniería pro- -~n.la tabla 10.7 se muestran las puntuaciones medianas para un grupo de
medio. Por tanto, desde el punto de vista taxonómico, los futuros estudiantes . ~ecamcos automotrices, quienes también pueden compararse con los estu-
de ingeniería y de derecho son dos grupos que pueden separarse de manera ~lantes ~e ingeniería, de lo cual resultan, una vez más, grupos claramente dis-
Untos; sm embargo, en este caso,la mayoría de las grandes diferencias radican
CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES DIFERENCIACIÓN Y PREDICCIÓN 367
366
en las pruebas de habilidades. No es sorprendente que los estudiantes de inge- diántes ~e la escuda secundaria .. Estos autores concluyen que no más de tres
niería obtengan puntuaciones más altas e? .todas las pruebas, so1;>re todo en las puntuaClOnes c~)l~puestás ~ partIr?e una batería total de los datos del Proyec-
medidas de matemáticas básicas y de habihdades para el}enguaJe. Muchos de to talento son utIles para dIferenCIar a estos grupos. Las dimensiones pueden
los intereses diferenciales son bastante pequeños; l,?s mas grandes son el c~>n­ clasificarse como sigue:
traste de los intereses por las ciencias físicas con los In:ereses por el comerClQ y
el trabajo. Una puntuación compuesta que separana a estos dos g~pos de l. Escolaridad orientada hacia la ciencia. Esta dimensión identifica a
manera más eficaz combinaría·información acerca del apr<?v.e;hamIe?to en los estudiantes con habilidades e intereses académicos, especialmente
lenguaje y matemáticas con el cieittificoprofesional, en OposIclon a los Intere- aquéllos con un gusto por los números y la ciencia. .
2. Técnico en oposición a sociocultural. Esta dimensión separa a es-
ses comerciolaborales. ". , .
Cuando usamos datos de pruebas con un enfoq~e taxo,nomlc,?, afronta- tudiantes con habilida.des e intereses primordialmente sobre cosas y cantida-
mos dos problemas relacionados: al ic~ántas catego.nas sena fr.uct~fero repa- des de aq~ellos cuyos Intereses y habilidades se relacionan con las personas y
rar en cierta etapa del desarrollo vocaCIonal d.e.u!l chente?, y ~I,lque ~orm~ de el lenguaJe.
combinar la evidencia de la prueba perrmtma ~a separaclOn mas ehc,az 3. Negocios en oposición a cultural. Esta dimensión sirve primordial-
de aquellas categorías? Cooley y Lohnes (19681 sug:e~en que las ~ 2 categonas mente para separar a los estudiantes cuyos intereses primarios son prácticos
que se muestran en el cuadro 10.1 pueden ser muy utIles para guIar a los estu- y materiales de aquellos que están interesados en una cultura por sí misma:
¡.
Cuadro 10.1. los 12 campos de correros principales Enfoque predictivo
1. Ciencias médicos y biológicos, Ph. O. o Investigadores biomédicos
Doctores en medicino En contrast~ con el modelo taxonómico, el modelo predictivo se enfoca
M.O. en algunas medIdas del éxito dentro de una ocupación específica. En la tabla
2. Ciencias médicos y biológicos, 0.0.5., Dentistas
Farmacólogos 10.8, s~ muestra u~a serie de datos para los estudiantes de ingeniería y de
M.S. o 8.5. mecanlca autom?tnz. En cada caso, la medida de criterio son los grados esco-
8iólogos
Investigadores científicos lares, y los predlCtores son las puntuaciones de factor de la GATB. En el
3. Ciencias físicos y matemóticas, Ph.D. modelo predictivo se pone poca o ninguna atención en las diferencias entre
Matemóticos
Científicos aplicados grupos. Más bien la atención se centra en el éxito dentro del grupo que toma
4. Ciencias físicos e ingeniería algún programa particular de entrenamiento en algún trabajo específico. Los
Ingenieros
Obreros calificados y técnicos datos acerca de los estudiantes de ingeniería en la tabla 10.8 sugieren que la
5. Técnico calificado, con entrenamiento mejor predicción de los grados escolares de ingeniería se produciría por algu-
postsecundoria na combinación de las puntuaciones verbal, numérica y de percepción del
6. Obreros, sin entrenamiento Misceláneos
Obreros
empleado.
postsecundaria
Empleados de mostrador .
7. Empleados y trabajadores de oficina, Trabajadores de oficina y servido Tablo 10.8. Coeficientes de validez de los pruebas GATB poro predecir los grados en los
sin entrenamiento postsecundaria Contadores escuelos de .ingeniería y mecónica automotriz
8. No universitarios, no técnicas, con Operarios de equipo de oficina
Vendedores Mecánica
entrenamiento postsecundaria Ingeniería automatriz
Hombres de negodos
9. Negociantes, 8.5. o 8.A. Auditores
0.40 0.18
Gerentes
0.38 0.18
10. Negociantes, escu'ela de graduados Ejecutivos •..' . (Espacial)
Trabajadores del bienestar 0.11 0.48
' '.(Percepción de formo) 0.11 0.14
11 . Sociocultural, 8.5. a 8.A. Artistas
.• ' ,' Q, (Percepción del empleado) 0.30 0.12
Músicos
Asesores
,.'. r (Coordinación mOfora) 0.25 - 0.11
y .. (Destreza digital) 0.08 0.27
Maestros
'. ... ~ (Destreza manual) 0.01 - 0.04
Abogados
Científicos sociales ." N' 164 50
12. Sociocultural. escuela de graduados

-< ,<. -, ., .... ,- .,..•..


. ,
,'. " :
DIFERENCIACIÓN Y PREDICCIÓN 369
CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES
368
nación de los efectos de la velocidad estadísticamente por medio de un
Para esta muestra de casos podemos determinar la mejor combinación de procedimiento de sustracción. .
las pruebas y la manera en que deberían combinarse para obtener la predic- . Desafortunadamente, los voluminosos datos del Proyecto talento no pro-
ción más exacta de las puntuaciones de criterio_3 En la tabla 10.9 se m';lestran porcionan en este momento ningún análisis organizado dentro del mode-
los mejores conjuntos de dos, tres, cuatro o más pruebas que ~e usa~an p~ra l~ predi~tivo¡ en~once~, no es posible comparar directamente las pruebas que
predecir los grados, cómo de~erían combinarse las pruebas y cual hU~)lera sIdo dIferencIan a los mgemeros de otros grupos con aquellas que predicen el éxito
la correlación de las puntuacIOnes compuestas con los grados. Por ejemplo, el en la. escue~a de ingeniería. Sin embargo, para los datos de la GATB, el mejor
mejor conjunto de dos pruebas q~e se hubiera éI?plea~o estaría form~~o por la predIctor SImple de los grados de la escuela de ingeniería es la puntuación V
V y la N¡ ambas deberían combmarse ~?n casI la rrusma ponderaClO?, p~;o (verbal', y los datos de la tabla 10.7 indican que una puntuación verbal alta
dándole más importancia a la puntuaclOn V (0.29 a 0.26). La combmaclO~ cierta~ente n.o ide~ltificaría a un estudiante de secundaria como probable
indicada produce una correlación de 0.46 con los grados. En esta tabla es pOSI- ~studIante.de ~~emena o de derecho. La diferencia que pudiera haber se loca-
ble comprobar cómo la correlación mejora a medida que se añaden pruebas liza en la dIreccIon opuesta; p,or tanto, las pruebas que son los mejores predic-
adicionales. La primera o segunda adición proporciona un incremento nota- tores dentro de una ocupaClOn pueden tener una eficacia muy limitada para
ble en la exactitud de predicción, pero después de eso, el incremento se hace diferenciar entre ocupaciones.
progresivamente más lento, dado que las pruebas ~ás promisoriasya había~ . Cua?do las pruebas so~administradas por una empresa para satisfacer
sido incluidas y las pruebas restantes tendIan tambIen a traslaparse con las pn-
pnmo!dIalmente sus nec~s~dades, el modelo predictivo parece ser el más
meras que ya se habían incluido. apropIad~. La empre~~ esta mteresada, en gran medida, en saber qué tan exi-
toso podna ser el sohcItante en un trabajo específico y quisiera identificar la
Toblo 10.9. Combinaciones de puntuaciones estándar de foctores paro predecir los grados prueba o las p:u~bas q'!e .le dieran. la predicción mejor del éxito probable
en lo escuela de ingeniería de~t~o de los hmItes practlc~s del tIempo de evaluación. Algunas veces, los
sol~clta?tes pueden ~er candIdatos o estar disponibles para ser asignados a
Número vano~ tipOS de traJ:laJos. Entonc~s, la empresa estaría interesada en saber qué
Cuiia/adán tan bIen cada solIcItante podna desempeñarse en los diferentes tipos de
de
factores Combinaciones de pruebas múltiple empleos, de tal :no~o que la f~erza de trabajo disponible pudiera colocarse
d~, la manera mas efIcaz. Este tIpO de interés con la clasificación y la asigna-
Clon de personal es lo más característico de una organización militar en
2 0.29V + 0.26N 0.46 la que a un conjunto relativamente indiferenciado de fuerza de trabaj~ le
3 0.27V + 0.25N + 0.2111 0.51 corresponde realizar una gran variedad de funciones. En todos estos ambi-
4 0.30V + O.32N - 0.20r + 0.260 0.54 entes, el modelo predictivo parece adecuarse a las demandas de la situación
5 0.30V + O.28N - O.35P + 0.260 + 0.22K 0.56 , . . La.si~uación es un poco diferente cuando se usan las pruebas para la aseso~
6 O.29V + 0.28N - 0.33P + 0.26Q + O.26K - O.10M 0.57 na mdIvldual acerca del futuro. El sujeto que pide asesoría está interesado no
8 O.30V + 0.28N + O.OOS - 0.34P + O.25(} + O.25K + O.12F - O.16M 0.58 sólo, y tal vez no de manera primordial, en su probable grado de éxito en una
ocupaci?n es~ecíf!ca, sino también en la satisfacción adquirida en un campo
de tr~baJo. Mas aun, normalmente estará preparado para considerarse en un
ampho rango .de ocu~aciones posibles. Necesita ayuda para evaluar el conjun-
Parece raro que las medidas de P y M sean incorporadas a ia predicción to de alternatIvas po.sIbles y contestar la pregunta /lzcómo soy yo?", en cuanto
con signos negativos, aunque los coeficientes de validez originales para estas . al mu?do del trabajO. En este contexto, el modelo taxonómico es bastan:te
pruebas eran positivas. Esto pasa algunas veces cuando una prueb~ co?una at~actlvo, pues trata de localizar al individuo dentro del espacio total del tra-
validez bastante baja se traslapa marcadamente con otras pruebas mas vahdas. . ~aJo Y ayudarlo a considerar qué tan ~ongruentes serían sus habilidades, sus
En este caso, se ,sospecha que P se obtiene en algún aspecto de una velocidad mt.ereses y su te~peramento con las dIversas opciones que confronta en cual-
de percepción y respuesta que también afecta a otras pruebas. Ya se sabe que qUIer punto partIcular de su desarrollo vocacional.
todas las pruebas de la GATB son bastante aceleradas y que este factor de v,el,o- En l~s últimas tres colurrmas de la tabla 10.10 se muestran las puntuacio-
cidad puede borrar las medidas de habilidades verbales y numéricas. Po~n~­ nes medIas de cada uno de los 12 grupos de carreras definidos en el cuadro
mos mejorar la eficacia de estas pruebas como predictores mediante la ehrru" • 10.1 en cada una de las tres dimensiones discriminantes definidas anterior-
mente. La ~scala en la que están reportadas estas medias es aquella en la
que la media total es de 50 y la desviación estándar de 10. Los resultados
3 Las técnicas estadísticas de regresión múltiple son más complejas y especializadas que1o. . para.las dos pri~era~ ?imensiones se muestran en la figura 10.3. Para tener
que podría presentarse de manera -ap·ropiada en este libro: El lector interesado encontrará que se· . una ~~ea de la dIsperslon dentro de cada grupo ocupacional, y los traslapes de .
presentan en muchos textos de estadísticas estándar, como el de Kerlinger y Pedhazur, 1973.
370 371

Tablo 10.1 O. Centroides de función discriminante poro los grupos de plan de carrero del
periodo de seguimiento de cinco años de 1965

Plan-Grupo Dimensión I Dimensión " Dimensión 111


J,J. .
¡
joo
1 MEO· 64 48 54
1,
. j'
1~ 2 BIO SS 47 50
3 IKV 62 41 52
4 IHG 54 44 48
S lEC 43 46 51
~ :, 6 OBR 38 48 53
7 EMP 41 52 50
8 CON 45 53 49
c::
9 HEG 52 52 46 -o
.¡;;
10 GER 59 51 45 g 42 I--=:¡:=-':'"
11 BEN 53 54 52 E
i5
12 SOC 59 54 53
Dimensión 1: Escn1oridod orientada hacia la ciencia
• los obreyiaturos se refieren a las categorías dados en el cuadro 10.1.
figura 10.3. Centroides de los gupos de planes de cerrero de cinco años de seguimiento
cada grupo, en esta figura está dibuJaaa ,?na elipse que muestr.a la región alre- en un plano discriminante.
dedor del centroide dentro del cual podna esperarse que se ubIcara el 50% del
grupo. Cada área sombreada define el 50% de casos en el grupo que se juntan
alrededor de la persona promedio_ La extensión de traslape de las áreas som- El enfoque taxonómico que representa datos como éstos describe la situación
breadas proporciona una idea de la similitud de los grupos. Así, una persona existente en un punto particular del tiempo. Para elaborar la asesoría con base
con 40 en la dimensión 1 y con 48 en la dimensión 11 está en el u 50% profun- en tales datos sería necesario asumir que en el presente y el futuro las cosas
do" para el grupo de trabajadores, para el ~po .de emplea~os y ~rabajadores deberían suceder como en el pasado. Esta puede ser una suposición general-
de oficina y para el grupo de entrenados y tecnICos¡ es decu, eV1dentemente mente razonable, en que la estructura de la educación y del trabajo no recibi-
"pertenece" a cualquiera de esos grupos. La pe!son~ n? está ta? s~parada y rán cambios rápidos y drásticos, pero es una suposición y podría ser inexacta
afuera del límite del grupo interno de los no unIversItanos, no tecnIcos, pero ·en muchos detalles, e incluso en algunas características principales.
está ubicada en un punto remoto de todos los grupos escolares de universidad ,o También debemos preguntarnos en qué grado las tendencias generales
y de posgrado. Puede notarse que mucha del área en el diagrama "pertenece- deberían prescribir para el caso individual. Un punto en una gráfica deseri-
por lo menos a dos, ya menudo a tr~ o cuatro, de los 12 grupos. 00 • "be sólo el promedio de un grupo, y cualquier región seleccionada comprende
Al analizar la figura 10.3 comprobamos que la primera dime?sión disc~­ <¡.solamente alguna fracción específica del grupo. Los miembros individuales
minante separa a los grupos que difieren sustancialmente en el nIvel educatI- >,.de un grupo se desvían del promedio en grados diversos y en muchas direc-
vo. En esta dimensión, relativamente pocas personas que sólo tengan una ,. Lo que podría hacer adecuadamente un asesor vocacional si los
educación secundaria sobrepasan el promedio del graduado universitario. La ,,!;<oww,.~,, han sido organizados de tal modo que se lo permitan, sería rep~rtar al
dimensión parece identificar bastante bien a los sujetos que tienen intención Y ;91l¡Clt:lnt:e de asesoría qué porcentaje de cada grupo está más alejado del cen-
habilidad para completar una educación universitaria. En la segunda dimen- él. Por tanto, si Ernesto Bernal tiene puntuaciones en las dos
sión hay gran cantidad de traslape, pero los científicos físicos y los ingenieros ';;!~"i,CliInellsi¡ofiles discriminantes principales, de 54 y 46, el reporte debe leerse
oo,OO",o-rn,mn el que se muestra en la tabla 10_11
están bien separados de Jos grupos no técnicos. Si señalamos una tercera
dimensión, notaremos todavía más traslape para e l l a _ . . Este tipo de reporte indica que una persona como Ernesto podría encon-
",:"" 1" ....""'" en ~ualquiera de las dos ocupaciones (como es cierto para la mayoría de
No es fácil expresar la cantidad de traslape en los agruparmentos educan-
vos y ocupacionales. Hemos intentado hacer esto en la figura 10.3, para lo comlbiIllaciOIles de puntuaciones', pero que es más similar a los graduados
cual empleamos un límite del 50% arbitrario, pero las personas en cada grupo o ,'o en las áreas dos y cuatro que incluyen ciencias físicas y biológi-
se ubican fuera de estos límites_ Es todavía más difícil juzgar cómo los hechos . " o, 'o o Y su aplicación. Este tipo de reporte proporciona una base realista y razo-

que observamos deberían usarse para tomar decisiones acerca de una carrera. , nable para hacer análisis posteriores y para la meditación. Si el punto corres-

o-
00
372 373
Tabla 10.11. Perfil para Billie Willioms Tipos de tarea incluidos en las pruebas representativos de disponibilidad paro
lo lectura .
Grupo ocupacional Centour'
Gates- Horrison- Lee- Metro- Murhpy-
Tipo de larea de prueba MarGinitie St;oud (/a,k polilana
1. Ciencias médicas y práctico, M.O., Ph.D. 12 Durre"
2. Ciencias médicos y biológicas, D.D.S., M.S.,B.S. 80
3. Ciencias físicos, matemáticas, PII.D. 18 . Reconocimiento de palabras * *
4. Ciencias físicos, ingenieña, M.S., B.S. 78 Reronocimiento de letras
14

S. Técnico calificado, .con entrenamiento postsecundoria Disuiminación de sonidos *
6. Obreras, sin entrenamiento paslsecundaria 5 *
Combinación de sonidos
7. Empleados, trabajadores de oficina, sin entrenamiento postsecundaria 8 Comprensión de material verbal:
8. No universitarios, no técnicos, con entrenamiento postsecundaria 12 . . poIobras, oraciones e instrucciones * * *
9. Negociantes, 8.S., B.A. 40 .Disaiminaci6n a igualación de
10. Negociantes, escuela de graduados 40 . fonnos visuales
11. Sociocultural, 8.S., B.A. 30 * *
Copio de símbolos
12. Sociocultural, escuela de graduados 25 *
,Conceptas numéricos
Aprendizaje de palabras en uno
• El cenlour es el límite que morca el porcentaje de cosos tan lejos del promedio del grupo o del centroide en que se
encuentro Billie Willioms; es decir. Barle Wllioms pertenece mós probablemente al grupo 2 que el 80% de aqueDos que el1ll lección estándar
*
realmente miembros del grupo 2, pero sGIo pertenece mós probablemente 01 grupo 6 que el 5% de aquellos que realmente
eslón en el grupo 6. .

' . . c~a: ~e~ grado sustancial de similitud. En ambas, aparece el conodinientodel


pondiente a las dos puntuaciones de Ernesto estuviera marcado en una gráfica .• slgmficado de las pruebas; ambas tratan el reconocimiento de las similitudes y
\: de la figura 10.3, sería fácil ver en qué direcciones se desvía Ernesto de cada ". difere!lcias, así como el análisis ~ la cl~sifi~ación. Sin embargo,las pruebas de
:; ro grupo, mientras que su perfil indica el grado de la desviación. capaCIdad para la lectura ponen enfasIs mas exclusivamente en los materiales
\ ~~.' Ü
.;. de le~tura, las letras y las palabras, así como incluyen los componentes o
". .: .las pnmeras etapas de. las tareas de la lectura. Entonces, las preguntas básicas
PRUEBAS DE PRONÓSTICO . senan: lel sesgo :specIa~ de las pruebas de capacidad para la lectura da como
'. resultado una .válidez ~crement~da!, ¿es esta p~eba especial una mejora
Un grupo de pruebas de aptitud se ha hecho a partir de pruebas Ul~"m,u"" '.sobre una medIda de aptItud. aca~emIca general? Estas son las preguntas que
con el fin de predecir la capacidad para aprender o el grado proba1?le de .' deben forrnul~rse en cU,al~Uler tIpo de prueba de pronóstico o en cualquier
en alguna materia específica o en un segmento de la educación. Estas se lla- prueba de aptItud academIca especial . .
man pruebas de pronóstico, y un grupo de pruebas en esta categoría que han . ., La tendencia ge~eral de la evidencia parece apoyar la validez más.alta de
sido ampliamente publicitadas y recibido un uso considerable son las nTl'lI.n"I.t ,. prueba~ de: capaCIdad, especialmente diseñadas para predecir el progreso
de capacidad para la lectura. Dichas pruebas se han diseñado para usarse aprendizaJ~ d~ ~a lectura, aunque sean difíciles de encontrar los estudios
niños, normalmente un poco después de su ingreso en el primer grado, hl'.!l;;;.¡;Olmpar~ltI~rOS mCIsI~oS. Las correlaciones de las pruebas de capacidad para la
fin de proporcionar a la escuela una información tan exacta como sea con las medIdas de lectura al final.del primer grado, son, de manera
de la habilidad del niño para progresar en la lectura; asimismo, ofrecen d~ 0.6~ a 0.65 y las subpruebas que tIenen la validez más alta son aque-
mación al maestro para que organice grupos de trabajo dentro de la clase, unplican de .mo~o. dIrecto componentes de habilidad de lectura, es
da acerca de la cantidad del tipo de actividades de prelectura que debe reconocer o dIscrunmar las formas visuales de las letras o las pala-
estime qué tan rápido se puede empezar con el programa formal de lectura. Probablemen~e estas corr~laciones sean algo más altas que las que daría
algunas comunidades donde la asistencia al jardín de niños es bastante prueba de aptItud generalIZada para este criterio específico es decir el
ral, administrar este tipo de pruebas al final del curso se considera como :senllpe:fio en la. lectura al final del primer grado. "
base para organizar los grupos de grado para el año siguiente. Las clases prueba,s ~e pron?stico se han diseñado para otros nIveles y mate-
tareas que aparecen en estas pruebas se pueden apreciar en el cuadro 10.2. los ultImos anos ~e ha renovado el interés por estas pruebas.
Si se comparan las tareas del cuadro 10.2 con los reactivos muestra de y Sapon /l?5~" y PImsleur (19661 han diseñado sendas baterías
pruebas de habilidad general que aparecen en el capítulo 9, tomaría . pruebas de pronostICO para lengua extranjera y se ha reestandarizado la

l.
374 CAP. 10. MEDICiÓN DE APTITUDES ESPECIALES
MEDIDAS DE APTITUD MUSICAL 375
prueba Symonds de pronóstico para lengua extranjera. También se han '. énfasis a los materiales cuantitativos para la ingeniería y a los materiales
revisado (Orleans y Hanna, 1968, 1969) la prueba Orleans de pronóstico . verbales para ~l ~erecho. Al~nas veces estas pruebas se complementan con
para el álgebra y la prueba de pronóstico para la geometría. Los autores .. . prue~~s especIalIzadas, po~ eJ~mplo, u?a prueba de modelado sobre yeso para
de todas estas pruebas ofrecen evidencia que muestra que las .pruebas medIcma dental. Estas vanacIones estan sobreimpuestas a un tema básico de
especializadas proporcionan una mejor predicción del aprovechamiento , aptitudes y aprovechamiento escolar.
en un área de materia especial, que la que sería posible obtener de una
medida general de aptitud escolar. Sin embargo, todavía podríamos pre-
guntarnos si, dentro de las áreas del aprovechamiento académico, las
pruebas de pronóstico especiales pueden mejorar las predicciones basadas MEDIDAS DE APTITUD MUSICAL
en una combinación de medidas de inteligencia general y de aprovecha_
miento académico previo en áreas relacionadas, lo suficientemente para <;uando an.a!izamos cam~os como el de la música y el arte, es más eviden-
justificar su uso_ Hasta ahora no se ha demostrado de manera contunden_ te la madec.uacIon de las medIdas de aptitud escolar generales. Los grados en
te que esto es posible como para aplicar ampliamente dichas pruebas. .e~tas matenas se e~cuentran normal~ente entre los que menos pueden prede-
Es probable que las pruebas de pronóstico especiales tengan máli utilidad ctrse con una m~dIda general de aptItud escolar. Más aún, la naturaleza del
como predictores de éxito en tareas académicas de tipo especial que no tie- talen~o sobresalIente en estos campos ya se ha reconocido desde hace mu-
nen contrapartida en niveles más tempranos de la experiencia escolar. ASÍ, la cho tIempo, pero nuestro problema consiste en determinar cuáles son los
prueba Turse de aptitudes para la taquigrafía, con una correlación de 0.67 . componentes. ~e este ta~ento y diseñar las formas para apreciarlos.
con aprovechamiento posterior de taquigrafía, puede ser muy útil como un . En la ha~~Idad musIcal,.un gran componente es de ejecución o motor, es
complemento de otras informaciones acerca de un alumno al evaluar el posi- dectr, la h~blhdad para dornmar los patrones de acción que se requieren para
ble éxito en el entrenamiento taquigráfico, en la medida en que este entrena- toca~ ~n IDstrumento. Las medidas de aptitud no se han ocupado de este
:!. miento continúe. La prueba ERe de aptitud estenográfica y la prueba Ben- . dorntnlo, tal vez porque es muy específico para cada instrumento particular_
nett de aptitudes estenográficas han dado resultados comparables eirtcluyen ~ mayoría d.e las medicio?~ han sido dirigidas hacia los aspectos perceptivos
tareas como la ortografía, la transcripción de símbolos, el dictado bajO presión e mterpretattvos de la mUSIea.
de velocidad y la discriminación de palabras. ., Escuch~r mú~ica.i~p1ic~, en prim~r lugar, varios tipos de discrimina-
ClOn sensonal: dIscnmmacIOnes de tImbre, de volumen y de relaciones
temporales. En segundo lugar, implica percibir las relaciones musicales
BATERÍAS DE APTITUD .' más compl~jas en el mat~r~~l, las relaciones de intervalos, los patrones de
ESCOLAR PROFESIONALES una melodIa, la compOSICIon de un acorde y la relación de una armonía
con una melodía. En tercer lugar, implica juicios estéticos acerca de la
O~ro grupo de pruebas de aptitud son las pruebas que se han dis~ñado con adecuación y el placer producido por una melodía una armonía un
el fin de seleccionar individuos para tipos particulares de entrenanuento pro- patrón rítmico o un patrón de dinámica. ' ,
fesional . 'Muchos tipos de escuelas profesionales, algunas veces de manera L~ b.atería de pruebas.de aptitud musical que se ha investigado con más
in.dividua!, pero más a menudo operando por medio de organizaciones pr?fe- detemnuento es la conOCIda como Medidas Seashore de talentos musica-
sionales, han instituido programas de pruebas para seleccionar a sus estudIan- _les , cuyo objetivo primordial es medir las discriminaciones sensoriales sim-
tes. Los programas de pruebas han funcionado para seleccionar estudiantes de . .' pl«;s, aun.que también se enfoca .en.la percepción de materiales ligeramente
ingeniería, leyes, medicina, odontología, veterinaria, enfermería y contadu- . mas mUSIcales. Las subpruebas SIgUIentes analizan la música hasta tal punto
ría, entre otros_ . . . .. que de ésta queda muy poco.
En general, las baterías de pruebas empleadas en estas escuelas profeSIOna-
les son de lectura, razonamiento cuantitativo y aprehensión de relaciones abs- al Discriminación de tesitura: juzgar entre dos tonos cuál es el más
tractas, con la suficiente elasticidad para adecuarse al énfasis académico del alto.
programa de entrenamiento particular. En gran medida, son variaciones bl Discriminación de volumen: juzgar entre dos sonidos cuál es el más
menores acerca del mismo tema, que es una medida de relativamente alto . fuerte. .
nivel de aptitudes y aprovechamiento escolares. Las diferentes pruebas de el Discriminación de intervalos: estimar cuál de los dos intervalos es
aptitudes profesionales se podrían correlacionar muy sustancial~ente entre . más largo.
J.: . sí o con una medida de aptitud académica general, ya que las habilidades que . dI luicios de ritmo: juzgar si dos ritmos son iguales o diferentes.
se requieren para tener éxito en el entrenamiento para cada profesión ti~nen el luicio del timbre: estimar cuál de dos calidades de tono es más agra-
mucho en común. Las similitudes sobrepasan a las diferencias, y el nucl~o .. dable.
común se adapta al campo profesional particular, por ejemplo, al dar mas . f I Memoria tonal: juzgar si dos melodías son iguales o diferentes.

. .1.· ...;.
.. ., .
...; .. ......; . .. ..
..
' , .. ;. .;. r .. •'.... , .. · 1.-~·,' ........' : . .: ... .
~ .' ....; .. .': ...
:j
,I
377
376 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES

Los reactivos están en registros fonográficos, .con una serie ·d~ re~c!iyos de Un año Dos años Tres años
cada tipo. Dentro de cada tipo de juicios, los ~eactlvos se.hacen mas dlflClles.
El enfoque analítico a las aptitudes musIcales es eVlde?~~ en las ~ubprue­
bas enumeradas, no obstante que, según los críticos! el anáhsls.h~ re~rra~o las rrueba de ejecución 0.53 0.69 0.68
pruebas muy lejos del material genuin~ment~ musIcal y ~as dlcnnunaclOnes . . Prueba de aprovechamiento 0.61 0.61 0.71
finas de las tesituras, del tiempo y de la mtensld~d en real~dad no son necesa- .. ) Calificación del maestro 0.37 0.39 0.35
rias para las actividades del músico. Los estudIoS de vahdez d.e las prue~as
Seasbore han sido bastante conflictivos, pues producen correlaclO~es apreCIa-
bles con medidas de éxito musical, en algu~,?s casos, ~ mu~ bajas correla-
ciones, en otros. El valor de las pruebas analmcas todavla esta en deuda y es . La prueba proporciona una buena predicción de la ejecuciÓn' musIcal
motivo de controversia. , . posterior, la cual fue mejor cuanto más largo era el periodo de entrena-
Una prueba diseñada m,ás recie?temente, que esta bas~da en un maten~l miento musical. Vale la pena hacer notar que las medidas de ejecución
musical más complejo y mas genumo, es la llamada perfll C;;ordon d~ aptI- ,. objetivas y sin sesgos fueron más buenas predictoras que las calificaciones
tudes musicales (Gordon, 1965). Esta prueba, gr~bada e.n cmta, ~onslste.en :. : de los maestros.
',; .
pruebas de percepción musical en las que el exanunado tIene que ju.zgar SI la
~. frase musical "respuesta" es la misma o es diferente de la frase mUSIcal "pre_
:j¡ : ~
gunta". Existen cuatro subpruebas de este tipo e? las ~ue se basan las c~mpa­ PRUEBAS DE APTITUD ARTÍSTICA
raciones, respectivamente: a) melodía, b) armoma, e) tIempo y dI ~etro. Estas
pruebas son seguidas de otras tres subpruebas ~n las que el. exammado debe Se han puesto a disposición varios tipos de pruebas relacionadas con la
juzgar cuál de dos selecciones musicales ~s, meJor.. En la pnmera (prueba de aptitud para el arte; no obstante, este campo ha permanecido más bien sin
1, fraseo), dos ejecuciones difieren en expreslO~ musIcal; ~n la segunda (prueba desarrollo en los años recientes. En primer lugar, aunque en un número redu-
de equilibrio), las dos ejecuci0Il:es tien~~ dIferent~s finales, yen la tercera . cido, existen pruebas de juicio estético, una de las cuales tiene bastante
(estilo diseñado), las dos ejeCUCIOnes dIÍ1e~en en tiempo. .. . iiúluencia en la actualidad: la prueba Meier de juicio artístico. Cada reactivo
Las pruebas se diseñaron con gran cantidad de complej.I dad y detalle PSI- consta de un par de fotografías de objetos de arte; una de las fotografías es una
cométrico. La con fiabilidad es bastante aceptable: aproXImadamente O.?O . . obra maestra conocida y la otra es la misma obra maestra, pero distorsionada
para las siete subpruebas por separado; cerca de ~;80 para las tres seCClQ- . en algún aspecto (equilibrio, proporción, colores, etc.). El protocolo de prue-
nes principales, y de 0.90 a 0.95 para la punt~aclOn compuesta basada. en . has indica los aspectos en los que las fotografías son diferentes, y el examina-
todas las partes. Debido a que la prueba es relativamente nueva (fue pubh~a­ .do debe escoger la mejor fotografía de cada pareja.
da en 1965), los datos de validez disponibles son aquellos que engran medIda ': . Una prueba del aspecto de juicio de la habilidad artística es la prueba Gra-
',' :1
fueron suministrados por el autor en el manual de prueb~s., pero par~cen ser ves de juicio de diseño, la cual difiere de la prueba Meier en que todos los
¡. altamente promisorios y, en ciertos casos, bastante dramatlc<;>s: Por ejemplo, ,. reactivos constan de materiales abstractos no figurativos. Los miembros de
:' siete correlaciones con las estimaciones del maestro de mUSIca acerca del : ¡m par difieren en algún aspecto simple del diseño, es decir, en balance, en
talento musical de los miembros de su grupo coral o instrumental fueron simetría o en variedad. Los juicios de diseño están presumiblemente separa-
reportadas como dentr? de. un rang~ ¡de 0 .6~ a 0.97! . . de cualquier objeto o contenido particular.
En un estudio 10ngItudmal que SIrve de ejemplo, ~ordon Jl967) hizo el .' En un intento por obtener un dato de lo productivo, como distinto de lo
seguimiento de un grupo de estudiantes durante tres anos. Se dIero~ las prue- . ¡ipulrarnel1te juicioso en cuanto a los aspectos del arte, en algunas pruebas
bas en el cuarto y en el quinto grados y se guardar~n, de m.o do que m los maes- :. la H orn y la Knauber) se pide al sujeto que produzca dibujos basados en
tros de música ni los evaluadores del desempeno mUSIcal de los alumnos . :Y?;ICleitos "hechos limitados". En el inventario Horn de aptitudes artísticas se
conocían los resultados. Se pusieron a prueba clases completas, for~adas por patrón de líneas y puntos, del cual el examinado tiene que producir un
alumnos' que no habían tenido entren~ento mu.si~al formal p~evlO. Duran- :':~,.,UV\'(;UJ. El tipo de reactivo se muestra en la figura lOA-y los productos se eva-
te los tres años de seguimiento,los estudIantes reCIbIeron un pe?~~~~~l?anal medio de una calificación subjetiva, de acuerdo con los estándares
de instrucción musical. Se sometió a cada alumno a una sene estandar . ~~:'''''uu"",u,v" por los autores, pero presentan una evidencia de que e§to puede
pruebas de desempeño para su inst.ru~ento; es .decir, e~tudios grabados :~~ce:rse de manera bastante confiable aun por personas no artistas. En las
cinta y que se juzgaban sin el conocrrmento preVIO de:: ,qUien ~ocaba . .nUIt;ll.""" ',;plruellJas Knauber de habilidad artística se emplean varias tareas de dibujo
se obtenían las calificaciones de los maestros y tamblen se dIeron pruebas · iI!~Juyen problemas en el sombreado, la perspectiva y la composición.
aprovechamiento en lectura musical y en notación. . . ... Generalmente,las pruebas dé arte han sido.bastante eXItosas para diferen-
Las correlaciones de las puntuaciones de prueba totales con ~as ~es medi- a los estudiantes interesados en el arte de los que no lo son; sin embargo,
das criterio al final de uno, de dos o de tres años fueron las SIguIentes: . é/t :tam:blé:n se ha argumentado que.las pruebas logran esto porque, en gran medi-

i!'
¡ .

~~ ~:. I\~;
378 APRECIACIÓN DE LA CREATIVIDAD 379

"i' Las dos últimas pruebas, que requieren que el examinado elabore dibujos
, .'. tenían casi la misma correlación con las calificaciones que la que tuvo la prue~
baMeier de iuicio artístico, pero correlaciones mucho más altas con las apre-
.' . ciaciones de los productos estudiantiles. .
::' De lo ante~ior se infiere que las tareas de prueba que se les piden a
los estudiantes mteresados en el arte son la misma clase de tareas que se les
enseñarán en el curso y, por tanto, predicen el aprovechamiento posterior.
Lo que faltaría por determinar es qué tan abajo podrían ubicarse los estu-
diantes no entre nados. .
. Debido a que las cl~s~s .de las pruebas de arte de todos los tipos depen-
· den de un conjunto de JUlCIOS, obtener una puntuación alta requiere con-
formidad con los estándares estéticos aceptados. Existen dudas reales en
· cuanto a la aplicabilidad de estas pruebas (o de las pruebas de aptitud musi-
cal) en una cultura distinta, así como la posibilidad, aunque remota, de que
una persona bastante talentosa pero no convencional sería sancionada por
estas pruebas.

APRECIACIÓN DE LA CREATIVIDAD
Considerar las pruebas en los campos de la música y el arte nos hace pen-
Figuro 10.4. Ejemplo de reactivo empleado en el inventario Horn de aptitudes ortísticos.
sar, naturalmente, en el tema de la creatividad. Una crítica que se ha dirigido a
las pruebas de habilidad del tipo común es que se enfocan en lo que se ha lla-
mado pensamiento convergente, en el cual se pide al examinado seleccionar
da, son pruebas de aprovechamiento, más que medidas de aptitud. Se han rea· la respuesta correcta para un problema para el que la respuesta ya está deter-
lizado rela~iv~~ente pocos estudios de estas pruebas como medidas de apti· minada; se le pide que defina una palabra, resuelva un problema de aritmética,
tud con mdIV1duos no entrenados. Las investigaciones acerca de los encuentre el siguiente número de una serie o identifique lo único que no per-
estudiantes interesados en el arte han indicado que el desempeño en la prueba tenece a un conjunto. A menudo, el examinado escoge la respuesta de una
es razonablemente predictor del éxito posterior en la escuela de arte. Así serie de cuatro a cinco opciones que se le proporcionan; sin embargo, los criti-
i . ~
~orn y Smith (1945) encontraron una correlación de 0.66 entre las puntua~ cos señalan que mucha de la actividad de la vida implica pensamiento diver-
ClOnes de la prueba Horn al principio del año y la puntuación de la facultad gente; es decir, producir respuestas novedosas a situaciones, respuestas que
promedio acerca del éxito en una clase de arte especial en la escuela secundaria sean originales, poco comunes, variadas y que sean eficaces para resolver un
al final del año. Barrett (1949) correlacionó cuatro pruebas de arte con las cali· problema desestructurado.
ficaciones obtenidas en el noveno grado de un curso de arte y con las califica· Recientemente, varios investigadores han intentado diseñar pruebas de
ciones que recibieron los productos artísticos de los alumnos, y obtuvo los pensamiento divergente e incluso de creatividad. Guilford incluye el pensa-
resultados siguientes: . miento divergente como una de las cinco operaciones del material intelectual
. en su Estructura del intelecto. Este autor, junto con sus estudiantes, ha pro-
· ducido varias pruebas que ejemplican esta función. De manera típica, en las
pruebas se pide al examinado que dé respuestas múltiples a un problema, por
Calificación ejemplo, los diferentes usos que se pueden dar a un gancho de alambre para la
Grada
de cursa del producto ropa. Las respuestas se califican en términos de fluidez (número de respuesta),
..•.. flexibilidad (número de diferentes categorias de respuestas) y originalidad
(número de respuestas raras dadas por unos cuantos examinados). 'l'orrance
Prueba de McAdory de arte 0.10 0.13 (1966) ha produCido pruebas con respuestas gráficas, pictóricas o verbales
Prueba Meier de juicio artístico 0.37 0.35 destinadas a los niños pequeños. Así, en una prueba se presenta al sujeto una
Pruebas Knauber de habilidad artística 0.33 0.71 página con círculos simples; y la tarea consiste en hacer de cada círculo un
Prueba Lewerenz d. habilidades artísticas fundamentales 0.40 0.76 dibujo, produciendo tantos y tan variados como se pueda.
Si el pensamiento divergente o la creatividad son constructos útiles para

. i~ :
;:!

. . .. !

." . : '.; , . ::, ., . • : . ', ' <; .• '


380 CAP. 10. MEDICiÓN DE APTITUDES ESPECIALES PREGUNTAS Y EJERCICIOS 381

la medición educativa y psicológica, las pruebas para estas cualidades deben ' medidas de aptitud escolar y de aprovechamiento académico. Las bate-
tener las características siguientes: de pruebas de aptitud escolar profesionales parecen ser variaciones de
" tema básico de las pruebas de aptitud escolar.
al No tener relativamente correlaciones con las pruebas de pensamiento., , En los campos de la música y el arte se han producido varias pruebas de
convergente, que son las que forman las baterías de prueba de aptitud , "'habilidad; sin embargo, las pruebas altamente analíticas no han sido exitosas.
convencionales. " , Las pruebas más completas impliCan una combinación aún no conocida de
b) Mostrar cierta coherencia en el sentido de que las diferentes pruebas de ,entrenamientos previos. Estas muestran una validez razonablemente buena y
"creatividad" se correlacionan entre sí. ' , pueden ser una forma objetiva, por lo menos relativamente, de apreciar el
el Tener algunas correlaciones signiflcativas en el mundo de los eventos ' ,' estatuS en estos campos.
prácticos. En la actualidad, las pruebas de pensamiento divergente y de creatividad
atraen mucha atención, pero su utilidad como instrumento psicométrico es
Las pruebas han tenido sólo un éxito modesto en cual~uiera de estas tres todavía incierta.
condiciones. Las correlaciones con las pruebas convencIOnales de pensa- .
miento convergente no son altas, pero suelen ser P?s,itivas y apr~ciables. Las,
correlaciones de las diferentes medidas de creatlVldad han SIdo, cuando PREGUNTAS Y EJERCICIOS
mucho modestas y la noción de un rango generalizado de creatividad tiene ','
poco apoyo. La extensión en que las pruebas de creatividad sean ~redictivas ,'. 1. Se han diseñado varias baterías de pruebas de aptitud para emplearlas en el nivel de
del aprovechamiento, ya sea dentro o fuera de la escuel~, es todaV1a u~ pun- ' escuelas secundarias y con adultos, pero casi ninguna para la escuela elemental.
to controvertido; algunos investigadores reportan relaCIOnes sustanciales al ¿Por qué?, ¿es esto razonable?
, .. respecto y otros fracasan para encontra~las. P<;>r t~~to, estas pIu.ebas deben 2. ¿Cuáles son las ventajas y limitaciones de usar una batería como las pruebas de
considerarse más como instrumentos de InveStlgaclOn que como mstrumen- aptitudes diferenciales, en vez de pruebas seleccionadas de varias fuentes?
tos de valor probado para el uso en las escuelas o en la industria. 3. ¿Cuáles serían los pasos por seguir para establecer un programa destinado a selec-
~:: cionarestudiantes para una escuela de odontología?
4. La Universidad de Mugwump tiene una escuela profesional en derecho medicina
e ingeniería. De acuerdo con un enfoque taxonómico, ¿qué propiedad desearía un
RESUMEN orientador vocacional que tuviera una batería de pruebas para ayudarle a seleccio-
nar a los estudiantes entre estas tres escuelas profesionales?
Aunque las prueb~s del1ab~li.d~~ cognos<::.it~va general tienen alguna ' , 5. Si el asesor destaca un enfoque predictivo, ¿qué propiedades desearía él que tuviera
relación con el hito en muchos campos, la guía vocacional eficaz o la clasi- la batería de pruebas?
ficación de personal requieren pruebas más específicamente ~irigidas a las , 6. Una escuela secundaria vocacional ofrece un programa para entrenar a tenedores
de libros, cosmetólogos, asistentes dentales y estenógrafos. Los estudios con la
habilidades necesarias para desempeñar cada trabajo. Los estudios analíti- CATB han revelado los datos en medidas, desviaciones estándar y correlaciones
cos de las habilidades humanas apoyan la idea de lo genuino y la impor- con las calificaciones de los supervisores, como se muestra a continuación para
tancia de estas habilidades_ Numerosas pruebas de habilidades especiales estas cuatro ocupaciones. Como asesor de la escuela, ¿cómo usaría usted esta
han aparecido en los últimos años, y más recientemente las pruebas de esta ' información para ayudar a los estudiantes a escoger entre los cuatro programas?
clase se han organizado en baterías de pruebas de aptitud integradas para su
uso en el asesoramiento vocacional o en la clasificación de personaL
Los datos de las pruebas de aptitudes pueden organizarse en los modelos Des/reza
predictivo o taxonómico. Desde el punto de vista de la empresa, que está inte- Verbal Numérica Espacial manual
resada por la selección y clasificación, el n;odelo predic~iyo es pr~bable:ne~t.e
el más apropiado; sin embargo, para la gula de la selecclOn vocaclOnal mdiV1- Medio DE Medie DE Medio DE Medio DE
dual puede ser más adecuado el modelo taxonómico. Las pruebas de aptitud
muestran una validez modesta dentro del contexto de cada modelo, lo cual no ,,: )enedor de libros 106 16 0.51 112 15 0.37 103 20 0.38 lOS 21 0.36
sucede con las pruebas de predicción, y la diferenciación no es lo suficiente-:, , +'¡,(osmelólogo 96 15 0.24 92 13 0.31 100 16 0.25 98 17 0.07
mente precisa para impulsar los programas de prueba. ' ' !{, Asistente deñio!- , '106 13 0.26 102 14 0.34 107 16 0,30 115 19 0.36
También se han diseñado pruebas especiales con el fin de evaluar la '", Eslenógrofo 105 12 0.21 lOS 14 0.24 106 16 0.06 103 21 0.09
capacidad para realizar alguna tarea educativa específica. Las más amplia-
mente utilizadas en este campo son las pruebas de la capacidad para la lec-
tura. Otras pruebas que se han usado un poco menos corresponden a las 7. Al principio del grado duodécimo, Susana Santiago tomó la batería de pruebas del
pruebas de pronóstico, tal vez porque su función queda bien cubierta por: , proyecto talento' y sus puntuaciones dieron valores para tres dimensiones discri-
382 CAP. 10. MEDICIÓN DE APTITUDES ESPECIALES

minantes de 62,58 Y 55, respectivamente. ¿Cuál de las 12 planeaciones de carrera


presentadas en el cuadro 10.1 es la que mejor se relaciona con los resultados obte- . .
nidos?, ¿cuál debería ser el objetiva in~ediato. del ases~r respecto a S?sana? .
8. ¿Qué tan válido es el enunciado "La mejor medIda de aptitud en cualqUIer campo
es una medida de aprovechamiento obtenida en ese campo hasta la fecha"?, ¿cuá·
les son sus limitaciones?
9. ¿Cuáles son las diferencias entre la prueb~ de capacidad para la lectura y u~a prue-
ba de inteligencia?, ¿cuáles son las ventajas de usar una p~eba de capacidad, en
vez de una prueba de inteligencia para los alumnos del pnmer grado?
10. ¿Hasta qué extensión las pruebas como el ir:ventario Rom de aptitudes artísticas
son medidas de aptitud y de aprovecharmento?
11
11. ¿De qué maneras el programa de asesoría escolar.podría mejorar un estudio de
seguimiento de graduados de la escuel~ secundana? . . . . ,.
12. ¿Por qué las baterías de prue?as d,e ~ptttud muestran meJ~res dlSCrlI?maclones
entre trabajos que en predeclr el eXlto dentro de un trabajo en particular? Cuestionarios e inventarios
13. ¿Qué problemas especiales surgen al intentar medir un atributo como el de creati-
vidad?, ¿qué procedimientos auguran bue~os resultados a estos probl,emas?
14. Pida a los estudiantes de una clase que escnban todos los usos que segun ellos se
de autoapreciación
pueden dar a los periódicos viejos, Trate de sistematizar las calificaciones para los
resultados en que se puede apreciar lo si~iente: al la fluid.e~, bl la flex!~~dad ycl
la creatividad. ¿Qué problemas encontro en la recolecclOn y el análiSIS de los
datos?
15. ¿Qué pretenden lograr los psicólogos por medio del .an.álisis de factores?, ¿qué
problema encuentran cada vez que usan este procedimiento?
.. . E~ 1.05 últimos c;apítulos ?e~os estudiado las medidas de habilidad, lo que
el mdIV1duo puede hacer baJO cIertas condiciones de prueba y la motivación
LECTURAS ADICIONALES . .que tenga para hacerlo lo mejor posible. Ahora examinaremos las mediciones
,de otros aspectos de la personalidad -es decir, la apreciación de lo que uno
Benett, C. K., Seashore, H. C. y Wesman, A. C., Fifth editiC?n manual fo~ the Diffe- podría hacer en las circunstancias naturales de la vida. Tanto al analizar la
rential Aptitude Tests, From S and T, The Psychologlcal Corporatlon, Nueva personalidad como al esforzamos en diseñar instrumentos de evaluación
York, 1974. . .. . . debemos reconocer que la persona es un todo unificado. Cualquier aspecto ~
Fleishman, E. A., HO n the relation between abihues, leammg, and human performan- .. .}~gos que pud~éramos ~eparar lo ~aríamos exclusivamente por nuestra pro-
ce" en American Psychologist, 27, 1972, págs. 1017-1032. . ··pIa convemenCIa, pues estos no eXIsten como entidades separadas, sino sólo
Ghiselli, E., The validity of occupational aptitude tests, Wiley, Nueva ~ork, 1966. son aspectos o formas de observar a la persona como un ser individual· sin
Hunt, J. McV. y Kirk, G. E., "Criterion-referenced tests of school readmess: A p3;fa- embargo, es inevitable que separemos a la persona en secciones para estudiarla
digm with illustrations", en Genetic Psychology Monographs, 90, 1974 pags.
y comprenderlar ya que Iio podemos ver todo al mismo tiempo.
143-182. . La personalidad tiene muchos aspectos diferentes, dentro de los cuales
Kogan, N . y Pankove, E., ULong-term predictive validity of divergent-thinking te~ts:
Sorne negative evidence", en 10umal of Educational Psycbology, 66, 1974, pags. .. podemos distinguir los siguientes:
802-810. .
Steckler, V., /lA review of the Nonreading Aptitude Test Battery", en lournal of
Temperamento: se refiere al estado de ánimo característico de un indi-
Employment Counseling, lO, 1973, págs. 17-~0: .
United States Department of Labor: Manpower Admmlstratton, A:1anual fo~ the U. S. . a su nivel de actividad, a su excitabilidad y a sus focos de interés y
E. S. General Aptitude Test Battery, U. S. Employment Servlce, Washington, D. . .pre:oc·uD;aclón, incluye dimensiones como alegre-triste, enérgico-indolenter
··},'.,.-."J'La'I.lV-\AlllllllaUU. introvertido-extravertido y dominante-sumiso.
C., 1970. .. . h US
United States Department of Labor: Manpower AdmlrustratlOn, Ma~ual for t e . . :",~nl,tl)r' se relaciona con aquellos rasgos a los que se establece un valor
E. S. NonreadingAptitude Test BatteIY, U. S. Employment Semce, WasIllIl:~lUU, .;, ':".". Ont',i~1 definido, como los rasgos de honestidad del "boy scout",la amabilidad,
D. C., 1970 ... cooperaciónr etc.
. ,: .' Ajuste: es un término que emplearemos para indicar qué tan bien el indi-
.••' . es capaz de encontrarse en paz interna y con el mundo que le rodea.
: el individuo pueda aceptar su modo de vida y éste no le produzca
... problemas con su grupo social, lo consideraremos bien ajustado.

383

. .~

. .....
.. ,' ... . ', .'
.
. ' .. ~',' .. '.:.", ' .. ~:,. ' ", ., . ," ,' .
384 CAP. 11. INVENTARIOS DE AUTOAPRECIAClÓN 385

Intereses: se refieren a las tendencias a buscar ciertas actividades y panici· " Medidas de conducta
par en ellas. , '
Actitudes: se relacionan con las tendencias a favorecer o rechazar a gro. ' , Se puede argumentar que para propósitos prácticos, la personalidad de un
pos particulares de individuos, conjuntos de ideas o instituciones sociales. individuo es lo que la persona hace, más que lo que la persona diga o lo que se
diga acerca de ella. El problema está en diseñar procedimientos para apreciar
la conducta genuina, no distorsionada, con el propósito de tener una buena
impresión. Se ha intentado poner a los individuos en situaciones de varios
MÉTODOS PARA ESTUDIAR LA P'ERSONALIDAD tipos. Las situaciones de evaluación pueden parecer como de pruebas de habi-
lidades, pero, de hecho, se califican por otros factores que no son las habilida-
La mayoría de las técnicas de evaluación que se consideran en este y los des que cree el examinado se están midiendo. La situación de prueba puede
próximos capítulos están relacionadas con uno o más aspectos de la personali· implicar fantasías y producción imaginativa, así como varias formas de in-
dad que identificamos en párrafos anteriores. ¿A qué tipo de fuentes podre· teracción grupal. En algunos casos, la conducta se califica de manera objetiva,
mos recurrir para buscar evidencia en estos aspectos cuando deseamos estu· en otros por medio de un observador o un asesor, mientras que en otros se
diar al individuo? Primero, debemos conocer el concepto que el individuo produce una interpretación clínica intuitiva y más bien elaborada.
tiene de sí mismo; segundo, las opiniones que acerca de él tienen otras perso- . La conducta ~uede estudiarse en s~ ~mbiente natural, es decir, en el grupo
nas, y tercero,la manera como dirige su vida, es decir, cómo se comporta en el de Juego,. en el salon de cl~s~s o en la 'ofIcma, y cuando esto ocurre el investiga-
mundo real de las cosas y las personas. ' dor funCIOna de manera tIpICa como un observador, registrando y tal vez tam-
bién evaluando las acciones que ocurren. Las diferentes formas de obtener y
analizar muestras de conducta se considerarán en el capítulo 13.
Autorreportes
ENTREVISTA
Una fuente obvia de información acerca de la persona es la persona mis-
ma. Nadie tiene un 'punto de vista tan íntimo, ni tan continuo, acerca de Juan Si deseamos saber algo acerca de una persona, una manera de hacerlo es
pregun~arle muchas cosas y evaluar sus respuestas. Esta entrevista puede ser,
como Juan mismo. El tiene conciencia de sus expectativas, esperanzas, aspira·
ciones, intereses y preocupaciones que pueden quedar muy bien escondidas al h?sta CIerto grado, estruc~u.rada, controlada y estandarizada con respecto a
extraño. Para obtener el punto de vista del individuo podríamos usar las ' solo las preguntas que se hICIeran, tanto a las preguntas que se hicieran como a
entrevistas, haciendo una prueba de aquellas áreas que parecen sensibles y sigo sus P?sible~ respuestas o a cuestiones diferentes de las preguntas y las respues-
nificativas para éL Otro enfoque es incorporar preguntas que podrían plan· tas. SI conSIderamos a las preguntas y a las respuestas como representativas de
tearse en una entrevista cara a cara en un cuestionario uniforme o inventario dos dimensiones que podrían extenderse desde muy fluidas hasta muy estruc-
de la personalidad. Las opciones que tiene el individuo al responder una serie turadas y controladas, podríamos representar las diversas formas de cuestio-
\" de preguntas se califican de cierta manera para proveer una autodescripción. namiento como se muestran en la figura 11.1. En el extremo del continuo
Estos procedimientos se elaborarán en este capítulo y se señalarán sus ven· representado por la pregunta estructurada, controlada, respecto tanto a la
pregunta como a su respuesta se encuentran muchos de los inventarios de
tajas y desventajas. ~utorrep.orte, de los que hablaremos más adelante en este capítulo. Tales
mventanos se presentan. a cada persona con una serie uniforme de preguntas
en un orden predetenmnado y proveen una serie limitada de categorías u
Apreciación por medio de la opinión , opciones de las que debe escogerse una.
de l os demás El blanco de aplicación típico está igualmente estructurado en cuanto
concierne a las preguntas, pero es más flexible del lado de la respuesta. Las
:~ . . ;
Para algunos propósitos, tal vez estemos interesados en cómo es percibi. ' respuestas son frecuentemente (aunque no siempre) construidas por el res-
da una persona por sus semejantes. ¿Se aprecia a Elena como una compañera pondiente, dándole la oportunidad de que conteste con una respuesta que lo
de trabajo amigable?, ¿como una maestra justa?, ¿como una alumna produc· describe de una manera única.
tiva?, ¿como una vendedora convincentd, ¿es una empleada generalmente En el otro extremo, esto es, en la pregunta y respuesta abierta y no estruc-
deseable? La opinión de los demás puede ser significativa en ciertos ambien· turada, encontramos la entrevista terapéutica no dirigida. Es imposible decir
tes; también es un modo muy conveniente de obtener una apreciación resu' " por adelantado, o de un caso al que sigue, qué preguntas se formularán o qué
mida de alguien. Por estas razones, dichos procedimientos de calificacÍónse , fo~s tomarán l~s respuestas; lo anterior son las ventajas y desventajas de
han utilizado ampliamente. En el capítulo 12 consideraremos su valor y sUS '" . este tIpo de entre":'Ist~..Es una ventaja en cuanto que hace posible adaptar las
limitaciones. preguntas al caso mdlVIdual, de manera que se puede profundizar en líneas de
387
386
Estructurado..--------....,..--------------------· , Cuadro 11.1. Guío poro el empleo y lo evaluación de los entrevistados. (Copyright 1972,
Banco Inventarios
de aplicación de autorreporte 1973, por The Psychologicol Corporation, Nuevo York, N. Y. Reproducido con
permiso. Todos los derechos reservados.)
GuiA DE LA EHTREVISTA

(am ••" rlegu."


Sea receplivo Enlabie Prueba (011; ¿Ové?
o'" y responsivo tOllVelWÓón ¿Cómo?
:;
¿POI qué?
~
w Entrevista MaDl.nga sus preguntas abiertas
estructurada
Entrevisto
del empleado
amateur
,,,~yr: Bu'que,
Entrevisto no Saludos Apariencia
Fluid0l,-...,..._ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _-;:-_ _--1
directivo requefla plólit. Maneras
rrego¡nl. de apertura Autoexpresión
E Pregunla (andudara Respamiv;dad
Respuesta

Figura 11.1. Relaciones entre la técnica autodescriptiva.


flptli.1<io J. Ilabaja

interés que parezcan más relevantes y productivas. Es una desventaja porque IMlul" P,egu"'~: Busqllt:
hace muy poco probable que se pueda obtener la misma evidencia en todos los Trabajos an/eriores, de medio ¿~ué (OSOS hace mejor? ¿Qué (OSOS ha!e peor? El lrobojo oJelUoda
t~po y eventuales ¿Oué lo,as l. guslan mós? ¿Cuáles le guslon menos? Suficiencia de lrabojo
entrevistados. En el caso extremo, puede haber grandes lagunas en la entrevis· Asignaciones mililares ¿Cuáles ,on ,us más grandes log,.,? ¿Cómo los obtu..? Hobilidad y (ompelencia
ta por la pérdida de material altamente relevante, debido a que no fueron Posi<iones de liempa lomplelo ¿Cuóles SI., los peares problemos que alronla? ¿Cómo los Adaplobilidod
maneja? rradud;vidod
formuladas las preguntas apropiadas. Esta variación en cuanto a la cobertura ¿Cuáles son Jos maneros mós eficQces (on los personas? Motivodón
es explicada, en parte, por la consistencia desalentadoramente baja que surge ¿(uáles los menos .li(O(es? Rel",;ones inlerpersonoles
de las impresiones que cada entrevistador obtiene cuando entrevista a la mis- ¿Cuól es el nivel de ingresos? . liderazgo
¿Cuáles ."", sus rozones para (ambiar de tmbojo? úe(imienlo y desOlJOfto
ma persona. ¿Qué aprendió en sus experiencias laborales?
El problema de la entrevista es mantener las virtudes de la flexibilidad, al ¿Oué bu"o en el lrabojo? ¿En lo (orrera?
mismo tiempo que se logra un grado razonable de uniformidad. Una manera
de resolver este problema consiste en diseñar varios patrones de entrevista
UU(ació.
estructurada que abarquen sistemáticamente una serie de temas, pero no
siempre en el mismo orden o con el mismo détalle. Este enfoque es interme· '''''1'' P"yu.'., Busqu. ,
diario en grado de estructura y control en la dimensión estímulo (pregunta) Y . &weIa elemenlal ¿Cuóles sun los mejores materios?, ¿lUáIes los peores? Escolaridad adelUado
Es<ueIa _ndorio ¿Cuáles malerios le gustoron más?, ¿1UÓ1es le gustaron menos? Suficiencia d. la e"olaridad
muy abierto y fluido en la dimensión de la respuesta. Mediante el entrena· . ~iversidod ¿Oué reo(dones liene .. relodón (on ios maeskos? Habilidades inlele""ales
miento y una forma de registro de la entrevista, los entrevistadores deben Erlfionomiento especializado ¿Cuáles son lo, niveles de grado?, ¿esfuerzos requeridos? VOISCIlilidad
abarcar sistemáticamente una serie de temas que ya han sido identificados ' C""'" mienles ¿CuóIe, son los razones pata estog...... esroeIa?, ¿cuáles son AmpIiIUd y profunOadorI riel conorimiento
ios (ampos prindpoles? NivtI de aprove<hamienro y logros
como apropiados y registrar la información relevante obtenida en cada entre· ¿Ap'ow(hamienlos espetiales?, ¿prablemos RlÓS difídles? Motivod6n. Iole,.,.,
vista. De esta manera, los lapsos y los sesgos de un entrevistador pueden mini·. ¿Out papel desempeilO en los molerías exlraplogramálitas? Reacciones a la outoridad
¿Cómo se finonció la edu(odón? liderazgo
mizarse. Una forma de registro que han empleado los psicólogos de personal ¿~ué reladÓII liene la educación Ion la (arrenr? Trobajo de equipa
para entrenar a los entrevistadores y guiar a los entrevistadores principiantes ¿Considera la edutadón posleri",?
se muestra en el cuadro 11.1.
La popularidad de la entrevista no está basada primordialmente en su .
validez demostrada como un instrumento para apreciar a las personas. De
hecho, la evidencia para la validez de las impresiones o conclusiones derivadas P"9·nll, Busqttto
de las entrevistas es esporádica y más bien contradictoria. Los procedimien· .. ¿En qué Irabojobo su padre? EsloIUS soáoe<0n6mko
¿(uáles son los inlereses de SUS padres?, ¿sus personalidades? Ejemplos fmnitlGltS
tos de entrevista son básicamente subjetivos, variables y muy dependientes de

.:, .
FORMAS PARA lOS DATOS BIOGRÁFICOS 389
388
la habilidad del entrevistador. En varias ocasiones se ha demostrado que cada
Cuadro 11.1. (Continuación.) entrevistador que entrevista a la misma persona llega a diferentes conclusio-
GuíA DE LA OOREVISTA nes respecto a ella. Esta variabilidad es resultado, en parte, de las variaciones
Pregunte
en las preguntas que se formulan y en las líneas de preguntas en las que se
Escuch. Comente
insiste, así como, en parte, de las diferencias de interpretación y evaluación de
Sea re<eptivo Entable Prueba con: ¿Qué? las respuestas que hace el entrevistado. La entrevista típica no es una técnica·
conversodóA ¿Cómo?
y responsivo
¿p", qtIÓ?
psicométrica precisa o eficaz. Más aún, las entrevistas individuales demandan
gran parte del tiempo del personal entrevistador, demandas que las hacen pro-
Mantenga sus proguatas abiertos hibitivas en múltiples situaciones. Para economizar en tiempo de entrevista y
Actitudes hacia el aprovechamiento, el
proporcionar un interrogatorio uniforme en la presentación y en ~l procedi-
Adividad" individuales y de ¿Oué pasó <00 los hermanos y 1M hermanos?, ¿rontroston
grupo ca" él? trabajo r los pe"onos miento de evaluación, se ha diseñado el cuestionario impreso. El cuestionario
Vecindario y comunidod ¿Hoy expectativos de los podres? ¿Oué t... estrictamente fue Valores y metas bá,icos o inventario de autorreporte consiste esencialmente en una serie estándar de
educado? Autaimagen
¿En qué ocupobo el tiempo?, ¿o qué jugobo?, ¿qué toreos
preguntas acerca de algunos antecedentes del individuo, de sus sentimien-
desempellobo?, ¿o qué orgonizo<ion" peIIene<.? toS, preferencias o acciones, que son calificadas con una clave de calificación
¿Cómo describe o lo comunidad?, ¿o los v"....? estándar. .
¿(uáles son los efecto, d. los primeros eXpelieneios?
Los enfoques alternativos para interrogar a un individuo tienen ventajas
opuestas. Se puede prescindir de la objetividad r la confiabilidad y la compa-
rabilidad de persona a persona, así como de la economía provista por un in-
Actividades einlereses presentes ventario de opción múltiple, por la flexibilidad y la adaptabilidad al caso
I.,/uyo; Pregunte: Busq." individual que da la entrevista. El usuario potencial debe decidir en cada
Intereses y afitiones presentes ¿Qué le gusta hacer en el tiempo libre? Vitalidad situación qué compromiso entre estos dos valores es el más adecuado a sus
Asuntos cívicos y de lo ¿Oué actividades sociales realizo? Maneja del tiempo, de la energia y del necesidades.
comunidad ¿En qué grado o nivel participo en la ,amunidad? di....
Arreglos de vida ¿Cómo son el hogar y lo familia? Madurez y juicio
Matrimonio r familia ¿Qué oportunidades tiene de co",truir 000 reservo finandero? (relimienla intelectual
Finanzas ¿Que problema de salud tiene?, ¿se ho hecho un exornen Amplitud "hurol
J Salud y energía físico? Diversidad de intereses FORMAS PARA LOS DATOS BIOGRÁFICOS
" Prefertmcios geográficos ¿(uü!es son las reo«iones de relocmizoción? Intereses sodales
Habilidades sociales
¡FICHA DE IDENTIDAD)
liderazgo
Val.... y metos bó,icos Un uso importante y bastante obvio del cuestionario es como medio para
Factores situacionoles
inducir la información factual acerca de la historia pasada del individuo.
Lugar y fechas de nacimiento, cantidad y tipo de educación, grado de éxito en
KeslJmen ella, naturaleza y duración en los trabajos anteriores, pasatiempos, habilida-
des especiales y una serie de otros datos biográficos pueden determinarse de la
Induya: Pregunre: B"q'"
Habilidades ¿Oué la hote solicitar este emplea?, ¿qué son los afirmacion,,? Más (+1 y menos (-) manera más económica si el individuo llena un cuestionario en blanco. La
Oeficiemios ¿(uáles soo sus mejores talentos? Talentos, habilidades economía y la eficacia de este enfoque lo hacen particularmente atractivo.
¿Qué ,ualídades se ve a ,í mismo y , . en los demó,? (onoc:inüento Aunque los reportes sean inexactos en algunos aspectos, probablemente cada
¿Oué lo hoce a usled una bueno inversión pora su empresa? Energía
Malivotióo individuo es el depositario único más rico para esta información personal
¿Cuáles son sus desventajas? Int...... de datos.
¿Qué ártOS necesitan mejorar? Cualidades pe,,"noles
¿Qué cualidades desearía deso"allar un poto más? EtKieDdo social
Al usar los cuestionarios para recabar datos existe un problema de comu-
¿1M aíticas constructivos podrro r",íbir de los demós? (- nicación. Cuando las preguntas están formuladas previamente (es decir, apa-
¿En qué sentido podría ser un riesgo paro SIl empresa? FOItores siruocionoles recen en forma impresa) puede ocurrir una serie de malentendidos en las
.! ¿Qué en~e_iento o experiencia posterior padrfa usted nMesit.,?
maneras como las interpretan el respondiente y la agencia de evaluación. Si no
hay una interacción personal, estos malentendidos no pueden aclararse con
Camenrar;.. finales una pregunta oral y, entonces, las siguientes preguntas entran en un área de
I.,/,y.; incertidumbre. Por tanto, es importante que un cuestionario sea claramente
(omentorios acorto de lo entrevista y del soIititante redactado y se pruebe de manera preliminar con pequeños grupos, para ase-
Contactos posteriores que podó.. hot,rse
(u,," de occÍÓA que podóa tomarse gurarse de que ya se han aclarado las ambigüedades.
Despedido ,a,,¡¡aI Puede ser deseable una entrevista complementaria del cuestionario para
adarar cualquiera de las respuestas a los reactivos del cuestionario que causen
INVENTARIOS DE INTERESES 391
390 CAP. 11. INVENTARIOS DE AUTOAP RECIAC IÚN
bien una
ta tamOS conoce r no sólo qué clase de trabajo es capaz de desarrollar
duda al entrevi stado o para que éste obteng a una inform ación más comple pe~sona, s~no tambié n q~é clase de ~rabajo sería interes ante y encont raría
. De hecho, un uso apropia do de los inventa rios de autorre_ aparato s de televi-
en ciertos puntos ia . s~~Isfa ctono ~acer. ¿Podna ser el trabajO de un reparad or de
porte de todos los tipos consist e en propor cionar entrevista complementar la en~ Slon o el de cajero de un banco?, ¿el de vended or de una tienda de departa
men-
nario marque rutas que puedan seguirs e en el de
de tal modo que el cuestio
toS o ~l ~e un eml?lea do en ~na estaci? n d~ servicio ?, ¿el de un abogad o o
trevista. mteres para una empres a que quiere te-
un medICO? Esta mfc:lrmaCIOn es de
Alguna s veces la inform ación factual en un cuestio nario en blanco puedes ner un emplea do satisfec ho y estable en el trabajo, así c
. omo para la person a
mínimo
usarse para determ inar si el solicitante satisface ciertos requisi tos que entra en <:1 mundo la~oral y para quien una de las preocu pacione s princi-
o, si ha cumpli do 21 años, si tiene licencia para
para un trabajo , por ejempl
material pales de su Vida es estudIa r una carrera que le produz ca satisfacción. los
conduc ir y es vigente, etc. Otras veces, esta inform ación es parte del al co- Por tal ~azón, el diseñ!) de los inventa rios para evalua r los intereses
y
o
crudo dispon ible al contrat ante de personal, al director de admisio nes v~lores ha SIdo. u!1a preocu pación ~uy i.mport ante para los psicólo gos indus-
cuanto a
mité de becas, con base en cuál será la decisió n clínica que se tome en se tnale~ Y los pSlcometras. Ahora bIen, SI queremos saber qué
tipo de trabajo
la deseabilidad del individ uo como emplea do o estudiante. Recientemente cuales sería mteres ante para EIsa o ~regori o, ¿por qué no simple mente se lo pregun -
entado el análisis de las hojas para datos biográf icos, las obtend ríamos mucha
ha increm
predigan tamoS? Por supues to, median te este proced imiento
se examin an punto por punto para diseñar claves empíric as que inf~rmaci~n, pero. habría ID:,:chas ocupac iones de las que Eisa o Gregar io no
s de empleo o de desemp eño cotidian o. qu~ en ellas y no po-
algunos criterio tuyIera n mngu~a I~fo~a c~on, de modo no pensar ían
Así, en un estudio (McGr ath, 1960) de la aplicación de los cuestionariosse
y s, hay mucho s tra~
dores de coches nuevos, dr~an expresa r mngun mteres acerca de las mIsmas. Ademá
los contrat os de compra de muestra s de compra a,. ~~ los que sólo se ti~nen impres iones vagas, es decir,
s que baJOS, tal vez la mayorí
identifi caron 24 puntos o reactivos que discrim inaban entre aquello por fal- no se conoce n con preCISlO n las tareas que Implica n y las circuns tancias en
su coche y aquello s que regresa ban el coche e mucho
comple taban los pagos de
diseñad a para una muestra de que se realizan. Por estas razones, parece más atractiv o un enfoqu
ta de pagos. Cuando la clave de calificación iones más directo .
, las correla ciones de las calificac e
casos se aplicó a una segund a muestra
mues- En el enfoque de inventa rio se presen ta al examin ado una serie bastant -
fueron aproxim adamen te de 0.50 con los pagos comple tos en la nueva s larga de enunciados, en los que sc nombr an trabajos , activida des y situacio
(1973) reporta ron validac iones cruzada más op- .
tra. Loughm iller y colabo radores
biográf icos como predic- n.es, y el examinado indic~ sus prefere ncias o gustos por una o por
de aproxim adamen te 0.40 para una clave de datos situa- ClOnes. La respuesta adqUIe re una o dos formas contras tantes· es decir una
tor de un criterio compu esto de éxito para practicantes médico s. Otras a de respue~ ta c~tegór ica d~ ~sto, de indi~er encia o de disgust o, '0 una opción
ciones en las que recient emente se ha aplicad o la ponder ación empíric resul- entre SItuaCIOnes o aCtiVIdades alterna tivas. Los reactiv os que ilustran
el for-
los reactiv os en un cuestio nario o en un inventa rio biográf ico, con ID.ato. de cinco series de inventa rios de los más conoci dos y amplia mente dis-
entes
tados promet edores, son la predicción de la creatividad en adolesc el tnbUldos (pero no tomado s del conten ido reall se mueStr an a continu ación.
científi cos (Bruel y colabor adores, 1966),
(Schaefer y Anastasi, 1968) y los
cambio de empleo de sujetos no adiestra dos (Scott y Johnso n, 1"967), ación Ejemplos
empleados de mostra dor (Bruel, 1964) y las ventas, así como la investig
y los interes es generales de ingeniería (Chane y y Owens ,
1964). Por tanto, io de intere·
Cuestionario de interese s vocacionales Strong (399 reactivos) e inventar
l '

este proced imiento parece ser promet edor en un amplio rango de situaciones .
apropiadas ses Strong-Campbell (325 reactivos)
prácticas. La determ inación de las ponder aciones de califica ción
ante, inclusiv e de los principa les
es un punto de investigación muy import la
Ocupaciones:
pero una vez que se ha diseñad o un sistema de califica ción,
(England, 1961), núme- I (Indiferente) D (Disgusta)
procede rápidam ente. Si el G (Gusta
calificación de los cuestio narios biográficos Electricista
biográ-
ro de solicita ntes lo justifica, aún es posible prepara r los cuestio narios y ca-
as Materias escolares:
ficos en una forma de opción múltiple con hojas de respues ta separad
prueba
lificarlas por medio de una máquin a como con cualqui er otro tipo de Astrono mía G D
estándar.
. Diversiones:
G D
INVE NTAR IOS DE INTER ESES Boliche

un Actividades:
Las pregun tas que casi todas las person as se hacen a sí mismas en de
son: ¿qué clase de trabajo debería tener yo?, ¿qué clase D
momen to o en otro Mirar deportes en la televisión G 1
necesi-
carrera sería la más adecua da para mí? Para contest ar estas pregun tas

1 .
, =-
' ;,

.¡ .:.: .. . :... .: .: .. ,"'.


INVENTARIOS DE INTERESES 393
392 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN

Encuesta de intereses vocacionales Ohio (280 reactivos)· un orden de rango de las tres opciones en la serie, marcando lo que más le gus-
taría hacer y lo que menos le gustaría hacer y, por tanto, indicando que la otra
D d n g G alternativa se ubica en medio. Este patrón de opción forzada de los dos últi-
Preparar comida en un restaurante g G
Conducir un camión de carga grande D d n mOS patrones de respuesta ha llamado la atención de constructores de pruebas
D d n g G porque controla la tendencia a decir que sí, esto es, a la orientación que podría
Contestar cartas en una oficina g G
D d n conducir a algunas personas que toman la prueba a fijar un estándar muy bajo
Enseñar a niños pequeños
g_ gusta . G = gusta muchísimo mediante la indicación de que les gusta cualquier actividad ya otros para fijar
"D - disgusta mucho d = disgusta n= neutro un estándar personal considerablemente más severo. Esta tendencia ha recibi-
Reproducido con permiso. Copyright 1969 por Harcourt Brace Jovanovich. Inc .• Nueva do el nombre de respuesta fiia¡ una respuesta complaciente es la de una serie
York. N. Y. Todos los derechos reservados. . de estilos de respuestas que pueden distorsionar el significado de las respues-
tas de inventario.
Inventario de preferencias vocacionales Holland (160 reactivos) Sin embargo, el tipo de reactivo de opción forzada tiene sus propias limi-
taciones. Dado que cada persona debe hacer el mismo número de selecciones
Entrenador atlético Sí No y de rechazos, el procedimiento desvanece la diferencia real entre las personas
Guardabosques Sí No en rango y en grado de intereses, de tal manera que cada persona debe tener
Sí No
Médico Sí No tantas altas como bajas en sus selecciones y se pierde cualquier diferencia
Conserje genuina en el nivel general de entusiasmo. Las relaciones entre las diversas
Reproducido con permiso. Copyright 1965 por The Psychological Corporation. Nueva .puntuaciones también tienden a distorsionarse, debido a que los patrones for-
York. N . Y. Todos los derechos reservados. zados de selección significan que para cada área de interés seleccionada debe
rechazarse otra área de interés. El resultado es que la correlación promedio
Inventario de intereses vocacionales de Minnesota (158 series)' entre las puntuaciones para instrumentos de opción forzada como éstos debe
ser negativa (aproximadamente - 11 (n - l/, donde n es el número de las
L D
diferentes escalas del instrumento).
Poner armarios de cocina O o
O O
Aflojar la tierra de un jardín O Inventario de intereses Strong-Campbell
Poner papel tapiz O

Conducir un camión de carga O O Ahora describiremos con algún detalle el inventario de intereses Strong-
O O Campbell, ya que es uno de los inventarios que data de la década de los veinte
Conducir un taxi O
Conducir mi tractor de jardín O y ha sido objeto de más de 50 años de investigación. Indicaremos cómo difiere
el Strong-Campbell de la versión anterior de Strong de su inventario de intere-
"L = lo que me gusta más D = lo que menos me gusta ses, y después lo compararemos con otro inventario de actualidad.
Como ya se indicó en los ejemplos anteriores, el Strong-Campbell cons-
Encuesta de intereses ocupacionales Kuder (100 series) y Registro de preferencias '
ta de 325 reactivos que se refieren a ocupaciones, materias escolares, activida-
Kuder (vocacional). p 68 series)' , des, diversiones, tipos de personas, etc., para los cuales el examinado expresa
Más Menos . .' sus gustos, su indiferencia o su disgusto. El tipo de calificación más típico de
.) las series de inventarios Strong es el que indica el grado en que una persona es
M L ', 'similar, en sus intereses, a personas en una ocupación particular.
Reparar el motor de un cohe L
Calcular promedios de bateo M . Para poder establecer la clave de calificación para una ocupación, Strong
M L (y más tarde Campbell) compararon las respuestas de personas dentro de
Vender revistas de puerta en puerta L
Cantar en un coro M una ocupación con las del grupo de referencia de las personas en general.
Hacer trabajo voluntario en un hospital M L
L Debido a que las respuestas de los hombres y de las mujeres muestran dife-
Acampar en el bosque M
sustanciales en varios reactivos de intereses , las comparaciones
L= lo que menos me gusta por separado para unos y otras¡ por ejemplo, los psicólogos
"M = lo que más me gusta r~;¿;'J"¡ClUJlaIl sido comparados con un grupo de referencia de hombres en general y
psicólogas con un grupo de mujeres en general. Las muestras general-
~... ; , .. En los tres primeros patrones de respuesta ilustrados, el examinado 't:i;z,:m,enlte estaban diseñadas para representar un número igual de personas de
ponde a cada reactivo de maner~ individual" re~strando una respuesta 50 ocupaciones diferentes.
va, positiva o neutra a ese reactivo. En los ultlmos dos patrones puede
394 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN
11.1. Perfil ocupacional Strong-Campbell poro Susano S.
Para ilustrar los resultados, considérense los porcentajes de personas que Escalas femeninas Escalas masculinas
respondían "gusta" a las ocupaciones Nartista" y "granjero". Los resultados , Tema
fueron aproximadamente como sigue: Tema
ocupa- ocupa-
Ocupación ciona/' Puntuación Ocupación rional" Puntuación
Artista Granjero , , , Similar a:
~; ,' Trabajadora social (S) 63 Psicoteropeuto del
i'·
c.

lenguaje ' (IS) 57
i r '" Psicólogas 76% 24% 'Maestra de ciencias
"¡ .- Mujeres en general 59 24 sodales (SEe) 55 Abogado (E)
1,
!; Psicólogos 55 23 55
Trabajadora del
!I !\ Hombres en general 41 30 personal de lo
YM(A (SE) 53 Trabajador social (S) 53
Psicoterapeuta del
lenguaje (IS) 51 Bibliotecario (A) 50
Para la ocupación de "artista" hay un porcentaje considerablemente , Bibliotecaria (A) 49 Maestro de escuela
mayor de psicólogos que para las personas en general que marcan H gusta" elemental (SEA)
tanto para los hombres como para las mujeres. Entonces, esta respuesta s~
49
Asesora guia de lo
calificaría + 1 para la clave de los psicólogos en ambos sexos. El reactivo secundaria (S(E) 49 Maestra de inglés '
"granjero" no muestra una diferencia significativa para ninguno de los dos (AS) 49
. Maestro de inglés (AS) 47 Músico (A) 49
.¡: .- sexos y probablemente recibiría una calificación de O en ambos casos. Si se Maestro de idiomas (A)
ponderara para los hombres, este peso sería de - 1, dado que menos hombres 47 Socerdote (S) 48
escogieran esa respuesta. Cada respuesta para cada reactivo se examina de esta Ejecutiva de
manera y se le asigna un peso (+ 1, O o - 1l. La puntuación total para la cla- publicidad (A) 46
ve "psicólogo" es la suma de las respuestas al reactivo. De esta manera se obtie· Ejecutivo de la
ne una puntuación cruda para cada ocupación para la cual se ha diseñado una Cómo ro de
clave, con claves por separado preparadas para los hombres y para las mujeres. comercio (ES) 45
Para producir puntuaciones directamente comparables para cada ocupación Maestro de ciencias
se tiene que fijar una conversión a puntuaciones estándar, basada en la mues· sociales (SEC) 45
.:'! :: tra de personas de una ocupación específica, de tal manera que la media para
esa muestra sea de 50 y la desviación estándar de 10. . , Muy disimil a:
La interpretación anterior está basada en las puntuaciones estándar. En ,Veterinaria (1) 14 Oficial de la Marina (RI) 14
general, una puntuación de 45 o más se considera "similar" a aquellas en la Maestro de arte (A) 13 Oficial de policía (RES) 12
: ' ,

¡ ocupación, dado que se ubica bien dentro de la distribución de puntuaciOIies ,Tétnica médico (IR) 12 Veterinario (RI) 10
"
i ,-
¡ de los miembros de la ocupación. Una puntuación de 25 o menos es conside- C ,Ingeniero (IR) 11 Arquitecto (ARI) 9
, , rada" diferente", ya que esta puntuación sería muy rara para una persona en el ,.' "",Ensambladora de
grupo definido de los miembros de la ocupación. Las puntuaciones de 26 a 44 instrumentos (Re) 10 Guardabosques (RI) 8
más bien son no informativas, pues no son claramente similares ni distintas '. Matemótica (1) 10 Maestro de
de aquellas recibidas por el grupo en la ocupación. matemóticas (IRS) 8
Las puntuaciones son proporcionadas por 57 grupos de mujeres y 67 gru- (IR) 4 Granjero
pos de hombres, pero no siempre para la misma ocupación (todavía es imposi- (Re) 6
(I) 2 Gerente de negocios
ble dar una muestra femenina adecuada de oficiales de la marina mercante o
una muestra masculina adecuada de maestros en economía doméstica). Los , de agricultura (ERe) 5
miembros de cada sexo son calificados para todas las 124 claves de califica- " Oficiol de lo Policía
ciún, pero se pone especial atención a las claves del mismo sexo para interpre- " de cominos (RE) O
tar el perfil de calificaciones. En la tabla 11.1 se muestra el perfil de puntua- Artesano calificado (R) O
ciones altas y muy bajas de Susana S., una enfennera registrada que recibía , Maestro de agricultura
entrenamiento para convertirse en asesora de rehabilitación. vocacionol (ReE) 3
• Las lelros entre poréntesis representon los vértices de los estolos de los lemas acupocional.s gene,ales de (ompbeB que
se muestron en el diagrama de este aporrado,
: :~
396 CAP. 11. INVENTARIOS DE AUTOAPREClAClÚN INVENTARIOS DE INTERESES 397

Por supuesto, es posible observar las puntu~ci?~es para escalas siI?plesy . empeñará creativ~mente en las artes o en las ciencias, y le gusta construir
tar por ejemplo que Susana tiene mayor sImIhtud con las trabajadoras cosas con herramIentas.
~~cial~s así como q~e la escala de asesoría está en las del grupo alto. También Las puntuaciones estándar de Susana S. en los temas generales se reportan
notamds que la enfermera registrada no es una de los gruP?S altos de Susana. " y se interpretan como sigue:
Lo anterior tal vez es tan informativo como observar el conjunto completo ~e
puntuaciones altas y bajas, especialmente p~ra las de personas del pro~lo
Así la mayoría de las escalas de puntuaclOnes altas para Susana se refIe· Puntuación
~:~o~ oc~paciones que implican trabaj~r con p.alab.ras o con personas, o a , Tema estándar Interpretación
menudo ambas. Las escalas de pUI?-tuaclOnes bajas uenden en muchos casos
a incluir ciencia o vida en los extenores o ambas. Pod~mos e~pecular que una Realista 38 Moderadamente bajo
base para cambiarse de enf~rrneras ,a consejeras e.s la ?~entaclOn de Susana ha- Investigotivo 46 Promedio
cia ocupaciones verbosoClales, mas que a la~ cIenuh~as. Artístico 57 Promedio
El inventario Strong-Campbell ha añadIdo dos tipOS de escalas que ~o Social 55 Moderadamente alto
estaban incluidas en el Strong VocatioDa~ ~nterest Bl~nk (SVIB) -cuestIO· Emprendedor 51 Promedio
nario de intereses vocacionales Strong- ongma!. La pnmera ~e ellas s.on las Convencional 41 Moderadamente boja
llamadas escalas de temática ocupacional general, que so~ seIS y. se _ongman
básicamente de una concepción de intereses y personahdad dIsena~a por
';,:
Holland (1966' . Estas sei~ esca~~s se representan en la forma de un hexagono, Campbell ha clasificado las escalas ocupacionales específicas bajo uno o
como se muestra a contmuaClOn: más de los temas ocupacionales generales, y el tema o los temas se indican en
el perfil por medio de letras mayúsculas entre paréntesis. Las cuatro escalas
, " I ~
ocupacionales femeninas en las que Susana obtuvo las calificaciones más al-
tas están clasificadas dentro del tema social (algunas veces en combinación
con otras), mientras que cinco de sus seis puntuaciones más bajas incluyen el
:,1
tema investigativo y cuatro de seis el tema realista. Así, los temas generales
tienden a dar la misma impresión de la inspección de las escalas específicas en
las que se obtuvieron las calificaciones altas y bajas; dan un marco de referen-
cia general dentro del cual se puede organizar la información más específica
de las escalas ocupacionales.
Finalmente, el inventario Strong·Campbell provee las escalas que se han
Convencional Artística llamado escalas de interés básico, que son puntuaciones basadas en peque-
: !' ños agrupamientos de reactivos en los que éstos se correlacionan sustancial-
mente entre sí y parecen compartir contenido manifiesto común. La naturale-
za de las escalas se puede apreciar mejor al ponerlas en una lista que muestre
las puntuaciones estándar de Susana S. en cada escala y los enunciados de
interpretación que acompañarían a tales puntuaciones. Los resultados se
muestran en la tabla 11.2.
Estas puntuaciones añaden muy poco a lo que ya se sabía acerca de
. Susana. Tal vez den un sentido mejor del contenido que contribuye a sus
<:;' puntuaciones altas y bajas para las ocupaciones específicas. Así, su puntua-
., ción estándar alta de trabajadora social ciertamente se origina en parte de
Se piensa que los vértices adyacentes expresan ~ntereses :elaciona~os o .~, su alta postura en las actividades de servicio social, y tal vez de su alto in-
compatibles y que los vértices opuestos repres.entan mtereses mcomp~tIbles. , , . terés en la enseñanza; quizá se vea reforzada por su interés promedio bajo
Cada tema se describe no sólo por las ocupaclOnes que par~cen rel~cI.onarse • .. :. , en a agricultura y la mecánica, dado que éstas no son actividades que ten-
con él sino también por una serie de adjetivos que se consIderan tlplCOS ~e " . ,'.. gan la posibilidad de atraer a trabajadores sociales. Algunos examinados
una p~rsona en quien ese tema es predominante. A~í, una pe~~ona que oboe· ·'.1.~."",,¡;;.': mostrarían algunos datos más dramáticos en sus respuestas a áreas especí-
ne puntuaciones altas en un tema realista se descnbe como robus~a, toser' . ,,·/ Jicas de contenido. Posteriormente, analizaremos el desarrollo más siste-
práctica y físicamente fuerte ...; estable, natural y persistente .. .". Se dIce que a . mático de las escalas de áreas homogéneas cuando reexaminemos el regis-
persona tiene metas políticas, económicas y convencionales; rara vez se des· , tro de preferencias Kuder.
398 INVENTARIOS DE INTERESES 399
Toblo 11.2. Puntuaciones estándar poro los escalos individuales de Susano S. .' ;.., donados. De esta manera, se diseñaron 10 escalas cohesivas estadísticamente
relacionadas con el contenido. En I~ tabla 11.3 se proporciona la designación
Puntuación de las escalas y.se muestran los perfIles de los promedios grupales para cuatro
Escola estándar Interpretación ~pos ocupacIonales. Por tanto, los psi~ólog?s hombres obtenían puntua-
CIOnes notablemeI.1te altas en las esc~las ~Iteranas y científicas, pero bajas en
Agñcultura 39 Más bien bajo las escalas persuaSIvas. SUS, escalas !ll~s baJas er~n las más altas para los vende-
Naturaleza 40 Más bien bajo dores d~ se~ros. Las ~uJeres medlcos obtentan puntuaciones altas en in-
" :' Aventura 48 Promedio tereses cIentlflCOS y de VIda en exteriores, y muy bajas en intereses del emplea-
Milicia 45 Promedio do. No todos los grupos mostraban patrones claramente diferenciados. así
Mecónica 37 Más bien bajo las ~enedoras de l~bros y las cajeras no t~nían áreas de intereses realmente baja~
y solo un pequeno aumento por los mtereses de cálculo.
Científico 40 Más bien bajo
Matemáticos 39 Más bien bajo
Ciencias médicos 44 Promedio Tablo 11.3. Rangos de percenfiles promedios de los intereses ocupacionales luder de las
Servicios médicos 52 Promedio personas en ocupaciones seleccionadas
Músico/drama 59 Promedio
>: . Arte 50 Promedio Hombres Mujeres
Escrituro 56 Promedio
Enseñanza 60 Más bien alto Tenedores
Servicio social 63 Más bien alto Vendedores
Atletismo 45 Promedio de libros
Escola Psicólogos de seguros Médicos y cajeras
Artes domésticos 61 Promedio
Religioso 54 Promedio
Hablar en público (orador) 53 Promedio Exteriores 33 84
Derecho/politica 58 Mós bien alto Mecánico 28 26 77 34
Comercio 51 Promedio De cálculo 67 35 47 77
Ventas 50 Promedio Científico 84 31 86 45
Gerente de negocios 52 Promedio Persuasivo 13 84 22 62
Prácticos de oficina 40 Más bien bajo Artístico 56 41 60 55
literario 84 54 58 61
Musical 52 61 45 65
Servicio social 60 52 63 42
También se reportan puntuaciones colaterales en la Strong-Campbell Empleado 30 58 11 59
que permiten una verificación acerca de la exactitud y el estilo de respuesta de
esta información complementaria dada acerca del examinado. • Datos no reportodos,

'"
Registro de preferencias Kuder, vocacional Las puntuaciones del área 10 del registro de Kuder parecen más directa-
mente descriptivas de una persona que las puntuaciones de la:; escalas de ocu-
Un inventario de intereses que contrasta tajantemente con las series de , pación específicas. Describir a una persona como alta en lo científico y en los
instrumentos Sttong es el registro de preferencias Kuder, vocacional. Ante- Intereses por la vida en exteriores y baja en los intereses persuasivos y del
riormente se señaló la diferencia en el tipo de reactivo. Ahora debemos consi- , .emplea~o, proporciona u~a imagen .más clara de una persona que, por ejem-
derar la diferencia en el tipo de puntuaciones que se deriva de esos reactivos. '.' ::, plo, declr que la persona tIene altos mtereses en ocupaciones del médico del
Mientras que el reactivo original Strong pondera solamente con base en la químico o del guardabosques y bajos intereses en ocupaciones del banqu'ero,
habilidad de los reactivos para diferenciar un grupo ocupacional particular de . • del contador y del vendedor de seguros de vida. Sin embargo, para interpretar
los hombres en general, los reactivos seleccionadores de Kuder definen un u~perfil Kuder en términos específicamente ocupacionales se requiere algo
área de interés particular, como la mecánica, la de empleado o lapersuasiv~ . ~a~ 9ue quizá no sea tan fácil o ta'n satisfactorio: comparar el perfil de un
Se selecciona un reactivo con base en su contenido y en su evidencia estadísu· mdlVIduo con el perfil típico para la ocupación en cuestión. Por tanto, en el
ca, es decir, se correlaciona con un agrupamiento apropiado de reactivos rela- pasado, el registro de preferencias Kuder, vocacional, se consideró un instru-

;' !:
'. :
400 CAP. 11. INVENTARIOS DE AUTOAPREC/AC/6N
401
mento exploratorio apropiado para hacer una gráf~ca de los intere~es del indi- Tobla 11.4. Puntuaciones altos de lo KOIS poro los mediciones de especializaciones de los
viduo en términos generales, y el Strong como un m~trumento mas enfocado mujeres
a examinar posibilidades vocacionales más específIcas. Con desarrollos en
ambos campos, se dificulta la distinción e~ la función entre los dos. yeremos Escalas awpacionales,
esto más claramente a medida que consIderemos la encuesta de mtereses Escalas de especialización universitaria,
normas femeninas normas femeninas
ocupacionales Kuder.
Psicalogía 0.66 Psicología 0.61
Psicolagía clínico 0.63 Ciencias biológicas
Kuder Occupational Interest Survey (KOISJ-Encuesta 0.60
Programadora de computación 0.61 Inglés
de intereses ocupacionales Kuder 0.59
---------------------------------------------------
.Trabajadora social, psiquiatría 0.59 Idioma extranjero 0.58
Con la KOIS Kuder entró al campo de los inventarios con una clave Trabajadora social de coso 0.57 Historia
, , :¡ 0.55
empírica. El tipo de reactivo era el mismo patrón triádico <:mpleado para el -----------------..... _----------------------
registro de preferencias Kuder¡ sin embargo, las pu~tuaclOnes !ep?r:tadas Gerente de una librería 0.55 Profesiones de la salud 0.52
podrían tomarse como las correlaciones entre las seleCCIOnes .de los mdIVIduos Terapeuta física 0.54 Matemáticos 0.52
y las selecciones típicas del grupo criterio. Es d,ecir, en la medIda en que l~s ~es­ Trabajadora social, medicina 0.54 Ciencias sociales generales 0.51
puestas del examinado eran aquellas que haCIan frecuentemente los pSIcolo- Maestra de ciencias, lIS 0.53 Educación elemental
gos, esa persona obtenía un alto coeficiente para psicól.o~o, yen la me~i?a en 0.50
Trabajadora social, escuela 0.53 Ciencias políticas
que escogiera respuestas hechas muy rara vez por los pSIcologos! ~l coehcIente 0.50
de esa persona sería bajo e incluso negativo. En esta comparac~<?n no se hace Escalas ocupacionales,
ninguna referencia a las personas en general. Para cada pun tuaclOn de referen- Escalas de especialización universitaria,
.normas masculinas normas masculinas
cia se hace sólo al grupo de criterio específico.
La forma de reporte para la KOIS muestra coeficientes para 37 grupos
ocupacionales femeninos y 75 grupos ocupacion~les II!-as~ulinos, 19.9radua- Profesor de psicología 0.60 Inglés 0.58
i' : das universitarias femeninas y 29 graduados umversItanos masculInos. Se Psíquiatra 0.59 Idioma extranjero
~l alienta a los consejeros o asesores para que pongan atención primordialmente 0.58
. Psicólogo clínico
¡;; (
l' I
0.59 Ciencias biológicas 0.54
en las puntuaciones altas, sobre todo en aquellas que están dentr~ del 0 . ~6
de las más altas para el solicitante de asesoría dado. Las 10 puntuaCIOnes mas Matemótica
------------------------------------------
0.58 Ciencias físicas 0.51
altas en cada categoría aparecen en una lista registrada por la máquina de cali- Pediatra O_58
ficación, con el fin de que la consulte el usuario. El registro para una joven que Psicología 0.51
Químico 0.54 Arte y educación artística
trabaja en un grado avanzado en la medición psicológica se muestra en la ta- 0.49
..Programador de computación 0.54 Músico y educación musicol
bla 11.4. 0.49
Las 10 puntuaciones más altas muestran gran diversidad, debido a lo cual Bibliotecario 0.54 Sociología 0.49
¡ i tal vez la atención debería centrarse en aquellos sujetos que están por arriba de Estadístico 0.54 Educación elemental 0.41
la línea punteada, dentro de los 0.06 del valor más alto. Es bastante alentador '----------------------- ... _-----... _-------
que varias ocupaciones psicológicas y cuantitativas aparezcan entre éstas, que Psicólogo, asesor o terapeuta 0.53 Historio 0.47
confirman lo apropiado de una rama cuantitativa de la psicología para esta
jQven¡ sin embargo,las escalas de graduados universitarios indican una exten-
sión de intereses que se considera en las ciencias sociales y las lenguas que •. .. . Otro inventario que tiene una clave empírica es el Minnesota Vocational
sugieren una orientación humanista al igual que una científica hacia el área de Interes~ lnventory (M VIl) -inventario de intereses vocacionales de Minneso-
las carreras. .i - tao DebIdo a que las pruebas ~e la ~~e Stron~ han sido diseñadas primordial-
Para algunos usuarios, la KOIS es menos discriminadora que el inventa- . :::i~>me.nte para la asesona y la onentaclOn vocaCIOnal en los estudiantes universi-
rio de Strong, ya que éste Se enfoca en lo que es diferente en los intereses de '.', tanos y.se han enfocado sobre las ocupaciones de negocios y profesionales es
un grupo ocupacional particular, distinguiéndolo de otros y de las personas •.••.•. ne~e~ano contar con l!n. inv~n?~o dirigido específicamente a los trabajos
en generaL Por contraste, la KOIS trata con las similitudes y, dado que las per- .. ca~ificados. La caractenstIca dIstmtIva del MVll es que se enfoca sobre los tra-
- sonas tienen bastante en común en un amplio rango de trabajos, las puntua- i, b~~os de los obreros. Se han dis~ñado claves para diferenciar los trabajos espe-
ciones recibidas para ocupaciones diferentes suelen ser similares. CIfICOS de los obreros del trabajO laboral en general, con base en la técnica de

: .1"
¡,f:1..: .
402 CAP. 11. INVENTARIOS DE AUTOAPREClACJÓN 403
11: INVENTARIOS DE INTERESES

!l''1;, Strong; sin embargo, los reactivos son de opción forzada y la prueba es razo.
nablemente eficaz para diferenciar grupos que ya se encuentran en distintos
.' I Para ~preciar.la valid.ez ~~ un inventario de intereses como una descrip-
, " cion de como, se SIente el IndIVIduo acerca de las actividades y los eventos en el
1 ) '. grados de calificados. No obstante, los datos acerca de la eficacia predictiva . , mundo que lo r?dea, el punt~ principal es la veracidad de sus respuestas. Real-
J del MVIl son más bien limitados. mente no hay mngun~ autondad mas alta a la cual apelar para determinar los
Finalmente, se debe hacer mención a la encuesta de intereses vocaciona. . gustos y las preferenCIas de una persona que las propias afirmaciones de ese
I!! les Ohio. Éste es un instrumento diseñado para usarlo en la escuela secunda. "individuo.
¡¡'L ¡> ria, y está basado en la tesis de que las ocupaciones pueden clasificarse en tér. . V.arios estudios han indicado que en ~ven~arios como el Strong se puede
.. i
minos de nivel (alto, moderado y bajo) al que se requiere que las actividades mentir (Carry, 1953; Longstaff, 1948). SI se pIde a un grupo de examinados
incluyan los datos, las personas y las cosas. 1 Los reactivos se han diseñado ' ' que trate de ~esponder de la manera como lo haría un agente o vendedor de
para ejemplificar cada combinación posible de estas categorías; por ejemplo seguros de Vida, generalmente l? lo~rará con bastante éxito para aparecer
se considera que el profesorado, la asesoría y el trabajo social representan eÍ . . como vendedores ~e se~ros de VIda; sm embargo, no hay ninguna indicación
nivel más alto de demanda para el trabajo con datos y con personas, y el más de que en el cuestIonano se pueda mentir, aun cuando se use como instru-
bajo para el trabajo con cosas. Cada una de las 24 agrupaciones vocacionales mento para seleccionar empleados.
está representada en el inventario por una serie de 11 reactivos, yel estudiante , Cuando el inventario se usa para la asesoría vocacional y para ayudar al
recibe una puntuación de percentil basada en las respuestas a una serie. Tam. evaluado, como .e~ la mayoría ~e l.os casos, probablemente hay muy pocas
bién se reporta un índice de consistencia de respuestas para cada serie. razones para antlClpar una menUra mtencional. Quizá se espera que el indivi-
quo reporte sus preferencias y sus disgustos de la manera como cree conocer-
los, y el ~utoco~ocimiento es a veces imperfecto, por lo que los reportes pue-
Confiabilidad y validez de los den se! ImpreCISOS en ,a~gun?s ~sI?ectos. Por tan~o, podemos decir que nos
inventarios de intereses gustan a escuchar la .musIca smfomca porque conslderamos que es algo valio-
so, pero n~estra ~c.cIón pue,d~ traicio~ar esta afirmación; de hecho, podemos
En la mayoría de los inventarios de intereses, las puntuaGÍones son bas- · escuchar solo mUSIca folklonca u OCCIdental. Esta falta de autodiscernimien-
tante estables a lo largo de periodos cortos, es decir, de dos semanas a un mes. .. to es uD: proble~a rea!, pero probablemente queda algo mitigado en el enfo-
Las correlaciones de cerca de 0.90 son típicas de las puntuaciones que se que de Inventano de mtereses, en el que los puntos aislados podrían tener
reportan en los manuales tanto para las series StlOng como para las Kuder. efectos menores sólo sobre la puntuación finaL .
Para el SVIB hay evidencia (Mallinson y Crurnrine, 1952; Strong, 1943, Otro tema es la validez de los inventarios de intereses como predictores de
1951, 1952) de que los intereses muestran gran estabilidad a lo largo del tiem· . conductas futuras. Para establecer las claves de calificación para el StlOng,
po, por lo menos en adolescentes y adultos. Los datos en la correlación pro- se compararon las personas que estaban realmente en una ocupación con las
medio a diferentes edades ya lo largo de periodos distintos pueden resumirse personas en general. Los perfiles de intereses ocupacionales para el registro de
como sigue: .' preferencias Kuder también habían sido preparados mediante la determina-
¡ '"
Ción del nivel promedio en cada área de interés para los individuos que ya es-
taban trabajando; pero los patrones de intereses comunes de los individuos en
Escuela Primer año Últimos años un campo de trabajo ~uedenhaber surgido del trabajo mismo. Los trabajado-
elemental Escuela de de universidad , res pueden mostrar CIertos patrones comunes por la misma naturaleza de la
superior secundaria universidad (pasantes) , experiencia de trabajo. La evidencia crucial de la validez predictiva radica en
,. evalu3f a un grupo antes de que ingrese al mundo de trabajo y determinar si
los SUjetos que entran después y permanecen en una ocupación particular
De 1 a 2 años 0.55 0.65 0.80 ban patrones e intereses distintivos antes que desempeñaran la ocupa-
De3a50ños 0.30 0.75 0.75 n:'-?str!1
Clon. Esta es una operación costosa tanto en el tiempo que debe pasar entre las
De 6 a 10 años 0.50 0.55 0.70
personas que ya se establecieron en su ocupación, como en la disposición de
, casos entre, literalmente, cientos de ocupaciones.
, Strong (1951) pudo hacer estudios de seguimiento con algunos grupos
La estabilidad es baja en la escuela elemental, pero para los estudiantes " fueron evaluados en la universidad cuando eran estudiantes y obtuvo
universitarios la estabilidad de edad se compara favorablemente con las prue- . '. , aIl!lln~ evidencia de la extensión en que los estudiantes con intere;es caracte-
bas para la habilidad cognoscitiva general. . . '. • " de una ocupación en particular tendían a desempeñar esa ocupación y
ti perSI~tIr en ella. La ocupación en la que el individuo típico estaba realmente

1 Tres niveles de cada categoria producen 27 combinaciones posibles (3 X 3 X 3), pero sólo
. '!,o: trabaJando 10 año~ después se hallaba en un rango segundo o tercero para
algunas de éstas se consideraron para ser representadas en el mundo laboral. '. aquella persona estimada entre todas las escalas del Strong. Al considerar los

... .;
.1.' ' , ' ', ' ,'. • •..... ~ ."." .
. ,
405
404 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN

promedios de grupo, los sujetos que pennanecían en una ocupación habían ~;~ ~g~~~~~ ~
recibido las puntuaciones más altas de intereses para esa ocupación que para ~ I III
cualquiera otra y las puntuaciones más altas que aquellos que cambiaron a ·
alguna otra ocupación. .
Berdie 11965) localizó los registros del grado duodécimo del SVIB de estu- ~-..oC"l v ........ OOU"'\C""-oIOO'" C""?
-----~- ~
diantes que habían completado programas profesionales especializados en la · -q-
I I I I I
Universidad de Minnesota. A continuación se muestran los porcentajes de los
intereses altos Ipuntuaciones estándar de 40 o más altas) de cada una de las
cuatro escalas en relación con el entrenamiento profesional completo: C"-oI __ Ln ('t?~r--....oC""-olC:>C"':) c:>
C"'-oI_ ......- ....::.t"C"?- c-.....
I I I I I

Entrenamiento completo en
Ingeniería
Interés alto en I I I
Medicino Derecho Contabilidad mecánica
escalo para

49 2 6 21 c)V~("'o.I....::.t"ceV) ce
Médico LI')-U"\C"? "" ~
18 50 18 2
Abogodo I I I I I
Contodor 5 19 43 6
Ingeniero 33 O 15 73
o...o-.-a..r---c>t..rl ....q-
:::""C'?~C"') C"'oI

I I I

No obstante que la relación se ubica muy lejos de la perfección es claroy


sorprendente que la discriminación entre los grupos sea tan tajante.
McCully 11954) hizo un estudio de seguimiento de un grupo de hombres ~f:"o.IOO
C'l")CO-
o-..--CJ"""'-..o~""'"
('o")~C""4- c-.....
c--.a
a quienes se les había aplicado el registro de preferencias Kuder como parte ' I I I I I I
de la asesoría de la administración de veteranos al fin de la Segunda Guerra
Mundial. Se les localizó varios años más tarde y se les determinó su ocupa- V>
..2
ción. En la tabla 11 .5 se muestran las puntuaciones estándar promedio en a>
:.; ;.. -es ~~~ ~('t?:!~~N('t?
i. :
cada una de las 10 áreas de intereses de Kuder para aquellos grupos ocupacio- o
1.0

I I I I I I
nales que fueron lo suficientemente grandes para justificar el estudio. Los "i5
Q)

resultados muestran diferencias Claramente distintas y bastante sustanciales E


en los patrones de interés para cada ocupación. Por tanto, la evidencia respec-
eo..
to a las pruebas Strong y Kuder indica que ambas tienen cierta cantidad de c:o...oco
....... 1.I"\C"I
........ O"..,..O"'C""-oI-to,Q
""..-....g--C""-oICOto,Q
t"')
...a .a
validez éomo predictores de la selección ocupacional. I I I I :~
i ! ¡:;
-::.,
i t;~; ;.: . !5
I nterés y habilidad .....
<: ¡\: C>

J j'; -::
Es importante no confundir las medidas de interés con las de habilidad. .:a

~li.
Las medidas de intereses no revelan directamente nada acerca de la habilidad ·· ~
y, en general, la relación entre los intereses y las habilidades es bastante baja. : ~
¡¡
Una serie de correlaciones representativas se muestra en la tabla 11.6, en la ..
:t~ ! que se aprecian las correlaciones de 0.20 o más; sólo hay seis correlaciones tan .... -8
§ .~
grandes como 0_20 y una sobre 0.30. La correlación más alta está entre la . :O "-g,
habilidad verbal y el interés literario, en seguida entre la habilidad espacial yel ·. :~
e
interés artístico, y en tercer lugar entre la habilidad numérica y el interés de ~
406 AJUSTE EMOCIONAl 407

-.:::t"""ON.C"oI-.::r'"~-'VC)
cálculo. Todas estas correlaciones son significativas aunque sean de tamaño
~C:J-OO~c::;:,-C)O
ocidddc::idddd muy modeSt<>.~ Las medidas de interés y de hahilidad tratan dos aspectos dis-
1 1 1 tintos del ajuste necesario para un campo de estudio o de trabajo. Cada una
I1
1
,,\
proporciona información que complementa a la otra. El interés no es sustitu-
to de la habilidad y, de manera inversa, la habilidad para aprender destrezas
r
.";.:
:;:-
:! ..g
1:;.2»
~-o
~CIOC'?OOO<"l""c=:t-.::rc....
c=- c::J c::> _ o
ooociódoooo
1
c::;, c::> C)
.- .~

l. 1 1
en un trabajo no es garantía de sobrevivencia o de satisfacción en el mismo.
.Los inventarios de intereses estandarizados han sido diseñados primor-
1'·,
dialmente por su contribución en la asesoría vocacional y en la colocación de
los trabajos. Con este propósito, están dirigidos a las escuelas secundarias o a
..
c:
'0
.¡;¡
C~
~:::~g~~~~og
oooooooocio
jóvenes más grandes. Los Kuder, con sus áreas de intereses relativamente
generales, se han empleado satisfactoriamente en el noveno grado o en grados
~ e
Q
1 1 1 superiores. Los Strong, con un enfoque en las ocupaciones específicas y con
~
.3
un énfasis particular en las ocupaciones a nivel profesional, son adecuados
, !. ..'"
~

'" c-o
Q primordialmente para la escuela secundaria superior con planes definitivos

. :' ~
~
<:n
~

'"
.. ...
:~~
~
.... e-
OC,""'o..f..,..C"'of...o""'=l"'-..o~-.::rc:o
N

"
_ _ _ OC)C)<C)C)OO
d ci ci o ci ci .o
, 1
ci o o
para ingresar en la universidad, así como para grupos universitarios. Como en
casi todos los inventarios, estos instrumentos incluyen gran cantidad de lec-
tura, y su uso con individuos que se ubican por debajo del octavo o noveno
g- ~~
grados del nivel de lectura probablemente presentará serios problemas.
~
l;
..Q
'"
c:
:g
..
~ 6~~~:::::;~cg~S
dcicic:icicio cicic:i
'" e~
Q.
ce~
INVENTARIOS DE TEMPERAMENTO Y
'"
-o " 1 " AJUSTE EMOCIONAL
..
~~
.!2
..Q
~
",-o--C""4N...o-.o· Q-.;;t-Oco
_ . . . - _ _ _ C"otoIc=:t<:::)N_
o Los inventarios de autorreporte han sido extensamente desarrollados en
~

~
~
ci ci ci
, ,o
ci 0 '0 d ci
" el área del temperamento y del ajuste emocional personal. En estas áreas vol-
vemos a encontrar instrumentos diseñados con el fin de producir puntuacio-
~
nes para agrupaciones internamente consistentes en cuanto conductas, como
.~ ~.q-""'o-c:::>~OO~...o
c:::><=>N_ClI_c:::tc:>oo en el registro de preferencias Kuder, y los instrumentos construidos con
.",

e ooc:iciodcidoo base en claves de referencia a algún criterio externo, como en el cuestionario


'" 1 1 1 1
:z:: de intereses vocacionales Strong.
Gran parte del material básico de todos los cuestionarios de temperamen-
<:;
r-..-..o-..oo,....,.,......N-..oo-.....r-
c:::>c::>o-oc:::>C"')c:>o-
to es dela misma clase; se toma de un catálogo extenso de enunciados acerca
~ c:iciooocidddc:i de los sentimientos y las acciones. El individuo responde a estos enunciados
~ 1 1 1 1 1 mediante la indicación de si cada uno de ellos es característico de él o no. En
muchos casos, un "?" o un "no estoy seguro" es la categoría que se da a una
_C"'ooI....,.-.oc--.tc:t~~ov
. o persona que no desea comprometerse con un "sí" o con un "no" que resulte
C::tc::ll-----c::>-N
c:icicidocic:idcio 1 equívoco. En los cuestionarios de ajuste personal, las preguntas se toman de
, 1 1 , estudios de casos, de escritos de varios tipos de problemas de ajustes emocio-
nales, de sugerencias del psiquiatra y fuentes similares. Para las dimensiones
normales de temperamento, una revisión de los tratamientos psicológicos y
literarios de las diferencias de la personalidad y el escrutinio sistemático de los
cuestionarios anteriores, junto con los discernimientos personales del investi-
gador, proporcionan los elementos básicos para ensamblar los reactivos.
Hay múltiples inventarios del temperamento y del ajuste personal. A
continuación describiremos tres con algún detalle, para lo cual mostraremos
distintivamente cada patrón, a saber: la encuesta del temperamento Guil-
ford-Zimmerman, el inventario mwtifásico de personalidad de Minnesota
(MMPI), y las dimensiones del temperamento Thorndike. Después realiza-

0 .

-.' , ;'.:,,; .. -.. - . -""-:': ,;_.,-,:. o', •. ' .•• • •


'1
;/ 408 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN
1!
AJUSTE EMOCIONAL 409
remos una evaluación más general de la validez de los inventarios en esta área Ascendencia. Una puntuación alta indica hábitos de liderazgo una ten-
y de las condiciones bajo las cuales cabría esperar que tuvieran algún valor. dencia a tomar la iniciativa al hablar con otros, gusto por hablar e~ público
gusto por persuadir a otros/ gusto por ser conspicuo, tendencia a aparentar'
tendencia a ser autodefensivo. '
Encuesta del temperamento Guilford-Zimmerman
Ejemplos
La encuesta del temperamento Guilford-Zimmerman fue e! último
diseño de una serie de instrumentos con los que trabajó Guilford, en cada uno Usted puede pensar en una buena excusa cuando la necesita. (+)
de los cuales se ha intentado identificar y medir un número de dimensiones Usted evita discutir un precio con un gerente de ventas o con un vendedor. (_ ,
internamente coherentes de la personalidad que son claramente distintas
entre sí. Guilford empezó con un conjunto de reactivos y estudió las inter- Sociabilidad. Una puntuación alta indiCa que uno tiene muchos amigos y
correlaciones entre ellos, para lo cual empleó los métodos de análisis de facto- conocidos, que busca relaciones sociales, le gustan las actividades, le agrada
res a los que ya nos referimos ~l principi~ del caI?ítulo 1O. Es~e autor id.entificó ser el centro de la atención, participa en las conversaciones, no es tímido.
distintos factores de personahdad (o fOC1) y trato de construIr agrupacIOnes de
reactivos para medir cada uno de ellos. El objetiv.o era obte!ler escal<l;s separa- Ejemplos
das que fueran internamente cohere!lt~s'y re,~atIvam~nte I.n ?ependIentes ~e
otras escalas. Así si un factor de l/socIabIlIdad estaba IdentIfIcado, se tratana A usted le disgustaría mucho trabajar solo o en un jugar aislado. (+)
La timidez le impide ser popular como le gustaría serlo. ( _ )
de obtener un ag~pamiento de reactivos con enfoque en la I/sociabilid~d." que
se correlacionaran entre sí, de tal manera que la persona que se suscnbIera a
un reactivo también tendría posibilidades de suscribirse a otros. Este agrupa- Estabilidad emocional. Una persona con una puntuación alta muestra
miento sería bastante distinto de otros conjuntos relacionados con la "domi- tener un estado d~ á?imo estable, intereses estables, etc.¡ optimismo, alegría,
nancia", la "impulsividad", etc./ de tal }llanera qu~ las corre!acione,s ~ntrecada compostura, sentImIentos de tener buena salud, estar libre de sentimientos de
agrupamiento serían bastante bajas. Este es e! mIsmo enfoque baSICO que se culpa, de preocupación o de soledad, de fantasías diurnas, de perseverar en
ideas y estados de ánimo. . .
dio al registro de preferencias Kuder. . .
El inventario de Guilford-Zimmerman proporCIOna puntuaCIOnes con Ejemplos
base en las cuales se aprecian los agrupamientos nombrados y caracterizados a
continuación (reproducidos con permiso de! Sheridan Psychological Services, Algunas veces se siente miserable sin tener ninguna razón. 1- )
(: Inc.) . Cada agrupamiento se caracteriza tanto por las frases descriptivas como Rara vez da a sus errores pasados una segunda interpretación. (+ )
por los dos reactivos ilustrativos.
Ob;etividad. El que tiene una puntuacIOn alta está definitivamente
Actividad general. Una puntuación alta indica un paso rápido de acti- "libre" de sentir: egoísmo, autocentrismo, suspicacia, fantasías de hostilidad
vidades: energía, vitalidad, mantenerse en movimiento¡ producción, eficien- ideas de referencia, tendencia a tener problemas, tendencia a ser qUisquilloso:
cia, gusto por la velocidad¡ apresuramiento, rapidez de acción¡ entusiasmo,
vividez. Ejemplos

Ejemplos . Usted casi siempre recibe todo el crédito que se merece por lo que hace. (+ )
'1 A veces parece que todo mundo está en contra suya. 1_ )
"
Usted empieza a trabajar en un nuevo proyecto con gran entusiasmo. (+ J
k Usted es la clase de persona que está trabajando todo el tiempo. (+, . ., Amigabl.e. U:~a puntuaci?n alta ~ignifica r 7speto por los demás, acepta-
: ClOn de dommacIOn, toleranCIa a aCCIOnes hostIles, estar libre de hostilidad
!r
1:
Restricción. Una puntuación alta indica ser pensativo, deliberado, con resentimiento o deseo de dominar. '
esfuerzos persistentes, con autocontrol, no es feliz ni suertudo, o libre de
preocupaciones, no busca excitación.

Ejemplos usted resiente las acciones de otra persona, rápidamente se lo hace saber. ( _ )
A usted le gustaría decir a las personas que le rodean una que otra verdad. ( _ )
A usted le gusta hacer bromas prácticas a los demás. (- J
Usted algunas veces se encuentra a sí mismo anticipándose a los acontecimien- . Pensativo. Una persona con una puntuación alta se caracteriza por ser
tos. (+, reflexiva y meditativa, por observar su propia conducta y la de otros, estar
410 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN AJUSTE EMOCIONAL 411
interesado en el pensamiento, tener inclinaciones filosóficas, ser calmado En la tabla 11. 7se muestran las con fiabilidades de las puntuaciones sepa-
mentalmente. radas y de las intercorrelaciones de las puntuaciones. Las confiabilidades se
aglomeran alrededor de los 0.80 y son adecuadas, aunque no sorprendente-
Ejemplos . mente altas. Al diseñar este inventario se pretendía identificar varios aspectos
.) relativamente independientes de la personalidad; es decir,las correlaciones de
Frecuentemente se Hpierde en sus pensamientos". (+, ,
Para usted es muy interesante observar a las personas para ver que hacen. ( + , cada puntuación deberían ser bajas, y, en efecto, tienden a serlo; sin embargo,
ciertas puntuaciones muestran correlaciones sustanciales. Debe centrarse la
Relaciones personales. Las puntuaciones altas significan tolerancia para atención en la ascendencia y la sociabilidad, en la estabilidad emocional y
las personas, fe en las instituciones sociales, Uestar libre" de autocompasión o la objetividad, en la amigabilidad y las relaciones personales y en la cons-
suspicacia por 10$ demás. tricción y lo pensativo. Estas parejas de puntuaciones están muy lejos de ser
independientes, y la información provista por las puntuaciones se traslapa. En
Ejemplos un sentido, el inventario es sólo parcialmente eficaz, dada la duplicación de
cada puntuación; es como si dijéramos lo mismo otra vez. Sin embargo, en la
Hay demasiadas leyes inútiles que coarta!lla libertad personal del individuo. (- J. mayoría de los casos cada puntuación proporciona información acerca de un
Casi todas las personas tratan de hacer bIen las cosas cuando se les da la oporturu· aspecto nuevo y distintivo del individuo.
dad. (+)
Masculinidad. La persona que obtiene uI?a puntu~c~ón alta está i~t,e:esa. Tabla 11.7. Intercorrelociones y confjobjlidodes de las 10 escolos de fa encuesta del
da en las actividades masculinas, no se le dIsgusta facIlmente, es dIfIcil de temperamento Guilford·Zimmerman*
lidiar, es inhibida en la expresión emocional, resis~e el miedo, no le repugnan
los gusanos, es poco interesada en la ropa, el estilo o el romance. Intercorrelaciones
Confiabi-
j,; '
Escolo 7 10 lidad··
Ejemplos

Usted puede mirar a las serpientes sin temblar. J+ J l. Actividad general - 0.16 0,34 0.35 0,34 0.14 - 0.17 0.24 - 0.03 0.30 0.79
Ver unas uñas sucias o descuidadas le es repulSIVO. (- J 2. (onstñcción - 0.08 - 0.21 0.08 0.05 0.25 0.42 0.14 - 0.01 0.80
3. Ascendencia 0,61 0.35 0.41 - 0.25 - 0,19 - 0.04 0.29 0.82
Debido a que cada uno de estos agrupamient~s se pueden consider.ar 4. Sociabilidad 0.23 0.36 - 0.06 0.04 0.18 0.21 0.87
como dimensiones que tienen dos extremos, de la mIsma manera como eXIS' 5. Estabilidad emocional 0.69 0.37 - 0.13 0.34 0.37 0.84
;.. ,¡ ten el norte y el sur, el este y el oeste, hay un extremo opuesto par~ c~?a 6. Objetividad 0.34 - 0.04 0.43 0.32 0.75
dimensión que puede caracterizarse como justo el reverso de la descI?pclon - 0,03
7. Amigabilidad 0.50 0.26 0.75
.~. que se dio con anterioridad. Los reactivo~ marcados con ( - ) car~ctenzan el
8. Pensativo · 0.22 · - 12 0.80
extremo opuesto. Desde luego, la mayona de las personas n.o obt~e,nen pu~­
tuaciones altas en cualquiera de los dos extremos de la dimenSIOno AqUl, 9. Relociones pelWllales 0.35 0.80
como en cualquier otro lado, hay un rango CQ~t.i~1U~ de varia~iones, en el que 10. MosruUnidod 0.85
la mayoría de las personas ocupan una pOSlClon mtermedIa, l~ cual es el
patrón característico. La mayoría de las personas no son sobresal~entemente • Reproducido con el permiso de lo Sheridon Supply Company.
•• Fórmula Kuder·Richordsan, basado en uno muestro de 912 estudiantes universitarios.
activas ni conspicuamente letárgicas, ni claramente ascendentes, DI claramen- .
te sumisas. Las personas rara vez quedan bien d~scritas en esto~ tipos de perso- .
nalidad tan tajantes; más bien, se describen mejor al mostrar dIferentes rasgos . El inventario Guilford-Zimmerman tiene varias características que se
en grados variados. . , resumen a continuación:
Escoger eJ nombre para los agrupamIentos presentados en lmeas ante-
riores fue un poco problemático, porque los agrupamientos no correspon- .' al Está basado en las respuestas de las personas normales en sq vida coti-
den exactamente a los membretes de lenguaje que conocemos. Cada agru- diana, no en las del desajustado emocionalmente o en el interno en
pamiento está definido por los reactivos que se ~ncluyeron y que se una institución para enfermos mentales.
agruparon juntos, porque en realidad se inclu~eron )U~tos en la,s respues- bl Sus escalas están fijadas por medio de un análisis interno, median~e el
tas que dieron las personas evaluadas con el Inventano. Los tItulas son estudio de los agrupamientos de reactivos II que van juntoso.
aproximados y cada agrupamiento puede entenderse más exactamente el Las respuestas se toman por su valor frontal; adquieren significado
sólo mediante un estudio más detallado de los reactivos de los que consta. por su contenido obvio.

~ :- " " • o •
' ;" ..
o. ,. " , . . :~ , _
" ..' ... ... ;, ... ... . .
AJUSTE EMOCIONAL 413
412 CAP. 11. INVENTARIOS DE AUTOAPREClAClÚN

d) El evaluado puede contestar el número de reactivos que desee¡ sus 8. Hipomanía (Ma). Personas que tienden a s~r física y mentalmente
selecciones no están forzadas ni limitadas. . hiperactivas, con rápidos cambios de ideas y de .accIOnes: .. .
9. Masculino-femenino (M!). Personas que tIenden a Identlhcarsecon el
sexo opuesto, más que con el propio.
Minnesota Multiphasic Personality Inventory
IMMPI) -inventario multifásico de personalidad La importancia que adquieren los r~activos ?el
MMPI .se puede ent~nder
de Minnesota mejor si citamos una muestra; los pnmeros CInCO r~act1vo~ def. cOdJunto
completo de 555 se citan abajo. Después de cada reactIvo e.sta en ~sta a una
En contraste, consideraremos el MMPI, que difiere radicalmente respecto designación en código de las escalas para las cuales el reactIvo esta en la cla-
a las tres primeras características de la encuesta del temperamento Guillord- ve. Los símbolos ( + )y ( - ) revelan si la respuesta que se añade a la clave es
Zimmerman. El MMPI fue diseñado originalmente como un instrumento HsíH o Hno".
para estudiar individuos en quienes se sospechaba la existencia de cierto grado
de psicopatología. Con este objetivo, se ensambló un conjunto de reactivos de Ejemplosl
enunciados que aparecían en libros de psiquiatría y psicopatología y de los
registros de estudios de casos. ELintento era diseñar todo un rango de enun- 1. Me gustan las revistas de mecánica. Mf (- J
ciados acerca de los síntomas, las acciones y las actitudes, que estuvieran inte· 2. Tengo bilen apetito. Hs( - J, D 1.1:" J, Hy (- J _ .
grados y que incluyeran todos los que parecieran ser ind!cadores del mal fun- 3. Despierto fresco y descansa?o caSI tod.as.las ma.nanas. Hs (- ), Hy (- J, Pt (- J
cionamiento de la personalidad. Se probaron los reactIvos en un grupo de 4. Creo que me gustaría trabaJar como bIbhotecano. Mf (+ )
gente "normal" y en un número de pacientes hospitalizados que se selecciona- 5. El ruido me despierta fácilmente. D ( + J
ron como representativos delos patrones específicos de desajustes de la perso-
nalidad. El proceso de diseñar claves de calificación fue, básicamente, el mis· Las puntuaciones crudas en el MMPI se convierten en puntuaciones
. ¡. .:
!:
mo que el que se siguió en el SVIB¡ es decir, los reactivos en una clave dada estándar con una media de 50 y una desviación estándar de 10. No obstante
eran aquellos que diferenciabanaun grupo patológico en particular de un que se examinan todos los puntos de un per~il del indivi~~o, se tiende a, cen-
grupo de "normales" dentro de las personas en generaL Se diseñaron nueve trar la atención particularmente en cualqmer puntuaclOn de ~O o mas. El
escalas clínicas en esta forma, las cuales, complementadas por una escala de perfil de un paciente psiq~iátrico se l?uestra en }a tabl~ 11.8, Junto ~on el
introversión social, dieron el perfil de puntuación básica para la prueba. tipo de reporte interpretatIvo que pudIera haber SIdo denvado por tal tIl?o de
Los membretes de la escala, así como los tipos de grupo en los que estaban perfiJ.3 Obviamente, ésta es una persona con problemas severos de ajuste
originalmente basados, se indican brevemente a continuación.
emocional. . . .,.
El MMPI fue originalmente dise~ado en el ho~pIt~1 pSIqUlatnC?, ~ero el
l. Hipocondriasis (Hs). Individuos que muestran preocupaciones excesi- uso de este instrumento se ha extendIdo mucho mas leJOS de estos hmItes¡ se
vas respecto a su salud, a menudo acompañadas por reportes de dolores y al- ha utilizado ampliamente como instrumento discriminante para lo~ proble-
teraciones oscuras. mas de la personalidad en las universidades! así c~mo. ~n los ~rupos mIhtar~s y
2. Depresión (D). Individuos que sufren de depresión crónica, consenti- gubernamentales, y es un instrumento de Inve~tIgaclOn en htera~ment.e CIen-
mientos de inutilidad y de inhabilidad. para afrontar el futuro. tos de estudios de todas clases de ambientes. 4 DIcho uso tan ampho del Instru-
; { 3. Histeria (Hi). Individuos que han reaccionado a problemas personales mento y un conjunto de escalas con una orientación básicamente psicoI?a~o­
mediante el desarrollo de síntomas físicos, como parálisis, calambres, quejas lógica hacen plantear serias preguntas .de naturaleza tanto metod?logIca
gástricas o síntomas cardiacos. como ética. Primero consideraremos vanos problemas de metodologIa de la
4. Desviación psicópata (Pd) . Personas que muestran falta de respuesta medición y después los puntos éticos que surgen del uso de un instrumento de
emocional profunda, irresponsabilidad y poco respeto por las presiones socia-
este tipo.
les y la consideración hacia los demás.
5. Paranoia (Pa). Personas que tienden a ser excesivamente suspicaces y
sensibles, con sentimientos de ser lastimados o perseguidos.
6. Psicastenia (Pt). Pacientes que se muestran preocupados con respecto a
miedos excesivos (fobias) y tendencias compulsivas a refugiarse en ciertas l Reproducido con permiso. Copyright 1943 por la Universidad de Minnesota. Publicado
ideas y realizar determinados actos. por la Psychological Corporation, Nueva York, N. Y. Todos los derechos reserv~d?s.
3 Los enunciados siguieron a aquellos programados en la computadora de la Chnlca Mayo y
7. Esquizofrenia (Se). Pacientes que se caracterizan por tener pensamien· se emplearon para la interpretación computarizada de lo~ res~Ul.dos de~ MMPI. .
tos y conductas extrañas y poco comunes, así como una vida subjetiva que 4 Este es uno de la media docena de instrumentos pSlcometncos mas usados. H~sta 1971
tiende a apartarse del mundo de la realidad. habían aparecido no menos de3 840 tesis, artículos y libros que lo habían usado o estudIado.

i '- ,
¡'¡,l
r 414 AJUSTE EMOCIONAL 41 5

:' I~
1,1:1-
!
1,'
¡ Tabla 11.8. Perfil MMPI y comentarios interpretativos paro un paciente psiquiátrico las puntuaciones pueden representar algunos aspectos diferentes de la perso-
nalidad en grupos normales de los que se sugieren para los grupos de criterio
Puntuaciones patológico, en los que las claves se establecieron originalmente.
JJI' Escala , estándor [omentarios
'~ l'
;1I "' : f' , 74 Interprete este perfil con precaución. El respondente admite haber 'Traslape de escalas
,t I :
tenido un gran número de elcperiencias poco comunes, así como Los instrumentos muestran características (que tienden a ser válidas en el
sentimientos y síntomos. Éste puede tener problemas psiquiátricos SVIB y de otros instrumentos cuya clave se determinó empíricamente) de un
significativos. Considera lo evaluación psiquiátrica traslape extenso entre ciertas escalas. Cada escala muestra correlaciones posi-
r· 5O Ni defensivo ni autodepreciotivo tivas que alcanzan valores tan altos como 0.80 (Se con Pt). Las correlaciones
Hs 82 Gran número de quejos físicos crónicos y de preocupación por los , surgen porque algunos de los reactivos están en las claves de varias escalas,los
funciones del cuerpo. Mucho dolor funcional, fatigo y probablemente reactivos de características similares están en las claves de escalas diferentes y
debilidad surgen ciertos conjuntos de respuestas que examinaremos a continuación.
j "
, ." o 89 Severamente deprimido, preocupado, indeciso y pesimista Como resultado de esto, grim parte de lo que se mide en las nuevas escalas
" j Hy 79 Probablemente inmaduro, egocéntrico y demandante. Propenso o regulares podría explicarse por dos o cuando mucho tres factores comunes
desarrollar quejas funcionales circunscritos, como dolores de cabezo y , básicos. El perfil d!,! puntuación completa parece ser redundante y, tal vez, ine-
de espalda ficaz para describir las diferencias de personalidad que las escalas evalúan.
Pd 64 Independiente o ligeramente inconfarme
Mf 71 Probablemente sensible e idealista, con intereses en la estético, la
culturo y el arte
Conjuntos de respuestas
Pa 53 Respeto las opiniones de los demás can una sensibilidad poco común Asociados con sus referencias patológicas obvias, muchos de los reactivos
Pt 82 El respandente está consciente y preocupado acerca de los actitudes del MMPI tienen un nivel muy bajo de deseabilidad como forma de conducta
sociales y los impulsos emocionales, pero es incapaz de controlarlos atribuible a uno mismo. Los jueces que evalúan los reactivos muestran razo-
Se 87 Sentimientos probables de irrealidad, pensamiento confuso o extraño y nable congruencia cuando califican cada reactivo para la deseabilidad social, y
conducta similar. Puede tener actitudes extraños y creencias falsos esta deseabilidad social y sus calificaciones tienen varios correlatos interesan-
Ma 43 Boja energía y nivel de actividad. Dificultad para motivarse. Apático tes. Primero, la deseabilidad social tiene una correlación muy sustancial, de
Si 83 Introvertido, tímido y socialmente inepto 0.86 en un estudio, con la probabilidad de apoyar el reactivo. Cuanto "mejor"
se perciba generalmente una cosa, más probabilidades hay de que una persona
• Véme ellinal de este apartado poro el estudio de estos puntuaciones.
diga que eso es cierto. Segundo, la tendencia a marcar reactivos socialmen-
te deseables es, por sí misma, una característica individual confiable. Un
grupo de reactivos seleccionados y marcados para revelar una deseabilidad
social proporciona una puntuación estable y confiable, como cualquiera de
Heterogeneidad de las claves las otras puntuaciones producidas por el instrumento. Tercero, esta puntua-
..1. de calificación ción de deseabilidad social muestra correlaciones muy sustanciales (la mayo-
ría negativas) con muchas otras puntuaciones del MMPI. En parte, el instru-
El procedimiento empírico, en el cual los reactivos se colocan en una cla- mento mide la tendencia del individuo a ser autodefensivo en oposición a
ve de calificación particular si un grupo clínico hospitalizado de tamaño autodespreciativo.
modesto responde de manera diferencial, conduce a una combinación de Los autores de la prueba han reconocido este problema y han diseñado
reactivos que deberían pertenecer a varias claves de calificaci~n. Algunos varias escalas para identificar las distorsiones de los resultados, ya sean cons-
se refieren a síntomas clínicos obvios, mientras que otros, denommados reac- cientes o inconscientes. Hay cuatro de estas escalas de verificación o de
tivos sutiles, aparentemente no tienen mucho en ~omún c~m e~ .modelo corrección, a saber:
particular de patología. ~stos dos subgrupos ?e reac~lvos no solo ~lf~eren en
su naturaleza aparente, SInO que tampoco estan relaclO~ados e~tadlStlCa~en­ 1. I El número de reactivos en los que el individuo se rehúsa a marcar "sí"
te (aun cuando sí lo están levemente de manera negatIva). ASl, los reactivos o "no"; se consideran una indicación de defensa y de separación de la tarea de
proporcionan una puntuación carente de coherencia, Parece pr~bable qu.e la prueba.
mucha de la variación en las puntuaciones entre un grupo de estudIantes ~m­ 2.1., El número de conductas obviamente "buenas", pero extremadamente
versitarios sea producida por las variaciones en las respuestas a los reactlvo,S improbables que reclama tener el examinado; se consideran una indicación de
sutiles, ya que pocos de ellos miden síntomas más marcados de patología. ASl, defensas más bien ingenuas y de sobreprotección.
,'1

" ; '," .:'


, ., .., ... ...:. . • . . ; :: • • ,' • '. ' .' "o~.""" ':. :~:•• . ',. .; ~ ,";. ,,':: '. ,.,'.: ..:;,', .....• , .... . , ... . ,'.,'.
pr;.· ¡:
, ,1 ,
i ,.,
416
i~ ' t
CAP. 11. INVENTARIOS DE AUTOAPRECIAClÓN AJUSTE EMOCIONAL 41 7
¡ti: 3. E El número de respuestas muy raras que haga el individuo; se conside_ la Guilford-Zimme!man; sin embargo, la forma de presentar los reactivos es
" r' ! ' ra una señal de que el evaluado quizá no haya entendido o seguido las instruc_ diferente. Las polandades se han clasificado como sigue:
ciones.
4. K La tendencia a escoger respuestas dadas por personas identificadas al Social en oposición a solitario.
clínicamente como anormales que han mostrado perfiles normales en la prue- bl Ascendiente en oposición a aislado.
ba; se consideran indicadores de una defensa sutil y una tendencia a describir_ el Alegre en oposición a triste.
se a sí mismo como bueno a la luz de ser "déseable socialmente". dI Complaciente en oposición a irritable.
el Aceptante en oposición a crítico.
Sin embargo, el problema de tratar con conjuntos de respuestas no se ha fI Intransigente en oposición a flexible.
resuelto por completo; permanece como problema porque es difícil decir qué g) Reflexivo en oposición a práctico.
tanta respuesta de "deseabilidad social" representa un conjunto de respuestas h) Impulsivo en oposición a reflexivo.
relativamente superficial por parte del individuo, qué tanto representa una i) Activo en oposición a negligente.
defensa más profundamente arraigada y qué tanto representa un nivel alto í) Responsable en oposición a casual.
completamente genuino de autorrespeto.
Una serie de respuestas corolarias que ha sido de alguna preocupación El f.o rmato b~ico consta de 20 conjuntos de 10 reactivos cada uno. En un
para el MMPI es la complacencia o el"decir que sí". En la estructura del ins- " determInado conjunto hay un reactivo que se relaciona con cada una de las 10
trumento casi todos los reactivos están redactados de modo que contestar a polaridades anteriores. Los reactivos se seleccionan en términos de sus inter-
ellos que "sí" significa atribuirse algunos síntomas o conductas como caracte- correlaciones: los altos con su propia escala y tan bajo como sea posible con
rísticos de uno mismo. ASÍ, cualquier elemento de sugestionabilidad o de l~s otras nueve escalas. Los reactivos que se ponen juntos en un conjunto han
prontitud para estar de acuerdo conduciría a atribuirse muchos síntomas y, en SIdo aparea.dos de manera bast~nte estrecha por su popularidad; es decir, por
la medida en que los síntomas son preponderantemente desfavorables, la l~frecuencla con que los sele~Ionan las personas que las consideran descrip-
complacencia conducirla a obtener puntuaciones altas en varias de las escalas tivos de .ellas. En consecuencIa, se puede presumir que se aparean razonable-
clínicas. II!-ente bIen con,la deseabilidad s?cial. Se instruye al examinado para que selec-
En contraste con la Guilford-Zimmerman, el MMPI tiene las caracterÍs· CIone tres reactlV?S ?e cada conjunto que sean los más descriptivos de él y los
ticas siguientes: tres menos descnptlvos¡ los cuatro restantes son los intermedios. El exarnÍ-'
nado obtiene una puntuación usociable" alta si selecciona los reactivos ex~
al Está basado en las respuestas distintivas de grupos seleccionados de presados, en la dir~~ión de ~ociabilidad . (UMe gustan las fiestas ruidosas")
personas -en este caso, grupos que representan cada uno una psicopa- como mas caractenstIcos de el y los reactIVOS enunciados en la dirección del
tología en particular. so~ta.rio (" Algunas ve~e~ siento que debo alejarme de la gente") como la carac-
bl Tiene escalas que están definidas por estos grupos anormales. tenstlca menos descnpuva.
el No está interesada por el significado aparente de un reactivo, sino sólo Nótese q~e en este instrumento se usa un formato de respuesta forzada y
por si éste funciona -es decir, si sirve para diferenciar entre el grupo que las sele~clOnes. se hac.e,n entre l.o~ re.activos que se aparean por su populari-
anormal y el grupo control. dad: Esto tiene la mtencIOn de IlllmmIzar el papel que desempeña cualquier
~onjunto de respuestas de deseabilidad social o de complacencia.5 Los con-
Por tanto, el MM PI sigue el patrón general del SVIB. Asimismo, al igual juntos de 10 reactivos requieren que el examinado compare cada dimensión
que la Guilford-Zimmerman: ' contra l~s otras nueve ~ada vez que hace una selección, de tal manera que
dI Permite que se apoye cualquier número de reactivos, de modo que el cada conjunto de seleCCIOnes proporciona la máxima cantidad. El instrumen-
evaluado quede libre de preocupación. to no es totalmente ipsa.tivo (es decir, las 10 puntuaciones no tienen que
sum~r exactamen~e el I~llS~O total para cada uno), porque la mitad de los
Ahora examinaremos un inventario en el que se emplea un patrón de res- reac~:IVo.s se enunCIa en terrnmos de un extremo de la polaridad y la otra mitád
, puestas de opción forzada. en termInOS ?e.l ?tTO extremo, per? las combinaciones forzadas de los conjun-
tos y de que InICIalmente se seleCCIOnen reactivos con bajas correlaciones con
las otra~ escalas que ~o sean la .misma, producen un conjunto de puntuacio-
Las dimensiones del temperamento, neseon IntercorrelaclOnes relatIvamente bajas (de las 45 intereorrelaciones de
de Thorndike
s s~ emba~go, los individuos que tenían instrucciones de aparentar bien aun así mostraban
~endenclas conslst!nt~ ~ au.~e.?tar o dis~uir los puntos específicos en sus'perfiles. Se ha dise-
Este inventario se diseñó para evaluar 10 dimensiones bipolares normales nado una clave de veriflcaclon IThomdike, 1968) para identüicar 83% de los "aparentadores' a
del temperamento, que tienen bastante en común con las que se incluyen en un COSto de 6% de las respuestas presumiblemente honestas.
;. '

¡ .l..
418 CAP. 11. INVENTARIOS DE AUTOAPRECIAClÓN AJUSTE EMOCIONAL 419

las escalas sólo dos para hombres y cuatro para mujeres son tan altas Como . uno mismo y juzgarse objetivamente, la cual puede ser difícil de lograr. De
!, ': 0.30). Las puntuaciones muestran buenas c?~rela.ciones con las autocalifica_ .hecho, la persona cuyos ajustes personales son de lo más insatisfactorios pue-
I ciones y correlaciones modestas con las calIfIcacIones hechas por o.tras per- de ser la menos capaz de lograr esta objetividad y afrontar sus propias defi-
sonas. Algunos grupos, como el de los vendedores, muestran perfiles muy ciencias. Los estudios han demostrado repetidamente que sujetos que obtie-
distintivos. Aún están pendientes por investigarse otros aspectos de la validez. nen bajas calificaciones por otras personas en algún rasgo deseable tienden a
JI'

sobrecalificarse a ellos mismos. Así, es probable que una joven de mal carácter
no se reconozca como irascible y que un muchacho tosco y patán no se dé
cuenta de su actitud hacia los demás.
Evaluación de los inventarios de Cuando los inventarios están construidos de acuerdo cQn el patrón del
temperamento y ajuste emocional SVIB O del MMPI esta falta de discernimiento no puede tener mucha impor-
tancia. La clave del reactivo para estos inventarios está basada no en su conteo
¿Qué tan bien podemos describir las caracterí~tic.a~ temperamen~ales y de nido obvio, sino en el hecho empírico que distingue entre grupos de criterio.
ajuste personal por medio de las respuestas de un mdIvIduo a una sene de pre- Si Raquel marcó que le gustaría reparar un reloj, se ha comportado con una
guntas? Para responder esta pregunta indicaremos lo que debe ha~er el evaI.ua- conducta típica de los ingenieros, pero la pregunta acerca de si los ingenieros,
do para llenar un inventario de manera adecuada, lo cual reqUiere que este por un lado, o Raquel, por el otro, realmente quieren reparar un reloj no es
a) sea capaz de leer y comprender el !e~ct~vo; b) se~ capaz d~ .reconsiderar ~u central a nuestra interpretación: Lo importante es que ambos han reacciona·
posición en su propia conductay-decIdu SI el enuncIado es valIdo o no para el, do a la pregunta de la misma manera, por lo que se le otorga a Raquel un crédi-
y e) esté dispuesto a ser franco y a dar respuestas ~onestas. C~da uno de estos to en la clave de ingeniería del Strong. Por el otro lado, cuando los reactivos
puntos plantea ciertas cuestiones acerca de la vahdez de los Instrumentos de y las puntuaciones están interpretados con base en su contenido manifiesto y
autorreporte. . ' . tomados por su valor frontal, como en el inventario de Guílford·Zimmer·
Un problema en los inventarIOS de todo tipO es la ear~a de lec.tura. DebI- roan o el registro de preferencias Kuder, las respuestas carentes de discerni·
do a que hay gran cantidad de lectura, sobre todo en los mventarIOS .que tra· miento conducen a una imagen poco verdadera de la persona que las hace.
tan de apreciar varios rasgos diferente~, normal~e?-te es necesano tener Un tercer problema es la disponibilidad del evaluado a revelar la forma
... ! varios cientos de reactivos para proporCIOnar el sufICIente panorama y con· como se percibe o como se siente él mismo. Para los inventarios de personali-
fiabilidad. El lector lento puede tener problemas para manejar toda esta pala· dad, la respuesta franca y honesta por parte del examinado es esencial para
brería, o se puede cansar y abandonar la prueba o ~mpezar a .responder sin una imagen válida. En la mayoría de los casos, el significado general de los
leer todos los reactivos. En parte, el problema conSIste en el nIvel de lectura reactivos es razonablemente evidente para el lector. Los evaluados moderada·
que se tiene; es decir, en la complejid~d de la estructura y d,e lo ~bstr~cto mente sofisticados (es decir, los estudiantes de las clases superiores de la uni-
de las ideas implicadas. Si el vocabulano o los conceptos estan mas alla de versidad) suelen "aparentar bien ll o uaparentar mal ll los inventarios autodes·
la comprensión del evaluado, por lo general éste se rinde ~I?- su intento por criptivos (Yonge y Heist, 1965', aunque suelen ser menos capaces de simular
comprender de qué se trata y responde de manera superhcIa~ o azarosa (la patrones particulares de ventajas o desventajas. Aun cuando los sujetos no
escala F del MMPI está diseñada para proteger contra este pehgro). Por tan· pueden aparentar exitosamente, una persona que trata de hacerlo dará una
to , los inventarios son de valor
. cuestionable para las personas de baja esco· imagen distorsionada de él mismo. Las puntuaciones de inventarios son útiles
laridad, ya sean niños o adultos. . ' sólo en la medida en que la mayoría de los evaluados contesten de la manera
Un problema relacionado con el de la lectura de los reactIVOS, pero dIfe· que consideran representarse a sí mismos. Es muy importante tomar medidas
rente es el de interpretarlos. Supongamos que la pregunta dice: l/iLe gusta a contra la distorsión, con el fin de controlar las puntuaciones y detectar si se ha
men~do hacer cosas por usted mismo?1I El lector puede descodificar este incluido en el MMPI Y en otros inventarios.
enunciado perfectamente de modo competente, pero todavía tendrá el pr,?· La posibilidad de distorsionar conscientemente la puntuación propia sig-
blema de decidir: a) qué tan frecuentemente este tipo de evento debe. ocurnr nifica que los inventarios de personalidad o ajustes no pueden usarse, o sólo
p~a que ~ea "a ~enudoll; b) a qué cl~se de I/co~a.sll se. refieren',es decu, es~u· con precauciones, cuando el examinado se siente amenazado por la prueba o
dIar cammar salIr a cenar etc., y e) SI "le gusta Imphca una busqueda activa siente que pueden emplearse los datos de la prueba en su contra. Tal vez por
o u~a acepta~ión pasiva d~ las actividades solitarias. La variación en la inter· esta razón, los inventarios generalmente han probado no ser muy útiles en las
pretación podría producir bastante variació~ en las respuestas; los problemas situaciones de empleo. Si se da un inventario a los alumnos de la escuela ele-
de interpretación de esta clase pueden surgIr tanto en las personas con muy mental Iy tal vez de las escuelas secundarias y de la universidad) dentro del
buen nivel de lectura como en los lectores deficientes. ambiente escolar típico, en el que las pruebas representan algo importante
Un segundo problema es el del autodiscemimiento. Los inventarios para el alumno, y en el que el maestro suele obtener lo mejor de ellas, uno se
requieren que los individuos conceptualicen y clasifiquen su propia conduc, inclinaría a dudar si muchos de los alumnos estarían dispuestos a revelar sus
ta. es decir que decidan si ciertas descripciones o clasificaciones de conducta deficiencias personales de las que fueran conscientes. Generalmente, en cual-
sC:n válida~ para ellos. Esto implica cierta habilidad para poder separarse de

. .....
·- " .·\1, 0" · '·
AJUSTE EMOCIONAL 421
420 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN
más, una universidad tiene responsabilidad al invertir sus recursos en estu-
quier situación práctica deberíamos co.nsiderar que un i!lv~ntari~ d: aj?st~ de diantes que tienen muchas probabilidades de proveer a la sociedad (aunque no
la personalidad no es otra cosa que un mstrumento prehmmar dlscnmm~tlvo sea necesariamente económica) esa inversión. Aun en la industria existe una
l' que localizaría a varios individuos que pudieran tener probl:I?as. de al.uste preocupacíón por las responsabilidades que ésta tiene con sus accionistas
¡ o que pudieran estar en conflicto con su. amb}ente. La evalua~l~n fIna~ SIem- empleados y clientes para funcionar eficazmente y producir los productos ~
pre deberá consistir en esperar un esttldlO mas personal y ~as ~tenslvo del
: 1,
I 1" los servicios de la mejor calidad. Por tanto, afrontamos aquí una ponderación
iIJ:. individuo. Más aún, una buena puntuación en un inven,ta~o de ajuste perso- de valores que compiten entre sí; ¿qué tan seria es la intrusión en el individuo
Di .
;'! '1', :
nal no es garantía de un buen ajust.e¡ puede ser caractenstlco d: u';1a persona y qué tan crucial es la información para un beneficio social genuino e impor-
': 1' "
>¡ , que es defensiva, autoprotectora e Incapaz de afrontar el conOCIDuento y sus tante? Estas preguntas se han planteado con más conciencia y detalle y de
;;l;;
problemas r e a l e s . . . manera más intensa en los años recientes.
Los inventarios de la personalIdad son producto de, la cu~tura estado'~ml-
,; , dense de la clase media y aún no se ha explorado en q?e medida los react1v~s
tienen significados equivalentes en otras culturas. nacIOnales, o aun en los m- Evidencia de validez
veles socioeconómicos más bajos en Estados Umdos. Se d~be tene~ una pre-
;" .; caución adicional para interpretar los resultados de los mventanos en los Los inventarios diseñados como medidas de ajuste emocional normal-
miembros de otros grupos culturales. ' mente muestran un nivel moderado de validez concurrente; es decir diferen-
cian entre grupos establecidos en otros campos distintos al del ajuste. Así, el
MMPI se estableció para distinguir entre grupos con diagIlósticos patológicos
; ~
¡ ; El tema de la invasión de la priva cía y grupos normales, y continúa haciéndolo con nuevos grupos. Otros inven-
tarios se han usado por su habilidad para diferenciar grupos menos extremos
Cada vez que se pide a un individuo que proporcione iI!fo~~ció~ perso- y se han mantenido bastante bien bajo la prueba.
nal, los temas de la invasión de la privada y. aun de la au.tomcnrru~aclOn s.~n Cuando nos referimos a la validez predictiva, los resultados son menos
problemas potenciales. El problema s~ convlerte:n algo lmportant~ a m~d~ua alentadores. En los estudios de civiles (Ellis, 1946, 1953; Ghiselli y Barthol,
que la información que se busca es pnvada y posl~leme~te autodespreclat!va 1953¡ Super, 1942), las puntuaciones de inventarios de temperamento o de
en naturaleza, como el inventario orientado haCIa la pSlcopatolog¡a del tipO ajuste emocional han fallado generalmente para predecir cualquier cosa acer-
ca de los eventos futuros de un individuo, ya sea en la escuela, en el empleo o
del MM información que se autorreporta va a ser usada ~o'1 o en be~e.f"ICIO de1 .
Si la PI. en su vida personal. Las experiencias militares con estos instrumentos (Ellis y
individuo y se da de manera libre y espontánea, ~omo sex:a el cas? tIplCO de la Conrad, 1948) han sido más prometedoras. Se ha producido un gran número
información provista en el contexto de la asesona a la pSl~o.terapla, el proble- de estudios que muestran relaciones sustanciales entre las puntuaciones basa-
ma de la invasión de la privada es mínimo. La conducta etica por parte de la das en los inventarios y el juicio subsecuente resultado de una entrevista
persona que recoge la información, ya ~ea ~ed.iante la en.treV1sta ~ !os cues- psiquiátrica. Las relaciones de dichos estudios con posteriores bajas en el
tionarios únicamente requiere la confIdenclahdad de la mfonnaclOn y que servicio militar también han sido lo suficientemente buenas para indicar que
ésta se m~ntenga y use sólo para el propósito p~ra el9ue ~~ obtuvo. ~uando la un inventario podría servir como un instrumento para discriminar en una
información se obtiene con propósitos de mvestIgaclOn, ademas de una entrevista más cuidadosa a aquellos sujetos que mostraron problemas de per-
garantía similar de confidencialidad se :equiere "e~ consentimiento de.l eva- sonalidad potenciales.
luado". es decir el individuo debe asentir voluntanamente para dar la l~for­
mació~ una ve~ que sabe qué clase de información se le pide y, en térmmos
generales, cómo se usará. ., . ,
Uso práctico de los inventarios de
Las preguntas más serias de la i!lvaslOn ~~ la pnvacIa surgen cuando el temperamento y de ajuste emocional
individuo recibe la propuesta de dar mformaclon que, de hecho, puede usa~se
en su contra, por ejemplo, cuando se solicita empleo. i qué tanto derec~o tie- Ahora cabe preguntamos qué uso deberíamos dar a los inventarios de
ne una escuela una universidad, una empresa Industnal o una agenCIa gu- temperamento y de ajuste emocional dentro y fuera de la escuela. Con base en
bernamental n~cional o local para pedirle al individuo información acerca de los factores que pueden distorsionar las puntuaciones y la validez limita-
él mismo que sirva para discriminado y negarle un entrenamiento, un empleo da que tales instrumentos han mostrado como predictores, debemos concluir
o un papel en los asuntos gubernamentales nacionales? Po~ supuesto, .los que estos inventarios deberían usarse muy esporádicamente. Uil inventario
derechos del individuo no son absolutos; los reclamos de la SOCiedad y sus mS- de la personalidad debería usarse sólo como un instrumento adjunto a servi-
tituciones también deben recibir consideración. En determinadas circuns.tan- cios psicológicos más intensivos. Si es posible que personal psicológico entre-
cias como en ciertas posiciones centrales y muy sensibles de la segundad nado realice estudios intensivos de algunas personas dentro del grupo, el
nacional, lo que concierne a la sociedad es de importancia capital. Una vez
422 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN CUESTIONARIOS DE ACTITUDES 423
inventario debería servir para identificar a las personas que pudieran benefi- 1. Si !anto un m~rido coI?o su mujer tienen empleos y
se ofrece a la mujer un tra-
ciarse al trabajar con un psicoterapeuta o con un asesor; sin embargo, Un baJO en una CIUdad dIstante que es mejor que el del marido, ella debería:
maestro de clases puede encontrar muy poco significado de la puntuación de
iI un inventario. Aceptada de manera no crítica, esta puntuación puede condu- al Aceptarlo y esperar que su esposo se mude con ella.
;1r 1'I cir a errores; asimismo, tiene pocos propósitos útiles dar un inventario de la bl Aceptarlo y esperar que su esposo decida lo que quiere hacer al res-
pecto.
'j:1 personalidad a los alumnos y proporcionar los resultados al maestro de clase el Aceptarlo sólo si su esposo encuentra trabajo en la nueva ciudad.
especialmente si éste es de la escuela elemental y trabaja con niños. ' dI Rechazarlo y mantener el trabajo actual.
Los inventarios de temperamento multidimensionales han dado mues-
, , tras de diferencias bastante sustanciales, basadas en evaluaciones concurren- 2. Si una mujer casada que trabaja tiene un hijo, debería:
1,"
tes, entre personas de distintas ocupaciones (Cattell, Eber y Tatsuoka, 1970);
sin embargo, casi no ha habido estudios predictivos genuinos. Aunque los al Quedarse en cas.a y cuidar al niño hasta que éste vaya a la escuela.
estudios concurrentes sugieren que hay diferencias temperamentales signifi- bl Regresar al trabajO y esperar que el esposo comparta las mismas obligacio
. j:
cativas entre las personas de ocupaciones distintas, la evidencia es bastante nes en el cuidado del niño .
más limitada que en el caso de las medidas de intereses. Es posible que perso-
nas con ciertos patrones de características temperamentales deberían ser guia- 3. En lo que concierne a la expresión sexual, una mujer debería:
' :
das hacia ciertos tipos de trabajo o, mejor, alejadas de otros. Esto parece plau- al Tener una libertad completa dentro o fuera del matrimonio:
' L
sible para muchas personas; no obstante, nuestra información acerca de los bl Tener ~na restricción completa hasta que se case.
patrones de la personalidad en las ocupaciones específicas es demasiado limi- el Tener lIbertad completa sólo hasta que se case.
tada, y el rango de variación dentro de las ocupaciones es probablemente
demasiado amplio para hacer actualmente un uso práctico de estas apreciacio- En análisis de los resultados tomaría la forma de porcentajes de personas
nes de la personalidad. que esco~~n ca~a.~lternativa. ,L?s datos pueden separarse en subgrupos por
edad, reglOn, rehgI~n, estado c.1VlI y otros factores de interés. Así, sería posible
esperar 9ue las mUJer~s escogIeran frecuentemente los enunciados que afir-
CUESTIONARIOS DE ACTITUDES men su Igualdad y su mdependencia; que éstos a su vez fueran escogidos más
frecuentemente por las mujeres más jóvenes y que la afiliación religiosa es-
Un tipo de autorreporte posterior que también es un instrumento que se taría relacionada por lo menos con la respu~sta del tercer punto.
ha utilizado ampliamente en la investigación psicológica y en la evaluación de
los programas educativos, es el cuestionario diseñado para evaluar activida-
des con respecto a algún grupo, institución social, concepto social o acción Medición de actitudes
propuesta. Es importante diferenciar el mapeo y la medición de las actitudes,
pues en el mapeo quedan implicadas muchas posturas diferentes en un domi- En la medición de actitudes estamos interesados primordialmente en
nio de actitud para determinar el rango y el panorama de las actitudes en algu- obten~r una. puntuación co? ~na con fiabilidad adecuada que pueda represen-
nos grupos, mientras que en la medición se trata de obtener apreciaciones tar la mtensIdad de los SentImIentos de cada persona hacia una manifestación
relativamente precisas de la intensidad de alguna actitud específica en cada de ~ctitudes o e~ contra de ella -en este caso, la liberación y la igualdad para la
individuo. Mediante el establecimiento de los procedimientos para diseñar mUJer. Por medIO de lecturas, de otras personas, de nuestra propia conciencia,
una medida de actitudes para el dominio de la liberación femenina, ilustrare- empezamos , por en.samblar un catálogo de enunciados q!le abarquen los
mos el mapeo y la medición de actitudes. puntos de VIsta pOSIbles en cuanto al concepto de interés. Estos deben ir en
un rango desde los más p~sitivos y favorables hasta los más negativos y desfa-
vorables, y normalmente mcluyen varias subfacetas del dominio de actitudes.
Mapeo de actitudes En el caso de la liberación femenina, incluirían por igual las oportunidades de
empleo, el c,:!idado ~e ~?S niños, la libertad sexual, la independencia personal,
El mapeo de actitudes podemos verlo en algunas encuestas de opinión .... el grado de diferenclacIon de papeles, etc. Cada enunciado debe ser claro y bre-
pública realizadas por ciertas organizaciones¡ como el GalIup PolI y el Michi- .. , ve, presentar una sola idea y estar enfocado en los sentimientos más'que en los
gan Survey Research Center. Los encuestadores intentan identificar algunos hechos, así como en la actitud más que en la información.
puntos actuales dentro de un dominio de actitudes y obtener una respuesta .: El. conjunto total de re~~t,ivos suele ser demasiado grande para usarlos
respecto a cada una; por ejemplo, en el área de la liberación femenina o de los como mstrumentos de mecllcIOn, por lo que es necesario seleccionar un sub-
derechos de la mujer, se incluyen algunas preguntas y ciertas alternativas de conjunto de reactivos. Para ello, un grupo de jueces revisan califican y valo-
respuestas como las que se muestran a continuación: ran los reactivos. La función de los jueces no es indicar el g/ado de acuerdo o

'. ;

" ; '" ' : , . : . :" '.'. " " , ' :" :. ; .....' ...:" ..
424 CAP. 11. INVENTARIOS DE AUTOAPREClAClÓN
CUESTIONARIOS DE ACTITUDES 425
de desacuerdo con un reactivo, sino. evalúar dónde se ubica el enunciado en chos de la muj~r, un valor de cuatro estaría asignado a una AA (fuertemente
: i
una escala proconcepto y anticoncepto en relación con el concepto elegido. de: acuerdo), mIentras que en los otros enunciados el valor de cuatro estaría
Normalmente, las escalas de actitudes son de siete a nueve puntos y los pun-
tos de la escala pueden estar en un rango de nueve co.mo fuertemente favora- aSI&.nado a ~na DD (fuertemente en desacuerdo). Ento.nces, la puntuación
i1, ble hacia la libertad yel estatus de la mujer, pasar po.r el cinco, que sería el
p.~slble esta:f1a en un rango. desde el 80 (más fuertemente a favor de la libera-
ClOn .femenma) hasta el cero (muy ho.stil). Una puntuación de 40 se po.dría
I neutral, hasta el uno., que sería muy fuertemente ho.stil hacia la libertad y el conSIderar como. neutral.
estatusde la mujer. El propósito de las calificaciones es encontrar dónde se
ubica la dimensión del pro y del anti en un enunciado específico y qué tan
bien puede estar de acuerdo un grupo de jueces en cuanto. al significado de Cuadro 11.2. Muestra de escolo de octitudes
cada enunciado. Eventualmente, deseamo.s seleccionar un conjunto de enUn-
ciados que representen to.dos los grados de favorable y desfavorable, así como Actitudes hocio lo liberación de lo mujer
que coincidan en el mismo significado para todo el mundo. La posición de un
reactivo en una escala de favorable-desfavorable se indica mediante la califica- Leo codo. enunciado, y después haga un círculo en el símbolo que represente mejor su reacción o
ción de la mediana que recibe de los jueces; sus ambigüedades por la disper- ese enuncJOdo, de acuerdo con lo escolo siguiente:
sión .de estas calificaciones están dadas por el rango. de semiintercuartiles. AA: completamente de acuerdo
Considérense los enunciados siguientes: o: tendencia o estor de acuerdo
?: indeciso; ni de acuerdo ni en desacuerdo
d: tendencia a estor en desacuerdo
Mediana Q
DD: completamente en desacuerdo
: ;.: .. la carrero y el empleo de uno esposo son tan importantes
como fas de su esposo
los modos' femeninos son un instrumento diseñado poro
8.1 1.0 ® o?d DO 1. El. hombre. y lo mujer deberían recibir el mismo solario por el
mismo trabajo
maniener a los mujeres en un papel inferior 7.0 3.1
® o?d DO 2. Ninguno mujer debería tener un hijo hasta que así lo decido

El primer enunciado parece prometedor para ser incluido en un instru-


AA o? d
® 3. La mayoría de los mujeres no son adecuados, por su
temperamento, paro desarrollar trabajos de supervisión o de
mento final de actividades; es un enunciado altamente a favor, y los jueces administración
están <Je acuerdo en que sí se ubica dentro de una dimensión de actitudes. El
segundo es un enunciado. incompleto; aunque en promedio esté calificado
>
,.
® o?d DO 4. No debería haber dubes o lugares públicos restringidos a un solo sexo
como. que implica una po.sición moderadamente favo.rable hacia la liberación AA o?d
® 5. El lugar de la mujer es el hogar
de la mujer, parece haber mucho desacuerdo entre los jueces en lo que real-
mente significa. Este enunciado fue asignado por jueces diferentes en todas las ® o?d DD 6. Las reglas para lo promoción deberían ser iguales poro el
hombre y paro lo mujer
posiciones de la escala desde la 1 hasta la 9; más aún, cerca del 10% de los jue-
ces lo marcaron como irrelevante para la dimensión de actitudes bajo estudio.
Debido a su gran ambigüedad, se retiró el segundo enunciado de una consi-
® a?d DO 7. El trabajo y lo correro de la esposo son ton importantes como
los del esposo
deración posterior para la escala en construcción.
Dadas las calificaciones de los jueces, ahora po.demos seleccionar un con-
junto breve y razonable de enunciados que tengan un significado claro, que
AA a?d
® 8. El hombre y lo mujer son bósicomente distintos en su estructuro
y, por tanto, tienen que desempeñar papeles diferentes
representen todos los grados de intensidad de los puntos de vista en pro y en
contra y que abarquen las principales facetas del campo que se está estudian-
do. Normalmente, los enunciados pueden presentarse mejor a los sujetos en
AA o?d
® 9. Uno ~ujer que estudia una carrera roro vez puede esperar tener
uno Vida hogareño satisfactorio
1;.
! :. .
un formato como el que se muestra en el cuadro 11.2, en el que el entrevista-
do indica el grado de aceptación de cada enunciado. Las respuestas pueden ® o?d DO 10. No hay ninguno diferencio psicológico innato entre el hombre y
lo mujer
calificarse como 4, 3,2, 1, O, Y la dirección de la puntuación depende de si el
enunciado es a favor o en contra; es decir, en los enunciados 1, 2, 4, 6, 7, lO,
ll, 12, 13, 15 Y 20, en los que el acuerdo indica actitudes favorables alosdere-
® o?d DO 1l. El hombre de~ería compartir por igual con su esposo el trabajo
de la cosa: alimentación, limpieza, etc. .
426 427

Cuodro 11.2. (Continuación.) ' Toblo 11.9. Resultados seleccionadas paro lo escala de actitudes acerco de la liberoción de
la mujer·
Actitudes hocio lo liberación de lo mujer
Leo codo enunciado, y después hago un circulo en el símbolo que represente mejor su reacción ;;- Se ubican por
ese enunciado, de acuerdo con lo escalo siguiente: ,Porcentaje arriba de la
Puntuación Percentil de grupo mediano
AA: completamente de acuerdo
o: tendencia a estor de acuerdo
?: indeciso; ni de acuerdo ni en desacuerdo 75 90 Mujeres 61%
, ' .
d: tendencia o estor en desacuerdo Hombres 29
! i:
DO: completamente en desacuerdo 68 75
.',.,.'
}::

61 50
Arribo de 30 años
Debajo de 30 años
41
57

~.?d DO 12. Codo mujer debería tener su carrero independiente si osi lo deseo 51 25
Solteros 55
AA o? d DO 13. En cuanto 01 sexo, debería haber un solo patrón de conducto 40 10 Otros 46
poro el hombre y poro lo mujer
AA o?d ® 14. Los trabajadoras que participan en el movimiento de lo
liberación de lo mujer son cosos de mujeres frustrados
Católicos
Otros
39
57

® o?d DD 15. Excepto por lo fuerza física, cualquier cosa que pueda hacer un • (onfiabilidad (de dividido en mitades): 0.89.
hombre puede hocerlo igual de bien uno mujer

:;: 1
1,
AA o?d ® 16. El movimiento de liberación de lo mujer es de interés sólo poro
unas cuantos mujeres que están 01 borde de lo locura Formatos alternativos
.:"n,1
, .
AA o? d ® 17. No tiene ningún sentido hacer grondes inversiones en lo
educoción de lo mujer, porque lo mós probable es que se cose
Las medidas de actitud algunas veces tienen otros formatos. Un cambio
simple sería presentar un conjunto de enunciados como los mostrados más
.; . ) no practique este entrenamiento avanzado algunos enunciados neutrales y pedir al entrevistado que marque todos los
"
'\
AA o?d ® 18. Por naturaleza, lo mujer es sumiso, mientras que el hombre es
dominante
enunciados con los que esté de acuerdo o un número específico de enuncia-
dos que me;or representen su punto de vista. Con este formato es importante
determinar con exactitud los valores de la escala para cada enunciado, ya que
AA o?d ® 19. El papel naturol de lo mujer es secundario y sólo de apoyo la calificación que recibe el individuo es el promedio de los valores de la escala
de los enunciados que la persona escogió.
®o?d DO 20. En todos aspectos, el hombre y lo mujer deberían recibir el Un enfoque ligeramente distinto consiste en seleccionar un conjunto más
mismo troto corto de enunciados que sean homogéneos en contenido, diferenciándose
sólo en el grado de alguna actitud específica. Un ejemplo relativo a la acepta-
bilidad del aborto podría tomar la forma que se indica a continuación:

Una muestra de los resultados obtenidos de la administración de la escala al El aborto debería ser legal para la mujer qUt; así lo desea.
a 133 estudiantes en clases de medición se presenta en la tabla 11.9. La esca- b) El aborto debería ser legal si el doctor así lo Tecomienda.
la revela una confiabilidad bastante satisfactoria. En general dichos estudian-
el El aborto debería ser legal cuando el embaraio es resultado de una violación o
de un incesto.
tes tienden a escoger enunciados favorables para los derechds de la mujer, y la dI El aborto debería ser legal cuando la salud o el bienestar de la madre está en
posición más fuertemente favorable (por encima de la mediana) apareció más peligro.
a menudo entre las mujeres, los estudiantes menores de 30 años de edad, los el El aborto debería ser legal cuando la vida de la madre está en peligro.
solteros y los no católicos. fIEl aborto no debería ser legal bajo ciertas circunstancias.

.. ...
428 CAP. 11. INVENTARIOS DE AUTOAP REC/AC /ÓN
RESUMEN Y EVALUACIÓN 429
Estos seis enunci ados presum ibleme nte represe ntan un gradien te de
pero
misividad. Una person a que esté de acuerdo con el enunciado a) probabl de las líneas anteriores, y se pide al entrevi stado que indique median
e. te una
mente estará de acuerd o con los enuncia dos del b) al eL y una que marca en el pu~to apropiado de la escala entre ambos adjetivos cómo
esté de le parece
acuerd o con el bl pero no con el al podría estar de acuerdo con los ya s~ el obJe~Ivo o. ~a person~ que se evalúa. Por ejemplo, si el entrevi
enuncia· stado
dos del e) al e) (si los enunci ados están en el orden correct o). Por tanto, conSIdera la hberaclOn femem na como muy buena, pondrá la marca
la posi· cerca de
ción de la persona en este continu o podría definirse por el enuncia do la palabra bueno¡ si la liberación femeni na se percibe como ni buena
más alto ni mala
que se aceptó. Una escala de este tipo tiene ciertas ventaja s lógicas en pondría una marca a la mitad de bueno y malo, etc.
cuanto a
que el mismo valor de la escala siempr e significa el mismo enunci ado
acepta· El diferencial semántico propor ciona una forma fácil y rápida de reunir'
do, pero este tipo de escala (llamada escala Guttma n, por el nombre impr~siones en uno o en varios objetivos¡ sin embarg o,
del el conjun to de pares de
logo que la promov ió) está limitad a a dominios de actitud es bastant e psicó· adjeuvos suelen ser cuestionables para un concep to objetivo, así como
específi· pue-
cos y homogéneos. den produc ir demasiada imagin ación de una person a para responder.
Se sos-
pecha que a menud o las respuestas pueden ser más bien superficiales y
sólo en
un nivel verbal.
Difere ncial semán tico Una limitac ión de todos los proced imiento s de evaluac ión de actitude
que hemos descrito es que implica n sólo una respuesta verbal· comun s
Otro enfoqu e de las medidas de actitud merece mencionarse: el llamado lo que la person a tiene la volunt ad de decir acerca de lo que ¿ree ican
diferencial semánt ico, que se desarro lló como consec uencia de los estudios o siente.
Puede ser que el ~ntrevistado no esté prepara do para mostra rse sincero
realizados por Osgoo d y otros autores acerca de la estruct ura del domini
o del completo y ser totalme nte veraz con el entrevi stador. Más import ante por
significado en los adjetivos. Con base en los estudio s de factores analític que
os, todo e~to quizá. se~ que las acciones de una person a no corresp ondan
Osgood , Suci y Tanneb aum (1957) reporta ron que la mayoría de la variació creenCIaS y sentlmI entos verbalm ente elegidos. Un niño que se suscrib sus a
n
en el significado que está expresada por los diferen tes adjetivos podría
repre· balmente a un enuncia do de buena volunta d hacia los miemb ros de e ver-
uno
sentars e por tres dimens iones principales: evalua tivo, potencia y activida
d. otro ~po étnico, puede evitar a ese grupo cuando seleccione a sus compañ u
Los pares de objetivos que represe ntan a cada una de estas dimensiones
princi· ros de Juegos o a las personas que quiere invitar a su fiesta de cumple e-
pales se muestr an a continu ación: años.
' De~e recono cerse que !os enunci ados de actitud es son
sólo eso, aunque puede
ser mteresa nte determ mar que después de un curso universitario particu
Evaluativo un program a de televisión particu lar un estudia nte haya cambia do sus lar o
actitu-
des, pero esto no implica que tambié n hayan cambia do otros aspecto
bueno malo s de su
agradable - - - - - - - - - - - - desagradable conducta. En los estudios se han examin ado varios indicadores más
directa-
justo ----- ----- ----- ---- injusto mente con~uctuales ~e las acti.tudes (Webb y colaboradores, 19861. Por
plo, las aCtltudes haCIa la bebIda han sido examin adas median te la ejem-
observa-
Potencia ción de una variedad de botella s de bebidas alcohólicas en los botes
basura¡ una medida funcional de actitud es hacia la ecología puede tenerse de la
fuerte - - - - - -- ----- ----- --- débil cuenta a partir de la observación de las botellas encontr adas a lo largo en
capaz ----- ----- ----- ----- incapaz banqueta en una vía pública . de la
. '
dominante ---- ---- ---- --- sumiso
Actividad RESU MEN Y EVAL UACI ÓN
enérgico - - - - - - - - - - - - - - - perezoso . En este capítul o hemos conside rado los inventa rios de autorre porte como
ocupado ----- ----- ----- -- ocioso mst~mentos para estudiar la personalidad. Un inventa rio de este tipo es
. ~.:
activo pasivo esenCIalmente una entrevista estánda r con un conjun to de pregun tas
presentan en forma escrita. que se
Un conjun to de adjetivos como los anterio res pueden emplea rse El reporte del individuo acerca de sí mismo tiene una ventaja sobresa
obtene r la percepción de una person a de cualqui er objetivo. El objetiv para te, ~u~ ~roporciona una vista Ddesde adentro ", basada en toda la experielien-
o
ser un concepto general del tipo de la liberación femeni na o el aborto,puede del mdIvIduo y en .u~ conoci miento acerca de sí mismo¡ sin embarg
ncia
una persona específica (como un maestro o uno mismo) . Norma lmente o ser o, los
, el autorreportes son hmItados, porque el individuo:
orden de los adjetivos está resuelt o y los sinónim os y antónim os de
algunos
pares se ponen al revés en la página, con el fin de reducir la respuesta a) T~ene habilidad para leer las pregun tas con compre nsión.
estereo·
tipada sin pensar. Se present a una escala de siete puntos , como en el b) TIe?e? no capaCIdad de autodis cemim iento y de autoco mprens
ejemplo ión.
el Esta dIspuesto o no a revelarse a sí mismo de manera franca.

~ .. . .
430 CAP. 11. INVENTARIOS DE AUTOAPRECIAClÚN LECTURAS ADICIONALES 431

Un tipo de cuestionario que ha demostrado ser muy útil para la selección d.e !nteres~s ocupacionale.s Kude~ sl.l:e!en mostr~r muy bajas correlaciones entre
y la colaboración es el cuestionario de datos biográficos, en el que la persona s~. zPor que pasa esto?, icual es el sIgmflcado teónco? icuál es el significado prác-
~~ ,
proporciona una información factual acerca de su historia pasada. Una clave
de calificación diseñada para un empleo particular ha sido un instrumento 5. En la tabla 11.6 se muest~an las co.rrelaciones entre las puntuaciones de habilidad
de ~a GATB '! las puntuaCIOnes de In.tereses del registro de preferencias Kuder. i A
útil que tiene validez de utilidad en varios casos diferentes. que concluslOne~ llega usted despues ~~ analizar est~ ~abla?, iqué significado tie-
Los inventarios de intereses dan descripci<]nes confiables de los patrones . nen sus c~mc1uslOnes p~ra la onentaclon y la seleccIOn vocacionaH
=.: 1
de intereses. Estos patrones persisten con gran estabilidad, por lo menos has- 6. ~a mayona de 1.05 estudIO~ con ci~iles han fracasado en encontrar inventarios de
ta la adolescencia tardía, y son factores significativos de la planeación vo- Intereses o de ajuste emOCIOnal efIcaces en la selección del personal. 'Cuáles son
cacional. . las razones para esto? z
La validez de los inventarios de ajuste emocional y del temperamento es 7. Com~~re las ventajas y ~as desv:entajas q~.e para la admisión académica o para la
más susceptible al cuestionamiento. Todos los tipos de inventarios pueden seleccIOn del personal tlene la mformacIOn obtenida de:
distorsionarse hasta cierta medida si el individuo tiene alguna motivación
para distorsionar sus respuestas. Por tanto, la integridad de las respuestas al Una entrevista.
bl Una forma de historia personal.
depende mucho de la motivación de la persona examinada, y esta motivación,
. el Un inventario autodescriptivo.
a su vez, depende del ambiente y del propósito en el que se usa el inventario.
En la escuela, en la industria y en la milicia se emplean los inventarios de ajus- 8. iQué significa el térrn~no eoniu!lto de respuestas?, zcuáles son algunos conjuntos
te emocional, pero se sospecha que las motivaciones pueden favorecer a me· de respuestas potencIalmente Importantes?, zcómo pueden influir los conjun-
nudo la distorsión de las respuestas. En cualquier evento, los inventarios de tos de re.spuestas en la interpretación de los resultados de los inventarios de la
este tipo no han tenido de manera general una alta validez, por lo cual deben personalIdad?
usarse con mucho cuidado. 9. zQué ta~ serio es e~ problema de la invasión de la privada con las medidas de la
" ,\. \ Los cuestionarios de actitudes se han diseñado para calificar la intensidad personah~ad?, ique usos de tales medidas son aceptables?, iqué controles de su
¡í
:i ; de las reacciones favorables o desfavorables hacia algún grupo, institución o uso ?eben~~ hacerse?, icómo y por quién?
: :·t concepto. Aunque éstas representan sólo expresiones verbales de actitudes, 10. ¿Que condiclOnes debe satisfacer un inventario de autorreporte si va a llenar de
· ···1 man~ra adecua~a para que proporcione resultados significativos?
son bastante útiles como instrumentos de la investigación. 11. iQue tanta .,:onfIanza podemos tener en los inventarios de la personalidad aplica-
dos ~ l<?s mno.s d: la escuela elementaH, ¿qué factores limitan su valor?
12. iQ~e dIfere~cIas Importantes nota usted entre la encuesta del temperamento
PREGUNTAS Y EJERCICIOS GUllford-Zlmmerman yel inventario multifásico de personalidad de Minneso-
tal, ¡para qué circunstancias sería cada uno de ellos más adecuado?
13. iQu~ tipos de distorsipn de la iI?age~ ~e una pers0!la son las escalas de control (L,
1 l. iOué tanto debe estructurar por adelantado una entrevista el entrevistador?, ¡qué
ventajas y desventajas ' tiene dicha estructuraéión? K, PI . del MMPI ~ue Intentan Identificar o corregIr?, ¡cómo podrían otras perso-
·'. 1· 2. Escriba dos o tres preguntas que pudieran usarse como parte de un cuestionario de nas adaptar estas Ideas de escalas de control a las calificaciones?
d
datos biográficos para seleccionar a vendedores caseros de cosméticos. Indique sus 14. zQué fa~tores limita? la utilidad de las escalas de actitudes de papel y lápiz?, ¡qué
razones para cada pregunta. iCómo decidiría qué preguntas conservar en la forma otros metodos podna usar un maestro para evaluar las actitudes?
final del cuestionario? ' 15. Ela~ore un esquema sin detal~ar de una escala breve de actitudes para medir las
3. Considere los siguientes inventarios de intereses: al inventario de intereses aCtltudes de los maestros haCIa las pruebas objetivas.
Strong-Campbell,-bl registro de preferencias Kuder, vocacional, cl encuesta de
intereses ocupacionales Kuder y dI inventario de intereses vocacionales
de Minnesota. iCuál o cuáles recomendaría usted para cada uno de los usos si- LECTURAS ADICIONALES
guientes? Dé sus razónes para su selección.
al Un estudjante de grados intermedios en la universidad solicita asesoría acerca Borgen, F. H. y Harper, G. T., "Predictive validity of measured vocational interests
de la selección del área principal de estudio y de sus planes vocacionales. with black and white college men', en Meassurement and Evaluation in Gui-
bl Se ha establecido un programa de asesoría para los estudiantes que ingresan en .' dance, 6, 1973, págs. 19-27.
una secundaria vocacional que tiene varios programas con técnicas diferentes.
Campbell, D. p". Ha~dbook for the Strong-Campbell Vocational 1nterest Blank
el Se necesita un inventario para utilizarlo en un curso de décimo grado para ~tanford l!mveTSlty Press, .S~anfor~, Calif?mi~, 1971. . '
explorar la selección de carreras y el proceso de selección ocupacional. . CascIo, W. F., Accuracy of venfIable bIOgraphIcal mformatJon blank responses" en
dI Un servicio de asesoría para adultos necesita un inventario para aplicarlo a Toumal of Applied PSychology, 60, 1975, págs. 76;-769. '
graduados universitarios_ . Ceg~lka, P. T., Omvig, C. y Larimne, D. L., "Effects of aptitude and sex on vocational
4. Se ha encontrado que las escalas para las mismas ocupaciones o para ocupaciones ~t~~ests', en Measurement and Evaluatiou in Guidance, 7, 1974, págs. 106-
muy similares en el inventario de intereses vocacionales Strong yen la encuesto

.,J."" .. ':":. : < •.


432 CAP. 11. INVENTARIOS DE AUTOAPRECIAClÓN

G ldb L R. 1/ A historieal su~ey of personality seales and inventori.es", en MeRey-


o eíj' ¡, (dir) Advances in psychological Assessment, vol. 2, Sclence and Beha-
~~r ~o¿ks P~lo Alto, California, 1971, págs. 293-336.
' l/Sexual bias in interest
, measurement", en Measurement and Evalua-
H armon, L. W.,
!ion in Guidance, S, 1973, pags. 469-501. . f· .
, H G III Schwab D P "Interviewer validity as a funcnon o mtervlew
Heneman, .. y , . ., . d n " 1 01 Appl" d
structure, biographieal data, and intervlewee or er , en ourna le
Psyhology 60 1975, págs. 748-753.
" -'. "M
tory to estimate college acade~üc achlevement , en easuremen
. . .
, D A p' l' E E YWells R A uApplieation of a blOgraphlcal.data mven-
Payne, . ., ap ey, . . t and Evalu
a-
12
l ..
tion in Guidance, 6, 1973, pags. 152-156. 1.. . .
"
· D J C 1 N S Sex-role socia1ization and employment rea ltles.lmpll-
Pred1ger, . ., y o e, .., ACT R h R rt No 68 10
cations for vacationaI interest measures, . eseare epo ., e
American College Testing Program, Iowa Clty, Iowa, enero, ~9!5.
·
Pred1ger, D..J y H a nns Gary
o , .R, "The distinction between
dI sex restnctlveness
· . G'd and sex7
El individuo evaluado
bias in interest inventories', en Measurement an Eva uatlOn m Ul ance, ,
,1974, págs. 96-104. . .. . d'· .1 r por otros
Schmitt, N., "Social and situational determmants of mtervlew eelSSlons. mp l,ca-
tions for the empIoyment interview", en Personne1 PsychoIogy, 29, 1976, pags.
?9h-1L°1.
UI tne, . y T rumb o D., "The selection interview since 1949", en PsychologicaI
BuIletin 63 1965, págs. 100-116. "
Wh etstone, R., D'. Y H ay les, V. R., "The SVIB1975'
and black College men , en Measure-
105 109
ment and Eva1uation in Guidal!ce, 8, .' l?ags. . . ,. "".
W' . J S Personality and prediction: Prmclples 01 personallty asse~~melJ!, En el capítulo anterior consideramos la infonnación acerca de la perso-
1991ns, . ., . 1973 ' 656 nalidad, que es recolectada mediante inventarios en los cuales el individuo
Addison Wesley, Readmg, Mass, , pago .
t
Z yows k· D G "Predictive validity of the Kuder Preference Record, Form B, over a se describe a sí mismo. Una segunda forma en que la personalidad de un
1, • • , dE
25.year span", en Measurement an va uatIon In 1 . . GUl·dnce
a " 7 1974, págs. individuo puede evaluarse es por medio de las impresiones que otros tienen
122-129. . U . de él. Segundas personas sirven como evaluadores de las reacciones de la pri-
Zytowski, D. G. (dir.), Contemp?rary apfroac.hes to lnterest measurement, ruver· mera persona. ¿Qué tanto le gusta A a B?, ¿considera B a A una persona grata
sity of Minnesota Press, Mmneapohs, Mmn., 1973. para tenerla a su alrededor?, ¿lo considera como un trabajador efectivo o
problemático?, ¿considera B aA una persona consciente?, ¿confiable?, ¿emo-
cionalmente estable? Preguntas de esta clase las hacen continuamente los
maestros, supervisores, reclutores de personal, ministros o los amigos.
Debemos ahora averiguar la manera de contestar exitosamente tales pregun-
tas y qué precauciones debemos tener para obtener respuestas útiles_

CARTAS DE RECOMENDACIÓN
La manera más rápida de obtener una impresión de la persona A mediante
el punto de vista de la persona B es invitar a B a escribir algo acerca de A. Tal
información podría ser obtenida en cualquier ambiente; sin embargo, la ma-
yoría de las veces ocurre cuando A es aspirante a un determinado puesto o
,función, por ejemplo, ser admitido en una escuela, obtener una beca, un tra-
bajo, ser miembro de un club, ser acreditado como agente de seguridad. En
este caso, la persona A recurre a una institución, a una agencia de colocación o
emplea el nombre de gente que lo conoce bien o que conoce su capacidad par-
ticular, y entonces la agencia obtiene juicios acerca de A por medio de B y e
que 10 conocen.

433

.. 0;: ;
434 CAP. 12. EL INDIVIDUO EVALUADO POR OTROS ESCALAS DE CALIFICACIÓN 435

¿Qué tan útil e informativo es el material que se proporciona de manera Aparentemente, la validez de las inferencias derivadas de una carta de
libre y que consiste en una descripción no estructural de otra persona? En recomendación depende del grado en que el que la recibe ha aprendido a '/leer
realidad, a pesar del vasto número de recomendaciones escritas cada año, se entre líneas", sopesando las cosas agradables que parecen ser un l/factor de dis-
conoce muy poco acerca de la naturaleza sólida y factual de su adecuación o criminación" apropiado que identifique las cosas relevantes al trabajo o las
efectividad con que cumplen su función; las opiniones acerca de su valor virtudes tangenciales mencionadas.
varían ampliamente. Algunos críticos sostienen que las cartas de recomen- La extensión en que una carta de recomendación proporciona una apre-
dación tienden a perpetuar e inclusive fomentar la inclusión de considera- ciación válida de un individuo y en que diagnostica de manera exacta sus
ciones irrelevantes en la apreciación de los aspirantes. Así, Lewis (1972) capacidades, virtudes y debilidades, es casi desconocida; sin embargo, no
señala en relación con las facultades de los estudiantes para la química: l/Fac- podemos pedir demasiado. La mayoría de las limitaciones que ya hemos dis-
tores no académicos tales como las habilidades individuales en las relaciones cutido en relación con las escalas de calificación más estructurada, se aplican
interpersonales tienen la misma importancia como una parte de la evalua- por lo menos con igual fuerza a las cartas de recomendación. Además en
ción académica que es la diligencia. Aquellos que son amigables, dóciles y de estas últimas el interesado está libre de interpretarlas de acuerdo con lo que
mentes inquietas reciben aprobación especial". Sin embargo, los estudios le dicte su fantasía, de manera que no hay un núcleo de contenido común
factuales de la confiabilidad y la validez de la información obtenida de una para las diferentes cartas acerca de una misma persona o de las cartas igua-
carta de recomendación o de la extensión en que las recomendaciones influ- les para las diferentes personas. De esta manera, una carta puede tratar del
yen las acciones tomadas con respecto a un aspirante, son fragmentarias en encanto social de A; una segunda de la integridad de B; y una tercera de la
extremo. originalidad de C.
En un análisis (Siskind, 1966) de 67 cartas escritas por 33 aspirantes a ser No obstante, como acabamos de considerar, el usuario de las cartas de
residentes de psicología se obtuvieron 958 juicios distribuidos en la siguiente recomendaciones puede diseñar un esquema de ponderaciones interno de co-
forma: mentarios de clases diferentes; este tipo de esquema no es muy preciso ni muy
estable, ni tampoco uniforme de lector a lector. Cabe añadir que el aspirante
suele tener libertad para seleccionar a las personas que escribirán acerca de él y
l. Juicios positivos 838 (87%) puede esperarse que seleccione a aquellos que 10 apoyarán y quienes 10 reco-
2. Juicios de "no conocer" acerco de uno característico 17 (2%) miendan pueden diferir en su tendencia a usar superlativos, y que el prospecto
3. Juicios referidos o desventajos, como resuhado de lo no sea el más idóneo.
inexperiencia y de lo juventud 44 (5%) Son necesarias investigaciones posteriores acerca de la validez de las des-
4. Otros juicios indicativos de desventajas S9 (6%) cripciones libres de una persona por sus contemporáneos. Mientras tan-
. to, las recomendaciones se seguirán escribiendo y, tal vez, usando. Ahora
debemos centrar nuestra atención en procedimientos de evaluación más
estructurados.
Siskind sugiere que las cartas escritas u quieren ver ángeles n entre sus estu-
diantes o bien" sólo quieren escribir acerca de ángeles". En cualquier evento es
fácil observar que la preponderancia de enunciados positivos hace difícil el ESCALAS DE CALIFICACIÓN
uso adecuado de las cartas de recomendación.
Existen evidencias de que los lectores que usan tales cartas concuerdan ' Sin duda, la subjetividad extrema de los enunciados no estructurados
bastante bien en juzgar qué tan positivas son y existe un grado moderado de adecuadamente, la falta de un núcleo común de contenido o el estándar de
consistencia (r = 0.40) entre las diferentes cartas escritas acerca de una per- referencia de una persona a otra y la extraordinaria dificultad para cuantificar
sona. Una evidencia de esto proviene de un estudio (Peres y Garcia, 1962) de los materiales, fueron las causas de que se diseñaran múltiples escalas de cali-
adjetivos usados en un conjunto de cartas de recomendación escritas en apo- ficación. Los procedimientos de calificación intentan resolver estas deficien-
yo a aspirantes para trabajos de ingeniería. De 170 diferentes adjetivos cias; es decir, intentan obtener apreciaciones acerca de un conjunto común de
extraídos de las cartas, casi todos fueron positivos; pero cuando se aplicaron atributos para todos los calificados y tener estas calificaciones expresadas en
como calificativos de ·mejor" y "peor· para los empleados, los adjetivos di- una escala cuantitativa común.
firieron enormemente en el grado en que diferenciaban estos grupos. Así, un Todos nosotros hemos tenido experiencia con las calificaciones, ya sea en
aspirante podría ser calificado como" de fácil trato·, "cooperativo" y "abi~r­ hacerlas o en ser calificados o, más probablemente, en ambas cuestiones. Las
to", o bien "ingenioso·, "informado" y "productivo". Los primeros tr~s adJe- escalas de calificación aparecen en una gran proporción de boletas de infor-
tivos fueron aplicados casi con igual frecuencia a los trabajadores mejores o mes escolares, más claramente en la parte no académica. De esta manera, so-
l' peores, mientras que los últimos tres diferenciaron bastante entre estos dos lemos encontrar una sección más o menos como la que aparece en el cuadro
grupos. de la página 436.

. ¡ \

.! , !
\ '
¡¡,,~l~t .: >.,
';::.-: ':, " . ': ;', ,. : ";' '.
436 ESCALAS DE CALlFICÁClÓN 437

" . .. de evaluación de personal de la gerencia. 1 El primero es uno de una


'..' serie de calificaciones de rasgos. Esta parte del instrumento requiere califica-
Primer Segundo Tercer Cuarto ciones de las características siguientes: saber cómo hacer el trabajo, juicio,
periodo periodo periodo periodo liderazgo, habilidad para planear y organizar, habilidad para la comunicación,
. iniciativa, ser dependiente y relaciones humanas. Para el rasgo de liderazgo, el
Esfuerzo califícador es instruido como se muestra a continuación. La escala de califica-
Conduda ciones reales sigue estas instrucciones.
Ciudadanía
Cooperaci6n
Ajuste personal Liderazgo

s = solisfartorio Considere su habilidad poro inspirar confianza. ¿Qué tonto respeto pide él como individuo, no sólo por su
H= superior I = insolisfu<lorio
posición?, ¿lo buscan los personas poro que tome decisiones?, ¿le do miedo afrontar lo responsabilidad por
lo que él cree?, ¿trabajo en equipo?

Muchas agencias de servicios civiles y de firmas industriales mandan for- Falto por completo. Troto de conducir con Es buen líder. los Es un líder excepcional.
¡: ' mas de calificación a las personas en una lista para pedir referencias de los soli- Es definitivamente cierto éxito, pero personas esperon poro Capaz de hacerse cargo
citantes a un trabajo, en la cual se piden evaluaciones acerca de la iniciativa,Ja un seguidor de sus nunca ha logrado uno oír lo que tiene que de uno situación y
originalidad, el entusiasmo o la habilidad para llevarse bien con los demás. iguales. No. troto de posición importante. decir. Es respetado organizarlo hasta ponerlo
Estas mismas compañías o agencias a menudo requieren supervisores Con convencer o los Es pasivo 01 dirigir o por sus colegas. los en formo. los personas
experiencia para valorar las calificaciones de sus empleados, con base en una demás de que su sus subordinados demás le preguntan parecen estor contentos
escala de calificación que incluye los adjetivos "superiores", "excelentes" formo de hacer los su opinión cuando von o su lodo. Es
"muy buenos", "buenos", l/satisfactorios" o l/insatisfactorios", en una varie~ cosos es lo mejor respetado por sus
'o, ,1 dad de características. Las universidades, las escuelas de medicina, los pro- subordinados y sus colegas
(.'¡ gramas de becas y otras agencias requieren calificaciones como parte de su
procedimiento de selección. Más allá de estos usos operativos prácticos, las
calificaciones se han tomado en cuenta en muchos proyectos de investiga-
if,¡I.', ción. A pesar de todo, grandes números de calificaciones se dan y se toman, a También se requiere un resumen de calificación, el cual adquiere la
menudo de manera renuente, en Estados Unidos cada semana y cada mes. siguiente forma:
'l' Calificar a otras personas es una operación a gran escala.
:¡~ ¡
;
,.
,'1
Las escalas suelen ser retrospectivas y resumen las impresiones que ha
tenido el calificador a lo largo de mucho tiempo de contacto con el calificado¡
algunas veces, son concurrentes y surgen de una· entrevista o un periodo de Por favor pongo uno morco en lo escalo que mejor muestro lo calificación total de este
observación. Casi universalmente, una calificación implica un resumen eva- hombre en su posición actual.
luativo de experiencias pasadas y presentes en el que la "computadora: inter-
na" del calificador procesa los datos de entrada de manera compleja e inespecí-
fica para llegar al juicio final. Por contraste, en los procedimientos
observacionales sistemáticos (que se considerarán en el capítulo siguiente!
el observador trata de funcionar solamente como un registrador exacto y deja
la síntesis y la interpretación de las observaciones obtenidas como un proceso No satisface los Regular, pero Satisfactorio Hoce un buen Hoce un
aparte. requisitos necesito mejorar trabajo trabajo
El patrón más comÚn de procedimiento de calific~ción presenta al califi- excelente
cador una serie de nombres de características, quizás bien definidas, y un
rango de números, adjetivos o descripciones que tienen que representar los
niveles o los grados de posesión de las características. Para calificar a una o
más personas sobre el rasgo o los rasgos, se les asigna un numero, una letra, un
adjetivo o la descripción que se considera inás adecuada. A continuación se 1 Éstos estuvieron disponibles mediante la cortesía del Personnel Department oE Mack
presentan dos ejemplos de escalas de calificación, que se tomaron de un pro- Trucks, Inc.
438 CAP. 12. El INDIVIDUO EVALUADO POR OTROS PROBLEMAS PARA OBTENER CALIFICACIONES 439

Estos son sólo ejemplos de una amplia gama de instrumentos de califica- .ficados por perio?~s aJ?~eriores a las calificaciones oficiales y que marcaran
ción. Ahora reexaminaremos algunas de las variaciones principales de los en la forma de cahftcacIOn los casos observados de los actos deseables e inde-
patrones de calificación, aunque por el momento sólo ·consideraremos algu- seables den~ro de cada categoría conductual descrita en la escala.
nos de los problemas que surgen cuando se trata de tener a un grupo de jueces . ~n t~ona e.sto resultaba admirable, porque vinculaba estrechamente las
para realizar las apreciaciones. cahfIca~lOnes fI~ales con las observaciones sistemáticas de las acciones de los
subordmados¡ sm embargo, después de uno o dos años de usar esta forma se
tuVO que descartar debido a su complejidad y porque los calificadores no esta-
PROBLEMAS pARA OBTENER ban dispuestos a ?edicar el ~ie~po y el trabajo que se hubieran requerido para
CALIFICACIONES VÁLIDAS ma?~en~r los regIstros prelimmares observacionales en los que se basaban las
cahfIcacIOnes.
El problema para obtener apreciaciones exactas y válidas de un individuo Se sospecha que, hasta cierto grado, la meticulosidad para realizar la cali-
por medio de sus calificaciones es de dos tipos principales: primero, existen ficación es. ~n f~~tor que. contribuye a disminuir la eficacia en muchos progra-
factores que limitan la disponibilidad del calificador para hacer una califica- mas de ca!I~Ica~lOn. PartIcularmente si el número de alumnos o de empleados
ción honesta y concienzuda de acuerdo con las instrucciones que recibe y, que se cah~Icaran es grande,. ~a tarea de preparar calificaciones periódicas pue-
segundo, hay factores que limitan la habilidad para calificar consistente y de convertlIse en una cuestlOn compleja. A menos que los calificadores estén
correctamente, aun con las mejores intenciones. A continuación considerare- verdaderamente uvendidos" a la idea de la importancia de las calificaciones
los jueces tend!~n muchas. pr,?babilidades de apresurarse y hacer las cosas d~
mos estos problemas. manera superfIcIal (es declI, a vuelo de pluma") para determinar las tareas
1· ,'. más que preocuparse por emitir juicios analíticos precisos. '
Factores que afectan la disponibilidad
del calificador para calificar concienzudamente Identificación con las personas
En general, al recoger las calificaciones se asume que cada calificador trata que se califican .
de hacerlo lo mejor posible de acuerdo con las instrucciones que se le han
dado y que sus incapacidades en las calificaciones se deben a la falla e inepti- , L~s calificaciones a.v~ces s~n requeri~as'por alguna agencia impersonal y
tud humanas¡ sin embargo, esto no es necesariamente cierto. Por lo menos mas ~~en remota. La C1~Il. &:IVIce ~~~~IsslOn (Comisión del servicio civil),
hay dos circunstancias que pueden desajustar la integridad de una serie de la Mihtary ~ersonnel DIVISSIon (DIvIsIon del personal militar) de un cuartel
calificaciones: a) el calificador no está dispuesto a realizar todo el trabajo que re~oto, el dlIector de personal de una gran compañía o el personal adminis-
se requiere para el procedimiento de apreciación, y b) el calificador pueda tr~tlvo ce?tral de un sistema escolar, están lo bastante alejados del superior de
identificarse con la persona calificada en tal medida que no esté dispuesto a pnmera lmea, del comandante de escuadrón o del maestro del salón de clases.
hacer una calificación que pudiera disgustar a la persona calificada. Cada uno El calificador suele estar más cerca de las personas a las que califica los traba-
jadores de su oficina, los soldados de su escuadrón, los alumnos de su clase
de estos factores amerita un análisis. que una ~g.e,ncia que pretende calificarlos. Uno de los primeros principios d~
~ .
i.· la supeIVISlOn o del hderazgo es que "el buen oficial cuida a sus soldados". La
Indisponibilidad para realizar el moral de una organización depende de la convicción con que el líder cuida de
trabajo necesario sus miembros. Cuando las calificaciones indican "tomar cuidado" esto se
c~>nvierte en un pu~to de observación de si la propia gente se comporta tan
De hecho, las calificaciones son una molestia, pero las calificaciones cui- bIen, o un poco meJqr, que aquellos del grupo en competencia.
dadosas y detalladas son aún más molestas. En algunos procedimientos de . Lo anterior se relaciona con lo que sucede cuando el calificador está más
calificación se intenta pasar por alto las impresiones subjetivas y las reaccio- Interesado en "dar una oportunidad" a sus subordinados a los que califica y en
ver,qu~ obtenga~.por lo menos el mismo buen trato que los otros grupos que
nes superficiales mediante la inclusión de procedimientos elaborados y cier-
tas precauciones. Así, en un intento por mejorar la eficacia de los procedi- estan SIendo califIcados, más que en dar una información precisa a la agencia
mientosde calificación para los oficiales de la Fuerza Aérea (Preston, 1948) que usa las calificaciones. Esta situación empeora en muchas agencias oficia-
se consideró una forma elaborada que servía como combinación de registro les del gobierno mediante la política de hacer que las calificaciones sean públi-
observacional y como forma de calificación. Se describían 54 conductas crí- cas y ~or requerir que el calificador discuta con la persona calificada cualquier
ticas específicas que se relacionaban con la eficiencia del oficial. Se diseñaron matenal desfavorable en las calificaciones. Una situación más grave se produ-
escalas para describir los grados de excelenc~a en cada tipo de conducta. L~s ce ~~an~o se est~b~ecen medidas administrativas en las que se especifican las
instrucciones adjuntas requerían que los calificadores observaran a sus cab- calIfIcaCIOnes mIlllmas como requisitos para la promoción o para el incre-
440 CAP. 12. El INDIVIDUO EVALUADO POR OTROS PROBLEMAS PARA OBTENER CALIFICACIONES 441

mento del salario. Entonces, no sorprende que las calificaciones tiendan a :(!)i~,,; aJUlll,UV A o del B. El a~?mno A ha ten~d? que competir con el B, e, y D y así
subir o a apilarse en un solo punto de la escala. Existe una tendencia para la • con el 2, Y tambIen ha estado mas mteresado en la enseñanza que en la
calificación típica, en la cual se pretende que una gran proporción de las cali- . fonnulación de juicios.
ficaciones dadas sean éxcelentes. El término muy buenas casi se convierte ' ,__ La misma situación se presenta en un servicio civil o en un ambiente
en una expresión de insatisfacción, mientras que una medida de calificación .·· ilidustrial. El principal interés se centra en el trabajo hecho, y aunque en teoría
satisfactoria se reserva para alguien del que quisiéramos deshacemos a la '. \,:1 supervisor tiene n:ucho tiempo para observar a cada trabajador, en la prácti-
menor oportunidad posible. . ca por lo general esta ocupado con muchísimas otras cosas. Se puede conven-
Es importante señalar que un calificador no puede siempre trabajar COn cer a los supervisores de dedicar más tiempo o más de su energía a observar ya
todo el corazón a fin de dar calificaciones válidas para el beneficio de la agen- evaluar a las personas que trabajan con él, pero en realidad hay muchos lími-
cia que las usa, que hacer calificaciones casi siempre es una molestia para él y tes para que esto se pueda hacer realidad sin descuidar las otras funciones del
que a menudo está comprometido con sus propios subordinados mucho supervisor.
más que con la agencia externa. Un programa de calificaciones debe "ven- Afrontamos no sólo el punto de la oportunidad general para observar
derse" continuamente y debe establecerse una política que sea eficaz. Exis- sino también la oportunidad específica de observar un aspecto particular de l~
ten ciertos límites en la extensión en que incluso una campaña activa puede personalidad de un individuo. Cualquier persona ve a la otra sólo dentro de
sobreponerse a la inercia natural del calificador ya su interés por su pequeño . ciertos contextos limitados, en los que sólo determinados aspectos de la con-
grupo. ducta se pueden mostrar. El maestro ve al niño primordialmente en el salón de
:: .
¡, clases, el supervisor ve al obrero primordialmente en la línea de producción
etc. Podríamos cuestionamos si un maestro en un salón de clases totalment~
Factores que afectan la habilidad del convencional ha visto a un niño bajo circunstancias que le permitan formular
calificador para calificar con precisión juicios acerca de su "iniciativa" o su "originalidad". El instructor de la univer-
sidad que ha dado clases durante mucho tiempo por medio de conferencias
Aun cuando los calificadores estén presumiblemente motivados para rea- está muy difícilmente situado en una posición que le permita evaluar la "pre_
lizar su trabajo lo mejor posible a fin deeinitir juicios válidos, hay todavía senciaR del estudiante o su I.(habilidad para trabajar con individuos". El super-
numerosos factores que operan para limitar la validez de esos juicios. Estos visor de un empleado que hace un trabajo rutinario está situado muy pobre-
factores se centran en la falta de oportunidad para observar, en lo cubierto que mente para otorgar "juicios". Cada vez que se proponen calificaciones ya sea
pudiera estar un atributo, en la ambigüedad de la calidad que se debe observar, con propósitos de investigación o como una base para tomar accione~ admi-
en la falta de uniformidad de un estándar de referencia y en los sesgos específi- nis~~ativas, deb~ríamos p~eguntamos respecto a cada característica que se
cos y la idiosincrasia del calificador. cahfIca: ¿ha temdo el calIfIcador la oportunidad de observar a estas personas
en situaciones suficientes de varias clases para poder esperar que mostrarán
variaciones en esta característica, de manera que esperáramos que sus califica-
Oportunidad para observar a la ciones sean significativas? Si la respuesta es no, sería mejor abandonar las cali-
persona calificada ficaciones de la característica en cuestión.
En este caso vale la pe~a_señalar que las personas en diferentes papeles
1~ pueden ver aspectos muy dIstmtos de la persona que se califica. Los alumnos
; Un factor que casi siempre debe tenerse en cuenta como limitante de la
precisión de lqs procesos de calificación es la oportunidad festringida por par- v~n a su maestro des~e mi punto de vista muy diferente de lo que lo hace el
te del calificador para observar a la persona que califica. Así, a un maestro que dIrector. Los companeros de la escuela para aspirantes a oficiales tienen un
da clases en cuatro o cinco grupos de 30 alumnos cada uno y que ve a tantos punto de vist~ muy diferente de otros oficiales, en potencia, que los del ins-
alumnos solamente en un ambiente de salón de clases puede pedírsele que tructor de rutmas. Al obtener las calificaciones de algunos aspectos del indivi-
haga juicios acerca de la Niniciativa" o de la "flexibilidad" de estos alumnos. duo, siempre es apropiado preguntar quién ha tenido la mejor oportunidad
Un instructor de la universidad que ha enseñado a una clase de 100 estudian- para ver la conducta adecuada que se mostró. Normalmente esta fuente se
tes puede recibir formas de calificación de una agencia de empleos o de la ajustaría mejor a las calificaciones. '
administración de la universidad. en las que se le solicite que dé juicios simila-
res . En estos casos, el contacto eficaz con la persona que se calificará ha sido
probablem.e nte demasiado limitado para dar una base adecuada para el juicio Encubrimiento del rasgo que se califica
requerido. Ciertamente, el calificado ha estado físicamente en presencia del
calificador por muchas horas, quizá por varios cientos de horas, pero éstas ~i un extraño, es decir, alguien más que no sea la persona calificada, va a
han sido horas de estar siempre muy ocupado e interesado primordialmente conSIderar un rasgo, éste deberá tener cierto impacto en el mundo exterior.
¡: en otras cosas que en la observación y la formulación de juicios acerca del Parece tranquilo en reuniones sociales, tener una voz de conversación agrada-

¡:,'
;; i .
I
442 CAP. 12. El INDIVIDUO EVALUADO POR OTROS
PROBLEMAS PARA OBTENER CALIFICACIONES 443
ble y participar de manera activa en proyectos de grupos son características lidad. Aunque ciertamente hay algún núcleo de uniformidad en el significado
esencialmente sociables; aparecen en la interacción con otras personas y Son de cada uno de tales términos que será igual para todos los calificadores, tam-
directamente observables. Son aspectos abiertos de la persona a la que se Va. bién hay un mismo grado de incertidumbre acerca de la variabilidad en el sig-
lora. Por contraste, los atributos del tipo de sentimientos de inseguridad, nificado de un calificador a otro. En proporción, a medida que un término se
autosuficiencia, tensión o soledad son cuestiones personales íntimas; son hace abstracto, su significado se vuelve variable de persona a persona, y estas
aspectos privados de la personalidad que sólo pueden inferirse a partir de lo cualidades, como las que listamos anteriormente, son abstractas.
que la persona hace. Son los aspectos cubiertos del individuo. Entonces, la calificación que puede recibir cierto niño en cuanto a "ciuda-
Un atributo que está cubierto en gran medida sólo puede ser juzgado por danía" dependerá de lo que este término signifique para el calificador. Si para
un extraño con mucha dificultad. Los conflictos pequeños o internos o las d calificador A Hciudadanía" significa conformarse con las reglas de la escue-
tensiones se muestran superficialmente, pero cuando se muestran a menudo . la, calificará alto a cierto niño¡ pero si para B significa desempeñar un papel
es sólo de manera aparente. Así, una inseguridad profunda puede expresarse activo en los proyectos escolares, las calificaciones altas serán para un niño
como una agresión en cohtra de otros alumnos en un niño o como retirada a bastante distinto del primero. Un primer problema para obtener calificacio-
un mundo interno en otro niño. La inseguridad no es una dimensión simple nes congruentes es lograr consistencia de calificador a calificador en el signifi-
de conducta abierta sino un factor fundamental dinámico que puede hacerse cado de las cualidades que se calificarán.
evidente de distinta; maneras en cada persona o aun en la misma persona en
momentos diferentes. Sólo mediante un conocimiento detallado del indivi-
duo combinado con una buena cantidad de discernimiento psicológico, es Estándares de referencia uniformes
posible inferir de la conducta aparente la naturaleza de sus dinámicas cubier·
tas primordiales. Numerosas tarjetas de calificación requieren juicios de las personas que
Entonces los procedimientos de calificación serán relativamente insatis- son calificadas en algún conjunto de categorías, tales como:
factorios par~ los aspectos internos o cubiertos de un individuo. Las cuali-
dades que dependen de u¡}a comprensión minuciosa del individuo más las Sobresaliente, por encima del promedio, promedio, por debajo del promedio
inferencias de su conducta serán calificadas con una baja confiabilidad y poca o insatisfactorio.
validez. Las calificaciones pueden ser adecuadas para las cualidades que mues· Superior, bueno, regular o deficiente.
tran a un individuo abiertamente como una persona que interactúa con otras. Muy bueno, bueno, promedio, deficiente o muy deficiente.
La experiencia ha demostrado que tales cualidades pueden calificarse de ma- Sobresaliente, superior, mejor que satisfactorio, satisfactorio o insatisfac-
nera más confiable e incluso tener más validez. La validez se basa, en parte, en torio.
que estos aspectos ~ociales de la conducta tienen su significado y su definición Superior, excelente, muy bueno, satisfactorio o insatisfactorio. 2
primordialmente en los efectos que ejerce una persona sobre otra.
Sin embargo, ¿qué tan bueno es bueno? Una persona que recibe la califica-
ción de buena en "juicio", ¿está en la décima más alta del grupo con el que se le
Ambigüedad de significado de la compara?, ¿sólo en la cuarta parte de arriba?, ¿en la medida: de arriba?, ¿o sólo
dimensión que será calificada que no pertenece a la última décima de abajo?; ¿qué es el grupo con el que se
supone se le está comparando?, ¿son todas personas de su edad?, ¿todos
Muchas formas de calificación requieren calificaciones en una caracterís- empleados de la misma compañía?, ¿todas las personas en un trabajo en par-
tica amplia y abstracta. Así, en un cuadro anterior in~luimos, ~ntr~ otros atri- tículad, ¿todas las personas en el mismo tipo de trabajo con el mismo tiempo
butos, la ciudadanía y el a;uste, los cuales no son mas vagos nI mas generalc:s de experiencia? Si es este último caso, ¿cómo se supone que el calificador
que los incluidos en otras tarjetas de calificación; pero, ¿qué quere~os dec~ conoce el nivel de juicio típico para una persona en un trabajo particular con
con "ciudadanía" en el alumno de escuela elemental?, ¿por medIO de que un nivel de experiencia específico?
acciones se puede mostrar la "buena ciudadanía"?,. isignifica no escribir sobre El problema que plantean todas estas preguntas es el de la formación de
los muros? iO no escupir en el suelo?, iO no jalar el pelo a las niñas?, iO traer un estándar con el cual apreciar a cierto calificado. Las variaciones en la inter-
recortes de'periódicos a la clase?, ¿o unirse a la Liga Juv~nil de la,Cruz R~j~?, i? pretación de los términos y las etiquetas, en la definición de la población de
quedarse después de la clase a ayudar al maestro a lImpIar el.salon?, ¿que Slgru- referencia y en la experiencia con los miembros de esa población que sirve
fica? Probablemente no habría dos calificadores que entendIeran exactamente como comparación, contribuyen a la variabilidad de un calificadora otro en
lo mismo cuando califiquen a un grupo de alumnos en "ciudadanía". los estándares de calificación. Este fenómeno es conocido en las prácticas de
Consideremos los términos "iniciativa", "personalidad", "habilidad para
supervisa!", "flexibilidad mental", "influencia ejecutiva' o "adaptabilidad". 2 Un sistema de Calificaciones de Indonesia se reporta con diversas categorías, que traduci·
Éstos son ejemplos de algunas escalas de calificaciones que se usan en la actua- das serían: excelente, muy bien, bien, suficiente, promedio, abajo del promedio, menos, bastante
menos, mediocre, muy mal.

,, : ' ' . . ' ~', . ". ' • • • ~ ' ¡' .-• .' : . . . . . - •• .•..:. ; • ., ' . '. ' ,,' . " 1 " • o• • : ;
444 CAP. 12. El INDIVIDUO EVALUADO POR OTROS PROBLEMAS PARA OBTENER CALIFICACIONES 445

asignar grados académicos. Cada escuela que ha estudiado el problema ha (1966) encontró amplias diferencias entre los supervisores de empleados en
encontrado variaciones enormes entre los miembros de la facultad en los por- trabajos muy similares en los atributos que se consideraban importantes.
centajes que da A, B o e en los cursos comparables. Esto también sucede para Algunos calificadores estimaban "resolver problemas bajo la propia iniciati-
cualquier conjunto de categorías, números, letras o adjetivos que se usen. Los va" entre lo más importante que debía tener un subordinado y otros lo con-
estándares de interpretación son muy subjetivos y varían ampliamente de Un sideraban entre los atributos menos importantes. En la medida en que estas
calificador a otro. Lo que para una persona es "sobresaliente" para otra es diferencias de valores prevalezcan será inevitable que los supervisores no se
"satisfactorio" . pongan de acuerdo acerca de quiénes son los subordinados más eficientes.
Los calificadores difieren no sólo en el nivel de calificaciones que asignan,
sino también en cuánto se dispersan en sus propias calificaciones. Algunos
son conservadores y muy pocas veces califican muy alto o muy bajo, mientras El resultado de los factores como limitante
que otros tienden a irse justamente a estos extremos. Esta diferencia en la a hl eficacia de la calificación
variabilidad de las calificaciones también sirve para reducir la comparabilidad
de las calificaciones de calificador a calificador, y estas diferencias entre todos . iCuál es el resultado neto de los factores que afectan la disponibilidad del
1' ellos parecen ser un punto del que el azar obtiene ventaja y que debe servir- calificador para marcar concienzudamente y la habilidad para calificar con
nos para reflexionar acerca de nuestras propias características personales, así precisión? Los efectos muestran ciertas distorsiones persistentes y dañinas de
:' !
como de nuestra estructura de valores como calificadores. Así, en un estudio las calificaciones, que se aprecian en la baja confiabilidad y en la duda de la
(Klores, 1966) se encontró que los supervisores que daban importancia a las
:
,,;, relaciones personales del supervisor con sus subordinados otorgaban califi-
validez básica de los procedimientos de calificaciones.
caciones más aIras y menos variables que los supervisores que daban impor·
tancia a la estructura provista por la situación de trabajo. Error de generosidad
Ya hemos señalado que el calificador tiende a estar comprometido con las
Idiosincrasias especí¡icas del personas a las que califica, como lo está también hacia la agencia para la que se
calificador preparan las calificaciones. Independientemente de esto, parece haber una fal-
tade disponibilidad muy difundida por parte de los calificadores, por lo
Los calificadores difieren no sólo en su "dureza" o "suavidad" general, menos en Estados Unidos, para señalar a un compañero con una calificación
sino también en una serie de idiosincrasias específicas. Las experiencias de la baja. El resultado neto es que las calificaciones tienden a apilarse de manera
vida han hecho que tengamos una variedad de gustos y hábitos, así como general en el extremo alto de la escala de calificaciones. La filosofía que .no
interpretaciones individualizadas de las características de las personas. Se pue- comenta el calificador parece que es "una persona es tan buena como la que le
de desconfiar de cualquier persona que no mire a los ojos cuando habla; el sigue, si no es que un poco mejor", de manera que el término promedio se
vecino puede considerar homosexuales a todos los hombres, si su voz es de un convierte no en una práctica de la calificación en el punto medio de una serie
tono más alto que lo usual; el jefe puede considerar que un apretón de manos de calificaciones, sino que casi siempre es el escalón más bajo que se marca en
firme es garantía de un carácter fuerte, y el compañero de tenis puede estar un grupo; sucede como en la calificación comercial de las aceitunas, cuando
convencido de que las rubias son coquetas. Éstas son reacciones definitivas las. más pequeñitas reciben el nombre de "medianas" y van desde ahí hasta
que pueden estar explícitas y claramente verbalizadas por la persona en cues- "grandes", Uextragrandes", "gigantes" y "colosales".
tión. Pero hay muchos otros sesgos o prejuicios más vagos o menos tangibles Si el error de generosidad operara de modo uniforme para todos los cali-
que llevamos con nosotros y que influyen en las calificaciones que hacemos. licadores, no sería preocupante, sino que sólo deberíamos recordar que las
Estos sesgos nos ayudan a crear una idea de la persona y enfocar todos los calificaciones no podrían interpretarse en términos de sus membretes verba-
aspectos de nuestra reacción hacia ella, así como participan en nuestra califi- les y que promedio significaría "bajo", así como "muy bien" significaría pro-
cación. En algunos casos, nuestras calificaciones pueden estar afectadas en medio. Los constructores de las escalas de calificación han encontrado esta
uno o dos .rasgos, pero suele suceder que los prejuicios y sesgos forman un tendencia humana con algún éxito al existir varios pasos en su escala del
gusto o un disgusto por la persona, y que esta reacción generalizada trascien- lado más positivo que el promedio, de manera que hay espacio para realizar
da en todas' las calificaciones específicas. Por tanto, las calificaciones reflejan una diferenciación sin tener que ser desagradable y considerar a una persona
no sólo los estándares de calificación subjetivos del calificador, sino también como promedio.
sus prejuicios específicos respecto a la persona que se califica. La causa del problema es la diferencia entre los calificadores en el grado de
Un tipo diferente de idiosincrasia que probablemente influye en los jui- su "error de generosidad". Corregir este tipo de diferencias es más que un pro-
cios totales de eficacia en un trabajo (o en un programa educativo) es la idio- blema. A continuación examinaremos algunas técnicas especiales que se han
.sincrasia en cuanto a qué tipos de conducta son los deseables. ASÍ, Barrett diseñado para este propósito. .
[
:, !i
.¡ "o
.1i
446 447

Error de halo . Confiabilidad de las calificaciones


Las limitaciones en la experiencia con las personas que se califican, la falta En diversos estudios se ha demostrado repetidamente que la confiabilidad
de oportunidad para observar las cualidades específicas que deben tener para entre calificaciones de los procedimientos de calificación convencionales
llenar un instrumento de calificación y la influencia de los prejuicios persona_ eS baja. Symonds (1931) resumió varios estudios y concluyó que la correla-
les que afectan la empatía general por una p'ers~na, influyen en la producción ción entre las calificaciones dadas por dos calificadores independientes para
de otro tipo de error en las calificaciones. Esta es una tendencia a calificar en un tipo convencional de escala era de 0.55. Parece que no había ninguna
términos de una impresión general sin la diferenciación de los aspectos especí- razón para cambiar esta conclusión después de varios años. Cuando en las dos
ficos; es decir, permitir que la reacción total a una persona influya en el juicio calificaciones no había ningún prejuicio (es decir, cuando los calificadores no
'; ¡ para cada rasgo determinado. A este efecto se le ha dado el nombre dehaJo. . habían hablado con las personas calificadas) se empleó el tipo normal de califi-
En la siguiente tabla se muestra el efecto de halo, que incluye las califica- cación gráfica o numérica, la apreciación resultante mostró sólo esta consis-
ciones de los aspirantes a comandantes de aviones de la Segunda Guerra Mun- tencia muy limitada de calificador a calificador.
dial por sus instructores (Arrny Air Force, 1947). En la tabla se muestran las Si es posible acumular las calificaciones de varios calificadores indepen-
intercorrelaciones de cuatro distintas características de los estudiantes cuan- dientes que conocen igualmente bien a las personas calificadas, la confiabi-
do el instructor proporcionaba las calificaciones, en comparación con la Iidad de la apreciación podrá incrementarse sustancialmente. Los estudios
confiabilidad, cuando se calculaba por correlaciones de las calificaciones para han demostrado (Remmers y colaboradores, 1927) que los conjuntos de cali-
el mismo rasgo hechas por dos instructores diferentes. ficaciones funcionan de la misma manera que si se alargara la prueba, y que la
fórmula de Spearman-Brown (véase capítulo 3) puede aplicarse válidamente
para estimar la confiabilidad de las calificaciones independientes del conjun-
In/ercorreloc;ones Con{jobilidad
to. Así, si la confiabilidad de un calificador está representada por una correla-
ción de 0.55, tenemos los siguientes estimadores para la confiabilidad de las
en/re las
2 3 4 colificadores
calificaciones en conjuntos:
Dos calificadores 0.71
l. Afanoso 0.77 0.77 0.59 0.39 Tres calificadores 0.79
2. Previsión 0.86 0.62 0.61 Cinco calificadores 0.86
3. liderazgo 0.66 0.56 10 calificadores 0.92
4. Volor con instrumentos 0.32
Desafortunadamente, en muchas situaciones prácticas muy importantes
es imposible obtener califi~adores adicionales igualmente entrenados. Un
alumno de escuela elemental sólo tiene un maestro en las clases y un trabaja-
dor sólo tiene un supervisor inmediato. Añadir a otros calificadores que estén
Mientras la confiabilidad entre los calificadores de los juicios tuvo un menos familiarizados con el calificado puede debilitar en vez de fortalecer las
promedio de 0.47, la correlación entre cada rasgo por el mismo califica- calificaciones.
dor promedio 0.71. Así, cuando la misma persona examinaba a otra, tendía a Los datos de confiabilidad en algunos de los tipos más nuevos de instru-
considerar lo mismo aun cuando estuviera evaluando rasgos muy distintos, mentos de calificación que actualmente se analizan parecen ser más promete-
mientras que cada calificador tendía a considerar cosas distintas aun para la dores. Tales datos se presentarán como métodos y se examinarán al presen-
misma característica. tarse. Una de las ventajas de basar las calificaciones en conductas tangibles
Por supuesto, cabe esperar alguna relación entre rasgos deseables. será, por 10 menos así se espera, que la objetividad Iy, por tanto, la confiabili-
Encontramos correlaciones entre cada habilidad cuando ésta es evaluada por dad} de los juicios se incremente.
medio de pruebas objetivas y no revela el efecto del halo que produce una
correlación entre las habilidades verbales y mecánicas. Qué tanto de la rela-
ción entre las cualidades diferentes en las cuales obtenemos calificaciones es Validez de las calificaciones
genuina y qué tanto es un efecto de halo espurio, resulta bastante difícil de
determinar. Sin embargo, que alguna relación se deba a la inhabilidad para Todos los factores limitantes y de distorsión que hemos considerado nos
liberarse de los sesgos generales y de los prejuicios resulta bastante claro de hacen dudar de la validez de las calificaciones. Los prejuicios y sesgos de los ca-
los ejemplos anteriores_ lificadores y la falta de confiabilidad operan para dar una validez baja; sin
embargo, normalmente es muy difícil hacer cualquier tipo de prueba estadís-
tica de la validez de las calificaciones. El mismo hecho de que se haya vuelto a

.. -; ~. .•.'. '. ;."~'.


448 CAP. 12. EL INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR LAS CALIFICACIONES 449

calificar SIgnifica que no se ha podido encontrar otro método mejor de la un patrón de opciones de respuesta (las calificaciones que se otorgarán). En
medida de la cualidad en cuestión. Normalmente, no hay nada que podamos sus formas más simples y convencionales, las variables de estímulos consis-
: :, - probar contra las calificaciones. ten en nombres de rasgos y las opciones de respuestas consisten en catego-
En un contexto, la validez de las calificaciones es axiomática. Si estuviéra. . rías numéricas o de adjetivos. Este tipo de formato, que se indicó al principio
mos interesados en apreciar cómo reacciona una persona frente a otras, POr de este capítulo, parece favorecer a la mayoría de las desventajas analizadas
ejemplo, si un niño simpatizara con sus compañeros de clase o si un superin. en las secciones precedentes. En consecúencia, se han tratado de hacer
tendente es aceptado por sus trabajadores súpervisados, las calificaciones .' . muchas variaciones y refinamientos del formato con el fin de sobreponer-
representan las reacciones de estas otras personas y son directamente apropia. nos a estas ventajas o por lo menos minimizarlas. Las variaciones se han
das en cuanto al punto en cuestión. hecho en las variables de estímulo, las opciones de respuesta o ambas. Algu-
Cuando las calificaciones se han estudiado como predictores, los datos nas de las variaciones principales se describen a continuación.
estadísticos se pueden obtener en cuanto a la exactitud con que, de hecho, pre.
dicen. Esto es algo que debe determinarse en cada ambiente y para cada tipo de
criterio que se prediga. Un buen ejemplo de que en algunos casos las califica. Refinamiento en la presentación de
ciones son los predictores disponibles más válidos está representado por los las variables de estímulo
estudios de las calificaciones de aptitud para el servicio militar que se ha dado
en la Academia Militar de Estados Unidos (Sección de investigación del perso~ . Los nombres de rasgos representan estímulos insatisfactorios por dos
nal, 1953). Estas calificaciones hechas por oficiales experimentados y cadetes razones. En primer lugar, las palabras tienen diferentes significados para cada
se correlacionaron en un nivel más alto con las calificaciones posteriores del persona. El niño que muestra "iniciativa~ para el maestro A puede mostrar
. :: desempeño como oficial en que las calificaciones de otros aspectos de registro "insubordinación" para el maestro B, mientras que el concepto de "buena ciu-
,.'
West Point. Las correlaciones con las calificaciones de la eficiencia para el dadanía" que tiene el maestro B puede ser para el maestro A un conformismo
11

:. 1
¡
combate en la guerra de Corea fueron de cerca de 0.50. Este criterio es, una dócil". En segundo lugar, los términos son lo suficientemente abstractos y
Ir
;! ¡
vez más, una calificación, pero es de tanta "utilidad" como la que se pudiera quedan muy retirados en muchos casos del área de la conducta observable.
;; ./. tener en esta situación. Por supuestu, en otras situaciones, las calificaciones . Por ejemplo, considérese el caso del ajuste. N o podemos observar el ajuste de
¡l.
" pueden resultar sin validez en absoluto. Cada tipo de situación debe estudiar- un niño¡ observamos toda una serie de reacciones a las situaciones y a las per-
se por su propia cuenta. sonas, pero no el ajuste. Tal vez algunas de estas reacciones sean sintomáti-
cas de un ajuste deficiente, pero el juicio acerca del ajuste del niño está muy
CÓMO MEJORAR LA EFICACIA DE LAS lejos de lo que tengamos la oportunidad de observar.
Los usuarios de las calificaciones han luchado para obtener una uniformi-
CALIFICACIONES dad mayor de significado de los rasgos que califican y han intentado basar las
Hasta aquí hemos presentado una imagen complicada de las técnicas de calificaciones más estrechamente en la conducta observable. Estos intentos
calificaciones como instrumentos para apreciar la personalidad. También es han modificado el aspecto del estímulo de los instrumentos de calificación en
cierto que los problemas y las trampas de los procedimientos de calificación tres formas, a saber:
son muchos, pero aun con todas sus limitaciones, son y continúan siendo en
una serie de situaciones lo mejor en lo que podemos confiar para juzgar a l . Se han definido los nombres de los rasgos. Ajuste social es un nombre
otras personas como un medio de apreciar a nuestros semejantes.' La sinceri· bastante ambiguo. Se le puede dar más significado si se elabora lo que se supo-
dad y la integridad de los estudiantes potenciales de medicina, la aceptabilidad ne que dice el nombre, como en el ejemplo siguiente:
social de los prospectos a vendedores y la conciencia de la secretaria privada,
probablemente sólo pueden evaluarse mediante el juicio que alguien haga de Ajuste social: intereses en la interacción y la habilidad para desempeñarse
esas cualidades en los individuos en cuestión. Entonces, ¿qué puede hacerse adecuadamente con niños y con adultos en situaciones tanto de juego como de
para mejorar los-procedimientos de calificación? A continuación considerare· trabajo. Disponibilidad de aceptación en las situaCiones interpersonales. Confor-
mos primero el diseño de un instrumento de calificación y después planea· midad con las normas de conducta sociales básicas.
remos y examinaremos las calificaciones mismas.
La elaboración proporciona más significado al concepto, de otra manera
¡ Refinamientos del instrumento de intangible, y debería contribuir a dar mayor uniformidad de significado entre
calificación un grupo de calificadores.
No hay evidencia de que la definición amplia de cada atributo se pueda
El instrumento de calificación usual tiene dos componentes principales: apreciar, lo cual es un primer paso deseable para mejorar los procedimientos
un conjunto de variables de estímulos (las cualidades que se calificarán) y de calificación; sin embargo, aún podríamos dudar de que una breve defini-
r¡ I
!

t4L
450 CAP. 12. El INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR LAS CALIFICACIONES 45 1

ción verbal resolvería la barrera de las diferencias individuales, lo cual sigo cación. Hay límites en cuanto al número de juicios diferentes que se pueden
nificaría que cada calificador aceptara literalmente el término y, en conse- pedir al calificador. Más aún, el reporte de la conducta muy largo y analítico
cuencia, se limitara a calificar la tarea. puede ser confuso para la persona que trata de usarlo e interpretarlo. La larga
2. Los nombres de los rasgos se han reemplazado por varias frases más lista de conductas específicas probablemente será más eficaz si los juicios son
limitadas y ~oncretas. Los términos abstractos e inclusivos, como ajuste muy simples en los términos empleados, tales como simplemente presente-
social, podrían dividirse en varios componentes, cada uno relacionado COn ausente, y se toman precauciones para organizar y resumir los juicios especí-
un aspecto más limitado de la conducta. Por tanto, son válidas las frases ficos en una o más áreas amplias de calificación.
siguientes:
Trabaja con otros niños. Refinamiento en la forma de
Juega con otros niños. categorías de respuestas
Interactúa con su maestro y con otros adultos.
Acepta las normas y los estándares sociales comunes. Expresar juicios acerca de una persona por medio de la selección de varios
números, letras o adjetivos, es todavía un reporte bastante común en las
Ahora podríamos requerir un juicio respecto a cada una de estas frases escuelas, en el servicio civil ylos sistemas de calificación del mérito industrial·
más restringidas, y esperar que así se tuvieran aspectos más tangibles de la sin embargo, estos procedimientos no son muy recomendables. Como ya s~
conducta del alumno. mencionó, las categorías son arbitrarias y no están definidas. No hay una
3. Cada nombre de rasgo se ha reemplazado por numerosas descripcio- pareja de calificadores que las interpreten ~xactamente de la misma manera.
nes de conductas específicas. Esto nos acerca todavía más hacia lo concreto y Un supervisor puede darle una calificación de "superior" al 5% de empleados,
específico. ASÍ, la frase "Trabaja con otros niños" podría reemplazarse del mientras que otro puede-dársela al 25%. La calificación A de una persona pue-
modo siguiente: de ser B para otra; los estándares subjetivos reinan en todo su esplendor.
Se han hecho varios intentos por manipular las opciones de respuesta para
Trabaia en KIUpO con otros niños: tratar de lograr una escala más significativa de mayor uniformidad de un cali-
ficador a otro.
Desempeña una parte activa.en las labores del grupo.
Plantea y defiende sus sugerencias. Porcentaje de grupos
Acepta las decisiones de la mayoría.
Participa en el trabajo. Para tratar de producir mayor uniformidad de calificador a calificador y
Ayuda a otros con su trabajo. obtener discriminaciones mayores entre las calificaciones dadas por un califi-
cador en particular, algunas veces los juicios requieren darse en términos de
Una subdivisión similar podría realizarse con cada uno de los otros tres porcentaje de un grupo definido en particular_ Así, un profesor que califica a
j. encabezados principales. Estos reactivos sOn todavía más tangibles y específi- un aspirante a una beca está instruido para calificar a cada candidato de acuer-
cos. Debería haber mucho menos ambigüedad en cuanto a qué se espera ob- do con la escala siguiente:
servar y reportar, aunque todavía quedan elementos de interpretación para
decidir, por ejemplo, que nivel de participación constituye" desempeñar una Se ubica en el 2% de los estudiantes mejores en este nivel de entrenamiento.
parte activa". Se ubica en el 10% superior, pero no en el 2% superior.
El reemplazo de un término general por varias conductas específicas pro- Se encuentra en el 25% superior, pero no en el 10% superior.
porciona una uniformidad prometedora de significado de un calificador a Se encuentra en la mitad superior, pero no en el 25% superior.
otro; también puede hacer que las calificaciones se acerquen más unas a otras Se ubica en la mitad inferior de los estudiantes en este nivel de entrenamiento.
j con las observaciones reales que se hacen de la conducta del individuo califi-
I Se supone que con los porcentajes específicos de un grupo definido se pro-
cado. Si el rasgo que se aprecia coincide con uno que el calificador no puede vee un estándar uniforme de calidad para cada calificador; sin embargo, la
I observar en la realidad, el intento por reemplazar el nombre del rasgo por con·
ductas observables específicas haría este hecho penosamente evidente y for-
estratagema suele ser sólo parcialmente exitosa, pues las diferencias indivi-
1: duales no pueden suprimirse con facilidad.
zaría al diseñador del instrumento a reconsiderar el problema de relacionar
! el instrumento con la observación que el calificador tendría realmente que
hacer. Escala grafica
Las ventajas que se pueden obtener de hacer una lista de conductas es·
pecíficas para uniformar el significado y lo concreto de la conducta juzgada Una segunda variación se refiere más a la forma que a la claridad de defi-
tienen como costo lo largo y complejo que se vuelve el instrumento de califi- nición. Las escalas de calificación suelen estar preparadas de tal manera que

' . ~.,~ '. , .:.'.


-
453
452 CAP. 12. El INDIVIDUO EVALUADO POR OTROS

los juicios puedan registrarse con una marca en el punto apropiado de una
línea, en vez de escoger un número, una letra o un adjetivo, como se muestra o '"
CI
-g:e
D.!:!!
en la escala siguiente: ao.
... .5!

Responsabilidad poro completar un trobo;o :a... °2'"


-

v>E
::>

.e
Muy Promedio Muy
...a
e
boja
...
alto eo
.¡;-
E
--
'" -
~ ~~
'"::>
O)

'"
-¡¡;
o
Con este patrón a menudo se hace una distribución de página bastante .g
.¡;; .5 e CI)
..c
CI)
'6~
atractiva, es compacto y económico en cuanto a espacio y parece menos pro- eCD o'"
..c
CI)

hibitivo que una forma que está toda impresa; sin embargo, esta variación no = :z:E V>

tiene muchas ventajas, aparte de la conveniencia y lo atractivo. En un estudio


(Blubarg y colaboradores, 1966) en el que se compararon varios formatos o
numéricos y gráficos para presentar la tarea de calificación, se encontró que el C>
E
formato era poco significativo como determinante de las calificaciones. '"::>
O) .§
'"
-¡¡; o
.~
...
e e
e
Enunciado conductual '">
...s! .5!
..c
='"
CI)
v>
Ya hemos visto que los estímulos pueden estar en forma de un enunciado
conductual relativamente específico. Los enunciados de esta clase también
pueden usarse para presentar las alternativas de opción. ASÍ, podemos tener
un reactivo del tipo siguiente:
'"
...s!
Participación en proyectos escolares e
e
e
:c
e
Es voluntario Trabajo o trae Hoce lo menos =
el material que se posible.
poro traer
le pide. Se resiste o que
materiales.
Participo, pero no lo ayuden.
Sugiere ideos.
Suele trabajar tomo lo iniciativo.
tiempo extra.

Tres enunciados que describen conductas se combinan con la escala gráfi-


ca y se usan para definir tres puntos en la escala. Cabe esperar que estas des-
cripciones proporcionen más concreción y uniformidad de significado a los
puntos de la escal.a¡ sin embargo, estas provisiones editoriales no vencen por
completo las idiosincrasias del calificador, que aún dominan el panorama.
Un diseño complicado de una forma de calificación que muestra unejem-
plo bastante claro de los enunciados conductuales se indica en el cuadro 12.1.
454 CÓMO MEJORAR LAS CALIFICACIONES 455
¡. Escalas hombre a hombre Si esta elegancia adicional parece justificada, se pueaen aplicar procedi-
mientos de calificación más refinados a los enunciados. Un valor de escala de
En un primer intento por obtener más uniformidad de ~ignificado en la los enunciados puede estar basado en el significado que se considera que tiene
escala de respuestas, diseñada desde la PriI?J-e~a Guerra MundIal, se usan hom- o el grado al.que es realmente discriminado entre los individuos con éxito y
bres en vez de números, adjetivos o descnpclOnes que r~presentan a los p~n­ los que no lo tienen. La puntuación que un individuo recibe está basada en
tos de las escalas. Se pide al calificador que piense ~nalgwen que ~<;mozca bIen el promedio de los valores de la escala de los reactivos que se marcan como
y que posea una proporción muy grande de la c~a.lIda.~ que se calI~I~a. El nom- los que lo describen. Se ha encontrado que la confiabilidad de esta lista de los
bre de esa persona se incluye en la forma de cahfIcaclOn para defInIr el punto reactivos escalados es bastante satisfactoria en algunos casos. En un primer
"más alto" en la escala. De la misma manera, los hombres de otras personas estudio (Richardson y Kuder, 1933) se resportó una correlación de 0.83 entre
que el calificador conoce bien entran en los espacios para d<:finir los concept~s las puntuaciones totales dadas por dos calificadores independientes cuando
de "alto", Hpromedio","bajo" ~ "~uy bajo". Entonces, los CInCO nombres defI- calificaban a vendedores. Más recientemente (Ross y colaboradores, 1965) se
nen los niveles de la caractenstIca. . . . reportaron confiabilidades de participación por mitades de O. 72 ~ 0.95 y con-
Cuando se va a calificar a una persona, el calificador reCIbe las mstruccIO- fiabilidades de test-retest desde 0.77 hasta 0.93 para las puntuaCIOnes de cua-
nes para compararlo con las cinco personas que definen ,los niveles del r~~go. tro escalas (agresividad, aislamiento, prosodal y pasivo"agresivo) de las esca-
El calificador tiene que juzgar a que persona se parece Il:1as de cerca el calIfica- las de encuesta de afuste emocional de Pittsburgh aplicadas a niños de las
do en cuanto a la característica en cuestión. El valor aSignado corresponde al escuelas elementales.
punto en la escala que ocupa esa persona. , Sólo se ha hecho un uso limitado de estas listas como instrumentos que
Se piensa que esta característica de escalas. hombre a ho~bre concre~ana producen puntuaciones para cada individuo, pero parecen representar un
la comparación y se sobrepondría a la tendenCIa a la generosIdad qu.e .algunos modelo promisorio; son las que más se acercan a cualquiera de los procedi-
calificadores muestran consistentemente. Cuando todos los calIfIcadores mientos de calificación, a los inventarios de autorreporte y a las pruebas de
tuvieran un amplio rango de familiaridad, de modo que las person~s ~e su habilidades. Una lista conductual es, en un sentido, un inventario de la perso-
escala pudieran compararse de man.e~a bastante. ~uena, el procedImIento nalidad que ha llenado alguna otra persona, que no es la misma que se des-
podría dar mayor uniformida~ d~ calIfIcad?r a calIfIcador. Pero este panora- cribe. Los reactivos pueden seleccionarse y calificarse de la misma manera.
ma de familiaridad y de conOCImIento preCISO con las person:as adecuad~~ de Una lista de conductas bien conocida que es más una prueba de habilida-
la escala, es poco práctico en las situaciones en las que se re~lz~n la~ calIfIca- des es la escala de madurez social V/neland (Doll, 1953, 1965). Esta lista
ciones. Las comparaciones implícitas con otras pe,r~onas estan ImplIcadas en consta de reactivos que relacionan la auto ayuda, la auto dirección, la comuni-
cualquier empresa de calificación, pero el uso eX'p~IcIt? de las pers~nas en p~r­ cación, la socialización, etc. Los reactivos seleccionados de cada nivel de la
1 escala se muestran en la tabla 12.1. Se han establecido normas para cada reac-
ticular para definir los pasos en las escalas de calIfIcaCIOnes no ha SIdo ampha-
J].
fi mente adoptado. tivo de la escala, que representan la edad en la que aparece la conducta como
promedio. La lista es llenada por un calificador que conoce al n~o evaluado.
j
J'
Los reactivos que el niño puede realizar se marcan. Se ha estableCIdo una edad
j'
I Presencia-ausencia basal donde todos los reactivos son positivos, y la persona por calificar recibe
¡; un crédito automáticamente por todos los puntos anteriores; se le dan puntos
¡ adicionales por los reactivos que realice y la tabla de normas proporciona
Cuando se usan como estímulos múltiples enunciados de conductas espe-
cíficas, la respuesta que se requiere suele ser una mera verificación de aquel~as equivalentes deed.ad de desarrollo para las puntu~ci~nes: ;\simis~o, se puede
que se aplican al individuo en cuestión. Entonces,. la pers~ma se caractenza calcular un coefiCIente de desarrollo, que es una mdlcacIOn del ntmo de pro-
por los enunciados que se marcan como r<:presentatl'~o.s de el. De ese modo, ~a greso del individuo hacia la autosuficiencia y la independencia. .
:1, escala de calificación se convierte en una lIsta por venfIcar o marcar,'y la sene Los patrones de las listas se han utilizado como instrumentos de d~sc.np­
): de reactivos del apartado anterior p~d~an constituir 'pa~e de tal lIsta. ción simples, así como en los reportes escolares para. el hogar..~l procedImIen-
',1 ..
",
Si a partir de este tipo de procedI~ento de aprecIa~I~n se va a obtener to es atractivo en este ambiente, porque puede dar InfOrmaCIOn acerca de los
;I¡ una puntuación, los enunciados deberan escalarse o reCIbIr val?~es de pun- aspectos específicos del desarrollo del estudiante; sin embargo, las fo~as
tuación. La forma más simple consiste sólo en dar una puntuaclOn de + 1, tienden a ser complicadas y a confundir a muchos padres, por lo cual este tIpO
il!
, de reporte no se ha utilizado ampliamente.
- 1 o O, dependiendo de si son ~avorables, des~av?rable~ o neutra~ re~l?ecto
,~

l.'
.¡,
).
;,
al atributo en particular (es deCIr, perseverancIa, mtegndad, cO,nfI.abll~d~d,
,' etc.) o a un criterio en particular (es decir, éxito en la labor ac~~emIca, ~XIt? Frecuencia de ocurrencia o tipicidad
en el trabajo, respuesta a la terapia, etc.'. Entonces, la punt~aclOn de un m~~­
viduo puede ser la suma de las puntuaciones para los reactIVOS que se venÍl- En vez de reaccionar de una manera del todo o nada a un reactivo, como
, : caron para él. en la lista de conductas, el calificador puede determinar que la conducta

4. .,~:.

'~'. . . , ...:
CÓMO MEJORAR LAS CALIFICACIONES 457
456
tándares de los calificadores. Más aún, cuando un número de conductas
Tobla 12.1. Reactivos seleccionados de lo escola de madurez social Vineland específicas que se marcan es sustancial, una forma simple de presente-ausente
Nivel de edad correlaciona bastante más alto con las formas más elaboradas.
Reactivo
número (en años) Reactivo
~: Orden de rango
1. 0-1 "BalbtKeos' y risas
6 0-1 Se estiro pom alcanzar objetos cercanos En los casos en que cada calificador conoce a un número sustancial de los
11 0-1 Bebe de uno tozo si se le ayuda calificados, es conveniente pedirle que los liste por orden de rango respecto al
15 0-1 Se pone de pie atributo que se esté estudiando. Así, a un maestro se le puede pedir que indi-
¡ I
que cuál es el niño más sobresaliente para contribuir con los proyectos de la
19 1-2 Hoce marcos con un lápiz o con una crayola
clase y las actividades "por encima y más allá de lo que requiere su deber", el
28 1-2 (ome con cuchara que ocupa el segundo lugar y así por el estilo. Normalmente, el calificador
:1 Platica con omciones cortas
¡ : 34 1-2 recibe instrucciones para empezar el trabajo por ambos extremos y trabajar
! hacia el centro, dado que los casos extremos suelen ser más fáciles de discrimi-
¡ í 37 2-3 Se quita el vestido o el abrigo nar que un grupo grande de personas promedio en el centro. Algunas veces,
l '
'. :
40 2-3 Se sec:a las monos esto está formalizado como orden de rango alternativo, que consiste en selec-
44 2-3 Relata experiencias cionar al más alto y después al más bajo, y después al que sigue como alto y-al
que sigue como bajo, y así hasta el final. Para facilitar esta tarea del calificador,
51 4-5 Se cuida a sí mismo en cuanto ir 01 baño se puede permitir que se unan los rangos. Si esto no se permite, el que los pone
53 4-5 Sale cerco de caso sin cuidados en orden puede sentir que la tarea es irracional, especialmente si el grupo es
Repudia al Santa (lous literol bastante numeroso.
68 7-8 Poner en orden de rango es una tarea ardua para el que la realiza, pero
70 7-8 Se peino o cepillo e~ pelo logra dos objetivos muy importantes. Primero, obliga a la persona a hacer una
Escribe cortas cortas ocasionalmente evaluación que contenga discriminaciones entre los evaluados. El ordenador
78 10-11 de rangos no puede poner a todas las personas o a su mayoría en una simple
80 10-11 Hace Imbaio remunerado fácil
categoría en el momento de juzgarlas, como lo hace con otros sistemas de cali-
ficación. Segundo, borra las diferencias individuales entre los calificadores
tanto en generosidad como en negligencia. No importa qué tan amablemente
se pueda sentir el calificador, tendrá que poner a alguien hasta atrás obligato-
ocurra usiempre", unormalmente, " "a1gun~s, veces 11 ~ .,. rara vez " o "nunca"
. riamente, y no importa qué tan descorazonado esté un calificador, siempre
como característica del calificado. 3 O qUlza el calIfIcado sea caractenza- tendrá que poner a alguien en el primer lugar. Las diferencias individuales en
do como Use parece mucho", "se parece bastante", .u se parece alg~", l/se pare~e los estándares de juicios quedan eliminadas en la puntuación final.
poco" o u no se parece en nada".a la conducta descnta en el e~uncIado . Lo~ ter- Si las puntuaciones están basadas en los órdenes de rango hechos por dife-
minos que indican la frecuencIa 0.1: sembla~za 'p,!eden vanar; los antenores rentes jueces que luego se combinan, los órdenes pueden ser tan problemáti-
sólo son sugerencias. La puntuaclOn ~e un mdIvIduo puede. ahora ~eI?-e.r en cos como las diferencias individuales en los estándares de juicio que se acaban
cuenta tanto el significado del enuncIado como la frecue~~Ia o la .upIcId~d de eliminar. Si tratamos a los órdenes de rango hechos por cada juez como
con que aparece; es decir, un atributo important~ puede recIbIr u~ ~redIto ~as puntuaciones comparables, debemos asumir que la calidad del grupo puesto
importante que uno menor, y una marca en la hsta en el"punto SIempre da en órdenes de rango es el mismo; es decir, asumimos que ser el segundo en un
más crédito que una marca en el punto ·no~almente . , grupo de 20 representa el mismo nivel de la característica que se juzga, sin
Las designaciones indefinidas de frecuencIa ~ de grado de la clase 9,!e aqUl importar cuál es el grupo de 20, es decir, por qué personas está formado. Debi-
se sugieren, son interpretadas de manera muy dIferente p.or cad~ cahfIcador, do a que normalmente no hay una forma directa para comparar a los subgru-
de tal forma que reaparecen los viejos problemas de las dIferencIas en los es- pos diferentes, sólo podemos asumir que son comparables. Si los grupos son
bastante grandes y escogidos más o menos al azar de una misma clase de
población, ésta puede ser una suposición razonable, pero con grupos peque-
3 Al formular reactivos que deben responderse con las categorías 'sie~bra', 'nonna~men­
te', etc., se debe tener cuidado de que ninguno de los términos expresen la misma frecuencia. que ños o con grupos seleccionados de maneras diferentes, la suposición de com-
se incluye en el reactivo, fonnulado como un enunciado. De otra maI?~ra, se afronta la at~o;ldad parabilidad puede incluir cantidades de error sustanciales en cualquiera de las
sintáctica de juzgar si Juan 'siempre' 'normalmente acepta las deCISiones de la mayona . puntuaciones basadas en órdenes de rango.
458 CAP. 12. EL INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR LAS CALIFICACIONES 459

Los rangos de este tipo no representan una escala de puntuaciones muy cada uno de ellos mu~stra una buena cantidad de acuerdo entre los jueces y
útil, pues el significado depende del tamaño del grupo; ser el tercero, en ~n para los cuales el conjunto completo revela un amplio rango de valores pro-
grupo de tres es muy diferente de ser el tercero en u~ grupo de 30: Mas aun, medio de la escala. Por ejemplo, los siguientes reactivos se tomaron de la esca-
los puntos en el rango no representan igualdad de umdades de me.dIcIon de "':ln la relaciones interpersonales con estudiantes en un instrumento diseñado
rasgo. Como ya habíamos visto al estudiar las ?ormas de percenules en la dIs- para una facultad universitaria (Harari y Zedeck, 1973). La escala tiene un
tribución normal con forma de campana (capItulo 4), uno o dos rangos a los rango posible desde cero (bajo) hasta siete (alto). .
extremos de un grupo representan mucho más de una difer<:ncia que el ~isI?o
número de rangos cerca del centro del grupo. Por esta razon, es una practica Valor de la escala Enunciado
común convertir los rangos en puntuaciones estándar normalizadas para
obtener un tipo de puntuación que tenga un significado uniforme sin consi- 6.8 Cuando una clase no entiende cierto concepto o se
derar el tamaño del grupo y las unidades uniformes a lo largo del .r~ngo de .,,.e, siente uperdida-, cabe esperar que el profesor se entere
. y actúe para corregir la situación
puntuaciones. Las tablas especiales que se han preparado para !acIhtar esta
.. '¡~ conversión así como las tablas para los grupos de todos los tamanos hasta lle- 3.9 Durante las conferencias, el profesor podría a menudo
gar a 25 s: pueden encontrar en las páginas 90-92 de la obra de Symonds decir a los estudiantes que planteen preguntas que
(1931). analizarán durante sus horas de oficina
:i" ¡i 1.3 Cabría esperar que este profesor humille o ponga en
L' .
;'; " vergüenza a los alumnos que no estén de acuerdo con él
Escalas de calificación ancladas
conductualmente Se proporciona la serie de enunciados para cada dimensión y el calificador
Un método que recientemente ha recibido mucha popularid~d por dise- indica cuál de los enunciados es el que describe mejor a la persona que se cali-
ñar instrumentos de evaluación del desempeño es aquel que reqUlere que los fica. Los usuarios han reportado (Campbell y colaboradores, 1973) que este
supervisores sean los que más adelante usen las escalas de calificación para procedimiento Hproduce menos varianza de método, error de halo y error de
participar en su desarrollo. El trabajo procede en tres etapas, a saber: indulgencia" que los procedimientos de calificación más convencionales.
Los procedimientos para desarrollar la escala requieren bastante tiempo
y los instrumentos resultantes tienden a ser un poco complicados. Se necesit~
l. Un grupo de futuros calificadores, a lo largo de un period? ~e di~cusión,
más experiencia antes que podamos juzgar si las ventajas de este procedimien-
se pone de acuerdo acerca de las dimensiones que ~ pueden ~IStlI:?Ulr como
aspectos del desempeño en un trabajo. En una pnmera aphcaclOn de este to se mantienen en usos posteriores y si son lo suficientemente grandes para
método (Smith y Kendall, 1963), se condujo a enfermeras a ponerse de acuer- justificar el trabajo adicional. · .
do acerca de las dimensiones siguientes como aplicables a las enfermeras
medicoquirúrgicas: Modelo de opción fOlzada
Conocimiento y juicio Todas las variaciones consideradas hasta aquí operan en el mismo
~l,' :
l
Conciencia para el trabajo
Habilidad para las relaciones humana:. . patrón básico. El calificador considera un atributo en cada momento y asig-
Habilidad organizacional na al calificado una categoría de un conjunto de categorías o lo coloca en
J; : Objetividad relación con otros acerca de un atributo en particular. Ahora considerare-
..,l l '
~1.~"..I, ¡ Habilidad observacional mos otro tipo de modelo. La esencia de este nuevo procedimiento es que el
!" 'j, calificador considera un conjunto de atributos al mismo tiempo y decide
rf.~:·ll ¡
2. Los usuarios potenciales generan un conjunto de "incidentes crítico~" cuál (o cuáles) de ellos es el q~e representa más exactamente a la persona eva-
de conducta real observable para ilustrar los desempeños superior, promedlO luada. Así, en un instrumento diseñado para evaluar a los instructores de la
e inferior en cada una de estas dimensiones. Los calificadores en un grupo escuela técnica de la Fuerza Aérea (Highland y Berkshire, 1951' se incluían
nuevo son iequeridos para que asignen cada incidente a la dimensión a la cual reactivos como los siguientes:
se aplica. Para un análisis posterior, sólo aquellos incidentes para.I0s que hay
un alto grado de acuerdo son retenidos en asignación a las dimenslOnes dadas. al Es paciente con los que aprenden lentamente.
3. Cada persona de un nuevo grupo de jueces indi~a dónde se ~bica ~ada b) Da conferencias con seguridad.
enunciado en la escala de excelencia. El nivel promedIO y la conSIstencIa de e) Mantiene el interés y la atención de la clase.
estos jueces son analizados y se retiene un subconjunto de reactivos en el que d) Imparte cIases con objetivos para cada lección.
t'irl[!if

~: ... t +.

~1 .. ;
, .
460 CAP. 12. El INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR lAS CALIFICACIONES 461

La función del calificador era seleccionar dos reactivos del conjunto que . ta práctica, pero la tarea de prepararlos y las reacciones negativas a ellos por
fueran Hmás descriptivos' de la persona calificada. . . parte de los calificadores han dado como resultado una declinación gradual en
Nótese que todos los enunciados en el conjunto antenor s~::m cuestiones su interés en los últimos años.
agradables para calificar a un inst~,ctor. De h.echo, .fue~~n cU1~ad?samente
apareados con base en la informaclOn de ~?a mvest~gaclOn prehmma~, p~ra
que fueran igualmente agradables para califlcar.a u~ mstructo.r, ~ero dlfenan Refinamientos de los procedimientos
en gran parte, una vez más basados. en inveStigacIOnes prehmInare,s, e~ la de calificación
extensión en que distinguían en realIdad entre las personas que hablan sIdo
identificadas por otras evidencias corno instru.cto~es.bue.nos o malos. El enun- El instrumento mejor diseñádo no puede dar buenos resultados si se usa
ciado más discriminativo es el a) y el menos dlscnmmatlvo es el b); por tanto, en condiciones de calificación insatisfactorias. Los calificadores no pueden
podemos asignar un valor de dos puntos al enunciado a), de ~m p~nto al el y al proporcionar la información que no tienen y no pueden proporcionar infor-
d) y de cero al b). La puntuació~ de una persona para esta se~le sena .la ~uma de mación si no están en buena disponibilidad para hacerlo. Por tanto, debemos
los créditos para los dos reactivos marcad~s corno, los mas descnptIvos. Su tratar de seleccionar a los calificadores que han estado en contacto estrecho
1"
puntuación para el instrumento en su totalIdad sena la suma de sus puntua- con los calificados y preguntarles sus juicios acerca de los atributos que han
ciones en los 25 o 30 bloques de cuatro enunciados. Se encontró que tal pun- podido observar. Debernos darles ciertas guías y entendimiento para el tipo de
tuación tenía una confiabilidad de partición por mitad~~ buena.s (de 0.85 a juicios que esperaplOS que hagan y, si es posible, deberían tener la oportuni-
0 .90), de manera que el instrumento daba una puntuaclOn conhable para.la dad de observar a los calificados sólo después de que han sido instruidos en el
,l:
deseabilidad del individuo corno instructor de acuerdo con el punto de VIS- uso de instrumentos de calificación. Cuando varias personas conocen a los
.¡ ta de un solo calificador. Desde luego, esto no revela nada acerca del acuerdo calificados igualmente bien, deberían reunirse las calificaciones de todos ellos
que se pudiera encontrar e~ltre cali~icadores diferentes. . , y hacerse una combinación conjunta. También debería hacerse un esfuerzo
Por medio del moldeamIento del mstrumento de evaluacIOn en un fonna- para motivar a los calificadores a desarrollar un trabajo honesto y consciente,
to de opciones forzadas, el constructor espera lograr tres cosas, a saber: por lo cual a continuación consideraremos estos puntos con más detalle.

l. Eliminar la variación en los estándares de bon.dad o gene.rosidad de


los calificadores. Dado que los reactivos en un conjunto son Igu~l~ente SeJecCÍón de calificadores
favorables para mostrar e! desempeñ? de al~una persona, el sentIml~nto
generoso no debería tener una tendencIa es~e~Ial para esc,oger un enunCIado Para la mayoría de los propósitos, el calificador ideal es la persona que
en lugar de otro, y la naturaleza real de! cahÍIcado debena ser el factor con- ha tenido la más grande oportunidad de observar al individuo que se califica
trolado. .1 en aquella situación en la que tiene más probabilidades de demostrar las cua-
n:
2. Minimizar la posibilidad de que el califi~~do !ntenci01!a ente pr~- lidades que se persiguen con las calificaciones (ocasionalmente, es deseable
iuicie o sesgue la puntuación. En la escala d~,cahflcaclon~s .o rdmanas, el cah- obtener una calificación de la impresión que una persona provoca en una
ficador está en completo control de la situaclon; pue?e cahhca~ a una persona entrevista breve o en una situación experimental limitada). También es
tan arriba otan abajo, como se le dé la gana. En este tIpO de o~clOnes.fo~z~da~, deseable que el calificador adopte una actitud imparcial hacia el calificado.
se espera que el calificador no sea cap~z de identificar l~~ opcIOnes sIgmfIcatl- La deseabilidad de estas dos cualidades, por medio de la familiarización y la
vas y, por tanto, no será capaz de aSIgnar la puntuaclOn a v?lu~ta~, ya sea imparcialidad, es generalmente reconocida en lo abstracto; sin embargo, las
hacia arriba o hacia abajo; sin embargo, aunque hay alguX:<l:s mdIcaclOnes de metas sólo pueden realizarse parcialmente en la práctica.
que un instrumento de opción .forzada ~ued~ ser me~os dlslII~ulabl~ que u.na Las consideraciones administrativas normalmente dictan que las funcio-
escala de calificaciones ordinana, todaVla esta muy leJos de eVItar la mtenclO- nes de calificación y evaluación se asignen al maestro dentro del ambiente
nalidad de un calificador determinado. escolar y al supervisor dentro de un ambiente laboral. La relación aquí es, en
3. Producir una mejor dispersión de puntuaciones y una distrib~ción cada caso, de supervisión directa. Generalmente hay un continuo de una rela-
de las mismas más cercana a la normal. Si se logra que todas las OpCI?neS ción personal estrecha, pero esta relación es sólo en una dirección y bastante
sean igualmente atractivas, se minimizar~ el efe~to .del ~~ror de genero~ldad parcial. El maestro y el supervisor consideran sólo una parte de su alumno o
(por lo menos así se espera) y se obt~n~a ~na dlstnbuclOn de,puntuacIOnes de su trabajador, la parte que muestra predilección hacia el Mjefe*.
más simétrica. Una vez más, no hay mdIcacIOnes de que esto de tal resultado, Las cualidades que el jefe tiene la oportunidad de ver, primordialmente
por lo menos en parte. . las de desempeño en el trabajo, es probable que las califique de manera ade-
cuada el maestro o el supervisor. Así; en un estudio (Judy, 1952) acerca de los
Los formatos de opción forzada generaron mucho interés y durant~ el mecánicos de aeroplanos, se encontró que las calificaciones hechas por un par
periodo entre 1945 a 1965 se han efectuado investigaciones al respecto, yCler- de supervisores respecto a "saber cómo se hace el trabajo" eran tan confiables

:l.
r
1:
:', I
462 CAP. 12. El INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR LAS CALIFICACIONES 463

como las calificaciones agrupadas de ocho ca trabajadores. de mantenimie~to no recae en éstos, sino en la agencia. Tal cambio podría reducir la cantidad
de aviones, Yque las calificaciones agrupadas de l?s supervtsores se ~~rre~aclO­ de defensa especial para el solicitante. .
naban 0.53 con una prueba de pericia escrita, mlent!aS que la~ cahf1caclOnes
agrupadas de los cotrabajadores se correlacionaban s~lo 0.43; s~~ embargo, las
cualidades que se mostraban primordialmente en la InterrelaclO~ en~r.e com- Selección de las cualidades que
pañeros y con subordinados fueron .evaluadas ?e U~1a manera mas. s?hd~ por deben calificarse
los mismos compañeros y subordInad~s. L.a. vahdez de las c~hficaclOn~s
hechas por los compañeros en la AcademIa MilItar de Estados Umdos, descn- D,os principios se aplican para determinar los tipos de información que
tasO anteriormente en este capítulo, ilustra este punto. . debenan buscarse en los procedimientos de calificación. Primero, parece ser
La falta de acuerdo entre las calificaciones hechas por los supervI~ores y generalmente deseable usar los procedimientos de calificación para obtener la
las calificaciones de los alumnos efectuadas p,?r sus maes~ros, .se sugIere en información que pudiera darse de manera satisfactoria por medio de un indi-
algunas de las correlaciones siguientes, tomadas de estudIos dIferentes: c~dor más o?jetivo y ~on.fia~le. Una puntuación en una prueba de aptitud
ble!l. co~s,trulda es meJ~r mdlcador de. las habilidades cognoscitivas que una
califtcaclOn del supervisor acerca del mtelecto. Cuando existen registros de
Calificación de excelencia de los alumnos en oposición o calificaciones hechos por producción apropiados, éstos deben preferirse a las calificaciones del supervi-
0.39 sor acerca.de la productividad. Debemos recurrir a las calificaciones cuando
el director (Cook y Leeds, 1947)
Calificaciones de excelencia de los alumnos en oposición o uno compuesta de no tengamos mejores indicadores disponibles.
0.28 Segundo, debemos limitar las calificaciones a las cualidades relativamente
cinco jueces (Líns, 1946) ... ...
Calificación promedio de los alumnos acerco de la eflClenoa en OpOSIClon a la evidentes o descubiertas, las que se pueden expresar en términos de conducta
calificación del administrador (Brookover, 1940) 0.08 observable real. No podemos esperar que los calificadores examinen concien-
Calificaciones de los estudiantes en oposición a las del administrador acerca de zudamente al calificado y nos digan qué hay dentro de él. Más aún, debemos
la eficiencia general de los maestros (Reed, 1953) Escuela I 0.40 tener en cuenta la extensión y la naturaleza del contacto entre el calificador y
Escuela 11 0.50 la persona calificada; por ejemplo, una serie de calificaciones que se obten-
drían después de una sola entrevista deberían limitarse a las cualidades que se
observaron durante la entrevista, es dedr, a la precisión, la compostura la for-
ma, de hablar, la fluidez para contestar a las preguntas del entrevistado, que
Existe gran cantidad de traslape, pero las calificaciones parecen tene~ tam- senan observables en una sola entrevista. La laboriosidad, integridad, iniciati-
bién mucha singularidad. El ojo del pájaro y el del gusano no ven Igua1. va e ingenio del' entrevistado no son cualidades que puedan apreciarse con
precisión, a menos que la persona que califica haya trabajado con el calificado
por un buen tiempo. Las calificaciones deben hacerse acerca de la conducta
¡Quién debería escoger a los calificadores! observable, en el ambiente en el que el calificado está siendo observado.

La selección de personas para calificar a los solicitantes a los tr~bajos y


altas becas requiere ciertas consideracion~s desd~ otro punto de ,?sta.. ~n Programa educativo para los calificadores
este ambiente el solicitante tiene que dar CIerto numero de referencIas.o tIe-
ne que somet~rse a formas de evaluación que son llenadas por determIna~o . Las buenas calificaciones no sólo acontecen, aun ~on los calificadores y
número de individuos. La selección de los evaluadores normalmente se deja los instrumentos apropiados para registrarlas. Se debe inculcar a los califica-
al solicitante, y podríamos anticipar q~e él sele,ccio~ará a la~ pe!son~s ~ue lo dores la importancia de hacer buenas calificaciones y enseñarles cómo usar el
calificarán de manera favorable. Podna ser mas satIsfactOrIO SI se pldl~ra al instrumento de calificación. Señalar la importancia de "tener" un buen pro-
solicitante que diera los nombres y los domicilios de, las person~s ~ue tUVieran grama de calificación es más fácil que decirles cómo hacerlo. Como ya se indi-
una relación particular con él y que, por tanto, .estanan en C~)l?-dlclones de pro- có, la inercia, por un lado, y la identificación con el calificado, por el otro, son
porcionar información adecuada, más que dejar que e~ sohcltante. s~lecclOne motivos que compiten poderosamente. No podemos dar un curso acerca de
libremente a sus propios evaluadores. Se puede p~dIr a .un SO~lcltante de estos motivos, pero se necesita insistir en la importancia que tiene ser califica-
empleo que proporcione los nombres ~e sus supervtsores mmedlatos.en sus dor. Más aún, esto debe continuar si queremos integridad y conciencia de las
trabajos anteriores, así como a un aspIrante a una beca q~e propor~lOne la apreciaciones y que éstas se mantengan.
lista de los nombres de sus asesores principales y de cualqUIera de los Instruc- Es recomendable que los calificadores practiquen con algún instrumento
tores con los que haya tomado dos o más cursos. De esta manera, l~ r~spon­ de calificación específico. Asimismo, es recomendable una sesión de entrena-
sabilidad para determinar quienes serán los evaluadores de los solICItantes miento en la que se use el instrumento bajo supervisión. El significado de los

. ... ,
464 CAP. 12. EL INDIVIDUO EVALUADO POR OTROS CÓMO MEJORAR LAS CALIFICACIONES 465

atributos puede discutirse, las hojas de calificación muestra pueden preparar- Nótese que especificamos que sería un agrupamiento. de calificaciones
se y las calificaciones resultantes se pueden revisar. El error de generosidad independientes. Si las calificaciones se hacen de manera independiente, lo.s
siempre perdurable puede hacerse notar y pedir a los calificadores que tengan componentes de I/erro.r" serán independientes también y tenderán a cancelar-
precaución para evitarlo. Se puede dar una práctica po.sterior, con el fin de se; sin embargo, si los juicio.s se combinan mediante algún procedimiento. de
generar tina distribución de calificacio.nes más simétrica. Las sesiones de en- co.nferencia, no. podremos hacer ningún pronóstico. En este caso, los erro.res
trenamiento. no. eliminarán to.das las desventajas de las calificaciones, pero. pueden cancelarse, puede vencer la sabiduría o pueden prevalecer los prejui-
pueden reducir el erro.r o las distorsio.nes más comunes consideradas Co.n cios de los más dogmático.s. Agrupar juicio.s independientes es la única mane-
anterio.ridad. ra segura de balancear los erro.res individuales; en vario.s estudios (Perso.nnel
Research Section, 1952) se ha compro.bado que este procedimiento es más
satisfactorio que el tipo. co.nferencia.
Observaciones hechas como una base
para las calificaciones
Técnicas de asignación
Una objeción a las calificacio.nes es que normalmente se realizan después
del trabajo y están basadas en las impresio.nes generales sin analizar a la perso.- Si un maestro pretende entender a sus alumnos, debe tener algún tipo. de
na Calificada. Un intento po.r apartarse de esta dependencia de la memo.ria conciencia de los valo.res y estándares que el grupo establece para sus miem-
general se lo.gra algunas veces si se incluye el programa de calificación po.r ade- bros (es decir, la cultura del grupo) y el papel que cada niño. desempeña en el
lantado, al mismo. tiempo. en que se requieran las calificaciones finales. Ento.n- grupo de sus contempo.ráneos o. en el grupo de compañeros. El valor y los
ces, se espera que los calificado.res estén alertas y tomen notas específicas de la estándares de sus compañeros establecen las sancio.nes y las gratificaciones
conducta relacionada co.n las cualidades que se califican. Se puede diseñar una que tienen mucha influencia para determinar cómo se desempeñará una per-
forma de registro. en la que las áreas críticas de desempeño queden identifica- so.na y qué tan contento estará en el ambiente del grupo.. Cuando el grupo de
dasy haya un espacio. para registrar lo.s casos de las acciones deseables e inde- compañeros es muy unido. cualquier acción que tome el maestro respecto a un
seables po.r parte del calificado.. Una sección de este tipo. de fo.rma diseñada niño individual suele considerarse como. una acción en pro o en contra no.
para evaluar a estudiantes de enfermería (Fivars y Co.snell, 1966) se muestra sólo de él, sino. también del grupo al que pertenece y con el que se identifica.
en el cuadro 12.2. Una calificación última para cada sección estaría basada en Así, para po.der entender al individuo y para entender cómo. las acciones res-
una revisión de lo.s incidentes, tanto. po.sitivos co.mo. negativos, que ha o.bser- pecto a los individuos afectan el clima del grupo, es impo.rtante apreciar el
vado. y registrado. el superviso.r; sin embargo, lo.s registros de este tipo. requie- papel que desempeña el individuo en el grupo..
ren más compro.miso. y cooperación co.n el pro.grama de calificación. Cuando. En diverso.s estudio.s se ha demostrado. (Gronlund, 1959) que los maes-
esto. se logra es po.sible anunciar po.r adelantado. el programa de calificación y tros, en general, identifican qué niños so.n y no a~eptados po.r sus co.mpañe-
se puede hacer un registro sistemático. para mejo.rar el proceso de calificación; ros, y parece que es bastante típica una correlación de cerca de 0.60 entre los
sin embargo., las situaciones de este tipo son rMas. órdenes de rango del maestro y 'el agrupamiento de seleccio.nes de los miem-
bros del grupo de compañeros. Pero aun una co.rrelación de este tamaño deja
espacio para marcadas discrepancias en la percepción de algunos individuos
dentro de una clase. Suele ser muy difícil para un maestro atribuir a un niño
Agrupamientos de calificaciones activo y tal vez problemático su nivel verdadero. de influencia con sus compa-
de varios calificádores ñeros. Así, para mejorar la comprensión de la interacción social de una clase,
la reputación de cada niño. entre sus compañeros y los patro.nes de atracción o
Una de las limitaciones de las calificacio.nes es su baja con fiabilidad. Si de repulsión, suelen ayudar las calificacio.nes de los co.mpañeros.
varias perso.nas han tenido la oportunidad de o.bservar al calificado., podrá Un pro.cedimiento de calificación que es muy simple y eficaz para o.bte-
mejo.rarse la co.nfiabilidad si se agrupan sus calificaciones independientes. ner las apreciaciones de los compañero.s es la técnica de asignación . Prime-
Desafo.rtunadamente, el número de personas que pueden ser bien ubicadas ro. consideraremos esta técnica como se aplica a las eleccio.nes y los rechazo.s
para o.bservar a un individuo en un ambiente particular (la escuela, el trabajo., so.ciales, y después como. se aplica más generalmente a las calificaciones de
el campo militar, etc.) es muy limitado.. A menudo., sólo. una perso.na ha esta- características o rasgos.
do en un contacto estrecho co.n un calificado. en una relación particular¡ éste Para mejorar la comprensión de la estructura so.cial en una clase los patro-
sólo. ha tenido. un maestro de base, un superviso.r o. un asesor. Otras personas nes de amistad y de liderazgo., los maestros simplemente piden a los alumnos
también han tenido. co.ntacto co.n el calificado., pero en generallo.s juicio.s que que nombren a los niños que son sus mejo.res amigos o sus mejores compañe-
fo.rmulan acerca de él no añaden nada o sólo muy pOCo. al juicio del calificado.r ros de equipo; po.r ejemplo., un maestro puede decir: "Para la unidad acerca de
que está más estrechamente invo.lucrado. México, necesitaremos contar con varios co.mités de niños que trabajen jun-

I
: :
466 467
Cuadro 12.2; Formo de registro observacionol que sirve de base a los calificaciones
(después de Fivors y Gosnell, 1966). (Reproducido con permiso de John
FIonagon y de lo Mocmillan Compony

Conductas que deben alentarse


Nombre del estudiante 1. ¡Ioneación, organización y adaptación del cuidada en la enfermería
a) Plan de cuidado de enfermeros organizado o equipo que funciono eficientemente
b) Necesidc¡des onticipodas de los otras
Conductos que n"esilon mejorarse el Adaptación del plan de ruidado en enfermería poro sobreponerse a las dificultades
1. Planeación, organización y adaptación del cuidado en enfermería ti) Adaptación ~e los ~rocedimientos del cuidado en enfermerio a los necesidades del paciente
o) Fracaso en organizar el cuidado profesional poro el beneficio móximo del paciente el liso del equipo sus"tuto adecuado cuando sea necesario
b) Frocasa en reunir todo el equipa necesario para el cuidado del paciente ~ Diseijo o sugerencia de nuevos técnicos para el bienestar del pocienle o paro el
c) Minimizo ellrabajo de maneru poco conveniente 01 dar el servicio de enfermeña funcionamiento eficaz de la sala
d) Fracaso en adoptar el procedimiento o la situación
e) Uso equipa sustitulo de manero inadecuado Fecha Reactivo Qué pasó
Fecho Reactivo Qué posó

1------+-----+----------l1 2. Verificación
a) Verificar frecuentemente el kordex para buscar 105 órdenes nuevos
2. Verificación b) Hacer verificaciones especiales paro el procedimienlo de medica lción
a) Fonó en verificar el kordex 01 administrar la medicación y el trotomiento el Verificar poro comprobar si los órdenes del laboratorio se realizaron
b) No verificó los tarjetos, los eliquelas o los nombres en el procedimiento de medición ti) Hocer natar los inconsistencias en lo medicación en el tratamiento o en los órdenes de
e) Folló en verificar que los órdenes de loboralorio se realizaron diela
d) No cuestionó la medicación, ellrotomienlo o 105 órdenes de diela inconsislenles e) Verificar el equipo y los suministros poro ver si faltan o paro sober si hoy defectos
e) Fracasó en verificar lo requisición, el equipo o los suminislros ~ Hacer verificaciones especiales ocerca de los signos vitales y los condiciones del paciente
f) Fue negligente 01 checar 105 condiciones del pocienle
Fecho Reactivo Qué pasó
Fecho Reactivo Qué posó

3. Satisfacción de las necesidades emocionales y de ajuste del paciente


3. Satisfacción de los necesidades emocionales y de ajuste del paciente o) Fue amable, dio apoyo y consideraciones al paciente
a) Se rehus6 o satisfacer uno petición, fue poco amable, no tuvo Ioclo 01 contestar o se b) Hizo arreglos poro desarrollar lo terapia recreocional o de diversión
maslró indiferenle e) Hizo observaciones 01 servitio social, a lo enfermero de planla respecto de los necesidades
·. , b) No proporcionó actividades reaeocionoles o olYersiones espirituales y otros
": , 1
JI el Frocasó en reconocer el servicio social, espiritual u otras necesidades el) Adoptó la explicación paro enseñar 01 paciente según su comprensión
e) Enseñ6 eficientemente 01 paciente Jos principios de salud o del cuidodo en coso
~nl .
d) No le expt.có o le reafirmó 01 paciente ocerca de algún onólisis, tratamienlo o polilita,
o bien le informó mol 01 paciente
!:~'ll ' Fecho ReocIiva Qué pasó

ru~
Fecho Reactivo Qué posó

tos en alguna parte del proyecto. Me gustaría saber qué niños quisieran ten~ de papel. Después pongan los nombres de los niños que quisieran que trabaja-
con ustedes en ese equipo. Anoten su nombre en la parte superior de una hOJa ran con ustedes de manera especial".

!~tli..
··. .,;H '.. ·.
...... ..... .
.." ~ ~' , ",' " , • ',,; ~ , " .. ' ',¡ . ' ' •
. ." ...... ~,' .-.". " ,:: ~
468 CAP. 12. EL INDIVIDUO EVALUADO POR OTROS
CÓMO MEJORAR LAS CALIFICACIONES 469

Este procedimiento produce una serie de asignac~ones o selecciones, d.e nos de otros grupos y escuelas que todavía no se han integrado al grupo. En
compañeros de trabajo. Es posible mostrar estas seleccIOn~ de manera grafl- este tipo de ambienteJ el maestro tiene que ser más eficiente para incorporar a
.' ( . ca por medio de un diagrama como el que se mue~tr~ en la Ílgura 12.1 J ~l que los aislados al grupo y promover nuevas amistades.
se ha dado el nombre de sociograma J yel procedImiento para constrUIrlo se Después de que el maestro ha determinado qué niños son los que no tie-
denomina sociometría. nen amigos o están relativamente aislados en el grupOJ deberá tratar de encon-
trar el porqué en cada caso. Algunas veces J la explicación es muy simple: el
niño es nuevo en la clase y no ha tenido tiempo de acoplarse en ella. Para que
se presenten las oportunidades normales de familiarizarseJ el maestro puede
resaltar los aciertos de ese niño. También es posible que el niño sea más gran-
de o más pequeño que sus nuevos compañeros y que tenga amigos en otras
I
clases o fuera de la escuela. Otras veces J la razón puede ser más sutil y quizá
I tome bastante tiempo al maestro investigar discretamente por qué Alfonso o
I Alicia no han sido escogidos por sus compañeros.
:;! ¡ I
Cuando las razones se entendieron J el maestro puede ayudar a remediar-
¡¡~:: " I
I
I las. Algunas veces basta un simple proceso en el que se convence al niño para
I que compita en atletismo J por medio del cual empieza a relacionarse con los
I demás. El maestro puede reordenar las sillas de tal manera que este niñe. aisla-
I I
I do quede cerca del que parece expresar ciertas preferencias por él. Algunas
vecesJ ayudar al niño a desarrollar actividades sociales cotidianas o a mejorar
su apariencia personal es todo lo que se necesitaba para hacerlo aceptable. Si
un niño solitario o marginado tiene una habilidad especial ya sea mecánica o
artística J puede ser muy eficaz darle la oportunidad de desarrollarla dentro del
grupo mediante una actividad que la favorezca. , '
Elección --+ En general J el maestro puede ayudar al niño a integrarse y a ser aceptado
Elección mutuo ~
por sus compañeros si: a) le da la oportunidad de desarrollar relaciones amis-
tosas J b) mejora las habilidades sociales y e) le infunde un sentimiento de
logro y de competencia.
Figura 12. 1. Sociogama d e uno clase de cuarto godo. Las selecciones socio métricas describen el flujo presente de la interac-
ción entre los niñosJ más que indicar la estructura emocional permanente y
fuerte; sin embargo J la estructuración de la clase afecta el clima emocional
En el sociograma que se muestra en la figura 12.1 podemos ver que los general de un salón de clases. En un grupo en el que hay muchos niños aisla-
alumnos A y B son los dos miembros más buscados por el ~rupo: est<?s d?s dos o marginados {es decir, que no son totalmente aceptados por las camari-
niños son los JJestrellas JJ . Los alumnos' y O no fueron escogidos por.mngun llas)J la moral del grupo tiende a ser baja y se dificulta realizar la planeación y
otro y ellos J a su vez no escogieron a nadie; ellos son los ~ohtanos~ L~s
J la coordinación del grupo. Ahora bien J no hay que olvidar que un maestro
alumnos He 1 se escogieron uno a otroJ pero no fueron escogidos por nadie que trata con un niño J frecuentemente trata con toda la camarilla a la que
J1,""!~:~ 1'": más yJ excepto por su amistad mutuaJ también son unos solitarios. ~os este niño pertenece.
alumnos P Q M Y N son los de las orillas; realmente no pertenecen a mn-
J J
En general J los sociogramas señalan los errores que comete un maestro al
':'1 :¡: gún grupoJ pero hacen selecciones den~ro de ese g:u po . .

I
;:J ~: En la figura 12.1 se muestra un patron de sele~~IOx;teS '! atraCCIOnes ~en­
caracterizar a un niño. ASÍJ cuando el maestro ha juzgado a un niño y su posi-
ción dentro del grupo de sus compañeros mediante los estándares adultos J y
, \i 'l!
tro del grupo· también fue posible hacer que los nmos mdlcaran a.los miem-
;i~~,:':I.i
los instrumentos sociométricos apuntan estos erroresJ dan al maestro un mar-
bros de la cla;e con los que definitivamente no quisieran estar aSOCIados. Esto co de referencia para comprender la conducta queJ tomada por sí misma,
!IH;! último presenta ciertos riesgos para la moral individual y de la claseJ pero per- podría ser inexplicable.
'1)')1" mite complementar la imagen de la estructura del grupo. . . Los sociogramas se han empleado en varias situaciones que no son escola-
t/( 1,1 El sociograma de la figura 12.1 indica que el grupo no tiene relaCIOnes res: en la industria para formar equipos de trabajo, y se ha encontrado que
estrechasJ pues tanto el n~mero grande de .niños aislado,s y margi~~dos como estimulan la producción; en institucionesJ especialmente en las que tratan a
las uniones de una JJcamanlla" a la otra sugieren un patron deseqUIhbrado que los delincuentes juveniles, para seleccionar a los grupos que viven en una casa.
está en proceso de cambiar y reformarse. ASÍJ el sociograI?a puede represen~ar El sociogramaJ por sí mismoJ indica al maestro qué niños han sido acepta-
a una clase al principio del año escolarJ en la que se mantiene parte de la amis- dos o rechazados J no las razones para la selección o el rechazo J por lo cual es
tad del año anteriorJ se empiezan a tratar los nuevos compañeros y los alum-

~ , ,
CÓMO MEJORAR LAS CALIFICACIONES 471
470 CAP. 12. EL INDIVID UO EVALUA DO POR OTROS

a.lumno o por la cl~~e en su totalidad; asimism o, se pueden buscar grupos


par-
¡¡ más útil cuando se usa conjun tament e con registros anecdóticos buenos un
cuando se piden los rechazo s, debe
. Para
existir tIculares de atracClOn mutua.
lmente
un uso exitoso , especia Las asignaci0!les .pueden emplearse para cualquier nivel fdeecedad y. hacerse
o;;
.1"!
o debería
sentim iento amisto so entre el maestr o y su clase. Más aún, el maestr a como respect o a cualqUIer tIpO de característica Por e¡·emplo con uencla se an
h
usar estas asignac iones tanto como sea posible, de la misma maner ·1· d I · ·IOnes en. las fuerzas. armadas de ,Estador s Unidos {con-
utI Iza o as aSIgnac
recomienda a sus alumno s que debería n usarlas. es cretam ente, en la Escuela para. aspiran tes a oficialesl , dond e cada nuem . b
ro
El maestro tambié n debería recorda r que la estruct ura del grupo no . m a
.
de una u .d d t·lene que d eSlgnar a un númer o específico de individ uos en su
constit uidos por niños
estática, especia lmente cuando los grupos están
pequeños. Un sociograma hecho al principio del año escolar rara vez ningu.
dará una dmdad que ~an dado las -?}ayores muestr as de "lidera zgoll durante el curso
e entrena mIento . Tambl en.se le puede pedir a cada sujetogoque d eSlgne a
.
buena imagen de la estruct ura del grupo a lo largo del año. Más aún, aque~los que han mostra do la menor indicac ión de lideraz
un valor
na de las dos, ni las selecciones ni los rechazos, deberá tomarse con S,I se toman todas las ~s,ignaciones para el grupo como una· totalida
d se
absolut o. Cuand o el número de seleccio nes se limita a los "tres mejore s ami-
p~dra o.~tener una puntuaclOn para cada individ uo, -dando un punto para ~da
ca que no se le tenga nin-
gos", el que no se escoja a talo cual niño no signifi
algún niño, más aSIgnacIon f~v~r,ab le y un pU!lt~ menos por cada asignac ión desfavo rable.
el io de
Una vanaCIOn ~el .~rocedllmento de asignación se ha utilizado con niños
gún afecto. Las seleccio nes pueden reflejar prestig
cultura en ciertos gru-
de edad esc~lar, vanaclOn qu~ se conoce como la técnica de adivina quién
que el lazo afectiv o o amistos o por él. Los patron es de es
Las
pos de edad indican que los rechaz os pueden estar influidos por el sexo. que o mlodelamlen~o ~e personales. En este proced imiento se instruy e a los niños
an factores cultura les
¡. distinciones de clase y de casta tambié n implic , una
de a manera SIguIente:
influye n en la selecci ón y el rechaz o. Un soci6gr ama es, cuando mucho exis-
sociale s y del clima que
imagen burda y sólo tentativ a de las corrientes Supóng~se que vamos a representar una obra de teatro en el salón de clases
ten en el grupo. Los personaJes de esta obra se describen a continuación. Para cada persona je tie~
Una últiina observación acerca del intento por emplear los datos socio- neds que dar los nombres de uno o más de los niños que lo harían bien' porq~e de
que to as maneras ellos ya son aSÍ.
métricos para reconst ruir a un grupo o para tratar de modificar el papel en las
desemp eña un niño dentro de él: hemos sugerid o algunas maner as sin
;
que el maestr o puede tratar de ayudar aun niño relati.vamente aislado sutile- ches::.Esta persona siempre .está alegre y feliz, nunca se enoja ni hace berrin-
embarg o, cualqu iera de este tipo de manipu lacione s requier e mucha
parte del demás lo
".Esta persona siempre se mete en lo que no le importa y dice a losque
za, pues los intento s por hacer manipulaciones toscas o groseras por vez de ue quedar callada sin meterse en lo no le
maestr o, dentro de un grupo, podría n sólo agrava r la situaci ón, en 9 tIenen que hacer¡ no se puede
Importa". I

aliviarla. de "Esta persona. ~s muy tranquila y no le gusta participar en los juegos o hacer
Se han diseña do otros patron es para obtene r la evaluac ión por parte cosas con otros mnos".
otros propós itos aparte de la prepa-
los compa ñeros y se han emplea do para de un
ración de los sociogr amas y de estudia r las corrien tes sociales dentro
grupo específ ico. Una forma ligeram ente más comple ja es la conocid a El nú.mer o de porcen tajes puede amplia rse todo lo que se desee y cada ida-
como escala de acepta ción social Ohio, en la que cada alumno reaccio na a upersona)el7 es una descrip ción bastan te concret a en términ os decual
cada uno de los otros niños dentro de un grupo, marcán dolo bajo cada una · ~es d~ conduct~ e~ las que el investi gador esté interes ado. Tambié n pueden
le
de las seis catego rías siguien tes: al Mi mejor amigo ; bl mis otros amigos ; el IncluIrs~ ~~scnpclOn~s en el otro. lado de la escala (por ejemplo, amigab y tra-
no son mis amigos , pero me simpat izan; dI no los conozco; el no me
impor- en OpOSIClOn ~ no ~mIgable,. ~ommante en oposición a sumiso , etc.' Cada niño
tan, y f I me desagra dan. Del agrupa miento de las respues tas del grupo de tar~e como aSIgnacI.~nes pOSItIvas y negativ as en una sola escala.
reCI?e una p~n.tuaclOn por cada "perso naje", basado en un número
indica qué gra- de asig-
niños se puede obtene r una puntua ción para cada niño que
con- naClOnes recIbIdas.
do de acepta ción tiene dentro del grupo. Este u otro format o similar de
La caracteristi~a. atractiv a. d~ este patrón de asignac iones es su simple ·
por parte za
proced imient o simple para obtene r califica ciones
tienen un
de la 9!le la hace muy facIl de adt;nI!lI strar, ~a que puede aplicar se a grupos muy
los compa ñeros, y su simpli cidad los hace aplicab les aun a niños ciones. Esta
escuela elemen tal. }ov~!les o a .!?rupos poco sofIstIcados e mexpe rtos en las califica
usar
Las escalas de relaciones sociales de Syracu se (Cardner y Thompson, aClhdad !esIde en q~e un. gran númer o de califica dores hace posible
en el que c?nteos sImple s de aSIg~ac ~ones, en ve!, de ~~a califica ción del tipo común ¡
19581 contien en un sistema de calificación bastan te más elabora do,
SIn e.mbargo, los p~ocedlmlentos de
n con el aSlgnac lOn alguna s veces generan resis-
cada alumno establece su propia escala persona a persona en relació
ll
la persona que tencIa~. Los estudIa ntes en los progra mas de_ entrena miento
militar son
individuo con quien "platica ría sus propios proble mas o con
o por conocId<;>s por su forma de "disimular" sus seleccio nes para no herir las
le ayudaría a "hacer algo·. Oespué s, cada alumno en la clase es colocad alguna s
otro alumno en cierto punto dentro de la escala. Los resultados pueden
resu- ~portumdades ~e sus compa ñeros? e eStudi o, y los grupos de padres
-
mirse en términ os de califica ciones promed io dadas o recibida s por un solo eces han reaCCIOnado de manera vlOlenta cuando se da a sus hijos la oportu

.,';.'..
,¡Ji ~. ' ..
rH~
¡ni 472 CAP. 12. El INDIVIDUO EVALUADO POR OTROS
PREGUNTAS Y EJERCICIOS 473
1,:';;
nidad de hacer respuestas negativas, de rechaz~ o de separación de. s,!~ com- dI S~ deben usar los calificadores que hayan tenido el máximo de oportu-
¡ijli
.,.... !.
pañeros de estudio. Es important~ estar conSCIentes de estas sensIbIhdades
" :'.
mdades de observar al individuo en la situación en la que muestra las
cualidades que se le califican .
en los estudiantes y en la comumdad.
11::;
. L· el Se debe IIconcientizar" a los calificadores acerca del valor de las califi-
caciones y entrenarlos en el uso de los instrumentos de calificación.
1\ ;:
RESUMEN Y EVALUACIÓN f' -Las calificaciones independientes hechas por varios calificadores se
1\\-.L' . - deben agrupar cuando hay varias personas calificadas para realizarlas.
q, A pesar de sus limitaciones 1 las evaluacio?es de las personas n:edian!e
¡¡r~ ,' las calificaciones hechas por otras personas mdudablemente contl1~uaran
usándose con amplitud en las escuelas, el servicio civil, la industna y la
Los procedimientos de evaluación en los que el significado de las califica-
ciones queda de alguna manera oculto al calificador, presentan una posibilidad
¡¡;J: investigación psicológica y educativa. Debemos r~~on~cer Y aceptar lo ante- int~resante para el servicio Civil y el uso industrial, particularmente cuando
rior. Debido a que continuaremos usando las cah~cacI.ones de c~d~ as~ecto se mcluyen controles sobre los sesgos y prejuicios del calificador mediante
de la personalidad, deberíamos hacerlo con la conCIenCIa de ~us hmItaclOnes las técnicas de opción forzada o por una corrección de puntuaciones.
1\'1'] tanto en sus instrumentos como en las personas que los reahzan, y debemos Las técnicas de asignación del grupo de compañeros son recomendables
efectuarlo de manera que estas limitaciones sean minimizadas. para aplicarlas en las escuelas y en otros ambientes grupales. Estas técnicas
Las limitaciones de los procedimientos de calificación surgen de los pun- permiten realizar análisis soCiométricos de las relaciones interpersonales de
tos siguientes: los alumnos dentro de una clase o de los trabajadores dentro de un taller. Las

li\: a) Una tendencia muy humana para formular juicios favorables de nues-
tros semejantes, que se manifiesta de manera particular cuando ~~s
asignaciones de J1 adivina quién es" permiten un tipo simple de calificacióri
para los primeros grados escolares.
!H?Y
oH'!.~ identificamos en cierta medida con la persona a la que vamos a cahh-
lIiU¡: car (error de generosidad). . __ PREGUNTAS Y EJERCICIOS
b) Amplias diferencias individuales entre los cah~lcadores en ~~ant?, a
sus "preferencias" y en la complacencia o sevendad en la cahhcaclOn
l. Si a usted le pidieran dar referencias de un solicitante a un trabajo en su compañía
¡diferencia entre los estándares de calificadores). _ o para la admisión dentro de su escuela, ¡qué haría para obtener la evaluación más
e) Una tendencia a responder a otras personas como una totalidad, en útil de su solicitante?
términos de nuestra simpatía o aversión, así como la dificultad para 2. Haga una lista tan completa como sea posible de las diferentes calificaciones
diferenciar aspectos específicos de la personalidad individual ¡error de empleadas en la escuela a la que usted asiste o a la escuela en la que usted trabaja.
halo). _. ¡Qué tipo de escala de calificación o de forma se usa en cada caso?
d) Contacto limitado entre el calificador y la persona cahhcada, -tanto en 3. De acuerdo con el resultado anterior, ¡qué tan eficaces son las calificaciones que
cantidad como en tipo de situación en la que se observa. usted identificó?, ¡qué tan adecuadas son las dispersiones de calificaciones que se
e) Ambigüedad en el significado de los atributos a evaluarse. _ . obtienen?, ¡qué tan consistentemente se emplea la escala por sus diferentes usua-
f) La naturaleza cubierta e inobservable de muchos de los aspectos mter- rios?, ¡cuál es su impresión acerca de la confiabilidad de las calificaciones?, ¡están
nos de la dinámica de la personalidad. libres de errores de halo y de otros tipos de errores?
g) Inestabilidad Y falta de confiabilidad del juicio humano. 4. ¡Qué factores influyen en la voluntad del calificador para calificar concienzuda-
mente?, ¡qué tan seria es esta cuestión?, ¡qué puede hacerse respecto de ella?
5. ¡Por qué sería preferible tener tres calificaciones independientes de distintos cali-
Con base en estas limitaciones, se sugiere que las calificaciones proporcio- ficadores, en vez de una calificación preparada por tres personas que trabajan en
nen una imagen más precisa de la persona que se califica cuando se satisfacen
1: ~'¡I:JI ¡
equipo? -
los criterios siguientes: 6. En la oficina de personal de una gran compañía los entrevistadores de empleados
;\ I ~,: ~ ~ /.1 son solicitados para que califiquen a los aspirantes al empleo al final de la entrevis-
a) La evaluación se debe limitar a las cualidades que parecen objetivas en ta. ¡Cuál de las características siguientes esperaría usted que se hubieran calificado
las relaciones interpersonales. de manera razonablemente confiable?, ¡por qué?
b) Las cualidades al ser evaluadas deben analizarse en aspectos concre~os
y relativamente específicos de la conducta, y se deben hacer juicios al Iniciativa
:!I' sólo de estas conductas.
el Se debe diseñar una forma de calificación que obligue al calificador a
bl Apariencia
el Antecedentes de trabajo
discriminar y/o que tenga controles para las diferencias de los califica- dl Dependencia
dores en cuanto a sus estándares de juicios. el Equilibrio emocional

i
,~
474 CAP. 12. El INDIVID UO EVALUADO POR OTROS LECTURAS ADICION ALES 475
un número de ratings" e
7. En una pequeñ a encuesta acerca de las tarjetas de reporte hecha en frecuencia: Centra, J. A., "Self-ratings of college teachers: A compar ison with student
comuni dades, las caracter ísticas siguient es se mencion aron con más
loumal 01 Educational" Mea~ur ement, 10, 1973, págs. 287-295 . ' n
al cortés, bl cooperativo, el hábitos de salud y dI trabaja con los demás.
iCómo
el maestro Elm<?re, Pi B. YBeggs, I? L~, Conslst ency of teacher ratings of pupil persona lity traits
podrían parcializarse estas características o revisarse de manera que 1I~ a c assroom settmg , en Measur ement and Evaluat ion
in Guidan ee 8 1975 ,
"
pudiera evaluar las mejór? pags. 70-74.
de una persona
8. ¡Cuál de los siguientes puntos influiría en su propio juicio acerca Hak~l' M: D., I/Norm ative persona lity factors recover ed from ratings of persona lity
'
en una entrevista?, ¡de.qué manera? escnptors: The beholde r's eye", en Personn el Psyehology" 27 1974, pags.
409-421.
ite halo in tea-
al Un apretón de manos muy firme. faeger, R."M. y Fr~ijo, T.p., "Race and sex concom itants of compos <nT 67
bl Traer una corbata lIescandalosaW. . chers e~aluatIve ratmg of pupils", en ¡oumal 01 Edueational Psyeholo on ,
el Genera lmente hacer una pausa momen tánea antes de contest ar la pregunta 1975, pags. 226-237 .
tion scales and
d) Jugar con las llaves dentro del llavero. Keaveny, T J. J:' McGaI,!n, A. F., "A compar ison of behavio ral expectapágs. 695-703.
el Traer una mancha en el saco. graphlc ratm scales , en ,o~lfnal 01 App}ied Psyehol ogy, 60, 1975,
characte ristics
11 Mirar al suelo durante toda la entrevista. Laosa, L.. M., Swartz, J. D. YWltzke, D. B., Cogniti ve and personality
of hl~h s~hool stud~nts :¡s predicto rs of the way the are rated by their teachers: A
conocidos acer- 67 1975 , pags. '
9. Compa re las reacciones de varios miembros de su clase o de varios de ellas?
l ongltudmal study , en ¡oumal 01 Educati onal Psyehol ouv OJ"
ca de los puntos de la pregunt a anterior. ¡En qué se basan cada una 866-872.
por los compañ eros evaluati ons" en
10. ¡Qué ventaja s y desvent ajas tienen las calificac iones hechas Rich, J., "Effects of children's physica l attractiveness on teachers'. '
del grupo sobre las de los superior es? 'oumal 01 Edueati onal Psychology, 67, 1975, págs. 599.609
las calificacio-
11. ¡Cuáles son las ventajas y desventajas de los órdenes de rango sobre
nes en una escala de calificac ión?
forzada para
12. Supong amos que se ha hecho una escala de calificación de opción una eva-
calificar a los maestros dentro de un sistema escolar, con el fin de obtener calificacio-
luación de su eficiencia; ¡Qué ventajas tendría este procedi miento de surgir al
nes sobre otros tipos de·calificaciones!, ¡qué tipo de problemas podrían
usar dicha escala?
un maestro que
13. Elabore una forma de u adivina quién es· que pudiera ser útil para disponible
pretend e conocer ciertas caracter isticas de sus alumnos . Si usted tiene
r y analizar los resultad os. ¡Qué precauci ones
un grupo escolar, trate de recopila
deben tomarse al usar los resultados?
se pone a dis-
14. Con un grupo que recibió clases de alguno de sus miembros o que niño para tra-
posició n por medio del instruct or, obtenga las seleccion es de cada
os. ¡Qué
bajar en equipo con otros niños. Elabore un sociograma con los resultad
los resultad os acerca del grupo y los alumno s que lo forman? , ¡qué limi-
revelan o entre
tacione s tendría este sociogr ama para juzgar el estatus de cada individu
sus compañ eros? .
calificación de
15. Supóng ase que usted ha sido elegido para planear un sistema de tratar de obte-
méritos que sffmpla nta en alguna compañ ía. ¡ Qué pasos daría para
ner las mejores calificaciones posibles?

LECT URAS ADIC IONA LES


oral expecta-
Bemardin, H. J., La SheIls, M. B., Smith, P. C. y Álvares, K. M., "Behavi 'oumal 01
tion scales: Effects of develop mental procedu res and formats ", en
Applied Psychology, 61, 1976, págs. 75-79.
relative effects of
Bumaska, R. F. Y HoIlman, T. D., uAn empirical comparison of the 01 Applied
rater respons e biases on three rating scale formats· , en 'ournal
Psycho logy, 59, 1974, págs. 307-312 .
deveIopment
CampbeIl, J. P., Dunnette, M. D., Arvey, R. D. Y HeIlervik, L. W., "The 01 Applied
and evaluat ion of behavio rally based rating scales-, en 'ournal
Psycho logy, 57, 1973, págs. 15·22.

' ;, . ; .' " .•. : '~:~'¡:. . :. ~-.~.: ., :' ······ ;· ·:... l· ... ;, . . • ~, ·{ ;~ t-·· ·:" · '·
MEDIDAS INDIRECTAS DE HONESTIDAD 4 77

los procedimientos sean indirectos y que la conducta que se observa en reali-


dad y la que se califica sean muy diferentes de la que parece enfocar aparente-
mente la prueba a la vista del examinado.

MEDIDAS INDIRECTAS DE HONESTIDAD

13 La necesidad de ser indirecto es bien ilustrada por una batería de prueba


acerca de la honestidad, diseñada hace casi 60 años por Hartshorne y May
(1928) . La batería, que constituía un primer estudio clásico de la evaluación
del "carácter" y de la educación, todaVÍa representa uno de los elementos
modulares de la evaluación en este campo e ilustra tanto los puntos esenciales
Pruebas y observaciones del enfoque de prueba como el rango de problemas que se encuentran en este
tipo de evaluaciones.
May y Hartshorne diseñaron series integradas de pruebas de honestidad,
de la conducta que incluyen situaciones en las que el individuo tiene la oportunidad de
hacer trampa, situaciones en las que tiene oportunidad de mentir y situacio-
nes en las que le es posible robar. Algunas de las situaciones se describen a .
continuación.

l. Hacer trampa en una prueba, por copiar. Se aplica una prueba que tra-
En los últimos dos capítulos hemos considerado las posibilidades de obte- ta algunos temas relacionados con el trabajo escolar. (por ejemplo, con el
ner información acerca de la personalidad del individuo a partir de la propia conocimiento de palabras). Se recogen las pruebas y al día siguiente se vuelven
impresión que él tenga de sí mismo y de la impresión que causa en otras perso- a: dar, y se permite a cada niño que califique su propia prueba cuando las res-
nas. Ambos enfoques han sido retrospectivos, es decir, basados en la acumula- puestas se leen en voz alta¡ sin embargo, los papeles de prueba ya se han califi-
ción de las experiencias pasadas -experiencias de uno mis~o en el primer c~s? cado cuidadosamente antes de regresarlos a los alumnos, sin ninguna marca
y experiencias de otra persona en el segundo-. Ahor~ conslde~amos las posIbI- sobre el papeL La cantidad con que el alumno copia y califica su propia prueba
lidades de obtener información acerca de la personalIdad medIante la observa· por encima de la calificación recibida se usa como indicador de las trampas.
ción de una muestra real de la conducta del individuo. 2. Hacer trampa en una prueba, por añadir. Se reparte entre los alumnos
Existen dos tipos principales de ambientes en los que se puede observar una prueba de velocidad en aritmética y a los tres minutos se dice a los alum-
una muestra de la conducta de la persona. Por un lado, podemos diseñar nos que dejen de contestarla¡ los papeles se dejan sobre los escritorios varios
algún tipo de situación de prueba que sea percibida C?llol0 tal por l~ per~~ma a minutos, mientras el maestro o el administrador de la prueba está ocupado
ser evaluada y observar su ejecucion dentro de los hmltes de la sltuaCIOz;t de haciendo otras cosas. Después se da a los alumnos otra prueba semejante, y en
prueba definida. Por otro lado, podemos observar su conducta en ~n. ambIen- cuanto acaban los tres minutos se recogen los papeles. Cuando el desempeño
te natural como en el salón de clases, en el patio de recreo o en la ofIcma, don- en la primera prueba sobrepasa el desempeño en la segunda por una cantidad
de la per;ona no tiene que percatars~ de que es o.!'jet? de observ~ción: específica, esto se toma como evidencia de que el examinado añadió más a su
En la primera sección de este capItulo se exaIll!-na,ran las aproxIllolaclOnes trabajo después del tiempo límite, antes que se recogieran los papeles.
de evaluación planeadas y en la segunda se estudIaran las observaCIOnes en 3. Hacer trampa en un juego (como asomarse a ver). Este juego se mues-
ambientes naturales. tra en la figura 13.1 . La instrucción es cerrar los ojos y después poner un
Cuando aplicamos una prueba para obtener una muestra de la conducta punto en cada círculo en turno. Se preparan las normas basadas en los niños
de la persona, de tal manera que podamos llegar a algunas concl,!siones acer- evaluados con los ojos vendados de tal manera que no pudieron asomarse a
ca de su personalidad, queremos que sea una muestra representatlva del modo ver. Se asume que un niño que se desempeña perfectamente bien ha abierto .
como la persona se comporta¡ sin embargo, muchas de las formas de co~ducta los ojos y se ha ayudado, como queda determinada a partir de la norma de la
en las que estamos interesados son aquellas que la persona puede mampular, prueba de asomarse a ver.
por lo menos hasta cieto grado, si así decide hacerlo. La persona puede adop- 4. Hacer trampa en una competencia atlética. Como parte de un día de
tar una actitud de honestidad, vigor, asertividad o mostrarse dulcemente campo, se da a cada niño un dinamómetro para que lo apriete como prueba
razonable si esto es lo que le parece que se requiere en la situación de evalua- de la fuerza de su mano. Se dan tres Uprácticas" de apretón, y el adulto que
ción. Por ello, es necesario que el propósito de la prueba esté encubierto, que observa sin interrumpir anotará la lectura del mayor de estos tres registros.

476
478 MEDIDAS INDIRECTAS DE HONESTIDAD 479
que en caso de que se sospechara cuál es el verdadero propósito de ella los
examinados actuarían de acuerdo con el estándar social aprobado. '

10
Evaluación de las pruebas de
conducta honesta
¿Qué tan confiable y qué tan válida es una prueba situacional de honesti-

8
dad? Los cálculos de confiabilidad se mues tan en la tabla 13.1, en la cual pode-
mos ver que la~ confiabilidades de una sola prueba son más bien modestas,
con un promedIO de cerca de 0.50. En comparación con las confiabilidades de
las pruebas de aptitud y de aprovechamiento estudiadas en los capítulos ante-
riores, estas confiabilidades son decepcionantes. La puntuación de un alumno
en una simple prueba de la serie empleada por May y Hartshorne daría sólo
figuro 13.1. Pruebo de tonteo (después de Hortshorne V MoV. 1928).
una indicación muy burda de la conducta típica de este niño. Una prueba
simple necesitaría extenderse por medio de la adición de varias pruebas de la
misma clase, si quisiéramos obtener una medida satisfactoriamente estable y
Después se pide al alumno que haga apretones adicionales para su registro, confiable. Las pruebas simples parecerían ser útiles sólo para la comparación
momento en el cual el adulto, obviamente, se ocupa en cualquier otra cosa de cada grupo de alumnos.
con otro niño y no observa. El niño anota este último desempeño en una
hoja en blanco para registros. Dado que la fatiga tiende a hacer cada vez más Tablo 13.1. Confiabilidades de las pruebas empleados para medir lo decepción. (Tomada de
débiles estos apretones, hay muy pocas probabilidades de que el último apre- Hortshome y Moy, 1928) ..
tón sea el más fuerte. Si el registro que el niño anotó sobrepasa al que apuntó
el maestro por una cantidad específica, se asume que este niño estuvo muy ( oeficiente
optimista en el registro de su desempeño. Tipo de prueba de confiabilidad
5. Mentíra-autoglorificación. En esta prueba se pregunta al niño una
serie de cuestiones. Cada pregunta está relacionada con estándares de con- 1. Copiar de uno clave o de uno hoja de respuestos 0.70
ducta que son universalmente deseados, pero pocas veces logrados. Por ejem- 2. Añadir puntos a lo puntuación propia sobre uno pruebo acelerado 0.44
plo: "¿Obedeces a tus padres siempre, rápidamente y con alegría~", 11 ¿Siempre 3. Escudriñar, cuondo los ojos deberían estor cerrados 0.46
sonríes cuando las cosas te salen maH" Es difícil saber cuántos de estos enun- 4. Simular lo solución o un problema 0.50
ciados atribuye el niño, realmente, pero se intenta determinar esto por medio 5. Engañar con uno puntuación en uno pruebo de habilidad físico 0.46
de grupos de estudiantes graduados que tenían que pensar otra vez en sus años 6. Mentir poro ganar aprobación 0.84
infantiles y responder como si hubiera sido verdad para ellos. El niño que 7. Obtener ayuda ilícita en casa 0.24
marca un número excesivo de reactivos da la impresión de no ser tan angeli-
cal, sino más bien mentiroso. .
6. Robo. Se diseíia un juego en el que se usan varias monedas que están en Cuando analizamos la validez tenemos que buscar un estándar exterior
una caja, y se da una caja a cada niño. Después que se acabó el juego, se pide a satisfactorio con el cual podamos evaluar estas pruebas. Las calificaciones que
los niños que vuelvan a poner las monedas en la caja y que amarren ésta. Se los alumnos reciben de sus maestros se podrían tomar sólo como un criterio
recogen las cajas que se han marcado, de manera que siempre se sabe de qué imperfecto y limitado, y las pruebas de salón de clases acerca de "hacer tram-
niño era cada caja. Cuando se verifica el número de monedas en cada caja es pa· mostraron una correlación muy baja con este criterio (su promedio es de
posible determinar qué niño se ha quedado con una o más monedas. cerca de 0.35). Pero antes que busquemos una medida de criterio externa
deberíamos preguntarnos cómo se correlacionan entre sí las diferentes cla-
Como ya lo hemos ';'¡sto en estas breves descripciones, las pruebas se ses de pruebas acerca de la honestidad.
involucran y requieren que se dé una manipulación extensiva. Los detalles de Considérense los cuatro tipos de prueba de "hacer trampa" realizadas en
la situación de prueba parecen ser bastante críticos, es decir qué tan seguro
l
la situación del salón de clases. Los autores encontraron que, en promedio,
se siente el niño de que se encuentra libre de ser observado, la manera en q~e un tipo de prueba se correlacionaba con otro sólo en una extensión del 0.26.
los niños estaban ocupados cuando se les pidió que interrumpieran su trabaJO, Cuando se correlacionó una prueba de hacer trampa dentro del salón de cla-
etc. También es importante que se mantenga la "seguridad" de la prueba l por- ses con una de hacer trampa en la competencia atlética se encontró que la l

:j¡~,i.~,;, ,:
,,,,,,:,,' " ', ' , ': ; '
,,
l.
" ,'
480 CAP. 13. PRUEBAS DE LA CONDUCTA TIPOS DE PRUEBAS DE DESEMPEÑO 481

correlación promedio era sólo de 0.16, mientras que c?n la PT?eba de robo dente la relación que existe entre la conducta que se observa y el rasgo que se
la correlación promedio fue de 0.17. La prueba de decIr mentIras que tam- infiere de la conducta. Los indicadores de rasgos tienen mucha validez apa-
bién se aplicó en el salón de clases dio un promedio de 0.23 co~ las otras rente y se identifican rápidamente como correspondientes al rasgo que se
pruebas del salón de clases y de 0.06 con las otras dos pruebas aphcadas fue- infiere de ellos.
ra del salón de clases. . No siempre sucede lo anterior; algunos indicadores de rasgos pueden
Las con fiabilidades de las pruebas individuales son bajas; las correlaCio- estar cualitativamente muy lejos del rasgo que indican. Por ejemplo, Eysenck
nes entre cada clase de pruebas son bastante más bajas. Cuando las correla- (19521 diseñó una batería de medidas de desempeño para identificar la neuro-
ciones incluyen ambientes diferentes (es decir, el salón de clases en oposición sis. Algunas de las medidas que encontró que discriminaban entre grupos
al gimnasio) o tipos de conducta distintos (es decir, decir mentiras en oposi- neuróticos y normales fueron:
ción a robar), las correlaciones son todavía más bajas. Muchas de ellas no
están lejos del cero, y la puntuación en cualesquiera de estas pruebas depende a) La cantidad de sudor corporal en respuesta a una sugerencia directa de
sólo ligeramente de un factor común implicado en todas las pruebas y de los caída.
factores únicos a esa situación de prueba específica. . . bl El número de respuestas poco comunes en una prueba de asociación
tOué significan estos resultados? Desde el punto de vista práctico, indi- libre de opción múltiple.
can que no hay una sola prueba de honestidad, ni s~qu.iera una batería de el La velocidad de adaptación a la oscuridad.
pruebas de honestidad, que nos permita hacer pr~dIcc~<?nes exactas d~ la dI El número de alimentos aversivos.
conducta para cualquier otra prueba o para una sItuaclOn real de la .vIda. el La duración del tiempo en que se podía sostener la respiración.
Nuestra habilidad para identificar al empleado de un mostrador de tienda
,' . que se lleva algo del negocio o al ciudadano que obtenga ventaja de su decla- La puntuación total de una batería de ocho a diez pruebas tan específicas
," , ¡ .,:
,. ración de impuestos será muy magra, a menos que podamos evaluar a estos como éstas parecía tener una confiabilidad bastante alta y discriminar tajante-
.,:;: :. : ~:. individuos en situaciones similares más cercanas a él. La especialidad de la mente entre el grupo de individuos normales y el grupo de neuróticos. Por
situación de prueba, por un lado, y la situación de vida, por el otro, disol- tanto, las pruebas parecían no tener validez, pero la validez, en estos casos,
verán cualquier relación. estaba basada por completo en la relación con un criterio exterior. Las pruebas
Desde el punto de vista teórico, estos resultados proporcionan una ima- no parecían ser medidas de tendencia neurótica, sino que se basaban en una
gen de la conducta como dependiente, sólo en un grado modesto, de los ras- validación empírica basada en la necesidad de confirmación repetida, cuando
gos de personalidad generalizados. El concepto de rasgo es útil sólo para el contenido de las respuestas de la prueba tiene poca relación aparente con las
organizar nuestra descripción de una persona. En esta descripción hay una inferencias que se hacen en ellas.
coherencia básica y una continuidad que dan significado a suc; acciones, pero Otro ejemplo de una serie indirecta de pruebas de desempeño se encuen-
éstas también están limitadas por la situación, y los hábitos específicos de tra en las pruebas diseñadas por Witkin y colaboradores (19621 de un atribu-
responder a cada situación son determinantes tan significativos como todos to que ellos llamaron dependencia del campo. La dependencia del campo es
los rasgos amplios básicos. Este fenómeno no es peculiar de las pruebas de una manera de percibir en la que la persona está totalmente influida por el
conducta objetivas, pues también caracteriza a los reactivos de los inventa- medio que la rodea y depende totalmente de él, es decir, de lo que constituye
rios de autorreporte. De hecho, una prueba de conducta aislada es, en su campo (por lo común el visual). Las tres pruebas que se correlacionan sus-
muchas maneras, similar a un reactivo aislado de un inventario. Por tanto, tancialmente y que se usan de manera colectiva para evaluar la dependencia
en un sentido, la prueba que permite al alumno revisar su hoja de respuestas del campo son las siguientes:
a medida que la califica, realmente plantea una pregunta específica en térmi-
nos de conducta: ¿cambiaría usted sus respuestas incorrectas si usted mismo l. La silla inclinada en el cuarto inclinado. Se pide al sujeto que ajuste
calificara su prueba? Las series de pruebas proporcionan colectivamente un una silla a una posición vertical cuando el l/cuarto inclinado" le da un campo
inventario conductual de varios reactivos; de manera colectiva describirían visual que entra en conflicto con la posición de su propio cuerpo.
la tendencia más notoria de la conducta del individuo, pero su respuesta a 2. Bastón y cuadro. Se pide al sujeto que ajuste un bastón con una orien-
cualquier situación específica será predecible sólo en una extensión limitada tación vertical cuando la única referencia visual es el marco que se ha inclina-
desde la postura que se tenga en ese rasgo general y dependerá, en un grado do en ángulo en cuanto a la orientación vertical-horizontal normal.
sustancial, de factores únicos a la situación específica. 3. Figuras incrustadas. El sujeto tiene que encontrar una figura simple
que está "escondida" en un diagrama más completo.
OTROS TIPOS DE PRUEBAS DE DESEMPEÑO
Esta serie de pruebas, de naturaleza primordialmente perceptual, for-
Las medidas de May y Hartshorne eran dudosas e indirectas desde el man un nexo entre las medidas de habilidad y las medidas de personalidad.
punto de vista del examinado. Para la persona que lee acerca de ellas, es evi- Varias pruebas de este tipo han recibido a veces el nombre de pruebas de
482 CAP. 13. PRUEBAS DE LA CONDUCTA
TÉCNICAS PROYECTIVAS 483

estilo cognoscitivo. Las tareas son de natu~aleza cognoscitiva, pero s~ u.san validez predictiva de las pruebas para criterios socialmente importantes está
para el discernimiento que podrían proporCIOnar a~erca de la.s caractenstIcas todavía sin determinar en gran medida. Se necesita mucha investigación antes
de la personalidad. Por tanto, una persona que es mdependlent~ del camp? que podamos saber si las pruebas objetivas para apreciar la personalidad pue-
que la rodea en las tres pruebas perceptuales se reporta como mas autosufi- den ser realmente útiles.
ciente en sus relaciones sociales, tiene defensas más elaboradas, controla la
canalización de sus impulsos, dirige sus acciones, muestra problemas de TÉCNICAS PROYECTIVAS
exceso de control, sobreintelectualización y se aísla cuando presenta una
",;
perturbación de la personalidad. . . Las muestras de conducta que se han descrito en este capítulo se han
La disponibilidad de estas medidas de dependenCIa del campo ha condUCI- enfocado, en cada caso, a un atributo o a un constructo específico: honesti-
do a numerosos estudios del atributo y sus correlatos, con algunos resultados dad, neurosis o dependencia del campo. Sin embargo, hay un grupo de técni-
incongruentes. Obviamente, las pruebas perceptuales ~ue se han empleado cas para obtener muestras de conducta que se considera proporcionan,en un
como indicadores del atributo dependen en gran medida de los factores de tiempo dado,la evidencia de diversos aspectos,de la estructura de la persona-
habilidad cognoscitiva general y de la habil!dad de vis,!alización espa~ial ('-;er. lidad y de la dinámica de esta personalidad. Estas se han llamado técnicas
non, 1972). Aún es cuestionable que evaluen rasgos Importantes mas alla de proyectivas, cuya característica común es que presentan al evaluado un con-
estas dos dimensiones intelectuales. . . . junto de estímulos materiales ambiguos y desestructurados, y le piden que
El esfuerzo más extenso para diseñar pruebas de personalIdad objetIvas sea él quien imponga su propia estructura sobre estos materiales. El prodUc"
;:j '
está representado por un catálogo de estas medidAs ~laboradas Po! R. B. Cat- to es un protocolo complejo que después se analiza de acuerdo con una serie
tell y sus asociados (1967). Cattell hizo esto,s 7stud~~s para apreciar m,!c~os de líneas guía que suelen ser más elaboradas que las respuestas originales a
de los factores de la personalidad que ya habla l~e~tIf¡cado en sus estudiOS d~ los materiales; el protocolo se interpreta en relación con varias facetas de la
análisis de factores, de los inventarios autodescnptlvos y de las e~calas de cah- personalidad.
ficación. El rango de medidas posibles es imponente, pero su vahdez y su uso Las dos pruebas más ampliamente utilizadas y conocidas y que se han
práctico permanecen, en gran medida, sin evaluar. En e~ mo~ent?'prese~1te, el investigado más de modo exhaustivo como técnicas proyectivas son el psico-
libro de Cattell es un catálogo de posibilidades para la mveStlgaclOn, mas que diagnóstico de Rorschach (con más de 4 580 referencias publicadas hasta
una serie de instrumentos prácticos ya probados. . . 1971) y la prueba de apercepción temática (con más de 1 760 referencias). El
Una característica común a muchas de las pruebas de conducta objetivas Rorschach consiste en 10 láminas que contienen manchas de tinta similares a
es que son indirectas y resultan medidas no "lIintrusas": se: designan ~ar~ las que se muestran en la figura 13.2, las cuales se presentan al sujeto con una
hacer que el evaluado se JI oriente hacia la tarea ,en vez de one.ntarse haCIa SI instrucción muy general que dice aproximadamente: liLas personas ven
mismos· es decir centran su atención y su esfuerzo en realIzar una tar~a muchas cosas diferentes en estas láminas. Me gustaría que usted me dijera lo
individ~al o de g~po de manera completa, rápida o eficaz. Media~te ~l !egls- que ve". Las diversas respuestas a cada lámina se anotan y después se formu-
tro o la observación de algunos aspectos de la conducta de un mdlvlduo, la una segunda serie de preguntas para determinar dónde vio el sujeto cada
esperamos obtener información de su modo típico de func::ionamien!o. La precepto y qué aspectos de la mancha se lo sugirieron (forma, color, sombre-
aparente ventaja de este enfoque oblicuo es q~e pode~os ~eJar de conSiderar ro, etc.) para determinar su respuesta.
las defensas del individuo que se oponen a la lDspeCClOn duecta de su ~erso­ Las respuestas posibles a la tarjeta 2 podrían incluir, por ejemplo, "dos
nalidad; sin embargo, esta ventaja se obt~en~ sólo a un costo m~~ consIdera- brujas que juegan a las manitas calientes", "la cabeza de George Washington",
ble, pues está relacionada con los procedImientos de la recoleccIOn d~ datos, ·una explosión atómica·, lIun águila blanca", IIdos manos con los pulgares
que son elaborados, muy comprometidos y costosos. Otras. veces radica en la que apuntan uno a otro", etc.
falta de una razón obvia para la puntuación de prueba; por ejemplo, cuando se En la prueba de apercepción temática (consúltese la obra de Murray y
usa como un indicador de neurosis una medida de la cantidad de sudor corpo- colaboradores, 1938) se muestra al examinado una lámina con un dibujo,
ral o cuando se infiere como una emocionalidad una categoría de respuest~s a como el que aparece en la figura 13.3, y se le pide que escriba o que narre una
un~ mancha de tinta que se interpreta. Cuando el significado de u~ reactivo historieta acerca de ella. En esta historieta se requiere que el examinado diga
de conducta no está claramente inferido por la naturaleza del acto ~Is.mo (por qué pasó, qué está pasando y qué lo condujo a pensar aSÍ, para que después
ejemplo, cuando golpea~ .a otro n~ño .se consid,era ~n acto de agreSIVIdad), es pueda aventurar en qué acabará. Se usan varias láminas yel registro consiste
necesario validar y revahdar cada mdlcador mas alla de la sombra de la dud~. en una serie de historietas producidas en respuesta a ellas. Una historieta típi-
Lo dudoso de esta validación independiente hace que los múltiples procedI- ca, que indica lo que podía haberse producido para la lámina de la figura 13.3,
mientos de evaluación indirectos sean cuestionables en la actualidad. . es la siguiente: .
Los enfoques anteriores son atractivos en cuanto se supo.ne que el sUjeto
no puede distorsionarlos para dar una respuesta d~seadai sm eIl}bargo, los Esta joven ya quiere irse de su casa y Vivir su propia vida, pero esta vieja quiere
procedimientos son complejos y consumen mucho tIempo, ademas de que la controlarla y obligarla a que haga las cosas que ella quiere. Algunas de las cosas

"~ ~ "
485
484

'.1:

Figuro 13.3. Figura muestra de la pruebo de opercepci6n temótico de Murrof,l.

~o, dependIendo del.uso que se dé a los resultados; por ejemplo, un grupo de


Investlgadores se ha mteresado en el uso de las historietas a fin de evaluar la
~otiv~ción para el aprovechamiento y el logro, mientras que otro grupo de
Investlgadores las han empleado para obtener evidencia acerca del paso del
tiempo en l~ percepción. que el in?ividuo .tiene de su mundo. En estos y en
otros matenales proy.ectIvos, los SIstemas !nt~rpretativos se han vuelto muy
elaborados y se reqUIere un buen aprendIZaje y un extenso entrenamiento
antes 9ue el us.ua!io sea considerado como alguien competente que pueda lle-
gar a mferencIas de este registro tan complejo.
. ~as téc?-icas proyectivas se usan de muy diferentes maneras, y cada usua-
no e m~est~gado~ ha tratado de llegar a tan amplia gama de inferencias de ellas
que caSI es !mposIble hacer cualquier enunciado general acerca de la validez de
Figuro 13.2. Mpnchos de tinta semejantes a las de Rorschach. los 'pro~edImIentos. En general, la evidencia acumulada acerca de la validez
no m~~)lra a los p~icom~tristas más exigentes la confianza que puedan tener de
su utIlIdad. Al mIsmo tIempo, muchos clínicos tienen la convicción más fuer-
que la vieja le dijo son malas, pero la joven tiene que hacerlas de todas manera~. La t~ de q~e ~l protocolo de respuestas proporciona una fuente muy rica para los
muchacha odia a la vieja fea y ya se cansó de que la controle, por lo que un dla se dISCernm?entos y para la formulación de hipótesis acerca de la personalidad
rebeló y la mató. Nunca nadie se dio cuenta de que la muchacha había matado aja del ex~~mado,.asI como de la estructura y la dinámica de esta personalidad.
vieja, así que ahora ya está libre de hacer lo que le dé la gana.
TambIen. es pO~Ible q~e la.s, respuestas l?roporcionen un material muy útil para
Tanto el psicodiagnóstico de Rorschach como la prueba de Gpercepción los estudIOS ~e lll!,eStlgaclOn de los estilos perceptuales y cognoscitivos, de los
temática generan un registro de respuestas muy extensas que suven co~o factores motIvaclOnales y de los efectos culturales. Aun si estos procedimien-
elementos básicos para el análisis, y claramente podrían analizarse por medio t?S .resultan po~o válidos en cuanto a lo práctico, y en este modo son muy
de diferentes procedimientos para la codificación, calificación y/o interpre~a· lImItados todaVla, pueden ser unos excelentes medios para la investigación.
ción del material registrado. Los procedimientos para interpretar el matenal Un punto en el que todo el mundo estaría de acuerdo entusiasta o crítico es
del Rorschach han sido elaborados en gran detalle y existen varios sistemas ~n que.es~os procedimientos deben.ser interpretados Sól¿ por el especialista que
competencia ¡Exner, 1969). Los procedimientos para interpretar el mate~al ha temdo un ex~~nso entrenamIento en la teoría psicológica y en el instru·
de la prueba de apercepción temática son muy informales Yvarían demasIa· mento en cuestIono El maestro, el asesor o el oficial de personal podrán,

,.
PRUEBAS SITUACJONALES 487
486 CAP. 13. PRUEBAS DE LA CONDUCTA

podrí~ afrontar un g~rente. Una escena que suele usarse para esto implica
cuando mucho, ser usuarios en segundo término de los resultados ya inter-
seleccI~)flar un supenntendente que será promovido al siguiente nivel de la
pretados de estos instrumentos. gerencIa. C~d.a perso~a por evaluar recibe un breve resumen de los puntos
fuertes y deblles de • su subordinado" y organiza una presentación inicial
PRUEBAS SITUACIONALES y PROGRAMAS ora~ ~l grupo. Des~ues de todas ~as presentaciones se inicia un periodo de dis-
DE EVALUACIÓN cuSIOn para seleCCIOnar al candIdato que recibirá la promoción y se señalan
~n un or?,en d.e r~ngo a ~os otros candidatos. La persona por evaluar recibe la
Un enfoque para evaluar la personalidad del individuo consiste en colo- mstrucclOn SIguIente: Dado que usted será juzgado por su actitud para
car a la persona en una situación de tarea bastante compleja y demandante y arguJ?entar a ,fa,,!or de ~~ candidato, tratará de convencer al grupo de que su
después observar la manera como enfrenta la situación. La situación de ta:ea candIdato esta bIen calIficado para la promoción; sin embargo, como miem-
se mantiene igual para todas las personas que se evaluarán y, en este sentido b!? de ~n grupo, usted querrá ~~l<;,ccionar ~ la persona que haga la contribu-
es una prueba estándar; sin embargo, las apreciaciones suelen hacerlas uno ¿ CIO~ mas grande a su compama . Se regIstra la discusión y la controlan
más observadores, en cuyo caso participan de la subjetividad y de algunos de vanos observadores que preparan un reporte acerca del desempeño de cada
los problemas de los procedimientos de calificación que ya se estudiaron en el persona por evaluar, tanto ?e la presentación inicial como de la discusión.
capítulo anterior. Probablemente, el primer uso a gran escala en Estados Uni- Estos reportes se leen ~espues al personal de evaluación, junto con los repor-
dos de la combinación de pruebas situacionales y de calificaciones hechas por tes de l?s otros procedImI~~tos, y se espera que contribuyan a la calificación
observadQ);es para la evaluación humana, fue el del programa de la Office of de cuah?ades como la habIlIdad p~;a la comunicación oral, la habilidad para
Strategic Services -Oficina de servicios estratégicos- (Assessment Staff OSS las relaCIOnes hum!lnas, la percepclOn de las reglas sociales la flexibilidad de la
1948) para seleccionar personal para las tareas de cobertura especiaÍ y d~ condu~ta, la neces!dad de recib~r a~r?bación de los compafteros, la resistencia
contrainsurgencia durante la Segunda Guerra Mundial; sin embargo, la apli- al estres, la energIa y la orgamzacIOn y planeación.
cación actual de estos procedimientos ocurre, en gran medida, en el recluta-
miento y la apreciación de los gerentes, en los negocios y en la industria. Se
reporta que más de lOO 000 personas han sido evaluadas en el sistema Bell, y Canasta de documentos
cantidades menores en otras organizaciones principales. A esta prueba responde de manera individual e independiente cada perso-
El estudio de investigación básico en el sistema Bell ha sido descrito por na que .es ~valuada, a la cual se le presenta la oportunidad de sustituir al geren-
Bray, Campbell y Grant (197 4). La evidencia de la validez de los procedimien- te de dIstnto. La persona por evalua~ llega un domingo y encuentra una pila
. tos de evaluación la resumió Huck (1973). Dado que el programa del sistema de memorandos y de correspondencIa sobre su escritorio. Como anteceden-
Bell es bastante típico, los procedimientos se describirán con más detalle y se tes, se?a a esta persona alguna infor~ación acerca del distrito y del personal
presentará la evidencia acerca de la validez de las apreciaciones para predecir que a~Ilabora. ~ establece una c~nt1dad de tiempo limitada (tres horas) para
el avance de la jerarquía gerencial. trabaJar.el matenal; dura~te.este tIempo la persona tiene que asimilarlo, esta-
El proceso de evaluación gerencial total es, de manera típica, una empresa blecer ~Ierto orden de pnondades para la acción y dejar instrucciones a sus
que dura dos días y que durante ese tiempo incluye pruebas convencionales s~b~rdmados en cu~nto a cuál es la acción que se debe realizar durante la
de habilidad general (del tipo de las estudiadas en el capítulo 9) y una entrevis- SIguIente semana, mIentras ~l gerente esté lejos. Entonces, la persona prepara
ta que se enfoca en la historia de trabajo y en las actitudes hacia el trabajo notas y memorandos que SIrven como un registro de su decisión.
(como se consideró en el capítulo 11). Por el momento centraremos nuestra D~spués de que ~e terminó el periodo de trabajo, el candidato acude a una
atención en pruebas situacionales incluidas en la evaluación, que represen- entreVIsta con un mIembro del personal de evaluación que quiere obtener un .
tan un patrón que no habíamos considerado con anterioridad. Tales pruebas panorama del método <J.ue empleó para afrontar las tareas y conocer las razo-
pued~n caracterizarse, en general, como simulacros de algún aspecto del nes por la~ que se escogIeron tales o cuales cosas como prioritarias y el porqué
trabajO del gerente, y están diseñadas para permitir a los candidatos mostrar de las aCCIOnes. El ~yaluador prepara un reporte del candidato, que incluye
mediante sus acciones en una situación de prueba semiestandarizada algu~ aspe~tos como habIhdades.p~ra la comunicación escrita, habilidades para las
nas de las cualidades de liderazgo, de toma de decisiones, de planeaci6n y de relaCI?neS hUI?~mas, <:reatIVIdad, necesidad de aprobación por parte de los
sensibilidad hacia los demás que podrían influir en la eficiencia de una per- supe.nores, estamlares mternos de trabajo, tolerancia a la incertidumbre resis-
sona en un papel gerencial. A continuación examinaremos tres tipos de tenCIa al estrés, energía, organización y planeación y toma de deci;iones.
tareas que aparecen en la evaluación del sistema Bell.
Juego del negocio
Discusión de grupo sin líder
En _e,sta simulación, un grupo trabaja junto, como los gerentes de una
Un grupo de seIS personas son evaluadas en cuanto a su capacidad para compama de manufacturas pequeña o como los comerciantes en un inter-
discutir y llegar a una decisión común acerca de un problema del tipo del que

. . : .. : . . '.- .. . '
.::-. ...
.~ ; .... . .... ' " " . ' . ~:.:. ,,' ;..; .... . . , .• ."... , .• ~..:! ·..I > .. , ... ~:<~,··.:.~; ... I •• ;"I.". .I. , ..,.'.·: ..... .:., ..
488 CAP. 13. PRUEBAS DE LA CONDUCTA PRUEBAS SITUAClONALES 489

cambio de seguridad. Se trata de tomar decisiones acerca de comprar o ven- ra evaluación. Algunas de las correlaciones entre las calificaciones obtenidas
der, en respuesta a los precios y las condiciones cambiantes que se presentan en la primera y la segunda evaluaciones se muestran en la tabla 13.2. Las
al grupo. Se requiere que las decisiones sean del grupo, de manera que apreciaciones finales y totales de la eficacia constituyen el más estable de
su desempeño eficaz tiene que desarrollarse conjuntamente con la calidad los.i~ici?s, segui.do de c~~ca por la aptitud escolar¡ sin embargo, todas las
para decidir y juzgar. Una vez más, se registra y controla el desempeño del cahfIcaclOnes mas espeCIfIcas muestran una consistencia moderada de una
grupo y se prepara un reporte descriptivo de cada participante. Los reportes sesión de evaluación a la otra. Con base en que las tareas específicas eran
contribuyen a las calificaciones eventuales de factores tales como flexibili- diferentes, el grupo de calificadores era distinto y el periodo que había pasa-
dad de la conducta, necesidad de aprobación de los compañeros, tolerancia a do entre ambas evaluaciones era de varios meses, los resultados que se mues-
la incertidumbre, resistencia al estrés, energía, organización y planeación y tran parecen ser un poco alentadores.
toma' de decisiones.
Estos ejercicios situacionales son "pruebas" bastante distintas de las que Tabla 13.2. Correlaciones de los calificaciones obtenidos en dos evaluaciones independientes
ya hemos presentado en los capítulos anteriores. En primer lugar, varias de
ellas son situaciones dentro de un grupo que implican la interacción en- Calificación lolal para un progreso gerencial probable 0.73
tre cada candidato y los otros miembros del grupo. La situación interactiva liderazgo 0.56
tiene un potencial para descubrir ciertos aspectos de la conducta de la persona Energía 0.52
en relación con los demás que difícilmente podrían aparecer en el ambiente Toma de decisiones 0.53
convencional de una prueba. En segundo lugar, el desempeño del candidato Fuerzo 0.62
suele describirse, por lo menos inicialmente, más que calificarse y, desde lue- Habilidades de comunicación oral 0.49
go, esta descripción depende de la percepción y la capacidad retentiva del Habilidades de comunicación escrila 0.57
observador. La descripción permite una amplitud y una vitalidad en el regis- Aplilud escolar 0.72
tro que una calificación muy bien podría perder, pero lo hace a riesgo de Necesidad de aprobación por parle de 105 compañeros 0.50
mucha subjetividad. En tercer lugar, cada situación a la que se expone al indi-
viduo muestra sólo una parte de los elementos que después se sintetizan en
una calificación final y total de los rasgos del individuo, y esta calificación
permite formular un juicio sumario de qué tantas posibilidades tiene de obte- ¿Qué validez tiene la calificación final como predictor del progreso geren-
ner éxito en la carrera ocupacional para la que se le evalúa (de manera típica, la cial? El estudio más importante es el de Bray, Campbell y Grant al que ya nos
de gerente de empresa) . ¿Qué tan bien funciona este proceso? A continuación referimos con anterioridad, debido a que todos los datos y las p~edicciones se
analizaremos algunos resultados representativos. han mantenido seguras y no se ha dado ninguna información a las personas ni
Primero, el punto acerca de la confiabilidad. Hay mucha evidencia respec- a sus supervisores. Por tanto, no ha habido posibilidad de contaminación en la
to a la confiabilidad entre calificadores. Comparada con el procedimiento de que los resultados de la evaluación y las predicciones pudieran haber estado
calificación típico que consideramos en el capítulo anterior, la consistencia influidas por lo que le pasó a una persona en su carrera. El porcentaje del per-
entre los evaluadores entrenados y sus calificaciones de los registros de la mis- sonal que logró la "gerencia media" después de ocho años en la compañía se
ma muestra de conducta observada es satisfactoria. Se logra una con fiabilidad muestra en la tabla 13.3, como función de la predicción del centro de evalua-
adecuada, o así lo parece, porque los evaluadores sí reciben un entrenamiento . ción y de las ~ondiciones de trabajo durante el periodo laboral. Obviamente,
práctico y porque reaccionan a una muestra de conducta real específica, más tanto las cualIdades del candidato, como las percibió el equipo de evaluación
que a ciertas impresiones tomadas de una experiencia pasada, llena de varia- como el tipo de situación de trabajo en el que la persona se estableció s~
ciones y problemas que se hayan tenido con el calificado. La pregunta más crí- relacio?aron con la probabilidad de progreso de la persona en la jerarquía
tica es si el desempeño del candidato en una sesión de prueba con tina serie de ger~~cIal. El hombre al que se le predijo que progresaría tuvo el doble de pro-
tareas corresponde al mismo desempeño del individuo en ocasiones posterio- babIlIdade~ de obtener una gerencia media que el hombre al que se le predijo
res cuando 10 evalúe un equipo de evaluadores diferente en una nueva serie de que no, mIentras que la persona que se colocó en un ambiente de altos desa-
tareas. fíos labor~les tuvo ca.si el doble de probabilidades de haber progresado que al
La evidencia más clara acerca de este punto proviene de un reporte que se le dlO un desafIo laboral moder,ado, y seis veces más probabilidades que
hecho por Moses (1973) de una investigación en la que un grupo de emplea- al que se le proporcionó un bajo desafío laboral. Los dos factores -<lados en
dos de una compañía telefónica, que había pasado por una evaluación de combinación contienen aun una mejor predicción. La relación se muestra
iden~ificación primaria de un día, fue procesado algunos meses después por en la tabla 13.3 y corresponde a las correlaciones' de 0.48 para la predicción
medIO del Centro de evaluación de personal, en su sesión regular de dos días. de evaluación, de 0.57 para el desafío en el trabajo y de 0.64 para las dos en
La segunda evaluación fue totalmente independiente de la primera, y ni los combinación.
candidatos ni el personal de evaluación conocían los resultados de la prime- , Éstas son correlaciones tetracónicas.
490 OBSERVACIÓN SISTEMÁTICA 491
Tabla 13.3. Porcentaje de evaluaciones que lograron acercarse o lo gerencio medio como observadas y evaluadas. La coroparabilidad de persona a persona en estas
uno función de predicción de evaluación y condiciones de trabajo situaciones nos ha parecido muy atractiva, aunque hay otras ventajas muy
Predicción de evaluación :~
importantes en la observación de la conducta en los ambientes naturales
, .
:." como ocurren en la vida diaria.
Nivel de llegará a nivel No llegará a nivel Las situaciones de la vida diaria probablemente son menos homogéneas
desafío gerencial gerencial .'
de una persona a otra que en una situación de prueba que pongamos en prácti-
laboral medio mee/ia Talal ca. En estas situaciones, los sujetos no se sienten forzados a exponer las con-
ductas en las que estamos especialmente interesados; sin embargo, por la mis-
Alto 76 61 71 ma naturalidad de la vida cotidiana y de los sucesos de la vida real, así como
Moderado 55 33 43 porque no creamos condiciones especiales para los propósitos de prueba, la
Boja 33 5 11 observación de la situación natural resulta muy atractiva.
Por supuesto, observamos a las personas con las que nos asociamos cada
Todos los (OSOS 64 32 50 día de nuestra vida, notando lo que hacen y las cosas a las que reaccionan, así
como las formas en las que se comportan. Nuestras impresiones de las perso-
nas se forman y modifican constantemente a partir de las observaciones que
Es importante conocer qué calificaciones de rasgo estaban especialmente hacemos de ellos, pero dichas observaciones son casuales, asistemáticas e indi-
relacionadas con la calificación de evaluación total y cuáles calificaciones de rectas. Si se nos pidiera documentar con ejemplos específicos nuestros juicios
rasgo estaban especialmente relacionadas con el nivel gerencial cuando se rea- acerca de Elena como líder de un grupo o de Alberto como poco confiable,
lizó la reevaluacióIi ocho años más tarde. Algunos resultados se muestran en normalmente estaríamos dispuestos a hacer una o dos observaciones concre-
la tabla 13.4. En especial, es importante observar la correspondencia tan tas de la conducta real que documentara nuestra impresión. Las observacio-
cercana en orden de magnitud para las dos series de correlaciones. La corres- nes deben organizarse, dirigirse y sistematizarse si queremos que sean una
pondencia está representada por una correlación de 0.94 entre las dos series, fuente de información confiable acerca del individuo.
lo cual demuestra que aparentemente ¡los evaluadores estaban haciendo lo Tal vez podríamos distinguir entre los procedimientos observacionales
correcto! que analizamos en esta sección y los procediriüentos de calificación que consi-
deramos en el capítulo 12_ La distinción básica es la siguiente: cuando reca-
Tabla 13.4. Correlación de calificaciones de rasgos con evaluaciones totales y con nivel de bamos observaciones queremos observar la función tan de cerca como sea
gerencia logrado posible, como si fuéramos un instrumento mecánico y objetivo de registro,
mientras que cuando. recabamos calificaciones, queremos que el calificador
Calificación Nivel sintetice e integre la evidencia que tiene. La función consiste en proporcionar
lolal alcanzado un registro exacto del número de contactos sociales, de sugerencias, de actos
agresivos o de cualquier otro que esté en la categoría de conducta en la que
Habilidades de relaciones humanas 0.66 0.32 estemos interesados_El observador sirve sólo como una cámara más flexible y
Organización y planeación 0.61 0.28 versátil o como. una máquina de registro. Por contraste, en las calificaciones
Toma de decisiones 0.59 0.18 el instrumento humano debe formular, ponderar e interpretar juicios.
Habilidades en (omunicación oral 0.53 0.33 Los procedimientos de observación sistemática se han desarrollado más
Energia 0.51 0.28 detalladamente en relación con los estudios de los niños pequeños y parecen
Aptitudes escolares 0.46 0.19 ser particularmente apropiados en estos estudios. Por un lado, el niño peque-
Rango de intereses 0.45 0.23 ño. no ha desarrollado defensas ni actitudes encubiertas que lo escondan de la
Tolerando o la incertidumbre 0.39 0.30 vista pública de manera tan completa como ya lo habrán hecho su hermano o
Necesidad de aprobación por parte de los compañeros - 0.16 - 0.17 su hermana mayores, por lo que se puede encontrar más si se le observa_ Por
Objetividad social 0.04 0.13 otro lado, este niño tiene menos capacidad para decirnos en palabras algo
Número de casas 207 123 acerca de sí mismo, por lo que el estudio de los infantes y de los niño.s del jar-
dín de niños es básico en los procedimientos observacionales que han llegado
a su desarrollo más co.mpleto y detallado. Extraer una apreciación significati-
OBSERVACIÓN SISTEMÁTICA va, confiable y relativamente objetiva de algunos aspectos de la personalidad
del individuo mediante la observación de una muestra de su conducta, no es
Hasta aquí hemos considerado situaciones de prueba relativamente uni- nada fácil. En primer lugar, la conducta fluye como una corriente continua y
formes y estandarizadas como ambientes en los que las conductas pueden ser compleja sin interrupciones claras o unidades tajantes. El preescolar está en la

::' . " - '. "


", l.: ,', . " .' .' ':" ~ ....: , • • .' .• ', . ,', , ', • • . • •• . .. ',.',,;.•• i. ... .:.', ', :., ,',':, • ', : .' . ,',.', • ', ' " .' . . '.':.,'
492 CAP. 13. PRUEBAS DE LA CONDUCTA 493

piscina de arena haciendo un 11 pastel" en un momento, y de ahí se mueve para Cuándo y por cuánto tiempo observar
escucharlo que dice su maestra, quien le habla al resto del grupo,x desp~ésse
desplaza a construir una casa .c,on los cub?! de mad~ra; por el camIlla se pIca la Los datos observacionales son de dos clases: sistemáticos e incidentales.
nariz, jugando l~ da un e~puJon a otro mno y l~, gnta a la maest~a (o al mundo En esta sección, centraremos nuestro enfoque en los programas de observa-
en general): "Veailme, imITen lo que he hecho! . Pero esto es solo un reporte ción sistemática, pues los procedimientos anecdóticos para registrar las obser-
parcial, pues no hay descripción v~rbal que pu~da captura~ _el det.alle com~ vaciones incidentales se estudiarán en otra sección de este capítulo. Cuando
pleto de aunque sean s~lo cinco mIll'!tos d.e la vIda de ~n mno actIvo. ¿Que realizamos un programa de observación sistemática, debemos decidir dónde,
deberá observarse?, ¿cuando y por cuant~ tlempo?, ) que podemos ha~er para cuándo y por cuánto tiempo habrá de observarse a cada persona. La decisión
que las observaciones sean exactas y confIables?, ¿como pued~n orgamzarse y representa un compromiso entre el costo de la amplitud de la observación,
resumirse estas observaciones?, ¿qué significan las observ.aclOnes e~ lo que por un lado, y la necesidad de una imagen representativa y confiable de la
concierne a la personalidad del niño? En las siguientes seCClOnes consIderare- persona, por el otro. Dado que tanto las personas como las situaciones varían
mos algunos de estos puntos e intentaremos resolverlos. día con día, por lo general es preferible tener varios periodos de observación
relativamente breves en días diferentes que tener sólo uno o dos periodos lar-
gos. De esta manera, la muestra de la conducta de la persona será más repre-
Qué observar sentativa y la puntuación que obtengamos será más confiable; sin embargo,
los factores prácticos reales de tiempo, de desplazamiento y de conveniencia
administrativa limitan el número de ocasiones en las que sería posible obser-
Si queremos obtener algo significativo de ,la observació~ ~e un flujo var a un niño en particular o a un grupo. Más aún, en una muestra de conduc-
completo de conducta, las observaciones deberan tener un objetIvo ~oncre­ ta demasiado breve, sería difícil observar y juzgar qué significa una acción
too Debemos observar algo o para algo:.indicacio~es de lideraz,go, de mse~­ particular. ASÍ, la decisión final es un compromiso (o una transacción) prácti-
ridad de sociabilidad de tensión emOCIOnal, de nIvel de energIa, de agreslVl- co entre el costo y la integración, entre la complejidad del contexto y la mul-
dad, de dependencia 'o de varios atributos personales al mismo tiemp~ . .La tiplicación de ocasiones.
investigación, o los problemas prácticos con los .que empezamos, especIfica Un recurso que funciona bien en varios casos consiste en dividir cada
qué aspecto o aspectos de la conducta son los I.mportantes ~e .o~:ervar, y periodo de observación simple en varios segmentos cortos. Quizá éstos no
nuestro plan de observación será la consecuenCIa de una defIllIcIon de los
sean más que de un minuto o medio minuto de duración, en cuyo caso sólo se
aspectos conductuales que nos parezcan relevantes para el problema.
observa la ocurrencia o la no ocurrencia de la categoría particular de conduc-
ta. Por tanto, podríamos observar diez veces a cada niño por periodos de cinco
minutos cada uno en un día diferente. A su vez, cada periodo de cinco minu-
Conductas que representan un tos puede subdividirse en diez periodos de medio minuto. Para cada periodo
atributo de la personalidad de medio minuto observaríamos si ese niño en particular mostró o no una
serie de conductas agresivas definidas. Entonces, cada niño recibiría una pun-
Aun cuando hayamos decidido en qué atribUto estamos interesados, tuación con un posible rango de O a 100 y se indicaría el número de periodos
todavía tenemos el problema de decidir qué conductas serán las aceptadas en los que produjo los actos agresivos. Este tipo de puntuaciones basadas en
como indicadores de ese atributo. Considérense las conductas siguientes:. un número adecuado de muestras cortas de conducta observada tiene una
con fiabilidad bastante satisfactoria. Por ejemplo, Olson (1929) encontró que
la confiabilidad para 20 observaciones de cinco minutos hechas acerca de los
Llorar hábitos nerviosos de los niños era de 0.87 en un caso y de 0.82 en otro.
Pegarle a otro niño
Dar la mano al maestro Naturalmente, sería deseable hacer observaciones en ambientes en los
Llamar la atención acerca de lo que uno ha hecho que es posible que aparezca la conducta en la que estamos interesados¡ por
Chismear con otro niño ejemplo, las observaciones de los actos agresivos podrían ser más adecuadas
Dar información para una discusión voluntariamente durante un periodo de juego libre que durante un periodo dedicado a escuchar
cuentos o a ver la televisión.
¿Cuál o cuáles de estas conductas deberán marcarse como indicadores de
dependencia" en un jardín de niños?, ¿qué otras conductas podrían añadirse?
11

Éste es el tipo de decisión que debe tomarse, tan apropiadamente como sea Entrenamiento de observadores
posible, con base en la familiaridad del comportamiento del niño y la diná-
mica en que se basa, si queremos que los datos observacionales tengan un Aun con una serie de conductas cuidadosamente definidas para ser
significado real. observadas, surgen desacuerdos entre los observadores. Algunos de estos
494 CAP. 13. PRUEBAS DE LA CONDUCTA
ESTUDIOS ILUSTRATIVOS 495
desacuerdos son inevitables, debido a las fluctuaciones de atención o a la lo que se observó. Los objetivos importantes aquí son: deshacerse de la de-
variación en la calificación que otorguen los jueces más cercanos; sin embar- pendencia de la memoria, obtener un registro que preservará tanto como sea
go, otros pueden eliminarse mediante entrenamiento. Las sesiones de prác- posible los detalles significativos de la conducta original y diseñar un procedi-
tica, en las que dos o más observadores registran la misma muestra de con- miento de registro que interfiera tan poco como sea posible en el proceso de
ducta, comparan sus anotaciones, discuten sus discrepancias y reconcilian observación del niño.
sUs diferencias, permiten incrementar la unifermidad, así como las sesiones
de práctica observadas y criticadas por un observador entrenado. Mediante ESTUDIOS ILUSTRATIVOS EN LOS QUE
tales procedimientos se logra una uniformidad de interpretación y una apli-
cación estándar de las categorías de observación. SE EMPLEÓ LA OBSERVACIÓN DIRECTA
Las maneras como se ha empleado la observación directa al estudiar los
aspectos de la conducta del niño y el impacto de las experiencias educativas
Mecánica de registrar las observaciones sobre. él, se pueden explicar mejor por medio de ejemplos seleccionados.
Hemos escogido varios ejemplos de procedimientos observacionales y proble-
A fin de registrar los datos observacionales de manera precisa, es esencial mas distintos para aclarar la aplicación de la observación directa.
algún procedimiento para el registro inmediato de lo que se observa. Los erro-
res y la selectividad de la memoria forman sesgos en los reportes, aun en los Diferencias de personalidad
sucesos más sobresalientes y poco comunes. Por ejemplo, en los eventos ordi- en los niños recién nacidos
narios y más bien repetitivos que se observan en un niño preescolar, es posible
efectuar el informe adecuado de lo que se ha observado sólo si las observacio- En el estudio que describiremos primero (Bims, 19651 se planteó una pre-
nes se registran inmediatamente. Hay tanto que ver en un solo evento y éste se gunta bastante simple (pero que no necesariamente requiere una respuesta
parece tanto a otro evento, que confiar sólo en la memoria para proporcionar simple): iexisten diferencias consistentes entre los niños recién nacidos? Es
un informe exacto de la conducta de un niño, sería fatal. Es importante tener poco lo que sabemos en cuanto a lo que se puede observar en los neonatos,
en cuenta lo anterior en cualquier intento de registro, completo y sistemático, pero sus respuestas a la estimulación son rasgos observables. Se intentó es-
aunque encontraremos un lugar para describir la observación selectiva y para timular a los bebés con un tono suave, un tono fuerte, con un disco frío y con
el registro anecdótico de los incidentes significativos de la conducta algún un chupón varias veces durante los primeros cuatro o cinco días de su vida.
tiempo después de que ésta haya ocurrido. Cada estímulo se presentaba tres veces en cada una de las cuatro sesiones di-
De lo anterior se infiere que cualquier programa de observación sistemáti- ferentes, y dos o tres observadores entrenados calificaron la intensidad de
ca debe proporcionar alguna técnica para el registro inmediato y eficaz de los la respuesta del infante. Los observadores de los infantes podían registrar sus
eventos que se observan. De los numerosos procedimientos existentes para respuestas como: a) inhibición o disminución de la actividad que se realizaba,
facilitar el registro de las observaciones de conducta, uno que se utiliza b) sin respuesta o el respuesta calificada en una escala de cinco puntos, desde
ampliamente es el diseño de un código sistemático para las categorías de con- una contracción pequeña del ojo, los dedos de las manos o de los pies, que se
ducta que son de interés. ASÍ, las observaciones preliminares servirán para refiere a movimiento en sólo una parte del cuerpo, hasta llanto fuerte y cual-
definir el rango de actos de agresividad que podría esperarse en niños entre los quier actividad~activación total intensa.
tres y los cuatro años de edad. Parte del código podría establecerse de la ma- Se ofrecieron dos tipos de evidencia para apoyar la proposición de que
nera siguiente: g = /{golpes n , e = "empujones", m = "arrebatar el material existen diferenCias individuales consistentes en la sensibilidad. Primero, la
a algún compañero", a = "poner apodos n , etc. Se puede preparar una hoja de sensibilidad a los cuatro estímulos diferentes se comparó con el hallazgo de
registro con espacios en blanco, dividida para representar los segmentos que las correlaciones típicas de intensidad de uno a otro estímulo eran de cer-
de tiempo de observación, y hacer anotaciones codificadas rápidamente, ca de 0.50. Segundo, la sensibilidad se comparó a lo largo de las cuatro sesio-
mientras el niñ9 es observado casi sin interrupción. nes de prueba separadas y se encontró que la correlación típica entre éstas era
Por supuesto, si el observador sabe taquigrafía, podría hacer anotaciones de cerca de 0.40. Estos dos hallazgos se interpretaron como datos que apoyan
más amplias de las observaciones. Estas anotaciones pueden transcribirse, la posición de las diferencias individuales consistentes en un aspecto de la per-
codificarse y calificarse más adelante. En algunos casos, cuando el proyecto de sonalidad, que están presentes aun desde los primeros días de vida.
investigación tiene un apoyo financiero abundante, se podrán hacetregistros
fotográficos o de videotape más completos de las observaciones, que permiti-
rán hacer un registro permanente de las conductas en una forma relativamen- Variables de la personalidad
te completa. Estos registros pueden analizarse posteriormente. Pero este tipo e "identificación"
de recursos son la excepción, y en muchos casos será necesario planear un En el estudio anterior se utilizaron las observaciones relacionadas con la
código simple y eficaz para realizar un registro inmediato y permanente de aplicación de estímulos específicos. Un patrón diferente se muestra en el

' .. .
.. ... ~._ . .. .. .. .. .... ". , . : •. ~, ·· ·~·· t· ••.~~.• > .•_~..~,. , . .•. ... • . .... ; . • ,o ' .
"o" : ; ": ,.\ ,",",
496 CAP. 13. PRUEBAS DE LA CONDUCTA ESTUDIOS ILUSTRATIVOS 497

estudio siguiente /Sears y colaboradores, 1965) en el que las observaciones se La muestra estudiada constaba de sólo 40 infantes,2 20 niños y 20 niñas,
realizaron con los niños que participaban en actividades normales dentro de de manera que las relaciones que se reportaron eran bastante tentativas. De
un programa. Las observaciones proporcionaron una cIase de datos dentro una extensión de relaciones reportadas entre las variables observacionales y
de un estudio más amplio de la identificación de los niños con sus padres. de éstas con otros tipos de medidas, seleccionaremos sólo algunos reactivos
Las observaciones se enfocaron en la dependencia, la agresión y tomar el ilustrativos. En general, las conductas agresivas estaban más 'coherentemen-
papel del adulto. te estructuradas en el grupo en su totalidad que la dependencia o el papel de
El periodo de observación para un niño eñ particular era de 10 minutos adulto; es decir, como una corriente general, el niño que obtenía una pun-
tiempo que se dividía en periodos, cada uno de 30 segundos de duración. E~ tuación alta en un tipo de conducta agresiva tendía a obtener' también una
cada periodo de 30 segundos, el observador registraba la categoría de conduc- puntuación alta en las otras. Sin embargo, para los niños, "chismear" no per-
ta dominante de entre una lista de 29. La designación de algunas categorías es tenecía a una conducta agresiva, mientras que para las niñas l/maltratar obje-
como sigue: tos" no tenía relación con otras conductas agresivas. Sólo para las niñas se
agrupaban diferentes tipos de conductas del papel de adulto, y las conductas
de dependencia tenían una unidad muy limitada y poca cohesión para cual-
Dar información y demostrar conocimiento (papel de adulto)
Usar conductas propias de los adultos (papel de adulto) quiera de los sexos. Parece que la búsqueda activa de atención, basada en
Tocar y abrazar a otros (Dependencia) el desempeño o el producto del individuo, era un tipo muy diferente de con-
Buscar atención de manera positiva (Dependencia) ducta con un significado muy distinto en la economía de vid'adel individuo
Agresión física directa (Agresión antisocial) de una deperidencia mostrada en tocar, abrazar, permanecer cerca o buscar
Chismear (Agresión prosocial) seguridad de un adulto. En términos generales, las relaciones hipotéticas
entre la dependencia y la identificación con los adultos no se confirmaron'
El horario de observaciones estaba planeado de tal manera que un niño con los resultados del estudio.
era observado en diversos momentos del día, durante varios días de la semana
y por diferentes miembros de un equipo de observadores. El número prome-
dio de periodos de observación de 10 minutos para cualquier niño era de 38; Conductas del maestro que influyen en las
es decir, el niño fue observado durante poco más de seis horas en totaL actitudes y el aprovechamiento de sus alumnos
La puntuación para un niño en particular en una categoría de conducta
específica era la proporción de periodos durante los cuales esa conducta se Una aplicación muy diferente de técnicas de observaCión directa la en-
codificaba como la dominante. Las categorías se combinaron de varias formas contramos en el estudio de la estimulación a los alumnos, de lo que sucede
para dar puntuaciones más integradas y estables. A continuación se muestra en la clase y de la relación de la producción de conocimientos o actitudes por
la con fiabilidad de varias de estas puntuaciones combinadas para las series de parte de los alumnos. Flanders /1965) estudió la interacción verbal dentro del
observaciones totales; en cada caso se calculó la correlación entre observado- salón de clases. Los observadQ!es en el salón de clases registraron seis horas de
res, mientras que en la otra forma se calcularon los diferent,es segmentos de la eventos en cada clase. Se hizo un registro casi cada tres segundos, usando la
serie de observaciones. serie de categorías que se muestran en el cuadro 13.1.
El interés de Flanders se centraba primordialmente en el impacto de la
influencia indirecta en las formas de habla del maestro que se compararían
con las formas de influencia directa. Se observaron 16 clases de estudios
Entre Entre sociales y 16 clases de matemáticas, y se compararon las clases de los maes-
observodores periodos trOS más uindirectos" con las de los maestros más udirectos" respecto a las
actitudes hacia el maestro y el aprovechamiento en una unidad estándar que
se enseñó durante el tiempo en el que se hicieron las observaciones. Los
Puntuación tatol-papel de adulto 0.77 0.73 resultados esenciales se resumen en la figura 13.4, en la cual se muestran el
Puntuación totol-dependencia 0.74 0.63 aprovechamiento promedio y las puntuaciones de actitudes para cada gru-
Puntuación total-agresión antisocial 0.8S 0.79 po, así como el rango que se extiende desde una desviación estándar a cada
Puntuación total-agresión prosodal 0.74 0.73 lado de la media. En este estudio, las clases de los maestros más Hindirectos·
mostraron medidas consistentemente más altas tanto en actitudes como en

2 Uno de los problemas prácticos de los estudios que utilizan procedimientos observaciona-
En esta tabla se puede apreciar que seis horas de observación no es mucho les es que el tiempo que se debe dedicar a cada niño tiende a ser tan grande que los sujetos estudia-
tiempo para hacer apreciaciones confiables de estas conductas. dos son pocos y los resultados correspond~,9.tesiío son confiables.
498
Estudios sociales Matemóticas
Cuadro 13.1. Categorías poro el anólisis de interacdón, 1959
Aprovechamiento Actitud Aprovechamiento Actitud

1.* Acepta sentimientos. Acepta y clarifico el tono del sentimiento de los


estudiantes de manero no amenazante. Los sentimientos pueden ser
positivos a negativos. Se induye la predicción o el recuerdo de los
sentimientos
2.- Alaba o aliento. Alaba o aUenta las acciones del estudiante o su
conducto. Hace bromos que relajan lo tensión, pero no o expensas de
Influencio
otro individuo. Lo aproboción con un movimiento de cabezo o por
~ indirecta medio de decir "mm hm" o ·síguele" también se incluyen
:z:
a
e 3.- Acepta o utiliza las ideas del estudiante. Clarifico, construye o desarrollo
~ ideos sugeridas por el alumno. A medido que el maestro propone más
c: de sus propios ideas, cambio o lo categoría S
:~
a
.~
c:
=>
4.- Hace preguntas. Formula preguntas acerca del contenido o de los
e procedimientos con la intención de que el alumno conteste
e
~ "Indirecto" "Directo" -
<> 5.* Dar conferencias. Proporciono hechos u opiniones acerco .del contenido y
~
el procedimiento; expreso sus propios ideos y plantea cuestiones teóricas
6.- Da instrucciones. Da instrucciones, órdenes o mandatos que se espera Figura 13.4. Aptitud y aprovechamiento de las clases enseñadas por maestros' directos'
e ·indirectos· (adaptado de Fkjoders. 1965). .
Innuencia que los aluinnos ejecuten
directa 7.- (ritica o justifica la autoridad. Enunciados que levan lo intención de
cambiar lo conducta del estudiante de inaceptable o aceptable; es Otro ejemplo del uso de las observaciones sistemáticas como una técnica
regañón; afirmo por qué el maestro hoce lo que hoce; autorreferencia para estud~ar a los al~m~~s de la, es~uela elemental y a sus maestros, aparece
extremo en el estudIO de la aphcaclOn de tecmcas de manejo de conducta en el salón de
clases (Rollins y colaboradores, 1974). Los maestros de una escuela urbana
8.* Respuesto. Hablo del estudiante como respuesto 01 maestro. El maestro de ~n ~ivel socioeconómico bajo habían sido instruidos para utilizar los pro-
inicia el contacto o solicita el enunciado del estudiante cedImIentos del reforzamiento positivo con el fin de alentar conductas desea-
Tipo de comunicación 9.- Iniciación. El habla la inicio el estudiante. Si "se llamo lo atención" al bles y actividades académicas en su salón de clases. Antes y después del entre-
del estudiante estudiante, sólo es poro indicar quién puede ser el próximo que hable; namiento se usó la observación sistemática para determinar si los maestros en
el observador liene que decidir si el estudiante quiere hablar o no las clases experimentales incrementaron el uso del reforzamiento positivo y
disminuyeron sus respuestas punitivas, y verificar si los cambios relacionados·
10.- Silencia o confusión. Pausos, cortos periodos de silencio y periodos de aparecían en la conducta de los alumnos.
confusión en los que lo comunicación no puede ser entendido por el . Se fijó ~a observación en ciclos de cinco minutos. Durante el primer
Silencio CIclo, se regIstraron las conductas de reforzamiento positivo y negativo del
observador
maestro; durante el segundo, las conductas disruptivas por part(! de los
alumnos, y durante el tercero, las conductas de atención en oposición a las
• Eltos números no imptKon ninguno escalo. Codo número es dosifico torio, designo uno dose particular de evento de fuera de la tarea. Como ejemplos de conducta dillruptiva aparecieron:
comunicativo. Escribir estos números duronte el tiempo qII9 se hoce la observaci6n significa sólo identificar y enumerar los
eventos cornunkativos. no juzgarlos. pararse del asiento sin autorización, hacer ruidos fuertes, distraer a otros
alumnos al hablarles, picarlos, empujarlos o juguetear con sus pertenencias.
Se usaron periódicamente observadores de verificación y se reportó una bue-
na con fiabilidad entre calificadores.
aprovechamiento. Por supuesto, no queda completamente claro que E! programa de entrenamiento había sido sorprendentemente eficaz para
emplear medidas "indirectas" sea la causa, o el síntoma, de una buena ense- cambIar la conducta del maestro, ya que los maestros en las clases experimen-
ñanza, pero debe ser por lo menos una probabilidad de que el trabajo de los tales Plostraban algo así como cuatro veces más reforzamientos positivos por
maestros puede mejorarse por medio del entrenamiento en usar más las cate- estudiante que los maestros en los grupos control, y aplicaban menos casti-
gorías "indirectas" de la interacción verbal. gos. La observación de los alumnos indicaba tal vez como una tercera parte
500 CAP. 13. PRUEBAS DE LA CONDUCTA 501

menos de actividades disruptivas y un incremento sustancial en el porcentaje Aplicable en una situación natural
de conducta de atención. Finalmente, las ventajas que se mostraron en la
prueba de lectura daban equivalentes de grado cC?mo ·de och~ meses más Una gran ventaja de las técnicas observacionales es que se pueden apli-
en promedio (a lo largo de todos los grados), como sIete D?eses mas en los gru- car a situaciones que ocurren de manera natural en la vida. Las observacio-
pos experimentales, comparados con l.os cua~ro m~s~s ma~ d~ los grupos con- nes no están restringidas a la situación de prueba, aunque vimos, cuando
trol. Así en este estudio las observaCIOnes sIstematIcas sUVIeron para docu- describimos las pruebas situacionales, que la observación siempre contribu-
mentar Íos cambios en los eventos del salón de clases, a los que pudieron ye de manera importante a la situación de prueba. Las observaciones pueden
atribuirse las notables diferencias en cuanto al aprovechamiento del salón de realizarse en la escuela, el jardín de niños, el salón de clases, la cafetería, el
clases. patio de recreo, el campo militar, el lugar de descanso del escuadrón o en
Los ejemplos anteriores tienen algunos métodos de observación directa cualquier otro lugar donde los individuos trabajen o jueguen en un ambien-
empleada de maneras diferentes y aplicada a cada problema. Estos ejemplos te público. Como ya lo apuntamos, existen dificultades y limitaciones prác-
son representativos de los muchos estudios específicos entre los cuales .hici- ticas que surgen al manipular el escenario de la observación, pero a pesar
mos una selección; sugieren el rango de utilidad de esta manera de estudIar al de esto l~ observación directa es el enfoque más ampliamente aplicable para
individuo o a un grupo de personas. estudiar la personalidad del individuo, que opera en un ambiente normal
que no sea de prueba.

VALORES y LIMITACIONES DE LA
OBSERVACIÓN SISTEMÁTICA Utilizable con niños pequeños o con
problemas de comunicación verbal
Acabamos de describir la naturaleza de las observaciones sistemáticas,
para lo cual señalamos algunas de las preocupaciones que son necesarias si La observación es posible con niños muy pequeños, no importa qué tanto
queremos que el procedimiento sea satisfactoriamente confiable y obje~ivo, e lo sean; de hecho, mientras más pequeño sea el niño; más fácil será la observa-
ilustramos la aplicación del método a las diferentes clases de estudIOS de ción. El infante está totalmente inconsciente de lo que pasa a su alrededor y
investigación. Ahora analizaremos la utilidad del método, para lo cual in?ica- hasta de sí mismo, y podemos sentarnos y ver por horas lo que hace sin nin-
remos algunas de sus ventajas y limitaciones coino una forma de estudIar la gún procedimiento o ninguna precaución especiales. COn los niños mayores
personalidad. es necesario ocultar al observador de la vista de los niños que observa o adap-
tar a los niños a la observación. El observador puede quedar separado median-
Ventajas de la observación directa te una pantalla de visión unilateral, de tal manera que pueda ver a los niños
pero éstos no puedan verlo; sin embargo, el requerimiento para dar este
Los procedimientos basados en la observación directa de la conducta de ambiente físico restringe seriamente la situación en la que se hace la observa-
otros individuos, tienen varias características que los hacen atractivos como ción. Más a menudo y más simplemente, el observador se puede presentar a
instrumentos de la evaluación de la personalidad. Algunos de los puntos más los niños por todo el tiempo necesario y funcionar de manera suficientemente
significativos se consideran a continuación. no intrusiva, de tal modo que los sujetos ya no le presten atención, aceptán-
dolo como una parte natural del medio que los rodea.
El valor de la observación directa es mayor cuando sus aplicaciones son
Registro de conducta real más posibles con los niños pequeños. Éstos están bastante limitados en su
habilidad para comunicarse por medio dellenguaje¡ no tienen tanta experien-
Cuando observamos a un individuo obtenemos un registro de lo que hace cia o facilidad para analizar o reportar sus sentimientos o la razón de sus
en realidad; no estamos tratando con sus racionalizaciones ni sus pensamien~ acciones. A menudo son tímidos y resistentes a los extraños, y especialmente
tos. Si nuestros procedimientos observacionales han estado bien planeados y en t:stos grupos la observación directa constituye un importante medio de
nuestros observadores cuidadosamente entrenados, nuestra calificación o acercamiento.
puntuación estará en gran medida libre de sesgos o idiosincrasias del observa-
dor particular. Nuestro registro del individuo no es un reflejo de lo que él
piensa que es o de lo que alguien más piensa que él es¡ más bien, sus acciones Limitaciones de la observación directa
reflejan directamente lo que él es. Si nuestro interés recae en lo que hace el
sujeto o en la manera en que su conducta ha cambiado, las observaciones Los factores que acabamos de describir contribuyen a resaltar el atractivo
de su conducta serán la manera más directa, y en muchas formas la más satis- de la observación directa como una técnica para estudiar a los individuos; sin
factoria, de obtener información adecuada. embargo, este enfoque no constituye la respuesta a todos los problemas de la

,
.¡;,
502 CAP. 13. PRUEBAS DE LA CONDUCTA VALORES DE LA OBSERVACIÓN SISTEMÁTICA 503

medición. Varios factores limitan seriamente la utilidad de las técnicas ob- c~almente dese~ble que el observador no conozca demasiado acerca del estu-
'i, servacionales y varían desde unos muy prácticos y de consideraciones muy dIO que se realIza, no sepa qué tratamiento experimental recibe cada niño
;'1 ' ",
i materiales, que consideraremos primero, hasta puntos teóricos más funda- específicamente y cuáles son las puntuaciones de prueba u otros hechos acer-
i mentales. ca de la persona que se observa. El objetivo de lo anterior es tener un observa-
i. dor que fu.ncione s~lo como un instrumento de registro que es sensible a (y
h.ace el regIst!'o de) cIer:tas categorÍa~ de l~ ~~nducta. ,La mayoría de las precau-
Costo de las observaciones CIOnes descntas antenormente estan dmg¡das haCIa este fin pero cuando
mucho, sólo se ti~n~ ,,:n éxito parcial. ~l obs~rv.ador es un ser human'o, yaun-
Las observaciones son costosas primordialmente por la demanda de que p.odamos minImiZar la mfluencIa subjetiva, no podremos eliminarla.
observadores entrenados. En los ejemplqs anteriores, cada niño o cada clase EspecIalmente cuan~o los fenó~enos que se estudian son complejos o inclu-
fue observado durante varios periodos de observaciones que en algunos casos yen un elemento de mterpretaclOn, debemos estar más conscientes del papel
~e e:ct.endieron a varias horas. Cuando se va a observar a un número grande de que desempeña el observador en el resultado final.
mdiVIduos o a grupos de clases, estas horas se multiplican rápidamente. Las
observaciones directas sistemáticas y los registros de conducta están, por esta
razón, limitados a proyectos de investigaCión, en los que se pueden hacer los
Determinación de las categorías de
compromisos de tiempo necesarios. En las operaciones rutinarias del salón de conducta productivas y significativas
clases no es práctico buscar el potencial humano requerido para hacer obser- que se observarán
vaciones directas de manera rutinaria a cada niño. "
El costo de las observaciones directas no se basa sólo en el tiempo del Cualquier observación es selectiva y sólo ciertos aspectos limitados de la
observador requerido para hacer los registros. Cualquier forma de ambiente conducta del ind!viduo se pueden observar y registrar. Más aún, si se van a
especial o de registro mecánico representa un costo adicionaL Más aún, cuan- usar las observaclOne~ de t;nanera cuanti~~tiva, deberán clasificarse, agrupar-
do el registro original es un informe comente diario, una película o un video. se y contarse. CualqUIer SIstema de claSifIcación es siempre arbitrario como
de la acción de un individuo o de un grupo de individuos, también es probable un marco de referencia que nos imponemos acerca de los eventos infinita-
que el análisis de estos registros consuina mucho tiempo. mente variados de la vida. No siempre es fácil establecer un marco de refe-
rencia que sirva bien a estos ~ropósitos. Por tanto, podríamos pensar que las
categona~ de conducta descntas en el cuadro 13.1 no abarcan bien el rango
Ajuste del observador al ambiente de las aCCIOnes de un maestro, o que los tipos de actividad incluidos bajo un
e?cabezado dado son inapropiados para ese encabezado. Puede ser que cali~
~iempre sur&e la. duda de si debe tenerse a un observador en cualquier fIquemos l~s act.os agresivos en términos de conducta aparente, es decir, gol-
ambiente; es deCir, Si el que observa y toma notas realmente cambia lo que pear, empUjar o agarrar; cuando para nuestros propósitos sería mejor haber
sucedería sin éL En muchas de las situaciones que nos gustaría observar no. es clasificado algo por medio de un evento precipitante (si pudiéramos obser-
práctico tener a un observador invisible. Esperamos, a menudo con justifica- varlo): la agresión en respuesta a un conflicto acerca de la propiedad como
',1
ción, que después de Un periodo inicial de acostumbrarse al observador, todas una reacción a un disparate o como respuesta al impedimento de u~a con-
:1.' ducta en progreso. En cualquier evento, las puntuaciones que se basen en las
las ~ersonas que se observan darán por hecho que el observador está presente
y lo Ignorarán; sin embargo, esto es más fácil de lograr en unas situaciones que observaciones de la conducta no pueden ser más significativas que las cate-
en otras. Cuando un grupo es pequeño, cuando es necesario que el observado.r gorías diseñadas para analizar esa conducta.
siga sus actividades muy de cerca o cuando el grupo se reúne por un tiempo
de.masiado corto para acostumbrarse a ser observado, es probable que los
mIembros del grupo no tengan mucho éxito para pensar que el observador es Determinación del significado de un
como un mueble. reactivo de conducta aislado
Debido a la necesidad de lograr confiabilidad y objetividad, se ha centrado
Eliminación de subjetividad y la atención de las observaciones en actos discretos y relativamente pequeños,
prejuicios o por lo menos se ha dividido el análisis del material de observación en actos
~iscretos y pequeños. Cuando se hace esto hay un peligro real para el signi-
Cuando se emplean los procedimientos observacionales es necesario fIcado de la conducta, pues la verdadera significación de la acción se puede
tener todas las precauciones posibles para mantener las interpretaciones del perder. Observamos que el niño de tres años A da un abrazo al niño B, de la
observador y los sesgos y prejuicios de éste fuera de su observación. Es espe- misma edad. iEs éste un acto de afecto?, iO es, como suele ser en esta edad, un

.. , ...
".,~..; ,':':. ', . .. .... " . ; O" . ~' . : ' • ••
504 CAP. 13. PRUEBAS DE lA CONDUCTA
OBSERVACIÓN INFORMAL 505

acto de agresión? Si sólo se considera la obstErvación, no podemos responder. La respuesta a las preguntas anteriores recae parcialmente en la falibilidad
Ahora bien, supongamos queA le pega a B. Este parece ser claramente un acto de la memoria humana y en la inadecuación de los seres humanos como
de agresión, pero ¿qué significa en la economía de vidadeA?, zes una reacción ensambladores y combinadores de hechos acerca de otra persona. Hacemos
saludable de ajuste a la primera dominación de B, una defensa natural de recu- muchas observaciones respecto de otras personas, pero hacemos tantas que
peración de su lugar anterior respecto a m, iO es una agresión displicente se mezclan en nuestra memoria, y sólo retenemos algunas de las experien-
construida por la dominación en el hogar por su padre o por un hermano cias más sobresalientes con toda su individualidad. Incluso éstas terminan por
mayod, ¿o significa muchas otras cosas? distorsionarse y deformarse con el paso del tiempo, y la forma como se distor-
sionan los recuerdos más agulios y claros, junto con el estado de excitación
nerviosa producido por los recuerdos de nuestras experiencias ordinarias coti-
Carácter externo de la observación dianas, depende tanto de la capacidad del que recuerda como del evento mis-
mo. Nuestra reacción general hacia un niño, considerado con todos nuestros
De los ejemplos anteriores se deduce que las observaciones son externas, y prejuicios, junto con todo lo que hemos oído decir de él o con nuestras prime-
esta "exteriorización" se exagera cuando los segmentos de la conducta se ana, ras experiencias con él, proporciona un marco de referencia en el que nos ubi-
lizan fuera del contexto. Pero esta "exteriorización" es una característica fun- camos después de nuestras observaciones. Todas las dificultades que surgen
damental de cualquier enfoque observacional al estudiar la conducta. Siempre cuando se evalúa la personalidad, que se han examinado en el capítulo ante-
afrontamos el problema de determinar el significado de la conducta y debe- rior, son pruebas de la falibilidad de la impresión general y de la memoria sin
mos reconocer que lo que tenemos enfrente es sólo lo que la persona hace, control. Por contraste, el registro de un evento es un dato confiable que per-
más no lo que esto significa. manecerá sin cambio desde el tiempo en que se hizo hasta que necesitemos
referimos a él. Un conjunto de este tipo de registros proporciona una eviden-
cia estable en la que se pueden basar apreciaciones posteriores.
OBSERVACIÓN INFORMAL. EL REGISTRO Una razón más para no confiar en las impresiones resumidas que se
obtengan de un niño, como las reporta el maestro a intervalos, es que este tipo
ANECDÓTICO de reportes generalmente no han dado pruebas de aportar ninguna informa-
Las observaciones continuas y sistemáticas de la conducta de los alum- ción o de ser útiles. Normalmente estos reportes tienden a ser prejuiciados en
términos generales, y a menudo moralistas, evaluadores más que descripti-
nos consideradas en la sección previa son esencialmente herramientas de
investigación que requieren demasiado tiempo para ser prácticas y normal- vos¡ asimismo se refieren más a las reacciones del maestro hacia el niño que al
mente son demasiado especializadas para resultar útiles dentro del salón de niño en sí. Por ejemplo:
clases a los maestros que pretendan comprender mejor a sus alumnos. Sin
embargo, cada maestro observa a sus alumnos día a día, de modo que no hay Guillermina no trabaja ni cercanamente tan bien como debería hacerlo. Pare-
ninguna razón que prohíba que estas observaciones se registren informalmen- ce que es una niña muy inteligente y trabaja bien cuando verdaderamente lo
te como una guía para aumentar la comprensión propia y delinear los aspec- intenta con ganas¡ pero a veces puede dar mucha lata.
tos que después tratarán con los mismos alumnos. Estos reportes de las obser-
vaciones informales de los maestros acerca de sus alumnos han recibido el ¿Qué es lo que de verdad aprendemos acerca de Guillermina?, ¿qué opor-
nombre de registros anecdóticos. tunidad tendremos de entenderla mejor o de trabajar con ella de manera más
¿Por qué deben registrarse las observaciones?, ¿qué debe observarse?, ¿que; eficaz? Tenemos una imagen bastante buena de la insatisfacción de la maes-
debería registrarsd, ¿cómo deben mantenerse estos registros?, zqué pasos de- tra, pero muy poco conocimiento fáctico de la naturaleza de esa niña.
ben darse para organizarlos y resumirlos?, ¿qué problemas son los que más Hacer un registro de una observación de la conducta de un niño, un regis-
comúnmente se encuentran para hacer y utilizar los registros anecdóticos? tro rápido mientras la conducta está todavía fresca en la mente, puede ser un
Éstos son algunos de los puntos que consideraremos a continuación. correctivo para las limitaciones y distorsiones de la memoria. Este tipo de
registro puede convertirse, en la práctica, en el proveedor de un reporte relati-
vamente objetivo y directo de las acciones, manteniendo al mínimo las reac-
¿Para qué hacer un registro! ciones del observador.

Obviamente, los maestros aprenden de observar a sus alumnos, pero Durante la clase de pintura, Guillermina empezó a ~rabajar con mucha lenti-
¿para qué registrar las observaciones por separado?, ¿por qué no confiar en la ·i ud. Dejó de trabajar varias veces durante el periodo de ·Clase para caminar por el
memoria del maestro para resumir en su propia mente las observaciones que salón y observar lo que hacían otros niños y para decirles lo que no estaba bien en
hace día a día y pennitirle que reporte su evaluación de un alumno en enun- sus dibujos. Berta y Juana le dijeron, cada una por su parte, que no se metiera en lo
ciados al final del semestre o en una serie de calificaciones? que no le importaba y que las dejara en paz.
506 CAP. 13. PRUEBAS DE LA CONDUCTA OBSERVACIÓN INFORMAL 507
Este tipo de anotación proporciona un punto de información fáctica que métodos más objetivos y exactos. La habilidad intelectual, el aprovecha-
puede ayudarnos a conocer y entender a Guillermina¡ es un extra~to especí.fi- miento académico y las habilidades creativas se evalúan mejor por medio
co de la conducta, que, junto con varios otros, puede ofrecer una Imagen fac- de pruebas estandarizadas o por el producto de los alumnos. Primordial-
tica y significativa de la niña. . . . mente, podemos aclarar los aspectos de funcionamiento o de ajuste social a
Finalmente, una serie de registros observacIOnales proporcIOnan un tIpO los problemas personales mediante los registros de incidentes de la conduc-
de documentación para hacer un reporte acerca de una pe~sona, ya se.a pa~a l~s ta escolar. La interacción de un niño con otros en el salón de clases, las evi-
autoridades escolares, los padres o una empresa, que ~e da ImportancIa y slgm- dencias de aceptación o rechazo, la agresión o el aislamiento, los eventos
ficado al reporte. De la misma manera que un enuncIado a~erca ?el desempe- que ayuden a comprender el papel que desempeña el niño en su grupo y las
ño académico es más convincente cuando se basa en la eVIdenCIa del desem- reacciones del niño, son las conductas que se ajustan a los registros anecdó-
peño sobre una prueba objet~va" lo.s enunciados ace~c~ de l~s r~laciones ticos. Las indicaciones de tensiones personales y de adaptaciones a ellas, el
interpersonales parecen ser mas factIcos y menos subjetivos SI estan docu- estado de ánimo habitual y el temperamento o las crisis y los ajustes espe-
mentados con una serie de casos reales de la conducta que se reporta. ciales, es lo que vale la pena registrar. En cada caso podríamos preguntar-
nos: ¿qué mostraría este incidente al lector del reporte que no conoce al
f
',o iQuién debe ser observado~
niño (por ejemplo, un asesor o un maestro subsecuente), que no pudiera
encontrar de ninguna manera más simple y objetiva?

Los registros anecdóticos pueden servir a ~os tipos ~i~tintos de propósi-


tos. Un primer propósito consiste .en proporcIo~ar practIca a lo.s, ma~stros Material que debe incluirse en la anécdota
para estudiar a sus alumnos, con el fm de profundI~ar su c?mprenSIon e mcre-
mentar sus discernimientos de simpatía. Si los regIstros SIrven como parte de Un registro anecdótico debería ser un reporte preciso y fáctico de un
un programa educativo de servicio interno en el estudio del niño, sería conve- evento en la vida de un niño, registrado con lo suficiente del ambiente y los
niente concentrar las observaciones en dos, tres o por lo mucho cuatro alum- detalles necesarios, de tal manera que sea un hecho significativo de conducta.
nos. Esto permitirá completar las observac!on~s e integrar un reJ?orte !lue no Este reporte no es fácil de preparar, pues las experiencias con los maestros que
sería posible realizar de otra manera. Ordmanamente, se seleccIOnana a los empiezan a tratar de escribir anécdotas acerca de sus alumnos indican que hay
1¡. ,'
.,' niños para observarlos en términos del interés e.special que muestre el maestro tres desviaciones comunes de esta prescripción, a saber:
hacia ellos¡ sin embargo,. es probable que sena J?oco ~fortunado cent~:r la
atención de modo exclUSIVO Oaun de manera pnmordlal, en los casos pro- l. La anécdota evalúa, en vez de reportar. La anécdota se refiere a la reac-
blema". Hay mucho que apr~nder e ilustra mucho acerca del niño co~ p.roble- ción del maestro hacia el niño. l/Hoy Juan se portó muy difícil" es un reporte
mas especiales al estudiar al niño "normal" con sus problemas, pecuhandades acerca de cómo sintió el maestro a Juan, más no de lo que éste hizo.
e idiosincrasias. 2. La anécdota interpreta, en vez de reportar. La anécdota da las conclu-
En las escuelas donde los registros anecdóticos se han vuelto parte de un siones del maestro en cuanto a las razones de la conducta del niño, en vez de
sistema de registro básico acumulativo, las anécdotas pueden repo~tarse para reportar lo que realmente ocurrió. Por ejemplo, un reporte dice: "Óscar no
cada niño en cada clase. En este caso, sería naturalmente necesano conf.~r­ pudo estarse quieto en clase. Está creciendo tan aprisa que se muestra inquieto
marse con una muestra mucho más limitada de observaciones para cada mno todo el tiempo". La segunda oración es una pura interpretación basada en una
en particular.. evidencia extremadamente pobre, que no revela nada acerca de lo que suce-
dió. Las expiicaciones e interpretaciones son muy válidas cuando se piden, si
se mantienen sólo corno tentativas y se piensan como hipótesis para una prue-
iQué debería registrarsd ba posterior, pero deben distinguirse claramente de una descripción. La fun-
ción primordial de los registros anecdóticos es la descripción de la conducta
Esta pregunta se divide en dos: ¿qué incidentes ~eberían ser los adecuados del niño.
para el registro? y ¿qué debería incluirse en el regIstro de cada uno? 3. La anécdota describe en términos generales, más que de manera
específica. Un reporte de este tipo sería como el siguiente: "María IlO es bien
aceptada por los otros niños de la clase. Normalmente, ella se para en las
Puntos que vale la pena registrar orillas del patio a la hora del recreo y no participa en los juegos". Este enun-
ciado resumido quizá tenga algún valor para dar una imagen de la niña¡ sin
Los registros anecdóticos proporcionan una imaget;i al~a!l1ente cua~ita­ embargo, carece de objetividad y concreción, que es lo que caracteriza a la
tiva e informal de ciertos aspectos de la conducta de un mdIv~duo. N o ~Iene descripción de un evento específico simple. Dicho enunciado incluye más de
caso usarlos para aspectos de la conducta que pueden apreCIarse medIante selección y evaluación que lo necesario para material básico crudo.

, .
.. ..
.~ " ," ..... ~.; • ·"-:"':'.'}ir: i~-::'):' !'~' ~.:' ~', : ~; ~: .'
r
·Ji
/J
I
508 CAP. 13. PRUEBAS DE LA CONDUCTA OBSERVACIÓN INFORMAL 509

Un buen registro anecdótico tiene las características siguientes: queta y tuvo otros.dos o tr~ pl~itos an~es de la hora de la comida. Se quedó sola
despues de la connda y no Jugo con nmguna otra niña.
¡~sto es poco común en Beatriz. Generalmente, aunque es temperamental
a) Da una descripción exacta de un evento específico. cae bIen y es el centro del grupo.)
b) Describe el ambiente de manera suficiente para que el evento tenga un
significado. :
e) Cuando incluye la interpretación o evaluación hechas por el observa-
dor, éstas se separan de la descripción y su estatus diferente se identi- ¡Por qué deben llevarse registros anecdóticos?
fica con claridad.
d) El evento que describe se relaciona con el desarrollo personal del niño El formato mecánico exacto de los registros anecdóticos es de importan-
o con sus interacciones sociales. cia secundaria si se compara con las consideraciones de contenido; sin
e) El evento que describe es representativo o significativo de la conducta embargo, la utilidad de los registros dependerá de la facilidad con que pue-
típica del niño porque es notoriamente distinto de su forma común de dan ensamblarse, estudiarse y resumirse los registros para un alumno en par-
conducta. Si la conducta es poco común en ese niño, este hecho debe ticular. También es importante que sea mínima la molestia mecánica de
anotarse. mantener los registros. Uno de los principales problemas prácticos al usar
los registros anecdóticos ha sido la cantidad de molestia que ellos imponen
Las siguientes anécdotas se adaptan bastante bien a las especificaciones a los empleados.
anotadas anteriormente. Nótese que no se intenta reproducir las anécdotas en Si un registro anecdótico va a ser un registro fiel de un evento, deberá
oraciones completas. Se pone el énfasis en la facilidad del registro, más que tomarse tan inmeditamente como sea posible, mientras el recuerdo del evento
en la elegancia gramatical. Para usted puede ser importante verificar punto perdure. Desafortunadamente, rara vez es posible realizar el registro anecdó-
por punto y considerar la manera de cambiarlas para hacerlas más útiles y sig- tico inmediato. Cuando mucho, pasa algún tiempo antes que el observador
nificativas como datos acerca del niño. esté libre por un momento para poder hacer las anotaciones del registro de la
conducta. Este intervalo debe mantenerse tan corto como sea posible, y de
Clase: SA Alumno: Enrique K. Fecha: 15/3/76 preferencia debe hacerse el registro el mismo día que se observó la conducta.
La forma apropiada para mantener los registros dependerá del propósito
La clase trabaja como grupo. Ricardo funciona como coordinador. Se discu- primario para el que se ha decidido mantenerlos. Si los registros sirven como
ten planes para trabajar el tema "Visite su escuela esta semana". Enrique alza la guía para que el maestro estudie a dos o tres niños en particular, podrán tener-
mano y trata de hablar casi continuamente; interrumpe a otros niños cuatro o se en forma de dos o tres diarios separados. Las entradas sucesivas que se ano-
cinco veces. Las interrupciones son altamente tendenciosas o de comentarios ten deberán fecharse e incluirse en secuencia dentro del cuaderno, en hojas
chistosos. Cuando Ricardo le dijo que se le hacía a un lado porque alguien más para máquina de escribir, tarjetas de archivo o fichas. Cuando los registros se
estaba hablando, Enrique contestó: "Tú estás loco", y ya no puso más atención a
la discusión.
hacen esporádicamente acerca de todos los alumnos de la escuela, como parte
¡Esto es típico de la conducta de Enrique. Busca atención de manera agresiva, del sistema de registro acumulativo de ésta, es necesario un método más uni-
después se aísla y se siente rechazado.) forme de registro que facilite archivar los registros de cada niño¡ algo similar
a una carpeta de archivo individual. En estos casos, una hoja tamaño carta ha
mostrado serlo más útil. La forma de registro debe contener un espacio para
Clase: 8D Alumno: Pedro Y. Fecha: 25/4/75 identificar la información (clase, alumno, fecha, persona que hace el registro),
la an~cdbta misma y la posibilidad de un comentario evaluativo.
Después del almuerzo, Pedro estaba durmiéndose al desarrollarse la discu-
sión acerca de los estudios sociales. Miraba a la distancia y después cerró los ojos.
Volvió a tener una mirada fija cuando se le habló. Pareció estar atento durante
algunos minutos, después volvió a quedarse dormido. Estuvo soñoliento duran- iQué debe hacerse para organizar y
te todo el tiempo. . resumir los registros?
¡Lo mismo ocurrió varias veces en las últimas dos semanas. ¿Acaso hay algo
que impide a alumnos dormir lo suficientd, ¿qué será?) Cada registro anecdótico original es un punto informativo acerca del
individ':!o. Una serie de registros contienen un conjunto completo de tales
Clase: 6B Alumna: Beatriz R. Fecha: 6/10/75 puntos mf<?rmativos, pero los datos no son útiles, a menos que se organicen,
resuman e mterpreten. Los datos en las pruebas de inteligencia del tipo de la
Al llegar a la clase después de la hora de recreo, Beatriz dio una cachetada a prueba Binet consisten en una serie de respuestas o reactivos específicos que
Susana, por razones desconocidas. Mientras se sentaba, tuvo una discusión con se resumen en una edad mental o en un CI. No obstante que los elementos
Juana acerca de la posición de un lápiz. Más tarde en la mañana, pellizcó a Enri- significativos de una serie de registros anecdóticos no pueden ser resumi-
1:
1: CAP. 13. PRUEBAS DE LA CONDU CTA
OBSERVACIÓN INFORM AL 511
510
Ji.:
,~
nar-
dos de manera tan simple, se deben incluir los puntos inform ativos
en una registros. escolares, estos registros pueden ser más específ icos y relacio
lo.dese~ ~le. , . la conduc ta del niño, si las muestr as de esas con-
imagen organiz ada del individ uo, que es n<?rma lmente se más duecta mente con
A intervalos, tal vez cada semestr e o mas a menud o, SI el mno esta baJo ductas están dispon ibles.
anotar 5. COl} patrones pote?cia1es. En un nivel más alto (por ejemplo, enalguna escue-
estudio intensi vo, las anécdo tas de ese niño deberá n revisarse. Se deben recome ndació n o
los patrone s de conduc ta recurrentes, hacer notar cualqui er cambio progres i- las profeslO nales)~ ;s pOSIble prepa.ra r una carta de
uo, como lo muestr an sus propias anécdo - fo~a de evaluaclOn para el, e.studIante. Esta evidencia está disponi
ble en el
vo y prepara r un esbozo del individ clínico que
tas. Se debe relacionar el materia l anecdó tico ton otros hechos ya conocid os conjun to de re~ortes . anecdot I~oS de la clase o en el desemp eño
acadé- puede dar la eVIdenCIa que guIe y apoye tal evaluac ión.
acerca del niño: su salud, su habilidad intelectual, su aprove chamie ntoetación
mico, los entorn os y patrone s familiares. Debe intenta rse una interpr
se consi-
tentativa de estos patrone s si se quiere que cualqu ier interpr etación
dere una hipótesis. En resume n, como en los registros, deberían manten. .
erse iQué proble mas surgen al hacer e
claram ente diferenciados un resume n descrip tivo y una interpr etación interp retar los registr os anecdó ticosl

En las s~cciones pre~i~s ind~camos varios problemas que se present an al


puntos se examin arán en esta
iQué uso se puede dar a los registr os anecdó ticos? usar los registros anecdotlcos. Estos y otros
sección.
-
Como cualqu ier otro proced imiento de evaluación, los registros anecdó
identifi car varios usos
ticos tienen valor sólo si van a ser usados. Se pueden
.apropiados para ellos, a saber: Problemas que surgen al selecc ionar
los punto s de inform ación
l. Por la persona que hace los registros. Como ya se hizo notar con ante~ uo es
y la El número de anécdotas que pueden escribirse acerca de un individmente
rioridad, tanto el proceso de los registros acumul ativos como el estudio r
organiz ación de los resulta dos deberán ayudar al q~e los hace a e~tende casi ilimitado. El registro escrito debe consistir en una fracción relativa
ativas
mejor a la person a bajo estudio . Se espera que una sene de estos estudIO t~s
S pue- pequeña de anécdotas escogidas por el observador como las más signific ados
da propor cionar más discern imie~to s general es, en cuanto a las re~pue~ o las más típicas de determinado niño. La calidad de los datos acumul signifi-
sociales y motivacionales del estudIante en el salon de clases o en la sItuaclO
n depende de la agudeza y la imparcialidad de esta selección. Tanto la -
laboral. . cancia como la veracidad de la imagen depend erán de la habilidad del observa
s o puntos inform ativos registra dos que real-
2. Por los maestros posteriores. Las observaciones anecdóticas acerca
de dor para seleccionar los reactivo ción
un niño pueden ofrecer a un maestro posteri or una base para empeza r a com- mente sean aclaratorios y representativos. Los sesgos en la observa
en la sección como en el registro de los pun-
prender al niño y evaluar sus triunfo s y dificultades. Existe una preocu
pación pueden fácilmente aparecer tanto selec-
legítima acerca de si las evaluac iones negativ as o positiv as de los maestro s tos informativos. Para un niño que no le simpatiza al maestro, es fácil
en las que el niño muestr a su aspecto
anteriores prejuician al maestr o en turno y hacen que éste se encuen tre en des- cionar y registrar sólo las situaciones del
mar- negativo. Si el maestr o tiene una preocu pación mayor de lo norma l acerca
ventaja en futuros desarrollos¡ pero esta preocu pación es mucho menos Si el aprovechamiento académico o respect o de un salón que se manten ga en
el registro anterio r es un reporte de muestr as de conduc ta. o de
cada cuando orden, los incidentes acerca de los niños que no aprove chan los estudio s
dar .un
reporte es primor dialme nte descriptivo, más que evaluativo, puede SOCIal. los que desordenan pueden tomar un papel domina nte en sus registro s. Es
antecedente valioso para interpr etar las accione s en el nuevo grupo de anécdo tas
muy difícil saber qué tanto sesgo se incluye en un conjun to
3. Con los padres. Los maestro s afronta n la import ante responsabilidad median te la selectividad de este tipo, pero el problem a es real.
la máxi-
de reporta r a los padres, y es muy deseable que estos reporte s tengan apoyen
ma credibilidad. Para que el maestr o pueda citar casos específicos que
o de las
los enunci ados de su reporte acerca de las conduc tas interpersonales Problemas relacionados con la forma
que de
interacciones sociales, estos reportes propor cionan una credibilidad de redact ar la anécdo ta
otra manera no sería más que un juicio muy subjetiv o.
un
4. Con otro person al de la escuela, En los casos en que se solicita a que
asesor, un maestr o especia l o un psicólo go escolar para trabaja r con u~ Al redactar la anécdo ta surgen dificultades en cuanto a las tendencias, i-
educat ivos o de p~rsonab­ ya hemos conside rado, a incluir la evaluac ión, la interpr etación y las general
niño en particu lar en relació n con sus proble mas estilo
dad es de mucha ayuda identif icar los problem as, en parte, medIan los
te las dades y dejar fuera la descripción fáctica específica. Los problem as de debe
ocasion alment e puntos de interés. En este aspecto
obs~rvaciones de las muestr as de su conduc ta. Una vez más, cuando literario tambié n son por la
enunci ados narrati vos periódi cos están anotad os en formas de reporte
o en recordarse que las anécdotas se valoran no como joyas literarias, sino

," ,:
..... '.. :¡ . .... . ' . . ;1 . , : ... . .. ..." .. ,.,,:... ", :''',:. ,', . . >:.', :. ,.,,' " .. .. ':~ ...
512 CAP. 13. PRUEBAS DE LA CONDUCTA RESUMEN 513

información que proporcionan. La brev~dad y la claridad, más n? la elegancia rizan las relaciones sociales, los hábitos de trabajo o la apariencia personal del
literaria, son los objetivos, aun cuando se describe en frases nornmales y no en niño_ Éstos no son registros anecdóticos en sentido estricto, porque no están
oraciones completas. basados en observaciones del niño de manera directa; son resúmenes, aprecia-
ciones subjetivas acerca del niño, que incluyen cualquier aspecto que según el
maestro se ajusta al registro. Aunque estos registros seudoanecdóticos pue-
Problemas relacionados con la carga den tener algún valor, deben reconocerse por lo que son, y no confundirlos
para los empleados con el tipo de registro que acabamos de examinar.

U no de los problemas prácticos más serios en cualquier programa escolar


de registros anecdóticos es la pesada carga de preparar, archivar y resumir los Evaluación resumida de los registros anecdóticos
registros. Estos problemas limitan el uso sistemático de los registros anecdóti-
cos a los jardines de niños, donde las clases son pequeñas y se da mucha Un registro anecdótico proporciona un medio de registrar las observacio-
importancia al desarrollo personal-social, así como a las escuelas públicas en nes de un punto significativo de la conducta del alumno. Cuando el maestro
las que los recursos están muy por encima del promedio nacional. Si se tiene ha desarrollado esta habilidad para seleccionar los incidentes y describirlos
en cuenta el trabajo que implica un programa de registros anecdóticos para el objetivamente; cuando la mecánica de la manutención de los registros y la
personal escolar, cualquier sistema escolar empezará el registro anecdótico de tarea de resumirlos se mantiene dentro de límites razonables, y cuando los
manera cautelosa. Los registros deberán probarse primero con unos cuantos registros los pueden utilizar todos aquellos que estén interesados en entender
alumnos en cada clase y gradualmente expanderlos, sólo si en efecto propor- al alumno de manera individual, los registros anecdóticos podrán ser una ayu-.
cionan información útil. Los procedimientos de registro deben mantenerse da significativa para quienes trabajan con niños.
tan simples como sea posible. El estilo literario y la elegancia del formato
deberán minimizarse.
RESUMEN

Problemas relacionados con el uso Un enfoque para apreciar la personalidad es la medición u observación
directa de algunos aspectos de la conducta. Podemos intentar inducir conduc-
Como cualquier otro procedimiento de evaluación, los registros anecdó- tas típicas mediante situaciones de prueba reales, como aquéllas representadas
ticos son útiles sólo si van a ser usados. Se debe tener cuidado de que estos por las pruebas de honestidad de May y Hartshome. Estas pruebas tienen la
registros no se conviertan en un fin por ellos mismos, sino que deben ser ac- ventaja de que pueden calificarse tan directa y objetivamente como una prue-
cesibles; deben resumirse periódicamente, de manera que el usuario pueda ba de habilidad; sin embargo, son muy complejas para efectuarse, tienen con-
referirse a un resumen conciso. El personal escolar debe ser alentado y entre- fiabilidades modestas, producen resultados que parecen específicos de la
nado para usarlos. situación de prueba en particular y no son rápidamente adaptables a muchos
Un problema específico es el sentimiento por parte de algunos maestros de los aspectos de la personalidad en los que estamos interesados.
de que no desean prejuiciarse osesgarse mediante los comentarios de maes- Un grupo de técnicas para obtener y evaluar la conducta que ha recibido
tros anteriores acerca de un niño. Cuando los comentarios del maestro ante- mucha atención en los últimos 40 años comprende las técnicas proyectivas.
rior son primordialmente una expresión de sus reacciones hacia el niño, con Estas pruebas proporcionan una muestra de respuestas a materiales estímulo
gran prejuicio personal, esta falta de voluntad de los maestros es comprensi- relativamente desestructurados, y las respuestas se analizan y se interpretan
ble_ Cuando las anécdotas y el resumen son fácticos y descriptivos no hay nin- para dar un amplio rango de inferencias acerca de la persona que las produjo.
guna razón para objetar esta información. Es tan importante para el maestro La evidencia de la confiabilidad y la validez de las inferencias resultantes se
empezar el año con la información acerca del estatus del desarrollo personal confunden y casi no podríamos recomendar estas técnicas con confianza. En
y social del niñó, como lo es estar informado acerca de su capacidad para la cualquier caso, el uso de estas técnicas debería limitarse a los especialistas que
lectura y de sus habilidades numéricas. han tenido un entrenamiento extenso en su calificación e interpretación.
La prueba situacional representa un compromiso entre una prueba están-
dar y un procedimiento observacional. Se diseña una prueba con una situa-
Registros seudoanecdóticos ción parecida a la vida real, para poner al alumno en ella. De manera típica, es
una situación social que implica algún tipo de interacción con otros indivi-
En los archivos de muchas escuelas existen registros a los que podríamos duos y que está estructurada para destacar las facetas de la personalidad en las
denominar seudoanecdóticos. Estos registros consisten en una serie de enun- que esté particularmente interesado el investigador. Las·discusiones o los pro-
ciados narrativos y evaluativos hechos por los maestros, en los que se caracte- blemas de grupo y su resolución representan un tipo promisorio de situación;
514 CAP. 13. PRUEBAS DE LA CONDUCTA 5 15
sin embargo, la conducta del examinado se evalúa con base en la observación PREGUNTAS Y EJERCICIOS
y las calificaciones. Esto permite mayor libertad en la planeación de u.na situa-
ción de prueba, y se pueden observar muchas clases de conductas mterper- l . En sus estudios acerca de la honestidad, Hartshome y May reportan correlaciones
sonales_ bastante bajas entre diferentes pruebas de conducta de honestidad. Si esto también
La conducta que ocurre en situaciones naturales también se ha estudia- es válido para otras cualidades, ¿qué significado tiene para nuestra comprensión
do mediante las técnicas de observación directa. Los pasos que se han dado de las personas!
para perfeccionar las observaciones cotidianas que hacemos de las personas 2. Trate de diseñar varias pruebas de conducta para algún rasgo que no sea la hones-
incluyen: tidad.
3. ¿Qué bases existen para esperar que funcione una prueba proyectiva?, ¿por qué
al Limitación de la observación a un solo aspecto de la conducta. somos. capaces de decir algo acerca de la persona a partir de sus respuestas a los
materiales de pruebas proyectivas!
bl Definición cuidadosa de las conductas que se ubican en esta categoría.
4. ¿Por qué ha habido tanta divergencia de opiniones entre los psicólogos clínicos y
el Entrenamiento de observadores. los especialistas en medición en cuanto al valor de las pruebas proyectivas!
dI Cuantificación de las observaciones, como un procedimiento de 5. ¿Cuáles son las ventajas más obvias de procedimientos tales como las discusiones
tomar muchas muestras pequeñas o cortas. de grupo sin líder, las de "dentro de la canasta" y los juegos de administración, en
el Diseño de procedimientos para la codificación y el registro de las comparación con las pruebas de habilidad de papel y lápiz?, ¿qué problemas espe-
observaciones. ciales presentan estos procedimientos!
6. Planee una prueba situacional para utilizarla en una escuela o en una situación
La observación directa tiene las ventajas siguientes: industrial. ¿Qué esperaría obtener de esta prueba que no pudiera obtener por otros
medios?, ¿cuáles serían las dificultades de usar esta prueba de la fonna como usted
la ha propuesto!
al Representar una conducta real. 7. La discusión de grupo que tiene lugar en la mayoría de las clases, ¿cómo podría ser-
bl Ser aplicable a las situaciones naturales de la vida. vir de base para la observación sistemática! Haga un plan para registrar estas
el Se puede usar con niños pequeños y, en general, con quienes sea difícil observaciones.
la comunicación verbal. 8. En un estudio de investigación usted propone usar las observaciones sistemáticas
de los niños de una determinada escuela como un método para estudiar su ajuste
Sin embargo, los procedimientos observacionales tienen múltiples pro- social. ¿Con qué problemas se encontraría!, ¿qué precauciones debería tener para
blemas, entre los que se incluyen: interpretar los resultados!
9. ¿Qué ventajas tienen las observaciones sistemáticas o las observaciones cortas de
muestra de conducta sobre las observaciones de la vida cotidiana!, ¿qué limitacio-
a) El costo. nes tienen estos procedimientos más especializados?
bl
La dificultad para ajustar al observador a la situación. 10. Si usted trabaja en un salón de clases, haga registros anecdóticos de algún niño
el
La dificultad para eliminar los sesgos y prejuicios del observador. durante una semana. Observe con cuidado las guías para realizar un registro anec-
d) La dificultad para fijar categorías significativas y productivas para dótico presentadas en este capítulo. ¿Qué dificultades encuentra al hacer estos
observar. registros?
e) La dificultad para determinar el significado de segmentos aislados de 11. Critique los registros anecdóticos siguientes:
la conducta.
f) El que, inevitablemente, el observador tenga un punto de vista o exte- al IISusana continuó dando lata en la clase. Ella hace mucho ruido y no sólo fra-
rior de la persona a la que observa. casa en su propio trabajo, sino que no deja que los otros niños realicen el suyo.
No sé qué voy a hacer al respecto" .
Las observaciones que se planifican sistemáticamente con horarios bJ IIEugenio tuvo muchos problemas para resolver problemas matemáticos.
pocas veces son prácticas para los maestros, los supervisores de empleos .u Parece que no entendió la forma de reducir las fracciones a un común denomi-
otras personas para quienes la apreciación de la personalidad.es secunda~a nador, pues de varios problemas sólo una vez pudo identificar el mínimo
común denominador".
a otros aspectos de su trabajo. Estas personas pueden usar regIstros anecdo-
ticos informales para acumular información acerca de un alumno o de un
empleado. Las observaciones informales deberían ser reportes fácticos de 12. En algunas situacIones educativas, como la parte clínica dentro de la educación de
puntos significativos dentro de la conducta; deberían evitar las evaluacio- las enfermeras, la evaluación depende totalmente de las observaciones hechas por
un supervisor. Para una situación de este tipo compare las ventajas y desventajas
nes las interpretaciones y las generalizaciones vagas. El registro de las obser- de: al observaciones sistemáticas regularmente programadas y bJ un programa de
vaciones debe mantenerse tan simple como sea posible y revisarse e interpre- registros anecdóticos. .
tarse periódicamente, a fin de proporcionar una imagen organizada de la 13. Obtenga información acerca de las experiencias de varias escuelas o de sistemas de
persona a la que se observó o se está obServando. escuelas en cuanto al uso que hacen de los registros anecdóticos. ¡Cuántas escue-

. .... .; ..
-<.,", ".: .. '. ", :.·:·¡.r.:.;'; .· .• ,
516 CAP. 13. PRUEBAS DE LA CONDUCTA

las emplean estos registros en la actualidad~, ¿con qué tipo de grupos~, ¿qué tipo de
problemas encuentran~, ¿cuántos han tratado de hacerlos y los han abandonado?,
¡por qué razones~

LECTURAS ADICIONALES
Asher, J. J. y Sciarrino, J. A., "Realistic work sample tests: A review", en Personnel
Psycbology, 27, 1974, págs. 519-533. " . .
Banister, D. y Bott, M., "Evaluating the perso~ , en Klme, P.jdu.), New Approacbes
in Psycbological Measurement, John Wiley &. Sons, Nueva York, 1973.
14
Bigoness W. J., "Effect of applicant's sex, race, and performance on employers perforo
man'ce ratings: Sorne additional findings", en Tournal of Applied Psycbology, 61,
1976, págs. 80-84. . .
Brandt, R. M., Studyng bebavior in natural settings, Holt, Rinehart and Wmston, Planeación de un programa
Inc., Nueva York, 1972.
Brown, B. B. Y Webb, J. N., Tbe use of classroom observation tec~niques in tbe eva· de pruebas escolares
luation of educational programs, TM Report 49, ERIC Cleannghouse on Tests,
Measurement and Evaluation, Educational Testing Service, diciembre, 1975.
Fitzpatrick, R. y Morrison, E. J., "Performance and prod1:lct evaluati~n/, en Th0TI?-di-
ke, R. L. jdir.), Educational Measurement, AmerIcan CouncIl on EducatlOn,
Washington, D. c., 1971. . . .
Herbert, J. y Attridge, c., u A guide for developers and users of observatl0n. systems
and manuals" en American Educational Researcb ¡oumal, 12, 197 S, pags. 1-20.
Hinrichs, J. R. Y Haanpera, S., "RealiabiJity of measurement in situational exercises: Supóngase que queremos aplicaruna prueba estandarizada en nuestra escue-
An assessment of the assessment center method", en Personnel Psycbology, 29, la. ¡Qué prueba me recomienda?
1976, págs. 31-40. . ,Estoy en un comité para revisar los programas de prueba para nuestras escue-
Hundleby,J. D., "The measurement of personality by objective tests", .en Kline, P. las. Estas son las pruebas que hemos planeado usar y los grados en los que planea-
jdir.), New Approacbes in Psichological Measurement, John WIley &. Sons, mos aplicarlas. ¡Qué opina usted de este plan?
Nueva York, 1973.
Mayer, S. E. y Bell, A. l., "Sexism in ratings of personality traits", en Personnel Probablemente cada maestro o cada especialista en pruebas y mediciones
Psychology, 28, 1975, págs. 239-249. afronta requerimientos como los anteriores cada semestre. ¿Qué pruebas
Semeonoff, B., "New developments in projective testing", en Kline, P. jdir.), New estandarizadas deberían aplicarse?, ¿cuándo deberían usarse? ¿qué es lo que
Approacbes in Psychological Measurement, John Wiley &. Sons, Nueva York, constituye un programa de pruebas sólido?
1973.
Simon, A. y Boyer, E. G., Mirrors for behavior III: An anthology of observation ins-
truments, Communications Materials Center, Wyncote, Pa., 1974.
LA CARRETA y EL CABALLO
En realidad no hay respuesta para estas preguntas o, más bien, la única
respuesta es otra serie de preguntas. Antes de preguntar ¿qué pruebas debería-
mos aplicad, debemos preguntarnos ¿qué decisiones necesitaremos tomar
para que los resultados de las pruebas puedan ser útiles?, ¿cuándo es probable
que necesitemos hacerlas?, ¿serán para todos o para la mayoría de los estu-
diantes o sólo para unos cuantos?, ¿quién será el responsable de estas decisio-
nes?, ¿el administradod, ¿el maestro?, ¿el padre?, ¿los estudiantes? A menos
que existan algunas decisiones respecto a que los resultados de las pruebas
sean útiles, aplicar pruebas podría ser una empresa bastante fútil. ¿Qué bene-
ficio produciría aplicar una prueba de velocidad de lectura si todos los miem-
bros de la clase estudian lectura juntos desde el primer año y al mismo ritmo?,
¿para qué aplicar una prueba delectura a estudiantes del décimo grado si no se
ha previsto dar trabajo individual diferenciado o instrucción especial de reme-

517
518 CAP. 14. PLANEAClÓN DE PRUEBAS FUNCIONES DE UN PROGRAMA 519
dio? Un programa de pruebas funcional debe diseñarse a partir de necesidades un análisis detallado de los tipos de decisión para los que pueden ser útiles
explícitamente enunciadas para clases específicas de información y para los resultados de las pruebas de aprovechamiento, el capítulo 9 para los usos de
planes acerca de cómo se emplearán los resultados de esas pruebas en la toma las pruebas de inteligencia y de pronóstico, y el capítulo 11 para los usos de los
de decisiones. Un programa de pruebas puede planearse sólo en ténninos de inventarios de temperamento y de ajuste personal.
'. los propósitos a los cuales servirá. Las pruebas proporcionadas que no tienen
;¡ En el cuadro 14.1 se muestra un resumen de los usos más justifica-
H· especificado un uso particular podrían encontrar un uso, es decir, crear su bles para los resultados de las pruebas. Este resumen puede servir como una
!¡: propio mercado, pero esto es bastante difíciL guía para la revisión de las necesidades locales y sus usos; sin embargo la apli-
1::
'~ .
. Este lugar de inicio es la escuela misma, sus programas, sus estudiantes, su cabilidad de estas funciones siempre debe verificarse localmente. Al respec-
personal y las decisiones que necesitan tomar para, con y por los estudian- to, es recomendable preguntarse: "¿podríamos o desearíamos usar pruebas
tes. No es posible que cada maestro determine por adelantado cómo se pue- para este propósito en nuestras escuelas?".
den usar los datos de las pruebas para predecir sus actividades con su clase.
Aprender a utilizar la información de la prueba representa un aspecto de este
desarrollo de servicio interno; pero un programa de pruebas que no tenga re-
lación con las necesidades locales, los recursos y los niveles locales de sofisti- Cuadro 14.1. Funciones de un programa de pruebas
cación tiene muy pocas probabilidades de funcionar eficazmente. La planea-
ción que no se centra en el uso constructivo de los resultados de la prueba y funciones del funciones paro Funciones
.que no permite incrementar la comprensión del personal en su totalidad de las salón de clases asesaría administrativas
pruebas que se usaron en los programas, tiene todas las posibilidades de no
funcionar. Las pruebas se diseñan para aplicarlas, no para archivarlas, y más Diagnóstico de dificultades del Preparación de lo evidencia Asignar a los estudiantes a los
importante para la planeación de qué pruebas dar, es planear cómo se apli- aprendizaje poro guiar discusiones con los grupos del salón de clases
carán estas pruebas. padres acerca de sus hijos
Entonces, la planeación de un programa de pruebas en abstracto o en el
vacío es insatisfactoria. En sentido figurado, definir las funciones y los pro- Evaluación de las discrepancias Ayudar a los estudiantes para
pósitos es el caballo, y la carreta que carga el programa'de pruebas deberá se- Colocar o estudiantes nuevos
entre los potenciales y el tomar opciones inmediatos
guirlo y ser jalada por éL aprovechamiento

Apreciación de los ganancias o Ayudar al estudiante poro Ayudar a determinar lo


FUNCIONES DE UN PROGRAMA del crecimiento en el establecer metas educativas y elegibilidad poro grupos
DE PRUEBAS aprovechamiento vocacionales especiales
o":

El término programa de pruebas, como se usa en este capítulo, se refiere a Agrupamiento de estudiantes Mejorar lo comprensión del Evaluar programas de
..' un programa organizado a lo largo y ancho de la escuela o del sistema, para para la instrucción dentro de
.i :~
;
maestro, del asesor y de los contenido o curriculares,
administrar una batería de pruebas uniforme. Restringimos el uso del término una clase podres de estudiantes que énfasis en el contenido y
a aquellos programas en los que las autoridades escolares locales tienen el representan un problema
control pleno sobre qué pruebas aplicar, cuándo aplicarlas y quién y a quién se experimentos de contenido
van a aplicar. Dicho término no incluye una amplia variedad de pruebas cons-
truidas por los maestros que se preparan para usarlas dentro de una clase o Planeación de actividades Mejorar los relaciones públicos
escuela, los procedimientos de pruebas especializados que pueden realizarse instruccionales poro un individuo
al examinar a algunos estudiantes individuales ni los programas de pruebas
que están controlados por ciertas agencias que no sean las autoridades escola- Identificación de estudiantes que Dar información para las
res locales, es decir, agencias del tipo de la College Entrance Examination necesitan un diagnóstico agencias externas
Board (CEEB) -Dirección de exámenes para el ingreso en la Universidad- o especial y una instrucción
algunos departamentos de educación estatales. correctivo
No obstante que al usar el ténnino programa de pruebas destacamos el
control y las necesidades locales, muchas de las necesidades de la información Determinación de los nivelJ!s de
que la prueba puede proporcionar son comunes en varios sistemas escolares. aprovechamiento razonables
En capítulos anteriores hemos examinado las founas de usar los resultados de poro cado estudiante
las diversas clases de pruebas estandarizadas. Consúltense el capítulo 6 para

.: .....
." " ," . ~'. " " , ' . .~ .
520 CUALIDADES PARA UN PROGRAMA 521

CUALIDADES DESEADAS PARA UN bución a un programa total. Varios aspectos de la integración ameritan nues-
PROGRAMA DE PRUEBAS tra consideración.
En un programa integrado, normalmente sería deseable usar las mis-
mas series de pruebas sobre el mismo rango de grados para los que dichas
¿Cuáles son las características generales de un buen programa de pruebas series sean los apropiados. Por ejemplo, si las pruebas metropolitanas de
escolar? A continuación consideraremos brevemente tres de estas característi- aprovechamiento se emplean para medir el progreso de las habilidades bási-
cas: la relación con el uso, la integración y la continuidad. cas, sería deseable usarlas en cualquier grado desde el primero hasta el sexto, y
posiblemente hasta el octavo o el noveno, donde se utilice una batería de
aprovechamiento. Las ventajas de esto es que las normas están basadas en la
Relación con el uso misma muestra de comunidades de grado a grado y las pruebas están en con-
formidad con un lineamiento común de contenido y formato. Por tanto, las
Como hemos indicado en el cuadro 14.1, existen varias funciones para puntuaciones de un grado al siguiente son más fácilmente comparables, de
las que pueden usarse las pruebas estandarizadas en algunos sistemas escola- tal manera que se puede obtener una imagen más verdadera del avance y des-
res. El primer paso para planear un programa de pruebas para la escuela es arrollo del alumno. .
revisar éstas, y posiblemente otras funciones, y determinar cómo podrían La integración implica particularmente la integración entre las diferentes
emplearse en cada escuela. Entonces, la evaluación debería planearse en rela- divisiones del programa escolar. Las pruebas en la escuela secundaria de nivel
ción con estos usos. Las pruebas deben seleccionarse y también escogerse los inferior deberían planearse en relación con aquellas que se administran en la
momentos en los que se aplicarán, de tal manera que la información necesa- escuela elemental, y aquéllas de la escuela secundaria de nivel superior debe-
ria esté disponible y sea lo más reciente posible en el momento en que se usa- rían tener en cuenta los programas de pruebas del nivel secundario inferior.
rá para ser de alguna ayuda en la toma de decisiones. No es necesario que después de aplicar una prueba de habilidad cognoscitiva
Supongamos que los maestros del primer grado quieren usar los resulta- en el sexto grado se formule una prueba similar al principio del séptimo grado.
dos de prueba para ayudarse a formar subgrupos que traten el problema de la Si se aplican pruebas de aptitud en el noveno grado, solamente se llegarán a
. enseñanza de la lectura en diferentes niveles. Estos maestros necesitan una obtener muy pocos resultados positivos al aplicar una batería similar en el
prueba de velocidad para la' lectura. Si casi todos los alumnos asisten al jardín décimo grado.
de niños, la prueba debe programarse para el final del último año de esta etapa La integración entre las divisiones de la escuela implica continuidad de los
escolar¡ pero es posible que también alguien quiera administrar la prueba en registros escolares. Los registros acumulados acerca de un alumno en la escue-
el primer grado, tan pronto como los alumnos se han acostumbrado a su nue- la elemental deberían prolongarse, ya sea en su totalidad o sólo en parte, en la
va clase. escuela secundaria. El registro completo, especialmente si es uno muy com-
También podemos suponer que un programa diferenciado de la escue- pleto, no debería quedar en el archivo activo de registros; sin embargo la
la secundaria está a disposición para los tres años de la sección superior de la información clave debería llevarse dentro de un sistema de registro a la esc~e­
escuela secundaria (preparatoria) y que los asesores y los alumnos trabajan la secundaria, y el registro completo debería quedar disponible para cualquier
con el fin de elaborar un plan para los programas de la escuela secundaria r~~erencia a él, en caso necesario. No obstante, al mismo tiempo, la informa-
durante la primavera del noveno grado, con base en la información disponible Clon debe tener fechas y estar al corriente con los resultados de pruebas más
acerca de las aptitudes y el aprovechamiento de los alumnos. En este ambien- recientes (y con otra información acerca del estudiante), de tal manera que
te, puede ser muy adecuado un programa de pruebas acerca de la aptitud y el las decisiones puedan basarse en la información más reciente y actual respec-
aprovechamiento durante el primer semestre del noveno grado, de manera to del estudiante.
que será una información reciente. De nuevo, lo más importante es propor- Finalmente, la integración significa tener en cuenta el tiempo en que
cionar 10 que se va a usar y cuándo se va a usar. deben aplicarse las pruebas, de tal modo que pueda cumplir con todos o la
mayor parte de los propósitos. El intento por servir a dos amos es siempre un
compromiso y, sin embargo, algunas veces representa un uso sólido y limita-
do de recursos. Por tanto, una prueba de habilidad cognoscitiva administrada
Integración muy pronto en el sexto grado puede servir adecuadamente para la segmenta-
ción y la guía necesaria en el séptimo grado, e inclusive quedar disponible
El programa de pruebas debe manejarse como un todo, puesto que la co~o recurso para estudiar los casos problema del sexto grado. Una prueba de
información que se necesita en el sexto grado está relacionada con la informa- aptItud escolar en los grados décimo y undécimo ofrece una predicción tan
ción que se recabó en el quinto grado o con la información que será de alguna buena del éxito en la universidad como una prueba que se tomara en mayo del
utilidad para el séptimo grado. Cada parte de información que se obtiene debe último año de preparatoria, y también estaría a disponibilidad para los propó-
recopilarse en tal momento y de tal forma que puede dar el máximo de contri- sitos de asesoría durante los dos o tres años de escuela superior.
522 PRIORIDADES QUE SE SUGIEREN 523

Continuidad disponibles para todas las escuelas. A continuación ofreceremos algunas suge-
rencias acerca de las pruebas que consideramos tienen más posibilidad de ser
Los valores potenciales de un programa de pruebas se incrementan a útiles en un programa, en los diferentes niveles.
medida que se continúan por un periodo de varios años. Las ventajas de la
continuidad en el programa incluyen dos aspectos. Por un lado, los datos se
acumulan en los registros del alumno individual y están disponibles para con- Programa para la escuela elemental
"?
tribuir a la comprensión del joven no sólo como resultados de pruebas admi- En la escuela elemental el interés se centra en ayudar al individuo a domi-
nistradas durante el presente año, sino también como datos de las evaluacio- nar los recursos del aprendizaje y de la comunicación, mientras aprende a
nes realizadas uno o más años antes en los grados más bajos. El estatus vivir y a trabajar en grupo con sus compañeros. Al mismo tiempo, el indivi-
presente se puede considerar en perspectiva en relación con los registros ante- duo construye un bagaje de experiencias, de conocimientos y de compren-
riores. Por ejemplo, podemos verificar si los problemas académicos de Jaime sión. En este ambiente deben funcionar las pruebas. Aunque es difícil organi-
en el sexto grado se han desarrollado recientemente o si sólo representan la zar las opciones en una secuencia ordenada, ya que las pruebas se relacionan
continuación de una tendencia temprana¡ también podemos determinar si las entre sí y funcionan por equipos, hemos intentado hacer esto.
dificultades de Mariana para hacer divisiones largas es una cuestión nueva o En todo el análisis subsecuente se asume que los niños han sido adecuada-
tiene su origen en las dificultades tempranas con los fundamentos de la arit- mente examinados de la visión y la audición y que mantienen un esta tus ge-
mética. neral de salud. Hemos considerado .estas mediciones como parte del examen
La continuidad también es de importancia al permitir a un sistema escolar físico, más que como parte del programa escolar de pruebas. Por supuesto,
conocer las pruebas particulares que emplea. En varios puntos hemos destaca- éstas son de importancia fundamental para garantizar una experiencia educa-
do que se debe tener mucha precaución al aplicar las.normas nacionales en un tiva provechosa para cada niño. No hay nada más trágico que el niño llamado
ambiente local. El uso local de una prueba o de una serie de pruebas durante estúpido que se sienta al final de la fila y que no aprende nada debido a que
determinado lapso permite desarrollar estándares locales de expectación. Esto no escucha lo que dice el maestro o no puede ver lo que está escrito en el
puede tomar la forma de una serie real de normas locales. Por tanto, una pizarrón.
comunidad suburbana con un alto porcentaje de alumnos que ingresaran en
la universidad, puede encontrar percentiles basados en su propia población
escolar que den un marco de referencia más apropiado para juzgar el esta tus Pruebas de lectura
académico de sus alumnos, en lugar de compararse con las normas nacionales
de edad o de grado. Estamos dispuestos a dar preferencia en nuestro programa de pruebas
Conocer las pruebas implica conocer lo que miden y establecer los están- para la escuela elemental a las pruebas de habilidades para la lectura. La lec-
dares locales de expectación. Si los maestros trabajan con las pruebas y con sus tura ha sido siempre uIlo de los medios clave para adquirir todos los tipos de
resultados, conocerán lo que abarca cada prueba y los datos que proporciona conocimiento organizados. Aunque en el mundo actual esta supremacía haya
para diagnosticar a un grupo, de tal modo que con base en este conocimiento sido desafiada por las películas, la radio y la: televisión, el aprendizaje median-
se pueden derivar sus ventajas y desventajas, así como sus limitaciones. te los libros aún es la esencia de la educación, especialmente en los niveles
Ambos tipos de Jamiliarización son deseables cuando los maestros utilizan superiores. Por esta razón, ayudar a la escuela a hacer identificaciones tempra-
los resultados de las pruebas como ayuda en su trabajo. Por esta razón, un sis- nas del progreso pobre en lectura y ofrecer información constante del pro-
tema escolar generalmente prefiere usar la misma prueba durante varios años greso de lectura durante los años escolares, son algunos de los servicios más
y sólo la cambia cuando es obsoleta o está disponible otra prueba que garan- útiles que proporciona un programa de pruebas.
tiza ser mejor que ella. Si se tienen recursos muy escasos que sólo permite realizar una prueba de
lectura, es recomendable que ésta se aplique al final del segundo grado o al
principio del tercero, para identificar a los individuos que necesitan ayuda
PRIORIDADES QUE SE SUGIEREN PARA especial, por ejemplo de un año, antes de que se les ofrezcan conocimientos
UN PROGRAMA DE PRUEBAS más avanzados en los grados posteriores. No obstante, lo deseable es aplicar
una prueba de lectura cada año o dos a partir del principio del segundo grado
Al principio de este capítulo indicamos una falta de voluntad para esta- durante toda la escuela elemental.
blecer un patrón particular para un programa de pruebas, la cual se origina de
las diferentes funciones a las que debe servir un programa en cada escuela y Prueba grupal de aptitud académica
de la enorme variedad de los recursos profesionales y financieros disponibles
para los distintos sistemas escolares. Sin embargo, existe un núcleo general Para interpretar los resultados de la prueba de lectura y otros aspectos del
de uniformidad, a pesar de la diversidad, y los mismos tipos de pruebas están aprovechamiento académico, establecer las expectativas para los alumnos y

~. 0.. . : ' .
:j':"

524 CAP. 14. PLANEAClÓN DE PRUEBAS


PRIORIDADES QUE SE SUGIEREN 525
comprender los casos problema, es recomendable tener los resultados de una
prueba de habilidad cognoscitiva general. Cuando pensamos en téminos de p~ebas se encuentran con, mucho menos frecuencia, algunos no se usan de-
un programa mínimo y consideramos las realidades prácticas de tiempo y cos- bIdo a su costo y otros mas porque su contenido es de menor importancia.
to, debemos conformamos con una prueba grupal que se empleará junto con
nuestra prueba de lectura del principio del tercer grado¡ es decir, debe ser una
prueba que no contenga cuestiones relativas a las habilidades para la lectura.
Pruebas individuales de inteligencia
Pero las pruebas grupales que se aplican al principio del tercer grado no tienen
una confiabilidad bastante satisfactoria o no son estables temporalmente. Si Para la m?y<?~ía de los estudiantes e~ la escuela elemental se puede obte-
sólo podemos aplicar una prueba grupal, es mejor no hacerlo hasta el cuarto o ~er una apreClaCIOn adecua~a de las habIlidades intelectuales generales a par-
el quinto grado, cuando los resultados son más confiables. Si se va a adminis- tu de }a.s pruebas grupal~s,. SlD emb.argo! hay .s ituaciones en las que podría ser
trar una prueba en el segundo o tercer grado es deseable poder incluir por lo l1!uy ud una prueba mdIVldual de mtehgencla. La mayor parte de estas situa-
menos una o más pruebas grupales durante los años superiores de la escuela c!ones son aqu.ellas en.las que se trabaja inte~siv:amente con un individuo que
elemental, el cuarto, el quinto y el sexto¡ en este caso, la opción del grado tIene severas lDcapacIdades para el aprendIzaje o problemas emocionales.
dependería de los planes para poner a prueba en la escuela secundaria inferior. Ofrecemos las pruebas de inteligencia individuales como complementarias al
No reprobamos el uso de las pruebas adicionales si se cuenta con recursos ade- programa regular de pruebas escolares.
cuados¡ éstas servirían primordialmente para incrementar la confiabilidad de
nuestras apreciaciones. Es deseable tener medidas tanto verbales como no ver-
bales de la habilidad cognoscitiva. Pruebas de aprovechamiento de
contenido de materias

Batería de habilidades básicas Algunas de las bat.erías de aprovechamiento para los grados superiores de
la ~scuela elemental mcluyen pruebas con áreas de contenido en ciencias
Comparadas con la prueba de aptitud académica, en segundo lugar en SOCIales y natural.es .. No ob~t~nte que cada escuela debe decidir si estas prue-
nuestro programa estarían las baterías que incluyen las materias de habilida- bas ofrecen apreCIaClOnes valIdas de sus programas curriculares la naturaleza
des básicas. Desde luego, éstas incluirían la lectura y podrían reemplazar a la de su contenido tiene una utilidad limitada para ayudar a los m'aestros o para
prueba separada de lectura. Si la batería se proporcionara sólo una vez, proba- ayudar a evaluar los programas de contenido en las escuelas. No recomenda-
blemente escogeríamos aplicarla en el tercer o cuarto grado, donde la escuela mos estas pruebas como características importantes en un programa para una
pudiera utilizar los resultados en la planeación de los programas individuales escuela elemental.
de instrucción para los alumnos, o para ajustar a los alumnos en programas de
instrucción especial; sin embargo, sería preferible evaluar a los niños con una
batería semejante cada año, desde el tercer grado o posiblemente el segundo. Otros tipos de mediciones
Tenemos cierta preferencia de realizar estas pruebas en el otoño, de tal mane-
ra que los resultados estén frescos y disponibles para que los use el maestro Se pueden necesitar otros tipos de pruebas para estudiar a los niños indivi-
que ha trabajado con las pruebas. dualn:ente, en~re las cuales están las pruebas de diagnóstico empleadas en los
estudl(~s espeCIales de los niños con incapacidades para aprender una materia
el"! partIcular, así como las .técnicas de las pruebas clínicas utilizadas por el psi-
Prueba de disponibilidad para cologo escolar para estudIar un caso problema¡ sin embargo, estas pruebas
la l ectura r~p~esenta? complementos del programa de pruebas, más que ser una parte
basIca de el.
Con base en la suposición de que los maestros de nuestra escuela tienen No h~mos reco~endado.los inventarios de la personalidad de lápiz y
un programa individualizado de instrucción en la lectura en el primer grado, papel debIdo a que eXIsten senas dudas acerca de la validez de la información
s~ puede aplicar una prueba de aptitud para la lectura en seguida de nuestra 9ue propor~ionan para el niño en la escuela elemental y por la solidez de las
hsta. Probablemente incluiríamos esta prueba todavía más arriba, y la consi- mterpretacIOnes y el uso constructivo que pudiera hacer de los resultados el
deraríamos como una guía parcial para el maestro del primer grado en cuanto personal escolar¡ otra caus.a es la o~jeción de los padres a las cIases de pregun-
a la organización de los subgrupos para la instrucción de lectura, y como una tas que s~ forrnula~ :n los Inventan os. Esto no significa que el desarrollo de la
base que lo ayudara a evaluar el progreso de sus alumnos individualmente. p'ersonahdad del mno de la escuela elemental no sea de interés a la escuela
Los cuatro tipos de pruebas que hemos enlistado son los que se encuen- s~no que la comprensión del niño como persona depende más de las observa~
tran más comúnmente en los programas de pruebas escolares. Otros tipos de ClOnes de cada alumno hechas por el maestro y por otros sujetos del personal
escolar.
526 PRIORIDADES QUE SE SUGIEREN 527

Programa para la escuela secundaria te todo el programa escolar. Las pruebas de habilidades verbales y no verbales
pueden usarse para obtener una descripción más completa de las habilida-
En la escuela secundaria el estudiante afronta varias opciones y decisio- des del estudiante.
nes educativas_ Tiene que seleccionar las materias particulares o entre diver-
sos programas de contenido_ Al mismo tiempo, debe pensar acerca de sus
planes educativos o vocacionales futuros. El programa escolar, hasta cierto Pruebas de lectura
límite, ha transcurrido más allá de las habilidades básicas y ha puesto énfasis
en un incremento de las materias más especializadas. Parece que estos cam. _La habilidad para la lectura es importante tanto para los estudiantes que
blos de énfasis requieren un cambio correspondiente en el patrón del progra- ingresarán a la universidad como para los que no lo harán. Sin embargo la
ma de pruebas escolares. aplicación de una prueba de lectura es de poco valor, a menos que la esc~e­
Al planear un programa de pruebas para la escuela secundaria, queremos la proporcione un programa para remediar las dificultades encontradas.
estar seguros de que se satisfagan las diversas necesidades tanto de los estu· Cuando se dispone de tales recursos, los resultados de una prueba de lectura
diantes que deseen continuar sus estudios en la universidad como <!e los -que pueden usarse para colocar a los individuos en el programa apropiado. Ya que
no vayan a ingresar en ella. En el programa de la escuela secundaria deberían el uso constructivo de una prueba de lectura implica acciones apropiadas, es
considerarse las pruebas de ingreso en la universidad, como las pruebas de deseable que la prueba se administre en el octavo o noveno grado.
aptitudes escolares preliminares de la CEEB, la prueba de aptitud escolar y
las pruebas de los American College Testing Program (Programas de prueba
para la Universidad estadounidense) que se aplican a los estudiantes que Pruebas de aptitudes especiales
seguirán los estudiosuniversitarios¡ sin embargo, es muy común que los pro-
gramas de prueba de las escuelas secundarias fracasen al proporcionar una Para poder asesorar a los estudiantes es deseable tener apreciaciones de
apreciación adecuada para los estudiantes que no ingresarán en la universi- sus aptitudes especiales, así como de sus aptitudes escolares en general. Fre-
dad. Estos estudiantes necesitan asesorías tanto como, si no es que más, los cuentemente, el uso de las pruebas de aptitudes especializadas no está bien
estudiantes que ingresarán en la universidad. La planeación de las actividades adaptado para aplicarse antes del octavo grado. El tiempo particular en que
instruccionales y los programas de contenido para ellos requieren una com- pueden ser usadas estas pruebas dependerá del programa guía de la escuela. Se
prensión de sus habilidades generales y específicas, así como de su estatus y debe programar el tiempo de aplicación de la prueba de tal manera que los
progreso en las habilidades básicas. Es nécesario que las escuelas recaben los resultados estén disponibles cuando el asesor y el estudiante decidan trabajar
datos acerca de la eficacia de sus programas para los estudiantes que no ingre- juntos el programa de este último en la escuela secundaria. Normalmente,
sarán en la universidad. El orden de prioridad que proponemos se describe a esta clase de decisiones se realiza en el octavo o noveno grado.
continuación. En este nivel, una batería orientada de manera educativa, como la bate-
ría de pruebas de aptitudes diferenciales, es especialmente apropiada. Si se
usa este tipo de baterías, puede sustituir a la prueba de aptitudes escolares, ya
Prueba de aptitud escolar que ciertas subpruebas pueden combinarse para dar un cálculo que se ajuste
a las aptitudes escolares. Para los estudiantes que no ingresarán en la univer-
Cuando están disponibles varios programas distintos de escuela secunda- sidad, la batería de pruebas de aptitud con orientación vocacional, como la
ria, un estudiante debe decidir la clase de programas que querrá seguir en la bateria de pruebas de aptitudes en general, puede darse en el undécimo o
escuela secundaria. Una decisión relacionada con la anterior es cuántos cur- dóodécimo grado.
sos académicos tomará cada vez y el nivel de los cursos que le sean más benefi-
ciosos. Durante su programa de escuela secundaria, debe decidir qué tan alto
quiere llegar en la escalera educativa. Una prueba de aptitud escolar tiene
valor como complemento a los grados escolares para obtener estas decisiones, Pruebas de aprovechamiento en
así como para interpretar el progreso del estudiante en la escala y establecer áreas de contenido
niveles razonables de aprovechamiento esperado pára él.
Para la edad de la escuela secundaria, las habilidades medidas por una Las pruebas de aprovechamiento estandarizadas en las áreas de contenido
prueba de aptitud escolar se han vuelto bastante estables. Hay poco cambio para las escuelas secundarias son de algún valor para ayudar a los estudiantes
sistemático de un año al siguiente. Así, una prueba aplicada a estudiantes del a tomar decisiones acerca de sus planes educativos futuros y a la escuela a eva-
décimo grado sirve para estimar la aptitud escolar al final del duodécimo gra- luar ciertos aspectos de sus programas de contenido. Estas pruebas tienen un
do, al igual que otra que se hubiera aplicado después. Por esta razón, si sólo se valor particular para los grados noveno y décimo, pero son de poco valor para
aplicara una prueba, puede darse antes, de tal manera que pueda usarse duran- la guía individual si se proporcionan en el duodécimo grado.

. .. . ," ' ... ;.;; , ....


..... ' . , .. " .... ., : ,
528 PRIORIDADES QUE SE SUGIEREN 529

Intereses dos o por los psicólogos escolares para analizar a los estudiantes de manera
individual.
No obstante que los intereses de un estudiante son importantes para ayu-
darlo a tomar decisiones educativas y vocacionales, hemos puesto a los in-
ventarios de intereses relativamente abajo en la lista de prioridades en los Programa de pruebas para
programas de prueba para las escuelas secundarias, de~ido, en pa~te, a que la universidad
l ~ " los intereses de los estudiantes de la escuela secundana son relatIvamente
inestables. Especialmente para los estudiantes que ing!esarán en la u~iversi­
¡" ",
En el nivel universitario, la diversidad de los programas, las características
dad los tipos de decisiones que construyen sobre los mtereses vocacIOnales de los estudiantes y las metas de éstos son más importantes que en el nivel de
nor~almente pueden producirse hasta el final de la escuela secun?aria, para la escuela secundaria. Esta diversidad se refleja en las funciones para las que se
cuyo momento los patrones de intereses se han hecho un poco n:as ~stables. espera que sirvan las pruebas estandarizadas a nivel universitario. Las prime-
Otra razón es que el tipo de inventarios de intereses que es apropIado para la ras funciones a las que atienden las pruebas estandarizadas a nivel universita-
escuela secundaria normalmente proporciona datos insuficientes acerca de rio son: a) admisiones, b) colocación académica y el guía y asesoría para el
la validez de las puntuaciones. Si se aplica un inventario de intereses cuando estudiante individual. Excepto por las pruebas que se aplican para la admisión
los alumnos empiezan a pensar y a discutir acerca del mundo laboral, como y la colocación, el programa de pruebas a nivel universitario tiene todas las
se hace en el noveno grado en algunas escuelas, debería ser uno, como el probabilidades de ser altamente individualizado para conocer las necesidades
registro de preferencias Kuder, que evalúe en té~minos d~ .áreas generales de del estudiante que ha pedido asesoría.
interés, más que proporcionar escalas para trabajos especIfIcos. Evaluar tem- Muchas de las pruebas de admisión para la universidad tanto de dos como'
pranamente con un inventario de esta naturaleza podría complementarse de de cuatro años se hacen por medio de agencias de pruebas externas, ya sea la
manera adecuada con una segunda prueba con un inventario más orientado CollegeEntrance Examination Board (CEEBI -Dirección de exámenes para el
hacia el trabajo, del tipo del cuestionario de intereses vocacionales Strong- ingreso en la universidad- o el American College Testing Program (ACTI
Campbell o el inventario de intereses vocacionales de Minnes~ta, en los -Programa estadounidense de pruebas universitarias. Estas pruebas se estu-
grados undécimo y duodécimo, especialmente para aquellos estudIantes que diarán en la sección de programas externos de. pruebas.
no han planeado ingresar en la universidad y que pronto se incorporarán al El problema de colocar a los estudiantes en los cursos apropiados o en las
mundo laboral. secciones de cursos después de la admisión a la universidad, se origina en cua-
tro situaciones generales:
Pruebas de pronóstico al Colocación entre los alumnos del primer año.
bl Colocación avanzada para los estudiantes que han tomado cursos uni-
Ponemos las pruebas de pronóstico muy abajo en nuestra lista de priori- versitarios en la escuela secundaria.
dades en nuestros programas de pruebas para la escuela secundaria. Cuando el el Crédito y exención de algunos cursos que el estudiante haya estudia-
estudiante ingresa en la escuela secundaria, normalmente ya hay datos exte~­ do fuera del salón de clases.
sos de sus habilidades y de su aprovechamiento que pueden usarse para estI- dI Colocación de los estudiantes transferidos de otra universidad.
mar su probabilidad de éxito en distintas áreas, como el álgebra y las lenguas
extranjeras. Dudamos que el uso de una prueba de pronóstico especial para Para la colocación entre los alumnos del primer año (de nuevo ingreso),
una materia incrementará la exactitud de la predicción de éxito en ésta, por lo las universidades han usado ya sea la prueba de aprovechamiento apropiado
menos lo suficiente para justificar esta evaluación adicional. También pensa- de la CEEB o las pruebas de aprovechamiento estandarizadas para el nivel de
mos que sería deseable basar las decisiones de admitir estudiantes a ciertos alumnos universitarios de nuevo ingreso, analizadas en el capítulo 8. Las
cursos en los resultados de una sola prueba. pruebas de aprovechamiento de la CEEB frecuentemente son administradas a
los estudiantes durante la escuela secundaria. Otras pruebas estandarizadas
normalmente se aplican a todos los alumnos de nuevo ingreso como una par-
Inventarios de personalidad y te del programa de pruebas de alumnos de nuevo ingreso, a menudo durante
de ajuste emocional la semana de orientación para estos alumnos.
La colocación avanzada para los estudiantes que tomaron cursos univer-
Tenemos serias reservas acerca del valor práctico de las técnicas de papel sitarios en la escuela secundaria normalmente se realiza mediante los exáme-
y lápiz para evaluar la personalidad en este nivel. No recomendamos admi- nes de colocación avanzada de la CEEB. Estos exámenes se administran una
nistrar esta clase de inventarios de manera rutinaria a todos los estudiantes; vez cada año, en mayo, y los resultados están disponibles antes que el estu-
sin embargo, esto no excluye su uso por parte de los asesores bien entrena- diante ingrese en la universidad. El programa de exámenes a nivel universi-

¡ .•
~ " ,; ,1
PRIORIDADES QUE SE SUGIEREN 531
530 CAP. 14. PLANEAClÓN DE PRUEBAS
de
habían . Se podría usa.r una batería de prueba s de aptitud en vez de una prueba
tario de la CEEB fue establecido para ayudar a los estudia ntes que por aptitud esc~lar; embarg o, es menos necesar io contar con prueba s de apti-
obtenido un nivel univers itario de educac ión fuera del salón de clases SIn
secunda-
estudio s por corresp ondenc ia, cursos por televisi ón, entrena miento t~des espe~I~l.es en ~na población universitaria que en una escuela alguna
medio de rara el na. La decIsI~n ~e Ingresa r en la univers idad ya está tomada y de
laboral, lectura s indepe ndiente s o cualquier. otro medio que demost r el gru-
maner a se ha hmItad o. ~l rango de <?c';lpaciones para las que se prepar a bien
nivel de aprove chamie nto; los resultad os de la prueba se usan para acredita
los ·cursos adecua dos. La misma po; las p~e~a~ de.~abI hdades meca~ll cas, espaCIa les y de ventas son más
cursos univers itarios o para colocación en de
de los de poca sIgmfjcacI~n para los estudIa ntes universitarios que para el grupo
serie de prueba s se ha utilizad o para la admisi ón, colocación y asesoría tipos escuela s secund anas. .
estudia ntes que desean transferencia de una univers idad a otra. Hay dos
de exámen es en el programa:

a) Exáme nes generales, en los que se aprecia el aprovechaniiento en


las Lectur a
cinco áreas básicas de las artes liberales: compo sición en inglés
(redacción), human idades , matem áticas, ciencias natura les y cien- Una medida de la habilidad para la lectura sirve como una base más para una
cias sociales-historia. compre nder los problem as en el fracaso académico. Esta medida tienese dé
- en la que
b) Exáme nes de 16 materi as, diseñados para apreciar el aprovechamien funció n especial si la univers idad impart e una clínica de lectura
to en cursos univers itarios específicos. instr:u~ción especial para solucionar dichos problemas. Una
prueba de lectura
admInIstrada cuando el alumno ingresa en la univers idad e interpr etada junto
es localizar a
La funció n principal de las pruebas estandarizadas en la universidad con las p~ebas de aptitud es escolar es, proporc iona una base para
guía a los estudia ntes. Esta asesoría los estudIantes que podrían recibir ventaio sament e tal ayuda.
ofrecer de manera individual asesoría y
los pro-
puede ser educativa, vocacional o personal. En el nivel univers itario,
blemas en estas áreas tienden a ser individ uales más que general es.
Más aún, es probable que tales servicios se ofrezcan sólo cuando el estu- Intere ses
presión
diante los solicita, aunque esta solicitud sea el produc to de una con
externa. Esto sugiere que las prueba s que se Usan deberán seleccio narse una
el énfa- El co~enzo de la un~versidad es el momen to propicio para aplicartodos
base en los problem as que se presen tan en cada estudiante¡ por tanto, prueba de mtereses vocaCIOnales, que podría admini strarse con éxito a
prue-
sis recae en lo altame nte individualizado, más que en un progra ma de l?s estudi~ntes. Entonc es, si se propor ciona una prueba de vocaciones
especí-
ell
bas uniform e. dos fIcas del tipO del cuestionario de intereses vocacionales Strong-Campb
Alguna s universidades, particu larmen te las técnicas con carreras de durant e el segundo año de univers idad, los resulta dos pueden estar disponi -
requier en exámen es no uniform es para todos los estudia ntes que ingre- es de especia lización .
años, alum- bles para considerarlos cuando se decidan las opcion
san en ellas. En estas escuelas, un programa uniform e de prueba s para Dado que los patron es de interese s en esa edad perman ecen bastant e estables
podría proporc ionar datos que serían útiles para colocar de lo~
nos de nuevo ingreso
idades, las puntuaciones serán adecuadas para la asesoría especial por medio
a los estudia ntes y también permitiría asesorarlos. En mucha s univers posició n restant es cursos univers itarios.
el númer o de estudia ntes que tienen dificult ades para manten er una
te grande para justific ar la recopila -
escolar satisfactoria es lo suficientemen spo-
ción de datos comun es a todos los estudia ntes, de tal manera que esténdi
hacia Ajuste emoci onal
nibles para la asesoría. Las prioridades que sugerimos están orientadas
estas necesidades de asesorí a y guía comun es.
los
Los inventarios de ajuste emocio nal típicos son más apropiados para de
maduro s y menos educad os
estudia ntes universitarios que para los menos
a estos
Aptitu d escola r los grupos inferiores. Cuando existen amplios servicios de asesorí -
tipos de inventarios pueden admini strarse de manera rutinaria para identifis
Debido a que un númer o sustancial de estudia ntes univers itarios tienen
se car. a los individuos que requier an estudio s posteri ores; sin embarg o, tenemo
. dificul tad para manten er una posición escolar satisfactoria, a menudores- senas reservas en cuanto al valor de este procedimiento. Ordina riamennamos
te, en
necesita la evidencia de una aptitud escolar como base para la asesoría a petició n del cliente. Cuestio
habi- el nivel universitario la asesoría se inicia
pecto a las dificultades académicas. Una apreciación por separad o de las ción la eficacia o utilida d de este sondeo en toda la universidad para atraer
a los
lidades verbales y cuantit ativas puede servir para permitir una aprecia n, estudia ntes a entrevi stas. El uso de las puntua ciones o califica ciones por parte ·
más diagnóstica. La prueba debería aplicarse en el momen to de la admisió a de los consejeros departa mental es y otras persona s sin entrena miento especial
de tal manera que los resulta dos estén disponibles durante todo el program difícilmente se puede recomendar.
universitario.

;. " .: :. '-.-).: ·.~ I: .. ,.: ....• ',_,', , __ ...... .,. ' ...... .
.':-'
PlANEAClÓN DE UN PROGRAMA 533
532
Cada sistema escolar debe decidir acerca de quién tendrá la responsabili-
Resumen de los programas sugeridos dad para planear y dirigir el programa escolar. La primera responsabilidad del
... ~
grupo o de la persona responsable del programa de pruebas es determinar
Es necesario insistir en que el personal de la escuela ,debe. formula~ cua.l- cómo se aplicarán los resultados de las pruebas a la situación local. Después,
quier programa de pruebas en l.a situación local, ya que este tIene con~l~ncla debe decidir qué pruebas se darán, en qué grados y en qué momento del año
de las condiciones los propósItos y los recursos locales. Las proposIcIOnes escolar. Por último, debe establecer las políticas más amplias para calificar las
que se han delineddo en, ~s~a sección son .sólo una idea general. Las partes pruebas y reportar los resultados. En las siguientes secciones analizaremos
l.
1.! sobresalientes de este anahsls se han organIzado en el cuadro 14.2. ~as prue- cuestiones relacionadas con la planeación del programa de pruebas.
bas más altamente recomendadas están marcadas con un doble astensco. Las
pruebas que se consideran complementos ú~i~es en un I?rogram~ de p:uebas
extenso o que tiepe valor para ciertos proposltos espeCIales rec~ben solo un Participación en la planeación
asterisco. Los procedimientos consi~erados de yalor ?udoso estan ma~ca~os
con un signo de interrogación .. CuaI?-do n,o ~xlste mnguna marca se m~lca Los usuarios potenciales de los resultados de las pruebas son los maestros
que el tipo de prueba es inapropIado, ImpractIco o de poco valor para el nIvel del salón de clases, el personal de asesoría, los especialistas como los psicólo-
de una clase o de un programa escolar. gos escolares y los maestros de educación especial, los supervisores y el perso-
nal administrativo. Todas estas personas afrontan "la toma de decisiones. El
Cuadro 14.2. Pruebas sugeridos poro un programo escolar de pruebas tiempo necesario para tomar la decisión y la información que se requiere pue-
den variar. Dado que los resultados de los programas escolares deberían servir.
Nivel educativo a todos estos usuarios potenciales, el programa debe representar los compro-
Universitario misos de la selección de las pruebas y del tiempo dentro del año escolar en las
Tipo de pruebas Elemental Secundario
que se administren. Para lograr la continuidad y la integración del programa,
una representación de todos los niveles dentro de la escuela, desde el jardín de
Académicos de grupo o aptitudes niños hasta el decimosegundo grado, deberían participar en la planeación,
escolares como un grupo, aunque parte del trabajo o realicen ciertos subgrupos.
Lectura Al seleccionar las pruebas de aprovechamiento se deben conocer la
Habilidades académicos bósicos ** ? naturaleza y los objetivos de los programas de contenido, así como los
Disposición paro la lectura énfasis en los objetivos en cada nivel de educación dentro del sistema local.
Inteligencia individual ? ? En una escuela, las personas que deberían estar más familiarizadas con los
Aprovechamiento en moteñas de objetivos y la naturaleza del programa de contenido son los maestros del
contenido ? * salón de clases, los especialistas en materias independientes y los supervi-
Inventarios de lo personalidad ? ? sores de la instrucción; por tanto, debe haber representantes de cada una de
Inventarios de intereses
Pruebas o boterías de aptitud especial
.. estas categorías que asuman un papel principal para seleccionar las pruebas
de aprovechamiento.
Los asesores, los psicólogos escolares, los maestros de educación espe-
Pruebas de pronóstico paro materias
? cial y otros especialistas tienen una relación con los estudiantes y con los
especiales
padres de éstos muy diferente de la relación que tiene el maestro del salón de
clases. Los tipos de problema y los temas que afrontan son tam~ién muy di-
ferentes. Además, suelen tener más experiencia en evaluar que la que tienen
los maestros del salón de clases, de manera que cabría esperar que también
PLANEACIÓN DE UN PROGRAMA tengan más sofisticación psicométrica. Estas personas t~mbién deberían
DE PRUEBAS estar representadas en el comité de planeación de pruebas y t~ner la seguri-
dad de que obtendrán la información que necesitan y en el tiempo en que la
Hemos analizádo las posibles funciones, las cualidades deseadas y algu- requieran.
nas prioridades sugeridas en un programa escolar?e pruebas; sin.~mbargo, en Los directores de escuela, los superintendentes y los superintendentes
el último análisis cada sistema escolar debe asumIr la responsabIlIdad de pla- asistentes afrontan problemas bastante distintos de los problemas de los otros
near y realizar su propio programa. Un extraño que no conoce el siste~a ~sco­ dos grupos. El personal administrativo tiene más posibilidades de hacer parti-
lar en particular no puede diseñar un buen programa para usarlo ahl, nI una cipar en los reportes a los padres y a la comunidad acerca de la eficacia de los
escuela puede obtener un programa eficaz sólo por adoptar el programa de programas y de la escuela como una totalidad. Ellos deben iniciar o apoyar
algún sistema escolar vecino.
534 CAP. 14. PLANEAClÓN DE PRUEBAS 535

las solicitudes para la revisión de los programas y para los presupuestos des- Selección de pruebas para el programa
tinados a añadir nuevos o más programas, o nuevas clases de personal. Por
tanto, también necesitan estar representados en la planeación de los progra- En capítulos anteriores se ha indicado que las clases de pruebas que se
mas de pruebas_ . .. aplicarán en una escuela dependen del tipo de información que la escuela
Durante 1976 en muchas comunidades fue aconsejable que partIcIparan necesita para poder tomar decisiones apropiadas. Para algunos tipos de deci-
representantes de la sociedad de padres o de otros grupos de la comunidad en siones, a v~ces se necesitan pruebas de aprovechamiento¡ para otros, pruebas
la planeación de los programas escolares de prueba. No obstante que el como de aptitud académica, y para otros más, baterías de pruebas de aptitudes espe-
promiso de estos grupos no ha sido continuo, debería haber un procedimiento cializadas. Entonces, la decisión inicial incluye los tipos de pruebas que se
sistemático para atraer a la deliberación del comité del programa de pruebas la necesitan¡ para una selección posterior, la prueba debe tomarse de una de las
opinión y las preocupaciones de ese grupo. muchas que están disponibles para cada categoría.
En la selección de una prueba de aprovechamiento se debe considerar
lo siguiente: primero, que la prueba se ajuste bien a los objetivos y al énfasis
Dirección centralizada del programa de contenido de la escuela, y segun?o, que ~a prueba te~~a las
No obstante que la planeación de un programa de pruebas incluye a características psicométricas adecuadas para gUIar los tIpOS de deCISIones
mucha gente es necesario designar.a una persona dentro de un sistema esco- que la escuela desea hacer al usar los resultados. La selección de otros tipos
·'1,
lar para que ~ea el responsable principal y tome las últimas decisiones para de prueba, como las pruebas de aptitud académica y las pruebas .de apti~des
coordinar y realizar el programa. El título que recibe esta persona varía de especiales, debería hacerse primordialmente con base en sus cuahdades pSlCO-
escuela en escuela, pero, aunque sólo sea por conveniencia, le llamaremos métricas.
director de pruebas, cuyas funciones pueden incluir: No obstante que los miembros del comité para la selección de pruebas
podrían reaccionar apropiadamente al form~to y a ~a atracción d: un.a pru~­
ba particular de esta clase, las preguntas mas crucIales son: ique eVIdenCIa
al Coordinar las actividades del comité de planeación.
ofrece el autor de esta prueba acerca de su validez para el tipo de decisiones y
bl Mantener los archivos al día con las muestras de las pruebas.
las interpretaciones en que queremos basar los resuítados?, ¿qué tan buena
el Hacer provisiones para revisiones periódicas de los programas de
es esta evidencia?, ¿es adecuada la confiabilidad para la clase de interpreta-
pruebas y del uso que se dé a los resultados.
dI Planear el presupuesto para el programa de pruebas. . ciones y usos que queremos hacer?, ¿qué tan adecuadas son las normas para
nuestros propósitos? Los juicios acerca de la adecuación de los datos técni-
el Realizar detalles administrativos del tipo de ordenar, almacenar y dis-
cos presentados requieren alguna sofisti~ación ~~ la estadísti~a y en la t~oría
tribuir las pruebas, elaborando horarios detallados para dar las prue·
bas y volver a escogerlas o recoger las hojas de respuesta y calificarlas. de pruebas. Un director de pruebas bIen calIfIcado debera proporCIOnar
fI Hacer provisiones para que se califiquen las pruebas, ya sea d~ manera estos servicios.
Después de una selección tentativa hecha para todas las pruebas que se
local o por medio de una agencia de calificaciones especializada. aplicarán en el programa, la totalidad de estas debe examinarse ~ríticame~te
gl Planear y supervisar los análisis y las tabulaciones de los resultados de para determinar qué tanta, buena y diferente, por nueva, es la mformacIOn
las pruebas. obtenida de cada prueba. Uno de los fracasos más comunes en los programas
hl Reportar los resultados de las pruebas al personal de la escuela, a los escolares de pruebas es la redundancia; es decir, se invierte tiempo y dinero en
grupos de padres y a la dirección de educ2:c~ó~. ., dos o más pruebas con las que se obtienen dat~s muy cercanos en cuant~ a la
il Hacer provisiones para contar con un servIcIo mterno de educaclOn información de un mismo estudiante, en el mIsmo punto en cuanto al tIem-
del personal de la escuela a fin de administrar, interpretar y usar las po. Por ejemplo, un plan para evaluar a los alumnos del noveno grado en
pruebas. febrero en el que se utilizaron tanto las Differential Aptitude Test (DA T)
-Prueb~ de aptitud diferencial- como una prueba de aptitud general, es inefi-
Al revisar los posibles deberes del director de pruebas se aclar~n dos caz y redundante. Las puntuaciones combinadas de la prueba de razonamien-
cuestiones. Primero ser el director de un Programa de- pruebas reqUIere de to verbal y de la prueba de habilidades numéricas de la DAT producen la
muchísimo tiempo,' por lo cual la persona que ocupe ésta posición deberá misma información o muy parecida a la obtenida de aptitudes generales.
estar asignada a ella como una parte reconocida de su tr3:bajo y.debe tener el Debido a que puede obtenerse mucha más información de la DAT q~e de la
suficiente tiempo disponible para poder desempeñar sus funCIOnes; la re~­ prueba de aptitudes generales, si el tiempo y el presupuesto lo permtte?, se
ponsabilidad del programa de pruebas no debe darse como un elemento adI- debe aplicar una batería de pruebas más larga y más completa; en cambIO!. la
cional a alguien que ya tiene una carga completa de otros deberes. Segu~do,la prueba de aptitud general debería eliminarse. Es prob~~le que se pueda ana-
persona que desempeña este papel debería tener antecedent~ educatlv?s. y dir cualquier otro tipo de prueba, o una prueba de ha~)1hdad general: en cual-
experiencia en evaluación y en estadística, así como tener cualIdades admInIS- quier otro momento de la carrera escolar del estudIante, que dana mucha
trativas y de liderazgo.
536 CAP. 14. PlANEAClÓN DE PRUEBAS PlANEAClÓN DE UN PROGRAMA 537

información nueva y muy útil; aSÍ, se deben buscar tanto los huecos como administración de pruebas generales de inteligencia en cada año del programa
las duplicaciones. escolar. En general, si los resultados de cualquier prueba administrada en
,, ,; el programa no se usan, aplicar una sola prueba representa una evaluación
,: .: de más.
,¡ :
Frecuencia y tiempo de la eyaluación
l ' Entre las decisiones que necesitan tomarse para planear un programa Calificación y análisis de pmebas
escolar están con cuánta frecuencia, en qué grados y en qué época del año se
aplican las pruebas seleccionadas. !!n cierta ?I~di.da, el tiempo del año en que Uno de los aspectos de la planeación del programa de pruebas es decidir
se debe aplicar una prueba en partIcular esta limItado por la ~aturale~a de la cómo se calificarán las pruebas y qué tipo de análisis se hará con ellas. Varios
prueba; por ejemplo, si se aplica una ~rueba d<: aproyechaD?-Iento en alg,ebra factores se combinan para que la calificación y el análisis de las pruebas las
a los estudiantes del noveno grado, solo tendra sentIdo aphcarla despues de realicen agencias de servicio especializadas y no los maestros. Por un lado,
que los estudiantes hayan finalizado el curso de e~tudio. P?~ otro lado, un.a existen cláusulas en varios contratos sindicales que limitan los deberes de los
prueba de aprovechamiento que abarque las neceSIdades baslca~ ,de apr~ndl­ maestros a cuestiones que no sean la enseñanza; por tanto, no se les puede
zaje se puede administrar en casi cualquier moment.o. ~n la seCClOn preVIa, al pedir que califiquen y analicen las pruebas. Por otro lado, ha habid~ una
tratar las prioridades en los programas de pruebas, mdlcamos nuestra prefe- mejoría constante en la tecnología del rastreo óptico de las fonnas de regIstro,
rencia tanto para la colocación de grado de vari~s pruebas como p~r~, la épo- que hace posible una calificación de prueba muy rápida y precisa por medio de
ca del año en que deben aplicarse esas pruebas; sm embargo, la declslOn debe aparatos. Algunos rastreadores (por ejemplo, Digitek) se pueden conseguir a
tomarse en términos de los usos locales que se darán a los resultados de la un precio económico dentro de un sistema escolar bastante grande, para que
prueba y al tiempo en que se necesitará dicha i~for?Iación. . opere su propio servicio de calificación centralizado; sin embargo, hay ras-
Cuando consideramos los grados en que se aphcaran las pruebas, el comI- treadores más versátiles y algunos que pueden leer respuestas marcadas direc-
té también debe decidir en qué nivel se administrará la prueba y si se requieren tament~ sobre el protocolo de la prueba y que están disponibles en las agencias
ciertos ajustes de nivel dentro de un grado en particular; por ejemplo, si se pla- de servicio de calificación especializadas (por ejemplo, el Measurement
nea una batería de pruebas de aprovechamiento para el principio del quinto Research Center -Centro de investigación de medición-, en Iowa). Especial-
grado, iestarán todos los alumnos del quint~ gr~do en el nivel para que se les mente para los sistemas escolares pequeños, las agencias de servicios de califi-
aplique la prueba diseñada para ese grado? SI aSl es, podemos esperar que los cación hacen posible la precisión de calificación y del análisis completo de los
estudiantes que lean mal contestarán muy pocas preguntas y entonces se resultados de la prueba que no es posible confiar sólo a los recursos locales.
apreciarán inadecuadamente. Podríamos obtener una apreciación más precisa Los servicios de calificación y de reporte ofrecidos por la mayoría de los
de lo que los estudiantes pueden hacer si les damos una prueba para un grado principales editores de pruebas son más variados y elaborados en cada año que
más bajo. Si la situación de prueba lo pennite, podríamos obtener ventaja al pasa. En muchos casos es posible obtener, por un precio, algunos o todos los
agrupar a los alumnos para la prueba de acuerdo con sus niveles de aprovecha- servicios siguientes:
miento esperados y probar en cada grupo con el nivel más apropiado para él,
sin tener en cuenta los membretes oficiales de grado. El problema se complica a) Listas impresas de los alumnos de la clase, que muestran las puntua-
cuando hay una organización sin grados en la escuela. En este tipo de organi- ciones parciales y totales, tanto en puntuaciones crudas como en per-
zación es conveniente detenninar la ubicación de las pruebas de acuerdo con centiles, estanueves u otros tipos de conversión de calificaciones para
el nivel instruccional del estudiante, no por el número de años que ha estado cada alumno de la clase.
en la escuela. b) Una etiqueta sensible a la presión para cada alumno, que se puede fijar
Cuando se planea la frecuencia de las pruebas se debe evitar evaluar con a la fonna de registro pennanente y que muestra toda la información
demasía. Dos ejemplos de este tipo de evaluación son la redundancia en las anterior.
pruebas y los programas de pruebas de la escuela elemental que administra e) Una codificación para cada alumno, que muestra qué reactivos estu-
una batería de aprovechamiento en octubre y otra vez en mayo, en cada grado vieron correctos y tal vez cuáles fueron las respuestas equivocadas que
desde segundo hasta sexto. Es difícil justificar este programa de pruebas tan se escogieron para cada reactivo que se contestó mal.
cargado. Ciertamente, las diferencias entre las puntuaciones obtenidas de las d) Una codificación resumen para cada clase, que muestra el número de
pruebas que se administran en mayo en un grado y aquellas que se adminis- alumnos que contestaron correctamente cada reactivo, poniendo los
tran en octubre siguiente, tienen bastantes posibilidades de no ser significati- reactivos en código para mostrar el objetivo que, supuestamente,
vas, y los resultados de las pruebas aplicadas en mayo se obtienen demasiado mide cada uno. .
tarde en el año para que tengan mucho uso en cuanto a cualquier decisión ins- e) Distribuciones de las puntuaciones crudas y convertidas, junto con la
truccional o de asesoría. Un tercer ejemplo de evaluación en demasía es la media y las desviaciones estándar para las clases separadas y los gru-
538 CAP. 14. PLANEAClÓN DE PRUEBAS
PlANEAClÓN DE UN PROGRAMA 539
pos de grado tanto en un edificio escolar como en un sistema escolar. tros del salón de clases deberían tener libre acceso a los resultados de las prue-
f) Identificación de los estudiantes que calificaron cerca o en el nivel de bas de aptitudes. Debido a que los resultados de las pruebas de aptitudes son
azar, que podrían beneficiarse al ser evaluados de nuevo con una prue- útiles para planear las actividades del aprendizaje de los estudiantes y ayudar a
ba de más bajo nivel. diagnosticar las dificultades de éstos para aprender, parece ilógico retener este
g) Puntuaciones de aprovechamiento expresadas en relación Con el tipo de información fuera del alcance del maestro del grupo, que es quien tie-
·:;
i' desempeño en una prueba de aptitud, reportado ya sea en rango de ne la responsabilidad principal por estas funciones. La razón que dan la mayo-
percentiles en un grupo de aptitud específico o como un nivel de apro- ría de las escuelas para retener la infonnación de los resultados de las pruebas
vechamiento esperado que podría compararse con la puntuación de de aptitud fuera del alcance del maestro, es que éstos podrían usar mallos
prueba de aprovechamiento obtenido_ resultados. Si esto es aSÍ, una acción constructiva sería planear activida-
des dirigidas a mejorar la competencia del maestro para interpretar y usar los
No obstante que en algunos casos se han vuelto tan complejos hasta el resultados, más que prohibirles el acceso a la información.
grado de autoderrotarse, estos reportes son potencialmente muy útiles en Un punto más importante es que la información de los resultados de las
:1'. relación con el registro y la interpretación de los resultados de prueba para los pruebas debería comunicarse a los padres o a los propios estudiantes. En algu-
"
alumnos específicos, así como para comunicar a los administradores, la direc- na medida, la decisión se ha retirado de las manos del personal escolar por
ción escolar y al público en general las evidencias de ventajas y desventajas del medio de la Buckley-Pell Amendment {Ley Buckley-PellJl que da a padres y
programa locaL estudiantes el derecho a examinar los registros, cualesquiera que sean, que
En la actualidad se producen muchas pruebas para los grados primarios mantiene la escuela de un estudiante dado. Cuando se permite a las escuelas
en protocolos que pueden calificarse con máquinas, en las que las opciones de actuar libremente, por lo general éstas no reportan a los padres las puntuacio-
respuestas se marcan directamente sobre el protocolo o el cuadernillo de la nes de prueba reales, sino las interpretaciones hechas por la escuela de los
prueba que se pasa directamente por medio de un rastreador óptico. Para los resultados de las pruebas (Goslin, 1967).
grados cuarto y más altos, en la mayoría de las pruebas editadas se usa una En muchísimos sistemas escolares los resultados de la evaluación se
hoja de respuestas por separado_ reportan sólo cuando los padres o el propio estudiante (en el nivel secundario)
Muchos maestros del salón de clases piensan que los niños reciben una solicitan la información_ La importancia de la interpretación adecuada difícil-
sanción cuando tienen que usar hojas de respuestas, en particular con las mente podría cuestionarse. Las puntuaciones crudas fácilmente se malinter-
hojas de respuestas que están densamente enpaquetadas, del tipo de la MCR y pretan por una persona que no conozca la naturaleza de la prueba, las normas
la Digitek. Algunos estudios (Dizney y colaboradores, 1966; Hayward, 1967; de las pruebas, el error de medición, etc_Por tanto, es importante que el siste-
Miller, 1965; y Slater, 1964) revelan que no hay diferencias consistentes entre ma escolar planee cuándo yen qué momento se deben poner a disposición los
las puntuaciones de las pruebas no aceleradas para los estudiantes del cuarto resultados de la prueba a los estudiantes y/o a sus padres, así como los proce-
grado hasta el noveno cuando se usan distintos tipos de hojas de respuestas. dimientos y las per$onas que darán esa información de tal manera que pueda
En otro estudio (Clark, 1968) se demostraron algunas diferencias pequeñas ser entendida y utilizada de modo constructivo.
pero estadísticamente significativas entre las marcas que se hacen de manera Nuestra opinión es que todos los interesados acerca del estudiante de-
directa sobre el protocolo de prueba y las que se hacen sobre una hoja de res- berían recibir rutinariamente algún tipo de información respecto del desem-
puestas por separado, en particular para los estudiantes de lento aprendizaje y peño de éste en todos los tipos de pruebas estandarizadas. El problema no es si
de edades entre los 11 y los 16 años. Es importante determinar si las hojas de unos deben o no recibir la información, si no cómo dar la información de tal
respuestas por separado se usan para evaluar pruebas normativas, ya que las manera que se comprenda y la usen constructivamente todos los interesados.
normas serán aplicables estrictamente sólo si los procedimientos locales se Consideraremos las formas de hacer esto en secciones posteriores_ El comité
ajustan a aquellos que se usaron cuando se elaboró la prueba_ de planeación debería decidir acerca de la política y hacer planes para verificar
que esa política se ponga en marcha.
Un tercer aspecto relativo a estas políticas que debe considerarse es si
Establecer políticas para reportar los resultados de un programa de pruebas para un sistema en su totalidad
los resultados deben reportarse de manera rutinaria a los grupos laicos. En cualquier comu-
nidad existen varios grupos que podrían constituir audiencias potenciales;
Al anticipar cuándo estarán disponibles los resultados es necesario esta- por ejemplo, las asociaciones de padres, las di!ecciones de e~u~ación, la
blecer políticas acerca de quién recibirá los reportes de los resultados y cómo comunidad en general que apoya a la escuela medIante el pago de nnpuestos y
se harán estos reportes. En las escuelas elementales y secundarias no es pro- los grupos con intereses especiales_ Las decisiones acerca de reportar a tale~
bable que surjan desacuerdos al hacer que los resultados de las pruebas de
aprovechamiento estandarizadas estén disponibles para todo el personal pro-
fesional de la escuela, pero sí existe cierto desacuerdo en cuanto a si los maes- 1 Para la Ley pública 93-380, Acta de escuelas elementales y secundarias de 1974.

", .
'., .. ':, 0 • •
:" .' )r .<.-. . ... '." .' . . . .. , ...',.. ' ...... .,-, ..
540 CAP. 14. PLANEAClÓN DE PRUEBAS LOGrSTICA DE UN PROGRAMA ESCOLAR 541
grupos normalmente se hacen a un alto nivel administrativo, pero debido a . niños o para los niños que comienzan el primer año, el horario debería permi-
que todo el personal de la escuela tiene un interés respecto de la imagen de los tir dividir la clase total en pequeños grupos de no más de lOa 15 estudiantes,
logros de esa escuela ante estos grupos y frecuentemente se le solicita a dicho para poder proporcionar las mejores condiciones de prueba posibles.
personal para que interprete o explique las razones de los resultados. Estable- El interés fundamental para los horarios es que las pruebas se deben
cer una política respecto de cómo, cuándo y a quién proporcionar informa- aplicar en condiciones estándar y que estas condiciones permiten a cada exa-
ción de tales reportes debería ser la responsabilidad de un grupo con una minado desempeñarse en su mejor nivel. Así, cualquier unidad de tiempo pro-
. representación amplia de subgrupos. gramada para la evaluación debería ser lo suficientemente larga para permitir
la administración de una prueba completa, de manera que se permita la distri-
bución y recolección de los papeles, así como dar las instrucciones. Puede ser
LOGÍSTICA DE UN PROGRAMA ESCOLAR que el principiante no se dé cuenta de qué tanto tiempo se requiere más allá
DE PRUEBAS del tiempo básico de prueba. Los horarios de las pruebas no deberían ser de-
masiado rígidos.
Realizar un programa de pruebas mediante un sistema escolar es un traba- Más aún, cuando se administra más de una prueba, como en el caso de
jo bastante difícil. Si queremos que las pruebas se apliquen de manera exitosa baterías de pruebas de aprovechamiento o de aptitud estandarizadas, no es
y si las condiciones estándar de la evaluación van a ser mantenidas, es necesa- deseable aplicar demasiadas pruebas en un solo día o de una sola vez. Especial-
. rio hacer una buena cantidad de planeación anticipadamente. Se ordenan las mente para los niños más jóvenes se deben proporcionar periodos de esparci-
pruebas necesarias y los materiales accesorios y se distribuyen por separado miento entre cada parte de la prueba, yel programa de pruebas debería dividir-
para las escuelas y las clases. Se preparan y se distribuyen las instrucciones se en varios segmentos y extenderse durante varios días. Un número de los .
locales complementarias. Se establecen horarios detallados y se distribuyen manuales para las baterías de pruebas sugiere la forma en que el tiempo total
para aplicar las pruebas. Se debe entrenar a los aplicadores y censores. Se reali- de prueba se puede dividir con el fin de obtener ventaja para los niños en dife-
zan arreglos detallados para calificar las pruebas o para recolectar las pruebas rentes niveles de edad. Por supuesto, el propósito de un horario amplio es
. con el fin de calificarlas. Se planean actividades educativas de servicio interno minimizar la pérdida de interés y de esfuerzo, especialmente por parte de los
para los maestros que necesiten ayuda en la interpretación y el uso de los niños más pequeños que encuentren la prueba demasiado difícil y frustrante.
resultados. Se preparan reportes de los resultados y se emplean con varios gru- En un plano secundario a todas estas consideraciones, se deben analizar la
pos. Algunos de los puntos más importantes para realizar un programa de economía y la conveniencia administrativa. La economía se logra cuando se
pruebas se estudiarán en las secciones siguientes. vuelven a usar varias veces los protocolos de pruebas. Cuando las pruebas tie-
nen hojas de respuestas por separado, se pueden usar en varias clases, por lo
que se necesita un horario bastante complejo para permitir que se vuelvan a
Horario para las pruebas usar las pruebas (este horario debería incluir suficiente tiempo para establecer
diferencias y ordenar de nuevo los protocolos que ya han marcado los exami-
Después de la decisión original acerca de qué pruebas se aplican, en qué nados). Sería posible obtener mayor flexibilidad en los horarios si se compra-
grados y en qué epoca del año, es necesario trabajar en la planeación de un ran partes separadas de las pruebas, de manera que una clase use una parte de
horario exacto de pruebas. Este horario para administrar la prueba debería la batería, mientras que otra clase usa otra parte de la misma.
estar disponible al principio del año para todos los maestros del salón de clases En las escuelas departamentalizadas con periodos de clases de duración
y para otro personal escolar, de tal manera que no se planeen actividades esco- fija, es administrativamente conveniente que una mádad de prueba se ajuste a
lares que se interfieran. Las pruebas probablemente no deberían programarse un solo periodo de clase. Muchos editores de prueba han tomado en cuenta
de inmediato antes o después de días de vacaciones principales, como la Navi- esto al diseñar sus pruebas; sin embargo, no debería permitirse que este tipo de
dad. Si las pruebas se aplican en el otoño, probablemente no deberían ad- conveniencia distorsione o interrumpa la administración de ninguna prueba.
ministrarse antes de la tercera o cuarta semana de la sesión, sobre todo en la Se debe dar el tiempo suficiente para permitir que se complete una prueba en
escuela elemental. una aplicación. Si el programa de pruebas es adecuado, también lo será cam-
Este horario debería permitir reagrupar a los niños para la aplicación de biar un poco las rutinas administrativas.
la prueba. Ya hemos mencionado que es deseable administrar un nivel de una
prueba que tiene un grado de dificultad apropiado para el estudiante¡ por
ejemplo, en las clases del quinto grado puede haber estudiantes para los que el Planeación de pruebas para los
tercer grado sea un nivel de prueba más adecuado, y otros para los que sería estudiantes ausentes
más adecuado el sexto nivel. Administrar pruebas que no correspondan al gra-
do es lo más recomendable en estas situaciones, yel horario establecido debe Cuando las pruebas incluyen un horario que ocupa varios días, se corre el
permitir que esto se realice. Si el programa requiere pruebas para el jardín de riesgo de que los estudiantes estén ausentes uno o más días en que hay sesión

i
.~ ;
542 CAP. 14. PLANEAClÓN DE PRUEBAS LOGíSTICA DE UN PROGRAMA ESCOLAR 543

de prueba. Se deben tomar provisiones para evaluar a los ausentes en otra e) Sean convenientemente capaces de manipular sus materiales de
oportunidad, de tal manera que se obtenga la mayor cantidad posible de datos prueba.
de los estudiantes. d) Est~n lo suficientemente separados para minimizar las tendencias a
copIarse unos a otros.
Preparación de los estudiantes
Las condiciones de iluminación y ventilación para la prueba deberían ser
para la prueba por lo menos tan buenas como las que se mantienen en el aula de enseñan-
La preparación de los estudiantes para ser evaluados tiene como objetivos za e~ un salón de clases normal. Especialmente con los niños pequeños se
establecer una motivación óptima y una cooperación razonable durante las prefIeren los alrededores conocidos de su propio salón de clases en ve; de
p~ebas, así como asegurar que los estudiantes se familiaricen con los procedi- cafeterías o auditorios, donde el amontonamiento y la falta de c~ndiciones
mlt:nt?s de la prueba, de tal manera que no se sientan impedidos por los pro- para esc~ibir y pa!a manipular los materiales de prueba son problemáticos.
CedImIentos novedosos o poco conocidos. Las ~nterrupclOnes casuales en los salones de prueba deben minimizarse
La motivación óptima es aquella que da como resultado un esfuerzo sos- por medIO de un cartel en la puerta, que diga: 11Administración de pruebas no
tenido y serio, sin tensión y ansiedad innecesarias. Dadas las amplias diferen- molestar". ~e debe convenir con la administración de la escuela para suspen-
cias entre los estudiantes, no es posible lograr este ideal para cada examinado· der las rutma~ de alann~ por fuego, los anuncios por micrófono y, hasta
sin embargo, algunas explicaciones por adelantado y un análisis acerca de l~ d.onde sea pOSIble, el somdo de las campanas y otras señales durante un pe-
que significan las pruebas ayudan a lograrlo. Se debe trasmitir una actitud n<?d? e? el que las'pruebas se administran a una o más clases. Otros pasos para
de que las pruebas son genuinamente importantes, pero que no es asunto de mmImIzar las demoras y las distracciones son:
"vida o muerte". Asimismo, deben destacarse los usos constructivos de los
resultados de prueba para la guía personal y la adaptación educativa. Cuanto a) Verificar que. cada examinado tenga un lápiz extra o que haya lápices
más grandes son los estudiantes, más completo deberá ser este discurso antici- en abundanCIa. .
pado para que resulte beneficioso. b) Asegura~se de que l?s niños (especialmente los pequeños) tengan
opor~umdad. de rr al baño antes de que empiece la prueba.
Debido a que las pruebas están diseñadas para medir aptitudes y aprove-
chamiento, más que los trucos y las habilidades para efectuar un examen es e) Dar ~nstrucclOnes .acerca de lo que deben hacer los examinados que
deseable que todos los examinados tengan la oportunidad de conocer por ade- termmen su trabajO antes del tiempo establecido.
lantado el carácter general de los reactivos de la prueba y los mecanismos de la
misma. Algunas de las agencias de pruebas a gran escala, como la Educational Para ser capaz de manipular los materiales de prueba convenientemen-
Testing Service (Servicio de pruebas educativas) y la Educational Records te, el examinado deberá tener un escritorio o una mesa en la cual escribir y el
su~iciente espacio, de tal manera que pueda extender tanto la prueba como la
Bureau (Oficina de registros educativos), preparan unas hojas que distribuyen
a.los examinados en las cuales se describen las pruebas y se proporcionan hOJa de ~e~puestas enfr~nt~ de él. Trabajar en sillas, tal vez con una paleta
ejemplos de los reactivos. Un sistema escolar podría encontrar muy prove- para eSCrIbIr, en un audItono o en un gimnasio no son las condiciones idea-
choso preparar materiales prácticos similares para sus propios programas de les¡ e~pecialmente si las pruebas son de velocidad, ya que los retrasos en el
pruebas. manejO del papel pueden disminuir la puntuación del examinado.
Cuando los estudiantes van a usar por primera vez hojas de respuesta por No es necesario reprimir a los estudiantes o insistir en mantener el orden
separado, podría ser útil practicar de antemano con una de las propias pruebas durante los exámenes si los pupitres o las sillas están bien separadas.
del maestro o con reactivos muestra preparados para ensamblarse a aque-
llos de la prueba.2
Selección y preparación de los
administradores de las pruebas
Ambiente para las pruebas
La administración de la mayoría de las pruebas grupales es lo suficiente-
El ambiente deseable para llevar a cabo la prueba es aquel en el que los exa- mente simple para que cualquier maestro sea capaz de manejarlas de modo
minados: s~tisfactorio, después de una pequeña práctica y de la adecuada preparación¡
Slll embargo, para algunas escuelas es administrativamente más conveniente
a) Estén físicamente confortables y emocionalmente relajados.
b) Se hallen libres de interrupciones y distracciones. asignar estas funciones a personas especializadas del personal de asesoría o de
la oficina del psicólogo escolar. Independientemente de quién administre la
2 Los materiales especiales de práctica están disponibles en algunas editoriales que se dedican prueba, todos los administradores en prospecto deberían tener algún entrena-
a la publicación de pruebas estandarizadas. miento de servicio interno con las pruebas específicas que van a usar. El entre-

: : .,- ", .
•:i :~ J , .' " . ' •
-,., :,-
LOGíSTICA DE UN PROGRAMA ESCOLAR 545
544 CAP. 14. PLANEAClÓN DE PRUEBAS

namiento tiene como objetivos familiarizar a los administradores con las pulsera, sobre todo si tiene segundero. Cuando se usa un reloj común y
pruebas y los manuales de prueba y estandarizar los procedimientos respec~o corriente se debe llevar un registro escrito del tiempo exacto en que empezó la
a ciertos problemas recurrentes y a las preguntas que surgen .con frecuencIa .. subprueba y del tiempo en que se debe suspender, de tal manera que el tiempo
Una experiencia de familiarización valiosa para los exammadores es I¡dar no tenga que alargarse o acortarse debido a lapsos de memoria. Una forma
la prueba' uno a otro; es decir, leer las instrucciones en voz alta, exactamen- casera seguramente facilitaría el registro.
te como se especifica en el manual¡ y hacerse preguntas uno a otro. Tomar
las pruebas, por lo menos en parte, es otra forma de anticip~rse a los p~oble­
mas que probablemente surjan al administrarlas a los estudI~n.tes. V ~n~s de Cuidadores o censores·
estos puntos probablemente surjan al asegurarse de las condICIones optlmas
de la evaluación, y son los siguientes: El examinador debe desplazarse PO{ toda la habitación¡ especialmente
cuando empieza una nueva subprueba¡ para verificar el trabajo de los estu-
diantes. También debe verificar que cada estudiante esté contestando las pági-
Instrucciones al pie de la letra nas correctas y que esté hatiendo sus respuestas en el lugar apropiado si utiliza
una hoja de respuestas por separado. Individualmente¡ quizá cada niño nece-
El examinador debe entender que las instrucciones del manual para admi- site ser animado y alentado a seguir trabajando, o reconsiderar sus respuestas
nistrar la prueba deben leerse al pie de la letra. El examinador no ?ebe parafra- y verificar lo que ya ha contestado. .
sear las instrucciones ni añadirles o suprimirles nada. Los estudIOS acerca de
los efectos de altera; las instrucciones (Lamb, 1967; Yamamoto y Dizney,
1965) han demostrado que los cambios en las instru~ciones ej~rcen ef~ctos Administración centralizad:,
diferenciales en el desempeño del estudiante. El cambIO de las mstr?CCI~nes
publicadas violan las condiciones estándar de la prueba y pueden mvahdar Algunas escuelas intentan obtener uniformidad de administración de
las normas. pruebas mediante el uso de circuitos cerrados de televisión o de sistemas
de intercomunicación escolares. Hopk.ins y colaboradores (1967) describie-
Contestar preguntas ron un experimento con el uso de un circuito cerrado de televisión para eva-
luar a grupos de los grados quinto y sexto. Los autores encontraron que para
El principio que debe guiar al examinador al contestar las pregunta~ de los clases numerosas (de 55 a 90 alumnos) la administración por televisión daba
estudiantes es que el alumno debe entender claramente lo que se le pIde; no como resultado puntuaciones de media más altas, pero para las clases de
debe quedar confuso por la mecánica de la pru~ba o perderse en cuan.to a la tamaño regular (de 20 a 35 alumnos) la administración de la prueba hecha por
naturaleza de ésta. Por tanto antes de que empIece la prueba¡ el exammador los maestros daba puntuaciones más altas. Las diferencias entre estos dos
debe dar su máximo esfuerz~ para hacer que la tarea y sus procedimientos modos de administración fueron sólo de cerca de 0.2 de equivalente de grado.
estén claros. En este sentido, puede repetir o parafrasear las instrucciones, dar No obstante que se gana uniformidad en la administración por medio de
algunos ejemplos prácticos y, posiblemente, complementarlos; debe al~n­ procedimientos altamente centralizados¡ la ganancia se obtiene mediante la
tar preguntas en este punto y hacer cualquier esfuerzo para aclarar cualqUIer pérdida de flexibilidad para tratar alguna emergencia o una situación especial
malentendido. en el salón de clases. No se da ninguna oportunidad para proporcionar ins-
Una vez que empieza cualquier prueba específica, se deben desalentar trucción extra en los grupos más lentos acerca de los procedimientos para
las preguntas. Obviamente, no se puede dar ninguna ayuda para contestar los manejar el material de las pruebas. Si se hace una administración altamente
reactivos ni ofrecer ninguna pista acerca de si la respuesta del alumno es centralizada de las pruebas en el sistema escolar, es muy importante dar la pre-
¿
correcta incorrecta. Las cuestiones acerca del procedimiento general se pue- paración adecuada al estudiante antes de la prueba.
den tratar mediante la repetición o el parafraseo de las instrucciones, p~ro
cuando un niño da muestras de perplejidad e insiste acerca de un reactIvo
específico, se le debe hacer entende~ por medio de f~ases del tipo "Lo siento. Calificación
N o puedo contestarte. Hazlo lo mejor que puedas. SI no puedes contestar un
reactivo, pasa al siguiente". La mayoría de las escuelas compran servicios de calificación de pruebas,
pero a veces los maestros califican algunas pruebas. Si la calificación la hacen
los maestros¡ se deberían establecer controles adecuados para asegurarse de
Tiempo que se haga correctamente. Existen muchas probabilidades de que haya erro-
Si la prueba tiene secciones con limIte de tiempo, cada examinador debe- res en estas operaciones y más si se trata de restar una corrección por errores¡
ría contar con un cronómetro: Para otras pruebas será suficiente un reloj de añadir puntuaciones parciales para hacer una puntuación total o ir de pun-

"
546 CAP. 14. PLANEAClÓN DE PRUEBAS PRESENTACiÓN AL PÚBLICO 547

tuaciones crudas a puntuaciones convertidas. Es especialmente importante tes de una b~tería de aprovechamiento, obtiene un el de 80 en una prueba de
verificar estos pasos, pues las encuestas indican repetidamente la poca preci- ~po de aptItudes. E? vez de etiquetar a este estudi~nte como un u superdota-
sión de la calificación hecha por los maestros al calificar estas pruebas. Si fuera d?" , el ma~s~ro debe~a asegurarse de que no ha habIdo errores graves al admi-
posible, el sistema escolar encontraría muy ventajoso comprar servicios de D:Istrar, cahfIcar o regtstrar la prueba de aptitud. Una prueba puede ser incon-
calificación, ya que éstos producen resultados más exactos y serán menos cos- SIstente con los resultados de una prueba anterior del mismo tipo como
tosos a la larga. cuando un estudia~te cae de un percentil de 98 en una prueba en el quinto
grado a un percentil de 25 en una prueba similar en el séptimo grado. Los
resultados de la prueba pueden ser inconsistentes para la clase en su totalidad
como cuando una clase de. quinto grado obtiene más bajas puntuaciones d~
Registro de los resultados de la prueba pruebas de lectura en ~éf1:11Ínos tanto d~ sus calificaciones en el cuarto grado
como de otra prueba SImIlar para el qumto grado. Estos resultados para toda
Debido a que los resultados tienen más probabilidades de ser más signifi- . ;.
la clase normalmente indican algún error muy serio en la administración de la
cativos si se tiene una imagen acumulativa del desarrollo del estudiante a ¡.~
:~
prueba .
medida que avanza en la escuela, todos los resultados de las pruebas de un Se debería hacer una lista de todos los casos que muestran serias discre-
estudiante deberían registrarse en una tarjeta de registro permanente. La for- pancias con los resultados, los cuales deberían verificarse de manera cuida-
ma más simple y fácil de llevar un registro del desempeño del estudiante y de dosa. Los papeles de prueba se deben recalificar para verificar la puntuación.
sus pruebas es comprar el servicio de calificación de pruebas con una etiqueta Los cálculos y las lecturas de las tablas de la norma implican obtener puntua-
sensible a la presión que permita reportarlas puntuaciones. Entonces, sólo es ciones convertidas que deberían verificarse, así como las transcripciones de
necesario determinar el espacio para la tarjeta de registro acumulativo estas puntuaciones. Si no se encuentran errores en ninguno de estos pasos
mediante la presión de las etiquetas. Este espacio debe permitir mantener jun- sería deseable aplicar a los estudiantes una reprueba con otra forma de l~
tos los resultados de las pruebas del mismo tipo¡ es decir, todas las pruebas de prueba sospechosa, antes de que se llegue a hacer el registro permanente de
aprovechamiento en una sección, todas las pruebas de aptitudes generales los resultados.
en otra sección y todas las pruebas de aptitudes especializadas en otra sec-
ción más.
Si la escuela no compra el servicio de calificación de este tipo, toda la PRESENTACIÓN AL PÚBLICO DE LOS
información mostrada en la etiqueta debería apuntarse a mano en una tarjeta RESULTADOS DE LAS PRUEBAS
de registro permanente.
Una escuela o un sistema escolar obtendría los máximos beneficios de su
inversión en un programa de pruebas estandarizadas si los resultados de estas
Verificación de los resultados pruebas se reportan a todas las personas o los grupos de personas que necesi-
discrepante s tan contar con esa información. En cualquier comunidad existeri varios gru-
pos a los que se les pueden reportar los resultados de las pruebas: primero, los
Hay varias formas en las que pueden ocurrir errores sistemáticos de los estudiantes individuales y sus padres¡ segundo, el personal de las escuelas res-
resultados de pruebas. Cuando se administra una prueba, el examinador pue- ponsable de la instrucción, los programas de contenido, la administración y el
de cometer un error de tiempo y dar más o menos tiempo del que las instruc- personal de servicio para los estudiantes; tercero, los cuerpos oficiales legales
ciones establecen. Cuando se usan pruebas en un formato de nivel múltiple, (como las direcciones de educación) que tienen la responsabilidad de estable-
los estudiantes pueden haber recibido hojas de respuestas equivocadas o haber cer la política total dentro de los asuntos tanto educativos como financieros;
empezado en el lugar incorrecto. Si las pruebas se califican de manera local, se cuarto, los grupos especiales (como las asociaciones padres-maestros), cuya
pueden cometer graves errores al contar los números de respuestas correctas o ayuda es necesaria para la escuela, y quinto, el público en general, cuyos
al usar las fórmulas de corrección para obtener la puntuación. Se puede usar impuestos y votos mantienen a las escuelas. Los resultados de las pruebas se
una tabla- equivocada para transformar las puntuaciones crudas en puntua- reportan a estos varios grupos para lograr diferentes metas. Los grupos di-
ciones convertidas o puede leerse incorrectamente la tabla. Por estas razones, fieren en cuanto a complejidad con referencia tanto a la educación como a las
todos los resultados de las pruebas deberían examinarse cuidadosamente para pruebas educativas, así como en cuanto a la clase de información que necesi-
verificar su consistencia y su racionalidad antes que se usen. tan. Sin embargo, a pesar de todas estas diferencias y cualquiera que sea la
Una prueba puede ser inconsistente con otras pruebas dadas al mis!?? audiencia, el propósito general del reporte debería ser resumir, organizar e
tiempo, como cuando un estudiante que consistentemente ha obtenido califi- interpretar los resultados de las pruebas, de tal manera que den una imagen
caciones dos o más años por arriba de su colocación de grado en todas las par- significativa y clara de los logros del individuo y de la escuela.

,
)i .,

. , ....... >;. .. ., .. . • .
PRESENTACIÓN Al PÚBLICO 549
548
ciertas caracterís~i~s. Por eje?Iplo, un director de pruebas podría querer com-
Reporte de los resultados de un parar la puntuaclOn promedlO en cada grado de su sistema escolar con la de
programa de pruebas otras escuela,s de ha?ilidad y nivel soci?económic? sin:ilares en el país. Para
l~grar es~o, el n~a:sIta las normas. ?aclOnales de IntelIgencia promedio y el
Antes de planear procedimientos eficaces para reportar los resultados de mvel s.oclOeconorruco de la poblaclOn. En 1976 no había este tipo de normas
un programa a cualquier grupo, se debe precisar con toda claridad qué es exac- I:ara mnguna p:r:ueba de aprovechamiento. Supóngase que una escuela especí-
tamente lo que se quiere comunicar. ¿Cuáles son las preguntas específicas que fIca desea estudIar por separado sus resultados de pruebas de aprovechamien-
intentamos contestar al usar los datos de la prueba? Un enunciado explícito t? para cada gra.do por nivel de habilidad, pero en cada grado sólo tiene de
de estas preguntas puede ayudar a aclarar las maneras en que se deben analizar CInCO ~ 1O estud1ante~ 9-ue se ubica!l por debajo de un CI de 100 en la prueba
y reportar los datos de la prueba. de ap~ltudes que admIm~tra. Es pOSIble que un análisis separado, basado en un
La pregunta general: ¿qué tan bien se desempeñan los estudiantes de ta~ano de muestra ~: CInCO a 10, sea tan inestable que no tendría significado;
cada grado de nuestra escuela en relación con las muestras normativas aS1, el ran~o .de habIhdad sobre el cual podría realizarse dicho análisis sería
nacionales?; se requiere sólo una tabulación de todas las puntuaciones den- bastante lnrotado.
tro de un grado en cada prueba y el cálculo de algún tipo de promedio. Esta Los resultados·.de un programa de pruebas pueden presentarse en reportes
puntuación promedio se puede comparar después con las normas nacionales Y<l: sea orales o esc~·ltos . La may?ría de los sistemas escolares encontrarán ven-
mediante la construcción de sistemas promedio. Por otro lado, si se pregun- taJas en ambos metodos¡ es deCIr, preparar un reporte escrito para referencias
ta: ¿qué tan eficaces han sidu nuestros esfuerzos para abarcar los programas futuras y usar reportes orales para una comunicación eficaz con la mayoría de
de contenido para los estudiantes de cada nivel de aptitud y de diferentes los grupos. Los ,r:sultados importantes se deben presentar en forma tanto
niveles socioeconómicos? Primero se debe agrupar a los estudiantes en cada tabu~ar como gr~f¡ca. Para cada clase y escuela o subgrupo de interés, las pun-
grado por niveles socioeconómicos, y dentro de los niveles socioeconómicos tuaCIOnes deberan mar~arse ~O! separado para cada subprueba significativa_
por el nivel de desempeño en una prueba de aptitud escolar; dentro de cada En geI?eral, las p~ntuacIOnes utIles pa~a contestar l~ mayoría de las preguntas
sub grupo, se deben tabular las puntuaciones de aprovechamiento y calcu- deberan ~onvertI~se en otras puntuaclOnes; es deCIr, puntuaciones de grado,
lar las puntuaciones promedio; finalmente, se tiene que buscar algún dato p~ntuacIOnes .estandar o percentiles, para cada grupo de grado en particular.
normativo para subgrupos similares de alumnos y mostrar los datos para la SI las p~ntuacIOnes serán comparadas con otras subpruebas deben usarse los
propia escuela en comparación con el grupo de referencia. percentIles o las puntuaciones estándar que tienen una si~ificación compa-
La mayoría de las preguntas que se pueden plantear implican varios ti- rable en~re las p~ebas, en .vez de las puntuaciones de grado. Las puntuaciones
pos de comparaciones. Algunas de ellas que pueden ser de interés son las promedIO (medIas y. m~dIanas) se nec.esita~án obtener para cada grupo; sin
siguientes: embargo, el I:romedIO ~lmple proporClOna Información limitada, de manera
que para una Imaget;! ~~s completa de los resultados, alguna media de variabi-
a) Comparaciones del desempeño del grupo local con las normas nacio- lIdad (como la desvIacIOn estandar o el rango de semiintercuartiles) también
nales o con normas más especializadas. debería calcularse. ~uando se reporta al personal de la escuela, se pueden
~ '- j ,; :¡
b) Comparaciones del desempeño del grupo sobre pruebas de aprovecha- calcular ~os pe~centIles 1?, 25, 75 Y 90, además de la mediana, de tal manera
'r.. miento con el nivel de desempeño sobre pruebas de aptitud escolar. ~ue se de una Imagen mas completa del desempeño del grupo. Todos éstos
,!'.!
,, e) Comparación del aprovechamiento en diferentes áreas o materias.
I
tienen que quedar organizados en forma tanto tabular como gráfica.
¡ :
.:!,¡ d) Comparación de la eficacia del programa de la escuela con los estu- Una buena representación gráfica puede facilitar la comprensión .de los
diantes de diferentes características raciales, socioeconómicas o de re~u!tados de la prueba, pero hay que evitar las distorsiones de los datos en las
habilidad. graÍlcas, ?e tal ~anera 9ue ~~ conduzcan a interpretaciones incorrectas. La
e) Comparación de las diferentes escuelas dentro de un sistema o de dis- forma m~s comun de dIstorslOn se deriva de mostrar sólo una parte de la es-
tintos grupos de clase dentro de una escuela. cala vertIcal. Al hacer esto, algunas veces es posible ampliar uria parte de la
f) Comparación de grupos que fueron enseñados de manera diferente o esca~~, de tal ~odo que las pequeñas diferencias se vean como grandes dife-
que tuvieron distintos programas de contenido. ren~Ias. Tamblen se debe trata~ de mantener las gráficas tan simples como sea
g) Comparación del mismo grupo de individuos en diferentes niveles de pOSIble; p~~er muchas cosas dIferentes en una gráfica sólo confunde al públi-
grado. c.o. Las grafIcas que representan los datos de una prueba se muestran en las
h) Comparación de grupos en diferentes niveles de grado dentro de una fIguras de la 14.1 ala 14.5.
escuela o un sistema escolar. En la figura 14.1 se m~e~tra el nivel mediano de aprovechamiento para
los gra??s del tercero al septlmo dentro del sistema escolar de Centreville.
Los tipos de análisis que se pueden hacer de los resultados de prueba están Esta graf~ca hace que la comparación sea particularmente fácil en cuanto a los
limitados por los tipos de comparaciones de los datos que estén disponibles grados dIferentes dentro de cada área de materias, pero también permite com-
para la prueba y por el número de estudiantes en el grado o sistema que tienen
550 CAP. 14. PlANEAClÓN DE PRUEBAS 551

paraciones entre áreas de materias para un solo grupo de grado. Este tipo de 99
gráfica es adecuada para mostrar a cualquier tipo de público cómo el desem- 98
peño promedio en cada grado de esta escuela se compara con las normas na-
cionales de promedios sistema; es particularmente adecuada para el público
95
l~go. Para ~onstruir una gráfica de este tipo que presente una imagen tan pre-
cIsa¡ necesItamos las normas para los promedios construidos. En esta gráfica
se muestran promedios para nuestra escuela¡ los cuales deberán compararse 90
con promedios de otras escuelas.
80
90

80 70

°(; '" 70
.
~
(F-
0.0
V):g
c:<1> 50
<1> :>
60 !:
g~ <1>
n.
o o
._ c: 40
v v
o",
50
30
c: o
Q;~
';~
40
20 Q)
..
'"
-o
0.2
ov
~ e
<'a. 30
·0
:>
-0-0
.:.= :> ~
<1>
cr
c:
.:ot;<1> É
n. o o '§
~ ..s:::_
20 10 '5 <1>
<1> leyendo
:; <1>
-o
<1>
-o !? -o
.D !?
10L-----~------------------------------------~ o :>
o o o
a. o
~
v ü
5
>
o ~ o
t-
o
t-
o
>- Normas nocionales generales
Leyendo (individuall
2
(] Normas para estudiantes del
mismo nivel de CI !individuall
Tercer grado Cuarto grado Quinto grado Sexto grado Séptimo grado

Figura 14.1. Aprovechamiento mediano de Centreville por órea de materia y nivel de Figuro 14.2. Aprovechamiento mediano de los estudiantes del séptimo godo de Centre-
goda en comparación con· los normas nacionales peco promedios sistema. ville en relacióh con los normas nocionales generales y con los normas poro estudian-
tes del mismo nivel de CI (pruebo lowa de habilidades bÓslcos).

. En la figura 14.2 se muestra el desempeño mediano del mismo grado sép-


tImOl comparado con las normas nacionales generales para los individuos y En la figura 14.3 se muestra otra forma de comparar el nivel de aprove-
con las normas nacionales para individuos que calificaron en el mismo nivel chamiento y el nivel de inteligencia. En este sistema escolar¡ se·administraron
de el en el promedio para este grado. La comparación de las figuras 14.1 y la prueba de aprovechamiento Stanford (edición 1964) y la prueba de inteli-
14.2 respecto a la altura de las barras en cada prueba¡ indica el efeCto de usar gencia Otis, beta¡ a todas las clases del séptimo grado. En la gráfica se muestra
normas para individuos más que para promedios sistema. No obstante que el desempeño en la comprensión de la lectura para la mitad de los estudiantes
ambas !?fáficas muestr~n que los alumnos del s~ptimo grado se desempeñan en el séptimo grado que obtuvieron puntuaciones a cada nivel de estanueve en
por enCIma del promedIO en todas las pruebas¡ solo la figura 14.1 muestra con la prueba de inteligencia. Este tipo de gráfica es particularmente valioso para
precisi~n qu~ tan lejos sobrepasa el desempeño típico de este séptimo grado. presentarlo al personal de la escuela¡ porque muestra con claridad que el pro-
Aun aS1¡ debIdo a que no hay normas para construir promedios de los niveles grama de lectura en la escuela fue menos eficaz para los estudiantes que se ubi-
de inteligencia para la prueba utilizada en este sistema¡la figura 14.2. es valio- caron en (o por debajo) el sexto estanueve en la prueba de inteligencia.
sa a pesar de sus limitaciones. Primero¡ es importante observar que original- En las figuras 14.4 y 14.5 se ilustra una forma de presentar una imagen
mente ~e esperaba que ~os alumnos de este séptimo grado se desempeñaran tanto del desempeño típico como del rango de desempeño de un grupo. En
por enCIma del promedIo. Segundo¡ llama la atención el desempeño relativa- estas gráficas¡ las barras que representan el aprovechamiento se extienden des-
mente pobre del grupo en aritmética¡ en relación con el de otros estudiantes de el percentil 10 hasta el percentil 90. El desempeño en el primer 50% se
de séptimo grado con puntuaciones de prueba de aptitud similares. muestra por la porción más gruesa de la barra¡ y la mediana está indicada por

.. . .: :. ..-
, . ' ~.: ',' , .. :- . .. .......:... ' .... : '~. -":,,. '~' .." " ' " :', ,.... , .. ' ~ .: ~. ~ .. ' , -." . . ". .: o", ~
552 PRESENTACIÓN AL PÚBLICO 553

12.0
11 .8
11 .6
11.4
11 .2
11.0
10.8
10.6
10.4
, ría de los grupos legos. La ligura 14.4 permite hacer comparaciones en!re las
subpruebas para el séptimo grado, y la fi~ra 14.5 muestra el desemp~n~ del
nllsmo grupo de estudiantes en ortograha, desde el cuarto hasta el septlmo
grados.

99
10.2
10.0
98 ~
-
9.8 ,()
9.6
-8'"
9 .4
9.2 )
95 ~ -- -
o 9.0
o, 8.8 -
a>
-u 8.4 8 .6
-i"
; . 90 r- - -
'".• r-
'"a> 8.2 -
e 8.0 80 r-
a>
(5
7.8 f-
r -
> 7 .6 '"Q) 70 f- -
,! .
i. 'S
CT
7.4 15 f- -
a> 7.2
7 .0
c=
o 60 -

--
'"
(J)
c: 6.6
6 .8 o - ,--
o e 50 - f--

o 6 .2
6.4 el)

~ 40
-- - - -
:J
e 6.0 e t-
- - ~ Leyendo
:J
"-
5 .8
5.6
Q)
v
Q; 30 - . - ~+- Percentil 90
5-.4
5 .2
5.0
o...
20 - - -
Percentil 75
4.8 - -
4 .6
4.4
4.2
10 - - -
M ediana
4 .0
3 .8
3.6
5 '- .... -
¡'I '
II 3.4 +- Percentil 25
2 3 4 5 6 7 8 9 2 i- .... -
Estanueve en pruebo de inteligencia - .:&- Percentil 10
r-- i- -
o o .Q c o '"
o o
V)
-o~ o '0 u
Ley:ndO Percentil 75 ou ~ 'O Q)
o u 'ü :;::: - u
fr~
I
'0
Normas .....- -- Mediano ='0
~
Ci> :::> a~ O ' a>
u E E
u _
'c a.. .E O> ~.E -a. c
nocionales .. Percentil 25 .2> (J)
Vl-U o c:
3 u .~
« =Eo o ' ¡::
Ue

Desempeño E Percentil 75 figura 14.4. Mediana y rango de aprovechamiento en alumnos del sé ptimo godo de
del séptimo Mediano Easton en comparación con los normas nacionales (pruebo de aprovechamiento
grado Percentil 25
Stonford. 1964).
figura 14.3. Compaación del desempeño en lo pruebo de aprovechamiento en lo lectu-
ra por nivel de desempeño sobre uno pruebo de inteligencia paro alumnos del sépti- Tal vez sea importante destacar que los resultados de prueba qU8 se mues-
mo godo de Eoston (batería avanzado. pruebas de aprovechamiento Stanford. tran en cualquier serie de gráficas y tablas constituyen sólo los hechos en cru-
1964). do mas no son ni conclusiones ni interpretaciones significativas. El educador
qu~ conoce las circunstancias en que se produjeron las puntuaciones de prue-
una línea horizontal a través de la barra más amplia. La cantidad de detalle en bas debe suplir estas interpretaciones. Por tanto, si se da poco énfasis al cálcu-
la gráfica la hace más adecuada para el personal de la escuela que para la mayo- lo aritmético en el sistema escolar del que se obtuvieron los datos para este
;!

¡

554 PRESENTACIÓN Al PÚBLICO 555


99 t- ·mediante este rechazo a afrontar un problema no desaparece éste. La igno-
- - 98 rancia acerca de qué tan pobremente (o qué tan bien) se desempeñan los
niños en lectura no los ayudará a que lean mejor; por el contrario, el análisis
95 - -,... -r- - de los resultados de las pruebas deberá servir como estímulo para determinar
,... por qué se obtuvieron esos resultados. El personal de la escuela podría bus-
- - - 90
d5 - - car respuestas a preguntas como: ¿tenemos un cuerpo estudiantil muy diná-
'"(lJ leyendo mico?, ¿son adecuados en cantidad y en calidad los materiales de lectura para
:. 80
¡ ¡ Oe 75
O
--= - 70
-
el tipo de estudiantes que tenemos?, ¿los maestros obtienen la suficiente
·ü 65 ayuda de los supervisores y de los especialistas en lectura?, ¿cuánto tiempo
O
e 55
= -= 60 de instrucción en la lectura recibe cada niño en cada grado?, ¿es demasiado
:.:
'" 45 -=- - - - F== 50
grande el tamaño de la clase para el maestro que le impide centrar su aten-
¡ . ~
e - 1-
40
ción en las diferencias individuales?
=- -=30
(lJ
35 1-
~
(lJ
25 - - 20
Los datos del análisis de reactivos pueden ser de ayuda particular a un sis-
~
'- tema escolar para comprender cuáles son las ventajas y las desventajas de su
15 '- - programa. Estos datos se pueden usar para ayudar al educador a interpretar
c- - 10
los resultados de las pruebas.
5 ¡- -
- - ....
t- -- 2 Reporte de los resultados de
r-
6 7
pruebas al individuo
Grado 4 5
1963 7 64 1964-65 1965-66 1966-67
Como ya se mencionó, los padres tienen el derecho de examinar cualquier
Figura 1.4.5. Aprovechomiento de los mismos estudiantes desde el cuarto (1963-1964) tipo de registro acerca de. sus hijos que tenga la escuela, incluyendo las pun-
hasta el séptimo godo (1966-1967) en ortogafía. tuaciones de pruebas; pero esto implica una acción positiva por parte de los
padres. ¿Qué debería hacer la escuela para reportar rutinariamente los resulta-
dos de pruebas a todos los padres?, ¿cuándo y quién debería reportar los resul-
séptimo grado que se muestran en la figura 14.4, no se podría esperar un tados de las pruebas?, ¿en qué forma deberían presentarse los resultados?
desempeño alto. Si la escuela da poco énfasis a una habilidad en particular en Un reporte impreso es, cuando mucho, una forma fría e impersonal de
uno de los primeros grados, pero incrementa este énfasis acerca de la habi- comunicación y está sujeta a que la interprete mal el lego, quien tiene poca
lidad en los grados más altos, cabrá esperar un aprovechamiento bajo en los experiencia con las pruebas y con los conceptos de la evaluación. Por esta
primeros grados; la escuela debe presentar el análisis de los datos de la prueba razón, a menudo es conveniente que se den los resultados de la prueba directa-
en todos los grados, como en la figura 14.5, para mostrar si la mejoría espera- mente en conferencias con los estudiantes y sus padres. La mayoría de las
da en aprovechamiento ocurre en los grados posteriores. Por otro lado, los escuelas han previsto que los padres visiten la escuela periódicamente y que
maestros y administradores de la escuela nece~itan afrontar con franqueza las tengan algún tipo de contacto con el maestro de su o sus hijos y/o con un
situaciones en las que hayan tenido menos éxito que el esperado. miembro del personal de asesoría. Estas visitas podrían programarse con ven-
Para muchas escuelas es particularmente difícil dar a conocer resultados taja algún tiempo después de que estén disponibles los resultados de la admi-
como los que se muestran en la figura 14.4. La escuela de la que se obtuvie- nistración de las pruebas.
ron estos datos tenía una estanueve mediana de 4 en la prueba de inteligen- Al mismo tiempo que se realizan estas conferencias o reuniones, sería
cia Otis. Este tipo de escuela posiblemente trate de explicar los resultados deseable tener a la mano un registro del desempeño que se pudiera dar al es-
con base en que el nivel de habilidad promedio de sus estudiantes en el sépti- tudiante o a sus padres para que lo guardaran_ Muchos editores de pruebas
mo grado está por debajo del de la muestra normativa nacional; sin embargo, proveen formas de registros diseñadas para dárselas al estudiante o para
la figura 14.3 indica que, aun cuando se tuviera en cuenta el nivel de habili- enviárselas a los padres a su domicilio. Estas formas de registro varían consi-
dad los resultados de la prueba de lectura son todavía muy pobres en su derablemente. Las mejores proporcionan una descripción simple de la natura-
tot;lidad, y un análisis similar para la aritmética probablemente mostraría leza y de los propósitos de las pruebas, una explicación acerca de cómo inter-
un cuadro semejante. Ante tales resultados de pruebas, el personal de algu- pretar las puntuaciones reportadas y algún tipo de perfil para registrar las
nas escuelas se inclina como el avestruz proverbial, a enterrar los reportes puntuaciones de los estudiantes. Casi todas ellas contienen medios para
bien profundamente e'n un archivo donde nunca más pueden ser vistos, e reportar puntuaciones exactas, normalmente los percentiles o los estaI?-ueve.
incluso decide suspender los programas de pruebas estandarizadas. Pero El personal de la escuela debería examinar las formas de reporte pubhcadas

.::-.'
.• .... ;
' . .."... . ' ~ ':' ..' . " ,., :", <• .•. . • .
CAP. 14. PlANEAClÓN DE PRUEBAS
557
556
para la prueba que se usan, a fin de decidir si quieren reportar los resultados de ~.g
la prueba de esta manera. c:
'" g-!.
Una escuela puede diseñar una forma de reporte para sus propios estu-
diantes. Esta forma debería contener la manera de reportar la posición del
-g
~
." ' -

."ª = -'

estudiante en todas las subpruebas importantes de una batería de pruebas y


~ '"
dar información acerca de la naturaleza y el propósito de las pruebas. Debido '"
e~
Q

a que las puntuacioneS no son exactas y los padres y los estudiantes pueden
hacer más interpretaciones de las necesarias, es recomendable tener una for-
Q)
~

"i5
~
." - ."
:C;E
J: '~ = -' -

ma en la cual se muestren puntuaciones en categorías más bien amplias. El '" '"


cuadro 14.3 es un ejemplo de un tipo de forma de reporte que un sistema esco- '"
..c
'7 i~ = -' -
lar podría construir para su uso. En este cuadro las puntuaciones se han agru-
Q)

~
~ :~
.3 '-'a
pado en cinco categorías: alto, percentil95 o más alto; por encima del pro-
medio, del percentil 76 al 94; promedio, del percentil 2.5 al 75; por debajo .g ¿,
'"
del promedio, del percentil 6 al 2.4, y bajo, del percentil 5 hacia abajo. Cual-
c:
Q)
.!2> 00
~
~
."

Q)
'"
. t;:; = 1-' -
quier prueba que tenga normas de percentiles puede anotarse en una forma de ~
-.o
o-
ce
1 1 1 1
.:
este tipo. La postura del estudiante en cada prueba se puede mostrar en rela- ., Q) '"
-o -o
~'" =
ción con las normas de percentiles nacionales generales,las normas de percen- S .É
-C>
G 1-' -
tiles locales o las normas de percentiles de puntuaciones de pruebas de inte- -o
Q)
4: 1 1 1 1

I~- II
'"Q.
II =
~

I I
ligencia. ¡g
o g-
El uso de una forma de reporte se puede ilustrar al tomar el registro de '"
.E ~
el> '=E
Roy Dawkins, un estudiante de cuarto grado de la escuela elemental de Cen- >- ¿; 2
-o c..
~ o Q; c>
treville a quien se administraron las pruebas Iowa de habilidades básicas y la
:~
t:5 ~ ""QE
I=~-
prueba de inteligencia Lorge-Thorndike, en abril de 1968. Su desempeño en
las pruebas se muestra en la tabla 14.1 en términos de puntuaciones de equi-
.Q

Q)
-o
Q)
-o
o
-5
~
:::;:E
.~

1 1 1 I
valentes de grado, percentiles nacionales generales, percentiles locales y per- el>
u.. .;,
centiles nacionales por nivel de inteligencia. .
~'" => c:
=-' -
~ C':::2
=> ~
Las puntuaciones de Roy se han anotado en una forma de registro en la '"
-e::: <>-
Q)
que N indica las normas de percentiles nacionales, L las normas de percentiles -o
¡g
locales e 1 las normas de percentiles de nivel de habilidad. Por supuesto, sólo '"
;,:
"'-
..",e
podría usarse un tipo de norma o debería emplearse una forma por separado ..!:!
Q ~ ::;:
>...
= -' -
para anotar cada tipo de norma. El uso de las tres normas en la misma forma i3
-o
~
:::. c>
Q) E
::.
tiene sus ventajas, si es que se pretende poner énfasis en las diferencias de la Q.

I=~-
posición que tiene Roy en relación con los tres grupos de referencia. Antes de '"
.E o~
sostener una entrevista o reunión con Roy y sus padres, el maestro o el asesor. CI) C§~
deberá adecuar los datos disponibles del desempeño de Roy en el salón de cla- ..o 1 1 1 1
~

I= I~- I
ses y, si es posible, examinar. su hoja de respuestas en las pruebas de aprove- !:!

I I
o
chamiento, a fin de tener una información más específica de los puntos fuer- >C:
""
~
Q)
c..
tes y débiles de Roy. E

I= I~-
~
El reporte oral debería incluir una explicación corta de las pruebas. El
estudiante o el padre tendría el derecho de observar los registros a medida que
el maestro o el asesor le dieran su interpretación. Esta interpretación debería
Q)
-o
Q)
-o
CD
t '"
IX
~
' S;:
~
c:
Q)
'-'
:.
~ . ;;::
~
0-
::-
o
'"
I I I
ser semejante a la siguiente: o
'"
c
c <>
~
Q.
Q)
:.i2 Ec: ..,.. :
a:: 3= Q) ""Q
." '"
." o-
Q)
c..
oq-
La aptitud de Roy para el trabajo escolar es mejor que el promedio entre los o E c: a;_ N

niños de cuarto grado en el país en su totalidad, pero sólo representa el promedio


ro; <=> el> ~g .~ -o a> ~~o
~
ü:i C>
O>~
o c
G> 0-
-c e .!:!.--..o -;;;;-
<>
0;--
entre los estudiantes de cuarto grado en las escuelas de Centreville. Predecimos
que muy probablemente estaría por encima del promedio en aprovechamiento
cuando se le compare con una muestra nacional de niños de cuarto grado, pero
..
o
"'l:I
13
.;;

E
o
-¡¡¡
~
'-J ""
'" "'-
c:
o..-
Q) -
_ o
_ -o
~o

'" '"
'O
E
;;e .:c 00-
o
csE!-o ~~~
o~;;;-
.:.r5Cii'"'-
e~D
...8.:6;
el>
-c E
:s
<>
~
C
~
Q)
e
~; ái
-
. _c
<>e_E
o Q)
o

aún así sólo sería el promedio en aprovechamiento entre los niños de cuarto gra-
:> C> ~ <iE o- =- ..... CI)
o- c.. o- co c..U">
u = U-I
.~

558 PROGRAMAS DE PRUEBAS EXTERNOS 559

Tabla 14.1. Resultados de la pruebo de Roy Dawkins habilidades. Planeamos formar pequeños grupos de estudiantes como Roy y asig-
narles una tarea especial en estas habilidades. De tiempo en tiempo, daremos a
Percentil Roy ejercicios especiales acerca de estas habilidades para que los haga en casa.
Percentiles nacional por Usted puede ayudar supervisando que Roy realmente los realice.
Equivalente nacionales Percentiles nivel de En las dos pruebas de aritmética, las puntuaciones de Roy fueron el promedio
de acuerdo con las normas nacionales, pero están por debajo del promedio para
Prueba de grado generale~ locales inteligencia nuestros niños de cuarto grado y para su nivel de habilidad. Roy tiene dificultades
para realizar las operaciones fundamentales y necesita más práctica en cuanto a
Vocabulario 4.4 41 19 21 los hechos numéricos. Trabajaremos con Roy en estas habilidades. Usted puede
Lectura 4.4 42 22 16 tratar de alentar a Roya practicar sus habilidades aritméticas en casa si hace uso
de situaciones naturales que impliquen dinero o medidas.
Ortografía 6.4 82 76 84
Uso de mayúsculas 5.8 71 49 65 En el ejemplo anterior hemos tratado de explicar tres cualidades que de-
Puntuación 5.0 56 33 38 bería tener una interpretación, a saber:
Uso del idioma 5.0 55 52 34
Mapas 4.0 28 08 16 a) Debería establecerse en un marco de referencia del estudiante en par-
Gróficas 4.4 40 20 23 ticular. Las puntuaciones de prueba deberían ser interpretadas en tér-
Referencias 4.1 31 17 17 minos del conocimiento que se tiene de la aptitud del estudiante y de
Conceptos aritméticos 4.1 31 19 14 sus metas educativas o vocacionales.
Problemas aritméticos 4.2 34 20 20 b) Debería estar dirigida hacia una acción positiva y constructiva. La
Prueba de inteligencia interpretación debería destacar los aciertos en un perfil de pruebas u
Lorge-Thorndike (el = 112) 5.2 78 55 orientarse hacia la acción para solucionar problemas cuando el apro-
vechamiento se ubica por debajo de los que las aptitudes podrían
hacemos esperar.
e) Debería ser fáctica y desapasionada, más que parecer que enjuicia al
individuo. Los resultados de la prueba se deben reportar de manera
do de Centreville. Ahora veremos cómo el aprovechamiento de Roy satisface
nuestras expectativas. verdadera y precisa.
En vocabulario y lectura, Roy está en el promedio de acuerdo con las normas Lo importante es trabajar con el estudiante y sus padres para realizar
nacionales, pero está un poco por debajo del promedio en el cuarto grado de Cen-
metas comunes, más que reportar un juicio acerca del niño.
treville. Su aprovechamiento en estas pruebas indica que es probable que tenga
ciertas dificultades para mantenerse al ritmo del trabajo escolar por el resto de este
año escolar yen el quinto grado. Roy lee despacio y tiene algunas dificultades para PROGRAMAS DE PRUEBAS EXTERNOS
mantener la idea principal de un pasaje y contestar preguntas que no estén especí-
ficamente contestadas en el material de lectura. Planeamos trabajar intensamente Hasta ahora sólo hemos analizado los programas de pruebas, que se hacen
con Roy para obtener estas habilidades por el resto del año. Usted podría ayudarlo dentro del sistema escolar local y de los cuales se tiene un control absoluto. Al
en casa si tuviera la oportunidad de alentarlo a aprender y usar nuevas palabras y planear su propio programa de pruebas, una escuela debe considerar los pro-
le auxiliara a leer durante su tiempo libre.
En ortografía, Roy está un poco por encima del promedio, en relación con la gramas de pruebas externos que están bajo el control de las agencias ajenas al
norma nacional, de los niños de cuarto grado de CeIltreville y de su nivel de habili- sistema local. En las secciones siguientes se analizarán brevemente los tres
dad. Su ortografía es uno de sus puntos fuertes. Las puntuaciones que obtiene en tipos de programas de pruebas externos que implican grandes números de
el uso de mayúsculas, puntuación y pruebas de uso de la lengua están por encima estudiantes de las escuelas elementales y secundarias, que son:
del promedio para su nivel de habilidad y entre los estudiantes de cuarto grado de
Centreville. a) Programas de admisión y colocación para la universidad.
No obstante que las puntuaciones de Roy en la lectura de mapas y en el uso b) Programas de pruebas para el otorgamiento de becas, a nivel nacional.
de referencias son promedio, de acuerdo con las normas nacionales, y su puntua- e) Programas de pruebas impuestos por los estados.
ción en gráficas está por encima del promedio en términos de las normas nacio-
nales, está un poco por debajo del promedio en todas estas pruebas si se le com-
para con los niños de cuarto grado de Centreville, y más abajo que lo que cabía Programas de admisión y colocacIón
esperar de acuerdo con su nivel de habilidad. El dominio de las habilidades medi- para la universidad
das en estas pruebas es importante para nuestros programas de matemáticas, cien-
cias naturales y estudios sociales, así como en el de lenguaje. Si queremos que Roy El programa de pruebas de admisión a la universidad más antiguo que se
aproveche satisfactoriamente estos programas, debe adquirir el dominio de estas conoce fue conducido por la College Entrance Examination Board (CEEB)

.. " .
.~ .
PROGRAMAS DE PRUEBAS EXTERNOS 561
560 CAP. 14. PLANEAClÓN DE PRUEBAS

-~ir~~ión de e~ámen~ para el ingreso <:n la universidad-o En 1900 esta este programa se pueden obtener en las publicaciones de la Dirección de uni-
dlTeCClO~ empezo a admIlllstrar pruebas de Ingresos para un número limitado versidades.
de ~studlante? a las universidades del"Ivy League". Las primeras pruebas
te~Ia~ un ca~acte: de pruebas de ensayo, pero una prueba de aptitud escolar
obJet~v~ fue InclUIda en 1926, y más tarde las pruebas de aprovechamiento se Programas de pruebas para el
con":1rt1e~?n gradu~lme~te a un formato objetivo. El volumen de pruebas de otorgamiento de becas
laDlT~CCIOn de !llllversldade? se i~crementó lentamente al principio, pero
despue~ aumento cada vez .mas e.l pumero de escuelas que requerían las prue- Los programas de pruebas empleados en relación con el otorgamiento de
bas, . aSI como el porcentaje de Jovenes que aspiraban a ingresar en la uni- becas representan un interesante desarrollo especial. La necesidad de adminis-
versIdad. trar estos programas surge de que los recursos sutanciales monetarios provie-
La CEEB administra sus pruebas en centros de pruebas en todo el mundo nen de fuentes externas de cualquier universidad, fundaciones, la industria y
Los papeles ~e p~eba se califica~ de.manera central, y los resultados se repor~ los gobiernos estatales y federal, de tal manera que se requiere una apreciación
~an. a.las ulll~ersldades que los IndIviduos han designado, a su escuela y al general de los solicitantes que no esté relacionada con los programas o con las
mdIVIduo ~IS~O. ~eneralmente, los estudiantes realizan estas pruebas políticas de cualquier institución en particular. El programa más ambicioso de
dura.nte su ultlI~o ano de escuela secundaria; sin embargo, siempre hubo este tipo es el administrado por la Corporación nacional de mérito para la
alguIen que tomo e~tas pruebas cuando apenas iba en los primeros grados de obtención de becas. La identificación de los "semifinalistas" se ha basado en
la escuela secundana, y en 1959-1960 la Dirección de universidades formali- una prueba de aptitudes escolares preliminar. Debido a que la política de la
zó la prueba de ~ptitudes escolares, preliminar para administrarla a los jóve- ~?rporación consiste en que las becas se deben repartir por estados en propor-
nes de secundana qu~ expresaran dese~s . ~e ingresar en la universidad, para CIOn con el número de graduados de escuela secundaria, el estándar para cali-
9-ue se us~a como gUla y para una admISIOn temprana a la universidad. Más ficar como semifinalista ha variado ampliamente de un estado a otro. Esta
mf<:>rmaclOn acerca de estas pruebas y las series se puede obtener en las publi- política también sostiene que el valor en efectivo de la beca varíe de acuerdo
caCIOnes de la Dirección de universidades. con el estatus financiero de la familia.
. Un segundo programa, más nuevo, para la admisión a las universidades El otorgamiento final de las becas se ha basado en el desempeño en las
dIseñado para universidades más pequeñas y menos selectivas que las que for~ pruebas de la CEEB y en otros factores como los paneles de evaluación consi-
man parte del progra~a de la Dirección de universidades, fue diseñado como derados.
el Pn;>grama estadoumdense de pruebas para ingresar en la universidad. La . Otros servicios de pruebas escolares menos extensos han sido dis~ñados y
bat~na ,de este pn?~ama ~on~iste en cuatro pruebas de habilidades generales ofrecidos al público por la Dirección de universidades, el Servicio de pruebas
en I~g~es, matematIcas, CIenCIas naturales y estudios sociales. Las pruebas se educativas y ciertas agencias estatales de pruebas.
admIlll~tran en los centros que se encuentran distribuidos a lo largo de Esta-
dos Umdos. Más info~mación acerca de estos programas se puede obtener en
el Programa estadoumdense para pruebas universitarias, en Iowa City, Iowa.
~lgunos estados elaboran sus propios pn;>gramas de admisión a las uni- Programas de pruebas impuestos por
verSIdades que operan con fondos estatales. Estos varían considerablemente los estados
de un estado a otro, y la información acerca de ellos normalmente se puede
obtener y~, sea en la principal universidad estatal o en el Departamento Un número de estados han hecho obligatorias ciertas pruebas que deben
de educaclOn estatal. aplicarse en grados particulares a lo largo de todo el estado. Algunos de los
Finalmente, hay varios programas de a~misió~ para escuelas de gradua- estad?s usan pruebas estandarizadas ya publicadas para estos programas obli-
dos o para esc~e!~s profeSIOnales. Los mas amplIamente utilizados como gat?nos, pero otros, como el de Nueva York, emplean pruebas que son cons-
pruebas de adm}SIOn pa~a .escuelas de gradua?~s son los exámenes de regis- truIdas por el Departamento de educación. Los programas a lo largo del esta-
tros del graduaao/ admIlll.s trados p<;>r.el SerVICIO de pruebas educativas, y la do normalmente se han establecido para servir a dos propósitos: controlar la
prueba de analog~as de Mlller, admmlstrada por la Corporación psicológica. calidad, es decir, ayudar a determinar la eficacia de los programas educativos
Las pruebas e~p~clales se usan ~n las escuelas, profesionales en campos como en las comunidades locales, y dar información que ayude al estado a localizar
derecho, medICIna, odontologla y contaduna. Se puede pedir información los sistemas escolares locales, ya sea para obtener fondos estatales especiales o
acerca ?~ ,ellas en las asocia<:iones naciona!es de profesionistas, la oficina para recabar fondos federales bajo el control del estado.
de adnusI?n,.la escuela profeSIOnal o cualqUIera de las agencias mencionadas El patrón típico encontrado en estos programas obligatorios del estado es
con antenondad. requerir pruebas en ciertos grados. Generalmente, las pruebas se enfocan en
., El programa de colocación avanzada de la CEEB se ha descrito en la sec- las habilidades básicas, aunque algunas, como los exámenes estatales para
Clon acerca de los programas de prueba de la universidad. Las descripciones de Nueva York. se han diseñado para apreciar el aprovechamiento en los cursos
562 CAP. 14. PLANEAClÓN DE PRUEBAS PROGRAMAS DE PRUEBAS EXTERNOS 563
de tIpO preparatorio universitarios en los grados desde el noveno hasta el padres para que la escuela establezca los programas de ayuda a los estudiantes
duodécimo. para las pruebas. La CEEB (1968) ha patrocinado o conducido varios estudios
acerca ~e los efectos de e~t~ ayuda. La conclusión de estos estudios es que la
ayuda tIene pocas probabi.hda,des de ser positiva para la prueba; sin embargo,
INTERESES EN LOS PROGRAMAS DE esto probablemente no eVItara que algunas escuelas y sus alumnos sigan gas-
PRUEBAS EXTERNOS tando su tiempo en tratar de IIderrotar a la prueba".
Una cuarta preocu~~,:ión se ori~na ~el sentimiento de que los programas
de pruebas para la adml:"IOn. a l~ umversldad no son justos o que están sesga-
Todos los programas de pruebas externos han causado considerable inte- dos contra los grupos mmontanos. En los estudios en los que se considera este
rés a los educadores. No obstante que cada programa externo ha sido diseña- punto (CI~ry, 1968; Mu.nd!1Y, 196?; Sanley y Porter, 1967) se ha corrobora-
do para servir a propósitos educativos válidos, es oportuno preguntar si existe do la preClSlon de la predlccIon del exito universitario mediante el empleo de
la posibilidad de que estos propósitos estén en conflicto en cierto momento las pruebas de la CEED o de la Acr, que son más o menos iguales o más altas
con otros propósitos de las escuelas donde se administrarán las pruebas. La para los estudiantes negros que para los blancos.
preocupación de los educadores acerca de los programas de pruebas externos La quinta preocupación es que las pruebas externas pueden alterar el
se enfoca en los efectos que ejercen las pruebas en el estudiante y en el progra- programa educativo de la escuela, porque las pruebas controlan a los progra-
ma educativo de la escuela. mas de contenido y a los maestros, que se abocan a prepararse para las prue-
Algunos educadores opinan que los estudiantes en la escuela secundaria bas. ~s más probable que surja este problema cuando las pruebas externas se
son requeridos para demasiadas pruebas externas y que el tiempo que gastan relaCIOnan con los segmentos específicos de los programas de contenido de
en contestarlas podría ocuparse mejor en trabajo escolar regular; sin embargo, la escuel~, como en lo~ exámenes estatales para Nueva York. Dado que los
la mayoría de las pruebas externas para la admisión y la colocación en la uni- desemp~nos del estudlant~ del maestro y de la escuela se juzgan, en cierta
versidad o para el otorgamiento de becas se administran fuera del tiempo de exte~sIOn, por el ~esempeno sobre las pruebas, éstas adquieren una impor-
clase normal¡ generalmente los sábados. Los estudiantes tienen posibilidades tanCIa desproporcIOnada. Cualquiera que esté familiarizado con las escuelas
de tomar, cuando mucho, dos o tres durante el año. No obstante que los hora- secundarias del estado de Nueva York conoce clases en las que durante se-
rios para las pruebas pueden ocasionar molestias para los administradores de manas, e inclusive meses, se revisan las pruebas de los exámenes estatales
la escuela -las agencias de pruebas deberán atender a este punto-, la carga pasados. Entonces, nos preguntamos si ésta es una inversión más gratifican-
de tiempo que el estudiante toma difícilmente podría ·considerarse con te de tiempo para el estudiante y para el maestro.
seriedad. Aun cuando .la prueba está menos estrechamente relacionada con el pro-
Debido a que las pruebas para la admisión a la universidad representan un grama de contemdo, puede afectarlo mediante su procedimiento e intereses.
obstáculo importante para los estudiantes de la escuela secundaria que Por tanto, se ha argumentado que el papel relativamente pequeño de escribir
pretenden ser admitidos en la universidad, los maestros, asesores y otros inte- realmente en las pruebas de inglés reciente, de la Dirección de universidades
resados han expresado su preocupación acerca de los efectos producidos por ha reforzado una tendencia a reducir el numero y la variedad de composicio~
la ansiedad y la angustia a que son sometidos los estudiantes; efectos que, a su nes que. se requieren en .lo~ cursos de inglés de la escuela secundaria y ha
vez, se revelan en las puntuaciones de prueba. En varios estudios (S. B. Sarason fortaleCIdo una tendenCIa mdeseable. Ciertamente, es importante que los
y colaboradores, 1960; 1. G. Sarason, 1961) se han encontrado correlaciones progra.inas de pruebas externos presenten modelos deseables, destaquen las
negativas estadísticamente significativas entre las medidas de ansiedad de metas Importantes de la educación y no distorsionen los patrones de los pro-
prueba y las puntuaciones sobre otras pruebas. Por supuesto, las correlaciones gramas escolares. Cuando el programa de pruebas consiste en pruebas de
negativas encontradas en estos estudios no indican una relación causal direc- aprovechamiento de una naturaleza lo suficientemente amplia y básica que
ta. No se sabe solamente a partir de la correlación si los altos niveles de ansie- rebasa los cursos específicos y los objetivos de los cursos se reduce el peligro
dad causaron las bajas puntuaciones de prueba o si las bajas puiltuaciones de de un impacto desfavorable. '
prueba anteriores causaron el presente alto nivel de ansiedad. French (1962) A pesar de las preocupaciones que los educadores pueden tener acerca de
comparó el desempeño de los estudiantes de escuela secundaria sobre la prue- l?s programas de pruebas externos, éstos seguirán empleándose por algún
ba de aptitudes escolares de la CEEB bajo condiciones relajadas y de in- tIempo. Las personas responsables del diseño de los programas internos para
cremento de ansiedad. Este autor encontró que ese desempeño era esencial- su propio sistema escolar deberían familiarizarse con los programas de prueba
mente el mismo bajo las dos condiciones y que la validez concurrente de la impu~t?S por el c;stado, así como con otros programas externos, y preguntar-
prueba era la misma, como queda demostrado por la correlación con los gra- .} se a SI mIsmos cuáles son las necesidades locales que pudieran satisfacer estos
dos de escuela secundaria. programas. Después, podrían planear sus propios programas de tal manera
Una tercera preocupación relacionada una vez más con las pruebas de que complementaran, en vez de que duplicaran, la información proporciona-
admisión a la universidad, surge de la presión de los estudiantes y de sus da por los programas obligatorios.

" ' ... . -....,.. , . .',., ... " .. .. .. ,· .. ··c>:: . " .'.:.' :' ". .. '. ' .... ,',; . " .':
564 PREGUNTAS Y EJERCICIOS 565

RESUMEN dualizados, no tiene lugar un programa de pruebas de aprovechamiento estanda-


rizadas.R ¿Cuál es su reacción ante esta afirmación?, ¿en qué basa su respuesta?
3. Se ha sugerido que si una escuela elemental usa una batería de aprovechamiento
El tema central de este capítulo ha sido que las pruebas administradas y general del tipo de la prueba de aprovechamiento Stanford o las pruebas Iowa de
sus usos estén detenninados por las necesidades locales. Un programa de habilidades básicas cada año, cuando quiera usar una prueba de inteligencia, ésta
pruebas eficaz para la escuela está relacionado con las necesidades locales y deberá ser no verbal. ¿Cuáles son los argunientos para apoyar lo anteriorl, ¿cuáles
ayuda a construir una imagen continua del desarrollo de los estudiantes desde son los argumentos en contra?
el jardín de niños hasta el grado duodécimo. 4. Un sistema escolar quiere tomar partes de varias baterías de aprovechamiento
En el cuadro 14.1 se resume la variedad de funciones para las que se supo- para elaborar una batería de aprovechamiento que los maestros consideren más
ne sirven las pruebas. El estudio de estas funciones puede guiar al grupo local adecuada al programa curricular o de contenido de la escuela. El sistema propone
a definir sus propósitos en cuanto al uso de las pruebas. La planificación para diseñar normas locales y usarlas sólo para interpretaciones. ¿Cuáles son las venta-
un programa escolar de pruebas y el establecimiento de las políticas relaciona- jas y las desventajas de semejante proposición?
5. Una escuela secundaria en la que aproximadamente el 70% de estudiantes no tie-
das deberían realizarse por un comité que tuviera representantes de todos los nen educación adicional, tiene un programa vocacional apoyado tanto por la
niveles del personal de la escuela, pero sólo el director del programa de prue- escuela como por industrias locales. En los grados once y doce existe un progra-
bas debería ser el supervisor total para el programa. Las prioridades sugeridas ma laboral en que durante la mitad del tiempo los estudiantes aprenden un oficio
para un programa de pruebas para las escuelas elementales y secundarias, así y la otra mitad realizan trabajo académico. ¿Cómo podría diferir el programa de
como para las universidades, se resumen en el cuadro 14.2. pruebas de esta escuela al de otra escuela suburbana en la que el 80% de estudian-
En este capítulo se dieron sugerencias para realizar los programas de prue- tes van a la universidad~
bas de tal manera que se mantuvieran las condiciones de estandarización. Asi- 6. Una universidad especial de artes libres desea colocar a estudiantes no elegibles
mismo, se destacó la importancia de los buenos registros acumulativos de las para cursos regulares pero que prometan completar un programa de artes libres.
puntuaciones de prueba y la necesidad de verificar las puntuaciones para que La universidad aceptará a cualquier estudiante que tenga más de 18 años, haya
sean razonablemente correctas. completado o no la escuela secundaria. Se establecerán programas para remediar
El uso eficaz de los resultados de cada prueba requiere que se establezcan las deficiencias que"los estudiantes pudieran tener. Planee un programa de prueba
que ayude a dicha universidad a seleccionar y colocar a los estudiantes.
procedimientos para analizar e interpretar los resultados para varios intereses 7. Un sistema escolar administra una batería de pruebas de aprovechamiento en
públicos. Los resultados del grupo necesitan ser organizados eficazmente en octubre desde el segundo hasta el sexto grado; las pruebas consisten en vocabula-
gráficas y tablas que revelen las comparaciones significativas. Los reportes rio, comprensión de lectura, ortografía, inglés y conceptos y razonamiento mate-
orales y escritos se deben dar en la escuela, tanto para el propio personal como máticos. También administra una prueba de inteligencia general en los grados
para el público lego. Es necesario reportar los resultados de la prueba indi- segundo, cuarto y sexto. ¿Cómo pueden usarse los resultados de las pruebas en
vidual tanto al estudiante como a sus padres. También se analizaron los mé- cada una de las situaciones siguientes?, ¿cómo deberían analizarse los datos de las
todos para reportar los resultados de prueba al individuo. Se puso énfasis en pruebas para responder a cada problema?, ¿cuáles serían las limitaciones de los
dar una interpretación sólida de las puntuaciones en términos de las metas resultados de las pruebas?
educativas y vocacionales del estudiante, más que en dar reportes de las pun- a) Los estudiantes del sistema deben ser reasignados. Los padres de los niños de la
tuaciones exactas, que es muy probable se empleen e interpreten de manera escuela A objetan mandar a sus hijos a la escuela B, porque piensan que el nivel
equivocada. de aprovechamiento de sus hijos disminuirá.
Finalmente, se revisaron los programas de pruebas externos que influyen b) El sistema escolar ha nombrado un comité para que revise el programa de
en los programas de la escuela, y se analizaron los principales programas matemáticas elemental. "
externos, como los de la CEEB y la ACT, para ingresar en la universidad, ade- el Una escuela del sistema ha tenido una organización sin grados durante cinco
más de las pruebas de la Corporación nacional del mérito para la obtención de años. El personal de la escuela quiere mantener esta organización, pero la
becas y los programas obligatorios del estado. También se analizaron los inte- Dirección de educación quiere poner a esa escuela bajo la organización por
Teses de los educadores en cuanto a los programas externos de pruebas. grados, debido a los costos. "
8. Un Departamento de educación estatal quiere empezar un programa de pruebas a
nivel estatal en los grados segundo, cuarto, sexto, octavo, décimo y duodécimo. El
PREGUNTAS Y EJERCICIOS departamento necesita contar con los "datos acerca de lectura, lenguaje, matemáti-
cas y habilidad escolar general, los cuales se emplearán para estimar la eficacia de
los esfuerzos educativos a lo largo del estado y proporcionar financiamientos
l. Suponga que usted empieza a trabajar en un sistema escolar particular y se le ha especiales. Se han hecho las proposiciones siguientes. ¿Cuáles son las ventajas y las
dicho que uno de sus deberes principales durante el primer año será revisar los desventajas de cada una de ellas~
programas de pruebas que se emplean en el sistema escolar. ¿Cuáles serían los pri-
meros pasos que daría~, ¿por qué~ al El estado diseñará pruebas y establ~cerá las normas para aplicar dichas pruebas
2. "En los sistemas escolares en los que los programas están verdaderamente indivi- en su jurisdicción.
566 CAP. 14. PLANEAClÓN DE PRUEBAS LECTURAS ADICIONALES 567
bJ Un comité seleccionado de varios distritos escolares en el estado seleccionará 11. En el ejercicio anterior, los datos están expresados en términos de normas locales y
cinco pruebas publicadas en cada área. Entonces, las escuelas locales pueden nacionales. ¿Qué revelan las diferencias entre ambas acerca de la naturaleza del
escoger una de las cincp pruebas para utilizarlas. Las escuelas pueden adminis- grupo del cuarto grado local?
trar la prueba en cualquier momento entre el primero de octubre y el 31 de 12. Un sistema escolar administró en mayo pruebas de aprovechamiento Stanlord a
diciembre. todos los alumnos del quinto grado. No obstante, ya se había administrado la
el Un comité seleccionado de varios distritos escogerá las mejores pruebas estan- prueba de habilidad mental Otis-Lennon casi al mismo tiempo. Los equivalentes
darizadas publicadas en cada área de prueba. Todas las escuelas del estado de grado para los percentiles 10,25, 50, 75 y 90 para cada prueba se muestran a
deberán administrar la misma prueba al mismo tiempo en el año. continuación. Prepare un reporte para interpretat y reportar estos resultados a la
Dirección de educación o a un grupo de padres interesados.
9. A continuación se muestran los datos de las puntuaciones obtenidas en las prue-
MS de aprovechamiento Stan/ord y la resolución de problemas aritméticos por Prueba ae Aprovechamiento S/anforJ
los estudiantes del sexto grado del Sistema Escolar Paraíso entre 1970 y 1974.
Todas las pruebas se administraron durante la primera semana de octubre. Grado: Evaluados en marzo de 1974

P,. P25 Pso P15 p..


Año N P IO
P25 P,o P" p..
Significado de palabras 3.3 4.2 5.0 5.7 6.8
1970 273 4.2 5.4 6.4 8.0 11.3 Significado del párrafo 3.7 4.8 5.5 6.5 7.8
1971 . 268 4.1 5.1 6.1 7.9 11.1 Ortografía 3.6 4.4 5.4 6.8 7.9
1972 277 3.1 4.4 5.9 7.4 9.5 Lenguaje 3.2 4.1 5.5 6.5 7.6
1973 273 3.1 4.0 5.7 7.0 9.0 Cálculo aritmético 3.9 5.0 5.7 6.5 7.3
1974 275 3.0 3.8 5.2 7.0 9.0 Conceptos aritméticos 4.0 4.7 5.5 6.4 7.5
Aplicación aritmética 3.7 4.5 5.5 6.6 7.6

Pruebo óe (/ de habilidad men/al Otis-lennoll 81 91 98 112 120


Sugiera varias hipótesis para explicar estos resultados de las pruebas. ¿Qué infor-
mación adicional sería necesaria para evaluar la racionalidad de cada hipótesis?

10. En la tabla que aparece a continuación se muestran las puntuaciones de Rogelio 13. Un programa de pruebas a nivel estatal ha planeado que cada alumno tome alguna
T., evaluado al final del cuarto grado. Prepare un reporte para utilizarlo en la con- de las 10 formas de una prueba de aprovechamierito de 30 minutos. En total, las
ferencia con los padres de Rogelio. 10 formas proporcionan una muestra a nivel estatal para los objetivos de la ins-
trucción. Los resultados se promedian por formas y por alumnos para cada escue-
Grado 4: Evaluados en moyo de 1974 la y para cada sistema escolar. ¿Qué tan deseable es este patrón de pruebas para
capacitar al estado y a la administración local a fin de controlar y vigilar el aprove-
chamiento en cada escuela y ayudar a los maestros con sus planes instruccionales
Normas nacionales Normas locales para cada niño en particular?
14. ¿Cuáles son las ventajas de la ley Buckley-Pell que requiere que los padres y los
Equivalen/e /lango de Rango de estudiantes tengan acceso a los registros de pruebas escolares?, ¿qué problemas
crea este requerimiento legal?
de grado percen/iles Es/anueve percenli/es Es/anueve

Conocimiento de palobras 4.0 30 4 9 2 LECTURAS ADICIONALES


Discriminación de palabras 4.9 55 5 25 3
Lectura 4.2 35 4 28 3 Ayrer, J. E. YMcNamara, T. C., "Survey testing on an out-of-level basis', en Tournal 01
3 Educational Measurement, ID, 1973, págs. 79-84. .
Ortografía 5.0 55 5 19 Borgen, F. H., HDifferential expectations? Predicting grades for black students in five
Lenguaje 5.5 67 6 18 3 types of colleges", en Measurement and Evaluation in Guidance, 4, 1972, págs.
Cálculo aritmético 6.7 98 9 96 8 206-212.
Resolución de problemas y Ferguson, R. L. Y Maxey, E. J., Trends in the academic perf()fmance oi high school
conceptos aritméticos 7.8 98 9 99 9 and college students, ACT Research Report No. 70, The American College Tes-
ting Program, Iowa City, Iowa, enero, 1976. .

: ",.:":'- .:.,, .... " ,'"' I '."' ' . ' • ••. ~, " , '. ', '
568 CAP. 14. PLANEAClÓN DE PRUEBAS

H f r R. "Published tests and the needs of educational accountability", en Edu-


oe~a~:o~al and Psychological Measurement, 34,1974, págs. ~03-109.
·
Lennlng,
O T Predictive validity 01 the ACT tests at selectlve colleges, ACT
. .,
Research Repon No. 69, The American Co11ege Testmg. Program, Iowa City,
. Iowa, agosto, 1975. 'd f h Sch 1 .
Mauger, P. A. Y Kolmodin, c: A., "Long-term predictive vah ltyO t e , o astIc
o

Aptitude Test", en ¡oumal 01 Educational Psycholo&y, 67, 1975, pags. 847-


Mun~~~', 1. A., Declining a~1ilissi~ns test scores( ACT Research Repon No. 71, The
American College Testmg Program, Iowa C:1ty, I~wa, febrero,.1976. . o
15
Pfeifer, c. M. Jr., "Relationship between scholastlc aptItude, ~erceptIon of umvers~ty
dimate and college success for black and white students , en 'oumal 01 Applled
PsychoÍogy,61, 1976, págs. 341-347. .' . .
T6wle, N. J. YMerrill, P. F., HEffects of anxiety type and ltem~dlff¡culty sequencmg on
mathematics test performance", en ¡oumal 01 EducatlOnal Measurement, 12, Calificaciones y forma
1975, págs. 241-249. f h 1" Aik'
Tyler, R. W., HNational assessment-Some valuable by-prod~cts or sc ~o , en
1. R. Jr. (dir.l, Reading in Psychological and EducatlOnal Testmg, Allyn and
ID, de calificar
Bacon, Boston, 1973. . "
Womer, F. B., HNational assessment of-educatl?nalyrogress ~ en Bracht, G. H., H?p-
kins, K. D. YStanley, J. C. (dirs.l, PerspectlVe~ m EducatlOnal and Psychologlcal
Measurement, Prentice-Hall,Englewood Chffs, N. J., 1972.

Una actividad educativa relacionada estrechamente con los problemas


de la medición es evaluar el desempeño del estudiante en algún segmento de
la escolaridad y registrar esa evaluación. De manera típica, la evaluación se
resume en algún símbolo condensado y altamente abstracto. Una encuesta
(NEA, 1967) de más de 600 sistemas escolares reveló que el sistema de
números, o de grados de letras, era empleado por el 80% de los sistemas,
excepto en el primer grado, en el que el porcentaje era de 73, yen el jardín de
niños, eh el que era de 17. Una evidencia más reciente (pinchak y Breland,
1974) indica que por lo menos, en el nivel secundario la situación no ha
cambiado.
El uso de estos símbolos altamente condensados para trasmitir la eva-
luación del maestro se ha criticado a menudo por razones que en seguida
consideraremos, pero las alternativas que se han ofrecido para reemplazar
las convencionales A, B, e, D, Fy los sistemas de porcentajes, han incluido
nuevos problemas¡ por tanto, no ha habido un reemplazo satisfactorio
para el grado de curso que se encuentra disponible. Especialmente en las
escuelas secundarias y en la universidad, parece que las marcas o califica-
ciones se usarán todavía un buen tiempo¡ por tanto, es importante que
entendamos 10 que significa la forma de calificar y las calificaciones, como
un fenómeno tanto cultural como psicométrico.
Las calificaciones y la forma de calificar han estado profundamente
implicadas en la cultura educativa¡ han sido la base, ya sea en la t<1talidad o
en parte, de un rango muy amplio de acciones y decisiones dentro de una
institución educativa dada, entre los niveles de la estructura educativa y en
relación con los sistemas educativos del mundo exterior. La elegibilidad para
admisión a ciertos programas o departamentos, para ayuda eso'lar destina-
da a otorgar membresía a equipos atléticos e inclusive para continuar en la

569
570 CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR FUNCIONES A LAS QUE SIRVEN 571

escuela en niveles más altos, ha estado determinada, en alguna medida, por califica y regresa a los alumnos, es lo que define para ellos lo que se considera
la postura académica. La admisión a la universidad o a una escuela de gra- importante en la escuela. Así, White y Boehm (1967) encontraron que en
duados ha estado basada, parcialmente, en los grados recibidos en años ante- general los alumnos en la escuela elemental están de acuerdo en que la orto-
riores en el nivel académico. Así, hay muchos puntos dentro de la escuela en grafía y la aritmética son lo más importante por aprender; pOrque estas ma-
los que las calificaciones interactúan con el proceso administrativo e ins- terias tienen prioridad para los maestros en el momento de calificar. De nue-
truccional. Por esta razón los sistemas de calificaciones han sido tan dura- vo, esta evaluación y retroalimentación inmediata resulta central, más que la
bles y tan resistentes al cambio. calificación y el reporte en una boleta una vez cada seis u ocho semanas.
Como cualquier otro aspecto profundamente implicado en la cultura, los Los estudiantes necesitan la información para saber qué clase de personas
procedimientos de calificación y las calificaciones a menudo se han considera- son. iSeré bueno con las palabras?, icon los números?, ien ciencia?, ien arte?;
do cosas ya hechas y sabidas, con un mínimo de análisis racional acerca de su iseré el tipo de persona que debería planear ingresar en la universidad?, ime
naturaleza y sus funciones. A medida que las examinamos, nuestro enfoque graduaré en química? Las calificaciones de los cursos pueden y deben desem-
debería ser, por lo menos en parte, el del antropólogo cultural que fija su inte- peñar un papel importante en la construcción de la autoimagen, aunque la
rés en una serie de patrones de conductas que le parecen raras y presumible- variabilidad de los estándares de calificaciones de escuela a escuela, de depar-
mente significativas, y trata de entender las funCiones para las que sirven y la tamento a departamento y de maestro a maestro presenten muchas barreras
manera en que se relacionan con la cultura de las que son parte. Debemos para lograr una imagen clara y precisa; sin embargo, a pesar de todas estas li-
hacer a un lado nuestro compromiso personal y mirar estos fenómenos Con mitaciones técnicas, las calificaciones siguen siendo uno de los mejores pre-
los fríos ojos del científico social, con el fin de tratar de identificar las fuerzas dictores de las calificaciones posteriores y, de esa manera, son importantes
que moldean y sustentan las prácticas de calificación actuales y las presiones para trasmitir la información acerca de la probabilidad de éxito en la universi-
dentro de la cultura educativa que hace de estas prácticas algo tan irracional y dad, de modo general, en las instituciones o los programas específicos. Los
resistente al cambio. . resultados para aproximadamente 100000 estudiantes que se observaron en
un estudio del Programa estadounidense de pruebas universitarias (Hoyt y
Munday, 19661 mostraron que la correlación era de 0.58 para los primeros
FUNCIONES A LAS QUE SIRVEN grados de la universidad para una composición de calificaciones de la escuela
LAS CALIFICACIONES secundaria, de 0.55 para una composición de puntuaciones de pruebas estan-
darizadas y de 0.65 para la combinación óptima de ambos tipos de informa-
Las prácticas de calificación y de reporte se basan, parcialmente, en la ción. Así, las calificaciones tienen un papel significativo que desempeñar para
tradición y las funciones reales a las que sirven en mayor o menor grado de informar al individuo (así como a la institución en la que éste solicitará ingre-
adecuación. Estas funciones se relacionan con las necesidades de los estu- sar después) de sus prospectos de éxito académico.
diantes, de los padres (o tutores) que están a cargo de los alumnos y que son Claramente, el alumno o el padre que mira el reporte de la escuela y pre-
los responsables de criarlos, de la escuela en la que están inscritos los alum- gunta: iqué clase de aprendiz soy yo?, necesita ayuda para interpretar esas
nos, de las escuelas en las que ~ás tarde serán candidatos para la admisión, y calificaciones. Con la enorme variación que existe entre los maestros y entre
de todas las empresas y personas que pertenecen a la sociedad adulta con las las escuelas y universidades, hasta un asesor hábil se siente incapaz para emitir
que se relacionarán estos estudiantes algún día. Examinaremos cada una de un juicio sólido en cuanto a qué es o qué significan los reportes en términos de
.estas categorías de necesidad para determinar qué tan bien sirven a ellas las cualquier decisión educativa específica. Pero las calificaciones que se mues-
prácticas de calificar y de reportar. tran en la boleta de reporte constituyen un tipo importante de evidencia del
Los estudiantes necesitan información acerca de ellos mismos, para guiar- potencial educativo que interpretarán el alumno o sus padres. Uno de los
los en su aprendizaje real y para sus planes futuros; necesitan retroalimenta- requisitos para cualquier sistema de calificación o de reporte es que sea lo más
ción inmediata que les diga qué es lo que ya saben y dónde están sus errores y interpretable posible.
sus deficiencias. Los ejercicios diarios, las recitaCiones y las pruebas cotidianas Los padres necesitan tener información en el nivel más simple, acerca de
proporcionan este tipo de información, la cual es provista de manera más sus hijos, para comprobar que la experiencia escolar de éstos procede satisfac-
completa y eficaz por los materiales instruccionales programados, en los que toriamente o para alertarlos de los problemas que se pudieran presentar. La
los estudiantes reciben una confirmación inmediata o una corrección a sus boleta de reporte normal satisface esta necesidad, por ló menos en un nivel
respuestas. Las marcas y los reportes periódicos están poco relaCionados con mínimo, pero la cantidad de información que puede trasmitirse a partir de un
las actividades de aprendizaje para proveer este tipo de instrucción específica solo símbolo es tan limitada que muchas escuelas han estimado que resulta
del aprendizaje día a día. necesario complementar de varias maneras este reporte convencional. La
Los estudiantes necesitan contar con información que defina lo que es encuesta del NEA de 1966 demostró que casi la mitad de los sistemas escola-
apropiado e importante para que ellos lo aprendan. Una vez más, lo que el res programaban horarios de conferencias con los padres de los niños de
maestro asigna como tareas de aprendizaje, especialmente lo que corrige, escuela elemental, pero este porcentaje decaía a cerca del 25% en la escuela

.=1 ,_
" . . .. .
,"" :,.~ . ,', ': ()I i ~" '''''' ..... ;..~. f ;· ;"; ,; H.' .', ~ .'~' .', v" '.' .:.- ,'," - ....• ... .. .. '.
' ' " ... ~.:
" ... ' ~·r , ', ,' " ,,: .'.¡.\_., . ...
572 CAP. 15. CALIfICACIONES Y fORMA DE CALIfICAR CUESTIONES TÉCNICAS 573

.secundaria inferior y a 20% en la escuela preparatoria. En los grados prima- irracionalidad de las prácticas de calificación y de su resistencia al cambio
rios, una tercera parte de las escuelas incluían en su reporte, comentarios racional. Una combinación de intereses creados y de convicciones persona-
narrativos acerca del alumno, práctica que ocurría por cerca de un quinto en les ata a los sistemas de calificaciones y a los estándares, y éstos resultan muy
el cuarto grado y sólo cerca de un décimo en las escuelas secundarias inferior y resistentes al cambio, de la misma manera que los hábitos dietéticos tienen
preparatorias. sus orígenes en la era previa a la refrigeración. ASÍ, en un departamento de
Especialmente cuando el niño afronta dificultades educativas, resulta ciencias que desea impartir un curso especializado en su campo con un núme-
más inadecuado este reporte convencional como medio de comunicación, ro limitado de estudiantes, se decide calificar con mucha severidad un curso
pues sólo muestra la insatisfacción del maestro con el alumno. No trasmite introductorio, de tal manera que la mayoría de los estudiantes del primer gra-
ningún diagnóstico, ni fuente alguna de problemas; tampoco proporciona al do se desalienten y no lo tomen y sólo unos pocos puedan ingresar al curso.
alumno o a los padres alguna sugerencia para realizar una acción correctiva. Un profesor individual que alimenta su ego con la convicción de que se
De este modo, cuando mucho, pero sin ninguna seguridad de que así será, H deben mantener los estándares" puede encontrar satisfacción en una alta tasa

dicho re·p orte puede hacer que el padre recurra al maestro y trate de averiguar de fracasos y en la poca frecuencia de calificaciones de excelencia en su clase
algo más acerca del problema, con el fin de encontrar juntos una posiblesolu- -evidencia que alguno de sus colegas puede considerar una deficiencia de ense-
ción. Este carácter global y puramente negativo de las calificaciones bajas es la ñanza. Las prácticas de calificación son las expresiones de un sistema de valores
más grande limitación del sistema. individual o de grupo en cuanto a que son reportes desinteresados de la conduc-
Los padres necesitan tener información para ayudar a planear el futuro de ta del estudiante. ¿Deberían recibir los estudiantes en una sección de "honores"
sus hijos. Esta necesidad es compartida por el alumno, y los valores y las limi- calificaciones que 'reflejaran su aprovechamiento en relación con el total de su
taciones de las calificaciones son las mismas que ya se consideraron. Una vez clase, o sólo en relación del uno con el otro?, ¿qué tal sería una sección de "len-
más, los padres necesitan contar con ayuda para interpretar las calificaciones tos" o de "mínimos fundamentales"?, ¿debería castigarse a un estudiante por
junto con los datos de las pruebas estandarizadas, en términos de expectativas entregar sus trabajos después de tiempo o darle créditos extras si hace trabajos
reales que se les presenten para realizar acciones y tomar decisiones futuras. opcionales?, ¿deberían obtener los estudiantes con el mismo nivel de aptitudes
La mayoría de los padres están muy pobremente calificados para usar ya sea escolares, en promedio, los mismos grados, sin tener en cuenta la materia o el
las calificaciones o las puntuaciones de pruebas estandarizadas para tomar departamento implicado? Todas éstas son preguntas de mucho valor que rara
decisiones, excepto que las implicaciones de esos datos sean interpretadas vez se examinan con detalle y sobre las que los miembros de la facultad rara vez
para ellos, de tal manera que las personas que hacen las interpretaciones llegan a un acuerdo válido. Mientras..exista el desacuerdo dentro de la cultura
desempeñan un papel muy importante para ellos. educativa local acerca de preguntas de alto valor como las anteriores, los esfuer-
Las evaluaciones de los maestros, registradas de manera típica como cali- zos técnicos de los psicometristas por introducir un raciocinio consistente en
ficaciones, pero algunas veces amplificadas con comentarios narrativos o las prácticas de calificación serán inútiles.
reportes anecdóticos, sirven a una variedad de funciones dentro de la econo-
mía del sistema educativo. Muchas de estas funciones son primordialmente
administrativas, aunque pueden ser muy importantes para el futuro educati- CUESTIONES TÉCNICAS EN LOS
vo del estudiante. La más obvia de ellas es la decisión de admitir: a la universi- PROCEDIMIENTOS PARA OBTENER
dad, con base en las calificaciones de la escuela secundaria, y a la escuela de UNA CALIFICACIÓN FIDEDIGNA
posgrado, con base en las calificaciones de la universidad.
En el nivel universitario, las calificaciones se clasifican desde la reproba- . Ahora que ya hemos explorado, en términos generales, el papel que
ción, en un extremo, hasta los honores y las distinciones, en el otro; en me- desempeñan las calificaciones en la cultura educativa, en este apartado exami-
dio, la elegibilidad para la admisión a cursos más avanzados o estudios de naremos algunos problemas específicos y técnicos en relación con la asigna-
especialización en un campo puede basarse de manera considerable en haber ción de calificaciones a lós alumnos. Centraremos el análisis en seis preguntas
Haprobado" o logrado un nivel específico en cursos previos. En la cultura de principales:
un sistema educativo que es selectivo en sus partes existen decisiones adminis-
trativas que deben tomarse, las cuales si no se toman con base en calificacio- al ¿En qué debería basarse una calificación?
nes hechas en las evaluaciones del maestro, se toman en términos de exámenes bl ¿Cómo deberían ponderarse los datos componentes para obtener una
especiales o de otros procedimientos. Por supuesto, también hay una serie de calificación?
decisiones no académicas en que las calificaciones tienen un papel, tal como la el ¿En cuántas categorías o subdivisiones deberían reportarse las califica-
elegibilidad para ser miembro de un equipo atlético -aspecto de la cultura uni- ciones?
versitaria- que a veces tiene una realidad perturbadora de importancia. dI ¿Qué fracción de estudiantes deberian recibir cada calificación?
Dichas acciones, tan cruciales para el estudiante individual y tan centra- el iEn relación con qué marco de referencia deberían formularse las cali-
les para el funcionamiento de la institución educativa, explican mucho de la ficaciones y cómo podrian relacionarse con ese marco?
574 CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR CUESTIONES TÉCNICAS 575

f) ¿Cómo podrían igualarse los estándares entre cada sección, cada curso competencia por uno o más tipos de consideraciones. Es deseable que la inclu-
y cada departamento? sión de otros factores se haga como resultado de un examen minucioso de
esos puntos, más que como una decisión casual y sin análisis.
Nótese que muchas de estas preguntas están formuladas en términos de Cuando los fundamentos para asignar las calificaciones se han estimado
debería y que los puntos de valor y de hecho surgen en relación con cada una mediante el procedimiento de revisión por el instructor o por todo un grupo
de ellas. A medida que consideramos estas preguntas tenemos que plantear. de maestros, es esencial decidir qué tipos de pruebas, ejercicios, reportes escri-
nos, primero, cuáles son los puntos de valor en que se basan y, después, cuáles tos o cualquier otra conducta, daría la evidencia de los logros que, supuesta-
son los problemas técnicos para su realización. mente, se representan en las calificaciones. La opción por tipos de evidencia se
puede basar mejor en el mismo tipo de análisis de los objetivos de un curso,
que se propusieron en el capítulo 7, así como en las bases para diseñar una
iEn qué debería basarse una calificaciónr prueba bien balanceada. Si los objetivos han estado claramente identificados,
en términos de condu<;ta, estas afirmaciones permitirán conocer los tipos de
Esta pregunta, en realidad, se podría formular en dos partes: a) ¿qué evidencia, que darán el indicador de la extensión en la que se han logrado
características del estudiante deberían estar representadas en la calificación? aquellos objetivos.
y b) ¿qué tipos de evidencia deberían reunirse para demostrar la existencia d~
las características designadas? La primera pregunta se podría plantear del
modo siguiente: iuna calificación debería representar una apreciación tan iCómo debería determinarse la importancia
pura y exacta de la competencia en un segmento del programa curricular de los datos componentesJ
como pudiera diseñarse, o debería modificarse por factores diferentes de los
de la competencia? Algunos de estos modificadores potenciales serían los si· Un escrutinio de la lista de objetivos normalmente sugeriría que cierta
guientes: clase de actividades, determinados ejercicios y asignaciones, ciertos reportes y
trabajos escolares, así como exámenes específicos, son los medios apropiados
l. Cantidad de trabajo completado, así como nivel de competencia para obtener la evidencia de la medida en que el estudiante ha logrado los ob-
logrado. Es común que los maestros permitan a los estudiantes aumentar su jetivos del curso. tstos indicadores por separado deben combinarse de alguna
calificación por medio de hacer trabajos adicionales, en los que dan una manera en un solo símbolo que se use para reportar el desempeño del estu-
atención limitada sólo a la calidad del trabajo y casi no se considera si este diante. ¿Cómo deberá determinarse la importancia que cada componente
trabajo adicional produce cualquier nivel más alto de competencia por parte debe tener?
del estudiante. Entonces, la calificación es sinónimo de meticulosidad y En el último análisis, dos factores determinan la importancia efectiva de-
laboriosidad, más que de competencia. seable para cualquier dato específico, es decir, una prueba, un trabajo, un
2. Aspectos mecánicos del trabajo completado: la limpieza, la legibilidad, reporte oral, etc. El primero de ellos es la validez de la información que pro-
la corrección en la mecánica de la escritura o de la expresión oraL Estos son porciona. La validez en este contexto significa la importancia del conoci-
¡ .·1 factores que la escuela favorece y por los que pugna en el trabajo con sus miento o la habilidad que se refleja en el dato y la fidelidad con que queda
. ~ I alumnos; pero es necesario preguntar cuántos de tales factores deberían reflejada, sin que la alteren. otros factores inapropiados (como la fluidez
'l. ! influir (y qué tantol, por ejemplo, en una calificación que reporta grado de verbal o la facilidad para escribir). Normalmente, la validez de un tipo de
competencia en historia o biología. datos se puede evaluar sólo mediante el juicio, posiblemente el juicio con-
l' 3. Aptitud, como queda indicada al maestro por medio de los resultados de junto de varios instructores en un área. Una segunda consideración, pero
.!
las pruebas de aptitud escolar o por la sección a la que el alumno es asignado. relativamente menor, es la confiabilidad. El dato menos confiable, que incor-
iDeberían ser juzgados todos los alumnos en relación con un estándar común o pora un componente relativamente grande de error de medición, merece una
con algún indicador de potencial para lograr? consideración menor, mientras otras cosas se conserven constantes, que otro
dato más confiable. Generalmente podemos anticipar que la confiabilidad
Aparte de las convicciones personales y del sistema de valores personal, será más grande por un margen considerable con una prueba objetiva prepara-
parece que el único criterio que se puede considerar para afrontar estas pre- da de modo cuidadoso¡ intermedia para las pruebas de ensayo y para trabajos
guntas es el criterio de uso. ¿Para qué propósitos se usará la calificación? Con escritos y ensayos, y más baja para una apreciación "salida de la manga" de las
base en estos usos -como los que hemos analizado en este capítulo-, ¿cuál es contribuciones orales y la participación en clase. Estas tendencias deberían
el mejor fundamento para un sistema de calificaciones? La mayoría de los pro- moderar la importancia que, de otra manera, se asignaría con base en la vali-
pósitos están mejor representados por una calificación que sea una medida dez juzgada del dato.
tan pura e inalterada de competencia como pueda diseñarse, pero otras perso- En cuanto un instructor ha decidido qué importancia asignar a cada clase
nas pueden pensar que ciertos valores están involucrados al modular esta de dato, es necesario que verifique esta asignación. Supongamos que un ins-

" ,. o,'

", ." J ,', .~., .,~,~'f ,;~{I:; :.,: :. . . :.. :..•.~ :.~ :.~,:.:~\..~,:,;.: ;.,( ;" . ",_ :o.• .;_" _..".';' : '.' ':'.': ' . ~:-~, "'.~ .... : .. ', ~~ _, ; :>':.; '., .... :::~ .. , ~: : ;. : ", ~ ', :.~ :: :;:";:; :' ;. . .
576 CAP. 15. CAlIRCAClONES y FOR'MA DE CALIFICAR CUESTIONES TÉCNICAS 577

tructor ha administrado un examen objetivo de 90 reactivos para el cual la muy ampliamente usadas cinco letras: A, B, C, D Y F), en un sistema de 15
puntuación es el número de reactivos correctos, y un trabajo semestral que ha categorías que ponga signos de más y de menos a las cinco letras o en un siste-
sido evaluado en una escala de cinco puntos que tiene un rango de 5 = exce- '11a de porcentajes que nominalmente puede tomar cualquiera de los 100
lente a I = insatisfactorio; asimismo, ha decidido que en la evaluación final de ¡alores. ¿Cómo podemos decidir lo que preferimos? De nuevo, estos puntos
sus estudiantes el examen debe ponderárse dos veces más que el trabajo. Más son parcialmente de valor y parcialmente de hecho.
aún, supongamos que los dos conjuntos de puntuaciones tienen las caracte- Los argumentos que se refieren a los valores implicados restan importan-
rísticas siguientes: cia a las presiones competitivas y a las metas presumiblemente inadecuadas
representadas por las calificaciones. Se afirma que esto puede lograrse me-
diante un sistema de calificación muy burdo que, en efecto, haga sólo unas
Examen Trabaio escrito cuantas discriminaciones gruesas. Desde luego, esta ventaja se logra a expen-
sas de la mayor parte de la información que el sistema de calificaciones podría
suministrar acerca del individuo. En un sistema de aprobado-reprobado, sólo
Media 63 3.2 sabemos que el estudiante ha sido juzgado como aprobado en un curso, excepto
Desviación estóndar 11 0.55 por la pequeña fracción en que se juzgó como fracasado. En un sistema de tres
puntos, sabemos que la mayoría de los estudiantes no han sido juzgados como
inadecuados ni sobresalientes; en este caso, las calificaciones no tienen mucha
i. Qué se debe hacer con estas puntuaciones para que produzcan el resulta- importancia, excepto para el pequeño grupo que fracasó y, tal vez, para el otro
do deseado? pequeño grupo que puede aspirar a los honores.
Nótense las desviaciones estándar: la del examen es 20 veces más grande A medida que se incrementa el número de discriminaciones más allá del
que la del trabajo escrito. Si sólo sumáramos las dos puntuaciones para cada sistema de dos o tres categorías, las distinciones empiezan a ser importantes
individuo, el examen tendría 20 veces tanto efecto como el trabajo para deter- para todos los estudiantes. Si el número de categorías es pequeño, hay relati-
minar la posición del individuo en una puntuación combinada. Pero este ins- vamente pocos estudiantes que se ubican cerca de las líneas divisorias entre las
tructor quiere que sus efectos sean lo doble de grandes, en cuyo caso tiene que categorías, y para ellos una ventaja o una desventaja mayor ocurre de acuerdo
multiplicar las puntuaciones en el trabajo escrito por un factor de lO, de con la dirección en que se tome la decisión. A medida que se incrementa el
modo que la media es 32 y la desviáción estándar 5.5 (véase el capítulo 4). número de categorías se incrementa la cantidad de decisiones en los límites
Entonces, las dos desviaciones estándar se encuentran en una razÓn de entre ellas, pero cada decisión es menos importante en el registro académico
dos a uno, y los pesos efectivos son los que el instructor se fijó producir. En total del estudiante. Siempre hay una balanza de frecuencia aumentada de
resumen, los pesos efectivos de cada componente están determinados por su error potencial o de injusticia en las calificaciones, debido a la disminución
desviación estándar. Para dar variables de los pesos efectivos deseados, se debe del tamaño y de la importancia de ese error.
r: multiplicar cada variable por un factor que ajustará a las desviaciones están- La característica principal para asignar el número de categorías es la con-
dar a la razón o proporción deseada. La constante multiplicadora deseada e se fiabilidad de la evidencia en que la decisión se toma. Cada componente que se
puede obtener mediante la fórmula siguiente: anota en la calificación final, así como la calificación misma, tiene un aprecia-
'í ble (y a menudo desconocido) error de medición estándar. Si este error es
Wt'SD , grande y relativo a la unidad en la que se reportan las calificaciones, muchas
e = B A de las discriminaciones que se reportan no tendrán sustancia o significado.
B WtA • SDB Considérese la siguiente situación, que aunque artificial es bastante realista:
donde WtA y WtB son los pesos deseados para los dos componentes; Una escuela reporta calificaciones en el sistema de porcentajes. Para un cursa
SDA y SDB son las desviaciones estándar de los componentes; en particular, las calificaciones tienen una media de 85, una desviación estándar
A es el componente que se emplea como una variable de 7, un rango de 53 a 98 y una confiabilidad de 0.80.
B "ancla" y
es una de las variables cuyo peso se ajusta para llevarla en Con base en los datos anteriores, podemos determinar el error estándar de
línea con la variable A. '
medición de esta calificación final, que es 7.j1 - 0.80 = 3.1 puntos de porcen-
taje. De acuerdo con el análisis acerca de la confiabilidad presentado en el
iCuántas categorías deberían emplearse! capítulo 3, ésta significa que cerca de una tercera parte de nuestras calificacio-
nes diferírá de la "calificación verdadera" hipotética de la persona por tres
Las evaluaciones se pueden reportar muy crudamente en sólo dos catego- puntos, y en el 87% de los casos la puntuación asignada a una persona diferirá
rías (como "aprobado" o "reprobado"), en tres o cuatro categorías (como las ¡por lo menos un punto del que habríamos asignado si hubiéramos conocido
578 CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR CUESTIONES TÉCNICAS 579

la puntuación verdadera! ¿Qué tan útil es realizar discriminaciones en este calificación determinan su verdadero significado y son los guardianes de la
nivel de fineza si significa que el 87% de los valores reportados son "incorrec- cultura, no los estadísticos, quienes deben decidir en qué proporción de un
tos"? Aun si la confiabilidad de la calificación final fuera de 0.95, un valor que grupo de estudiantes deberían acrecentarse estas consecuencias.
probablemente.nunca se alcanza en la práctica, todavía habría 75% de califica- En la mayoría de las instituciones educativas es fácil lograr un equilibrio
ciones "incorrectas". entre el sistema simbólico de calificaciones y las consecuencias sociales de
Supóngase que agrupamos nuestros datos y dividimos el rango de puntua- las calificaciones particulares. El porcentaje de fracasos académicos perma-
ciones en un número de categorías más pequeño. ¿Qué tan a menudo la califi- nece bastante estable de año en año; las CAlificaciones promedio dentro de
cación reportada sería la calificación '/correctan~ A continuación se calculan el un departamento se mantienen en un nivel bastante estable, aunque varían
porcentaje de las asignaciones correctas en cuatro niveles de confiabilidad y tres de departamento a departamento; nuevos miembros de una facultad son ini-
grados de calificaciones burdas. ciados de manera informal en la cultura y mantienen su carácter general aun-
que impongan sus idiosincrasias individuales so1)re ella. Pero este equilibrio es
una cuestión intuitiva que no se ha examinado.
(onfiabilidatl Se ha enco~trado que los promedios en puntos de calificación no respon-
den a los cambIOS reales en cuanto a las características de la población estu-
(ategorías . 0.60 0.70 0.80 0.90
diantil (por ~jemplo, co~súltese la obra de Baird y Feinster, 1972), pero parece
15 (A + o F-) 27% 31% 37% 50% que estan sUjetos a la mIsma clase de presiones inflacionarias que plagan nues-
: .[ 5 (A o F) 70 77 85 96 tra economía. l Las razones para las diferencias de instructor, de curso y de
,. r 3 (Honores, aprobado, reprobado) 91 95 98 99.9 departamento en cuanto a la distribución de calificaciones, son bastante oscu-
"
ras. Las normas culturales en cuanto a cómo deben usarse los símbolos de cali-
':¡ ficaciones en una escuela o la universidad merecen un análisis detallado y
consciente, para verificar que las categorías son empleadas de tal manera que
¡ ',.,
Las suposiciones sobre las que se basa la tabla anterior son complejas y
arbitrarias, pero probablemente realistas¡ parecen sugerir que tratar de hacer sirven a los propósitos de la institución y al sistema educativo más grande del
discriminaciones en más de 15 categorías es un ejercicio bastante inútil, y que cual ella forma parte.
aun este grado de fineza perjudica la precisión de nuestros juicios. Por supues- Después de este análisis, una decisión posible es que los símbolos sucesi-
!; to, estar "incorrecto" en una o dos categorías en una escala finamente dividida vos deberían representar distancias iguales a lo largo de una escala de interva-
no tiene demasiada importancia, pero tratar de hacer discriminaciones que lo. ¿Cómo se supone que se logran unidades iguales por un compuesto de
rebasan los límites de nuestra evidencia no parece una empresa fructífera. varios tipos de información expresados en varias unidades?, ¿cuál es igual y
. "
. ', .. 1 cuál no lo es? También puede formularse la pregunta acerca de si esto puede
'1'1 hacerse de tal manera que los resultados sean confiables. Sin embargo, una
!.:
técnica que tiene cierta racionalidad para los cursos tomados por grupos gran-
iCuántas personas deberían obtener des y relativamente sin selección, es suponer que la competencia está distri-
qué calificaciones~ . buida de acuerdo con la curva normal. Entonces, el rango de la curva normal
Durante un periodo de 50 años se ha escrito mucho (a menudo sin senti- se puede dividir en segmentos iguales y el porcentaje de casos que se ubican en
do) acerca de la distribución de frecuencia apropiada de los símbolos que cada segmento se puede determinar por una tabla semejante a la del apéndice
representan calificaciones. En este aspecto, debemos destacar dos principios uno. A continuación se muestra una solución a este problema.
primordiales: primero, los símbolos que representan calificaciones son, bási-
camente, un sistema ordinal, no uno cardinal. Nadie cuestionaría que, en I'untuación estándar Porcentaje
nuestro sistema convencional de cinco letras, la A es mejor que la B, la B Símbolo Rango sobre la curva normal de casos
mejor que la C, y así sucesivamente hasta la F. Pero no hay mucho consenso
universal de que estos cinco o seis pasos entre una letra y otra representen, o A + 1.5 o + 2.5 o mós 7
deberían representar, pasos iguales de cualidad, de tal manera que la A es 8 + 0.5 o + 1.5 24
mejor que la B por la misma distancia que la D es mejor que la F. Segundo, los ( - 0.5 o + 0.5 38
símbolos ~stán implicados en nuestra cultura educativa yel papel cultural de O - 1.5 o - 0.5 24
los símbolos es por lo menos tan importante como sus p:opiedades p~icomé­ F - 2.5 o menos o - 1.5 7
tricas. La especificación de que un estudiante debe repetIr un curso SI quere-
mos que lo acredite es una decisión sociocultural/ no psicométrica, al igual I Es una experiencia reportada comúnmente que los grados promedio tienden a ir hacia arri-
que la decisión de que un estudiante es elegible para tomar cursos más avan- ba a lo largo de un periodo, durante el cual las medidas objetivas de aprovechamiento estaban en
zados en un departamento. Estas consecuencias prácticas derivadas de una una posición fija o más bien tendían a bajar.

. .. .. .
.. ' ..... ",;" -:';';: ',' : ':.' :':;'."
CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR
CUESTIONES TÉCNICAS 581
580

Entonces, si este sistema se aplicara a una encuesta entre alumnos de pri- desempeñarse. Se argumenta que el tipo de información útil-en parte para la
mer ingreso en la universidad en un curso de matemáticas, el 7% recibiría cali- escuela, pero especialmente para los padres- es si las medidas de aprovecha-
ficaciones de A, el 24% calificaciones de B, y así sucesivamente. miento miden los que los talentos primordiales del individuo hacen posible.
Por supuesto, el que sea posible asignar calificaciones mediante este sis- Aquí consideramos los aspectos del bajo aprovechamiento y del sobreaprove-
tema no significa que sea sensato hacerlo. Esto sólo puede juzgarse en térmi- c?a~ient? que ya se analizaron en el capítulo 9, así como muchos problemas
nos del impacto que este tipo de procedimiento tendrá sobre las acciones tecmcos similares a los que afrontamos entonces. ¿Cómo obtenemos una medi-
prácticas que se derivan de esta asignación de calificaciones. ¿Es socialmente da de "potencialn independiente y sin contaminación del aprovechamiento real
deseable, en el contexto de la institución en cuestión, que 7% de los estu- y actual?, ¿pueden los maestros hacer los juicios requeridos de aprovechamien~
diantes de primer grado de universidad reprueben el curso de matemáticas?, to en relación con el potencial, separándolos del aprovechamiento simple? En
¿los propósitos de la institución estarían mejor cumplidos si el porcentaje un estudio se consideró específicamente esta última pregunta (Halliwell, 1960)
fuera mayor?, ¿el porcentaje de reprobados debería ser igual al que obtiene y la respuesta fue negativa¡ quienes recibían calificaciones altas eran los jóvenes
A? Sólo mediante un examen sensato de los propósitos de la institución y el sobresalientes, no los que "sobreaprovechabann. Además de esta pregunta
impacto que tenga este porcentaje de reprobados sobre tales propósitos, se acerca de si los maestros pueden hacer los juicios requeridos de una manera lo
pueden responder estas preguntas. suficientemente confiable y válida, está la cuestión respecto a los diversos
contextos en los que se usan las calificaciones, acerca de si ésta es realmente la
información deseada que se espera que trasmita un símbolo calificativo.
iEn relación con qué marco de referencia Cuando las decisiones se relacionan con cursos más avanzados que se toma~
se deberían asignar las calificaciones? rán por reco~endación para estudios posteriores o para un empleo, no se pre-
tende saber SI Sara hace las cosas lo mejor que puede, sino qué es lo que Sara
Existen tres marcos de referencia completamente distintos respecto a los puede hacer.
cuales se pueden asignar calificaciones: . El tercer marco de referencia, el desempeño respecto a los compañeros se
refiere a la ~xP!esión del. desempeño individual en relación con algún gn{po
a) Desempeño en relación con la perfección. de referenCIa. Este es el tIpO de referente que se usa en las pruebas estandari-
b) Desempeño en relación con el potencial. zadas a una norma, como ya se describieron en el capítulo 4, en el que el grupo
e) Desempeño en relación con los compañeros. de compañeros o pares de éstos es una muestra nacional muy extensa. Este
grupo de referencia se ha empleado, por lo menos en una extensión limitada
El desempeño en relación con la perfección ya se ha analizado con algún para estimar las prácticas de calificación a nivel nacional en las escuelas d~
detalle en el capítulo 6, en lo concerniente a las pruebas referidas al criterio. Suecia, pero normalmente el grupo de referencia para las calificaciones escola-
Puede haber algunos segmentos de contenido limitados del material curricu- res se considera en términos mucho más limitados. Quizá el cuerpo total de
lar para los que es posible hacer un catálogo completo de lo que existe y se estudiantes de la: institución, o alguna unidad de él, sea el grupo total que
aprenderá. Los ejemplos comunes serían las "cifras" de la multiplicación por toma un curso, el grupo total en una sección de instructor particular o el som-
IDO, los símbolos que representan los elementos químicos y los nombres de brío o pobremente definido grupo total de estudiantes previos que moldean
los huesos del cuerpo humano. Cuando el numero de reactivos es finito y las impresiones .d~l instructor acerca de lo que es un desempeño bueno,
defini?le, se puede evaluar al examinado con todos o con una muestra repre- moderado o defICIente. Los problemas en el uso de los compañeros como
sentatIva de ellos y reportar su desempeño como un porcentaje de ejecución marco de referencia implican, primero, el juicio de valor de lo que el grupo de
perfecta. co~pañeros proporc~on~ como el marco de referencia más apropiado y, des-
Sin embargo, como ya se indicó, el aprendizaje al que se aplica el concepto pues, los problemas teCnICOS de encuadrar en este marco las calificaciones que
de un ~o~nio completo representa sólo una fracción bastante pequeña del se otorgan.
aprendIzaje escolar. Para los alumnos, la idea de dominio o maestría puede ser Los argumentos para usar un marco de referencia muy ampiio (por ejem-
un tanto ilusoria, porque tendríamos que especificar la tarea tan completa- plo, el total de alumnos de primer grado de una universidad o todos los niños
ment~ que seria trivial. Así, un niño que puede contestar la pregunta ¿a cuán- de s~xto grado de un.sistema escolar) se centran en aspectos de justicia y de
to es Igual 5 x 4?, tal vez fracase al contestar ¿cuánto cuestan cuatro barras de eqUIdad. Se argumenta que un individuo en cierto nivel de habilidad debería
chocolate de 5 pesos cada una? Entonces, ¿el niño "conocen las combinaciones tener la,misma oportunidad de obtener una calificación particular no importa
mult.ip~icatorias si no puede aplicarlas en un contexto de problema? Este con que ma~s~ro, gruP? de clase o .ma~e~as del conocimiento¡ sin embargo,
dO~nI~ ~o~pleto como. ~arco de referencia para el empleo de símbolos de esta concepclOn de eqUIdad para el mdIvIduo produce un conflicto con otros
cahfIcacIon tIene una utilIdad bastante limitada. valo~es en el sistema e~ucatívo. Para el estudiante, es un principio que se pro-
Un marco de referencia que ha recibido apoyo es usar símbolos para re- porCIOne una oportUnIdad igual de éxito para cada individuo en su propio
portar el desempeño en relación con algunas estimaciones del potencial para nivel. Esto implica evaluar al individuo en términos de progreso desde su ni-
CUESTIONES TÉCNICA S 583
582 CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR

~n el ej~~plo siguien~e se muestr a una prueba de encuad ramien es de


to que
idea del
vel de competencia anterio r y está relacio nado estrech amente con la la socie- podna admIOlstrarse. Supong ase que una uruver sidad tiene tres seccion
aprovechamiento en relació n con el potenc ial. Para la instituc ión y tes por distintos
lares ~n curso de psicología gen.era l, impartidas en horas diferen
dad se puede argume ntar que los niveles necesarios de talento s particuentre Instructores que usan un hbro de texto y un progra ma de conten ido final
comu-
(específicamente de los talento s cognos citivos e intelect uales) varían un examen
as nes. Los instruc tores, trabaja ndo juntos, han diseñad o
cada campo y ocupación, y que el grupo de referencia debería ser de person que el C?ffiÚn para las tres secciones. Unos cuanto s reactivos pueden ser más
apro-
en un campo específico, como la agricul tura vocacio nal o física, más reactiv os que son
pIados para una sección, pero como tambié n existen otros
cuerpo total de estudia ntes. más apropia dos para cada una de las otras seccion es, el exame n está equili-
El marco de referencia más simple es aquel que se limita al instruc tor indi- brado. El exame n se aplica a las tres secciones y los resultados se muestr
an en
con el
vidual. Entonces, se pueden asignar las calificaciones en relació n ya sea más la tabla 15.1.
grupo de clase específico o con un estánd ar interno má$ general , pero
para dar
vago, que es el que sostien e el instruc tor. Si se usa a la clase específica ntes en Toblo 15.1. Puntuaciones en los tres secciones de un curso
el marco de referencia, siempr e existirá la posibili dad de que los estudia
pueda
una clase sean no representativos, de tal manera que cada estudiante eza Puntuación Sección I Sección 11 Sección 1/1 Grupo lotal
recibir un castigo injusto (, un premio que no se merecía debido a la natural
cia. Si se usa este "estánd ar interno ", deberán afronta rse
del grupo de referen OF, y
los problem as de la subjetividad y su variabilidad de instruc tor a instruct 85-9 1 2 1 4
posible mente de un tiempo a otro para un instruc tor dado. 80-4 2 4 1 7
de
El tamaño y la aleatoriedad del grupo en una clase determ inan cuál 10 a
75-9 3 7 1 11
menor. Si la clase es muy pequeñ a (es decir, de 9 6 20
estos dos problemas es el inter-
70-4 5
15 alumno s), casi no hay ningun a duda de que se necesita el l/estándar es
65-9 6 6 6 18
no" para verificar la representatividad de esa clase. A medida que el grupo os 60-4 6 7 19 32
más grande , y sobre todo como ya se sabe que no operan factores selectiv 55-9 4 5 19 28
se
especiales para designar a un tipo particu lar de estudia:pte en cierto grupo, una
50-4 5 4 3 12
tiene más confian za en la equival encia de las muestr as sucesiv as para 45-9 2 2 2 6
sobre
poblac ión común y el maestr o se prepar a para asignar calificaciones de
40-4 4 O O 4
una base predete rminad a para consid erar al grupo total como un marco 35-9 O 3 2 5
"estánd ar interno " al/grup o de referen cia O 3
referencia uniform e. El cambio de alum-
30-4 2 1
de clase" es sólo cuestió n de grados. Con grupos intermedios, de 25 a 40 ,
r de grados de alguna manera 50 60 150
nos, es necesario ajustar y colocar el estánda relació n
N 40
para tener en cuenta la propia impres ión de la calidad del grupo en
Por
con los otros grupos que se han enseña do previa o concur rentem ente. s, se
último, en los grupos grande s de tipo confere ncia,de 100 o más alumno
i- La política de calificaciones de la univers idad es que, en los cursos intro-
podría 'considerar razona blemen te que existe más confian za en la uniform aproxi-
dad de grupos sucesivos que en la estabili dad del juicio subjetiv o. ductorios, se den las calificaciones de modo ordina rio en un reparto de
madam enteell S%deA , el 25% de B,el 40% deC,el 15%de DyelS %deF,lar
y
los instruc tores están de acuerd o en que no han notado nada en particu
de esta
Cómo iguala r estánd ares acerca del curso introdu ctorio de psicología que amerite un cambio
de puntua ciones totales para todala clase,
política. Al usar esta distribu ción de la
15% de 150 es 22, de tal maner a que los 22 estudia ntes
Cada vez que se selecciona un grupo general para dar un marco de refe- tenemo s que el
n represe ntar las A¡ éstos son estudia ntes
rencia, se necesita alguna técnica para encuad rar a cualqu ier grupo específbles
ico parte superio r de la escala debería
2 El siguiente 25% de ISO estudia ntes es igual a
haber algún punto o puntos de inform ación disponi con puntua ciones de 75 o más.
en ese marco. Debe -
para el grupo de referencia completo (o para una muestr a representativa
de 38, que son los que represe ntan a las B, y que son los estudia ntes con puntuata
estudia ntes del ciones de 65 a 74. Si continu amos hacia abajo, obtenem os la imagen comple
él). Cuand o el grupo de referen cia está formad o por el total de
de obje- de la tabla. 15.2.
total de secciones de un curso y éste incluye un núcleo de conten ido y buen
tivos comun es, un exame n sobre este núcleo común propor ciona un
los pro-
plan para encuadrarlo. Para grupos más diversos se podría n emplear prueba s 1 La distribuc ión de frecuencia fue diseñada de tal manera que
los eones de las letras apare-
medios de puntos de grado de cursos previos o las puntua ciones de las con datos reales.
cen en intervalos de clase regulares, lo cual comúnm ente no sucede
de aptitud escolar comun es, como un encuad ramien to burdo.
584 PREGUNTAS Y EJERCICIOS 585

Tablo 15.2. Distribución de grado en los tres secciones que las variaciones acerca de la naturaleza de los estudiantes que .se inscriben
para cada curso serían de~:tsiado marcadas. E:n estas circ~nstancIas, el ~po
Sección' . Sección 11 Sección 111 de referencia tiende a deÍlmrse de manera eqmvocada y el mstructor reafirma
la idea del"estudiante inglés típico n , con base en el cual califica a su grupo.
Grado Puntuación Total Número Porcentaje Número Porcentaie Número Porcentaje Evidentemente éste es un marco de referencia subjetivo, individúalista e ines-
table· sin emb~rgo es el que controla los estándares de calificación en una
part; muy amplia de la educación contemporánea y se teme que así ~o~ti­
A 75-89 22 6 15 13 26 3 5 núe sobre todo de manera inevitable, cuando un curso es muy especIahza-
8 65-74 38 11 28 15 30 12 20 do ~ el grupo cÍe estudiantes posee características muy distintivas.
( 55-64 60 10 25 12 24 38 63
D 40-54 22 11 28 6 12 S 8
F Menos de 40 8 2 S 4 8 2 3 RESUMEN
Las calificaciones y los .sistemas de calificación están profundamente
En esta tabla se especifica el número de cada grado que será asignado a arraigados en la cultura educativa y sirven, aunque de m~nera incompleta, a
eada sección, pero no cuáles individuos recibirán qué grado. Presumible- un número de finalidades educativas legítimas. Por ello, tIenen todas las pro-
mente, esto se basaría en el registro completo de cada estudiante, al proporcio- babilidades de subsistir durante bastante tiempo. Entre los propósitos a los
nar sólo la estimación deseada en el total de la prueba de encuadramiento que sirven con por lo menos un mínimo nivel de éxito están:
común. ASÍ, un alumno en la sección I que obtuvo sólo una B en esta prueba aJ Informar a los padres acerca de cómo se considera a su hijo dentro de
de núcleo común, podría recibir una A porque en el resto del registro ha dado la escuela.
muestras de ser excelente. En la práctica se podría estar de acuerdo en qu,- cada bJ Ayudar al individuo a formarse una auto imagen como aprendiz ya
instructor tuviera la posibilidad de que se le permitiera hacer pequeñas desvia- establecer sus metas .para futuros niveles de aprendizaje.
ciones de sus frecuencias localizadas cuando ocurrieran estos otros VÍncu- eJ Regular la entrada a los programas específicos y a las actividades den-
los cercanos o cuando otras evidencias sugirieran una forma diferente d~ dis- tro de una institución educativa.
tribución del desempeño en su grupo. . dJ Vigilar y controlar la admisión posterior a instituciones educativas y
Este ejemplo es una conversión estricta de equipercentiles a partir de una al mundo laboral.
prueba de encuadramiento para la calificación final¡ es decir, el porcentaje de
cada grado corresponde, paso a paso, al porcentaje obtenido en esa categoría Al igual que otros aspectos profundamente implícitos en una cultura,
con la prueba común. Esto es razonable cuando la prueba de encuadramiento las calificaciones y las prácticas de evaluación incluyen motivaciones que
representa clara y directamente los elementos comunes de los objetivos para ese sólo son parcialmente accesibles a la inspección en el nivel consciente y, por
curso específico. Cuando el encuadramiento está basado en algún indicador tanto, son resistentes al cambio. Antes que las prácticas de calificaciones se
más indirecto de competencia, como sería un promedio de punto .de grado puedan hacer psicométricamente más sólidas, se deben ~onocer s~s bases y
generala una medida de aptitud escolar, parece razonable ajustar la variación someter a un escrutinio consciente, e incluso autoconSCIente. DebIdo a que
entre los grupos con base en este indicador indirecto, permitiendo que cada algunos, tal vez la mayoría, de los l?untos que se relaciona~ con l~ asignación
grupo regrese, de alguna manera, más cerca al promedio general. ASÍ, en nues- de calificaciones se refieren a juicIOS de valor, es necesano reahzar un exa-
tro ejemplo,la sección 11 colocaría más A que el 15% pero menos que el 25%, y men de las prácticas de calificaciones a fin de aclarar estos valores. En este
la sección III menos que el 15% pero más que el 5%. Cuanto menos directa- capítulo se ofrecen unas cuantas sugerencias d~ ~rocedimientos I?~icomé~ri­
mente adecuada sea la medida encuadre, debería ser más recomendable ajustar cos para obtener valores de equivalencia especIfIcos y comparablhdad, SI se
la variación de manera que el promedio de punto de grado general no tendría decide que éstos son los valores que vale la pena buscar.
que recibir ponderación para determinar cuál sería el número apropiado de A, B
Y C en, por ejemplo, un curso para tocar el piano.
Los métodos estadísticos para controlar los estándares dentro de las sec- PREGUNTAS Y EJERCICIOS
ciones de un curso, e incluso entre varios cursos, funcionan razonablemente
bien para los cursos grandes con un programa de contenido común y con gru- l . Se ha propuesto que mientras el sistema de calificaciones de A, B, C, D, F es relati-
pos de estudiantes bastante generales. Se presentan dificultades cuando los vo, un sistema de porcentajes representa una apreciación absol~ta. ¿Cuáles so.n.los
grupos son pequeños o especializados, en cuyo caso no se recomienda añadir argumentos a favor y en contra de este punto de vista!, ~h.ay sIstemas de ca11~lca­
ciertos porcentajes de grados particulares. Las variaciones de la muestra en el ciones que estén basados en un estándar absoluto! IdentIfique uno de estosslste-
carácter del grupo de un semestre a otro serían demasiado grandes., mientras mas y aporte evidencias que apoyen su posición.
586 CAP. 15. CALIFICACIONES Y FORMA DE CALIFICAR LECTURAS ADICIONALES 587
2. ¿De qué maneras el sistema de calificaciones en una escuela es similar a un proce- 16. Se ha sugerido que las calificaciones deben considerarse como un fenómeno cultu -
dimiento evaluativo?, ¡en qué formas difiere!, ¡qué factores que limitan la efica- ral, más que como uno psicométrico. ¿Qué mérito tiene este punto de vista?, icuá-
cia de las evaluaciones también limitan la eficacia del sistema de calificaciones!, les son algunas de sus implicacionesl
i cómo podrían usarse las sugerencias del capítulo 12, para mejorar las evaluacio-
nes, a fin de mejorar los procedimientos de calificación en una escuela?
3. ¿Qué probabilidades tiene el nivel general de habilidad de una clase de que un estu- LECTURAS ADICIONALES
diante afecte las calificaciones que ese alumno obtendrá?, ¡cómo debe afectarlas?
4. ¿Cuál debería ser el papel de la autoapreciación del estudiante para evaluar su pro- Adkins, c., Test construetion, Charles E. Merrill, Columbus, Ohio, 1974, cap. 9 .
greso educativo?, ¿cuáles son los límites de tal apreciación? Austin, D. B., IIGrading systems", en Deighton, L. C. ¡dir.), Tbe Encyclopedia 01 Edu-
5. Trate de obtener copias de las boletas de calificaciones utilizadas en uno o en eation, vol. 4, Macmillan and Free Press, Nueva York, 1971, págs. 181-185.
varios sistemas escolares. ExamÍnelas y compárelas con las boletas obtenidas por Baurenfeind, R. H., "Goal cards and the measurement of educational progress", en
otros miembros de la clase. ¿Qué similitudes y qué diferencias nota?, ¿qué desven- Payne, D. A. YMcMorris, R. F. (dirs.), Edueational and Psyehological Measure-
tajas considera usted que tienen? . ment, General Learning Press, Morristown, N. J., 1975.
6. Hable con el director o el superintendente de una escuela y vea qué cambios se han Baurenfeind, R. H., uGrading on the bulb", en Measurement and Evaluation in Guí-
hecho en las prácticas de reporte mientras han estado en la escuela. ¡Por qué se dance, 5, 1973, págs. 483-487.
hicieron!, ¿qué tan satisfechos están con los resultados?, ¿qué medidas se han Cureton, L. W., "The history of grading practices", en Measurement in Educatíon ,
tomado para las conferencias de los maestros con los padres?, ¿qué tan satisfacto- National Council on Measurement in Education, East Lansing, Mich., 1971.
rias han sido éstas?, ¡qué nuevos problemas han surgido?, ¡qué tan bien sirve este Gilman, D. A ., uThe economics and psychology of the report card", en Measurement
nuevo sistema de calificaciones y de reportes a las funciones que se enlistan en el and Evaluation in Guídanee, 7, 1974, págs. 157-162.
apartado "Funciones a las que sirven las calificaciones" de este capítulo? Goldman, R. D ., Schmidt, D. E., Hewitt, B. N . Y Fisher, R., uGrading practices in diffe-
7. ¿Qué problemas surgen cua,ldo un maestro trata de que las calificaciones en la rent major fields*, en American Edueational Research !oumal, 11, 1974, págs.
boleta de reporte muestren la aptitud y el esfuerzo? 343-357.
8. Comente la proposición siguiente: liLa calificación de un curso es más útil cuando Goldman, R. D . Y Newlin Hewitt, B., uAdaptation-level as an explanation for diffe-
mide, tan exactamente como sea posible, el dominio que tiene el alumno de los rential standards in coJ]ege grading", en !oumal 01 Edueational Measurement,
objetivos directos del curso y no se mezcla con ningún otro factor". 12, 1975, págs. 149-16l.
9. Para un curso que usted imparta o que planee impartir, elabore una lista de los Gronlund, N. E., Improving marking and reporting in classroom instruction, Mac-
tipos de evidencia que planearía considerar para calificar a los estudiantes. Indi- millan, Nueva York, 1974.
que la importancia que daría a cada uno de ellos. ¿Por qué ha clasificado de esta Hiner, N . R., "An American ritual: Grading as a cultural function", en The Clearing
manera la importancia? House, 47, 1973, págs. 356-361.
10. En un curso de biología, usted ha decidido dar igual importancia a: a) una serie de Hoyt, D. P. "The relationship loetween colle~e grades and adu!t achievement", enA~T
pruebas, b) un examen final y el las calificaciones del laboratorio. El estudio de las Researeh Reports, núm. 7, The Amencan College Testmg Program, Iowa Clty,
distribuciones de puntuaciones muestra que la serie de pruebas tiene una desvia- Iowa, 1965.
ción estándar de 10; el examen, de 15; Y las calificaciones del laboratorio, de 5. Hunt, R. A., "S tu dent grades as a feedback system: The case for a confidential mul-
¿Cómo debe estimar las puntuaciones en crudo para poder dar la importancia tiple grade", en Measurement and Evaluation in Guidanee, 5, 1972, págs.
deseada a los tres componentes del grado final? 345-359.
11 . ¿Cuándo es apropiado marcar sobre la curval, ¿cuándo no? Cuando sí lo es, ¿cómo Kindsvatter, R., uGuidelines for better grading", en The Clearing House, 43, 1969,
debe determinarse la fracción para obtener cada calificación? págs. 331-334. . . .
12. ¿Qué pasos propone usted para reducir las diferencias entre los instructores en Millman, J., "Reporting student progress: A case for a cntenon-referenced markmg
cuanto a sus estándares para calificar? system", en Phi Delta Kappan, 52, 1970, págs. 226-230. .
13. En la universidad Y hay 10 grupos de estudiantes de inglés en primer año. ¿Qué Milton, O. y Edgerly, J. W., The testing and grading o{ students, Change Magazme,
procedimientos podrían usarse para asegurar estándares de calificaciones unifor- New Rochelle, N. Y., 1976. -
mes, de tal manera que ningún estudiante sea "castigadoR por haber pertenecido a Pinchak, B. M. Y Breland, H. M., "Grading practices in American high schools", en
un grupo en particular? . Tbe Education Digest, 39, 1974, págs. 21-23.
14. Se ha propuesto que lilas escuelas deberían abandonar la práctica de hacer califica- Scully, M. G . "Gradeinflation", en TheChronicle 01 Higher Education, 9 (3), octubre
ciones graduadas y reportar simplemente 'aprobado' o 'reprobado' para los estu- 7, 1974, pág. 2.
diantes". ¿Cuáles serían las ventajas y desventajas de este procedimiento?, ¿cómo Soderberg, L. O ., NGrading: An old problem revisited*, en Improving College and
se descartarían las funciones para las que hasta ahora sirve el sistema de califica- University Teacbing, 22, 1974, págs. 244-246.
ciones (aunque de manera probada imperfectas)?, ¿qué tan adecuado sería este Terwilliger, J. D., Assigning grades to students, Scott, Foresman and Company, Glen-
procedimiento? view, IlI., 1971.
15. El director de una escuela comunicó a la Dirección de educación: "nosotros tene- Thomas, R. M., NRecords and reports', en Encyclopedia 01 Educational Research,
mos estándares más altos que Masan High. Nuestra calificación de pase es de 70, Macmillan Nueva York, 1969, págs. 1 104-1111. .
mientras que la de ellos es sólo de 65". ¿Qué suposiciones hace el director con este Thorndike, R. L, "Marks and marking systems"¡ en Eneyclopedia o{ Educational
enunciado?, iqué tan defendibles son? Researeh, Macmillan, Nueva York, 1969, págs. 759-766.

, , '.
'.'.

588 CAP. 15. CALIfiCACIONES Y FORMA DE CALIfiCAR

Warren, J. R., College gradingpractices:An overview, Report 9, ERIC Clearinghouse


on Higher Education, Washington, D. C., 1971.
Warren, J. R., The continuing controversy over grades, TM Report 51, ERIC Clea-
ringhouse on Tests, Measurement and Evaluation, Educational Testing Service
noviembre, 1975. '
Williams, R. G. YMiller, H. G., "Grading students: A failure to communicate", en The
Clearing House, 47, 1973, págs. 332-337.
Williams, R. G., PoIlack, M. J. Y Ferguson, N. A., "Differential effects of two grading
systems .on student performance", en Tournal 01 Educational Psychology, 67,
1975, pags. 253-258. 16
Problemas sociales y políticos
de la evaluación

Durante los últimos 70 años, en Estados Unidos, las pruebas estandariza-


das se han extendido en variedad y en amplitud a tal grado que, de alguna u
otra manera, influyen en la vida de casi todas las personas. Un niño en la
escuela recibe una batería de pruebas'estandarizadas para apreciar su progreso
académico. Si sale mal en estas pruebas, se le puede evaluar de manera indivi-
dualizada para determinar si es necesario colocarlo en una clase de educación
especial, y si lo hace extremadamente bien (lo cual es menos frecuente) se le
evalúa de manera individualizada para apreciar si sería necesario enviarlo a un
programa de educación acelerada o enriquecida. Si asp~ra a ingresar en la uni-
versidad, probablemente tomará una o más pruebas de las que se usan a nivel
nacional, y si aspira a ingresar en una escuela profesional, se le puede solicitar
que tome una batería de pruebas de aprovechamiento-aptitud especializada
para admitirlo. Puede encontrarse con una o más pruebas si solicita un traba-
jo, y seguramente recibirá una batería de pruebas de clasificación si decide
unirse a las Fuerzas Armadas. Si busca ayuda en el proceso de sus opciones
educativas o vocacionales, quizá se le especifique que necesita tomar pruebas
que den la información necesaria para el proceso de toma de decisiones, y si
llegara a necesitar un asesor o un psicoterapeuta en caso de un problema emo-
cional, seguramente tendría que resolver otras pruebas.
En vista de la amplia prevalencia de las pruebas en la educación, en la
industria y en el gobierno, no es de sorprender que evaluar, lo que significa
primordialmente administrar pruebas estandarizadas sobre una base institu-
cional, se ha convertido en un material de interés político y social. Este interés
es más general cuando se trata de los derechos del ciudadano individual y de
los grupos de ciudadanos en nuestra sociedad. La preocupación más general se
ha manifestado de muchas maneras en la última generación -la preocupación
por los derechos de la mujer, los derechos de las minorías étnicas y raciales, los

589
CAP. 16. PROBLEMAS SOCIALES LA EVALUACIÓN COMO UNA AMENAZA 59 1
590
derechos a la privada y de la separación de la vida privada de la vida pública Aunque estos caminos personales son menos obvios, también una prueba
o del trabajo. En la medida en que los resultados de la evaluación parecen de matemáticas que hace que una persona diga: liNo soy muy hábil para la
constituir una amenaza a los derechos de los individuos o de los grupos, aritmétical/, se puede considerar como que requiere una revelación personal
evaluar ha caído bajo escrutinio, y algunas veces bajo ataque. que el individuo preferiría no hacer acerca de sí mismo. ¿Cuándo es razonable
En este capítulo, nuestro propósito es examinar algunos de los peligros y demandar esa información?, ¿en qué circunstancias una necesidad social que
las inequidades que se han adscrito a la evaluación, inquirir acerca de los méri- se quiere conocer puede sobrepasar el derecho del individuo a mantener sus
tos de la crítica y ver que se tomen las precauciónes requeridas para satisfacer- propios secretos? A continuación ofrecemos varios criterios que pueden apli- .
las además de considerar cómo la evaluación se puede manejar de tal forma carse, pero casi nunca de manera mecánica, para estimar cuándo es razonable
qu~ maximice los valores individuales y sociales, mientras que minimice los pedir a un individuo que demuestre lo que puede hacer, o que reporte lo que
peligros individuales y sociales. cree o lo que piensa. .

l. ¿Para qué tipo de beneficios se usará la información? Cuando esta


LA EVALUACIÓN COMO UNA AMENAZA información se va a juntar con otra para dar ayuda específica al individuo que
A LOS DERECHOS INDIVIDUALES la proporciona, la objeción para colectada se minimiza. Este tipo de situación
surge cuando se administran las pruebas de salón de clases para identificar
¡En qué aspectos deberíamos preocuparnos por que las pruebas constitu- habilidades específicas en las que el alumno necesita practicar más, o cuando
yan una amenaza a los derechos .del individuo, ya ~ea u!1 ni~~ o un a~ult?? se dan pruebas diagnósticas como guía para planear el trabajo para remediar
Consideraremos esta amenaza baJO tres puntos de Vista: lllvaSlOn de pnvaCia, los déficit, como en la lectura. Este tipo de situación surge cuando un estu-
autoincriminación y riesgo físico o psicológico. diante solicita asesoría, en algún centro vocacional, para buscar ayuda en la
planeación de su carrera o para sus problemas personales, y se le administran
cuestionarios o inventarios para dar al asesor y al cliente la información que
avude al proceso de asesoría.
Invasión de privada . Cuando se anticipa un beneficio social general de la información, como
cuando los datos de una prueba de aprovechamiento sirven para guiar al esta-
En los años recientes ha habido una preocupación creciente en lo políti- do o a la ciudad a ubicar los recursos financieros para la educación, la tenden-
co y en 10 legal acerca de todos los tipos de caminos que conducen hacia la cia es a no ser critico, mientras las demandas de tiempo y de esfuerzo hacia los
privacía individual. El uso cada ~e.z más exteI?-d~do y algunas ye<:es aparente- examinados se mantengan razonables. Otro tipo de beneficio social se en-
mente irresponsable de las o{¡cmas de credito, el advemmiento de las cuentra en los exámenes que, con el fin de otorgar licencia, se aplican a practi-
computadoras y los bancos de datos en los cuales se pue?e almacenar mec~­ cantes incompetentes que desempeñan trabajos importantes -como manejar
nicamente la información acerca de las personas, y la colera que hace declf un camión o extirpar un apéndice-; de este modo, se protege al público.
que la vida de una persona eS su propio asunto, han sensibilizado a la socie- La restricción más severa de este tipo de pruebas parece indicarse cuando
dad en contra de cualquier proceso que pueda ?ar pruel;>as de la forma p~rso­ la información buscada se empleará sólo para el beneficio egoísta de una sola
nal de ser individual y revelárselo a otros. Los lllventanos de la personalIdad persona o de un'grupo queno sea el que solicitó la información Iy tal vez en
han sido el blanco más frecuente de esta preocupación, porque las preguntas detrimento de este último). El caso más obvio es el uso de pruebas de selección
que en ellos se formulan son, en su misma naturaleza, muy personales y y de inventarios de autorreporte para la empresa; sin embargo, aquí también
potencialmente reveladoras. Al respecto, considérense preguntas como las puede argurnentarse que beneficia a la sociedad si los individuos en cada
siguientes: empleo son aquellos que resultaran los más eficaces y los que están más satis-
fechos con ese tra~ajo.
¿Tiene usted problemas al tratar de hacer nuevos amigos? 2. ¿Qué tan adecuada es la información para las decisiones que se toma-
¿Alguna ve:3 ha querido escapar de su casa? . rán? Aun cuando la meta sea importante, no hay ningún punto de evidencia
¿Algunas veces tiene pensamientos que son demaSiado malos como para cuya relevancia sea limitada que casi no proporcione información para las
platicados con otra persona? decisiones que van a tomarse. Por lo contrario, cuanto más directamente ade-
cuada sea la información, más justificado será requerir al individuo para que
Seguramente, tales preguntas tienen que ver con hacer públicos -a cual- la dé siempre bajo el supuesto de que los usos que se hagan también son defen-
quiera que tenga acceso a la hoja de respuestas- algunos aspectos de alguna dibles. De manera ideal, el grado de adecuación deberia quedar bien estableci-
manera encubiertos y personales de la vida íntima del evaluado. Cabria pre- do por investigaciones prevías; sin embargo, especialmente en los propios
guntar en qué circunstancias y a quién deberían interesarle este tipo de revela- estudios de investigación, puede haber varios casos en los que la adecuación
ciones que las manejara apropiadamente. sólo se presuma y se estime sobre bases racionales.

.' ' .. '.'.' '.:...,: , .' .'-,. ',: .. .._: . : :":" ...: . .".,,~, . ·,,~ ..;;.~.,"::~_ ~ 1;'
592 CAP. 16. PROBLEMAS SOCIALES 593

3. Si la información se va a colectar para un beneficio social, iqué tan


importante es ese beneficio? Un grupo de estudiantes fue requerido a res- 1. Antecedentes e inHuencias familiares (17 reactivos) 49%
ponder si sería aceptable colectar datos ac~rca de la est.abilidad em?cional ~e 11. Datos de lo historia personal (19 reactivos) 3
los candidatos a un empleo. Los porcentajes de estudIantes que dIjerOn "SI" 111. Intereses y valores (11 reactivos) 12
para cada uno de los diversos empleos fueron como sigue: IV. Datos de manejo financiero ( 7 reactivos) 52
V. Ajuste sociol ( 7 reactivos) 16

Empleado de mostradQr 34% Si se aceptan estos resultados, parece ser que las pruebas de habilidad y
Piloto de aerolínea 75 las evaluaciones de intereses serían relativamente aceptables en este contex-
j Astronauta 83 to' mientras que la evaluación con inventarios de la personalidad que tratan
:i
F puntos políticos, religiosos, financieros y sexuales es potencialmente com-
prometedora. Posiblemente, en un contexto distinto, el orden sería diferen-
te, pero estos resultados ofrecen una guía tentativa en cuanto a dónde puede
La diferencia anterior puede reflejar, en parte, un juicio de la adecuaCión surgir la invasión de la privada en un punto importante.
del ajuste emocional para funcionar en los tres trabajos; pero también refleja 5. iSe han hecho provisiones para obtener un "consentimiento infor-
una percepción de la cantidad de daño social o de pérdida que podría resultar mado"? Un procedimiento para minimizar las ofensas de cualquier invasión
si una persona "pierde la cabeza" en cada uno de estos tres ambientes. La de privada es administrar una prueba, un cuestionario o cualquier otro proce-
sociedad debe estar advertida de que se necesitan estándares más rígidos para dimiento después de haber obtenido un ·consentimiento informado" de esa
aplicarse a los cirujanos que para aquellos que soliciten empleo para vender persona, o el padre o tutor en el caso de un niño pequeño. Este consentimien-
salchichas. Los derechos del individuo también tienen que dar un rendimien- to informado implica que se ha dicho a la persona qué información se colecta,
to máximo cuando los derechos de otros están crucialmente involucrados. por qué se colecta y para qué se utilizará, y entonces ella ha estado de acuerdo
4. ¿Qué tan personal es la información que se busca? Algunas preguntas en contestar a la prueba o a cualquier otro procedimiento; implica que quien
se perciben como más comprometedoras que otras. ASÍ, en un estudio de acepta es competente para entender la información que se le solicita y para
cuestionario en un contexto de selección de personal, Rosenbaum (1971) decidir acerca de lo apropiado de su participación. Esto puede ser cuestionable
encontró que más a menudo los reactivos que se señalan a continuación eran cuando quien da el consentimiento tiene limitadas ciertas habilidades o se
los que se consideraban como una invasión de la privada: halla en un ambiente limitado o distinto del investigador. Por tanto, se ha
incrementado la introducción de este consentimiento informado como un
requerimiento federal en la investigación psicológica (así como en la médica).
Hóbitos sexuales 81% El consentimiento informado hace surgir problemas tanto para el exa-
Cantidad de ahorro 66 minador como para la persona evaluada. Para la persona que se somete a
Creencios políticos 64 prueba, debe existir una libertad genuina para rehusar, si este consentimien-
Cómo se distribuye un salario 63 to le significa muchas cosas. ASÍ, un solicitante que quiere con vehemencia
Frecuencia de asistir a la iglesia 60 entrar a un trabajo, o un prisionero que siente que sus privilegios dependen
Descripción de la personalidad del de su cooperación, se hallan bajo presión considerable para aceptar cual-
cónyuge 59 quier tipo de pruebas (o de cualquier otra demanda que se les haga). En tales
circunstancias es especialmente importante que las demandas sean razona-
bles por propio derecho y que el examinador no se apoye en un consenti-
miento para justificar demandas poco razonables.
Los temas que rara vez se consideraban como una invasión de la privada Desde el punto de vista del examinador, surge un tipo de problema a par-
incluían un amplio rango de hechos históricos y biográficos acerca de la esco- tir de la palabra informado y otro del mismo hecho de invitar al rechazo por
laridad y de la historia laboral anterior, pero también la evidencia de aptitudes medio de hacer del consentimiento un acto positivo explícito. El primer pro-
vocacionales (2.5%), impedimentos físicos e incapacidades (3.5%), metas de blema surge cuando es esencial que el examinado permanezca ingenuo acerca
trabajo (9.5%), el (9%), intereses (11 %) y hobbies (12%). de la naturaleza y el propósito del procedimiento de prueba. Considérense las
Se identificaron cinco amplios factores en una serie de 66 reactivos, y la pruebas de honestidad que se describieron brevemente en el primer apartado
mayoría de los reactivos podía agruparse en estos cinco grupos. Tanto la de- del capítulo 13. zQué pasaría a los resultados de esas pruebas con aquellos di-
signación de los grupos como los porcentajes promedio que consideran a seños si el examinador llegara el día anterior a la prueba y anunciara: "Niños,
estos reactivos como una invasión de la privacía son como siguen: mañana vamos a aplicarles unas pruebas para ver si ustedes hacen trampa,
594 CAP. 16. PROBLEMAS SOCIALES 595

mienten o roban»? Los niños ahora están informados, de una manera bastante Autoincriminación y derecho a refutar
burda, pero el proceso de informarlos hará que las puntuaciones obtenidas no
tengan sentido. Su conducta en las pruebas habrá sido radicalmente alterada. Una preocupación relacionada con la invasión de la privada, pero que se
Éste es un caso extremo, pero, de alguna manera, siempre Surge el mismo pro- distingue de ella, es la de la autoincriminación. Puesto en palabras de la
blema cada vez que el propósito de una prueba o de un experimento psicológico Enmienda de la Ley Quinta de la Constitución de los Estados Unidos, ningu-
es, hasta cierto punto, encubierto y tortuoso; es decir, en algunas ocasiones, na persona "será compelida en cualquier caso criminal a atestiguar contra sí
informar al evaluado puede redundar en la destrucción de su utilidad para la misma"; nuestra cultura tiende a extender a esta nación a contextos no crimi-
investigación. nales. Vemos con preocupación ciertos procesos que fuerzan al individuo,
El otro problema, que es requerir el consentimiento explícito, invita al re- debido a las presiones que se ejercen directamente sobre él o a las inferencias
chazo, un rechazo que quizá nunca habría surgido si se hubiera tomado como escondidas e indirectas que puedan hacerse por medio de sus respuestas, para
un hecho que el proceso era agradable. Particularmente en proyectos como la dar información que se usará después en su contra. Aun así, reconocemos que
normatividad de pruebas o la realización de encuestas de habilidades o de apti- el individuo que busca cierto beneficio personal -participar en un programa
tudes, los resultados de una muestra representativa son de una importancia de entrenamiento, ser contratado para un trabajo u obtener crédito en un ban-
crítica, las personas que se rehúsan o se dan de baja, lo cual constituye un pro- '<:0- tiene alguna responsabilidad que justifique que reciba tal consideración y
blema muy serio. Si, como normalmente es el caso, los que rehúsan difieren que este intento de justificación implica cierto riesgo. Tal vez un punto de vis-
significativamente de los que consienten, la muestra resultante está sesgada y ta razonable sería el que los beneficios potenciales para el individuo deberían
la naturaleza y la cantidad de este sesgo suelen desconocerse. La distorsión ser, por lo menos, equivalentes a las demandas que se le hacen para dar la
consecuente de los resultados puede reducir seriamente (o aun destruir) su información que podría ser auto despreciativa.
significado y su utilidad. Cuando un individuo toma el carácter de acusado en una corte tiene el
6. ¿Hasta qué extensión se puede asumir el consentlmiento? Desde hace derecho de carearse con el acusador, de oír cuáles son las pruebas que hay en
mucho tiempo operamos como si la presencia de un individuo en cierto papel su contra y de ofrecer pruebas que refuten la acusación. Una preocupación
en un ambiente específico implicara permiso para reunir determinado tipo de con el uso que se da a los datos de las pruebas es que esta situación no preva-
información acerca de él. Tal vez el caso más obvio es la aceptación, en gran lece. El examinado no ve los resultados de su prueba, no sabe cómo se inter-
parte automática, de lo apropiado de evaluar a los estudiantes, realizado por pretan, ni está consciente de qué tipo de decisiones se tomarán a consecuencia
su maestro tanto para dar evaluaciones del progreso como para guiar la ins- de ellos. 2 En vista de la confiabilidad menos que perfecta de las puntuacio-
trucción subsecuente y hacer evaluaciones acumulativas en términos de qué nes de prueba,la ocurrencia de que en ocasiones cuando un individuo, por
importancia dé el maestro a la adecuación y a la calidad del desempeño de alguna razón, "dé menos de sí" y se desempeñe deficientemente y la reali-
cada estudiante. Generalmente hemos considerado que quien solicita un tra- dad de que se cometan eirores ocasionales al calificar, al convertir las pun-
bajo, por el solo hecho de solicitarlo, implica su consentimiento para que la tuaciones o al copiar, o la posibilidad de que un individuo sea condenado
empresa reúna cierto tipo de información a medida que ésta se relacione con por un juicio erróneo, es lo suficientemente real para que uno desee permi-
el valor potencial del solicitante como empleado. La pregunta es: ¿qué tipos de tir al examinado (o a su padre, si el examinado es un niño pequeño) ver las •
información son adecuados? De manera similar, una persona puede volunta- calificaciones o puntuaciones y que tenga una reacción hacia ellas.
riamente pedir asesoría, lo que implica, por ese solo hecho, la. disposición Esta reacción puede tomar la forma de una descripción que atenúe las cir-
voluntaria para que el asesor o el psicoterapeuta evalúe su vida interna. Este cunstancias, de una petición para volver a ser evaluado o de la presentación de
consentimiento implícito es todavía probablemente aceptado como real, pero información compensatoria. En cualquier caso, si los resultados se ponen a
sus límites apropiados están bajo escrutinio mucho más en los momentos pre- disposición del individuo en cuestión, o tal vez se discutan con él, se evitará la
sentes que lo estuvieron en el pasado. impresión de la cámara secreta, en la que se fuerza al individuo a dar una
7. ¿Está protegido el anonimato del individuo? Un último factor que información que se mantiene en secreto y que se usa de modo secreto. Esta
atenúa la intrusión en los asuntos del individuo es la garantía de anonimato. preocupación acerca del secreto sobre los registros académicos, incluyendo
En la mayoría de los estudios de investigación no hay ningún interés por los resultados de las pruebas, ya ha sido cristalizada en la Enmienda de Ley
conocer a personas específicas, y una vez que los datos se han recolectado,los Buckley-Pell, la cual especifica que una escuela debe tener sus registros dispo-
nombres ya no se necesitan.! Algunas veces no se necesita ninguna identifica- nibles para quejos puedan revisar los padres y/o los estudiantes. Cumplir con
ción, aun cuando se colectan los datos originalmente. Cuando esto es así, se este requisito genera muchos problemas prácticos en las escuelas, lo cual tal
reduce muchísimo cualquier amenaza a la privada personal en la realización vez las anime a realizar menos pruebas y a mantener los registros menos com-
de la investigación, por supuesto. pletos, pero también proporciona una garantía contra el tipo de pruebas defec-
tuosas o de resultados de pruebas con errores a los que nos referimos antes.
J Algunos estudios longitudinales requieren la continua identificación de personas, y en 2 Desde luego, esta preocupación incumbe no sólo a los resultados de las pruebas, sino tam-
estos estudios la protección del anonimato es un problema especial. bién a cualquier expediente.

', o'.
II 596

Riesgo físico o psicol~gico


VALORES POSITIVOS

pongan toda la información junta, de manera lo ~uficientemente conv~niente


597

y sabia, de modo que esta persona sea comprendida y ayudada, y no solo se le


asigne una denominación o se le clasifique.
I Una tercera preocupación que se ha expresado es que evaluar tal vez
invada los derechos del individuo, por medio de someter a la persona evalua-
da a algún ·riesgo físico o psicológico'l. E~ dif~ci~ ver cómo c~alquiera de las PELIGROS POSIBLES A LOS DERECHOS
pruebas estándar, ya sean educativas o pSlcologIcas,. de los upos .que he??,os DEL GRUPO
considerado en este libro, pueden someter al examu!-a?o a u.n nesgo flSICO
que sea mayor que los propio~ l?~ligros d~ la vida cotIdlan~; sro eII?-bar?~, es Una preocupación que se expresa a veces es c:tue las pru~b~s ~uedan usars.e
factible que haya alguna posIbIlIdad de rocrementar el nesgo pSIcologIco. para privar a ciertos grupos de la just~ oportumdad. de reclbrr CIertos beneÍl-
Las pruebas pueden ser generadoras de angustia. Los inveI!ta~i~s de la per- cios sociales, especialmente oportumdades educatl-y-a~ y de eml?le? En la
1'1 sonalidad pueden hacer surgir puntos que hagan pensar al mdlvlduo acerca extensión en que se usen las pruebas de manera mecamca como dIseno s para
11 de ciertos aspectos de sus sentimientos y acciones que le p.r?voquen preo~upa­ la selección y la colocación, y en la medida en que ciertos grupos de nuestra
,1 ción. El desempeño deficiente en divers<l:s pruebas de habIhda~ puede danar la sociedad -las minorías raciales y étnicas, o más generalmente, la gente pobre-
'11 autoestima de una persona. Si la angustIa extra, la preocupaClOn o la autode- se desempeñan más defidentemente en las. pruebas, éstas se conve~i!án en
!~ preciación se consideran representativas de peligros psicológicos, tiene que
reconocerse que tanto contestar pruebas como sus resultad~s pueden, a vece~,
instrumentos por medio de los cuales se mega el acceso a la educacIOn y al
empleo de manera desproporcionada a los miem?ros de estos ~~pos. La cues-
contribuir a dichos peligros. El problema es juzgar la sevendad de estos peli- tión que debe afrontarse es si en realidad se les mega el acceso rojustam~nte y,
gros y compararlos con los beneficios ya sea para la persona evaluada 5> p~ra de modo más general, que constituye un uso de resultados de pruebas justo y
una porción mayor de la sociedad en la 9.ue esa perso?~ se. ?esempenar.a. equitativo para la selección, colocación y clasifjc~ción, d7 personal.
Un tipo de riesgo diferente es el que atIende a la clasIfIcaCI~n o categonza- La cuestión de un uso justo tiene su lado pSlcometnco cuando se pre-
ción del individuo (Hobbs, 1975). Todos tenemos una tendenCIa natural, pero gunta en relación con las puntuaciones de prueb~ 1 el desempeño ~n ~l tra-
algunas veces lamentable, a simpli.41.car la complejidad infinita del mu~do por bajo, tanto dentro de un grupo como entre los dl~ere?t~s grupos etmc,o~ y
medio de clasificar a las acciones, y algunas veces a las personas, despues darles socioeconómicos. Pero también tiene un lado hlosofleo y otro polluco
una denominación y luego tratar ese evento o a esa persona como representati- cuando se pregunta qué valores son los que la sociedad acepta como,metas
va de esa clase, más que como a un individuo. Estas denominaci0!les conllevan deseables para un sistema de colocación y emple? del personal. íqu 7 tanta
un complejo de implicaciones en cuanto a cómo es la persona, que puede hacer, importancia debería darle la. so.ciedad estad?umde.nse pa~a maxlmlza~ la
qué se puede esperar de ella y en qué se puede convertir. Una serie de este tipo productividad de sus establecImIentos e~ucauvos e md~s~nales (cua~qUlera
de implicaciones se adhieren a denominaciones del tipo de retrasado mental, que sean los términos en los que se d~fma la pr~~uctIVldad)?, íque tanta
inhabilidad específica para aprender, emocionalmente perturbado o d.elin- importancia se debería dar a la oportumd~d de eqUlh~rar ent!e ca~a segmen-
cuente, y la denominación acarrea con ella prospectos para el tratamIento to de una sociedad o a extinguir cualesqUlera de las dIferenCIas eXIstentes en
futuro de esa persona en los sistemas educativos y sociales. lo educativo y oc~pacionaH La investigación psicométrica P?~de aportar
Las denominaciones son, cuando mucho, una descripción sobresimplifi- algunos cálculos, admitidamente burdos, del costo dey!oductlvldad d~,for­
cada aun cuando el nombre se ha aplicado correctatnepte. Más aún, se consi- zar la igualdad numérica entre los grupos en las declSlones de s~le~clOn y
dera 'que muchas de estas denominaciones son explicacjO:nes, más que simples colocación, pero la investigación psicomét!ica,~ura no puede decI.r ~l el cos-
clasificaciones descriptivas. Los casos de una denomffÍación errónea son pun- to en relación con un tipo de valor queda jusufIcado por el benefICIO en un
to de preocupación en particular, y la posibilid.ad de q,ue los resultados ~e valor completamente distinto.
prueba desempeñen frecuentemente el papel 'de denomroar de manera erro-
¡. nea a las personas de antecedentes y medios culturales distintos o deprimidos
económicamente, es una de las bases para la preocupación acerca de los peli-
gros que sufre el individuo como consecuencia de los resultados de pruebas. VALORES POSITIVOS Q.UE SE PRETENDE
Quienes diseñamos y administramos pruebas debemos estar continuamen- LOGRAR CON EL DISENO DE PRUEBAS
te alertas contra la tendencia a denominar y clasificar sólo por el deseo de hacer-
lo. Constantemente tendremos que insistir en que las puntuaciones de prueba Hasta aquí hemos considerado, primordialmente,los p~ligros y l?ro~l~­
son un hecho descriptivo acerca de una persona, y que un solo hecho única- mas que pueden surgir del uso de la~ prueb~s en cuanto co~clernen ~1,md1Vl­
mente puede entenderse en su totalidad, en renninos de los contextos presente duo y a los grupos en nuestra SOCIedad; sro embargo, eXI~te tamb~en otro
y pasado totales de esa persona. Es un desafío el que todas las personas que tra- lado de la moneda. La evaluación se realiza en una extensIón conSIderable
bajen en las profesiones de ayuda social, como maestros, asesores o trabajado- con el fin de lograr resultados positivos tanto para e~ ~dividuo con:o par~,la
r~ sociales, conozcan a cada alumno o a cada cliente con el suficiente detalle y sociedad mayoritaria. Ahora debemos prestar atencIOn a una conslderaclOn
598 CAP. 16. PROBLEMAS SOCIALES VALORES POSITIVOS 599
de esos resultados positivos. Finalmente, trataremos de reconciliar los peli- D?-étodos o las metas para o~timizar .las experiencias de aprendizaje de un indi-
gros y los beneficios y ver qué clase de enfoque usar en los resultados del uso VIduo o de un grupo en partIcular¡ sm embargo, los problemas y las decisiones
de pruebas que se acompañen de términos de valores positivos o al menos en existen. Las pruebas abarcan una fuente de información adecuada que puede
término de peligros. usar una persona inteligente para tomar mejores decisiones, las cuales consti-
tuyen uno de los valores importantes que tratamos de lograr cuando evalua-
mos a los estudiantes.
Beneficios individuales que se pueden lograr Tenemos mucho que aprender acerca de las maneras en que las caracterís-
mediante las pruebas ticas humanas interactúan con las modalidades instruccionales para hacer
que el aprendizaje sea más eficaz, así como de las técnicas de administración
En varias secciones de este libro hemos hablado de la evaluación en rela- instrucdonal que permitirán que las modalidades instruccionales diferentes
ción con la toma de decisiones -de las decisiones que se tomarán inevitable- repercutan en el salón de clases. Tenemos mucho espacio para hacer mejoras
mente para cada persona o por una persona, en el curso de la educacióri y de la de nuestras técnicas de diagnóstico y prescripción para los niños que mues-
vida. El "credo" de todos aquellos que administran pruebas o enseñan acerca tran dificultades de aprendizaje específicas¡ pero también hemos hecho pro-
de ellas es que el uso de las pruebas permitirá (pero ciertamente no garantiza- gresos, eillos cuales la evaluación ha desempeñado un papel muy importante.
rá) tomar decisiones mejores o más sabias. Las decisiones acerca del tratamiento que debe recibir una persona no se limi-
tan, por supuesto, a las. instituciones educativas. En la extensión en que el per-
sonal de lbs hospitales para enfermos mentales, las prisiones y otras insthu-
Decisiones acerca de una persona, ciones de custodia logren más que sólo su función de custodia, deberán
concernientes primorditrlmente al contenido determinar cómo es cada persona que está bajo su cuidado y enfocar los pro-
y al método más eficaz para su educación blemas de cada una de ellas con el fin de planear un programa de tratamiento
o de cuidados que sea el mejor para esa persona. Las pruebas son sólo un
Durante los últimos 80 años, los educadores y los psicólogos ha'n reco- recurso que ayuda a completar estos cuadros.
nocido que las personas dan muestras de diferencias sustanciales en sus ca-
pacidades de aprendizaje y en sus estilos de aprendizaje. Los educadores han
tratado de adaptarse de varias maneras a estas diferencias y de individualizar Decisiones tomadas por una persona,
la instrucción. Cualquier intento por adaptar la educación a las característi- que conciernen a opciones y planes futuros
cas de una persona específica, significa tomar toda una serie de decision,es en
cuanto a cuál sería el patrón o los patrones de instrucción que se ajustaran Es obvio que cada persona tiene muchas opciones en la vida que dependen
mejor a la persona en un momento dado. iQué tan rápido y de qué manera de su conocimiento acerca de qué clase de persona es. No hay ninguna duda de
debería hacerse para que un niño se interese en la lectura? I idebería' enseñar- que muchas personas sienten la necesidad de recibir ayuda para escoger algu-
se a un niño la aritmética mediante el enfoque del"descubrimiento" o por :{la de esas opciones. Esta ayuda puede tomar la forma de la información de
medio de la práctica y la habituación?, ¿se deberí,il enseñar álgebra a un niño cómo es el mundo de la educación, es decir, qué carreras hay y qué implica
y, en caso afirmativo, cuándo y a qué ritmo? Estas son decisiones que se cada una de ellas, o qué tipo de programas educativos existen y qué requisitos
deben tomar si se quiere que la instrucción sea otra cosa que realizar una deben cumplirse en cada uno de ellos. Pero esta ayuda también puede tomar la
serie de pasos cerrados para todo el mundo, por medio de la misma secuen- forma de decir al individuo algo acerca de sí mismo, es decir, qué tan bien se
cia, al mismo ritmo y de la misma manera. ajustan sus habilidades, sus intereses o su temperamento a las demandas de las
Por supuesto, tales decisiones pueden basarse por entero en juicios subje- diferentes opciones o entrenamientos para cada carrera. Esta ayuda al indivi-
tivos de un maestro, ayudados por pruebas informales del tipo de las que este duo en lograr un mejor autoconocimiento representa uno de los valores
maestro desee construir y emplear. Pero parece que ha habido ciertas ventajas importantes que las pruebas intentan lograr.
en el complemento de estos juicios mediante la apreciación objetiva basada en
una serie de ejercicios uniformes que sistemáticamente se relacionan con
habilidades o aptitudes críticas y que permiten comparar el desempeño de
grupos de aprendices con características definidas {de edad, grado, sexo, etc. ,. Beneficios sociales que se intenta
Cada vez ha sido más evidente que las relaciones entre las características , lograr mediante las pruebas
humanas, por un lado, y los patrones óptimos de instrucción, por el otro, son
más complejas que lo que nuestras fonnulaciones algunas veces nos lo habían La evaluación no sólo funciona en los intereses de un individuo específico
indicado. Es evidente que aún tenemos mucho que aprender acerca de cómo y al cual los resultados de las pruebas pueden dar una información útil y una
qué tanto se deben modificar los materiales instruccionales, así como los guía para su carrera educativa o vocacional, sino también para el grupo social

. .; .....
. '," ," - . r·· · ~ - " , .:. •~. ".':. ,,<-,. ,-.' '•..
CAP. 16. PROBLEMAS SOCIALES VALORES POSITIVOS 601
600

del que la persona forma parte. Podemos identificar varios problemas sociales esto representa un costo social, aunque sea, tal vez, menos reconocido como
en los que las pruebas pueden y deben desempeñar un papel constructivo. una preocupación general para la sociedad; sin embargo, a lo largo de los años,
la eficiencia incrementada de las operaciones para los establecimientos pro-
ductivos en su totalidad es una de las metas de la evaluación del personal.
Protección contra la incompetencia
y la ineptitud
Procedimientos educativos eficaces
En un amplio rango de ocupaciones es importante que todos quedemos
protegidos de aquellos que no pueden desempeñarse competentemente. Tal La educación es una empresa muy costosa y los costos se han hecho
vez veamos esto con más claridad en un campo como el de la medicina. Todos cada vez más onerosos. La "productividad" en educación no es fácil de eva-
estaremos de acuerdo en que es socialmente deseable que los practicantes luar -aunque el desempeño en las medidas de aprovechamiento bien dise-
médicos sean competentes y en que se establezca cierta clase de garantías para ñadas den un indicador de lo que se produce en la empresa educativa-¡ sin
proteger al público de los practicantes que carezcan del conocimiento o las embargo, se tiene un sentimiento poco confortable en cuanto a que no hay
habilidades adecuadas. De las diversas bases para asegurar esta competencia nada en educación que se compare con las ganancias en la productividad
en la práctica de algún campo, lo que las pruebas evalúan en cuanto a su cono- industrial durante los últimos 60 años. Por tanto, cada vez se vuelve más
cimiento y aplicación representa un componente significativo. En el campo importante controlar, vigilar y guiar la empresa educativa para que sea lo
de la medicina se han visto algunos desarrollos muy interesantes en los exá- más eficaz posible.
menes para obteneI' la licenciatura que han implicado la evaluación no sólo La evaluación desempeña un papel para apreciar los resultados de la edu-
del dominio del individuo en ese campo, sino también de su habilidad para cación, especialmente en la evaluación de las innovaciones en los programas
aplicarlo en el diagnóstico de casos individuales yen la prescripción del tra- de contenido y en los cambios instruccionales¡ también desempeña un papel
tamiento apropiado. Obviamente, no hay una prueba que proporcione una en cuan to al control y a la vigilancia de rutina de la eficacia de una escuela o de
evaluación perfecta del desempeño en una especialidad profesional o labo· un sistema escolar, así como en cuanto a ajustar el programa de instrucción al
ral, pero sí puede dar una seguridad importante acerca del individuo que está aprendiz individual. Por ejemplo, durante los últimos 25 o 30 años ha habido
desinformado o inepto. mucha investigación dirigida hacia la noción del "estilo cognoscitivo" y los
patrones de aprendizaje particulares, con lo cual se implica que la informa-
ción acerca de un individuo específico puede ayudar a dar un tratamiento
Uso eficaz de los recursos sociales educativo que sea más apropiado para el individuo. Debe admitirse que, hasta
este momento, la cantidad de información clara y ya verificada acerca de la
Relacionada con la protección de las personas contra los practicantes inex- relación que existe entre el estilo de aprendizaje y el tratamiento educativo ha
pertos o incompetentes e ineptos, está la protección de la sociedad contra el gas- sido fragmentada y limitada, pero qüe las nociones básicas parecen ser promi-
to o el" desperdicio de sus recursos al entrenar a individuos que no tienen proba- sorias y fructíferas, y cabe esperar que en el futuro produzcan mejoras en los
bilidades de progresar en esa habilidad especial para la que son entrenados. Una procedimientos instruccionales individuales.
vez más, podemos tomar la medicina como ejemplo. El entrenamiento médico
es un recurso escaso y fuertemente subsidiado, y la provisión de las facultades y
los laboratorios necesarios para entrenar a los estudiantes de medicina es una Descubrimiento del talento en todos
demanda costosa para la sociedad. Con los lugares para el entrenamiento de los segmentos de la población
practicantes de la medicina a gran demanda, se convierte en algo muy impor-
tante para la sociedad que aquellos a quienes se da la oportunidad de recibir Una de las características principales de las pruebas es que consideran a
este entrenamiento sean las personas que tienen más probabilidades de bene- cada persona como un individuo, y no como miembro de cualquier grupo. La
ficiarse de él y de tener éxito en la especialidad en que han sido en trenados. El prueba no sabe si el individuo que se somete a ella es negro o blanco, rico o
problema es menos agudo en las áreas en las que el entrenamiento es menos pobre, hombre o mujer; no tiene concepciones previas en cuanto a quién
costoso yen las que las desventajas sean menos severas, pero, en principio, el debería desempeñarse bien en ellas y quién mal, y será capaz de reconocer la
punto del empleo eficaz de los recursos sociales se convierte en un beneficio habilidad de cualquiera que demuestre que la tiene. Esto es más tle lo que
que uno espera lograr mediante los procedimientos de selección válidamente generalmente pueden pretender los maestros o cualquier otra clase de evalua-
apropiados. dores humanos, que sostienen convicciones firmes de que por lo general los
El empleo eficaz de los recursos sociales se aplica no sólo a los programas pobres, o las personas de las minorías específicamente, no deberían aspirar (o
de entrenamiento, sino también a los recursos de producción. Si un trabajador ser alentados) a proseguir niveles más altos de la educación o a seguir ciertas
no es eficiente en el uso de un equipo costoso para la producción industrial, carreras.
602 CAP. 16. PROBLEMAS SOCIALES CÓMO LLEVAR AL MÁXIMO lO POSITIVO 603

Como ya indicamos en otra sección, hay preocupaciones legítimas de que nifique cierto grado de aislamiento social de la corriente o tendencia principal
los distintos antecedentes de algunos grupos en nuestra sociedad pueden ten- de la escuela. La decisión de un estudiante en cuanto a solicitar admisión a
der a mantener bajo el nivel de desempeño en esos grupos. Pero las diferencias una escuela de derecho en particular puede implicar satisfacciones personales
individuales aún permanecen, y las pruebas tienen la preparación para reco- como prestigio personal y beneficios económicos futuros si se le admite, per~
nocer el talento individual dondequiera que aparezca. ASÍ, los resultados de un costo en autoestima si se le rechaza o si el candidato fracasa en cumplir con
las pruebas pueden servir como una fuerza liberadora para dar las oportunida- los requisitos del programa. Un sistema de selección personal puede lograr
des a los individuos talentosos que, dada su afiliación a un grupo, de otra ciertos valores para la empresa, en cuanto al dinero que se ahorre en entrena-
manera se les habría negado. miento yen menos cambios del personal, pero al costo de que para la sociedad
en su totalidad se reducen las oportunidades de empleo para las personas jóve-
nes de los ghettos del centro de las ciudades. Sólo en cuanto se reconozcan
Adiciones al conocimiento estos valores en conflicto y se ponderen, se podrá decidir si las pruebas pueden
contribuir a tomar decisiones mejores y de qué manera.
La evaluación puede contribuir a un quinto valor, que es almacenar el 2. Reconocer que las puntuaciones de prueba son sólo indicadores o
conocimiento potencialmente útil acerca de los individuos. La ciencia de la signos de la realidad esencial en la que uno está interesado. Una puntua-
psicología y la ciencia de la educación, hasta donde la educación puede ser ción en una prueba de lectura es un indicador de la habilidad para leer, mas no
Ciencia, depende de que se sepa cómo se desarrolla el ser humano, cómo la habilidad para leer en sí misma. La puntuación en una prueba de aptitud
aprende, cómo reacciona al estrés y a las crisis, y qué factores influyen en el escolar es sólo un indicador parcial de la disponibilidad para tener éxito en el
proceso de crecimiento, aprendizaje y respuesta. La ciencia observa las rela- aprendizaje escolar. Este signo es, cuando mucho, una representación imper-
ciones, manipula las condiciones y mide los resultados. La medición es pri- fecta de la realidad; pero la realidad esencial sólo es accesible a nosotros por
mordial para toda empresa científica, y la psicología y la educación no son medio de las señales que da. Así, nos percatamos de la fiebre en un organismo
excepciones. Si estudiáramos las condiciones que favorecen el desarrollo si empleamos un termómetro clínico o, de manera más burda, cuando adverti-
mental, deberíamos medir ese desarrollo -probablemente por medio de algún mos una cara sonrojada y caliente; sin embargo, cuando intervienen los facto-
tipo de prueba. Si hiciéramos un mapa con todos los factores que promueven res físicos, culturales o sociales distorsionan tes, la significancia del indicador se
la hostilidad hacia un subgrupo de nuestra sociedad, deberíamos medir esa puede modificar o borrar.
hostilidad -probablemente mediante algún tipo de escala de actitudes. Con 3. Reconocer los resultados de la prueba sólo corno un tipo de datos des-
todas sus desventajas, las pruebas de una clase o de otra desempeñan un papel criptivos. Las palabras clave en este enunciado son uno y descriptivo; por
central en la investigación del crecimiento y del aprendizaje humanos. tanto, en relación con cualquier decisión, hay muchos otros tipos de informa-
ción que son adecuados, además de las puntuaciones de prueba. Una prueba
Stanford-Binet o una WISC pueden proporcionar una información útil para
CÓMO LLEVAR AL MÁXIMO LO POSITIVO prescribir algo a un niño que lee mal, pero también pueden proporcionar
datos adecuados a una evaluación de habilidades visuales, una información
En las secciones anteriores hemos tratado de dejar claro que no obstante acerca de las circunstancias, o algún conocimiento acerca de los hobbies e
que hay ciertas preocupaciones legítimas acerca de los usos que se han hecho intereses de ese niño. La puntuación de una prueba de habilidad sólo puede
o que podrían hacerse de los resultados de lal1 pruebas, también hay muchas describir un aspecto del funcionamiento actual de una persona; por sí misma,
ventajas positivas que se obtienen de éstas. ¿En qué circunstancias tendre- no revela por qué se desempeña como lo hace, ni nos aclara qué relaciones
mos más probabilidades de obtener las ventajas, mientras mantenemos los causales tiene ese desempeño, por ejemplo, con las dificultades que afronta
riesgos de los efectos negativos a un mínimo? Las prescripciones que ofrece- para aprender a leer.
mos podrían muy bien ser un consejo de perfección, cuando mucho una 4. Relacionar los resultados de la prueba con cualquier otra cuestión
aproximación hecha por seres humanos falibles, pero nos parece que definen acerca de la persona o del grupo. Ningún resultado de prueba existe en un va-
las metas por las cuales pugnamos. Emplearemos los resultados de las prue- cío. Las puntuaciones ganan en significado en proporción a que la serie de in-
bas de una manera constructiva para la toma de decisiones, en la extensión formación en la cual se ajustan sea completa e integrada. Esta serie incluye
en que hagamos lo siguiente: información acerca del contexto cultural del individuo, de sus antecedentes
familiares, de su historia personal, de su estatus físico y de salud, et<!: Hay una
l. Examinar hasta hacer claros todos los valores implicados. La mayoría cuestión muy real en cuanto a qué tan completa y sólidamente puede sinteti-
de las decisiones, ya sea que se relacionen con un solo individuo o con toda zar una mente humana este tipo de información tan completa acerca de un
una clase o categoría de individuos, implica un complejo de valores interac- caso individual {eventualmente, las computadoras podrían háCerlo mejor}.
tuantes y en conflicto. La decisión de poner a un alumno en una clase especial Sin embargo, se obtendrán decisiones convenientes en la medida en que se
tal vez le signifique un aprendizaje más eficaz, pero puede que también le sig- puedan sintetizar, ponderar y aceptar todas las evidencias disponibles.

. .' .
. .... ; , .... :. '." ", ,' -.: ',,' ~:': . '
.:.. :-,:.- .; ,-,', '. '/ /. :'.. ,"'~ ;~':~'·::~~:!;~~~;t~~·~~~~~;:·~::·':·
'
604 CAP. 16. PROBLEMAS SOCIALES LECTURAS ADICIONALES 605
5. Reconocer las posibilidades de error en todos los tipos de datos des- Equal Employment Opportunity Commission (EEOC), "GuideJines on employee selec-
criptivos. Repetidamente se ha hecho referencia al error de medición en las tion procedures", en Federal Register, 35 (149), 1970, págs. 12333-12336.
puntuaciones de prueba, incluso se han señalado las posibilidades de cometer Pincher, c., "Personne1 testing and public policy", en American Psychologist, 28,
errores muy grandes en la administración de las pruebas, en su calificación y 1973, págs. 489-497.
en su reporte. El usuario de los resultados de prueba necesita estar constante- National Council on Measurement in Education, "On bias in selection", en Toumal 01
mente alerta de la naturaleza aproximada de cualquier puntuación y de en- Educational Measurement, 13, 1976, págs. 1-99.
cuadrar esa puntuación o calificación en un marco de incertidumbre. Pero Privacy and behavioral research, U . S. Government Printing Office, Washington, D.
C., 1967.
también es igualmente cierto, aunque tal vez menos reconocido explícita- HTesting and public policy·, en American Psychologist, 20, 1965, págs. 857-992.
mente, que todas las otras clases de información que tengamos acerca de una uThe myth of measurability", en The National Elementary Principal, 54, marzo-
persona también están sujetas a error. La impresión del maestro de qué tan abril, 1975.
bien lee Elena, qué tan popular es dentro del salón de clases o qué tan intere- HThe scoring of children: Standardized testing in America', en The National Elemen-
sados están sus padres en su éxito escolar son juicios burdos y falibles. La tary Principal, 54, julio-agosto, 1975.
apreciación del médico acerca de su salud, <> la caracterización de su ambien- Tittle, C. K., HSex bias in educational measurement: Fact or fíttion?", en Measure-
te hogareño hecha por el trabajador social, son consideraciones subjetivas, ment and Evaluation in Guidance, 6, 1974, págs. 219-226.
aproximadas y falibles. Nuestras decisiones siempre se realizan con base en Tyler, R. W. y WoIf, R. M. (dirs.), Crucial issues in testing, McCutchan, Berkeley,
la información parcial y falible, dado que las puntuaciones de prueba son Calif., 1974.
falibles como todas las cosas.
6. A la luz de 10 anterior, reconocer los límites del conocimiento huma-
no y mantener las decisiones propias como tentativas, en la medida en que
hacer esto sea realmente posible. Las decisiones tienen que tomarse, pero las
tomamos con base en datos parciales y falibles, las tomamos lo mejor que
podemos con lo que el conocimiento nos ha dado hasta ahora. Algunas deci-
siones son de táctica y se toman día con día, como cuando se instruye o se guía
a un niño específico, y siempre existe la posibilidad de cambiar la dirección,
con base en un papel vigilante del progreso. Otras decisiones son instrumen-
tales y comprometen sólo parcialmente el futuro de alguien, como sería la
decisión de tomar un curso de matemáticas, dado un compromiso tentativo de
participar después en un programa de ingeniería. La naturaleza tentativa de las
decisiones puede ser reconocida, e inmediatamente se pueden redirigir las deci-
siones a la luz de futuras evidencias. Con otras decisiones, el reverso no es tan
fácil; pero para todas las decisiones, cualquiera que sea el papel que en ellas
desempeñen las puntuaciones de prueba, nos mantendremos claros y siempre
afrontaremos la máxima siguiente: tal vez nos equivocamos.

LECTURAS ADICIONALES
American Psychological Association, Ethical standards 01 psychologists, American
Psychological Association, Washington, D. C., diciembre, 1972.
American Psychological Association, M Task Force on Employment Testing of Mino-
rity Groups. Job testing and the disadvantaged', en American Psychologist, 24,
1969, págs. 6."!7-650.
Berdie, F. S., "What test questions are likely to offend the general public/, en !ouma}
01 Educational Measurement, 8,1971, págs. 87-93.
Buchwald, A. M., ·Values and the use of tests", en Toumal 01 Consulting Psychology,
29, 1965, págs. 49-54.
Cronbach, L. J., MFive decades of public controversy over mental testing", en Ameri-
can Psychologist, 30, 1975, págs. 1-14.
Ethical principIes in the conduct 01 research with human participants, American
Psychological Association, Washington, D. C., 1973.
Apéndices

.. ; . .. . . ' ... . . .
'. ' ;"
" . '. : ..
: ;. , .. :,.· .Q, ,; ~ ,: ;~,.,~~, I ·r. ,: ..: '.
609

APÉNDICE UNO
PORCENTAJE DE CASOS QUE SE UBICAN
POR DEBAJO DE LOS VALORES SELECCIONADOS
EN UNA CURVA NORMAL

Desviación Porcentaje Desviación Porcentaje


en unidades de cosos en unidades de cosos
de desviación que se ubican de desviación que se ubican
estóndar por debajo estóndar por debajo

+ 3.0 99.9 - 0.1 46.0


2.9 99.8 - 0.2 42.1
2.8 99.7 - 0.3 38.2
2.7 99.6 - 0.4 34.4
2.6 995 - 0.5 30.9
2.5 99.4 - 0.6 27.4
2.4 99.2 - 0.7 24.2
2.3 98.9 - 0.8 21.2
2.2 98.6 - 0.9 18.4
2.1 98.2 - 1.0 15.9
2.0 97.7 -1.1 13.6
1.9 97.1 - 1.2 11 .5
1.8 96.4 - 1.3 9.7
1.7 95.5 - 1.4 8.1
1.6 94.5 - 1.5 6.7
1.5 93.3 - 1.6 5.5
1.4 91.9 -1.7 4.5
1.3 90.3 - 1.8 3.6
1.2 88.5 - 1.9 2.9
1.1 86.4 - 2.0 2.3
1.0 84.1 - 2.1 1.8
0.9 81.6 - 2.2 1.4
0.8 78.8 - 2.3 1.1
0.7 75.8 - 2.4 0.8
0.6 72.6 - 2.5 0.6
0.5 69.1 - 2.6 0.5
¡. 0.4 65.6 -2.7 0.4
0.3 61.8 - 2.8 0.3
0.2 57.9 - 2.9 0.2
0.1 54.0 - 3.0 0.1
0.0 50.0

h
!~~
~ .~
611
610
Variable X (punllJaci6n en aritmético )
~"""OM-oo-Nlt)CO "<t

N,?~. Ñ:;;~~~~¿~~l~
OM'Oo-.---NNNC")MMMV
58-60
55-57
,
APÉN DICE DOS
_ 52-54
o ,
CÁLC ULO DEL COEFICIENTE DE
549-51
ü , ,
CORR ELAC IÓN
~ 46-48
c: , ,
Q)
c:
:g
43-45
, ,
El coeficie nte de correlación es un Índice que expresa la extensi ón
en que dos
40-42
~ 37-39
, , ", , ,
variables (X y Y) varían conjunt amente; es decir, indica la extensió n en que puntuacio- , , , ."
los conceptos
nes altas de X corresponden a puntuac iones altas de Y, y viceversa. Pero conjunto de
.[34-36
, ,
de "alto" y "bajo" deben quedar expresad os en término s uniform es de un
los diferentes
datos u otro si se quiere que el Índice tenga el mismo significado paray "bajo· son la
>- 31-33
~ 28-30
o
", " , ",, ,
conjuntos de datos. El marco de referenc ia estánda r para expresar 11 alto"

media y la desviac ión estándar del grupo. Si cada puntuac ión X o Y se expresa
en unida-
§ 25-27
, , ,
estándar X y
des de desviac iones estándar, calcula el product o de estas puntuac iones correlación
> 22-24
, ,
Y, Y al promed io de estos product os se le conoce como el coeficiente de
19-21
16-18
, ,
produc to·mom ento de Pearson.
Esto puede expresarse median te la fórmula siguiente:
Figuro R.l.

Paso 3. Marque los datos, anotand o Las marcas ya se han anotado en la


cada puntuac ión como una marca de hoja de tabulaci ón que se muestra en
bastonc ito en la celdilla la figura 1. Las frecuencias se
donde r es el coeficiente de correlación. corresp ondient e a las puntuac iones X muestra n en la figura 2
Zx y Zy son las puntuac iones estánda r de
X y de Y. y Y para ese caso. Cuente el número
N es el número de casos. de marCaS en cada celdilla y escriba la
frecuencia en la parte superior de la
, no pro- celdilla
La anterio r es una definición del coeficiente de correlación; sin embargo
ación explica-
porciona un procedimiento eficaz para calcular el coeficiente. A continu Paso 4. Sume cada column a y anote los Las sumas se muestran en la figura 2.
mano, y otro en
remos dos método s para calcularlo, uno basado en las marcas hechas a de los datos totales en la parte inferior de la hoja Las anotaci ones a lo largo de la parte
el que se usa una calculadora electrón ica. Explica remos cada uno a partir inferior son las de la variable X
la tabla 2.1. de tabulación. Sume a lo largo de
de las puntuac iones de lectura y de aritmética que se muestran en el coefi- cada hilera y anote el resultado a la (aritmética), mientras que del lado
Primero explicaremos el procedi miento para marcar a manO y calcular . derecha. Estos totales anotados en el derecho son las de la variable Y !lectura)
de distribu ción (bidimen sional) de dos variables
ciente a partir de una gráfica margen dan la distribu ción de •
frecuencia simple para la X y para la
Paso 1. Seleccio ne los intervalos de En nuestra gráfica, tanto las Y, respectivamente
clase para ambas variables . puntuac iones de aritmét ica como las
de lectura están agrupad as de tres en Paso 5. Considere los valores anotado s Los valores para t, fy' y f (y')2 se
tres a la derecha de la figura 1 en el paso muestra n en las tres column as justo
4. Forman una distribu ción de alIado de la columna de las
Paso 2. Prepare una hoja de tabulac ión La hoja de tabulación se muestra en la frecuencia simple de las puntuac iones frecuencias en la figura 2. Para este
de dos dimens iones que indique los figura 1. La variable X está de Y. De acuerdo con las indicaci ones ejemplo, "Lfy' ~ - 7 Y "LI (y')2. = 535. (Se
intervalos de clase para la variable X constitu ida por las puntuac iones de del capítulo 2, realice los pasos para puede hacer notar que la variable Y es
en el eje superio r de la gráfica, y para aritméti ca, mientra s que la variable Y calcular la desviac ión estándar. la prueba de lectura y que estos
la variable Y en el eje del lado lo está por las de lectura Determine N, "Lfy' Y 'E..f (t1
2 valores son idénticos a los que se
izquierdo. Se puede usar papel calcular on para esa prueba en el
cuadricu lado o papel especial para capítulo 2)
tabulación, con ciertas ventaja s

' . .,.: .
" . ' .~ ' .
" ',': ,., ". , ., , :'~ .
612 APÉNDICE DOS. CÁLCULO DEL COEFICIENTE 613

Variable X (punluoción en aritméticol punto cero para cada escala. La en la hilera, f= 1, x' = 3 Y '1'= 1, de
vr-..O M 'Oo-N'0CO v"o frecuencia en una celdilla debe tal manera que el producto es
N '0 ro
OM~C>
N';' ~ <;'
NNNC"')
~ ~ 6' ~ ~ ;r
MC")C?"'f"-q""
~ J; ~ (y
v
y (y' l(y']2 Ix'y multiplicarse tanto por el valor de x'
para esa celdilla como por el valor de y
1 x 3 x 1 = 3. Nótese que en la parte
superior de la izquierda y en la
inferior de la derecha de la figura, los
58-60 'All
,. t 8 864 56
productos son negativos; porque ya
~--~~~-r-+~-4~~~~ 7
55- 57 7 49 14 sea x' o y son negativos. También
~~-+~~+-~-+~~~~~-+--r-~~-+--\~.~~ nótese que todos los productos para
52-54 ' ~~ 6 6 36 42 las celdillas entre .las líneas pesadas
e 49-51 ~~_-+__~_~~~_ _r-_I~-;__+--r~r-~I~"~~__~Jt~
~~~~.4-~ 2 5 lO 50 70 son cero
] 46-48 - '~i '~ 2 4 8 32 28

~ 43-45~~~t~~·~~~+--+__+--t.~~~~r.-~_-~~'·~...~~-+.___ 3 3 9 27 12 Paso 8. Sume los valores fx'y' para


todas las celdillas. Esto da 'Lfx'y' que
En el ejemplo, primero se sumaron los
valores a lo largo de cada hilera, y
:g 40-42 • 'di '~ 3 2 6 12 6 es la suma de todos los productos de estas sumas se anotaron en la
~ 37_39r.tdl~--~~4~~r-~3~r-~"~o~,~-+~-1~'-~~-+~~ 7 los valores x' y y columna de la extrema derecha.
7 7-3
:>
.9- 34-36 . I '3 l' , 8 Esta columna se ha sumado para dar
>-
O (+61) 'Lfx'y' = 277 .
~ 31-33 '~ 2~t I~ 2 ~7 7 -1 - 7 7 5
.Q r-~~~~~i~~~
~~~~+---+--tl~~~'~--~~~--+--+~
~ 28-30 _ . lt1t . _. ' __ 5 -2 -lO 20 4 Paso 9. La fórmula para calcular el En el ejemplo, esta solución es:
25-271--+1';-::-
i
JC2:!Ii i'~ - ' ""',
l,.¡¡j
,:!"I!~~~_~-4_t_41;-J~"[cIC; ...,.,..-l--l---!~~.+-'r
coeficiente de correlación es:

22-24 ~, __ ~i ~~ , "7-!-- -t-:t= 4 -3 -12


3 -4 -12
36 12
48 -4

.:-.-
o

~~ ¡ , ,~ ' ¡ ' 1 1 r.fx'y' _


19-21~-ttl!.... ,~'-t-+~C-+-~H= 3 -5 -15 75 35 ('L~') ('L%) ~; - (~~) (~~)
r
N
16- J8 ~ . ~ -1 I IU~ ¡ i...lJ.--L.J 1-1 2 -6 -12 72 O
r= r=
Ix 2 2 2 4 5 4 12 o
{~ ~~-(~r
6 4 2 4 52=N (-681
-7=Ify'
'Lf~')2 - ( ~~'
52 52
x -6 -5 -4 -3 -2 -1 O 2 3 4 5 6 7 8 9 10 535=~f(y')'
277=~fx'y'
Ix' -12 -la -8-12-10 -4
1-56)
12 12 4 5 12 28 8 10
(+92)
+36=Ilx' X ~ ~¡tJ2 - ( 'L~r} ~ 553; - (~~r
I(xl 72 50 32 36 20 4 24 36 16 25 72 196 64 100 748='2.f(x'j'
Figuro R.2. Sustituya los valores apropiados en la 5.33 - (0.692) (- 0.1351
fórmula y resuélvala. (Debe hacerse ..j14.38 - (0.692)2
notar que los dos términos del
Paso 6. Repita el paso 5 para las El valor de r.¡x' es + 36; r.¡ (X' )2 es denominador son sólo las fórmulas
frecuencias de la variable X que se igual a 748 para las desviaciones estándar de X y X .,J1O.29 - {- 0.1351 2
anotó en la parte inferior de la figura de Y, respectivamente)

Paso 7. Multiplique la frecuencia en Estas anotaciones se han encerrado en


5.42
cada celdilla de la tabla de dos un CÍrculo en la figura 2. Considere la
direcciones, por los valores de x' y de hilera que está justamente por encima
y, para esa celdilla. Anote este de las reglas horizontales, en
producto, es decir, ¡x'y', en la esquina dirección hacia la derecha desde las
inferior de la celdilla. Este reglas verticales y verá que tiene una 5.42
=---
procedimiento será más fácil si la frecuencia de 1 en la segunda celdilla. 11.90
columna y la hilera escogidas por su Para esta celdilla, ¡ = 1, x' = 2 Y '1'=1,
origen arbitrario están encerradas en de modo que el producto es
reglas severas, a fin de mostrar el 1 x 2 x 1 = 2. Para la siguiente celdilla = 0.46

_ _'0 .---OiiIi
615
614 APÉNDICES

Con una calculadora electrónica se Al sustituir los valores mostrados en la


hace un cálculo con las puntuaciones fórmula, obtenemos:
crudas (observadas). Entonces, la

~-(~) (~)
fórmula toma la forma:

r=
I 66 840 _ (1 798 )2 APÉNDICE TRES
V 52 52 RECURSOS PARA LAS PRUEBAS
EDUCATIVAS y PSICOLÓGICAS
I 29226 _ ( 1086)2
V 52 52 Muchas agencias publican una o dos pruebas, cuestionarios u otros instrumentos
de medición; sin embargo, la mayoría de las pruebas más ampliamente utilizadas las
768.84 - (34.58) (20.88) maneja un grupo relativamente pequeño de editores. La lista de editores que sigue
incluye a todos los editores de pruebas que se describen en el apéndice cuatro, más uno
.J1285.38 - (34.58)2 o dos que tienen una lista sustancial de títulos.
Se usa la calculadora para calcular las ../562.04 - (20.88)2 American College Testing Program (ACT)
sumas siguientes: P. O. Box 168
768.84 - 722.03 Iowa City, Iowa 52240
Problema ilustrativo .J1285.38 - 1 195.78
American Guidance Service Inc.
LX 1798 .J562.04 - 435.97 720 Washington Avenue, S. E.
2:Y i 086 Minneapolis, Minnesota 55414
LX 2 66840 46.81
2:y2 39980 Bobbs-Merrill Co., Inc.
LXY 29126 .J(89.60) (126.Q7)
4300 East 62nd Sto
46.81 Indianapolis, Indiana 46206
La forma más eficaz para efectuar estas
sumas depende de las capacidades del ../10955.48 College Entrance Examination Board (CEEB)
modelo de la calculadora que se
Box 592
emplee. Cada usuario necesitará 46.81 0.45
= = Princeton, Nueva 1ersey, 08540
aprender las funciones de la 104.67
calculadora que tenga disponible Consulting Psychologists Press, Inc.
Nótese que el coeficiente calculado de 577 College Avenue
las puntuaciones crudas no es Palo Alto, California 94306
idéntico al que se calculó mediante la
agrupación de datos por intervalos de CTB/McGraw-Hill
clase. Generalmente, éste es el caso y Del Monte Research Park
la diferencia suele ser pequeña y sin Monterey, California 93940
ningún significado
Educational Testing Service (ETSj
Rosedale Road
Princeton, Nueva Jersey 08540

Harcourt Brace Jovanovich Inc.


757 Third Avenue
Nueva York, Nueva York 10017

Houghton Mifflin Company


One Beacon Street
Boston, Massachusetts 02107
616 APÉNDICES 617

Institute for Personality and Ability Testing


1602 Coronado Drive
Champaing, IIlinois 61820

The Psychological Corporation


757 Third Avenue
Nueva York, Nueva York 10017

Psychometric Affiliates APÉNDICE CUATRO


1743 Monterey
Chicago, Illinois 60643 SECCIÓN A
Science Research Associates, Inc.
259 East Erie Street Pruebas de habilidad general
Chicago, IlIinois 60611
Análisis de potencial de ap~endizaie
Sheridan Psychological Services Inc.
P. o. Box 6lO1 Harcourt Brace Jovanovich
Orange, California 92667 Tiempo de la prueba: de 50 a 84 minutos, dependiendo del nivel
Primaria 1, grado 1, primaria 2, grados 2 y 3
C. H. Stoelting Co. Elemental, grados 4 a 6
424 NCltth Hornan Avenue Avanzado 1, grados 7 a 9; avanzado 11, grados 10 a 12 .
Chicago, Illinois 60624
La prueba proporciona opciones de completamiento, y al final proporciona dos
Teachers College Press puntuaciones totales -una puntuación de potencial de aprendizaje, basada en las com-
Teachers College, Columbia University paraciones del propio grupo de edad del examinado, y una puntuación compuesta
525 West 120th Street general basada en las comparaciones del grupo del grado del examinado. En los grados
"lueva York, Nueva York 10027 4 a 12, también se reporta una puntuación de diferencia en lectura-matemáticas, lla-
mado diferencial pronóstico compuesto de lectura-matemáticas. También es posi-
Western Psychological Services ble obtener una puntuación pronóstico compuesta de lectura y otra de matemáticas.
Box 775 Las dos puntuaciones totales se reportan como puntuaciones estándar con una media
Beverly Hills, California 90213 de 50 y una desviación estándar de 15. Las confiabilidades de forma alternativa son
bastante adecuadas y se agrupan alrededor del 0.90. Las correlaciones concurrentes

I
con las baterías de aprovechamiento están en un rango desde los 0.50 hasta los 0.70.
Las pruebas están bien normativizadas.

California Short Form Test of Mental Maturity (CTMMI, 1963, revisión-prueba de


forma corta de madurez mental California

Buró de Pruebas de California


Tiempo de la prueba: de 40 a 45 minutos
Jardín de niños: 1.5, grados: 1-3,3-4,6-7, 7-9,9-12 Y 12-16

La CTMM produce tres puntuaciones: Cl verbal, CI no verbal y Cl total. Sólo


una forma de la prueba está disponible en cada nivel. En esta edición se da alguna
información de la naturaleza de las puntuaciones factor; sin embargo, las p.untuacio-
nes factor están basadas en un número relativamente pequeño de reactivos. La con-
fiabilidad de la subprueba no verbal tiende a ser baja. El trabajo artístico en la sección
no verbal es muy deficiente. La porción de lenguaje de la prueba hace gran énfasis en
el vocabulario. Los datos de validez predictiva no se dan en el complemento técnico,
pero el el de lenguaje y el CI total deberían dar correlaciones adecuadas con el apro-
vechamiento académico para los grados más altos.
618 APÉNDICES SECClÚN A 619

Cognitive Abilitie$ Tests (CAT)-pruebas de habilidades cognoscitivas Pruebas de inteligencia qne toman en cuenta a la cultura
Houghton Mifflin Company lnstitute for Personality and Ability Testing
Tiempo de la prueba: primaria de 40 a 50 minutos; nivel múltiple, 45 minutos para Tiempo de la prueba: escala 1,22 minutos; escalas 2 y 3, 15 minutos
cada sección Escala 1, alumnos de 4 a 8 años de edad y retrasados más grandes .
Jardín de niños-primaria: 3 Escala 2, alumnos de 8 a 14 años de edad y adultos promedio .
Nivel múltiple: 3-13 Escala 3, estudiantes de preparatoria y universitarios, así como adultos de inteligencia
superior
Consúltese el capítulo 8. Es una prueba para primaria sin lectura en dos nive-
les. Nivel múltiple a ocho niveles de dificultad. El nivel múltiple da puntuaciones La escala 1 consiste en ocho subpruebas, cuatro de las cuales deben administrarse
separadas para las secciones verbal, cuantitativa y no verbal. Son normativizadas individualmente. Las escalas 2 y 3 contienen cuatro subpruebas que incluyen tareas
conjuntamente con las pruebas lowa de habilidades básicas y las pruebas de pro- percentuales diferentes, completar series progresivas, clasificar, resolver diseños
greso académico. Los resultados se reportan en puntuaciones de edad estándar incompletos y evaluar condiciones. Las puntuaciones crudas de la escala 1 se convier-
(media = lOO, DE = 16) Y como percentiles de grado. El rango de confiabilidades ten en edad mental y en el; en las escalas 2 y 3 se convierten en rangos de percentiles
(coeficiente alfa) es de 0.89 a 0.90 para primaria, de 0.91 a 0.94 para verbal, de 0.87 por edad y en Cl. Hay edici()nes en español para las escalas 2 y 3. .
a 0.91 para cuantitativo y de 0.90 a 0.93 para no verbal. Tres secciones muestran
correlaciones de 0.65 a 0.70.
Prueba de dibujO Goodenough-Harris
Columbia Mental Maturity Scale (CMMS), tercera edición-escala de madurez men-
tal de Columbia The Psychological Corporation
Tiempo de la prueba: sin límite, pero normalmente de lOa 15 minutos
The Psychological Corporation Edad: de 3 a 15 años
Tiempo de la prueba: sin límite, normalmente requiere de .15 a 20 minutos
Edad: de 3 1/2 a 10 años Es una prueba no verbal de habilidad mental, adecuada para utilizirla de in~~era
individual o en grupo. Asimismo, es una revisión hecha en 1963 de la prueba ?ngmal
La CMMS es una prueba de habilidad mental administrada individualmente que Dibuja un hombre. Se pide al sujeto que dibuje la figura de un hombre, la fIgura de
no requiere respuesta verbal y un mínimo de respuesta motora por parte de los exami- una mujer y que haga un dibujo de él mismo. Los usuarios potenciales de la prueba
nados. La escala consiste en 92 reactivos arreglados en ocho niveles que se traslapan, deberían tener una copia del libro de Harris Children's I?rawings as Mea~ure 01
de tal modo que el nivel que se administra es determinado por la edad cronológica del lntellectual Maturity (ULos dibujos de los niños como medIda de la madurez mtelec-
examinado. Cada reactivo se imprime en una tarjeta de 15 cm x 48 cm y requiere que tual"), además del equipo examinador. La prueba se estandariz~ con 2975 niños
el examinado seleccione de una serie de dibujos el que no pertenece al grupo. Las pun, representativos de la distribución ocupacional. de los E~tados Umdos, en 1.950. Las
tuaciones crudas se pueden convertir en puntuaciones de desviación de edad, en ran- puntuaciones crudas se convierten en punt1~aClOnes estandar, con una ~edla de 100
gos de percentiles, en estanueve y en Índices de madurez. Los datos de confiabilidad y Y una desviación estándar de 15. Se proporCIOna una tabla para convertl! la~ puntua-
de validez de la forma revisada (1972) son limitados. Los niños pequeños (de cuatro . ciones estándar en percentiles. La mayoría de los datos acerca de la co.n~lablhdad y la

I
·años o menos), sordos y mentalmente impedidos tienden a tener dificultades para validez reportados para la versión de 1963 se aplican a la prueba ongmal de 19~6.
entender las instrucciones orales para contestar los reactivos. La guía para administra- Dentro de grupos de edad homogéneos, las correlaciones reportadas entre las versIO-
ción e interpretación incluye instrucciones en esp.añol. nes de 1926 y la revisión de 1963 están en un rango de 0.91 a 0.98. Para .la escala de
1926 las confiabilidades de administrar la prueba por segunda vez estUVIeron en un
rang~ de 0.60 a 0.70; las confiabilidades entre las puntuaciones de los sujeto~ están
Cooperative School and College Ability Tests (SCAT)-pruebas de habilidad para la en el orden de 0.80 a 0 .96, y las correlaciones con la prueba de Stanford-Bmet se
universidad y para escuelas cooperativas hallan en un rango de 0.36 a 0.65. No se han presentado correlaciones con el aprove-
chamiento académico para ninguna de las dos escalas, de 1926 y de 1963_
Cooperative Test Division
Tiempo de la prueba: de 60 a 75 minutos
Educational Testing Service Pruebas de habilidad mental Henmon-Nelson, edición revisada
Grados: 4-6,6-8,8-10, 10-12 y 12-14
Houghton Mifflin Company
La SCAT produce tres puntuaciones: a) verbal, bl cuantitativa y el totat Los Tiempo de la prueba: de 30 a 45 minutos
manuales y los materiales interpretativos que acompañan las pruebas son excelentes. Grados: 3-6, 6-9,9-12 y 13-14
Los coeficientes de confiabilidad se reportan sólo para una forma. La puntuación total
se correlaciona bien con medidas de éxito escolar, pero hay poca evidencia para una Las pruebas diseñadas para las escuelas elementales y ~ecund~rias.pr~ducen una
predicción diferencial a partir de las puntuaciones verbales y cuantitativas. Se propor- sola puntuación total, mientras.qu~ la prueba que en el n~~el umve1S1tano. prod~ce
cionan percentiles y puntuaciones estándar normativizadas_ tres puntuaciones: verbal, cuantItativa y total. La puntuacIOn total correlaciona bien

", .
.~'.' . '.: "" ".1':' ,- ," ' ," .,.
620 APÉNDICES
SECCIÓN A 621
con otras pruebas de inteligencia de grupo, con los grados asignados por los maestro Pruebas de habilidad mental Otis-Lennon
~ con los resultados ~e las pruebas de aprovechamiento. Los coeficientes de confiabi~
lldad calculados medIante ~l, uso de formas de prueba paralelas están en un rango de Harcoun Brace Jovanovich
0.87 a 0.94 para la puntuacIOn t?tal. ~os datos normativos para los niveles de escuela Tiempo de la prueba: de 30 a SO minutos
ele~en~al y de escuela secundana, aSI como para los estudiantes del primer año uni- Jardín de niños, 1-1.5, 1.6-3.9, 4.0-6.9, 7.0-9.9 y 10.0-12.9
ve~sItar~o son ~uenos, pero faltan las normas para otros niveles en ]a edición para la
universIdad. Solo se presentan normas de percentiles para la edición universitaria. Esta prueba es una revisión de las pruebas de habilidad mental de calificación
rápida, y se parece mucho a ell~s. :Tiene un formato de ómnib,!s en espiral y. pr?duce
K.uhlmann-Anderson lntelligence Tests (K-A), séptima edición-pruebas deinteligen_ un el total. Se da un manual tecmco muy completo que descnbe los procedlrruentos
cla Kuhlmann-Anderson para construir la prueba y aporta datos completos acerc~ de la validez, la con fiabilidad
y la estandarización. La confiabilidad de forma alt~matIva con una o dos semanas de
intervalo está en un rango del 0.81 para la edad de CInCO hasta el 0.94 para la edad de 14
Personnel Press, lnc. años con una mediana de 0.92. Los coeficientes de confiabilidad de la prueba dividida
Tiempo de la prueba: de 25 a 60 minutos en mitades y el K -R # 21 son ligeramente mayor.es. Se rep,ortan los errores de J?edición
Jardín de niños, 1,2,3-4,4-5,5-7, 7-9 Y 9-12 estándar para los diferentes niveles de puntuaCIOnes, aSl como para la totalIdad. Los
datos de validez concurrente y predictiva se reportan y se comparan favorablemente
La K-A consiste en oc~? subprueb.as en todos los niveles. Los niveles más bajos con aquellos que se reportan para otros instrumentos. Se proporcionan desviaciones
produce? una sola puntuacI.on ~otal, mIentras que los niveles más altos producen tres de el, normas de percentiles y edades mentales.
pu~tuacIOnes: .ve~bal, cuantitativa y total. Hay normas de percentiles y de puntuación
estandar ,desvIa~lOnes d.e el) para cada nivel. Los coeficientes de confiabilidad gene~
ralme~Ite .son satIsfactonos. La puntuación de diferencia entre las subpruebas verbal y Peabody Picture VocabularyTest {PPVT)-prueba Peabody de vocabulario y figuras
cuantItatIva no ~arece tener una confiabil~dad ]0 ~uficientemente alta para emplearla.
Lo~ datos d~ v~bdez concurrente son satlsfactonos, pero hay pocos coeficientes de American GuidanceService, Inc.
~ah.dez predICtIva reponados en el manual técnico. Las subpruebas tienen tiempos Tiempo de la prueba: de 15 a 20 minutos
Jlmltes l~Uy cortos y, ponanto! exigen a los examinados que hagan un trabajo rápido y Edad: 2 1/2 años hasta el adulto
al examInador que cuente el tIempo de manera precisa.
La PPVT es una prueba de administración individual para el vocabulario, que con-
siste en una serie graduada de 1SO láminas en las que cada una contiene cuatro dibujos.
Escalas McCarthy de habilidades de los niños El examinador da un estímulo oral en una palabra, y el examinado señala el dibujo
sobre la lámina que ilustra mejor el significado de esa palabra estímulo. La PPVT se usa
The Psychological eorporation frecuentemente como una forma abreviada de prueba de habilidad general. Las nor-
Tiempo de la prueba: variable mas están basadas en muestras de individuos que se hallan en un rango de edad de los
Edad: de 2 1/2 años hasta 8 1/2 dos a los 18 años. Las puntuaciones crudas se convierten en tres tipos de puntuaciones
derivadas: edades mentales, puntuaciones estándar de el y percentiles, las confiabi-
lidades de forma alternativa están en un rango desde el 0.67 hasta el 0.84, con una
. ~sta escala const~, de 18 prue~as agrup.ada.s en seis escalas que se traslapan, a mediana de 0 .77. La correlación mediana dela PPVTcon laStanford-Binet esde 0.72
s~ber. verbal, percepclOn-desempeno, CuantItativa, cognoscitiva general, de memo- y con las escalas Wechsleres de 0.61 . Las correlaciones reportadas entre lasPPVTy el
na y mo.tora. La ~scala produ~e puntuaciones en cada escala que se reportan como aprovechamiento escolar tienden a caer cerca de 0 .50.
puntuacIOne.s, estandar normalIzadas, con una media de 50 y una desviación estándar
de 10. TambIen pr~duceuna punt?ación de cognición general basada en 15 de las 18
pruebas de. la ?atena. Las l?~ntuaclOnes de la escala cognoscitiva general se reportan Matrices progresivas de Raven
como u~ IndIce cognOSCItIvo general, una puntuación estándar normalizada con
u.~a medIa ~e 100 y una de~viación estándar de 16. La muestra para ]a estandariza- The Psychological Corporation
c~~n fue cUlda~.?samente dIseñada C?? el fin de ~ncluir en ella un número igual de Tiempo de la prueba: de 30 a 60 minutos
nmo.s que de m~as y una representaclOn proporCIOna] de raza, de región geográfica, Edad: de 5 años en adelante
de n~vel Ocup~cIOna] ~~I padre y de residencia urbana-rural. La confiabilidad de la
medl~na de mItades dIVIdIdas para el índice cognoscitivo general está cerca del 0.93, Esta prueba se puede conseguir en blanco y negro o a colores. Representa ~n
c~>n niveles de edad que.se~~Ilan en un rango desde el 0.79 hasta el 0.88 para las otras intento por apreciar el factor de habilidad general, la g de Spearman. Las tareas conSIS-
~mco escalas. Las conf13bihdades cuando se vuelve a administrar la prueba con un ten de diseños con partes faltan tes. De las opciones dadas, el examinado escoge el dise-
mtervalo de un mes para 125 niños clasificados en tres grupos de edades fueron de ño que mejor se ajusta. No obstante que se dice que la prueba tie~e alg? que la ~ace
cerca del 0 .90 para el índice cognoscitivo general y estuvieron en un rango desde el "justa para todas las culturas", hay poca evidencia que apoye esta afI~aclon. No tIene
0.69 hasta el 0.89 l;'ara. las otras escalas. Los datos de validez que se tienen hasta límite de tiempo. La evidencia de su confiabilidad y validez es inconsIst.en~e: La prueba
el momento son mas bIen escasos_
tiende a ser extremadamente difícil para los niños pequeños y las conhabIlidades para
622 APtNDICES
SECCIÓN A 623
los grupos de edad escasa tienden a ser bajas. El manual para la prueba es inadecuado. Pruebas de habilidad general: series interamericanas
Los datos normativos son dudosos, cuando mucho, mientras que la mayoría de las
normas están basadas en muestras británicas. Guidance Testing Associates
Tiempo de la prueba: de 40 a 60 minutos, dependiendo del nivel
Preescolar; jardín de niños, grado 1.5;
Short Form Test of Academic Aptitude (SFTAA)- prueba de forma corta de aptitud Grados: 2-3, 4-6, 7 a 9 y 10-13.5
académica
. p objetivo ~el autor era producir una serie de pruebas que fueran paralelas en
CTB/McGraw-Hill mgles y en espanol, y que produzcan resultados comparables cuando la edición en
Tiempo de la prueba: de 31 a 38 minutos español se administre a hispanohablantes y la edición en inglés se administre a los
Grados: 1.5-12 a.nglo~~blantes. Se usan reactivos idénticos en las dos versiones. Los reactivos son del
tIpo tIplCO que se encuentra en las pruebas de habilidad general. Se presentan las nor-
La SFTAA se diseñó de tal manera que pudiera administrarse en un solo periodo mas sólo para las muestras obtenidas por entero de Puerto Rico. Las confiabilidades de
de clases. Es una revisión hecha en 1970 de la prueba de madurez mental de Califor- formas alternas y para la versión inglesa tienen una puntuación total que varía en un
nia, y produce tres puntuaciones: lenguaje, lenguaje no verbal y total. Consiste en cua- ~ango d;sde 0.72 hasta 0.90 con un valor de mediana de o. 80, y para la versión en espa-
tro subpruebas: vocabulario, analogías, secuencias y memoria. Hay cinco niveles de la nol esta~. en un rango desde 0.59 hasta 0.91, con un valor de mediana de 0.88. La
prueba que se expanden del grado 1.5 al 12. La SFTAA ha sido estandarizada concu- correlaclOn concurrente con el aprovechamiento queda reportada. Las dos ediciones
rrentemente con las pruebas de aprovechamiento de California, edición 1970, y con de acuerdo con sus J:evisores, no son equivalentes en la versión española, y no se consi~
las pruebas integradas de habilidades básicas. Las puntuaciones se presentan en la deran igualmente aplicables a todas las minorías de habla española en la parte con-
forma de puntuaciones estándar que se llaman puntuaciones de escala de referencia, tinental de Estados Unidos.
con una media de 100 y una desviación estándar de 16.
Escala Wechsler de inteligencia para adultos
SRA Tests of General Ability (TOGAJ-pruebas de habilidad general SRA Edad: 16 años y más

Science Research Associates Escala Wechsler de inteligencia para niños-revisada


Tiempo de la prueba: de 35 a 45 minutos
Jardín de niños: 2, 2-4, 4-6,6-9 y 9-12 Edad: 6 1/2 a 16 1/2 años

Las TOGA intentan reducir el estrés de las habilidades que se aprenden en la Escala Wechsler de inteligencia para primarias y preescolares
escuela, por medio de la presentación de todos los reactivos en todos los niveles, en
forma pictórica. Se supone que una su bprueba en cada nivel aprecia el razonamiento y
que la otra aprecia la información. Las muestras normativas en todos los niveles son
.. pequeñas, pero no representativas geográficamente. La subprueba de razonamiento
parecería ser IIjusta con la cultura", pero no hay evidencia que apoye esta afirmación.
Los datos de validez concurrente presentados indican que las TOGA aprecian casi las
II Edad: 4 a 6 1/2 años

The Psychological Corporation


Tiempo de la prueba: variable

mismas funciones que las otras pruebas de inteligencia más comúnmente empleadas y Consúltese el capítulo 9 para un análisis de estas pruebas.
que ponen a los estudiantes en un rango aproximadamente de la misma manera. Los
coeficientes de confiabilidad totales (división de la prueba en mitades) están en un ran-
go de 0.80/0.90, con una mediana de 0.87. Las instrucciones para administrar la prue-
ba son claras, pero permiten al administrador de la prueba un margen considerable
para alterar la toma del tiempo, particularmente en la prueba de información.

Escala de inteligencia Stanford·Binet, forma L-M

Houghton Mifflin Co.


Tiempo de la prueba: variable
Edad: desde 2 1/2 años hasta la adultez

Para un análisis de esta prueba, consúltese el capítulo 9.

." .
. ': : ,' , , "
',:. ,. ~ ., J.:-
624 SECCIÓN B 625

Hasta que no haya disponibles más datos de validez resultaría más aconsejable ser
extremadamente cauto para interpretar el significado de las puntuaciones.

General Aptitude Test Battery (GATB)-bateria de pruebas de aptitud general

U. S. Employment Service
SECCIÓN B Tiempo de la prueba: de 120 a 150 minutos para pruebas de grupo
Grados: 12 y superior, así como para adultos
Baterías de pruebas de aptitud Para un análisis de esta batería, consúltese el capítulo 10. Esta batería s~ halla dis-
ponible para utilizarla sólo en las State Employrnent Offices.
Batería de pruebas de aptitud diferencial

The Psychological Corporation Nonreading Aptitude Test Battery (NATB), edición 1969-batería de pruebas de apti-
Tiempo de la prueba: de 300 a 330 minutos tud sin lectura .
Grados: de 8 a 12
United Staü:s Employrnent Service
Para un análisis de estas pruebas consúltese el capítulo 10. Ésta es una batería de Tiempo de la prueba: 190 minutos
guía práctica para emplearla en' las escuelas secundarias. Tiene un manual extremada- Estudiantes con educación limitada en los grados 9 a 12 y adultos
mente completo y bien organizado. Los datos de validación, muy extensos, se presentan
comparados con los criterios educativos, pero con poca comparación con los criterios Esta batería es una adaptación de la CATB diseñada para los estudiantes de escue-
vocacionales. Lo que se dice de la validez es modesto y realista. la secundaria y para los adultos con habilidades limitadas para la lectura.

Cuestionario de aptitudes del empleado SRA Primary Mental Abilities (PMA), revisada-habilidades mentales primarias SRA

Psychological Services, Inc. Science Research Associates


Tiempo de la prueba: 55 minutos Tiempo de la prueba: de 65 a 75 minutos (grados 2 a 4), de 50 a 107 minutos (grados 4
Empleados adultos, pero se puede tomar a partir del noveno grado y en grados más a 6), de 35 a 75 minutos (grados 6 a 9 y 9 a 12)
avanzados. Jardín de niños-l, grados 2-4, 4-6,6-9 y 9-12

Consiste en una serie de 10 pruebas breves (nueve de cinco minutos y una de 10 No obstante que este instrumento, que produce cuatro subpuntuaciones y una
minutos) diseñadas para usarlas en la selección de empleados. Las pruebas se hicieron puntuación total (excepto en la forma para los grados 4 a 6, en la que rinde cinco
cortas para ajustarse a la realidad de la evaluación industrial. Las normas ocupaciona- subpuntuaciones), se promueve en términos de la información diferencial provista
les se dan para 45 grupos. El cuestionario contiene datos de validez ocupacionales bas- por las puntuaciones parciales, la evidencia de la validez diferencial es escasa y la
tante extensos. Es un buen manual técnico. mayoría de los datos son para la puntuación total. Sólo hay una forma disponible, y
aplicar por segunda vez esta prueba da una confiabilidad de la puntuación total,
que está entre los 0.80 o por debajo de los 0.90. Los datos de las valideces de las sub-
Flanagan Aptitude Classification Tests (FACT)-pruebas de clasificación de aptitud, pruebas, así como de las confiabilidades y de las normas, son escasos.
de Flanagan

Science Research Associates


Tiempo de la prueba: de 210 a 328 minutos
Grados: del 12 al 16 y superiores

Esta batería consta de 19 pruebas y está orientada esencialmente hacia la guía


vocacional, más que hacia la guía educativa. Cada prueba está en un protocolo sepa-
rado y tiene una hoja de respuestas que se.autocalifica. La construcción de los reacti-
vos de prueba parece ser muy buena. Los coeficientes de con fiabilidad para las pruebas
por separado tienden a ser bajos, pero las puntuaciones compuestas tienen una confia-
bilidad adecuada. La más grande desventaja de esta batería es la falta de datos de vali-
dez que apoyen muchas de las pretensiones del manual y de los materiales adjuntos.

II
>,
~!

flji
il
626
SECCiÓN e 627
cirnit;nto de palabras, 22 pasajes de lectura y ocho pruebas fonéticas complementarias.
Las hstas_ graduadas de reconocimiento de palabras producen un nivel tentativo de
desempeno, que se usa para determinar el nivel de ejecución inicial del examinado en
los pasa!es de I~ra. I?ichos pasajes se usa~ para establecer tres niveles de lectura para
e~ exammado: ~struc~l~:malllectura o~al), mdependiente (lectura en silencio) y poten-
cial J~ompren~JOn audItiva). Los matenales completos incluyen un libro con encuader-
SECCIÓN C naClOn en eSl?lfal que puede emplear el examinado, una forma de registro desechable
para el exammador y un manual para el examinador.
Pruebas de lectura
Prueba Doren de diagnóstico para la lectura-edición 1973
Prueba de lectura Davis
American Guidance Service, Ine.
The Psychological Corporation Tiempo de la prueba: sin límites, de una a tres horas
Tiempo de la prueba: de 45 a 55 minutos Primaria y grados intermedios
Grados: 8-11 y 11-12
La prueba está limitada a las habilidades para reconocer palabras en 12 áreas: reco-
Esta prueba produce dos puntuaciones:, niv~l de comp~ensión ~ velocidad de la nocimiento de letras, sonidos iniciales, recono~imiento de palabras totales, palabras
comprensión. Los reactivos .de la prueba estan bIen. co~~trUldos y ffilden los ~spectos dentro de palabras, consonantes del habla, sorudos terminales combinación ritmo
más sutiles de la comprensión de la lectura. Las conflabihdades de la forma equIvalente vocales, conjeturas discriminativas, deletreo y palabras visual~s. "
están en los 0.70 superiotes o en los 0.80 inferiores. Las correlaciones entre las puntua-
ciones de las pruebas de lectura y los grados en inglés dan un promedio de cerca de 0.50.
Las normas de puntuaciones estándar y las normas de percentiles están presentes. Prueba de habilidades de disponibilidad Gates-MacGinitie
Teachers College Press
Pruebas diagnósticas de lectura: sección de encuesta Tiempo de la prueba: sin límite, aproximadamente dos horas
Jardín de niños-l
Science Research Associates
Tiempo de la prueba: de 60 a 70 minutos y de 175 a 200 minutos Las pruebas constan de siete partes: comprensión auditiva, discriminación auditi-
Grados: 4-8 y 7-13 va, discriminación visual, seguir instrucciones, reconocimiento de letras, coordina-
ción visomotora y combinaciones auditivas. Una octava prueba, reconocimiento de la
El nivel para los grados cuarto a octavo produce cinco puntuaciones: r~conoci­ palabra, se incluye como prueba opcional. Las normas están basadas en dos estandari-
miento de palabras, comprensión, vocabulario, lectura de cuentos y total. El mvel para zaciones separadas. y se dan al final del curso del jardín de niños y al principio del pri-
los grados siete a decimotercero también produce cinco puntuaciones: ritmó de lectu- mer grado. Se dan puntuaciones estanueve para cada subprueba. Las ponderaciones
. ra comprensión de historietas, vocabulario, comprensión y total. Los manuales que se opcionales para las siete subpruebas se usan para predecir el éxito en la lectura del pri-
adjuntan a las pruebas son muy difíciles de entender y contienen muy poca informa- mer grado. La puntuación ponderada total se puede obtener fácilmente.
ción acerca de los procedimientos de confiabilidad y normativización. Los manuales
para la administración son algo vagos acerca de los límites de tiempos. Los ?atos n?r-
mativos son suministrados en hojas mimeografiadas por separado y no contIenen nIn- Pruebas de lectura Gates-MacGinitie
guna descripción de la naturaleza del grupo norm.atiy? No obstru;tt.e que las pruebas
contienen varios enfoques interesantes de la apreclaclon de las habilldad~ para la lec- Teachers ColJege Press
tura la falta de datos de confiabilidad, la inadecuación de los datos normativos y la Tiempo de la prueba: de 40 a 50 minutos
calidad tan deficiente de reproducción son argumentos en contra del uso amplio de Primario A-segunda mitad del grado 1; primario B-grado 2; primario C-grado 3; pri-
estas pruebas. mario CS-segunda mitad del grado 2 y grado 3

Los primarios A, B Y C consisten cada uno en dos subpruebas: vocabulario y


Escalas diagnósticas de la lectura-edición revisada 1972 comprensión. El primario CS es una subprueba separada de velocidad y exactitud.
Los reactivos de vocabulario de los primarios A y B Y los primeros reactivos del pri-
CTB/McGraw-Hill mero C consisten en un dibujo, seguido por una opción de cuatro palabras, una de las
Tiempo de la prueba: sin limite . " . cuales es la ilustrada por el dibujo. Los últimos reactivos del primario C consisten en
Grados: 1-8 y estudiantes de escuela preparatona con defICIenCIas en la lectura una palabra estímulo, seguida de una opción de cuatro palabras, una de las cuales sig-
nifica lo mismo que la palabra estímulo. Los reactivos de la prueba de comprensión
Las escalas diagnósticas de la lectura consisten en una serie de pruebas que se de los primarios A y B consisten en una oración o un párrafo corto, acompañado por
administran individualmente, que son graduadas y que contienen tres listas.de recono-

.. ...... : . .
',\.'. , ,. . ~'. > ," .:" ó,': ",_.. :: . .' ':
SECCIÓN C 629
628 APÉNDICES
Nivel 1, grados 6-9¡ nivel 2, grados 9-14¡ nivel 3, para estudiantes avanzados de la
un panel de cuatro dibujos, de los que el examinado tiene que seleccionar el que escuela secundaria y para estudiantes universitarios
mejor ilustre el significado de la oración o el párrafo corto. Los reactivos del primero
C consisten en un párrafo corto, seguido de dos preguntas con una opción de cuatro En todos los niveles de esta prueba se aprecian el vocabulario, la comprensión de
respuestas para cada pregunta. La prueba de velocidad y exactitud consiste en un la lectura y la velocidad para comprender la lectura. Los niveles 1 y 2 también apre-
párrafo corto que termina en una pregunta o en un enunciado incompleto, ~eguido cian el uso de los materiales de referencia, así como el hojeo y rastreo de información
de una opción de cuatro palabras, de las que el examinado tiene que seleccIOnar la específica. Dos formas de las pruebas se hallan disponibles para cada nivel. Las pun-
palabra que mejor complete el enunciado o que conteste la pregunta. La prueba pro- tuaciones crudas se pueden convertir a puntuaciones estándar, a rangos de percenti-
duce puntuaciones estándar, de percentiles y de grados. Hay normas disponibles les y estanueve. También se da un índice de eficiencia en la lectura, en cuanto a la
para las pruebas anuales de principiantes, medios y finales. Hay una edición revisa- rapidez y precisión.
da para 197{i.
Metropolitan Readiness Test (MRTJ, ~dición 1976-prueba Metropolitana de dispo-
Pruebas de lectura Gates-MacGinitie nibilidad para la lectura
Teachers College Press The Psychological Corporation
Tiempo de la prueba: 45 minutos Tiempo de la prueba: de 80a 90 minutos
Encuesta D, grados 4, 5 Y6; encuesta E, grados 7,8 Y 9¡ encuesta F, grados lO, 11 Y 12
Jardín de niños- grado 1
Cada batería consiste en tres subpruebas: vocabulario, comprensión y velocidad y
exactitud. Los reactivos de vocabulario constan de una prueba de palabras seguida por La edición de 1976 de la MRT tiene dos niveles: el nivel 1 se usa con los grupos
una elección de cinco palabras, una de las cuales es similar en significado a la palabra que no hayan desarrollado lo suficiente la habilidad, y el nivel II se usa con los gru~
prueba. Los reactivos de comprensión consisten en pasajes en los que se dejan espacios pos que hagan progresos normales en los objetivos de la habilidad. Esta edición incluye
vacíos. Para cada espacio en blanco se da una opción de cinco posibilidades para com- un protocolo de práctica como una parte integral de a:c.bos r:.iveles de la prueba. El
pletar, de las cuales el examinado debe escoger la que mejor se conforma al significado nivel 1 consiste en seis subpruebas: memoria auditiva, ritmo, reconocimiento de letras,
del pasaje. Los.reactivos de la prueba de velocidad y precisión consisten en un párrafo apareo visual, lenguaje y audición escolar y lenguaje cuantitativo, y una prueba opcio-
corto que tel'mina en una pregunta o en un enunciado incompleto, seguido de una nal, copiado. La prueba rinde 10 puntuaciones, una puntuación de cada subprueba y
opción de cuatro palabras, de las cuales el examinado selecciona la que conteste mejor una puntuación para el área visual (pruebas 3 y 4), para el área del lenguaje (pruebas 5
la pregunta o que complete mejor el enunciado. Se dan normas para las pruebas de y 6), Y un compuesto de habilidades de prelectura (pruebas 1-6). Las normas se dan
principiantes, medios y finalistas. Las puntuaciones crudas se pueden convertir en para el mes de noviembre y para la mitad del año para el jardín de niños, tres niveles
puntuaciones estándar, percentiles, estanueve o en puntuaciones de grado. Una edi- de desempeño en cada subprueba¡ estanueve para puntuaciones de área dedos habili-
ción reservada está disponible desde 1976. dades (visual y lenguaje); estanueve y rangos de percentiles para el compuesto de
habilidades previas a la prelectura y cinco niveles de calidad para el copiado. Hay dis-
ponibles normas especiales para los sistemas escolares de las grandes ciudades.
Prueba Gates-McKillop de diagnóstico para la lectura El nivel II consiste en seis subpruebas de prelectura: consonantes iniciales, corres-
Teachers CoIlege Press pondencia sonido-letra, apareo visual, encontrar modelos o patrones, lenguaje escolar
Tiempo de la prueba: sin límite, cerca de una hora y comprensión auditiva, así como dos pruebas opcionales cuantitativas: conceptos
Todos los grados cuantitativos y operaciones cuantitativas, y una prueba opcional, copiado. El nivel II
produce ocho puntuaciones de subprueba: puntuación de área auditiva (pruebas 1 y 2);
Es una batería de 17 pruebas, diseñada para ayudar al especialista en lectura a ais- puntuación de área visual (pruebas 3 y 4); puntuación de área de lenguaje (pruebas 5 y
lar y analizar las áreas específicas de la dificultad para leer. Las pruebas se administran 61; puntuación de área cuantitativa (pruebas 7 y 8); compuesto de habilidades de pre-
individualmente y el examinado da sus respuestas en forma oral. Se prueban las lectura (pruebas de la l ala 6), y compuesto de batería (pruebas 1 a 8). Las normas están
siguientes habilidades y técnicas implicadas en el proceso de la lectura: lectura oral disponibles para el final del curso del jardin de niños (abril) y para el principio del grado
(que da un análisis de 10 tipos de error·diferentes), percepción de palabras, percepción 1 (septiembre y principios de octubre). A su vez las tablas proveen estanueve para cada
de frases, partes de palabras combinadas, dar el sonido de las letras, nombrar las letras, área de habilidad; estanueve y percentiles para el compuesto de habilidades de prelec-
reconocimiento de las formas visuales de sonidos del tipo de palabras sin sentido, dele- tura (pruebas de la 1 a la 6) y cinco niveles de calidad para el copiado. Las normas
treo, vocabulario oral, silabeo y discriminación auditiva. No se tienen que administrar nacionales para el compuesto de bateria (pruebas de la 1 a la 8) y las normas especiales
todas las pruebas a todos los examinados. Hay dos formas de pruebas disponibles, las para los sistemas escolares de las grandes ciudades están disponibles si se solicitan.
puntuaciones crudas pueden convertirse en puntuaciones de grado, de edad o califica-
ciones de alto, medio y bajo.
Prueba de lectura Ne1son-formas 3 y 4
Pruebas Iowa de lectura en silencio-edición 1973 Houghton Mifflin Co.
Tiempo de la prueba: 40 minutos
Hartcourt Brace Jovanovich Grados: 3-5, 5-7 y 7-9
Tiempo de la prueba: niveles 1 y 2, 1 hora 20 minutos; nivel 3, 56 minutos
630 AP~NDICES SECCIÓN e 631

Ésta es una nueva forma de la prueba de lectura Nelson que está disponible des- Pruebas de dominio en la lectura, de Woodcock
de enero de 1977. Cada nivel consiste en una prueb~ de vocabulario de nueve minu-
tos y una prueba de comprensión de la lectura de 25 minutos. Una parte opcional de American Guidance Service
25 minutos, para los grados tercero a quinto, contendría subpruebas de correspon- Tiempo de la prueba: de 20 a 30 minutos
dencia sonido-símbolo de las palabras, raíces de palabras y silabeo. También tendrá Desde jardín de niños hasta el grado 12
una prueba de ritmo de lectura breve, opcional para los grados quinto a séptimo y
séptimo a noveno. Estas pruebas constituyen una batería de cinco pruebas de lectura que se adminis-
tran individualmente: identificación de letras, identificación de palabras, ataque de
palabras, comprensión de palabras y comprensión de pasaje. Están disponibles dos for-
Prueba de la lectura NelsoIi-Denny-formas C y D mas de la batería de pruebas. Se dan las interpretaciones tanto normativas como de
referencia al criterio. Las puntuaciones normativas inCluyen las puntuaciones de gra-
Houghton Mifflin Co. do, puntuaciones de edad, rangos de percentiles y puntuaciones estándar. La escala de
Tiempo de la prueba: 30 minutos puntuaciones con referencia al criterio intenta indicar el éxito probable que tendrá el
Grados: 9-12¡ universidad y adultos examinado con las tareas de lectura en diferentes niveles de dificultad. Sólo se reportan
confiabilidades de división en mitades para los grados primero, cuarto y décimo. Éstas
. La revisión de 1973, aligual que las ediciones previas, tiene dos partes: vocabula- tienden a estar en las 0.90 superiores para cada prueba y para la puntuación total. Fal-
rio y comprensión de la lectura. La segunda parte contiene un pasaje especial que se tan los datos de validez.
usa para medir el ritmo de la lectura. Están disponibles normas equivalentes de grado y
de percentiles, basadas en los limites de tiempo regulares, así como las normas especia-
les para adultos y la administración en tiempo reducido.

Perfiles de lectura primarios


Houghtcn Mifflin Co.
TIempo de la prueba: de 70 a 85 minutos
Grados: 1.5-2.5 y 2.5-3.5

La batería consiste en cinco pruebas: aptitud para la lectura, asociación auditiva,


reconocimiento de palabras, ataque de palabras y comprensión de la lectura. La prime-
ra prueba se presenta como una prueba de audición y se recomienda administrarla para
indicar el nivel de aprovechamiento de lectura que sería razonable esperar de cada
estudiante. El coeficiente de confiabilidad de división en mitades para esta prueba es de
0.77, pero para las otras pruebas el coeficiente de confiabilidad (división en mitades!
está en un rango de 0.90 a 0.96. La primera prueba tiene correlaciones con las otras
pruebas de la batería de 0.45 a 0.56 y con la edad mental de las pruebas de inteligencia
Stanford-Binet de 0.53. No obstante que el valor de la primera prueba nose ha estable-
cido, las tres pruebas de habilidades para la lectura parecen ser apreciaciones adecuadas
de la lectura en este nivel.

Prueba Stanford de diagnóstico para la lectura

Harcourt Brace Jovanovich


Tiempo de la prueba: de 160 a 180 minutos y de 110 a 130 minutos
Grados: 2.5-4.5 y 4.5-8.5

Esta batería consiste en pruebas de vocabulario, de comprensión de la lectura y de


reconocimiento de palabras. Las correlaciones entre las subpruebas varían en un rango
de 0.49 a 0.81 con una correlación promedio de cerca de 0.60. El promedio de confía-
J

bilidades de la partición en mitades está cerca del 0.94. No se proveen errores estándar
de medición por niveles de puntuaciones. Los datos acerca de la validez son escasos.
Esta prueba puede ser útil al maestro del salón de clases para saber cuáles son las difi-
cultades comunes en la lectura.

:¡..
. ... .. .
632 SECCIÓN D 633

Están disponibles dos formas de la prueba: la A y la B. La batería produce puntua-


ciones para lectura, lenguaje y matemáticas, en todos los niveles.

Comprehensive Tests of Basic Skills (CTBS), formas S y T -pruebas integradas de


habilidades básicas
SECCIÓN D eTB/McGraw-Hill
Tiempo de la prueba: de 2 horas 24 minutos a 4 horas 28 minutos
Baterías de aprovechamiento Nivel A, jardín de niños-l.3¡ nivel B, jardín de niños 6 meses-l.9¡ nivel e, 1.6-2.9¡
nivel 1, 2.5-4.9¡ nivel 2, 4.5-6.9¡ nivel 3, 6.5-8.9; nivel 4, 8.5-12.9
Adult Basic Learning Examination (ABLE)-examen de aprendizaje básico para adultos
La forma S de la CTBS contiene siete niveles, A-C, 1-4, y grados salteados K-12.
La forma alternativa T contiene cuatro niveles, 1-4, y grados salteados 2.5-12. El ni-
The Psychological eorporation
Tiempo de la prueba: niveles I y II, sin límites¡ nivel m, 3 horas, 25 minutos vel A se considera como un instrumento de instrucción previa de 11 disposición para la
Adultos . lectura". La puntuación total de prelectura para el nivel A se deriva de siete pruebas:
formas de las letras, nombres de las letras, escuchar para información, sonido de las
El ABLE es una prueba de grupo diseñada para medir el aprovechamiento de los letras, discriminación visual, lenguaje y apareamiento de sonidos. También incluye
adultos en las habilidades básicas, que usa un material tomado de la vida adulta. La una puntuación de matemáticas. El nivel B ha sido diseñado para estudiantes que ya
prueba contiene medidas de vocabulario, comprensión de la lectura, ortografía, han recibido un año de instrucción, y produce cuatro puntuaciones: una de lectura.
cálculo aritmético y habilidades para resolver problemas. Están disponibles tres nive- total, una de lenguaje total, una de matemáticas total y una de batería total. Los nive-
les de prueba en niveles de dificultaddiferemes, con fonnas alternativas para cada les e 1,2,3, Y 4 constan de 10 subpruebas separadas· que rinden puntuaciones de lec-
nivel. Una prueba de discriminación, corta, se puede administrar para determinar el ni- tura total, lenguaje total, matemáticas total, habilidades de referencia (excepto el
vel apropiado de la prueba que se debe aplicar al examinado. Hay casetes disponibles nivel C) y ciencias y estudios sociales. La lectura total, el lenguaje total y las matemá-
para la administración de la prueba. Las puntuaciones cruda!i se pueden convertir a ticas totales se combinan para producir una puntuación de batería total. Los protoco-
puntuaciones de grado en los niveles 1, y II, Y a rango de percentiles y estanueve en el los para los niveles A, B Y C Y 1 están disponibles para calificar por máquina o a
nivel III. Las distribuciones de puntuaciones para grupos de referencia de adultos mano, mientras que los protocolos de los niveles 2, 3 Y 4 se pueden utilizar de nuevo,
están disponibles en cada nivel. dado que se usan hojas de respuestas por separado.

Prueba de conceptos básicos, ~~ Boehm Series de evaluación de contenido

The Psychological Corporation Houghton Mifflin eo.


Tiempo de la prueba: de 30 a 40 minutos Tiempo de la prueba: variable
Jardín de niños- grado 2 . Grados: 7-12

Las pruebas están disponibles en ediciones en inglés y español. El contenido de Las series de evaluación de contenido consisten en un grupo de pruebas estandari-
las pruebas consta de conceptos que se consideran importantes para la comprensión zadas que se administran al final del año, diseñadas para evaluar el estatus del estudian-
y el seguimiento de instrucciones que comúnmente dan los maestros o que aparecen te en algunas materias específicas. Hay pruebas disponibles en las áreas siguientes: arte
en los materiale:> programáticos de contenido en el jardín de niños hasta. el segundo de la lengua (habilidad para ellengua;e, composición y literatura), matemáticas, ciencia,
gr~d? Los .reactIvos de la prueba! 50 en total, parecen ser demasiado fáciles para dis- álgebra moderna, negocios del agricultor, geometría moderna, economía y habilidades e
cnmmar nIveles de aprovechamIento entre los niños de primer grado de los niveles infonnación de oficina. Se pueden comprar las pruebas por separado.
socioeconómicos medios o altos, o para los niños de segundo grado de cualquier ni-
vel socioeconómico. Los coeficientes de confiabilidad reportados varían en un rango
de 0.68 a 0.90. Sólo se reporta la validez del contenido pero ésta es adecuada para los Pruebas de habilidad educativa-edición universitaria
propósitos que la prueba intenta cumplir.
eTB/McGraw-Hill
Tiempo de la prueba: Inglés, 1 hora 45 minutos¡ matemáticas, 45 minutos
Pruebas California de aprovechamiento-edición 1970 Estudiantes de ingreso en la universidad

CTB/McGraw-Hill Estas pruebas, una para inglés y la otra para matemáticas, se han diseñado para
Tiempo de la prueba: de 1 hora 54 minutos a 2 horas 33 minutos colocar a los estudiantes universitarios de nuevo ingreso. Las subpruebas de inglés son:
Nivel 1, 1.5-2¡ nivel 2, 2-4¡ nivel 3, 4-6¡ nivel 4, 6-9¡ nivel 5, 9-12 sonidos, comprensión 1, comprensión 11, organización de ideas y mecánica de la escri-
634 AP~NDICES SECCIÓN D 635
tura. Las subpruebas de la prueba de matemáticas son: información básica, cálculo La batería consta de nueve subpruebas: comprensión de los conceptos sociales
aritmético y análisis de problemas. básicos, antecedentes generales de las ciencias naturales, corrección y propiedad en la
expre~ión, habilidad para el pensamiento cuantitativo, habilidad para interpretar los
matenales de lectura en los estudios sociales, habilidad para interpretar los materia-
pruebas Iowa de habilidades básicas, batería de primaria-formas 5 y 6 les de la lectura en las ciencias naturales, habilidad para interpretar los materiales
Houghton Mifflin Co. literarios, vocabulario general y usos de las fuentes de información. La batería produ-
Tiempo de la prueba: edición estándar, 3 horas 32 minutos¡ edición básica, 1 hora 53 ce 10 puntuaciones, una p~ra cada una de las subpruebas, y una puntuación total
. minutos compuesta, basada en las pnmeras ocho subpruebas. Se dan datos de validez predicti-
Nivel 7, grados 1.7-2.5¡ nivel 8, grados 2.6-3.5 va y de validez concurrente. Las correlaciones entre las puntuaciones compuestas
obtenidas en los grados lO, 11 Y 12 Y en los grados de los estudiantes de nuevo ingre-
La batería para primaria es una extensión derivada de las pruebas Iowa de habili- so en la universidad, varían en un rango de 0.40 a 0.71 con una media aproximada de
dades básicas. Hay disponibles dos ediciones; la edición básica consta de seis subprue- 0.60. La consistencia interna de las confiabilidades es satisfactoria. Las correlaciones
bas: vocabulario, análisis de palabras, comprensión de la lectura, ortografía, conceptos entre las puntuaciones de la tercera edición y las de la cuarta tomadas con un año de
matemáticos y problemas matemáticos. La edición estándar consiste en estas mismas diferencia son en la mayoría de los casos de 0.80. Las correlaciones entre las subprue-
seis subpruebas, más una de comprensión auditiva, uso de mayúsculas, puntuación, bas tienden a caer por arriba de 0.70¡ por tanto, el valor de las pruebas como un ins-
uso, mapas, gráficas y tablas, y referencias. La mayoría de las subpruebas de la batería trumento es cuestionable. Se proporcionan puntuaciones estándar, percentiles y
de primaria se administran oralmente con el fin de separar las habilidades para la lectu- bandas de percentil.
ra de aquellas funciones no relacionadas directamente con la lectura. Las pruebas son
sin límite de tiempo. Hay dos tipos de normas disponibles: 10S-Jangos de percentiles y
los equivalentes de grado. Las normas de percentiles especiales para las grandes ciuda- Pruebas metropolitanas de aprovechamiento 1970
des y para las escuelas católicas están disponibles si se solicitan al editor. Las dos edicio-
nes están disponibles en protocolos calificables a máquina o a mano. Harcoun Brace Jovanovich
Tiempo de la prueba: varía por nivel de 70 a 270 minutos
Grados K.7 a 1.4; primaria 1, grados 1.5~2.4¡ primaria 11, grados 2.5-3.4¡ elemental,
Iowa Tests 01 Basic Skills (ITBSJ-pruebas Iowa de habilidades básicas grados 3.5-4.9¡ intermedio, grados 5.0-6.9¡ avanzados, grados 7.0·9.5
Houghton Mifflin Company
Tiempo de la prueba: de 280 a 335 minutos La primera batería consiste en tn;s subpruebas: escuchar sonidos, lectura y
Grados: 3-9 números. La batería primaria 1 consiste de cinco subpruebas: conocimiento de pala-
bras, análisis de palabras, lectura, cálculo matemático y conceptos matemáticos. La
Las ITBS usan un formato de nivel múltiple, con un solo cuaderno de lomo de batería primaria 11 tiene las mismas subpruebas que la primaria 1 y agrega deletreo y
espiral que es reusable para todos los grados. El nivel de prueba se controla por los resolución de problemas matemáticos. Todas las otras baterías consisten de siete
puntos de inicio y de terminación diferentes. La batería produce 15 puntuaciones: subpruebas: conocimiento de palabras, lectura, lenguaje, ortografía, cálculo mate-
vocabulario (una puntuación), comprensión de la lectura (una puntuación),lenguaje mático, conceptos matemáticos y resolución de problemas matemáticos. Las sub-
(cuatro subpuntuaciones y una puntuación total), habilidades para el estudio y el tra- pruebas de ciencia y de ciencias sociales están también disponibles para las baterías
. bajo (tres puntuaciones y una puntuación total) y una puntuación compuesta. La ba- intermedia y avanzada. Las puntuaciones crudas pueden convenirse a puntuaciones
tería pone énfasis en la apreciación de las habilidades funcionales necesarias.en el estándar, equivalentes de grado, rango de percentiles y estanueve. Hay normas dis-
niño si se quiere que progrese en la escuela. Las confiabilidades de las subpruebas son ponibles para evaluar en primavera y otoño. También están disponibles dos formas
adecuadas y las de las pruebas totales son altas. Los procedimientos para normar la de nivel primario y tres de todos los otros niveles.
prueba son excelentes. La ITBS y las pruebas de habilidad cognoscitiva fueron nor-
madas simultáneamente y se proveen normas de percentiles para niveles de habiliclad
en un manual complementarío. Además de las normas nacionales generales, se esta- Sequential Tests 01 Educational Progress (STEP)-pruebas secuenciales de progreso
blecen normas de percentiles especiales para construir promedios, regiones geográfi- educativo
cas, ciudades grandes y escuelas católicas. Los manuales son excelentes, sobre todo
los del maestro y los del administrador. Un complemento de matemáticas modernas Cooperative Test Division
está disponible para utilizarlo además de las pruebas de habilidades aritméticas en la Educational Testing Service
batería regular, o para reemplazarlas. Tiempo de la prueba: de 450 a 500 minutos
Grados: 4-6, 7-9, 10-12 y 13-14
Iowa Tests 01 Educational Development (ITED)-pruebas Iowa para el desarrollo edu-
cativo La batería consiste en seis pruebas: lectura, escritura, matemáticas, ciencia, estu-
dios sociales y comprensión auditiva. Se supone que las pruebas proveen una escala de
Science Research Associates puntuaciones estándar continuas para apreciar el desarrollo del aprovechamiento des-
Tiempo de la prueba: de 330 a 540 minutos de el grado cuarto hasta el decimocuarto. Los críticos de esta prueba han formulado
Grados: 9-12 preguntas acerca de la equivalencia de la escala mediante los diferentes niveles. Las

....... 1 : .:. ,;..", ~ "'''.: . ' ... ..


636 APtNDICES SECCIÓN D 637
normas se presentan en términos de bandas de percentiles. Los manuales y textos para y ciencia y, con excepción del nivel avanzado, comprensión auditiva. Las pruebas
la batería son excelentes.
están disponibles ya sea como una batería completa o como una batería básica que
incluye sólo lectura, matemáticas y artes de la lengua. Las puntuaciones crudas pue-
Series de aprovechamiento SRA den convertirse a equivalentes de grado, puntuaciones en escala, rangos de percenti-
les o estanueve. Hay normas disponibles para evaluar al principio o al final del año en
Science Research Associates todos los niveles de grado, y para evaluar a medio año en los grados primero y segun-
Tiempo de la prueba: de 270 a 450 minutos do. Se proveen pruebas de práctica para cada subprueba en el nivel primaria 1 hasta el
Grados: 1-2,2·4 Y 4-9 nivel intermedio II, en todas las baterías. También están disponibles pruebas de prác-
tica separadas para todas las baterías, excepto para el nivel avanzado. Existen dos for-
Los niveles de la prueba diseñados para administrarla en los grados 1-2 Ygrados mas de prueba.
2-4 están publicados como baterías separadas; la que se diseñó para el grado cuarto
hasta el noveno está editada en un formato de nivel múltiple. Las habilidades para la
lectura y para la aritmética se aprecian en todos los niveles; una subprueba en artes Stanlord Early SchoolAchievement Test (SESAT)-prueba del aprovechamiento esco-
del lenguaje se añade a los grados segundo a cuarto y a todos los niveles más altos y lar Stanford, preliminar
subpruebas en estudios sociales y en ciencia se añaden a los grados cuarto más alt~s.
Una prueba de habilidades para el estudio y el trabajo se da como un complemento Harcourt Brace Jovanovich .
desde el cuarto grado hasta otros superiores. Las pruebas son muy atractivas y hace~ Tiempo de la prueba: nivel 1, 1 hora 30 minutos; nivel 1I, 2 horas 20 minutos
un buen uso del color. En la batería de nivel múltiple, las hojas de respuestas para los Nivel 1, grados K.l-l.l; nivel 11, grados 1.1-1.8
gra~os di~erentes están en un código de colores. Las pruebas de ciencias y de estudios
·socIales tIenden a destacar el recuerdo de la información fáctica. El vocabulario se Los dos niveles contienen las subpruebas siguientes: ambiente, matemáticas,
aprecia sólo en el contexto de una selección de lectura. Los coeficientes de confiabili- letras y sonidos, y comprensión auditiva. El nivel II, contiene además dos pruebas adi-
dad . (K-R # 20) son satisfacto~os, pero puede que estén algo inflados. Se proveen cionales: lectura de palabras y lectura de oraciones. Las puntuaciones crudas se pueden
eqUlva~en~es de grado, percentIles y estanueve para todos los niveles de grado. Los convertir en rangos de percentiles y estanueve.
proced!!ruentos para normar, establecer el contenido de las oruebas v detenninar la
confiabilidad están reportados de manera inadecuada.' .
1973 Stanlord Test 01 Academic Skills (TASK)-prueba de habilidades académicas
Stanford, 1073
Encuesta de evaluación SRA
Harcourt Brace Jovanovich
Science Research Associates Tiempo de la prueba: 1 hora 20 minutos
Tiempo de la prueba: varía con cada nivel Nivel J, grados 8-10; nivellI, grados 11-12; nivel 11, edición universitaria, grado 13
Grados: desde el 1 hasta el 12
Cada nivel de la batería contiene tres subpruebas: lectura, inglés y matemáticas.
. Esta encuesta es un servicio de programa referido a la norma, que consta de seis Hay disponibles dos formas de la prueba. Las puntuaciones crudas pueden convertirse
mveles qu~ ~. trasla~an: ed!ci?n primaria de las series de aprovechamiento SRA, gra- en puntuaciones en escala, rangos de percentiles y estanueve. Hay normas disponibles
dos 1-4; edlclon de mvel muluple d<: las series de aprovechamiento SRA, grados 4-9, Y para la evaluación de principio y de fin de año.
la prueba lowa de desarrollo educatIvo (ITED), grados 9-12 . .Cada nivel contiene sub-
pruebas de lect1:l~a, .de artes del lenguaje y de matemáticas. La edición de nivel múltiple
y la ITED t~mb)en mcluyen pruebas en estudios sociales, en ciencia yen uso de fuentes Tests 01 Academic Progress (TAP)-pruebas de progreso académico
de referenCIa.
Houghton Mifflin Company
Tiempo de la prueba: de 330 a 340 minutos
Series de pruebas del aprovechamiento Stanlord, 1973 Grados: 9-12
Harcourt Brace Jovanovich
La batería consiste en cuatro pruebas que se traslapan, una para cada grado, en las
Tiempo de la prueba: varía por nivel, de 2 horas 50 minutos a 5 horas 20
niinutos seis áreas siguientes: estudios sociales, composición, ciencia, lectura, matemáticas y
Nivel primaria J, gra~os ~.5-2.4; n.ivel primaria II, grados 2.5-3.4; nivel primaria III, literatura. Las pruebas están disponibles en un solo protocolo o como protocolos sepa-
grados 3.5-4.4¡ mvel mtermedIO J, grados 4.5-5.4; nivel intermedio 11, grados 5.6- rados. Se proveen tres tipos de normas: nonnas de puntuación estándar, normas de
6.9; avanzado, grados 7-9.5 grado de percentiles para estudiantes individuales y normas de percentiles de grado
para promedios escolares. Las pruebas se estandarizaron en un programa coordina-
Todos ~os niv~les i.ncluyen subpruebas de lectura, de matemáticas y de arte de la do con las pruebas Iowa de habilidades básicas y con las pruebas de habilidades
lengua. El ruvel pnmana 11 y las baterías más altas también incluyen estudios sociales cognoscitivas. Los coeficientes de confiabilidad de división en mitades para los dife-
rentes grados son de 0.85 o mejores, excepto para la subprueba de ciencias en el nove-

I
J
638 APÉNDICES 639

no grado, para la que es de 0.83. La mayoría de los coeficientes de confiabilidad son


de 0.89 o mejores. Los errores estándar de medición se dan para cada subprueba y
para cada grado para la puntuación total, así como para los niveles de rango de percen-
tiles seleccionados. Las T AP son una batería de pruebas bien construidas y bien norma-
tivizadas que podría ser muy útil en una amplia variedad de escuelas secundarias.

SECCIÓN E
Tests of Basic Education (TABEI-,pruebas de educación básica
CTB/McC raw-Hill Pruebas de aprovechamiento referidas al criterio
Tiempo de la prueba: de 1 hora 34 minutos a 2 horas S6 minutos
Adultos Servicio de control objetivo confeccionado a la medida -lectura y matemáticas

Las TABE se adaptaron a partir'de las pruebas California de aprovechamiento, Houghton Mifflin Co.
edición de 1975. Hay tres niveles, clasificados por orden de dificultad: el nivel D (difí- Tiempo de la prueba: sin límite
cil), que se adaptó del nivel de escuela secundaria inferior de las CAT; el nivel M Lectura, grados 1-6;
(mediano), del nivel elemental superior, y el nivel E (fácil), del nivel primarÍo superior. Matemáticas, grados 1-8
La prueba está diseñada para administrarse a jóvenes que están fuera de la·escuela y
para adultos que tienen niveles de habilidad limitados en lenguaje, en lectura yen arit- Al igual que el sistema de control indiv~du~l, del mismo editor,. este servicio pro-
mética. Se proveen puntuaciones y pruebas por separado para lectura, lenguaje y vee un programa de evaluación referido al cnteno, hecho a la.s ~eceslda.des, en lect1.~ra
aritmética. Una prueba localizadora se provee para determinar el nivel apropiado o matemáticas, para las escuelas. Las escuelas que usan el servICIO selecclOnan los ~bJe­
de la prueba que debe suministrarse. Una nueva edición de las TABE, comparada tivos que deben apreciarse, de los folletos de ~b(etivos ~onductua1e~ y de las lIstas
con las pruebas California de aprovechamiento, en su edición 1970, está disponi- complementarias que están disponibles en las oft~mas reglOn~les del edI~or. La escuela
ble desde 1976. que usa el servicio especifica el número de !eactlvos qu~ qUIere qu~ se mcluyan para
cada objetivo. Las pruebas se hacen a la medida d~l usuano, por medlo de esc,?ger reac-
tivos ya probados a prueba de los ~~cos de reactivos. ~os. protocolos, las hOjas de res-
Tests 01 Basic Experiences (TOBE)'-pruebas de experiencias básicas puestas y los aditamentos para calificar a mano o en maquma, se elaborart sobre la base
de "hecho a la medida".
CTB/McGraw·Hill
Tiempo de la prueba: sin límite
Preescolar, jardín de niños y grado 1 Diagnóstico: una serie de ayudas instruccionales -lectura y matemáticas

Las TOBE contienen dos niveles que se traslapan, el K Y el L, y consta de cinco Science Research Associates, Inc.
pruebas, cuatro de las cuales están relacionadas con las áreas programáticas de lengua- Tiempo de la prueba: sin límite
je, de matemáticas, de ciencia y de estudios sociales. La quinta prueba es una prueba de Grados: del 1 al 6
conceptos generales, que consiste en reactivos tomados de las otras cuatro pruebas,
más algunos reactivos diseñados específicamente para esta prueba. Se recomienda que Ésta es una serie de pruebas con refere~cia al crit~~o e? lectura, ~ mate~áti~~~,
se apliquen a los niños ya sea las cuatro pruebas pOr separado o la prueba de conceptos que se llaman sondeos, diseñados para apreCIar las defICienCIas especIficas del mdlVI-
generales, pero no ambas. Cada reactivo de la prueba consta de un estímulo verbal y de duo en cada una de estas áreas de habilidades. Se provee una prueba de sondeo que se
cuatro respuestas pictográficas, de las cuales el niño tiene que. seleccionar una respues- usa para dirigir al individuo a los son~~os necesarios y dar má~ d~tos detall~dos acerca
ta correcta. También están disponibles las instrucciones de la prueba en español. Las de las deficiencias en conceptos y hab¡hdades. Las pruebas estan en refere,n~la cruzada,
puntuaciones crudas se pueden convertir en puntuaciones estándar, rangos de percen- con los programas de instrucción individualizada en lectura y rnatematlcas.
tiles y estanueve.

Inventario de diagnóstico matemático

CTB/McGraw-Hill
Tiempo de la prueba: sin límite . . ., .
Grados: 1.5-7.5 y estudiantes en grados supenores que necesitan educaClon especIal

Ésta es una serie de pruebas con referencia al criterio diseñada~ para apreci~r 32~
objetivos conductuales en matemáticas tradicionales y contemporaneas. La. sene esta
dividida en siete niveles que se traslapan en términos de los objetivos que mIden. Hay

-.-! .
640 APÉNDICES SECCIÓN E 641

equipos disponibles para el salón de clases, para cada nivel, excepto para el nivel G. de acuerdo con el criterio del usuario. Están disponibles dos tipos de hojas de respues-
Cada equipo contiene pruebas interim que incluyen de dos a siete objetivos cada una, tas: las "instarnark" o las calificables a mano. Las hojas de respuesta "instamark" son
un manual de prueba interim, una guía de actividades del aprendizaje, una guía del autocorregibles, pero requieren un crayón especial.
maestro, una guía para materiales auxiliares, una hoja resumen para la clase, una vista
al producto y una forma para reordenar. Los resultados de la prueba se reportan de Maestría: un medio para evaluar
varias maneras: análisis de predominio, reporte de dominio de objetivos -un reporte
de clase y un reporte diagnóstico individual. Science Research Associates, Inc.
Tiempo de la prueba: sin límite
Desde jardín de niños hasta el grado 9
Pruebas de habilidades cotidianas
Éste es un servicio de pruebas referido al criterio en lectura y matemáticas. Las
CTB/McGraw-Hill escuelas y los distritos escolares pueden seleccionar objetivos medidos de los catálogos
Tiempo de la prueba: forma A, sin límite; forma B, lectura 30 minutos, matemáticas, de objetivos del editorl o pueden seleccionar niveles apropiados de pruebas de catálogo
38 minutos en lectura y matemáticas, que aprecien los objetivos seleccionados previamente. El edi-
Grados: 6-12 tor provee servicios de calificación y reportes de grupo e individuales.
Estas pruebas han sido diseñadas para usarse como pruebas de competencia míni-
ma en lectura y en matemáticas. Las pruebas de habilidades cotidianas se publican en Banco de reactivos y de pruebas referidos a los ob¡etivos
protocolos de pruebas separados para la lectura y para las matemáticas. Ambas prue-
bas, de lectura y de matemáticas, constan de dos partes: la parte A, que es una prueba CTB/McGraw-Hill
referida al criterio, y la parte B, que es una prueba referida a la norma. La prueba de Tiempo de la prueba: sin límite
lectura, parte A, aprecia 15 objetivos, con cada objetivo medido por tres reactivos, Grados: jardín de niños-12
mientras que la prueba B, lectura, es una prueba referida a la norma de las habilidades
para el estudio tomadas de las pruebas de habilidades básicas integradas, forma R, Éste es un servicio a la medida que permite a una escuela o a un sistema escolar
nivel 3 (grados 6-81. La prueba de matemáticas, parte A, mide nueve objetivos conduc- identificar los objetivos de matemáticas y lectura y comunicación que desea apreciar, y
tuales con tres reactivos por objetivo. La prueba B, cálculos aritméticos, es también después proporcionar cuatro reactivos ya probados por objetivo, para una prueba con
tomada de las CTBS, forma R, nivel 3, y consta de 12 reactivos cada una, en sumas, referencia al criterio confeccionada a la medida. El sistema ofrece 335 objetivos en
restas, multiplicaciones y divisiones. habilidades de la lectura y la comunicación, y 506 objetivos en matemáticas, de las que
los estudiantes pueden escoger aquellos que sean los más apropiados para su propia
instrucción. El sistema también provee servicios de calificación.
Sistemas de control individual del alumno, matemáticas y lectura
Houghton Mifflin Co. Inventario de matemáticas prescriptivas
Tiempo de la prueba: sin límite
Matemáticas: grados 1-8; lectura: grados 1·6 CTB/McGraw-Hill
Tiempo de la prueba: sin límite
Estos sistemas proveen pruebas con referencia al criterio en matemáticas y en lec- Grados: 4-8
tura. Cada conjunto está disponible en dos formas. Las pruebas de matemáticas están El inventario de matemáticas prescriptivas es una serie de pruebas con referencia
divididas en ocho niveles, en cada nivel se evalúa el desempeño de 48 a 64 objetivos al criterio diseñadas para apreciar los objetivos matemáticos que comúnmente se ense-
conductuales. Las pruebas de lectura están divididas en seis niveles, cada uno de los ñan en los grados del cuarto al octavo. Está dividida en cuatro niveles: Al B, e y D. Los
cuales contiene de 43 a 63 objetivos conductuales. Todos los reactivos ya han sido pro-
cuatro niveles abarcan 351 objetivos instruccionales en matemáticas tradicionales y
bados en una muestra nacional, los reactivos se relacionan con los objetivos, y no con contemporáneas. Los estudiantes anotan sus respuestas en una rejilla de respuestas
los grados de manera específica.
que se califica a máquina y que causa que muchos estudiantes tengan dificultades. Se
Los objetivosne matemáticas en cada nivel están divididos entre tres módulos de proveen cinco reportes de calificación: la matriz de diagnóstico individuall la guía de
evaluación, otoño -A, invierno -B y primavera -C I que corresponden al programa
de contenido que de manera típica se abarca en un tercio del año escolar. En las se- estudio individual, la matriz de diagnóstico de clase, el reporte de agrupamiento de la
clase y el reporte de dominio del objetivo.
ries de lectura, cada nivel tiene tres protocolos de prueba diseñados para tres categorías
amplias de habilidades: ataque de palabras, vocabulario y comprensión, y habilidades
de estudio/discriminación. Para cada serie de pruebasl el sistema provee protocolos de Inventario de lectura prescriptiva
prueba, registros de progreso del alumno, guía del maestro folleto con objetivos con-
l
ductuales folleto con referencias cruzadas de objetivos y el registro del manejo de
l CTB/McGraw-Hill
objetivos del maestro. Los protocolos de prueba para los niveles del 1 al3 se consumen Tiempo de la prueba: sin límite
y se desperdician, mientras que todos los demás se pueden desperdiciar o volver a usar Grados: 1.5-6.5

1
642 AP~NDICES 643

El inventario de lectura prescriptiva es una serie de pruebas con referencia al


criterio, diseñadas para apreciar el aprovechamiento del estudiante en los objetivos
de lectura que comúnmente se enseñan en los grados del 1.5 al 6.5. Está dividido en
cuatro niveles: A, B, C y D. Los 90 objetivos están clasificados en análisis, análisis
estructural, traducción, comprensión literal, comprensión interpretativa y com-
prensión crítica. En promedio, hay tres o cuatro reactivos por objetivo. Se recomien-
da calificar a máquina en todos los niveles porque el proceso de calificar a mano es SECCIÓN F
largo y enredado. Hay disponibles cinco reportes para las puntuaciones, el reporte de
dominio objetivo, el mapa de diagnóstico individual, el mapa de diagnóstico de cIase, Inventarios de intereses
el reporte de agrupamiento de la clase y la guía de estudio individual. Además de
estos cinco reportes, también hay disponibles guías con referencia al programa para Encuesta de intereses ocupacionales Kuder, forma DD
cada programa de lectura que está representado en el inventario de lectura prescrip-
tiva. Estas guías hacen una lista, para todos los niveles, de las páginas en los libros de Science Research Associates, Inc.
texto, las ediciones y los libros de trabajo del maestro, en los que se enseña cada obje- Tiempo de la prueba: de 30 a 40 minutos
tivo medido por el inventario. El cuaderno interpretativo hace una lista de los objeti- Grados: 11-12 y adultos
vos medidos por el inventario, proporciona información acerca de la interpretación
de los reportes y da sugerencias para las actividades en el salón de clases de los objeti- Consúltese el capítulo 11. El instrumento consta de 100 triadas. En cada triada, el
vos que presenta. examinado selecciona la actividad que más le gustaría y la que menos le gustaría. El
instrumento produce 114 puntuaciones ocupacionales y 48 puntuaciones de áreas
universitarias. Se reportan puntuaciones separadas para las ocupaciones del hombre y
Sober español de la mujer, y se dan áreas universitarias para hombres y para mujeres. Las puntuacio-
nes se-reportan en términos de la relación que existe entre las respuestas del examinado
Science Research Associates, Inc. y las de aquéllos de los grupos satisfechos y que han tenido éxito en las ocupaciones o
Tiempo de la prueba: sin límite en el área universitaria. Las hojas de respuestas se deben calificar a máquina, pero los
Desde jardín de niños hasta el tercer grado servicios de calificación son rápidos y eficientes. .

.El Sober español es un servicio de pruebas con referencia al criterio en lectura para Registro de preferencias Kuder-vocacional
los niños que hablan español. Una escuela o un distrito escolar puede seleccionar de
200 objetivos en lectura aquellos que desee evaluar. Se recomienda un mínimo de 10 Science Research Associates
objetivos y un máximo de 30, por el editor de cada prueba. El editor provee protocolos Tiempo de la prueba: de 40 a SO minutos
de prueba diseñados a la medida y manuales para el examinador para cada prueba. Grados: 9-16 y adultos
Todas las instrucciones y los reactivos de prueba están en español.
Consúltese el capítulo 11.

Encuesta de intereses generales Kuder, forma E


Science Research Associates, Inc.
Tiempo de la prueba: de 30 a 40 minutos
Grados: 6-12
Similar al registro de preferencias Kuder-vocacional, el instrumento mide la pre-
ferencia relativa del individuo para las actividades en 10 grupos empleo-familia: al aire
libre, mecánicos, científicos, de cálculo, persuasivos, artísticos, literarios, musicales, de
servicio social y del empleado. Contiene puntuaciones de percentiles para cuatro grupos
de normas, hombres y mujeres, de los grados 6 al 8, y de hombres y mujeres para los gra-
dos del 9 al 12. Los protocolos pueden calificarse a mano o a máquina.

Minnesota Vocational Interest Inventory (MVIl)-inventario de intereses vocaciona-


les de Minnesota
The Psychological Corporation
Tiempo de la prueba: de 40 a 45 minutos
Escuela secundaria y adultos hombres

..: .. .. ..... .
644 AffNDICES SECCIÓN F 645

El MVIl es un inventario de clave empírica, diseñado para apreciar los intereses en Cuestionario de intereses vocacionales Strong, para mujeres, revisado
. ocupaciones no profesionales. Se diseñó para administrarlo a estudiantes hombres de
escuela secundaria que no ingresarán en la universidad o para adultos, también hom- Consulting Psychologists Press, Inc.
bres, que tienen una educación limitada o una educación técnica vocacional. El inven- Tiempo de la prueba: de 30 a 60 minutos
tario consta de 158 tríadas de enunciados breves que describen las tareas o actividades Edad: 17 años o más
en una variedad de oficios o de ocupaciones no profesionales. Produce puntuaciones
para 21 escalas ocupacionales y para nueve escalas de área que muestran los gustos y Este cuestionario es similar al cuestionario para hombres. Esta versión todavía no
los rechazos para las actividades comunes a varias ocupaciones. Los coeficientes de se ha estudiado con detenimiento, ni tampoco parece ser tan eficaz como lo fue el cues-
confiabilidad para poner la misma prueba por segunda vez, para las escalas ocupacio- tionario para hombres.
nales a lo largo de un intervalo de 30 días, varían en un rango desde 0.64 hasta 0.88,
con una confiabilidad mediana de cerca de 0.82. Los datos de validez reportados en el
manual consisten en las diferencias en las puntuaciones de la media entre los 11 trabaja- Vocational Preference Inventory ¡VPI)-inventario de preferencias vocacionales
dores satisfechos' y los Mtrabajadores insatisfechos' y el'porcentaje de traslape' entre
la ocupación de criterio y los oficios en general. El inventario fue publicado en 1965¡ Consulting Psychologists Press, Inc.
por tanto, no se ha investigado tan detalladamente, ni se ha estudiado tanto como el Tiempo de la prueba: sin límite, aproximadamente 30 minutos
Kuder o el Strong¡ sin embargo, este inventario sirve para dar una medida de intereses Grados: 12-16 y adultos
adecuada para aplicarla a estudiantes secudarios que no ingresarán en la universidad y
a grupos similares. El VPI consiste en 160 títulos ocupacionales, de los cuales el examinado indica los
que le gustan y los que le disgustan. El inventario produce 11 puntuaciones, seis de las
cuales se pueden usar como escalas tipo de intereses vocacionales: realista intelectual
Ohio Vocationallnterest Survey (OVIS)-encuesta de intereses vocacionales Ohio social, convencional, empresarial y artístico. Las cinco escalas restantes s~n escalas d~
Harcourt Brace Jovanovich personal~dad: autocontrol, masculinidad, estatus, infrecuencia y complacencia. Este
Tiempo de la prueba: sin límitel aproximadamente 80 minutos m~entano será probablemente más útil como inventario de intereses vocacionales. .
Grados: 8-13 El mventar!~ está bas~do en la teoría de Holland sobre los seis tipos de personalidad.
~uchas cntIcas conSIderan que el VPI es el mejor instrumento para la asesoría voca-
El instrumento está dividido en dos secciones: cuestionario de información del CiOnal o para la investigación.
estudiante e inventarlo de intereses. El primero recopila la información acerca de los
planes ocupacionaleS del examinado, de las preferencias en las materias escolares, de
sus planes acerca del contenido, de los planes para después de la escuela secundaria y
de los intereses acerca de los cursos vocacionales. A su vez, el inventario de intereses
consiste en 280 reactivos de actividad laboral. Se dan puntuaciones para 24 escalas
ocupacionales. También hay una puntuación que se llama índice de escala de clari-
dad, que, supuestamente, refleja el cuidado y la consistencia de las opciones de res-
puesta del examinado. Las puntuaciones crudas se convierten a rangos de percentiles y
a estanueve, por grado y por sexo.

Strong-Campbelllnterest lnventory (SC1I)-inventario de intereses Strong-Campbell


The Psychological Corporation
Tiempo de la prueba: sin límite, aproximadamente 35 minutos
Grados: 11-12, universidad y adultos
Consúltese el análisis que aparece en el capítulo 11. El SClI, forma T 325, es un
solo protocolo que se administra a hombres y mujeres. Se han hecho esfuerzos para
reducir o para retirar el sesgo debido al sexo en el contenido de los reactivos y en las
puntuaciones de reporte.

Cuestionario de intereses vocacionales Strong, para hombres, revisado


Consulting Psychologists Press, IDC.
Tiempo de la prueba: de 30 a 60 minutos
Edad: de 17 años o más
Ésta es la antigua versión del SCll.
646 SECCIÓN G 647
La CEFT consist: en una seri~. de reactivos que requieren que el examinado
e!1cue~tre u~~ forma s~~le que ,:sta lDcrustad~ en una más compleja. La prueba apre-
Cla .la dlDlenSlOn que Wilkin llamo de.pende~cl~:inderen~encia de campo Yque, más
reCIentemente, otros han llamado dJferenClQClOn pSlcologica. En la actualidad este
instrumento es más apropiado para la investigación. '

SECCION G Inventario de preferencias personales Edwards

Inventarios de la personalidad The Psychological Corporation


Tiempo de la prueba: de 40 a 55 minutos
Lista para marcar adietivos Universidad y adultos

Consulting Psychologists Press, Inc. Esta prueba se diseñó para evaluar los puntos fuertes relativos de 15 necesidades
Tiempo de la prueba: sin límite, aproximadamente de 15 a 20 minutos manifiestas a partir del sistema de necesidades de Murray. Cada necesidad está repre-
Grados: 9-16 y adultos sentada por nueve enunciados. Los. enunciados que representan cada necesidad se
presentan en un formato de selección forzada, apareados con un enunciado que
La lista para marcar adietivos es una lista de adjetivos por orden alfabético des- representa otra necesidad. Se supone que el par de enunciados está controlado por la
de "distraído" hasta Rbufón' y el examinado, al responder, marca los adjetivos que le deseabilidad social. Se dan normas para muestras de estudiantes universitarios, hom-
parecen autodescriptivos. El instrumento puede calificarse por 24 variables que bres y mujeres y para adultos. La representatividad de la muestra de adultos es cues-
incluyen 15 necesidades, medidas de ajuste personal, disponibilidad _a la asesoría, tionable.
autoconfianza, autocontrol y habilidad. La calificación es complicada porque se Los coeficientes de confiabilidad de consistencia interna reportados en el
requieren diferentes tablas de normas, lo cual depende del número de reactivos que manual varían en un rango de 0.60 a 0.87, con una mediana de 0.78 y unos coeficien-
se marquen. Los datos de validez son más bien escasos; por tanto, el instrumento es tes de confiabilidad con prueba por segunda vez con intervalos de una semana, que
más apropiado para propósitos de investigación. _ varían en un rango de 0.74 a 0.87 con una mediana de 0.83. Esta prueba se ha
empleado extensamente en la investigación, pero los datos de validez consistente son
bastante escasos. .
California Psychological Inventory (CPI)-inventario psicológico California
Consulting Psychologists Press, Inc.
Eysenck Personality Inventory (EPI)-inventario de la personalidad Eysenck
Tiempo de la prueba: de 45 a 60 minutos
Edad: de 13 años en adelante
Educational and Industrial Testing Service
El CPIse diseñó para administrarlo a una población normal. Consiste en 480 Tiempo de la prueba: de 10 a 15 minutos
reactivos a los que se contesta con "falso· o "verdadero'. Cerca de la mitad de Grados: 9-16 y adultos
los reactivos del CPI han sido tomados del MM PI. El CPI produce 18 puntuacio-
nes, tres de las cuales son escalas de verificación para determinar las actitudes al El EPI produce tres puntuaciones: extraversión, neuroticismo y mentira. Hay dos
tomar la prueba. Los reactivos en 11 de las 15 escalas se seleccionaron por su habili- formas disponibles, y el autor recomienda que se administren ambas formas con el fin
dad para discriminar grupos contrastantes. Las con fiabilidades de la prueba y de obtener una confiabilidad adecuada para la medición individual. Los reactivos
reprueba para los grupos de las escuelas secundarias a lo largo de un año de interva- requieren respuestas de 'sí' o "no". Cada forrna consiste en una escala de extraversión
lo promediaron 0.65 para los hombres y 0.68 para las mujeres. Las con fiabilidades (E) de 24 reactivos, una escala de neuroticismo (NI de 24 reactivos y una escala de men-
de volver a evaluar a un grupo adulto a lo largo de un periodo de una a tres semanas tira de nueve reactivos. Las normas no están diferenciadas por el sexo y los grupos de
promediaron cerca de los 0.80. Las correlaciones entre puntuaciones tienden a ser norma están descritos inadecuadamente.
altas, lo cual indica que las puntuaciones no son tan independientes, como indica el
manual. Las normas separadas se dan para el sexo para las muestras de la escuela
secundaria y la universidad. Algunos de los datos de validez basados en las diferen- Escalas FIRO
cias entre los grupos extremos son cuestionables.
Consulting Psychologists Press, Inc.
Tiempo de la prueba: sin límite, aproximadamente 120 minutos para todas las
Children's Embedded Figure Test (CEFT)-prueba de las figuras incrustadas para escalas
niños Grados: 9-16 y adultos
Consulting Psychologists Press, Inc. Las escalas PIRO son cuestionarios de autorreporte diseñados para evaluar la
Tiempo de la prueba: aproximadamente 20 minutos necesidad de una persona para la inclusión, el control yel afecto en varios aspectos
Edad: 5-12 años
I
I
j
' , ; . ,, " .
648 APÉNDICES SECCIÓN G 649

de las situaciones interpersonales. Hay seis escalas, cada una de las cuales fuerza Encuesta del temperamento Gui1ford-Zimmerman
una situación interpersonal diferente: conducta hacia los demás, sentimiento hacia
los demás relaciones con los padres retrospectivas de la infancia, encuesta de prefe- Sheridan Psychological Services, Inc.
rencia de 'operaciones copiadas, evaluación de actitudes matrimoniales y valores Tiempo de la prueba: de 50 a 60 minutos
educativos. En todos los cuestionarios, excepto en el de la encuesta de preferencia Grados: 9-16 y adultos
de operaciones copiadas, las subescalas contienen nueve reactivos de enunciados Consúltese el capítulo 11. Éste es uno de los mejores inventarios para describir los
simples cada uno de los cuales debe contestarse en una escala de seis puntos. La aspectos de la personalidad normal. Se necesita experiencia para determinar si las di-
escala de la encuesta de preferencia de operaciones copiadas es una escala ipsativa mensiones son de importancia práctica para la asesoría personal o vocacional.
en la que un examinado pone por orden de rango los mecanismos de defensa que
utiliza para cada situación interpersonal. Sólo la escala de conducta hacia los
demás FIRO-B está lo suficientemente bien desarrollada para darle otros usos que La Escala de ansiedad IPAT
no sea~ estudi~s exploratorios.
Institute for Personality and Abilíty Testíng
Tiempo de la prueba: de 5 a 10 minutos
Inventario de la personalidad Gordon Edad: de 14 años en adelante

La escala consiste en 40 reactivos que producen cinco puntuaciones parciales y


Harcourt Brace Jovanovich una puntuación total. Además, los 40 reactivos producen puntuaciones de ansiedad
Tiempo de la prueba: de 15 a 20 minutos "cubierta" y "aparente" por separado. La construcción de la escala de ansiedad estuvo
Grados: 8-16 y adultos basada en extensos estudios del análisis de factores. La validez de la escala está basada
en estudios de análisis y factores y en criterios externos. A su vez, la validez externa
En este inventario y en el perfil personal Gordon se emplea el mismo formato. está basada en las correlaciones de las puntuaciones ,totales con las calificaciones psi-
Los reactivos están arreglados en series de cuatro enunciados, dos favorables y dos quiátricas (en un rango de 0.30 a 0.40, sin correcciones por atenuación); en diferencias
desfavorables de los cuales el examinado debe seleccionar el enunciado que u más» le de las puntuaciones de la media entre los neuróticos ansiosos y la población de estan-
gusta y el eriu'nciado que "menos" le gusta. El inventario produce cuatro puntuacio- darización, y en diferencias en puntuaciones de la media entre otros grupos diagnosti-
nes: precaución, pensamiento original, relaciones personale~ y vigor. Los coeficien- cados clínicamente. .
tes de confiabilidad de consistencia interna (división en mitades) de las cuatro escalas Los coeficientes de confiabilidad para las puntuaciones parciales, basadas en sub-
varían en un rango de 0.77 a 0.84. Los datos de validez consisten primordialmente en pruebas con un mínimo de cuatro reactivos y un máximo de 12, son demasiado bajos
correlaciones entre puntuaciones de las subpruebas y en criterios de desempeño; sin para justificar el uso de las puntuaciones parciales con los individuos, La escala proba-
einbargo, dado que no hay una base teórica para predecir en qué dirección.y .en qué blemente es más útil como diseño de rastreo rápido para adultos que saben leer y como
magnitud deben darse las correlaciones, estos datos deben verse con eSCeptIClSmO, a instrumento de investigación.
menos que aparezcan para varios grupos. Se dan normas de percentiles por sexo y
para grupos de escuelas secundarias y universitarios, así como para algunos grupos
ocupac;ionales. La utilidad de este inventario es limitada, debido a la falta 'de los da- Minnesota Multiphasic Personality lnventory (MMPI)-inventario multifásico de
tos de validez. personalidad de Minnesota
The Psychological Corporation
Tiempo de la prueba: de 30 a 90 minutos
Perfil personal Gordon _Cad: de 16 años O más
Harcourt Brace Jovanovich Para un análisis de este inventario, consúltese el capítulo 11. Este instrumento
Tiempo de la prueba: de 15 a 20 minutos está dirigido a los grupos anormales, más que a los normales, y se diseñó para estable-
Grados: 9-16 y adultos cer diferencias entre ellos. Parece que hay bastantes dudas acerca de si realmente hace
esto con eficacia. Es bastante largo para usarlo como prueba de rastreo; sin embargo, el
Este perfil produce cuatro puntuaciones: ascendencia-A, responsabilidad-R, perfil basado en las puntuaciones de las escalas por separado proporciona gran canti-
estabilidad emocional-E y so~iabilidad-S. No obstante que se seleccionaron cuatro dad de material para la interpretación, hecha por un asesor o un psicoterapeuta sofis-
rasgos como si fueran independientes, las correlaciones entre las escalas A y S y entre ticado. Hay disponible una traducción al español.
las escalas R y E son de 0.60 o más altas. La confiabilidad es adecuada. Los datos de
validez reportados en el manual incluyen correlaciones entre las puntuaciones y califi-
caciones entre los compañeros, así como calificaciones de los rasgos hechas por el ase- Inventario de problemas Mooney
sor para los grupos universitarios, Los datos de validez adicionales se presentan por
grupos en las situaciones industriales y de entrenamiento. Se dan normas de percenti- The Psychological Corporation
les para los estudiantes de escuelas secundarias y de la universidad, para empleados de Tiempo de la prueba: de 20 a 40 minutos
niveles medio y bajo, así como para gerentes, vendedores y superintendentes. Grados: 7-9,9-12,13-16 Y adultos
650 APÉNDICES
SECCIÓN G 651
Esta lista de verificación proporciona diversas soluciones a los problemas que a 22 puntuaciones. Tanto la forma estándar como la larga producen puntuaciones para
menudo se reportan como significativos en los diferentes niveles de edad. Aunque el aprovechamiento, la afiliación, la agresión, la autonomía, la dominancia, la resisten-
los reactivos están agrupados por áreas (desarrollo físico y de la salud, cortejo, sexo cia, la exhibición, la evitación de daño, la impulsividad, los cuidados en la educación
y matrimonio, hogar y familia, etc.) y se pueden contar los reactivos marcados en en el hogar, el orden, el juego, el reconocimiento social, la comprensión y la infrecuen-
cada área, se pone el énfasis al usar las respuestas individuales, pues son las que con- cia. La edición larga también rinde puntuaciones para humillación, cambio, estructura
ducen y dan la posibilidad de una entrevista. Este instrumento no propone ser una cognoscitiva, defensa, sensibilidad, auxilio y deseabilidad. Las escalas de infrecuencia
prueba, y el uso que se le da es probablemente el más justificado para un instrumen- y de deseabilidad son tipos de escalas de validez. Las puntuaciones se expresan como
to de autorreporte. puntuaciones T, que se basan en muestras de 1 000 estudiantes hombres y 1 000
estudiantes mujeres de más de 30 universidades. El inventario tiene una complejidad
Myers-Briggs Type Indicator (MBTI)-indicador de tipos de Myers-Briggs técnica superior y los revisores y críticos lo consideran uno de los inventarios de la
personalidad más promisorios. En su etapa actual de desarrollo, debería usarse pri-
Educational Testing Service mordialmente en la investigación.
Tiempo de la prueba: sin límite, aproximadamente SS minutos
Grados: 9-16 y adultos
Sixteen Personality Factor Questionnaire /16 PF)-cuestionario de 16 factores de la
El MBTI es un inventario de autorreporte de opción forzada basado en una modi- personalidad .
ficación de la teoría de los tipos de ]ung. Produce cuatro puntuaciones: extraversión e
introversión, sensación e intuición, pensamiento y sentimiento, y juicio y percepción. Institute for Personality and Ability Testing
El instrumento se diseñó originalmente hace más de 40 años y ya ha pasado por varias Tiempo de la prueba: de 45 a 60 minutos
revisiones. Se ha utilizado extensamente en asesoría e investigación. Edad: de 17 años en adelante

El16 PF se ha diseñado para apreciar un rango integrado de rasgos. La construc-


Omnibus Personality Inventory (OPI)-inventario de la personalidad Ómnibus ción del instrumento está basada en estudios extensos de análisis de factores y de otras
investigaciones. El instrumento de 16 PF para padres ha conducido al diseño de inven-
The Psychological Corporation tarios para grupos de menos edad (como el cuestionario de la personalidad para los
Tiempo de la prueba: de SO a 70 minutos alumnos de las escuelas secundarias, el cuestionario de la personalidad para niños y
Estudiantes universitarios el cuestionario de la personalidad para alumnos de la educación básica). El inventa-
rio produce 16 puntuaciones en factores primarios y cuatro puntuaciones de factores
La mayoría de los reactivos del OPI se han tomado de otros inventarios de la per- de segundo orden. Las confiabilidades de, división en mitades de las puntuaciones de
sonalidad, principalmente del MMPI¡ del inventario de actitudes VC, del inventa- factor sólo de una forma del inventario, tienden a ser bajas, pero las confiabilidades
rio T-S-E de Minnesota y del CPI. El OPI se diseñó para evaluar la personalidad de de división en mitades de las puntuaciones de factor del agrupamiento de las dos for-
los estudiantes universitarios, sobre todo las características de aquellos que eran inte- mas de la prueba (formas A y B) son adecuadas. Se dan normas para estudiantes univer-
lectualmente superiores. El inventario produce 14 puntuaciones. Los coeficientes de sitarios y adultos, pero las muestras normativas están descritas de manera inadecuada.
confiabilid¡¡d de consistencia interna (K-R 21) varían en un rango de 0.79 a 0.89 para El 16 PF es un instrumento interesante y potencialmente útil, pero en el momento
' Ias subpuntuaciones separadas. Las confiabilidades de prueba-reprueba con un inter- actual debería considerarse primordialmente como un instrumento de investigación.
valo de tres y cuatro seinanas varían en un rango de 0.79 a 0.94 para 67 mujeres en
tres universidades, y de 0.84 a 0.93 para 71 hombres en los grados sup~riores en una
universidad. Los datos de validez consisten principalmente en correlaciones con Estudio de valores, tercera edición
otros inventarios y con las calificaciones de varios grupos académicos. Las normas
para las escalas están basadas en una muestra de 7 283 estudiantes del primer año Houghton Mifflin Co.
universitario, en 37 instituciones. En el estado actual de desarrollo, el OPI debería Tiempo de la prueba: 20 minutos
usarse primordialmente para propósitos de investigación. Grados: 13 y más altos

El estudio de valores, originalmente publicado en 1931, fue diseñado para medir


Forma de investigación de la personalidad los seis 11 tipos de valor" de Spranger: teóricos, económicos, estéticos, sociales, políticos
y religiosos. La segunda edición, publicada en 1951, redefinió el valor social y añadió
Research Psychologists Press, Inc. más reactivos discriminadores. La tercera edición publicada en 1960, difiere de la
Tiempo de la prueba: sin límite¡ forma estándar, aproximadamente 40 minutos; forma segunda sólo en que da más datos de normatividad. Los coeficientes de confiabilidad
larga, aproximadamente 70 minutos mediana para las diferentes subescalas son de 0.82 (división en ~it~~es) y de 0.~8.p.a:a
Estudiantes universitarios la prueba-reprueba, con uno o dos meses de intervalo. Las conftablhdades de dlVJslon
Este instrumento es un inventario de la personalidad de autorreporte disponible
en una edición estándar que produce 1S puntuaciones y una edición larga que produce II en mitades están basadas en grupos de 100 sujetos, y las de prueba-reprueba e.n grup~s
de 34 y 53 sujetos. Los datos de validez que se presentan en el manual consIsten pn-
mordialmente en la demostración de que los patrones o modelos de valores de los

~;¡
~
li

. .. . ..1.'.
.
' ;; :': .' . " :" . , '
i', ." . ,::" . ~. - .' .. ". ;' . . .... ..
" ~ : ' ,',
652 API:ND'CES

diversos grupos educacionales y ocupacionales difieren de la man~ra predicha. Se esta-


blecen normas para grupos universitarios y para grupos ocupacionales .que n?!1l1al-
mente requieren alguna educación universitaria. Este instrumento ha Sido cntIcado
por su falta de evidencia en la unidimensi~nalida~ de ~us escalas, el.~robl~ma?e s~s
puntuaciones ipsativos y la falta de generalIdad mas alla de la poblaclOn UnIverSItana.

Survey of Personal Values ¡SPV)-encuesta de valores personales

Science Research Associates, Inc.


Bibliografía
Tiempo de la prueba: sin límite, aproximadamente 20 lnÍnutos
Grados: 11 -16 y adultos
La SPV produce seis puntuaciones: mente práctica, aprovechamiento, variedad,
toma de decisiones orden y orientación hacia la meta. La SPV consiste en 30 tríadas, American Psychological Association, Standards for educational and psychologi-
de las cuales el ex~minado selecciona una, la que es más importante o la menos cal tests and manuals, American Psychological Association, Washington, D.
importante para él. Las puntuaciones crudas se convierten a rangos de percentiles. Se
establecen normas para estudiantes universitarios, hombres y mujeres, así como para C., 1974. . h 1 . 1
Ammons, R. B. Y Ammons, H. S., Full-Range Picture VocabnlaryTest, Psyc o oglca
estudiantes de secundaria, hombres y mujeres. Las muestras normativas de la escuela Test Specialists, Missoula, Montana, 1948. .
secundaria están restringidas geográficamente. En su estado actual de desarrollo, Anderson, J. E., "The limitations of infant and preschool tests In the measurement of
la SPV es primordialmente útil para la investigación. intelligence", en loumal of Psychology, 8, 1939, págs. 351-379.
Army Air Force Aviation Psychology Program Research R~ports. ~eport #16,
Psychological research on operational training in the contm~ntal an forces, U.
Tennessee Se1f Concept Scale ¡TSCS)-escala de autoconcepto de Tennessee S. Government Printing Office, Washington, D. C., 1947, pags. 101-105.
Arthur, G., A point scale 01 per/ormance tests, Commonwealth Fund, Nueva
Counselor Recordings and Tests York, 1943. . .
Tiempo de la prueba: sin límite, aproximadamente 20 minutos Assessment Staff, U. S. Office of Strat~ic Services, Assessment of men, Rinehart,
Edad: de 12 años o más Nueva York, 1948. . ,
Baird, L. y Feister, W. J., "Grading standards: the relatl0n. of changes ~ average stu-
La TSCS es un instrumento de autoadministración que consiste en 100 enuncia- dent ability to the average grades awarded", en Amencan EducatlOnal Research
dos con cinco opciones de respuesta que varían en un rango desde completamente loumal, 9, 1972, págs. 431-442. . .
fals~ hasta completamente verdadero. Hay disponibles dos formas: la de asesoría y la Barrett H. O. HAn examination of certain standardized art tests to determme therr
clínica y de investigación, pero ambas formas contienen los misI?os reactivos y dif.ie- reÍation t~ classroom achievement and to intelligence", en lournal 01 Educatio-
ren sólo en el método para calificarlas. La forma de asesoría consiste en 14 puntuacIO- nal Research, 42, 1949, págs. 398-400.
nes, en tanto que la forma clínica y de investigación produce 30 puntuacion~s. L~s Barrett, R. S., "The influence of supervisor's requirements on ratings", en Personnel
reactivos se construyeron para apreciar los siguientes aspectos del yo mismo: Identi- Psychology, 19, 1966, págs. 375-388. .
dad autosatisfacción, conducta, yo físico, yo social, yo eticomoral, yo personal y yo Bayley, N., Bayley Scales ot Intant D.e velopment, Psychological Corporation, Nueva
fam'iliar. Además, se dan tres puntuaciones derivadas: puntuación positiva total, que York,1969.
refleja el nivel total de autoestima¡ puntuación de variabilidad, que refleja la cantidad Bayley, N., HConsistency and variability in the growth of intelligence from birth to
de consistencia entre las áreas del yo, y puntuación de distribución, que refleja la eighteen years", en loumal of Genetic Psycho~ogy, 75, 194?, págs. 16~-196.
tendencia a usar calificaciones de respuesta extremas. El proceso de calificación es te- Berdie, R. F., "Strong Vocational Interest scores of hlgh school semors and thetr later
dioso. El manual para la prueba está incompleto y le falta mucha información esencial.
occupational entry·, en lournal 01 Applied Psychology, 49, 1965, págs. 1.88-193.
En su etapa actual de desarrollo, es más adecuado para la investigación.
Birns, B., MIndividual differences in human neonates' responses to stunulatJonll, en
Child Development, 36, 1965, págs. 249-256.
Blatchford, C. H., Experimentalsteps to ascertain reliability of diagnostic tests in
Thomdike Dimensions of Temperament ¡TDOTI-dimensiones del temperamento
Thomdike English as a second language, Tesis doctoral inédita, Teachers College, Colum-
bia University, Nueva York, 1970.
The Psychological Corporation Bloom, B. ¡dir.), Taxonomy 01 educational obiectives, Handbook 1: Cognitive
Tiempo de la prueba: de 30 a 45 minutos domain, Longmans, Green &. Co., Nueva York, 1956. . .
Grados: 11 y superiores Bloom, B. S., Stability and change .in human characteristIcs, WIley, Nueva
York,1964.
Para su análisis, consúltese el capítulo 11. Blumberg, H. H., De Soto, C. B. y Kuethe, J. L., "Evaluation of rating scale formats·,
en Personal Psychology, 19, 1966, págs. 243-260.

653
654 BIBLIOGRAFíA
BIBLIOGRAFíA 655
Boynton, B., "The Physical growth of girls", en University 01 lowa Studies in Child Buros, O. K., Science: tests and reviews, Gryphon Press, Highland Park, N. J., 1975g.
Wellare, 12, núm. 4, 1936. Buros, O. K., Vocational: tests and reviews, Gryphon Press, Highland Park N. J.,
Boynton, M., "Inclusion of None of These makes spelling items more difficult", en 1975h. '
Educational and Psychological Measurement, ID, 1950, págs. 431-432. Buros, O. K., Personality: titles and reviews Il, Gryphon Press, Highland Park, N. J.,
Bradway, K. P. Y Thompson, C. W., "Intelligence at adulthood: A twenty-five year 1975i.
fo11ow-up", en Toumal 01 Educational Psychology, 53, 1962, págs. 1-14. Campbell,1. P., Dunnette, M. D., Arvey, R. D. Y Hellervik, L. V., IIThe development
Bray, D. W., Campbe11, R. J. YGrant, D. L., Formative years in business: Along-term and eváluation oE behaviorally based rating scalesll, en Toumal 01 Applied
AT&T study 01 manageriallives, Wiley, Nueva York, 1974. Psychology, 57, 1973, págs. 15-22.
Brookover, W. B., 'Person-person interaction between teachers and pupils and tea- Carroll, J. B. YSapon, S. M., Modem Language Aptitude Test, The Psychological Cor-
ching effectiveness", en T. 01 Educat. Res., 34, 1940, págs. 272-287. poration, Nueva York, 1958.
Buel, W. D., "Voluntary female clerical tumover: The concurrent and predictive vali- Cattell, P., Cattell1nlant lntelligence Scale, The Psychological Corporation, Nueva
dity of a weighted application blank", en loumal 01 Applied Psychology, 48, York,1960.
1964, págs. 180-182. Cattell, lL B., Eber, H. W. y Tatsuoka, M. M., Handbook lor the Sixteen Personalíty
Buel, W. D., Albright, L. E. Y Glennon, J. R., "A note on the generality and cross- Factor Questionnaire i16 PFJ, Institute for Personality and Ability Testing,
validity of personal history Eor identifying creative research scientists", en Tour- Champaign, Ill., 1970.
nal 01 Applied Psychology, 50, 1966, págs. 217-219. Cattell, R. B. et aL, Ob;ective personality and motivation tests: A theoretical
Buhler, R. A., Flicker lusion threshold and anxiety level, Tesis doctoral inédita, introduction and practical compendium, University of Illinois Press, Urba-
Columbia University, Nueva York, 1953. na, Ill., 1967.
Buros, O. K., "Educational, psychological, and personality tests oE 1933, 1934, and Clark, e . A, MThe use of separate answer sheets in testing slow-Ieaming pupils", en
1935", en Rutgers University Bulletin, 13, núm. 1, Studies in Education, No. 9, Toumal 01 Educational Measurement, 5, 1968, págs. 61-64.
School oE Education, Rutgers University, New Brunswick, N. J., 1936. Cleary, T. A., ~est bias: Prediction of grades of Negro and white students in integrated
Buros, O . K., NEducational, psychological, and personality tests oE 1936", en Rutgers colleges", en Toumal 01 Educational Measurement, 5, 1968, págs. 115-124.
University Bulletin, 14, núm. 2A, Studies iu Education. No. 11, School of Edu- Cleary, T. A., "Tests bias: Validity of the Scholastic Aptitude Test for Negro and
cation, Rutgers University, New Brunswick, N. J., 1937. white students·, en College Entrance Examination Board Research Bulletin,
Buros, O. K., The 1938 mental measurements yearbook, Rutgers University Press, junio, 1966. . . . ._.-
New Brunswick, N. J., 1938. Coleman, J. S. et aL, Equality 01 educational opportunity, U. S. Government Printing
Buros, O. K., The 1940 mental measurements yearbook, The Mental Measurements Office, Washington, D. c., 1966. . __
Yearbook, Highland Park, N. J., 1941. College Entrance Examination Board, Effects 01 coaching on Scholastic Aptitude
Buros, O. K., The third mental measurements yearbook, Rutgers University Prcss, Test scores, College Entrance Examination Board, Princeton, N. J., 1968.
New Brunswick, N. J., 1949. Cook, W. y Leeds, C. H., Measuring the teaching personality. Educational and
Buros, O. K., The lourth mental measurements yearbook, Gryphon Press, Highland Psychological1Y1easurement,7, 1947, págs. 399-410.
Park, N. J., 1953. . Cooley, W. W. y Lohnes, P. R., Predicting development 01 young adults, American
Buros, O. K., The fifth mental measurements yearbook, Gryphon Press, Hlghland Institute' for Research, Palo Alto, Calif., 1968.
Park, N. J., 1959. Coombs, e . H., Milholland, J. E. YWomer, F. B., "The assessment oE panial knowled-
Buros, O. K., Tests in print, Gryphon Prcss, Highland Park, N. J., 1961. ge", en Educational and Psychological Measurement, 16, 1955, págs. 13-37.
Buros, o. K., The sixth mental measurements yearbook, Gryphon Press, Highland Cronbach, L.]" Essentials 01 psychological testing, Harper &. Row, Nueva York, 1970.
Park, N . J., 1965. Chaney, F. B. y Owens, W. A., IlLife history antecedents of sales research and gene-
Buros, O. K., Reading tests and reviews, Gryphon Press, Highland Park, N. J., 1968. ral engineering interests", en Toumal of Applied Psychology, 48, 1964, págs.
Buros, O. K., Personality tests and reviews, Gryphon, Highland Park, N. J., 1970. 101-105.
Buros, O. K., The seventh mental measurements yearbook, Gryphon Press, High- Chase, e . I., uRe1ative length of options and response set in multiple-choice items· , en
Iand Park, N. J., 1972. Toumal 01 Educational Measurement, 1, 1964, pág. 38.
Buros, O . K., Tests in print n, Gryphon Press, Highland Park, N. J., 1974. Chun, K., eobb, S. y French, J. R. P. Jr., Measures lor psychological assessment, Insti-
Buros, O . K., Foreign Language: tests and reviews, Gryphon Press, Highland Park, N. tute for Social Research, The University of Michigan, Ann Arbor, Mich., 1975.
J., 1975a. Davis, F. B., "Estirnation and use of scoring weights for each choice in multiple-choice
Buros, O. K., English: tests and reviews, Gryphon Press, Highland Park, N. J., 1975b. test items", en Educational and Psychological Measurement, 19, 1959, págs.
Buros, O. K., lntelligence: tests and reviews, Gryphon Press, Highland Park, N. J., 2.91-2.98.
1975c. . Dizney, H. F., Merrifield, P. R. YDavis, O. L. Jr., MEffects oE answer-sheet format on
Buros, O. K., Mathematics: tests and reviews, Gryphon Press, Highland Park, N. J., arithmetic test scores", en Educational and Psychological Measurement, 16,
1975d. 1966, págs. 491-493.
Buros, O. K., Reading: tests and reviews, Gryphon Press, Highland Park, N. J., Do11, E. A, Measurement 01 social competance, Educational Test Burcau, Educatio-
1975e. nal Publishers, Minneapolis, Minn., 1953.
Buros, O. K., Social Studies: tests and reviews, Gryphon Prcss, Highland Park, N. J., Doll, E. A, Vineland Social Maturity Scale, American Guidance Service, Inc., Min-
19751. neapolis, Minn., 1965.

.: :. ... .
. , .. . ... , >, .... ,,: .
; '.! . . ~ .. '; ' ,- '.y; .':.,.;.... .~.' . ~.•.~., ' .,' .
656 BIBLIOGRAFíA BIBlIOGRAFfA 657
Doppelt, J., 'Estimating fulI-scale score on the Wechsler Adult Intelligence Scale Gesell, A. et al., The first five years 01 lile: A guide to the study 01 the preschool
from scores on four subtests", en ¡oumal 01 Consulting Psychology, 20, 1956, child, Harper, Nueva York, 1940.
págs. 63-66. . Ghiselli, E. E., uThe validity of aptitude tests in personnel selection", en Personnel
DuBois P. /dir.) The classification programo Army Air Porces Aviation Psycho- Psychology, 26, 1973, págs. 461-477.
log~ Progra~ Report No. 2, U. S. Covemment Printing Office, Washington, Ghiselli, E. E., The validityo/occupational aptitude tests, Wiley, Nueva York, 1966.
D. c., 1 9 4 7 . . . . . . Ghiselli, E. E. YBarthol, R. P., uThe validity of personality inventories in the selectíon
Dunn, L. M., Peabody Picture Vocabulary Test, Amencan Crndance ServlceS, Mm- oE employees", en ¡oumal 01 Applied Psychology, 37, 1953, págs. 18-20.
neapolis, Minn., 1959. . Goodenough, F. L. Y Maurer, K. M., "The mental growth of children from two to
Dunn, T. F. ., CoIdstein, L. C., HTest difficuIty, vaIidity, and reliability as functíons of fourteen years: A study oI the predictive value of the Minnesota Pieschool Sca-
selectíve multiple-choíce ítem construction principIes", en Educational and les", en University 01 Minnesota Institute 01 Chíld Wellare Monograph, 1942,
Psychological Measurement, 19, 1959, págs. 171-179. núm. 19.
Ebel, R. L., 'Confidence weíghting and test reliability", en ¡oumal 01 Educational Goodenough, F. L., Maurer, K. M. Y Van Wagenen, M. J., Minnesota Preschool Scales:
Measurement, 2, 1965, págs. 49-57. Manual o[ instructions, Educational Test Bureau, Minneapolis, Minn., 1940.
Eben, E. y Simmons, K., HThe Brush Foundatíon study of child growth and ~evelo'p­ Gordon, E., Musical Aptitude PlOlile, Houghton Mifflin, Boston, Mass., 1965.
mento 1: Psychometric tests", en Monograph 01 the Society/or Research lD Chlld Gordon, E., A three-year longitudinal predictive vali dity study o[ the Musical Apti-
Development, 8, núm. 2, 1943. . tu de Profile, University of Iowa Press, Iowa City, Iowa, 1967.
Educational Testing Servíce, Test Development Division, Multiple-choice questions: Goslin, D. A., Teachers and testing, RusselI Sage Foundation, Nueva York, 1967,
A close look, EducatíonalTesting Service, Princeton, N. J., 1963. págs. 25-33.
Ellis, A., 'Recent research with personality ínventories", en ¡oumal 01 Consulting Grimsley, C., Ruch, F. L. Warren, N. D. Y Ford, J. S., Employee Aptitude Survey,
Psychology, 17, 1953, págs. 45-49. PsychoIogical Services, Los Angeles, Calif., 1963. .
Ellis, A., 'The validity of personality questíonnaíres", en Psycholof,ical Bulletin, 43, Gronlund, N. E., Sociometry in the c1assroom, Harper, Nueva York, 1959, págs.
1946, págs. 385-440. 164·166.
Ellis, A. y Conead, H. S., flThe validity of personalíty inventories ín military practice", Guilford J. P., The natura 01 human intelligence, McGraw-Hill, Nueva York, 1967.
en Psychological Bulletin, 45, 1948, págs. 385-426. . HalliwelÍ, J., W., "The relationship of certain factors to marking practices in indivi-
England, C. W., Development .and use 01 weighted application blanks, Wilham C. dualized reponing programs", en ¡oumal 01 Educational Research, 54, 1960,
Brown, Dubuque, Iowa,196l. págs. 76·78. .
Exner, John E. Jr., TheRorschach Systems, Crune and Stratton, Nueva York, 1969. Harari, O. y Zedeck, S., HDevelopment of behaviorally ancho red scales for the eva-
Eysenck, H. J., The scientific study 01 personality, Macmillan, Nueva York, 1952: luation DI faculty teaching", en Joumal 01 Applied Psychology, 58, 1973,
Feldhusen, J. F., u An evaluation of college student's reactions to open book examma- págs. 261-265.
tíons' en Educat. and Psychol. Meas., 21, 1961, págs. 637-646. Harrington, W., "Recommendation quality and placement success", en Psychological
Findley, W. C. y Bryan, M. M., Abiliiy grouping: 1970 Status. impact and alterna· Monographs, 1943, núm. 252.
tives, Atenas, Grecia: Center for Educatíonal Improvement, University of Harris, D. B., Children's drawings as measures 01 intellectual maturity, Harcourt,
Ceorgia, 1971. . Brace &. World, Nueva York, 1963.
Fivars, C. y Cosnell, D., Nursing evaluation: The problem and the process, MacmI· Harris, D. B. Y Pinder, C. D., The Goodenough·Harris Drawing Test as a measure 01
lIan, Nueva York, 1966, cap. 9. intellectual maturity of youths, National Center for Health Statistics, DHEW
FIanagan, J. C. y CooIey, W. W., PlOject Talent: One-yearlollow·up studies, Univer- Publication No. /HRAJ 74-1620, Rockville, Md., 1974.
sity of Pittsburgh SchooI of Education, Pittsburgh, Pa., 1966. Hanshome, H. y May, M. A., Studies in deceit, Macrnillan, Nueva York, 1928.
Flanagan, J. C., Tiedman, D. V., WilJis, M. B. YMcLaughlin, D. H., The Career Data Hayward, P., NA comparison of test performance on three answer-sheet Iormats", en
Book: resuIts Irom Project Talent' s five-year lollow-up study, American Jnstitu- Educational and Psychological Measurement, 27, 1967, págs. 997-1 004.
tes for Research, Palo Alto, Calif., 1973. HighIand, R. W. y Berkshire, J. R., A methodological study of forced choice perfor-
Flanders N. A. MTeacherinfluence, pupil attitudes, and achievement', en U. S. Office mance rating, Human Resources Research Center, Lackland Air Force Base, San
01 ÉducatÍon Cooperative Research Monograp~, U. S. Covernment Printing Antonio, Texas, mayo, 1951 /Research Bulletin, 51·9).
Office, Washington, D. c., 1965, núm. 12. . Hobbs, N./dir.), Issues in the classilication of children, ]ossey-Bass, San Francis-
French, J. W., "TIte description of aptitude and achievement tests in terms oI rótated co,1975. .
factors', en Psychometric Monographs, 1951, núm. 5. Holland, J. L., Tbe psychology olvocational choice, Blaisdell, Waltham, Mass., 1966.
French, 1- W., "The effect of anxiety on verbal and mathematicaI examination scores", Honzik, M. P., McFarlane,]. W. y Allen, L., 'The stability oE mental test performance
en Educational and Psychological Measurement, 22, 1962, págs. 553-564. between two and eíghteen years", en Joumal 01 Experimental Education, 17,
Gardner, E. F. Y Thompson, G. G., Syracuse Scales 01 Social Relations, Harcourt, 1948, págs. 309-324.
Brace &. World, Nueva York, 1958. Hopkins, K. D., Lefever, D. W. y Hopkins, B. R., HTV versus teacher administration DE
Carry, R., 'Individual differences in ability to fake vocational interests", en ¡oumal 01 standardízed tests: Comparability of scores/, en foumal 01 Educational Measu·
Applied Psychology, 37, 1953, págs. 33·37. rement, 4, 1967, págs. 35-40.
Gerberich, J. R., Specimen objective test ítem s: A guide to achievement test cons· Hom, C. A. y Smith, L. F., The Hom Art Aptitude Inventory, en Joumal 01 Applied
. truction, Longmans, Creen and Co. /David McKay), Nueva York, 1956. Psychology, 29, 1945, págs. 350-355.
BIBLJOGRAFIA 659
658 BlBlIOGRAFIA
McKay, Nueva
junior colleg~s·, Miller, D. c., Handbook of research design and social measur ement,
Hoyt, D. P. Y Munday, L., "Academic descrip tion and predicti on inNo. lO, Arnenc an York, 1964.
en Americ an College Testing Program Research Reports 1966 . Miller l., u A note on the evaluation of a new answer fonn" ' en Toumal
01 App1ied
College Testing Program , Iowa City, Iowa, 1966. Psycho1o&y,49, 1965, págs. 199-201.
validities", en
Huck, J. R., "Assessmentcenters: Areview of the external and internal Mitchel l, B. c., HPredictive validity of the Metlopo litan Readine
ss Tests and
Persona l Psycho1ogy, 26, 1973,2, págs. 191-212 . white and Negro student s" en
in multip le- Murphy -Durrel l Readin g Readine ss Tests for
Hughes , H. H. Y Trimble , W. E., 'The use of complex alternat ives 25, 1965, Educat ional and Psychol ogical Measur ement, 27, 1967, págs. 1047-1
054.
choice items', en Educat ional and Psychol ogical Measur ement, use: An attempt at valida-
Mogul, S. y Satz, P., ..Abbrev iation of the WAIS for clinical
págs. 117-126. 01 airciaf t tion", en Toumal of C1inica1 Psycho10gy, 19, 1963, págs. 298-300
.
Judy, c. J., A compar ison 01 peer and supervi soIY ranldng s as criteria ity, Nue- Moses, J. L., uThe deve10pment of an assessm entcent er for the early
identification of
ance prolicie ncy, inédito, Teache rs College, Columb ia Univers
mainten supervis~ry P?t~ntial", en Personne1 Toumal , 26, 4, 1973,
págs. 569-580 .
va York, 1952. grades in predom inantly Negro colleges ' en Touma1
hy scales as Munday , L., Predlctmg college
Kaufma n, A. S., 'Cómpa rison of the WPPSI, Stanlord-Binet and McCart 36, 1973, of Educati onal Measur ement, 2, 1965, págs. 157-160.
'
predicto rs of first-grade achievement", en Perceptual and Motor Sltills, Murray , H. A. et a1., Explora tions in persona lity, Oxford Univers ity Press, Nueva
págs. 67-73. York, 1938.
research, Holt,
Kerlinger, F. N. Y Pedhazu r, E. J., Multip1e regression in behavio ral Nationa l Education Associa tlon, "Reports to parents ', en NEA Researc
h Bulleti n 45
Rineha rt &. Winston , Nueva York, 1973. ' ,
, en Person nel 1967, págs. 51-53.
Klores, M. S., IlRater bias in forced-distribution performance ratings' Neville, D., uThe relation ship between reading skills and intellige nce test scores" , en
Psycholo&y, 19, 1966, págs. 411-421 . r, 18, 1965, págs. 257-262 .
neurom otor and The Reading Teache
Knoblo ch, H. y Passamanick, B., MPrediction from the assessm ent of atho1ogy Olson, W. c., MThe measur ement of nervous habits in normal children núm.. 3.
", en Univer-
intellec tual status in infancy ', en J. Zubin y G. A. Jervis (dirs.I, Psychop aph, 1929,
sity of Minneso ta Institut e of Child We1fare Monogr
01 mental develop ment, Grune &. Stratton , Nueva York, 1967. Test Harcou rt
nal objecti ves, Orleans, J. B. Y Hanna, G. S., Orleans-Hanna Geomet ry Prognosis
Krathw ohl, D. R., Bloom, B. S. y Masia, B. B., Taxono my of educatio domain , David Brace Jovanovich, Nueva York, 1968.
'
the classilication of educati onal goa1s, Handbook II: Affectiv e Orleans , J. B. Y Hanna, G. S., Orleans-Hanna Algebra Progno sis Test '
Harcou rt Brace
McKay , Nueva York, 1964. Jovanov ich, Nueva York, 1969.
reading test", en
Lamb, G: S., uTeacher verbal cues and pupil performance on a group Osgood , C. E.,Suci,G. J. y Tannenbaum, P. H., Themea sureme nto/me
aníng Uni-
Tournal 01 Educati onal Psychology, 58, 1967, págs. 332-336 . versity of Illinois Press, Urbana, 1957.
'
from differen t
Lesser, G. S., Fifer, G. y Clark, D., H., HMental abilities of childrenfor Resear ch in Owens, W. A. Jr., "The retest consiste ncy of Arroy Alpha after 30 years', en 'oumal 01
social-class and cultura l groups', en Monogr aphs of the Society
App1ie d Psychology, 38, 1954, pág. 154.
Chi1d Develop ment, 30, núm. 4, 1965. Peres, S. H . y Garcia, J. R-, "Validityand dimensi ons of descript ive adjective
s used in
Associa tion of
Lewis, L. S., HOn the genesis of gray-flanneled Puritans', en Americ an - referen ce letters for engineering applican ts", en Personne1 Psychology"
15 1962
Univer sity Professo rs Bulletin , 58, 1972, págs. 21-29. ,
págs. 279-286 .
Lins, L. J., HThe prediction of teaching efficien cy·, en 'ouma1 01 Experim .
ental Educa- Efficien cy Report (WD
. Personn el Research Se~tion, AGO, Ana1ys is of an Officer
tion, 15, 1946, págs. 2-60. W. H. AGO Form 67-11 using multiple raters, Adjutant Genera l's Office, Washin
gton,
ces in intellige nce,
Loehlin , H. c., Lindzey , G. y Spuhler, J. N ., Race differen
D. c., 1952a (PRS Report 8171.
. Freema n, San Francis co, Calif., 1975. . logy, validity
Prefere nce Personn el Research Section , AGO, A study of officer rating methodo
Longsta ff, H. p,,"Fak ability of the Strong Tnterest Blank and the Kuder and reliabil ity 01 ratings by single raters and multipl e raters, Adjutan
t General 's
01 Applied Psycho1 0gy, 32, 1948, págs. 360-369 .
Record ", en 'ouma1 Office, Washin gton, D. c., 1952b (PRS Report 9041.
the distribu tion
Lord, F. M., UThe relation of the reliability of multiple-choice tests to Personn el Research Section , AGO, Survey of the aptitude for service
rating system at
of item difficulties", en Psychom etrika, 17, págs_ 181-19 4. !he U. S. Military Academ y, West Point, New York, Adjutan t General
's Office
ing career per-
Loughm iller, G. c., Ellison, R. L., Taylor, C. W. y Price, P. B., uPredict Washin gton, D. c., 1953.
'
forman ce of physicia ns using the biograp hical inventor y approac h", en Tourna1 of Harcou rt, Brace &. Jovanov ich,
Pimsleu r, P., Pimsleur Langua ge Aptitud e BatteIY,
Vocatio nal Behavio r, 3, 1973, págs. 269-278. . Nueva York, 1966.
of interes ts
Mallins on, G. G. Y Crumri ne, W. M., "An investigation of the stability 45, 1952, págs. Pinchak , B. M. Y Breland, H. M., #Grading practices in Americ an high on Digest, 39,
schools : Natio-
of high school studen ts·, en 'ouma1 of Educatio na1 Researc h, of 1972", en Educati
nallong itudinal study of the high school c1ass
369-383 . 1974, pág. 21.
ogical Corpor a-
McCart hy, D., McCart hy Scales of Childre n's Abilities, The Psychol Preston, H. 0., The deve10 pment 01 a proced ure lor evaluat ing officersPa., 1948.
in the Uni-
tion, Nueva York, 1972. ts, Nueva ted States Air Force, America n Institut e for Researc h, Pittsbur gh,
McClel Iand, D. et al., The achieve ment motive, Appleton-Century-Crof Raven, J. c., Progressive Matrices, H. K., Lewis, London, 1956 (Distrib
uidor: The
York, 1953. Psychological Corpora tionl.
inédita, George
McCull y, C. H., The va1idit y 01 the Kuder Preference Record , Tesis Reed, H. J., 11An investig ation of the relation ship between teachin g effective on, 21,
ness and
Washin gton Univers ity, Washington, 0_ c., 1954. the teacher's attitude of acceptan ce", en Tournal 01 Experim ental Educati
ion blank", en
McGra th, J. J., "Improv ing creditev aluation with a weighte d applicat 1953, págs. 277-325 .
Toumal of Applied Psycholo &y, 44, 1960, págs. 325-32 8.

..: ..- . ' . ..


... .... . ..;.:.
BIBUOGRAFiA 661
660 BIBLIOGRAFíA
Strong, E. K., "Nineteen-year follow-up of engineer interest", en !oumal 01 Applied
Remmers, H. H., Shock, N. W. y Kelly, E. L., "Anempiricalstudyofthevalidity of the Psychology, 36, 1952, págs. 65-74.
Spearman Brown formula as applied to the Purdue Rating Scale*, en ¡oumal 01 Stutsman, R., Mental measurement 01 pre-school children, with a guide lor the
Educational Psychology, 18, 1927, págs. 187-195. administration 01 the Merrill-Palmer Scale 01 mental tests, World Book, Yon-
Richardson, M. W. y Kuder, G. F., HMaking a rating scale that measures·, en Person- kers, N. Y., 1931.
nel ¡oumal, 12, 1933, págs. 36-40. . . . . Super, D. E., uThe Bernreuter Personality Inventory: A review oI research", en
Rimland B. uThe effects of varying time límits and of usmg nght answer not gIven m Psychological Bulletin, 39, 1942, págs. 94-125. .
exp~ri~ental Iorms oI the U. S. Navy Arithmetic Testn , en Educational and Syrnonds, P. M., Diagnosingpersonality and conduct, Nueva York, Century, 1931.
Psycbological Measurement, 20, 1960, págs. 533-539. . Terrnan, L. M. YMerrill, M. A., Stanlord-Binet Intelligence Scale: Manual lor third
Robinson, J. P. y Shaver, P. R., Measures 01 social psychological attit?-des, InstItute revision, Houghton Mifflin, Boston, Mass., 1973. .
for Social Research The University of Michigan, Ann Arbor, MICh., 1973. Thorndike, R. L., MThe prediction of intelligence at college entrance from earher
Rollíns, H. A., McCandÍess, B. R., Thompson, M ..y Brassell, W. R., uPr?ie~t succ~ss tests", en !oumal 01 Educational Psychology, 38, 1947, págs. 129-148.
environment: an extended application of contmgency management m mner-cIty Thorndike, R L., "A Verification Key for the Thorndike Dimensions of Tempera-
schools" en !oumal 01 Educational Psycbology, 66, 1974,2, págs. 167-178. ment", en !ournal 01 Educational Measurement, 5, 1968, págs. 331-332.
Rosenbaum, 'B. L., An empirical study 01 attitude toward invasion o~ priv~cy a.s it Thorndike, R. L. Y Hagen, E. P., 10000 Careers, Wiley, Nueva York, 1959. .
relates to personnel selection, inédito, Teachers College, Columbia Umverslty, Thorndike, R. L., Hagen, E. P. Y Lorge, 1. D., Lorge-Thorndike Intelligence Tests,
Nueva York, 1971. Multilevel Edition, Houghton Mifflin, Boston, Mass., 1966.
Ross, A. O., Lacey, H. M. y Panon, D. A., "The development of a behavior checklist Thorndike, R. L., Hagen, E. P. Y Lorge, 1. D., Cognitive Abilities Test, Primary Bat-
for boys", en Child Development, 36, 1965, págs.. 1 013-1.027. tery Houghton Mifflin, Boston, Mass., 1968.
Ruch, F. 1. et a1., Employee Aptitude Survey, PsychologIcal Servlces, Ine., Los Ange- Thorndike, R. L., Hagen, E. P. Y Lorge, 1. D ., CognitiveAbilities Test, Multilevel Edi-
les, 1965. tion Houghton Mifflin, Boston, Mass., 1972.
Sarason, 1. G., UTest anxiety and the intellectual performance of college students", en Thursto~e, L. L., "Primary mental abilities", en Psychometric Monographs, 1938,
!onmal 01 Educational Psycbology, 52, 1961, págs. 201-206. núm. 1.
Sarason S. B. et al. Anxiety in elementary school children, Wiley, Nueva York, 1960. Torrance, E. P., Torrance Tests 01 Creative Thinking, Personnel Press, Princeton, N.
Schaefe~, C. E. y ~astasi, A. A., UBiographical Inventory for identifying creativity in J., 1966. .
adolescent boys', en !oumal 01 Applied Psychology, 52, 1968, págs. 42-48. Tuddenham, R. D., "Soldier intelligence in World Wars 1 andIl", en Amencan
Scott, R D. Y Johnson, R. W., "Use of the weighted application blank in selecting unski- Psychologist, 3, 1948, págs. 54-56. .
Ued employees', en !oumal 01 Applied Psychology, 51, 1967, págs. 393-39~. United States Employment Service, Manual lor the General Aptitude Te~t Battery,
Sears, R. R., Rau, L. y Alpen, R., Identilication and child rearing, StanIord Umver- Section III: Development, United States Depattment of Labor, Washington, D.
sity Press, Stanford, Calif., 1965. c., 1967.
Shaw, M. E. Y Wright, J. M., Scales lor the measurement 01 attitudes, McGraw-Hill, Vernon, P. E., The structure 01 human abilities, Methuen, Londres, 1960.
Nueva York, 1967. Vernon, P. R, MThe distinctiveness of field independence", en !oumal 01 Personality,
Siskind, G., uMine eyes have seen a host of ange]s", en American Psychologist, 21, 40, 3, 1972, págs. 366-391.
1966, págs. 804-806. WahJstrom, M. y Boersma, F. J., "The influence of test-wiseness upon a~hievement*,
Slater R. D. uThe equivalency of IBM mark-sense answer cards and IBM answer en Educational and Psychological Measurement, 28, 1968, pags. 413-420.
sheets w'hen used as answer forrnats for a precisely timed test oI mental ability", Wason, P., "Response to affirmative and negative binary staternents", en British !our-
en !oumal 01 Educational Research, 57, 1964, págs. 545-547. nal 01 Psychology, 52, 1961, págs. 133-142.
Slosson, R. L., Slosson Intelligence Test, Slosson Educational Publications, East Waters, L. K., uEffect of perceived scoring formula on sorne aspects of test performance*,
Aurora, N. Y., 1963. en Educational and Psychological Measurement, 27, 1967, págs. 1005-1010.
Smith, P. C. y Kendall, L. M., "Retranslation of expectations: An approach to the cons· Webb, J., Campbell, D. T., Schwanz, R. D . Y Sechrest, L., Unobtrusive Me~sures: Non-
truction of unambiguous anchors for rating scales", en ¡oumal 01 Applied reactive research in the social sciences, Rand McNally &. Co., Chicago, 1966.
Psychology, 47, 1963, págs. 149-155. Wechsler, D., Wechsler Adult Intelligence Scale, The Psychological Corporation,
Sto John, C. W., 'Educational achievernent in relation to intelligence as shown by tea-
Nueva York, 1955.
cher's marks, promotions and scores in standard tests in cenain elementary gra-
Wechsler, D., Wechsler Intelligence Scale for Children-Revised Manual, The
des", en Harvard University Studies in Education, 15, 1930.
Psychological Corporation, Nueva York, 1974.
Stanley, J. C. y Poner, A. C., "CorreJation of scholastic-aptitude test scorewith college
Wechsler, D., Wechsler Preschool and Primary Scale 01 Intelligence, The Psycholo-
grades for Negroes versus whites*, en !oumal 01 Educational Measurement, 4,
1967, págs. 199-218. gical Corporation, Nueva York, 1967.
Wesman, A. G. YBennett, G. K., -The use of 'None ofThese' as an option in test cons-
Strong, E. K., Vocatiol\.al interests 01 men and women, Stanford University Press,
Stanford, CaliI., 1943. truction", en !oumal 01 Educational Psychology, 37, 1946, págs. 533-539.
Strong, E. K., 'Jnterest scores while in college of occupations engaged in twenty years Wheeler, L. R., IfA comparative study of the intelligence of east Tennessee mountain
later*, en Educat. and Psychol. Meas., 11, 1951a, págs. 335-348. children", en !oumal 01 Educational Psychology, 33, 1942, págs. 321-33~.
White, M. A. Y Boehm, A., "Child's world of Iearning: Written workload of pupils·,
Strong, E. K., "Permanence of interest scores over twenty-two years", en !ournal 01 en Psychology in the Schools, 6, 1967, págs. 70-73.
Applied Psychology, 35, 1951b, págs. 89-91.
662 BIBLIOGRAFíA

Witkin H. A et a1., Psychological differentiation, Wiley, Nueva York, 1962.


Yama~oto, K. y Dizney, H. F., "Effects of three sets of test instructions on scores on
an int~ligence scaIe", en Educational and Psychological Measurement, 25,
1965, págs. 87·94. .
Yonge, G. D. Y Heist, P. A, "The influence of suggested content on faking a personality
test", en American Educational Research Toumal, 2, 1965, págs. 137-144.
Zem, D., "Effects of variations in question phrasing on true-false answers by grade-
school children", en Psychological Reports, 20 {2}, 1967, págs. 527-533.
, .
Indice onomástico

Dizney, H., 538, 544


Doll, E., 455
Barrett, H., 378 Doppelt, Jo, 303
Bayley, N., 307, 314 Dunn, L., 303
Bennett, G., 235 Dunn, T., 225, 232
Berdie, R., 404
Berk.shire, J., 459 Ebel, R., 246
Bims, B., 495 Eber, Ho, 422
Blatchford, C., 96, 100 Ebert, E., 308
Bloom, B., 318 Ellis, A., 421
Boehm, A.1 571 England, G., 390
Boersma, F., 232 Exner, J., 484
Bountom, B., 235 Eysenck, H., 481
Bradway, K., 317
Bray, Do, 486, 489 Fifer, G., 324
Breland, H., 569 Findley, W., 336
Bruel, W., 390 Fivars, G., 464
Bryan, M., 336 Flanagan, J., 320
Buros, O., 153, 157 Flanders, N., 497
French, J., 156, 346, 562
Campbell, D., 393, 397
Campbell, R., 459, 486, 489 Garcia, J., 434
Carrol, Jo, 373 Gardner, E., 470
Cattell, P., 307 Garry, R., 403
Cattell, R., 422, 482 Gerberich, J., 236
Clark, D., 324, 538 Gesell, A, 306
Clearly, To, 326, 563 Ghiselli, Eo, 361, 363, 421
I Cobbs, S., 156
Coleman, J., 326
Goldstein, Lo, 225, 232
Goodenough, Fo, 309
! Cooley, W., 364, 366 Gordon,E., 376
l Coombs, C., 246
Cordero,. P., 30
Goslin, D., 539
Grant, D., 486, 489

II
&
. Cronbach, L., 343
Crumrine, W., 402
Gronlund, N., 465
Guilford, J., 346, 379, 408

Hagen, Eo, 290, 314


.¡ Chaney, F., 390

Chase, C_, 232 Hanna, G., 374
¡ Harari, 00,459
1 Chun, K., 156

663

~. ".. :
íNDICE ONOMÁSTICO 665
664 íNDICE ONOMÁSTICO

Wechsler, D., 299 Yamamoto, K., 544


Harris, D., 304-305 Passamanick, B., 308 Yonge, G., 419
Hartshome, H ., 477, 479-480 Pedhazur, E., 368n Wesman, A., 235
Peres, S., 434 Wheeler, L., 323
Hayward, P., 538 Zedeck, S., 459
Pimsleur, P., 373 White, M., 571
Hcist, P., 419 Zern, D., 220
Highland, R., 459 Pinchak, B.,. 569 Witkin, H., 481
Hobbs, N., 596 Porter, A., 326, 563
Holland, J., 396 Preston, H., 438
Hopkins, K., 545
Horn, C., 378 Raven, J., 304
Hoyt, D., 571 Rernmers, H., 447
Huck, J., 486 Richardson, M., 455
Hughes, H., 235-236 Rimland, B., 235
Robinson, J., 156
Johnson, C., 30 Rollins, H., 499
Johnson, R., 390 Rosenbaum,·B., 592
Judy, c., 461 Ross, A., 455

Kaufman, A., 309 SapoD, S., 373


Kendall, L., 458 Sarason, S., 562
KerJinger, F., 368n Satz, P., 303
Knobloch, H., 308 Schaefer, C., 390
Kuder, G., 400, 455 Scott, R., 390
Sears, R., 496
Shaver, P., 156
Lamb, G., 544 Simmons, K., 308
Lesser, G., 324 Siskind, G ., 434
Lewis, L., 434 Slater, R., 538
Loehlin, J., 324 Slosson, R., 303
Lohnes, P., 364, 366 Smith, L., 378
Longstaff, H ., 403 Smith, P., 458
Lorge, l., 290, 314 Sto John, c., 320
Loughmiller, G., 390 Stanley, J., 326
Strong, E., 393, 402-403
Mallinson, G., 402 Suci, G., 428
Maurer, K., 309 Super, D., 421
May, M., 477, 479-480 Symonds, P., 447, 458
McCarthy, D., 309, 314
McClelland, D., 74-75 Tannenbaum, P., 428
McCulIy, C., 404 Tatsuoka, M., 422
McGrath, J., 390 Terman, L., 295,314
Merril, M., 295, 314 Thompson, C., 317
Miller, l., 538 Thomdike, R., 290, 314
MitcheIl, B., 326 Thurstone, L., 346
MoguI, S., 303 Torrance, E., 379
Moses, J., 488 Trimble, W., 235-236
Mundag, L., 563, 571 Tuddenham, R., 323
Murray, H ., 483
Vemon, P., 345, 482
NevilIe, D., 310
Wahlstrom, M ., 232
Orleans, J., 374 Wason, P., 220
Osgood, c., 428 Waters, L., 245
Owens, W., 317, 390 Webb, J., 429
íNDICE ANALíTICO 667

referidas al criterio, 639-642 general, 350


soluciones, 180 subpruebas de la, 350
Aptitud(es) y batería de las pruebas de aptitu-
artísticas, inventario Hom de, 377 des diferenciales, 353-354
diferenciales, batería de pruebas de, musical, 375
144 utilidad, 354
, musicales, perfil Gordon de, 376 y predicción del éxito
subpruebas del, 376 académico, 355
Indice analitico Aptitud(es), prueba(s) de, 13
artística, 377 .
laboral, 355
Becas, programa de pruebas para el otor-
baterías de las, 624-625 gamiento de, 561
diferenciales, batería de, 144, 346
escolar, 526 Cálculo de la desviación estándar, 48-49
y éxito académico, 318-320 Calificación(es), 119,436
y pruebas de aprovechamiento es- con fiabilidad de las, 447
Actitudes, 384 Análisis tandarizado, diferencias, 289 de la(s} prueba(s), 545-546
mapeo de 422-423 académico, 177 especiales, 527 de respuesta restringida, 256
y medición de actitudes, diferen- de factores, 343 Arreglos de ómnibus, 294 objetiva, 244
cias, 422 de las respuestas de la prueba objetiva, Artículos en revistas profesionales, revi- y programá de pruebas, 537-538
medición de, 423-425 247 sión de, 160-161 escalas de, 435-436
formatos de la, 427 objetivos, 246-247 Asesoría y pruebas de habilidad cognosci- ancladas conductualmente, etapas,
y mapeo de actitudes, diferencias, discriminatorio, 364 tiva . 458-459-
422 Annual Review of Psychology, 160 educativa, 337-338 estándares de, 443-444
Actividades de los administradores de las . Anuarios para la medición mental. Véase vocacional, 338 igualación de, 582, 584-585
pruebas, 543-544 Mental Measurements Year- Asignación, técnicas de, 465 fidedigna, procedimientos para obte-
Adivinación, fórmula de corrección por, . books Asociación de campana, 232-233 ner una, 573-582
245 Apercepción temática, prueba de, 483- Atributo función, 570-573
Administración centralizada de pruebas, 484 cuantificación del, 19-20 instrumentos de, elementos, 448-449
545 Aplicación de prueba(s) definición de un, 17 marco de referencia para asignar, 580
Administradores de las pruebas, 543-544 facilidad de, 107 operacional, 19 perfil de, 141
actividades de los, 544 formas paralelas de, 81-82 identificación de un, 17 problemas, 464
Admisión Aprendizaje de la lectura, habilidades operaciones para medir un, 18 servicios de, clasificación, 537-538
a la universidad, programa de pruebas para el, 172-173 Autodeterminación y evaluación, 595 válidas, problemas, 438-446
de, 560 Aprovechamiento, nivel de, 326, 328 validez de las, 447-448
y pruebas de habilidad cognoscitiva, tablas del, 328 . Bandas de percentiles, 129 Calificador(es) .
334 Aprovechamiento estandarizadas, prue- objetivo, 129 con las personas-que se califican, iden-
Adultos escalas Wechsler de inteligencia bas de, 266,273 Batería tificación del, 439-440
para, 299 a nivel estatal, programas de, 282-283 de habilidades básicas, 524 disponibilidad del, 438
Agrupación de reactivos cortos de falso- baterías de las, 268-270 de medidas de desempeño para identi- idiosincrasias del, 444
verdadero y reactivos de fal- ventajas, 268 ficar la neurosis, 481 para realizar el trabajo necesario, in-
so-verdadero, 224 para la universidad, 279 Batería(s) de la(s) prueba(s) disponibilidad del, 438-439
Agrupamiento(s) para las escuelas secundarias, 279 de aprovechamiento, 632-639 programa educativo para los, 463~464
de la encuesta del temperamento Guil- utilidad, 267 estandarizadas, 266, 273 selección del, 461-462
ford-Zirnmerman, 408 y pruebas ventajas, 268 requisitos, 461
homogéneo, 336 de aprovechamiento, diferencias, de investigación de aptitudes de em- Campana, asociación de, 232-233
Ajuste, 383 266-267 pleado, 354 Canasta de documentos, 487
Alumno(s} de aptitud escolar, diferencias, 289 Batería(s) de las prueba(s) de aptitud(es}, Capacidad para la lectura, pruebas de,
en relación con, desempeño del Aprovechamiento, prueba(s) de, 13, 180 624-625 372-373
el potencial, 184, 580-581 baterías de las, 632-639 diferencial(es}, 144, 346 Carácter, 383
la perfección, 182, 580 de contenido de materias, 525 subpruebas de la, 347-350 Cartas de recomendación, 434
sus compañeros, 182,581 metropolitanas de, 270 y batería de las pruebas de aptitud validez de las, 434-435
interés del progreso académico por utilidad, 180 general, diferencias, 353-354 Centro de información de los recursos
los, 181 problemas, 180 escolar profesionales, 374-375 educativos. Véase. Education

666

,.,".:.', .
668 íNDICE ANALíTICO
íNDICE ANALíTICO 669
Resources Information Cen- Constructo(s), 14, 74n
ter validez del, 74-77 y evaluación, 599 de las escalas de puntuación estándar,
CI. Véase Coeficiente de inteligencia Constructor de pruebas y resultados de la prueba, toma de 130-131
Clase, intervalo de, 34, 36 fuentes del, 64 sugerencias, 602-604 prueba Graves de juicio de, 377
selección del, 36 guía de reactivos para el, 213 Definición de un atributo, 17 Disponibilidad
Coeficiente Y plan de prueba, 205 operacional, 19 de la medida criterio, 68
alfa, 84 Contenido Delimitación de las normas de grado, del calificador, 438
de correlación, 53, 610 de materias, pruebas de aprovecha- 119-120 para la lectura, pruebas de, 524
métodos para calcular el, 610-614 miento de, 525 Denominaciones, 596 Distribución de frecuencias, 34
Y mediciones, 55-56 validez de, 63 Derechos del grupo y evaluación, 597 División(es)
y pruebas, 55-56 Continuidad del programa de pruebas, Desarrollo educativo, prueba Iowa para de una prueba, 82
de inteligencia, 139, 298-299 522 el, 280 largas. Véase Composición escrita.
de desviación, 140 Conversión lineal, 133 subpruebas de la, 280 Documentos, canasta de, 487
intelectual. Véase Coeficiente de inte- Corrección de enunciados falsos y reacti- Desempeño
ligencia vos falso-verdadero, 222 del alumno en relación con Economía de los instrumentos de medi-
Coeficiente de confiabilidad, 79 Corrección por adivinación, fórmula de, el potencial, 184, 580~581 ción, 105-106
interpretación del, 88-90 245 la perfección, 182, 580 sugerencias, 105-106
Y grupo Correlación, coeficiente de, 53 sus compañeros, 182, 581 Edad
habilidad del, 91-92 métodos para calcular el, 610-614 para identificar la neurosis, bateria de mental, 122, 139, 298
rango del, 91 y mediciones, 55-56 medidas de, 481 normas de, 122-125
y tamaño de la prueba, 92-93 y pruebas, 55-56 pruebas de, 481 Editores de pruebas, 159
Colocación Creatividad, pruebas de, características, Desviación Educación y evaluación, 601
clasificación, 335 380 coeficiente de inteligencia de, 140 Education
decisiones de, 188 Criterio, prueba referidas al, 167 estándar, 48, 50-51, 131 Index, 162
College Entrance Examination Board, de aprovechamiento; 639-642 cálculo de la, 48-49 Resources Information Center, 162
559-560 guías para la construcción de la, 168~ unidades, 132 Educational ana Psychological Measure-
Compañeros, desempeño del alumno en 169 normal,50 ment, 161
relación con sus, 182, 581 Y pruebas de diagnóstico, 172 Diagnóstico, 275, 277-279, 337 Eficiencia mínima y prueba de habilida-
Competencia mínima, 284 Cualidades Diagnóstico, pruebas de, 172-175,275- des común, prueba de, 284-
Composición escrita, 172 a calificar, selección de las, 463 277,525 285
Conducta(s) de la medida criterio, 65-67 elección de las, 175-176 Ejercicio de respuesta restringida, 251-
a reportar en el registro anecdótico, de los instrumentos de medición, 61 requisitos, 172 252
507 del proceso de medición, 21 utilidad, 176 Elaboración
lista de, 455 Cuantificación del atributo, 19-20 Y pruebas referidas al criterio, 172 de los reactivos de la, 205, 208
Confiabilidad, 78 Cuartilas, 46 Dibujo(s) del registro anecdótico, 509-510
de la diferencia entre puntuaciones, Cuestionario, 389 de la figura, pruebas de, 304-305 Elección de la(s) prueba(s), 154
100-103 desventajas, 389 y vocabulario; prueba Peabody de, de diagnóstico, 1 72-175
de la medida criterio, 68 utilidad, 389 303 Encuesta
de las calificaciones, 447 y entrevista, 389 Diferencia(s) de intereses
de las pruebas de habilidad cognosciti- Curva normal exacta, 128 entre puntuaciones, confiabilidad de ocupacionales Kuder, 400
va, 290-294 la, 100-103 e inventario de intereses Strong-
del sistema Bell, 486 Decisiones individuales y evaluación, 602 Campbell, diferencias, 400
posibilidades, 79 acerca de la persona y evaluación, Diferencial semántico, 428-429 vocacionales Ohio, 402
procedimientos para calcular la com- 598 Dificultad de los reactivos del temperamento Guilford-Zimmer-
paración, 86c curriculares, 189-191 de la prueba, 211-212 man,408
Confiabilidad, coeficiente de, 79 de clasificación. Véase Decisiones de de opción múltiple, 226 agrupamientos de la, 408-410
interpretación del 88-90 ubicación Dimensiones del temperamento de Thom- características, 411-412
Y grupo de colocación, 188 dike, 416-417 Enfoque
habilidad del, 91-92 de selección, 10 polaridades de las, 417 de los resultados de la prueba
rango del, 91 de tipo curricular, 10 Director de pruebas, 534 predictivo, 367-369
Y tamaño de la prueba, 92-93 de ubicación, 10 características, 534 taxonómico, 364-367,371
Construcción de las pruebas referidas al instruccionales, 9 funciones, 534 del inventario de intereses, 391
criterio, guías para la, 168 personales, 10 Diseño Ensayo
de la(s) prueba(s) de pericia, 189 examen de, 251

... -------'
670 íNDICE ANALíTICO (NDICE ANAUTICO 671

preguntas de, 257 subpruebas, 299-300 laboral general, prueba de, 617-623
para medir las habilidades, poten- Y prueba de inteligencia Stanford-Bi- batería de las pruebas de aptitudes para el aprendizaje de la lectura, 172-
cial de las, 257 net, diferencias, 302-303 y predicción del, 355 173
redacción de las, 258-261 Escuela(s) y pruebas de habilidad cognosciti- potencial de las preguntas de ensayo
valor de las, 258 elemental, programa de pruebas para va, 322-323 para medir las, 257
prueba de, 258 la, 523-525 y medidas de interés, medidas de, 404
preparación de la, 261-262 inter~s del progreso por la, 181 Facilidad de aplicación de prueba, 107 Habilidad cognoscitiva, pruebas de, 290,
Entrevista, 386 por el personal de la, 182 Factores, análisis de, 343 294
estructurada, 386 secundariaJsl Figura humana, pruebas de dibujo de la, confiabilidad de las, 313t
guía de la, 387c-38Se programa de pruebas para la, 526- 304-305 subpruebas de las, 290-291, 294
terapéutica no dirigida, 385 528 Formas paralelas de aplicación de prue- Y admisión, 334
desventajas, 386 pruebas de aprovechamiento estan- bas, 81-82 y asesoría
ventaja, 385-386 darizadas para las, 279 Formatos de la medición de actitudes, educativa, 337-338
y cuestionario, 389 Estadística descriptiva, 33 427 vocacional, 338
Enunciado(s) Estado programas de pruebas impuestos Fórmula y éxito laboral, 322-323
apareados, reactivos de opción múlti- por el, 561 de corrección por adivinación, 245 Halo, 446
ple con, 238 Estímulo/s) Kuder-Richardson,85 error de, 446
conductual, 452 . específico, reactivos de falso-verdade- predictiva de Spearman-Brown, 83-84 Histograma, 37
falsos y reactivos falso-verdadero, ro y material de, 222-223 Frecuencia/s) Hombre a hombre, escalas de, 454
corrección de, 222 variables de, 448-449 acumulada, 38 Honestidad, pruebas de, 477-478
reactivos falso-verdadero y subrayado y rasgos, 449-450 del programa de pruebas 536-537 evaluación de las, 479
de palabras en el, 222 Estudiantes distribución de, 34 Horario para las pruebas, 540-541
Equilibrio de los reactivos de la prueba, ausentes, planeación de pruebas para polígono de, 37
205,208 los, 541-542 Fuentes Identificación
Error para la prueba, preparación de los, 542 de la evidencia, 14-15 de un atributo, 17
de generosidad, 445 Estudio diagnóstico, 278 del constructor de pruebas, 64 del calificador con las personas que se
de halo, 446 Evaluación/es) . califican, 439-440
estándar, 78, 88 curricú1ares, características, 191 Generosidad, error de, 445 Idiosincrasias del calificador, 444
Escala/s) de las pruebas de honestidad, 479 Grado, normas de, 119, 121 Igualación de estándares de calificación,
de aceptación social Ohio, 470 e invasión de la privada, 590-594 delimitación de las, 119-120 582, 584-585
de calificación, 435-436 razones, 591 utilidad, 122 Incompetencia, evaluación y protección
ancladas conductualmente, etapas, y autodeterminación, 595 Grupo/s) contra la, 600
458-459 y decisiones porcentaje de, 451 Individuo, reporte de los resultados del
de hombre a hombre, 454 acerca de la persona, 598 sin líder, 486-487 programa de pruebas al, 555-
de interés básico, 397 personales, 599 y coeficiente de confiabilidad 556
de madurez social Vineland, 455 y derechos del grupo, 597 habilidad del, 91-92 Infantes, pruebas para, 306-307
de puntuación estándar, 130-131 y diferencias individuales, 602 rango del, 91 -utilidad, 307
diseño de las, 134 y educación, 601 y evaluación, derechos del, 597 Instrucciones para las pruebas de reacti-
de relaciones sociales de Syracuse, Y protección contra la incompetencia, Guía(s) vos
470-471 600 de la entrevista, 387c-388c de falso verdadero, 243
del inventario multifásico de Minne- y recursos sociales, 600 de reactivos para el constructor de de opción múltiple, 243
sota y riesgo físico o psicológico, 596 pruebas, 213 Instrumento(s)
clínicas, 412-413 Evidencia, 22 para la construcción de las pruebas de calificación, elementos, 448-449
de verificación, 415-416 fuentes de la, 14-15 referidas al criterio, 168-169 de medición
gráfica, 452-453 Examen economía de los, 105-106
McCarthy de habilidades de los niños, de ensayo, 251 Habilidad(es) sugerencias, 105-106
309 _ de libro abierto, 258 básicas, batería de, 524 recopilación de, 156-157
Merril-Palmer, 308 Exito común y prueba de eficiencia mínima, sugerencias, 61
preescolar de Minnesota, 309 académico prueba de, 284-285 Integración del programa de pruebas,
Escalas Wechsler de inteligencia, 299 batería de las pruebas de aptitudes de los niños, escala McCarthy de, 309 520-521
para adultos, 299 y predicción del, 355 del grupo y coeficiente de confiabili- Inteligencia
para niños, 302 Y pruebas de aptitud escolar, 318- dad,91-92 coeficiente de, 139
para preescolar y primaria, 302 320 desarrolladas, 333 de desviación, 140

"?, • •• ;

-
672 íNDICE ANALíTICO íNDICE ANAlÍTICO 673

pruebas individuales de, 525 nnesota, 412,414-416 y medición de actitudes, diferencias, Negocio, juego del, 487-488
Stanford-Binet, prueba de, 295 caracteristicas, 416 422 Neurosis, batería de medidas de desem-
subpruebas de la, 295-298 escalas Marco de referencia para asignar califica- peño para identificar la, 481
y escalas Wechsler de inteligencia, clínicas del, 412-413 ciones,580 Niño(s)
diferencias, 302-303 de verificación, 415-416 Material de estímulo específico y reacti- escala(s)
Inteligencia, escalas Wechsler de, 299 problemas, 418-419 vos falso-verdadero, 222 de Wechsler de inteligencia para
para adultos, 299 Inventario de intereses, 643-645 Materias, pruebas de aprovechamiento los, 302
para niños, 302 enfoque del, 391 de contenido de, 525 McCarthy de habilidades de los,
para preescolar y primaria, 302 Strong-Campbell, 393, 396-398 Matrices progresivas, prueba de, 304 309
subpruebas de las 299-300 Y encuesta de intereses ocupaciona- Media observación sistemática del, 491-492
y prueba de inteligencia Stanford-Bi- les Kuder, diferencias, 400 aritmética, 41 Nivel
net, diferencias, 302-303 y registro de preferencias Kuder supuesta, 42 de aprovechamiento, 326, 328
Interacción de tratamiento del rasgo, 179 vocacional, diferencias, 398 Mediana, 38 tablas del, 328
Interés(es), 384 validez del, 403 Medición(es) estatal, programas de pruebas deapro-
básico, escalas de, 397 vocacionales de Minnesota, 401 cualidades del proceso de, 21 vechamiento estandarizados
del progreso académico por 1nvestigación de actitudes, 423-425 a, 282-283
la escuela, 181 de aptitudes de empleado, baterías de formatos de la, 427 Norma(s)
el personal de, 182 las pruebas de, 354 etapas, 16 de edad, 122-125
los alumnos, 181 evaluativa, 189 instrumentos de de grado, 119-121
los padres, 181 requisitos, 190 economía de los 105-106 delimitación de las, 119-120
ocupacionales Kuder, encuesta de; 400 sugerencias, 105-106 utilidad, 122
e inventario de intereses Strong- Journal recopilaciones de, 156-157 de percentiles, 125, 127-129
Campbell, diferencias, 400 of Counseling Psychology, 159 sugerencias, 61 para los promedios escolares, 146-147
vocacionales Ohio, 402 of Educational . premisas, 26 prueba referida a la, 13
y medidas de habilidad, medidas de, Measurement, 159 problemas, 23-26 requisitos, 147-149
404 Research, 160 procedimientos de, objetivo, 9 Número
Intereses, inventario de, 643-645 Juego del negocio, 487-488 y coeficiente de correlación, 55-56 de los reactivos de la prueba, 209-210
enfoque del, 391 Juicio · Medida criterio, 65-67 factores, 209-210
Strong-Campbell, 393, 396-398 artístico, prueba Meier de, 377 atingente, 68 primo, 167n
Y encuesta de intereses ocupaciona- de diseño, prueba Graves de, 377 confiabilidad de la, 68
les Kuder, diferencias, 400 Lectura, 172 cualidades de la, 65-67 Objetivos
y registro de preferencias Kuder habilidades para el aprendizaje de la, disponibilidad de la, 68 características, 198-200
vocacional, diferencias, 398 172-173 libre de sesgos, 68 definición de, 197
validez del, 403 pruebas de, 523, 527,626-631 Medidas redacción de, 190
vocacionales de Minnesota, 401 de capacidad para la, 372-373 de desempeño para identificar la neu- y maestros, 197-198
Interpretación de disponibilidad para la, 524 rosis, bateria de, 481 . Observación(es)
de los resultados de la prueba, cualida- Libro (s) de habilidad y medidas de interés, de la persona calificada, 440-441
des, 559 abierto, examen de, 258 404 directa_ Véase Observación sistemática
del coeficiente de confiabilidad, 88-90 de texto y pruebas, 155-156 de interés y medidas de habilidad, infonnales_Véase Registro anecdótico
Intervalo de clase, 34, 36 Líder, grupo sin, 486-487 404 Observación sistemática, 491
selección del, 36 Líneas de regresión, 178 Scashore de talentos musicales, 375 del niño, 491-492
Invasión de la privada Lista de conductas, 455 subpruebas de las 376-377 desventajas, 502-504
e inventarios de temperamento, 420- Mental Measurements Yearbooks, 157- objetivo, 492
421 Madurez social Vineland, escala de, 455 158 registro de la, 494-495
Y evaluación, 590-594 Maestro(s) características, 157 ventajas, 500-501
Inventario(s) reporte del, 171-172 contenido, 157 tiempo de la, 493
de personalidad, 646-652 Y objetivos, 197-198 índices de los, 157-158 Ómnibus, arreglos de, 294
de temperamento, 407 Manual Métodos para calcular el coeficiente de Opción(es)
e invasión de la privacía, 420-421 de prueba, 107, 160 correlación, 610-614 de respuesta, 449
evaluación, 418-420 contenido, 107 Moda, 38 forzada
uso práctico de los, 421 y prueba, 159 Modelo de opción forzada, 459-460 modelo de, 459-460
Horn de aptitudes artísticas, 377 Mapeo objetivos, 460 objetivos, 460
multifásico de personalidad de Mi- de actitudes, 422-423 Muestreo de reactivo, 191,283-284 reactivo de, 393
674 íNDICE ANALíTICO íNDICE ANALiTlCO 675

Opción múltiple, reactivo(sJ de, 225 de, 412, 414-416 para obtener una calificación fidedig- formas paralelas de, 81-82
complejo, 236-237 características, 416 na, 573-582 calificación de, 545-546
con enunciados apareados, 238 escalas Proceso de medición, cualidades, 21 y programa de pruebas, 537-538
dificultad de los, 226 clínicas del, 412-413 Programa{sJ de pruebas constructor de,
elementos, 225 de verificación, 415-416 características, 520-522 fuentes del, 64
instrucciones para las pruebas de, 243 elementos, 383-384 continuidad del, 522 guía de reactivos para el, 213
redacción de los, 227-236 inventario de, 646-652 de admisión a la universidad, 560 y plan de prueba, 205
y reactivos apareados, diferencias, 238 métódos para estudiar la, 384-385 de aprovechamiento estandarizadas a contenido, 203
Operaciones para medir un atributo, 18 Personnel Psychology, 161 nivel estatal, 266, 273 de apercepción temática, 483-484
Oposición a socioculturales, técnicos en, Plan de prueba, 203-204, 214 externos, 559-563 de capacidad para la lectura, 372-
364 y constructor de pruebas, 205 frecuencia del, 536-537 373
Orden de rango, 457-458 Planeación impuestos por el estado, 561 de colocación. Véase Pruebas de apro-
alternativo, 457 de la prueba, 196,203 . integración del, 520-521 vechamiento
objetivos, 457 de pruebas para los estudiantes ausen- para el otorgamiento de becas, 561 de creatividad, características, 380
Ordenación de los reactivos de la prueba tes, 541-542 para la escuela de desempeño, 481
objetiva, 241-244 educativa, resultados de las pruebas elemental, 523-525 de dibujo de la figura humana, 304-
Otorgamiento de becas, programa de para, problemas, 187 . secundaria, 526-528 305
pruebas para el, 561 Polaridades de las dimensiones del tem- para la universidad, 529-530 de eficiencia mínima y prueba de habi-
peramento de Thorndike, 417 reporte de los resultados, 538-540, lidades común, 284-285
Padres, interés del progreso académico Porcentaje de grupos, 451 . 548-555 de ensayo, 258
por los, 181 Potencial, desempeño del alumno en rela- al individuo, 555-556 preparación de la, 261-262
Palabras en el enunciado, reactivos falso- ción con el, 184, 580-581 uso del, 520 de estilo cognoscitivo. Véase Prueba
verdadero y subrayado de, Predicción del éxito y batería de la prueba y personal educativo, 533-534 de desempeño
222 de aptitud y pruebas, . . de habilidad(esJ
Pensamiento académico, 355 calificación de, 537-538 común y prueba de eficiencia míni-
convergente, 379 laboral, 355 selección de, 535 ma,284-285
divergente, 379 Preescolar y primaria, escalas Wechsler Programa educativo para los calificado- general, 617-623
Percentil(esJ, 41 de inteligencia para, 302 res, 463-464 de honestidad, 477-478
bandas de, 129 Preferencias Kuder vocacional, registro Progreso académico evaluación de las, 479
objetivo, 129 de, 399 comparación, 193-194 de inteligencia, 289
equivalentes de, 144 e inventario de intereses Strong-Camp- evaluación, 181 Stanford-Binet, 295
normas de, 125, 127-129 bell, diferencias, 398 interés del subpruebas de la, 295-298
Perfección, 182 . Preguntas. Véase también Reactivos por la escuela, 181 . y escalas Wechsler de inteligencia,
desempeño del alumno en relación de ensayo, 257 ROr el personal de la, 182 diferencias, 302-303
con la, 182, 580 para medir las habilidades, poten- por los alumnos, 181 de lectura, 523, 527, 626-631
Perfil cial de las, 257 por los padres, 181 de disponibilidad para la, 524
de calificaciones, 141 redacción de las, 258-261 prueba de, 280-281 de matrices progresivas, 304
Gordon de aptitudes musicales, 376 valor de las, 258 reporte del, 193-194 de pericia
subpruebas del, 376 Preparación Progreso escolar. Véase Progreso acadé- diseño de las, 189
Pericia, pruebas de de la prueba de respuesta restringida, mico utilidad, 188-189
diseño de las, 189 255-256 Promedios escolares, normas para los, de pronóstico, 372-373, 528
utilidad, 188-189 de los estudiantes para la prueba, 542 146-147 especiales, 374
Persona{sJ . Presentación de los resultados de la prue- Pronóstico prueba{sJ de, 372-3734 528 de reactivos, instrucciones para las
Calificada, ob~rvación de la, 440-441 ba,547 especiales, 374 de opción múltiple, 243
que se califican, identificación del cali- Primaria y preescolar, escalas Wechsler Protección contra la incompetencia y falso-verdadero, 243
ficador con las, 439-440 de inteligencia para, 302 evaluación, 600 de vocabulario de rango completo,
sociabilidad de una, 74n Privada, invasión de la Prueba{sJ, 13-14, 153 303
y evaluación, decisiones acerca de la, e inventarios de temperamento, 420 administración centralizada de, 545 del progreso académico, 280-281
598 administradores de las, 543-544 del salón de clases. Véase Pruebas
y evaluación, 590-594 .
Personal educativo y programa de prue- Procedimientos actividades del, 544 escolares
bas, 533-534 ambiente para las, 542-543 director de, 534
de medición, objetivo, 9 características, 534
.Personalidad para calcular la confiabilidad, compa- aplicación de
de Minnesota, inventario multifásico ración,86c facilidades de, 107 funciones, 534

._..¿
.. .. ......, .. .
-.:
iNO/CE ANALíTICO 677
676 íNDICE ANALÍTICO

división de una, 82 y libros de texto, 155-156 Pruebas de aprovechamiento estandari- y pruebas


editores de, 159 y manual, 159 zadas, 266, 273 calificación de, 537-538
elaboración de los reactivos de la, 205, y programa de pruebas, selección de, a nivel estatal, programas de, 282-283 selección de, 535
208 535 baterías de las, 268-270 Psicodiagnós.tico de Rorschach, 483-484
elección de la, 154 Prueba/sI de aptitud/es/, 13 ventajas, 268 Psychological Abstrads, 161
en imprenta_ Véase Test in Print artística, 377 para la universidad, 279 secciones del, 161
enfoque de los resultados de la batería de las, 624-625 para las escuelas secundarias, 279 Puntuación/es)
predictivo, 367-369 diferenciales, batería de las, 144, 346 utilidad, 267 confiabilidad de la diferencia entre,
taxonómico, 364-367,371 escolar, 526 y pruebas 100-103
escolares, 171 y éxito académico, 318-320 de aprovechamiento, diferencias, estándar, 135
desarrollo, 171 y pruebas de aprovechamiento es- 266-267 escalas de, 130-131
función, 172 tandarizado, diferencias, 289 de aptitud escolar, diferencias, 289 diseño de las, 134
utilidad, 171-1 72 especiales, 527 Pruebas de diagnóstico, 172-175, 275- estanueve, 134
Gates-McKillop, 174 Prueba objetiva 277,525
subpruebas de la, 174 análisis de las respuestas de la, 247 elección de las, 175, 176 Rasgo/s), 45 .
Graves de juicio de diseño, 377 objetivos, 246-247 . requisitos, 172 del grupo y coeficiente de confiabili-
grupales calificación de la, 244 utilidad, 176 dad,·91
de aptitud académica, 523-524 ordenación de los reactivos de la, 241- y pruebas referidas al criterio, 172 interacción de tratamiento del, 179
y pruebas individuales, compara- 244 Pruebas de habilidad cognoscitiva, 290, intercuartilar, 46
ción, 310 reproducción de la, 241 294 orden de, 457-458
horario para las, 540-541 Prueba, reactivos de la confiabilidad de las, 313t alternativo, 457
individuales clasificación, 208 subpruebas de las, 290-291, 294 objetivos, 457
de inteligencia, 525 dificultad de los, 211-212 Y admisión, 334 que se califica, 441-442
y pruebas grupales, comparación, equilibrio de los, 205, 208 y asesoría semiintercuartilar, 46
310 número de los, 209-210 educativa, 337-338 y variables de estímulos, 448-449
Iowa para el desarrollo educativo, factores, 209-210 vocacional, 338 Reactivo/s)
280 redacción de los, 214 y éxito laboral, 322-323 apareados
subpruebas de la, 280 sugerencias, 215-217 Pruebas de respuesta desventajas, 238-239
Meier de juicio artístico, 377 Prueba(s/, resultados de la/sI libre, 250 redacción de los, 240
para infantes, 306-307 discrepantes, verificación de los, 546 restringida utilidad, 238
utilidad, 307 enfoque de los calificación de la, 256 y reactivos de opción múltiple,
Peabody de vocabulario y dibujos, predictivo, 367-369 objetivo, 255 diferencias, 238
303 taxonómico, 3Q4-367, 371 preparación -de la, 255-256 cortos de falso-verdadero y reactivos
plan de, 203-204, 214 interpretación de los, cualidades, 559 Pruebas, programa/s) de de falso-verdadero, agrupa-
Y constructor de, 205 para la planeación educativa, proble- características, 520-522 ción de, 224
planeación de la, 196, 203 . mas, 187 continuidad del, 522 de la prueba objetiva, ordenación de
para estudiantes ausentes, 541-542 presentación de los, 546 de admisión a la universidad, 560 los, 241-244
preparación de los estudiantes para la, registro de los, 546 de aprovechamiento estandarizadas a de opción forzada, 343
542 y toma de decisiones, sugerencias, nivel estatal, 266,273 de respuesta/sI, redacción de los
referida(s/ 602-604 externos, 559-563 alternativas, 218
a la norma, 13 Pruebas de aprovechamiento 13, 180 frecuencia del, 536-537 restringida, 252
al criterio, 167 baterías de las, 632-639 ' . impuestos por el Estado, 561 muestreo de, 191, 283-284
guías para la construcción de de contenido de materias, 525 integración del, 520-521 para el constructor de pruebas, guía
las, 168-169 metropolitanas, 270 para el otorgamiento de becas, 561 de, 213
y pruebas de diagnóstico, 172 objetiva de, 270 para la escuela Reactivo/s) de opción múltiple, 225
repetición de la misma, 79 utilidad, 188 elemental, 523-525 complejo, 236-237
sugerencias, 79-80 problemas, 180 secundaria, 526-528 con enunciados apareados, 238
utilidad, 70 referidas al criterio, 639-642 para la universidad, 529-530 dificultad de los, 226
verbal, 290 soluciones, 180 reporte de los resultados, 538-540, elementos, 225
y coeficiente Stanford, 270 548-555 instrucciones para las pruebas de, 243
de confíabilidad, tamaño de la, 92- y pruebas de aprovechamiento estan- al individuo, 555-556 redacción de los 227-236
93 darizadas, diferencias, 266- uso del, 520 y reactivos apareados, diferencias, 238
de correlación, 55-56 267 Y personal educativo, 533-534 Reactivos de la prueba

~. _ -
. ..
678 íNDICE ANALíTICO fNDICE ANALíTICO 679

clasificación, 208 Regresión, líneas de, 178 Revistas profesionales, revisión de, 159 de asignación, 465
dificultad de los, 211-212 Relaciones sociales de Syracuse, 470- de artículos en, 160-161 proyectivas, 483, 485
elaboración de los, W5, 208 471 Riesgo físico o psicológico y evaluación, Técnicos en oposición a socioculturales,
equilibrio de los, 205, 208 Relevancia, 22 596 364
número de los, 209-210 Repetición de la misma prueba, 79 Temperamento, 383
factores, 209-210 sugerencias, 79-81 Selección de Thorndike, dimensiones del, 416-
.~
redacción de los, 214 Reporte j decisiones de, 10 417
sugerencias, 215-217 de los resultados del programa de de las cualidades a calificar, 463 polaridades de las, 417
Reactivos falso-verdadero pruebas, 538-540, 548-555 de pruebas y programa de pruebas, Guilford-Zimmerman, encuesta del,
clasificación, 221-225 -al individuo, 555-556 535 408
instrucciones para las pruebas de, 243 del maestro, 171-172 del calificador, 461-462 agrupamientos de la, 408-410
redacción de los, 221-225 del progreso académico, 193-194 requisitos, 461 características, 411-412
y agrupación de reactivos cortos de Reproducción de la prueba objetiva, 241 _ del intervalo de clase, 36 inventarios de, 407
-;
falso-verdadero, 224 Respuesta{sl Servicios de calificación, clasificación, e invasión de la privada, 420-421
j evaluación, 418-420.
y corrección de enunciados falsos, alternativas, reactivos de, 218 537-538
222 redacción de los, 218 Sesgos, medida criterio libre de, 68 uso práctico de los, 421
y material de estímulo específico, 222- complaciente, 393 Símbolos estadísticos, 58 Test in Print, 158
_ 223 de la prueba objetiva, análisis de las, Sistema BeU, 486 Texto y pruebas, libros de, 155-156
Ysubrayado de palabras en el enuncia- 247 confiabilidad del, 488 Tiempo de la observación sistemática,
do, 222 objetivos, 246-247 tareas del, 486-488 493
Recomendación, cartas de, 434 fija, 393 Sociabilidad de una persona, 74n Tipo curricular, decisiones de, 10
validez de las, 434-435 libre, prueba de, 250 Sociodrama, 468-470 Toma de decisiones y resultados de la
Recopilaciones de instrumentos de medi- opciones de, 449 Sociometría, 468 prueba, sugerencias, 602-604
ción, 156-157 Respuesta restringida Subpruebas Trabajo necesario, indisponibilidad del
Recursos sociales y evaluación, 600 ejercicio de, 2:;1-252 de la batería de las pruebas de aptitud calificador para realizar el,
Redacción prueba de, diferencial, 347-350 438-439
de las preguntas de ensayo, 258-261 calificación de la, 256 general, 350 Transformación lineal. Véase Conver-
de objetivos, 190 objetivo, 255 de la(sl prueba(sl sión lineal
Redacción de los reactivos preparación de la, 255-256 de habilidad cognoscitiva, 290- Tratamiento, 188
apareados, 240 reactivo(sl de, 252 291,294 del rasgo, interacción del, 179
de la prueba, 214 redacción de los, 252-255 de inteligencia Stanford-Binet, 295-
sugerencias, 215-217 Resultados de la{sl prueba/s) 298 Ubicación, decisiones de, lO
de ()pción múltiple, 227-236 discrepantes, verificación dé los, 546 Gates-McKillop, 174 Unidades características, 118
__de respuesta{sl enfoque de los Iowa para el desarrollo educativo, Universidad
- -aheQ?-ativas, 218 predictivo, 367-369 280 programa de pruebas para la, 529-530
. restringida, 252-255 taxonómico, 364-367, 371 de las escalas Wechsler de inteligencia, de admisión a la, 560
falso-verdadero, 190 interpretación de los, cualidades, 559 299·300 pruebas de aprovechamiento estanda-
Referencia para asignar calificaciones, para la planeación educativa, proble- de las medidas Scashore de talentos rizadas para la, 279
marco de, 580 mas, 187 musicales, 375-376 Uso
Registro(sl presentación de los, 546 del perfil Gordon de aptitudes musica- del programa de pruebas, 520
de la observación sistemática, 494 registro de los, 546 les, 376 práctico de los inventarios de tempera-
de los resultados de la prueba, 546 y toma de decisiones, sugerencias, Subrayado de palabras en el enunciado y mento, 421
de preferencias Kuder vocacional, 339 602-604 reactivos falso-verdadero, 222
e inventarlo de intereses Resultados del programa de pruebas, re- Validación cruzada, 357n
Strong-Campbell, diferencias, porte de los, 538-540, 548- Tablas del nivel de aprovechamiento, 328 Validez, 61, 73-74
398 555 Talentos musicales, medidas Scashore de, aparente,61n
seudoanecdóticos, 512-513 al individuo, 555-556 375 clasificación, 62 -
Registro anecdótico, 504 Resúmenes en psicología. Véase Psycho- subpruebas de las, 375-376 de contenido, 63
Tamaño de la prueba y coeficiente de de las calificaciones, 447-448
características, 508 logical Abstracts de las cartas de recomendación, 434-
conductas a reportar en el, 507 Review of Educational Research, 159- confiabilidad, 92-93
elaboración del, 509-510 160 Tareas del sistema Bell, 486-488 435
problemas, 511-512 Técnicas del constructo, 74-77
Revisión de revistas profesionales, 159 del inventario de intereses, 403
utilidad, 505-507,510-511 de artículos en, 160-161 de adivina quién es, 471-472

··;i\.,.· - ' , : _,", . ,' :: '


. .', .... "
680. íNDlcEANAtíTICO
las pruebas, asl como para valorar su efectividad
empírica, 65 , ..' después de contestadas.
. . . prueba, 546
estadística. V¿a.reValjdez empírica del inventarlo multifasico de pe'rsona- Es una valiosa gula para el maestro, presentada
Valor, 18~ .: \ : i.~ . lidad de Minnesota, escalas en forma sencilla, con indicaciones útiles para
de lai;preguntas de ensayo, 258 de, 415-416 mejorar los métodos de la evaluación del desempeño
Variables de estímulos, 448-449 Vocabulario
y rasgos, 449"450 . del alumno. Está dirigido a profesores de todos .
de rango completo, prueba de 303 . los niveles educativos, tanto en formación como
Verificación . y dibujos, prueba Peabody de; 303
de los resultados discrepantes de la experimentales, asl como a los cursos de psicologfa
educacional, de administración de personal, etcétera.

TEORíA DE LOS TESTS


Psico/ogia diferencial
Psicologia aplicada
Orientación vocacional
David Magnusson
.. '
El principal propósito del autor es que todos los
estudiantes, incluso aquellos que no cuentan con una
preparación amplia en estadística, logren comprender
..
~,

cabalmente este texto, del que destacan, entre otras,


tres cualidades positivas.

i 1. Un enfoque original que hace comprensibles los


r conceptos más complejos a los que, además, les
imprime una singull:lr riqueza heurística.
2. Una gran habilidad para presentar sin complicación
matemática (aun en los casos en que hay
necesidad de utilizarla, la hace simple y
comprensible) a los iniciados y, en forma clara
y con abundantes ilustraciones, una serie de
procedimientos de vital importancia para aquellos
que quieran construir, valorar o interpretar tests.
¡
3. La riqueza de contenido con respecto de todo
,. aquello que pueda considerarse fundamental a
¡
una teoría de las pruebas.
Estudia en forma sencilla con la ayuda de
ilustraciones y ejemplos, conceptos tales
como la distribución normal, el problema de la
métrica mental, de la varianza de los ítems, de las
calificaciones y de los tests, el error estándar de
medida, .etcétera.
· .' ~ <..',.:. .. ', ,.:.....
:.:~<

S-ar putea să vă placă și