Documente Academic
Documente Profesional
Documente Cultură
Assessment & Evaluation in Higher Education, Volume 35, Issue 5 August 2010 , pages 535 - 550
D. Royce Sadler *
Griffith Institute for Higher Education, Griffith University, Mt Gravatt campus, Brisbane 4111,
Australia
Introducción
En la literatura acerca de investigaciones sobre el aprendizaje, inicialmente se asociaba a la
retroalimentación -como elemento fundamental de la evaluación formativa- con el
conocimiento de los resultados. Esto aludía a resultados simples (como la respuesta a la
pregunta de una prueba) que podrían clasificarse como correctos o incorrectos. Como lo
planteó Kulhavy (1977), la retroalimentación se define como “cualquiera de los numerosos
procedimientos que se utilizan para comunicarle a un estudiante si la respuesta a una pregunta
es correcta o incorrecta” (211). A partir de esto se deducía que los estudiantes sabrían que
estudiando se resolvería el problema si se les decía que lo hicieran. Aquellos encargados de
investigar la enseñanza se interesaron particularmente en los efectos de las diversas
características (especialmente el apremio, la pertinencia, información personal y tipo de
recompensa) de la retroalimentación en la retención de los contenidos aprendidos. Este
*
Email: r.sadler@griffith.edu.au
enfoque, que se desarrolló a partir de modelos de aprendizaje estímulo-respuesta conductista,
se considera en la actualidad como un enfoque excesivamente limitado.
Las características de la retroalimentación que eran importantes en los primeros estudios
todavía mantienen su importancia hoy en día, aunque el enfoque ha cambiado. En general la
educación ha cambiado el énfasis que ponía en el fomento de la memorización de material
objetivo por el énfasis en el desarrollo de las habilidades de los estudiantes para producir
respuestas en tareas evaluadas que son más bien divergentes que convergentes y más bien
complejas que simples. Esas respuestas comúnmente se evalúan basándose en juicios
cualitativos. Sadler (1987, 1989) describió esos juicios como algo salido directamente de la
mente de una persona la cual, por lo tanto, funciona como la fuente y el instrumento de cada
valoración. Los juicios cualitativos no pueden reducirse a un conjunto de procedimientos
formales que pueden ser aplicados por inexpertos en la materia. Aumentar los límites de la
retroalimentación para que ésta promueva el aprendizaje complejo tiene consecuencias
trascendentales. Con este propósito, la retroalimentación puede incorporar varios elementos.
Entre esos se incluyen un puntaje o nota simbólicos para representar la calidad global del
trabajo; una explicación o justificación detallada para el puntaje; una descripción de la
calidad del trabajo; elogios, estímulos u otro tipo de comentarios afectivos; diagnósticos de
las debilidades; y sugerencias para mejorar las deficiencias específicas y para fortalecer el
trabajo en su totalidad.
No es posible en este artículo resumir los resultados de los cuatro análisis más
importantes acerca de la retroalimentación, realizados por Natriello (1987), Crooks (1988),
Black y William (1998), y Hattie y Timperley (2007), pero sí se puede decir que todas ellos
abordan predominantemente el aprendizaje escolar. Sin embargo, resulta útil hacer algunas
observaciones que señalen resultados similares pero en la educación superior. La
retroalimentación tiene la capacidad de influir en el aprendizaje, pero la simple entrega de
una retroalimentación no conduce necesariamente a una mejora. Esto es un hecho que los
docentes de todos los sectores de la educación, incluida la educación superior, conocen bien
(Crisp 2007). Arriesgándose a pasar por alto las complejidades acerca de la
retroalimentación, la visión general dice que la relación que existe entre su estructura, el
momento oportuno en el que se entrega y la efectividad es compleja y variable, y no tiene
una receta mágica. Incluso algo tan aparentemente sencillo como incluir elogios no significa
necesariamente que se lograrán beneficios académicos. Butler (1987) descubrió que existe
una diferencia crucial entre los efectos de los elogios hacia el estudiante como persona
(retroalimentación relacionada con el ego) y los elogios que tienen que ver con la calidad de
la tarea realizada (retroalimentación relacionada con la tarea).
Alcance y terminología
Las tareas evaluadas que son de particular interés en este artículo requieren que los
estudiantes demuestren mayores habilidades cognitivas o algún tipo de capacidad
profesional. Los logros en estas tareas se evalúan comúnmente por medio de actividades que
requieren respuestas largas y complejas que demandan una capacidad de análisis, de síntesis,
creatividad, evaluación o pensamiento crítico. Esas respuestas son un elemento común en
una amplia variedad de disciplinas, campos y profesiones tanto en cursos de pregrado como
de postgrado. Dentro de ellos se incluyen las lenguas, artes y letras, salud y ciencias sociales,
artes visuales y escénicas, y muchas áreas de la ciencia y tecnología.
Tanto el docente como el examinador pueden decidir las especificaciones de la tarea,
o pueden negociarse en colaboración con los estudiantes. En este artículo, se asume que una
vez que se han entregado las especificaciones de manera oficial, éstas definen los parámetros
del diseño en los cual se deben basar los estudiantes para construir sus respuestas. Con ese
fin, las especificaciones deben ser interpretadas de manera literal. Al evaluador generalmente
se le llama profesor; en la práctica puede ser un tutor, un ayudante del profesor u otra persona
calificada. Juicio y valoración se utilizan como sinónimos. La retroalimentación debe incluir
cualquier tipo de comunicación que realice el docente al estudiante después de la valoración
de la respuesta dada por el estudiante. Puede entregarse en directo, como por ejemplo en un
discurso, o por escrito, en un archivo de audio, o de otra forma de carácter permanente a la
que se pueda acceder cuando sea necesario. Cualquier tipo de evaluación termina cuando el
docente ha revisado las respuestas, ha entregado los resultados y ha dado la información
pertinente (como comentarios, puntajes o notas) a los estudiantes, y en el caso que sea
necesario, a la institución. Esta secuencia básica de evaluación: dar una tarea, evaluar las
respuestas de los estudiantes y entregar información sobre el desempeño, es una práctica
común en la educación superior.
Prealimentación (Feedforward)
Las dos herramientas principales para guiar a los estudiantes en la producción del trabajo
pedido son las especificaciones de la tarea que se va a evaluar y, en muchos casos, la
información respecto a la manera en la que se evaluará el trabajo. El diseño en sí se deja en
manos de los estudiantes. No se pueden hacer suposiciones acerca de la manera en la que se
entrega la información; éstas pueden incluir instrucciones escritas, presentaciones orales o
que utilicen alguna tecnología y discusiones cara a cara. Todas esas comunicaciones están
pensadas para un uso futuro y, utilizando la terminología de Bjorkman (1972), constituyen
una “prealimentación”. En este punto es necesario hacer una salvedad: informarle a los
estudiantes con anterioridad los criterios y estándares de evaluación (como una guía de
evaluación u otro formato) puede ser algo problemático. Nicol y Macfarlane-Dick (2006), al
notar la conveniencia de entregar con anterioridad criterios y estándares, citaron varios
estudios que destacan los componentes tácitos presentes en las expectativas y estándares
académicos, advirtiendo de ese modo las limitaciones inherentes de las descripciones
explícitas. En el estudio de Sadler (2009b), se han desarrollado en detalle las objeciones
teóricas complementarias. En este artículo no se aborda en profundidad este tema ya que es
un aspecto secundario al tema principal.
Retroalimentación (Retroalimentación)
La primera de las dos funciones generales de la retroalimentación es entregar un enunciado
acerca del desempeño basado en la evaluación del docente (ya sea por medio de una
clasificación o una nota) de la respuesta del estudiante, y una razón que indique la manera en
la que se consideraron las fortalezas y debilidades de la respuesta en el juicio. La segunda
función es entregar consejos o sugerencias respecto a la manera en la que se podría haber
elaborado una mejor respuesta. Claramente, si se quiere que la retroalimentación tenga una
buena posibilidad de lograr su propósito formativo, tiene que ser específica (haciendo
referencia, como debe hacerlo, al trabajo recién evaluado) y también general (identificando
un principio más general que podría aplicarse a trabajos posteriores). Por lo tanto, a pesar de
que la retroalimentación es principalmente de carácter retrospectivo, también se puede
utilizar en futuras ocasiones. Este componente especifico que tiene relación con futuras
actividades constituye un elemento adicional de prealimentación (Hounsell y otros, 2008).
Las recomendaciones generales que se encuentran en la literatura respecto de las
propiedades deseables de la retroalimentación incluyen: decirle a los estudiantes las
fortalezas de sus trabajos; decirles (de manera gentil) las deficiencias, donde se encuentran y
de qué tipo son; decirle a los estudiantes que podrían haber hecho para mejorar su trabajo; y
señalarles lo que podrían hacer la próxima vez que realicen un trabajo parecido. En todos los
casos, la retroalimentación debe tener como objetivo ser útil y entregar apoyo. La cantidad
de información en la retroalimentación de un trabajo en particular depende en parte de las
posibilidades que tenga el trabajo de ser arreglado. Cuando exista una cantidad de
deficiencias razonablemente pequeña en lugares específicos que solucionándose aumenten
de manera sustancial la calidad del trabajo, el docente podría entregar una cantidad
considerable de detalles. En el caso de un trabajo de alta calidad, no hay mucho que decir; en
el caso de un trabajo que presenta debilidades en su totalidad, el docente podría no saber qué
decir o por dónde comenzar.
Los docentes que entregan una retroalimentación escrita exhaustiva que utilice las
propiedades recomendadas, generalmente encuentran que la tarea requiere de mucho trabajo
y de la utilización de procesos cognitivos. Ponen mucha atención en la precisión de la
redacción, ya que posteriormente la retroalimentación se convertirá en una comunicación
diferenciada que se podría mencionar varias veces. Debido a que la comunicación es
asíncrona, el docente tiene que anticipar la posible reacción del estudiante ante el contenido
y el tono de la retroalimentación, y esto requiere un costo afectivo de parte del docente.
Dentro de las alternativas para la retroalimentación individual se encuentran los métodos
sistemáticos, algunos de los cuales requieren un mínimo uso de tecnología, como por
ejemplo, comentar el trabajo de los estudiantes utilizando códigos que permitan que los
estudiantes busquen los enunciados con la retroalimentación correspondiente en una lista
(Ramsden 2003). También se incluyen plantillas electrónicas, guías de evaluación y de
criterios, y bases de datos con oraciones que los evaluadores pueden utilizar para elaborar
una retroalimentación más extensa. Esto ayuda a ahorrar tiempo y esfuerzo de manera
considerable (Case 2007). En la medida en que la retroalimentación se entregue usando
tecnologías y mecanismos estructurados, se pueden aliviar las demandas cognitivas y
laborales. Sin embargo, sea cual sea la manera en la que se produzca y comunique la
retroalimentación, y a pesar del efecto limitado que a menudo ésta presenta, los docentes que
son meticulosos siguen poniendo un esfuerzo considerable para entregarle una
retroalimentación a sus estudiantes.
Asegúrese de que responda lo que se le está preguntando y no lo que usted cree que se le
está preguntando. La causa principal por la cual se descuenta puntaje en los exámenes es
que los estudiantes se salen del tema a la hora de responder las preguntas. El puntaje se
entrega por los puntos que tienen una estricta relación con la pregunta. No se entrega más
puntaje por conocimientos, información u opiniones adicionales que no tengan que ver con
la pregunta, por muy brillantes que éstos sean.
Abordar una pregunta es el arte de hacer que su contestación sea una excelente respuesta
a las palabras de la pregunta. Estas son palabras o frases con “instrucciones” importantes
tales como comparar, contrastar… mostrar, etc. (261)
Una reacción típica de los evaluadores frente a un trabajo que no aborde claramente la tarea
pedida es evaluar el trabajo de todos modos pero restándole puntaje o créditos.
En esta sección, el método que se propone para abordar este problema es introducir
el concepto “cumplimiento de una tarea”. Si se les pide a los estudiantes que hagan una crítica
de, por ejemplo, una política pública; un trabajo literario o una solución tecnológica a un
problema, se espera que las respuestas correspondan a una crítica. Una crítica es un tipo de
respuesta diferente a la explicación; en ella el estudiante se involucra en la evaluación de algo
y emite un juicio cauteloso acerca del tema. Tampoco se parece a una opinión ni a los tipos
de actividad mental a la que libremente se le llama pensamiento crítico. Para desarrollar una
crítica, el estudiante debe tomar distancia del contenido o tema, sopesar las características y
condiciones relacionadas con el tema, examinar las pruebas o motivos que lo llevan a hacer
su evaluación, y luego poner el resultado de la reflexión evaluativa en palabras. La crítica
tiene una estructura determinada, razón por la cual pertenece a una categoría diferente de
producción. Esto no quiere decir de ninguna manera que las críticas que realicen distintos
estudiantes acerca de una misma cosa sean las mismas –o parecidas. Idealmente, éstas serán
diferentes. Sin embargo, la crítica tienen propósito y estructuras lo suficientemente similares
para que formen parte de la categoría debidamente llamada “crítica”. Por otro lado, una
explicación se somete a un conjunto diferente de características. Se llega a ella a través de
diferentes procesos cognitivos, y trae como consecuencia un producto final específico. Otros
ejemplos de tipos de tareas son las soluciones, comparaciones, comprobaciones,
demostraciones, extrapolaciones y situaciones hipotéticas.
El cumplimiento de una tarea se refiere a la congruencia entre el tipo de respuesta
estipulada en las especificaciones de la tarea y el tipo de respuesta que el estudiante entrega
en realidad. Si las especificaciones piden una crítica, el estudiante que entrega una
explicación, una combinación entre una sinopsis y una conjetura, u otra cosa completamente
distinta no está cumpliendo con la forma y la estructura requeridos. Por lo tanto, no se puede
decir que la producción corresponde a la categoría de respuesta requerida. Por consiguiente,
no se puede evaluar su calidad como crítica. Entregar créditos por cualquier trabajo que no
es una crítica tiene tres efectos negativos potenciales: se recompensa y se respalda la acción
del estudiante sin que exista un cambio en su pensamiento y en la práctica; el estudiante
obtiene créditos sin llegar a un objetivo educacional valioso; y la intención de la tarea
evaluada, que es proporcionar evidencia de las capacidades de los estudiantes se destruye.
Hay que reconocer que no todos los docentes quieren que las tareas para evaluación
se interpreten de manera literal, y muchos de ellos utilizan formas o palabras familiares por
costumbre. Existen más posibilidades de que esto ocurra cuando los académicos, al crear las
tareas de evaluación, se centren principalmente en los contenidos que quieren evaluar, y no
pongan la suficiente atención en lo que los estudiantes deberían hacer con esos contenidos
para demostrar que se lograron los objetivos de mayor importancia fijados para el curso. Esta
actitud se puede traspasar al proceso de calificación: el trabajo que presente una información
completa puede recibir mayores recompensas, sea cual sea la tarea pedida. Sin embargo, decir
“Este estudiante obviamente sabe mucho sobre el tema, y eso merece un debido
reconocimiento” refleja un desconocimiento acerca de la importancia del cumplimiento de la
tarea, y no incluir este último concepto en las listas de criterios de evaluación refleja un
desconocimiento también.
Calidad
Este concepto se aplica en contextos disciplinarios y profesionales donde se espera que las
producciones complejas realizadas por los estudiantes no sean del mismo tipo. El concepto
de calidad en estas situaciones es abstracto y los estudiantes normalmente tienen dificultades
para comprenderlo. Calidad se entiende como la manera en la que el trabajo se realiza para
lograr el propósito deseado. Cuando se evalúan fenómenos complejos, la calidad es
determinada configuradamente (Kaplan 1964) en lugar de determinarse a través de la “suma”
de “medidas” particulares de sus componentes. Esos juicios integrales pueden equivaler a
más (aunque algunas veces a menos) de lo que equivaldría una consideración formal de las
diversas características por separado. Estas características son, por supuesto, comúnmente
llamadas criterios (Sadler 2009b). En la práctica, es más fácil reconocer la calidad cuando se
presenta que definirla de manera abstracta o explicarla en un caso particular. Con cierta
frecuencia, se pierde algo importante cuando se intenta expresar la calidad de forma
proporcional o declarativa, es decir, en palabras, como por ejemplo con guías de evaluación
y la expansión de criterios fijos.
Las determinaciones de calidad a menudo requieren considerar todos los tipos de
juicios integrales en donde se tratan múltiples criterios simultáneamente de manera
entrelazada. Para emitir un juicio es necesario ver más allá de las diferencias superficiales
que se presentan en trabajos individuales y concentrarse en aspectos más profundos, más
sutiles y más abstractos. También requiere mucho más que tomar múltiples muestras
representativas de un juicio; cada una de ellos relacionada a un único criterio. Esta es la razón
por la cual en este artículo la calidad como concepto se trata como una propiedad integrada
por derecho propio y no como algo “compuesto” o construido a partir de juicios basados en
criterios separados. Los estudiantes necesitan estar expuestos a una variedad de trabajos que
exijan diferentes calidades y adquirir experiencia en la emisión de juicios respecto a esos
trabajos; y, por lo tanto, llenar por sí mismos el espacio de evaluación bidimensional
mencionado anteriormente. Ellos deben conocer los ejemplos de manera planificada y no
aleatoria, y ganar experiencia en emitir juicios sobre la calidad. Necesitan crear razones y
relatos verbales acerca de las maneras en las que se podrían haber realizado mejores trabajos.
Por último, necesitan conversar con los profesores y con otros estudiantes sobre el proceso
de evaluación. Estos tres hechos entregan los medios con los que los estudiantes pueden
desarrollar un concepto de calidad que básicamente sea similar al que posee el docente y, en
particular entender que implica una alta calidad. Aunque proporcionar estas experiencias a
los estudiantes pareciera añadir más capas a la tarea de la enseñanza, se puede llevar a cabo
a través de la evaluación entre pares para que se convierta en una estrategia poderosa para la
enseñanza en la educación superior (Sadler 2009ª).
Criterios
Criterio se entiende como una propiedad o característica que es útil para la calidad y para su
determinación. Algunos criterios (como cantidad de palabras y utilizar convenciones de
referencia para realizar un texto escrito) son directos y están bien definidos. En el caso de
estos criterios, es relativamente fácil saber cuando se han cumplido las condiciones o cuando
se ha quebrantado una regla. Otros criterios, probablemente la mayoría de ellos, incluidos
algunos que reciben nombres increíblemente simples, son considerablemente más abstractos.
Esto los hace complicados para los estudiantes hasta que ellos comiencen a utilizarlos
competentemente, lo que a menudo requiere sofisticación y precisión. Estos criterios
abstractos son conceptos que no están bien definidos, por lo que deben aprenderse del mismo
modo en el que las personas forman otros conceptos abstractos y los utilizan en contextos
sociales o profesionales. Eventualmente, los criterios deben pasar a ser algo habitual dentro
del vocabulario de evaluación de cada estudiante, lo que les permitirá practicar y razonar en
sus propias cabezas a medida que emiten juicios y, en un futuro, explicar y justificar estos
juicios frente otras personas.
La coherencia (en un artículo académico) es un ejemplo de criterio abstracto. ¿Qué
tan bien entienden los estudiantes este concepto? ¿Pueden reconocer niveles altos y bajos de
coherencia en trabajos particulares? ¿Reconocen eficazmente esta propiedad pero utilizan
una terminología diferente para referirse a ella (como “unión”)? ¿Pueden detectar la
coherencia y mantenerla en sus producciones cuando están realizando un trabajo? La prueba
esencial para saber si los estudiantes entienden el criterio (de evaluación) de la coherencia no
tiene que ver con la capacidad que ellos posean para definirla formalmente. Tiene que ver
con la capacidad para emitir juicios certeros acerca de la coherencia en sus propios trabajos
y en los de otros, y con la capacidad para utilizar de manera apropiada el término cuando
expliquen los juicios emitidos acerca de la calidad, entregando una retroalimentación que
ayude a mejorar el trabajo y conversando con otros.
Se puede decir lo mismo de otros criterios como la evidencia (para realizar una
afirmación), la originalidad o precisión (de un argumento), la habilidad (en una interpretación
musical), la elegancia (en una solución matemática o en un software), la integridad (en una
entrevista clínica), la eficiencia (en el diseño de un proyecto) y la convicción (en una opinión
legal o en el anteproyecto de una política). Los estudiantes deben entender lo que éstos
significan e implican para las decisiones reales relacionadas con la evaluación. Deben saber
cuando es apropiado utilizar criterios particulares en casos particulares. Deben saber cuando
apelar a un criterio que raramente se utiliza y que no es parte de lo estándar, ya que, en casos
particulares, esto es sumamente importante. Deben saber ignorar un criterio que normalmente
es indispensable cuando la presencia de un criterio superordinado lo vuelva irrelevante en
una evaluación particular. El punto al que se quiere llegar aquí es que el conocimiento
profundo de los criterios y de la manera adecuada de usarlos no llega utilizando la
retroalimentación como la estrategia de aprendizaje principal. La divulgación puede informar
y provocar mejorías solamente cuando los estudiantes, como destinatarios del mensaje,
comprendan todos los referentes –que incluyen los significados e implicancias de los
términos, y la estructura de la comunicación.
El problema subyacente que surge respecto a los criterios como conceptos tiene que
ver con que términos específicos pueden significar cosas distintas para distintos profesores,
y con que estas diferencias todavía no hayan sido estudiadas. Por motivos de tiempo no es
posible realizar un análisis detallado de esto, sólo es posible mencionarlo y hacer breves
comentarios. A pesar de que los profesores que enseñan en diferentes cursos podrían estar de
acuerdo en que existiera una lista establecida de criterios, pueden surgir grandes debates
cuando se intente formalizar las interpretaciones de esos mismos criterios para que todos los
docentes y evaluadores los utilicen de manera constante. Además, los estudios de
investigación acerca de las formas en la que los docentes pueden transmitir de mejor manera
sus expectativas (incluidos los significados de los criterios) tienden a centrarse
específicamente en la evaluación cualitativa de un curso en vez de hacerlo en la consistencia
de la interpretación en todos los cursos, y este tema no es visto como algo problemático. Dos
ejemplos recientes son los estudios realizados por Andrade y Du (2007) y Rust, Price y
O’Donovan (2003) en los Estados Unidos y en el Reino Unido, respectivamente, donde el
interés fundamental estaba en la manera en la que los profesores dan a conocer sus
expectativas a los estudiantes. La consistencia en la interpretación de los términos
fundamentales podría no presentar problemas para profesores de educación superior o para
equipos de docentes, pero sí presenta problemas para los estudiantes, especialmente cuando
se encuentran con interpretaciones que difieren significativamente de profesor a profesor y
de curso a curso. Finalmente, se podría concluir que los estudiantes deben familiarizarse tanto
con los estándares como con los criterios. La razón por la que no se mencionó este aspecto
anteriormente tiene que ver con que se puede pensar que los estándares son etiquetas que se
aplican a divisiones establecidas (pero que han sido determinadas arbitrariamente) en la
escala de la calidad. El aspecto más importante que los estudiantes deben entender primero
es la naturaleza constitutiva de la calidad.
Conocimiento tácito
Un ambiente educativo que se ocupa de que los estudiantes desarrollen un entendimiento
conceptual acerca del cumplimiento de una tarea, la calidad y los criterios, aumentará, como
consecuencia, el conocimientos tácito de los estudiantes (Polanyi 1962). No se puede enseñar
(o captar) de ninguna otra manera. La realización de varias evaluaciones entre pares con un
propósito específico se convierte en un recipiente en el cual estos tres conceptos pueden
reaccionar e interactuar. Esta actividad que se basa en la experiencia no solo da lugar a una
evaluación o juicio sino también a un conjunto de conocimientos prácticos desconocidos,
difíciles de entender y que a menudo llegan inesperadamente. Estos conocimientos están
relacionados con las relaciones complejas que existen entre los elementos de evaluación y la
manera en la que éstos se aplican. Los profesionales y evaluadores expertos recurren
constantemente a sus reservas de conocimientos tácitos; éstas constituyen la esencia de una
gran cantidad de habilidades profesional.
Como ejemplo de esto, considere nuevamente el ejercicio de tener docentes hábiles
como evaluadores. Ellos generalmente examinan el trabajo con dos intenciones simultáneas.
Una de ellas es desarrollar un punto de vista acerca de la calidad general del trabajo y la otra
es anotar las características particulares (que a menudo son las fortalezas y debilidades, pero
no siempre es el caso) que requieren una atención especial. Estas “anotaciones” específicas
están asociadas a criterios (a menudo extraídos de un grupo indefinido de posibles criterios)
que luego son útiles tanto para formar la perspectiva inicial del evaluador como para construir
una retroalimentación (Wittgenstein 1974; Sadler 1989, 2009b). La importancia de un criterio
específico en un juicio específico depende de la manera en la que se percibe el trabajo que se
está evaluando. Por lo tanto, es una función que corresponde tanto de la condición mental del
perceptor como de las propiedades del trabajo que se está evaluando. Los posibles criterios
que se escojan según su relevancia en un punto en particular están más relacionados con lo
que dictan los sentidos que con lo que se considera importante. Estar al tanto de lo que es
importante es un elemento esencial del conocimiento tácito de un evaluador experto. Sólo
cuando el estudiante desarrolle también un conocimiento tácito que coincida a grandes rasgos
con el del docente, el alumno estará en condiciones de comprender los juicios y fundamentos
del docente.
Las instituciones de educación superior no solo tienen la responsabilidad de
enseñarles a los estudiantes los mecanismos de evaluación, sino también de ayudarlos a
comprender a cabalidad lo complejo que puede ser emitir juicios cualitativos con integridad
(Taras 2006; Ellery 2008). Esto hace necesaria la inmersión del docente y del estudiante en
actividades de evaluación que conectan formas simbólicas (palabras, oraciones y discurso)
con sus referentes concretos (trabajos de los estudiantes como ejemplificaciones), un
requisito que se aplica generalmente a las evaluaciones (Sadler 1980).
El camino a seguir
El objetivo manifiesto ya no es informarle a los estudiantes sobre la calidad de sus trabajos
(dar a conocer la información) sino hacerlos ver y entender las razones por las cuales se exige
una calidad (visibilidad), y en el proceso desarrollar la capacidad personal para emitir juicios
complejos. Esto incluye emitir juicios acerca de sus propios trabajos, durante la producción
del trabajo y una vez terminado éste. La clave para lograrlo yace en educar a los estudiantes
en el arte de realizar evaluaciones sustanciales y exhaustivas de manera similar a las que
utilizan habitualmente los evaluadores expertos. En la implementación de ese método
específico a la evaluación entre pares explicada detalladamente por Sadler (2009ª), la materia
prima a partir de la cual se realizan los juicios consiste en el trabajo de otros estudiantes, que
normalmente tienen distinta calidad y son de distintas formas.
Existen cuatro tareas básicas en la evaluación entre pares, y se pueden expresar como
preguntas con el siguiente orden. ¿Sirve una respuesta específica como un intento de abordar
el tema especificado en la descripción de la tarea? Esta es una pregunta relacionada con la
categoría, no tiene que ver con la calidad; eso sólo se puede decidir después de analizar el
trabajo completo. La siguiente pregunta es: ¿Qué tan bien cumple el trabajo los propósitos
pedidos? Esto apunta directamente a la determinación de la calidad. Tercera pregunta:
¿cuáles son los motivos que se utilizaron para emitir el juicio: utilizar cualquier criterio que
se apropiado para apoyar la evaluación? Los inconvenientes de no tener criterios establecidos
por adelantado El contraargumento frente a las posibles objeciones de que tener criterios
estandarizados dificulta el proceso de evaluación es que capacitar a los estudiantes para que
utilicen criterios fijados con anterioridad, guías de criterios y guías de evaluación no los
prepara adecuadamente para que sigan aprendiendo por el resto de su vida, ya que en el
mundo que viene después de la graduación, se debe evaluar una cantidad de cosas de distintos
tipos por muchas razones y propósitos, y pretender tener una guía de evaluación para cada
una de ellas es poco realista. A esto se añade demás la observación hecha anteriormente en
este artículo que dice que utilizar criterios preestablecidos no produce necesariamente los
juicios más auténticos. La cuarta y última pregunta es ¿cómo se puede mejorar el trabajo de
manera sustancial? Esto requiere consejos sobre el trabajo completo y respecto a las
deficiencias o debilidades específicas.
Esta evaluación entre pares realizada con una intención específica se convierte en un
elemento fundamental dentro de un enfoque pedagógico general que básicamente puede
remplazar a los métodos de tradicionales utilizados para dominar los contenidos más
importantes del curso. Este proceso hará que el profesor sea el responsable de lograr que los
estudiantes maduren progresivamente su capacidad para emitir juicios evaluativos al
proporcionar situaciones de práctica reales que no representen riesgos en las cuales ellos
también puedan reconocer las normas o estándares de calidad de la disciplina o profesión
correspondiente. En la vida real, los evaluadores están obligados a seguir ciertos parámetros.
En un curso las evaluaciones se rigen por los parámetros que estipulen las especificaciones
de la tarea. Dentro de esos parámetros, los estudiantes (como evaluadores) son capaces de
desarrollar habilidades para reconocer la calidad cuando ésta se exprese de distintas maneras.
A pesar de que el reconocimiento de la calidad es la actividad principal dentro de la
evaluación, no tiene que ver con los gustos personales. Los juicios se emiten dentro de un
contexto social-profesional definido y éstos deben ser justificados; el método que
comúnmente se utiliza es ocupar criterios que son sobresalientes en cada caso específico.
Este método general ocupa elementos del trabajo de Polanyi (1962), y se podría describir
como la manera de ayudar a los estudiantes a convertirse verdaderos expertos.
Todavía existen muchas cosas que se desconocen respecto a la mejor manera de
diseñar actividades de evaluación que ayuden a mejorar la enseñanza de los estudiantes de
educación superior. Los estudios citados anteriormente en este artículo se han centrado en
ciertos factores que pueden ayudar o entorpecer las mejorías en el rendimiento. La mayoría
de esos factores han sido estructurados y ejecutados en modelos que dependen de la
retroalimentación como parte clave del proceso. El tema de este artículo ha sido proponer un
modelo alternativo para la organización del aprendizaje y de la enseñanza. Este modelo
cuestiona la visión que dice que el docente debería ser la opción automática y fundamental
para mejorar el aprendizaje. Se ha puesto demasiada atención al nivel micro que se utiliza en
el modelo tradicional: lo que puede hacer el docente para construir una retroalimentación
más efectiva, y lo que debería hacer el estudiante para beneficiarse aún más de la
retroalimentación entregada.
Las investigaciones sobre la eficacia comparada de las innovaciones en la entrega de
la retroalimentación han basado típicamente sus conclusiones en cuestionarios en los cuales
los estudiantes cuentan sus experiencias, y en los puntajes obtenidos en las pruebas y tareas
evaluadas. Sin embargo, un aumento regular en el desempeño incluso cuando se ha entregado
una buena retroalimentación solamente indica que algunos estudiantes mejoraron. ¿Qué pasa
con los estudiantes que no mostraron mejorías? Encuestarlos para saber sus puntos de vista
probablemente no entregue evidencia que pueda servir para implementar nuevos cambios a
menos que los estudiantes hayan tenido algún tipo de experiencia con métodos alternativos.
¿Cuáles de los estudiantes que no mostraron mejorías podrían tener resultados diferentes
utilizando un método distinto, siempre y cuando éste sea implementado sin perjudicar a
aquellos que ya saben cómo interpretar y utilizar la retroalimentación? Estas son preguntas
para el futuro.
Conclusión
Para resumir, comúnmente se cree que la responsabilidad del docente respecto al uso de
actividades evaluadas para facilitar mejorías en el aprendizaje se cumple a cabalidad cuando
se entregan comunicaciones verbales extensas referentes a las especificaciones de la tarea
que se evaluará (y posiblemente a criterios de evaluación establecidos); información acerca
de la calidad de un trabajo evaluado; y consejos que ayuden a construir una respuesta a tareas
evaluadas que se presenten en un futuro. A la primera se la conoce comúnmente como
prealimentación, a las otras se las conoce como retroalimentación. Sin embargo, la evidencia
empírica muestra que aunque estas comunicaciones sean comprendidas por los estudiantes,
es muy común que no se observen mejorías en sus próximos trabajos, y si las hay, éstas serán
mínimas. Debido a que la retroalimentación de alta calidad requiere una contribución
específica por parte de los docentes, y debido a que a muchos de los estudiantes no les interesa
o no obtienen beneficios de ella, se puede entender que los docentes se sientan
desconcertados o desanimados.
El argumento presentado en este artículo hace mención a que el problema
fundamental no yace tanto en la calidad de la prealimentación y de la retroalimentación, sino
en suponer que informarles algo a los estudiantes, aunque sea de manera detallada, es la ruta
más apropiada para mejorar la enseñanza compleja. Aprender a partir de lo que el profesor
dice que debe hacerse es una estrategia general errónea ya que rara vez se cumplen las
condiciones para que los enunciados realicen una conexión íntima con el trabajo del
estudiante (con miras a trabajos futuros). Además, algunas formas de dar a conocer la
información, en especial las guías de evaluación y las plantillas que contengan criterios y
estándares pueden de hecho dificultar la formación de un concepto de calidad más completo
ya que tienden a priorizar características (criterios) específicas, en lugar de priorizar la
calidad como una propiedad global. También pueden dificultar el desarrollo de habilidades
que ayuden a identificar los criterios que sean más importantes en una evaluación especifica.
En palabras simples, depender de la entrega de información (como se expresa en la
prealimentación y retroalimentación) como el vehículo principal para promover las mejorías
en los estudiantes es depender del modelo de transmisión de información que se utiliza para
desarrollar conceptos de evaluación significativos.
Suponiendo que la baja disposición de los estudiantes a aprender no es la razón por
la cual no aprovechan las oportunidades de aprendizaje; entonces el tema sería cómo crear
un ambiente de enseñanza diferente que funcione eficazmente. La alternativa que se propone
para cambiar la secuencia usual es utilizar de manera intensa la evaluación entre pares con
un objetivo específico, como una estrategia pedagógica, no solo para evaluar sino también
para enseñar los contenidos fundamentales del curso. Los estudiantes deben tener un
conocimiento práctico razonable acerca de tres conceptos en particular –el cumplimiento de
una tarea, la calidad y los criterios- si se quiere que las interacciones entre docentes y
estudiantes tengan un efecto formativo, y si se quiere desarrollar capacidades para realizar
evaluaciones complejas. Estos conceptos de evaluación no deben considerarse como algo
abstracto sino como conceptos esenciales que deben interiorizarse, utilizarse y aplicarse en
operaciones concretas. Sin éstos, es probable que los conceptos clave de evaluación
continúen siendo ignorados e invisibles. A medida que se ponga en marcha este modelo, la
importancia de la retroalimentación como una divulgación se reduce. Por supuesto, si el
proceso fuera completamente exitoso, se obviaría completamente la necesidad de depender
sustancialmente de la retroalimentación entregada por el profesor.
References
Andrade, H., and Y. Du. 2007. Student responses to criteria-referenced self-assessment.
Assessment and Evaluation in Higher Education 32: 159-181.
Ausubel, D. 1963. The psychology of meaningful verbal learning. New York: Grune &
Stratton.
Black, P. and D. Wiliam. 1998. Assessment and classroom learning, Assessment in Education
5: 7-74.
Bjorkman, M. 1972. Feedforward and feedback as determiners of knowledge and policy:
Notes on a neglected issue. Scandinavian Journal of Psychology 13: 52-158.
Boud, D., R. Cohen, and J. Sampson. 2001. Peer learning in higher education: Learning from
& with each other. London: Routledge
Carroll, J.B. 1968. On learning from being told. Educational Psychologist 5: 4-10.
Crooks, T.J. 1988. The impact of classroom evaluation practices on students. Review of
Educational Research 58: 438-481.
Polanyi, M. 1962. Personal knowledge: Towards a post-critical philosophy. London: Routledge
& Kegan Paul.
Higgins, R., P. Hartley, and A. Skelton. 2002. The conscientious consumer: Reconsidering
the role of assessment feedback in student learning. Studies in Higher Education 27:
53-64.
Rust, C., M. Price, and B. O'Donovan. 2003. Improving students' learning by developing their
understanding of assessment criteria and processes. Assessment & Evaluation in Higher
Education 28: 147-164.
Sadler, D.R. 1980. Conveying the findings of evaluative inquiry. Educational Evaluation and
Policy Analysis 2(2): 53-57.
-------. 1989. Formative assessment and the design of instructional systems. Instructional
Science 18: 119-144.
-------. 1998. Formative assessment: Revisiting the territory. Assessment in Education:
Principles, Policy & Practice 5: 77-84.
-------. 2009a. Transforming holistic assessment and grading into a vehicle for complex
learning. In Assessment, learning and judgement in higher education, ed. G. Joughin,
49-64. Dordrecht: Springer.
-------. 2009b. Indeterminacy in the use of preset criteria for assessment and grading in higher
education. Assessment and Evaluation in Higher Education 34: 159-179.
Vygotsky, L.S. 1986. Thought and language. Revised and edited by Kozulin, A. Cambridge,
Mass: MIT Press. (Originally published in Russian as Myshlenie I rech, (1934