Sunteți pe pagina 1din 37

ISSN: 0718-6002

Programa de Promoción de la Reforma Educativa en América Latina y el Caribe


Partnership for Educational Revitalization in the Americas

DOCUMENTOS
No 46
Evaluación docente:
prácticas vigentes en los
países de la OCDE y una
revisión de la literatura

Marzo 2010

Marlène Isoré

Este informe fue preparado por Marlène Isoré, estudiante de postgrado del Institut d’Études Politiques de Paris (Sciences Po),
Francia, durante una pasantía en la División de Políticas de Educación y Capacitación, Dirección de Educación, OCDE, durante
el período junio-septiembre de 2008. PREAL agradece a la OCDE la autorización para traducirlo y publicarlo en español.

Las opiniones vertidas en este documento no representan necesariamente al PREAL ni a las instituciones que lo patrocinan.

1
Publicado originalmente por OECD en inglés como:
Isoré, M. (2009),–“Teacher Evaluation: Current Practices in OECD Countries and a Literature Review”,
OECD Education Working Paper No. 23
© 2009 OECD

© 2010, PREAL, Chile, para esta edición en español.


Publicado en acuerdo con OECD, París.
La calidad de la traducción al español y su coherencia con el texto original es de responsibilidad de PREAL, Chile.
Traducción: Maritza Blajtrach

Este documento puede ser descargado de: www.preal.org/publicacion.asp


Si desea solicitar copias adicionales, contacte a PREAL
a través de CINDE o del Diálogo Interamericano:

CINDE
Santa Magdalena 75, piso 10, oficina 1002, Providencia
Santiago, Chile
Tel.: 56-2-3344302

INTER-AMERICAN DIALOGUE
1211 Connecticut Ave., NW, Suite 510
Washington, D.C., 20036
Tel.: 202-822-9002

E-mail: infopreal@preal.org

ISSN 0718-6002
Primera edición
Publicado en Chile

Diseño e Impresión:
Editorial San Marino
esm.cl

2
ÍNDICE

1. Introducción ................................................................................................................................................................................... 4

2. Principales características de los esquemas de evaluación del desempeño docente .................................................... 5

2.1 Propósitos de la evaluación ................................................................................................................................................... 5


2.1.1 La evaluación sumativa y la garantía de la calidad .................................................................................................. 5
2.1.2 Evaluación formativa y desarrollo profesional ........................................................................................................... 6
2.2 Principales elementos de los esquemas de evaluación docente ........................................................................................ 7
2.2.1 Actores involucrados en la concepción e implementación de los sistemas de evaluación ................................... 7
2.2.2 Alcance de la evaluación y maestros evaluados ....................................................................................................... 9
2.2.3 Criterios y estándares ................................................................................................................................................ 10
2.2.4 Instrumentos de recopilación de datos .................................................................................................................... 12
2.2.5 Evaluadores ................................................................................................................................................................ 13
2.3 Vínculos con el reconocimiento y las retribuciones ............................................................................................................ 15
2.4 Vínculos con las oportunidades de desarrollo profesional y las prioridades más generales de las escuelas .............. 16

3. Ventajas y desventajas de los diferentes enfoques con respecto a la evaluación docente ......................................... 17

3.1 Ventajas y desventajas del uso de los indicadores de rendimiento escolar como medida del
desempeño docente .............................................................................................................................................................. 17
3.2 Diseño de un conjunto coherente de métodos e instrumentos alineado con el propósito enfatizado
de evaluación docente .......................................................................................................................................................... 19
3.3 Dificultades en la implementación de los esquemas de evaluación del desempeño docente ........................................ 21
3.3.1 Conflictos de interés entre los diferentes actores ................................................................................................... 21
3.3.2 Cómo superar los obstáculos .................................................................................................................................... 23

4. Evidencia empírica de los efectos de los esquemas de evaluación del desempeño docente ..................................... 24

4.1 Evidencia cuantitativa ........................................................................................................................................................... 24


4.1.1 Dificultades para medir la calidad del desempeño docente y el impacto de la evaluación
del desempeño docente ............................................................................................................................................ 24
4.1.2 Evidencia empírica mixta con respecto a los sistemas de evaluación del desempeño docente ........................ 25
4.2 Evidencia cualitativa ............................................................................................................................................................. 27

5. Conclusión ................................................................................................................................................................................... 29

Anexo 1: Marco conceptual para la evaluacion del desempeño docente ................................................................................ 30

Anexo 2: Ejemplos de sistemas de evaluación del desempeño docente en los países de la OCDE .................................. 31

1. Evaluación del desempeño docente con propósitos sumativos y vínculos con la remuneración: ................................. 31
2. Evaluación docente con propósitos formativos y como parte de las políticas escolares más generales ...................... 31
2a. Finlandia [UNESCO, 2007] ....................................................................................................................................... 31
2b. Inglaterra [Ofsted, 2006; TDA, 2007] ....................................................................................................................... 32
3. Conciliación de los propósitos sumativos y formativos en un enfoque integral: Chile [Ávalos y Assael, 2006] ............ 32
4. Evaluación docente derivada de procedimientos burocráticos: Francia [Haut Conseil de l’évaluation de
l’école, 2003; Pochard, 2008] ............................................................................................................................................... 33

Referencias .......................................................................................................................................................................................... 34

3
RESUMEN nales con la apropiación del proceso por parte de
los maestros, así como también para aumentar el
En este informe se analizan los principales pro- decisivo atractivo y reconocimiento de la profe-
blemas relativos a la evaluación del desempeño sión docente.
docente en la educación primaria y secundaria
mediante una revisión de la literatura reciente y
un examen de las prácticas vigentes en los paí- 1. INTRODUCCIÓN
ses de la OCDE. En primer lugar, se presenta un
marco conceptual que destaca las principales ca- En este informe se examina la literatura acadé-
racterísticas de los esquemas de evaluación do- mica y de políticas actual sobre evaluación del
cente. En particular, se recalca la importancia de desempeño docente en la educación primaria y
aclarar los propósitos de la evaluación, ya sean secundaria. Se actualiza y expande la sección
sumativos, cuando el objetivo es garantizar que correspondiente incluida en “Los docentes son
se están aplicando prácticas que favorecen el importantes: cómo atraer, formar y retener a los
aprendizaje de los estudiantes, o formativos, docentes eficientes” ( Teachers Matter: Attrac-
cuando el objetivo es la formación profesional ting, Developing and Retaining Effective Tea-
continua. Además, se consideran los diversos cri- chers), publicado por la OCDE en 2005.
terios e instrumentos utilizados comúnmente para
evaluar a los maestros, como también los actores La evaluación de la práctica y el desempeño de
generalmente involucrados en el proceso y las los docentes no es una preocupación reciente.
posibles consecuencias para la vida profesional Como resultado de las demandas por una mejor
de los docentes. En segundo lugar, se aborda calidad de la educación, muchos países han
una serie de puntos conflictivos, incluyendo la establecido alguna forma de evaluación del de-
conveniencia de utilizar los indicadores de rendi- sempeño docente. Sin embargo, la evaluación
miento escolar para medir el desempeño de los docente ha sido siempre un tema muy
docentes, las ventajas y desventajas de diferen- controvertido, con evidencia empírica mixta con
tes enfoques dependiendo del propósito enfatiza- respecto a sus efectos en el aprendizaje de los
do y las restricciones de recursos, las dificultades estudiantes y con conflictos de interés entre los
de implementación resultantes de los diferentes principales actores de los sistemas educacionales.
intereses de los actores y las posibles maneras Por consiguiente, la evaluación ha sido con
de superar estos obstáculos. Finalmente, se exa- frecuencia un ejercicio sinsentido, derivado de los
mina la evidencia empírica actual, que apunta a rituales burocráticos requeridos en las escuelas y
resultados mixtos a consecuencia de las dificulta- sobrellevado tanto por los docentes como por los
des para medir los efectos de los esquemas de evaluadores (Danielson, 2001; Holland, 2005;
evaluación existentes sobre la calidad de la en- Marshall, 2005). Solo recientemente algunos
señanza, la motivación de los maestros y el países han mostrado un creciente interés por
aprendizaje de los estudiantes. Como conclusión, establecer sistemas de evaluación como un
se consideran las circunstancias bajo las cuales elemento integral de las políticas docentes y
los sistemas de evaluación del desempeño do- escolares más generales (Peterson, 2006; TDA
cente parecen ser más eficaces, equitativos y 2007a).
confiables. El desarrollo de un enfoque integral
para evaluar a los maestros es crítico para conci- Los esquemas de evaluación docente vigentes
liar las demandas de mejores prácticas educacio- en los sistemas educacionales de la OCDE

4
adoptan múltiples formas. El alcance y los méto- 2.1.1 La evaluación sumativa y la garantía de
dos de la evaluación docente, los criterios y es- la calidad
tándares aplicados y los instrumentos de recopi-
lación de datos difieren ampliamente de un país Si el objetivo final de los sistemas educacionales es
a otro, dependiendo del contexto educacional y favorecer el aprendizaje de todos los estudiantes y
la tradición, de los actores involucrados en el si el desempeño y la práctica de los docentes cons-
diseño e implementación del sistema de evalua- tituyen el principal factor en este propósito, la eva-
ción y del propósito de evaluación enfatizado. luación docente podría considerarse como un me-
Las consecuencias de los procesos de evalua- canismo de garantía de la calidad (Danielson y
ción para las carreras profesionales de los do- McGreal, 2000; Kleinhenz e Ingvarson, 2004). Su-
centes también son diversas. Si bien el escala- poniendo que la calidad de los docentes y la cali-
fón único y la estructura salarial única siguen dad de la educación son importantes, un proceso
aplicándose en forma generalizada, diversos de evaluación idealmente debería estar orientado
países han intentado vincular su sistema de tanto a la eficiencia educacional –garantizando que
evaluación docente ya sea al reconocimiento y la enseñanza cumpla con los estándares académi-
las retribuciones, financieras o de otro tipo, o a cos requeridos para que los estudiantes vivan en
las oportunidades de desarrollo profesional. sociedades del conocimiento– como a la equidad
educacional, garantizando que todos los estudian-
Este informe consta de tres secciones más. En tes tengan acceso a las oportunidades de progreso
la sección 2 se examinan las principales dimen- escolar independientemente de sus antecedentes.
siones de los esquemas de evaluación docente Por lo tanto, la evaluación sumativa del desempeño
encontradas en la literatura o en los sistemas docente es una forma de evaluar que los docentes
educacionales de la OCDE. En la sección 3 se estén adoptando las acciones y prácticas ‘óptimas’
analizan las ventajas y desventajas de los dife- para mejorar los resultados de los estudiantes.
rentes enfoques, como también las dificultades
planteadas por la implementación de programas El desarrollo de una evaluación sumativa es la
de evaluación eficaces debido a los diferentes manera más visible y reconocible de evaluar a
puntos de vista de los actores. Finalmente, en la una persona y consiste en realizar informes re-
sección 4 se resume la evidencia existente con sumidos de las capacidades de un maestro a
respecto a los efectos de los sistemas de eva- través de exámenes, con el fin de medir sus
luación docente. aptitudes y conocimientos, garantizar el cumpli-
miento de los estándares requeridos o certificar
el nivel de desempeño con miras a un reconoci-
2. PRINCIPALES CARACTERÍSTICAS DE miento inmediato. La evaluación docente suma-
LOS ESQUEMAS DE EVALUACIÓN DEL tiva entrega información esencial con respecto a
DESEMPEÑO DOCENTE las prácticas que está aplicando y al desempeño
que está teniendo el maestro que está siendo
En esta sección se describen las principales di- evaluado en relación con los estándares de
mensiones de los esquemas de evaluación del ‘buena’ enseñanza establecidos. En consecuen-
desempeño docente encontradas en la literatura cia, la evaluación sumativa es una fuente de do-
y en los sistemas educacionales de la región de cumentación indispensable para responsabilizar
la OCDE. a los maestros por su desempeño profesional.
Por ejemplo, Stronge y Tucker (2003) recalcan
2.1 PROPÓSITOS DE LA EVALUACIÓN la necesidad de un mecanismo de garantía de
calidad como este: “El propósito de responsabili-
La evaluación del desempeño docente tiene dos dad por los resultados refleja un compromiso
propósitos principales. Por una parte, garantizar con los importantes objetivos profesionales de
que los maestros se desempeñen de la mejor ma- competencia y desempeño de calidad. Esta fun-
nera posible para favorecer el aprendizaje de los ción de responsabilidad por los resultados (…)
estudiantes. Por otra, mejorar la propia práctica de está relacionada con la evaluación de la eficien-
los maestros a través de la identificación de sus cia de los servicios educacionales”.
fortalezas y deficiencias con miras a la formación
profesional continua. Estos dos enfoques están re- La necesidad de mecanismos de responsabili-
feridos a dos formas de evaluación de naturaleza dad por los resultados en la docencia proviene
diferente, sumativa y formativa, respectivamente. de la existencia de relaciones asimétricas, típi-

5
cas del ‘problema de la relación mandante-man- mite realizar comparaciones y estas últimas son
datario’ tan conocido para las teorías de las útiles para las decisiones con respecto a la contra-
ciencias económicas y políticas. El ‘mandante’ tación y permanencia en los cargos, las oportuni-
carece de información crucial para saber si su dades de ascenso o, en condiciones particulares,
empleado, el ‘mandatario’, se está desempeñan- las medidas a aplicar en el caso de los maestros
do de acuerdo a sus expectativas de resultados. ineficientes.
En nuestro caso particular, los padres, las auto-
ridades a cargo de la calidad de la educación e La evaluación sumativa del desempeño docente
incluso los directores de los establecimientos también puede utilizarse como base para el re-
escolares solo tienen medios limitados para co- conocimiento y la retribución del trabajo de los
nocer el grado de concordancia entre el desem- maestros. Existen inquietudes con respecto a la
peño de los maestros y sus expectativas de imagen y el prestigio de la profesión docente en
aprendizaje de los estudiantes. En palabras de varios países de la OCDE, incluyendo el senti-
Mizala y Romaguera (2004): “La responsabilidad miento de los maestros de que su trabajo está
por los resultados es fundamental, debido a que subvalorado. La evaluación ofrece oportunida-
existe una brecha de información que separa a des para reconocer y retribuir la competencia y
las escuelas de las familias. Es difícil para las el desempeño de los docentes, aspectos esen-
familias obtener información actualizada y perti- ciales para retener a los docentes eficientes en
nente con respecto a lo que está ocurriendo en las escuelas, como también para hacer de la
sus escuelas y las escuelas no reciben necesa- docencia una elección atractiva como carrera
riamente incentivos para entregar información a profesional (OCDE, 2005). Por ejemplo, la Junta
los padres. Además, la capacidad de las familias Nacional Norteamericana para los Estándares
para obtener información con respecto a las es- Profesionales Docentes (US National Board for
cuelas varía, dependiendo de su nivel cultural y Professional Teaching Standards - NBPTS) ha
socioeconómico”. Considerando esta informa- desarrollado “rigurosos estándares profesiona-
ción asimétrica, Casson (2007) sostiene que, en les que reflejan lo que los buenos maestros de-
ausencia de mecanismos de incentivo, los ben saber y ser capaces de hacer” como base
maestros tienen el incentivo de realizar menos para un sistema nacional voluntario de certifica-
esfuerzo (dado el costo asociado a una mayor ción de los docentes que cumplen con estos es-
cantidad de trabajo), debido a que “el distrito tándares. Desde su creación en 1987, más de
escolar no puede distinguir entre el bajo rendi- 64.000 docentes norteamericanos han sido re-
miento de los estudiantes producto de una falta conocidos por su desempeño sobresaliente.
de esfuerzo del maestro y el bajo rendimiento
de los estudiantes producto de la escasa habili- En su forma sumativa, la evaluación responde
dad de los estudiantes”. Si bien Casson argu- en primer lugar a las necesidades de garantizar
menta a favor de medidas tendientes a armoni- que la enseñanza se oriente al rendimiento aca-
zar el desempeño de los maestros con los démico de los estudiantes. También brinda opor-
intereses de las autoridades a posteriori para tunidades de reconocimiento social de las habili-
superar este problema, un sistema de evalua- dades de los maestros y su compromiso con su
ción sumativa bien diseñado podría ser suficien- trabajo. Estas son dos inquietudes principales
te como para motivar a los maestros a adoptar en nuestras sociedades del conocimiento.
las mejores prácticas, debido a que esto permite
cerrar la brecha de información a priori. 2.1.2 Evaluación formativa y desarrollo
profesional
Además del propósito informativo en sí mismo, los
resultados de las evaluaciones sumativas permi- Además de los propósitos de responsabilidad
ten la toma de decisiones con consecuencias con por los resultados y reconocimiento, la evalua-
respecto al maestro que está siendo evaluado. De ción docente puede aplicarse con el fin de mejo-
acuerdo a Ávalos y Assael (2006): “La mayor parte rar la práctica de un maestro. La evaluación for-
de las formas de evaluación se justifican debido a mativa se refiere a una evaluación cualitativa de
que se requiere información de diagnóstico o debi- la práctica actual de un maestro, orientada a
do a que entregan evidencia para la toma de deci- identificar sus fortalezas y deficiencias y a en-
siones. Esto también es válido para la evaluación tregar oportunidades de desarrollo profesional
del desempeño docente”. La evaluación de los adecuadas en las áreas en las cuales se requie-
maestros en relación con criterios específicos per- re perfeccionamiento. Como explican Stronge y

6
Tucker (2003): “El propósito de mejoramiento por parte de los maestros de los objetivos indivi-
del desempeño está relacionado con la dimen- duales establecidos durante el año anterior y
sión de desarrollo personal e implica ayudar a analizar los objetivos y necesidades individuales
los maestros a aprender y a reflexionar acerca para el año siguiente (UNESCO, 2007).
de su práctica y a mejorarla. Esta función de
mejoramiento generalmente es considerada de Asimismo, las instituciones a cargo de la forma-
naturaleza formativa y sugiere la necesidad de ción docente inicial también pueden beneficiarse
perfeccionamiento y formación profesional conti- a partir de la retroalimentación provista por las
nua”. Al contrario de una evaluación sumativa evaluaciones formativas. Pecheone y Chung
diseñada para formular juicios acerca de un (2006) describen la Evaluación del Desempeño
desempeño (evaluación de la enseñanza), la para los Maestros de California (Performance As-
función de una evaluación formativa es determi- sessment for California Teachers - PACT), un sis-
nar las maneras de mejorar la práctica actual tema de evaluación de las competencias de los
(evaluación orientada a la enseñanza). estudiantes de pedagogía para efectos de la ob-
tención de la licenciatura, como “una poderosa
La evaluación formativa es un proceso a través herramienta para el aprendizaje de los maestros
del cual los evaluadores entregan retroalimenta- y el mejoramiento de los programas”. En efecto,
ción constructiva al maestro, indicando el nivel agregan que este sistema ha generado muchos
al cual se está desempeñando en cada uno de debates profesionales “acerca de las característi-
los criterios pertinentes y sugiriendo maneras de cas de una enseñanza eficaz y acerca de lo que
mejorar su práctica. Las conversaciones con los los egresados deberían saber y ser capaces de
evaluadores o con colegas comprometen a los hacer”, lo que, a su vez, ha llevado a los progra-
maestros en una auto-reflexión acerca de su tra- mas a “reexaminar la manera en que apoyan y
bajo. En palabras de Danielson y McGreal preparan a los postulantes a la docencia”.
(2000): “A medida que los maestros consideran
la articulación de diferentes componentes de la En su modalidad formativa, la evaluación puede
docencia y sus elementos y comparan sus im- considerarse como una base para el mejora-
presiones y prácticas con las de los demás, miento de la docencia y las oportunidades de
intercambian técnicas y aprenden nuevas estra- desarrollo profesional durante toda la vida. Los
tegias de sus colegas. Estas conversaciones aspectos sumativos y formativos de la evalua-
son enriquecedoras; están centradas en la cali- ción del desempeño docente suelen ser propósi-
dad de la enseñanza y aportan mucho al apren- tos conflictivos, pero no necesariamente incom-
dizaje profesional de los participantes”. El em- patibles. En la práctica, los países rara vez
poderamiento de cada uno de los docentes en el utilizan una forma pura de modelo de evaluación
perfeccionamiento de sus propias habilidades docente, sino que más bien aplican una combi-
trasciende el propósito de garantía de la calidad nación singular que integra propósitos y meto-
inherente a la evaluación docente. dologías múltiples (Stronge y Tucker, 2003).

Además, los resultados de la evaluación formati- 2.2 PRINCIPALES ELEMENTOS DE LOS ESQUEMAS
va permiten que las escuelas adapten sus pro- DE EVALUACIÓN DOCENTE
gramas de desarrollo profesional a las necesida-
des de sus docentes de acuerdo a sus objetivos En esta sección se resumen los elementos invo-
educacionales. Las escuelas pueden aprender a lucrados en los sistemas de evaluación docente,
partir de las fortalezas de los maestros eficien- tales como los actores que participan en el dise-
tes –destacadas por las evaluaciones formati- ño e implementación del proceso, el alcance de
vas– e implementar programas de desarrollo la evaluación, los instrumentos y métodos de re-
profesional que respondan a sus deficiencias. copilación de datos y los criterios y estándares
En Finlandia, el director de un establecimiento aplicados para evaluar a los maestros.
escolar es el líder pedagógico responsable de
los maestros que trabajan en su establecimiento 2.2.1 Actores involucrados en la concepción
y de la implementación de las medidas necesa- e implementación de los sistemas de
rias para mejorar la calidad de la enseñanza. En evaluación
consecuencia, la mayoría de las escuelas finlan-
desas tienen un sistema que incluye debates Gobiernos. Los gobiernos desempeñan una fun-
anuales destinados a evaluar el cumplimiento ción principal en la concepción de los esquemas

7
de evaluación, dado que establecen los objetivos diseño e implementación del proceso de evalua-
en términos de indicadores de aprendizaje a nivel ción. En Finlandia, donde el sistema educacio-
nacional, frecuentemente a través de la legisla- nal se caracteriza por un muy alto grado de au-
ción. Por ejemplo, en Estados Unidos, la Ley tonomía escolar, todas las decisiones relativas a
‘Ningún Niño Debe Quedar Atrás’ (No Child Left los docentes (incluida la evaluación) se toman
Behind - NCLB), promulgada en 2001, pretende en las escuelas mismas (UNESCO, 2007). El rol
mejorar el desempeño de las escuelas primarias de los directivos escolares como evaluadores se
y secundarias norteamericanas elevando los es- analizará más adelante.
tándares de responsabilidad por los resultados
para los estados, los distritos escolares y las es- Investigadores educacionales y maestros ex-
cuelas. Los sistemas de evaluación eficientes de- perimentados. Para el diseño del sistema de
ben estar orientados al logro de los objetivos na- evaluación se puede solicitar la asesoría de in-
cionales. Además, algunas veces los gobiernos vestigadores y maestros en su calidad de exper-
desempeñan un rol directo en la implementación tos en la materia. Estos profesionales se en-
y supervisión de los procedimientos de evalua- cuentran en una buena posición como para
ción docente. La extensión de esta función de- saber cuáles son las ‘buenas’ prácticas docen-
pende del grado de descentralización del país tes, ya sea como resultado de sus estudios o su
(UNESCO, 2007). En este sentido, Francia es un propia experiencia como docentes, y pueden
caso paradigmático: la mayor parte de las deci- ayudar a identificar los criterios e instrumentos
siones legales se toman a nivel central, incluyen- pertinentes para evaluar a los maestros (Ingvar-
do las decisiones relativas a las escuelas públi- son, Kleinhenz y Wilkinson, 2007). Los integran-
cas; por lo tanto, el Ministerio de Educación es el tes de la NBPTS, constituida principalmente por
encargado de determinar los diferentes aspectos maestros, “examinaron los pros y los contras de
del sistema de evaluación. A nivel más general, diferentes métodos de investigación y luego
las autoridades nacionales son actores de mayor aplicaron sus propias experiencias a lo que oye-
importancia en los países en los cuales los do- ron y aprendieron, siempre teniendo en conside-
centes son funcionarios públicos. ración la intersección de los datos empíricos a
gran escala, su propia formación y desarrollo
Autoridades locales. Las autoridades locales en- profesional como maestros expertos y la natura-
cargadas de las políticas educacionales general- leza de los estudiantes a los que enseñan y sir-
mente tienen uno de los dos deberes siguientes ven. Deliberaron y debatieron entre ellos y luego
en relación con la evaluación docente. En algunos consultaron a otros colegas con el fin de gene-
países de la OCDE, las autoridades locales son rar nuevas perspectivas e ideas” (NBPTS,
responsables del logro de los objetivos nacionales 2007).
y, por lo tanto, implementan procedimientos consi-
derados deseables para garantizar la calidad edu- Sindicatos docentes. Los sindicatos docentes
cacional de los establecimientos escolares bajo su también pueden ser consultados para el diseño
responsabilidad. Por ejemplo, Heneman et al. e implementación de procedimientos relativos a
(2006) resumen las características de los modelos las prácticas y dificultades cotidianas de los
de evaluación docente de cuatro distritos norte- maestros. Se supone que los sindicatos docen-
americanos (Cincinnati, Washoe, Coventry y tes representan todos los intereses de los maes-
Vaughn). En otros países, las autoridades locales tros, cualquiera sea su nivel de desempeño. Su-
pueden tomar parte en la concepción del esquema poniendo que los maestros podrían mostrarse
de evaluación, pero están, sobre todo, a cargo de renuentes o temerosos frente a algunos aspec-
la implementación y supervisión de las medidas tos particulares de los esquemas de evaluación
de evaluación docente decididas por el Estado docente, los sindicatos docentes son indispen-
central. Por ejemplo, las municipalidades chilenas sables para diseñar un proceso que considere
brindaron asesoría en el diseño del proceso de sus intereses y se traduzca en un amplio con-
evaluación, pero actualmente todas aplican el mis- senso. Heneman et al. (2006) sostienen que de-
mo sistema nacional, que fue promulgado por ley ben incorporarse mecanismos para disminuir la
en 2004 (Ávalos y Assael, 2006). resistencia en el diseño inicial del plan. Estos
incluyen la comunicación amplia y continua con
Directivos escolares. Mientras más descentra- los docentes y los administradores. Agregan que
lizado es un país, mayor es la importancia del se requiere un compromiso con respecto a una
rol que cumplen los directivos escolares en el transformación de la manera en que se define,

8
mide y apoya el desempeño docente, y que di- Nivel de experiencia del maestro. Las evalua-
cho compromiso debe considerar las aprensio- ciones docentes pueden diferir dependiendo del
nes de los docentes y de los administradores. nivel de experiencia del maestro. Por ejemplo,
en Inglaterra, las características de los maestros
Los padres. Es poco frecuente que los padres se definen en cada etapa de la carrera profesio-
participen directamente en el diseño o imple- nal (TDA, 2007b), dado que sus funciones y res-
mentación de los sistemas de evaluación docen- ponsabilidades evolucionan durante toda la ca-
te, dado que sus intereses educacionales están rrera. Sin embargo, muchos países de la OCDE
representados por las autoridades nacionales y no diferencian a los maestros de acuerdo a su
locales mencionadas anteriormente. Su rol nivel de experiencia una vez que han obtenido
como evaluadores se analizará más adelante. la permanencia en el cargo: “La docencia, a di-
ferencia de todas las demás profesiones, plan-
2.2.2 Alcance de la evaluación y maestros tea las mismas exigencias a los novatos que a
evaluados los profesionales experimentados. Al momento
en que los maestros de primer año ingresan a
Los procedimientos de evaluación docente no sus primeras aulas, se les exige el mismo nivel
son necesariamente aplicables a todos los –y están sujetos a los mismos procedimientos–
maestros de un país; por el contrario, el alcance que sus colegas más experimentados. (…) A pe-
de la evaluación y los maestros sujetos a la eva- sar de que el distrito escolar debe garantizar
luación difieren considerablemente en los distin- que todos los maestros (incluyendo los princi-
tos sistemas educacionales de la OCDE. Las piantes) tengan al menos un cierto nivel de com-
principales diferencias son las siguientes. petencia, podrían existir algunas variaciones en
los procedimientos aplicados a los novatos y a
Procedimientos regionales. Los mismos sus colegas más experimentados” (Danielson y
procedimientos no son necesariamente McGreal, 2000). No existe consenso con res-
aplicables a todo el país, sino que pueden variar pecto a la manera de diferenciar la evaluación
de acuerdo a la región considerada. Lo más de acuerdo al nivel de experiencia. Por ejemplo,
probable es que los procedimientos varíen a nivel puede argumentarse que los estudiantes de pe-
regional cuando la estructura federal o el alto dagogía deben ser sometidos a evaluaciones
grado de descentralización del país lo permiten. más frecuentes y más completas, puesto que
Por ejemplo, en Alemania, los ministerios a cargo deben demostrar la práctica y el desempeño
de la educación en cada Land (estado) adecuados para obtener su licenciatura. Darling-
determinan sus propias orientaciones para todos Hammond et al. (2004) señalaron que los es-
los aspectos de la evaluación docente: las fuerzos de la NBPTS por identificar y reconocer
personas a cargo del proceso, los criterios de la buena enseñanza motivaron la creación de un
evaluación, el tiempo destinado a la evaluación, sistema similar para evaluar a los estudiantes
los instrumentos de recopilación de datos y las de pedagogía en California (sistema PACT). Por
consecuencias de los resultados de la evaluación otra parte, estas evaluaciones podrían no ser
(UNESCO, 2007). necesarias, considerando que el programa de
pasantías e inducción para los maestros princi-
Tipo de establecimiento escolar. El sistema piantes les ofrece oportunidades formativas. En
podría estar limitado a las escuelas públicas, consecuencia, la Federación Norteamericana de
pero también podría ser aplicable a algunas es- Maestros recalca que más de la mitad de los
cuelas privadas, particularmente a estableci- estados de Estados Unidos no exigen que el
mientos al menos parcialmente subsidiados por docente haya cumplido un año o dos de ense-
el Estado, si bien de propiedad y administración ñanza exitosa para obtener su licenciatura (AFT,
privada. Por ejemplo, la Política de Perfecciona- 2001). Algunos sostienen que las evaluaciones
miento, Supervisión y Evaluación Docente de la sumativas deberían ser relativamente más im-
provincia canadiense de Alberta es igualmente portantes para los maestros experimentados,
aplicable a las escuelas charter (escuelas con dado que se supone que comprenden mejor lo
una organización semiautónoma, pero con fi- que se espera de un ‘buen’ maestro (Danielson
nanciamiento completamente público) y a las y McGreal, 2000), mientras que otros recalcan
escuelas privadas acreditadas (solo subsidiadas que su primera necesidad es la retroalimenta-
parcialmente con fondos públicos) (Alberta Edu- ción formativa para mantener intacta su motiva-
cation, 1996, 2003). ción (Day y Gu, 2007).

9
Periodicidad de la evaluación. Un aspecto se inició con dos años de implementación piloto
principal a considerar es si las evaluaciones for- (en 2002-2003 y 2003-2004), durante los cuales
males son parte del trabajo regular del maestro se evaluaron áreas pedagógicas restringidas
o deben realizarse en ocasiones especiales (y lo con el fin de validar los métodos utilizados y
contrario es válido para las evaluaciones infor- mejorar el programa para los años siguientes
males). En Holanda, el 38% de las escuelas pri- (Pecheone y Chung, 2006). Cuanto más se vean
marias y el 62% de las secundarias evalúan a afectadas las vidas profesionales de los maes-
sus maestros de manera regular; en la mayoría tros por el proceso de evaluación, más impor-
de los casos, los maestros son evaluados anual- tante será la implementación piloto.
mente (UNESCO, 2007). En otros países, existe
un proceso obligatorio de evaluación formal solo 2.2.3 Criterios y estándares
cuando los maestros han sido objeto de un re-
clamo. En Italia, una vez que se otorga la per- Un esquema de evaluación docente equitativo y
manencia en el cargo, pueden realizarse eva- confiable requiere criterios y estándares para
luaciones formales cuando los administradores evaluar a los maestros en relación con lo que se
de la escuela inician un procedimiento de ‘exo- considera una ‘buena’ enseñanza. Deben deter-
neración de los servicios’, debido a que se ha minarse las competencias y responsabilidades
observado una práctica inadecuada o un de- de los docentes con el fin de concebir una defi-
sempeño insuficiente durante un período signifi- nición integral de lo que los maestros deberían
cativo; un maestro también puede solicitar ser saber y ser capaces de hacer en el ejercicio de
evaluado para efectos de rehabilitación si se en- su profesión. Un aporte de referencia en esta
cuentra sujeto a una sanción disciplinaria área es el Marco para la Enseñanza de Daniel-
(UNESCO, 2007). son (1996, 2007), articulado para servir al mis-
mo tiempo como “un mapa de ruta para guiar a
Evaluaciones obligatorias versus evaluacio- los maestros principiantes a través de sus expe-
nes voluntarias. Además de los procedimientos riencias iniciales en las aulas, una estructura
de evaluación obligatorios, algunos países ofre- para ayudar a que los profesionales experimen-
cen a los maestros la posibilidad de ser evalua- tados se vuelvan más eficaces y un medio para
dos en forma voluntaria con el fin de postular a focalizar las iniciativas de mejoramiento”.
un aumento de su remuneración o a un cargo de
más alto nivel. En España, por ejemplo, un El Marco agrupa las responsabilidades de los
maestro de enseñanza secundaria puede ser maestros en cuatro grandes dominios, que lue-
ascendido excepcionalmente después de una go se dividen en componentes:
revisión de los resultados de su evaluación por
un consejo profesional, el cuerpo de catedráti- • Planificación y preparación: demostrar
cos (UNESCO, 2007). Es posible combinar las conocimientos de los contenidos y de
evaluaciones obligatorias formales con evalua- pedagogía, demostrar conocimiento de los
ciones voluntarias e informales, puesto que su estudiantes, establecer los objetivos
propósito suele no ser idéntico. En efecto, un pedagógicos, diseñar una instrucción
procedimiento de evaluación formal está más coherente, evaluar el aprendizaje de los
probablemente destinado a propósitos sumati- estudiantes.
vos mínimos, mientras que un procedimiento de • El ambiente del aula: crear un ambiente de
evaluación informal ofrece las mayores oportuni- respeto e interacción, establecer una cultura
dades formativas y un procedimiento voluntario propicia para el aprendizaje, manejar los
es preferido para propósitos sumativos conse- procedimientos de aula, manejar la conduc-
cuenciales. Por ejemplo, en Chile coexisten dos ta de los estudiantes y organizar el espacio
formas de evaluación: una evaluación periódica físico.
obligatoria para todos los maestros de las es- • Instrucción: comunicarse con los estudian-
cuelas públicas y una evaluación voluntaria para tes en forma clara y precisa, utilizar técni-
efectos de ascenso (Ávalos y Assael, 2006). cas de interrogación y debate, comprometer
a los estudiantes en el aprendizaje, entregar
Implementación piloto. El alcance de la eva- retroalimentación a los estudiantes, demos-
luación puede limitarse a una implementación trar flexibilidad y sensibilidad.
piloto durante algunos años antes de la plena • Responsabilidades profesionales: re-
implementación. El sistema PACT de California flexionar sobre la enseñanza, mantener re-

10
gistros rigurosos, comunicarse con las fami- estándares de la NBPTS están referidos a
lias, participar activamente en el estableci- maestros competentes que se someten volunta-
miento escolar y el distrito escolar, realizar riamente a una evaluación para ser reconocidos
actividades de perfeccionamiento y desarro- por el alto nivel de desempeño que han adquiri-
llo profesional, mostrar profesionalismo. do a través de su experiencia docente. Por el
contrario, en el caso de los maestros principian-
Cada uno de estos componentes consiste en di- tes, el Nuevo Consorcio Interestatal de Evalua-
versos elementos que deben ser evaluados. Por ción y Apoyo Docente (Interstate New Teacher
ejemplo, el conocimiento de los estudiantes por Assessment and Support Consortium - INTASC)
parte del maestro comprende elementos tales desarrolló estándares de conocimientos y habili-
como el conocimiento de las características de dades docentes para los sistemas de titulación
los grupos etarios, el conocimiento de los diver- de los maestros (CCSSO, 1992).
sos estilos de aprendizaje de los estudiantes,
etc. Cada elemento de un componente está aso- Una serie de sistemas de evaluación docente de
ciado a cuatro niveles de desempeño: ‘insatis- Estados Unidos han establecido una lista de cri-
factorio’, ‘básico’, ‘competente’ y ‘destacado’. terios basados en el Marco para la Enseñanza de
Danielson. Cuatro distritos norteamericanos
Danielson sostiene que los niveles de desempe- –Cincinatti, Washoe, Coventry y Vaughn– adopta-
ño son especialmente útiles en la supervisión y ron versiones adaptadas del modelo de compe-
evaluación, pero también pueden emplearse tencias del Marco (Milanowski, 2004; Borman y
para ayudar a la autoevaluación o apoyar las Kimball, 2005; Heneman et al., 2006). Lo mismo
relaciones de tutoría o coaching, para informar hizo la provincia de Quebec en Canadá. Los cua-
un debate profesional y para sugerir las áreas tro dominios y veinte criterios de evaluación esta-
que requieren perfeccionamiento. En conse- blecidos en Chile se inspiraron en gran medida
cuencia, el Marco puede servir tanto para efec- en el Marco (Ávalos y Assael, 2006). El análisis
tos sumativos como formativos. Danielson tam- de la UNESCO de los sistemas de evaluación
bién advierte contra los posibles usos docente europeos y latinoamericanos da énfasis
inadecuados de los componentes, señalando al conocimiento de los contenidos, las habilida-
que, aunque los componentes sean genéricos y des pedagógicas, las habilidades para evaluar a
hayan sido diseñados para ser aplicables a los estudiantes y las responsabilidades profesio-
cualquier situación pedagógica, sus manifesta- nales ante el establecimiento escolar, los estu-
ciones reales diferirán en los diversos contex- diantes y sus familias como dominios clave para
tos. Por ende, los evaluadores deben examinar evaluar a los docentes. Cabe señalar que el aná-
la aplicabilidad y ponderación de cada compo- lisis no menciona la participación en programas
nente, junto con trasladar los elementos especí- de desarrollo profesional como un estándar do-
ficos observables a contextos particulares. cente común en los sistemas europeos, con el
consiguiente riesgo de subestimar el compromiso
Kleinhenz e Invargson (2004) advierten de “la y disposición de los maestros con respecto al
ausencia de estándares que describan adecua- mejoramiento de su propia práctica. Sin embar-
damente el trabajo de la docencia – qué es lo go, recientemente Inglaterra implementó un mar-
que se puede esperar que los docentes sepan y co para los estándares profesionales similar al de
sean capaces de hacer en dominios de práctica Danielson, que incluye criterios de desarrollo pro-
específicos”, lo que necesariamente se traduce fesional para los cinco niveles de desempeño do-
en un deficiente “núcleo técnico de conocimien- cente (la certificación como Maestro Calificado,
tos y habilidades docentes”. Agregan que “ac- los maestros incluidos en el escalafón principal,
tualmente existe consenso con respecto al he- los Maestros Post-Umbral, los Maestros Excelen-
cho de que estándares integrales, congruentes tes y los Maestros con Habilidades Avanzadas)
y específicos a cada dominio constituyen la úni- (TDA, 2007b).
ca base confiable para la formulación de juicios
útiles con respecto a la competencia docente”. Entre los ocho estándares (que incluyen 42 crite-
Entre los conjuntos de estándares que se utili- rios) del Estado de Iowa, los seis siguientes son
zan actualmente para evaluar a los maestros, muy afines al Marco de Danielson: competencia
algunos fueron propuestos antes del Marco de en el conocimiento de los contenidos, competen-
Danielson, pero están referidos a trabajadores cia en planificación y preparación para la instruc-
en situaciones más específicas. Por ejemplo, los ción, métodos de enseñanza y evaluación del

11
aprendizaje de los estudiantes, competencia en forma de recopilar evidencia acerca de un do-
el manejo del aula, compromiso con el desarrollo cente en particular podría influir en los resulta-
profesional y cumplimiento de las responsabilida- dos de la evaluación, la selección de los instru-
des profesionales (Departamento de Educación mentos tiene una importancia crucial en el
de Iowa, 2002). Sin embargo, los dos criterios diseño e implementación de los sistemas de
restantes difieren de la definición de Danielson evaluación del desempeño docente.
de lo que es una buena enseñanza. El primero se
refiere a las estrategias utilizadas para impartir Observaciones en el aula. Las observaciones
una enseñanza que cumpla con las múltiples ne- en el aula son la fuente más común de evidencia
cesidades de aprendizaje de los estudiantes. Da- utilizada en los países de la OCDE, ya sea en
nielson sostiene que la equidad está implícita en América (por ejemplo, Canadá, Chile, Estados
todo el Marco, particularmente en el caso de los Unidos), en Europa (por ejemplo, Dinamarca,
dominios relacionados con la interacción con los Francia, Irlanda, España) o en la región de Asia-
estudiantes (“en un ambiente de respeto e inter- Pacífico (por ejemplo, Australia, Japón, Corea).
acción, todos los estudiantes se sienten valo- Este proceso permite observar si el maestro
rados”), reconociendo, sin embargo, que “la con- adopta prácticas adecuadas en su lugar de traba-
ciencia de la adecuación a las diferentes etapas jo más usual: el aula (UNESCO, 2007). Sin em-
de desarrollo puede extenderse, incluyendo la bargo, dependiendo del evaluador y del contexto,
sensibilidad a los estudiantes con necesidades la utilidad y capacidad informativa de la evidencia
especiales”. En contraste, el estándar de Iowa se recopilada podría diferir. Peterson (2000) explica
centra explícitamente en la habilidad del maestro que la observación de la experticia que exhibe un
para aumentar la equidad, por ejemplo, aplicando maestro en los contenidos que debe dominar
estrategias que aborden todo el rango de niveles ejerce un rol menor en algunas situaciones, pero
cognitivos o incorporando los conocimientos an- es muy importante en otras.
teriores de los estudiantes, sus experiencias de
vida y sus intereses en el proceso pedagógico. El Entrevistas al docente. Las entrevistas a los
segundo estándar de Iowa que difiere del Marco docentes podrían adoptar múltiples formas, con
es la demostración por parte de los maestros de un grado de estructuración variable. En unos
la capacidad para mejorar el rendimiento acadé- pocos casos, son útiles para formular juicios di-
mico de los estudiantes. Por ejemplo, el maestro rectos acerca de las competencias y habilidades
debe entregar evidencia del aprendizaje de los de un maestro, pero son más adecuadas para
estudiantes a los estudiantes mismos, a las fami- fines de desarrollo profesional, al preguntarles a
lias y al personal docente. Este punto es más los maestros qué actividades de perfecciona-
conflictivo, no solo debido a que una multitud de miento quisieran o necesitarían realizar. Por
otros factores puede influir en los indicadores de ejemplo, las escuelas inglesas que entregan for-
aprendizaje de los estudiantes, sino que además, mación profesional exhaustiva a los docentes
y más importante, puede que no sea parte del rol utilizan entrevistas con respecto al manejo del
del maestro demostrar a un tercero que su de- desempeño para identificar las necesidades in-
sempeño es la base del éxito académico de sus dividuales de su personal docente (Ofsted,
estudiantes. Los resultados de los estudiantes 2006). Sin embargo, la propensión de los do-
son utilizados algunas veces por los evaluadores centes a revelar sus verdaderas deficiencias y
como un instrumento para medir el desempeño temores durante las entrevistas depende de su
de los maestros, pero el requerimiento de esta confianza en el entrevistador y de sus percep-
evidencia al maestro generalmente no es en sí ciones de la posibilidad de recibir retroalimenta-
mismo un criterio de buena práctica sujeto a eva- ción pertinente y constructiva derivada del pro-
luación. ceso de evaluación.

2.2.4 Instrumentos de recopilación de datos Portafolio preparado por el docente. Los por-
tafolios requieren que los docentes recopilen do-
Si bien, en general, existe un amplio consenso cumentación acerca de su trabajo actual. Dife-
con respecto a los criterios que determinan una rentes elementos pueden componer los
buena enseñanza, la definición de los instru- portafolios preparados por los docentes: planes
mentos para la recopilación de evidencia con de las lecciones y materiales pedagógicos, gra-
respecto a la práctica actual de un docente es baciones pedagógicas en video, muestras de
un aspecto mucho más conflictivo. Dado que la trabajos realizados por los estudiantes y comen-

12
tarios con respecto a ejemplos de evaluaciones gógicas de los maestros se evalúan mediante
aplicadas a los estudiantes, cuestionarios au- pruebas escritas. Es lo que ocurre en el caso de
toadministrados por los docentes y hojas de re- los nuevos maestros en Chile (Ávalos y Assael,
flexión. Beck, Livne y Bear (2005) recalcan que 2006) o los maestros que postulan a un ascenso
un dilema importante en el diseño de los porta- en México (OCDE, 2005).
folios es si el mismo es principalmente un medio
para la evaluación docente o el desarrollo profe- Cuestionarios y encuestas. Los cuestionarios
sional docente y si estos dos objetivos son com- con respecto a la práctica de los docentes po-
patibles. Este punto se profundizará más ade- drían ser respondidos por el director del estable-
lante. Además, debido a que los portafolios cimiento, por los padres o por los estudiantes,
constituyen una fuente de evidencia compleja, es decir, por quienes podrían dar testimonio de
Wertzel y Strudler (2006), Strudler y Wertzel la calidad de la enseñanza como resultado de
(2008), Jun et al. (2007) y Jacobs, Martin y Otie- una interacción permanente con el maestro y no
no (2008) señalan que la preparación de porta- solo durante el proceso de evaluación (Peter-
folios completos es particularmente útil en la son, 2000; Peterson et al., 2000, 2005; Jacob y
evaluación de los estudiantes de pedagogía o Lefgren, 2005b). En consecuencia, esta catego-
los maestros principiantes. Los programas de ría precisa de cuestionarios y encuestas excluye
formación docente también podrían beneficiarse los informes de evaluadores producto de obser-
a partir de los resultados obtenidos por los vaciones del aula o las entrevistas al maestro;
maestros principiantes en las evaluaciones de está restringida a cuestionarios como fuentes de
sus portafolios (Jacobs, Martin y Otieno, 2008). evidencia per se. Las encuestas a los estudian-
tes son utilizadas como herramientas de evalua-
Indicadores de rendimiento escolar. Los indi- ción docente en México, la República Eslovaca,
cadores de rendimiento escolar no suelen ser España o Suecia, generalmente en el caso de
utilizados como fuentes de evidencia para la los maestros que postulan a un ascenso; según
evaluación docente en los países de la OCDE nuestros conocimientos, no se aplican en los es-
(OCDE, 2005; UNESCO, 2007). Los resultados quemas de evaluación docente obligatorios. Si
de los estudiantes en rendimiento académico bien la utilización de estos instrumentos puede
podrían reflejar el desempeño docente, espe- aportar alguna información interesante, es preci-
cialmente cuando se los mide en términos de so tener en mente que los evaluadores no son
mejoramientos de valor agregado más que en expertos en docencia y no valoran necesaria-
términos absolutos, es decir, después de contro- mente las mismas cualidades que aquellas que
lar los resultados anteriores de estudiantes indi- se supone que favorecen el aprendizaje de los
viduales que recibieron enseñanza del maestro estudiantes (Peterson et al., 2000, 2003; Jacob
(Braun, 2005). Por ejemplo, la Evaluación del y Lefgren, 2005b). Las investigaciones con res-
Desempeño Docente de California (Californian pecto al uso o la confiabilidad de dichos proce-
Teacher Performance Assessment) mide los me- dimientos lamentablemente siguen siendo muy
joramientos en el aprendizaje de los estudiantes escasas.
en relación con los estándares de los distritos
con el fin de recomendar a los maestros para 2.2.5 Evaluadores
una certificación. Sin embargo, el aprendizaje
de los estudiantes rara vez es utilizado como Revisión interna. En la mayoría de los países,
una medida del desempeño de los maestros en las evaluaciones docentes contemplan la partici-
los esquemas existentes, ya sea debido a que pación del director del establecimiento escolar u
no existen pruebas estandarizadas regulares otro personal directivo (Peterson, 2000; OCDE,
que permitan comparaciones viables o debido a 2005, 2008; UNESCO, 2007). Sin embargo, el
que enfrentan un fuerte rechazo de los docentes compromiso del personal directivo de los esta-
y los especialistas, que consideran que este ins- blecimientos escolares en el proceso de evalua-
trumento es defectuoso, ineficaz o poco equitati- ción difiere en los distintos países. En 2003, el
vo (Weingarten, 2007). Las ventajas y desventa- 100% de los estudiantes norteamericanos esta-
jas de este tipo de medición directa del ban matriculados en escuelas secundarias cu-
‘desempeño puro’ se analizarán más adelante. yos directores informaban que habían realizado
observaciones de aula durante el año anterior,
Pruebas a los docentes. Excepcionalmente, el mientras que esto solo era válido para el 5% de
conocimiento curricular y las habilidades peda- los estudiantes de Portugal, con un promedio de

13
60% para la OCDE (OCDE, 2008). En los distin- otro evaluador, los documentos preparados por
tos países, es variable el tiempo y la capacidad el maestro podrían utilizarse con un propósito
que tienen los directivos de los establecimientos sumativo. Sin embargo, el propósito formativo
escolares para asumir esta importante respon- es predominante, puesto que el proceso de re-
sabilidad (Marshall, 2005; Jacob y Lefgren, flexión permite que el maestro tome conciencia
2005a, 2008). Las ventajas y desventajas deri- de sus propias fortalezas y deficiencias e identi-
vadas del hecho que la evaluación sea realizada fique sus necesidades de perfeccionamiento,
por los directores en lugar de otros evaluadores desarrollo profesional o coaching.
se examinarán más adelante.
Padres. Los padres generalmente desempeñan
Revisión externa. Algunos países han imple- una función indirecta en el proceso de evalua-
mentado esquemas de evaluación en los cuales ción cuando los informes de los directores inclu-
los docentes son evaluados por pares o por yen sus reclamos acerca de un maestro en par-
maestros competentes, ya sea en forma exclusi- ticular o, por el contrario, sus solicitudes con
va (Irlanda) o como parte de un panel que inclu- respecto a un maestro en particular. Es menos
ye al director del establecimiento (Francia). Por frecuente que actúen como evaluadores direc-
una parte, los ‘pares’ son otros docentes que tos, como, por ejemplo, a través de cuestiona-
tienen un nivel equivalente en términos de asig- rios. La escasa evidencia actual en esta área
nación, formación, experiencia, perspectiva e in- muestra que las características de los maestros
formación acerca de las condiciones en las cua- valoradas por los padres están sorprendente-
les se desenvuelve la práctica sujeta a revisión, mente alejadas del rendimiento académico de
pero no deberían ni enseñar en la misma escue- los estudiantes: ‘la capacidad del maestro de
la que el maestro que está siendo evaluado ni promover la satisfacción de los estudiantes’ (Ja-
estar social o políticamente relacionados con cob y Lefgren, 2005b), ‘el trato humano a los
este (Peterson, 2000). Por otra parte, los ‘maes- estudiantes’, ‘el apoyo al aprendizaje de los es-
tros’ competentes son reconocidos como maes- tudiantes’ y ‘la comunicación y colaboración
tros que tienen un conocimiento profundo de las efectiva con los padres’ (Peterson et al., 2003).
materias y experticia pedagógica, como profe- Incluso si su perspectiva pudiera tomarse en
sionales altamente competentes y exitosos, ca- consideración, su distancia de los estándares
paces de guiar y apoyar a otros en el proceso profesionales docentes, su falta de conocimien-
de enseñanza (MCEETYA, 2003). Ambos tipos to acerca de lo que ocurre en las aulas y su
de evaluadores tienen ventajas relativas: los pri- compromiso emocional sugieren que sus valora-
meros participan en el proceso en una condición ciones están lejos de ser apropiadas para un
de igualdad con los docentes evaluados, mien- esquema de evaluación docente integral.
tras que los segundos lo hacen desde la pers-
pectiva de la experticia. Estudiantes. Los estudiantes son rara vez con-
sultados como evaluadores. México, España y
Autoevaluación. La participación de los docen- Suecia utilizan encuestas a los estudiantes, pero
tes en ‘evaluaciones de empoderamiento’ es generalmente solo en algunos grados de la ense-
esencial tanto para obtener la aceptación del ñanza o en casos especiales de evaluación do-
proceso de evaluación por parte de los maes- cente (por ejemplo, evaluaciones voluntarias
tros como para mejorar el desempeño docente para un ascenso o un procedimiento relacionado
(Peterson, 2000; Kennedy, 2005). Los portafo- con un reclamo). Los estudios con respecto a
lios son instrumentos particularmente adecua- evaluaciones de los docentes realizadas por es-
dos para la auto-reflexión docente, debido a que tudiantes en los niveles de la educación primaria
la adecuada decisión tomada por el maestro de y secundaria son extremadamente escasos. Pe-
incluir determinados componentes (planes de terson et al. (2000) señalan que los estudiantes
las lecciones, grabaciones de lecciones en vi- responden en forma directa y confiable con res-
deo, muestras de trabajos realizados por los es- pecto a la calidad de los maestros si las pregun-
tudiantes, comentarios narrativos) en lugar de tas están formuladas de manera simple y perti-
otros, constituye un juicio que requiere determi- nente. Propusieron tres conjuntos de preguntas
nar qué características de un componente son que, según ellos, funcionan bien, para estudian-
superiores a otras (Danielson, 1996, 2007; Dar- tes de la enseñanza preescolar, primaria y se-
ling, 2001; Mansvelder-Longayroux et al., 2007). cundaria. Sin embargo, consideran a los estu-
En combinación con una revisión realizada por diantes como “clientes”, pero este punto es muy

14
cuestionable. En efecto, los estudiantes no pa- el cual los mejores maestros pueden competir
gan directamente por los servicios educacionales por un aumento temporal de la remuneración,
(mientras que sus padres puede que paguen, del 15% durante un año al 20% durante cuatro
pero no son los consumidores de los servicios años (UNESCO, 2007).
educacionales) y, lo que es más importante, los
estudiantes son miembros matriculados involun- Otros países no relacionan directamente los re-
tariamente: no tienen la libertad de abandonar la sultados de las evaluaciones docentes con la
organización, de elegir su escuela o sus maes- remuneración de los maestros, pero los vinculan
tros, ni de influir en lo que se les enseña o cómo a la progresión en la carrera. Francia, Alemania,
se les enseña (Greenfield, 1995). Grecia, Polonia, Portugal y el Reino Unido se
encuentran entre estos países. Los maestros in-
2.3 V ÍNCULOS CON EL RECONOCIMIENTO Y LAS gleses que cumplen con los estándares para las
RETRIBUCIONES categorías de Maestros Post-Umbral, Maestros
Excelentes y Maestros con Habilidades Avanza-
El proceso de evaluación podría estar vinculado das, también acceden a la escala de remunera-
a mecanismos de reconocimiento y retribucio- ciones correspondiente (TDA, 2007b). En con-
nes. En la mayoría de los países de la OCDE traste, en una serie de países de la OCDE, los
existe una escala salarial única para los maes- resultados continuamente negativos en las eva-
tros y pocos incentivos formales y reconocimien- luaciones están vinculados a postergaciones del
tos por la buena práctica. Esto plantea inquietu- ascenso (OCDE, 2005). Cabe señalar que la
des con respecto al atractivo de la docencia vinculación del proceso de evaluación a incre-
como una elección de carrera profesional y al mentos salariales a través del escalafón podría
mantenimiento de la motivación de los maestros no ser suficiente en países en los cuales los
durante su carrera. El Departamento de Educa- niveles superiores del escalafón se alcanzan en
ción de Australia sostiene que, si bien las perso- etapas tempranas de la carrera docente. Por
nas que han escogido la docencia como carrera ejemplo, en Australia, el incentivo de incremen-
están principalmente motivadas por las recom- tos salariales vinculados a una revisión del des-
pensas ‘intrínsecas’, factores extrínsecos tales empeño no es aplicable a la mayoría de los
como la remuneración son los factores más sig- maestros, puesto que ya se encuentran en el
nificativos que influyen en el hecho de que las extremo superior de la escala de remuneracio-
personas no escojan la docencia como carrera nes después de 10-12 años de carrera docente
–especialmente en el caso de los posibles pos- y, por lo tanto, no parece ser particularmente
tulantes de alta calidad– y que influyen en el eficaz (Kleinhenz e Ingvarson, 2004).
hecho de que los maestros abandonen la profe-
sión (DEST, 2007). Finalmente, algunos países vinculan las evalua-
ciones docentes con oportunidades de ascensos
Heneman et al. (2006) sostienen que los siste- verticales a cargos de liderazgo escolar. En Es-
mas de evaluación docente basados en están- paña, una de las condiciones para ser elegido
dares deben utilizarse como base para la remu- como jefe del Consejo Escolar es aprobar el
neración basada en los conocimientos y las proceso de evaluación docente (UNESCO,
habilidades. Apoyan una estrategia de incenti- 2007). Asimismo, en los años posteriores a la
vos que requiere el diseño e implementación de etapa de progresión de la carrera de 10º o 12º
sistemas de remuneración docente alternativos año en Australia, algunos maestros muy compe-
que difieren de la escala salarial única. Esta tentes son ascendidos a cargos administrativos
nueva estrategia, aplicada actualmente por va- que pueden llegar hasta el puesto de director
rios estados norteamericanos (Peterson, 2006), (Kleinhenz y Ingvarson, 2004). Sin embargo, la
vincula la remuneración con combinaciones de práctica de vincular el desempeño docente des-
evaluaciones del desempeño docente, la adqui- tacado a ascensos verticales puede ser critica-
sición de nuevos conocimientos y habilidades, y da, por dos razones principales. Por una parte,
el mejoramiento de los resultados obtenidos por un buen maestro no es necesariamente un buen
los estudiantes en las pruebas estandarizadas. administrador ni un buen directivo. Por otra par-
Pocos países europeos entregan un aumento di- te, esta práctica podría tener efectos adversos
recto de la remuneración sobre la base salarial en su intento por obtener el reconocimiento de
como retribución por un buen desempeño. Por la profesión docente; paradójicamente, los mejo-
ejemplo, Rumania ha establecido un sistema en res maestros son retribuidos por no seguir ha-

15
ciendo lo que hacen mejor: enseñar (UNESCO, pertinentes deben ser visualizados en su con-
2007). En efecto, los maestros destacados que junto con el fin de ayudar a los maestros a iden-
escogen seguir enseñando son considerados tificar sus áreas de fortaleza y las áreas que
como “criaturas oscuras que ocupan el submun- requieren perfeccionamiento. Un maestro que
do del aula”, cuyos conocimientos y habilidades aspira a acceder a una etapa superior de la ca-
no suelen ser reconocidos. Adoptando la direc- rrera profesional deberá reflexionar y analizar la
ción opuesta, algunas escuelas australianas han mejor forma de planificar su futuro desarrollo
optado por implementar una categoría docente profesional de modo de poder trabajar en pos
entre el nivel superior de la escala salarial auto- del cumplimiento de los estándares y el manejo
mática y las categorías administrativas, con el del desempeño proporcionaría evidencia para la
fin de retribuir a los maestros que optan por per- futura postulación del maestro” (TDA, 2007b).
manecer en el aula en lugar de pasar a la admi- Las escuelas que asocian las necesidades indi-
nistración (Kleinhenz y Ingvarson, 2004). viduales identificadas con las prioridades pro-
pias de la escuela y que también logran desa-
2.4 V Í N C U L O S
CON LAS OPORTUNIDADES DE rrollar las correspondientes actividades de
DESARROLLO PROFESIONAL Y LAS formación profesional continua, tienen una alta
PRIORIDADES MÁS GENERALES DE LAS probabilidad de lograr un buen desempeño (Ofs-
ESCUELAS ted, 2006).

Pocos países vinculan la evaluación del desem- Sin embargo, todavía queda mucho por hacer
peño con la formación profesional continua. Sin en esta área. Margo et al. (2008) recalcan que
embargo, es esencial la existencia de una cade- actualmente existen muchos problemas que
na lógica entre la evaluación del desempeño y obstaculizan el logro de una fuerza laboral do-
las oportunidades de formación profesional con- cente plenamente eficiente en Inglaterra, entre
tinua para mejorar la práctica docente (Ofsted, los cuales se encuentra una ‘calidad inconsis-
2006). La identificación de las fortalezas y defi- tente de la formación docente’ y un ‘desarrollo
ciencias de cada uno de los maestros es impor- profesional inadecuado’. Para superar estos
tante para escoger a partir de una amplia gama problemas, recomiendan reforzar nuevamente el
de posibles actividades de desarrollo profesional vínculo entre la formación profesional continua
aquellas que cumplen las necesidades particula- (FPC) y el proceso de evaluación, a través de
res de los maestros en función de cada una de evaluaciones más frecuentes, requisitos integra-
las prioridades del plan de mejoramiento del es- dos de FPC y la obligación de que los maestros
tablecimiento escolar correspondiente. cuya evaluación indique un bajo desempeño ac-
cedan a actividades de perfeccionamiento apro-
En el Reino Unido se implementaron nuevos piadas antes de reingresar a la docencia.
planes e iniciativas en esta dirección. Desde
2005-2006, la Agencia de Capacitación y Desa- La percepción de los procedimientos de
rrollo para las Escuelas ( Training and Develop- evaluación como base para el mejoramiento de la
ment Agency for Schools - TDA) está a cargo de práctica futura es crucial para implementar un
coordinar el desarrollo profesional de todo el sistema en el cual todos los docentes se sientan
personal de los establecimientos escolares in- comprometidos con la evaluación y con las
gleses. En septiembre de 2007, se implementa- oportunidades de desarrollo profesional
ron nuevos estándares docentes con el fin de pertinentes, independientemente de su nivel de
establecer un marco para la evaluación docente desempeño actual. Evidentemente, los
de acuerdo con las políticas escolares más ge- procedimientos de evaluación son necesarios
nerales. Estos estándares dan énfasis al vínculo para adoptar las medidas adecuadas ante los
entre lo que se espera de un ‘buen’ maestro en docentes ineficientes y garantizar que adopten
cada etapa de la carrera profesional, por una las prácticas apropiadas. Sin embargo, sin un
parte, y las oportunidades de perfeccionamiento vínculo con las oportunidades de desarrollo
con miras a la siguiente etapa de la carrera, por profesional, el proceso de evaluación no es
otra. “El marco ofrece un telón de fondo para los suficiente para mejorar el desempeño docente y,
debates con respecto a la manera de considerar como resultado, suele convertirse en un ejercicio
el desempeño de un maestro en relación con la sinsentido enfrentado con desconfianza –o, en el
etapa actual de su carrera profesional y la etapa mejor de los casos, apatía– por los maestros que
a la que se está aproximando. Los estándares están siendo evaluados (Danielson, 2001;

16
Milanowski y Kimball, 2003; Margo et al. 2008; Por ejemplo, Leigh (2007) examinó reciente-
Pochard, 2008). Con respecto al sistema francés, mente los resultados de las pruebas de alfabeti-
Pochard (2008) sostiene que lamentablemente zación y conocimientos básicos de matemáticas
los programas de desarrollo profesional no están de tres cohortes de estudiantes y concluyó que
diseñados como para responder a las las variaciones en las posiciones relativas de las
necesidades de perfeccionamiento claramente clases de estudiantes proporcionaban una base
identificadas tanto por el docente como por la para la identificación de los maestros eficientes
institución. Se sostiene que la evaluación por sí e ineficientes. Braun (2005) sostiene que la con-
sola no es suficiente como para implementar los sideración de los resultados de los estudiantes
cambios necesarios para promover es un enfoque prometedor por dos razones: en
mejoramientos de la eficacia y la equidad del primer lugar, traslada el debate acerca de la ca-
sistema educacional. También se plantea que lidad de los docentes hacia el aprendizaje de los
toda evaluación que identifique las disfunciones estudiantes como el principal objetivo de la en-
existentes en un establecimiento escolar debería señanza y, en segundo lugar, incorpora una me-
traducirse en el diseño de un nuevo plan dida cuantitativa –y, por ende, objetiva y equita-
educacional apoyado por un equipo externo. tiva– del desempeño de los docentes. A este
respecto, el desarrollo de modelos de “valor
agregado” representa un significativo avance en
3. VENTAJAS Y DESVENTAJAS DE LOS DI- relación con los métodos basados en la propor-
FERENTES ENFOQUES CON RESPECTO ción absoluta de estudiantes que logran un nivel
A LA EVALUACIÓN DOCENTE de rendimiento determinado. Los modelos basa-
dos en el “valor agregado” tienen por objetivo
En esta sección se analiza una serie de aspec- controlar los puntajes anteriores obtenidos en
tos conflictivos relacionados con el diseño y la las pruebas por cada uno de los estudiantes y,
implementación de los sistemas de evaluación por lo tanto, tienen la potencialidad de identificar
docente. El primer aspecto controvertido es si el aporte de un maestro particular al rendimiento
deberían utilizarse los indicadores de rendimien- académico de los estudiantes.
to escolar como una medida del desempeño de
los docentes. El segundo punto de debate ilus- En Florida, el esquema denominado “Los Maes-
tra que las ventajas y desventajas de los dife- tros Especiales reciben una Retribución” (Spe-
rentes métodos generalmente están relaciona- cial Teachers are Rewarded - STAR) vincula la
das con los propósitos planteados para la remuneración o las bonificaciones para maes-
evaluación docente y que, dadas las usuales tros particulares a medidas de valor agregado
restricciones de recursos, es inevitable realizar del aprendizaje de los estudiantes (Ingvarson,
compensaciones entre los argumentos en favor Kleinhenz y Wilkinson, 2007). Sin embargo, este
de enfoques sumativos y aquellos en favor de tipo de vínculo entre una medida de desempeño
sistemas formativos. Finalmente, los argumen- directa y la remuneración sigue siendo extrema-
tos en favor o en contra de los diferentes enfo- damente escaso, dados los numerosos desafíos
ques reflejan las diferentes perspectivas de los estadísticos y teóricos asociados al uso de es-
actores, las que se traducen en dificultades de tos métodos. En efecto, Braun (2005) recalca el
implementación. marcado contraste entre el entusiasmo de quie-
nes quisieran utilizar tales mediciones, principal-
3.1 VENTAJAS Y DESVENTAJAS DEL USO DE LOS mente las autoridades a cargo de las políticas, y
INDICADORES DE RENDIMIENTO ESCOLAR COMO las reservas expresadas por los investigadores
MEDIDA DEL DESEMPEÑO DOCENTE que han estudiado sus características técnicas.

Los indicadores de rendimiento escolar constitu- El uso del rendimiento académico de los estu-
yen una atractiva medida para evaluar el de- diantes en las pruebas estandarizadas para eva-
sempeño docente, puesto que el objetivo final luar el desempeño de los docentes plantea nu-
de la enseñanza es el mejoramiento del apren- merosos desafíos estadísticos. La mayoría de los
dizaje de los estudiantes. No es de sorprender autores (Lockwood, Louis y McCaffrey, 2002; Ku-
que gran parte de las investigaciones se hayan permintz, 2003; Braun, 2005; Aaronson, Barrow y
centrado en el uso del rendimiento académico Sander, 2007; Goe, 2007) no están convencidos
de los estudiantes medido a través de las prue- de que la generación actual de modelos de valor
bas estandarizadas para evaluar a los docentes. agregado sea lo suficientemente válida y confia-

17
ble como para ser utilizada para evaluar en forma vers, 1996; CAESL, 2004). Finalmente, el im-
equitativa la eficiencia de maestros particulares. pacto de la enseñanza en los estudiantes no
Las limitaciones estadísticas están relacionadas, está restringido a las áreas evaluadas a través
en primer lugar, con la notoria ausencia de datos de las pruebas estandarizadas, generalmente li-
confiables, principalmente debido al hecho de mitadas a lectura y matemáticas, sino que tam-
que los estudiantes no suelen rendir pruebas es- bién incluyen la transferencia de habilidades
tandarizadas con una frecuencia anual. Rowley e psicológicas, cívicas y de aprendizaje para toda
Ingvarson (2007) critican la metodología de Leigh la vida (Margo et al., 2008). Xin, Xu y Tatsuoka
(2007), que consiste en crear un puntaje de prue- (2004) intentaron descomponer los puntajes de
ba hipotético en el año con datos faltantes en el pruebas estandarizadas en diversas categorías
punto medio de dos resultados disponibles, argu- de habilidades cognitivas en cuatro países (Ja-
mentando que no permite atribuir en forma equi- pón, Corea, Holanda y Estados Unidos) y en-
tativa el éxito de los estudiantes a los diferentes contraron que los atributos de los maestros con-
maestros involucrados. En segundo lugar, cuan- siderados en las decisiones con respecto a las
do se dispone de datos, las variaciones del remuneraciones no tienen un impacto positivo
muestreo pueden provocar imprecisiones en las consistente sobre ningún tipo de habilidad cog-
medidas de los puntajes de las pruebas. Este nitiva, a pesar de haber controlado los antece-
problema es particularmente notorio en las es- dentes tanto individuales como familiares. Estas
cuelas básicas, donde el limitado número de es- son fuentes de escepticismo con respecto al uso
tudiantes por clase genera grandes idiosincrasias de estos métodos estadísticos.
de la muestra particular de estudiantes que está
siendo evaluada (Kane y Staiger, 2002). También es necesario considerar las limitacio-
nes teóricas. En primer lugar, una correlación
Las principales críticas metodológicas señalan estadística no es una relación causal: el hecho
que los modelos basados en el valor agregado, de que los docentes sean importantes para el
cualquiera sea su grado de sofisticación, no aprendizaje de los estudiantes no indica nece-
pueden ni integrar cabalmente todos los facto- sariamente que el aprendizaje de los estudian-
res que influyen en los resultados obtenidos por tes sea el resultado de una buena enseñanza.
los estudiantes en las pruebas –de naturaleza En segundo lugar, las pruebas estandarizadas
cualitativa– ni reflejar todos los resultados de utilizadas para evaluar a los estudiantes no es-
aprendizaje de los estudiantes. Los anteceden- tán específicamente diseñadas para efectos de
tes y el apoyo de las familias, la asistencia a la evaluar a los docentes. Siguiendo a Popham
escuela, el clima entre pares y en el aula, las (1997), Goe (2007) sostiene que no están dise-
políticas de las escuelas, la disponibilidad de ñadas para ser particularmente sensibles a pe-
materiales apropiados y los efectos de los niños queñas variaciones en la pedagogía o para de-
influyen en el aprendizaje de los estudiantes terminar los aportes de los docentes al
(CAESL, 2004; Ingvarson, Kleinhenz y Wilkin- aprendizaje de los estudiantes. En consecuen-
son, 2007; Goe, 2007, Weingarten, 2007). Fac- cia, no ofrecen una base sólida que permita res-
tores específicos que intervienen en el momento ponsabilizar a los docentes por los resultados
de la prueba –“un perro que ladra en el patio, de su desempeño. En tercer lugar, el uso de los
una temporada con una alta incidencia de res- puntajes obtenidos por los estudiantes en las
fríos, un estudiante con mal comportamiento en pruebas para evaluar a los docentes podría in-
una clase”– también pueden afectar los resulta- ducir distorsiones y constricciones no esperadas
dos de un estudiante independientemente del en el comportamiento de los docentes, centrán-
aporte de su maestro (Kane y Staiger, 2002). dose solo en el rendimiento de los estudiantes
Además, es probable que los buenos maestros en las pruebas estandarizadas. Los esquemas
tengan un impacto en el rendimiento de los ni- de incentivos de altas consecuencias ( high-
ños durante varios años después de haberles stakes) basados en las pruebas estandarizadas
enseñado y, a la inversa, después de varios pueden incitar a los docentes a concentrarse ex-
años de estar sometidos a maestros ineficien- clusivamente en las áreas pedagógicas evalua-
tes, puede que los estudiantes nunca sean ca- das en las pruebas, reduciendo así el currículo a
paces de ponerse al día académicamente. Estos las habilidades básicas generalmente evaluadas
‘efectos acumulativos’ de los docentes no pue- (Jacob y Lefgren, 2005; Weingarten, 2007), inci-
den medirse con precisión en puntos discretos tar a los maestros a concentrarse en los estu-
en el tiempo (Hanushek, 1986; Sanders y Ri- diantes específicos que están cerca de la nota

18
de aprobación a expensas de los niños que es- docentes: la “enseñanza exitosa” es una medida
tán más atrasados o adelantados (Weingarten, del desempeño puro, en tanto que la “buena en-
2007) e incluso provocar graves casos de enga- señanza” se centra en la calidad de las oportuni-
ño por parte de los docentes en las pruebas dades de aprendizaje de los estudiantes ofreci-
estandarizadas (Jacob y Levitt, 2003; Jacob, das en las aulas en relación con los estándares
2005). Por otra parte, puede que los resultados docentes. Dado que no existe una relación di-
de las pruebas permitan identificar a los maes- recta, confiable y segura entre la calidad de los
tros que son ineficientes o requieren perfeccio- docentes y el rendimiento de sus estudiantes en
namiento, pero no permiten ni discriminar en for- las pruebas estandarizadas, existe un amplio
ma justa entre la amplia gama de maestros consenso en que es preferible evaluar a los
eficientes ni identificar cuáles son las activida- maestros por su práctica (una “buena enseñan-
des de perfeccionamiento que deberían imple- za”) en lugar de por su desempeño (una “ense-
mentarse con el fin de mejorar el desempeño de ñanza exitosa”) (Ingvarson et al., 2007). Como
los maestros ineficientes (Braun, 2005). Final- resultado, la recopilación de múltiples fuentes
mente, estos sistemas podrían traducirse en de evidencia acerca de la práctica docente sa-
que los maestros fuesen responsabilizados por tisface las necesidades de rigurosidad y equidad
todo el desempeño de los estudiantes mientras del proceso de evaluación, tomando en conside-
que, por el contrario, se debería reconocer que ración la complejidad de lo que un ‘buen’ maes-
la enseñanza exitosa es una responsabilidad tro debería saber y ser capaz de hacer (Daniel-
compartida entre los gobiernos, las escuelas y son, 1996, 2007; Peterson, 2000).
la profesión docente (Ingvarson et al., 2007).
Sin embargo, mientras que la multiplicación de
Como consecuencia, a pesar del atractivo de la instrumentos y evaluadores con mayor probabili-
idea, existen numerosas advertencias contra el dad entregará una base sólida para evaluar a
uso de los puntajes obtenidos por los estudiantes los docentes, la limitación de los recursos hace
en las pruebas para evaluar a los docentes. En inevitables las compensaciones. Los esquemas
particular, existe un amplio consenso en la de evaluación docente integrales implican ma-
literatura en torno a dos direcciones específicas: yores costos directos e indirectos en cada etapa
los resultados de los estudiantes no deberían del proceso: el alcance de acuerdos sobre el
utilizarse como la única medida del desempeño diseño del sistema requiere tiempo para deba-
de los docentes y no deberían utilizarse tes y consultas con todos los actores (Ávalos y
ingenuamente para la toma de decisiones Assael, 2006); la capacitación de los evaluado-
relativas a la carrera profesional de un docente, res es onerosa (Danielson, 1996, 2007); la con-
incluyendo el vínculo con la remuneración, ducción de procesos de evaluación agrega una
debido a que esto incorpora un considerable carga de trabajo adicional tanto para los docen-
riesgo de castigar o retribuir a los docentes por tes como para los evaluadores, a menos que se
resultados que están fuera de su control (Kane y realicen compensaciones reduciendo la carga
Staiger, 2002; Kupermintz, 2002; McCaffrey et de trabajo derivada de otras responsabilidades
al. , 2003; CAESL, 2004; Raudenbush, 2004; (Heneman et al., 2006); la armonización de las
Braun, 2005; Ingvarson, Kleinhenz y Wilkinson, reformas escolares más generales, tales como
2007; Rowley e Ingvarson, 2007). Estas las oportunidades de desarrollo profesional, re-
objeciones de los docentes y los investigadores quiere más recursos educacionales (Heneman
se han materializado, por ejemplo, en la decisión et al., 2007; Margo et al., 2008). Por estas razo-
de la legislatura del Estado de Nueva York de nes, a menudo los países han decidido imple-
prohibir el uso de los resultados obtenidos por los mentar solo algunos de los aspectos de los es-
estudiantes en las pruebas para evaluar a los quemas de evaluación docente. Sin embargo, la
maestros en abril de 2008. implementación de compensaciones entre los
diferentes métodos no es simple, puesto que las
3.2 D ISEÑO DE UN CONJUNTO COHERENTE DE ventajas de instrumentos o métodos particulares
MÉTODOS E INSTRUMENTOS ALINEADO CON EL para efectos sumativos suelen constituir des-
P R O P Ó S I TO E N FAT I Z A D O D E E VA L U A C I Ó N ventajas para efectos formativos y viceversa.
DOCENTE
En lo que respecta a las fuentes de evidencia,
Fenstermacher y Richardson (2005) distinguen los instrumentos tales como los indicadores de
dos enfoques para determinar la calidad de los rendimiento escolar, las pruebas a los maestros,

19
los cuestionarios y encuestas respondidas por ces y justos que los portafolios impresos. Los
los padres y los estudiantes, y las observacio- portafolios electrónicos facilitan el acceso cons-
nes en el aula, tienen una naturaleza más su- tante a las muestras de trabajos y motivan la re-
mativa, mientras que las entrevistas con el do- troalimentación de los evaluadores, permiten
cente y la documentación preparada por el captar el reflejo inmediato del desarrollo profesio-
docente generalmente son más útiles para efec- nal de los docentes y permiten una fácil presen-
tos formativos. Los mecanismos de responsabi- tación de múltiples puntos de datos (Wetzel y
lidad por los resultados requieren calificar cuan- Strudler, 2006; Jun et al., 2007), mientras que
titativa y objetivamente a los maestros de presentan una desventaja en comparación con el
acuerdo a un marco único compuesto por unos portafolio impreso en el hecho de que un maestro
pocos aspectos profesionales (Nabors Oláh, con mayores habilidades tecnológicas se en-
Lawrence y Riggan, 2008). Esto permite compa- cuentra en ventaja, incluso si sus capacidades
rar a los docentes de acuerdo a estándares docentes son precisamente las mismas (Wetzel y
idénticos bien definidos y totalizar fácilmente los Strudler, 2006). Strudler y Wetzel (2008) también
puntajes obtenidos en los diferentes criterios. destacan la significativa cantidad de tiempo y es-
Un índice global de desempeño docente obteni- fuerzo empleados en la creación y revisión de los
do de esta manera podría ofrecer una escala portafolios y la posible falta de compatibilidad con
equitativa para reconocer y retribuir el trabajo de las creencias, valores e intereses de las institu-
los maestros. En contraste, cuando el propósito ciones.
es ayudar a los maestros a mejorar sus prácti-
cas y ofrecerles oportunidades de desarrollo En lo que respecta a los evaluadores, existe un
profesional, son preferibles los instrumentos y amplio consenso en el hecho de que los directo-
criterios cualitativos especialmente adaptados. res de las escuelas, los pares y los expertos, los
Para efectos formativos, la recopilación de evi- padres y los estudiantes no valoran las mismas
dencia adaptada es más apropiada que un con- capacidades y conocimientos docentes, no se re-
junto de estándares que se ajusten a todas las fieren al mismo conjunto de evidencia y tienen
situaciones posibles. Debe permitir tanto la diferentes percepciones y grados de objetividad.
identificación de los dominios de fortalezas y de- Por consiguiente, es frecuente que la participa-
ficiencias en la docencia como la entrega al ción de múltiples evaluadores sea visualizada
maestro de una retroalimentación constructiva como una clave para las prácticas exitosas; por
que incluya las posibles maneras de mejorar su lo menos más de una persona debería estar invo-
desempeño, de acuerdo al nivel de experiencia lucrada en la calificación de la calidad y el de-
del maestro y al contexto de la escuela. sempeño de los docentes (Peterson, 2000; Stron-
ge y Tucker, 2003). Danielson y McGreal (2000)
Los portafolios son particularmente interesantes explican que los ‘sistemas de evaluación en 360
en la medida que contienen componentes de tra- grados’, que incorporan la participación de mu-
bajo docente que pueden combinarse de diferen- chos tipos de evaluadores, apoyan la idea de que
tes maneras de acuerdo al propósito enfatizado. la competencia de un maestro podría considerar-
Por una parte, Klecker (2000), Campbell et al. se desde varias perspectivas diferentes y que de-
(2000) y Tucker et al. (2002) sostienen que los bería ser ejemplar (o por lo menos suficiente)
portafolios entregan información evaluativa que desde todos estos diferentes ángulos.
permite hacer responsables a los maestros por el
cumplimiento de los estándares educacionales. La literatura distingue las ventajas y desventajas
Por otra parte, Darling (2001) sostiene que el de- relativas de la inclusión de diferentes tipos de
sarrollo profesional de los docentes debe tener evaluadores de acuerdo a la naturaleza del pro-
prioridad en el diseño de los portafolios y que la ceso de evaluación. Los directores parecen ser
‘reflexión narrativa’ es la mejor manera de esti- particularmente eficaces en identificar a los mejo-
mular dicho desarrollo. Beck, Livne y Bear (2005) res y a los peores docentes (aquellos que se en-
observan que los portafolios formativos centra- cuentran en el 10-20% superior e inferior de la
dos en el desarrollo profesional de los docentes distribución) (Jacob y Lefgren, 2005a, 2008) y su
apoyan de mejor manera los resultados profesio- función de supervisión y liderazgo los coloca a
nales y, en consecuencia, sostienen que los por- priori en una posición como para realizar evalua-
tafolios no deberían ser utilizados para la evalua- ciones de los docentes. Esto sugiere que pueden
ción sumativa de los docentes. Otra interrogante ser evaluadores relevantes para las evaluaciones
es si los portafolios electrónicos son más efica- sumativas. Sin embargo, la evidencia también

20
sugiere que los directores muestran muy pocas Sin embargo, los directores son esenciales
habilidades para distinguir entre los maestros para vincular las necesidades de perfecciona-
que se encuentran en la amplia mayoría de la miento detectadas en el maestro a las oportuni-
distribución, discriminan sistemáticamente ba- dades de formación profesional continua de
sándose en algunas características de los acuerdo a los objetivos del establecimiento es-
maestros (por ejemplo, el género, la edad, la colar y otras necesidades de personal docente.
educación) y suelen mostrarse influidos por una También exhiben una mayor probabilidad de
serie de factores afectivos o no relacionados entregar retroalimentación informal permanente
con el desempeño, tales como la afinidad con el al maestro durante todo el año y no solo duran-
subordinado o la primera impresión que tuvieron te el proceso de evaluación formal. En un con-
del maestro en particular que está siendo eva- texto más general, son esenciales para conver-
luado (Lefkowitz, 2000; Bolino y Turnley, 2003; tir el mejoramiento del desempeño en un
Jacob y Lefgren, 2005a, 2008). Levin (2003) y imperativo estratégico y ayudar a considerar la
MacLeod (2003) muestran que la exigencia e evaluación docente como indispensable para el
indulgencia del director en las evaluaciones del maestro y para las políticas escolares más am-
desempeño docente, que se encuentran fre- plias (Heneman et al. , 2007; Robinson, 2007;
cuentemente en la práctica, son características OCDE, 2008).
del contrato óptimo entre un director neutro ante
el riesgo y un agente con aversión al riesgo 3.3 DIFICULTADES
EN LA IMPLEMENTACIÓN DE LOS
cuando las retribuciones se basan en una eva- ESQUEMAS DE EVALUACIÓN DEL DESEMPEÑO
luación subjetiva del desempeño. Finalmente, DOCENTE
es difícil considerar a los directores como jueces
imparciales debido a que se encuentran en con- 3.3.1 Conflictos de interés entre los
tacto diario con los maestros evaluados. Estos diferentes actores
argumentos muestran que un sistema de eva-
luación basado en los directores podría ser útil La selección de los métodos de evaluación se
para decisiones de despido, pero podría no ser vuelve aún más compleja debido a las signifi-
lo suficientemente riguroso como para estar vin- cativas divergencias entre las perspectivas e
culado a incrementos de las remuneraciones. intereses de los diferentes actores. La impor-
En contraste, los revisores externos evalúan a tancia relativa de los propósitos sumativos y
los maestros en relación con marcos de están- formativos es particularmente conflictiva. Por
dares profesionales, conocen las especificida- una parte, las autoridades encargadas de la
des de contenidos y habilidades para cada área formulación de las políticas y los padres tien-
pedagógica, pero son relativamente menos ca- den a valorar la garantía de calidad y la res-
paces de adaptar el proceso al contexto, los ponsabilidad por los resultados. “Sostienen que
problemas y los valores del establecimiento es- las escuelas públicas son, después de todo,
colar en cuestión (Anderson y Pellicer, 2001). instituciones públicas financiadas con el dinero
de los contribuyentes y que la opinión pública
En relación con el propósito formativo, también tiene un legítimo interés en la calidad de la
existen debates acerca de quién está en posi- educación que se imparte en ellas. Es por me-
ción de definir con precisión las necesidades dio del sistema de evaluación del desempeño
de perfeccionamiento de los docentes y entre- docente que los miembros de la opinión públi-
gar la retroalimentación más constructiva. Los ca, a través de sus legisladores, consejos loca-
pares y colegas que tienen las mismas caracte- les de educación y administradores, garantizan
rísticas e imparten la misma materia al mismo la calidad de la enseñanza. En otras palabras,
grado de estudiantes exhiben la mayor probabi- un padre, al confiar la educación de un niño a
lidad de ganarse la confianza del maestro eva- las escuelas públicas, tiene el derecho a espe-
luado. Por lo tanto, el maestro podría compro- rar un determinado nivel de desempeño míni-
meterse con mayor facilidad en una mo” (Danielson y McGreal, 2000). Por otra par-
auto-reflexión acerca de sus prácticas y expre- te, los docentes y sus sindicatos esperan
sar sus sentimientos y preocupaciones durante oportunidades de reconocimiento social de su
las entrevistas sin el miedo a posibles sancio- trabajo y oportunidades de desarrollo profesio-
nes. Los pares también pueden entregar re- nal a través de la implementación de un siste-
troalimentación cualitativa basada en su propia ma formativo de evaluación del desempeño do-
experiencia en el área pedagógica pertinente. cente (Ávalos y Assael, 2006).

21
TABLA 1

RESUMEN DE LOS ARGUMENTOS EN FAVOR Y EN CONTRA DE LA EVALUACIÓN DOCENTE SEGÚN


LO DESCRITO EN LA LITERATURA

Argumentos a favor de la evaluación Argumentos en contra de la evaluación


docente docente

El sistema actual no hace responsables a los El diseño de un sistema de evaluación equi-


docentes por su práctica y su desempeño. Es tativo y riguroso para efectos de responsabili-
un ejercicio burocrático sinsentido que re- dad por los resultados es vano, debido a que
quiere cambios. no es posible determinar el desempeño en
forma objetiva y la ‘buena enseñanza’ puede
adquirir diversas formas.
Responsabilidad por
los resultados Las autoridades locales y los padres tienen el La enseñanza requiere un ambiente seguro,
‘derecho’ a instituir mecanismos de garantía alejado de las presiones políticas, sociales y
de la calidad. La revisión del desempeño au- financieras.
menta el apoyo político y público a los siste-
mas educacionales.

Las evaluaciones permiten la identificación Los mecanismos de mercado no tienen lugar


de quienes tienen un buen desempeño de en la educación.
manera similar a otros mercados.

Las evaluaciones entregan una base para in- Los docentes no están motivados por recom-
crementos de la remuneración que difieren de pensas financieras, sino por aspectos ‘intrín-
la escala salarial única basada meramente en secos’ (por ejemplo, el deseo de enseñar, de
Mecanismos de incen- la experiencia. Son esenciales para hacer trabajar con niños) y condiciones de trabajo
tivo y vínculos con el más atractiva la profesión. favorables (por ejemplo, horarios flexibles).
reconocimiento y las Algunos docentes pueden desmotivarse
retribuciones como consecuencia de los procedimientos de
evaluación.

Existe la necesidad de adoptar las medidas Es una política paternalista que estigmatiza a
adecuadas ante los docentes ineficientes. los docentes.

Las evaluaciones permiten que los docentes La selección de las actividades de desarrollo
identifiquen sus fortalezas y deficiencias en profesional no debe basarse en los resulta-
relación con los objetivos del establecimiento dos de las evaluaciones, sino que debe ser
Desarrollo profesional escolar y evalúen sus necesidades de desa- realizada por el docente unilateralmente.
rrollo profesional. Son esenciales para man- Los establecimientos escolares no ofrecen
tener motivados a los maestros en su trabajo. actividades de desarrollo profesional en las
áreas en las cuales se requiere el perfeccio-
namiento.

Costo El sistema actual malgasta tiempo, energía y Un esquema de evaluación docente integral
dinero. es oneroso y requiere mucho tiempo.

Las evaluaciones mejoran la práctica de los Las evaluaciones producen una serie de
docentes y el aprendizaje de los estudiantes. efectos negativos tales como la restricción
del currículo y el descuido de algunos estu-
diantes.

Las evaluaciones del desempeño docente Las evaluaciones del desempeño docente re-
Efectos mejoran la cooperación entre los docentes –a ducen la cooperación entre los docentes –de-
través de debates profesionales y un inter- bido a los efectos de competencia– y entre
cambio de su práctica– y entre los docentes y los docentes y los directivos de los estableci-
los directivos de los establecimientos escola- mientos escolares, debido a las relaciones je-
res, de los cuales se espera retroalimenta- rárquicas o entre ‘evaluador-evaluado’.
ción y coaching.

22
Por otra parte, los docentes suelen rechazar las más jóvenes podrían mostrarse más dispuestos
reformas diseñadas por las autoridades a cargo a aceptar evaluaciones sumativas y vínculos en-
de la formulación de las políticas, debido a que tre los resultados de las evaluaciones y la remu-
las consideran incompatibles con sus propios in- neración que los maestros más experimentados,
tereses y prácticas diarias. Kennedy (2005) ar- que se encuentran en un nivel más alto de la
gumenta que el rechazo a las reformas por par- escala salarial. Estudiando la aceptación poten-
te de los maestros “muy dedicados” no proviene cial de la remuneración basada en el desempe-
de su falta de disposición al cambio o al mejora- ño o la remuneración basada en los conocimien-
miento, sino del “triste hecho de que la mayor tos y las habilidades por parte de los nuevos
parte de las reformas no reconocen las realida- maestros, Milanowski (2007) descubrió que los
des de la enseñanza en el aula”. Los reformado- maestros principiantes podrían visualizar en for-
res tienen altas expectativas con respecto al ma más favorable las nuevas estrategias de re-
contenido escolar riguroso y pertinente, al com- muneración que sus colegas más experimenta-
promiso intelectual y al acceso universal al co- dos. Asimismo, los docentes que han invertido
nocimiento. Sin embargo, las reformas fracasan, una considerable cantidad de tiempo y dinero en
principalmente debido a que “las circunstancias obtener las certificaciones educacionales reque-
de la docencia impiden que los docentes modifi- ridas por la escala salarial única, exhiben una
quen sus prácticas”. Por ejemplo, los docentes mayor probabilidad de rechazar la reforma
enfrentan restricciones diarias y hechos inespe- (Odden y Kelley, 2002). Entre los maestros más
rados, soportan las presiones del calendario antiguos, la heterogeneidad también es sorpren-
académico y sirven a una ‘clientela obligatoria’ y dente. Day y Gu (2007) descubrieron que los
heterogénea. maestros que habían ejercido más de veinticin-
co años se encontraban en escenarios profesio-
En la Tabla 1 se resumen los argumentos en nales extremos: un subgrupo “mostraba un con-
apoyo y en contra de las evaluaciones docen- tinuo interés por actualizar y mejorar sus
tes, de acuerdo a algunas dimensiones claves. conocimientos para el aula”, mientras que el
Si bien los argumentos en favor de las evalua- otro subgrupo “mostraba crecientes sentimien-
ciones generalmente provienen de las autorida- tos de fatiga y desilusión”. Esta división podría
des a cargo de la formulación de las políticas y implicar que los primeros estuvieran mucho más
los argumentos en contra provienen de los sindi- dispuestos que los últimos a aceptar –o incluso
catos docentes, la realidad es menos tajante. a promover– una revisión de su práctica y una
Por ejemplo, la Federación Norteamericana de retroalimentación con respecto a la misma.
Maestros y la Asociación Nacional de Educa-
ción, los dos principales sindicatos docentes 3.3.2 Cómo superar los obstáculos
norteamericanos (Hesse y West, 2006), promue-
ven la certificación de la NBPTS como “una ma- A pesar de los desafíos, es preciso dedicar tiem-
nera probada de fortalecer las habilidades, co- po y recursos al (re)diseño e implementación de
nocimientos, profesionalismo y reconocimiento un sistema de evaluación del desempeño do-
de los maestros” (AFT y NEA, 2008). Sin embar- cente bien aceptado. De lo contrario, persistirán
go, como se mencionó anteriormente, la evalua- las preocupaciones asociadas a los actuales
ción de la NBPTS es solicitada voluntariamente procedimientos, desmotivadores y onerosos
por los docentes que desean revisar su práctica (Danielson, 2001; Milanowski y Kimball, 2003;
en función de los más elevados estándares pro- Holland, 2005; Marshall, 2005). La literatura
fesionales y no tiene ninguna consecuencia ne- destaca la crucial importancia de los siguientes
gativa. La respuesta de los sindicatos podría ha- elementos para superar los obstáculos para la
ber sido diferente ante un esquema de implementación.
evaluación obligatorio generalizado en el cual
todos los maestros fuesen evaluados, cualquie- Participación en el diálogo y las consultas.
ra fuese su nivel o calidad, o en el cual pudieran La concepción inicial del sistema debería incluir
estar en juego potenciales despidos o posterga- la amplia participación de todos los actores cla-
ciones de los ascensos. ve, especialmente los docentes y sus sindicatos,
desde el inicio de las conversaciones (Ávalos y
Asimismo, se observa una gran heterogeneidad Assael, 2006). Los maestros aceptarán más fá-
en las respuestas de los docentes a los esque- cilmente ser evaluados si se los consulta duran-
mas de evaluación. Por ejemplo, los docentes te el diseño del proceso. Además de tomar sus

23
temores y demandas en consideración, la parti- del sistema antes de la plena implementación.
cipación de los docentes reconoce su profesio- Asociada a las percepciones obtenidas a partir
nalismo, la escasez de sus habilidades y la ex- de los actores clave, permite la revisión del pro-
tensión de sus responsabilidades (Hess y West, ceso y la introducción de ajustes a la luz de las
2006), como también su posición indispensable posibles deficiencias. Heneman et al. (2006)
para estimar la factibilidad y relevancia del sis- sostienen que se requiere al menos un año pilo-
tema de evaluación docente. Los docentes son to para resolver los problemas de operación de
el ‘núcleo técnico’ de los sistemas educaciona- los sistemas de evaluación. Sin embargo, el
les y su compromiso es esencial en el desarrollo traspaso a plena escala después de la ejecución
de los sistemas de evaluación dada la profundi- piloto algunas veces revela otros problemas de
dad de sus conocimientos y prácticas profesio- implementación, los que, a su vez, reducen la
nales. Si los procedimientos de evaluación del credibilidad del sistema ante los docentes y la
desempeño docente se diseñan en forma unila- aceptación por parte de estos. Por lo tanto, es
teral al nivel de la superestructura administrativa preciso actuar con precaución en la selección
sin considerar e incluir el núcleo de la práctica de establecimientos o docentes representativos
docente, se producirá una ‘conexión suelta’ en- para la implementación piloto.
tre los administradores y los docentes, la que no
ofrecerá las garantías públicas de calidad y a la
vez desincentivará la reflexión y la revisión entre 4. EVIDENCIA EMPÍRICA DE LOS EFECTOS
los docentes mismos (Elmore, 2000; Kleinhenz DE LOS ESQUEMAS DE EVALUACIÓN
e Ingvarson, 2004). Por lo tanto, los administra- DEL DESEMPEÑO DOCENTE
dores y los sindicatos docentes necesitan traba-
jar mano a mano en la creación del nivel de En esta sección se resume la evidencia empíri-
confianza y cooperación requerido para permitir ca existente con respecto a los efectos de la
el avance de la reforma de manera productiva evaluación del desempeño docente en la prácti-
(Odden y Kelley, 2002). ca docente y el aprendizaje de los estudiantes.
En primer lugar, se destacan las dificultades en-
Apoyo a los maestros en la comprensión y frentadas para evaluar los efectos cuantitativos
apropiación de la evaluación. También es de asociados a los esquemas de evaluación del
vital importancia garantizar que los docentes re- desempeño docente y las conclusiones mixtas
ciban el apoyo necesario para comprender los resultantes. A continuación, se consideran las
procedimientos de evaluación. Los maestros de- circunstancias bajo las cuales los sistemas de
ben saber lo que se espera de ellos para ser evaluación del desempeño docente parecen ser
reconocidos como ‘buenos’ docentes antes del más eficaces.
inicio del proceso. Esto requiere no solo comple-
ta transparencia en los criterios y procedimien-
tos de evaluación, sino también garantizar que 4.1 EVIDENCIA CUANTITATIVA
los maestros se apropien del proceso a través
del apoyo y el coaching. Por ejemplo, la Guía 4.1.1 Dificultades para medir la calidad de
para Comprender la Certificación de la Junta los docentes y el impacto de la
Nacional responde a las preocupaciones de los evaluación docente
maestros en relación con las características de
la evaluación de la NBPTS. Es importante expli- Gran parte de la literatura establece que los do-
car el sistema (quiénes son los involucrados, en centes tienen una alta incidencia en los indicado-
qué consiste el proceso, cómo se establecen los res de rendimiento escolar, en el sentido de que
puntajes, etc.) y ofrecer asesoría para ayudar a son poderosos contribuyentes al rendimiento
que los docentes tengan éxito (qué incluir en un académico de los estudiantes (Vandervoort et al.,
portafolio, qué ejercicios preparar, ejemplos e 2004; OCDE, 2005). Sin embargo, la literatura se
ideas de postulantes y formadores anteriores) muestra más renuente a demostrar cuáles son
(AFT y NEA, 2008). las características de los maestros que son rele-
vantes para la calidad de los docentes y cuál es
Aplicación de una implementación piloto an- la importancia relativa de la calidad de los docen-
tes de la plena implementación. La aplicación tes en comparación con otros factores que teóri-
de una implementación piloto es una forma ren- camente influyen en el aprendizaje de los estu-
table de garantizar la viabilidad y confiabilidad diantes, incluyendo los factores familiares, los

24
factores asociados a los estudiantes y los facto- particular (ya sean características, formación,
res escolares. Aaronson, Barrow y Sander (2007) experiencia o incentivos financieros), numero-
recalcan que la literatura sobre este tema “sigue sos estudios concluyeron que lo que en realidad
estando relativamente en la oscuridad” a pesar importaba eran las prácticas del maestro y, por
del mejoramiento de la información. No es de extrapolación, la evaluación de estas prácticas.
sorprender que la medición del impacto de la El primer aporte influyente fue la distinción de
evaluación docente en términos del aprendizaje Hanushek entre las características observables
de los estudiantes a través de las ‘funciones de de los docentes, tales como los antecedentes, el
producción educacionales’ sea incluso más difícil. género o la raza, y las “habilidades” no cuantifi-
cables de los docentes (Hanushek, 1986, 1992).
La medición del efecto de la evaluación docente De acuerdo a Hanushek, el hecho de que la lite-
enfrenta una serie de desafíos. En primer lugar, ratura anterior no haya encontrado ningún im-
es preciso controlar el amplio conjunto de varia- pacto significativo de la calidad de los docentes
bles cualitativas que probablemente influyen en en el rendimiento académico de los estudiantes
el aprendizaje de los estudiantes. Estas varia- se ha debido a que se ha concentrado en los
bles comprenden las características del maestro atributos observables de los docentes –el hecho
(por ejemplo, edad, género), su formación y ex- de que el docente tuviera un grado de magíster,
periencia, los factores familiares que afectan al por ejemplo– mientras que la calidad de los do-
estudiante (por ejemplo, los antecedentes de los centes estaba, por el contrario, relacionada con
padres, el apoyo de los padres), los factores es- sus “habilidades” o “elecciones idiosincráticas
colares (por ejemplo, las políticas del estableci- de la pedagogía y los métodos” (tales como el
miento escolar, los incentivos del establecimien- manejo del aula, los métodos de presentación
to, los efectos de los pares y el aula) y los de las ideas abstractas, las habilidades comuni-
factores de cada estudiante (por ejemplo, la mo- cacionales, etc.), es decir, su práctica.
tivación, las habilidades cognitivas, la experien-
cia acumulada). Las complejas realidades de la Basándose en el modelo de Hanushek, un cuer-
educación impiden que los investigadores asimi- po de nuevos estudios empíricos entrega evi-
len con precisión estos factores como datos de dencia de una escasa relación entre los atribu-
entrada tradicionales en las funciones de pro- tos de los docentes y los indicadores de
ducción (Hanushek, 1986). En segundo lugar, rendimiento escolar para apoyar la evaluación
debido a su naturaleza cualitativa y heterogé- de la práctica docente. Por ejemplo, Muñoz y
nea, el producto en sí mismo –el aprendizaje de Chang (2008) destacan la vaga relación entre la
los estudiantes– no es un ‘producto final’ tradi- formación y los años de experiencia de los do-
cionalmente medible y esto hace aún más difícil centes y el progreso escolar de los estudiantes,
la descomposición entre los aportes de los dife- con la intención de elevar el perfil de la revisión
rentes factores (Hanushek, 1986; Ingvarson et de las prácticas pedagógicas de los docentes
al., 2007). Esto no significa que es inútil realizar entre las políticas educacionales. Aaronson, Ba-
cualquier estudio cuantitativo en educación, sino rrow y Sander (2007) descubrieron que las me-
que se requiere prestar particular atención a los didas tradicionales aplicadas a los docentes, in-
aspectos analíticos o a las potenciales interpre- cluyendo aquellas que determinan la actual
taciones erróneas de los resultados. Además, es remuneración docente, explican poco de la va-
preciso considerar que cada omisión de un fac- riación de la calidad estimada. Estos hallazgos
tor o problema de medición –incluyendo la au- cuestionan la actual escala salarial única basa-
sencia de datos– genera un posible sesgo cuan- da en la formación y la experiencia de los do-
titativo en la relación estimada entre la calidad centes en beneficio de incrementos de la remu-
de los docentes y el rendimiento académico de neración que consideren determinantes más
los estudiantes (Xin, Xu y Tatsuoka, 2004). amplias, incluyendo el vínculo con los sistemas
de evaluación de la práctica y el desempeño de
A consecuencia de lo anterior, la literatura empí- los docentes.
rica, que principalmente indicaba que la evalua-
ción docente podría tener una función importan- 4.1.2 Evidencia empírica mixta con respecto
te en el aprendizaje de los estudiantes, derivaba a los sistemas de evaluación docente
de un proceso de eliminación. Por medio de una
oposición o restricción de los respectivos roles A diferencia de los estudios mencionados en la
de los rasgos evidentes de cada maestro en subsección anterior, a continuación se aborda la

25
evidencia cuantitativa en torno a los sistemas de te en el caso de los estudiantes minoritarios y
evaluación docente per se. Sin embargo, cabe los estudiantes con necesidades especiales, su-
señalar que la mayor parte de las investigacio- giriendo, por ende, que la NBC identifica ade-
nes empíricas no se centran en la estimación de cuadamente a los maestros que adoptan las
los efectos directos sobre los resultados de los prácticas que mejoran la equidad educacional
estudiantes (ni considerando un sistema de eva- además de la eficiencia general. Sin embargo,
luación docente en particular ni en forma longi- otros autores (McColskey y Stronge, 2005; San-
tudinal). Por el contrario, la literatura cuantitativa ders et al., 2005; Harris y Sass, 2007) mostraron
comprende principalmente las dos categorías si- que, en contraste, los estudiantes de maestros
guientes de estudios empíricos. que habían obtenido la NBC no exhibían un ren-
dimiento significativamente mejor que los demás
El primer subgrupo examina la variación en la estudiantes, a pesar de mejoramientos en algu-
relación estadística entre los docentes y los re- nos grados o áreas.
sultados de los estudiantes cuando los docentes
aprueban un proceso de evaluación particular y La evidencia empírica también es mixta en el
cuando no lo hacen. Este cuerpo de evidencia caso de los sistemas de evaluación docente
no mide los efectos de la evaluación docente en obligatoria. Milanowski (2004) estimó la relación
los resultados de los estudiantes, puesto que entre las calificaciones derivadas de la evalua-
compara dos grupos distintos de maestros (uno ción docente y una medida de rendimiento de
sujeto a evaluación y el otro no) en lugar de valor agregado de los estudiantes para el distri-
comparar el impacto de un grupo particular de to norteamericano de Cincinnati, que ha imple-
maestros en los resultados de los estudiantes mentado un esquema de evaluación docente in-
antes y después del proceso de evaluación con- tegral basado en estándares como base para un
siderado. Por el contrario, entrega una indica- sistema de remuneración basada en los conoci-
ción de la capacidad del proceso de evaluación mientos y las habilidades. Descubrió significati-
implementado de diferenciar eficazmente los vas correlaciones positivas y concluyó que, si
maestros competentes de aquellos que no lo los puntajes derivados de un sistema de evalua-
son. Estos estudios son esenciales, puesto que ción docente riguroso están sustancialmente re-
establecen la viabilidad y confiabilidad de un es- lacionados con el rendimiento académico de los
quema de evaluación, aspectos indispensables estudiantes, esto entrega evidencia válida para
para la equidad de los procedimientos sumati- el uso de los puntajes obtenidos por los maes-
vos y el potencial vínculo con las retribuciones. tros como base para un sistema de retribución
financiera. Borman y Kimball (2005) estudiaron
Por ejemplo, numerosos estudios analizaron la el sistema de evaluación docente del distrito de
viabilidad del sistema de evaluación de la Washoe County, que consiste en un modelo de
NBPTS, debido a que representa uno de los en- dos niveles. Después de controlar los antece-
foques más complejos e integrales con respecto dentes de los estudiantes y la experiencia de los
a la evaluación del desempeño docente y se tra- maestros, evaluaron la relación entre la calidad
duce en un reconocimiento formal: la Certifica- de los docentes medida a través del sistema de
ción de la Junta Nacional ( National Board Certi- evaluación y tanto el rendimiento medio general
fication – NBC). Una serie de autores del curso como los efectos al interior del aula en
(Cavalluzzo, 2004; Goldhaber y Anthony, 2007; la equidad social. Descubrieron que los maes-
Vandervoort et al., 2004; Smith et al., 2005) des- tros con altos puntajes en las evaluaciones es-
cubrieron que los estudiantes de maestros que tán relacionados con mejores resultados de
han obtenido la NBC exhiben un mejor rendi- aprendizaje de los estudiantes en todos los gra-
miento en las pruebas estandarizadas que los dos y áreas pedagógicas (lectura y matemáti-
estudiantes de maestros no certificados. Esto in- cas). Sin embargo, estos maestros no parecen
dica, en primer lugar, que las prácticas docentes estar reduciendo las brechas en el rendimiento
son importantes para el rendimiento académico entre los estudiantes con menor y mayor rendi-
de los estudiantes y, en segundo lugar, que la miento y los estudiantes con antecedentes de
NBC identifica correctamente a aquellos maes- bajos ingresos o minoritarios. Esta es una fuen-
tros que han adoptado las mejores prácticas. te de escepticismo al considerar la validez del
Más aún, Goldhaber y Anthony (2007) y Cava- sistema de evaluación para distinguir entre los
lluzzo (2004) también concluyen que los punta- maestros que adoptan prácticas orientadas a la
jes de los estudiantes mejoraron, particularmen- equidad y aquellos que no lo hacen.

26
El segundo subgrupo de estudios cuantitativos con menor frecuencia, con la expectativa de que
con respecto a los sistemas de evaluación una revisión más frecuente del desempeño me-
docente se centra en los efectos en el jorara el desempeño docente. También controla-
mejoramiento de la práctica y la motivación de ron un amplio conjunto de variables de los estu-
los maestros, según lo percibido por el maestro diantes y de las escuelas, además de los
evaluado. Si los maestros informan un incentivos financieros para los maestros y la
mejoramiento de las prácticas como resultado del amenaza de despidos. Lamentablemente, vol-
proceso de evaluación y suponiendo que las vieron a encontrar que la evaluación del desem-
prácticas correspondientes son relevantes para peño docente no era estadísticamente significa-
el aprendizaje de los estudiantes, se supone que tiva, mientras que los incentivos financieros
el sistema de evaluación es eficaz en mejorar estaban correlacionados positiva y significativa-
indirectamente los resultados de los estudiantes. mente con el rendimiento de los estudiantes.
Por ejemplo, al solicitar a los maestros la
preparación de portafolios y una reflexión acerca Los resultados de Figlio y Kenny destacan las
de sus prácticas, la NBPTS ofrece una dificultades para estimar el impacto directo de la
oportunidad rentable de desarrollo profesional a evaluación del desempeño docente en el rendi-
través del proceso de evaluación (Cohen y Rice, miento de los estudiantes. Sin embargo, el he-
2005), motivando al maestro a centrarse en las cho de que las retribuciones financieras se iden-
características de un currículo sólido y en las tifiquen como mecanismos de incentivos
características de una evaluación rigurosa del positivos orientados al éxito de los estudiantes
aprendizaje de los estudiantes. Diversos autores sugiere que un sistema de evaluación del de-
(Bond et al. , 2000; Lustick y Sykes, 2006) sempeño docente es indispensable, puesto que
destacan que los maestros aplicaban en el aula permite la identificación de los maestros eficien-
lo que habían aprendido a partir del proceso de tes que recibirán una retribución. Además, pue-
evaluación. También pareciera que los maestros de que no sea la frecuencia de evaluación, sino
cobraban un nuevo entusiasmo por la profesión la calidad y la sofisticación del proceso de eva-
–en relación al tiempo que esperaban luación lo que importe. Esto explica probable-
permanecer en la docencia– como resultado de mente la razón por la cual los estudios empíri-
haber enfrentado el proceso de evaluación cos suelen centrarse en el diseño de esquemas
(Vandervoort et al., 2004; Lustick y Sykes, 2006; de evaluación exitosos en lugar de mediciones
Sykes et al., 2006; NBPTS, 2007). Finalmente, cuantitativas de sus impactos.
los maestros competentes que se someten al
proceso de evaluación exhiben probabilidades de 4.2 EVIDENCIA CUALITATIVA
contribuir al liderazgo escolar mediante la
adopción de nuevas funciones, incluyendo La evidencia también indica que la evaluación
tutorías y coaching de otros maestros que docente parecer ser más eficaz bajo ciertas cir-
reconocen la ayuda que pueden recibir de los cunstancias particulares.
maestros certificados (Petty, 2002; Freund et al.,
2005; Sykes et al., 2006). Estos estudios aportan Participación de los docentes en cada etapa
considerables nociones relativas al aspecto del proceso. Es preciso consultar a los docen-
formativo del sistema de evaluación docente. tes con respecto a las fortalezas y deficiencias
del sistema desde su diseño hasta su plena im-
Como se mencionó anteriormente, existe muy plementación y revisión. En primer lugar, los do-
poca evidencia de la correlación directa entre la centes deben estar de acuerdo con el marco
evaluación del desempeño docente y el rendi- que define los estándares de la profesión. “La
miento de los estudiantes. Figlio y Kenny (2007) participación activa de los docentes en la cons-
intentaron introducir una evaluación docente trucción y perfeccionamiento del modelo es
como un mecanismo de incentivo para los esencial” (Heneman et al., 2006). El Marco para
maestros orientado al rendimiento académico de la Enseñanza de Danielson (1996, 2007) o los
los estudiantes –junto con medidas de incenti- estándares desarrollados por la NBPTS podrían
vos financieros– en una regresión longitudinal. utilizarse como puntos de partida, con ajustes
Utilizaron la base de datos longitudinal norte- posteriores para cumplir con los objetivos edu-
americana de escuelas para distinguir entre las cacionales locales. La creación de Consejos de
escuelas que evalúan a sus maestros experi- Docencia, como en Irlanda en el período 2005-
mentados anualmente de aquellas que lo hacen 2006, ofrece grandes oportunidades para involu-

27
crar a los docentes en el establecimiento de es- un sistema recientemente implementado en un
tándares profesionales de alto nivel y, de mane- distrito escolar norteamericano de mediano ta-
ra más general, para integrar plenamente a los maño estaba correlacionada con la aceptación
maestros en la (re)definición de la profesión de los estándares docentes, la equidad percibi-
para el posterior desarrollo de las políticas da del proceso, las cualidades del evaluador y la
(OCDE, 2005). percepción de que el sistema de evaluación tie-
ne un impacto positivo en su enseñanza. Los
En segundo lugar, todos los docentes deben re- docentes recibieron 1,5 días de perfecciona-
cibir apoyo para comprender lo que la evalua- miento para comprender los dominios y están-
ción espera de ellos para reconocerlos como dares evaluados y familiarizarse con los aspec-
buenos maestros y para prepararse adecuada- tos que serían considerados por los evaluadores
mente para el proceso de evaluación. Esto re- y se les proporcionó información con respecto al
quiere tanto transparencia con respecto a los desarrollo de un portafolio.
métodos utilizados como también coaching
orientado a una evaluación con empoderamien- Formación de los evaluadores. La literatura
to. En palabras de Heneman et al. (2006): “En el apunta a un amplio consenso con respecto a la
caso de los maestros, la formación inicial debe- necesidad de una exhaustiva formación de los
ría centrarse en la naturaleza de las competen- evaluadores. En primer lugar, los evaluadores
cias de desempeño en las cuales se basa el deben recibir capacitación para calificar a los do-
sistema, los propósitos y mecanismos del siste- centes de acuerdo a la evidencia limitada que
ma de evaluación y los conocimientos y habili- recopilan, los criterios de una buena enseñanza y
dades necesarios para operar eficazmente bajo los correspondientes niveles de calidad de los
el nuevo sistema”. Podrían integrarse expectati- docentes. Esto es particularmente importante
vas claras con respecto al proceso de evalua- cuando los evaluadores son los directores de los
ción y el correspondiente perfeccionamiento do- establecimientos escolares, que podrían tener
cente en las acciones de liderazgo de los conocimientos limitados con respecto a los con-
directores de las escuelas (Ovando y Ramírez, tenidos y las habilidades pedagógicas requeridas
2007). La necesidad de eliminar la ‘conexión para la materia enseñada por el docente evalua-
suelta’ entre la superestructura administrativa y do. En segundo lugar, debe ofrecerse capacita-
el núcleo técnico conformado por los docentes ción a los evaluadores en la entrega de retroali-
(Ingvarson et al., 2007), es decir, la transición mentación constructiva y coaching a los docentes
desde los procedimientos burocráticos actuales para el futuro mejoramiento de la práctica.
bajo los cuales los docentes son sometidos a
una evaluación hasta una evaluación realizada Liberación de otras tareas, tanto para los
con los docentes, requiere la plena apropiación evaluadores como para los docentes. Los sis-
de la reforma por parte de los docentes. temas de evaluación docente integrales requie-
ren tiempo y otros recursos. Esto puede ser
Finalmente, también es preciso ofrecer a los do- oneroso, pero es indispensable para el diseño
centes oportunidades de expresar sus percep- de un sistema coherente y equitativo aprobado y
ciones y preocupaciones con respecto al proce- aceptado como propio por los docentes. Una
so de evaluación después de la instauración del consecuencia es que tanto los docentes como
sistema. Las entrevistas y encuestas son méto- los evaluadores deberían ser liberados parcial-
dos comunes utilizados por los analistas para mente de otras labores. Milanowski y Heneman
recoger las reacciones de los docentes con res- (2001) descubrieron que incluso si los docentes
pecto al sistema de evaluación. Las preguntas aceptan los estándares y la necesidad de un
generalmente incluyen la comprensión del pro- sistema de evaluación, podrían manifestar reti-
ceso, la aceptación de los estándares, la equi- cencia cuando el sistema recarga demasiado su
dad del proceso y de los resultados, la capaci- carga de trabajo. Por lo tanto, los docentes de-
dad y objetividad del evaluador, la calidad de la berían contar con el tiempo para reflexionar con
retroalimentación recibida, el impacto percibido respecto a su práctica, especialmente cuando el
del proceso de evaluación sobre la enseñanza y proceso exige la preparación de un portafolio.
la impresión general del sistema (Milanowki y Como lo enfatiza Heneman et al. (2006): “Los
Heneman, 2001, 2004; Kimball, 2002). Mila- diseñadores del sistema deben analizar cuida-
nowski y Heneman (2001) descubrieron que la dosamente qué se requiere de los maestros
actitud general favorable de los docentes hacia para minimizar la carga. (…) Tal vez alguna pe-

28
queña reducción de las demás responsabilida- los programas de inducción, el desarrollo profe-
des durante el período en el cual los maestros sional, la retroalimentación y asesoría informa-
están siendo sometidos a la evaluación dismi- les permanentes y el reconocimiento más am-
nuiría la percepción de carga y sensación de plio de la experticia y el compromiso con el
estrés”. Las autoridades a cargo de la formula- trabajo exhibidos por los docentes (AFT, 2001;
ción de las políticas también deberían intentar Corcoran, 2007).
reducir la carga de trabajo administrativa de los
evaluadores, especialmente de los directores de
los establecimientos escolares, con el fin de 5. CONCLUSIÓN
otorgarles más tiempo para la evaluación de los
docentes, la retroalimentación y el coaching En la primera sección de este informe se da
(Marshall, 2005). énfasis a la amplia diversidad de esquemas de
evaluación del desempeño docente existente en
Ejecución de una implementación piloto y re- los países de la OCDE. Los países exhiben
visión permanente del proceso. Una implemen- grandes diferencias en cada una de las caracte-
tación piloto constituye una forma rentable de ga- rísticas relevantes, incluyendo los respectivos
rantizar que el sistema sea eficiente, equitativo y roles de los actores clave, el alcance y propósito
coherente con las necesidades locales antes de de la evaluación, los métodos e instrumentos
la plena implementación. Las entrevistas a los utilizados para evaluar a los docentes como
maestros durante la implementación piloto son también los criterios de una ‘buena’ enseñanza
esenciales para corregir las posibles deficiencias y los vínculos con las retribuciones o el desarro-
e inquietudes con respecto al sistema. Los inves- llo profesional. Además de los debates acerca
tigadores o profesionales también deberían con- de las características particulares y las conse-
centrarse en estudios de validez y confiabilidad. cuencias para las carreras profesionales de los
Pecheone y Chung (2006) muestran que la con- maestros, la evaluación del desempeño docente
sistencia de los puntajes debe ser minuciosa- parece ser particularmente conflictiva en los paí-
mente examinada. Por ejemplo, los puntajes ba- ses en los cuales la evaluación docente deriva
sados en estándares son relevantes si de procedimientos burocráticos impuestos en lu-
corresponden a las calificaciones holísticas del gar de constituir una parte integral de las políti-
desempeño de los docentes y si supervisores fa- cas docentes y escolares más generales.
miliarizados con los docentes muestran un am-
plio consenso con respecto al nivel de desempe- Cada vez son más los países que muestran un
ño. Milanowski y Heneman (2001) y Milanowski creciente interés por implementar sistemas inte-
(2004) recalcan la necesidad de controlar la con- grales de evaluación del desempeño docente en
fiabilidad de los evaluadores mediante un ‘proce- respuesta a las demandas de una alta calidad
so de calibración’ consistente en comparar las educacional. A pesar de que actualmente se dis-
calificaciones experimentales de algunos evalua- pone de poca evidencia empírica, la literatura
dores con jueces expertos y analizando las dife- concuerda principalmente en la necesidad de
rencias. Solo debe permitirse que evaluadores aclarar el propósito enfatizado y la importancia
acreditados evalúen a los maestros después de de incluir un conjunto diverso de evaluadores y
la plena implementación. También deberían reali- criterios para reflejar de mejor manera la com-
zarse revisiones del proceso después de la plena plejidad de la definición de lo que es una buena
implementación. Es más probable que los maes- enseñanza. También existe un amplio consenso
tros acepten el proceso en forma rápida si saben con respecto a la participación de los maestros
que tendrán la oportunidad de expresar sus pre- durante todo el desarrollo del proceso de eva-
ocupaciones y opiniones con respecto a las ade- luación. Un esquema de evaluación eficiente,
cuaciones necesarias a medida que el proceso equitativo y confiable requiere la aceptación ge-
evoluciona. neral y apropiación del sistema por parte de los
docentes. El desarrollo de un enfoque integral
Incorporación de la evaluación del desempe- podría ser oneroso, pero es crítico para conciliar
ño docente en las políticas de calidad y apo- las demandas de calidad educacional, el perfec-
yo docente más generales. La evaluación no cionamiento de las prácticas docentes mediante
debería reemplazar otros medios de garantizar el desarrollo profesional y el reconocimiento de
la calidad de los docentes, tales como la forma- los conocimientos, habilidades y competencias
ción docente y los programas de licenciatura, de los docentes.

29
ANEXO 1

MARCO CONCEPTUAL PARA LA EVALUACIÓN DEL DESEMPEÑO DOCENTE

Principales organismos u organizaciones involucrados / Actores:


– Gobiernos nacionales (Ministerios / Departamentos de Educación) – Directivos escolares
– Autoridades descentralizadas a cargo de las políticas educaciona- – Maestros y sindicatos docentes
les (distritos, municipalidades) – Padres / Estudiantes

Alcance de la evaluación / Maestros evaluados: Evaluadores:


– Todo el país versus procedimientos regionales – Revisiones internas (por los directores o el per-
– Tipo de establecimiento: escuelas públicas, escuelas privadas sonal directivo del establecimiento)
– Periodicidad de la evaluación: parte del trabajo regular versus – Revisiones externas (por parte de pares o maes-
evaluación en casos especiales (ascensos, reclamos) tros competentes vinculados a la misma área de
– Obligatoria versus voluntaria contenidos pedagógicos)
– Todos los docentes están sujetos a la misma evaluación versus – Autoevaluación
evaluación adaptada de acuerdo a la experiencia del docente – Padres
– Implementación piloto versus plena implementación – Estudiantes
#

#
Criterios y estándares: Métodos e instrumentos:
– Conocimiento de los contenidos en la materia enseñada. – Observaciones en el aula
– Habilidades pedagógicas – Entrevistas con el docente
– Conocimiento de los estudiantes – Portafolios preparados por los docentes (vi-
– Capacidad de mejorar el rendimiento de los estudiantes deoclips, planes de lecciones, hojas de re-
– Competencia en la planificación pedagógica " " flexión, cuestionarios autoadministrados, mues-
– Conocimientos sobre medición del aprendizaje de los estudiantes EVALUACIÓN tras de trabajos de los estudiantes)
– Habilidad para crear un ambiente favorable en el aula – Resultados en términos de rendimiento acadé-
DE LA
– Habilidad para manejar los procedimientos de aula mico de los estudiantes (desempeño absoluto o
– Capacidad para involucrar a los estudiantes en el aprendizaje e PRÁCTICA mejoramientos de valor agregado)
interactuar con ellos Y EL – Pruebas a los docentes
– Habilidades de comunicación y supervisión – Datos de cuestionarios y encuestas respondidas
DESEMPEÑO
– Habilidades para satisfacer las necesidades de poblaciones de es- por los padres y los estudiantes
tudiantes diversificadas; demostración de flexibilidad y sensibilidad DE DOCENTES
– Profesionalismo: comunicación con las familias, el personal do-
cente del establecimiento y los directivos
– Participación en actividades de perfeccionamiento y desarrollo
profesional: reflexión sobre la enseñanza, formación continua
#

Evaluación sumativa: Evaluación formativa:


• Responsabilidad por los resultados y garantía de calidad • Desarrollo profesional para mejorar la ense-
para las autoridades a cargo de las políticas y los padres ñanza:
– Mejoramiento del aprendizaje y el rendimiento de los estu- – Identificación de las fortalezas y deficiencias
diantes a través de mejores prácticas docentes del docente
– Reducción de la inequidad en el rendimiento de los estu- – Entrega de retroalimentación constructiva
diantes sobre las prácticas del docente
• Reconocimiento y/o retribuciones para los docentes: – Asesorías a los docentes con respecto a los
– Reconocimiento de las habilidades y el compromiso programas de desarrollo profesional adecua-
– Ascenso dos y las oportunidades de perfeccionamien-
– Incrementos salariares to de sus capacidades
– Retribuciones no financieras (condiciones laborales) ! Mantenimiento de la motivación de los do-
– Medidas ante los docentes ineficientes (postergaciones del centes durante toda su carrera
ascenso, despidos) • Mejoramiento del liderazgo escolar:
! Convertir a la docencia en una elección de carrera atrac- – Adaptación de los programas de desarrollo
tiva profesional de los establecimientos escola-
! Retención de los maestros eficientes en las escuelas res a las necesidades identificadas
– Mejoramiento de la supervisión y coaching
de los docentes por parte de los directores
! Participación de los docentes en el desa-
rrollo e implementación de las políticas

30
ANEXO 2

EJEMPLOS DE SISTEMAS DE EVALUACIÓN DEL DESEMPEÑO DOCENTE EN LOS PAÍSES DE LA OCDE

1. EVALUACIÓN DOCENTE CON PROPÓSITOS SUMA- estándares para obtener un puntaje para cada uno de los
TIVOS Y VÍNCULOS CON LA REMUNERACIÓN: EL cuatro dominios.
DISTRITO NORTEAMERICANO DE CINCINNATI [MI-
LANOWSKI, 2004] Alcance y frecuencia de la evaluación. Todo el sistema de
evaluación se utiliza para una evaluación integral de los
Contexto. Cincinnati es un gran distrito urbano con 48.000 docentes en su primer y tercer año y cada cinco años de ahí
estudiantes y 3.000 maestros en más de 70 establecimien- en adelante. Se realiza una evaluación menos intensiva en
tos escolares y programas. Su nivel promedio de rendimien- todos los demás años, la que es llevada a cabo por los
to académico de los estudiantes es bajo en comparación directores y los subdirectores y se basa en evidencia más
con los distritos suburbanos circundantes. Cincinnati tam- limitada. La intención de la evaluación anual es constituir
bién ha tenido una historia de actividades de reforma esco- tanto una oportunidad para el desarrollo profesional docente
lar, incluyendo la introducción de nuevos diseños a nivel de como una evaluación para efectos de responsabilidad por
todo el establecimiento, el diseño de presupuestos basados los resultados.
en las escuelas y la formación de equipos a cargo de la
administración de los establecimientos escolares y de im- Capacitación en el proceso de evaluación. Tanto los do-
partir la instrucción. La relación entre el sindicato docente y centes como los evaluadores reciben considerable capacita-
la administración ha sido en general positiva. Como muchos ción en el nuevo sistema. Los evaluadores son capacitados
otros distritos urbanos, los programas estatales de respon- utilizando un proceso de calibración que comprende leccio-
sabilidad por los resultados y las expectativas de la opinión nes grabadas sobre calificación aplicando las rúbricas y com-
pública han ejercido presión en el distrito para que mejore parando luego las calificaciones con jueces expertos y anali-
los indicadores de rendimiento escolar. zando las diferencias. Para garantizar la consistencia entre
los evaluadores, el distrito finalmente requiere que todos los
Implementación. En respuesta a la obsolescencia del siste- evaluadores, incluidos los directores, cumplan un determina-
ma de evaluación del desempeño docente existente y a am- do nivel de concordancia con un conjunto de referencias o
biciosos objetivos de mejoramiento del rendimiento acadé- evaluadores expertos en lecciones de calificación grabadas
mico de los estudiantes, el distrito diseñó un sistema de en video. A partir del año escolar 2001-2002, solo quienes
remuneración basada en los conocimientos y las habilida- cumplen los estándares están autorizados para evaluar.
des y un nuevo sistema de evaluación del desempeño do-
cente durante el año escolar 1998-1999. El sistema de eva- Consecuencias directas. Para los maestros principiantes
luación fue implementado en forma piloto en el año escolar (aquellos evaluados durante su primer y tercer año), la con-
1999-2000 y se utiliza para la evaluación docente a nivel de secuencia de una baja evaluación global podría ser el térmi-
todo el distrito desde el año escolar 2000-2001. no del contrato. En el caso de los docentes permanentes,
las consecuencias de una evaluación positiva podrían incluir
Criterios. El sistema de evaluación se basa en un conjunto la elegibilidad para convertirse en un líder pedagógico. Una
de estándares docentes derivados del Marco para la Ense- mala evaluación podría llevar a la asignación a un programa
ñanza (Danielson, 1996). Diecisiete estándares de desem- de asistencia entre pares y finalmente a un término del con-
peño están agrupados en cuatro dominios: (i) planificación y trato.
preparación; (ii) generación de un ambiente conducente al
aprendizaje; (iii) enseñanza orientada al aprendizaje; y (iv) Vínculo con la remuneración. El sistema de evaluación
profesionalismo. Para cada estándar, un conjunto de esca- del desempeño se diseñó en parte para proporcionar la
las de calificación de tipo conductista, llamadas rúbricas, base de un sistema de remuneraciones basado en los cono-
describen cuatro niveles de desempeño: insatisfactorio, bá- cimientos y las habilidades. Este sistema define los niveles
sico, competente y destacado. de la carrera profesional docente con una remuneración di-
ferenciada por nivel. El nuevo sistema de remuneraciones
Instrumentos. Los maestros son evaluados utilizando las se programó originalmente para entrar en vigencia durante
rúbricas, de acuerdo a dos fuentes de evidencia principales: el año escolar 2002-2003, traduciéndose en evaluaciones
seis observaciones en el aula y un portafolio preparado por de ‘altas consecuencias’ para los maestros del distrito. Sin
el maestro. El portafolio incluye componentes tales como embargo, el vínculo entre el sistema de evaluación y la re-
planes de lecciones y unidades, registros de asistencia, tra- muneración fue rechazado por los maestros en una elección
bajos de los estudiantes, registros de contacto con las fami- especial realizada en mayo de 2002.
lias y documentación de las actividades de desarrollo profe-
sional.
2. EVALUACIÓN DOCENTE CON PROPÓSITOS FOR-
Evaluadores. Un evaluador docente contratado entre las MATIVOS Y COMO PARTE DE LAS POLÍTICAS ES-
filas del personal docente y liberado de impartir docencia en COLARES MÁS GENERALES
el aula durante tres años realiza cuatro observaciones en el
aula. Los directores y subdirectores realizan otras dos ob- 2A. FINLANDIA [UNESCO, 2007]
servaciones.
Contexto. En Finlandia, los maestros de la educación pri-
Totalización de los puntajes. Sobre la base de resúmenes maria y secundaria tienen cargos comparables a los de los
de las seis observaciones, los evaluadores docentes reali- funcionarios públicos nacionales o municipales. Sin embar-
zan una calificación sumativa final en cada uno de los es- go, los directivos escolares están a cargo de la selección de
tándares incluidos en los dominios (ii) y (iii), mientras que los maestros –una vez que han obtenido la licencia requeri-
los directores y los subdirectores califican a los maestros en da– y a cargo de todas las políticas que son consideradas
los estándares incluidos en los dominios (i) y (v), principal- necesarias para el mejoramiento de la calidad de la ense-
mente basándose en el portafolio del maestro. A continua- ñanza, entre las cuales se encuentra la evaluación del de-
ción, se totalizan las calificaciones para cada uno de los sempeño docente. Finlandia es un caso paradigmático en el

31
cual el sistema anterior de ‘inspección y supervisión de los ficados; y los conocimientos sobre salud y bienestar de los
docentes y los establecimientos escolares’ fue eliminado en estudiantes. El último dominio se refiere a las habilidades
1990, pero no fue reemplazado por ningún otro sistema ex- profesionales de los docentes, incluyendo la planificación, la
terno similar. Como consecuencia, la evaluación docente enseñanza, la evaluación, la supervisión, la entrega de
actualmente corre en forma paralela con otras políticas en competencias de retroalimentación; la capacidad de revisar
cada escuela particular. y adaptar la enseñanza y el aprendizaje; la capacidad para
crear un ambiente de aprendizaje; las capacidades para de-
Métodos/Evaluadores. El esquema finlandés de evaluación sarrollar trabajo en equipo y colaboración. Todos estos es-
docente se caracteriza por el muy alto nivel de confianza tándares son representaciones de una buena enseñanza
asignado a la escuela y a las competencias y el profesiona- que no reemplazan los deberes y las responsabilidades pro-
lismo de los docentes como base para el mejoramiento de fesionales de los docentes.
la calidad de la enseñanza. Por lo tanto, la autoevaluación
de los maestros es considerada uno de los principales me- Consecuencias para el desarrollo profesional de los do-
dios de optimización profesional. Los directivos escolares centes y vínculos con las expectativas y políticas esco-
también desempeñan una función crucial en comprometer a lares. Los estándares apoyan a los docentes en la identifi-
los maestros en la auto-reflexión acerca de su propia prácti- cación de sus necesidades de desarrollo profesional.
ca y en desarrollar una cultura de evaluación junto con am- Cuando los docentes desean avanzar a la siguiente etapa
biciosos objetivos, de acuerdo al contexto y los problemas de la carrera profesional, el nivel siguiente del marco ofrece
de cada escuela. La mayoría de las escuelas han imple- un punto de referencia para todos los docentes al conside-
mentado debates anuales entre los directivos escolares y rar su desarrollo futuro. Mientras que no todos los docentes
los docentes para evaluar el cumplimiento de los objetivos desean necesariamente pasar a la siguiente etapa de la
personales establecidos durante el año anterior y para esta- carrera profesional, los estándares también los apoyan en la
blecer nuevos objetivos personales que sean concordantes identificación de las maneras de ampliar y profundizar su
tanto con el análisis del maestro como con las necesidades experticia en su actual etapa de la carrera profesional. Es-
de la escuela. tos marcos constituyen una base para la responsabilidad
profesional y la obligación contractual de comprometer a
2B. INGLATERRA [OFSTED, 2006; TDA, 2007] todos los docentes en un desarrollo profesional eficaz, sos-
tenido y relevante durante toda su carrera profesional. Ofre-
Contexto. El sistema inglés se diseñó originalmente con cen un conjunto continuo de expectativas acerca del nivel
propósitos sumativos, teniendo como objetivo la evaluación de compromiso con el desarrollo profesional, que ofrece cla-
del desempeño de los docentes y la entrega a estos de ridad y la diferenciación apropiada para cada etapa de la
oportunidades para acceder a una etapa superior de la ca- carrera profesional. También establecen expectativas con
rrera profesional y a la escala de remuneraciones corres- respecto al aporte que cada uno de los docentes realiza a
pondiente. Sin embargo, se plantearon numerosas inquietu- los demás, tomando en cuenta sus niveles de habilidades,
des con respecto a la equidad del proceso y a los experticia y experiencia y su función en la escuela y refle-
potenciales impactos perversos del procedimiento en el jando su uso de conocimientos de las materias y pedago-
desempeño de los docentes (Kleinhenz e Ingvarson, 2004). gías actualizadas. En todos estos casos, el manejo del de-
Por lo tanto, los recientes avances del sistema, incluyendo sempeño es el proceso clave que ofrece el contexto para
nuevos estándares profesionales a partir de septiembre de debates regulares con respecto a las aspiraciones que tie-
2007, indican un mayor enfoque formativo, sustentado por nen los docentes con respecto a su carrera profesional y su
una disposición a reforzar el vínculo entre el sistema de desarrollo futuro, en su actual etapa de carrera o después
evaluación docente y las necesidades de desarrollo profe- de ella.
sional de los docentes en relación con los objetivos de las
escuelas. De manera más general, el sistema, implementa- Para mayor información:
do dentro de un marco más amplio para toda la fuerza labo- – Training and Development Agency for Schools (TDA):
ral de los establecimientos escolares, tiene por objetivo me- h t t p : / / w w w. t d a . g o v. u k / t e a c h e r s /
jorar el liderazgo escolar y ser una parte integral de las professionalstandards.aspx y
políticas más generales de las escuelas. h t t p : / / w w w. t d a . g o v. u k / t e a c h e r s /
continuingprofessionaldevelopment.aspx
Alcance/Métodos. La evaluación está diferenciada de – Office for Standards in Education (Ofsted): http://
acuerdo a la etapa de la carrera profesional del docente www.ofsted.gov.uk
evaluado. Se identifican cinco etapas profesionales: (i) la
certificación como Maestro Calificado (Q); (ii) los maestros
incluidos en el escalafón principal (C); (iii) los maestros in- 3. CONCILIACIÓN DE LOS PROPÓSITOS SUMATIVOS
cluidos en el tramo superior de la escala de remuneraciones Y FORMATIVOS EN UN ENFOQUE INTEGRAL: CHI-
(Maestros Post-Umbral) (P); (iv) los Maestros Excelentes LE [ÁVALOS Y ASSAEL, 2006]
(E); y (v) los Maestros con Habilidades Avanzadas (A).
Contexto. El contexto histórico del sistema educacional chi-
Criterios. En cada etapa, los estándares profesionales do- leno sin duda ha desempeñado una función crítica en la
centes comprenden tres dominios. El primero se refiere a comprensión de la necesidad de un esquema de evaluación
los atributos profesionales del docente, incluyendo las rela- docente integral y conciliador. En 1980, el gobierno militar
ciones con los niños y los jóvenes, la actitud frente al marco [1973-1990] transfirió la gestión de las escuelas a las autori-
y la implementación de nuevas políticas escolares, la comu- dades municipales, lo que implicó un cambio en la condición
nicación y trabajo con los demás y las actividades de desa- de los maestros, que pasaron de ser funcionarios públicos a
rrollo profesional. El segundo dominio está compuesto por empleados asalariados de las municipalidades. Al término
los conocimientos profesionales y la comprensión de la pro- del régimen dictatorial, una de las principales preocupacio-
fesión por parte del docente, incluyendo los conocimientos nes fue el hecho de que las condiciones de los docentes no
de pedagogía y aprendizaje; la comprensión de la evalua- evolucionaron en forma paralela a aquellas de los funciona-
ción y la supervisión; las materias y el conocimiento del rios públicos, lo que tuvo un enorme impacto en la percep-
currículo; las habilidades de alfabetización, habilidades bá- ción y valoración de la docencia tanto por parte de los do-
sicas de matemáticas y habilidades en tecnología de la in- centes como de la opinión pública. En la década de los
formación y la comunicación; la comprensión de los factores noventa, la profesión docente sufrió un drástico deterioro de
que afectan el rendimiento de grupos de estudiantes diversi- la calidad de los postulantes a la carrera y un empeoramien-

32
to de las condiciones laborales. Al mismo tiempo, la eviden- Capacitación de los evaluadores. Los evaluadores pares
cia de resultados insatisfactorios en términos de aprendiza- reciben capacitación específica para su tarea y deben apro-
je de los estudiantes ejerció una fuerte presión sobre el bar una prueba para obtener la acreditación. Si bien debe-
gobierno para que incluyera una cláusula en el nuevo Esta- rían estar familiarizados con el contexto en el cual se de-
tuto Docente (1991) que exigió una evaluación anual de los sempeña el maestro evaluado (es decir, condiciones
maestros. Sin embargo, si bien los maestros siguieron soli- socioeconómicas y laborales), no deben enseñar en el mis-
citando mejores sueldos y condiciones laborales, rechaza- mo establecimiento escolar.
ron la implementación del sistema de evaluación. Esto fue
seguido por un largo período de debates y negociaciones Consecuencias de la evaluación. Uno de los principales
con respecto al modelo de evaluación docente que debería problemas que debieron abordarse durante el proceso de
implementarse. negociación se refería a las posibles consecuencias para el
docente evaluado. Se acordó que los docentes calificados
Diseño e implementación del sistema. El sistema fue pro- en un nivel ‘básico’ recibirían oportunidades específicas de
mulgado por ley en agosto de 2004, es decir, alrededor de desarrollo profesional con el fin de perfeccionarse. Los do-
siete años después del inicio de los debates. El sistema centes calificados como maestros con un desempeño ‘insa-
está orientado al mejoramiento de la enseñanza y los resul- tisfactorio’ también reciben oportunidades de desarrollo pro-
tados de aprendizaje. Su objetivo es estimular a los maes- fesional, pero se los evalúa nuevamente al año siguiente; si
tros a continuar su propio perfeccionamiento a través del el maestro no logra desempeñarse satisfactoriamente en
conocimiento de sus fortalezas y deficiencias. Se basa en dos evaluaciones consecutivas, es despedido. En contraste,
criterios explícitos de lo que se evalúa, pero sin prescribir los maestros evaluados como ‘competentes’ o ‘excepcional-
un modelo de enseñanza. Está fundamentado en la articula- mente competentes’ tienen prioridad en las oportunidades
ción de sus diferentes elementos: criterios sancionados por de ascenso y en las actividades de desarrollo profesional de
la fuerza laboral docente, una estructura de gestión inde- su interés. También pueden postular a bonificaciones sala-
pendiente, evaluadores especialmente capacitados y un riales siempre y cuando den una prueba sobre conocimien-
conjunto coordinado de procedimientos para recopilar la evi- tos curriculares y pedagógicos. El sistema tiene elementos
dencia requerida por los criterios. tanto sumativos como formativos en lugar de estar principal-
mente orientado a uno de los propósitos, lo cual es un re-
Principales actores del sistema. El Centro de sultado del proceso de negociación, el que tomó en consi-
Perfeccionamiento, Experimentación e Investigación deración los múltiples intereses de los actores. Por ejemplo,
Pedagógica del Ministerio de Educación está a cargo de la los elementos sumativos no incluyen un vínculo entre el
gestión del sistema. Un comité consultivo compuesto por desempeño del maestro y los resultados de los estudiantes
académicos y representantes del Sindicato Docente, la (un aspecto al cual el sindicato se opuso firmemente) como
Asociación Chilena de Municipalidades y el Ministerio de tampoco un vínculo con el escalafón profesional. El vínculo
Educación supervisa y brinda asesoría con respecto al con el desarrollo profesional es enfatizado y diferenciado
proceso. Se ha contratado un centro universitario para sobre la base del nivel de desempeño del maestro.
implementar el proceso: producción y revisión de los
instrumentos, selección y preparación de los evaluadores y los Para mayor información: Leyes chilenas sobre el Estatuto
profesionales encargados del cálculo de los puntajes y análisis Docente: Ley N° 3.500; Ley N° 19.070; Ley N° 19.933; Ley
de la evidencia recopilada en cada proceso de evaluación. El N° 19.961.
proceso de postulación en sí mismo está descentralizado, de
manera que, en cada municipalidad, existe un comité que es
directamente responsable de organizar los procedimientos de 4. EVALUACIÓN DOCENTE DERIVADA DE PROCEDI-
evaluación. La evidencia recopilada se procesa a nivel de las MIENTOS BUROCRÁTICOS: FRANCIA [HAUT CON-
municipalidades y se envía a la unidad de procesamiento SEIL DE L’ÉVALUATION DE L’ÉCOLE, 2003; PO-
central en la universidad, junto con la información contextual CHARD, 2008]
que puede ayudar a interpretar los resultados. Esta forma
centralizada de procesamiento de la evidencia se implementó Contexto. Los maestros franceses están clasificados en tres
a solicitud de los maestros con el propósito de lograr una categorías distintas de acuerdo a su formación y su certifica-
mayor objetividad. ción inicial: maestros de educación primaria (professeurs des
écoles), maestros de educación secundaria con certificación
Criterios. El Ministerio de Educación fue la principal instan- regular (enseignants certifiés) y maestros de educación se-
cia en la definición de los criterios de evaluación, obtenien- cundaria con un mayor nivel de certificación (enseignants
do un conjunto de estándares basados en el trabajo realiza- agrégés). Todos los maestros son funcionarios públicos, pero
do anteriormente con respecto a los estándares de están ubicados en una de las tres trayectorias profesionales
formación docente inicial y el Marco para la Enseñanza de anteriores. Estas difieren en términos de las condiciones y
Danielson. El resultado es un marco para la enseñanza horario de trabajo, la escala de remuneración administrativa y
competente, formulado a través de cuatro dominios de la la práctica docente (maestros de educación primaria para
enseñanza (planificación, ambiente de aprendizaje, profe- múltiples materias versus maestros de educación secundaria
sionalismo y estrategias pedagógicas para el aprendizaje de especializados en una materia). En general, Francia no sufre
todos los estudiantes) y veinte criterios/estándares. El mar- de escasez de maestros y los exámenes requeridos para
co fue objeto de amplias consultas entre los docentes hasta ingresar a la profesión siguen siendo selectivos. Sin embar-
que se llegó a un acuerdo. Los criterios están vinculados a go, Francia tiene problemas en relación con el prestigio so-
cuatro niveles de calidad/desempeño: ‘insatisfactorio’, ‘bási- cial de la docencia y las habilidades necesarias para respon-
co’, ‘competente’ y ‘excelente’. der a las necesidades de las escuelas. El actual sistema de
evaluación del desempeño docente suele ser descrito como
Instrumentos. La evidencia utilizada para evaluar a los do- ‘no muy justo’, ‘no muy eficiente’ y ‘generador de malestar y
centes, estructurada en torno al Marco, incluye cuatro fuen- algunas veces sufrimiento’ tanto para los maestros evaluados
tes: (i) un portafolio con muestras del trabajo de los maes- como para los evaluadores, debido a que está basado en
tros y un video de una de sus lecciones; (ii) un formulario de procedimientos administrativos más que en un esquema inte-
autoevaluación estructurado; (iii) una entrevista estructura- gral con un claro propósito de mejoramiento.
da con un evaluador par; y (iv) un informe de las autorida-
des administrativas y pedagógicas del establecimiento es- Periodicidad de la evaluación/evaluadores. Se supone
colar. La evaluación se realiza cada cuatro años. que la evaluación del desempeño docente se realizará en

33
forma regular, como una parte integral del trabajo y los de- des de desarrollo profesional y estas últimas son muy limita-
beres del maestro. Los maestros de educación primaria son das y están desconectadas de las deficiencias identificadas
evaluados por un inspector docente (inspecteur), mientras en los docentes. El proceso de evaluación no ofrece oportu-
que los maestros de nivel secundario son evaluados por un nidades de auto-reflexión con respecto a las prácticas do-
panel compuesto por un inspector, que define el 60% del centes ni de aprendizaje mutuo entre pares y comprenden
puntaje final, y el director de la escuela, responsable del poca asesoría y coaching.
40% restante. Sin embargo, la pretendida frecuencia de las
evaluaciones suele no cumplir las expectativas. En primer Para mayor información:
lugar, la frecuencia de las evaluaciones no está establecida – Haut Conseil de l’évaluation de l’école (2003): http://
legalmente y es determinada arbitrariamente por la disponi- cisad.adc.education.fr/hcee/ documents/
bilidad de inspectores. Esta es una causa de preocupación rapport_annuel_2003.pdf
en lo que respecta a la equidad del sistema –debido a que – Informes de las inspecciones generales: http://
maestros que trabajan bajo las mismas condiciones reciben lesrapports.ladocumentationfrancaise.fr/BRP/
retroalimentación a diversos intervalos– como también en 054004446/0000.pdf
relación con su eficiencia: el intervalo promedio entre dos – Ministerio de Educación:http://www.education.gouv.fr/
evaluaciones corresponde a 3-4 años para la educación pri- cid263/l-evaluation-des-personnels.html
maria y 6-7 años para la educación secundaria, un tiempo
que se estima demasiado prolongado. Además, la carga de Para otros sistemas de evaluación del desempeño docente:
trabajo es tal que podrían surgir preocupaciones con res- – La Provincia de Alberta en Canadá: http://
pecto al valor de la retroalimentación. Un inspector se res- w w w. e d u c a t i o n . a l b e r t a . c a / d e p a r t m e n t / p o l i c y /
ponsabiliza por 350 a 400 maestros, un número excesivo k12manual/section2/teacher.aspx
para que la retroalimentación sea eficaz en el mejoramiento – El Estado de Iowa en Estados Unidos: http://
de las prácticas de los docentes. En consecuencia, los ins- www.iowa.gov/educate/content/view/1450/1617
pectores mismos informan malestar y frustración asociados
al proceso de evaluación, principalmente debido a que sien-
ten que tienen poco impacto en las prácticas docentes y no
pueden aplicar sus competencias y habilidades al mejora- REFERENCIAS
miento de la enseñanza. Su función está algunas veces res-
tringida de facto al control de los abusos al interior de la Aaronson, D.; Barrow, L. y Sander, W. (2007) “Teachers and Student
profesión. Achievement in the Chicago Public High Schools”, Journal of
Labor Economics, Vol. 25, No. 1, pp. 95-135.
Instrumentos. La evidencia con respecto a la práctica de American Federation of Teachers (2001) “Beginning Teacher
los docentes se recopila mediante la observación de una Induction: The Essential Bridge”, Educational Issues Policy
sesión de clases, seguida de una entrevista con el maestro. Brief No. 13, AFT, 2001.
Las críticas a este enfoque incluyen: (i) el hecho de que una American Federation of Teachers y National Education Association
observación de aula aislada podría no ser suficiente como (2008) A Guide to Understanding National Board Certification,
para obtener una visión equitativa y rigurosa de las habilida- AFT and NEA, Washington, DC.
des y conocimientos del maestro, y (ii) en la entrevista, los Anderson, L. y Pellicer, L. (2001) Teacher Peer Assistance and
maestros se focalizan en reaccionar a las críticas de los Review, Corwin Press.
inspectores en lugar de analizar sus necesidades de mejo- Avalos, B. y Assael, J. (2006) “Moving from resistance to agreement:
ramiento en particular. Todo el procedimiento no parece The case of the Chilean teacher performance evaluation”,
International Journal of Educational Research, Vol. 45, No. 4-
ofrecer mucho espacio a la autoevaluación y a la reflexión
5, pp. 254-266.
por parte de los maestros con respecto a su propia práctica
Beck, R.; Livne, N. y Bear, S. (2005) “Teachers’ self-assessment of
y desempeño. the effects of formative and summative electronic portfolios on
professional development”, European Journal of Teacher
Criterios. Se observan y califican los aspectos tanto ‘peda- Education, Vol. 28, No. 3, pp. 221-244.
gógicos’ como ‘administrativos’, pero sin referencia a un Bolino, M. y Turnley, W. (2003) “Counternormative impression
marco que defina lo que es una ‘buena’ enseñanza. Las management, likeability, and performance ratings: the use of
inquietudes son numerosas. La naturaleza de las diferentes intimidation in an organizational setting”, Journal of
habilidades ‘pedagógicas’ evaluadas como también su pon- Organizational Behavior, Vol. 24, No. 2, pp. 237-250.
deración en la apreciación general del maestro siguen es- Bond, L.; Smith, T.; Baker, W. y Hattie, J. (2000) “The Certification
tando en gran medida a discreción de cada inspector. Esto System of the National Board for Professional Teaching
refuerza las evaluaciones subjetivas y los resultados impre- Standards: A Construct and Consequential Validity Study”,
decibles y aleatorios a expensas de la equidad y rigurosidad NBPTS, 2000.
del proceso. Los maestros informan que no saben cómo y Borman, G. y Kimball, S. (2005) “Teacher Quality and Educational
basado en qué criterios están siendo evaluados. Los crite- Equality: Do Teachers with Higher Standards-Based Evaluation
rios más objetivos y bien comprendidos utilizados para eva- Ratings Close Student Achievement Gaps?”, The Elementary
luar a los maestros son aquellos ‘administrativos’, tales School Journal, Vol. 106, No. 1, pp. 3-20.
Braun, H. (2005) “Using Student Progress to Evaluate Teachers: A
como la puntualidad y la asistencia. En consecuencia, la
Primer on Value-Added Models”, Educational Testing Service
calificación obtenida por un maestro suele estar principal-
(ETS), 2005.
mente determinada por su calificación en cuanto a certifica- Casson, H. Jr (2007) “Reducing Teacher Moral Hazard in the U.S.
ción (es decir, el resultado del examen de ingreso). Elementary and Secondary Educational System through Merit-
pay: An Application of the Principal - Agency Theory”, Forum
Consecuencias. Las consecuencias de la evaluación do- for Social Economics, Vol. 36, No. 2, pp. 87-95.
cente en la carrera de un maestro son limitadas, excepto en Campbell, D.; Melenzyer, B.; Nettles, D. y Wyman, R. (2000)
los casos de graves faltas de conducta. Los sueldos de los Portfolio and performance assessment in teacher education,
docentes están determinados por una escala salarial única Needham Heights, MA, Allyn & Bacon.
en la cual la progresión depende de los años de servicio Cavalluzzo, L. (2004) “Is National Board Certification An Effective
junto con las calificaciones iniciales y el examen de ingreso. Signal of Teacher Quality?”, The CNA Corporation, Alexandria,
El compromiso con el trabajo es rara vez reconocido y valo- Virginia, 2004.
rado al igual que el mérito, el desempeño destacado o las Center for Assessment and Evaluation of Student Learning (2004)
iniciativas que buscan mejorar el aprendizaje de los estu- “Using Student Tests to Measure Teacher Quality”, CAESL
diantes. Además, no existe ningún vínculo con las activida- Assessment Brief No. 9.

34
Center for Teaching Quality (2008) “Measuring What Matters: The System”, Journal of Personnel evaluation in Education, Vol.
Effects of National Board Certification on Advancing 21 st 17, No. 2, pp. 173-195.
Century Teaching and Learning”, CTQ, 2008. Heneman, H.; Milanowski, A. y Kimball, S. (2007) “Teacher
Cohen, C. y King Rice, J. (2005) “National Board Certification as Performance Pay: Synthesis of Plans, Research, and
Professional Development: Design and Cost”, NBPTS, 2005. Guidelines for Practice”, Consortium for Policy Research in
Corcoran, T. (2007) “Teaching Matters: How State and Local Education (CPRE) Policy Briefs RB-46.
Policymakers Can Improve the Quality of Teachers and Heneman, H.; Milanowski, A.; Kimball, S. y Odden, A. (2006)
Teaching”, Consortium for Policy Research in Education “Standards-Based Teacher Evaluation as a Foundation for
(CPRE) Policy Briefs RB-48. Knowledge- and Skill-Based Pay”, Consortium for Policy
Danielson, C. (2001) “New Trends in Teacher Evaluation”, Research in Education (CPRE) Policy Briefs RB-45.
Educational Leadership, Vol. 58, No. 5, pp. 12-15. Hess, F. y West, M. (2006) “A Better Bargain: Overhauling Teacher
Danielson, C. (1996, 2007) Enhancing Professional Practice: A Collective Bargaining for the 21 st Century”, Cambridge, MA:
Framework for Teaching, 1st and 2nd editions, Association for Program on Education Policy and Governance, Harvard
Supervision and Curriculum Development (ASCD), Alexandria, University.
Virginia. Holland, P. (2005) “The Case for Expanding Standards for Teacher
Danielson, C. y McGreal, T. (2000) Teacher Evaluation to Enhance Evaluation to Include an Instructional Supervision
Professional Practice, Association for Supervision and Perspective”, Journal of Personnel Evaluation in Education,
Curriculum Development (ASCD), Alexandria, Virginia. Vol. 18, No. 1, pp. 67-77.
Darling, L. (2001) “Portfolio as practice: the narratives of emerging Ingvarson, L.; Kleinhenz, E. y Wilkinson, J. (2007) Research on
teachers”, Teaching and Teacher Education, Vol. 17, pp. 107- Performance Pay for Teachers, Australian Council for
121. Educational Research (ACER), 2007.
Darling-Hammond, L.; Pecheone, R. y Stansbury, K. (2004) Interstate New Teacher Assessment and Support Consortium (1992)
“Beginning Teacher Quality: What Matters for Student “Model Standards for Beginning Teacher Licensing,
Learning?”, Research proposal from Standford University to Assessment and Development: A Resource for State
the Carnegie Corporation of New York, available at Dialogue”, INTASC, Council of Chief State School Officers
www.pacttpa.org/_files/Publications_and_Presentations/ (CCSSO), 1992.
Carnegie_grant_proposal.doc. Jacob, B. (2004) “Accountability, Incentives and Behavior: The
Day, C. y Gu, Q. (2007) “Variations in the conditions for teachers’ Impact of High-Stakes Testing in the Chicago Public Schools”,
professional learning and development: sustaining commitment Journal of Public Economics, Vol. 89, No. 5-6, pp. 761-796.
and effectiveness over a career”, Oxford Review of Education, Jacob, B. y Lefgren, L. (2008) “Can Principals Identify Effective
Vol. 33, No. 4, pp. 423-443. Teachers? Evidence on Subjective Performance Evaluation in
Department of Education, Science and Training (2007) Education”, Journal of Labor Economics, Vol. 26, No. 1, pp.
“Performance-based rewards for teachers”, DEST Research 101-136.
Papers, 2007. Jacob, B. y Lefgren, L. (2005b) “What Do Parents Value in
Elmore, R. (2000) Building a New Structure for School Leadership, Education: an Empirical Investigation of Parents’ Revealed
Albert Shanker Institute, Winter 2000. Preferences for Teachers”, NBER Working Paper n° 11494.
Figlio, D. y Kenny, L. (2007), “Individual teacher incentives and Jacob, B. y Lefgren, L. (2005a) “Principals as Agents: Subjective
student performance”, Journal of Public Economics, Vol. 91, Performance Measurement in Education”, NBER Working
No. 5-6, pp. 901-914. Papers n° 11463.
Freund, M.; Kane Russell, V. y Kavulic, C. (2005) “A Study of the Jacob, B. y Levitt, S. (2003) “Rotten Apples: An Investigation of the
Role of Mentoring in Achieving Certification by the National Prevalence and Predictors of Teacher Cheating”, The Quaterly
Board for Professional Teaching Standards”, NBPTS, 2005. Journal of Economics, Vol. 118, No. 3, pp. 843-878.
Goe, L. (2007) “The Link Between Teacher Quality and Student Jacobs, C.; Martin, S. y Otieno, T. (2008) “A Science Lesson Plan
Outcomes: A Research Synthesis”, National Comprehensive Analysis Instrument for Formative and Summative Program
Center for Teacher Quality, 2007. Evaluation of a Teacher Education Program”, Science Teacher
Goldhaber, D. y Anthony, E. (2007) “Can Teacher Quality Be Education (Articles online in advance of print).
Effectively Assessed? National Board Certification As a Signal Jun, M.-K.; Anthony, R.; Achrazoglu, J. y Coghill-Behrends, W.
of Effective Teaching”, The Review of Economics and (2007) “Using ePortfolio for the Assessment and Professional
Statistics, Vol. 89, No. 1, pp. 134-150. Development of Newly Hired Teachers”, TechTrends, Vol. 51,
Greenfield, W. (1995) “Toward a Theory of School Administration: the No. 4, pp. 45-50.
Centrality of Leadership”, Educational Administration Quraterly, Kane, T. y Staiger, D. (2002) “Volatility in School Test Scores:
Vol. 31, No. 1, pp. 61-85. Implications for Test-Based Accountability Systems”, Brooking
Halverson, R.; Kelley, C. y Kimball, S (2004) “Implementing Teacher Papers on Education Policy, Wahington, DC.
Evaluation Systems: How Principals Make Sense of Complex Kennedy, M. (2005) Inside Teaching, Harvard University Press,
Artifacts to Shape Local Instructional Practice” in Educational London, England, 2005.
Administration, Policy and Reform: Research and Kimball, S. (2002) “Analysis of Feedback, Enabling Conditions and
Measurement Research and Theory in Educational Fairness Perceptions of Teachers in Three School Districts with
Administration, Vol. 3, W.K. Hoy and C.G. Miskel (Eds.) New Standards-Based Evaluation Systems”, Journal of
Greenwish, CT: Information Age Press. Personnel Evaluation in Education, Vol. 16, No. 4, pp. 241-268.
Hanushek, E. (2004) “Does School Accountability Lead to Improved Kimball, S.; Milanowski, T. y McKinney, S. (2007) “Implementation of
Student Performance?”, NBER Working Papers n° 10591. Standards-Based Principal Evaluation in One School District:
Hanushek, E. (1992) “The Trade-Off between Child Quantity and First Year Results From Randomized Trial”, Paper presented at
Quality”, Journal of Political Economy, Vol. 100, No. 1, pp. 84- the annual conference of the American Educational Research
117. Association, available at http://cpre.wceruw.org/publications/
Hanushek, E. (1986) “The Economics of Schooling: Production and KimballMilanowskiMcKinney.pdf.
Efficiency in Public Schools”, Journal of Economic Literature, Klecker, B. (2000) “Content validity of preservice teacher portfolios in
Vol. 24, No. 3, pp. 1141-1177. a standards-based program”, Journal of Instructional
Hanushek, E.; Kain, J.; O’Brien, D. y Rivkin, S. (2005) “The Market Psychology, Vol. 27, No. 1, pp. 35-38.
for Teacher Quality”, NBER Working Papers n° 11154. Kleinhenz, E. y Ingvarson, L. (2004) “Teacher Evaluation Uncoupled:
Harris, D. y Sass, T. (2007) “The Effects of NBPTS-Certified A Discussion of Teacher Evaluation Policies and Practices in
Teachers on Student Achievement”, Center for Analysis of Australian States and Their Relation to Quality Teaching and
Longitudinal Data in Education Research (CALDER), Working Learning”, Research Papers in Education, Vol. 19, No. 1, pp.
Paper n° 4. 31-49.
Haut Conseil de l’évaluation de l’école (2003) Rapport annuel, HCéé, Leigh, A. (2007) “Estimating Teacher Effectiveness From Two-Year
2003. Changes in Students’ Test Scores”, Research School of Social
Heneman, H. y Milanowski, A. (2003) “Continuing Assessment of Sciences, Australian National University, available at http://
Teacher Reactions to a Standards-Based Teacher Evaluation econrsss.anu.edu.au/~aleigh/pdf/TQPanel.pdf.

35
Levin, J. (2003) “Relational incentive contracts”, American Economic New Directions and Practices, 2nd edition, Thousand Oaks, CA:
Review, Vol. 93, No. 3, pp. 835-57. Corwin Press.
Lustick, D. y Sykes, G. (2006) “National Board Certification as Peterson, K.; Wahlquist, C. y Bone, K. (2000) “Student Surveys for
Professional Development: What are Teachers Learning?”, Teacher Evaluation”, Journal of Personnel Evaluation in
Education Policy Analysis Archives, Vol. 14, No. 5. Education, Vol. 14, No. 2, pp. 135-153.
MacLeod, B. (2003) “Optimal contracting with subjective evaluation”, Peterson, K.; Wahlquist, C.; Esparza Brown, J. y Mukhopadhyay, S.
American Economic Review 93, No. 1, pp. 216-240. (2003) “Parents Surveys for Teacher Evaluation”, Journal of
Mansvelder-Longayroux, D.; Beijaard, D. y Verloop, N. (2007) “The Personnel Evaluation in Education, Vol. 17, No. 4, pp. 317-
portfolio as a tool for stimulating reflection by student 330.
teachers”, Teaching and Teacher Education, Vol. 23, No. 1, pp. Peterson, K. (2006) “Teacher Pay Reform Challenges States”,
47-62. Stateline.org: where policy and politics news click, available at
Margo, J.; Benton, M.; Withers, K. y Sodha, S. (2008) Those Who http://www.stateline.org/live/ViewPage.action?siteNodeId=
Can?, Institute for Public Policy Research (IPPR) Publications, 136&languageId=1&contentId=93346.
2008. Petty, T. (2002) “Identifying the Wants and Needs of North Carolina
Marshall, K. (2005) “It’s Time to Rethink Teacher Supervision and High School Mathematics Teachers for Job Success and
Evaluation”, Phi Delta Kappan, Vol. 86, No. 10, pp. 727-735. Satisfaction”, NBPTS, 2002.
McColskey, W. y Stronge, J. (2005) “A Comparison of National Board Ping Yan Chow, A.; King Por Wong, E.; Seeshing Yeung, A. y Wan
Certified Teachers and non-National Board Certified Teachers: Mo, K (2002) “Teachers’ Perceptions of Appraiser-Appraisee
Is there a difference in teacher effectiveness and student Relationships”, Journal of Personnel Evaluation in Education,
achievement”, NBPTS, 2005. Vol. 16, No. 2, pp. 85-101.
Milanowski, A. (2007) “Performance Pay System Preferences of Pochard, M. (2008) Livre vert sur l’évolution du métier d’enseignant,
Students Preparing to Be Teachers”, American Education Rapport au ministre de l’Education nationale, La
Finance Association, 2007. Documentation française, Collection des rapports officiels,
Milanowski, A. (2004) “The Relationship Between Teacher 2008.
Performance Evaluation Scores and Student Achievement: Popham, J. (1997) “Consequential validity: Right Concern - Wrong
Evidence From Cincinatti”, Peabody Journal of Education, Vol. Concept”, Educational Measurement: Issues and Practice, Vol.
79, No. 4, pp. 33-53. 16, No. 2, pp. 9-13.
Milanowski, A. y Heneman, H. (2001) “Assessment of Teacher Robinson, V. (2007) “School Leadership and Student Outcomes :
Reactions to a Standards-Based Teacher Evaluation System: A Identifying What works and Why”, Australian Council for
Pilot Study”, Journal of Personnel Evaluation in Education, Vol. Educational Leaders, ACEL Monograph Series No. 41.
15, No. 3, pp. 193-212. Sanders, W.; Ashton, J. y Wright, P. (2005) “Comparison of the
Milanowski, A. y Kimball, S. (2003) “The Framework-Based Teacher Effects of NBPTS Certified Teachers with Other Teachers on
Performance Assessment Systems in Cincinatti and Washoe”, the Rate of Student Academic Progress”, NBPTS, 2005.
CPRE Working Paper Series TC-03-07. Smith, T.; Gordon, B.; Colby, S. y Wang, J. (2005) “An Examination
Ministerial Council on Education, Employment Training and Youth of the Relationship Between Depth of Student Learning and
Affairs (2003) “A National Framework for Professional National Board Certification Status”, Office for Research on
Standards for Teaching”, MCEETYA, Carlton South, Australia, Teaching, Appalachian State University.
2003. Stronge, J. y Tucker, P. (2003) Handbook on Teacher Evaluation:
Mizala, A. y Romaguera, P. (2004) “School and teacher performance Assessing and Improving Performance, Eye On Education
incentives: The Latin American experience”, International Publications, 2003.
Journal of Educational Development, Vol. 24, No. 6, pp. 739- Stronge, J.; Ward, T.; Tucker, P. y Hindman, J. (2007) “What is the
754. Relationship Between Teacher Quality and Student
Muñoz, M. y Chang, F. (2007) “The Elusive Relationship Between Achievement? An Exploratory Study”, Journal of Personnel
Teacher Characteristics and Student Achievement Growth: A Evaluation in Education, Vol. 20, No. 3-4, pp. 165-184.
Longitudinal Multilevel Model for Change”, Journal of Strudler, N. y Wertzel, K. (2008) “Costs and Benefits of Electronic
Personnel Evaluation in Education, Vol. 20, No. 3-4, pp. 147- Portfiolos in Teacher Education: Faculty Perspectives”, Journal
164. of Computing in Teacher Education, Vol. 24, No. 4, pp. 135-
Nabors Oláh, L.; Lawrence, N. y Riggan, M. (2008) “Learning to 142.
learn from benchmark assessment data: How teachers analyze Training and Development Agency for Schools (2007a) “Models
results”, Paper presented at the Annual Meeting of the Performance Management Policy for Schools”, TDA, United
American Educational Research Association, New York, 2008, Kingdom, 2007.
available at http://www.cpre.org/images/stories/cpre_pdfs/ Training and Development Agency for Schools (2007b) “Professional
aera2008_olah_lawrence_riggan.pdf. Standards for Teachers: Why Sit Still in Your Career?”, TDA,
National Board for Professional Teaching Standards (2007) “A United Kingdom, 2007.
Research Guide on National Board Certification of Teachers”, Tucker, P.; Stronge, J. y Gareis, C. (2002) Handbook on teacher
NBPTS, Arlington, VA, 2007. portfolios for evaluation and professional development,
Odden, A. y Kelley, C. (2002) Paying Teachers for What They Know Larchmont, NY, Eye on Education.
and Do: New and Smarter Compensation Strategies to Improve UNESCO (2007) Evaluación del Desempeño y Carrera Profesional
Schools, Corwin Press, Thousand Oaks, California, 2002. Docente: Una panorámica de América y Europa, Oficina
Office for Standards in Education (2006) “The logical chain: Regional de Educación para América Latina y el Caribe,
continuing professional development in effective schools”, UNESCO Santiago, 2007.
OFSTED Publications n° 2639, United Kingdom, 2006. Vandervoort, L.; Amrein-Beardsley, A. y Berliner, D. (2004) “National
Organisation for Economic Co-Operation and Development (2008) Board Certified Teachers and Their Students’ Achievement”,
Improving School Leadership, OECD, Paris, 2008. Education Policy Analysis Archives, Vol. 12, No. 46.
Organisation for Economic Co-Operation and Development (2005) Weingarten, R. (2007) “Using Student Test Scores to Evaluate
Teachers Matter: Attracting, Developing and Retaining Teachers: Common Sense or Nonsense?”, United Federation
Effective Teachers, OECD, Paris, 2005. of Teachers, available at http://www.uft.org/news/randi/
Ovando, M. y Ramirez, A Jr (2007) “Principals’ Instructional ny_times/ UFT_WMM_Mar07_v32.pdf.
Leadership Within a Teacher Performance Appraisal System: Wertzel, K. y Strudler, N. (2006) “Costs and Benefits of Electronic
Enhancing Students’ Academic Success”, Journal of Personnel Portfiolos in Teacher Education: Student Voices”, Journal of
Evaluation in Education, Vol. 20, No. 1-2, pp. 85-110. Computing in Teacher Education, Vol. 22, No. 3, pp. 69-78.
Pecheone, R. y Chung, R. (2006) “Evidence in Teacher Education: Xin, T.; Xu, Z. y Tatsuoka, K. (2004) “Linkage Between Teacher
The Performance Assessment for California Teachers (PACT)”, Quality, Student Achievement, and Cognitive Skills: A Rule-
Journal of Teacher Education, Vol. 57, No. 1, pp. 22-36. Space Model”, Studies in Educational Evaluation, Vol. 30, pp.
Peterson, K. (2000) Teacher Evaluation: A Comprehensive Guide to 205-223.

36
Programa de Promoción de la Reforma Educativa en América Latina y el Caribe Programa de Promoción de la Reforma Educativa en América Latina y el Caribe
Partnership for Educational Revitalization in the Americas Partnership for Educational Revitalization in the Americas

El Programa de Promoción de la Reforma Educativa en


América Latina y el Caribe es un proyecto conjunto del
Diálogo Interamericano, con sede en Washington, y la
Corporación de Investigaciones para el Desarrollo
(CINDE), con sede en Santiago de Chile.

Desde su creación en 1995, el PREAL ha tenido como


objetivo central contribuir a mejorar la calidad y equidad
de la educación en la región mediante la promoción de
debates informados sobre temas de política educacional y

DOCUMENTOS
reforma educativa, la identificación y difusión de buenas
prácticas y la evaluación y monitoreo del progreso
educativo.

La ejecución de las actividades se realiza a través de


Centros Asociados de Investigación y Políticas Públicas
en diversos países de la región y comprenden la
realización de estudios, la organización de debates y la
promoción de diálogos públicos sobre temas de política
educacional y reforma educativa.

Las actividades del PREAL son posibles gracias al apoyo


de la United States Agency for International Development
(USAID), el Banco Interamericano de Desarrollo (BID),
el Banco Mundial, la International Association for the
Evaluation of Educational Achievement (IEA), The Tinker
Foundation, GE Foundation, entre otras.

Inter-American Dialogue • 1211 Connecticut Ave. N.W. Suite 510 CINDE • Santa Magdalena 75, Piso 10 • Oficina 1002 • Providencia
Washington, D.C. 20036 U.S.A. • Tel: (202) 822-9002 Santiago, Chile • Tel: (56-2) 334-4302
Fax: (202)822-9553 • E-mail: iad@thedialogue.org Fax: (56-2) 334-4303 • E-mail: infopreal@preal.org
Internet: www.thedialogue.org & www.preal.org Internet: www.preal.org