Modelo Iluminativo de La Evaluacion

Referencia:
Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de
Reference: intenso desarrollo de la evaluación en educación. Revista ELectrónica de Investigación y EValuación
Educativa, v. 9, n. 1. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm. Consultado en (poner fecha).
This article in english version (added March, 21th 2006)
Analysis / Análisis Hits: Visitas
DESDE LOS TESTS HASTA LA

INVESTIGACIÓN EVALUATIVA ACTUAL. UN
SIGLO, EL XX, DE INTENSO DESARROLLO
DE LA EVALUACIÓN EN EDUCACIÓN
(From tests to current evaluative research. One
century, the XXth, of intense development of
evaluation in education)
En formato
po
In format r
Article record Ficha del artículo
About the Tomás Escudero Escorza Sobre los
authors autores
(tescuder@posta.unizar.es)
Print this article Imprimir el
artículo
Abstract Resumen
Este artículo presenta una revisión
This article presents a review and state of art
crítica del desarrollo histórico que ha tenido el
about development in educational evaluation
ámbito de la evaluación educativa durante todo
in the XXth century. The main theoretical
el siglo XX. Se analizan los principales
proposals are commented
propuestas teóricas planteadas.
Keywords Descriptores
Evaluación, Investigación evaluativa, Métodos
Evaluation, Evaluation Research, Evaluation
de Evaluación, Evaluación Formativa,
Methods; Formative Evaluation Summative
Evaluación Sumativa, Test, Evaluación de
Evaluation, Testing, Program Evaluation
Programas
Introducción
En cualquier disciplina, la aproximación histórica suele ser una vía

fundamental para comprender su concepción, estatus, funciones, ámbito, etc. Este
hecho es especialmente evidente en el caso de la evaluación, pues se trata de una
disciplina que ha sufrido profundas transformaciones conceptuales y funcionales a
lo largo de la historia y, sobre todo, a lo largo del siglo XX, en el que
principalmente ubicamos nuestro análisis. En este sentido, la aproximación
diacrónica al concepto resulta imprescindible.
Comments to
this article
Related
articles:
de la Orden et
al. (1997).
Desarrollo y
validación de un
modelo de
calidad
universitaria Comentar este
como base para artículo
su evaluación. Artículos
relacionados:
Volume 9, n 1
de la Orden et al.
El análisis la vamos a llevar a cabo basándonos en tres (1997). Desarrollo
planteamientos que podríamos tachar de clásicos en la reciente y validación de un
literatura sobre el tema y que usamos indistintamente, aunque no modelo de calidad
tenemos la pretensión de ofrecer un planteamiento de síntesis, universitaria
sino de utilización cabal de todos ellos, puesto que los tres como base para su
evaluación.
planteamientos inciden sobre los mismos momentos y
movimientos claves. Volume 9, n 1
Un planteamiento, quizás el más utilizado en nuestro contexto (Mateo y otros,

1993; Hernández, 1993), es el que ofrecen Madaus, Scriven, Stufflebeam y otros
autores, que en sus trabajos suelen establecer seis épocas, empezando su análisis
desde el siglo XIX (Stufflebeam y Shinkfield, 1987; Madaus y otros, 1991). Nos
hablan de: a) época de la reforma (1800-1900), b) época de la eficiencia y del
«testing» (1900-1930), c) época de Tyler (1930-1945), d) época de la inocencia
(1946-1956), e) época de la expansión (1957-1972) y f) época de la
profesionalización (desde 1973), que enlaza con la situación actual.
Otros autores como Cabrera (1986) y Salvador (1992) citan tres grandes
épocas, tomando como punto de referencia central la figura de Tyler en el
segundo cuarto del Siglo XX. A la época de Tyler se le denomina de nacimiento,
a las anteriores de precedentes o antecedentes y a la posterior de desarrollo.
Guba y sus colaboradores, sobre todo Yvonna Lyncoln, destacan distintas
generaciones. Ahora estaríamos en la cuarta (Guba y Lincoln, 1989), que según
ellos se apoya en el enfoque paradigmático constructivista y en las necesidades de
los «stakeholders» (demandantes e implicados en la evaluación), como base para
determinar la información que se necesita. La primera generación es la de la
medición, que llega hasta el primer tercio de este siglo, la segunda es la de la
descripción y la tercera la del juicio o valoración.
Tras el análisis histórico, como complemento y como revisión de síntesis del
mismo, ofrecemos un sucinto resumen de los enfoques evaluativos más
relevantes, de los distintos modelos y planteamientos que, con mayor o menor
fuerza, vienen a nuestra mente cuando intentamos acotar lo que es hoy en día la
investigación evaluativa en educación
1. Precedentes: Antes de los «tests» y de la medición
Desde la antigüedad se han venido creando y usando procedimientos
instructivos en los que los profesores utilizaban referentes implícitos, sin una
teoría explícita de evaluación, para valorar y, sobre todo, diferenciar y seleccionar
a estudiantes. Dubois (1970) y Coffman (1971) citan los procedimientos que se
empleaban en la China imperial, hace más de tres mil años, para seleccionar a los
altos funcionarios. Otros autores como Sundbery (1977) hablan de pasajes
evaluadores en la Biblia, mientras Blanco (1994) se refiere a los exámenes de los
profesores griegos y romanos. Pero según McReynold (1975), el tratado más
importante de evaluación de la antigüedad es el Tetrabiblos, que se atribuye a
Ptolomeo. También Cicerón y San Agustín introducen en sus escritos conceptos y
planteamientos evaluadores.
En la Edad Media se introducen los exámenes en los medios universitarios con
carácter más formal. Hay que recordar los famosos exámenes orales públicos en
presencia de tribunal, aunque sólo llegaban a los mismos los que contaban con el
visto bueno de sus profesores, con lo que la posibilidad de fracaso era
prácticamente inexistente. En el Renacimiento se siguen utilizando
procedimientos selectivos y Huarte de San Juan, en su Examen de ingenios para
las ciencias, defiende la observación como procedimiento básico de la evaluación
(Rodríguez y otros, 1995).
En el siglo XVIII, a medida que aumenta la demanda y el acceso a la
educación, se acentúa la necesidad de comprobación de los méritos individuales y
las instituciones educativas van elaborando e introduciendo normas sobre la
utilización de exámenes escritos (Gil, 1992).
Entrado el siglo XIX se establecen los sistemas nacionales de educación y
aparecen los diplomas de graduación, tras la superación de exámenes (exámenes
del Estado). Según Max Weber (Barbier, 1993), surge un sistema de exámenes de
comprobación de una preparación específica, para satisfacer las necesidades de
una nueva sociedad jerárquica y burocratizada. En los Estados Unidos, en 1845,
Horace Mann comienza a utilizar las primeras técnicas evaluativas del tipo
«tests» escritos, que se extienden a las escuelas de Boston, y que inician el
camino hacia referentes más objetivos y explícitos con relación a determinadas
destrezas lecto-escritoras. Sin embargo, no se trata todavía de una evaluación
sustentada en un enfoque teórico, sino más bien, algo que responde a prácticas en
buena medida rutinarias y con frecuencia basadas en instrumentos poco fiables.
Al final del siglo XIX, en 1897, aparece un trabajo de J. M. Rice, que se suele
señalar como la primera investigación evaluativa en educación (Mateo y otros,
1993). Se trataba de un análisis comparativo en escuelas americanas sobre el
valor de la instrucción en el estudio de la ortografía, utilizando como criterio las
puntuaciones obtenidas en los tests.
2. Los tests psicométricos

En el contexto anterior, a finales del siglo XIX, se despierta un gran interés por
la medición científica de las conductas humanas. Esto es algo que se enmarca en
el movimiento renovador de la metodología de las ciencias humanas, al asumir el
positivismo de las ciencias físico-naturales. En este sentido, la evaluación recibe
las mismas influencias que otras disciplinas pedagógicas relacionadas con
procesos de medición, como la pedagogía experimental y la diferencial (Cabrera,
1986).
La actividad evaluativa se verá condicionada de forma decisiva por diversos
factores que confluyen en dicho momento, tales como:
a) El florecimiento de las corrientes filosóficas positivistas y empíricas,
que apoyaban a la observación, la experimentación, los datos y los
hechos como fuentes del conocimiento verdadero. Aparece la exigencia
del rigor científico y de la objetividad en la medida de la conducta
humana (Planchard, 1960) y se potencian las pruebas escritas como
medio para combatir la subjetividad de los exámenes orales (Ahman y
Cook, 1967).
b) La influencia de las teorías evolucionistas y los trabajos de Darwin,
Galton y Cattel, apoyando la medición de las características de los
individuos y las diferencias entre ellos.
c) El desarrollo de los métodos estadísticos que favorecía decisivamente
la orientación métrica de la época (Nunnally, 1978).
d) El desarrollo de la sociedad industrial que potenciaba la necesidad de
encontrar unos mecanismos de acreditación y selección de alumnos,
según sus conocimientos.
Consecuentemente con este estado de cosas, en este periodo entre finales del
siglo XIX y principios del XX, se desarrolla una actividad evaluativa intensa
conocida como «testing», que se define por características como las siguientes:
• Medición y evaluación resultaban términos intercambiables. En la
práctica sólo se hablaba de medición.
• El objetivo era detectar y establecer diferencias individuales, dentro del
modelo del rasgo y atributo que caracterizaba las elaboraciones
psicológicas de la época (Fernández Ballesteros, 1981), es decir, el
hallazgo de puntuaciones diferenciales, para determinar la posición
relativa del sujeto dentro de la norma grupal.
• Los tests de rendimiento, sinónimo de evaluación educativa, se
elaboraban para establecer discriminaciones individuales, olvidándose en
gran medida la representatividad y congruencia con los objetivos
educativos. En palabras de Guba y Lincoln (1982), la evaluación y la
medida tenían poca relación con los programas escolares. Los tests
informaban algo sobre los alumnos, pero no de los programas con los
que se les había formado.
En el campo educativo destacan algunos instrumentos de aquella época, como
las escalas de escritura de Ayres y Freeman, de redacción de Hillegas, de
ortografía de Buckingan, de cálculo de Wood, de lectura de Thorndike y McCall
y de aritmética de Wood y McCall (Planchard, 1960; Ahman y Cook, 1967; Ebel,
1977).
Sin embargo, fue en los tests psicológicos donde los esfuerzos tuvieron mayor
impacto, siendo probablemente la obra de Thorndike (1904) la de mayor
influencia en los comienzos del siglo XX. En Francia destacan los trabajos de
Alfred Binet, después revisados por Terman en la Universidad de Stanford, sobre
tests de capacidades cognitivas. Ahora hablamos del Stanford-Binet, uno de los
tests más conocidos en la historia de la psicometría.
Años más tarde, con las necesidades de reclutamiento en la Primera Guerra
Mundial, Arthur Otis dirige un equipo que construye tests colectivos de
inteligencia general (Alfa para lectoescritores y Beta para analfabetos) e
inventarios de personalidad (Phillips, 1974).
Tras la contienda, los tests psicológicos se ponen al servicio de fines sociales.
La década entre 1920 y 1930 marca el punto más alto del «testing», pues se idean
multitud de tests estandarizados para medir toda clase de destrezas escolares con
referentes objetivos externos y explícitos, basados en procedimientos de medida
de la inteligencia, para utilizar con grandes colectivos de estudiantes.
Estas aplicaciones estandarizadas se acogen muy bien en los ámbitos
educativos y McCall (1920) propone que los profesores construyan sus propias
pruebas objetivas, para no tener que confiar exclusivamente en las propuestas por
especialistas externos.
Este movimiento estuvo vigente en paralelo al proceso de perfeccionamiento
de los tests psicológicos con el desarrollo de la estadística y del análisis factorial.
El fervor por el «testing» decreció a partir de los años cuarenta e, incluso,
empezaron a surgir algunos movimientos hipercríticos con estas prácticas.
Guba y Lincoln (1989) se refieren a esta evaluación como a la primera
generación, que puede legítimamente ser denominada como la generación de la
medida. El papel del evaluador era técnico, como proveedor de instrumentos de
medición. Según estos autores, esta primera generación permanece todavía viva,
pues todavía existen textos y publicaciones que utilizan de manera indisoluble
evaluación y medida (Gronlund, 1985).
3. El nacimiento de la verdadera evaluación educativa: La gran reforma

«tyleriana»
Antes de que llegara la revolución promovida por Ralph W. Tyler, en Francia
se inicia en los años veinte una corriente independiente conocida como
docimología (Pieron, 1968 y 1969; Bonboir, 1972), que supone un primer
acercamiento a la verdadera evaluación educativa. Se criticaba, sobre todo, el
divorcio entre lo enseñado y las metas de la instrucción. La evaluación se dejaba,
en último término, en manos de una interpretación totalmente personal del
profesor. Como solución se proponía: a) elaboración de taxonomías para formular
objetivos, b) diversificación de fuentes de información, exámenes, expedientes
académicos, técnicas de repesca y tests, c) unificación de criterios de corrección a
partir del acuerdo entre los correctores de las pruebas y d) revisión de los juicios
de valoración mediante procedimientos tales como la doble corrección, o la media
de distintos correctores. Como puede verse, se trata de criterios en buena medida
vigentes actualmente y, en algún caso, incluso avanzados.
Pero quien es tradicionalmente considerado como el padre de la evaluación
educativa es Tyler (Joint Committee, 1981), por ser el primero en dar una visión
metódica de la misma, superando desde el conductismo, muy en boga en el
momento, la mera evaluación psicológica. Entre 1932 y 1940, en su famoso
Eight-Year Study of Secondary Education para la Progressive Education
Association, publicado dos años después (Smith y Tyler, 1942), plantea la
necesidad de una evaluación científica que sirva para perfeccionar la calidad de la
educación. La obra de síntesis la publica unos años después (Tyler, 1950),
exponiendo de manera clara su idea de «curriculum», e integrando en él su
método sistemático de evaluación educativa, como el proceso surgido para
determinar en qué medida han sido alcanzados los objetivos previamente
establecidos (véase también Tyler, 1967 y 1969).
El «currículum» viene delimitado por las cuatro cuestiones siguientes:
a) ¿Qué objetivos se desean conseguir?
b) ¿Con qué actividades se pueden alcanzar?
c) ¿Cómo pueden organizarse eficazmente estas experiencias?
d) ¿Cómo se puede comprobar si se alcanzan los objetivos?
Y la buena evaluación precisa de las siguientes condiciones:
a) Propuesta clara de objetivos.
b) Determinación de las situaciones en las que se deben manifestar las
conductas esperadas.
c) Elección de instrumentos apropiados de evaluación.
d) Interpretación de los resultados de las pruebas.
e) Determinación de la fiabilidad y objetividad de las medidas.
Esta evaluación ya no es una simple medición, porque supone un juicio de
valor sobre la información recogida. Se alude, aunque sin desarrollar, a la toma
de decisiones sobre los aciertos o fracasos de la programación, en función de los
resultados de los alumnos, algo que retomarán otros importantes evaluadores
como Cronbach y Sufflebeam unos años después.
Para Tyler, la referencia central en la evaluación son los objetivos
preestablecidos, que deben ser cuidadosamente definidos en términos de
conducta (Mager, 1962), teniendo en cuenta que deben marcar el desarrollo
individual del alumno, pero dentro de un proceso socializador.
El objeto del proceso evaluativo es determinar el cambio ocurrido en los
alumnos, pero su función es más amplia que el hacer explícito este cambio a los
propios alumnos, padres y profesores; es también un medio para informar sobre la
eficacia del programa educacional y también de educación continua del
profesor. Se trata, según Guba y Lincoln (1989), de la segunda generación de la
evaluación. Desgraciadamente, esta visión evaluativa global no fue
suficientemente apreciada, ni explotada, por aquellos que utilizaron sus trabajos
(Bloom y otros, 1975; Guba y Lincoln, 1982).
A pesar de lo anterior y de que las reformas tylerianas no siempre se aplicaron
de inmediato, las ideas de Tyler fueron muy bien acogidas por los especialistas en
desarrollo curricular y por los profesores. Su esquema era racional y se apoyaba
en una tecnología clara, fácil de entender y aplicar (Guba y Lincoln, 1982; House,
1989) y encajaba perfectamente en la racionalidad del análisis de la tarea que
comenzaba a usarse con éxito en ámbitos educativos militares (Gagné, 1971). En
España, los planteamientos de Tyler se extendieron con la Ley General de
Educación de 1970.
Tras la Segunda Guerra Mundial se produce un periodo de expansión y
optimismo que Stufflebeam y Shinkfield (1987) no han dudado en calificar de
«irresponsabilidad social», por el gran despilfarro consumista tras una época de
recesión. Se trata de la etapa conocida como la de la inocencia (Madaus y otros,
1991). Se extienden mucho las instituciones y servicios educativos de todo tipo,
se producen cantidad de tests estandarizados, se avanza en la tecnología de la
medición y en los principios estadísticos del diseño experimental (Gulliksen,
1950; Lindquist, 1953; Walberg y Haertel, 1990) y aparecen las famosas
taxonomías de los objetivos educativos (Bloom y otros, 1956; Krathwohl y otros,
1964). Sin embargo, en esta época, la aportación de la evaluación a la mejora de
la enseñanza es escasa debido a la carencia de planes coherentes de acción. Se
escribe mucho de evaluación, pero con escasa influencia en el perfeccionamiento
de la labor instruccional. El verdadero desarrollo de las propuestas tylerianas vino
después (Taba, 1962; Popham y Baker, 1970; Fernández de Castro, 1973).
Ralph W. Tyler murió el 18 de febrero de 1994, superados los noventa años de
vida, tras siete décadas de fructíferas aportaciones y servicios a la evaluación, a la
investigación y a la educación en general. Unos meses antes, en abril de 1993,
Pamela Perfumo, una estudiante graduada de la Universidad de Stanford,
entrevistó a Tyler con el propósito de conocer su pensamiento acerca del actual
desarrollo de la evaluación y de los temas controvertidos alrededor de la misma.
Esta entrevista, convenientemente preparada, fue presentada el 16 de abril de
1993 en la Conferencia de la AERA que tuvo lugar en Atlanta. Horowitz (1995)
analiza el contenido y el significado de la citada entrevista, destacando, entre
otros, los siguientes aspectos en el pensamiento de Tyler al final de sus días:
a) Necesidad de analizar cuidadosamente los propósitos de la evaluación,
antes de ponerse a evaluar. Los actuales planteamientos de
evaluaciones múltiples y alternativas deben ajustarse a este principio
b) El propósito más importante en la evaluación de los alumnos es guiar su
aprendizaje, esto es, ayudarles a que aprendan. Para ello es necesaria
una evaluación comprensiva de todos los aspectos significativos de su
rendimiento; no basta con asegurarse que hacen regularmente el trabajo
diario.
c) El «portfolio» es un instrumento valioso de evaluación, pero depende
de su contenido. En todo caso, hay que ser cauteloso ante la
preponderancia de un solo procedimiento de evaluación, incluyendo el
«portfolio», por su incapacidad de abarcar todo el espectro de aspectos
evaluables.
d) La verdadera evaluación debe ser idiosincrásica, adecuada a las
peculiaridades del alumno y el centro. En rigor, la comparación de
centros no es posible.
e) Los profesores deben rendir cuentas de su acción educativa ante los
padres de los alumnos. Para ello, es necesario interaccionar con ellos de
manera más frecuente y más informal.
Medio siglo después de que Tyler revolucionara el mundo de la evaluación

educativa, se observa la fortaleza, coherencia y vigencia de su pensamiento.
Como acabamos de ver, sus ideas básicas, convenientemente actualizadas, se
entroncan fácilmente en las corrientes más actuales de la evaluación educativa.
4. El desarrollo de los sesenta

Los años sesenta traerán nuevos aires a la evaluación educativa, entre otras
cosas porque se empezó a prestar interés por algunas de las llamadas de atención
de Tyler, relacionadas con la eficacia de los programas y el valor intrínseco de la
evaluación para la mejora de la educación.
En esa época surge un cierto conflicto entre la sociedad americana y su sis-
tema educativo, sobre todo porque los rusos iban por delante en la carrera
especial, tras el lanzamiento del Sputnik por la URSS en 1957. Aparece un cierto
desencanto con la escuela pública y crece la presión por la rendición de cuentas
(MacDonald, 1976; Stenhouse, 1984). En 1958 se promulga una nueva ley de
defensa educativa que proporciona muchos programas y medios para evaluarlos.
En 1964 se establece el Acta de educación primaria y secundaria (ESEA) y se
crea el National Study Comitte on Evaluation, creándose una nueva evaluación no
sólo de alumnos, sino orientada a incidir en los programas y en la práctica
educativa global (Mateo y otros, 1993; Rodríguez y otros, 1995).
Para mejorar la situación y retomar la hegemonía científica y educativa, fueron
muchos los millones de dólares que desde los fondos públicos se destinaron a
subvencionar nuevos programas educativos e iniciativas del personal de las
escuelas públicas americanas encaminadas a mejorar la calidad de la enseñanza.
(Popham, 1983; Rutman y Mowbray, 1983; Weiss, 1983). Este movimiento se
vio también potenciado por el desarrollo de nuevos medios tecnológicos
(audiovisuales, ordenadores...) y el de la enseñanza programada, cuyas
posibilidades educativas despertaron el interés entre los profesionales de la
educación (Rosenthal, 1976).
De la misma forma que la proliferación de programas sociales en la década
anterior había impulsado la evaluación de programas en el área social, los años
sesenta serán fructíferos en demanda de evaluación en el ámbito de la educación.
Esta nueva dinámica en la que entra la evaluación, hace que, aunque ésta se
centraba en los alumnos como sujeto que aprende, y el objeto de valoración era el
rendimiento de los mismos, sus funciones, su enfoque y su última interpretación
variará según el tipo de decisión buscada.
Buena parte de culpa de este fuerte ímpetu evaluador americano se debió a la
ya citada aprobación de la «Elementary and Secondary Act» (ESEA) en 1965
(Berk, 1981; Rutman, 1984). Con esta ley se puso en marcha el primer programa
significativo para la organización de la educación en el ámbito federal de los
Estados Unidos, y se estipuló que cada uno de los proyectos realizados con el
apoyo económico federal debía ser anualmente evaluado, a fin de justificar
subvenciones futuras.
Junto al desencanto de la escuela pública, cabe señalar la recesión económica
que caracteriza los finales años sesenta, y, sobre todo, la década de los setenta.
Ello hizo que la población civil, como contribuyentes, y los propios legisladores
se preocupasen por la eficacia y el rendimiento del dinero que se empleaba en la
mejora del sistema escolar. A finales de los años sesenta, y como consecuencia de
lo anterior, entra en escena un nuevo movimiento, la era de la «Accountability»,
de la rendición de cuentas (Popham, 1980 y 1983; Rutman y Mowbray, 1983),
que se asocia fundamentalmente a la responsabilidad del personal docente en el
logro de objetivos educativos establecidos. De hecho, en el año 1973, la
legislación de muchos estados americanos instituyó la obligación de controlar el
logro de los objetivos educativos y la adopción de medidas correctivas en caso
negativo (MacDonald, 1976; Wilson y otros, 1978). Es comprensible que,
planteado así, este movimiento de rendición de cuentas, de responsabilidad
escolar, diera lugar a una oleada de protestas por parte del personal docente.
Otra dimensión de la responsabilidad escolar nos la ofrece Popham (1980),
cuando se refiere al movimiento de descentralización escolar durante los últimos
años sesenta y principios de los setenta. Los grandes distritos escolares se
dividieron en áreas geográficas más pequeñas, y, por consiguiente, con un control
ciudadano más directo sobre lo que ocurría en las escuelas.
Como consecuencia de estos focos de influencia, se amplió considerablemente
el fenómeno de la evaluación educativa. El sujeto directo de la evaluación siguió
siendo el alumno, pero también todos aquellos factores que confluyen en el
proceso educativo (el programa educativo en un sentido amplio, profesor, medios,
contenidos, experiencias de aprendizaje, organización, etc.), así como el propio
producto educativo.
Como resultado de estas nuevas necesidades de la evaluación, se inicia durante
esta época un periodo de reflexión y de ensayos teóricos con ánimo de clarificar
la multidimensionalidad del proceso evaluativo. Estas reflexiones teóricas
enriquecerán decisivamente el ámbito conceptual y metodológico de la
evaluación, lo que unido a la tremenda expansión de la evaluación de programas
ocurrida durante estos años, dará lugar al nacimiento de esa nueva modalidad de
investigación aplicada que hoy denominamos como investigación evaluativa.
Como hitos de la época hay que destacar dos ensayos por su decisiva
influencia: el artículo de Cronbach (1963), Course improvement through
evaluation, y el de Scriven (1967), The methodology of evaluation. La riqueza de
ideas evaluativas expuestas en estos trabajos nos obligan a que, aunque
brevemente, nos refiramos a ellas.
Del análisis que Cronbach del concepto, funciones y metodología de la
evaluación, entresacamos las sugerencias siguientes:
a) Asociar el concepto de evaluación a la toma de decisiones. Distingue el
autor tres tipos de decisiones educativas a las cuales la evaluación
sirve: a) sobre el perfeccionamiento del programa y de la instrucción, b)
sobre los alumnos (necesidades y méritos finales) y c) acerca de la
regulación administrativa sobre la calidad del sistema, profesores,
organización, etc. De esta forma, Cronbach abre el campo conceptual y
funcional de la evaluación educativa mucho más allá del marco
conceptual dado por Tyler, aunque en su línea de sugerencias.
b) La evaluación que se usa para mejorar un programa mientras éste se
está aplicando, contribuye más al desarrollo de la educación que la
evaluación usada para estimar el valor del producto de un programa ya
concluido.
c) Poner en cuestión la necesidad de que los estudios evaluativos sean de
tipo comparativo. Entre las objeciones a este tipo de estudios, el autor
destaca el hecho de que, con frecuencia, las diferencias entre las
puntuaciones promedio entre-grupos son menores que las intra-grupos,
así como otras referentes a las dificultades técnicas que en el marco
educativo presentan los diseños comparativos. Cronbach aboga por
unos criterios de comparación de tipo absoluto, reclamando la
necesidad de una evaluación con referencia al criterio, al defender la
valoración con relación a unos objetivos bien definidos y no la
comparación con otros grupos.
d) Se ponen en cuestión los estudios a gran escala, puesto que las
diferencias entre los tratamientos pueden ser muy grandes e impedir
discernir con claridad las causas de los resultados. Se defienden los
estudios más analíticos, bien controlados, que pueden usarse para
comparar versiones alternativas de un programa.
e) Metodológicamente Cronbach propone que la evaluación debe incluir:
1) estudios de proceso –hechos que tienen lugar en el aula–; 2) medidas
de rendimiento y actitudes –cambios observados en los alumnos– y 3)
estudios de seguimientos, esto es, el camino posterior seguido por los
estudiantes que han participado en el programa.
f) Desde esta óptica, las técnicas de evaluación no pueden limitarse a los
tests de rendimiento. Los cuestionarios, las entrevistas, la observación
sistemática y no sistemática, las pruebas de ensayo, según el autor,
ocupan un lugar importante en la evaluación, en contraste al casi
exclusivo uso que se hacía de los tests como técnicas de recogida de
información.
Si estas reflexiones de Cronbach fueron impactantes, no lo fueron menos las
del ensayo de Scriven (1967). Sus fecundas distinciones terminológicas
ampliaron enormemente el campo semántico de la evaluación, a la vez que
clarificaron el quehacer evaluativo. Destacamos a continuación las aportaciones
más significativas:
a) Se establece de forma tajante la diferencia entre la evaluación como
actividad metodológica, lo que el autor llama meta de la evaluación, y
las funciones de la evaluación en un contexto particular. Así, la
evaluación como actividad metodológica es esencialmente igual, sea lo
que fuera lo que estemos evaluando. El objetivo de la evaluación es
invariante, supone en definitiva el proceso por el cual estimamos el
valor de algo que se evalúa, mientras que las funciones de la evaluación
pueden ser enormemente variadas. Estas funciones se relacionan con el
uso que se hace de la información recogida.
b) Scriven señala dos funciones distintas que puede adoptar la evaluación:
la formativa y la sumativa. Propone el término de evaluación formativa
para calificar aquel proceso de evaluación al servicio de un programa
en desarrollo, con objeto de mejorarlo, y el término de evaluación
sumativa para aquel proceso orientado a comprobar la eficacia del
programa y tomar decisiones sobre su continuidad.
c) Otra importante contribución de Scriven es la crítica al énfasis que la
evaluación da a la consecución de objetivos previamente establecidos,
porque si los objetivos carecen de valor, no tiene ningún interés saber
hasta qué punto se han conseguido. Resalta la necesidad de que la
evaluación debe incluir tanto la evaluación de los propios objetivos
como el determinar el grado en que éstos han sido alcanzados (Scriven,
1973 y 1974).
d) Clarificadora es también la distinción que hace Scriven entre
evaluación intrínseca y evaluación extrínseca, como dos formas
diferentes de valorar un elemento de la enseñanza. En una evaluación
intrínseca se valora el elemento por sí mismo, mientras que en la
evaluación extrínseca se valora el elemento por los efectos que produce
en los alumnos. Esta distinción resulta muy importante a la hora de
considerar el criterio a utilizar, pues en la evaluación intrínseca el
criterio no se formula en términos de objetivos operativos, mientras que
sí se hace en la evaluación extrínseca .
e) Scriven adopta una posición contraria a Cronbach, defendiendo el
carácter comparativo que deben presentar los estudios de evaluación.
Admite con Cronbach los problemas técnicos que los estudios
comparativos entrañan y la dificultad de explicar las diferencias entre
programas, pero Scriven considera que la evaluación como opuesta a la
mera descripción implica emitir un juicio sobre la superioridad o
inferioridad de lo que se evalúa con respecto a sus competidores o
alternativas.
Estas dos aportaciones comentadas influyeron decisivamente en la comunidad
de evaluadores, incidiendo no sólo en estudios en la línea de la investigación
evaluativa, a la que se referían preferentemente, sino también en la evaluación
orientada al sujeto, en la línea de evaluación como «assessment» (Mateo, 1986).
Estamos ante la tercera generación de la evaluación que, según Guba y Lincoln
(1989), se caracteriza por introducir la valoración, el juicio, como un contenido
intrínseco en la evaluación. Ahora el evaluador no sólo analiza y describe la
realidad, además, la valora, la juzga con relación a distintos criterios.
Durante estos años sesenta aparecen muchas otras aportaciones que va
perfilando una nueva concepción evaluativa, que terminará de desarrollarse y,
sobre todo, de extenderse en las décadas posteriores. Se percibe que el núcleo
conceptual de la evaluación lo constituye la valoración del cambio ocurrido en el
alumno como efecto de una situación educativa sistemática, siendo unos objetivos
bien formulados el mejor criterio para valorar este cambio. Así mismo, se
comienza a prestar atención no sólo a los resultados pretendidos, sino también a
los efectos laterales o no pretendidos, e incluso a resultados o efectos a largo
plazo (Cronbach, 1963; Glaser, 1963; Scriven, 1967; Stake, 1967).
A pesar de las voces críticas con la operativización de objetivos (Eisner, 1967
y 1969; Atkin, 1968), no sólo por la estructura de valor que en ello subyace, sino
también por centrar la valoración del aprendizaje en los productos más fácilmente
mensurables, a veces los más bajos en las taxonomías del dominio cognoscitivo, y
de que se prestaba escasa atención a los objetivos del dominio afectivo, que
presentan mayor dificultad de tratamiento operativo, el modelo evaluativo de
Tyler se enriquecería mucho en estos años, con trabajos sobre los objetivos
educativos que continuarían y perfeccionarían el camino emprendido en 1956 por
Bloom y colaboradores (Mager, 1962 y 1973; Lindvall, 1964; Krathwohl y otros,
1964; Glaser, 1965; Popham, 1970; Bloom y otros, 1971; Gagné 1971). Entre
otras cosas aparecieron nuevas ideas sobre la evaluación de la interacción en el
aula y sobre sus efectos en los logros de los alumnos (Baker, 1969).
Stake (1967) propuso su modelo de evaluación, The countenance model, que
sigue la línea de Tyler, pero es más completo al considerar las discrepancias entre
lo observado y lo esperado en los «antecedentes» y «transacciones», y posibilitar
algunas bases para elaborar hipótesis acerca de las causas y los fallos en los
resultados finales. En sus sucesivas propuestas, Stake se irá distanciando de sus
posiciones iniciales.
Metfessell y Michael (1967) presentaron también un modelo de evaluación de
la efectividad de un programa educativo en el cual, aún siguiendo el modelo
básico de Tyler, proponían la utilización de una lista comprensiva de criterios
diversos que los evaluadores podrían tener en cuenta en el momento de la
valoración y, por consiguiente, no centrarse meramente en los conocimientos
intelectuales alcanzados por los alumnos.
Suchman (1967) profundiza en la convicción de que la evaluación debe
basarse en datos objetivos que sean analizados con metodología científica,
matizando que la investigación científica es preferentemente teórica y, en cambio,
la investigación evaluativa es siempre aplicada. Su principal propósito es
descubrir la efectividad, éxito o fracaso de un programa al compararlo con los
objetivos propuestos y, así, trazar las líneas de su posible redefinición. Esta
investigación evaluativa para Suchman debe tener en cuenta: a) la naturaleza del
destinatario del objetivo y la del propio objetivo, b) el tiempo necesario para que
se realice el cambio propuesto, c) el conocimiento de si los resultados esperados
son dispersos o concentrados y d) los métodos que han de emplearse para
alcanzar los objetivos. Suchman, además, defiende la utilización de evaluadores
externos para evitar todo tipo de tergiversación de los profesores muy implicados
en los procesos instruccionales.
El énfasis en los objetivos y su medida traerá también la necesidad de una
nueva orientación a la evaluación, la denominada evaluación de referencia
criterial. La distinción introducida por Glaser (1963) entre mediciones referidas a
normas y criterios tendrá eco al final de la década de los sesenta, precisamente
como resultado de las nuevas exigencias que a la evaluación educativa se le
planteaban. Así, por ejemplo, cuando Hambleton (1985) estudia las diferencias
entre tests referidos al criterio y tests referidos a la norma, señala para los
primeros, además de los conocidos objetivos de describir la ejecución del sujeto y
tomar decisiones sobre si domina o no domina un contenido, otro objetivo como
es el de valorar la eficacia de un programa.
Desde finales de los sesenta los especialistas se pronunciarán decisivamente a
favor de la evaluación criterial, en cuanto que es el tipo de evaluación que
suministra una información real y descriptiva del estatus del sujeto o sujetos
respecto a los objetivos de enseñanza previstos, así como la valoración de ese
estatus por comparación con un estándar o criterio de realizaciones deseables,
siendo irrelevantes, al efecto de contraste, los resultados obtenidos por otros
sujetos o grupo de sujetos (Popham, 1970 y 1983; Mager, 1973; Carreño, 1977;
Gronlund, 1985).
En las prácticas evaluativas de esta década de los sesenta se observan dos
niveles de actuación. Un nivel podemos calificarlo como la evaluación orientada
hacia los individuos, fundamentalmente alumnos y profesores. El otro nivel, es el
de la evaluación orientada a la toma de decisiones sobre el «instrumento» o
«tratamiento» o «programa» educativo. Este último nivel, impulsado también por
la evaluación de programas en el ámbito social, será la base para la consolidación
en el terreno educativo de la evaluación de programas y de la investigación
evaluativa.
5. Desde los años setenta: La consolidación de la investigación evaluativa

Si con algo se podría caracterizar las aportaciones teóricas que nos ofrecen los
especialistas durante los años setenta es con la proliferación de toda clase de
modelos evaluativos que inundan el mercado bibliográfico, modelos de
evaluación que expresan la propia óptica del autor que los propone sobre qué es y
cómo debe conducirse un proceso evaluativo. Se trata, por tanto, de una época
caracterizada por la pluralidad conceptual y metodológica. Guba y Lincoln (1982)
nos hablan de más de cuarenta modelos propuestos en estos años, y Mateo (1986)
se refiere a la eclosión de modelos. Estos enriquecerán considerablemente el
vocabulario evaluativo, sin embargo, compartimos la idea de Popham (1980) de
que algunos son demasiado complicados y otros utilizan una jerga bastante
confusa.
Algunos autores como Guba y Lincoln (1982), Pérez (1983) y en alguna
medida House (1989), tienden a clasificar estos modelos en dos grandes grupos,
cuantitativos y cualitativos, pero nosotros pensamos con Nevo (1983) y Cabrera
(1986) que la situación es mucho más rica en matices.
Es cierto que esas dos tendencias se observan hoy en las propuestas
evaluativas, y que algunos modelos pueden ser representativos de ellas, pero los
diferentes modelos, considerados particularmente, se diferencian más por destacar
o enfatizar alguno o algunos de los componentes del proceso evaluativo y por la
particular interpretación que a este proceso le dan. Es desde esta perspectiva, a
nuestro entender, como los diferentes modelos deben ser vistos, y valorar así sus
respectivas aportaciones en los terrenos conceptual y metodológico (Worthen y
Sanders, 1973; Stufflebeam y Shinkfield, 1987; Arnal y otros, 1992; Scriven,
1994).
También son varios los autores (Lewy, 1976; Popham, 1980; Cronbach, 1982;
Anderson y Ball, 1983; De la Orden, 1985) los que consideran los modelos no
como excluyentes, sino más bien como complementarios y que el estudio de los
mismos (al menos aquellos que han resultado ser más prácticos) llevará al
evaluador a adoptar una visión más amplia y comprensiva de su trabajo.
Nosotros, en algún momento nos hemos atrevido a hablar de enfoques modélicos,
más que de modelos, puesto que es cada evaluador el que termina construyendo
su propio modelo en cada investigación evaluativa, en función del tipo de trabajo
y las circunstancias (Escudero, 1993).
En este movimiento de propuestas de modelos de evaluación cabe distinguir
dos épocas con marcadas diferencias conceptuales y metodológicas. En una
primera época, las propuestas seguían la línea expuesta por Tyler en su
planteamiento, que ha venido a llamarse de “Consecución de Metas”. Además de
los ya citados de Stake y Metfessell y Michael, que corresponden a los últimos
años sesenta, en esta época destacan la propuesta de Hammond (1983) y el
Modelo de Discrepancia de Provus (1971). Para estos autores los objetivos
propuestos siguen siendo el criterio fundamental de valoración, pero enfatizan la
necesidad de aportar datos sobre la congruencia o discrepancia entre las pautas de
instrucción diseñadas y la ejecución de las mismas en la realidad del aula.
Otros modelos consideran el proceso de evaluación al servicio de las
instancias que deben tomar decisiones. Ejemplos notables de ellos son:
probablemente el más famoso y utilizado de todos, el C.I.P.P. (contexto, input,
proceso y producto), propuesto por Stufflebeam y colaboradores (1971) y el
C.E.S. (toma sus siglas del Centro de la Universidad de California para el Estudio
de la Evaluación) dirigido por Alkin (1969). La aportación conceptual y
metodológica de estos modelos es valorada positivamente entre la comunidad de
evaluadores (Popham, 1980; Guba y Lincoln, 1982; House, 1989). Estos autores
van más allá de la evaluación centrada en resultados finales, puesto que en sus
propuestas suponen diferentes tipos de evaluación, según las necesidades de las
decisiones a las que sirven.
Una segunda época en la proliferación de modelos es la representada por los
modelos alternativos, que con diferentes concepciones de la evaluación y de la
metodología a seguir comienzan a aparecer en la segunda mitad de esta década de
los setenta. Entre ellos destacan la Evaluación Responsable de Stake (1975 y
1976), a la que se adhieren Guba y Lincoln (1982), la Evaluación Democrática de
MacDonald (1976), la Evaluación Iluminativa de Parlett y Hamilton (1977) y la
Evaluación como crítica artística de Eisner (1985).
En líneas generales, este segundo grupo de modelos evaluativos enfatiza el
papel de la audiencia de la evaluación y de la relación del evaluador con ella. La
audiencia prioritaria de la evaluación en estos modelos no es quien debe tomar las
decisiones, como en los modelos orientados a la toma de decisiones, ni el
responsable de elaborar los currículos u objetivos, como en los modelos de
consecución de metas. La audiencia prioritaria son los propios participantes del
programa. La relación entre el evaluador y la audiencia en palabras de Guba y
Lincoln (1982) debe ser «transaccional y fenomenológica». Se trata de modelos
que propugnan una evaluación de tipo etnográfica, de aquí que la metodología
que consideran más adecuada es la propia de la antropología social (Parlett y
Hamilton, 1977; Guba y Lincoln, 1982; Pérez 1983).
Este resumen de modelos de la época de eclosión es suficiente para
aproximarnos al amplio abanico conceptual teórico y metodológico que hoy se
relaciona con la evaluación. Ello explica que cuando Nevo (1983 y 1989)
pretende realizar una conceptualización de la evaluación, a partir de la revisión de
la literatura especializada, atendiendo a los tópicos ¿qué es la evaluación? ¿qué
funciones tiene? ¿cuál es el objeto de evaluación?... no encuentra una única
respuesta a estas cuestiones. Es fácilmente comprensible que las exigencias que
plantea la evaluación de programas de una parte, y la evaluación para la toma de
decisiones sobre los individuos de otra, conducen a una gran variedad de
esquemas evaluativos reales utilizados por profesores, directores, inspectores y
administradores públicos. Pero también es cierto que bajo esta diversidad
subyacen diferentes concepciones teóricas y metodológicas sobre la evaluación.
Diferentes concepciones que han dado lugar a una apertura y pluralidad
conceptual en el ámbito de la evaluación en varios sentidos (Cabrera, 1986). A
continuación destacamos los puntos mas sobresalientes de esta pluralidad
conceptual.
a) Diferentes conceptos de evaluación. Por una parte existe la clásica
definición dada por Tyler: la evaluación como el proceso de
determinar el grado de congruencia entre las realizaciones y los
objetivos previamente establecidos, a la que corresponden los modelos
orientados hacia la consecución de metas. Contrasta esta definición con
aquella más amplia que se propugna desde los modelos orientados a la
toma de decisiones: la evaluación como el proceso de determinar,
obtener y proporcionar información relevante para juzgar decisiones
alternativas, defendida por Alkin (1969), Stufflebeam y otros (1971),
MacDonald (1976) y Cronbach (1982).
Además, el concepto de evaluación de Scriven (1967), como el proceso
de estimar el valor o el mérito de algo, es retomado por Cronbach
(1982), Guba y Lincoln (1982), y House (1989), con objeto de señalar
las diferencias que comportarían los juicios valorativos en caso de
estimar el mérito (se vincularía a características intrínsecas de lo que se
evalúa) o el valor (se vincularía al uso y aplicación que tendría para un
contexto determinado).
b) Diferentes criterios. De las definiciones apuntadas anteriormente se
desprende que el criterio a utilizar para la valoración de la información
también cambia. Desde la óptica de la consecución de metas, una buena
y operativa definición de los objetivos constituye el criterio
fundamental. Desde la perspectiva de las decisiones y situados dentro
de un contexto político, Stufflebeam y colaboradores, Alkin y
MacDonald llegan a sugerir incluso la no valoración de la información
por parte del evaluador, siendo el que toma las decisiones el
responsable de su valoración.
Las definiciones de evaluación que acentúan la determinación del
«mérito» como objetivo de la evaluación, utilizan criterios estándares
sobre los que los expertos o profesionales están de acuerdo. Se trata de
modelos relacionados con la acreditación y el enjuiciamiento
profesional (Popham, 1980).
Los autores (Stake, 1975; Parlett y Hamilton, 1977; Guba y Lincoln,
1982; House, 1983) que acentúan el proceso de evaluación al servicio
de determinar el «valor» más que el «mérito» de la entidad u objeto
evaluado, abogan por que el criterio de valoración fundamental sean las
necesidades contextuales en las que ésta se inserta. Así, Guba y Lincoln
(1982) refieren los términos de la comparación valorativa; de un lado,
las características del objeto evaluado y, de otro, las necesidades,
expectativas y valores del grupo a los que les afecta o con los que se
relaciona el objeto evaluado.
c) Pluralidad de procesos evaluativos dependiendo de la percepción
teórica que sobre la evaluación se mantenga. Los modelos de
evaluación citados y otros más que pueden encontrarse en la
bibliografía, representan diferentes propuestas para conducir una
evaluación.
d) Pluralidad de objetos de evaluación. Como dice Nevo (1983 y 1989),
existen dos conclusiones importantes que se obtienen de la revisión de
la bibliografía sobre la evaluación. Por un lado, cualquier cosa puede
ser objeto de evaluación y ésta no debería limitarse a estudiantes y
profesores y, por otro, una clara identificación del objeto de evaluación
es una importante parte en cualquier diseño de evaluación.
e) Apertura, reconocida en general por todos los autores, de la
información necesaria en un proceso evaluativo para dar cabida no sólo
a los resultados pretendidos, sino a los efectos posibles de un programa
educativo, sea pretendido o no. Incluso Scriven (1973 y 1974) propone
una evaluación en la que no se tenga en cuenta los objetivos
pretendidos, sino valorar todos los efectos posibles. Apertura también
respecto a la recogida de información no sólo del producto final, sino
también sobre el proceso educativo. Y apertura en la consideración de
diferentes resultados de corto y largo alcance. Por último, apertura
también en considerar no sólo resultados de tipo cognitivo, sino
también afectivos (Anderson y Ball, 1983).
f) Pluralidad también reconocida de las funciones de la evaluación en el
ámbito educativo, recogiéndose la propuesta de Scriven entre
evaluación formativa y sumativa, y añadiéndose otras de tipo socio-
político y administrativas (Nevo, 1983).
g) Diferencias en el papel jugado por el evaluador, lo que ha venido a
llamarse evaluación interna vs. evaluación externa. No obstante, una
relación directa entre el evaluador y las diferentes audiencias de la
evaluación es reconocida por la mayoría de los autores (Nevo, 1983;
Weiss, 1983; Rutman, 1984).
h) Pluralidad de audiencia de la evaluación y, por consiguiente,
pluralidad en los informes de evaluación. Desde informes narrativos,
informales, hasta informes muy estructurados (Anderson y Ball, 1983).
i) Pluralidad metodológica. Las cuestiones metodológicas surgen desde
la dimensión de la evaluación como investigación evaluativa, que viene
definida en gran medida por la diversidad metodológica.
El anterior resumen recoge las aportaciones a la evaluación en los años
setenta y ochenta, la época que se ha denominado época de la profesionalización
(Stufflebeam y Skinkfield, 1987; Madaus y otros, 1991; Hernández, 1993; Mateo
y otros, 1993), en la que además de los innumerables modelos de los setenta, se
profundizó en los planteamientos teóricos y prácticos y se consolidó la evaluación
como investigación evaluativa en los términos antes definida. En este contexto,
lógicamente, aparecen muchas nuevas revistas especializadas como Educational
Evaluation and Policy Analysis, Studies in Evaluation, Evaluation Review, New
Directions for Program Evaluation, Evaluation and Program Planning,
Evaluation News,..., se fundan asociaciones científicas relacionadas con el
desarrollo de la evaluación y las universidades empiezan a ofrecer cursos y
programas de investigación evaluativa, no sólo en postgrados y programas de
doctorado, sino también en planes de estudio para titulaciones de primer y
segundo ciclos.
6. La cuarta generación según Guba y Lincoln

A finales de los ochenta, tras todo este desarrollo antes descrito, Guba y
Lincoln (1989) ofrecen una alternativa evaluadora, que denominan cuarta
generación, pretendiendo superar lo que según estos autores son deficiencias de
las tres generaciones anteriores, tales como una visión gestora de la evaluación,
una escasa atención al pluralismo de valores y un excesivo apego al paradigma
positivista. La alternativa de Guba y Lincoln la denominan respondente y
constructivista, integrando de alguna manera el enfoque respondente propuesto en
primer lugar por Stake (1975), y la epistemología postmoderna del
constructivismo (Russell y Willinsky, 1997). Las demandas, las preocupaciones y
los asuntos de los implicados o responsables (stakeholders) sirven como foco
organizativo de la evaluación (como base para determinar qué información se
necesita), que se lleva a cabo dentro de los planteamientos metodológicos del
paradigma constructivista.
La utilización de las demandas, preocupaciones y asuntos de los implicados es
necesaria, según Guba y Lincoln, porque:
a) Son grupos de riesgo ante la evaluación y sus problemas deben ser
convenientemente contemplados, de manera que se sientan protegidos
ante tal riesgo.
b) Los resultados pueden ser utilizados en su contra en diferentes
sentidos, sobre todo si están al margen del proceso.
c) Son potenciales usuarios de la información resultante de la evaluación.
d) Pueden ampliar y mejorar el rango de la evaluación.
e) Se produce una interacción positiva entre los distintos implicados.
El cambio paradigmático lo justifican estos autores porque:
a) La metodología convencional no contempla la necesidad de identificar
las demandas, preocupaciones y asuntos de los implicados.
b) Para llevar a cabo lo anterior se necesita una postura de descubrimiento
más que de verificación, típica del positivismo.
c) No se tienen en cuenta suficientemente los factores contextuales.
d) No se proporcionan medios para valoraciones caso por caso.
e) La supuesta neutralidad de la metodología convencional es de dudosa
utilidad cuando se buscan juicios de valor acerca de un objeto social.
Partiendo de estas premisas, el evaluador es responsable de determinadas
tareas, que realizará secuencialmente o en paralelo, construyendo un proceso
ordenado y sistemático de trabajo. Las responsabilidades básicas del evaluador de
la cuarta generación son las siguientes:
1) Identificar todos los implicados con riesgo en la evaluación.
2) Resaltar para cada grupo de implicados sus construcciones acerca de lo
evaluado y sus demandas y preocupaciones al respecto.
3) Proporcionar un contexto y una metodología hermenéutica para poder
tener en cuenta, comprender y criticar las diferentes construcciones,
demandas y preocupaciones.
4) Generar el máximo acuerdo posible acerca de dichas construcciones,
demandas y preocupaciones.
5) Preparar una agenda para la negociación acerca de temas no
consensuados.
6) Recoger y proporcionar la información necesaria para la negociación.
7) Formar y hacer de mediador para un «forum» de implicados para la
negociación.
8) Desarrollar y elaborar informes para cada grupo de implicados sobre
los distintos acuerdos y resoluciones acerca de los intereses propios y
de los de otros grupos (Stake, 1986; Zeller, 1987).
9) Reciclar la evaluación siempre que queden asuntos pendientes de
resolución.
La propuesta de Guba y Lincoln (1989) se extiende bastante en la explicación
de la naturaleza y características del paradigma constructivista en contraposición
con las del positivista.
Cuando se habla de los pasos o fases de la evaluación en esta cuarta
generación, sus proponentes citan doce pasos o fases, con diferentes subfases en
cada una de estas. Estos pasos son los siguientes:
1) Establecimiento de un contrato con un patrocinador o cliente.
• Identificación del cliente o patrocinador de la evaluación.
• Identificación del objeto de la evaluación.
• Propósito de la evaluación (Guba y Lincoln, 1982).
• Acuerdo con el cliente por el tipo de evaluación.
• Identificación de audiencias.
• Breve descripción de la metodología a usar.
• Garantía de acceso a registros y documentos.
• Acuerdo por garantizar la confidencialidad y anonimato hasta
donde sea posible.
• Descripción del tipo de informe a elaborar.
• Listado de especificaciones técnicas.
2) Organización para reciclar la investigación.
• Selección y entrenamiento del equipo evaluador.
• Consecución de facilidades y acceso a la información (Lincoln y
Guba, 1985).
3) Identificación de las audiencias (Guba y Lincoln, 1982).
• Agentes.
• Beneficiarios.
• Victimas.
4) Desarrollo de construcciones conjuntas dentro de cada grupo o
audiencia (Glaser y Strauss, 1967; Glaser, 1978; Lincoln y Guba, 1985).
5) Contraste y desarrollo de las construcciones conjuntas de las
audiencias.
• Documentos y registros.
• Observación.
• Literatura profesional.
• Círculos de otras audiencias.
• Construcción ética del evaluador.
6) Clasificación de las demandas, preocupaciones y asuntos resueltos.
7) Establecimiento de prioridades en los temas no resueltos.
8) Recogida de información.
9) Preparación de la agenda para la negociación.
10)Desarrollo de la negociación.
11)Informes (Zeller, 1987; Licoln y Guba, 1988).
12)Reciclado/revisión.
Para juzgar la calidad de la evaluación, se nos ofrecen tres enfoques que se
denominan paralelo, el ligado al proceso hermenéutico y el de autenticidad.
Los criterios paralelos, de confianza, se denominan así porque intentan ser
paralelos a los criterios de rigor utilizados muchos años dentro del paradigma
convencional. Estos criterios han sido validez interna y externa, fiabilidad y
objetividad. Sin embargo, los criterios deban ser acordes con el paradigma
fundamentador (Morgan, 1983). En el caso de la cuarta generación los criterios
que se ofrecen son los de credibilidad, transferencia, dependencia y
confirmación (Lincoln y Guba, 1986).
El criterio de credibilidad es paralelo al de validez interna, de forma que la
idea de isomorfismo entre los hallazgos y la realidad se reemplaza por el
isomorfismo entre las realidades construidas de las audiencias y las
reconstrucciones del evaluador atribuidas a ellas. Para conseguir esto existen
varias técnicas, entre las que destacan las siguientes: a) el compromiso
prolongado, b) la observación persistente, c) el contraste con colegas, d) el
análisis de casos negativos (Kidder, 1981), e) la subjetividad progresiva y f) el
control de los miembros. La transferencia puede verse como paralela a la validez
externa, la dependencia es paralela al criterio de fiabilidad y la confirmación
puede verse como paralela a la objetividad.
Otra manera de juzgar la calidad de la evaluación es el análisis dentro del
propio proceso, algo que encaja con el paradigma hermenéutico, a través de un
proceso dialéctico.
Pero estos dos tipos de criterios, aunque útiles, no son del todo satisfactorios
para Guba y Lincoln, que defienden con más ahínco los criterios que denominan
de autenticidad, también de base constructivista. Estos criterios incluyen los
siguientes: a) imparcialidad, justicia, b) autenticidad ontológica, c) autenticidad
educativa, d) autenticidad catalítica y e) autenticidad táctica (Lincoln y Guba,
1986).
Este análisis de la cuarta generación de podemos terminarlo con los rasgos con
los que definen Guba y Lincoln a la evaluación:
a) La evaluación es un proceso sociopolítico.
b) La evaluación es un proceso conjunto de colaboración.
c) la evaluación es un proceso de enseñanza/aprendizaje.
d) La evaluación es un proceso continuo, recursivo y altamente
divergente.
e) La evaluación es un proceso emergente.
f) La evaluación es un proceso con resultados impredecibles.
g) La evaluación es un proceso que crea realidad.
En esta evaluación, se retienen las características del evaluador fruto de las
tres primeras generaciones, esto es, la de técnico, la de analista y la de juez, pero
estas deben ampliarse con destrezas para recoger e interpretar datos cualitativos
(Patton, 1980), con la de historiador e iluminador, con la de mediador de juicios,
así como un papel más activo como evaluador en un contexto socio-político
concreto.
Russell y Willinsky (1997) defienden las potencialidades del planteamiento de
la cuarta generación para desarrollar formulaciones alternativas de práctica
evaluadora entre los implicados, incrementando la probabilidad de que la
evaluación sirva para mejorar la enseñanza escolar. Esto requiere por parte del
profesorado el reconocimiento de otras posiciones, además de la suya, la
implicación de todos desde el principio del proceso y, por otra parte, el desarrollo
de aproximaciones más pragmáticas de la conceptualización de Guba y Lincoln,
adaptadas a las distintas realidades escolares.
7. El nuevo impulso alrededor de Stufflebeam

Para terminar este recorrido analítico-histórico desde los primeros intentos de
medición educativa hasta la actual investigación evaluativa en educación,
queremos recoger las recomendaciones que más recientemente nos viene
ofreciendo una de las figuras señeras de este campo en la segunda mitad del siglo
XX. Nos estamos refiriendo a Daniel L. Stufflebeam, proponente del modelo
CIPP (el más utilizado) a finales de los sesenta, desde 1975 a 1988 presidente del
«Joint Committee on Standars for Educational Evaluation» y actual director del
«Evaluation Center» de la Western Michigan University (sede del Joint
Committee) y del CREATE (Center for Research on Educational Accountability
and Teacher Evaluation), centro auspiciado y financiado por el Departamento de
Educación del gobierno americano.
Recogiendo estas recomendaciones (Stufflebeam, 1994, 1998, 1999, 2000 y
2001), en las que se han ido integrando ideas de diversos evaluadores también
notables, no sólo ofrecemos una de las últimas aportaciones a la actual
concepción de la investigación evaluativa en educación, sino que completamos en
buena medida la visión del panorama actual, rico y plural, tras analizar la cuarta
generación de Guba y Lincoln.
Se parte de los cuatro principios del Joint Committee (1981 y 1988), esto es,
de la idea de que cualquier buen trabajo de investigación evaluativa debe ser: a)
útil, esto es, proporcionar información a tiempo e influir, b) factible, esto es, debe
suponer un esfuerzo razonable y debe ser políticamente viable, c) apropiada,
adecuada, legítima, esto es, ética y justa con los implicados, y d) segura y
precisa a la hora de ofrecer información y juicios sobre el objeto de la evaluación.
Además, la evaluación se ve como una «transdisciplina», pues es aplicable a
muchas disciplinas diferentes y a muchos objetos diversos (Scriven, 1994).
Stufflebeam invoca a la responsabilidad del evaluador, que debe actuar de
acuerdo a principios aceptados por la sociedad y a criterios de profesionalidad,
emitir juicios sobre la calidad y el valor educativo del objeto evaluado y debe
asistir a los implicados en la interpretación y utilización de su información y sus
juicios. Sin embargo, es también su deber, y su derecho, estar al margen de la
lucha y la responsabilidad política por la toma de decisiones y por las decisiones
tomadas.
Para evaluar la educación en una sociedad moderna, Stufflebeam (1994) nos
dice que se deben tomar algunos criterios básicos de referencia como los
siguientes:
• Las necesidades educativas. Es necesario preguntarse si la educación que
se proporciona cubre las necesidades de los estudiantes y de sus familias
en todos los terrenos a la vista de los derechos básicos, en este caso,
dentro de una sociedad democrática (Nowakowski y otros, 1985).
• La equidad. Hay que preguntarse si el sistema es justo y equitativo a la
hora de proporcionar servicios educativos, el acceso a los mismos, la
consecución de metas, el desarrollo de aspiraciones y la cobertura para
todos los sectores de la comunidad (Kellagan, 1982).
• La factibilidad. Hay que cuestionar la eficiencia en la utilización y
distribución de recursos, la adecuación y viabilidad de las normas
legales, el compromiso y participación de los implicados y todo lo que
hace que el esfuerzo educativo produzca el máximo de frutos posibles.
• La excelencia como objetivo permanente de búsqueda. La mejora de la
calidad, a partir del análisis de las prácticas pasadas y presentes es uno de
los fundamentos de la investigación evaluativa.
Tomando el referente de estos criterios y sus derivaciones, Stufflebeam
sumariza una serie de recomendaciones para llevar a cabo buenas investigaciones
evaluativas y mejorar el sistema educativo. Estas recomendaciones son las
siguientes:
1) Los planes de evaluación deben satisfacer los cuatro requerimientos de
utilidad, factibilidad, legitimidad y precisión (Joint Committee, 1981 y
1988).
2) Las entidades educativas deben examinarse por su integración y servicio
a los principios de la sociedad democrática, equidad, bienestar, etc.
3) Las entidades educativas deben ser valoradas tanto por su mérito (valor
intrínseco, calidad respecto a criterios generales) como por su valor
(valor extrínseco, calidad y servicio para un contexto particular) (Guba y
Lincoln, 1982; Scriven, 1991), como por su significación en la realidad
del contexto en el que se ubica. Scriven (1998) nos señala que usando
otras denominaciones habituales, mérito tiene bastante equivalencia con
el término calidad, valor con el de relación coste-eficacia y significación
con el de importancia. En todo caso, los tres conceptos son dependientes
del contexto, sobre todo significación, de manera que entender la
diferencia entre dependencia del contexto y arbitrariedad es parte de la
comprensión de la lógica de la evaluación.
4) La evaluación de profesores, instituciones educativas, programas, etc,
debe relacionarse siempre con el conjunto de sus deberes,
responsabilidades y obligaciones profesionales o institucionales, etc.
Quizás uno de los retos que deben abordar los sistemas educativos es la
definición más clara y precisa de estos deberes y responsabilidades. Sin
ello, la evaluación es problemática, incluso en el terreno formativo
(Scriven, 1991a).
5) Los estudios evaluativos deben ser capaces de valorar hasta qué medida
los profesores y las instituciones educativas son responsables y rinden
cuentas del cumplimiento de sus deberes y obligaciones profesionales
(Scriven, 1994).
6) Los estudios evaluativos deben proporcionar direcciones para la mejora,
porque no basta con emitir un juicio sobre el mérito o el valor de algo.
7) Recogiendo los puntos anteriores, todo estudio evaluativo debe tener un
componente formativo y otro sumativo.
8) Se debe promover la autoevaluación profesional, proporcionando a los
educadores las destrezas para ello y favoreciendo actitudes positivas
hacia ella (Madaus y otros, 1991)
9) La evaluación del contexto (necesidades, oportunidades, problemas en un
área,...) debe emplearse de manera prospectiva, para localizar bien las
metas y objetivos y definir prioridades. Asimismo, la evaluación del
contexto debe utilizarse retrospectivamente, para juzgar bien el valor de
los servicios y resultados educativos, en relación con las necesidades de
los estudiantes (Madaus y otros, 1991; Scriven, 1991)
10) La evaluación de las entradas (inputs) debe emplearse de manera
prospectiva, para asegurar el uso de un rango adecuado de enfoques
según las necesidades y los planes.
11) La evaluación del proceso debe usarse de manera prospectiva para
mejorar el plan de trabajo, pero también de manera retrospectiva para
juzgar hasta qué punto la calidad del proceso determina el por qué los
resultados son de un nivel u otro (Stufflebean y Shinkfield, 1987).
12) La evaluación del producto es el medio para identificar los resultados
buscados y no buscados en los participantes o afectados por el objeto
evaluado. Se necesita una valoración prospectiva de los resultados para
orientar el proceso y detectar zonas de necesidades. Se necesita una
evaluación retrospectiva del producto para poder juzgar en conjunto el
mérito y el valor del objeto evaluado (Scriven, 1991; Webster y
Edwards, 1993; Webster y otros, 1994).
13) Los estudios evaluativos se deben apoyar en la comunicación y en la
inclusión sustantiva y funcional de los implicados (stakeholders) con las
cuestiones claves, criterios, hallazgos e implicaciones de la evaluación,
así como en la promoción de la aceptación y el uso de sus resultados
(Chelimsky, 1998). Más aún, los estudios evaluativos deben
conceptualizarse y utilizarse sistemáticamente como parte del proceso de
mejora educativa a largo plazo (Alkin y otros, 1979; Joint Committee,
1988; Stronge y Helm, 1991; Keefe, 1994) y de fundamento para la
acción contra las discriminaciones sociales (Mertens, 1999). La
evaluación para el desarrollo (empowerment evaluation), que defiende
Fetterman (1994), es un procedimiento, de base democrática, de
participación de los implicados en el programa evaluado, para promover
la autonomía de los mismos en la resolución de sus problemas. Weiss
(1998) nos alerta de que la evaluación participativa incrementa la
probabilidad de que se utilicen los resultados de la evaluación, pero
también la de que sea conservadora en su concepción, pues es difícil
pensar que los responsables de una organización pongan en cuestión el
fundamento y el sistema de poder de la misma. Generalmente su interés
es el cambio de cosas pequeñas.
14) Los estudios evaluativos deben emplear múltiples perspectivas,
múltiples medidas de resultados, y métodos tanto cuantitativos como
cualitativos para recoger y analizar la información. La pluralidad y
complejidad del fenómeno educativo hace necesario emplear enfoques
múltiples y multidimensionales en los estudios evaluativos (Scriven,
1991)
15) Los estudios evaluativos deben ser evaluados, incluyendo
metaevaluaciones formativas para mejorar su calidad y su uso y
metaevaluaciones sumativas para ayudar a los usuarios en la
interpretación de sus hallazgos y proporcionar sugerencias para mejorar
futuras evaluaciones (Joint Committee, 1981 y 1988; Madaus y otros,
1991; Scriven, 1991; Stufflebeam, 2001).
Estas quince recomendaciones proporcionan elementos esenciales para un
enfoque de los estudios evaluativos que Stufflebeam denomina objetivista y que
se basa en la teoría ética de que la bondad moral es objetiva e independiente de
los sentimientos personales o meramente humanos.
Sin entrar en el debate sobre estas valoraciones finales de Stufflebeam, ni en
análisis comparativos con otras propuestas, por ejemplo con las de Guba y
Lincoln (1989), nos resulta evidente que las concepciones de la investigación
evaluativa son diversas, dependiendo del origen epistemológico desde el que se
parte, pero apareciendo claros y contundentes algunos elementos comunes a todas
las perspectivas como la contextualización, el servicio a la sociedad, la
diversidad metodológica, la atención, respeto y participación de los implicados,
etc., así como una mayor profesionalización de los evaluadores y una mayor
institucionalización de los estudios (Worthen y Sanders, 1991).
El propio Stufflebeam (1998) reconoce el conflicto de los planteamientos del
Joint Committee on Standards for Educational Evaluation con las posiciones de
la corriente evaluadora denominada postmodernista, representada, además de por
Guba y Lincoln, por otros reconocidos evaluadores como Mabry, Stake y Walker,
pero no acepta que existan razones para actitudes de escepticismo y frustración
con las prácticas evaluadoras actuales, porque existen muchos ámbitos de
aproximación y el desarrollo de estándares de evaluación es perfectamente
compatible con la atención a los diversos implicados, valores, contextos sociales y
métodos. Stufflebeam defiende una mayor colaboración en la mejora de las
evaluaciones, estableciendo los estándares de manera participativa, pues cree que
es posible la aproximación de planteamientos, con contribuciones importantes
desde todos los puntos de vista.
Weiss (1998) también toma posiciones parecidas cuando nos dice que las ideas
constructivistas deben hacernos pensar más cuidadosamente al usar los resultados
de las evaluaciones, sintetizarlas y establecer generalizaciones, pero duda que
todo haya que interpretarlo en términos exclusivamente individuales, pues existen
muchos elementos comunes entre las personas, los programas y las instituciones.
8. Para concluir: síntesis de enfoques modélicos y metodológicos de la

evaluación y la última perspectiva de Scriven
Tras este análisis del desarrollo de la evaluación a lo largo del Siglo XX,
parece oportuno, a modo de síntesis y de conclusión, recoger y resaltar los que
son considerados los principales modelos, planteamientos metodológicos,
diseños, perspectivas y visiones de la evaluación en la actualidad. Su análisis, de
manera compacta, es un complemento necesario para una visión como la histórica
que, por su linealidad, tiene el riesgo de ofrecer una imagen disciplinar
artificiosamente fraccionada.
Hemos visto que en la década de los setenta y en sus alrededores se produce
una especie de eclosión de propuestas evaluativas, que tradicionalmente han
venido siendo denominadas como modelos (Castillo y Gento, 1995) y en algunos
casos como diseños (Arnal y otros, 1992) de investigación evaluativa. Sabemos
que existieron varias decenas de estas propuestas, pero muy concentradas en el
tiempo, en la década citada. De hecho, el asunto de los propuestos modelos para
la evaluación parece un tema prácticamente cerrado desde hace cuatro lustros. Ya
no surgen nuevos modelos o propuestas, salvo alguna excepción como vemos más
adelante.
A pesar de lo dicho, se sigue hablando de modelos, métodos y diseños en la
literatura especializada, sobre todo buscando su clasificación de acuerdo con
diversos criterios, origen paradigmático, propósito, metodología, etc. También en
las clasificaciones, no sólo en los modelos, existe diversidad, lo que prueba que,
además de dinamismo académico en el terreno de la investigación evaluativa,
todavía existe cierta debilidad teórica al respecto.
Nosotros ya hemos señalado con anterioridad (Escudero, 1993), que
coincidimos con Nevo (1983 y 1989) en la apreciación de que muchos de los
acercamientos a la conceptualización de la evaluación (por ejemplo, el modelo
respondiente, el libre de metas, el de discrepancias, etc.) se les ha denominado
indebidamente como modelos a pesar de que ninguno de ellos tenga el grado de
complejidad y de globalidad que debería acarrear el citado concepto. Lo que un
texto clásico en evaluación (Worthen y Sanders, 1973) denomina como «modelos
contemporáneos de evaluación» (a los conocidos planteamientos de Tyler,
Scriven, Stake, Provus, Stufflebeam, etc), el propio Stake (1981) dice que sería
mejor denominarlo como «persuasiones» mientras que House (1983) se refiere a
«metáforas».
Norris (1993) apunta que el concepto de modelo se utiliza con cierta ligereza al
referirse a concepción, enfoque o incluso método de evaluación. De Miguel
(1989), por su parte, piensa que muchos de los llamados modelos solamente son
descripciones de procesos o aproximaciones a programas de evaluación. Darling-
Hammond y otros (1989) utilizan el término «modelo» por costumbre, pero
indican que no lo hacen en el sentido preciso que tiene el término en las ciencias
sociales, esto es, apoyándose en una estructura de supuestos interrelacionales
fundamentada teóricamente. Finalmente diremos que el propio autor del modelo
CIPP, solamente utiliza esta denominación de manera sistemática para referirse a
su propio modelo (Stufflebeam y Shinkfield, 1987), utilizando los términos de
enfoque, método, etc., al referirse a los otros. Para nosotros, quizás sea el término
enfoque evaluativo el más apropiado, aunque aceptemos seguir hablando de
modelos y diseños por simple tradición académica.
Nuestra idea es que a la hora de plantearnos una investigación evaluativa, no
contamos todavía con unos pocos modelos bien fundamentados, definidos,
estructurados y completos, entre los que elegir uno de ellos, pero sí tenemos
distintos enfoques modélicos y un amplio soporte teórico y empírico, que
permiten al evaluador ir respondiendo de manera bastante adecuada a las distintas
cuestiones que le va planteando el proceso de investigación, ayudándole a
configurar un plan global, un organigrama coherente, un «modelo»
científicamente robusto para llevar a cabo su evaluación (Escudero, 1993).
¿Cuáles son las cuestiones que hay que responder en este proceso de construcción
modélica? Apoyándonos en las aportaciones de diferentes autores (Worthen y
Sanders, 1973; Nevo, 1989; Kogan, 1989; Smith y Haver, 1990), deben
responderse y delimitar su respuesta al construir un modelo de investigación
evaluativa, los aspectos siguientes:
1) Objeto de la investigación evaluativa.
2) Propósito, objetivos.
3) Audiencias/implicados/clientela.
4) Énfasis/aspectos prioritarios o preferentes.
5) Criterios de mérito o valor.
6) Información a recoger.
7) Métodos de recogida de información.
8) Métodos de análisis.
9) Agentes del proceso.
10) Secuenciación del proceso.
11) Informes/utilización de resultados.
12) Límites de la evaluación.
13) Evaluación de la propia investigación evaluativa /
metaevaluación.
Para definir estos elementos hay que buscar, lógicamente, el apoyo de los
diferentes enfoques modélicos, métodos, procedimientos, etc., que la
investigación evaluativa ha desarrollado, sobre todo en las últimas décadas.
Volviendo a los denominados modelos de los setenta y a sus clasificaciones,
podemos recoger algunas de las aparecidas en la última década en nuestro entorno
académico, apoyándose en distintos autores. Así, por ejemplo, Arnal y otros
(1992) ofrecen una clasificación de lo que denominan diseños de la investigación
evaluativa, revisando las de diversos autores (Patton, 1980; Guba y Lincoln,
1982; Pérez, 1983; Stufflebeam y Shinkfield, 1987). Esta clasificación es la
siguiente :
Tabla 1- Tipos de diseños de investigación educativa
Guba y Stufflebeam
Patton Pérez Autores
Perspectiva Lincoln y Shinkfield
(1980) (1983) creadores
(1982) (1987)
Objetivos Objetivos Objetivos Objetivos Tyler (1950)
Rivlin (1971)
Análisis Análisis
Empírico-analítica Rossi y otros
sistemas sistemas
(1979)
Método
Suchman (1967)
científico
Stufflebeam
CIPP CIPP CIPP
(1966)
Susceptibles Crítica Crítica Crítica
Eisner (1971)
de artística artística artística
complementarieda
Adversario Contrapuesto Wolf (1974)
d
Cronbach
UTOS UTOS
(1982)
Respondente Respondente Respondente Respondente Stake (1975
Parlett y
Iluminativo Iluminativo Iluminativo
Hamilton (1977)
Humanístico-
interpretativa
Sin metas Sin metas Sin metas Scriven (1967)
MacDonald
Democrático
(1976)
Por su parte, Castillo y Gento (1995) ofrecen una clasificación de «métodos de

evaluación» dentro de cada uno de los modelos (paradigmas), que ellos
denominan conductivista-eficientistas, humanísticos y holísticos (mixtos). Una
síntesis de estas clasificaciones es la siguiente:
Tabla 2- Modelo conductista-eficientista

Método/ Finalidad Paradigma Contenido de Rol del
autor evaluativa dominante evaluación evaluador
Consecución Medición logro Cuantitativo Resultados Técnico externo
objetivos objetivos
Tyler (1940)
CIPP Información Mixto C (contexto) Técnico externo
Stufflebeam para toma I (input)
(1967) decisiones P (proceso)
P (producto)
Figura Valoración Mixto Antecedentes, Técnico externo
(countenance) resultados y transacciones,
Stake (1967) proceso resultados
CSE Información para Mixto Centrados en Técnico externo
Alkin (1969) determinación de logros de
decisiones necesidades
Planificación Valoración Mixto U (unidades de Técnico externo
educativa proceso y evaluación)
Cronbach producto T (tratamiento)
(1982) O (operaciones)
Tabla 3- Modelo humanístico
Método/ Finalidad Paradigma Contenido de Rol del

autor evaluativa dominante evaluación evaluador
Atención al Análisis de Mixto Todos los Evaluador externo
cliente necesidades del efectos del de necesidades
Scriven (1973) cliente programa del
cliente
Contraposición Opiniones para Mixto Cualquier aspecto Árbitro externo
Owens (1973), decisión del programa del debate
Wolf (1974) consensuada
Crítica artística Interpretación Cualitativo • Contexto Provocador
Eisner (1981) crítica de la • Procesos externo de
acción educativa emergentes interpretaciones
• Relaciones de
procesos
• Impacto en
contexto
Tabla 4- Modelo holístico
Método/ Finalidad Paradigma domi- Contenido de Rol del

autor evaluativa nante evaluación evaluador
Evaluación Valoración de Cualitativo Resultado de Promotor externo
respondente respuesta a debate total de la
Stake (1976) necesidades de sobre programa interpretación
participantes por los
implicados
Evaluación Interpretación Cualitativo Elementos que Promotor externo
holística educativa para configuran la de la
MacDonald mejorarla acción educativa interpretación
(1976) por los
implicados
Evaluación Iluminación y Cualitativo Sistema de Promotor externo
iluminativa comprensión de enseñanza y de la
Parlett y los componentes medio interpretación
Hamilton del programa de aprendizaje por los
(1977) implicados
También Scriven (1994) ofrece una clasificación de los «modelos anteriores»,

previamente a introducir su perspectiva transdisciplinar que luego comentamos.
Este autor identifica seis visiones o enfoques alternativos en la fase «explosiva»
de los modelos, además de algunas más que denomina «exóticas» y que se
mueven entre los modelos de jurisprudencia y de experto. A continuación
comentamos sucintamente estas visiones y los «modelos» que se adscriben a
ellas.
La visión fuerte hacia la toma de decisiones (Visión A) concibe al evaluador
investigando con el objetivo de llegar a conclusiones evaluativas que le ayuden al
que debe tomar decisiones. Los que apoyan este enfoque se preocupan de si el
programa alcanza sus objetivos, pero van más allá, cuestionándose si tales
objetivos cubren las necesidades que deben cubrir. Esta posición es mantenida,
aunque no la hiciera explícita, por Ralph Tyler y extensamente elaborada en el
modelo CIPP (Stufflebeam y otros, 1971).
Según el planteamiento tyleriano, las decisiones acerca de un programa deben
basarse en el grado de coincidencia entre los objetivos y los resultados. El cambio
de los alumnos, habitualmente el objetivo perseguido, es el criterio de evaluación.
A diferencia de Tyler, Stufflebeam ofrece una perspectiva más amplia de los
contenidos a evaluar. Estos son las cuatro dimensiones que identifican su modelo,
contexto (C) donde tiene lugar el programa o está la institución, inputs (I)
elementos y recursos de partida, proceso (P) que hay que seguir hacia la meta y
producto (P) que se obtiene. Además, se deja constancia de que el objetivo
primordial de la investigación evaluativa es la mejora, la toma de decisiones para
la mejora de todas y cada una de las cuatro dimensiones antes citadas.
Scriven (1994) nos dice que Stufflebeam ha seguido desarrollando su
perspectiva desde que desarrolló el CIPP. Sin embargo, uno de sus colaboradores
en tal empresa, Guba, tomó posteriormente una dirección diferente, tal como
hemos visto al analizar la cuarta generación de la evaluación (Guba y Lincoln,
1989).
La visión débil hacia la toma de decisiones (Visión B) concibe al evaluador
proporcionando información relevante para la toma de decisiones, pero no le
obliga a emitir conclusiones evaluativas o críticas a los objetivos de los
programas. El representante teórico más genuino es Marv Alkin (1969), que
define a la evaluación como un proceso factual de recogida y generación de
información al servicio del que toma las decisiones, pero es éste el que tiene que
tomar las conclusiones evaluativas. Esta posición es lógicamente popular entre
los que piensan que la verdadera ciencia no debe o no puede entrar en cuestiones
de juicios de valor. El modelo de Alkin se conoce como CES (Centro para el
Estudio de la Evaluación), planteando las siguientes fases: valoración de las
necesidades y fijación del problema, planificación del programa, evaluación de la
instrumentalización, evaluación de progresos y evaluación de resultados.
La visión relativista (Visión C) también mantiene la distancia de las
conclusiones evaluativas, pero usando el marco de valores de los clientes, sin un
juicio por parte del evaluador acerca de esos valores o alguna referencia a otros.
Esta visión y la anterior han sido el camino que ha permitido integrarse sin
problemas en el «carro» de la investigación evaluativa a muchos científicos
sociales. De hecho, uno de los textos más utilizados de evaluación en el ámbito de
las ciencias sociales (Rossi y Freeman, 1993), toma preferentemente esta
perspectiva .
Las visiones B y C son las posiciones de los científicos entroncados con una
concepción libre de valores de la ciencia. En cambio, los que participan de la
visión A proceden de un paradigma diferente, probablemente debido a su
conexión académica con la historia, la filosofía de la educación, la educación
comparada y la administración educativa.
Hace unos años Alkin (1991) revisó sus planteamientos de dos décadas atrás,
pero siguió sin incluir los términos de mérito, valor o valía; termina definiendo un
Sistema de Información para la Gestión (Management Information System-MIS)
para uso del que toma decisiones, pero no ofrece valoraciones al respecto
Pero la forma más simple de la visión relativista (Visión C) es la desarrollada
en el «modelo de discrepancia» de evaluación de Malcolm Provus (1971). Las
discrepancias son las divergencias con la secuencia de tareas proyectadas y la
temporalización prevista. Este modelo es muy cercano al control de programas en
sentido convencional; es una especie de simulación de una evaluación.
La visión de la descripción fértil, rica, completa (Visión D) es la que entiende
la evaluación como una tarea etnográfica o periodística, en la que el evaluador
informa de lo que ve sin intentar emitir afirmaciones valorativas o inferir
conclusiones evaluativas, ni siquiera en el marco de los valores del cliente como
en la visión relativista. Esta visión ha sido defendida por Robert Stake y muchos
de los teóricos británicos. Se trata de una especie de versión naturalista de la
visión B, tiene algo de sabor relativista y a veces parece precursora de la visión de
la cuarta generación. Se centra en la observación, en lo observable, más que en la
inferencia. Recientemente se le ha denominado como visión de la descripción
sólida, fuerte, para evitar el término rica, que parece más evaluativa.
Stake, en su primera etapa, es tayleriano en cuanto a concepción evaluativa
centrada en los objetivos planteados, proponiendo el método de evaluación de la
figura (Stake, 1967), como rostro o imagen total de la evaluación. Esta gira en
torno a los tres componentes, antecedentes, transacciones y resultados,
elaborando dos matrices de datos, una de descripción y otra de juicio. En la
primera se recogen de un lado las intenciones y de otro las observaciones y, en la
segunda, las normas, lo que se aprueba y los juicios, lo que se cree que debe ser.
A mitad de los setenta, Stake se aleja de la tradición tayleriana de
preocupación por los objetivos y revisa su método de evaluación hacia un
planteamiento que él califica como «respondente» (Stake, 1975 y 1975a),
asumiendo que los objetivos del programa pueden modificarse sobre la marcha,
con la finalidad de ofrecer una visión completa y holística del programa y
responder a los problemas y cuestiones reales que plantean los implicados. Según
Stufflebeam y Shinkfield (1987), este modelo hizo de Stake el líder de una nueva
escuela de evaluación, que exige un método pluralista, flexible, interactivo,
holístico, subjetivo y orientado al servicio. Este modelo sugiere la «atención al
cliente» propuesta por Scriven (1973), valorando sus necesidades y expectativas.
De manera gráfica, Stake (1975a) propone las fases del método a modo de las
horas de un reloj, poniendo la primera en las doce horas y siguiendo las siguientes
fases, el sentido de las agujas del reloj. Estas fases son las siguientes: 1) Hablar
con los clientes, responsables y audiencias, 2) Alcance del programa, 3)
Panorama de actividades, 4) Propósitos e intereses, 5) Cuestiones y problemas, 6)
Datos para investigar los problemas, 7) Observadores, jueces e instrumentos, 8)
Antecedentes, transacciones y resultados, 9) Desarrollo de temas, descripciones y
estudio de casos, 10) Validación (confirmación), 11) Esquema para la audiencia y
12) Reunión de informes formales. El evaluador puede seguir las fases también
en sentido contrario del reloj o en cualquier otro orden.
En el método respondente el evaluador ha de entrevistar a los implicados para
conocer sus puntos de vista y buscar la confluencia de las diversas perspectivas.
El evaluador deberá interpretar las opiniones y diferencias de puntos de vista
(Stecher y Davis, 1990) y presentar una amplia gama de opiniones o juicios, en
lugar de presentar sus conclusiones personales.
La visión del proceso social (Visión E) que cristalizó hace algo más de dos
décadas alrededor de un grupo de la Universidad de Stanford, dirigido por Lee J.
Cronbach (1980), resta importancia a la orientación sumativa de la evaluación
(decisiones externas sobre los programas y rendición de cuentas), enfatizando la
comprensión, la planificación y la mejora de los programas sociales a los que
sirve. Sus posiciones quedaban claramente establecidas en noventa y cinco tesis
que han tenido una enorme difusión entre los evaluadores y los usuarios de la
evaluación.
En cuanto a los contenidos de la evaluación, Cronbach (1983) propone que se
planifiquen y controlen los siguientes elementos:
• Unidades (U) que son sometidas a evaluación, individuos o grupos
participantes.
• Tratamiento (T) de la evaluación.
• Operaciones (O) que lleva a cabo el evaluador para la recogida y análisis
de datos, así como para la elaboración de conclusiones.
• Contexto en el que tiene lugar el programa y su evaluación.
En una investigación evaluativa concreta se pueden dar varias unidades, varios
tratamientos y varias operaciones, en definitiva varios (uto), dentro de un universo
UTO de situaciones admisibles.
Ernie House (1989), un teórico y un práctico de la evaluación bastante
independiente de corrientes en boga, también marcó el entronque social de los
programas, pero se distinguía sobre todo por su énfasis de las dimensiones más
éticas y argumentales de la evaluación, quizás motivado por la ausencia de estas
facetas en los planteamientos de Cronbach y sus colaboradores.
La visión constructivista de la cuarta generación (Visión F) es la última de
estas seis visiones que describe Scriven (1994), siendo mantenida por Guba y
Lincoln (1989) y seguida por muchos evaluadores americanos y británicos. Ya
hemos visto anteriormente que esta visión rechaza una evaluación orientada a la
búsqueda de calidad, mérito, valor, etc., y favorece la idea de que ello es el
resultado de la construcción por individuos y la negociación de grupos. Esto
significa, según Scriven, que el conocimiento científico de todo tipo es
sospechoso, discutible y no objetivo. Lo mismo le ocurre a todo trabajo análitico
como el análisis filosófico, incluido el suyo. Scriven apunta que el propio Guba
ha sido siempre consciente de las potenciales «autocontradicciones» de su
posición.
De esta revisión de Scriven quedan al margen algunas posiciones evaluativas
tradicionalmente recogidas y tratadas por los analistas. Así por ejemplo, Schuman
(1967) ofrece un diseño evaluativo basado en el método científico o, al menos, en
alguna variación o adaptación del mismo. Owens (1973) y Wolf (1974 y 1975)
proponen un método de contraposición o discusión que sobre un programa llevan
a cabo dos grupos de evaluadores, partidarios y adversarios, para proporcionar
información pertinente a quienes toman decisiones. Eisner (1971, 1975 y 1981)
plantea la evaluación en términos similares al proceso de crítica artística.
El propio Scriven (1967 y 1973) proponía hace años centrar la evaluación en la
atención al cliente y no tanto en las metas previstas, puesto que frecuentemente
los logros no previstos son más importantes que los que figuran en la
planificación del programa. Por ello, se suele denominar a su enfoque como
evaluación sin metas. El evaluador determina el valor o mérito del programa para
informar a los usuarios; se trata algo así como de un intermediario informativo
(Scriven, 1980).
La evaluación iluminativa (Parlett y Hamilton, 1977) tiene un enfoque
holístico, descriptivo e interpretativo, con la pretensión de iluminar sobre un
complejo rango de cuestiones que se dan de manera interactiva (Fernández,
1991). La evaluación democrática de MacDonald (1971 y 1976), también
denominada holística, supone la participación colaborativa de los implicados,
siendo el contraste de opiniones de los implicados el elemento evaluativo
primordial.
Scriven (1994) analiza las seis visiones críticamente y se muestra más cercano
a la visión A, la visión fuerte sobre la toma de decisiones, representada
fundamentalmente por el modelo CIPP de Stufflebeam y sus planteamientos, pues
dice que es la más cercana de todas a la visión del sentido común, que es la que
tienen los evaluadores trabajando con sus programas, de la misma manera que los
médicos trabajan con los pacientes, haciéndolo lo mejor posible,
independientemente del tipo y del estado general del paciente. Scriven quiere
extender esta visión con una visión o modelo que denomina transdisciplinar y
que él califica como significativamente distinta de la aludida visión A y
radicalmente diferente de las restantes.
En la perspectiva transdisciplinar, la investigación evaluativa tiene dos
componentes: el conjunto de campos de aplicación de la evaluación y el
contenido de la propia disciplina. Algo parecido a lo que ocurre a disciplinas
como la estadística y la medición. En definitiva, la investigación evaluativa es una
disciplina que incluye sus propios contenidos y los de otras muchas disciplinas; su
preocupación por el análisis y mejora se extiende a muchas disciplinas, es
transdisciplinar.
Esta visión es objetivista como la A y defiende que el evaluador determine el
mérito o el valor del programa, del personal o de los productos investigados. En
tal sentido, se debe establecer de manera explícita y defender la lógica utilizada
en la inferencia de conclusiones evaluativas a partir de las premisas definicionales
y factuales. Así mismo, se deben perseguir las falacias argumentales de la
doctrina libre de valores (Evaluation Thesaurus, 1991).
En segundo lugar, la perspectia transdisciplinar se orienta hacia el
consumidor, más que hacia el gestor o intermediario. No se trata de una
orientación exclusiva hacia el consumidor, pero sí la consideración primera del
consumidor como justificación del programa, y que el bien común es la primacía
de la evaluación. A partir de aquí, también se produce información valiosa para el
gestor que decide y se pueden analizar los productos de un programa o institución
a la vista de sus objetivos. Esta posición no sólo ve legitimidad en la emisión de
conclusiones evaluativas por parte del investigador, sino que ve necesidad de
hacerlo en la gran mayoría de las ocasiones.
Se trata también de una visión generalizada, no justamente una visión general,
que incluye la generalización de conceptos en el ámbito del conocimiento y la
práctica. Desde esta perspectiva, la investigación evaluativa es mucho más que la
evaluación de programas e incide en procesos, instituciones y otros muchos más
objetos. De manera más detallada, esta visión generalizada significa que:
a) Los campos distintivos de aplicación de la disciplina son los programas,
el personal, los rendimientos, los productos, los proyectos, la gestión, y la
metaevaluación de todo ello.
b) Las investigaciones evaluativas inciden en todo tipo de disciplinas y en
las prácticas que resultan de ellas.
c) Las investigaciones evaluativas se mueven desde niveles muy prácticos
hasta el nivel conceptual.
d) Los distintos campos de la investigación evaluativa tienen muchos
niveles de interconexión y solapamiento. La evaluación de programas, de
personal, de centros, etc., tienen muchos puntos en común.
El cuarto elemento distintivo de la visión transdisciplinar de la evaluación es
que se trata de una visión técnica. La evaluación no sólo necesita el apoyo técnico
de otras muchas disciplinas, sino que, además, tiene su propia metodología. La
lógica de la síntesis de resultados, las consecuencias, etc., y la correcta ubicación
en el proceso de muchas técnicas auxiliares en las que, probablemente, no es
necesario ser un gran especialista, pero sí tener un conocimiento cabal.
Esta perspectiva transdisciplinar de la investigación evaluativa de Scriven
(1994), coincide en gran medida con los planteamientos que de la misma hemos
defendido en otros momentos (Escudero, 1996). Nosotros no tenemos unas
posiciones contrarias a las otras visiones en la misma medida que las tiene
Scriven y, de hecho, consideramos desde una posición pragmática, que todas las
visiones tienen puntos fuertes y que en todo caso, aportan algo útil para la
comprensión conceptual y el desarrollo de la investigación evaluativa. Sin
embargo, sí que pensamos que esta moderna visión de Scriven es sólida y
coherente y ampliamente aceptada en la actualidad.
Una crítica que podría hacerse a este planteamiento de Scriven está en el
excesivo énfasis relativo de la orientación al cliente, al usuario en sentido estricto.
Pensamos que esta orientación debe integrarse dentro de una orientación a los
implicados, donde existen distintos tipos y distintas audiencias y, por supuesto,
una muy importante, son los usuarios en el sentido de Scriven, pero nos parece
que la investigación evaluativa hoy en día tiene una orientación prioritaria más
plural que la defendida por este autor.
Referencias bibliográficas
Ahman, S. J. y Cook, M. D. (1967). Evaluating Pupil Growth. Principles of

Tests Measurement. Boston, Ma.: Allyn and Bacon
Alkin, M. (1969). Evaluation theory development. Evaluation Comment, 2, 1,
2-7.
Alkin, M. (1991). Evaluation theory development: II. En M. McLaughlin, y
Phillips (Eds.), Evaluation and education at quarter century (pp.91-112).
Chicago: NSSE/ University of Chicago .
Anderson, S. B. y Ball, S. (1983). The profession and practice of program
evaluation. San Francisco, Ca: Jossey-Bass.
Arnal, J.; Del Rincon, D. y Latorre, A. (1992). Investigación educativa.
Fundamentos y Metodología. Barcelona: Labor
Atkin, J. M. (1968). Behavioral Objectives in curriculum design: A
cautionary note. The Science Teacher, 35, 27-30.
Baker, L. R. (1969). Curriculum evaluation. Review of Educational
Research, 39, 339-358.
Barbier, J. M. (1993). La evaluación en los procesos de formación.
Barcelona: Paidos.
Berk, A. R. (Ed.) (1981). Educational evaluation methodology: The state of
the art. Baltimore: The Hopkins University Press.
Blanco, F. (1994). La evaluación en la educación secundaria. Salamanca:
Amasú Ediciones.
Bloom, B. S., Engelhaut, M.D., Furst, E.J., Hill, W.H. y Krathwohl, D.R.
(1956). Taxonomy of educational objectives Handbook I; Cognitive
domain. New York: Davis, McKay.
Bloom, B. S., Hastings, J. TH. Y Madaus, F. (1971). Handbook on formative
and summative evaluation of student learning. New York: McGraw-Hill.
Bloom, B.S., Hastings, T. y Madaus G. (1975). Evaluación del aprendizaje.
Buenos Aires: Troquel.
Bonboir, A. (1972). La Docimologie. Paris: PUF.
Cabrera, F. (1986). Proyecto docente sobre técnicas de medición y
evaluación educativas. Barcelona: Universidad de Barcelona.
Carreño, H. F. (1977). Enfoques y principios teóricos de la evaluación.
Mexico: Trillas.
Castillo, S. y Gento, S. (1995). Modelos de evaluación de programas
educativos. En A.Medina y L. M. Willar (Coord.), Evaluación de
programas educativos, centros y profesores (pp.25-69). Madrid: Editorial
Universitas, S. A..
Chelimsky, E. (1998). The role of experience in formulating theories of
evaluation practice. American Journal of Evaluation 19, 1, 35-55.
Coffman, W. E. (1971). Essay examinations. En R.L. Thorndike (Ed.)
Educational Measurement. Washington , DC: American Council on
Education.
Cronbach, L. J. (1963). Course improvement through evaluation. Teachers
College Record, 64, 672-683.
Cronbach, L. J. (1982). Designing evaluations of educational and social
programs. Chicago: Jossey-Bass.
Cronbach, L. J., Hambron, S.R., Dornbusch, S.M., Hess, R.D., Hornick, R.C.,
Phillips, D.C., Walker, D.F. y Weiner, S.S. (1980). Towards reform in
program evaluation: Aims, methods and institutional arrangements. San
Francisco: Jossey-Bass.
Cronbach, L. J. y Suppes, P. (1969). Research for tomorrow's schools:
Disciplined inquiry for education. New York: MacMillan.
Darling-Hammond, L., Wise, AE, & Pease, SR (1989). Teacher evaluation in
the organizational context: A review of the literature. En E. R. House
(Ed.) New directions in educational evaluation (pp.203-253). London: The
Falmer Press.
De La Orden, A. (1985). Investigación evaluativo. En Arturo De la Orden.
(Ed.), Investigación educativa. Diccionario de Ciencias de la Educación
(pp.133-137). Madrid: Anaya.
De Miguel, M. (1989). Modelos de investigación sobre organizaciones
educativas. Revista de Investigación Educativa, 7, 13, 21-56.
Dubois, P. H. (1970). A History of Psychological Testing. Boston: Allyn
Bacon.
Ebel, R. L. (1977). Fundamentos de la medición educacional. Buenos Aires:
Guadalupe.
Eisner, E. W. (1967). Educational objectives: Help or hindrance?. The School
Review, 75, 250-260.
Eisner, E. W. (1969, Instructional and expressive educational objectives: their
formulation and use in curriculum. En J. Popham (Ed.), Instructional
objectives (pp. 1-18). Chicago: AERA.
Eisner, E. (1971). Emerging models for educational evaluation. School
Review, 2.
Eisner, E. W. (1975). The perceptive eye: Toward the reformation of
educational evaluation. Stanford, Ca: Stanford Evaluation Consortion.
Eisner, E. W. (1981). The methodology of qualitative evaluation: the case of
educational connoisseurship and educational criticism. Stanford, Ca:
Stanford University .
Eisner, W. E. (1985). The art of educational evaluation. London: The Falmer
Press.
Escudero, T. (1993). Enfoques modélicos en la evaluación de la enseñanza
universitaria, Actas de las III Jornadas Nacionales de Didáctica
Universitaria «Evaluación y Desarrollo Profesional» (pp. 5-59). Las
Palmas: Servicio de Publicaciones, Universidad de Las Palmas.
Escudero, T. (1996). Proyecto docente e investigador. Zaragoza: Universidad
de Zaragoza.
Fernández Ballesteros, R. (1981). Perspectivas históricas de la evaluación
conductual. En R. Fernández, y J.A.I Carrobles. (Ed.), Evaluación
conductual. Madrid: Ediciones Pirámide.
Fernández de Castro, J. (1973). La enseñanza programada. Madrid: CSIC.
Fernández, J. (1991). La evaluación de la calidad docente. En A. Medina
(Coord.), Teoría y métodos de evaluación. Madrid: Cincel.
Fetterman, D. M. (1994). Empowerment evaluation. Evaluation Practice, 15,
1, 1-15.
Gagne, R. M. (1971). Las condiciones del aprendizaje. Madrid: Aguilar.
Gil, E. (1992). El sistema educativo de la Compañía de Jesús. La «Ratio
Studiorum». Madrid: UPCO.
Glaser, B. G. (1978). Theoretical sensitivity. Mill Valley, Ca: Sociology
Press.
Glaser, B. G. y Strauss, A. L. (1967). The discovery of grounded theory.
Chicago: Aldine.
Glaser, R. (1963). Instructional technology and the measurement of learning
outcomes: some questions. American Psychologists, 18, 519-521.
Glaser, R. (Dir.) (1965). Teaching machines and programmed learning.
Washington: National Education Association.
Gronlund, N. E. (1985). Measurement and evaluation in teaching. New York:
MacMillan,
Guba, G. E. y Lincoln, Y. S. (1982). Effective evaluation. San Francisco:
Jossey Bass Publishers.
Guba, E. G. y Lincoln, Y. S. (1989). Fourth Generation Evaluation.
Newbury Park, Ca.: Sage Publications
Gullicksen, H. (1950). Theory of mental tests. New York: Wiley
Hambleton, R. K. (1985). Criterion-referenced measurement.En
Encyclopedia of Educational Research. New York: McMillan.
Hammond, R. L. (1983). Evaluation at the local level. En B. R. Worthen y J.
R. Sanders, Educational Evaluation: Theory and Practice. Worthington,
Ohio: Charles A. Jones Publishing Company.
Hernández, F. (1993). Proyecto docente e investigador. Murcia.
Horowitz, R. (1995). A 75-year legacy on assessment: Reflections from an
interview with Ralph W. Tyler. The Journal of Educational Research, 89,
2, 68-75.
House, E. R. (1983). How we think about evaluation. En House, E. R.,
Philosophy of evaluation. San Francisco, Ca.: Jossey-Bass
House, E. R. (1989). Evaluating with validity. Newbury Park, Ca.: Sage.
Joint Committee on Standards for Educational Evaluation (1981, Standards
for evaluations of educational programs, projects, and materials. New
York.: McGraw-Hill.
Joint Committee on Standards for Educational Evaluation (1988). The
personnel evaluation standards. Newbury Park, CA.: Sage.
Keefe, J. (1994). School evaluation using the CASE-IMS model and
improvement process. Studies in Educational Evaluation, 20,1, 55-67.
Kellaghan, T. (1982). La evaluación educativa. Bogotá: Universidad
Pontificia Javierana.
Kidder, L. H. (1981). Qualitative research and quasi-experimental
frameworks. En M. B. Brewer y B. E. Collins, (Eds.), Scientific inquiry
and the social sciences. San Francisco: Jossey-Bass.
Kogan, M. (Ed.) (1989). Evaluating higher education. London: Jessica
Kingsley Publishers.
Krathwohl, R. D., Blomm, B.S. y Masia, B.B. (1964). Taxonomy of
educational objectives. Handbook II: Affective domain. New Cork: Davis
McKay.
Lewy, A. (Ed.) (1976). Manual de evaluación formativa del currículo.
Bogotá : Voluntad/Unesco.
Lincoln, y. S. y Guba, E. G. (1985). Naturalistic inquiry. Beverly Hills, CA:
Sage.
Lincoln, y. S. y Guba, E. G. (1986). But is it rigorous? Trustworthiness and
authenticity in naturalistic evaluation. en D. D. Williams (Ed.),
Naturalistic evaluation. San Francisco: Jossey-Bass.
Lincoln, y. S. y Guba, E. G. (1988). Criteria for assessing naturalistic
inquiries as products. Paper presented at the American Educational
Research Association, New Orleans, LA.
Lindquist, E. F. (1953). Design and Analysis of Experiments in Psychology
and Education. Boston, Ma.: Houghton Mifflin Company.
Lindvall, C. M., (Ed.) (1964). Defining educational objectives. Pittsburg:
University of Pittsburgh Press.
Macdonald, B. (1971). The evaluation of the Humanities Curriculum Project:
a holistic approach. Theory into Practice, 10, 3, 163-169.
Macdonald, B. (1976). Evaluation and the control of education. En D.
Tawney (Ed.), Curriculum evaluation today: trends and implications, 125-
136. London: McMillan.
Madaus, G. F. y otros (1991). Evaluation Models. Viewpoints on Educational
and Human Services Evaluation. Hingham , Mass.: Kluwer-Nijhoff
Publishing.
Mager, R. F. (1962). Preparing instructional objective. Palo Alto, CA.:
Fearon.
Mager, R. F. (1973). Análisis de metas. México: Trillas.
Mann, H., (1845). Boston Grammar and Writing Schools. Common School
Journal, October, 7, 19.
Martínez de Toda, M. J. (1991). Metaevaluación de necesidades educativas:
Hacia un sistema de normas. Tesis doctoral. Madrid: Universidad
Complutense.
Mateo, J. (1986). Proyecto docente e investigador. Barcelona: Universidad de
Barcelona.
Mateo, J. y otros (1993). La evaluación en el aula universitaria. Zaragoza:
ICE-Universidad de Zaragoza.
Mccall, W. A. (1920). A new kind of school examination. Journal of
Educational Research, January.
McReynold, P. (1975). Advances in Psychological Assessment, vol. III.San
Francisco: Jossey-Bass.
Mertens, D. M. (1999). Inclusive evaluation: Implications of transformative
theory for evaluation. American Journal of Evaluation, 20, 1, 1-14.
Metfessel, N. S. y Michael, W. B. (1967). A paradigm involving multiple
criterion measures for the evaluation of effectiveness of school programs.
Educational and Psychological Measurement, 27, 931-943.
Morgan, G. (1983). Beyond method. Beverly Hills, Ca: Sage.
Nevo, D. (1983). The conceptualization of educational evaluation: An
analytical review of the literature. Review of Educational Research, 53, 1,
117-128.
Nevo, D. (1989). The conceptualization of educational evaluation: An
analytical review of the literature. En E. R. House (Ed.), New directions in
educational evaluation. London : The Falmer Press, 15-29.
Norris, N. (1993). Understanding educational evaluation. London : Kogan
Page/CARE, School of Education , University of East Anglia .
Nowalowski, Jeri, Mary Anne Bunda, Russell Working (1985). A Handbook
of Educational Variables. Boston: Kluwer-Nijhoff .
Nunnally, J. C. (1978). Psychometric Theory. New York: McGraw Hill.
Owens, T. R. (1973). Educational evaluation by adversery proceedings. En
E.R. House (Comp.), School Evaluation: The Politics and Process.
Berkeley: McCutchan.
Parlett, M. y Hamilton , D. (1977). Evaluation as illumination: A new
approach to the study of innovative programmes. En Hamilton D. y otros
(Eds.), Beyond the numbers game. London: MacMillan.
Patton, M. Q. (1980). Qualitative Evaluation methods. Beverly Hills, Ca.:
Sage
Pérez, A. (1983). Modelos contemporáneos de evaluación. En J. Gimeno y A.
Pérez, La enseñanza: su teoría y su práctica (pp. 426-449). Madrid: Akal
Phillips, R. C. (1974). Evaluation in education. Columbus, Ohio: Merril.
Pieron, H. (1968). Vocabulaire de la psychologie. Paris: PUF.
Pieron, H. (1969). Examens et Docimologie. PUF, Paris.
Planchard, E. (1960). La investigación pedagógica. Madrid: Ediciones Fas.
Popham, W. J. (1970). Establishing instructional goals. Englewood Cliffs, N.
J.: Prentice Hall.
Popham, W. J. (1980). Problemas y técnicas de la evaluación educativa.
Madrid: Anaya.
Popham, W. J. (1983). Evaluación basada en criterios. Madrid: Magisterio
Español, S. A..
Popham, W. y Baker, E. L. (1970). Systematic Instruction. Englewood Cliffs,
NJ.: Prentice Hall.
Provus, M. (1971). Discrepancy evaluation. For educational program
improvement and assessment. Berkeley, Ca.: McCutchan Publishing Co.
Rivlin, A. M. (1971). Systematic thinking for social action. Washington,
D.C.: Brookings Institute.
Rodríguez, T. y otros (1995). Evaluación de los aprendizajes. Aula Abierta
Monografías 25. Oviedo: ICE-Universidad de Oviedo.
Rosenthal, J. E. (1976). Evaluation history. En S. B. Anderson, y otros (Eds.),
Encyclopedia of Educational Evaluation. San Francisco: Jossey Bass
Publishers.
Rossi, P. H. y Freeman, H. (1993). Evaluation: A Systematic Approach.
Beverly Hills , Ca.: Sage.
Rossi, P. H. y otros (1979). Evaluation: A systematic approach. Beverly Hills
, Ca.: Sage.
Russell, N. y Willinsky, J. (1997). Fourth generation educational evaluation:
The impact of a post-modern paradigm on school based evaluation.
Studies in Educational Evaluation, 23, 3, 187-199.
Rutman, L. (Ed.) (1984). Evaluation research methods: A base guide.
Beverly Hills, Ca.: Sage.
Rutman, L. y Mowbray, G. (1983). Understanding program evaluation.
Beverly Hills, Ca.: Sage.
Salvador, L. (1992). Proyecto docente., Universidad de Cantabria.
Scriven, M. (1967). The methodology of evaluation. En Perspectives of
Curriculum Evaluation, (pp. 39-83). AERA Monograph 1. Chicago : Rand
McNally and Company.
Scriven, M. (1973). Goal-free evaluation. En E. R. House (Ed.), School
evaluation: The politics and process,(pp. 319-328). Berkeley, CA.:
McCutchan.
Scriven, M. (1974). Prose and cons about goal-free evaluation. Evaluation
Comment, 3, 1-4.
Scriven, M. (1980). The logic of evaluation. Inverness , Ca.: Edgepress
Scriven, M. (1991, Evaluation Thesaurus. Newbury Park , Ca.: Sage
Scriven, M. (1991a). Duties of the teacher. Kalamazoo, Mi.: Center for
Research on Educational Accountability and Teacher Evaluation.
Scriven, M. (1994). Evaluation as a discipline. Studies in Educational
Evaluation, 20, 1, 147-166.
Scriven, M. (1998). Minimalist theory: The least theory that practice require.
American Journal of Evaluation 19, 1, 57-70.
Smith, E. R. y Tyler, R. W. (1942). Appraising and recording student
progress. New York: Harper & Row,.
Smith, N. L. y Haver, D. M. (1990). The applicability of selected evaluation
models to evolving investigative designs. Studies in Educational
Evaluation, 16, 3, 489-500.
Stacher, B. M. y Davis, W. A. (1990). How to Focus on Evaluation. Newbury
Park, Ca.: Sage.
Stake, R. E. (1967). The countenance of educational evaluation. Teacher
College Record, 68, 523-540.
Stake, R. E. (1975a). Program evaluation: particularly responsive evaluation.
Occasional Paper, 5. University of Western Michigan.
Stake, R. E. (1975b). Evaluating the arts in education: A responsive
approach. Ohio: Merril .
Stake, R. E. (1976). A theoretical stament of responsive evaluation. Studies
in Educational Evaluation, 2 , 19-22.
Stake, R. E. (1981). Setting standars for educational evaluators. Evaluation
News, 22, 148-152.
Stake, R. E. (1986). Quieting reform. Urbana: University of Illinois Press.
Stenhouse, L. (1984). Investigación y desarrollo del curriculum. Madrid:
Morata.
Stronge, J. H. y Helm, V. M. (1991). Evaluating professional support
personnel in educational settings. Newbury Park, Ca: Sage.
Stufflebeam, D. L. (1966). A depth study of the evaluation requeriment.
Theory into Practice, 5, 3, 121-134.
Stufflebeam, D. L. (1994). Introduction: Recommendations for improving
evaluations in U. S. public schools. Studies in Educational Evaluation, 20,
1, 3-21.
Stufflebeam, D. L. (1998). Conflicts between standards-based and
postmodernist evaluations: Toward rapprochement. Journal of Personnel
Evaluation in Education, 12, 3, 287-296.
Stufflebeam, D. L. (1999). Using profesional standards to legally and
ethically release evaluation findings. Studies in Educational Evaluation,
25, 4, 325-334.
Stufflebeam, D. L. (2000). Guidelines for developing evaluation checklists.
Consultado en www.wmich.edu/evalctr/checklists/ el 15 de Diciembre de
2002.
Stufflebeam, D. L. (2001). The metaevaluation imperative. American Journal
of Evaluation, 22, 2, 183-209.
Stufflebeam, D. L., Foley, WJ, Gephart, WJ, Guba, EG, Hammond, RL,
Merriman, HO & Provus, MM (1971). Educational Evaluation and
Decision-making, Itasca, Illinois : F. E. Peacock Publishing.
Stufflebeam, D. L. y Shinkfield, A. J. (1987). Evaluación sistemática. Guía
teórica y práctica. Barcelona: Paidos/MEC.
Suchman, E. A. (1967). Evaluative Research: Principles and Practice in
Public Service and Social Action Programs. New York : Russell Sage
Foundation.
Sunberg, N. D. (1977). Assessment of person. Englewood Cliffs, N.J.:
Prentice Hall.
Taba, H. (1962). Curriculum development. Theory and practice. New York:
Harcourt Brace .
Thorndike, E. L,. (1904). An Introduction to the Theory of Mental and Social
Measurements. New York: Teacher College Press, Columbia University .
Tyler, R. W. (1950). Basic principles of curriculum and instruction. Chicago:
University of Chicago Press .
Tyler, R. W. (1967). Changing concepts of educational evaluation. En R. E.
Stack (Comp.), Perspectives of curriculum evaluation. AERA Monograph
Series Curriculum Evaluation, 1. Chicago: Rand McNally,.
Tyler, R. W., (Ed.) (1969). Educational evaluation: New roles, new means.
Chicago: University of Chicago Press .
Walberg, H. J. y Haertel, G. D. (Ed.) (1990). The International Encyclopedia
of Educational Evaluation. Oxford: Pergamon Press.
Webster, W. J. y Edwards, M. E. (1993). An accountability system for school
improvement, Paper presented at the annual meeting (April) of the AERA.
Atlanta, GA.
Webster, W. J., Mendro, R.L. y Almaguer, T.O. (1994). Effectiveness
indices: A «value added» approach to measuring school effect. Studies in
Educational Evaluation, 20, 1, 113-137.
Weiss, C. H. (1983). Investigación evaluativa. Métodos para determinar la
eficiencia de los programas de acción. México: Trillas,.
Weiss, C. H. (1998). Have we learned anything new about the use of
evaluation?. American Journal of Evaluation, 19, 1, 21-33.
Wilson, A. R. J. (1978). La evaluación de los objetivos. En J. A. R. Wilson
(Ed.), Fundamentos psicológicos del aprendizaje y la enseñanza (pp. 549-
578). Madrid: Anaya.
Wolf, R. L. (1974). The citizen as jurist: A new model of educational
evaluation. Citizen Action in Education, 4.
Wolf, R. L. (1975). Trial by jury: a new evaluation method. Phi Delta
Kappa, 57, 185-187.
Worthen, B. R. y Sanders, J. R. (1973). Educational Evaluation: Theory and
Practice. Worthington, Ohio: Charles a. Jones Publishing Company.
Worthen, B. R. y Sanders, J. R. (1991). The changing face of educational
evaluation, Theory into Practice, XXX, 1, 3-12.
Zeller, N. C. (1987). A rethoric for naturalistic inquiry. Ph. D. dissertation,
Indiana University.
TO KNOW MORE / PARA SABER MÁS

This article has been cited in... / Este artículo ha sido citado en...
* Bustos, P. , Fernández Chávez, C (). Construcción histórica del concepto de

calidad de la educación. Revista de pedagogía pp.9-16.
http://www.fide.cl/revistas/documentos/Const.pdf .[Párrafo añadido el 16 de
Marzo de 2007]
* Cardona Rodríguez, A. & Barrenetxea Ayesta, M. (2003). Las tecnologías de la
información y la comunicación y los indicadores de evaluación universitaria en
España. Education Policy Analysis Archives, 11(46).
http://epaa.asu.edu/epaa/v11n46. [Párrafo añadido el 19 de Mayo de 2004]
* Cockbaine O., Juan y Casas R., Ignacio. Un metamodelo OLAP para la
evaluación de ambientes tel. Rev. Fac. Ing. - Univ. Tarapacá. [online]. abr. 2005,
vol.13, no.1 [citado 08 Enero 2007], p.9-20. Disponible en la World Wide Web:
http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-
13372005000100002&lng=es&nrm=iso. ISSN 0718-1337. [Párrafo añadido el
16 de Marzo de 2007]
* Escudero, T (2005-2006). Claves identificativas de la investigación evaluativa:
análisis desde la práctica. Contextos Educativos. 8-9. 179-199.
http://www.unirioja.es/servicios/sp/ej/contextos/infos/2091397.pdf. [Párrafo
añadido el 16 de Marzo de 2007]
* Gámez Requena, J.J., Márquez, A.C. (2004). Evaluación de los programas de
promoción de la salud para inmigrantes. Index Enferm Digital 2004; 44-45.
Disponible en http://www.index-f.com/index-
enfermeria/44revista/44_articulo_51-55.php. [Párrafo añadido el 16 de Marzo
de 2007]
* García Landa, José Ángel (2006). A bibliography of literary theory, criticism and
philology. 11th online edition
http://www.unizar.es/departamentos/filologia_inglesa/garciala/bibliography.html
. [Párrafo añadido el 16 de Marzo de 2007]
* González Pérez, Yanelis, Rosell León, Yorbelis , Marín Milanés, Franklín, Leal
Labrada, Osvaldo, Piedra Salomón, Yelina y Kourí Cardellá, Gustavo (2006). .
Usabilidad: la evaluación de los servicios en el entorno Web .Acimed; 14(5) .
Disponible en http://bvs.sld.cu/revistas/aci/vol14_5_06/aci10506.htm. [Párrafo
* Ortiz, L. (2006). La nueva concepción de la evaluación de aprendizajes en la
educación de las ciencias de la salud. Revista de Educación en Ciencias de la
Salud (RECS), Vol. 3. n. 2. Disponible en
http://www2.udec.cl/ofem/recs/anteriores/vol312006/art3106a.htm . [Párrafo
* Peñaranda-Correa F, Bastidas-Acevedo M, Escobar-Paucar G, Torres-Ospina JN,
Arango-Córdoba A. (2006). Análisis integral de las prácticas pedagógicas de un
programa educativo en Colombia. Salud Publica Mex, 48:229-235.
http://www.insp.mx/salud/48/483_6.pdf . [Párrafo añadido el 16 de Marzo de
2007]
* Torres Fernández, C.P. (2006). Las investigaciones sobre evaluación educativa
en Cuba. Ciencias Pedagógicas, 6 (1), http://cied.rimed.cu/revista/61/index .
[Párrafo añadido el 16 de Marzo de 2007]
ABOUT THE AUTHORS / SOBRE LOS AUTORES
Tomás Escudero Escorza (tescuder@posta.unizar.es). Catedrático del área de

Métodos de Investigación y Diagnóstico en Educación de la Universidad de
Zaragoza. Es miembro de la Comisión de Coordinación Técnica del Plan de
Calidad de las Universidades. Tiene un gran número de trabajos y publicaciones
sobre evaluación educativa, particularmente sobre evaluación institucional.
Buscar otros artículos de este autor en Scholar Google
ARTICLE RECORD / FICHA DEL ARTÍCULO
Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual.
Un siglo, el XX, de intenso desarrollo de la evaluación en educación. Revista
Reference /
ELectrónica de Investigación y EValuación Educativa (RELIEVE), v.
Referencia 9, n. 1. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm.
Consultado en (poner fecha).
Desde los tests hasta la investigación evaluativa actual. Un siglo, el
XX, de intenso desarrollo de la evaluación en educación. [ From tests
Title / Título to current evaluative research. One century, the XXth, of intense
development of evaluation in education]
Authors / Autores Tomás Escudero Escorza
Review / Revista ELectrónica de Investigación y EValuación Educativa
Revista (RELIEVE), v. 9, n. 1
ISSN 1134-4032
Publication date /
2003 (Reception Date: 2003 January 10; Publication Date: 2003
Fecha de Febr. 27 )
publicación
This article presents a review and state of art about development in
educational evaluation in the XXth century. The main theoretical
proposals are commented
Abstract /
Resumen Este artículo presenta una revisión crítica del desarrollo histórico que
ha tenido el ámbito de la evaluación educativa durante todo el siglo
XX. Se analizan los principales propuestas teóricas planteadas..
Evaluation, Evaluation Research, Evaluation Methods; Formative
Evaluation Summative Evaluation, Testing, Program Evaluation.
Keywords
Descriptores Evaluación, Investigación evaluativa, Métodos de Evaluación,
Evaluación Formativa, Evaluación Sumativa, Test, Evaluación de
Programas
Institution /
Universidad de Zaragoza (España)
Institución
Publication site /
http://www.uv.es/RELIEVE
Dirección
Language /
Español (Title, abstract and keywords in english)
Idioma
Volumen 9, n.1
© Copyright 2002, RELIEVE. Reproduction and distribution of this articles it is
authorized if the content is no modified and their origin is indicated (RELIEVE
Journal, volume, number and electronic address of the document).
© Copyright 2002, RELIEVE. Se autoriza la reproducción y distribución de este

artículo siempre que no se modifique el contenido y se indique su origen
(RELIEVE, volumen, número y dirección electrónica del documento).
[Principal] [La Revista] [Artículos publicados] [Publicar en RELIEVE]
[Home Page] [ About us] [ Published Articles] [To publish in RELIEVE]
Revista ELectrónica de Investigación y EValuación Educativa

http://www.uv.es/RELIEVE
email: relieve@uv.es
Programa de Estudio de Educación

Básica
Información General
Evaluación
La propuesta de evaluación de los aprendizajes en la primera Etapa de

Educación Básica se enmarca dentro de los principios, propósitos y objetivos
del Proyecto Educativo Educación Básica: "Reto, Compromiso y
Transformación", el Plan de Acción del Ministerio de Educación, y Modelo
Curricular planteado, está sustentada teóricamente en la cuarta generación de
la evaluación, la cual es concebida como un proceso democrático,
respondiente, negociado, iluminativo e integrado a los procesos de enseñanza
y de aprendizaje.
Coll (1987) considera que el cómo evaluar va unido al cómo enseñar,

por cuanto ambos procesos se realizan simultáneamente en el aula y no de
forma separada. De allí que la evaluación podrá verse como un proceso
constructivo integrado al quehacer educativo, en el que se contemplan
diversas dimensiones: evaluación del aprendizaje en los alumnos, la práctica
pedagógica y el proyecto pedagógico de aula y plantel.
ARGUMENTACIÓN TEÓRICA
En una sociedad convulsionada como la nuestra, inmersa en una crisis

de valores, que ha provocado una ruptura ética en los individuos y
desintegración de las comunidades, se observa una educación ajena a este
problema. Para cubrir tales exigencias se plantean, innovaciones en la
Educación Básica que conducirán a redimensionar el proceso enseñanza -
aprendizaje como vía para la comprensión, el saber, el hacer, el ser y la
comunicación para lograr un cambio que permita superar los obstáculos y
dificultades y poder encauzarlo con bases firmes hacia el nuevo milenio.
Esto supone el uso de nuevas estrategias y actividades que tomen en

cuenta al niño como centro del saber, al maestro como mediador y a la escuela
en integración con su comunidad, para avanzar en un proceso democrático
dignificador de sus actores y cohesionador de sus comunidades.
En este sentido, tanto la enseñanza como el aprendizaje cobran una

nueva connotación:
- La enseñanza es concebida como un proceso intencional, planificado

y provocado por agentes externos, que plantea como finalidad proyectar,
orientar y dirigir las experiencias del trabajo reflexivo de los alumnos
atendiendo a hechos y valores de sus culturas y de sus vidas.
- El aprendizaje es una actividad mental, dinámica, continua, intensiva,

personalizada, autónoma e implica que el alumno esté en constante
interacción con el objeto de conocimiento.
Por ello ambos procesos (enseñanza y aprendizaje) no pueden darse

aisladamente sino de forma cohesionada e interactiva. El docente debe
provocar y planificar las condiciones óptimas para que se produzcan los
encuentros entre él, los alumnos y la comunidad, a fin de favorecer una
verdadera enseñanza y la construcción del saber por parte del niño.
Como lo afirma Coll (1990), la actividad pedagógica deberá ser

articulada entre el alumno que lleva a cabo su aprendizaje. el objeto de
conocimiento que constituye el contenido del saber y el profesor que enseña
con el propósito de favorecer el aprendizaje de los alumnos.
El aprendizaje, así concebido, se identifica como la construcción

interna del conocimiento donde subyace una actividad autoestructurante por
parte del alumno cuya dinámica, según lo postulado por Piaget (1966 y 1975),
depende de los procesos cognitivos estructurales cada vez más complejos que
determinan las relaciones interpersonales entre el alumno y el docente.
Nos encontrarnos con un alumno en capacidad de aprender una serie de

aspectos que tienen que ver con su nivel de desarrollo, así como con otros
fuera de su alcance que puedan ser asimilados con la orientación del docente o
por intermedio de otros compañeros de clase o de la comunidad donde vive el
niño. En este sentido la teoría de Vygotzky (1977 y 1979), concede al maestro
un papel importante como mediador en el desarrollo de las estructuras
mentales del alumno, quien estará en capacidad de construir e integrar
aprendizajes cada vez más complejos en función de la interacción y
cooperación con los demás.
Cabe destacar la teoría psicológica, verbal, significativa planteada por

Ausubel (1977), quien señala la importancia de los conocimientos previos de
los alumnos en la adquisición de nuevas informaciones. La significatividad
reside en relacionar e integrar los nuevos conocimientos que el alumno
adquiere con los que ya posee. El autor define estas tres condiciones básicas
para que se produzca el aprendizaje: (1) Estructuración lógica de los
materiales de enseñanza, (2) Organización de la enseñanza tomando en cuenta
los conocimientos previos y estilos de aprendizaje en los alumnos y (3) La
motivación como elemento importante para aprender.
La necesidad comunicativa es planteada por Esté (1994), como

inherente a la condición social del sujeto El hombre desarrolla sus
potencialidades genéticas realiza sus logros c culturales en función de la
interacción con otros hombres, con la naturaleza y, simultáneamente,
alimentándose de esa interacción, construye aprendizajes, propone, evalúa,
autoevalúa, contrasta y logra cosas en un mismo curso de negociaciones.
La interacción y la comunicación, según el mismo autor, son posibles

en la medida en la que el sujeto que interactúa sea percibido como: (1)
Dignificado en su capacidad para comprender, construir conocimientos y
emprender tareas y (2) Poseedor de un acervo cultural que tenga continuidad
en la escuela
Las teorías anteriormente descritas centran su atención en el estudiante,

su reflexión e interacción en los procesos de enseñanza y de aprendizaje, por
lo que tienen gran importancia en la práctica pedagógica y evaluativa, al
considerar al aprendizaje como un proceso constructivo interno y personal,
que toma en cuenta las estructuras mentales del que aprende, a través de un
proceso interactivo que se origina entre docentes, alumnos y objetos de
conocimiento en el cual el maestro actúa como mediador del aprendizaje del
alumno. Para ello, planifica y organiza situaciones significativas y pertinentes
que promueven la participación democrática en el aula.
La práctica pedagógica no puede ir separada de la práctica evaluativa,

por lo que se debe propiciar en el aula un ambiente favorable para la discusión
y confrontación de ideas, donde cada niño sea percibido como un ser diverso
que avanza a su propio ritmo de acuerdo con su nivel de maduración, esto
implica un aula que:
1. Respete a cada niño como individuo, es decir, que permita su
libre actuación para que manifieste lo que él es y quiere ser y hacer.
2. Se base en el derecho democrático que todos tienen a participar
en la toma de decisiones y en el control y evaluación de procesos y
resultados desarrollados a partir de tales decisiones.
3. Estimule la ayuda mutua y la cooperación.
4. Incluya la planificación integrada al contexto y al proceso de
evaluación.
5. Invite al docente a observar y describir la evolución del
aprendizaje de los alumnos (bloqueos, progresos, aptitudes,
actitudes, regresiones,...).
ENFOQUE DE LA EVALUACIÓN
Consecuentemente con las bases conceptuales del diseño del nivel

antes enunciadas, se inserta la evaluación de los aprendizajes en la Educación
Básica, dentro del enfoque cualitativo - etnográfico - naturalístico, que
pretende hacer de la escuela un lugar que valore y comprenda las
consideraciones, interpretaciones, intereses y aspiraciones de quienes actúan
en el proceso enseñanza aprendizaje, a fin de ofrecer información pertinente y
oportuna a cada uno de los participantes. La metodología de la evaluación
cualitativa, es comprensiva, global, de carácter descriptivo, narrativo. Usa la
investigación etnográfica, por cuanto, analiza la interrelación del proceso de
aprendizaje en el contexto donde se desarrolla, para vincularlo con los
resultados reflejados en el curriculum que se producen a corto, mediano y
largo plazo.
Entre los modelos evaluativos que sirven de apoyo a la nueva corriente

de evaluación planteada, se destacan los siguientes:
1. Evaluación iluminativa (Parlett y Hamilton, 1972)
Es un modelo cualitativo que se fundamenta en dos ejes conceptuales:

sistema de instrucción y el ambiente o entorno de aprendizaje.
El sistema de instrucción está constituido por un conjunto de elementos

que toma en cuenta y relaciona con el entorno socio-psicológico y material, el
proceso de la enseñanza por parte del docente, y el aprendizaje por parte de
los alumnos.
El ambiente de aprendizaje está representado por un conjunto de

relaciones culturales, sociales, institucionales y psicológicas las cuales inciden
en las normas, opiniones y estilos de trabajo que tienen lugar en el aula.
2. Evaluación respondiente (Etake, 1975)

El propósito principal del modelo es responder a los problemas que se
confrontan en el aula, descubriendo y ofreciendo un retrato completo y
holístico de los procesos de enseñanza y de aprendizaje. Toma en cuenta la
experiencia vivenciada de cada uno de los participantes, con el fin de
responder a las necesidades de información y al nivel de conocimientos de
quienes participan en el proceso.
3. Evaluación democrática (Stenhouse, McDonald y Elliot, 1976 y

1982)
Postula el derecho del alumno y del docente de expresar sus puntos de

vista y opiniones en el aula, la escuela y la comunidad.
Enfatiza el rol del docente evaluador como orientador que se ocupa de

analizar y valorar el progreso del estudiante, a través del uso de las formas de
participación de la evaluación como forma para transformar y modificar la
práctica educativa.
4. Evaluación negociada (Guba y Lincoln. 1989)
Proponen en su modelo, el consenso entre los distintos agentes que

actúan en el proceso de evaluación, a través de ciclos dinámicos de
confrontación de ideas para tomar decisiones.
Todos estos modelos evaluativos anteriormente descritos, se agrupan

para dar fundamento a la cuarta generación de la evaluación. A través de esta
concepción evaluativa se propicia una relación ética y de respeto que toma en
cuenta las diferencias individuales de los alumnos, en atención a sus logros y
dificultades para aprender. Así mismo, invita al docente a reflexionar acerca
de la didáctica y metodología de la enseñanza utilizadas, reorienta y mejora el
proyecto de aula y de la institución.
El rol del evaluador pasa a ser más dinámico, por cuanto:
A. Comunica, orienta v hace reflexionar sobre todo el proceso

educativo.
B. Concede mayor importancia al trabajo en equipo.
C. Participa y propicia actividades de interacción constructiva.
D. Atiende las diferencias individuales.
F. Está en capacidad de negociar y generar consenso entre los

participantes.
G. Delega funciones en un trabajo organizado, cooperativo y
democrático.
H. Planifica en atención a las necesidades de los alumnos y del

contexto.
I. Informa a los alumnos y a sus representantes acerca del progreso

habido durante el trabajo escolar.
J. Redimensiona y reorienta su proyecto de aula y aporta esfuerzos para

el alcance de las metas establecidas en el proyecto plantel.
Todo esto conduce a conceptualizar el proceso evaluativo como:
- Constructivo - interactivo - participativo: por cuanto se considera que

el alumno va descubriendo y construyendo su aprendizaje a partir de
experiencias previas, las cuales son convalidadas y enriquecidas en el aula. La
evaluación recoge evidencias continuas, tal y como suceden en la realidad
sobre como aprende el estudiante y como el docente logra que aprenda más y
mejor.
- Global: porque se pretende evaluar todos los componentes de la

practica pedagógica, relaciones e influencias, que permitan el mejoramiento
continuo de quienes participan en los procesos de enseñanza y de aprendizaje.
LA NECESIDAD DE LA PROPUESTA
La aplicación de esta nueva forma de evaluación generará cambios en

la práctica pedagógica, la cual constituye el elemento didáctico fundamental
para promover la reforma necesaria en el mejoramiento del proceso educativo,
tanto en lo general, como en lo particular. En tal sentido, la evaluación
centrada en procesos es la práctica evaluativa que más se ajusta al modelo
planteado anteriormente.
La evaluación como parte de los procesos de enseñanza y de

aprendizaje tiene como finalidad principal, despertar el interés hacia el
mejoramiento del desarrollo de los alumnos, la actividad del docente, los
materiales educativos, el Proyecto Curricular del Plantel y el Currículo
Básico; por lo que deberá:
- Servir de instrumento de investigación y reflexión para proporcionar

un potencial formativo a cada uno de los agentes que interactúan en el proceso
educativo.
- Proporcionar medios que permitan detectar dificultades en los
procesos de enseñanza y de aprendizaje.
- Reconsiderar fines, métodos y técnicas que contribuyan a mejorar la

práctica pedagógica y a evitar conflictos y bloqueos en los alumnos.
- Promover la autoafirmación personal como estímulo positivo para

valorar progresos y esfuerzos.
- Fomentar relaciones democráticas y afectivas a través de actividades

de cooperación que involucren la autoevaluación, coevaluación y
heteroevaluación.
- Incentivar el trabajo en equipo, como un espacio de reflexión

conjunta donde los agentes educativos puedan compartir experiencias,
estrategias y criterios de evaluación, a objeto de proporcionar un tratamiento
más justo a los alumnos.
Desde esta perspectiva, la presente propuesta promueve situaciones

específicas para integrar la evaluación a los procesos de enseñanza y de
aprendizaje, con el fin de mejorarlo y contribuir a la permanencia de los
estudiantes en el sistema educativo, evitando de esta manera la exclusión, la
repitencia, el fracaso escolar y los profundos niveles de insatisfacción de
docentes, padres y niños.
EVALUACIÓN DEL APRENDIZAJE EN EL ALUMNO
En atención a los planteamientos curriculares la evaluación de los

aprendizajes se concibe como:
Un proceso interactivo de valoración continua de los progresos de los

alumnos, fundamentado en objetivos de aprendizaje de etapa y los planteados
por los docentes en el proyecto de aula, que tonga en cuenta contenidos
conceptuales, procedimentales y actitudinales y el nivel de evolución del
estudiante. En este sentido tendrá como finalidad:
- Determinar el avance del aprendizaje de los alumnos en la

adquisición de los tres tipos de contenidos.
- Contribuir a formar y afianzar los valores y actitudes.
- Desarrollar en cada alumno sus capacidades del saber, del saber hacer
y del ser.
- Detectar en los alumnos: intereses, actitudes, aptitudes, ritmos y

estilos de aprendizaje.
- Identificar las limitaciones o dificultades que poseen los alumnos,
para orientarlos hacia la consolidación de logros
- Brindar al alumno oportunidades para aprender del acierto y del error

y en general de la experiencia, lo cual contribuye al desarrollo de la
metacognición.
- Proporcionar al docente información para mejorar y fortalecer su

práctica pedagógica y la planificación que se desarrollará en el aula.
- Fortalecer la interacción entre el docente y el alumno, que permita el

intercambio de ideas sobre el trabajo y la responsabilidad que corresponde a
cada uno en el proceso de aprendizaje.
PRINCIPIOS DE LA EVALUACIÓN
INTEGRAL E INTEGRADA
Entendida como:
- Conjugación de contenidos conceptuales, procedimentales y

actitudinales.
- Evaluación conjunta e implícita en los procesos de enseñanza y de

aprendizaje.
- Individualizada, es decir, centrada en la evolución y particularidades

de cada alumno, para lo cual emplea diversas técnicas que permitan conocer y
reflexionar acerca de las diferencias individuales y grupales, así como
entender y orientar el aprendizaje y la enseñanza.
- Global, porque la evaluación:
a) Considera el proceso de aprendizaje del alumno como un todo,

explicando sus progresos en todos los aspectos de su personalidad en relación
con las circunstancias que lo rodean en la escuela, en el grupo, en la familia y
en su comunidad.
b) Pretende evaluar, junto con el alumno, el trabajo docente, la

estrategia empleada, la organización del plantel, el proyecto de aula y en
general todos los componentes del diseño curricular, tanto a nivel formal
como lo no previsto en el currículo.
c) Aspira el conocimiento global del alumno como sujeto de

aprendizaje, por lo que se requiere de una comunicación abierta con él para
comprender sus problemas, circunstancias y trabajo.
CONTINUA
Centrada en el proceso, valorando reflexiva y permanentemente la

actuación del alumno para la consecución de competencias expresadas en los
objetivos generales de etapa que abarque todos los contenidos conceptuales,
procedimentales y actitudinales; tome en cuenta las individuales de los
alumnos y el contexto donde se produce el aprendizaje para reorientarlo,
retroalimentarlo y mejorarlo.
La evaluación continua implica:
a) Observación permanente, reflexiva e individualizada con

retroalimentación constante.
b) Carácter cualitativo, descriptivo e interpretativo.
c) Acumulación de juicios basados en procedimientos formales e

informales.
d) Conocimiento del alumno para comprender sus adquisiciones,

posibilidades progresos y carencias, con el fin de proporcionarle la ayuda
requerida.
e) Incentivo de las funciones orientadora v motivadora de la

evaluación.
f) Información útil al alumno sobre su proceso de aprendizaje que le

permita asumir la responsabilidad que le corresponde a su continuidad.
g) Consideración de la autoevaluación, coevaluación y

heteroevaluación para el logro de una interacción constructiva de los
participantes.
h) Aprovechamiento de logros anteriores en todo el proceso y al final

del mismo, atendiendo a criterios previamente establecidos y a su aplicación.
FUNCIÓN
En este sentido, la evaluación contempla tres funciones:
- Explorativa: tiene como propósito, obtener información sobre los

conceptos y experiencias que el alumno posee, para construir
significativamente su propio aprendizaje y al mismo tiempo proporciona
herramientas al docente para la planificación del proceso enseñanza
aprendizaje.
En tal sentido se debe explorar en el alumno:
a) Disposiciones, sentimientos, valores, actitudes y aptitudes.
b) Cómo aprende: hechos, conceptos, representaciones y esquemas,

que permitan conocer el punto del cual parte y establecer necesidades previas.
c) El sentido, significación y utilidad de lo aprendido.
d) Carencias, incomprensiones y errores, para corregirlos y superarlos

con el fin de garantizar el éxito en el aprendizaje.
e) Logros alcanzados después de un tiempo de aprendizaje.
- Formativa: Tiene como propósito observar, investigar y reflexionar

constantemente con el alumno su proceso de aprendizaje, para iluminar lo que
está ocurriendo y a la vez ofrecer retroalimentación y acciones necesarias para
estimular y mejorar su aprendizaje.
La evaluación de procesos tiene carácter dinámico y formativo, debe

estar estrechamente vinculada con las actividades de enseñanza y de
aprendizaje, y ser realizada fundamentalmente a través de procedimientos
informales que permitan:
a) Conocer los progresos de los alumnos.
b) Determinar las causas de sus deficiencias y éxitos.
c) Propiciar situaciones donde se manifiesten rasgos del alumno:

hábitos de trabajo, dedicación, responsabilidad, disposición, integración del
grupo, actitudes, manifestaciones intelectuales y potencialidades entre otras.
d) Analizar con sentido crítico la participación en el trabajo tanto del

alumno como del profesor.
e) Acumular juicios descriptivos, que permitan evidenciar los

progresos y las limitaciones que requieran una atención esmerada en beneficio
del aprendizaje del estudiante.
f) Planificar nuevas acciones educativas tomando en consideración los

contenidos conceptuales, procedimentales y actitudinales adquiridos por los
alumnos, para continuar la labor educativa.
g) Elaborar criterios para la promoción de los alumnos, tomando en

cuenta los aspectos conceptuales, procedimentales y actitudinales, la madurez
del aprendiz, aptitudes, habilidades y destrezas, capacidades e intereses para la
resolución de la realidad.
h) Implementar las diferentes formas de participación de la evaluación:

autoevaluación, coevaluación y heteroevaluación como herramientas de la
evaluación de procesos.
Final: Cumple con la función administrativa de la evaluación, con ella

se pretende:
a) Recoger y analizar evidencias sobre los resultados obtenidos durante

el proceso de aprendizaje.
b) Determina el nivel de logro de competencias fijadas, en términos de

criterios de evaluación previamente establecidos.
c) Proporcionar información relevante para promover al alumno,

tomando en consideración el conjunto de observaciones hechas durante el
proceso sobre: consecución de objetivos educacionales, acciones concretas
para mejorar el aprendizaje, capacidades, actitudes, posibilidades y
limitaciones de los alumnos y los criterios de evaluación establecidos
previamente.
d) Proporcionar información a los:
- Alumnos, para asumir la responsabilidad que les corresponde en la

continuidad del proceso de aprendizaje y para que conozcan sus capacidades,
aptitudes e intereses, que determinan su crecimiento integral.
- Docentes, para otorgar una calificación basada en la acumulación de juicios
descriptivos sobre cl proceso de aprendizaje del estudiante.
COOPERATIVA
Concebida como una labor conjunta de todos los participantes para:
- Propiciar niveles de relación, comunicación e información constante.
- Integración de juicios, perspectiva y apreciaciones con carácter

deliberativo y negociado.
- Flexibilizar la aplicación de criterios de evaluación que se

seleccionen.
- Mantener una visión multidireccional.
Formas de participación
AUTOEVALUACIÓN
Es un proceso que permite el autodesarrollo del alumno, por cuanto

identifica sus posibilidades y limitaciones para hacerlo consciente de los
cambios necesarios para su propia actuación.
Mediante la autoevaluación el alumno:
a) Emite juicios de valor sobre sí mismo en función de ciertos criterios

o puntos de referencia.
b) Analiza y describe sus actividades, características y la variedad de

causas de sus éxitos y fracasos.
c) Estimula la retroalimentación constante de sí mismo y de otras

personas para mejorar su actuación.
d) Participa críticamente en la construcción de su aprendizaje.
e) Evalúa todo el proceso, así como su propio interés, dedicación,

atención, preparación anterior, actitud frente a la materia, ritmo de trabajo y
progreso en su desarrollo, para decidir cual fue la causa del acierto y del error.
f) Evita errores y sus causas que le ayudarán a planear mejor la

actividad.
COEVALUACIÓN
Es un proceso de valoración recíproca que realizan los alumnos sobre

su propia actuación y la del grupo, atendiendo a ciertos criterios previamente
establecidos.
Mediante la coevaluación el alumno:
a) Determina los logros personales y grupales.
b) Incrementa su participación, reflexión y crítica constructiva ante

situaciones específicas de aprendizaje.
c) Aporta soluciones para el mejoramiento individual y grupal.
d) Opina sobre su actuación en el grupo.
e) Desarrolla su capacidad de líder.
f) Desarrolla actitudes para la integración del grupo.

g) Mejora su responsabilidad e identificación con el trabajo.
h) Posee libertad para emitir juicios valorativos acerca de otros porque

es parte activa del proceso.
HETEROEVALUACIÓN
Es un proceso de valoración recíproca que se realiza entre los agentes

educativos (alumno, docente, equipo de docentes, padres y representantes,...),
con el objeto de lograr el mejoramiento y la calidad de su actuación.
La heteroevaluación se fundamenta en una evaluación continua donde

cada uno de los agentes:
- Recoge e interpreta datos que evidencian el desarrollo del proceso

educativo.
- Acumula una serie de datos integrales acerca de la actuación del

alumno.
- Saca conclusiones sobre el progreso del alumno, los métodos de

enseñanzas empleados y la participación y colaboración de los padres y
representantes en el proceso educativo.
PLANIFICACIÓN DE LA EVALUACIÓN
La planificación de la evaluación debe estar estrechamente vinculada

con el proceso interactivo de la clase. Esto significa que el docente al
planificar debe incluir los elementos relacionados con la evaluación, tales
como: el qué, el cómo, el con qué y el cúando evaluar.
EL QUÉ EVALUAR
Vendrá dado por los objetivos generales de grado, las competencias

derivadas de los mismos y los criterios de evaluación establecidos para definir
el logro alcanzado por los alumnos.
Las competencias representan el nivel de desempeño que debe

demostrar el. alumno al final de la etapa.
La primera Etapa de Educación Básica contempla tres grados, en cada

uno de estos grados debe aspirarse al logro de las competencias básicas, los
cuales permitirán, una vez evidenciadas, tomar decisiones para:
a) Nivelar o recuperar a los alumnos con la ayuda de docentes, padres o
representantes así como de tutorías de alumnos más avanzados.
b) Ubicar a los alumnos en un grado de acuerdo con las competencias

logradas.
c) Promover al alumno una vez que haya adquirido las competencias

generales de la etapa.
Para evaluar las competencias se deben establecer criterios e

indicadores de logro, a través de los cuales se podrá evidenciar los progresos
alcanzados por los alumnos.
Indicador: es la señal que permite evidenciar el dominio de la

competencia. Permite establecer diferencias cualitativas y cuantitativas en
logro de la misma.
Criterio: implica la norma o recurso que permite evidenciar el nivel del

logro de la competencia del alumno, es decir, convalidar lo que sabe, qué hace
y cuáles son sus actitudes
Es importante que el docente al evaluar tenga presente la consideración

de estos aspectos (indicadores y criterios de la evaluación) a fin de evitar el
azar, la costumbre o la rutina, la arbitrariedad e irracionalidad.
EL COMO EVALUAR
A través de:
a) Situaciones relacionadas con lo enseñado que involucren lo

conceptual, procedimental y actitudinal.
b) Las tareas donde se manifieste el grado de significación de lo

aprendido en el desarrollo de la clase.
c) Actividades continuas que proporcionen información sobre todo el

proceso, atendiendo el carácter dinámico de la evaluación.
d) Una gama diversa de actividades de evaluación que permitan la

transferencia de lo aprendido a situaciones diferentes.
e) La utilización de distintas estrategias de evaluación: actividades,

funciones, formas de participación y diversas técnicas y procedimientos que
permitan orientar el proceso de aprendizaje del alumno.
En el siguiente cuadro se presenta una propuesta que permite visualizar

cómo evaluar:
EL CON QUÉ EVALUAR
Con instrumentos que además de aportar la información que se

requiera, que sean capaces de promover la interrelación docente - alumno.
Se recomienda el empleo de instrumentos que se caractericen por:
a) Recoger aspectos concretos y al mismo tiempo permitan la

incorporación de otros no previstos.
b) Ser de fácil interpretación y manejo diario.
c) Evitar en lo posible el sesgo cuantitativo.
Entre algunos de los procedimientos e instrumentos de evaluación

recomendables para la primera etapa de Educación Básica figuran:
EL CÚANDO EVALUAR
No se dispone de una fecha prevista para evaluar. La evaluación tendrá

carácter continuo, basada en observaciones permanentes sobre la actuación de
cada alumno para determinar e interpretar sus progresos, limitaciones, ritmos
y estilos de aprendizaje, aptitudes, intereses que permitan realizar el análisis
del proceso. Será responsabilidad del plantel en atención a sus necesidades y
al proyecto pedagógico de aula que decidirá la periodicidad o frecuencia de
información a padres y representantes, del progreso de su representado.
Asimismo se recomienda que esa información llegue tanto al representante
como al alumno, a través de los portafolios y registros descriptivos, de manera
que puedan percibir cómo el estudiante ha evolucionado en su aprendizaje y
cuáles han sido los progresos alcanzados.
Profa. Dra. María Dolores García Fernández.

Universidad de Córdoba.
PERSPECTIVAS DE LA EVALUACIÓN
House (1980-1983) ha puesto de manifiesto que las diferentes perspectivas

de evaluación son dependientes de diversas concepciones filosóficas. Así en cuanto a
teorías del conocimiento las agrupa en dos grandes tendencias: Objetivismo y
Subjetivismo. Para el objetivismo, dependiente de una tradición empirista en las
ciencias sociales, la evaluación requiere que la información sea "objetiva
científicamente", es decir que tanto los datos como los análisis realizados puedan ser
reproducidos y verificados por otras personas competentes utilizando las mismas
técnicas. Desde una epistemología subjetiva la validez depende de "una llamada
a la experiencia más que al método científico. El conocimiento científico se concibe
más como algo tácito que explícito (House, 1980:252). La validez de una evaluación
depende de los hechos replicables como base de la verdad, para el subjetivismo
depende de las experiencias acumuladas como base de la comprensión.
GRANDES ORIENTACIONES EN LA EVALUACIÓN
Hay diferentes enfoques, marcos u orientaciones sobre la evaluación; Aoki

(1991) expone las cuatro grandes orientaciones que comprende:
1.- Orientación medios-fines.
2.- Orientación práctica.
3.- Orientación emic.
4.- Orientación crítico-hermenéutica.

Cada una de ellas se corresponde con los grandes paradigmas que se han
destacado, a partir de la teoría de los intereses cognoscitivos de Habermas: El
Empírico-Analítico con la orientación medios-fines, paradigma cuantitativo; el crítico-
reflexivo con la orientación de la praxis paradigma cualitativo; y la situacional-
interpretativa la subdivide en emic y crítico-hermenéutica, el paradigma crítico.
Los intereses de los evaluadores que actúan con una orientación medios-
fines dentro del paradigma cuantitativo reflejan cuestiones como las siguientes:
1.- ¿Qué efectivos y eficientes son los medios usados en conseguir los fines y
objetivos curriculares?.
2.- ¿Cuál es el grado de congruencia entre resultados pretendidos, contenido de

los materiales curriculares y los métodos de enseñanza especificados?.
3.- ¿Cómo de bueno es el curriculum A comparado con el curriculum B en

conseguir los fines dados?.
4.- Dados unos currícula, ¿cuál de ellos implica menor coste y tiempo?.
5.- ¿Qué generalizaciones válidas pueden hacerse para todas las escuelas en una
zona o distrito?.
En la orientación medios-fines nos interesa reflejar una orientación de la

evaluación que puede ser caracterizada como técnica o instrumental. Como acción
instrumental, orientada al éxito con arreglo a fines, "a partir de un horizonte de
valores claramente articulado selecciona fines y organiza los medios apropiados
teniendo en cuenta los efectos secundarios alternativos" (Habermas, 1989:384).
ORIENTACIONES INTERESES CAMPO DE MODO DE

CONOCIMIENT EVALUACIÓN
O
MEDIOS-FINES El control se imitada al campo Medida de la

refleja en de los hechos, discrepancia entre
valores de contenidos, medios y fines. Basada
eficacia, generalizaciones, en los objetivos, con
efectividad, leyes y teorías. referencia al criterio,
certeza y La creencia clave coste-beneficio, tasación
predictibilida es la posibilidad y consecución.
d. de progreso.
Fidelidad
entre medios
y fines.
PRÁXICA Acción Comprender las Descubrir las ideologías

emancipatori asunciones subyacentes al
a que mejora ocultas, conocimiento y a la
la condición perspectivas, acción.
humana. motivos,
Cualidad de racionalizaciones
la reflexión y e ideologías.
de la acción
Conocimiento
crítico unido a la
acción.
EMIC Cualidad de Conocimiento Perspectiva de estudios

vida cultural descriptivo, de casos etnográficos.
cotidiana. denso de la Perspectiva
Reglas cultura. La etnomenológica.
tácitas con realidad se
que la gente entiende como
vive en su socialmente
vida diaria. construida.
CRÍTICO- Revelación Intuiciones Perspectiva

HERMENÉUTICA de los dentro de las fenomenológico-
significados situaciones hermenéutica. Búsqueda
existenciales humanas únicas. crítica de lo que significa
en la Concretado en el ser humano.
experiencia mundo vivido de
vivida. la existencia.
Cualidad de
la existencia
humana
Sumario de modos de entender las orientaciones en evaluación.
Por su parte, la orientación práxica (crítico emancipadora)está interesada

en otro tipo de cuestiones, que difieren de la orientación técnica, como son las
siguientes:
1.- ¿Cuál es la orientación subyacente en el curriculum A en términos de sus

intereses fundamentales, sus asunciones y enfoques?.
2.- ¿)Cuál es el punto de vista implícito de los alumnos y del profesor que
ayuda a los planificadores del currículum?.
3.- A nivel más básico ¿a qué intereses sirve el currículum?.
4.- ¿Cuáles son las metáforas fundamentales que guía a los que desarrollan,
implementan o evalúan el curriculum?.
5.- ¿Cuál es el prejuicio básico de los editores o autores de los materiales y

recursos prescritos o recomendados?.
6.- ¿Cuál es la cosmovisión que subyace al currículum?
Este conjunto de intereses refleja una orientación en la evaluación vista desde

una teoría crítica de la sociedad neomarxista. Los evaluadores práxicos están
interesados en poner de manifiesto los intereses, asunciones, cosmovisiones,
etc., revelando las condiciones ideológicas que hacen posible el conocimiento, las
distorsiones que subyacen en la existencia humana, produciendo alienación. En lugar
de una racionalidad de medios-fines, la orientación práxica toma un marco dialéctico
entre acción práctica y reflexión crítica, a lo que Paolo Freire llama Praxis. Este
proceso reflexivo no pretende sólo poner de manifiesto estos supuestos, sino entrar
en un proceso de transformación de la realidad evaluada. Por la explicitación de los
supuestos ocultos o inconscientes de los afectados, se les sitúa en condiciones para
liberarse o transformarlos, en la actitud moral de emanciparse de ellos.
La orientación emic, por analogía con su empleo en antropología, pretende
comprender los valores, creencias y actividades en su situación vivida por aquellos
que están inmersos en la situación evaluada. Las cuestiones que preocupan a una
evaluación desde esta perspectiva son:
1.- ¿Cómo comprender la cualidad de un currículum en la microcultura de la

clase?.
2.- ¿Cómo ven el currículum A varios grupos (alumnos, profesores, padres y

administradores)?)Qué valor tienen estas visiones?
3.- ¿Cómo estos grupos ven la fuerza y debilidad de un currículum

determinado?.
4.- ¿De que modo estos grupos aprueban o desaprueban un currículum

determinado?.
5.- ¿Cuáles son las reglas construidas por el grupo para un currículum
determinado en esta clase?.
Los evaluadores están interesados en los patrones etnoculturales de la vida

en las situaciones escolares. La mayoría de los evaluadores de esta orientación están
interesados en la construcción social de la realidad desde un punto de vista
antropológico o sociológico.
La orientación crítico-hermenéutica está interesada "en la búsqueda de

los significados ontológicos en la experiencia vivida de los alumnos, profesores,
administradores y padres" (Aoki, 1991:103). Estos intereses se centran en la
existencia, vivencias y experiencias que tienen los alumnos y profesores en la vida
del aula.
1.- ¿Cómo es la existencia de un profesor o alumno en esta clase?.
2.- ¿Cómo viven la experiencia en esta clase?.
3.- ¿Cuál es la cualidad de las experiencias vividas de los profesores y

alumnos?.
4.- ¿Cómo son experienciados los contenidos trabajados?.
5.- ¿De qué modo se corresponden pedagógicamente conjuntamente lo que

los profesores hacen y enseñan?.
La cuestión más importante no es lo que se enseña, sino cómo es vivido; por

tanto una evaluación con esta orientación pretende transcender la objetividad. La
orientación que Aoki llamada crítico-hermenéutica se interesa por las
intuiciones en las experiencias humanas como vivencia, sus esfuerzos se dirigen a
clarificar, y unir las estructuras de significado de la experiencia vivida; para esto
emplea situaciones de diálogo que puedan clarificar los motivos, las experiencias
auténticas, y los significados comunes. Más que una perspectiva "emic", le importa
entrar profundamente en conversación intersubjetiva con la gente en una situación
de evaluación.
APROXIMACIONES TEÓRICAS EN LA EVALUACIÓN: MODELOS.

Proppe (1990) se basa en la definición de Stake y Dewey (1969) "desde una
perspectiva amplia, la evaluación es el descubrimiento de la naturaleza y el
valor de algo" indicando algunas características comunes:
A) Supone conocer el fenómeno a evaluar y determinar su valor.
B) Se realiza en un contexto de acción.
C) Hay que tomar decisiones y se toman en determinados momentos, en

base al proceso y resultados de la evaluación.
D) Es un proceso de aprendizaje, descubrimos la naturaleza y el valor de

algo.
Este autor hace un recorrido por tres paradigmas fundamentales: cuantitativo,

cualitativo y dialéctico, analizando la evaluación en cada uno de ellos.
a) EL PARADIGMA CUANTITATIVO. Es positivista, está fundamentado en

el positivismo, se identifica la autoridad con el experto, basada en una
imagen dualista (sujeto/objeto), en el que la ciencia es el único camino de
conocimiento y la realidad como el único objeto posible de conocimiento.
La evaluación "acrítica" se fundamenta en el interés por el control, la
eficacia y eficiencia.
Por tanto este enfoque se refiere a los resultados de un proyecto,

programa etc. Pero el énfasis de los resultados, nos aporta muy poco
sobre la calidad de los objetivos propuestos. Como es conocido el Comité
sobre Estándares de Evaluación desarrollo una serie de ideas y normas en
base a una definición de evaluación más amplia:"Investigación
sistemática sobre el valor o mérito de algún objeto"(1981).
Esta nueva definición amplía las formas de evaluar y determinar la

eficacia de los objetivos propuestos . Bajo este concepto se han realizado
experiencias de evaluación con el objeto de controlar y evaluar los efectos
del curriculum en las escuelas, para mejorar el nivel de logro de los
estudiantes.
b) EL PARADIGMA CUALITATIVO. Tanto la evaluación como la

investigación, se interesa por saber qué está sucediendo, qué ha
sucedido y que significado tiene o ha tenido para diferentes
grupos. Es por lo que no pretende formular leyes universales, sino
comprender el significado que constituye socialmente.
Según Madans y Kellagham (1992) hay varios tipos de evaluación

cualitativa:
1.- La interpretativa. El evaluador estudia los significados y significantes

que se asignan a los sucesos por los actores, en un contexto
social. Solo se pueden comprender los significados desde el punto
de vista del actor, porque estos no se pueden entender desde
criterios externos, sino desde una visión interpretativa de lo
subjetivo.
2.- La artística. Supone una representación narrativa de los

descubrimientos del evaluador. Para Eisner (1983) son
fundamentales la inducción y la observación. La percepción es
muy importante para el evaluador ya que así, puede captar
cualidades y relaciones que existen entre el profesor y el
estudiante.
3.- La sistemática. Comparte con el enfoque tradicional el enfoque de la

orientación de la investigación hacia "un mundo real" externo a
los individuos, por otro lado rechaza la posición positivista con
respecto a que el mundo externo sea el único elemento que
determina la visión que se debe tener de la realidad, con
independencia del proceso o de las circunstancias. Pretende
ofrecer una visión objetiva, válida y fiable pro medio de la
triangulación.
Proppe (1990) señala que esta visión mantiene la lealtad al dualismo

sujeto/objeto, pero cada hecho educativo debe ser entendido en
su contexto y cultura. El fundamento de la evaluación, está en el
interés por el significado de la comunicación intersubjetiva entre
los individuos y "sobre ellos" en una situación dada.
Los esquemas de evaluación deben poner énfasis en la mejora de la

calidad del proceso de aprendizaje y las formas de motivación intrínseca,
más que en la certificación.
Por otra parte, es importante establecer mecanismos para que el

alumno tenga acceso a los datos y se cuide la confidencialidad y la
privacidad de los mismos. Esto implica que se reduzca el rol de la
evaluación como elemento de selección.
c) EL PARADIGMA CRÍTICO. Desde el paradigma crítico, se propugna la

acción, en forma de evaluación dialéctica. El evaluador se relaciona con la
posibilidad de que todos los seres humanos se convierten en participantes
en la "acción comunicativa", por ello, debe ser el catalizador del diálogo,
en un proceso dialéctico que transcienda la dualidad sujeto/objeto. Esta
evaluación se basa en el interés por la emancipación respecto a supuestos
ocultos o condiciones humanas subyacentes, como la comunicación
"sistemáticamente distorsionada" (Habermas, 1987).
Así pues, el proceso de evaluación es un proceso de reflexión y

autoreflexión, en el que el evaluador se convierte en un auténtico agente
de cambio. Por tanto, la evaluación dialéctica es un proceso de recogida y
ofrecimiento de información, pero también un proceso de diálogo,
metaevaluación, análisis de la comprensión del mundo, autoreflexión y
autocomprensión.
Para Madans y Kellagham (1992), la "crítica-emancipatoria" pretende

generar conocimiento que ayude a las personas a hacerse conscientes de
si mismas y a decidir con criterio personal. La evaluación, entonces,
supone una tarea de negociación para ayudar a construir significados y
revelar los significados construidos.
Desde este planteamiento, se muestra la evaluación formal de la

excelencia escolar. Juzgar el valor de algo, es valorar su excelencia. La
excelencia para Perrenoud (1990) tiene que ver con los distintos ámbitos
y tareas de la vida humana. La excelencia se identifica con competencia y
esta con el poder de "poner en práctica conocimientos, saber hacer,
técnicas, que no todas pueden dominar con facilidad, exigiendo una
asimilación progresiva y un trabajo.
La evaluación informal es constante en una clase, dado que la
búsqueda de la excelencia forma parte de la situación. Este tipo de
evaluación informal, que se integra en el flujo de las interacciones diarias,
no está codificada, ni registrada, ni negociada.
En cambio, la evaluación formal, que consiste en valorar el grado de

dominio del curriculum, implica a la organización escolar. Fija oficialmente
el nivel de excelencia reconocido a cada alumno. Este tipo de evaluación
suele ser escrita y normalizada en cuanto a su forma, personalidad,
difusión y en cuanto a sus consecuencias referentes a promoción, apoyo
pedagógico y orientación.
El análisis de la evaluación en la educación primaria nos lleva a una crítica

del sistema de evaluación formal por calificaciones estableciendo
diferentes niveles de excelencia sin saber muy bien cuales son los
criterios que los guían. Es por lo que , Gimeno (1992), nos consta que la
evaluación es "una práctica ampliamente rechazada por los alumnos y
bastante molesta y engorrosa para muchos profesores".
Scriven y House, dos importantes filósofos de la ciencia, hacen hincapié en la

constitución de la evaluación como disciplina, y destacan el componente ético de la
evaluación.
En nuestra opinión, no hay paradigmas sustantivos propios de evaluación,

éstos son dependientes de grandes enfoques o paradigmas de la educación o, más
ampliamente, de acción social. Por eso es más conveniente hablar de modelos de
evaluación, en lugar de paradigmas. Perez Gómez (1983c) y Hopkins(1989:18) hablan
de "modelos", Aoki (1991) de "orientaciones", Worthen y Sanders (1987) de "puntos
de vista alternativos". Worthen (1990) señala: "El valor de los modelos yace en su
habilidad para ayudarnos a pensar, para proporcionar fuentes de ideas y técnicas
nuevas, para servir como listas mentales con las que repensar lo que debemos
considerar, recordar o de lo que debemos preocuparnos ".
1.- Enfoques orientados a los objetivos: Cuyo foco son los fines y objetivos específicos
y en qué grado han sido conseguidos.
2.- Enfoques orientados a la gestión: Cuya principal preocupación es identificar y

reunir las necesidades informativas para los gestores que han de tomar decisiones.
3.- Enfoques orientados la consumidor: Evaluar los "productos" para proporcionar

información a los consumidores para elegir entre curriculum alternativos, materiales y
recursos educativos, etc.
4.- Enfoques orientados a los expertos: Dependientes primariamente de las

aplicaciones de profesionales expertos para juzgar los programas educativos.
5.- Enfoques orientados al adversario: El foco central de la evaluación es la

planificación de oposición de puntos de vista (pro y contra) de diferentes evaluadores.
6.- Enfoques naturalistas y orientados a la participación: Investigación e

implantación de los participantes (o "afectados"), para determinar los valores,
necesidades, criterios y datos de la evaluación.
Clasificación de los distintos enfoques de evaluación (Worthen y Sanders,

1987).
Desde el contexto inglés a Hopkins (1989) le parece bien distinguir seis
modelos de evaluación:
1.- Modelo clásico (o agrícola-botánico).
2.- Modelo de investigación y Desarrollo (o de factoría industrial).
3.- Modelo iluminativo ( o antropológico).
4.- Model o de toma de decisiones (o político).
5.- Modelo del profesor como investigador.
6.- Modelo de estudio de casos.
Referido fundamentalmente a la evaluación de programas, Alkin y Ellet

(1991), hablan de que los modelos de evaluación se pueden utilizar en dos sentidos:
1) Modelos preceptivos, son aquellos que proporcionan un conjunto de

normas, preceptos, prohibiciones y líneas orientativas que determinan qué
es una evaluación adecuada y el mejor modo de llevarla acabo.
2) Modelos descriptivos: son aquellas descripciones o análisis sobre los

modos de hacer la evaluación en la práctica. "Los modelos preceptivos
brindan marcos y estrategias más rigurosas para realizar evaluaciones,
mientras que los modelos descriptivos presentan una amplia gama de
posibilidades válidas" (Alkin y ellet, 1991:2574).
Worthen y Sanders (1987:49 y ss.) estiman que los diferentes planteamientos

filosóficos sobre el conocimiento y los valores tienen su correspondiente implicación
en los métodos. Los dos aspectos metodológicos más importantes para llevar a cabo
estudios evaluativos son:
A.- Investigación cuantitativa/cualitativa.
B.- La dificultad encontrada por los evaluadores al trabajar a través de límites

disciplinares y metodológicos.
MODELOS CUANTITATIVOS: EL MODELO DE EVALUACIÓN POR OBJETIVOS.
Las bases del primer método sistemático de evaluación surgen a partir del
modelo de Tyler, al proponer una formulación precisa de objetivos como punto de
referencia para la evaluación y la toma de decisiones. Este método tuvo gran
influencia al utilizar la medición, adquiriendo un sentido de legitimación con el
paralelismo de la investigación científica. Tyler diferenció medida y evaluación,
añadiendo que la medida era la parte descriptiva de la evaluación y la explicación
completaba el proceso de evaluación.
Tyler apuntó la necesidad de la evaluación, ya que, según él, no basta con

haber planificado correctamente para lograr unos resultados determinados, puesto
que existen múltiples diferencias individuales entre los estudiantes, los ambientes en
los que se desarrolla la enseñanza y la capacidad del docente para lograr los planes,
hay que descubrir hasta qué punto las experiencias de aprendizaje han logrado los
efectos previstos (Nevo,1989).
Fases de la evaluación:
1.- Determinación de los objetivos específicos de cada área de
contenido.
2.- Identificar situaciones en las que los estudiantes puedan demostrar
la conducta expresada en los objetivos.
3.- Examinar o desarrollar instrumentos capaces de probar cada
objetivos.
4.- Aplicar los instrumentos, dentro de un modelo pretest-postest,
para comprobar que se han dado cambios y que pueden se
imputados al currículum.
5.- Examinar los resultados para determinar la áreas del currículum
más fuertes y más débiles.
6.- Desarrollar hipótesis y probarlas para explicar los patrones
observados de consistencia o debilidad.
7.- Hacer modificaciones apropiadas en el currículum.
Sin embargo Tyler no dio normas sobre cómo usar los datos de la evaluación.
Se le criticó que su evaluación no es explicativa, que ignoraba los juicios sobre la
dignidad y mérito, es decir, que no evaluaba los objetivos. Tyler entendió la
evaluación como un proceso terminal, refiriéndose a los productos o el rendimiento
como único criterio, sin, además, proporcionar estándares para saber cómo juzgar la
discrepancia entre las medidas y los objetivos propuestos.
MODELOS DE TRANSICIÓN HACIA LA EVALUACIÓN CUALITATIVA
Stake (1967, y 1975, según Guba y Lincoln, 1985 y Sttuflebeam y Sinkfield,

1989), propuso objetivos para las condiciones contextuales y para la conducta del
profesor, y no solo para los alumnos, con lo cual la evaluación debe tener otro
alcance: se desplaza desde la valoración de los alumnos a la evaluación de
programas.
a) El modelo CIPP (Context, Imput, Process, Product). La evaluación

orientada al perfeccionamiento de los sistemas.
Este modelo de Sttuflebeam (Sttuflebeam y Sinkfield, 1989), se basa en la

necesidad de mejorar la práctica educativa. Para ello es preciso diseñar, obtener y
proporcionar información útil para juzgar alternativas de decisión, y comparar con las
necesidades de la gente a la que debe servir, para poder juzgar su valor.
Según el autor las funciones de la evaluación son:
- Servir la guía para la toma de decisiones.

- Proporcionar datos para la responsabilidad.
- Promover la comprensión de los fenómenos implicados.
Sttuflebeam, incluye en el modelo la técnica del grupo asesor para la

evaluación de entradas, con sus principales cometidos.
b) Modelo de evaluación libre de objetivos.
Para Scriven (1978), la evaluación es un proceso que implica descripción y

juicio o valoración, es decir, la función de la evaluación está en conceder valor a lo
que se está evaluando.
Por un lado, puede tener valor en si mismo, algo inherente e independiente de

posibles aplicaciones, lo cual define Scriven como mérito, es decir, valor libre de
contexto. Pero además esa realidad que se evalúa puede tener valor dentro de un
contexto de uso o aplicación, en cuyo caso, el valor está en la medida en que
proporciona tales soluciones, es un valor extrínseco que el autor llama dignidad. Sin
embargo tanto el mérito como la dignidad son valores variables, en cuanto a las
personas que juzgan debido a sus distintos indicadores de esos valores.
La evaluación del mérito puede ser más homogénea, si se establecen los

criterios de bondad, si se juzga conforme a ellos. Pero la determinación de la dignidad
requiere una evaluación en el contexto en el que se realiza, lo cual tienen sus efectos
más importantes, en los referente a las estrategias de la difusión de programas de
innovación, porque el valor depende de la situación, pero también teniendo en
cuenta el valor que tienen para varias audiencias, a la que se dirige la evaluación.
Debido a esto Scriven, establecerá la diferencia entre evaluación formativa y

sumativa. El objetivo de la evaluación formativa es refinar y mejorar los criterios y
juicios sobre los aspectos intrínsecos de las realidades que están siendo evaluadas. El
objetivos de la evaluación sumativa es determinar el impacto o los resultados en el
contexto en que se obtienen tales resultados.
A continuación se muestra, según Guba y Lincoln, las relaciones entre tipos de

evaluación y su objetivo:
TIPO DE MÉRITO VALOR

EVALUACIÓN
FORMATIVA Intención: modificar y mejorar el Intención: ver las adecuación
diseño. al contexto.
Audiencia: equipo que lo desarrolla. Audiencia: equipo de

adaptación local.
Fuente de estándares: panel de
expertos. Fuentes de estándares:
juicios y valores del contexto
local.
SUMATIVA Intención: crítica, certificado y Intención: certificado y
justificación. justificación para uso local.
Audiencia: compañeros Audiencia: los que toman

profesionales, adaptadores decisiones locales.
potenciales.
Fuente de estándares: juicio
Fuente de estándares: panel de sobre las necesidades locales
expertos
Especifica el valor y el mérito en cada tipo de evaluación, según Scriven (Guba y

Lincoln, 1985,p.50).
La evaluación sumativa, para Scriven, debe realizarse por un experto,

evaluador externo, que aumente la objetividad y los resultados deben hacerse
públicos. Además puede ayudar a los administradores a decidir si implantar a nivel
general un currículum o programa o modificarlo. Sin embargo la evaluación
formativa es más propia de los profesionales que están tendiendo a una
profesionalización de esta, aunque se tiende a una profesionalización de esta, como
muestra Bridges (1988) en la siguiente tabla donde se resumen las condiciones
necesarias para ello.
Además propondrá la evaluación libre de objetivos, es decir, evaluar el

programa en sus efectos, al margen de los objetivos previstos, sin excluir que algún
evaluador o momento de la evaluación determine el grado de consecución de los
objetivos planteados.
El problema surge cuando se valoran los efectos sin criterios, de ahí que se
evalué sin referencia a objetos, y cuyo criterio serán las necesidades de los sujetos
a los que se dirige el programa.
CRITERIOS HACIA UNA INFLUENCIA MÁS HACIA MAYOR

FORMATIVA Y MENOS INDEPENDENCIA Y UN
INDEPENDIENTE INFLUENCIA MENOS
FORMATIVA
INFORMES Dialogo continuo formal o Documentos escritos
informal con los directores los producidos después de haber
que tomas decisiones. realizado la práctica.
VALORES Base común de valores El evaluador tiene distintos
compartidos entre evaluadores valores que los que desarrollan
y los que desarrollan el el programa.
programa.
STATUS Se percibe al evaluador en un Se percibe al evaluador como
status más o menos igual que en un status diferente y
los que desarrollan el programa. particular.
DESCRIPCIÓN/PRESCRIP El evaluador entrará en la El evaluador describe, analiza
CIÓN discusión sobre estrategias e informa solamente.
alternativas, o acciones
recomendadas
CERCANÍA/DISTANCIA El evaluador desea la iniciativa El evaluador tiene una posición
para el éxito y siente alguna de curiosidad imparcial,
responsabilidad en este éxito. escepticismo y oposición
Diferencia entre una evaluación más formativa y una menos formativa (Bridges,
1988).
MODELOS CUALITATIVOS:
Dentro de ellos podemos destacar los siguientes:
MODELOS NATURALISTAS
Modelo de evaluación respondiente.
A continuación se presenta un cuadro comparativo entre la evaluación

preordenada, según el modelo de Tyler, y la evaluación respondiente de
Studie:
Item comparativo Evaluación preordenada Evaluación respondiente

Orientación Formal Informal
Perspectiva de valor Única, consensual Pluralista, posibilidad de
conflicto.
Bases el diseño de Objetivos del programa, Preocupaciones y problemas
evaluación hipótesis. de la audiencia.
Preconcepciones del Programa de actividades.
evaluador, sobre dominio,
habilidad, medida, aptitud, reacciones, motivaciones o
resultados. problemas de las personas en
y alrededor de la evaluación.
El valor instrumental de la
educación.
)Cuándo está completo el Al comenzar la evaluación. Nunca. Continuamente está
diseño?. evolucionando.
Rol del evaluador Estimulador de los sujetos con Estimulado por los sujetos y
visión de probar un las actividades.
funcionamiento crítico.
Métodos Objetivos, Test. Subjetivos: observaciones,
entrevistas, negociaciones e
interacciones.
Comunicación. Formal: informes, es un Informal, descripciones,
estadio típico. retratos, a menudo
progresivos.
Feedback Informe escrito, identificando Descripción narrativa, a
variables y sus relaciones, menudo oral, proporcionando
interpretación simbólica. modelos el programa,
proporcionando experiencia
variada, comunicación
holística.
Paradigma Psicología experimental Antropología, periodismo y
poesía.
Comparación de las formas de evaluación preordenada y respondiente

(Guba y Lincoln, 1989, p.28).
La evaluación respondiente (Stake, 1975) es sensible a las necesidades e

intereses de la audiencia, por lo que la primera fase hace referencia a los
problemas, dudas y necesidades. Una forma de identificar problemas es hablando
con los implicados. Estos problemas deben utilizarse para discusiones, y
posteriormente servirán para organizar el plan de recogida de datos, las acciones
correspondientes, y la búsqueda de soluciones. La forma del modelo quiere romper
la idea de linealidad, ya que la observación y la información deben ser continuas y
estar presentes en todas las fases.
Modelos de contraposición
Consiste en proponer evidencias sólidas en torno a los problemas para los

que se toman decisiones sobre los programas, siendo mejor si en el análisis de
dichos programas participan distintas personas que aportan visiones diferentes
sobre un mismo problema. De la discusión puede surgir la clarificación.
Para poder emitir juicios correctos, Owen propone algunos de los ámbitos de
discusión que se basan en la investigación sobre "pros" y "contras":
a) Para explorar los valores de un currículum, bien será el existente o el

propuesto.
b) Para seleccionar libros de texto.
c) Para estimar la congruencia entre una innovación y el sistema
existente.
d) Para revelar las distintas interpretaciones que distintos
representantes hacen sobre los mimo datos.
e) Para informar a los profesores, directores y administradores.
f) Para clarificar cuestiones en torno a los contratos de trabajo.
g) Para tomar decisiones sobre todas estas cuestiones.
Por otra parte, para Wolf, la evaluación judicial, está compuesta de cuatro
etapas:
a) Proposición de problemas relativos a la evaluación de un

programa. Dos elementos clave orientan esta tarea: los
objetivos del programa y las entrevistas al personal implicado,
así como la observación.
b) Selección de problemas sobre la priorización de los vistos. Tarea
para un grupo de implicados representante de los diversos
grupos.
c) Preparación de los argumentos. Tarea de dos equipos evaluativos
que deben reunir y analizar los datos convenientes.
d) Discusión ante la audiencia. Un jurado deliberará sobre los
argumentos presentados.
Modelo de evaluación iluminativa
Trata de comprender de forma amplia, a través de la inmersión en la

realidad, los procesos curriculares innovadores tal como ocurre, describiéndolos en
términos de factores influyentes, y tratando de desvelar las relaciones entre las
creencias y las prácticas, la organización y las concepciones de los individuos. Por
ello no sólo cuentan los hechos sino también las interpretaciones de las personas
implicadas. Todo ello se hace entre de un marco de negociación cuya meta es
facilitar la comprensión de los procesos por los propios participantes y servir de
estímulo a su enriquecimiento en el plano personal y tanto como en el grupal.
Sttuflebeam y Sinkfield (1989), señalan tres etapas:
a) Observación, abarcando todas las variables que afectan al

resultado del programa.
b) Investigación: Selección y planeamiento de cuestiones de manera
coherente y sistemática sobre el programa en su contexto.
Pueden utilizarse entrevistas, cuestionarios y tests, así como
el análisis de la información documental e históricas.
c) Explicación, etapa de iluminación. Se destapan los principios
subyacentes de la organización del programa y se ven las
posibles relaciones causa-efecto en sus operaciones.
Modelo de crítica artística
Este modelo se centra en procesos educativos y está muy ligado con la

formación del profesorado. Eisner (1979), defiende el modelo de evaluación
iluminativa, pero marca la diferencia del conocimiento que obtiene el
"entendimiento educativo"con el del antropólogo, quien no evalúa porque no
tienen interés pro mejorar la cultura. De ahí que proponga tres condiciones:
a) Disponer de valores para juzgar sobre el mérito y la dignidad de

un proceso educativo.
b) Poseer un conocimiento refinado, apreciación. Es personal y exige
desarrollo de la capacidad de percepción.
c) Tener crítica educativa, es decir, divulgar el conocimiento
obtenido para hacerlo comprensible a otros. Tiene la
siguiente estructura:
* Descripción, para que otros vean y experimenten los
contenidos a través de la forma.
* Interpretación, que facilite la comprensión de los hechos en
relación con los factores que influyen sobre ellos.
* Evaluación, o valoración educativa según unos criterios.
* Conclusión, generalización de la idea básica obtenida.
MODELOS CRÍTICOS.
La evaluación democrática.
Emerge de un marco teórico fenomenológico, interpretativo, que toma en

consideración el factor político y el tema del control y del poder en la evaluación,
sin embargo creemos que está a medio camino entre los modelos prácticos y lo
críticos.
McDonald (1983) piensa que las diferentes formas de evaluación responden

a diferentes posiciones sobre la distribución del poder educativo, distinguiendo tres
tipos:
a) Burocrática: Trabajos que sirven incondicionalmente alas agencias

gubernamentales con poder para distribuir los recursos educativos. El
evaluador acepta los valores de la autoridad, ofreciendo la
información necesaria para conseguir sus objetivos políticos. Los
informes pertenece a la administración y la técnicas deben ser
creíbles y eficaces.
b) Autocráticos: Servicio condicional a las agencias con poder para

distribuir los recursos. El evaluador se preocupa por
determinar el valor educativo de su política y actuar como
consejero. Los informes son burocráticos, científicos y públi
cos. Las técnicas son científicas. Se rige por los principios y la
objetividad y la responsabilidad profesional.
c) Democráticos: Servicio de información a la comunidad entera

sobre las características del programa educativo. Basado en el
derecho de sabe, cuyos conceptos claves son la negociación,
confidencialidad y accesibilidad. Reconoce la pluralidad de
valores. El rol del investigador es democratizar el conocimiento.
Las técnicas de recogida de datos son accesibles a personas no
especialistas. Los informantes tienen el control sobre el uso de la
información. Su finalidad es proporcionar datos relevantes para
los que tienen que tomar decisiones, iluminando las prioridades,
los valores y las circunstancias.
Lakomski (1983) critica la evaluación democrática de McDonald porque no

proporciona una respuesta política al problema de control. A su juicio se debe a la
aceptación de la perspectiva fenomenológica, que deja las cosas como están. Las
base para una evaluación democrática debe se la perspectiva o la epistemología
critica.
También critica la idea del evaluador como "agente honesto", puesto que
olvida que la actividad de evaluación está influenciada por los valores del propio
evaluador. Parece ser que se parte de la aceptación de que el pluralismo es la única
posición válida, cuando, según el autor, no es más que un sofisticado relativismo en
el que, cuando los diferentes grupos no están de acuerdo o entran en conflicto de
valores, se admite que no hay forma de establecer cuál de ellos es correcto porque
todos ellos son igualmente válidos. Pero el hecho de que no haya valores absolutos
no quiere decir que no haya criterios por los que lo evaluadores puedan juzgar lo
que debe hacerse en cada situación. Por lo cual será importante clarificar los
criterios para una evaluación democrática.
* Criterios para un evaluación democrática del currículum.
Partiendo de la definición de Kemmis (1989, p.119), "Evaluación es el

proceso de ordenación de la información de los argumentos que permiten participar
en el debate crítico sobre un programa específico a individuos y a grupos
interesados", considera que un programa de evaluación sobre desarrollo curricular
e innovación debe estar desarrollado por los siguientes principios:
1) Principio de la racionalidad como lo razonable: La tarea de

la evaluación es iluminar el razonamiento que guía el
desarrollo del programa, para identificar los factores
contextuales e históricos que influyen y facilitan el análisis
crítico de estos aspectos. Por ello es importante atender al
proceso de negociación de los participantes, ya que a través
de él se van cambiando las exigencias del programa en un
proceso de debate crítico o conservación
Para adoptar este principio es preciso partir de que la realidad es
social, histórica y culturalmente negociada. Lo que contradice el
principio de construir reglas y criterios universalmente válidos
para la aplicación de un programa.
2) Principio de autonomía y responsabilidad: Este principio
implica a todos lo participantes (profesores, evaluadores,
patrocinadores...). Se basa en el principio de autonomía moral
y cooperación o responsabilidad compartida entre los
patrocinadores del programa y los participantes, aunque
siempre hay elementos constrictores de la libertad e acción y
circunstancias que están más allá del control de los
participantes, los cuales deberá descubrirse mediante la
evaluación.
3) Principio de comunidad de intereses: El evaluador deberá
iluminar la extensión de los intereses comunes y de los
conflictos entre valores e intereses de los participantes de la
comunidad.
4) Principio de la pluralidad de perspectivas de valor: En la
evaluación hay que tratar de determinar cuáles son las
perspectiva más relevantes en el proyecto, e informar a la
audiencia para dar pie al debate sobre el programa.
5) Principio de la comunidad autocrítica: La evaluación debe
refinar el debate crítico, existente dentro de la comunidad,
sobre la naturaleza y la dignidad de un programa. La
metaevaluación puede ayudar a mejora la calidad de la
contribución el programa de evaluación, la evaluación externa
contribuir al debate crítico pro acrecentar la conciencia de
algunos intereses y valores relevante para el programa, y la
evaluación independiente puede ayudar a aprovechar la
autocrítica al programa allí donde el programa de la
comunidad es difuso o dividido por la controversia. De ahí que
la autocrítica sea la primera base para la evaluación.
6) Principio de propiedad en la producción y distribución de
información: Los argumentos y la información son un
aspecto importante de la evaluación porque su uso y abuso
afecta a los participantes y a los observadores del programa
en su vida social, ética y política. Por ello la evaluación deberá
hacer explícitos lo principios de procedimiento que gobierna la
dirección, producción y distribución de este proceso o de
elaboración de información.
7) Principio de conveniencia: El diseño de evaluación no es una
cuestión teórica o técnica sino práctica, y no debe realizarse
con relación a la "lógica interna" del modelo de evaluación
que se elija, sino en relación a las preferencias, necesidades,
obligaciones, circunstancias y oportunidades de los que serán
más estrechamente implicados en el programa.
LA EVALUACIÓN COMO INVESTIGACIÓN.
Suchman (1967) distinguió ente evaluación e investigación evaluativa.

Entendida la evaluación como el proceso de emitir juicio de valor, y la investigación
como la actividad científica que trata de aumentar la posibilidad de demostrar el
valor de alguna actividad social.
Weis (1989), considera que la evaluación es una actividad orientada a

determinar el valor de algo y, que la investigación pretende obtener conclusiones
generando nuevo conocimiento, definiéndola como aquella forma de evaluación que
establece criterios claros y específicos para el éxito.
Para este autor la investigación evaluativa es necesaria cuando:
- Los resultados que se quieren evaluar son complejos, difíciles de

observar y constan de muchos elementos que reaccionan de
diversas formas.
- Las decisiones que se derivan son importantes y caras.
- Se necesitan pruebas para convencer a otras persona acerca de
la validez de las conclusiones.
Es decir, debe aportar conocimiento suficiente porque los que toman

decisiones quieren y necesitan saber con qué grado de acierto está cumpliendo el
programa los objetivos para los que se estableció, y si se debe continuar con él
ampliarlo, reducirlo, cambiarlo o retirarlo.
Los supuestos básicos de la investigación evaluativa, según Suchman

(1967), son:
* La utilidad de los resultados debe ser el criterio fundamental del

evaluador.
* La investigación científica debe ser su modelo.
* La finalidad es ayudar en la planificación, desarrollo y operatividad de los

programas.
* Su característica fundamental, orientar a conocer cuál es el nivel de

consecución de alguna meta u objetivo existente de un programa,
definido por un valor.
* El estudio de casos en investigación curricular.

Según Pérez Gómez (1983), se entiende por estudio de casos el análisis de
una instancia en acción.
Ying (1987, citado por Marcelo y Parrilla 1991, p.13) define el estudio de
caso como un método de investigación que permite un estudio holístico y
significativo de un acontecimiento o fenómeno contemporáneo dentro del contexto
real en que se produce, en el que es difícil establecer lo límites entre fenómeno y
contexto, y que requiere el uso de múltiples fuentes de evidencia.
Las características del estudio de caso son definidas por diversos autores,
así, por ejemplo, Marcelo y Parrilla (1991) citan las siguientes: totalidad,
particularidad, realidad, participación, negociación, confidencialidad y accesibilidad.
Shulman (1992) subraya como característica, que el estudio de casos refleja

los problemas particulares de la enseñanza, y a través de ellos se puede conseguir
una visión clara de ello que sucede en la clase.
Walker (1989) considera el estudio de casos es el intento de investigar a

través de la experiencia de los sujetos del estudio para ofrecérselo a los que son
audiencia. Sin embargo el autor reflexiona sobre alguno problemas y los presenta
como razones para no hacer el estudio de casos:
a) El estudio de casos es una intervención, a menudo incontrolada,

sobre la vida de otros. Por ejemplo, la entrevista, la
observación de la enseñanza, el hablar cono profesores sobre
sus sentimientos, o con los alumnos sobre la enseñanza, son
medio des influir en la vida del centro.
b) El estudio de casos da una formación del mundo, ya que se hace
un selección para entrevistar, para que te hablen, de lo que
escribes, etc.
c) El estudio de casos es conservador, capta un instante en el
tiempo y el espacio y lo detienen frente a la realidad cambiante.
Nunca describe la realidad como es ahora.
LA EVALUACIÓN DEL CURRICULUM
EL CAMPO DE LA EVALUACIÓN DEL CURRÍCULUM
"Evaluación de curriculum" entendida como la evaluación de curriculum

diseñado, y/o como programa o contenido; al curriculum como resultado o
producto, que es evaluado en el aprendizaje de los alumnos. En ambos casos van
unidas. Como ha destacado Kvale (1992:121-2), la evaluación contribuye "la
determinación de lo que son los conocimientos válidos de una disciplina. (...) Los
conocimientos sobre una disciplina no sólo se transmiten en la enseñanza y se
comprueban en los exámenes, sino el mismo examen contribuye a establecer los
conocimientos válidos de una disciplina". En este sentido la evaluación legitima
el curriculum a aprender/enseñar/seleccionar en un campo de
conocimiento o disciplinar de una etapa educativa. Madaus y Kellagan
(1992:147), tras la revisión (histórica) del campo de la evaluación del curriculum,
señalan que este es "un área compleja de estudio, con relaciones cercanas a la
evaluación de programas, a los test, y de la investigación educativa". Por esto, se
presenta como una perspectiva amplia. Dentro de la evaluación del currículum,
hemos de incluir, aparte de dimensiones internas del curriculum (contenidos,
materiales, etc), la evaluación de la innovación curricular, y la evaluación de
programas (educativos, innovadores o formativos).
La evaluación del curriculum ha estado dominada por un cierto imperialismo

de los test y estándares establecidos. Madaus (1988), en un buen estudio sobre la
influencia de los test en la determinación del currículum, ha puesto de manifiesto
cómo los test usurpan el papel del currículum en la definición de lo que hay que
enseñar y cómo hacerlo: "No es currículum oficial, sino los test quienes están
determinando cada vez más que se enseña, cómo se enseña, qué se aprende, y
cómo se aprende"(Madaus, 1988:83).
Por otra parte podemos distinguir funcionalmente (Ariav,1986) entre

análisis del curriculum y evaluación del curriculum, cifrando el primero en
describir el posible valor educativo del currículo, sus potencialidades curriculares y
sus procesos de desarrollo; mientras que la "evaluación del curriculum", en su
dimensión sumativa, prioritariamente se centra en juzgar/valorar su éxito y
resultados. La finalidad del análisis es describir y comprender una situación,
independientemente de sus resultados , como base para clarificar el campo,
contexto y situación investigada; al tiempo que puede proporcionar evidencias que
puedan ser tomadas en cuenta para guiar la toma de decisiones (y en este aspecto
guarda similaridad con la evaluación formativa), teniendo una función descriptiva
más que prescriptiva. Ariav (1986) señala los siguientes propósitos, métodos de la
evaluación del currículum:
1.- El propósito de la evaluación del curriculum es juzgar el éxito o fracaso

de un curriculum particular. Evidentemente esto es una
generalización, porque según los diferentes modelos de evaluación se
centrará en cuestiones diferentes y aplicará diferentes metodologías.
2.- Los métodos aplicados, de igual manera, son diferentes en los modelos
y fines, pero la asociación tradicional entre investigadores y
evaluación ha motivado un énfasis en los test y medida, la toma de
datos empíricos, y la orientación al diseño, desarrollo e informe.
3.- La dirección de la evaluación del curriculum se puede dirigir a la

administración educativa, agencias patrocinadores, profesores,
alumnos, comunidad escolar.
King (1991), refiriéndose a la evaluación del curriculum en la práctica,

señala las siguientes características iniciales:
1.- La evaluación del curriculum es dependiente de las múltiples

perspectivas del curriculum existentes, y cubre un amplio rango
de actividades curriculares (procesos y productos) que
pueden ser objeto de evaluación. La evaluación puede dirigirse al
uso de un material curricular específico, de un método de enseñanza,
o de personal.
2.- En segundo lugar, es dependiente de múltiples perspectivas

filosóficas y metodológicas conjuntamente, pues la suposiciones
metodológicas suelen implicar concepciones del curriculum.
3.- La evaluación de la práctica curricular se dirige a lo que los

profesores y alumno han utilizado, están usando o van a usar en el
futuro, distinta de la investigación curricular sobre evaluación en la
medida en que no pretende proporcionar material para la discusión
teórica, sino información útil para iluminar la práctica. Aquí
igualmente se presenta un amplio espectro de modos y formas de
evaluación
Desde la perspectiva crítica Apple y Beyer (1983), propugnan una

"evaluación social del curriculum", caracterizada por redefinir la unidad de
evaluación dentro de un contexto más amplio y por focalizarse en las funciones
sociales que cumplen el curriculum escolar, Dado que las escuelas no son entidades
aisladas, divorciadas del contesto social y de sus funciones de legitimación,
producción, distribución y reproducción de las relaciones sociales; la evaluación del
curriculum debe ampliarse a estas funciones socioeconómicas. Por ello la
evaluación del curriculum es incompleta si se limita a la "caja negra" de la escuela
investigando lo que se enseña o las experiencias de los alumnos con los programas
escolares. Tres dominios, al menos, necesitarían ser objeto de estudio en una
evaluación social del curriculum (Apple y Beyer, 1983: 430) para ver las
conexiones entre el curriculum y las estructuras ideológicas y económicas:
1.- Las interacciones cotidianas y regularidades de la vida escolar:

Lo que se ha llamado "curriculum oculto" como modo en que se
enseña y reproducen importantes valores y normas sobre trabajo,
clase social, raza y género de nuestra sociedad.
2.- El corpus formal del conocimiento escolar: El curriculum planificado,

expresado en materiales curriculares y vivenciados por el profesor y
los alumnos.
3.- Las perspectivas, procedimientos y teorías fundamentales que los

docentes utilizan para planificar, organizar y evaluar lo que
sucede en las escuelas.
No obstante, el campo de la evaluación del curriculum se ha ampliado

considerablemente hasta poder abarcar otros campos, en cuanto son dependientes
del curriculum o influyen decisivamente en él (entorno escolar o apoyo externo). Así
en el reciente documento a debate presentado por el MEC (1994) sobre "Centros
educativos y calidad de enseñanza" se señala:
"Al adoptar una concepción más compleja e interactiva del curriculo, ya

no se justifica reducir la tarea de evaluación exclusivamente al alumno y al
proceso de enseñanza y aprendizaje. Los resultados de la educación vienen
determinados por la actuación de los profesionales que en ella intervienen,
por la organización y funcionamiento del centro no escolar en el que aquélla
se lleva a cabo, por la propia definición y desarrollo del currículo, y por la
actuación del aparato administrativo que debe proporcionar los recursos
para el funcionamiento eficaz del sistema en su conjunto. En consecuencia,
todos ellos se convierten en objeto de evaluación" (MEC, 1994:26).
SENTIDO DE LA EVALUACIÓN
En un documento del MEC (!994) sobre "Centros educativos y calidad de

enseñanza", afirma que: "La importancia actualmente cobrada por la evaluación
educativa y el notable desarrollo de las funciones que le han sido atribuibles ha
producido una ampliación paulatina de su ámbito de actuación. más allá de la
valoración de los aprendizajes adquiridos por los alumnos, que constituyó su campo
de intervención originario, la evaluación alcanza actualmente a los centros
educativos, al profesorado, al currículo, a la propia Administración y, en suma, a
todo el conjunto del sistema educativo".
Próximo a nosotros tenemos a House (1992), que realizó una revisión de las
tendencias actuales en evaluación y dice: "La evaluación, que fue inventada para
solucionar nuestros problemas sociales, se encuentra afectada hoy en día,
precisamente por los mismos problemas que tenía que resolver".
Kemmis (1986: 119), ha proporcionado un conjunto de principios que deben

regir un proceso de evaluación democrática en el desarrollo curricular. Parte de la
siguiente definición de evaluación:
"Evaluación es el proceso de recoger información y argumentos que
capaciten a los individuos y grupos interesados para participar en el
debate crítico sobre un programa específico. Así definida la evaluación
consiste en aprovechar y refinar los múltiples procesos de enjuiciamiento
público y privado, no en substituirlos con tecnologías de valoración".
CONCEPTUALIZACIÓN DE LA EVALUACIÓN.
La evaluación tiene como objeto determinar el valor de una cosa, Worthen y

Sanders (1987:24) definen la evaluación como "el acto de proporcionar juicios para
determinar el valor (valía o mérito), sin minusvalorar por ello las importantes
funciones que la evaluación tenga en la toma de decisiones y en las actividades
políticas. En educación, la evaluación es la determinación formal de la
cualidad, efectividad, o el valor de un programa, producto, proyecto,
objetivo, o curriculum. La evaluación, para ello, utiliza métodos de investigación
y de juicio, como:
1.- Determinar los estándares para juzgar la cualidad y decidir

cuáles de ellos deben ser relativos o absolutos
2.- Recoger información relevante sobre los objetos de evaluación;

y aplicar los estándares para determinar la cualidad.
Gimeno (1992, p.338) define la evaluación como "proceso por medio del que
alguna o varias características de un alumno, de un grupo de estudiantes, de un
ambiente educativo, de objetivos educativos, de materiales, profesores, programas,
etc., reciben la atención del que evalúa, se analizan y se valoran sus características
y condiciones en función de unos criterios o puntos de referencia para emitir un
juicio que sea relevante para la educación".
En el artículo de Cronbach (1963), Presentó un cambio muy significativo en

el que se elabora una propuesta sobre los tipos de decisiones en el uso de la
evaluación:
1.- Mejora del curso/programa: Decidir qué material de instrucción y qué

métodos son satisfactorios y en cuales es necesario introducir
cambios.
2.- Decisiones sobre individuos: Identificar las necesidades del alumno,

con el fin de planificar su aprendizaje, valorar sus méritos con fines
de selección y agrupación, familiarizándose con sus propios
progresos y deficiencias.
3.- Regulación administrativa: Juzgar la calidad del sistema escolar, la de

los profesores individualmente considerados, etc.
Cronbach plantea la necesidad de centrar la evaluación en el propio proceso

de desarrollo de un curso, con el objeto de mejorar y evitar lagunas que al final del
proceso no se pueden superar.
Nevo (1989) llevó a cabo una revisión biliográfica sobre evaluación y señaló
las dimensiones relevantes en la evaluación del curriculum:
1.- )Cómo se define la evaluación?
La evaluación educativa es una sistemática descripción de los objetos

educativos y/o su mérito o valor.
2.- )Cuáles son las funciones de la evaluación?
Señalaremos cuatro funciones básicas en la evaluación educativa.
1.- Formativa (para desarrollar y mejorar).
2.- Sumativa (para selección, certificación, rendir cuentas).
3.- Sociopolítica (como motivación y soporte de apoyo público).
4.- Administrativa (para ejercer control y autoridad).
Por otro lado Gimeno (1992) al referirse a la evaluación de la enseñanza,

considera siete tipos de funciones que de hecho ejerce la evaluación:
a) Definir los significados pedagógicos y sociales, o qué se entiende por

excelencia escolar. Y a partir de la consecución de la excelencia o de
niveles de excelencia, definir el significado social de términos y las
realidades como la calidad de la educación, o el rendimiento, el éxito,
el fracaso escolar, etc
b) Funciones sociales. Dado que a través de las certificaciones se acreditan

los niveles de competencia en función del grado de saber
demostrado, sirve para la jerarquización de los puestos de trabajo y
la selección de las personas que deben desempeñarlos.
c) Poder de control. El profesor ejerce su poder, fundamentalmente a

través de las calificaciones. Controla la conducta, y es una forma de
compensación a la ausencia de liderazgo.
d) Funciones pedagógicas. También sirve a funciones con claro objetivo

educativo, o de mejora, que son las que legitiman la existencia de la
práctica de la evaluación.(creación de ambiente escolar, función
diagnóstica, recursos para la individualización, afianzamiento del
aprendizaje, orientación, pronóstico y ponderación del currículum y
socialización profesional).
e) Funciones con respecto a la organización escolar. Proporciona

conocimiento para una ordenación del currículum y una organización de
la práctica real de la enseñanza.
f) Proyección psicológica. En la medida que repercute en la motivación, el

autoconcepto y las actitudes hacia la escuela, etc.
g) Apoyo a la investigación. Es una fuente de información sobre el

funcionamiento del sistema educativo, y la validez de los currículums.
3.- ¿Cuales son los objetos de la evaluación?
Cualquier entidad puede ser evaluada, pero los objetos más

frecuentes son: alumnos, personal administrativo y docente, curricula,
materiales, programas proyectos, e instituciones o centros. No debe
limitarse a alumnos y profesores, y es necesario identificar claramente el
objeto de evaluación, ampliar el objeto de la evaluación, para que esta sea
más explicativa.
A.- La evaluación de los alumnos
En la evaluación de los alumnos considero dos formas: la evaluación por

parte de la administración, y la evaluación por los profesores.
a) La evaluación por parte de la administración se realiza

generalmente mediante exámenes; esta ha sido la forma más
utilizada en todos los países.
Marsh (1992) considera que el problema de los exámenes hoy día se

sitúa fundamentalmente a nivel de la enseñanza secundaria, pues
aunque han sido muy utilizados en el siglo XX, sin embargo se está
operando un cambio de manera que se han desplazado desde la
primaria a la secundaria.
b) La evaluación del alumno por los profesores
Los profesores toman en cuenta la cantidad de información tanto al

planificar como durante la tarea de instrucción (habilidad y logro,
cuestiones sobre el sexo, participación en clase, autoconcepto,
competencia social, independencia, conducta en clase, hábitos de
trabajo,...) Pero el logro es lo más importante, de forma que hay
evidencia de que el juicio sobre la capacidad, la motivación y el esfuerzo
del estudiante dependen de su valoración del resultado.
B.- Evaluación del profesor
Es opinión pública, que la clave de la mejora de la educación está ligada

al grado de calidad de los profesores, lo cual a llevado a la administración a
tomar diferentes decisiones en torno al cambio para facilitar la mejora. de
esta manera se ha visto en la necesidad de adoptar medidas para realizar
una evaluación correcta.
* Entrevista al profesor. Se ha usado en el pasado y es la piedra

angular de las estrategias de evaluación más recientes.
* Test de competencia. Se usan para certificación inicial y para el

contrato. Los profesores deberían demostrar competencia cognitiva
como un prerrequisisto para poder enseñar.
* Medidas indirectas de la competencia del profesor. Esto no se

refiere a características de la personalidad, sino a rasgos tales como el
compromiso profesional que se expresa a través de actividades
extraescolares, etc.
* Observación de clases. Supone observación directa del estilo del

profesor en clase, durante la interacción con sus alumnos, y
generalmente se completa con entrevistas. Se pueden usar instrumentos
estandarizados de observación para facilitar los juicios de los
observadores, como Weade y Evertson (1991) recomiendan, ya que la
observación sistemática y deliberada, como una acción intencional
enfocada a determinados propósitos, puede y debe ser planeada para
poder obtener justamente la información que se necesita.
* Valoraciones de los estudiante. Se basa fundamentalmente en que:

1) los estudiantes saben cuando han sido motivados; 2) son los
estudiantes los que van a cambiar la conducta; 3) ellos saben si el
profesor proporciona feed-back; 4) El reconocimiento de los estudiantes
pude motivar la buena enseñanza.
* Revisión de compañeros. En este proceso un comité de compañeros

evalúa la enseñanza a través de un análisis de documentos. Aunque es
una idea entusiasta, en la práctica puede causas tensión.
* Evaluación del Claustro de profesores. La autoevaluación puede

promover autoreflexión y la motivación hacia el cambio y el desarrollo
personal y profesional. Un profesor puede usar datos derivados de las
otras técnicas y hacer juicios sobre su propia enseñanza, y sobre los
aspectos organizativos, lo cual es un pilar de la profesionalización.
Darling-Hammond y sus colaboradores (1989) después de revisar los

procedimientos de evaluación del profesor, concluyeron que no hay un único
método válido, porque todos tienen sus riesgos , y desde luego no es útil una
aproximación unidimensional para juzgar la competencia del profesor.
4.- ¿Qué tipo de información debe ser recogida para cada objeto?
Independientemente de los modelos de evaluación que condicionan esta

dimensión, cuatro grupos de variables deben ser consideradas: los objetivos
del objeto/aspecto a evaluar; sus estrategias y planes; su proceso de
implementación; y sus resultados e impacto.
5.- ¿)Qué criterios se han de emplear para juzgar el mérito de un

objeto?
Al menos tendremos en cuenta los siguientes: Si responde a las

necesidades identificadas de los actuales o potenciales clientes; El grado de
consecución de normas y estándares; la existencia de otros objetivos no
planteados; y la consecución de objetivos determinados para los objetos
propuestos. No olvidando que se deben emplear múltiples y variados
criterios.
6.- ¿A quién debe servir la evaluación?
La evaluación debe ofrecer la información necesaria para todas las

partes implicadas tanto las actuales como potenciales, interesadas en el
objeto de evaluación. Es responsabilidad del evaluador/es delimitar a los
afectados por una evaluación e identificar o proyectar la información
necesaria.
7.- ¿Cómo se realiza el proceso de evaluación?
En el proceso de evaluación, como método de investigación, debe

incluir las tres actividades siguientes:
1.- Centrarse en el problema de evaluación.
2.- Coleccionar y analizar datos empíricos.
3.- Comunicar los hallazgos a las audiencias. Unido a una estrecha

interacción entre el evaluador y los destinatarios.
8.- ¿¡Qué métodos de evaluación deben ser usados en la

evaluación?
La evaluación es una tarea compleja, que necesita de varios métodos de
trabajo, utilizando de acuerdo con la naturaleza del problema el método de
investigación que mejor se ajuste a la demanda solicitada.
9.- ¿Quién debe hacer la evaluación?
La evaluación debe ser realizada por equipos de profesionales que

posean:
1.- Una amplia competencia en metodología de investigación y otras

técnicas de análisis de datos.
2.- Comprensión del contexto social y del tema específico de evaluación.
3.- Habilidad para mantener relaciones humanas correctas con los

individuos o grupos implicados en la evaluación.
4.- Un marco conceptual para integrar las capacidades mencionadas.
10.-¿)Por medio de qué estándares debe juzgarse una evaluación?
La evaluación debe lograr un equilibrio óptimo en el conjunto de

estándares de: Utilidad (su uso y su práctica); Precisión (técnicamente
adecuada); Viabilidad (ser realista y prudente); y Apropiada (ser realizada
de modo legítimo y ético).
Por otra parte tenemos a Stake (1986) que ha señalado las dimensiones más
comunes para clasificar los diseños de evaluación, categorizandolos en los
siguientes:
1.- Formativa - Sumativa: Una de las distinciones más extendidas es si los estudios
de evaluación se hacen durante el desarrollo del programa o cuando el programa ha
finalizado. Stake plantea sus dudas sobre la base en la práctica de la distinción.
2.- Formal - Informal: Evaluar de un domo informal es una actividad específicamente

humana. La evaluación está más operacionalizada y menos personalizada; suele
requerir validez, credibilidad, utilidad y precisión.
3.- Caso particular - Generalización: Si el estudio de un programa se hace como

representativo de otros, con pretensiones de generabilidad, o estudios de caso
particulares.
4.- Producto - Proceso: Otra distinción relevante en los estudios de evaluación es si

se dirigen a los resultados de un programa, o a sus procesos de desarrollo, según el
valor extremo del programa o su valor intrínseco.
5.- Descripción - Juicio: Priman los aspectos descriptivos y objetivos en la

información proporcionada; o defender la legitimidad de proporcionar un juicio sobre el
programa evaluado.
6.- Preordenado - Respondente: Si la evaluación debe venir predeterminada por la

observación de las actividades o por la realización de preocupaciones de los
participantes en el programa .
7.-Totalidad - Analítico: Tratar el programa como una totalidad holística, como los
estudios de caso; o hacer estudios analíticos como las relaciones entre variables
discretas.
8.- Interna - Externa: Si la evaluación es realizada por personas implicadas en la

institución responsable del programa o por externos. Esta posición influye en cómo es
evaluado, interpretado y negociado.
DIMENSIONES DE LA EVALUACIÓN FORMATIVA Y SUMATIVA.
EVALUACIÓN FORMATIVA Y SUMATIVA
Siguiendo a Cronbach, Scriven en 1976, distinguió entre roles o funciones

que pude cumplir la evaluación "propongo la utilización de los términos evaluación
formativa y sumativa para hacer referencia a estas dos funciones de la
evaluación"), los términos han sido universalmente utilizados. Stufflebeam las ha
llamado "evaluación proactiva" y "evaluación retroactiva"; y Fernandez Perez
(1994:781) los denomina "evaluación sobre el proceso" y "evaluación terminal".
Se diferencian, en un principio por las audiencias a quién van dirigidas y el

uso que se hace de la información. Las audiencias en el caso de la evaluación
formativa es el personal inmerso en el programa; en la evaluación sumativa la
audiencia incluye a los potenciales consumidores (alumnos, profesores y otros
profesionales), aquellos que lo financian, y supervisores. La evaluación formativa
sirve para tomar decisiones sobre el desarrollo del programa, mientras que en la
sumativa las decisiones conciernen sobre si continuar con el programa o darlo por
finalizado, extenderlo o adoptarlo, etc. Por eso Scriven resaltó que no hay
diferencias lógicas o metodológicas entre la evaluación formativa y sumativa, pues
el propósito de ambas es examinar el valor de una entidad determinada. "Solo el
tiempo de realización, el público que la pide y la manera de usar los resultados,
pueden indicar si una evaluación es formativa o sumativa. Por otra parte, el mismo
estudio pude ser considerado formativo por un cliente y sumativo por otro" (Lewy,
1992:2552).
Esta distinción es difícil en la práctica. Por eso Stake (Worthen y Sanders,

1987: 36) propone, como términos más adecuados, diferenciar entre evaluación
interna y externa:
" En el campo de la evaluación los términos formativo y

sumativo han llegado a ser cada vez más utilizados. Estos términos
tienen un efecto dramático, distinguiendo entre lo que se hace
durante el desarrollo y aquello que se hace cuando el desarrollo ha
terminado. Yo encuentro esta distinción trivial. Para la mayoría de
los programas educativos-cursos de correspondencia, programas
Montessori- el desarrollo no acaba nunca. Para un alumno hay un
comienzo y un final; pero para el profesor, el programa sigue
funcionando, nunca acaba. Lo que es importante es que hay
diferencias entre lo que la "gente del programa" quiere conocer
sobre el programa y lo que los "externos" quieren conocer".
Acercándose a Stake, Hopkins (1989:168) señala que, aunque la distinción

entre formativa/sumativa es "superficialmente clara", en la práctica no funciona así
(una evaluación formativa puede convertirse en una serie de pequeños informes, y
unos informes sumativos pueden servir para promover el desarrollo). El propio Lewy
(1991: 2552-3) reconoce que "tras dos décadas de utilización de estos términos se
ha producido poco consenso en lo que se refiere a sus rasgos distintivos". El
supuesto básico la evaluación formativa es que los agentes utilizan o podrán usar la
información obtenida para el estudio que realizan. En el caso de la evaluación
sumativa: "lo que funciona en un contexto sometido a unas condiciones debe
operar de manera similar en otro contexto".
Dos características diferenciales entre la evaluación formativa y la sumativa

las encontramos en el nivel deseado de generalización y el modo de aplicación. En
la evaluación formativa el nivel de generalización está limitado al contexto
especifico evaluado, sin embargo en la evaluación sumativa el nivel deseado de
generalización se escapa hacia operaciones con objetos similares. El modo de
aplicación en la evaluación formativa se basa en el informe oral, conferencia,
informe interno, y la limitada difusión entre evaluadores y programas similares al
estudiado, en el caso de la evaluación sumativa el modo de aplicación se basa en
informes de evaluación para responsables de evaluación, planificadores de la
educación, revistas especializadas
En la última década ha emergido con fuerza una perspectiva interpretativa

de análisis de los significados, modos de trabajo y "cultura"; lo que implica valorar
los procesos, la acción conjunta del centro y su compromiso por la mejora escolar.
De este modo está en crisis si lo que se debe evaluar es la consecución de los
objetivos prefijados centrándose en los resultados, medidos en términos
cuantitativos, normalmente rendimientos académicos de los alumnos; o, más
preferentemente ,autodiagnosticar los elementos disfuncionales y necesidades
como paso previo para la mejora escolar. De modo similar al nuestro, aunque
referido a la evaluación del profesorado universitario, Zabalza (1990b) contrapone
la evaluación orientada al control a la evaluación orientada al desarrollo, según los
diferentes estándares de calidad, procesos, sujetos o grupos implicados y la
iniciativa de la evaluación.
No debemos caer en el error de oponerlas dicotomicamente, pues como

recuerda recientemente Nevo (1994: 94), a veces, se ha utilizado
injustificadamente la evaluación formativa como excusa para evitar las demandas
de rendir cuentas de resultados, o para presentarla como una alternativa a la
evaluación sumativa. En la práctica un proyecto de innovación, desarrollado
autonomamente por un centro escolar, que emplea como instrumento básico de
mejora la evaluación formativa o autoevaluación, necesita también de una
evaluación sumativa que le sirva para demostrar su mérito y valor, y que le sirva
para defender su viabilidad frente a las escuelas tradicionales.
EVALUACIÓN INTERNA/EXTERNA
Siguiendo la sugerencia de Stake, junto a la dimensión anterior se pude

diferenciar entre evaluación interna (realizada por los que están trabajando en el
programa) y externa (conducida por agentes externos). Desde una perspectiva que
intente unir desarrollo curricular e investigación no tiene sentido separar el
papel de desarrollador interno y evaluador externo, ambos se fusionan: "En mi
opinión el desarrollo del currículum debería tratarse como investigación educativa.
Aquel que desarrolló un curriculum debe ser un investigador, y no un
reformador... La nueva evaluación equivale a investigar la naturaleza y los
problemas de la innovación educativa y el perfeccionamiento de las escuelas"
(Stenhouse, 1984: 169).
Scriven define de las siguientes formas las evaluaciones externas e

internas: Evaluaciones internas son aquellas hechas por el personal del proyecto,
tanto si son personal especializado, como si son externos a la parte encargada de
producción/escritura/servicio del proyecto. Un evaluador externo es alguien que
en alguna medida no forma parte del proyecto, o alguien que en el caso del
personal de evaluación es diferente del personal que está siendo evaluado.
También se plantea necesidad de una evaluación interna debido a que la
evaluación del currículum forma parte de la cultura de la escuela, es preciso
someterla a deliberación, por ello requiere crear cauces de participación y
responsabilización apropiados para la toma de decisiones del currículum escolar.
Cuando se trata del currículum básico, o de proyectos de innovación que

desarrollan el currículum básico, la evaluación interna puede ser completada por la
externa, sobre todo a efectos administrativos.
En cuanto a la evaluación de los aprendizajes del curriculum, Rosales

(1990)ve la necesidad de implicar a diferentes grupos de personas:
a) Los profesores. Son los responsables de la evaluación inicial y continua

de sus alumnos.
b) Los alumnos. Necesitan conocer los resultados que va teniendo su

propia actividad y esfuerzo.
c) Los padres. Deben conocer qué valoración va obteniendo el aprendizaje

de sus hijos en la escuela.
d) La sociedad. Debe conocer cual es el nivel de la eficacia en la tarea

encomendada al sistema educativo.
DIMENSIONES DE LA EVALUACIÓN INTERNA/EXTERNA
Dimensiones DESARROLLO/INTERNA CONTROL/EXTERNA

Propósito Mejorar internamente el Certificar comparativamente la
funcionamiento de un eficacia de un programa.
programa. Orientado en los Centrado en los resultados.
procesos internos
Formas/roles Evaluación formativa. Evaluación sumativa
Desarrollo y mejora del Responsabilidad: Dar cuentas de

programa o curriculum los resultados
Agentes Internos Externos
Metodología Cualitativa: Etnográfica y Cuantitativa: validez. Test
procesual. Observación estandarizados o pruebas
sistemática. formales.
Medida A menudo informal Válida/fiable
Frecuencia de Frecuente/continua Limitada en el tiempo

datos
Normalmente pequeña. Normalmente extensa
Tamaño muestra
Audiencia Personas implicadas en el Administración, potenciales
desarrollo del programa o consumidores o patrocinadores.
currículum.
Principales ¿Cómo se está trabajando?, ¿Qué resultados?, ¿Qué coste?,
cuestiones ¿Cuál es el grado de eficacia?
¿Qué necesidades tenemos?.
¿Cómo mejorar?.
Dimensiones principales de la evaluación (Reelaborado a partir de Worthen y

Sanders, 1987:36).
Nevo (1994), defiende que la evaluación basada en la escuela puede ser

concebida como sinónima de "evaluación interna", en combinación con la
"evaluación externa". La distinción entre evaluación interna y externa no tiene por
qué implicar un juicio de valor sobre la superioridad o ventajas de una sobre otra,
aunque cada una pueda tener ventajas para ciertos propósitos: Evaluación interna
para una evaluación formativa y para proveer feedback para la mejora; y la externa
para una evaluación sumativa, y para proveer información para demostrar el
rendimiento de cuentas o resultados.
Como resultado de un Proyecto llevado a cabo en Israel para capacitar a los

centros a hacer su propia evaluación, Nevo (1994) expone las siguientes conclusiones
extraídas:
1.- El personal escolar entiende mejor el significado de la evaluación

mediante la distinción entre descripción y juicio.
2.- Los alumnos y sus resultados no deben ser el único objeto de la

evaluación escolar.
3.- Los resultados o impactos no deben ser únicamente los aspectos

a examinar cuando se evalúa un programa, proyecto u otro
objeto de evaluación dentro del centro escolar.
4.- La autoevaluación tiene que servir conjuntamente para una

función formativa y sumativa, para proveer información en orden
a planificar y mejorar, así como para certificar y dar cuentas.
La tarea de hacer más formativa una evaluación se convierte en el problema

de cómo el conocimiento producido en la evaluación es utilizado por los usuarios;
implicando una formación para aprender de la evaluación. Pero más allá de
discriminaciones conceptuales, interesa cómo la evaluación puede servir para un
desarrollo o mejora interna del aspecto o actividad evaluada (Hopkins, 1989).
Criterios Hacia una influencia más Hacia una mayor

formativa y menos independencia y una influencia
independiente menos formativa
INFORMES Diálogo continuo formal o Documentos escritos producidos
informal con los gestores y los después de haber desarrollado la
que toman decisiones actividad práctica.
VALORES Base común de valores El evaluador/es tiene distintos
compartidos entre evaluadores y valores que los que desarrollan el
los que desarrollan el programa programa.
STATUS Se percibe al evaluador en un Se percibe al evaluador como en
status más o menos igual que los un status diferente y particular.
que desarrollan el programa
DESCRIPCIÓN/ El evaluador entrará en la El evaluador sólo describe, analiza
discusión sobre estrategias e informa.
PRESCRIPCIÓN alternativas, o acciones
recomendadas
COMPROMISO/ El evaluador toma la iniciativa El avaluador toma una posición de
DISTANCIA para el éxito y siente alguna curiosidad imparcial, escepticismo
responsabilidad en este éxito. u oposición.
Paradoja de la evaluación formativa (según Bridges, recogido en Hopkins,

1989:168).
RELACIÓN ENTRE MEJORA ESCOLAR Y EVALUACIÓN.
Holly y Hopkins (1988) han propuesto, con fines clarificadores, distinguir tres
perspectiva sobre la relación entre mejora escolar y evaluación: evaluación de
la mejora, evaluación para la mejora, y evaluación como mejora. Cada una
tiene sus propias implicaciones metodológicas y puede servir para cuestionar el papel
de la evaluación en el proceso de mejora escolar; al tiempo que cada una se sitúa a
un nivel superior del círculo y pueden conducir a otra. La distinción tiene la
virtualidad de romper con la oposición fácil entre evaluación sumativa y formativa, y
diferenciar, dentro de una evaluación orientada a la mejora escolar, que no toda
evaluación formativa implica un desarrollo organizativo del centro.
Aspectos Evaluación COMO Evaluación PARA la Evaluación DE la

mejora mejora mejora
Finalidad La evaluación forma "Evaluación formativa" Medida de la
parte del proceso de Ayudar a introducir consecución de los
desarrollo mejoras en la práctica objetivos.
Caracteres * El papel de * Evaluación durante el * Racionalidad
evaluador y usuario se proceso. instrumental de
identifican. medios-fines.
* Usar los datos para
* Autoevaluación del mejorar la práctica. * Evaluación basada
centro. en objetivos.
* Mayor implicación de
los usuarios. * Determinar el
grado de
implementación y
factores que lo
explican.
Limitacione * Permanecer en un * Limitarse a como * Perspectiva de
s plano emic, sin facilitar el cambio, "fidelidad".
transcender el evaluación y cambio
contexto local. son distintos. * Mejora como
adopción de
* Posible mecanismo * No centrarse en los propuestas externas.
de interiorización de factores que
responsabilidad. constituyen el proceso
de cambio mismo.
* Posible uso
conservador por los * Comunicar y utilizar
centros. los datos.
La evaluación de la mejora, en un primer plano, pudo incluir la tradición

Tyleriana de medida de resultados o "productos" para detectar aquellos aspectos, en
un programa educativo o curriculum, que no funcionan eficientemente de acuerdo
con las expectativas prefijadas.
La evaluación como mejora se puede asimilar a la llamada "evaluación
formativa", como intento de introducir mejoras en la práctica docente, por lo que su
finalidad es cómo facilitar el cambio, desdeñando en parte los factores del proceso
de cambio.
La evaluación de la mejora implica que ésta tiene como fin explícito la

mejora escolar, inserta en el propio desarrollo organizativo del centro, identificándose
los papeles de evaluador y usuario por medio de la autoevaluación escolar. El
evaluador externo adopta la posición de mediador, negociador, agente de cambio y
dinamizador, etc., es decir se guía por un conjunto de valores contribuyendo a hacer
explícito un dibujo más claro de la institución y de lo que significa su trabajo en el
conjunto más amplio de las prácticas sociales, como primer paso para la reflexión
conjunta sobre lo que se hace, se debería hacer o sería legítimo lograr.
Darling-Hammond (1994) han argumentadon, que una política externa de

evaluación de alumnos, centros o profesores sólo puede legitimarse desde la
orientación de ofrecer apoyos a la base para mejorar la enseñanza. La evaluación, en
estos casos, es usada para ofrecer a los profesores informaciones prácticas sobre el
aprendizaje de los alumnos y proveer información para que la comunidad escolar se
comprometa en "un proceso recursivo de autoreflexión, autocrítica, autocorrección, y
autorenovación"(Darling.Hammond, 1994: 26).
LA PRÁCTICA EN LA EVALUACIÓN DEMOCRÁTICA.
Para House (1973:130) se pueden distinguir, en todo proceso de evaluación

dos contextos: el contexto de valoración y el de justificación. Mientras que el
contexto de justificación incluye todos los procedimientos científicos, técnicas
empleadas para demostrar los resultados extraídos, el contexto de valoración se
refiere a valores, actitudes, ideología, y otros sesgos desde los que se realiza la
evaluación. En palabras de House (1973: 131) "La utilización de la metodología
científica en el contexto de justificación nos permite justificar los resultados
producidos en el 'contexto de valoración'".
McDonald (1976), aplicó un análisis político a la evaluación, proponiendo

frente a tipos burocráticos o autocráticos, una "evaluación democrática". "Los
evaluadores no solo viven en el mundo real de la política educativa, de hecho,
influyen en sus cambiantes relaciones". La evaluación democrática en las
instituciones educativas se entiende como un servicio de información a toda la
comunidad, negociado, confidencial y accesible a todos los implicados, sin reconocer
un derecho especial a ningún grupo; para lo que utiliza metodologías e informes que
puedan hacer accesible el conocimiento. Beltran y San Martín (1992: 67) la definen
como "aquella en la que, tanto los métodos aplicados, como la información generada
en el proceso evaluador es abierta, y se discuta y reelabora entre los diferentes
grupos de interés, formales o no, que configuran la comunidad educativa".
Pero el control democrático por los agentes implicados en la metodología

utilizada y de la información generada no deja de ser una propuesta moralista
y/o piadosa, si no se entra en los propios mecanismos distorsionadores del
pensamiento de los agentes sobre sus propias condiciones de trabajo.
McTaggart (1990), ha señalado un conjunto de Principios de procedimiento,

que deberán seguir y respetar, el patrocinador y evaluadores en la elaboración de los
informes de evaluación para contribuir a hacer un uso democrático: Independencia,
desinterés, negociación del informe, del acceso a los datos y de la
información, publicación, confidencialidad y rendimiento de cuentas.
Una fase clave en la evaluación educativa es la diseminación de los

resultado e informes evaluativos, y consecuentemente utilizados por los agentes
sociales y educativos. Las evaluaciones formales (de los centros, del proceso de
enseñanza o de los alumnos)es obvio, se diseñan y realizan para producir
datos/juicios que serán usados con determinados fines por agentes/audiencias
diversas. Inyectar nuevos conocimientos en una organización es un acto
micropolítico, (Huberman y Cox, 1990), por lo que el evaluador debe preveer, y poner
los medios, los potenciales usos que se puedan hacer de los datos de la evaluación y
del procesamiento de los mismos.
Bryk y Hermanson (1992), al revisar los sistemas de indicadores de evaluación

como instrumentos necesarios para mejorar el sistema educativo, señalan que estos,
han tenido un uso instrumental o "ingenieril"; proponiendo ellos, un uso ilustrado de
la información: "proporcionar información para comprender los problemas y
catalizar nuevas ideas". Desde esta perspectiva las evaluaciones en base a
indicadores no deben pertenecer al uso privado de políticos o administradores
educativos para ejercer más efecto sobre las escuelas. Más bien deben contribuir a
enriquecer el discurso público de la comunidad educativa sobre el sistema educativo
público: "Debe proveer información que capacite a los agentes educativos a
reflexionar y hacer un mejor escrutinio de sus actividades"(Bryk y Hermanson, 1992:
466).
Partiendo de que todo conocimiento es poder, debemos clarificar al máximo,

el uso y la distribución de los informes de evaluación. Como dice Kemmis (1986)): "La
evaluación es, inevitablemente, un proceso político, que afecta la circulación de la
información en una situación dada y tiene consecuencias vitales para los que la
sufren". Determinados principios éticos deben ser respetados por tanto en la
producción, distribución y control de los informes de evaluación de centros,
programas o alumnos.
La comunicación a los potenciales usuarios necesitan una información válida,

significativa y operacionalizada, sin tener en cuenta los factores que afectan al
procesamiento social de dicha información, produciendo una merma relevante en la
interpretación y uso de la información. Debemos tener en cuenta los canales de
comunicación y el contexto de trabajo ya que este, se presenta como el filtro último
para juzgar la pertinencia y adecuación de los resultados.
En cuanto a la distribución y uso por profesionales o administración, se ha

observado que los análisis vienen a sugerir que casi nunca se hacen cambios en
función de los resultados de la evaluación; por lo que más que dirigirse a la toma de
decisiones, debían servir para ilustrar a los patrocinadores, clientes y agentes
proporcionando información para comprender y reflexionar sobre la situación. Por
tanto Darling-Hammong (1994:25) propone un sistema de evaluación externa que
potencie la igualdad y la mejora interna (1994: 25):
"cambiar las formas y formatos de evaluación sin cambiar los modos

en que la evaluación es usada no cambiará los resultados de la
evaluación. Si queremos apoyar el aprendizaje de los alumnos,
debemos incluir a los profesores en todas las fases del proceso y que
la evaluación esté implicada en el curriculum y en las actividades de
enseñanza. (...)En orden a mejorar la educación, la evaluación debe
ser una parte integral para incentivar el diálogo entre los profesores y
el desarrollo de la escuela".
EVALUACIÓN FORMAL DEL CURRICULUM.
Madaus y Kellaghan (1992) estiman necesaria una evaluación formal del

currículum, ya que los profesores suelen hacerlo de forma secundaria, dado que su
preocupación principal es la evaluación del nivel de logro de los alumnos. De hecho,
el modelo Tyleriano pretendía ser un instrumento para ayudar a los profesores a
evaluar el curriculum, a través de los objetivos como elementos del curriculum. El
modelo CIPP, recoge cuatro categorías (Contexto y evaluación de necesidades, input,
proceso y producto); Stake distingue tres elementos sobre los que centrar el proceso
de evaluación (antecedentes, transacciones alumnos-profesor, y resultados). A pesar
de la variedad de aspectos o dominios y métodos, Madaus y Kellaghan (1992)
proponen seis componentes fundamentales del curriculum que deben ser evaluados,
que recojo en el siguiente gráfico. Los elementos y forma de evaluación que
proponen Madaus y Kellaghan, no obstante, no dejan de ser obvios y tradicionales,
con fuerte acento en Tyler y Taba, señalando a modo de notas a pie de página otras
versiones. Por otra parte silencian dimensiones como organización y estructuración
del curriculum, organización del centro, acción conjunta del curriculum por el centro,
etc.
1.- Contexto: Partir del contexto de desarrollo del curriculum, como las características
de los alumnos (nivel cognoscitivo, destrezas, necesidades e intereses), también la
concepción educativa del centro y de la sociedad, naturaleza de la materia y psicología
del aprendizaje.Este contexto es relevante para los objetivos, como señaló Tyler, pero
también para evaluar la adecuación de los materiales, los procedimientos empleados y
los resultados obtenidos.
2.- Objetivos generales: Aunque es difícil definirlos y operativizarlos, por su

dependencia con concepciones valorativas (educativas y sociales), es preciso hacerlo
como criterio necesarios de evaluación.
3.- Objetivos específicos de las áreas curriculares o unidades didácticas:

Trasladar los objetivos generales, como dice Taba, a las materias de enseñanza con
objetivos específicos adaptados al contenido de los cursos y necesidades particulares de
grupos de estudiantes. No obstante cabe una deliberación curricular sobre los
contenidos (Walker), evaluación libre de objetivos (Scriven) u objetivos expresivos
(Eisner).
4.- Materiales curriculares: El curriculum planificado se concreta en los materiales

curriculares empleados. Un conjunto de cuestiones pueden plantearse en la evaluación
de los materiales: elementos que incluyen, si son guías para el desarrollo, si desarrollan
otros objetivos no pretendidos. etc.
5.- Transacción y procesos: Los procesos y la interacción en clase deben ser

evaluados, en relación con los restantes elementos, normalmente con metodologías
cualitativas.
6.- Resultados: El fin último de la evaluación curricular es qué resultados producen en

los alumnos los elementos anteriores. No todos los modelos dan el mismo énfasis, a si
deben evaluarse sólo en función de los objetivos explícitos o también de los no
intencionados.
Seis componentes principales en la evaluación del curriculum (Madaus y

Kellaghan, 1992).
Zabalza (1987) hace una propuesta de evaluación comprhensiva del proceso

de enseñanza/aprendizaje, que contempla todos los elementos y aspectos que
presenta la enseñanza:
1.- Áreas de desarrollo de los sujetos:
- área cognitiva: conocimiento y habilidades mentales, rendimiento académico;

- área relacional social. nivel de adaptación, relaciones interpersonales, etc.
- área afectivo-emocional: satisfacción, intereses, ajuste personal, etc.
2.- Situaciones en que se recoge la información:
- Situaciones controladas: las típicas situaciones artificiales en que se

plantean tareas de papel y lápiz, de exámenes orales,
entrevistas, ejercicios prácticos, etc.
- Situaciones naturales: las que surgen en la dinámica norma de una clase, en el recreo,
etc.
3.- Técnicas de evaluación:
- exámenes orales y escritos;
- pruebas objetivas y tests;
- observación;
- entrevistas;
- sociogramas;
- ...(cada tipo de técnica se especializa en un tipo de información. Por tanto

reducirse a tan sólo una técnica significa renunciar a la
información que ella no puede darnos y que si podrían dar otro
tipo de técnicas.
4.- Contenidos; Tareas; Operaciones mentales:
- representatividad: que se recojan una muestra representativa de los

contenidos-tareas trabajadas y de las operaciones puestas en
juego;
- significación: recogiendo aquellos aspectos más importantes o que han
sido definidos como prioritarios.
5.- Modalidades de evaluación:
- evaluación sumativa y formativa;
- evaluación del proceso y del producto;
- autoevaluación, heteroevaluación y mixta o de triangulación;
- evaluación individual y en grupo;
- evaluación cuantitativa y cualitativa.
Componentes y aspectos de una evaluación comprehensiva (Zabalza, 1987).

La evaluación para Stenhouse, se debe constituir un una investigación sobre el
desarrollo del curriculum, entendiendo el curriculum como un problema práctico, y
por lo tanto como un campo de investigación de la práctica profesional del profesor.
De este modo la evaluación, como analiza Martínez Bonafé (1989:64), consiste en la
"comprobación crítica del curriculum como hipótesis de acción educativa". De
acuerdo con el análisis de Martínez Bonafé (1988) los problemas a investigar se
refieren al aprendizaje de los alumnos, a la enseñanza del profesor, a la
estructuración, organización y desarrollo del curriculum, a los materiales curriculares,
y a la propia organización de la escuela.
En una perspectiva de fidelidad podemos medir los resultados de un programa

comparándolos con los objetivos del programa. Pero en una perspectiva procesual es
más difícil valorar cualitativamente el desarrollo curricular innovador. Por ello la
mayor parte de los estudios de evaluación del curriculum se refieren a una
perspectiva de "fidelidad". Desde estas coordenadas se habla de un control de
calidad de un programa, como lo hace Lewy (1976: 36):
"Un programa que se ha incorporado exitosamente dentro de un sistema

educativo y ha tenido una calurosa acogida del profesorado, puede deteriorarse con
el tiempo. El deterioro total o parcial puede ocurrir en todo el sistema o solo en
ciertas áreas o escuelas. Para prevenir esto, debe mantenerse un permanente
seguimiento del control de calidad del programa. El control de calidad debe hacerse
mediante el estímulo a aquellas escuelas en las que el programa se implementa en
forma adecuada y reforzando aquellas en que la implementación ha sido defectuosa.
Este control debe, además, revelar cómo algunas o todas las partes del programa
deben alterarse o reemplazarse. De este modo, el control de la calidad puede
conducir a la actualización de un programa viejo o al desarrollo de nuevos
programas.
LA EVALUACIÓN DEL CURRICULUM A TRAVÉS DE LA AUTOEVALUACIÓN
La autoevaluación institucional, como estrategia de revisión y desarrollo de la

mejora, significa que el centro escolar como conjunto genera procesos y formas de
trabajo dirigidas a autorevisar lo que se hace cotidianamente, lo que se podría
cambiar y consensuar planes de acción. Hernández (1990: 12) define, desde esta
perspectiva, la evaluación del curriculum como " la puesta en marcha de un proceso
que exige por parte de quienes lo inician la voluntad de reflexionar sobre la práctica
con el ánimo profesional de aprender de ella de forma constante. La evaluación del
curriculum se centra en la revisión de los fundamentos y la práctica de las
decisiones que los enseñantes adoptan en el centro con la colaboración de
un asesor externo". Una evaluación institucional se inscribe en un marco más
amplio de la reconstrucción cultural de la escuela y de sus pautas de trabajo, en que
el proceso de autorevisión y reflexión crítica de la propia realidad, guiado por unos
valores de cooperación, colegialidad y compromiso, se convierte en el contexto para
promover el desarrollo curricular, organizativo y profesional de los profesores.
Zabalza (1987:289-90), reivindicando la dimensión actual de autorevisión

colegiada de la labor conjunta del centro, caracteriza la evaluación del desarrollo
del currículum como "realizar una especie de reflexión, partiendo de los principios
de justificación y desarrollo de los proyectos curriculares que estemos llevando a
cabo, nos permita analizar y valorar las líneas generales del proceso", precisando a
continuación que "los resultados de este tipo de evaluación tendrá la virtualidad de
reorientarnos respecto a qué es lo que consideramos importante a nivel de principios
curriculares y si estamos funcionando o no, en la práctica, en el sentido que tales
principios enmarcan".
El sentido de esta autoevaluación institucional del curriculum es la mejora de la

propia institución escolar y de la calidad de enseñanza (evaluación formativa y
procesual), más que el control de resultados, rendición de cuentas o fiscalización del
funcionamiento del Centro (evaluación externa o sumativa). Se trata de revisar y
diagnosticar el estado actual del Centro y su funcionamiento, por parte del grupo de
profesores, y emprender acciones de mejora en aquellos aspectos que se consideren
prioritarios. De este modo la finalidad y sentido en la autorevisión escolar no es
primariamente evaluar la consecución de los objetivos prefijados encontrándose en
los resultados normalmente rendimientos académicos de los alumnos sino, más
preferentemente, autodiagnosticar los elementos disfuncionales y necesidades como
paso previo para la mejora escolar.
No obstante la autoevaluación institucional del centro escolar, inscrita en un

compromiso por la mejora, se compone y está relacionada con otros componentes,
como han puesto de manifiesto, entre otros, Holly y Hopkins (1988), como ejemplifica
la siguiente figura.
La autoevaluación institucional, como alternativa al profesionalismo de expertos

externo para evaluar la realidad escolar, parte por reconocer/capacitar al Centro para
hacer su propia evaluación. Esto significa situar al profesorado con la disposición,
actitud y competencia para aprender del contexto de trabajo, generando
conocimiento desde la propia práctica en deliberación con los compañeros, por
medio de procesos de revisión conjunta de su práctica diaria y de la propia acción
educativa del centro en los espacios discursivos del trabajo colectivo; al tiempo que
supone reivindicar una perspectiva dialógica del conocimiento primando el
conocimiento local, frente a producido desde "fuera" por expertos evaluadores
financiados por la Administración. En último extremo la autoevaluación se
institucionaliza cuando un centro se acerca a una "comunidad de aprendizaje", o un
a"escuela en desarrollo" o una "escuela evaluativa".
Partiendo de una relación de compromiso institucional por la mejora de la

educación, de respetar la profesionalidad del profesor, su capacidad para resolver
colegiadamente los problemas y de tomar la reflexión y revisión de la práctica, como
ejes sobre los que articular la mejora escolar, se utiliza un modelo de "resolución de
problemas" en que se genera desde dentro consenso para mejorar las dimensiones
organizativas y didácticas del trabajo escolar, se suelen utilizar un modelo flexible y
contextual con estos procesos (Escudero, 1992b; Holly y Southworth, 1989).
1.- Autodiagnóstico: Identificación y análisis de necesidades: Revisar y

valorar la realidad actual del centro (logros, necesidades, problemas),
clarificar las necesidades llegando a un entendimiento y priorizar ámbitos
concretos de mejora.
2.- Planificación para la acción y búsqueda de alternativas y recursos: En
un segundo momento, una vez definido el ámbito de mejora, entraríamos en
la elaboración conjunta de un plan de desarrollo de la escuela y, en una
búsqueda colegiada de soluciones, generar alternativas, previendo los
recursos necesarios. No se debe entender como algo puntual o formalista,
sino un proceso dinámico de decisión y revisión en torno a cómo vamos a
abordar los problemas.
3.- Desarrollo o puesta en práctica: Analizar, coordinada y reflexivamente,
qué va sucediendo en la práctica con los acuerdos tomados, que´efectos está
teniendo, en que aspectos conviene corregir, etc. Para esto es necesario
promover la capacidad del centro para ponerlo en práctica, para rectificar o
modificar las líneas de trabajo planteadas y para reflexionar sobre ellas.
4.- Evaluación como y para la mejora: Inserta "en espiral" en el propio
proceso de desarrollo se autorevisa colegiadamente lo conseguido para
generar nuevos problemas o prioridades y líneas de acción. La evaluación del
desarrollo curricular no es un apartado final ni un procedimiento formal o
burocrático, sino revisión permanente, ir haciendo un balance permanente
para ver si los cambios deben ser mantenido, modificados o ampliados.
Fases en la autorevisión del centro escolar.
LA EVALUACIÓN EN LAS INNOVACIONES CURRICULARES
En sentido amplio la evaluación del curriculum, como proceso de investigación,

forma parte de todo proceso de desarrollo curricular innovador. La evaluación tanto
del curriculum como de la innovación curricular, debe suponer, como ha especificado
Sttuflebeam en su modelo CIPP:
a) Evaluación durante el proceso de planificación del curriculum, tanto la

adecuación/validez del "prototipo de diseño curricular", como el propio
proceso de planificación.
b) Evaluación durante el proceso de implementación; y
c) Evaluación a largo plazo.
A su vez, se pueden distinguir diferentes estrategias para llevar a cabo la

evaluación, y el consecuente apoyo posterior, de los procesos de cambio,
dependientes cada una de diferentes perspectivas sobre el cambio educativo:
1.- Estrategias de origen tecnológico para ver el grado de implementación y

facilitar el desarrollo; o basadas principalmente en el sujeto/profesor
como individuo: P.e. el CBAM, al menos, en sus primeras formulaciones.
2.- Estrategias basadas en la realidad institucional de los centros

escolares: p.e. RBE o DO.
En sentido general los modelos y técnicas de evaluación de programas son

trasladables a la evaluación de las innovaciones, como hicieron en este apartado
González y Escudero (1987: 143-160). No obstante, como dice De la Torre (1992:
953): "Resulta un tanto sorprendente que siendo tan amplia la literatura disponible
sobre evaluación educativa y evaluación de programas, exista tan poco referido a la
evaluación de innovaciones... (por lo que es preciso) recurrir a la evaluación
curricular y de programas para inferir modelos, estrategias, recursos e instrumentos".
Fullan (1985c:1212), desde una perspectiva procesual, sitúa estos tres

componentes en la evaluación de una innovación curricular:
1.- Los factores que han afectado a la implementación;
2.- Cuál es el estado actual del cambio en la práctica en un tiempo

dado; y
3.- El impacto de la implementación en el aprendizaje de los

alumnos, actitudes capacidad organizativa y otros resultados.
Desde una perspectiva de proceso no sólo se debe examinar el desarrollo

curricular a la luz de los objetivos de la innovación, sino también qué otras
consecuencias (no planificadas) ha tenido la innovación. Como señala Fullan (1985c:
1212): "La mayoría de la literatura del campo no trata investigaciones que examinen
las relaciones entre proceso de implementación y resultados. Casi la totalidad de los
estudios examinados aisladamente uno u otro, pero los estudios de investigación de
estas relaciones están en las primeras etapas de desarrollo y plantean algunas
dificultades intrínsecas".
Desde esta misma perspectiva se emplean también procedimientos abiertos,
cualitativos, que permitan describir qué cambios introducidos en la práctica han
resultado exitosos. Desde esta perspectiva procesual es muy importante incluir en el
diseño de la evaluación los factores que han condicionado y explican el desarrollo de
la innovación. Y es que "ciertas reformas no producen efectos, otras provocan efectos
inesperados o incluso opuestos a las intenciones iniciales y otras, por su propia
dinámica, vuelven a crear en algún otro punto del sistema educativo el mismo
desequilibrio que pretendían corregir" (Unesco, 1981:21).
El modelo CBAM ("Concers Based Adoption Model") ha sido uno de los que
específicamente ha pretendido convertirse en un modelo de evaluación del desarrollo
de las innovaciones (Hord, 1987), al determinar los "niveles de uso de una
innovación", y con ello como una estrategia para facilitar el desarrollo y gestión del
cambio en los centros educativos.
El CBAM suele usar un cuestionario (SOCQ) sobre los estadios/niveles de

interés/implicación para obtener el perfil individual de las preocupaciones dominantes
en la adopción y desarrollo de la innovación; complementado por entrevistas y
estudios longitudinales. Además de la adopción en una innovación, es necesario
evaluar cómo está siendo desarrollada en las aulas, para lo que es necesario
determinar los niveles de uso de la innovación, por medio de un conjunto de
indicadores (conductuales) de cada uno de los siete niveles de uso, completados por
la observación directa. Los niveles de interés permiten analizar la dimensión personal
y afectiva del proceso de innovación, observando la práctica docente de los
profesores
NIVELES DE USO INDICADORES

USUARIOS VI.- RENOVACIÓN Busca alternativas/opciones más efectivas.
V.- INTEGRACIÓN Intenta colaborar/coordinar activamente con otros el

uso de la innovación.
IV.- B REFINAMIENTO Evalúa impacto e introduce cambios para mejorarlo

o potenciar sus posibilidades
IV.- A RUTINA No introduce casi cambios, tiene establecida una

rutina de uso.
III.- USO MECÁNICO Pobre coordinación. Cambios menores para facilitar

el uso.
II.- PREPARACIÓN Disposiciones favorables para utilizarla
NO USUARIOS
I.- ORIENTACIÓN Buscar información
0.- NO USUARIO No conoce, no actúa
Niveles de uso de la innovación.
El modelo CBAM parte, entonces, diferenciando entre usuario y no usuario

en la innovación. Tener en cuenta estos últimos significa partir de las actitudes y
conductas previas para una posterior adopción. Por eso mismo los diferencia en tres
niveles (no uso, orientación, preparación). El comienzo del desarrollo del modelo
presentado discrimina cinco tipos de usuarios, según el grado de implementación.
Junto a los anteriores elementos, el CBAM emplea las "configuraciones de la
innovación" (I.C.) como lo ha percibido e interpretado el cambio por parte de los
usuarios y las realizaciones que la innovación tiene en la práctica. Así como el
"perfil" de la innovación (presupuestos y asunciones básicas, metas y objetivos,
contenidos y estrategias, medios y recursos, etc.), necesarios para poder realizar
una evaluación de la innovación en la práctica. Un perfil preciso y definido de la
innovación nos permite establecer, por observación comparada lo que está pasando
en la práctica (configuración de la innovación), así como el grado de desarrollo
de la innovación. El problema para evaluar con este modelo, como ya señalaba, es
que la mayoría de propuestas de innovación oficial carecen de dicho perfil, por
tener un amplio grado de "indeterminación curricular". La evaluación diagnóstica
del nivel de uso de una innovación permite determinar qué intervenciones (cuarto
componente del modelo) son mejores por parte de los agentes de cambio. Por tanto
además de las posibilidades del CBAM como diagnóstico, puede utilizarse con fines
evaluativos.
Leithwood y Montgomery (1980), en coincidencia en parte con el modelo

CBAM y con un enfoque del cambio como resolución de problemas (Leithwood,
1986), plantea una "estrategia técnica atenuada" de evaluación, con las
siguientes fases y procesos:
1.- Diagnóstico de la situación: Se trata de identificar el perfil de la innovación

para saber las metas necesarias para la implementación del curriculum
propuesto.
1.1.- Revisión de la discrepancia de la innovación. Revisar lo que se está

haciendo en la práctica y el perfil o alcance de lo que plantea el modelo.
Esto supone elaborar un perfil del usuario que sirva para medir las
prácticas reales de los profesores en cada dimensión curricular.
1.2.- Identificación de obstáculos:Detectados los aspectos "discrepantes", se

puede entrar en un análisis de los obstáculos y los apoyos
(conocimientos y destrezas, materiales organización y estructuras)
necesarias para superarlos, e irse acercando a una "plena"
implementación.
2.- Aplicación: Acciones dirigidas a superar los obstáculos. Según señalan

Leithwood y Montgomery (1980) habría que llevar tres tipos de tareas:
2.1.- Procedimientos para superar la carencia de conocimientos y destrezas

que necesita el profesorado para desarrollar plenamente la innovación,
elaborando un plan de formación del profesorado.
2.2.- Procedimientos para superar la ineficacia de estructuras organizativas y

de control.
2.3.- Diseñar procedimientos para facilitar la disponibilidad de recursos y

materiales curriculares que faciliten el desarrollo e implementación del
cambio.
3.- Evaluación: Detectar y valorar en qué medida se han ido superando los
obstáculos identificados y se han realizado las metas del perfil de la
innovación. Una evaluación formativa irá en la primera dirección, con una
orientación sumativa en la segunda. Un segundo perfil del usuario, aplicado en
esta fase, podría identificar si las conductas del profesor en las distintas
dimensiones de la innovación curricular han tenido cambios. Si no hubiese
existido progreso, habría que reiniciar el ciclo para diagnosticar la situación.
EVALUACIÓN DE PROGRAMAS
Según Worthen (1989) los propósitos de la evaluación de programas son los
siguientes "a) contribuir a tomar decisiones sobre la implantación de un programa;
b) contribuir a tomar decisiones acerca de la continuidad, expansión o certificación;
c) contribuir a tomar decisiones sobre las modificaciones de los programas; d)
obtener evidencias para ayudar a un programa ; e) obtener evidencias para
oponerse a un programa; f) contribuir a comprender procesos básicos psicológicos,
sociales y otros". Por su parte Talmage (1982:594) entiende que "tres propósitos
aparecen frecuentemente en las definiciones de evaluación de programas: 1)
Proporcionar juicios sobre el valor de un programa; 2) Ayudar en la toma de
decisiones responsables en política; 3) servir para una función política.
La evaluación de un programa, entonces, se planifica como un proceso cíclico

para valorar si el programa ha conseguido alcanzar los objetivos para los que se
puso en marcha o ha dado lugar a otros efectos o resultados (positivo o no).Por eso
normalmente es necesario identificar los objetivos del programa y necesidades de
los participantes, establecer unos indicadores, recoger datos relativos a las
variables o indicadores seleccionados, y ver qué objetivos se han alcanzado,
juzgando el valor o el mérito en su consecución (Sttuflebeam y Shinkfield, 1987).
Al igual que la evaluación en general, la evaluación de programas ha estado

muy orientada a maximizar la eficiencia y eficacia de las acciones del programa,
juzgar la relación coste-beneficio, o responder a las demandas del cliente. En los
últimos tiempos, sin embargo, se ha destacado la función de proporcionar
información y elementos de juicio que contribuyan a establecer un cierto
debate social sobre las acciones educativas. No obstante, hay diferentes
modalidades de evaluación de programas. Talmage (1982), por ejemplo, distingue
cinco: experimentalista, ecléctica, descriptiva, coste-beneficio y crítica.
Pero el papel clave que desempeñan los criterios y normas de valor en la

evaluación de un programa, consiste en establecer criterios que sirvan para juzgar
la propia labor evaluativa del programa. Los principios comúnmente aceptados han
sido fijados por un colectivo de investigadores, en el llamado Joint Commitee on
Standards for Educational Evaluation (1988), que posteriormente se han reeditado
(The Joint Commitee on Standards for Educational Evaluation & Sanders, 1994),
conforme aparecen en el siguiente cuadro, que puede servir de guía general del
tema
UTILIDAD FACTIBILIDAD PROPIEDAD EXACTITUD
U1.- Identificación de la F1.- Procesamientos P1.- Orientación del E1.- Documentación del
audiencia. Identificación de prácticos. Reduciendo la servicio.La evaluación programa. Clara y
personas afectadas por la desorganización debe servir a las precisa.
evaluación. mientras se obtiene necesidades de los
información. participantes.
E2.- Análisis del
U2.- Credibilidad del contexto.
evaluador. El evaluador F2.- Viabilidad P2.- Acuerdos formales.
debe ser competente. política.Planifica la Las obligaciones deben
E3.- Descripción de
evaluación con constar por escrito.
propósitos y
antelación a las
U3.- Amplitud y selección procedimientos.
diferentes posiciones de
de la información. Que P3.- Derechos de los
los grupos de interés.
incluya preguntas sujetos. Se deben
E4.- Fuentes confiables
pertinentes sobre el respetar derechos de
de información, para
programa. F3.- Eficacia del coste. sujetos.
juzgar su adecuación.
La información debe
tener valor suficiente.
U4.- Identificación de P4.- Interacciones
E5.- Información válida.
valores. Describir humanas. Respetar la
perspectivas para dignidad en los
interpretar hallazgos. participantes. E6.- Información fiable.
U5.- Claridad del informe. P5.- Evaluación completa E7.- Información

Información importante del y clara. De los puntos sistemática. Se debe
programa fuertes y débiles del revisar
U6.- Oportunidad y difusión programa. sistemáticamente.
informe. Los hallazgos se
deben difundir entre los
P6.- Revelación de E8.- Análisis de la
usuarios.
hallazgos. Difusión y información
diseminación de los cuantitativa.
U7.- Impacto de la hallazgos.
evaluación.Planificar la
E9.- Análisis de la
evaluación para que
P7.- Conflicto de interés. información cualitativa
penetre en los usuarios.
Realizado con apertura y
honradez.
E10.- Conclusiones
justificadas.
P8.- Responsabilidad
fiscal.Justificación de los
E11.- Informe imparcial
gastos en recursos.
E12.- Metaevaluación.
Las Normas de Evaluación de Programas (The Joint Committee on Standards For Evaluation &
Sanders, 1994).
Metodologicamente hoy se vive una situación plural, compleja que tiende a un

mayor realismo, las nuevas perspectivas no sustituyen a las anteriores sino que las
complementan. Como señala Tejedor y otros (1993) "los cambios habidos en estos
últimos años en las dos posturas básicas son los siguientes: (1) la postura tradicional
entendía la evaluación como el empleo de métodos científicos para medir el
desarrollo y los resultados de programas que luego se utilizaban para la toma de
decisiones, (2) la segunda postura más actual entiende la evaluación como el
conocimiento empírico del mérito o valor de las actividades y objetivos de un
programa propuesto".
LAS TÉCNICAS EN LA EVALUACIÓN EN EL CURRICULUM.
Realizaremos un estudio de las diferentes técnicas cualitativas y cuantitativas

en la evaluación
TÉCNICAS CUALITATIVAS.
Son técnicas de evaluación continua, con una finalidad formativa. Ory (1991)
comenta que el aumento de estas técnicas de evaluación se debe a la ampliación del
campo de la evaluación, de las audiencias y de los propósitos de la misma
evaluación. Por tanto se trata de técnicas de evaluación cualitativa, que se usan tanto
en enfoques interpretativos como críticos, aunque con finalidades diferentes.
Hemos seguido, en principio, la línea de Kemmis y McTaggart (1992). Es por

lo que partimos de las técnicas utilizadas por Kemmis y McTaggart (1992) en la
investigación-acción.
a) Registros anecdóticos.
Son informes longitudinales y descriptivos, de lo que un alumno o grupo de

alumnos dicen o hacen en determinadas situaciones a lo largo de un período de
tiempo. Son muy importantes los hechos y contextos en relación a los incidentes
relativos a un problema determinado.
b) Notas de campo.
Son aquellas que describen hechos, impresiones e interpretaciones subjetivas

de la realidad, en la cual se refleja la propia realidad.
c) Descripción ecológica del comportamiento.
Se registran todos los comportamientos observados para comprender la

secuencia de los mismos.
d) Análisis de documentos.
Se utilizan entre otros documentos importantes cartas, folletos, circulares,

informaciones del tablón de anuncios, trabajos de los estudiantes, planificaciones de
los profesores, revistas o periódicos escolares, cuadro de horario, archivos, informes
escolares, programas y proyectos educativos del centro, con el objetivo de analizar el
funcionamiento interno del centro o de una parte del mismo.
e) Diarios
Se trata de analizar los informes personales cuyo contenido puede ser muy
variado (preocupaciones, sentimientos, reflexiones, observaciones, interpretaciones,
hipótesis, explicaciones, ...), pudiendo ser potentes instrumentos de autocontrol del
proceso de enseñanza (diario de profesores) o de aprendizaje (diario de alumnos y
profesores). Los diarios en el contexto de documentos personales, como biografías,
autobiografías, historias de vida, cartas, etc., son consideradas como importantes por
Zabalza (1991) para la investigación educativa y para analizar el pensamiento y los
dilemas que se le presentan al profesor en la práctica. Su validez en investigación
cualitativa depende del contexto en el que se utilice, elabore y su finalidad y forma
de analizarlo.
Para Schratz (1992), el diario, en el contexto de un proyecto de investigación-

acción de profesores universitarios, es un documento personal que se escribe para
consignar pensamientos, impresiones y sentimientos sobre situaciones docentes.
Utilizado en un contexto evaluativo contribuye a desarrollar el proceso de
autorreflexión, expresando la forma intelectual de vivir la experiencia, pero también
refleja otros aspectos personales integrados en la misma.
A pesar de ser considerado como un documento para la reflexión personal sobre

el desarrollo profesional, debe servir para estimular la reflexión y la discusión
colegiada, integrando en la medida de lo posible a los estudiantes con
objetivo de introducirles y hacerles conscientes de los procesos de
autoevaluación y contribuir en procesos de autoreflexión.
White (1985) considera, como una exigencia profesional, la de reflexionar sobre

las propias prácticas docentes, planificar, poner en práctica los planes y mantener
registros que ayuden a valorar las prácticas, por ello ve necesaria la redacción de un
diario en el contexto del Área Remota de Educación del Profesorado (RATE), por el
potencial que ofrece:
* Es un mecanismo para explorar las prácticas.

* Es un componente dentro de un repertorio de métodos de
evaluación.
* Es un medio de autonomía a través del desarrollo de la confianza en
la utilización de la palabra escrita como guía para la acción, que a la
vez proporciona oportunidades de reflexión sobre esta acción y
nuevos planes de acción consecutivos.
* Es un vehículo para facilitar la relación de apoyo y de crítica.
Según el autor se deben tener en cuenta los siguientes principios en la

redacción de los diarios:
a) El diario debe ser realizado por todos los participantes implicados en
el proceso.
b) Los momentos especiales del curso, se reservarán para ser escritos
ininterrumpida y silenciosamente
c) Debe compartirse con otros participantes todo aquello que se
escriba.
d) Se reservaran momentos especiales en el horario para compartir los
diarios.
e) La redacción del diario requiere una estructura y un ambiente de
apoyo, esto puede conseguirse estableciendo un enfoque previo al
inicio de la redacción y procedimientos para el diálogo en el que se
comparten los diarios.
Kemmis y McTaggart (1992,p.66) distinguen cuatro tipos de reflexiones que

deben constar en el diario de un proyecto de investigación-acción:
1.- Sobre el cambio en la utilización del lenguaje y sobre un discurso

más coherente en relación con la preocupación temática que se
estudia, tanto de uno mismo como de los otros.
2.- Sobre el cambio en las prácticas educativas en su contexto.
3.- Sobre los cambios en las relaciones sociales ente las personas integradas
en su misma actividad, así como sobre los cambios que se vayan
iniciando en la estructura organizativa formal.
4.- Sobre los cambios en los modos de participación del grupo en el

proceso de investigación-acción mismo, y cómo se relaciona este
proceso con otros existentes en el mimo centro educativo.
f) La carpeta de enseñanza.
La carpeta de enseñanza, es una técnica de investigación y evaluación

educativa, con fines formativos, que se está utilizando en la Universidad de Stanford
(Shulman, 1992). Se tienen en cuenta el contexto, el contenido, el conocimiento y la
comprensión del profesor, y las relaciones entre estudiantes y profesores, para
valorar la calidad de la enseñanza. Además contiene la observación directa del
profesor en sus clase, así como sus reflexiones.
Para Shulman (1992) el portafolio es un documento físico que recoge las

preguntas de los profesores y las respuestas reflexivas que van dando, y en el que se
contiene variedad de información que consta en documentos, preguntas, ensayos,
proyectos, trabajos, exámenes, interrogantes, autoevaluación del profesor.
Athanasses (1991) utiliza este medio en la evaluación de la enseñanza de la

lectura y escritura, ya que considera que es una técnica que proporciona evidencia
sobre el pensamiento y la práctica del profesor. Explica el uso de la carpeta de
enseñanza para explicar tres campos: Cómo planifica y enseña el profesor una parte
del currículum, sólo evalúa el progreso del estudiante, y cómo crea un ambiente que
favorece la enseñanza.
Por tanto, esta técnica, puede convertirse en un medio de evaluación

colaborativa en cuanto que sirve para la reflexión del profesor, pero también para
que otros comprendan el significado desde el punto de vista de los sujetos, y
profundizar en el conocimiento y valoración de las prácticas de enseñanza por el
análisis documental y la entrevista sobre ello.
g) Cuadernos.
Es el registro de actividades en determinados tiempos, y la valoración que se
hace de ellos. Es un medio de control del cual no se debe abusar en detrimento de
otras actividades que pueden ser más enriquecedoras como observar, percibir,
pensar, idear, imaginar, analizar, discutir,.., y que además pueden consignarse en
alguno forma de representación escrita o no.
Schratz habla de otras técnicas como la del "minuto de escritura", en la que se

pide a los estudiantes que respondan a dos preguntas: )Qué es lo más significativo
que he aprendido hoy?, )Cuál es la cuestión fundamental que me queda en la mente
al terminar la clase?. Este procedimiento proporciona conocimiento sobre la
comprensión de los estudiantes. Sirve de evaluación, de conocimiento y
autoevaluación de la enseñanza.
Otra técnica es la del "feedback inminente", la cual consiste en obtener, de

forma sencilla y escrita, una respuesta rápida e individual de algunos aspectos del
proceso de enseñanza-aprendizaje, la cual ayudará al profesor a juzgar posteriores
pasos en el enfoque dado, sobre todo si es diferente de otros profesores. Los
estudiantes están muy motivados a dar sus propias opiniones, sobre todo si se
presentan resultados.
Dado que en la investigación de Schratz es muy importantes la comunicación y

la evaluación en ambas direcciones, se ha utilizado otra técnica denominada "carta
abierta". Se trata de una forma de comunicación, y puede utilizarse para evaluar
cierto aspectos e los procesos de enseñanza- aprendizaje. Puede servir para obtener
más información o apoyo de los estudiantes.
h) Muestras de cuestiones tipo.
Se tratan de fichas en las que se registra información referente a distintos tipo

de temas: actividades, disciplina, organización, motivación,...Sirven, como base para
la reflexión, para elaborar informes diarios de cada tema.
i) Archivos.
Son recopilaciones de diversos materiales con un fin determinado.
j) Cuestionarios.
Se componen de preguntas escritas, abiertas o cerradas, que exigen también

respuestas escritas.
Para Schratz (1992), el cuestionario es una de las técnicas más usadas y

sencilla utilizadas en evaluación. Sin embargo, su debilidad se fundamenta en la
limitación de las opciones para responder, por ello sería buena la idea de que los
estudiantes pudieran escribir una corta explicación del por qué han tomado
determinada opción, y a su vez el profesor obtendría una visión más amplia de cada
cuestión debido a estos comentarios subjetivos.
Similar a un cuestionario abierto podemos encontrar el cuestionario de

"completar frases", en las que cada estudiante añade a la pregunta su propia
interpretación. El problema de esta técnica es que ofrece dificultad en orden a
estandarizar los resultados, sin embargo brinda una información más rica de la
experiencia individual, y sirve para evaluar la comprensión como los sentimientos,
creencias, reacciones, opiniones y valores.
k) Entrevistas.
Las entrevistas pueden ser de varios tipos: no planificadas, planificadas pero no
estructuradas, estructuradas y semiestructuradas.
Basándose en la utilización que hizo Piaget de la entrevista para evaluar las

capacidades cognitivas, Novak y Gowin (1988) enfatizan en la importancia de la
entrevista como instrumento de evaluación del aprendizaje significativo. Una de las
aportaciones de Piaget, según estos autores, fue el haber ideado los hechos y
objetivos específicos que usaba en las entrevistas, así como las preguntas que hacen
posible observar las regularidades en las respuestas de los niños, es decir, una
planificación cuidadosa de la entrevista. La entrevista sirve para indagar qué
conceptos han adquirido o poseen los estudiantes, cuál es su estructura,
cómo pueden activarse conceptos y estructuras para resolver problemas,
también ayudan a conocer las actitudes y valores de los estudiantes y los
procedimientos que utilizan para resolver la tarea.
En la planificación de una entrevista hay que tener en cuenta los siguientes

elementos:
a) Selección del contenido. Se debe averiguar previamente qué sabe el

alumno sobre un tema o cuerpo de conocimiento determinado, para
facilitar la organización de conceptos y ejemplos de una instrucción
posterior.
El problema de este procedimiento es el excesivo tiempo que hay que
dedicarle.
b) Estructuración de las preguntas. Deben hacer referencia a
cuestiones claves, de las que se solicitan explicaciones, relación, y
juicios de valor y trasferencia.
c) Selección de materiales auxiliares. Apoyan a la tarea, y son el punto
de partida de las preguntas más útiles para averiguar la
comprensión de los estudiantes.
d) Ordenación de las preguntas. Los autores no aconsejan la pregunta
arbitraria, sobre todo al comenzar. Por ello dan algunas reglas para
ordenarlas; partir de la tarea que se está realizando, y pedir
explicaciones sobre lo que sucede; proceder de lo fácil a lo difícil, y
desde las preguntas amplias a las detalladas.
e) Evaluación de las entrevistas. Toda entrevista debería grabarse y

analizarse mediante un sistema de categorías de conocimiento. Novak y Gowin,
proponen categorizar los tipos de respuestas en válidas y erróneas.
Gowin (1988) propone otro sistema de categorías, el análisis de las

entrevistas mediante la UVE. Se basa la entrevista en un mapa
conceptual, se graba, y para analizar las categorías de respuestas se van
consignando en la UVE, de forma que se puede descubrir cómo funciona la
mente del estudiante y qué teorías sostiene.
Gowin observó que la UVE de evaluación contradice la teoría de los estadios de

Piaget, ya que en todos los estudiantes, incluidos los más pequeños, se puede
encontrar todo tipo de respuestas que pertenecen a las distintas categorías del
pensamiento.
Otro tipo de entrevista es la que Schratz (1992) denomina "entrevista

triangular", en la que un observador externo participa en la entrevista con fines
evaluativos, recogiendo información sobre ciertos aspectos y problemas.
Posteriormente se entrevista al profesor y a los estudiantes. Este tipo de entrevista
implica un mayor esfuerzo en la investigación evaluativa ya que se confrontan tres
perspectivas, pero suele aportar información sobre problemas específicos o áreas de
interés.
l) Métodos sociométricos.
Con este método se pretende averiguar qué individuos son apreciados o

rechazados en un grupo, y quienes se aprecian o rechazan mutuamente. Pueden
servir para formar grupos de trabajo, desarrollar actitudes sociales o mejorar las
relaciones personales.
m) Inventarios y listados de interacciones.
Sirven para registrar los datos de la observación, de clases grabadas o de

reuniones. Kemmis y McTaggart, señalan cuatro categorías de comportamientos que
pueden registrarse: comportamiento verbal del estudiante y del profesor,
comportamiento no verbal del estudiante y del profesor
n) Grabaciones en audio.
Son útiles en reuniones de trabajo y para la interacción con el alumno en clase o

en grupos. Su problema es el largo tiempo que hay que dedicar para una
transcripción completa. Por ello Kemmis y McTaggart consideran necesario un listado
de interacciones para agilizar el análisis.
ñ) Grabaciones en vídeo.
Técnica muy útil para la evaluación de los procesos de enseñanza-aprendizaje.

Facilita el registro de toda la clase, o de parte, o de aspectos concretos, para
analizarla posteriormente. Schratz (1992) utiliza esta técnica para el análisis de la
interacción entre profesor y estudiantes.
o) Fotografías y diapositivas.
Útiles para registrar "incidentes críticos", aspectos de la actividad de la clase,

determinados productos. También sirven como referencia para entrevistas con los
estudiantes.
p) Observación de clases.
Schratz (1992) comenta que la observación directa produces ansiedad en los

profesores. Sin embargo sería útil la observación entre compañeros de forma regular,
para así compartir significados que ayuden al crecimiento continuo personal y
profesional.
q) Análisis de metáforas
Revelan ideas y definiciones de los problemas que subyacen a los programas.

También se ha utilizado en el análisis del pensamiento del profesor.
r) Mapas conceptuales.
Se representa un visión global del programas en sus contexto con los procesos,
inputs y resultados, y sus interrelaciones.
s) Algoritmos relacionales.
Para crearlos se comienza por hacer declaraciones cortas de un problema para

después centrar la atención sobre dos términos que representan un dilema, y
después se relacionan mediante palabras de enlace, que pueden poner de manifiesto
la primacía de unos elementos frente a otros, o igualdad y complementariedad entre
los dos conceptos.
t) Recuadros de frases
Se usan para comparar las visiones y descubrir los aspectos críticos del
programa. Para ello se encuadran las descripciones del programa hechas por
distintas personas: director, profesores, alumnos.
TÉCNICAS CUANTITATIVAS.
Se basan en la comprobación del aprendizaje de contenidos disciplinares. Se

relacionan con la evaluación periódica y sumativa (Rosales, 1990), que tienen lugar
en determinados momentos del proceso de enseñanza/aprendizaje.
a) Los exámenes escritos.
No todos los exámenes se construyen sobre pruebas objetivas, cuantitativas,

sin embargo existe una tendencia a la cuantificación.
Ausbel (1983) consideraba que los exámenes tienen algunos valores positivos:
a) A la vez que el profesor piensa qué debe ser objeto de examen,

clarifica sus objetivos, al mismo tiempo que comunica sus
expectativas a los alumnos al indicarles cuáles son los aspectos
fundamentales de la materia y que forma puede tener el examen.
b) Los exámenes suponen una importante experiencia de aprendizaje
ya que obliga a revisar, aclara y consultar los conocimientos antes,
durante y después.
c) Tienen un papel motivacional.
d) Los estudiante aprenden a evaluar sus propios resultados a través
de ellos.
e) Proporciona conocimiento de su tarea al profesor, lo cual le sirve de
autoevaluación.
Tipos de pruebas escritas.
a) Pruebas de ensayo. A través de ellas se puede expresar el

conocimiento obtenido, así como la expresividad y originalidad del
alumno.
b) Pruebas formales de elaboración de respuestas, de producción de
determinadas obras o experimentos de laboratorio.
c) Test de rendimiento de los estudiantes. Pruebas objetivas de
respuesta breve. Sirven para diagnosticar lagunas, constar logros,
etc.
b) Pruebas orales.
Se comprueba el aprendizaje del alumno mediante el diálogo con el profesor.

Requieren mucho tiempo y un clima socioafectivo adecuada para que puedan
suponer una situación de pensamiento y de trabajo intelectual adecuado, para poder
rendir y expresar el aprendizaje.
c) Características que deben reunir las pruebas.
* En cuanto a la elaboración las cuestiones deben ser representativas del

contenido que se pretende evaluar. La prueba debe estar
adecuadamente elegida a los fines planteados y la formulación debe ser
clara.
* En cuanto a la aplicación, es importante reducir el nivel de ansiedad de

los alumnos a través de una información previa sobre el conocimientos de
que la prueba va a consistir en aspectos importantes a los que ha
dedicado tiempo y tareas suficientes. En este sentido Zabalza (1987)
habla de la influencia del contexto de aprendizaje que juega en la
asociación de preguntas y respuestas.
* En cuanto a la medición, se trata de comparar lo logrado con lo

pretendido. La corrección debe tener en cuenta qué aspectos y
contenidos deben puntuarse y con qué prioridad.
* Por último se produce la evaluación, el juicio de valor que emitimos sobre

la calificación otorgada cuando se analizan los resultados y los procesos,
los datos y las condiciones en las que se han producido. Su aplicación
puede tomar mediadas sobre la promoción de un alumno, o con fines
formativos, para tomar decisiones sobre la planificación y el desarrollo del
currículum en los procesos siguientes.
LA EVALUACIÓN DEL CURRICULUM EN LA REFORMA
Algunas de las principales funciones y sentidos de la evaluación fueron ya

recogidos en la L.G.E. de 1970. En la medida que el lugar y la función de la
evaluación en el propio Diseño Curricular sigue siendo el mismo (Escudero, 1990c),
es decir, Tyleriano :"¿Qué, cómo y cuando evaluar?. Por lo que es dificil hacer
una evaluación que permita juzgar si se han alcanzado los objetivos deseados".
La finalidad de la evaluación, es obtener (MEC,1992b) "información que

permita adecuar el proceso de enseñanza al progreso real en la construcción de
aprendizajes de los alumnos", de modo que permita tomar las decisiones para,
además de reconducir el proceso de aprendizaje, adecuar el diseño y desarrollo de la
programación. Por eso se plantea, con una cierta novedad, la relación entre la
evaluación del proceso de aprendizaje y la evaluación del proceso de
enseñanza. La evaluación del aprendizaje de los alumnos se convierte en
autorregulación del proceso de enseñanza, y en criterio de si es necesario reformular
el diseño y programación realizado.
La evaluación de la enseñanza se debe realizar en un triple nivel: evaluación

del proceso de enseñanza y práctica docente, del proceso de aprendizaje de
los alumnos, y del Proyecto curricular. Así las órdenes de evaluación especifican
que "los profesores/as evaluarán los procesos de enseñanza y su propia práctica
docente en relación con el desarrollo del currículo. Asimismo, evaluarán el Proyecto
Curricular y las programaciones de aula emprendidos, en virtud de su desarrollo real
y de su adecuación a las características específicas y las necesidades educativas de
los alumnos y alumnas".
Los Reglamentos Orgánicos de los Centros (1993) determinan, después de un

período de indecisión sobre qué aspectos formales debían incluir los Proyectos
curriculares de Etapa, que deberán incluir las siguientes decisiones relativas a la
evaluación:
- La distribución de los objetivos, contenidos y criterios de evaluación de

las distintas áreas.
- Criterios generales sobre evaluación de los aprendizajes y promoción de

los alumnos.
- Criterios para evaluar y, en su caso, revisar los procesos de enseñanza y
la práctica docente de los profesores.
LA EVALUACIÓN DE LOS DOCUMENTOS INSTITUCIONALES EN EL CENTRO.
En relación con la evaluación del contenido curricular en los Proyectos

Curriculares, de acuerdo con lo señalado en este Proyecto Docente, en el apartado
dedicado a los contenidos curriculares, a nivel de diseño curricular, se plantean dos
cuestiones principales:
1) Selección de contenidos.
2) Organización y secuenciación.
Aspectos como la determinación del contenido, qué núcleos de conocimientos

humanos deben formar parte del currículo escolar de una determinada etapa/ciclo; si
dicha selección debe basarse en los corpus disciplinares o incluir contenidos de otras
fuentes necesarios para la vida cotidiana, son dimensiones del problema de la
selección del contenido curricular.
La secuenciación de contenidos interciclos e intraciclos se debe efectuar al

triple nivel de Proyecto Curricular de Etapa, del Ciclo respectivo o en cada unidad
didáctica. En la evaluación del Proyecto Curricular se especifica que se evaluará "la
validez de la secuenciación de los objetivos y contenidos por ciclos", tanto en la
selección, distribución y equilibrio que se ha realizado de los contenidos, una vez que
se ha llevado a cabo una primera implementación y desarrollo práctico.
Elaborada una determinada distribución y secuenciación de los contenidos del

curriculo, prescrito oficialmente o no, se pueden analizar los criterios/indicadores para
juzgar/evaluar la adecuación del "prototipo de diseño curricular" realizado,
dependientes de la perspectiva adoptada, me parece, desde una triple perspectiva
de criterios-guía:
1.- Perspectiva de "fidelidad":
* Grado de concordancia/fidelidad con los criterios, orientaciones,

distribución y secuenciación por ciclos, establecidos oficialmente para la
elaboración de proyectos curriculares de centro.
* Grado en que está completa la "cubierta curricular" externa del currículo

oficial: p.e. están cubiertos aparentemente todos los bloques temáticos,
enunciados de tópicos, etc.
* Congruencia con los materiales curriculares ("libros de texto") utilizados.
2.- Perspectivas de proceso, desarrollo o adaptación:
* Grado de adaptación/variación de las prescripciones oficiales para lograr

una adaptación mutua a la situación del contexto local del Centro.
* Grado en que ha empleado creativamente el potencial curricular del

curriculo básico, para sacar nuevas posibilidades, no previstas en el
curriculum oficial, generando un currículo "propio".
* Proceso de dinámica de trabajo conjunto, compromiso, acuerdo/consenso

por el que se ha llegado al documento o propuesta.
3.- Perspectiva "oficialista":
* Los criterios de secuenciación de contenidos aducidos repetidamente en

la literatura oficial (Del Carmen y Zabala, 1991: 45-50; Del Carmen, 1991:
20-23; MEC, 1992b: 36-41, etc.) son una mezcla de estos dos
componentes: Teoría de la Elaboración y Psicología
Constructivista. Pueden, creo, ser empleados complementariamente
indistintamente desde una perspectiva de fidelidad o de desarrollo. Estos
criterios son: Pertinencia con el desarrollo evolutivo y los aprendizajes
previos del alumnado, coherencia con la lógica de las disciplinas a las que
pertenecen los contenidos de aprendizaje, elección de un tipo de
contenido como eje vertebrador de la secuencia, delimitación de las ideas
eje, continuidad y progresión, equilibrio, interrelación y presencia de
temas transversales.
En cualquier caso, resulta problemático aplicar en una lógica supervisora un

conjunto de indicadores externos, al margen del proceso y realidad interna del Centro
a que responda el Proyecto curricular. A modo de ejemplo, los criterios externos
uniformados para evaluar el Proyecto curricular de Etapa se pueden ver los
indicadores de evaluación que aparecen en la siguiente tabla.
INDICADORES DE EVALUACIÓN DEL CONTENIDO DEL PCC VALORACIÓN
*Incluye los contenidos, por áreas o materiales, marcados legalmente como obligatorios. 12345
* Secuencia los contenidos, por áreas o materias, para cada ciclo o curso de la etapa. 12345
* Es coherente la secuenciación vertical de contenidos. 12345
* Es coherente la secuenciación horizontal de contenidos de las diferentes áreas o 12345

materias.
* Tiene un cuenta los contenidos trabajados en la etapa anterior. 12345
* Tiene en cuenta los contenidos que se trabajarán en la etapa posterior. 12345
* Adecua los contenidos a las características del entorno, de manera que resultan: 12345
funcionales, significativos, aplicables a la vida diaria y útiles.
* Adecua los contenidos a las peculiaridades del alumnado. 12345
* Incluye, en las diferentes áreas o materias, los contenidos transversales. 12345
* Recoge suficientes opciones de contenido, en su caso, para la elección por parte del 12345
alumnado
Indicadores de Evaluación del contenido en el Proyecto Curricular del Centro (Casanova, 1992, 1993).
El Proyecto Curricular de Etapa/Centro, para que pueda ser un instrumento

válido para la práctica pedagógica, exige su evaluación por parte del Claustro de
profesores. Esta evaluación, según las orientaciones y normativa oficial, deberá
valorar todos y cada uno de los elementos que componen el propio Proyecto
curricular.
La evaluación del proceso de enseñanza y de la práctica docente, además del análisis específicos del Proyecto
Curricular de Etapa, deberá abordar, al menos, la consideración de los siguientes aspectos:
a) La organización del Centro y el aprovechamiento de los recursos.
b) El carácter de las relaciones entre profesores y alumnos y entre los mismos profesores, así como la
convivencia de entre los alumnos.
c) La coordinación entre los órganos y personas responsables en el Centro de la planificación y desarrollo

de la práctica docente: Equipo Directivo, Claustro de Profesores, Equipo Técnico de Coordinación
Pedagógica, Departamentos y tutores
d) La regularidad y claridad de la relación con los padres, madres o tutores legales.
EVALUACIÓN DEL PROCESO DE APRENDIZAJE
Los "criterios de evaluación" de Enseñanzas mínimas se refieren

mayoritariamente a contenidos conceptuales, algunos a procedimientos y casi
ninguno a contenidos actitudinales; tal vez porque en su propósito de especificar
criterios, más o menos mensurables, en las actitudes no son fáciles de expresar. Con
lo que hay una contradicción entre lo proclama de novedad o la Reforma que era
hacer explícito el currículo oculto por medio de la dimensión de "normas, actitudes y
valores", y cuando se intentan determinar los criterios de evaluación, éstas
prácticamente desaparecen en su dimensión sustantiva.
Por ello los "criterios de evaluación" se convierten en objetivos terminales en

la práctica, y esa será la lectura que hará el profesorado (y las propias editoriales),
como objetivos que los alumnos tendrán que haber cubierto al final del proceso, lo
que convierte la propuesta inicial de un currículo abierto y flexible de facto en
currículo semicerrado, prescriptivo, que deja poco margen a las potenciales
interpretaciones y prácticas docentes divergentes del profesorado, para uniformarlas
en función de esos mínimo.
EVALUACIÓN DE LOS CONTENIDOS
La evaluación del grado de aprendizaje de contenidos curriculares impartidos,

que interacciona y suele ser dependiente con los contenidos planificados y trabajados
en el aula, se convierte en "institución creadora de conocimientos" (Kvale, 1992). En
analogía con la definición operacional de inteligencia (lo que es medido en los test), el
contenido curricular operativo para los alumnos es lo que es evaluado en los
exámenes, definiendo éstos el conocimiento válido en un campo disciplinar. Nos
fijaremos, en esta segunda dimensión , en los criterios de evaluación referidos a los
contenidos comunes válidos de una disciplina, por la evaluación que se efectúa del
aprendizaje de los alumnos.
EVALUACIÓN INTEGRADA O DIFERENCIAL
La evaluación integrada se debe entender con un doble sentido: 1) No separa

aspectos conceptuales de los actitudinales, siendo juzgada toda la labor educativa de
modo integrado; 2) Que el proceso de evaluación esté integrado en el propio proceso
de enseñanza-aprendizaje, con un sentido formativo o continuo; y 3) la labor de
evaluación es conjunta del equipo de profesores: integración de juicios, de
perspectivas/juicios de los diferentes profesores. Por ahora, aquí nos referimos sólo al
primer sentido.
La distinción entre tres tipos de contenidos quiere indicar, además de señalar

diversos campos de actuación en la enseñanza, que "las estrategias didácticas y los
procesos psicológicos mediante los cuales se enseñan y se aprenden los hechos,
conceptos, los procedimientos y las actitudes, valores y normas presentan algunas
diferencias sustanciales entre sí, al igual que sucede con las estrategias e
instrumentos de evaluación más apropiados en cada caso" (Coll y otros, 1992:17).
Que los instrumentos y procesos de evaluación tengan que ser diferentes en cada
tipo de contenido, y los criterios para juzgar el nivel de aprendizaje alcanzado puede
ser distinto, no debe significar en ningún caso que cada tipo de contenido
tenga una evaluación diferenciada. Así haber situado formalmente el campo de
las actitudes y valores como contenidos de toda enseñanza, al mismo nivel que los
restantes, debiera significar que han de ser evaluados de manera global e integrada.
Clase de contenido Tipo de aprendizaje Criterios y Formas de evaluación
CONCEPTUAL: Hechos * Hechos: memorísticos, SABER: Conocer, analizar, enumerar,

conceptos y principios. reproductivo y aislado. explicar, describir, resumir,
relacionar, recordar, etc.
* Conceptos: significativo, relación
e integración. * Definición, exposición,
identificación, categorización, etc.
* Principios: Comprensión de
relaciones entre conceptos o
hechos.
PROCEDIMIENTOS: Distintas * Conocimiento y utilización SABER HACER: Elaborar, aplicar,

acciones y estrategias para (funcionalidad, uso y aplicación) de experimentar, demostrar, planificar,
resolver objetivos o alcanzar un conjunto de habilidades y construir, manejar, etc.
metas. estrategias, métodos, reglas,
destrezas o hábitos a las tareas o
* Uso y aplicación práctica en
situaciones particulares.
situaciones apropiadas. Integración
de acciones, generalización,
contextualización, etc.
ACTITUDINAL: Actitudes, * Componente afectivo, cognitivo y VALORAR: Comportarse,

valores y normas comportamental.
respetar, tolerar, apreciar,
preferir, sentir, valorar,
* Predisposición a actuar de aceptar, etc.
una determinada forma
socialmente deseable. * Observación sistemática en
sus diversas variantes y
situaciones.
Clases de contenidos, tipo de aprendizaje y formas de evaluación.
La Orden del MEC de 30 de octubre de 1992 ("B.O.E" de 11 de noviembre),

sobre los elementos básicos de los informes de evaluación, especifica que el
Informe de Evaluación Individualizado contendrá, entre otros elementos, la
"apreciación sobre el grado de asimilación de los contenidos de las diferentes áreas o
materias". Interpretando de modo extremo lo anterior, como ejemplo de lo que no
debe hacerse, ha diferenciado la evaluación de la adquisición de cada tipo de
contenido en cinco grados para cada área, tanto en Primaria como en Secundaria
Obligatoria.
EVALUACIÓN DE LOS CONTENIDOS
Como señalo Stenhouse, son las cualidades, valores y principios intrínsecos al

propio proceso educativo, puestos de manifiesto en la misma forma de llevar a cabo
la acción, y no los resultados objetivos extrínsecos que se consiguen, los que hacen
"educativa" una actividad. Podemos, no obstante, con estos presupuestos referirnos
específicamente a cada tipo de contenido:
1.- Evaluación de contenidos conceptuales: La distinción entre

conocimiento factual, conceptual y de principios, pretende ser relevante
didácticamente por implicar distintos procesos de aprendizaje,
estrategias de enseñanza y modos de evaluación. Así un concepto no se
puede evaluar igual si fuera un dato o un principio, pues suele implicar
procesos de un nivel sino más alto, diferente de abstracción.
2.- Evaluación de procedimientos: Pretende incidir en que los alumnos

aprendan a saber hacer y transferir funcionalmente a otros contextos las
habilidades adquiridas. Su evaluación debe referirse a destrezas de
distinto rango, desde estrategias cognitivas a la utilización de técnicas e
instrumentos, aunque el "saber cómo" suele presuponer el "saber que".
3.- Evaluación de los contenidos actitudinales: Las actitudes adquiridas

no suelen ser directamente evaluables, son inferidas a partir de acciones
manifiestas. Evaluar estos contenidos actitudinales trae consigo dos
problemas: uno técnico-metodológico y otro ético. Solo si tenemos claro
el sentido de la evaluación en este ámbito (por qué, para qué, con que
legitimidad) podríamos entrar en qué métodos o técnicas nos podrían ser
útiles en este sentido.
LA DIFUSIÓN DE LA EVALUACIÓN: TIPOS DE INFORMES
Se prescribe la realización de un Informe Anual y de un Informe de Evaluación

Individualizado (IEI), cuya finalidad es servir de orientación para evaluación inicial del
primer ciclo de educación primaria (en el caso de Infantil) o de los ciclos o etapas
siguientes, de manera que se garantice la continuidad del proceso de aprendizaje;
aparte de los destinados a las familias, cuyo formato específico se deja como decisión
a los centros.
El Informe de Evaluación Individualizado (IEI), que emitirán los profesores al

término de cada curso académico en Primera y Secundaria Obligatoria, incluye la
"apreciación sobre el grado de asimilación de los contenidos conceptuales,
procedimentales y actitudinales de las diferentes áreas o materias".
EVALUACIÓN DE LOS PROCESOS DE ENSEÑANZA-APRENDIZAJE
Como otro ámbito de la evaluación se pretende que los maestros y profesoras

evalúen su propia práctica docente, referida a tres aspectos fundamentales: el
ambiente del aula, la coordinación y coherencia entre los profesores de
cada ciclo, y la calidad y regularidad de las relaciones con los padres.
El plan para evaluar el proceso de enseñanza-aprendizaje se encomienda a un

Equipo técnico la comisión Coordinación Pedagógica, y deberá ser aprobado por el
Claustro. Pero también el Claustro o el Consejo Escolar de Centro pueden tener la
iniciativa de poner en marcha programas de evaluación sobre el funcionamiento del
Centro educativo.
De acuerdo con la literatura oficial se aconseja que acerca de la práctica

docente en el aula se deberá valorar el diseño y desarrollo de cada unidad didáctica,
el ambiente de aula y clase y la propia actuación personal. En el ámbito del Ciclo y la
Etapa el desarrollo de la programación o Proyecto curricular, la coordinación en el
ciclo o interciclos, y la adecuación de los criterios de evaluación/promoción. Esta
evaluación debe efectuarse al comienzo de cada ciclo y al finalizar. Aquellas
evaluaciones que afecten al Proyecto curricular introduciendo algunos modificaciones
deberán reflejarse en la Programación anual.
FUTURO DE LA EVALUACIÓN.
En los últimos años los teóricos de la evaluación se han dedicado a reflexionar,
aumentando, probablemente, el conocimiento, y desarrollando alguno elementos de
la práctica: instrumentos, técnicas... que, por otra parte, en nuestro país empezamos
ahora a necesitar.
La mayoría de los modelos se desarrollaron en los años sesenta y setenta. En el

año 1989, algunos autores revisan y hacen una reflexión debido a la petición de
participación en la obra de House sobre evaluación. Igualmente, en el año 1991, los
capítulos de cada uno de los autores aportan a la obra de McLaughlin y Phillips siguen
mirando hacia adentro, hacia sus posiciones, sin suponer un debate entre ellos, que
hubiera dado lugar a nuevas visiones o modelos. De forma que Milburn (1992), al
hacer la recensión, dice que hay obras que tienen éxito si eliges a los participantes
adecuados: Stake, Scriven, Eisner, House, Sttuflebeam, Weiss, etc.
A) SOBRE EL MARCO TEÓRICODE LA EVALUACIÓN.
Greene y McClintock (1991)piensan que no se puede buscar la causa de la

mejora de la educación en un programa de innovación curricular entendido como
variable independiente, porque son muchos los factores que influyen en el éxito de
un determinado programa y no sólo éste. Por ello hay que tener en cuenta una
variedad de perspectivas o aproximación a la evaluación desde enfoques mixtos, que
puedan tener en cuenta distintas variables para concebir programas teóricamente.
B) SOBRE LOS MÉTODOS EN LA EVALUACIÓN.
Para los autores Greene y McClintock, a pesar de los pocos ejemplos prácticos
de investigaciones que utilicen métodos mixtos, no es lo mismo usar métodos
mixtos, que un teoría mixta, ya que los métodos no están inherentemente ligados a
un determinado paradigma.
Clinkenbeard (1992) reflexiona sobre problemas educativos y tipos de

programas. Para determinados problemas sólo sirve la metodología cuantitativa, para
otros la cualitativa. En caso singulares, como los efectos des un programa de niños
bisen dotados, hay que hacer estudio de casos con métodos cualitativos, pero
además es el único medio para poder explora y descubrir si efectivamente trabajan
de manera cualitativamente diferente.
C) EN CUANTO A LA FINALIDAD DE LA EVALUACIÓN.
Ory (1991) hace una crítica a los programas de evaluación que se ha

desarrollado durante los últimos veinticinco años, porque a su juicio hacen demasiado
hincapié en ser útiles para los que toman decisiones, pero en adelante el énfasis
deberá ponerse en el desarrollo del profesorado y en la mejora del currículum. y algo
importante será relacionar evaluación de programas y proyectos futuros. Es decir, el
trabajo de evaluación no termina con el informe de lo que sucede sino con la
propuesta de estrategias de mejora.
D) EN CUANTO AL OBJETO DE LA EVALUACIÓN.
Eastmond (1991) defiende que en losa años 90 la evaluación se enfocará hacia

la calidad. Su argumento es que una sociedad creciente sofisticada valorará más la
dimensión cualitativa como el primer elemento de competición, y ya que los sistemas
educativos hoy no son competitivos, se desarrollarán sistema de evaluación con
mecanismos para asegurar y promover la calidad.
E) SOBRE LOS AGENTES DE LA EVALUACIÓN.

Eastmond (1991) supone que en los próximos años se verá como natural la
necesidad de evaluación interna dentro de las organizaciones. Pero en la empresa
pública se confiará la evaluación a profesionales externos que puedan establecer
comparaciones con otros programas similares.
En este sentido, pueden generarse nuevas asociaciones entre universidades,

centros escolares y la industria. La Universidad puede proporcionar entrenamiento en
técnicas de evaluación, los profesores de los centros escolares pueden obtener
experiencia en conducir trabajos de evaluación, y la industria puede proporcionar
recursos y servir como canalizadora del cambio, en apoyo de las nuevas tecnologías
que emergen. La escuela pública puede proporcionar la prueba fehaciente del juicio
sobre la realidad educativa. Todos los grupos ganan por la interacción intelectual.

Modelo Iluminativo de La Evaluacion

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Modelo Iluminativo de La Evaluacion

Încărcat de

Drepturi de autor:

Formate disponibile

Referencia:

This article in english version (added March, 21th 2006)

Analysis / Análisis Hits: Visitas

DESDE LOS TESTS HASTA LA

En cualquier disciplina, la aproximación histórica suele ser una vía

Un planteamiento, quizás el más utilizado en nuestro contexto (Mateo y otros,

2. Los tests psicométricos

3. El nacimiento de la verdadera evaluación educativa: La gran reforma

Medio siglo después de que Tyler revolucionara el mundo de la evaluación

4. El desarrollo de los sesenta

5. Desde los años setenta: La consolidación de la investigación evaluativa

6. La cuarta generación según Guba y Lincoln

7. El nuevo impulso alrededor de Stufflebeam

8. Para concluir: síntesis de enfoques modélicos y metodológicos de la

Tabla 1- Tipos de diseños de investigación educativa

Por su parte, Castillo y Gento (1995) ofrecen una clasificación de «métodos de

Tabla 2- Modelo conductista-eficientista

Tabla 3- Modelo humanístico

Método/ Finalidad Paradigma Contenido de Rol del

Tabla 4- Modelo holístico

Método/ Finalidad Paradigma domi- Contenido de Rol del

También Scriven (1994) ofrece una clasificación de los «modelos anteriores»,

Ahman, S. J. y Cook, M. D. (1967). Evaluating Pupil Growth. Principles of

TO KNOW MORE / PARA SABER MÁS

* Bustos, P. , Fernández Chávez, C (). Construcción histórica del concepto de

Tomás Escudero Escorza (tescuder@posta.unizar.es). Catedrático del área de

Buscar otros artículos de este autor en Scholar Google

ARTICLE RECORD / FICHA DEL ARTÍCULO

© Copyright 2002, RELIEVE. Se autoriza la reproducción y distribución de este

[Principal] [La Revista] [Artículos publicados] [Publicar en RELIEVE]

[Home Page] [ About us] [ Published Articles] [To publish in RELIEVE]

Revista ELectrónica de Investigación y EValuación Educativa

Programa de Estudio de Educación

La propuesta de evaluación de los aprendizajes en la primera Etapa de

Coll (1987) considera que el cómo evaluar va unido al cómo enseñar,

En una sociedad convulsionada como la nuestra, inmersa en una crisis

Esto supone el uso de nuevas estrategias y actividades que tomen en

En este sentido, tanto la enseñanza como el aprendizaje cobran una

- La enseñanza es concebida como un proceso intencional, planificado

- El aprendizaje es una actividad mental, dinámica, continua, intensiva,

Por ello ambos procesos (enseñanza y aprendizaje) no pueden darse

Como lo afirma Coll (1990), la actividad pedagógica deberá ser

El aprendizaje, así concebido, se identifica como la construcción

Nos encontrarnos con un alumno en capacidad de aprender una serie de

Cabe destacar la teoría psicológica, verbal, significativa planteada por

La necesidad comunicativa es planteada por Esté (1994), como

La interacción y la comunicación, según el mismo autor, son posibles

Las teorías anteriormente descritas centran su atención en el estudiante,

La práctica pedagógica no puede ir separada de la práctica evaluativa,

Consecuentemente con las bases conceptuales del diseño del nivel

Entre los modelos evaluativos que sirven de apoyo a la nueva corriente

1. Evaluación iluminativa (Parlett y Hamilton, 1972)

Es un modelo cualitativo que se fundamenta en dos ejes conceptuales:

El sistema de instrucción está constituido por un conjunto de elementos

El ambiente de aprendizaje está representado por un conjunto de

2. Evaluación respondiente (Etake, 1975)

3. Evaluación democrática (Stenhouse, McDonald y Elliot, 1976 y

Postula el derecho del alumno y del docente de expresar sus puntos de

Enfatiza el rol del docente evaluador como orientador que se ocupa de

4. Evaluación negociada (Guba y Lincoln. 1989)

Proponen en su modelo, el consenso entre los distintos agentes que

Todos estos modelos evaluativos anteriormente descritos, se agrupan

El rol del evaluador pasa a ser más dinámico, por cuanto:

A. Comunica, orienta v hace reflexionar sobre todo el proceso