Documente Academic
Documente Profesional
Documente Cultură
Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de
Reference: intenso desarrollo de la evaluación en educación. Revista ELectrónica de Investigación y EValuación
Educativa, v. 9, n. 1. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm. Consultado en (poner fecha).
Abstract Resumen
Este artículo presenta una revisión
This article presents a review and state of art
crítica del desarrollo histórico que ha tenido el
about development in educational evaluation
ámbito de la evaluación educativa durante todo
in the XXth century. The main theoretical
el siglo XX. Se analizan los principales
proposals are commented
propuestas teóricas planteadas.
Keywords Descriptores
Evaluación, Investigación evaluativa, Métodos
Evaluation, Evaluation Research, Evaluation
de Evaluación, Evaluación Formativa,
Methods; Formative Evaluation Summative
Evaluación Sumativa, Test, Evaluación de
Evaluation, Testing, Program Evaluation
Programas
Introducción
Consecuentemente con este estado de cosas, en este periodo entre finales del
siglo XIX y principios del XX, se desarrolla una actividad evaluativa intensa
conocida como «testing», que se define por características como las siguientes:
• Medición y evaluación resultaban términos intercambiables. En la
práctica sólo se hablaba de medición.
• El objetivo era detectar y establecer diferencias individuales, dentro del
modelo del rasgo y atributo que caracterizaba las elaboraciones
psicológicas de la época (Fernández Ballesteros, 1981), es decir, el
hallazgo de puntuaciones diferenciales, para determinar la posición
relativa del sujeto dentro de la norma grupal.
• Los tests de rendimiento, sinónimo de evaluación educativa, se
elaboraban para establecer discriminaciones individuales, olvidándose en
gran medida la representatividad y congruencia con los objetivos
educativos. En palabras de Guba y Lincoln (1982), la evaluación y la
medida tenían poca relación con los programas escolares. Los tests
informaban algo sobre los alumnos, pero no de los programas con los
que se les había formado.
En el campo educativo destacan algunos instrumentos de aquella época, como
las escalas de escritura de Ayres y Freeman, de redacción de Hillegas, de
ortografía de Buckingan, de cálculo de Wood, de lectura de Thorndike y McCall
y de aritmética de Wood y McCall (Planchard, 1960; Ahman y Cook, 1967; Ebel,
1977).
Sin embargo, fue en los tests psicológicos donde los esfuerzos tuvieron mayor
impacto, siendo probablemente la obra de Thorndike (1904) la de mayor
influencia en los comienzos del siglo XX. En Francia destacan los trabajos de
Alfred Binet, después revisados por Terman en la Universidad de Stanford, sobre
tests de capacidades cognitivas. Ahora hablamos del Stanford-Binet, uno de los
tests más conocidos en la historia de la psicometría.
Años más tarde, con las necesidades de reclutamiento en la Primera Guerra
Mundial, Arthur Otis dirige un equipo que construye tests colectivos de
inteligencia general (Alfa para lectoescritores y Beta para analfabetos) e
inventarios de personalidad (Phillips, 1974).
Tras la contienda, los tests psicológicos se ponen al servicio de fines sociales.
La década entre 1920 y 1930 marca el punto más alto del «testing», pues se idean
multitud de tests estandarizados para medir toda clase de destrezas escolares con
referentes objetivos externos y explícitos, basados en procedimientos de medida
de la inteligencia, para utilizar con grandes colectivos de estudiantes.
Estas aplicaciones estandarizadas se acogen muy bien en los ámbitos
educativos y McCall (1920) propone que los profesores construyan sus propias
pruebas objetivas, para no tener que confiar exclusivamente en las propuestas por
especialistas externos.
Este movimiento estuvo vigente en paralelo al proceso de perfeccionamiento
de los tests psicológicos con el desarrollo de la estadística y del análisis factorial.
El fervor por el «testing» decreció a partir de los años cuarenta e, incluso,
empezaron a surgir algunos movimientos hipercríticos con estas prácticas.
Guba y Lincoln (1989) se refieren a esta evaluación como a la primera
generación, que puede legítimamente ser denominada como la generación de la
medida. El papel del evaluador era técnico, como proveedor de instrumentos de
medición. Según estos autores, esta primera generación permanece todavía viva,
pues todavía existen textos y publicaciones que utilizan de manera indisoluble
evaluación y medida (Gronlund, 1985).
Guba y Stufflebeam
Patton Pérez Autores
Perspectiva Lincoln y Shinkfield
(1980) (1983) creadores
(1982) (1987)
Objetivos Objetivos Objetivos Objetivos Tyler (1950)
Rivlin (1971)
Análisis Análisis
Empírico-analítica Rossi y otros
sistemas sistemas
(1979)
Método
Suchman (1967)
científico
Stufflebeam
CIPP CIPP CIPP
(1966)
Susceptibles Crítica Crítica Crítica
Eisner (1971)
de artística artística artística
complementarieda
Adversario Contrapuesto Wolf (1974)
d
Cronbach
UTOS UTOS
(1982)
Respondente Respondente Respondente Respondente Stake (1975
Parlett y
Iluminativo Iluminativo Iluminativo
Hamilton (1977)
Humanístico-
interpretativa
Sin metas Sin metas Sin metas Scriven (1967)
MacDonald
Democrático
(1976)
Referencias bibliográficas
Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual.
Un siglo, el XX, de intenso desarrollo de la evaluación en educación. Revista
Reference /
ELectrónica de Investigación y EValuación Educativa (RELIEVE), v.
Referencia 9, n. 1. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm.
Consultado en (poner fecha).
Desde los tests hasta la investigación evaluativa actual. Un siglo, el
XX, de intenso desarrollo de la evaluación en educación. [ From tests
Title / Título to current evaluative research. One century, the XXth, of intense
development of evaluation in education]
Authors / Autores Tomás Escudero Escorza
Review / Revista ELectrónica de Investigación y EValuación Educativa
Revista (RELIEVE), v. 9, n. 1
ISSN 1134-4032
Publication date /
2003 (Reception Date: 2003 January 10; Publication Date: 2003
Fecha de Febr. 27 )
publicación
This article presents a review and state of art about development in
educational evaluation in the XXth century. The main theoretical
proposals are commented
Abstract /
Resumen Este artículo presenta una revisión crítica del desarrollo histórico que
ha tenido el ámbito de la evaluación educativa durante todo el siglo
XX. Se analizan los principales propuestas teóricas planteadas..
Evaluation, Evaluation Research, Evaluation Methods; Formative
Evaluation Summative Evaluation, Testing, Program Evaluation.
Keywords
Descriptores Evaluación, Investigación evaluativa, Métodos de Evaluación,
Evaluación Formativa, Evaluación Sumativa, Test, Evaluación de
Programas
Institution /
Universidad de Zaragoza (España)
Institución
Publication site /
http://www.uv.es/RELIEVE
Dirección
Language /
Español (Title, abstract and keywords in english)
Idioma
Volumen 9, n.1
© Copyright 2002, RELIEVE. Reproduction and distribution of this articles it is
authorized if the content is no modified and their origin is indicated (RELIEVE
Journal, volume, number and electronic address of the document).
ARGUMENTACIÓN TEÓRICA
ENFOQUE DE LA EVALUACIÓN
LA NECESIDAD DE LA PROPUESTA
- Desarrollar en cada alumno sus capacidades del saber, del saber hacer
y del ser.
PRINCIPIOS DE LA EVALUACIÓN
INTEGRAL E INTEGRADA
Entendida como:
FUNCIÓN
COOPERATIVA
Formas de participación
AUTOEVALUACIÓN
COEVALUACIÓN
HETEROEVALUACIÓN
PLANIFICACIÓN DE LA EVALUACIÓN
A través de:
PERSPECTIVAS DE LA EVALUACIÓN
Los intereses de los evaluadores que actúan con una orientación medios-
fines dentro del paradigma cuantitativo reflejan cuestiones como las siguientes:
1.- ¿Qué efectivos y eficientes son los medios usados en conseguir los fines y
objetivos curriculares?.
4.- Dados unos currícula, ¿cuál de ellos implica menor coste y tiempo?.
5.- ¿Qué generalizaciones válidas pueden hacerse para todas las escuelas en una
zona o distrito?.
Fidelidad
entre medios
y fines.
2.- ¿)Cuál es el punto de vista implícito de los alumnos y del profesor que
ayuda a los planificadores del currículum?.
4.- ¿Cuáles son las metáforas fundamentales que guía a los que desarrollan,
implementan o evalúan el curriculum?.
5.- ¿Cuáles son las reglas construidas por el grupo para un currículum
determinado en esta clase?.
1.- Enfoques orientados a los objetivos: Cuyo foco son los fines y objetivos específicos
y en qué grado han sido conseguidos.
Las bases del primer método sistemático de evaluación surgen a partir del
modelo de Tyler, al proponer una formulación precisa de objetivos como punto de
referencia para la evaluación y la toma de decisiones. Este método tuvo gran
influencia al utilizar la medición, adquiriendo un sentido de legitimación con el
paralelismo de la investigación científica. Tyler diferenció medida y evaluación,
añadiendo que la medida era la parte descriptiva de la evaluación y la explicación
completaba el proceso de evaluación.
Fases de la evaluación:
1.- Determinación de los objetivos específicos de cada área de
contenido.
2.- Identificar situaciones en las que los estudiantes puedan demostrar
la conducta expresada en los objetivos.
3.- Examinar o desarrollar instrumentos capaces de probar cada
objetivos.
4.- Aplicar los instrumentos, dentro de un modelo pretest-postest,
para comprobar que se han dado cambios y que pueden se
imputados al currículum.
5.- Examinar los resultados para determinar la áreas del currículum
más fuertes y más débiles.
6.- Desarrollar hipótesis y probarlas para explicar los patrones
observados de consistencia o debilidad.
7.- Hacer modificaciones apropiadas en el currículum.
Sin embargo Tyler no dio normas sobre cómo usar los datos de la evaluación.
Se le criticó que su evaluación no es explicativa, que ignoraba los juicios sobre la
dignidad y mérito, es decir, que no evaluaba los objetivos. Tyler entendió la
evaluación como un proceso terminal, refiriéndose a los productos o el rendimiento
como único criterio, sin, además, proporcionar estándares para saber cómo juzgar la
discrepancia entre las medidas y los objetivos propuestos.
El problema surge cuando se valoran los efectos sin criterios, de ahí que se
evalué sin referencia a objetos, y cuyo criterio serán las necesidades de los sujetos
a los que se dirige el programa.
Diferencia entre una evaluación más formativa y una menos formativa (Bridges,
1988).
MODELOS CUALITATIVOS:
MODELOS NATURALISTAS
Modelos de contraposición
Para poder emitir juicios correctos, Owen propone algunos de los ámbitos de
discusión que se basan en la investigación sobre "pros" y "contras":
Por otra parte, para Wolf, la evaluación judicial, está compuesta de cuatro
etapas:
MODELOS CRÍTICOS.
La evaluación democrática.
También critica la idea del evaluador como "agente honesto", puesto que
olvida que la actividad de evaluación está influenciada por los valores del propio
evaluador. Parece ser que se parte de la aceptación de que el pluralismo es la única
posición válida, cuando, según el autor, no es más que un sofisticado relativismo en
el que, cuando los diferentes grupos no están de acuerdo o entran en conflicto de
valores, se admite que no hay forma de establecer cuál de ellos es correcto porque
todos ellos son igualmente válidos. Pero el hecho de que no haya valores absolutos
no quiere decir que no haya criterios por los que lo evaluadores puedan juzgar lo
que debe hacerse en cada situación. Por lo cual será importante clarificar los
criterios para una evaluación democrática.
Ying (1987, citado por Marcelo y Parrilla 1991, p.13) define el estudio de
caso como un método de investigación que permite un estudio holístico y
significativo de un acontecimiento o fenómeno contemporáneo dentro del contexto
real en que se produce, en el que es difícil establecer lo límites entre fenómeno y
contexto, y que requiere el uso de múltiples fuentes de evidencia.
Las características del estudio de caso son definidas por diversos autores,
así, por ejemplo, Marcelo y Parrilla (1991) citan las siguientes: totalidad,
particularidad, realidad, participación, negociación, confidencialidad y accesibilidad.
2.- Los métodos aplicados, de igual manera, son diferentes en los modelos
y fines, pero la asociación tradicional entre investigadores y
evaluación ha motivado un énfasis en los test y medida, la toma de
datos empíricos, y la orientación al diseño, desarrollo e informe.
SENTIDO DE LA EVALUACIÓN
Próximo a nosotros tenemos a House (1992), que realizó una revisión de las
tendencias actuales en evaluación y dice: "La evaluación, que fue inventada para
solucionar nuestros problemas sociales, se encuentra afectada hoy en día,
precisamente por los mismos problemas que tenía que resolver".
CONCEPTUALIZACIÓN DE LA EVALUACIÓN.
Gimeno (1992, p.338) define la evaluación como "proceso por medio del que
alguna o varias características de un alumno, de un grupo de estudiantes, de un
ambiente educativo, de objetivos educativos, de materiales, profesores, programas,
etc., reciben la atención del que evalúa, se analizan y se valoran sus características
y condiciones en función de unos criterios o puntos de referencia para emitir un
juicio que sea relevante para la educación".
Nevo (1989) llevó a cabo una revisión biliográfica sobre evaluación y señaló
las dimensiones relevantes en la evaluación del curriculum:
4.- ¿Qué tipo de información debe ser recogida para cada objeto?
Por otra parte tenemos a Stake (1986) que ha señalado las dimensiones más
comunes para clasificar los diseños de evaluación, categorizandolos en los
siguientes:
1.- Formativa - Sumativa: Una de las distinciones más extendidas es si los estudios
de evaluación se hacen durante el desarrollo del programa o cuando el programa ha
finalizado. Stake plantea sus dudas sobre la base en la práctica de la distinción.
7.-Totalidad - Analítico: Tratar el programa como una totalidad holística, como los
estudios de caso; o hacer estudios analíticos como las relaciones entre variables
discretas.
EVALUACIÓN INTERNA/EXTERNA
Holly y Hopkins (1988) han propuesto, con fines clarificadores, distinguir tres
perspectiva sobre la relación entre mejora escolar y evaluación: evaluación de
la mejora, evaluación para la mejora, y evaluación como mejora. Cada una
tiene sus propias implicaciones metodológicas y puede servir para cuestionar el papel
de la evaluación en el proceso de mejora escolar; al tiempo que cada una se sitúa a
un nivel superior del círculo y pueden conducir a otra. La distinción tiene la
virtualidad de romper con la oposición fácil entre evaluación sumativa y formativa, y
diferenciar, dentro de una evaluación orientada a la mejora escolar, que no toda
evaluación formativa implica un desarrollo organizativo del centro.
1.- Contexto: Partir del contexto de desarrollo del curriculum, como las características
de los alumnos (nivel cognoscitivo, destrezas, necesidades e intereses), también la
concepción educativa del centro y de la sociedad, naturaleza de la materia y psicología
del aprendizaje.Este contexto es relevante para los objetivos, como señaló Tyler, pero
también para evaluar la adecuación de los materiales, los procedimientos empleados y
los resultados obtenidos.
- Situaciones naturales: las que surgen en la dinámica norma de una clase, en el recreo,
etc.
- observación;
- entrevistas;
- sociogramas;
El modelo CBAM ("Concers Based Adoption Model") ha sido uno de los que
específicamente ha pretendido convertirse en un modelo de evaluación del desarrollo
de las innovaciones (Hord, 1987), al determinar los "niveles de uso de una
innovación", y con ello como una estrategia para facilitar el desarrollo y gestión del
cambio en los centros educativos.
NO USUARIOS
I.- ORIENTACIÓN Buscar información
3.- Evaluación: Detectar y valorar en qué medida se han ido superando los
obstáculos identificados y se han realizado las metas del perfil de la
innovación. Una evaluación formativa irá en la primera dirección, con una
orientación sumativa en la segunda. Un segundo perfil del usuario, aplicado en
esta fase, podría identificar si las conductas del profesor en las distintas
dimensiones de la innovación curricular han tenido cambios. Si no hubiese
existido progreso, habría que reiniciar el ciclo para diagnosticar la situación.
EVALUACIÓN DE PROGRAMAS
Según Worthen (1989) los propósitos de la evaluación de programas son los
siguientes "a) contribuir a tomar decisiones sobre la implantación de un programa;
b) contribuir a tomar decisiones acerca de la continuidad, expansión o certificación;
c) contribuir a tomar decisiones sobre las modificaciones de los programas; d)
obtener evidencias para ayudar a un programa ; e) obtener evidencias para
oponerse a un programa; f) contribuir a comprender procesos básicos psicológicos,
sociales y otros". Por su parte Talmage (1982:594) entiende que "tres propósitos
aparecen frecuentemente en las definiciones de evaluación de programas: 1)
Proporcionar juicios sobre el valor de un programa; 2) Ayudar en la toma de
decisiones responsables en política; 3) servir para una función política.
U1.- Identificación de la F1.- Procesamientos P1.- Orientación del E1.- Documentación del
audiencia. Identificación de prácticos. Reduciendo la servicio.La evaluación programa. Clara y
personas afectadas por la desorganización debe servir a las precisa.
evaluación. mientras se obtiene necesidades de los
información. participantes.
E2.- Análisis del
U2.- Credibilidad del contexto.
evaluador. El evaluador F2.- Viabilidad P2.- Acuerdos formales.
debe ser competente. política.Planifica la Las obligaciones deben
E3.- Descripción de
evaluación con constar por escrito.
propósitos y
antelación a las
U3.- Amplitud y selección procedimientos.
diferentes posiciones de
de la información. Que P3.- Derechos de los
los grupos de interés.
incluya preguntas sujetos. Se deben
E4.- Fuentes confiables
pertinentes sobre el respetar derechos de
de información, para
programa. F3.- Eficacia del coste. sujetos.
juzgar su adecuación.
La información debe
tener valor suficiente.
U4.- Identificación de P4.- Interacciones
E5.- Información válida.
valores. Describir humanas. Respetar la
perspectivas para dignidad en los
interpretar hallazgos. participantes. E6.- Información fiable.
E12.- Metaevaluación.
Las Normas de Evaluación de Programas (The Joint Committee on Standards For Evaluation &
Sanders, 1994).
TÉCNICAS CUALITATIVAS.
Son técnicas de evaluación continua, con una finalidad formativa. Ory (1991)
comenta que el aumento de estas técnicas de evaluación se debe a la ampliación del
campo de la evaluación, de las audiencias y de los propósitos de la misma
evaluación. Por tanto se trata de técnicas de evaluación cualitativa, que se usan tanto
en enfoques interpretativos como críticos, aunque con finalidades diferentes.
a) Registros anecdóticos.
b) Notas de campo.
d) Análisis de documentos.
e) Diarios
Se trata de analizar los informes personales cuyo contenido puede ser muy
variado (preocupaciones, sentimientos, reflexiones, observaciones, interpretaciones,
hipótesis, explicaciones, ...), pudiendo ser potentes instrumentos de autocontrol del
proceso de enseñanza (diario de profesores) o de aprendizaje (diario de alumnos y
profesores). Los diarios en el contexto de documentos personales, como biografías,
autobiografías, historias de vida, cartas, etc., son consideradas como importantes por
Zabalza (1991) para la investigación educativa y para analizar el pensamiento y los
dilemas que se le presentan al profesor en la práctica. Su validez en investigación
cualitativa depende del contexto en el que se utilice, elabore y su finalidad y forma
de analizarlo.
3.- Sobre los cambios en las relaciones sociales ente las personas integradas
en su misma actividad, así como sobre los cambios que se vayan
iniciando en la estructura organizativa formal.
f) La carpeta de enseñanza.
g) Cuadernos.
Es el registro de actividades en determinados tiempos, y la valoración que se
hace de ellos. Es un medio de control del cual no se debe abusar en detrimento de
otras actividades que pueden ser más enriquecedoras como observar, percibir,
pensar, idear, imaginar, analizar, discutir,.., y que además pueden consignarse en
alguno forma de representación escrita o no.
i) Archivos.
j) Cuestionarios.
k) Entrevistas.
Las entrevistas pueden ser de varios tipos: no planificadas, planificadas pero no
estructuradas, estructuradas y semiestructuradas.
n) Grabaciones en audio.
ñ) Grabaciones en vídeo.
o) Fotografías y diapositivas.
p) Observación de clases.
q) Análisis de metáforas
r) Mapas conceptuales.
Se representa un visión global del programas en sus contexto con los procesos,
inputs y resultados, y sus interrelaciones.
s) Algoritmos relacionales.
t) Recuadros de frases
Se usan para comparar las visiones y descubrir los aspectos críticos del
programa. Para ello se encuadran las descripciones del programa hechas por
distintas personas: director, profesores, alumnos.
TÉCNICAS CUANTITATIVAS.
Ausbel (1983) consideraba que los exámenes tienen algunos valores positivos:
b) Pruebas orales.
1) Selección de contenidos.
2) Organización y secuenciación.
*Incluye los contenidos, por áreas o materiales, marcados legalmente como obligatorios. 12345
* Secuencia los contenidos, por áreas o materias, para cada ciclo o curso de la etapa. 12345
* Adecua los contenidos a las características del entorno, de manera que resultan: 12345
funcionales, significativos, aplicables a la vida diaria y útiles.
* Recoge suficientes opciones de contenido, en su caso, para la elección por parte del 12345
alumnado
Indicadores de Evaluación del contenido en el Proyecto Curricular del Centro (Casanova, 1992, 1993).
La evaluación del proceso de enseñanza y de la práctica docente, además del análisis específicos del Proyecto
Curricular de Etapa, deberá abordar, al menos, la consideración de los siguientes aspectos:
b) El carácter de las relaciones entre profesores y alumnos y entre los mismos profesores, así como la
convivencia de entre los alumnos.
FUTURO DE LA EVALUACIÓN.
En los últimos años los teóricos de la evaluación se han dedicado a reflexionar,
aumentando, probablemente, el conocimiento, y desarrollando alguno elementos de
la práctica: instrumentos, técnicas... que, por otra parte, en nuestro país empezamos
ahora a necesitar.
Para los autores Greene y McClintock, a pesar de los pocos ejemplos prácticos
de investigaciones que utilicen métodos mixtos, no es lo mismo usar métodos
mixtos, que un teoría mixta, ya que los métodos no están inherentemente ligados a
un determinado paradigma.