Documente Academic
Documente Profesional
Documente Cultură
Manual s
Eval uaci n, tica y poder
Por
Ernest R. HOUSE
TVeduccin de
Pablo Manzano
Col ecci n PEDAGOGIA
Manual s
Eval uaci n, tica y poder
Por
Ernest R. HOUSE
TVeduccin de
Pablo Manzano
Ernest R. HOUSE
Eval uaci n, tica y poder
Tercera edi ci n
ed i c i o n es mo r a t a , s . l .
Fundada por Javier Morata, Editor, en 1920
C/ Meja Lequerica, 12
28004 - MADRID
Ttulo original de la obra:
E val uat ing wit h val idit y
Ernest R. House.
Publicada originalmente por Sage Publications Inc., 1980.
Primera edicin: 1994
Segunda edicin: 1997 (reimpresin)
Tercera edicin: 2000 (reimpresin)
e-mail: morata@infornet.es
pgina web: http:/ / www.edmorata.es
No est permitida la reproduccin total o parcial de este libro, ni su tratamiento informtico, ni la transmisin
de ninguna forma o por cualquier medio, ya sea electrnico, mecnico, por fotocopia, por registro u otros
mtodos, sin el permiso previo y por escrito de los titulares del Copyright.
Biblioteca U.N.S.C.H.
INGRESO 145758
EDICIONES MORATA, S. L. (2000)
Meja Lequerica, 12. 28004 - Madrid
Derechos reservados
Depsito Legal: M-27.971-2000
ISBN: 84-7112-389-4
Compuesto por: ngel Gallardo
Printed n Spain - Impreso en Espaa
Imprime: CLOSAS-ORCOYEN. Paracuellos del Jarama (Madrid)
Ilustracin de la cubierta: Postal publicitaria de Fsforo Ferrero. Reproducida con
permiso de Syntex Latino.
CMVERHM MCIMflL K W
m n l M l M BAHAMA
UNIDAD DE ALMACEN
Ptcasa N* :__&/J L_______
Fecha:.44MURr-Wa^
Valon S/. /LLQ.------
S. ' ______
CONTENIDO
Pgs.
SOBRE EL AUTOR................................................................... ...... 10
AGRADECIMIENTOS.......................................................................... 12
PREFACIO........................................................................................... 13
PRIMERA PARTE: Los enfoques de la eval uacin............................ 15
CAPTULO PRIMERO: El evaluador en la sociedad............................ 17
Evaluacin privada y evaluacin pblica, 18.El proceso de evalua
cin, 20.
CAPTULO II: Los enfoques principales............................................. 23
El enfoque de anlisis de sistemas, 25,El enfoque de objetivos con
ducales (o basado en metas), 28.El enfoque de decisin, 29.B
enfoque que prescinde de los objetivos, 31 El enfoque del estilo de
la crtica de arte, 33 El enfoque de revisin profesional (acredita
cin), 35.El enfoque cuasijudicial (contradictorio), 38.El estudio de
casos (o negociacin), 40.Otros enfoques, 43.
CAPTULO III: Premisas en las que se basan los enf oques............... 45
Liberalismo, 45.tica subjetivista, 48.La epistemologa objetivista
liberal, 49.La epistemologa subjetivista, 55.Premisas polticas de
los modelos: los utilitaristas, 58.Premisas polticas de los intui-
cionistas-pluralislas, 59.
SEGUNDA PARTE: Los criterios fundamentales de la evaluacin: ve
racidad, belleza y j ust i ci a............................................................ 63
CAPTULO IV: La lgica de la argumentacin eval uative................... 65
El gran terremoto que se va a producir en California, 65.Equivocktad
Ediciones Morata, S. L
Eval uaci n, ti ca v p0(j er
de las pruebas: certidumbre frente a credibilidad, 66.La evaluacin
como persuasin, 69.Los destinatarios de la evaluacin, 72.Las
premisas del acuerdo, 75.La argumentacin cuantitativa, 77.La
argumentacin cualitativa, 80.Revisin de la objetividad, validez e
imparcialidad, 83.El discurso evaluativo: la buena vida (junto a la
falla de San Andrs), 90.
CAPITULO V: Coherencia y credibilidad. La est t i ca.......................... 93
El conductor ebrio, 93.La trama, 97.La forma, 101. Outward
Bound" (Salida), 103.Autenticidad, 106.La belleza del conductor
ebrio, 109.
CAPTULOVI: Justicia........................... . ... .. .... ................. 112
Utilitarismo, 11A.Pluralismo/Intuicionismo, 118.J usticia como equi
dad, 120.La utilizacin de las teoras de la justicia, 126.
TERCERA PARTE: Los principios de la eval uaci n............................ 129
CAPTULO VII: La democratizacin de la eval uaci n.......................... 131
La poltica de la eleccin, 131 .Evaluacin democrtica libe
ral, 133.Intereses, 134 7 inters pblico en la evaluacin, 137.
Concentracin de poder frente a difusin de poder, 140.Principios
distributivos, 142.a evaluacin como procedimiento de decisin
moral, 145.
CAPTULO VIII: Un contrato de evaluacin equi t at i vo........................ 148
La caracterizacin de la equidad, 149 Algunas condiciones para
un contrato equitativo, I50. Reflexiones sobre las condiciones de
equidad, 158.Hasta qu punto es vinculante el contrato?, 160.
CAPTULO IX: Poder y deliberacin........................... ........ 162
Las debilidades del liberalismo, 162.Poder e intereses, 164.Poder
y autoridad, 167.Deliberacin, 169.Determinacin colectiva de las
opciones, 173 El fundamento moral de la evaluacin, 175.La con
cepcin subyacente de justicia, 176.
CUARTA PARTE: Metaevaluacin........................ . . V . . . . / / : . , 183
CAPTULO X: La objetividad, equidad y justicia de la poltica federal
de evaluacin...................... ................................................... 185
La poltica federal de evaluacin, 185.Los comienzos del Folow
Through", 188.La fase Egbert/Stanford Research Institute: 1968-
1971,189 La fase McDaniels/Huron Institute: 1972-1973, 192.La
fase Evans/Abt Associates: 1974-1977,194.a lgica de la evalua
cin, 197.Objetividad, 200.Equidad, 202.Justicia, 204.Una re
visin de la poltica federal de evaluacin, 206.
CAPTULO XI: Crtica de los enf oques.................... ............ 209
El Anlisis de sistemas, 210.Objetivos conductuaes, 211.Deci
sin, 213 Independencia de los objetivos del programa, 215.Crtica
ttmm Morato. f .
Cont eni do___________________________________________________
de arte, 218.Revisin profesional, 221 .Cuasijudcial, 224.Estu
dio de casos, 227.
CAP TULO XII: La real i zaci n de eval uaci ones vl i das......................... 231
APNDI CE A: Un anl i si s de la l gi ca de una eval uaci n.................... 239
Formas de razonamiento, 239.Anlisis de la "Educational Product
Evaluation" de Glass, 244.Anlisis de la respuesta de Scriven a
la evaluacin de Glass, 250.
APNDI CE B: La eval uaci n nat ural i st a.................................................. 255
APNDI CE C: Un cont rat o de eval uaci n................................................ 259
BI BLI OGRAF A................................................................................................. 262
OTRAS OBRAS DE EDICIONES MORATA DE I NTERS......................... 270
Sobre el aut or
Emest R. House es profesor de Administration, Higher and Cntinuing
Education del Center for tnstructional Research and Curriculum Evauation
(CIRCE) de la University of Illinois en Urbana. Se gradu con el de Bachelor
en la Washington University en 1959 (graduacin Phi Beta Kappa), ejerci
la docencia en educacin secundaria, gradundose como Master en la
Southern Illinois University en 1964 y obteniendo su doctorado en la University
ofllinoisen 1968.
Su primer proyecto consisti en una evaluacin a gran escala del Illinois
Gifted Program. Desde entonces, se ha dedicado a evaluar diversos pro
gramas educativos y sociales. En los ltimos aos ha trabajado en la eva
luacin de evaluaciones. Con anterioridad ha publicado los siguientes libros:
School Evauation: The Politics and Process (1973), The Politics of Educational
Innovation (1974) y Survival in the Classroom (con S. Lapan, 1978). Ha sido
consultor de muchas organizaciones de los Estados Unidos y de otros
pases. En 1976, fue presidente del congreso anual de la American Educa
tional Research Association y en la actualidad pertenece al consejo de
redaccin de Educational Evauation and Policy Analysis.
El individuo instruido aunque imprudente, que camina en lnea recta
desde las verdades generales a la particulares, se pierde en medio de
las tortuosas sendas de la vida. Pero el sabio que, en medio de las 1
vueltas e incertidumbres de la accin y de los acontecimientos huma
nos, mantiene su mirada fija en la verdad eterna, sigue una via indirecta,
cuando no puede proseguir por la lnea recta y, en el terreno de la
accin, toma decisiones que, con el tiempo, se muestran tan prove
chosas como lo permite la naturaleza de las cosas.
Giambattista Vico.
On the Study Methods of Our Time, 1709, pg. 35.
AGRADECIMIENTOS
Este libro constituye la culminacin de mis cinco ltimos aos de trabajo.
Diversas personas han aportado su contribucin significativa al mismo. Gene
Giass y Rochelle Mayer lo han revisado y han influido ampl iamente en las
ideas que se exponen. Steve Lapan, Don Ho gben y Barry M a c Do n a l d han
desarrollado conmigo muchos de estos pensamientos hasta extremos, a
veces, inconcebibles. Mis colaboradores del CIRCE (Gordon Ho k e , Tom
Hast j ngs, Bob St ake y Harry Br oudy) me han proporci onado un ambiente
excepcionalmente estimulante en el que trabajar.
Mike At ki n, decano de Illinois durante estos aos, ha alentado de forma
especial mis esfuerzos. Tom Sergiovanni, director de mi departamento, se
ha mostrado muy generoso a la hora de repartir las tareas. Muchos alumnos
de CIRCE han hecho lo posible para evitar que me desvi ase en diversas
cuestiones y les agradezco su ayuda en determinados captul os. Ot ra tarea
ingrata, desarrollada con todo entusiasmo por Jeri W i l l e n y Donna Koeni g,
ha sido la de trabajar con mis manuscritos.
PREFACIO
Este libro se dirige a los evaluadores y a quienes deseen adquirir un
conocimiento ms profundo de la evaluacin moderna, qu es y adnde se
dirige. Su objetivo consiste en lograr que la prctica de la evaluacin sea
ms reflexiva. Para ello, el libro presenta una conceptualizacin global de la
evaluacin moderna, que va desde los enfoques principales hasta las normas
y principios que deben presidir esa prctica, y la crtica de aquellos enfoques
sobre la base de tales normas.
El panorama actual de la evaluacin se caracteriza por la vitalidad y el
desorden. La escala a la que se llevan a cabo las actividades de evaluacin,
su omnipresencia y diversidad hacen difcil su comprensin, incluso a quienes
se mueven en este campo. Ms alarmante an es el hecho de que una
mala evaluacin puede deteriorar un programa social y ocasionar perjuicios
a toda una clase social. La importancia social de la evaluacin es enorme;
su interpretacin, relativamente insignificante. Esperamos que este libro con-
tribuya a un orden conceptual ms completo y evidente, y a un sentido ms
decidido de responsabilidad moral.
La Primera parte del libro se ocupa de la caracterizacin de las modernas
tentativas de evaluacin. En el Captulo Primero se describen las formas
actuales de evaluar, mostrando cmo, en un contexto moderno, la evaluacin
no slo difiere de los intentos precedentes en cuanto al mbito que abarca,
sino tambin en sus caractersticas esenciales. En el Captulo II, afirmamos
que hay relativamente pocos enfoques de la evaluacin, a pesar del esfuerzo
masivo que se lleva a cabo, describindolos con detalle. Establecemos una
taxonoma de los enfoques fundamentales de la evaluacin. En el Captu
lo III, relacionamos entre s de forma sistemtica los distintos enfoques
fundamentales a partir de sus supuestos bsicos subyacentes de caracter
epistemolgico, tico y poltico, explicando dichos supuestos. Al caracterizar
los enfoques preponderantes en la actualidad, damos por supuesto que los
evaluadores actan de manera racional, o sea, que tienen buenas razones
Q Eckxww Mism S
14
Evaluacin, ti ca y poder
para hacer lo que hacen, aunque ello les lleve a adoptar enfoques dife
rentes.
La Segunda parte del libro consiste en una reflexin sobre los niveles
de verdad, belleza y justicia necesarios para orientar y juzgar la calidad de
una evaluacin. La veracidad en la evaluacin tiene ms implicaciones que
en el caso de la verdad en la ciencia, al menos eso se dice. La belleza,
que se manifiesta en la coherencia y la imaginacin en la evaluacin, tiene
una influencia sustancial en la credibilidad que otorgue un pblico concreto
a la evaluacin. Por ltimo, el sentido de la justicia con el que actuemos
tiene importantes consecuencias para el tipo de evaluacin que llevemos a
cabo y para los resultados de la misma. Revisaremos las concepciones de
la justicia y sus consecuencias sobre la evaluacin.
La Tercera parte del libro trata de extraer los principios polticos y morales
sobre los que debe basarse la evaluacin. Se la concibe como un aspecto
de los procedimientos ms generales de decisin social. Se limita a la
persuasin racional. Estudiamos qu significa el que una evaluacin sea
aceptable desde los puntos de vista democrtico y moral. En sentido ms
prctico, afirmamos que, para considerar equitativa una evaluacin, hace
falta que se cumplan determinadas condiciones. Por ltimo, indicamos que
el fundamento subyacente de la evaluacin consiste en valores morales
considerados en el marco de una concepcin pluralista de la justicia.
La Cuarta parte del libro constituye una crtica de la poltica federal de
evaluacin y de sus principales enfoques. Cada uno tiene sus Virtudes y
sus defectos, tanto desde el punto de vista terico como del prctico, pero
ninguno tiene valor universal. El libro acaba con una exposicin del carcter
de la validez en la evaluacin sosteniendo que, para que sta se considere
vlida, ha de ser veraz, creble y correcta, desde el punto de vista normativo.
El objetivo del libro consiste en conseguir que la prctica sea ms autorre-
flexiva
Pr i mer a par t e
Los enfoques de la evaluacin
El primer paso para que los hombres se comprendan consiste en
hacer que reconozcan el modelo o modelos que dominan y penetran
su pensamiento y accin. Como todos los intentos de hacer conscientes
a los hombres de las categoras con las que piensan, se trata de una
actividad difcil y, a veces, dolorosa, que produce con facilidad resultados
profundamente inquietantes. La segunda tarea consiste en analizar el
modelo en s, lo que compromete al analista respecto en su aceptacin, j
modificacin o rechazo y, en este ltimo caso, en la elaboracin de
otro ms adecuado que lo sustituya.
Isaiah Be r l n . !
Philosophy, Politics and Society, 1962, pg. Vil. i
1
oi i ms m m i m oc
SMCJSrCBAL DtHtIAMAHG
nSLlQTgC
c a p t u l o p r i mer o
El eval uador en la soci edad
Separar lo malo de lo bueno es, desde muy antiguo, una actividad
humana, esencial para la misma sociedad. Aunque a menudo se ha conce
dido autoridad a las instituciones para hacer juicios de valor, slo en los
ltimos tiempos se ha formalizado la evaluacin de los programas pblicos
de manera que constituya una actividad independiente como tal e incluso
una nueva disciplina.
En los ltimos veinte aos, la evaluacin se ha convertido en una actividad
importante al surgir los programas de bienestar a gran escala. Cada ao, se
llevan a cabo decenas de miles de evaluaciones de programas pblicos,
slo en los Estados Unidos. Miles de personas estn empleadas en estas
evaluaciones y cientos de universidades y empresas compiten para conseguir
contratos de evaluacin. La mayor parte de las evaluaciones estn patroci
nadas por el gobierno federal; otras lo estn por los gobiernos de los
estados y los ayuntamientos. La evaluacin de los programas pblicos se
ha convertido en una actividad exigida por la legislacin y cada ao se in
vierten en ella cientos de millones de dlares.
Tant o por su omnipresencia, como por el papel que desempea, la
evaluacin tiene gran relieve social, y transforma, justifica o desacredita ios
programas pblicos. La enorme cantidad de las actividades de eval uacin
hacen difcil la supervisin. No siempre las eval uaciones de los programas
pblicos son de buena calidad. Con excesiva frecuencia, los evaluadores
se limitan a hacer lo que quieren sus patrocinadores. Demasiado a menudo
confunden el carcter de su trabajo y no hacen justicia a los programas
sociales que evalan. No se trata de que los evaluadores sean ms i ncom
petentes o avariciosos que las personas que se dedican a otras ocupaciones,
sino de que las posibilidades de causar daos suelen ser ms amplias,
menos evidentes y ms perdurables.
Este libro pretende fomentar la reflexin en la eval uacin Parece nece
sario basar la evaluacin en alguna forma de responsabilidad moral, de
18
Evaluacin, t i ca y poder
manera que las reflexiones sobre su justicia, veracidad e, incluso, belleza
configuren su prctica. Deben existir consideraciones morales que tras
ciendan el marco de los cientos de organizaciones y miles de evaluadores
que tratan de atraer la atencin de unos pocos patrocinadores. Sin embargo,
estas consideraciones no pueden derivarse o imponerse de f orma arbitraria,
sino desarrollarse a partir de un anlisis racional de lo que es la eval uacin
y de lo que parece razonable a los que la realizan como f undamento de
una prctica consciente.
Evaluacin privada y evaluacin pblica
La evaluacin moderna es descendiente directa del modernismo. La
modernizacin era la liberacin de la tradicin, el paso de una realidad
incontrovertida ofrecida por la tradicin, a un contexto social en el que todo
es controvertible y mutable; era el paso de lo dado a la opci n" (Ber ger ,
1974). En el mundo moderno, podan escogerse ms cosas. Se supona
que esto traera una vida material mejor y un desarrollo personal ms
profundo. En realidad, la modernizacin ha llegado a tal extremo que la
misma opcin se ha convertido en un problema. La eval uacin aparece
como elemento de ayuda para poder elegir.
En poca ms reciente, la realizacin de evaluaciones f ormales a escala
masiva, el patrocinio brindado por los gobiernos a las eval uaci ones y la
proliferacin de organismos que las efectan han pl anteado probl emas
nunca vistos antes. Pensemos en una mujer que elige por su cuenta y
riesgo. Acude a una tienda de automviles para comprar un coche nuevo.
Visita los concesionarios cuyos vehculos puede adquirir y mira los coches
disponibles. Tras un regateo con el vendedor respecto del precio, escoge el
coche pequeo ms barato. Le gustan los coches pequeos y no quiere
tener que esperar un par de meses hasta que se lo entreguen. Para ella
son importantes el precio de compra, el tamao y la posibilidad de entrega
inmediata. No le preocupan demasiado ni el color ni los accesorios. Ll eva a
cabo su propia evaluacin para su satisfaccin particular.
Pensemos ahora en una situacin en la que el exceso de opci ones po
sibles abruma a la persona en cuestin. Hay tal cantidad de vehculos
disponibles que no sabe ni por dnde empezar y, adems, el comprador no
es experto en mecnica. Una organizacin, como la Consumers Union*, le
ofrece sus servicios: evala en su nombre los coches y le dice cul le con
viene ms. El interesado puede conseguir sus informes de eval uaci n de
automviles. Ahora bien, en este caso, el evaluador es distinto de la persona
que decide. Ambas situaciones difieren en varios aspectos.
Cmo debe proceder el evaluador? Para que la eval uacin sea til, ha
* El equivalente en Espaa sera la Organizacin de Consumidores y Usuarios (OCU).
(N. (ME.}
0 tOorm Mofla, 8 L
El eval uador en la soci edad
de seleccionar normas de valoracin adaptadas a los gustos y necesida
des de la interesada. SI no la conoce, es difcil que adivine sus preferencias
personales. Pasar por alto la forma externa; la interesada puede hacer tal
eleccin sin ayuda. La entrega inmediata es un problema circunstancial. El
evaluador tambin lo dejar de lado, salvo como factor limitador. Por su
puesto, a todo el mundo le interesa el precio de compra. Adems, el eva
luador tendr en cuenta en su valoracin la economa de consumo de
combustible y otros aspectos por el estilo, dejando de lado la velocidad
mxima como criterio.
El evaluador tiene que tomar otras decisiones importantes tambin. Qu
coches ha de evaluar? Cuando la mujer efectuaba la evaluacin por su
cuenta, defina el conjunto de vehculos que le servirla de base para elegir.
Para el evaluador no es una cuestin sin importancia, porque los resultados
variarn de modo espectacular segn los coches que incluya en su compa
racin. Ti ene que seleccionar un conjunto que evaluar. Aplicar las normas
por l elegidas al conjunto de coches. En la medida en que se ajusten
mejor o peor a las normas, los calificar como buenos o malos (lo que
supone una comparacin con todos o con el "coche medio") o clasificar
los automviles del mejor al peor, dependiendo de cmo haga la comparacin
en el conjunto seleccionado. Por ltimo, elaborar su informe.
En ese momento, la consumidora tiene que optar de nuevo; debe decidir
si acepta o no la evaluacin. Ha de cumplir determinados requisitos; tomara
ella como punto de partida los vehculos preseleccionados? Las normas
utilizadas son pertinentes respecto a su decisin? Al emitir sus juicios finales,
el eval uador sopesa las normas empleadas como lo hubiera hecho ella
mi sma? Y todava ms importante: es veraz la evaluacin?, puede fiarse
de ella?, es fiable el evaluador?, le paga alguna de las empresas auto
movilsticas?, tiene credibilidad la eval uacin? La consumidora sigue te
niendo libertad para aceptar o rechazar los resultados y consejos de la
evaluacin. Aunque la evaluacin se haya convertido en un proceso social
que establece un vnculo entre el evaluador y la consumidora, la eleccin
final le compete a sta.
Pensemos ahora en una tercera situacin. El gobierno financia a un
eval uador para que valore un programa de accin social. En este caso,
para quin se realiza la evaluacin?: para el gobierno?, para el pblico?,
para los beneficiarios del programa?, para los administradores del mismo?
La respuesta no es sencilla porque los resultados afectan a todos estos
grupos. Sin embargo, aqu no existe un individuo concreto, como en el caso
de la compradora de coches, a quien pueda dirigirse la eval uacin. Hay
muchas personas interesadas, porque las decisiones sobre un programa
basadas en la eval uacin afectarn a todos. La eval uacin f orma parte, de
manera f undamental e inextricable, de una situacin pblica: una decisin
colectiva.
A diferencia del contexto privado, el consumidor insatisfecho no puede
conf ormarse con dejar de lado la evaluacin despus de encontrara i na
ceptable porque sta le afectar de alguna manera. El carcter publi co de
20
Eval uaci n, ti ca y p0der
la situacin impone ciertas limitaciones a la evaluacin. Al cabo del tiempo,
quedan magnificados todos los problemas relacionados con la seleccin de
normas apropiadas y la eleccin de comparaciones adecuadas. Sin embargo,
los evaluadores tienen que escoger y han descubierto distintos modos de
habrselas con este problema. Los enfoques adoptados por ellos de ah
el moderno predicamento del evaluador constituyen el tema inicial de
este libro. La mayor o menor adecuacin de estos enfoques es su final.
Entretanto, tratar de establecer las normas de eval uacin que conduzcan
a estos juicios de adecuacin.
El proceso de evaluacin
En su sentido ms sencillo, la evaluacin conduce a una opinin fundada
de que algo es de un cierto modo. No tiene por qu llevar a una decisin
respecto a una determinada forma de actuar, aunque hoy da a menu
do pretende tal cosa Podemos valorar a Csar como un gran general sin
que de ello se derive ninguna decisin. La evaluacin aboca a un juicio
acerca del valor de algo.
Con frecuencia, se llega a tal juicio mediante la calif icacin o clasifica
cin de algo segn cumpla mejor o peor un conjunto de normas o crite
rios. La evaluacin es comparativa por naturaleza, y suele presentarse ex
plcitamente como tal Esto significa que ha de existir un conjunto de normas
y una clase con la que comparar el objeto. Si ste se califica como bueno
o malo, la clase de comparacin est constituida por toda la clase de
objetos o por el objeto promedio de la clase. Si el objeto recibe la clasificacin
de mejor" o peor", se le compara directamente con un subconjunto concre
to de objetos similares; por ejemplo, un coche se compara con otros cuatro
en cuanto a su precio. Los coches se clasifican por orden, indicando el
nivel relativo de cada uno, en relacin con esta norma y en comparacin
con los otros cuatro, aunque sin necesidad de asignar una valoracin al
grupo de coches como tal. El mero hecho de sel ecci onar una clase de
comparacin puede provocar una diferencia espectacular en la evaluacin,
aunque las normas utilizadas sean las mismas ( T a y l o r , 1961).
Por tanto, la evaluacin supone, por naturaleza, adoptar un conjunto de
normas, definirlas, especificar la clase de comparaci n y deducir en qu
grado el objeto satisface las normas. Cumplimentadas estas etapas, el eva
luador debe poder llegar a establecer un juicio sobre el val or del objeto
evaluado (Tayl or , 1961). Muchos enfoques, como los de los estudios de
casos, presentan las normas, comparaciones y juicios de f orma ms implcita
e Intuitiva. Algunos tienden ms a la comprensin que al juicio.
Es frecuente que el juicio de valor se exprese como bueno o malo, o
mediante otras frmulas valorativas, pero no hace falta que as sea. En
determinados contextos, pueden utilizarse expresiones descriptivas ordi nari as
para expresar juicios de valor. Los ejemplos y ancdotas pueden t ransmi t i r
t tbkmtt Monta. S. L
El eval uador en la soci edad
mensajes de evaluacin. El juicio de valor estriba en la forma de utilizar las
expresiones ms que en estas mismas.
Los juicios de valor que se desprenden de las evaluaciones no equivalen
a directrices. Slo podemos orientar a alguien de manera razonable para
que haga algo si est en sus manos hacerlo. Podemos hacer juicios de
valor sobre cosas cuya modificacin se nos escapa. Sin embargo, en la
prctica moderna de la evaluacin, se pide a menudo al evaluador que
ayude al responsable de las decisiones cuando trata de decidir entre distintos
cursos generales de accin. stos se transforman en los objetos evaluados.
Los juicios de valor pueden convertirse en recomendaciones, pero, aun en
ese caso, el responsable de la decisin goza de libertad para dejar de lado
el consejo del evaluador.
En el caso ms sencillo de evaluacin, en el que evaluador y responsable
de la decisin es la misma persona, es ms fcil seleccionar la clase de
comparacin y adoptar un conjunto de normas. Sin embargo, el proceso
real de evaluacin es ms complejo de lo que parece. Las personas no
slo evalan mediante la aplicacin de normas, sino comprobando tambin
sus juicios en situaciones particulares cuyos resultados creen conocer. El
razonamiento real de evaluacin se desarrolla como un proceso dialctico
entre principios abstractos y casos concretos ms que como una deduccin
directa a partir de las normas (Ba r r y, 1965).
Es ms, en una evaluacin real, las normas pueden ser contradictorias.
Queremos un coche amplio y tambin un automvil que consuma poca
gasolina. No podemos conseguir el mximo respecto de ambas caracters
ticas de manera simultnea. En estos casos, nos inclinamos al equilibrio
entre ellas, plantendonos cunta amplitud queremos en relacin con el
consumo que deseamos. En vez de dar una preferencia absoluta a una
u otra norma, optamos por determinar la inclinacin por normas contra
dictorias mediante consideraciones intuitivas de las proporciones de ambas.
Qu amplitud estamos dispuestos a sacrificar en beneficio de cunta eco
noma de consumo? Estas proporciones relativas varan de una persona a
otra. La evaluacin es un proceso complejo aun cuando se concibe como
una operacin personal.
Cuando evaluador y responsable de las decisiones son personas distintas,
se aade otra dimensin. Est en juego la credibilidad del evaluador y.
adems, en ese caso ha de comunicarse de alguna manera la evaluacin
al responsable de la decisin. Existe una mayor incertidumbre respecto a la
clase de comparacin y las normas que emplear y a las proporciones
relativas que asignar a las normas. El responsable de la decisin no soto ha
de preocuparse de que los datos sean correctos, sino tambin de si el
evaluador los presenta de forma veraz. En las sociedades liberales moder
nas, esta relacin se concibe an como un acto privado, aunque interper
sonal.
Por ltimo, en la tercera situacin, el objeto sometido a evaluacin es un
programa pblico. El evaluador debe preocuparse de que la evaluacin
satisfaga las normas de los procedimientos de decisin previstas en vas
22
Eval uaci n, t i ca y pc| er
de inters pblico. La evaluacin no slo s ya un asunt o interpersonal,
sino colectivo. Debe tenerse en cuenta una comuni dad ms ampla de
intereses pertinentes. ste es el problema fundamental del eval uador moderno
y es lo que echa sobre sus espaldas la carga ms pesada de todas. Su
evaluacin no slo debe ser veraz y creble, tambin debe ser justa.
Los evaluadores han enfocado la solucin de su moderno probl ema de
diversos modos. Sus soluciones han evolucionado a partir de sus convic
ciones filosficas, profesionales y personales. Su preparaci n y prctica
habitual constituyen influencias significativas. En el prxi mo captulo pre
sentamos los principales enfoques de la eval uacin y, en el si guiente, los
ponemos en relacin con los sistemas de creencias.
omtt Mu**, 1.1,
CAPTULO II
Los enf oques pri nci pal es
Se defienden docenas de enfoques de la evaluacin. No obstante, la
mayora de ellos puede agruparse en unos pocos tipos bsicos. Hay quienes
denominan model os a estos tipos bsicos, para poner de manifiesto que
se trata de diseos o tipos estructurales, defendidos por importantes tericos
como enfoques dignos de imitacin. Son paradigmas. Podemos llamarlos
enf oques , sin ms.
Todos estos modelos bsicos tienen importantes partidarios, presen
tan unos f undamentos racionales explcitos, aparecen en las bibliografas,
hay un grupo de profesionales que los ponen en prctica y con no menos
relieve existen evaluaciones concretas llevadas a cabo segn sus co
rrespondientes diseos bsicos. En s, los modelos constituyen elabora
ciones idealizadas de los enfoques de evaluacin. Son muchas las contingen
cias distintas que configuran una evaluacin real; por tanto, sta puede
adoptar muchas formas aunque comience, desde el punto de vista con
ceptual, como un tipo concreto. En otras palabras, un modelo es un tipo
ideal.
Convi ene sealar tambin que muchos tericos eminentes de la eval ua
cin (Cronbach, Campbell y Glass, por ejemplo) no se comprometen con
ningn enfoque concreto. Y otros, por ej., Guba, han publicado trabajos que
defienden dos enfoques diferentes. Yo he llevado a cabo eval uaciones
utilizando todos los enfoques principales. En consecuenci a, no podemos
identificarlos como propios de ninguna persona determinada ni considerarlos
tpicos de nadie.
La Figura 1 muestra una taxonoma de los principales modelos de eva
luacin. Al definir stos, he utilizado con profusin otras clasif icaciones
anteriores, sobre todo la de S take (1976), as como las de Popham (1975) y
W o r t h e n y Sanders (1973). Sin duda, habr omitido sin querer algunos
tipos. He excluido algunos posibles modelos porque an no se han utilizado
lo suficiente para que constituyan una escuel a de prctica profesional. Los
Monfth. S i .
Eval uaci n, ti ca y PJ
U
Los enf oques pri nci pal es
modelos de la Figura 1constituyen los principales enfoques que se utitizan
en la actualidad.
A continuacin, expongo un breve esquema de cada uno. En ej Captu
lo XI, har una crtica de cada enfoque, desde un punto de vista tanto
terico como prctico.
El enfoque del anlisis de sistemas
En este enfoque, se definen unas pocas medidas de resultados, como
las puntuaciones de tests en educacin, tratando de relacionar las diferencias
halladas entre programas o normativas con las variaciones que se descubran
en los indicadores. Los datos son cuantitativos y las medidas de resultados
se relacionan con los programas mediante anlisis de correlacin u otras
tcnicas estadsticas. Recientemente, vienen utilizndose ms los diseos
experimentales, prefirindose la variacin planificada del programa a la
natural (vase Cooley y Lohnes, 1976).
Uno de los antecedentes principales de este enfoque fue el anlisis de
sistemas desarrollado en el Department of Defense, siendo secretario
McNamara. Desde 1965, ms o menos, constituy la principal perspectiva
sobre la evaluacin en el Department of Health, Education and Welfare
(Departamento de Salud, Educacin y Bienestar). En ese ao, el presidente
Johnson ampli el Planning, Programming and Budgeting System (PPBS)
(Sistema de planes, programas y presupuestos) en el mbito del gobierno
federal. Si endo secretario de Health, Education and Welfare John Gardner,
se cre un nuevo organismo denominado Assistant Secretary for Program
Evaluation (ASPE) (Subsecretara de Evaluacin de Programas). Para hacerse
cargo del mismo, fue nombrado un grupo de economistas y auditores,
dirigido por William Gorham, que contaba con gran experiencia en el PPBS
del Departamento de Defensa. Los ayudantes de Gorham eran Robert
Gros s e y Alice Rivlin, quien se convertira ms adelante en subsecretara y
directora de la Congressional Budget Office (Oficina de presupuestos del
Congreso).
El modelo de gestin, promovido y perfeccionado por Robert McNamara en
el Departamento de Defensa y llevado al de Salud, Educacin y Bienestar por
William Gorham, se derivaba del mundo de la teora microeconmica. Los ana
listas de la Subsecretara de Evaluacin de Programas trataron de aplicar pers
pectivas tericas semejantes a las reas de servicios humanos. En el diseo dte
TEMPO (a primitiva evaluacin del Ttulo I) haba diversos supuestos mpcios
de partida que configuran una visin econmica de cmo funciona e manda
El presupuesto bsico consiste en que los individuos y las organizaciones se
comportan de manera que se eleve al mximo algn resultado o conjurto per
ceptible de resultados. Por tanto, el analista debe ser capaz de representar tas
opciones organizativas y deducir los objetivos deseados, asi como l a aAcaci a
relativa de las distintas estrategias para alcanzarlos. Este marco miEco supo
ne la existencia de una funcin estable de produccin, una raiacia agriar y
t i m m i tawaa, Si i
Eval uaci n, t ica y poder
cuaniiftcable entre los factores iniciales de una actividad y los productos de |a
misma
(McLaughl i i m, 1975, pg. 35j
La historia de la evaluacin del Ttulo I de la ESEA (Ley de Educacin
especial), que financiaba a los nios en situacin desventajosa, es la de
una tentativa de utilizar el enfoque del anlisis de sistemas. La Office of
Education* resolvi que se utilizara este enfoque en los 30.000 proyectos
del Ttulo I, que afectaban a cinco millones de nios. Dos f uncionarios del
Departamento de Salud, Educacin y Bienestar explican el enfoque:
Para cumplir este mandato legislativo, la U. S. Office of Education contrat a
la RMC Research Corporation para que elaborase modelos para eval uar los
incrementos de la adquisicin de destrezas bsicas conseguidos por los proyectos
del Ttulo I. Cada modelo de los tres de RMC incluye tests pre y postrat ami en
to, un mtodo de estimacin de incrementos de la "lnea base en ausenci a de
los servicios del Ttulo I y procedimientos de conversin de los resultados de los
tests locales en equivalentes de curva normal" que permitieran la i ntegraci n
entre proyectos.
(Barnes y Gi nsburg, 1979, pg. 7.)
Por tanto, estas evaluaciones prescritas utilizan como ni ca medi da de
xito las puntuaciones en los tests (aunque tambin se recogieran la duracin
semanal de los servicios, las proporciones entre profesores y alumnos, los
gastos por cada nio y la cantidad total de participantes), preocupndose
ms por la mxima consecucin de xitos y por la integracin de resultados
que por la distribucin de los mismos. Todos los resultados deban ser
comunicados en un equivalente de curva normal elaborado al efecto, e
integrados en el nivel estatal y en el nacional. Podemos presumi r que una
puntuacin podra representar el estado o la nacin.
En Systematic Thinking for Social Action, deca Ri vli n (1971) que el
problema fundamental consista en cmo podra el gobierno tomar decisiones
mejores. Esta autora consideraba que las cuestiones cl ave eran: 1) cmo
definimos los problemas sociales y cmo se distribuyen?; 2) a quin y
cunto ayudaran las soluciones propuestas?; 3) qu sera ms beneficioso
y cmo podran compararse los beneficios derivados de los distintos enfo
ques?; 4) cmo pueden proporcionarse los servicios del modo ms eficaz?
De estas dos ltimas preguntas podra ocuparse la eval uacin. La caracte
rstica ms importante de este enfoque es el anlisis comparat i vo cos
te/producto de los programas. El caso paradigmtico es la eval uaci n de
seguimiento.
En general, existe un consenso respecto a los objetivos, y el problema
* La U S Officeof Education, integrada en el Department of Health Education and Welface,
correspondera a loque en el organigrama espaol es una secretara de estado o s u b s e c r e t a r a
mmtertal de educacin. (N. deIT.)
oorm Uorata, 3 L
Los enf oques principales 27
estriba en medir los resultados de los programas gubernamentales. Con el
fin de establecer las relaciones de causa a efecto entre programas y resul
tados, hace falta un buen diseo experimental. El diseo preferible incluye
un grupo de control escogido al azar, pero no siempre es factible. Una vez
medidos los resultados de modo psicomtrico, sociomtrico o econom-
trico, se comparan los costes de los programas para averiguar qu resul
tado puede obtenerse por menos dinero. La metodologa de las ciencias
sociales se basa, en gran parte, en este proceso.
El libro Evaluation: A Systematic Approach, de Rossi, Freeman y Wright
(1979) hace suyo el enfoque del anlisis de sistemas. Para ellos, las eva
luaciones se efectan con fines de gestin, planificacin, desarrollo normativo
y efectos fiscales. Las cuestiones clave son las siguientes:
1. Alcanza la intervencin a la poblacin objetivo?
2. Est implementndose del modo especificado?
3. Es eficaz?
4. Cunto cuesta?
5. Cul es su razn coste/ eficacia? (pg. 20).
La evaluacin debe ser lo ms objetiva posible; es decir, para propor
cionar una valoracin firme: una valoracin cuyos resultados no varen si la
realiza otro grupo o si la repiten los mismos evaluadores (pg. 21). Se
pretende conseguir el desarrollo e implementacin ordenados de normas.
Las evaluaciones sistemticas se basan en las tcnicas de las ciencias
sociales. Rossi y cois, desestiman las evaluaciones de sentido comn porque
conducen a conclusiones errneas, y las evaluaciones basadas en reglas y
normas profesionales porque no se fundan en pruebas cientficas. Tampoco
el juicio clnico proporciona una orientacin firme para la decisin.
Las evaluaciones sistemticas proporcionan pruebas vlidas y fiables
que pueden repetir otros observadores, que no podran haberse producido
sin la interaccin y que incluyen informacin respecto al empleo eficaz de
los fondos. Una evaluacin global da respuesta a cuestiones relativas a la
planificacin y supervisin de programas, valoracin de su impacto y efi
ciencia econmica. La informacin sobre la planificacin ayuda a los plani
ficadores a poner a punto intervenciones adecuadas. La informacin de
supervisin nos dice si un programa concuerda con su diseo. La informa
cin sobre el impacto nos muestra si el programa provoca cambios en el
sentido pretendido. La informacin econmica pone de manifiesto si el pro
grama es eficiente. Rossi, Fr eeman y Wr i g h t advierten que no es posible
llevar a cabo la evaluacin de un modo competente si el proceso de de
sarrollo normativo no se efecta de forma clara y explcita.
En todo caso, el enfoque del anlisis de sistemas adopta, sin lugar a
duda, la metodologa de la ciencia social positivista y, por regla general,
excluye otras metodologas. Este enfoque cuenta con el respaldo de muchos
altos funcionarios del gobierno federal, sobre todo economistas. Adems,
reclama para s la categora de ciencia social.
Ediciones Mora. S. I
Como sealamos en el captulo anterior, el problema que se plantea ai
evaluador moderno consiste en que debe valorar un programa pblico pa,
unos destinatarios externos. El enfoque del anlisis de sistemas resuelve
este problema adoptando la perspectiva de los legisladores federales, dando
por supuesto que el programa que se somete a investigacin constituye
una parte funcional de la estructura social y gubernamental. Si asignamos
ese papel al programa, ste debe observar determinados criterios y funciones
Por tanto, el evaluador ha de responder a ciertas cuestiones, aceptando
que el programa desempea ese papel. Se trata de un enfoque funcionalista
Dada la funcin de los programas, todos ellos deben cumplir ciertos requi
sitos.
El enfoque de objetivos conductuales *
(o basado en metas)
El enfoque por objetivos resuelve de otra manera el dilema del evalua
dor moderno. Toma las metas del programa tal como estn formuladas y
recaba pruebas para comprobar si se han alcanzado. Los objetivos son la
nica fuente de normas y criterios. El evaluador valora lo que dicen que
tratan de conseguir quienes han elaborado el programa. La discrepan
cia entre los objetivos formulados y los resultados obtenidos constituye la
medida del xito del programa. Los objetivos formulados descargan al eva
luador de la tarea de suponer determinadas funciones de los programas,
por ejemplo, la eficiencia
En educacin, el modelo basado en objetivos fue promovido por Tyler
(1950), que defenda la definicin de los objetivos educativos en trminos
de la conducta de los estudiantes. La evaluacin de un programa debera
definir sus resultados y sus objetivos como conductas individuales especficas.
El cometido del evaluador consistira en determinar si los estudiantes mos
traban estas conductas concretas tras participar en el programa. Este pro
cedimiento acab conocindose como enfoque por objetivos conductuales
o modelo tyleriano de elaboracin y evaluacin de programas.
Mager (1962) perfeccion ms tarde la tcnica, insistiendo en que no
slo haba que especificar de antemano los objetivos en trminos conduc-
tuales, sino que los mismos objetivos encerraban los criterios y niveles de
consecucin de las metas previstas por quienes elaboraran el programa
Los medios empleados para medir la conducta de los alumnos consistan
en variables de logros cuantificadas, sobre todo los tests de rendimiento en
educacin. Bl oom (1956) y otros elaboraron taxonomas de objetivos edu-
cativos apropiados. Bl oom y cois. (1971) y Popham (1975) aplicaron est
enfoque a la evaluacin de distintas asignaturas.
En los ltimos aos, el centro de atencin de la tcnica se ha desplaza
desde la adecuada formulacin de los objetivos a la preocupacin Por
modo de medirlos. Los tests normalizados de rendimiento tradicionales c ^
sisten en tems de prueba que no se basan en objetivos especificado
Los enfoques principales
antemano. Ha surgido un marcado inters por la elaboracin de tests "refe
ridos a un criterio". Invariablemente, se refieren a objetivos. O sea, tos crea
dores de los tests establecen un conjunto de objetivos, basndose en ellos
para elaborar los Items del test.
El National Assessment of Educational Progress, cuyo principal defensor
es Ty l e r , es de este tipo. Los tests de competencia constituyen un desarrollo
ms reciente de esto. A menudo, se parte de la base de que los objetivos
que sirven de fundamento al test son objetivos mnimos correspondientes a
uh nivel determinado. En otras palabras, todos los nios tienen que llegar
a dominarlos. Para que se le declare mnimamente competente, el alumno
tiene que responder bien todos estos tems. Casi todos los estados cuenten
con un programa de tests de competencia de este tipo. En algunos, como
en Florida, el paso al curso superior depende de la puntuacin que el
alumno consiga en el test El enfoque por objetivos goza de mayor popula
ridad en el nivel estatal.
El enfoque por objetivos conductuales tambin ha adquirido relieve en otros
campos. Por ejemplo, la gestin por objetivos consiste esencialmente en el
enfoque por objetivos aplicado a los negocios y a los organismos guberna
mentales. Se pide a organismos e individuos que definan sus objetivos y se
les juzga con arreglo a la medida en que los cumplen. Nada tiene de particular
si tenemos en cuenta que el movimiento a favor de los objetivos surge del an
lisis de tareas y de la psicologa industrial de principios del siglo xx.
El primer libro de evaluacin de Suchman (1967), sobre la evaluacin de
la salud pblica se basaba primordialmente en el enfoque por objetivos. El
proceso de evaluacin se conceba como la identificacin de una actividad
meta, como la puesta en marcha de esa actividad, la valoracin del efecto
de la actuacin meta, la formacin de valores, la formulacin de objetivos y
la medida de los mismos (pg. 34). En palabras de Suchman: La caracte
rstica ms peculiar de la investigacin evaluativa es la presencia de alguna
meta u objetivo, cuya medida de consecucin constituye el principal centro
de atencin del problema que se va a investigar (pg. 37). Un objetivo
claro de un programa equivale a la hiptesis en un trabajo de investigacin.
Podemos contrastar este enfoque con el antes descrito del anlisis de
sistemas. La evaluacin de seguimiento, segn el enfoque del anlisis de sis
temas, se basaba slo en cuatro bateras de tests para evaluar trece programas
relativos a la primera infancia. Es de suponer que lo que medan estos cuatro
tests era fundamental. En realidad, cada programa de primera infancia tena
docenas de metas y objetivos explcitos. Una evaluacin por objetivos con
ductuales tendra que haber determinado si se cumpla cada uno de los ob
jetivos o bien debera reducir stos a algn conjunto mensurable.
El enfoque de decisin
Todos los enfoques modernos de la evaluacin tienen presente la cone
xin entre sta y la toma de decisiones, aunque varen los responsables <Je
EacnMSManto. $.
Eval uaci n, ti ca y poder
las decisiones y el modo en que stas se llevarn a efecto. El enfoque de
decisin sostiene que la evaluacin ha de estructurarse a partir de las deci
siones reales que haya que tomar, lo que alude, por regla general, a las que
corresponden al responsable mximo, director, o administrador.
En el campo de la educacin, el principal exponente de este enfoque ha
sido Stufflebeam (1973). La evaluacin es el proceso de delimitar, obtener
y proporcionar informacin til para juzgar posibles decisiones alternativas"
(pg. 129). Stufflebeam define tres mbitos de decisin (homeostasia, In-
crementalismo y neomovilismo), cuatro tipos (planificacin, estructuracin,
implementacin y reciclado), tres fases en el proceso de evaluacin (delimi
tacin, obtencin y comunicacin) y cuatro tipos de evaluacin [de contexto,
de entrada (input), de proceso y de producto].
Con independencia del tipo de evaluacin de que se trate, su diseo
se establece mediante la identificacin del nivel de decisin al que se di
rige, proyectando la situacin de decisin, definiendo los criterios de cada
situacin y las normas para el evaluador. Tras ello, se recoge, organiza,
analiza y transmite la informacin requerida. Cada fase se divide en diversas
tareas subordinadas del evaluador (Stufflebeam, 1969).
Gut t ent ag (1973, 1974) trat de realizar un anlisis cuantitativo de la
estructura preferida por el responsable de la decisin. Su idea consiste en
identificar las acciones o programas que eleven al mximo relieve los valores
de los responsables de las decisiones. Esto se llev a cabo mediante un
mtodo de escalado de utilidad de atributos mltiples, elaborado por Edwards.
La "utilidad es el resultado de un curso de accin relativo a los valores de
los responsables de las decisiones. Su objeto consiste en identificar los
cursos de accin que favorecen al mximo la utilidad global.
El enfoque exige que se definan las dimensiones pertinentes de valor y
que el responsable de la decisin clasifique las entidades que han de
evaluarse en relacin con estas escalas de valor. Todo ello se basa en los
juicios subjetivos de los responsables de las decisiones. La utilidad de las
alternativas de accin se resume en relacin con las diversas dimensiones
de valor para determinar el curso de accin de mxima utilidad.
Pat t on (1978), que hace hincapi en el factor personal en la utilizacin
de ios hallazgos de la evaluacin, presenta la tercera perspectiva respecto
al enfoque de decisin de la evaluacin. El primer paso en la perspectiva
que se centra en la utilizacin de la evaluacin consiste en la identificacin
y organizacin de los responsables pertinentes de la decisin y de los
usuarios de la informacin que aporte la citada evaluacin (pg. 61). Pat t on
sostiene que los hallazgos de la evaluacin se utilizan cuando algn individuo
se responsabiliza de forma directa y personal de conseguir la informa
cin para las personas adecuadas. La responsabilidad de determinar qu
informacin necesitan corresponde a los encargados de tomar las deci-
El segundo paso de una evaluacin consiste en i dent i f i car y cent rar las
cuestiones pertinentes. La cuestin correcta tiene varias caract erst i cas. Es
aportar datos que se refieran a ella y existe ms de una posible
Los enf oques principales 31
respuesta a la misma. Los responsables de las decisiones identificados
quieren y creen necesitar informacin que les ayude a responder la pregunta
Los encargados de las decisiones quieren contestarse a s mismos y es
preocupan las respuestas. Por ltimo, los responsables de las decisiones
pueden especificar cmo utilizarn la respuesta a la cuestin.
En resumen, el enfoque de decisin de la evaluacin resuelve el problema
del evaluador tomando como destinatario (a quien se dirige la evaluacin)
al responsable de las decisiones, adoptando como preocupaciones y criterios
significativos los propios de aqul. Vara la manera de identificar a ios res
ponsables de las decisiones y cmo se manifiestan stas. Se supone que
este enfoque incrementar la utilizacin de los hallazgos de la evaluacin.
La metodologa descansa, en gran medida, en la metodologa de encuesta
como cuestionarios o entrevistas, y el evaluador trabaja ms sobre las
variaciones naturales en el medio en donde se desarrolla el programa que
tratando de montar experimentos. Las cuestiones que se resuelven corres
ponden a los responsables de las decisiones, aunque, por regla general,
incluyen la eficacia del programa en relacin con alguna dimensin y, en
especial, qu partes del programa funcionan.
El enfoque que prescinde de los objetivos
El enfoque que prescinde de los objetivos constituye una reaccin directa
frente a la omnipresencia de la evaluacin determinada por los objetivos.
Scriven (1973) sostiene que el evaluador no slo no tiene que basar su
evaluacin en los objetivos del programa, sino que debe procurar evitar
deliberadamente informarse sobre ellos, con el fin de que no le lleven a
sesgos tendenciosos. La evaluacin sin objetivos debe contemplarse en el
contexto de la preocupacin ms general de Scriven por la reduccin de
los efectos de los sesgos en la evaluacin. Los objetivos producen sesgos
en el evaluador. Como dice Scriven, por desgracia yo no puedo evaluar
sus logros (del personal del proyecto) con una objetividad razonable y, al
mismo tiempo, tener una larga sesin de adoctrinamiento con ellos (p
gina 320).
El modelo sin objetivos reduce el sesgo de buscar slo los intentos del
responsable del programa, especificados de antemano, ya que stos no se
comunican al evaluador. Por tanto, el evaluador debe investigar todos ios
resultados. Muchos de ellos no son sino efectos colaterales imprevistos,
que pueden ser positivos o negativos. Como dice Scriven:
A menudo, los llamados efectos colaterales, sean buenos o matos, deter
minan completamente el resultado de la evaluacin. Es obvio que. para el eva
luador, carece de relieve si se trata de efectos colaterales o directos ' Esa
forma de hablar se refiere a las intenciones del promotor y e) evaluador no
valora intenciones, sino resultados. En realidad, es peligroso incluso prestar
odos a descripciones generales de las intenciones porque esto aparta la aienon
32
Eval uaci n, t ica y poder
de los efectos colaterales" y tiende a hacer que los pasemos por alto o los In
fravaloremos.
(Pg. 321 .j
De todos los enfoques de la evaluacin aqu descritos, el que prescinde
de los objetivos ha sido el menos utilizado, hasta el punto de que algunos
cuestionan que se le incluya entre los modelos principales. En el campo de
los servicios sociales, es frecuente que, tanto a los eval uadores como a los
responsables de los programas, les resulte difcil imaginar incluso dnde
puede el evaluador encontrar criterios de evaluacin fuera de los objetivos
del responsable del programa. Dan por supuesto que el evaluador se limita
a reemplazar sus propios criterios por los correspondientes a los responsa
bles de los programas.
Sin embargo, la Consumers' Union evala productos de consumo con
regularidad sin preguntar a los productores cules son sus metas. Por
ejemplo, este organismo evala automviles sin utilizar los objetivos de la
General Motors como base de la evaluacin. La Consumers Union emplea
las normas y criterios que cree benefician ms al consumidor que al pro
ductor. Del mismo modo, la evaluacin sin objetivos toma como destinatarios
o grupo de referencia a los beneficiarios de los programas sociales, en vez
de a los directivos. En gran parte, el pensamiento de Scriven parece tener
presente como modelo el enfoque de la Consumers Union.
Por supuesto, los programas sociales no son automviles y la obtencin
de un conjunto de normas para su evaluacin no resulta tan sencilla como
en el caso de los productos de consumo. Con este objeto, Scriven ha
tratado de desarrollar el concepto de necesidad como fundamento de la
evaluacin. Frente a los simples gustos o deseos, las necesidades se descu
bren mediante su evaluacin. El establecimiento de la validez objetiva de ta
les necesidades proporcionara al evaluador una fuente autorizada de nor
mas. Por tanto, la evaluacin independiente de los objetivos se basa en el
anlisis de las necesidades del usuario y no de los objetivos de los pro
ductores.
La metodologa de la evaluacin sin objetivos no es tan clara como en
otros enfoques. En general, Scriven es partidario de un enfoque sin sesgos
para garantizar la objetividad. Se considera al eval uador como experto en
la tarea de eliminar e impedir que los sesgos derivados de s mismo y de
los dems intervengan en la evaluacin. Entre las tcnicas utilizadas es
tn los experimentos de tipo doble ciego , en los que ni el sujeto ni el ex
perimentador saben cul es el tratamiento ni cul el placebo. Scr i ven ve la
evaluacin sin objetivos como una operacin a triple ciego, en la que
nadie conoce las intenciones. Otras tcnicas abarcan la mezcla antecedente
y posterior de los elementos que se juzgan, la calibracin de los jueces por
medio de casos normalizados, la separacin entre el individuo y el personal
del programa, cdigos deontolgicos, rplica concurrente de las experiencias,
anlisis secundario a cargo de agentes independientes y otras por el estilo
(Scri ven, 1976).
Los enf oques pri nci pales 33
Scriven (1975) insiste mucho en la independencia entre el evaluador y
el personal del programa. Su principio de retroalimentacin {feedback\ inde
pendiente dice que ninguna unidad depender por completo de una deter
minada subunidad en relacin con la retroalimentacin evaluativa sobre
esa subunidad. Su principio de la inestabilidad de la independencia da a
entender que, en el transcurso del tiempo, los evaluadores se ven continua
mente solicitados, debiendo cuidarse de mantener una renovada vigilancia
sobre la evaluacin. Se refiere de forma reiterada al evaluador como a un
cazador o detective que ha de descubrir claves y extraer la informacin. En
un caso, compara el trabajo del evaluador con el de un juez instructor que
trata de determinar conexiones causales en condiciones no experimentales
(Scriven, 1976). Por medio del mtodo del modus operandi, el investigador
establece una cadena causal entre causa y efecto. El evaluador debe operar
de modo semejante.
Las tcnicas utilizadas en las pocas evaluaciones llevadas a cabo pres
cindiendo de los objetivos son muy diversas. En una evaluacin de ciertos
materiales curriculares nuevos, House y Hogben (1974) examinaron los
resultados de un pretest, leyeron revisiones de los materiales efectuadas
por expertos, visitaron aulas, entrevistaron a profesores y alumnos, y exami
naron los materiales concretos. En otra evaluacin de materiales curriculares.
W elch (1978) utiliz un tribunal de jueces para clasificar los materiales en
una larga lista de comprobacin. Harrington y Sanders (1979) tratan de
elaborar algunas orientaciones para la realizacin de la evaluacin, pres
cindiendo de los objetivos.
El enfoque del estilo de la crtica de arte
Los roles que desempean la crtica de arte, la crtica literaria, la critica
teatral y la crtica de cine son bien conocidos. Constituyen formas valiosas
de juzgar la calidad de las obras de arte. Eisner (1979) y otros han estudiado
el modelo anlogo de crtica educativa o curricular para juzgar los programas
educativos. El mismo enfoque puede utilizarse en otras reas del mbito
social.
En la concepcin de Eisner, la crtica es cualitativa por naturaleza como
las mismas obras de los artistas. El crtico o crtica de arte se enfrente con
la difcil tarea de traducir las cualidades esencialmente inefables que cons
tituyen las obras de arte a un lenguaje que ayude a los dems a percibir la
obra con mayor profundidad (pg. 191). Ei s n e r sostiene que la crtica es
una operacin emprica. Las cualidades que describe el crftteo pueden
situarse en la obra misma. Es ms, todo puede ser objeto de critica. sla no
es la valoracin negativa de algo, sino la iluminacin de sus cualidades, de
modo que pueda apreciarse su valor. La prueba de la crtica est en tos
efectos instrumentales que produce en su destinatario.
Eisner distingue entre la actuacin del experto y la crtica. La earaciensfcca
del experto es el arte de la apreciacin, mientras que la crtica es e arte de
32
Eval uaci n, ti ca y p0(ler
de los 'efectos colaterales y tiende a hacer que l os pasemos por alto o los in
fravaloremos.
(Pg. 321.)
De todos los enfoques de la evaluacin aqu descritos, el que prescinde
de los objetivos ha sido eJ menos utilizado, hasta el punto de que algunos
cuestionan que se le incluya entre los modelos principales. En el campo de
los servicios sociales, es frecuente que, tanto a los eval uadores como a los
responsables de los programas, les resulte difcil i magi nar incluso dnde
puede el evaluador encontrar criterios de evaluacin f uera de los objetivos
del responsable del programa Dan por supuesto que el eval uador se limita
a reemplazar sus propios criterios por tos correspondientes a los responsa
bles de los programas.
Sin embargo, la Consumers' Union evala productos de consumo con
regularidad sin preguntar a los productores cules son sus metas. Por
ejemplo, este organismo evala automviles sin utilizar los objetivos de la
General Motors como base de la evaluacin. La Consumers Union emplea
las normas y criterios que cree benefician ms al consumi dor que al pro
ductor. Del mismo modo, la evaluacin sin objetivos toma como destinatarios
o grupo de referencia a los beneficiarios de los programas soci al es, en vez
de a los directivos. En gran parte, el pensamiento de S c r i v e n parece tener
presente como modelo el enfoque de la Consumers' Union.
Por supuesto, los programas sociales no son automvil es y la obtencin
de un conjunto de normas para su evaluacin no resulta tan sencil la como
en el caso de los productos de consumo. Con este objeto, S cri ven ha
tratado de desarrollar el concepto de necesi dad como f undamento de la
evaluacin. Frente a los simples gustos o deseos, las necesi dades se descu
bren mediante su evaluacin. El establecimiento de la val idez objetiva de ta
les necesidades proporcionara al evaluador una fuente aut ori zada de nor
mas. Por tanto, la evaluacin independiente de los objeti vos se basa en el
anlisis de las necesidades del usuario y no de los objeti vos de los pro
ductores.
La metodologa de la evaluacin sin objetivos no es tan c la r a como en
otros enfoques. En general, Scr i ven es partidario de un enf oque sin sesgos
para garantizar la objetividad. Se considera al eval uador como experto en
la tarea de eliminar e impedir que los sesgos deri vados de s mismo y de
los dems intervengan en la evaluacin. Entre las t cnicas utilizadas es
tn los experimentos de tipo doble ciego , en los que ni el sujeto ni el ex
perimentador saben cul es el tratamiento ni cul el pl acebo. S cr i v e n ve la
evaluacin sin objetivos como una operacin a triple ci ego , en la que
nadie conoce las intenciones. Otras tcnicas abarcan la mezcl a antecedente
y posterior de los elementos que se juzgan, la calibracin de los jueces por
medio de casos normalizados, la separacin entre el indi viduo y el personal
del programa, cdigos deontolgicos, rplica concurrente de las experiencias,
anlisis secundario a cargo de agentes independientes y otras por el estilo
(Scr i ven, 1976).
ftriiiMM Moran, 8- L
Los enfoques principales
Sc r i ve n (1975) insiste mucho en la independencia entre el evaluador y
el personal del programa Su principio de retroalimentacin (feedback\ inde
pendiente dice que ninguna unidad depender por completo de una deter
minada subunidad en relacin con la retroalimentacin evaluativa sobre
esa subunidad. Su principio de la inestabilidad de la independencia da a
entender que, en el transcurso del tiempo, los evaluadores se ven continua
mente solicitados, debiendo cuidarse de mantener una renovada vigilancia
sobre la evaluacin. Se refiere de forma reiterada al evaluador como a un
cazador o detective que ha de descubrir claves y extraer ia informacin. En
un caso, compara el trabajo del evaluador con el de un juez instructor que
trata de determinar conexiones causales en condiciones no experimentales
(Scriven, 1976). Por medio del mtodo del modus operandi. el investigador
establece una cadena causal entre causa y efecto. El evaluador debe operar
de modo semejante.
Las tcnicas utilizadas en las pocas evaluaciones llevadas a cabo pres
cindiendo de los objetivos son muy diversas. En una evaluacin de ciertos
materiales curriculares nuevos, House y Hogben (1974) examinaron los
resultados de un pretest, leyeron revisiones de los materiales efectuadas
por expertos, visitaron aulas, entrevistaron a profesores y alumnos, y exami
naron los materiales concretos. En otra evaluacin de materiales curriculares,
We lc h (1978) utiliz un tribunal de jueces para clasificar los materiales en
una larga lista de comprobacin. Harrington y Sanders (1979) tratan de
elaborar algunas orientaciones para la realizacin de la evaluacin, pres
cindiendo de los objetivos.
El enfoque del estilo de la crtica de arte
Los roles que desempean la crtica de arte, la crtica literaria, la critica
teatral y la crtica de cine son bien conocidos. Constituyen formas valiosas
de juzgar la calidad de las obras de arte. Eisner (1979) y otros han estudiado
el modelo anlogo de crtica educativa o curricular para juzgar los programas
educativos. El mismo enfoque puede utilizarse en otras reas del mbfto
social.
En la concepcin de Eisner, la crtica es cualitativa por naturaleza como
las mismas obras de los artistas. El crtico o crtica de arte se enfrenta con
la difcil tarea de traducir las cualidades esencialmente inefables que cons
tituyen las obras de arte a un lenguaje que ayude a los dems a perder to
obra con mayor profundidad" (pg. 191). Eisner sostiene que ia crf tca es
una operacin emprica Las cualidades que describe el critico puedan
situarse en la obra misma. Es ms, todo puede ser objeto de critica. Esto m
es la valoracin negativa de algo, sino la iluminacin de sus cualidades fe
modo que pueda apreciarse su valor. La prueba de la critica esto en los
efectos instrumentales que produce en su destinatario.
Eis n e r distingue entre la actuacin del experto y la critica La caraciansca
del experto es el arte de la apreciacin, mientras que la critica a s al afta f ia
& aaMMtt ItoNNfc.
la revelacin (pg. 193). El arte del experto consiste en reconocer y apreciar
las cualidades de la obra en cuestin, pero no exige un juicio o descripcin
pblicos. Es el preludio necesario de la crtica.
El carcter de experto requiere del perceptor que tenga gran experiencia
para ser capaz de distinguir lo que de significativo tiene un vino, un juego,
un aula educativa. Sin embargo, existen diferencias entre reconocimiento y
percepcin. El simple reconocimiento y la clasificacin basados en la expe
riencia no bastan. Hace falta ser capaz de percibir las sutilezas y comprender
cmo contribuyen a un patrn general, como en la vida del aula.
Para desarrollar este carcter de experto es preciso tener la oportunidad
de asistir a los acontecimientos y compararlos. Las percepciones han de
perfeccionarse, integrarse y valorarse. Hay que ser sensible a las cualidades
que surgen del aula o del programa que se va a evaluar. Esto requiere
tambin un conjunto de ideas (teoras, modelos o lo que sea) que permitan
al sujeto diferenciar lo significativo de lo trivial. Para acceder a estas discri
minaciones hace falta una preparacin adecuada y tambin experiencia.
Por otra parte, "la critica es el arte de revelar las cualidades de los
hechos u objetos que percibe el arte del experto (pg. 197). La crtica trata
de 'traducir una situacin de tal manera que se pongan en evidencia los
aspectos significativos, de la situacin, objeto o programa. Eisner plantea
aqu la distincin entre las formas discursiva y no discursiva de presentacin.
La crtica trata de captar la esencia de lo concreto. Su lenguaje es no
discursivo en la medida en que utiliza formas para presentar sensaciones
ms que para representar hechos.
La crtica realizada de manera adecuada aumenta el conocimiento y la
apreciacin. "Apreciacin no significa que guste algo, sino un mayor co
nocimiento. La funcin de la crtica consiste en aplicar criterios, de mane
ra que los juicios sobre los hechos puedan fundarse en una consideracin
de lo importante. Esa investigacin cualitativa permite al lector participar de
manera vicaria en las cualidades descritas.
En cuanto a la validez y fiabilidad, Eisner habla de la "corroboracin
estructural" y de la adecuacin referencia!". La evidencia se corrobora
cuando los elementos de la misma encajan entre s. La adecuacin referen-
cial alude a la posibilidad de encontrar en la obra o programa criticado las
caractersticas sealadas por el crtico. Se hace gran hincapi en la- necesidad
de un buen conocimiento de la situacin. No obstante, no hay que espe
rar la unanimidad entre los crticos. Segn Eisner, el objetivo consiste en
ampliar la percepcin y no en llegar a una crtica definitiva. La consecuencia
de la crtica se basa en el desarrollo del carcter de expertos de los dems.
Hasta ahora, el enfoque crtico de la evaluacin ha sido divulgado sobre
todo por Eisner y sus discpulos (p. ej.: McCutcheon, 1978, y Val l ance,
1978), (imitndose a la educacin.
En realidad, hay diferentes enfoques respecto a la crtica misma,* Ke-
.y (1978) establece una analoga entre la evaluacin y la crtica literaria,
ms que con la crtica de arte. De la literaria extrae conceptos establecidos
como, metfora, voz, argumento y tema, utilizndolos para ilustrar la evala-
34 _______________ __________________________________________Eval uaci n, tica y p0rio,
%CAmwmtont, 8 i
Los enf oques principales %
cin. Su anlisis muestra cmo los evaluadores emplean conceptos similares
al considerar los programas y redactar sus informes. En su anlisis, se
mezclan descripcin y evaluacin. Asimismo, la credibilidad de la crtica
constituye un problema para l ms que para Eisner. Como seala Kelly,
aceptamos la crtica con la que estamos de acuerdo. Por tanto, la naturaleza
de la crtica puede variar de una materia a otra.
La crtica puede cambiar tambin dentro de una misma rea. Jenki ns y
OTo o l e (1978) sealan las diferencias entre crticos literarios. Existen los
crticos acadmicos de las universidades, que juzgan todo segn los nive
les de las mejores obras. Hay crticos escritores que perciben la crtica co
mo una consecuencia de su propia obra y tratan de determinar las normas
de gusto mediante las que podran ser evaluados. En particular, la crtica de
estos ltimos asume algunas caractersticas de la escritura creativa. Por
ltimo, se encuentran los crticos libres o periodsticos, que se dirigen a un
pblico amplio.
Ante todo, el crtico da por supuesto que escribe para un grupo de
usuarios o para expertos. El pblico descubrir si el programa es bueno,
pero tambin tendr una sensibilidad acrecentada. Esto supone que el
pblico acepta la crtica y, por regla general, sus normas implcitas. No
existe una metodologa normalizada, salvo la revisin crtica, que puede
llevarse a cabo de diversos modos. La inmersin y la familiaridad con el
objeto o programa suelen considerarse fundamentales. Para el crtico, son
esenciales una experiencia y preparacin adecuadas. En definitiva, la crtica
lleva a una consciencia reforzada, una mejora de los niveles y una actuacin
perfeccionada. El enfoque crtico de la evaluacin resuelve el dilema de
sta mediante la designacin, como evaluador, de una persona experimen
tada y con la adecuada preparacin, en definitiva, un experto en la cuestin
de que se trate. Con su sensibilidad, la persona experimentada comunica
sus juicios de un modo que informa y educa a los menos sensibles.
El enfoque de revisin profesional (acreditacin)
Durante ms de cincuenta aos, las asociaciones profesionales han
llevado a cabo evaluaciones de la preparacin profesional. Ya se trate de
mdicos, abogados, trabajadores sociales o maestros, la revisin profesional
de los centros de formacin, tal como la realiza la North Central Associatm
en las escuelas secundarias, ha constituido un medio fundamental de eva
luacin. Concebida de manera algo ms amplia, (a revisin profesional
supone que los cirujanos, profesores o abogados juzguen el trabajo de sus
colegas. Por regla general, la participacin en la revisin se circunscribe a
los compaeros de profesin.
Muchas de ellas son evaluaciones que sirven para dar fe de la ca
lidad de los centros de preparacin profesional. Por ejemplo, a partir de
1885, ciertos grupos de escuelas secundarias organizaron la normalizacin
de los requisitos de ingreso en los centros de enseanza superior. De eflo
surgi el National Study of School Evaluation (1978), que publica Evaluative
Criteria. En este trabajo aparecen criterios mediante los cuales se evalan
las escuelas secundarias.
Los criterios estn organizados por materias especficas, como agricultura
arte, formacin empresarial, etctera. Algunos criterios se refieren a los
servicios escolares, como medios audiovisuales de aprendizaje, servicios a
los alumnos o instalaciones de la escuela El programa educativo se divide
en dieciocho reas temticas. Adems, existen nueve reas de servicios
Hay diversas listas de comprobacin para evaluar cada materia.
Por ejemplo, en el rea de ingls, aparecen tems como: "Se exige a
todos los alumnos que cursen la asignatura de ingls (pg. 103); Algunas
obras contemporneas y clsicas, seleccionadas por su adecuaci n a las
capacidades, intereses y madurez de los alumnos, se estudian de manera
intensiva" (pg. 195); Se presta atencin al perfeccionamiento de las tcnicas
de estudio (pg. 111). El evaluador punta cada tem en una escala de
cinco opciones, desde "nada en absoluto" hasta excelente .
Este enfoque est pensado para involucrar al prof esorado en la auto-
evaluacin. Antes de que una comisin externa efecte una visita, el profe
sorado del centro se divide en varias subcomisiones que se encargan de
puntuar los tems de la lista de comprobacin. Los resultados se comunican
a todo el profesorado. El organismo externo encargado de la certificacin
(p. ej.: la North Central Association) nombra una comisin externa encargada
de validar la autoevaluacin. Los centros tienen derecho a vetar a los
miembros de dicha comisin, cuyo nmero puede oscilar entre diez y treinta.
La comisin visitadora se divide en subcomisiones por materias, cada
una de las cuales comprueba las puntuaciones de la autoevaluacin, modi
ficndolas si no estn de acuerdo con ellas. Tant o las subcomisi ones como
el pleno de la comisin visitadora elaboran informes escritos. Antes de
abandonar el centro, en un breve informe oral al prof esorado, la comisin
indica los principales aspectos positivos y negativos y hace las correspon
dientes recomendaciones. Dependiendo del informe, se concede o no la
certificacin a la escuela. Tras la visita, se prev que sta adopte las
medidas pertinentes para corregir los aspectos negativos sealados. Aunque
existen ciertas variaciones de criterios y procedimientos, diversos organismos
con capacidad para otorgar certificaciones, como asociaciones profesionales
y gobiernos estatales, efectan visitas similares a casi todas las escuelas,
desde las ms elementales hasta las de carcter ms profesional.
Una variante interesante del enfoque de acreditacin de la eval uaci n,
que registra un rpido crecimiento, consiste en la eval uaci n de departa'
mentos o unidades de una universidad, patrocinada, por regla general, po
la administracin universitaria. Una de las primeras eval uaci ones de es
tipo fue la Council on Program Evaluation (COPE), de la Uni versi dad o
Illinois. Desde 1972 hasta 1979, fueron eval uadas todas las unidades aca
dmtcas del campus de Urbana.
Para llevar a cabo este proceso, se instituy un consejo de nue ^
profesores, presidido por un administrador del rectorado. Ms tarde, entrar
Los enfoques princi pal es
9
a formar parte del consejo dos alumnos graduados y dos no graduados. B
consejo tena autoridad para evaluar los departamentos de acuerdo con
seis criterios:
1. calidad del programa docente;
2. calidad de la investigacin, de la actividad creativa o de trabajo
acadmico;
3. calidad de servicio a la universidad y a la profesin;
4. contribucin prestada por la unidad a otras del campus o importancia
de aqulla en el mismo;
5. valor del programa para la sociedad o singularidad del mismo en el
estado, y
6. posibilidades y previsiones de futuro.
Al principio, el consejo nombraba grupos de trabajo de cinco a diez
profesores para que estudiasen un departamento concreto. Dichos grupos
celebraban amplias entrevistas con los miembros del departamento en cues
tin, redactando ms tarde un informe confidencial de evaluacin del mismo
que elevaban al consejo. Este organismo revisaba el informe y. basndose
en l, elaboraba su propia evaluacin abreviada, normalmente en forma de
carta, que enviaba al vicerrector y al departamento. Este ltimo poda res
ponder a la carta y a las recomendaciones que contuviese.
Despus de emplear este mtodo durante unos aos, este proceso
empez a exigir tal cantidad de tiempo que se decidi que no hubiese un
grupo de trabajo por cada departamento. Se elabor un amplio conjunto de
formularios para que cada uno de ellos los cumplimentase. stos reco
gan cuestionarios sobre la mayora de los aspectos de las operaciones de
los departamentos. El consejo revisaba los formularios cumplimentados,
emitiendo un juicio global y una serie de recomendaciones fundadas en
criterios formales. En la prctica, la calidad de la investigacin pesaba
mucho en el juicio final. Cuando pareca que el departamento en cuestin
presentaba demasiados aspectos negativos o necesitaba algn tipo de aten
cin especial, se nombraba un grupo de trabajo para que llevase a cabo
una evaluacin presencial ms exhaustiva (Pet r i e, 1979).
Por supuesto, no todas las revisiones profesionales se desarrollan del
mismo modo. Por ejemplo, ios tribunales de evaluacin de las especialidades
mdicas estn regidos por un consejo de profesionales, pero el medico se
somete a un examen escrito y otro oral a cargo de especialistas. En todas
estas evaluaciones, la fuente de normas y criterios son los profesionales
mismos. Se da por supuesto que estn mejor cualificados para juzgar el
mrito profesional. Los procedimientos varan, pero la evaluacin cumma
en una valoracin global de un programa profesional a cargo de otaros
expertos.
Eval uaci n, ti ca y podQr
El enfoque cuasijudicial (de contrapruebas)*
Los procedimientos cuasijudiciales se han utilizado desde hace mucho
tiempo con fines de evaluacin y de elaboracin de normativas. Reciente
mente, en el campo de la evaluacin, se viene prestando atencin a la
simulacin de juicios u otros procedimientos de contrapruebas, sobre todo
ante la agresiva accin de los tribunales de justicia en la determinacin de
problemas de los programas sociales. Sin embargo, no todos los procedi
mientos cuasijudiciales son por naturaleza de contrapruebas. Deshecho, si
contamos entre los procedimientos de tipo judicial los j urados de premios y
las comisiones nombradas con fines parecidos, la mayora no reviste ca
racteres de contrapruebas. La legislacin [p. ej.: la Civil Rights Act (Ley de
Derechos Civiles)] establece procedimientos de revisin administrativa que
se atienen a los principios procesales, aunque no son de contrapruebas.
Por ejemplo, la Warren Commission, que investig el asesinato del pre
sidente Kennedy, fue un grupo nombrado por el presidente que tom decla
raciones a los testigos, llev a cabo sus propias investigaciones y lleg a
una conclusin sobre los hechos probables. Del mismo modo, \a Kerner
Commission on Civil Disorders lleg a una conclusin sobre causas proba
bles. Con frecuencia, se emplea este tipo de tribunales para tratar cuestiones
controvertidas y resolver las dudas que pesen sobre ellas. La comi si n de
Wi rt z (1977) constituye un ejemplo reciente del descenso de las puntuacio
nes en los tests normalizados registrado en todo el mbito nacional. El
tribunal correspondiente dedujo las probables causas de tal descenso.
En Inglaterra, se hace frecuente uso de este tipo de comisiones y consejos
para extraer orientaciones para la poltica pblica (Ko g a n y Pa ck wo o d ,
1974). El Plowden Committee de 1967, sobre la educacin primaria, y el
Taylor Report, ms reciente, sobre el gobierno local de las escuel as consti
tuyen buenos ejemplos. Para presidir estos tribunales, se nombra a ciuda
danos relevantes, contando con la ayuda gubernamental.
Todas las reas sociales han recibido orientaciones de esta clase de
tribunales y a menudo se instituye el tribunal para resolver problemas en el
seno de una colectividad profesional. Por ejemplo, la National Education
Association (House y cois., 1974) financi un tribunal para que examinara el
sistema de responsabilidad educativa de Michigan. El mismo grupo patrocin
una investigacin similar en Florida (Tyl er y cois., 1978). En la Office of
Education, el J oint Review Dissemination Panel escucha los testimonios de
prueba y los comunica s los programas desarrollados con financiacin
federal resultan lo bastante "validados como para divulgarlos por el resto
ei pas,
' 8 trmino origina! es Adversar/ * , cuya traduccin literal sera 'adversario o c o n t r a r i o
Dado el contexto cuasjurdico en el que aparece, optamos por la acepcin / c o n t r a p r u e b a s .
que ss como en nuestro mbito jurdico se conoce este vocablo. Contrapruebas, en D e r e c h o P f '
rms Gsvt, son las pruebas encaminadas a destruir los asertos al egados por la parte co n tr a r i a
formar porte de lo que se denomina prueba de lo contrario o "prueba en contrario". (N. del ' '
Los enf oques pri nci pal es
39
Aunque estos tribunales y comisiones no forman parte del sistema judicial,
en realidad, su autoridad se deriva, en parte, de sus procedimientos cuasijud-
ciales. Las pruebas suelen presentarse ante un tribunal. Los testigos testifican
y presentan pruebas. Se establecen reglas respecto a quin puede pre
sentarlas y en qu condiciones ha de darse testimonio. Las mismas audiencias
adoptan los smbolos y la solemnidad de las salas de justicia; a menudo, las
salas de audiencia estn dispuestas a la manera de aqullas. Suele ponerse
mucho cuidado en tomar declaraciones exhaustivas. En resumen, el problema
del evaluador se resuelve mediante el empleo de procedimientos cuasijudi-
ciales que prestan a la evaluacin la autoridad de la justicia.
Desde no hace mucho tiempo, vienen utilizndose procedimientos judi
ciales de contrapruebas para evaluar programas. La audiencia de contraprue
bas se basa en el supuesto de que los hechos de un caso pueden comprobar
se mejor si cada parte hace todo lo posible, con plena parcialidad, para
presentar las pruebas ms favorables en apoyo de sus tesis ante el tribunal
(Owens, 1973). La tendenciosidad de las partes en conflicto pone en eviden
cia pruebas vitales.
En 1970, tuvo lugar en Hawai la primera audiencia de contrapruebas para
juzgar si las escuelas pblicas de all deban adoptar el curriculum Man: A
Course of Study. Presidan tres jueces, todos ellos educadores. Las dos
partes pasaron varias semanas preparando el caso. Otra simulacin judicial
se celebr en la universidad de Indiana para evaluar un programa de for
macin de profesorado (Wo l f , 1975). Los equipos opuestos entre s pre
sentaron argumentos en pro y en contra del programa. Durante dos das,
declararon treinta y dos testigos. Se elaboraron instrucciones judiciales
respecto al examen directo y cruzado. El jurado estuvo constituido por trece
expertos en educacin.
El responsable del diseo del juicio dijo: quiz, la razn de mayor peso
para utilizar la metodologa judicial sea que presenta un sistema til de
reglas y procedimientos de prueba dirigidos a conseguir inferencias alter
nativas a partir de los datos antes de proceder al juicio... El enfoque judicial
facilita la consideracin estructurada de argumentos e inferencias alternativos
que hagan que la evaluacin sea intelectualmente honrada y equitativa
(Wo l f , 1975, pg. 185).
W o l f concibi el proceso constituido por cuatro fases: planteamiento
del problema, seleccin del mismo, presentacin de argumentos y audiencia
En la primera fase, se llevaba a cabo una serie de entrevistas para descubrir
treinta problemas. En la segunda, se utilizaba una encuesta dirigida a profe
sores, estudiantes y administradores con el fin de reducir el nmero de
problemas. En la tercera fase, se preparaban los alegatos. En la cuarta,
tenan lugar las sesiones de presentacin anterior a la audiencia y ella
misma. La duracin total del proceso fue de seis meses.
Ante las crticas dirigidas contra los mtodos de contrapruebas, W o l f (1979)
trat de quitar importancia al carcter de contrapruebas de su enfoque concre
to: quiz el aspecto ms significativo de la metfora judicial... sea que la tor*
ma de investigacin de los tribunales es educativa (Wo l f , 1979, pg. 21), El
BdicioMS S.
40
Eval uaci n, Bcay^
testimonio humano es la "piedra de toque de la evidencia. La evidencia
final que orienta la deliberacin y el juicio no slo abarca los hechos, sino
una gran variedad de percepciones, opiniones, sesgos y especulaciones
en un contexto de valores y creencias (pg. 21).
Stenzel (1979) estudi el empleo de las comisiones de investigacin del
Congreso como modelo de evaluacin. La Illinois Office of Education instituy
una comisin para examinar los aspectos positivos y negativos de la eva
luacin de un programa de educacin especial a cargo de terceros. La
comisin recibi el encargo de estudiar la validez de la evaluacin, revisar
las recomendaciones contenidas en el informe y elaborar por escrito una
respuesta al informe original de evaluacin. La comisin estaba compuesta
por tres miembros del personal profesional de la Illinois Office of Edu
cation. Los evaluadores comparecieron ante la comisin para responder
a las preguntas suscitadas. Stenzel (1979) destaca los procedimientos de
las comisiones del Congreso, que difieren significativamente de los de un
juicio.
Hay muchos procedimientos cuasijudiciales que pueden aplicarse a la
evaluacin, de los que el jurado de certmenes y el juicio slo son los ms
conocidos. El objetivo de los procedimientos judiciales consiste en resolver
de uno u otro modo los problemas. La mayora de los procedimientos
judiciales se caracterizan por alguna forma de audiencia en la que se
presentan los argumentos en pro y en contra. La legitimidad de este enfoque
depende de la aceptacin que se dispense a los procedimientos empleados
en concreto, al instructor y al jurado o tribunal. En el mbito de la misma
administracin de justicia, la accin de los tribunales suele seguir los derro
teros marcados exclusivamente por los jueces.
El estudio de casos (o negociacin)
Este enfoque se centra en los mismos procesos del programa y en la
visin que las personas tienen de ste. La cuestin principal que se plantea
es: "qu les parece el programa a los sujetos que tienen contacto habitual
con l?. La metodologa usual consiste en llevar a cabo entrevistas con
muchas personas, hacer observaciones in situ y presentar los hallazgos en
forma de estudio de casos. El estudio cualitativo de casos prevalece hasta
tal punto en cuanto metodologa que, para referirme al enfoque, utilizo esta
misma expresin junto a la de "negociacin. Tambin podra llevarse a
cabo un estudio cuantitativo de casos, pero se apartara mucho de este
enfoque. El de estudio de casos-negociacin es casi completamente cuali
tativo por metodologa y presentacin. Quiz la denominacin de historia
de casos" fuera ms exacta
E! objetivo de este enfoque consiste en mejorar la comprensin que de
la evaluacin tenga el lector o destinatarios, mostrndoles, ante todo, cmo
perciben otros el programa sometido a evaluacin. Los procedimientos an
tropolgicos e, incluso, las herramientas periodsticas y novelsticas son
0 CdtMnm lontt, $ L
Los enf oques pri nci pales
4f
anlogos. La metodologa etnogrfica constituye un enfoque relacionado
con el que nos ocupa y es habitual calificar estas metodologas como
"naturalistas". Un personaje de cabecera es St ak e (1975,1978).
Este autor defiende as los estudios de casos:
Con frecuencia, los estudios de casos sern el mtodo preferible de investi
gacin porque estn en armona epistemolgica con la experi enci a del lector,
por lo que, para esa persona, constituirn una base natural para la general i zaci n-
Si los lectores de nuestros informes son las personas que puebl an nuestros
hogares, escuelas, gobiernos e industrias, y si tenemos que ayudarles a ent ender
los problemas y programas sociales, hemos de percibirlos y comuni carl os de
forma que se adapten a sus conocimientos actuales. En su mayora, esas perso
nas han adquirido sus conocimientos a travs de la experiencia directa y vi cari a
(St ak e, 1978, pg. 5.)
Cuando la meta de la investigacin es ms la comprensin que la
explicacin y el conocimiento preposicional, el estudio de casos es a menudo
superior a otras formas de investigacin. Es legtimo descubrir o validar
leyes por medio de muchos estudios acadmicos, pero el objetivo de las
artes prcticas es hacer cosas. Para Stake, los estudios de casos presentan
descripciones complejas, holsticas y que implican gran cantidad de varia
bles interactivas. Los datos se obtienen mediante la observacin personal y
la redaccin es informal, narrativa, empleando a menudo citas, ilustracio
nes, alusiones y metforas. Las comparaciones son ms implcitas que
explcitas.
El enfoque de Stake se centra en la percepcin y en el conocimiento
como proceso de negociacin, por lo que a veces se le denomina modelo
de negociacin. En la evaluacin responsiva *, el evaluador suele negociar
con el cliente sobre lo que ha de hacerse, y responde a lo que quieren
saber distintos destinatarios.
La evaluacin educativa es responsiva si se orienta de forma ms directa
hacia las actividades del programa que a sus intenciones, si responde a las
peticiones de informacin de los destinatarios y si se tienen en cuenta las
diferentes perspectivas de valor presentes al informar sobre el xito o el fracaso
del programa. Para hacer una evaluacin responsiva, el evaluador concibe un
plan de observaciones y negociaciones. Prepara la situacin de manera que
diversas personas observen el programa y, con su ayuda, elabora breves informes
narrativos, descripciones, exposiciones de resultados, grficos, etc. Pone de
manifiesto lo que sus destinatarios consideran valioso y recaba manifestaciones
de valor de Individuos cuyos puntos de vista difieran. Por supuesto, comprueba
* Aunque la traduccin de la pal abra inglesa ' responsive' no es, en sentido esmd&
responsi va , sino sensible (al contexto)", en este caso, esa "sensibi l idad'1se mareiesfca en
la di sposicin a adaptar la eval uaci n a lo que desean conocer diversos desnatenos d* **
misma, por lo que parece adecuado traducir el trmino como aparece en ei textor (H a T ;
COwcum Xindfc & l
- Eval uacin, tica v ^
H . . i , ! , - -------------------------------------------------1'"ir |
la calidad de sus anotaciones; hace que el personal que desarrolla el program,
reaccione respecto a la precisin de sus descripciones, y los destinatarios re^'
donan segn la importancia de sus hallazgos. Lleva a cabo la mayor parte de
estas operaciones de manera informal: repitindolas y anotando acciones v
reacciones. Escoge medios accesibles a sus destinatarios para aumentar
viabilidad y fidelidad de la comunicacin. Puede preparar, o no, un Informe f|na|
por escrito, dependiendo del acuerdo al que llegasen sus clientes y l.
(St ak e, 1975, pg. 141
Utilizando una metodologa antropolgica ms tradici onal , Smith y Poh.
l and (1974) evaluaron un programa de enseanza asistida por ordenador
en los Apalaches, y Wo l co t t (1977) evalu la instalacin de un sistema de
planificacin de programas y de presupuestos en una escuel a local. En
ambos casos, los evaluadores se basaron en la observaci n participante,
en especial por medio de notas de campo, entrevistas i nf ormales y anlisis
documental.
En Inglaterra, MacDonald (1974) defiende tambi n el enf oque de los
estudios de casos en lo que ha denominado eval uacin democrt i ca :
La evaluacin democrtica constituye un servicio de informacin a la comu
nidad sobre las caractersticas de un programa educativo. Reconoce el pluralismo
de valores y trata de representar un conjunto de intereses al formular los proble
mas. El valor bsico consiste en una ciudadana informada y su evaluador acta
como intermediario en los intercambios de informacin entre distintos grupos.
Sus tcnicas de recogida y presentacin de datos deben estar al alcance de
personas no especializadas. Su principal actividad consiste en recoger definiciones
del programa y reacciones frente a l. A los informadores, les garantiza la con
fidencialidad y les confiere el control sobre el uso que pueda hacer de la infor
macin. El informe carece de recomendaciones y el evaluador no es responsable
del empleo incorrecto de la informacin. El evaluador mantiene negociaciones
peridicas respecto a sus relaciones con los patrocinadores y los participantes
en el programa El criterio de xito es el mbito de destinatarios del proceso.
(MacDonal d, 1948, pgs. 226-227.)
Tambin en Inglaterra, Par l et t y Hami l t on (1977) def endan un enfoque
que denominaban evaluacin iluminadora". Su objetivo consi st e en estudiar
el programa' cmo opera, cmo influyen en l las si tuaciones en l as que se
aplica; qu ventajas e inconvenientes presenta para qui enes se ven direc
tamente afectados por l, y en qu aspectos de las t areas intelectuales y
experiencias acadmicas de los alumnos influye de modo especial. Aspira
a descubrir y documentar qu supone participar en el pl an, sea como
profesor o como alumno, y discernir y exponer, adems, las caractersti cas
ms significativas, las consecuencias y los procesos crticos de la i nnovacin
fP/ MLErr y Hami l t on, 1977, pg. 19).
Poco despus, Guba (1978), adoptando en lneas general es este mismo
entogue, trai d definir las dificultades a las que se enfrenta una e v a lu a c i n
Loe anf oquM pri nci pal es 43
naturalista". Tal como lo considera, el principal problema es el de la auten
ticidad: el establecimiento de las bases que permitan fiarse de los resulta
dos de la eval uacin. Otros problemas metodolgicos son el de fijar los
lmites de la investigacin y el de circunscribirse a las categoras en las que
puedan asimilarse y comprenderse los datos. Guba considera que la meto
dologa naturalista no slo describe el enfoque del estudio de casos, sino
tambin los modelos crtico y cuasijudicial.
Podemos comparar el enfoque del estudio de casos con el crtico, al
que se parece mucho. El crtico se basa en su propia experiencia y aplica
normas que escoge l mismo. Qui en emplea el estudio de casos se funda
tanto en las percepciones de otros como en las suyas, emitiendo sus j uicios
de valor sobre el programa. En algunos casos, ambos enfoques pueden
parecer muy semejantes.
El enfoque del estudio de casos, o de negociacin, de la evaluacin va
adquiriendo gran popularidad. Se estn llevando a cabo muchas evaluaciones
mediante estudio de casos (consideradas antes muy subjetivas) y existe
una bibliografa muy amplia sobre el tema. El enfoque del estudio de casos
resuelve el problema del evaluador procurando representar todas las posturas
significativas de valor en el estudio del caso de que se trate, extrayendo de
esas posturas sus criterios y normas, y dejando al lector del estudio que
sopese y equilbre estos elementos por su propia cuent a
Otros enfoques
He propuesto determinados enfoques, descritos y puestos en prctica
por muchos profesionales, como modelos principales de evaluacin. He
excluido otros por estar muy relacionados con estos tipos principales o ser
combi naci ones de los mismos. Los enfoques puros no tienen por qu ex
cluirse mutuamente. Est surgiendo un nuevo enfoque, debido a Ap p l e
(1979), Lundgren (1977), K a l l o s (1978), P au ls t o n (en prensa) y otros ms.
Aunque estos autores presentan diferencias sustanciales entre s, su enfoque
global consiste en asumir una postura terica que tiene en cuenta de forma
deliberada la sociedad. Consideran que sta se halla organi zada de mane
ra que produzca desigualdades de clase, y creen que la educacin propor
ciona los f undamentos ideolgicos de esta reproduccin social.
Hasta ahora, su trabajo ha consistido sobre todo en crticas de ios
enf oques de la evaluacin vigentes, ms que en formular un nuevo enfoque
basado en aqul fundamento terico. Muy pocas evaluaciones se han llevado
a cabo de acuerdo con este enfoque. Un estudio que se ha realizado
consiste en una investigacin a largo plazo de las convicci ones que han ido
surgiendo en los estudiantes en el transcurso de su f ormacin profesional
en la educacin superior sueca (Franke-Wikberg, 1979). Podemos suponer
que este enfoque de la eval uacin se centrar en las desigual dades en ei
contexto del programa sometido a val oracin. Si llega a desarroll arse este
4*
Eval uaci n, t i ca v p ^
enfoque, es probable que los supuestos a l subyacent es se caractericen
por ser no liberales, en claro contraste con los domi nant es en la actualidad
que hemos presentado antes.
Respecto a la clasificacin de las eval uaciones en ti pos idealizados
hemos de advertir, por ltimo, que tal clasificacin sl o ti ene un carcter <
aproximacin. Muchos evaluadores insistirn en que su enf oque concreto
es nico y no puede encuadrarse en ninguna de las ca t e gora s que he
expuesto. En cierto sentido, tienen razn. Los enf oques mencionados slo
son tipos idealizados, constructos utilizados para acl arar el pensamiento en
este campo. En cierto sentido, cada enfoque presenta caract eres exclusivos.
Por otra parte, creo que estos tipos bsicos dan cuent a de la inmensa
mayoria de las evaluaciones que se realizan en la act ual idad, y que pue
de defenderse con fuerza la clasificacin de los enf oques concretos utili
zados en la prctica en estas categoras general es. Est o no significa que
cada evaluacin adopte exactamente la forma propia de uno de estos ti
pos. Las evaluaciones reales estn configuradas por determinadas circuns
tancias y contingencias. Lo que, en ciertas circunst anci as, empieza como
una evaluacin por objetivos puede diferir mucho de ese tipo de evaluacin
en situaciones distintas. No obstante, es muy probabl e que, en la mayora
de los casos, una evaluacin por objetivos difiera mucho ms de otra que
siga el enfoque del estudio de casos. La prueba def initiva del esquema de
clasificacin estriba tanto en su validez como en su utilidad para comprender
la evaluacin. Alkjn y E lle t t (1979) y Alkin (1979) han manifestado un
punto de vista similar sobre el papel que desempean l os sistemas catego-
riales en la evaluacin.
CAPTULO III
Premi sas en l as que se basan l os enf oques
Liberalismo
Una manera de comprender la evaluacin consiste en comparar los
numerosos enfoques o modelos entre s (utilizo los trminos enfoques y
modelos como sinnimos). Hay muchas posibilidades de comparacin,
pero quiz las ms significativas sean las que se efectan entre las premisas
tericas en las que se fundan los enfoques. De este modo, podemos ver
hasta qu nivel son similares, desde el punto de vista lgico, y determinar
qu posibilidades lgicas tienen y cules no.
La cuestin fundamental es que todos los enfoques de evaluacin se
basan en variaciones de las premisas del liberalismo o, si se prefiere, en
las concepci ones de la democracia liberal. Los modelos difieren entre s
cuando cambian las premisas bsicas. En este contexto, entiendo el trmino
premisas segn el significado de sentido comn, en cuanto cosas que se
dan por supuestas o se toman como verdaderas.
En la primera columna de la taxonoma de la Figura 1 del Captulo II, se
citan los nombres corrientes de los enfoques. En la fila superior, apare
cen las dimensiones crticas de la comparacin: los destinatarios a quienes
se dirige la evaluacin, sobre qu aspectos existe acuerdo dentro del en
foque en cuestin, la metodologa de recogida de datos, los resultados
finales previstos y la cuestin caracterstica de la que se ocupa el enfoque.
En cierto nivel de abstraccin, stas son las premisas subyacentes al en
foque.
NOTA DEL AUTOR: Una versin de este capitulo apareci con el titulo: "Assumptions Un
derlying Evaluation Modes ", en: Educational Researcher, vol. 7, n. 3, marzo 1978, pgs. 4-12,
Copyright 1978: American Educational Research Association, Washington, D.C. Reimpreso con
autorizacin. Robert Enni s, David Hami l t on y Bruce St ewar t han aport ado sus valiosos co
mentarios.
41
Eval uaci n, tica y
En ta taxonoma, los modelos se relacionan entre s de forma sistemtica.
En general, a medida que se desciende por la columna de destinatarios
principales, son ms democrticos y menos elitistas. Si descendemos por
la columna del consenso, menor es el acuerdo sobre los objetivos y otros
etementos. En ta columna correspondiente a la metodologa, cuanto ms
abajo vayamos, ms subjetivista y menos objetivista ser la metodologa de
investigacin Descendiendo por la col umna de resultados, decrece la preo
cupacin general por la eficiencia social y aumenta la bsqueda de la com
prensin personal. En realidad, se trata de simplificaciones excesivas,, puesto
que el orden real es ms complejo.
Los etementos principales para comprender los enfoques son su tica,
su epistemologa y sus derivaciones polticas. Todos los modelos vigentes
se denvan de la filosofa del liberalismo y las diferencias existentes entre
ellos se deben a sus respectivas desviaciones de la corriente principal. No
pueden separarse por completo la tica, la epistemologa y la poltica.
El mismo liberalismo surgi del intento de racionalizar y justificar la so
ciedad de mercado (Macpher son, 1966), organizada sobre la base de la
libertad de eleccin. La eleccin sigue siendo una idea clave en los enfoques
de la evaluacin, aunque aparezcan diferencias en cuanto a quin elige,
qu elige y sobre qu base elige. El ideal ltimo es la eleccin del usuario,
pero difieren las concepciones sobre dicho usuario.
La segunda idea clave del liberalismo consiste en una psicologa in
dividualista Se presume que la existencia de cada mente individual es an
terior a la de la sociedad. En principio, no se piensa en el individuo como
parte de una colectividad mayor, aunque pueda incluirse ms adelante en
una de ellas, como en una situacin de contrato social. Respecto a sus
estructuras intelectuales, el liberalismo es profundamente individualista, desde
el punto de vista metodolgico.
Otra idea clave consiste en la orientacin empirista. Con f recuenci a,
el liberalismo es radicalmente empirista. Por ejemplo, John Stuart Mi l l , el
apstol del liberalismo, crea que incluso las matemticas tenan una ba
se inductiva. Todos los modelos de evaluacin muestran ese regusto empi
rista.
Los enfoques de la evaluacin asumen tambin un mercado l ibre de
ideas en el que los usuarios comprarn las mejores. Dan por supuest o
que la competencia entre las ideas fortalece la verdad. En ltimo extremo,
suponen que el saber har de alguna manera felices o mejores a las
personas. Por tanto, los enfoques de la evaluacin comparten las ideas
correspondientes a una sociedad mercantil, competitiva e individualista. Pero-
la idea ms fundamental es la de libertad de eleccin, porque, si falta, qu
utilidad tiene la evaluacin? La Figura 2 presenta los enfoques de eval uacin
relacionados con el liberalismo.
F
i
g
u
r
a
2
:
E
s
q
u
e
m
a
d
e
r
e
l
a
c
i
o
n
e
s
e
n
t
r
e
l
o
s
p
r
i
n
c
i
p
a
l
e
s
e
n
f
o
q
u
e
s
d
e
e
v
a
l
u
a
c
i
n
y
la
f
i
l
o
s
o
f
a
d
e
l
l
i
b
e
r
a
l
i
s
m
o
Premi sas en tas que se basan tos enf oques
47
J
u
s
t
i
c
i
a
c
o
m
o
e
q
u
i
d
a
d
Eval uacin, t i ca y pode
tica subjetivista
Todos tos modelos principales de evaluacin se basan en una tica
subjetivista aunque no sea necesario. Una clase de subj etivi smo tico con
sidera que el fin de la conducta tica es la realizacin de al gn tipo de
experiencia subjetiva. Se muestra ste en los cuatro enf oques que he de
nominado utilitarios". Hablando con propiedad, el utilitarismo se refiere a la
idea de elevar al mximo la felicidad en la sociedad. Toda activi dad que lo
consiga es correcta" y debe llevarse a cabo (House, 1976). Por regla
general, como indicadores de felicidad se utilizan medidas vi cari as, como el
producto nacional bruto en economa o las puntuaciones medi as de tests
en educacin.
Junto a los enfoques de anlisis de sistemas, objetivos conductual es y
de decisin, el modelo de Scriven, que prescinde de los objetivos, se
incluye tambin en esta clase. Todos estos enfoques tratan de ll egar a un
juicio nico de utilidad social general. El enfoque ms sencillo es la escala
homognea del enfoque del anlisis de sistemas, que trata de reduci r todas
las variables a un modelo cuantitativo, como el anlisis de regresin. Slo
se utilizan una o unas pocas variables de resultados.
El ms complejo (el de Scriven) considera muchas variables de resulta
dos, incluyendo efectos secundarios y terciarios. Hay que asi gnar pesos
distintos y combinar todas estas variables de manera que se integren en un
juicio sumativo global. Puede establecerse una analoga con un informe de
una asociacin de consumidores en el que se integran criterios muy diversos
para dar como resultado una clasificacin global de mejor y ptimo.
Como en el caso de la asociacin de consumidores, la clasificacin final
ser ordinaria y no de intervalos. Es utilitaria en el sentido de que el resaltado
final consiste en una clasificacin final de mritos, encabezada por la mejor
opcin para el usuario y, en ltimo trmino, de mxima utilidad social.
He denominado los otros cuatro modelos principales de evaluacin
intuicionistas-pluralistas". Los principios ticos no son nicos ni estn defi
nidos explcitamente como en la tica utilitaria. Hay varios principios sin
reglas para sopesarlos y esos principios se derivan de la intuicin y la
experiencia. Esto pone de relieve otro sentido del subjetivismo tico: los
criterios ltimos de lo que es bueno y correcto son sentimientos o aprecia
ciones individuales.
En el modelo de la critica de arte, el crtico llega a sus principios i nv aria
blemente plurales a travs de un largo perodo de preparacin y ex perie nci a.
Su gusto se ha perfeccionado tanto que es un j uez experto. G r a n p a rte de
su maestra se basa en su capacidad para equilibrar de modo intuitivo las
premisas de sus juicios. En el enfoque profesional, las premisas^ pue den
expresarse en libros como Evaluative Criteria (National Study of Secondary
School Evaluation, 1978), pero su origen y aplicacin siguen s i e n d o una
cuestin que tiene mucho de juicio intuitivo basado en una larga experiencia.
En el enfoque cuasijudicial, como en los juicios, el jurado tiene libertad
para utilizar mltiples criterios de manera intuitiva Los adversarios pueden
Premi sas en l as que se basan l os enf oques 49
introducir lo que gusten en calidad de evidencia que puede estructurarse
como pertinente. Por ltimo, en el enfoque del estudio de casos, se introducen
criterios plurales solicitando a diversas personas participantes en el programa
que emitan sus juicios respectivos. El evaluador y los destinatarios de la
evaluacin sopesan los datos de manera intuitiva. En general, los utilitaristas
suelen adoptar tcnicas definidas de forma explcita como base de la tica
y el saber, mientras que los intuicionistas-pluralistas asumen como f unda
mento de aqullos el saber intuitivo tcito que se deriva de la experiencia
profesional y la participacin.
Aunque todos los enfoques principales se basan en una tica subjetivista,
no tendra por qu ser as. En el marco de la filosofa liberal, podra darse
una tica objetivista. Por ejemplo, en su A Theory of J ustice, John Rawls
(1971) trat de fundamentar su tica social en dos principios de justicia
Esos principios no se justificaban sobre la base de que llevaran al mximo
un sentimiento subjetivo, como la felicidad, ni en el hecho de que las personas
sostuvieran intuitivamente tales principios. Las premisas se justificaban, en
cambio, sobre la base de que el anlisis racional, o sea, la teora de reducir
al mnimo las prdidas, llevara a cualquier persona racional hasta las mis
mas premisas. Eran objetivistas en el sentido de que se basaban en una
lgica pblica susceptible de revisin. La teora de Rawls seguira encua
drndose en la tradicin liberal de la libre eleccin y el individualismo me
todolgico.
El grupo utilitarista se diferencia internamente por su orientacin hacia
distintos destinatarios. Los enfoques de anlisis de sistemas, objetivos con-
ductuales y de decisin se orientan en gran medida a suministrar informacin
a los gestores o dirigentes. El enfoque que prescinde de los objetivos del
programa tiende ms hacia los usuarios. Esta distincin entre elite y masas
aparece tambin entre los intuicionistas-pluralistas. Los enfoques crticos
artstico y profesional se basan, para j uzgar el programa que se evala, en
profesionales expertos, mientras que los enfoques cuasijudicial y de estudio
de casos requieren la participacin de profesionales y pblico.
La epistemologa objetivista liberal
Los enfoques gerenciales, con su orientacin hacia la gestin, buscan la
manera de que la direccin pueda supervisar y perf eccionar los programas.
Las principales preocupaci ones de la direccin son la responsabilidad, la
eficiencia y el control de calidad. La eval uacin tiene una cierta funcin de
perro guardin. La escuel a gerencial suele basarse tambin en una episte
mologa comn, que he denominado objetivista". Se considera que la in
f ormacin de la eval uacin es "cientficamente obj et i vaEst a objetividao se
consigue utilizando instrumentos objetivos", como tests o cuestinanos. Se
supone que los resultados que producen estos instrumentos son reproduo
bles. Los datos se analizan por medio de tcnicas cuantitativas, que tambin
# Ct MMI MOMBk S.
Eval uaci n, ti ca v p0(Je|
son objetivas" en el sentido de que pueden verificarse mediante la revisin
lgica de (as mismas, con independencia de quien las emplee.
En su forma extrema, el objetivismo epistemolgico excluye por completo
lo no cuantitativo: lo que existe puede medirse. La reduccin a nmeros se
equipara a veces a la objetividad. En buena medida, los orgenes de este
empirismo y objetivismo extremos pueden encontrarse en la primitiva epis.
tecnologa de la filosofa liberal.
En parte, podemos situar los orgenes del liberalismo como filosofa en
el primer gran empirista britnico: Thomas Hobbes. Este autor e ra un admi-
rador de Gauleo y de su visin mecnica global del universo. Hobbes
elabor una filosofa mecanicista de la mente, basada en la dea de que las
sensaciones se producen en la mente a causa de los movimientos de
cuerpos externos. Las palabras slo tienen significado cuando se asocian
con estas sensaciones y la verdad consiste en el correcto ordenamiento
de nombres y sensaciones. Las definiciones claras son fundamentales. El
razonamiento equivale al clculo y slo ser correcto cuando los signos se
vinculen con imgenes coherentes. Causa y efecto constituyen un reflejo
directo del mundo. Por tanto, el camino hacia la verdad pasa por la definicin
clara y el mtodo cientfico.
Locke, Berkeley y Hume, a su vez, reformularon esta epistemologa.
Doscientos aos despus, apareci el ltimo de los grandes empiristas
britnicos: John Stuart Mi l l , llamado tambin el apstol del liberalismo.
Segn Mi l l , la mente es un manojo de impresiones. Las leyes psicolgicas
de la asociacin constituiran el fundamento de la ciencia de la sociedad.
Todo proviene de la experiencia y ha de ser comprobado mediante sta,
hasta el punto de que incluso la lgica deductiva (las matemticas, por
ejemplo) tiene una base inductiva. Mi l l no vea ninguna diferencia funda
mental entre las verdades lgicas y las verdades basadas en hechos. ^Pen
saba que todo el conocimiento tena que fundamentarse en la experiencia y i
comprobarse mediante sta. El saber consista en la suma de las observa
ciones individuales.
Este individualismo metodolgico extremo llegaba hasta lo ms profundo
de la filosofa de Mi l l . Segn l, la sociedad era una coleccin de personas
individuales unidas por intereses comunes. Su empirismo radical 1$ llev a
formular reglas para el desarrollo de la investigacin inductiva en MSystem
of Logic. Como la mente consista en sensaciones, sentimientos y sus
asociaciones, para Mi l l , las categoras del mundo real eran lbilmente
accesibles. Pero, en qu se basaban estas categoras? Si fuesen efmeras,
nada podramos conocer. Para solucionar este problema, M i l l dio por su
puesto que el mundo consista en uniformidades constantes entre clases de
sensaciones.
La experimentacin era esencial para la comprobacin cientfica de l as
teoras. Las conexiones causales vlidas slo podan establecerse medi ant e
el meticuloso ordenamiento y la variacin ifidpendiente de las condi ci ones
antecedentes y las consecuencias. Con frecuencia, stas quedaban ocul t as
a la observacin casual. Las apariencias sin depurar resultaban engaosas.
# CdKHmMwsBa. $. L.
145758
Premi sas en les que se besen l os enf oques
Slo las tcnicas de la lgica inductiva podan purificarlas. En este contexto,
eran tiles las tcnicas como el mtodo del acuerdo, el de la diferencia o el
de la variacin concomitante. Los cnones de la induccin proporcionaban
un mtodo para filtrar la evidencia de las correlaciones en las que se
basaban las leyes cientficas.
Se trataba de llegar a leyes cientficas. La ciencia debia ocuparse de las
uniformidades causales que afectaran a todos los elementos pertenecien
tes a una clase dada. La clave de la que dependa todo el sistema lgico
de Mil l era el supuesto de la uniformidad de la naturaleza. Con palabras de
este autor:
En pri mer lugar, t enemos que observar que, en el mi smo enunci ado de lo
que es la i nducci n, hay una premi sa bsica; un supuest o previ o en rel aci n
con el decurso de la nat uraleza y el orden del uni verso: en la nat uraleza existen
casos paralelos, de modo que lo que sucede una vez, si se da un grado suficiente
de ci rcunst anci as semej ant es, ocurri r de nuevo, y no sl o otra vez, si no tantas
veces cuant as vuel van a concurri r las mi smas ci rcunst anci as... V si observamos
el curso real de l a nat ural eza, veremos que la premi sa es ci erta. El uni verso, en
la medi da en que lo conocemos, est constitui do de tal manera que lo que es
ci erto en un caso, lo es en t odos los casos de una mi sma cl ase; la ni ca
dif icultad est en descubri r de qu clase se trata.
(Mil l , 1893.)
Este empirismo extremo se basaba en el convencimiento de que no era
difcil descubrir las categoras, como en el caso de las categoras de las
ciencias fsicas. Utilizando las tcnicas adecuadas, podran definirse las
variables y establecer las relaciones entre ellas. Como la naturaleza serla
uniforme, podramos inducir las leyes de las ciencias sociales, del mismo
modo que en las ciencias naturales. Es ms, esto podra llevarse a cabo
mediante la metodologa de encuesta. La evaluacin ha heredado ese ex
tremo inters por el empirismo en la exclusin de la teora a partir de la
epistemologa liberal: en la naturaleza, podemos descubrir relaciones sin
necesidad de constructos tericos.
Hami l t on (1977) estudia la aparicin de algunas de estas ideas en la
evaluacin. Un contemporneo de Mi l l , Francis Ga l t o n , cre tcnicas co
rrelacinales para establecer las conexiones entre las categoras que, segn
Mi l l , eran fcilmente apreciables. Ga l t o n proporcion tambin un importante
f undamento para la psicometra en su obra sobre las diferencias individuales.
Ca t t e l l , muy influido por Ga l t o n , introdujo los tests mentales en los Estados
Unidos.
El uso de los tests en educacin con fines de clasificacin fue promovido
por E. L. Thor ndi k e. Este autor tuvo tambin gran influencia en el movimiento
de gestin Cientfica de la educacin. Dicho movimiento introdujo en las
escuelas la ingeniera de la eficiencia. Los tests, las escalas de clasificacin
y las tcnicas cuantitativas estimuladas por los trabajos de Thohnoke se
^ ---------- I_Wder
utilizaron como instrumentos para lograr la eficiencia de las escuela
(Caiuhan, 1962). ' I s
Al hacer hincapi en el anlisis de tareas, la especificacin previa
muchos otros aspectos, la gestin cientfica presenta un importante pareci
con los enfoques del anlisis de sistemas y de los objetivos conducales
de la evaluacin (House, 1978). De hecho, uno de los principales def enso
res de la gestin cientfica de la educacin fue Franklin Bobbitt. Ms tarde
Bobsitt y Cmarters adoptaron un enfoque de anlisis de tarea y especifj
cacin de la misma en relacin con el desarrollo curricular. Uno de |0
alumnos posgraduados de Char t er s fue Ralph Ty l e r , creador del modelo
de evaluacin por objetivos conductuales. La orientacin gerencial de la
evaluacin tiene profundas races histricas.
Con independencia de sus conexiones histricas, la semejanza entre
los modelos gerenciales de evaluacin y la epistemologa de M i l l es grande.
Quiz sea Alice M. Rivun la principal exponente del enfoque del anlisis de
sistemas. Perteneca al grupo que introdujo el anlisis coste/producto en la
educacin y en otros programas sociales en el Department of Health, Edu
caron and Welfare en los aos sesenta. La mayor parte de los ms amplios
programas federales de evaluacin se basaron en la lgica del anlisis de
sistemas (McLaughlin, 1975).
Las ideas clave del enfoque de Rivun ( 1971) eran las siguientes (Hou
se, 1978):
Las decisiones clave deben tomarse en los niveles gubernamentales
superiores.
El fin de la evaluacin es la eficiencia en la produccin de servicios
sociales.
El nico conocimiento verdadero consiste en una funcin de produc
cin que especifique relaciones estables entre inputs y outputs edu
cativos.
Slo puede conseguirse ese conocimiento mediante los mtodos
experimentales y las tcnicas estadsticas.
Es posible lograr el acuerdo sobre los objetivos y sobre unas pocas
medidas de resultados.
Existe un paralelismo directo entre la produccin de servicios sociales
y la de artculos manufacturados. Se aplican las mismas tcnicas de
anlisis.
Como Mill, Rivun da por supuesto que el paradigma de las ciencias
fsicas es adecuado para estos menesteres. Consideraba que las misn1^
tcnicas de investigacin servan para los servicios sociales y para la fa
cacin de productos. El resultado sera unas generalizaciones (funcin
de produccin, en este caso) vlidas en diversas circunstancias, sie^P
que pudiesen determinarse stas. Esta concepci n mecanicista se re,1l0L
hasta Hobbes. Y las premisas de la uniformidad de la naturaleza nos_
van hasta J. S. Mill. Los resultados seran consistentes en cualquier P
41 .
# EdttwwMoral*, f. '
Premi sas en las que se basan los enfoques
53
Ri vl i n crea, como t ambi n Mi l l , que hacan falta muest ras grandes para
evi t ar l os aspect os i diosi ncrsi cos.
Mi l l pensaba que el pri ncipal probl ema moral era la i lustracin y que tos
hombres resul t aban engaados por sus i nsti tuci ones. Ri vun crea que el
pri nci pal probl ema era la i gnoranci a respect o a cmo produci r servi ci os
soci al es de manera ms ef i caz. Ambos estaban convenci dos de que el
empl eo de expert os el i mi nara esos probl emas. Asi mi smo, ambos crean en
la ut i l i zaci n de unas cuant as medi das como sustitutos de la f eli ci dad. Esas
medi das son necesari as para los cl cul os preci sos para el f unci onami ent o
de la t i ca utilitaria.
No obst ant e, hay un aspect o en el que el liberal cl si co J. S. Mi l l y un
l i beral moderno se di st anci an. Para Mi l l , la libertad era necesari a para que
se produj era la i l ust racin. Fue uno de l os grandes def ensores del laissez-
faire. El gobi erno deba apart arse de los asunt os de los i ndi vi duos. Segn
Ri vl i n, una l i beral del est ado del bi enest ar, el gobi erno t endra que t omar las
deci si ones y ponerl as en prct i ca. Con el fin de descubri r lo que f unci o
na, el gobi erno necesi t a mayor cont rol para poder desarrol l ar experi ment os.
A excepci n de campos especi al es, como el de la educaci n, en el que
acept aba la pl ani f i caci n y la coerci n, i ncl uso, Mi l l no est aba a f avor de
l a pl ani f i caci n soci al a gran escal a. Ri vl i n const i tuye el eptome de di cha
pl ani f i caci n.
El obj et i vi smo de l os enf oques gerenci al es de la eval uaci n, que t i ende
a equi parar la obj et i vi dad con la cuanti f i caci n, se basa en el acuerdo
i nt ersubj et i vo como i ndi cador excl usi vo de obj et i vi dad. Scri ven (1972) lo
l l ama sent i do cuanti tati vo de la obj eti vidad . La percepci n que una persona
t i ene de al go se consi dera subj et i va: es la di sposi ci n de un i ndi vi duo. Lo
obj et i vo est consti tui do por lo que experi ment a un conj unto de observadores.
La experi enci a comn hace pbl i ca la observaci n medi ant e el acuerdo
i nt ersubj et i vo.
Ha l l egado a equi pararse la obj eti vi dad con la ext eri ori zaci n de t odas
l as ref erenci as, de manera que se l l egue a un test i moni o mlti ple, dado que,
segn la doct ri na de la i nt ersubj eti vi dad, no es acept abl e lo que no puedan
experi ment ar ot ros de f orma di recta. Por tanto, con f recuenci a, se equi para
la obj et i vi dad con l a posi bi l i dad de especi f i car y expl i car por compl et o t odos
l os procedi mi ent os de recogi da de dat os. La total ext eri ori zaci n permi t e la
rpl i ca, l a pi edra de t oque de la f i abi l idad.
Descri bi endo l os procedi mi ent os de anl i si s de si st emas, el Department
of Defense pl ant ea de est e modo l a cuest i n:
Qui z el ms importante de ellos sea el mtodo cientfico. Esto significa que
los datos utilizados en el anlisis deben ser susceptibles de verificacin, bien
mediante observaci n, bien por deducci n a partir de premi sas aceptables, y
que los procedimientos empleados en el anlisis deben ajustarse a las regias
aceptadas de la lgica. El anlisis de sistemas se caracteriza, en segundo tugar,
por el uso de datos cuantificables y tcnicas matemticas... El comn denomnactor
final del anlisis de sistemas es la claridad. Las premisas y criterios utthzactos m
$ CdieiotmMchHl i L
a
utilizaron como instrumentos para lograr la eficiencia de las escuela
(Cal l ahan, 1962).
Al hacer hincapi en el anlisis de tareas, la especificacin previa m
muchos otros aspectos, la gestin cientfica presenta un importante parecido
con los enfoques del anlisis de sistemas y de los objetivos conduct ual es
de la evaluacin (House, 1978). De hecho, uno de los principales defenso-
res de la gestin cientfica de la educacin fue Franklin Bo b b it t . Ms tarde
Bobbit t y Char t er s adoptaron un enfoque de anlisis de tarea y especifj'
cacin de la misma en relacin con el desarrollo curricular. Uno de |0
alumnos posgraduados de Cha r t er s fue Ralph Ty l e r , creador del modelo
de evaluacin por objetivos conductuales. La orientacin gerenci al de la
evaluacin tiene profundas races histricas.
Con independencia de sus conexiones histricas, la semejanza entre
los modelos gerenciales de evaluacin y la epistemologa de Mil l es grande.
Quiz sea Alice M. Rivun la principal exponente del enfoque del anlisis de
sistemas. Perteneca al grupo que introdujo el anlisis coste/ producto en la
educacin y en otros programas sociales en el Department of Health, Edu-
cation and Welfare en los aos sesenta. La mayor parte de los ms amplios
programas federales de evaluacin se basaron en la lgica del anlisis de
sistemas (Mc Laughl in, 1975).
Las ideas clave del enfoque de Ri vun (1971) eran l as siguientes (Hou
se, 1978):
Las decisiones clave deben tomarse en los niveles gubernamentales
superiores.
El fin de la evaluacin es la eficiencia en la produccin de servicios
sociales.
El nico conocimiento verdadero consiste en una funcin de produc
cin que especifique relaciones estables entre inputs y outputs edu
cativos.
Slo puede conseguirse ese conocimiento mediante los mtodos
experimentales y las tcnicas estadsticas.
Es posible lograr el acuerdo sobre los objetivos y sobre unas pocas
medidas de resultados.
Existe un paralelismo directo entre la produccin de servicios sociales
y la de artculos manufacturados. Se aplican las mismas tcnicas o
anlisis.
Como Mill, Rivun da por supuesto que el paradigma de l as ciencias
fsicas es adecuado para estos menesteres. Consideraba que l as
tcnicas de investigacin servan para los servicios sociales y para la ja
cacin de productos. El resultado sera unas generalizaciones (tune1 e
de produccin, en este caso) vlidas en diversas circunstancias, sl0pta
que pudiesen determinarse stas. Esta concepcin mecanicista se rem ^
hasta Ho bbes . Y las premisas de la uniformidad de la nat ur al eza1no e
van hasta J. S. Mill. Los resultados seran consistentes en cual qui er P
6 f&eiPMi Moteta, I ,L
Premi sas en las que se basan los enfoques
53
Ri v l i n crea, como t ambi n Mi l l , que hacan f al t a muest ras gr andes para
evi t ar l os aspect os i di osi ncrsi cos.
M i l l pensaba que el pri nci pal probl ema moral era la i l ust raci n y que l os
hombres resul t aban engaados por sus i nsti t uci ones. Ri vl i n crea que el
pri nci pal probl ema era la i gnoranci a respect o a cmo produci r servi ci os
soci al es de manera ms ef i caz. Ambos est aban convenci dos de que el
empl eo de expert os el i mi nara esos probl emas. Asi mi smo, ambos crean en
la ut i l i zaci n de unas cuant as medi das como sust i tutos de la f el i ci dad. Esas
medi das son necesari as para l os cl cul os preci sos para el f unci onami ent o
de la t i ca utilitaria.
No obst ant e, hay un aspect o en el que el l i beral cl si co J. S. M i l l y un
l i beral moderno se di st anci an. Para Mi l l , la l i bert ad era necesari a para que
se produj era la i l ust raci n. Fue uno de l os grandes def ensores del laissez-
faire. El gobi erno deba apart arse de l os asunt os de l os i ndi vi duos. Segn
Ri vl i n, una li beral del est ado del bi enest ar, el gobi erno t endra que t omar l as
deci si ones y ponerl as en prct i ca. Con el fin de descubri r lo que f unci o
na, el gobi erno necesi t a mayor cont rol para poder desarrol l ar experi ment os.
A excepci n de campos especi al es, como el de l a educaci n, en el que
acept aba la pl ani f i caci n y la coerci n, i ncl uso, M i l l no est aba a f avor de
l a pl ani f i caci n soci al a gran escal a. Ri vl i n const i t uye el ept ome de di cha
pl ani f i caci n.
El obj et i vi smo de l os enf oques gerenci al es de l a eval uaci n, que t i ende
a equi parar la obj et i vi dad con la cuant i f i caci n, se basa en el acuerdo
i nt ersubj et i vo como i ndi cador excl usi vo de obj et i vi dad. Scr i ven (1972) lo
l l ama sent i do cuanti tat i vo de la obj et i vi dad . La percepci n que una persona
t i ene de al go se consi dera subj et i va: es l a di sposi ci n de un i ndi vi duo. Lo
obj et i vo est const it ui do por lo que experi ment a un conj unt o de observadores.
La experi enci a comn hace pbl i ca l a observaci n medi ant e el acuerdo
i nt ersubj et i vo.
Ha l l egado a equi pararse la obj et i vi dad con la ext eri ori zaci n de t odas
l as ref erenci as, de manera que se l l egue a un t est i moni o ml ti ple, dado que,
segn l a doct ri na de la i nt ersubj et i vi dad, no es acept abl e lo que no puedan
experi ment ar ot ros de f orma di rect a. Por t anto, con f recuenci a, se equi para
l a obj et i vi dad con l a posi bi l i dad de especi f i car y expl i car por compl et o t odos
l os procedi mi ent os de recogi da de dat os. La total ext eri ori zaci n permi t e la
rpl i ca, la pi edra de t oque de la f iabi l idad.
Descri bi endo l os procedi mi ent os de anl i si s de si st emas, el Department
of Defense pl ant ea de est e modo l a cuest i n:
Qui z el ms importante de ellos sea el mtodo cientfico. Esto signif ica que
los datos utilizados en el anlisis deben ser susceptibles de verif icacin, bien
mediante observaci n, bien por deducci n a partir de premi sas aceptables, y
que los procedimientos empleados en el anlisis deben aj ustarse a las recias
aceptadas de la lgica. El anlisis de sistemas se caracteriza, en segundo lugar,
por el uso de datos cuantificables y tcnicas matemticas... El comn enomrator
final del anlisis de sistemas es la claridad. Las premi sas y criterios utilizados en
CdMon MONMk S. L.
54 Evaluacin, t i ca
' ' -----iPgger
un anlisis se especifican y los aspectos i nconmensurabl es y l as reas d
incertidutnbre se delimitan con todo cuidado. r e
( S N Y D E R , 1 9 6 7 , P g . 5 j I
De acuerdo con este razonami ento, se asi gna la mxi ma pri ori dad a ios I
"instrumentos fiables". En realidad, cuant o mayor sea el acuer do entre i
observadores (coeficiente de fiabilidad), mej or parecer el i nst rument o o I
procedimiento. Por desgraci a, la fiabilidad no garant i za l a val i dez y l a f alacia I
intersubjetiva puede llevar a utilizar "i nst rument os con l os que se l ogra un I
alto grado de acuerdo entre observadores en perj ui ci o de procedi mi ent os 1
de superior validez. Los instrumentos de el evada f i abi l i dad const i t uyen los I
hitos de este objetivismo epi stemolgi co.
En cierto sentido, el principio de veri f icaci n i nt ersubj et i va se t rasl ada a I
la definicin de los objetivos, as como a la medi da de l os ef ect os. En el I
enfoque gerencial de la eval uacin, se supone que es posi bl e l l egar al I
consenso sobre los objetivos de un proyect o concret o. Est e supuest o es I
fundamental en los model os de anlisis de si st emas y de obj et i vos conduc- I
tuales, porque el consenso def ine lo que buscar la eval uaci n. Adems, el I
modelo de anlisis de si stemas da t ambi n por supuest o el acuer do sobre ]
las relaciones entre causa y efecto. Mi l l presupona que l a causa y el I
efecto son evidentes y di scerni bl es por nat ural eza.
Por tanto, en el objetivismo, la nocin de obj et i vi dad se equi par a con los I
procedimientos para determinar la i ntersubj eti vi dad. Est o se pr oduce tanto 1
en la tica como en la epi stemologa. En real i dad, el ut i l i t ari smo [requiere I
que haya una norma ni ca de utilidad soci al con l a que comparar las 1
cosas.
Aunque he situado la eval uaci n i ndependi ent e de l os obj et i vos de I
Scri ven en el grupo utilitarista, sta es al go ms compl ej a. Scr i ven emplea 1
la idea cualitativa de objetividad. En est e caso, st a se equi para con la I
ausencia de sesgos y def ormaci ones. La preocupaci n suprema de S c r i v e n I
consiste en el control de los sesgos. Puede uti l i zar el di seo experimen-
tal, como el grupo gerencial , pero ha el aborado t odo un arsenal de disposi- 1
tivos organizati vos y social es para control ar l as desvi aci ones tendenciosas
en su sentido ms ampli o (Scri ven, 1 9 7 5 , 1 9 7 6 ) .
En el marco de Sc r i v en , es posi bl e que un ni co observador, sin el 1
auxilio de instrumento psi comtrico alguno, sea ms obj et i vo que un bata-
lln de observadores cargado de i nst rument os f i abl es, si empre q u e el ob- j
servador ni co busque lo que debe buscar y est lo bast ant e pr ot egi do
contra numerosos sesgos. Sc r i v en no equi para l a obj et i vi dad al a c u e r d o i n - 1
tersubjetivo.
Tampoco hace suyo el consenso respect o a met as y obj et i vos, como
pone de manifiesto de manera espect acul ar el enf oque i ndependi ent e de
objetivos. Es probable que la eval uaci n i ndependi ent e de obj et i vos requ'era
el acuerdo sobre las consecuenci as del programa. (De nuevo, se refie,e
ms a la eleccin del usuari o que a la del di rect i vo.) Sc r i v e n f eombna
& EAaonM Mor ata, S. L
Premi sas en las que se basan los enfoques
6
ml t i pl es cri t eri os de consecuenci as con l a escal a ordi nal y un enf oque
comparat i vo i mpl acabl e.
La epistemologa subjetivista
La eval uaci n uti litari sta se basa, por tant o, en una t i ca subj et i vi sta, de
manera que el eve al mxi mo un est ado ment al , como es l a sat i sf acci n;
pero, para hacerl o, empl ea una epi st emol oga obj et i vi sta. Cuando se ha
det ermi nado lo que debe promoverse al mxi mo, l a met odol oga puede
ut i l i zarse de f orma obj et i vi st a para asi gnar recursos que sat i sf agan di versos
deseos.
Los enf oques i nt ui ci oni st as-pl ural i st as de l a eval uaci n empl ean una
t i ca subj et i vi st a de cl ase di f erente. En general , t ambi n su met odol oga de
i nvest i gaci n suel e ser subj et i vi st a. Los procedi mi ent os medi ant e l os cual es
un crt i co educat i vo o un equi po de acredi t aci n l l eva a cabo su i nvest i gaci n
son ms general es que especf i cos. La cl ari dad de detal l es y la ext eri ori zaci n
de l os procedi mi ent os, de manera que ot ros puedan observar lo mi smo, no
son denomi nadores comunes. Tampoco la posi bi l i dad de reproducci n es
el cri t eri o pri nci pal .
Del mi smo modo, en l os enf oques cuasi j udi ci al y de est udi o de casos,
no se especi f i ca del t odo cmo l l ega un j urado a una deci si n ni por qu un
est udi oso de casos escoge ci ert os mat eri al es y no otros. El modo en que el
aut or cl ave desarrol l a su i nvent i gaci n se di st i ngue por una subj et i vi dad
i mport ant e.
Mi ent ras l os obj et i vi st as se f undan en la cl ari dad de det al l es para def ini r
t cni cas que puedan ut i l izar ot ros, l os i nt ui ci oni st as se basan en l a prepara
ci n y l a experi enci a para garant i zar el descubri mi ent o de l a verdad. En
est os enf oques, l l evados al ext remo, t ant o la val i dez como la ut i li dad se
def i nen de manera subj et i va. La val i dez se conci be en rel aci n con l os
condi ci onami ent os de l a ment e humana, bi en a causa de l as l i mi t aci ones
uni versal es que pesan sobre la f orma de pensar de l as personas, bi en a
causa de l i mi t aci ones personal es. (A menudo, en el marco obj et i vi st a, se
conci be l a val i dez como la previ si n de una cat egora observabl e a parti r
de otra.)
La val i dez subj et i va si gni f i ca que la verdad depende de l a nat ural eza
humana y, qui z i ncl uso, de l os humanos concret os. Lo que es vl i do para
uno, puede no serl o para ot ro. De i gual modo, l a ut il idad subj et i va de al go
se basa en el j ui ci o y en l os deseos personal es. Cada persona es el mej or
j uez de l os hechos para s mi sma.
En real i dad, la epi st emol oga subj et i vi st a no es t an anrqui ca como parece.
Mi ent ras que l a post ura obj et i vi st a se basa en la ext eri ori zaci n y pl ena es
peci f i caci n de l as t cni cas, l a post ura subj et i vi st a se f unda en la t radi ci n
del caso cerrado . Medi ant e l a preparaci n, l a experi enci a y l a soci al i zaci n,
el eval uador i ncorpora precedent es a sus j ui ci os. La j ust i ci a const i t uye el
ej empl o ms obvi o de un conj unt o de casos que ori ent an el j ui ci o.
Ediciones Moris. i.
A t e subjeftwstas tes npocta menos llegar a una proposicin verdadera
ten eJsenado de generafczabte) que relacionar la eval uacin con la expe~
nenoa concreta de los destinatarios. Tratan de conseguir una perspectiva
v>>ca eft p marco de referencia del grupo para el que trabajan. Se da por
supuesta la distancia entre el lenguaje y la experiencia. El eval uador busca
ms el conocimiento tcito que el explcito. La eval uacin est intenciona,
tmente togada al contexto y sus descubrimientos se interpretan dentro de:
mismo. Como los descaanos pueden tener una captacin ms Jndamen-
ada del contexto, basados en su mayor experiencia, la interpretacin que
eAos hagan de un acontecimiento puede ser superior a la del evaluador, a
los evaluadores subjelivistas les preocupan ms en su trabajo los enunciados
causales especficos (validez interna) que los enunciados causales generales
(validez extema) (Ennis, 1973). Las generalizaciones quedan para los desti
natarios
La metodologa subjetivista suele ser naturalista. Aspira a la generalizacin
naturalista (basada en la experiencia de los destinatarios); se dirige ms a
destinatarios no tcnicos, como profesores y pblico en general; utiliza el
lenguaje ordinano y categoras cotidianas de acontecimientos, y se basa
ms en la lgica informal que en la formal. Los instrumentos preferidos para
recoger datos son las entrevistas y observaciones informales. Con frecuencia,
sus trabajos se ponen por escrito a modo de estudios de casos.
El evaluador procura recoger mltiples perspectivas, aunque no con-
cuerden entre s. Asimismo, tienen gran relieve la investigacin histrica y
el seguimiento de los hechos en el transcurso del tiempo. El modo histrico
de investigacin es ms adecuado que el de las ciencias naturales. Se
hace ms hincapi en lo cualitativo que en lo cuantitativo.
En la metodologa subjetivista, la utilidad se plantea en trminos de los
intereses del observador. La teora y la prctica se mezclan. El objetivo
consiste en mejorar la comprensin de individuos particulares. En el enfoque
objetivista. se da una separacin rgida entre el observador y los hechos
(una teora muy abstracta separada de la aplicacin). Su objetivo es la
previsin.
La tcnica del caso cerrado y el uso de los precedentes proporci onan
estabilidad a los juicios que se derivan de la epistemologa subjetivista. En
realidad, en estos enfoques de evaluacin, tiene tanto peso la tradicin qu
se pueden criticar por eso mismo. Ocurre esto porque los enf oques subjej1'
vistas se basan en gran medida en el juicio del profesional que, a su v02, ^
funda en la experiencia de la clase. Los modelos subjetivistas consi deran
educacin y la enseanza como un arte, ms que como un conj unt o j
tcnicas explcitas y exteriorizadas.
El enfoque de estudio de casos de la evaluacin se centra en los lieCV I
que se producen dentro y alrededor del programa concreto en con10 I
Se basa en la percepcin y en el conocimiento como proceso I
4or En una versin de la psicologa transaccional, la percepci n l111111' ,/, I
fJepende de tres caractersticas (It t e l s o n y C a n t r i l , 1954). En prime' j oS I
fA hechoe de la percepcin se presentan siempre mediante* lnd|V/l
Pl f KMMt W I M QWWM bMUl t ol t rt QQUM
concret os que se desenvuelven en situaciones concret as Po tant o, sol o
pueden estudiarse las percepci ones a travs de (as t ransacci ones concret a*
en las que pueden observarse. Ni las percepciones ni el obj et o perci bi do
existen con independencia de una situacin vi t al La situacin es una tran
saccin, Todas las parles que intervienen en la situacin se incluyen en la
transaccin como participantes activos '. Las partes deben su exi st enci a a
esta participacin activa y no aparecen como entidades independientes
preexistentes. En consecuencia, la participacin activa constituye una idea
clave.
En segundo tugar, la percepcin siempre es de una peisona particular,
desde su propia postura, expenencias y necesidades nicas Hay tantos
puntos de vista como participantes. Incluso los cientficos observadores
entran en la situacin como participantes. Ellos influyen en la situacin y, a
su vez, son influidos por ella. Por tanto, el punto de vista del cientfico
observador slo es uno entre muchos. Forma parte de la transaccin
Tercero, cada persona crea su propio ambiente psicolgico, atribuyendo
aspectos de su experiencia al ambiente. Cree que el ambiente oxiste con
independencia de su experiencia. En otras palabras, exterioriza su expe
riencia. En consecuencia, el mundo, tal como se experimenta, es el producto
de la percepcin y no su causa.
Estas premisas respecto a la percepcin difieren por completo de las de
J. S. Milu y Ho b b es . Desde el punto de vista mecanicista hobbesiano. el
ambiente acta sobre el organismo para producir la percepcin. En la pera-
pectiva transaccional, ste tambin opera en el ambiente de forma activa,
por lo que la percepcin es producto de ambos. Las categoras no se dis
tinguen con facilidad del ambiente porque estn inextricablemente mezcladas
con las propias percepciones.
Desde el punto de vista hobbesiano-milliano, el mundo se toma como
dado. La uniformidad mecanicista de la naturaleza lo garantiza. Las percep
ciones pueden aislarse y estudiarse. Un cientfico puede comunicar enun
ciados a otro cientfico, que son reduclbles a lo que el otro experimental a si
hace determinadas cosas (el punto de vista operacional). En la perspectiva
transaccional, la fiabilidad no se consigue con tanta facilidad, Lo que uno
observa es funcin de la posicin y experiencia nicas de cada obseivador
e, Incluso, de sus fines. Las percepciones slo pueden estudiarse en situa
ciones concretas de la vida real.
No todos los defensores de los enfoques de estudio de casos de la
evaluacin suscribiran todos estos presupuestos, pero esta descripcin
presenta el punto de vista transaccional como Interaccin dialctica entre
las personas y su ambiente que se traduce en percepciones Las percep
ciones individuales constituyen un centro de atencin que estudiar y la
participacin activa es esencial para el conocimiento.
^ a |uaci6n1ticayp^er
Premisas polticas de los modelos: los utilitaristas
El liberalismo no slo es una teora tica y epi stemolgica, si no tambin
una teora profundamente poltica. Como sealamos antes, aunque RiVl i n n
los liberales modernos aceptan la tica utilitaria y el empi ri smo extremo de
J. S. Mi l i , difieren espectacularmente de su postura respect o al papel que
haya de desempear el gobierno en cuanto a las deci si ones y a la iniciati
va de accin. El liberalismo de bienestar de Ri vl i n sost i ene que el gobier
no debe tomar las principales decisiones, mientras que M i l l era el campen
del laissez-faire, de mantener al gobierno lo ms apart ado posible de las
decisiones. En este sentido, los intuicionistas estn ms cerca del liberalismo
clsico que los utilitaristas.
Segn Mi l l , la ilustracin era necesaria para la f eli cidad y la libertad. La
ausencia de interferencia del gobierno era necesari a para la ilustracin.
Segn Rivlin, la ilustracin se producir a travs de la i nvest i gacin patroci
nada por el gobierno y, sobre la base de estos conoci mi ent os, el gobierno
emprender los pasos necesarios para paliar los probl emas. En ambos
casos, el saber har felices a los hombres.
Segn Mi l l , hay dos esferas distintas de acti vi dades: int erna y externa.
La interna abarca la mente, el cuerpo y las acci ones pri vadas del propio
individuo. En la esfera interna, el gobierno no ti ene absol ut ament e ningn
derecho a interferir en nada. El individuo podra ent ret enerse o abusar de s
mismo cuando se tratase de cuestiones que sl o le af ect aran a l (Wo l f f ,
1968). El mbito de actuacin del gobierno se limita sl o a lo que concierne
a terceros: la esfera extema.
Incluso en la esfera extema en la estructura de Mi l l , slo se Justifica la
interferencia social sobre la base del principio de utilidad. Es decir, la inter
ferencia gubernamental slo estara justificada cuando promovi era la mayor
felicidad del mayor nmero de personas, elevando al mximo la satisfaccin.
Las acciones guardan una proporcin correcta cuando tienden a promover j
la felicidad, y errnea cuando tienden a producir lo contrario a ella. Entendemos
por felicidad el placer y la ausencia de dolor; por infelicidad, el dolor y la pri vaci n,
del placer.
(Mi l l , 1861)
Los argumentos de Mi l l eran estrictamente utilitarios, o sea,, basados en
una estimacin de las consecuencias futuras de di versas alternativas. Si ^
estimaciones empricas de las consecuencias cambi an, tambin lo 0
as conclusiones. Los modernos liberales del est ado de bienestar han
dmcado las estimaciones empricas y, en consecuenci a, las c o n c l u s i n |
Segn los liberales modernos, el principio de utilidad requiere que el gb' ef]
emprenda una accin enrgica. El clculo del princi pi o de utilidad
ltimo trmino, al liberalismo del estado de bi enestar (W o l f f , 196 8). $,
Segn Mu, cualquier persona es el mej or j uez de su propio n
Premi sas en las que se basan los enf oques
(Debemos sealar que Mi l l escriba en un momento en que las masas
carecan de voto. Sus teoras slo se aplicaban a la ciudadana ms ilus
trada".) Para los liberales modernos, como Ri v l i n (1971), no es as. A menudo,
el gobierno es el mejor juez. En el marco de Mi l l , la completa libertad de
expresin lleva a una competencia de ideas que refuerza la verdad. En un
mercado libre de ideas, los consumidores adquirirn lo mejor sin la interfe
rencia gubernamental. Para el liberal moderno, el gobierno debe proporcionar
ndices de eficacia sobre los que fundar los juicios y, a menudo, eiegir en
aras del inters pblico. Los liberales, clsicos y modernos, estn de acuerdo
en los principios polticos liberales, pero disienten respecto al carcter be
nfico o daino de la interferencia gubernamental.
Mi l l cree que la interferencia del gobierno se traducir en el impedimento
del desarrollo individual, la centralizacin y el abuso de poder, la ineficacia,
la accin desganada y de baja calidad del gobierno que las partes privadas
interesadas podran realizar mejor y la supresin de la iniciativa indivi
dual que sienta las bases para el despotismo. Sin embargo, incluso Mi l l
cree que, si el comprador no fuese el mejor juez de un bien, la competencia
del mercado no existira. En los asuntos culturales y educativos, Mi l l no
cree que los incultos sean los mejores jueces. Por tanto, el estado podra
intervenir legtimamente, postura prxima a la de los liberales modernos.
En la esfera privada, que consiste en la libertad de pensamiento, concien
cia, opinin, sentimiento, gustos y pasatiempos y asociacin, Mi l l pensaba
que cualquier persona sera, sin duda, el mejor juez de sus propios inte
reses por ser la ms preocupada por su propio bienestar. Su conocimiento
de sus sentimientos y circunstancias sera muy superior al que pudiera
tener cualquier otra respecto de ella misma. Por tanto, sera mejor dejar a
cada individuo que hiciera sus propios juicios, aunque pareciesen equivoca
dos o dainos para el interesado.
Pero, en general, el clculo del principio de utilidad conduce ms bien a
potenciar una fuerte intervencin gubernamental que a evitarla. No nos
sorprende, por tanto, que todos los modelos utilitaristas de evaluacin (anlisis
de sistemas, por objetivos conductuales, de decisin e independiente de los
objetivos) se basen en una accin de gobierno, normalmente en forma de
mandato gubernamental, incluso. La mayor parte de estos modelos tienen
como principales destinatarios tambin a los directivos y administradores
de programas gubernamentales. La evaluacin independiente de los objeti
vos del programa, cuyos principales destinatarios son los usuarios, constituye
la nica excepcin.
Premisas polticas de los intuicionistas-pluralistas
Cmo puede llevarse a cabo una evaluacin si no existe un principio
nico, como el de utilidad, para usarlo como criterio? En los enfoques
intuicionistas-pluralistas hallamos dos tipos de respuestas. Una consiste en
la autoridad profesional, como en los enfoques crtico y profesional, y la otra
60 Eval uaci n, tica
i ^ o s
es una combinacin de autoridad cientfica y de participacin en la evaluar
de quienes desarrollan el programa. El enfoque profesional comenz col?
asociacin voluntaria en contra de la interferencia del gobierno y se ba
en la idea de la maestra por medio de la experiencia. fl, A Sa
Los enfoques participativos constituyen intentos de promover una coi
boracin ms directa de las personas ms comprometidas en el prograrrf
El enfoque cuasijudicial consigue esto haciendo que las personas se invo
lucren en una operacin de decisin semejante a un juicio. El enfoque ci
estudio de casos implica a las personas a travs de la negociacin, |a
entrevista y la respuesta a evaluaciones provisionales, aunque sea el eva
luador quien redacte el informe. Para que las personas participen en calidad
de destinatarios principales, la evaluacin ha de ser inmediata y comprensi
ble. La escuela participativa pretende establecer una democraci a ms directa
entre los implicados en el programa en vez de-dejar las decisiones al go-
biemo, como en et caso de la evaluacin utilitaria. Los principios pluralistas
se derivan de la participacin de diversos individuos y grupos.
Existen dos enfoques distintos del pluralismo poltico. Uno se deriva di
rectamente de la filosofa liberal clsica de J. S. Mi l l , sin su epistemolo
ga ni su tica utilitarista. El liberalismo clsico considera la sociedad como
una asociacin de individuos autodeterminados que cooperan con los de
ms para conseguir sus propios fines. De acuerdo con Mi l l , es esencial
que puedan autorgobernarse, dado que son ellos quienes mejor se conocen
a s mismos y a sus intereses. Esta versin del pluralismo acepta como
inevitables las idiosincrasias individuales y los conflictos interpersonales
(Wol f f , 1 9 6 8 ) .
La inviolabilidad del individuo frente a la intrusin de la sociedad es
fundamental y la esfera ntima de la persona debe conservarse inviolada.
No pueden interferirse sus pensamientos y prcticas. En vez de suprimirse,
se estimulan la individualidad y la diversidad. Se concibe la sociedad como
un mercado en el que cada individuo trata de conseguir sus propios fines.
Cada hombre goza de libertad para procurar alcanzar sus propias metas de
manera compatible con la de los dems que pretenden lograr las suyas. En
la esfera pblica, la sociedad tiene derecho a i mponer algunas regl as de
equidad. Por lo dems, el mercado regula las cosas de f orma automti ca
La sociedad ideal que se preconiza es la de una gran ciudad con10
Londres o Nueva York. El liberalismo clsico considera al hombre como ^
calculador racional del dolor y el placer. La racionalidad consiste en
prudencia calculada. Cada individuo ve a los dems como i nstrumento
para conseguir sus propios fines. Los dems son medios p a r a algn
no fines en s mismos. A veces, sta se denomina teora instrumental
pluralismo ( W o l f f , 1 9 6 8 ) . y I
La justicia consiste en la proteccin de la esfera ntima de la person^
en la oportunidad, ms o me/ios igual para todos, de conseguir sus ^se.
fines. En versiones ms complejas, se suaviza hasta cierto punto la con
cucin del mximo placer, hacindose hincapi en el logro de objet^a
ms elevados: No obstante, sigue considerndose la soci edad como
Premi sas en las que se basan los enfoques
01
col ecci n de cent ros de conci enci a i ndependi ent es, cada uno de los cua
les procura consegui r sus propi os f i nes y se enf rent a a los dems como si
de obj et os ext raos se t ratase (Wo l f f , 1968).
Asociada con esta versin del pluralismo est la teora arbitral del
gobierno. ste tendr que establecer las reglas bsicas para la competicin
entre individuos y grupos, aunque sin inmiscuirse de ninguna otra manera.
La accin debe ser directa de los individuos y grupos interesados y no una
accin de gobierno. Cada persona tiene que gozar de libertad para participar
de forma directa en los procesos de decisin y este papel no puede delegarse
ni en el gobierno ni en nadie ms, como tampoco puede ser usurpado por
ellos. Esta versin de la democracia directa surge del liberalismo clsico,
en el que se promueve al mximo la eleccin de cada individuo.
El enfoque de evaluacin que ms se corresponde con esta versin del
pluralismo liberal es el de la evaluacin democrtica de Ma c Do n al d (1974).
Este autor considera al evaluador como intermediario en los intercambios
de informacin entre grupos, representando un conjunto de intereses, pre
sentando informacin accesible a los no especialistas, brindando confiden
cialidad y proporcionando control sobre los datos a los informadores, sin
intencin de utilizar mal la informacin, negociando con los patrocinadores
y participantes y abstenindose de hacer recomendaciones. El evaluador
facilita informacin a los destinatarios y deja que el mercado resuelva
Cada persona hace el uso que le parece de la informacin, relevando al
evaluador de hacer interpretaciones. ste opera sobre la base de un conjunto
de normas de procedimiento que controla el flujo de informacin.
Ma c Do n a l d ha sido tambin un mximo defensor de la proteccin de la
inviolabilidad de la esfera ntima, concediendo a los informadores el derecho
a vetar lo que pudiera aparecer en el informe. Esto se refleja en su mxima:
las personas son dueas de los hechos de sus vidas. Se rechaza la
interferencia del evaluador tanto en la esfera privada como en la pblica,
salvo para facilitar el flujo de informacin que incremente el conocimiento y,
quiz, la felicidad, al permitir a los individuos que traten de conseguir con
mayor facilidad sus propios fines.
En los Estados Unidos, prevalece una versin diferente del pluralismo.
Basada en la idea de que cada persona alcanza su identidad a partir de los
grupos primarios, no considera al hombre como un individuo por completo
desvinculado, como en el liberalismo clsico. Como los grupos tnicos,
religiosos, econmicos y culturales determinan lo que es una persona, sus
intereses deben expresarse por medio de los grupos ms grandes a los
que pertenece. Esta versin, denominada pluralismo democrtico o libe
ralismo conservador, acepta la tolerancia para con los distintos grupos
establecidos, pero no respecto a los individuos idiosincrsicos. Se considera
que, para el individuo, es bueno adaptarse a ciertos grupos, aunque, para
stos, es bueno que difieran entre s.
En esta visin del pluralismo, en cuanto conflicto de grupos de intereses
permanentes, la comunidad tiene un valor mucho mayor que en el liberalismo
clsico. El pluralismo se basa en la diversidad de los grupos y no en la de
EdoooMMmn $
Evacuacin, aftca y pooe.
136 mtitokto& l a sociedad oeai se parece ms a una ciudad pequea que
s yne grande La tolerancia y la aceptacin mutua se ejerce entre ios
9* 00*
Asoci ada con esta visin dei pluralismo est la teora del gobierno de la
u m de vect ores a de* ~equtf ibno del: poder *. El objetivo consiste en
corsegurr que el gcOi emo act e en una di recci n det ermi nada. Ei i ndivi duo
dada operar por medi o de sus grupos para l ograrl o, dado que sol o ellos
t on* ? t i uenoa suf ici ente para conduci r la nave del Est ada Como en el
Kwrat emo dsco, ei i ndi vi duo debe est ar cerca de su grupo, ser ef i caz y
compromtat e en ei mi smo y part e toar en el. El gobierno (y ei eval uador)
adua como medi ador amort i guando l as i nst rucci ones y respondiendo a los
cambi os de presi n En ambos t i pos de plurali smo, fa capacidad de consi
derar t egf t mas las redamaci ones encont radas es esencial para que el
M a m a t ondone
La evaluacin responsiva de Stake se acerca mucho a la versin del
pur&smc dernocrftco. El evaluador debe responder a cualesquiera intereses
y presiones fegtbmos en tomo al programa, pero no est obligado a repre
sentar punto de vista alguno ni a reflejar en la evaluacin ios puntos de
vista satvo que algn grupo de intereses participante en el programa pro
mueva activamente alguno de ellos. La participacin activa es un criterio
para reflejar en la evaluacin el punto de vista de un grupo.
Los grupos legtimos definen las cuestiones y slo algunas se estudian.
Han de escogerse mtodos de investigacin que se adapten a las cuestiones
planteadas Los problemas se resuelven mejor cuando se encargan de ello
(rectamente personas prximas a la situacin en la que se plantean (St ak e,
1975) Este planteamiento se opone ai de la evaluacin utilitarista en la que
al gobierno evala, define el problema y emprende la accin. Las evalua
ciones pluralistas tienden a favorecer al mximo la opcin individual y local
en vez de ia utilidad social. Ambas formas de pluralismo suelen identificarse
con ta interaccin libre entre individuos y grupos opuestos, como requiere
I funcionamiento del mercado bre.
Aunque todos estos enfoques de la evaluacin difieren en cuanto a los
aspectos sealados, comparten algunos elementos bsicos de la ideologa
iioeras. Entre ellos est el principio de la libertad de eleccin. Aunque siga
en pie el problema de quin elegir, se favorece al mximo esa el ecci n.
Se tundin en una psicologa muy individualista. Asimismo, su ori ent aci n
m rotundamente empirista.
De igual modo, todos los enfoques de la evaluacin dan por supuest o
un mercado Ubre de ideas en el que, en un plano ideal, los usuarios selec-
clonaran & mejor Mediante la competicin entre las ideas, se fortalece la
arded y se perfeccionan los sen/ icios sociales. Por ltimo, todos los enf oques
atienen p un mayor conocimiento hace de alguna manera felices, mejores
1 metoctm a las personas, suposicin interesante que se remonta hast a
te
Se g u n d a p a r t e
Los criterios fundamentales de la evaluacin:
veracidad, belleza y justicia
Cuando se trata de la conducta prudente en la vida, es bueno que
tengamos presente que los acontecimientos humanos estn dominados
por el Azar y la Eleccin, que estn extremadamente sujetos a cam
biosl . En consecuencia, aquellos cuya nica preocupacin es la verdad
abstracta experimentan grandes dificultades para poner los medios y
mayores an para alcanzar sus fines... Por tanto, dado que el curso de
accin debe tener en cuenta la importancia de los acontecimientos
nicos y sus circunstancias, puede suceder que muchas de estas
circunstancias sean ajenas y triviales, algunas malas otras contrarias
incluso, al propio objetivo. Es, pues, imposible valorar los asuntos
humanos con arreglo al criterio inflexible de la justicia abstracta; debe
mos, en cambio, sopesarlos mediante las... reglas flexibles que no
adaptan los cuerpos a s mismas, sino que se adaptan a sus siluetas
" \
Gi ambat ti st a Vi co.
On the Study Methods of Our Time, 1709, pg. 34
CAPTULO IV
La l gi ca de la argument aci n eval uat i va
Utilizo a propsito la palabra discurso" porque las demostra
ciones cientficas, incluso las pruebas matemticas, son f undamen
talmente actos de persuasin. Los enunciados cientficos nunca
pueden ser ciertos; slo pueden ser ms o menos crebles.
Joseph W e i z e n b a u m: Computer Power and Human Reason, 1976
Las generalizaciones desaparecen.
Lee J. C r o n b a c h : Beyond the Two Disciplines of Scientific
Psychology, 1974
El gran terremoto que se va a producir en California
Vi vo en Los ngel es, pero me pregunto por qu. Ha surgi do una repentina
el evaci n de treinta cent metros y medi o en una f ranj a de ciento sesent a
ki lmet ros a lo l argo de la f alla de San Andrs. Basndose en las l ect uras
de l as ondas ssmi cas, un cientf ico de Cal if orni a ha previst o un importante
t erremot o en el rea de Los ngel es durant e este ao (Science, mayo
1976). Fundndose en otras lecturas, un predi cador radi of ni co advi erte
El ttulo origi nal del captulo es: The logic of evaluative argument En ingls, la pal abra
argument" si gnif i ca argument o", razonamiento, di scusi n", debate , alegato". En la cita
de Wei zenbaum, la pal abra "argument" se utiliza en dos sentidos dif erentes: razonami ent o" y
di scurso persuasi vo", deri vndose esta ltima acepci n de uno de los si gnif icados del verbo
i ngls "to argue": persuadi r , que concuerda con el sentido de la cita inicial, la cual resul tana
conf usa t raduci da de otro modo. (N. del T.)
NOTA DEL AUTOR: Est e captulo es una versin reduci da de The Logic o EvaJ uatrve
Argument, Monografa n. 7, Los ngel es: Center for the Study of Evaluation, UCLA, 1977.
Agradezco a Lee Cronbach, Bob Enni s, Gene Gl ass y al personal del CSE sus detal l ados
comentari os.
Ediciones Morals, S. L
acerca de un importante temblor de tierra Tanto los cientficos como los
videntes concuerdan en sus augurios. Sin embargo, ninguno facilita el tipo
de informacin que necesito.
Hablo con los naturales del pas acerca de estos signos de mal agero.
Su respuesta corresponde a la necesidad de vivir en esas circunstancias:
se encogen de hombros. El Presidente ha sido informado, pero parece que
nadie sabe qu hacer con exactitud. Los funcionarios de Washington sugieren
que se instale un nuevo dispositivo de instrumentos cientficos a lo largo de
la falla, aunque no est claro qu resultados pueden proporci onar ms
medidas.
Mientras tanto, el tiempo es perfecto; el marco de las montaas de
Santa Mnica, esplndido; el estilo de vida, sibartico. Los cl cul os de pro
babilidades de los sesmos a largo plazo no me benefician en absoluto; yo
necesito saber cundo temblar la tierra en relacin conmi go mismo. El
vocabulario de la accin es complejo. Todo el mundo est de acuerdo en
que la informacin configura de algn modo las decisiones, pero la relacin
no es directa ni sencilla. A menudo, cuanto ms importante es la decisin,
ms oscura parece la relacin. Consideremos la decisin de contraer matri
monio. Para la mayora, se trata de un proceso largo, arduo, que requiere
un perodo de tiempo para ir tomando forma. Ninguna porcin de informacin
es decisiva al respecto. Al contrario, la decisin se f ragua despacio, casi
imperceptiblemente, hasta que se produce. Se esgrimen y ponen a prueba
una razn tras otra. Por ltimo, un conjunto de argumentos diversos se
erigen en fundamento racional de la decisin que, con f recuencia, se ha
tomado mucho antes de establecer todos los argumentos.
Las decisiones ms significativas son las que tienen consecuenci as a
largo plazo, pero no permiten una extrapolacin fcil, las que estn tan
enredadas con todo lo dems que se oponen a un anlisis formal preciso.
Ante ellas, nos vemos obligados a aplicar nuestra lgica intuitiva, nuestro
sentido comn. El hecho de que nuestros conocimientos de estos complejos
problemas sea limitado, que no llegue a ser determinado, radica en su mismo
carcter. Ante un conocimiento inseguro, la tarea de decidir en medio de esta
maraa depende menos de que aparezcan pruebas que nos convenzan de
manera absoluta que de que dispongamos de mltiples razones que nos
persuadan. El criterio no estriba en lo necesario sino en lo admisible.
Equivocidad de las pruebas: certidumbre frente a credibilidad
Entonces, por qu los funcionarios gubernamentales, el pblico e, incluso,
los miembros de la comunidad de evaluadores reclaman pruebas definitivas
'Respecto a esta distincin y a muchas otras ideas expuestas en este captulo, estoy en
deuda con la excelente obra sobre la argumentacin de Perelman y Ol b r e c h t s -Ty t e c a : The
H$w ftml o r i e : A Treatise on Argumenl Scranton (PA): University of Notre Dame Press, 1969.
$ (VmtifiOM Mrrrda 8. L
La lgica da la argumentacin avaluatlva 67
del xito de los programas educativos? May una tradicin que se remonta
hasta De s c a r t e s que sostiene que el nico conocimiento es el que posee
la caracterstica de cierto. El mtodo de anlisis de De s c a r t e s parta del
escepticismo total: dudar de todo lo que pudiese dudarse. En su bsqueda
de un saber seguro, lleg a lo de por si evidente como ltima nota de la
razn. Para que algo pudiese calificarse de saber, habla que partir de ideas
claras y distintas e ir progresando a base de pruebas deductivas. Las
proposiciones asi derivadas tenan que ser necesarias e irresistibles para el
intelecto; no podan ser negadas, desde el punto de vista racional.
Este mtodo impeda considerar como saber lo meramente creble. Segn
el ideal cartesiano, el nico razonamiento verdadero es analtico. La lgica
deductiva formal, el mtodo de prueba utilizado en matemticas, constituye
el mtodo por excelencia. El saber puede reducirse a proposiciones de por
s evidentes. No son posibles los desacuerdos respecto al conocimiento
cierto. Como deca De s c a r t e s , si dos hombres no se ponen de acuerdo
sobre una materia, uno de ellos estar con seguridad equivocado. Hay una
proposicin verdadera y otra falsa y la lgica acta mediante pruebas irre
futables para determinar cul es cada cual.
Ms tarde, quienes prolongaron esta lnea de razonamiento tuvieron que
enfrentarse con el hecho de que, a menudo, pareca que los hombres
racionales pensaban de forma diferente y llegaban a conclusiones contra
dictorias. Algunas de las proposiciones del mismo De s c a r t e s parecan sos
pechosas. Pa s c a l introdujo la explicacin de que estos desacuerdos, as
como la negativa a aceptar conclusiones necesarias, era producto de la
irracionalidad. Comenz a verse en el hombre un lado irracional que, con
frecuencia, le descarra en su bsqueda del saber. La aparente irracionalidad
de quienes no aceptan las conclusiones que otros perciben como necesarias
es moneda corriente en la evaluacin contempornea.
Desde la perspectiva cartesiana puede accederse al conocimiento cierto
mediante procesos deductivos, y ste debe llevar a una conviccin absoluta
Ese razonamiento funciona en geometra, pero lo hace porque excluye la
mayor parte del mundo de los sentidos. Como sealaba Hu me , nuestras
creencias, aun en conceptos tan bsicos como la causalidad, no son seguras
si se les aplica un escepticismo absoluto. El razonamiento deductivo llega a
producir un conocimiento cierto sobre todo mediante la eliminacin de la
mayor parte del mundo cotidiano.
Desde el punto de vista epistemolgico, John Stuart Mi l l rescat para
nuestros usos el mundo sensible. Del mismo modo que los lgicos han
estructurado la lgica deductiva formal reflexionando sobre la naturaleza de
las pruebas matemticas, Mi l l reflexion sobre la psicologa asociacionista
de su poca y formul una lgica inductiva que permiti la introduccin de
la certidumbre en el conocimiento derivado de manera inductiva Para ha
cerlo, Mi l l estableci diversos axiomas que, an hoy, estn presentes en
toda la investigacin a base de encuestas. Segn Ha mi l t o n (1976), st os
son los axiomas:
fe EOctonas Moraaa, % i
Eval uaci n, tica y p0cjQ(.
l a naturaleza es uniforme en el espaci o y en el tiempo. Esto brinda
ai razonamiento inductivo la misma cert idumbre de procedi mi ento
que a las conclusiones deri vadas mediante la lgica silogstica.
Los conceptos pueden definirse por ref erencia directa a categoras
empricas y las leyes de la naturaleza puede deri varse de un modo
inductivo de los datos por lo dicho anteriormente.
Las muestras grandes pueden eliminar los aspectos i di osi ncrsicos
y poner de relieve "causas generales".
Las ciencias sociales y naturales tienen el mi smo objetivo de descubrir
leyes generales (que proporci onan la base de la expl i caci n y de las
previsiones).
Las ciencias sociales y naturales son idnticas desde el punto de
vista metodolgico.
Las ciencias sociales slo son ms complejas.
Por tanto, Mi l l defenda que el conoci mi ento cierto puede deri varse
tanto del razonamiento inductivo, como del deducti vo. Podramos def inir las
categoras y relacionarlas entre s medi ante tcnicas ahora bien conoci das.
En realidad, Mi l l conclua que el mtodo inductivo constitua la nica f orma
de descubrir ideas nuevas, dado que la lgica deducti va sl o podra revel ar
lo que hubiera de antemano. (Mi l l estaba tan seguro de su mt odo que
afirmaba que los principios ticos tambi n podan deri varse medi ante el
razonamiento inductivo y, por tanto, tenan un f undamento cientf i co.)2
El axioma de verdad importante es el primero de Mi l l . Segn sus propias
palabras: "El universo, en la medi da en que lo conocemos, est estructurado
de manera que lo que en un caso es verdadero es cierto en t odos los
casos de una determinada descripcin; la nica dificultad estriba en descubrir
de qu descripcin se trata" (Mi l l , 1893). Qu familiar resulta esa i dea a
2AI final de su obra f undamental sobre la lgica inductiva, Mil l considera la lgica de la
prctica" o "arte: "Debe haber alguna norma mediante la que determinar la bondad o mal
dad, absoluta y comparativa, de los fines u objetos de deseo. Y, cualqui era que sea la nor
ma, slo puede haber una; porque si los principios ltimos de conducta f uesen .diversos, la
misma conducta podra ser aprobada por uno de estos principios y condenada por otro; y sera
necesario algn principio general, como rbitro entre ellos" (John Stuart Mil l : A System o
Logic Nueva York. Harper, 1893, 8.a edicin).
Esto lleva a M i l l a imponer una nica norma universal mediante la que juzgar l o s asunt os
prcticos, porque la nica alternativa es "suponer un sentido o instinto moral" o princi pi os
morales intuitivos . Los principios ticos generales slo pueden conocerse por i nducci n.
Como la certeza inductiva presupone la uniformidad de naturaleza, la psi col oga resultante es
determinista La moralidad es natural, dado que slo una valoracin naturalista p e r m i t i r mt odos
cwnlfteos de prueba. La base es el utilitarismo hedonista.
En cierto sentido, Mil l impeda el desacuerdo respecto a las cuesti ones moral es, ya que
empre es posible llegar a conclusiones opuestas en ausencia de un acuerdo previ o sobre el
emano B resultado de este razonamiento es el clculo utilitario que combi na todos lo deseos
Humera* en una nica configuracin y los satisface mediante el criterio del mxi mo de satis-
M m plenas derivadas. El juicio lo lleva a cabo un "espectador i mparcial" que, en los
i t i Mpot moderno* , demuestra su imparcialidad empleando tcnicas objetivas" de anlisis.
# f tf lannat i t r s i
La l gi ca de la argument aci n evaluatl va
quienes se dedi can a la investigacin mediante encuesta y qu falible la
lgica inductiva en la que se basa!
El procedimiento de razonar desde una parte" hacia el todo" constituye
sin lugar a dudas una falacia lgica. Se supone que cada caso confirmato
rio hace ms probable una hiptesis. Sin embargo, si la hiptesis es: todos
los hombres miden menos de 30 metros , y encontramos uno que mda
29,9 metros, ste sera un caso confirmatorio que debilitara considerable
mente la hiptesis, en vez de reforzarla (Ga r d n e r , 1976). Cada da que
pasa en Los ngel es sin que se produzca el gran terremoto previsto, lo
hace ms o menos probable? En los estudios estadsticos, tambin es muy
posible que dos trabajos independientes confrmen por separado una hip
tesis y que, sin embargo, reuniendo los resultados de ambos, quede refutada
(vase la paradoja de Si mpson en: Martin Ga r d n e r , 1976).
No obstante, a pesar de sus graves defectos lgicos, parece que la
cienci a basada en la lgica inductiva funciona con relativo xito. Sin
embargo, el conocimiento procedente de la misma carece de certidumbre.
Incluso los hechos cientficos mejor establecidos deben tomarse como pro
visionales. Como afirma un cientfico:
Seguro que el hombre de la calle cree que tales hechos cientficos est n tan
bien fundados como probada est su propia existencia Su seguridad es una
ilusin. Ni siquiera el cientfico resulta inmune a tal ilusin. A fin de cuent as, en
su prctica debe mantener en suspenso la desconfianza para hacer o pensar
algo. Es, ms bien, como un espectador de teatro que, para participar en lo que
sucede en el escenario y comprenderlo, tiene que fingir para s que est presen
ciando acontecimientos reales. El cientfico debe creer su hiptesis de trabajo,
junto con su amplia estructura subyacente de teorias y supuestos, aunque slo
sea como tal hiptesis. Con frecuencia, el discurso" abarca toda su vida. Poco
a poco, se convierte en lo que, al principio, slo finga que era un verdadero
creyente. Utilizo a propsito la palabra discurso porque las demostraciones
cientficas, incluso las pruebas matemticas, son fundamentalmente actos de
persuasin.
Los enunciados cientficos nunca pueden ser ci ertos; slo pueden ser ms o
menos crebles. Y la credibilidad es un trmino que pert enece a la psicologa del
individuo, es decir, una palabra que slo tiene sentido con respect o a un obser
vador individual. Decir que una proposicin es creble es, en ltimo t ermi na
decir que un agente, con libertad para no creerla la cree, o sea que un obser
vador, tras ejercitar el juicio y (posiblemente) la intuicin, opt a por acept ar la
proposicin como digna de ser creda
(Wb z b b m m 19764
La evaluacin como persuasin
Si en las ciencias fsicas las demostraciones son f undamefKalmmft
actos de persuasin, an ms las investigaciones sobre la educaorv 0
axioma de Mi l l acerca de que las ciencias sociales y naturales son oent cas.
itAf c & de v'ssa ^e?Ddo* occo hoy da parece mucho ms dbdo.
*o Ocw^ ao {i74iy por ejempi a dusfe de la conveni enci a de i mpon*.
a a* oenoas socales ios ideales de las aenctas f sicas. En el parada
as. esencias i scas tos nechos se explican y prevn medi ante una
*90 de proposeerw que ponen en relacin constructos abstractos
Tras reat ar weeae aos de estucfos de las interacciones entre apttuc y
y^ar vsr ^) basados en aoue< modelo. Cpo nbac h concl uye que tos fln-
sooae* estn demasiado abiertos a las interacciones con otras
tf naOf es para permitir generalizaciones establ es La estrategia positivista
di establecer condiciones que permitan conseguir general izaciones da por
puesto* unos procesos estables que puedan dividirse en si st emas inde
pendiente* a efectos de estudio de los mismos, supuesto muy f rgil en
reiaon con los sistemas sociales.
C i n v i t a a interpretar los datos en su contexto, en vez de tratar
# Aegar a generalizaciones. Un observador, situado en un ambiente concreto
puede describir e interpretar ios efectos en las condiciones locales. Mientras
gue el control experimental y la correlacin sistemtica plantean preguntas
formales de antemano, la observacin local es ms abierta ante los impre-
vwtoe El empirismo a corto plazo es sensible al contexto, y as el investigador
puede prescindir de cierta capacidad de previsin. Dej a de ef ectuar gene
ralizaciones y construir teoras, elaborando, en cambio, "concept os que
ayuden a pensar a las personas". He ah lo que defiende Cr o n bac h .
Yo estoy dispuesto a sostener que, por s mismas, las eval uaci ones no i
W sino actos de persuasin. Aunque, a veces, los eval uadores prometen
pruebas cartesianas y utilizan los mtodos inductivos de Mi l l , inevitablemente,
la* evaluaciones carecen de la certidumbre de prueba y del carcter con
cluyente que les otorga el pblico. Si en realidad existe, la eval uacin
definitiva es rara. Incluso un metodlogo cientfico tan mi nucioso como
James Coleman ha de hacer frente a continuas y custicas crticas de su |
tritfijo Si i someten a un examen serio, las evaluaciones si empre resultan
equvoca.
Esperar que la evaluacin arroje conclusiones definitivas y necesarias |
es pedir ms de lo que la evaluacin puede dar. Sobre todo en una sociedad
pluralista, la evaluacin no puede llevar a proposiciones necesarias. Pero, 1
aunque no pueda acabar en conclusiones definitivas, s puede l levar a lo I
creble, lo plausible y lo probable. Sus resultados no llegan a ser ciertos,
pero todava pueden ser tiles.
Probar algo supone satisfacer el conocimiento de una audiencia uni versal ;
con respecto a la verdad, ms all de toda duda. Producir una prueba
aceptable para una audiencia universal que comprenda a todos los hombres j
itt.iongto?, gx^o superar las particularidades locales o histricas. La cer t eza
requiera aialar los datos reapecto de su contexto total como, por ej empl
n loa ttrminos de un silogismo. La certeza lgica slo puede consegui r se i
dentro de un sistema cerrado, completamente definido, como un juego.
8i la evaluacin se limita al conocimiento cierto proporcionado por un J
raionam+ento deductivo e inductivo estricto, tiene que dejar de lado graf
S I __________ E w f t u a atea y bb^
La l gi ca e l a argurnent aci cr evsi uaf cva : . W
parte de la capacidad de razonamiento que (as personas utilizan de forma
habitual para regir sus vidas. Esa limitacin es el resultado de contundir la
racionalidad con la lgica. No son idnticas.
Si convencer de manera absoluta a todos los hombres racionales cons
tituye una carga excesi va para la eval uacin, no lo es persuadir a deter
mi nadas personas. En lugar de las proposiciones necesarias derivadas de
una lgica rigurosa, podemos emplear los razonamientos no obligatorios
de la persuasin. En lugar de la necesidad de la autoevidencia, podemos
val emos de la adhesin variable a las tesis cuando se presentan a destina
tarios concretos. Las tesis pueden ser ms o menos crebles. Los destinata
rios gozan de libertad para creer o no creer tras estudiar los razonamientos
y ejercitar su propio juicio.
La eval uacin aspira a persuadir a un pblico concreto del valor de algo
o de que ese algo es lo que interesa, apelando a la razn y la comprensin
del pbli co3. A stos efectos, el conocimiento no probado es til, aunque
siempre sean discutibles las ideas que se exponen. Los mtodos adecuados
son los de la argumentacin, que es el mbito propio de lo creble, lo
plausible y lo probabl e y no de lo necesario (Per el man y Ol b r e c h t s -
Ty t e c a , 1969).
La argumentacin se opone a la demostracin. Las demostraciones se
basan en la l gica formal que evita la ambigedad por medio de la cohe
renci a interna de su sistema de smbolos. En la lgica deductiva, el origen
de los axiomas es externo al sistema. Cuando pasamos de la deduccin a
la induccin, todos los tipos de cuestiones se convierten en discutibles,
como la val idez de la medida. Pero sigue buscndose el conocimiento
cierto .
En la eval uacin, los contextos social y psicolgico cobran especial
relieve y el conocimiento se hace menos seguro. En tales condiciones, la
argumentacin orientada a lograr la adhesin y a aumentar la comprensin
de destinatarios concretos resulta ms apropiada. La persuasin slo pro*
cl ama la validez respecto a determinados destinatarios, y la intensidad con
la que esos pblicos concretos aceptan los descubrimientos de la evaluacin
constituye una medi da de su eficacia. El eval uador no aspira a convencer a
3Ke l l y (1980) ha puesto de manifiesto las premisas ocultas presentes en mis razonamientos
aqu expuestos. Est implcito en ellos que el evaluador acte para persuadir a los destnatenos
de cierto punto de vista porque es verdadero" y tiene algn medio para establecer esto, Ho
obstante, la verdad puede mantenerse con distinta intensidad. Kelly afirma tambin corree*
tamente, a mi modo de ver que hago la distincin aristotlica entre el argumento terico que
conduce a la verdad y el argumento prctico que lleva a la accin razonada.
No estoy tan seguro respecto a su afirmacin de que la evaluacin persuada a itQuieri
para que acte en vez de persuadirlo de que algo constituye el problema. La accin es el
objetivo final de la evaluacin, pero en la accin estn involucradas tantas otras cooiiitlerecionee
que parece difcil que el evaluador pueda valorar e. incluso, identificar las pnncipeloi c o n M v
gencias. Me parece que la evaluacin persuade de la conveniencia de algo. En ciertas cir
cunstancias, esto puede constituir un curso de accin, pero, por regla qeneral. le accin
supone otras consideraciones adicionales.
tteeMMK woHMe, s
Eval uaci n, t i cay ^
una audiencia universal, compuesta por todos los hombres racionales, p0r
la fuerza de la necesidad de sus conclusiones.
La persuasin est directamente relacionada con la accin. Aunque |9
informacin de la evaluacin no sea tan segura como la informacin cientfica
dingida a una audiencia universal, la persuasin es eficaz para promover ia
accin porque se centra en un pblico concreto y suministra la informacin
que afecta a ese pblico. El conocimiento personalizado que induce a las
personas a dejar de fumar puede ser distinto de las generalizaciones cien
tficas que vinculan el fumar con las enfermedades del corazn o con el
cncer. Es ms fcil que el conocimiento del ataque al corazn de un
pariente prximo sea el que nos induzca a actuar, y no todos los grficos y
tablas. El razonamiento evaluativo es a la vez menos seguro, ms particula
rizado, ms personalizado y ms tendente a la accin que la informacin
derivada de la investigacin.
En resumen, la evaluacin persuade ms que convence, argumen
ta ms que demuestra, es ms creble que cierta, la aceptacin que suscita
es ms variable que necesaria. Esto no significa que se reduzca a mera
oratoria o sea completamente arbitraria. El hecho de que no se limite al
razonamiento deductivo e inductivo no supone que sea irracional. La racio
nalidad no equivale a la lgica. La evaluacin emplea otras formas de
razonamiento. Eliminada la carga de la certeza, las posibilidades de una
accin informada aumentan, en vez de disminuir.
Los destinatarios de la evaluacin
S la persuasin se convierte en el objetivo de la evaluacin, los destina
tarios a quienes se dirige la evaluacin son importantes. Desde hace muchos
aos, se aconseja a los evaluadores que piensen en sus destinatarios y en
el tipo de informacin que ellos necesitan. Lo que tiene importancia para un
grupo, quiz carezca de relieve para otro. La argumentacin parte de la
base de que existe una "comunidad de mentes, hay un contacto intelectual
y, al menos, hay acuerdo respecto a algunas cuestiones sobre las que
comenzar a deliberar.
Debe existir un lenguaje comn y el deseo del evaluador de persuadi r
a tos destinatarios y de tener en cuenta sus preocupaciones. A menu
do, estas condiciones no se cumplen. El concepto que se tiene de los des
tinatarios es errneo o no se los toma en serio. No es raro que el eval uador
facilite informacin apropiada para un pblico compuesto por psi cl o
gos poro casi carente de sentido para un profesor o un funcionario del go-
t omo
Es fcil que el acuerdo de una audiencia universal (todos los hombres
de todos tos Uempos) se consiga mediante el razonamiento lgico f ormal
tMMtdo en conceptos de por s evidentes. Por tanto, cuanto ms est ri ct o
0 diserio experimental, ms convencida quedara una audiencia uni versal
$ relacin entre causa y efecto, con independencia del contexto. Unos
# b/ mtm Manto. S- i ,
La l gi ca de la argument acin evaluativa
destinatarios ms cercanos a la escena pueden aceptar la causa y ei
efecto sin necesidad de tal prueba. Por supuesto, la audiencia universal no
es reunible en ningn momento determinado, aunque, de hecho, diversos
grupos escogidos actan como representantes de aqulla. Quiz los filsofos,
ms que nadie, representen este tipo de audiencia. Los argumentos que
manejan stos no siempre coinciden con los que esgrimen los profesores.
En la medida en que un razonamiento se dirija a una audiencia universal,
menos discutible ser. Poca discusin cabe en pura lgica deductiva
Con frecuencia, las tcnicas de evaluacin se presentan como indiscutibles,
basadas, por ejemplo, en instrumentos vlidos y fiables, que utilizan proce
dimientos estadsticos fundados, etctera. En realidad, todos los enunciados
basados en una evaluacin pueden suscitar desacuerdos y son discutibles,
si el desacuerdo se manifiesta adecuadamente. Cuanto ms tcnica y cuan
titativa sea la evaluacin, menos capaces de discutirla sern unos destina
tarios no iniciados, pareciendo, en tal caso, que la evaluacin es ms
incontrovertible de lo que en realidad es.
En las evaluaciones que utilizan metforas estadsticas, podemos decir
que los efectos del tratamiento difieren porque existe la probabilidad de que
dos puntuaciones medias del test pertenezcan a poblaciones diferentes y,
por tanto, que el programa experimental es mejor que el control. El uso
generalizado de nmeros en los procedimientos estadsticos y las puntua
ciones de los tests proporcionan a las pruebas una apariencia de certeza e
inequivocidad.
En realidad, detrs de los nmeros se esconden muchos supuestos
previos (como, por otra parte, detrs de toda evaluacin). Casi siempre, es
posible discutir la validez de los tests, la adecuacin de los procedimientos
estadsticos y el control del diseo experimental. La discusin no invalida la
evaluacin, pero, cuando se discuten las premisas, se pone en evidencia el
carcter de la evaluacin como discurso persuasivo. El evaluador puede o
no tener xito en la defensa de su estudio. En todo caso, para defenderlo
ha de asumir un razonamiento no deductivo y ms equvoco. Aunque, en
apariencia, la evaluacin apele a la racionalidad definitiva de la audiencia
universal, termina en apelaciones directas a destinatarios concretos. Creo
que es imposible estructurar de otra forma una evaluacin.
Incluso una operacin de evaluacin de base muy amplia, como la del
Consumers feport, que utiliza procedimientos objetivos y diseos expen-
mentales complejos para evaluar productos de consumo, se orienta a unos
destinatarios determinados. Sus argumentos, dirigidos a la clase media arta,
no tienen mucho sentido para las clases inferiores o superiores, que no
suelen tener muy en cuenta sus evaluaciones.
Por tanto, la situacin a la que se enfrenta el eval uador consi st e casi
siempre en una llamada a pblicos concretos que puede def i ni r con ci ert a
precisin. Si el evaluador no puede definir a sus destinatarios, l a eval uaci n
ser indeterminada. Debe tratar problemas y estructurar argument os que
digan algo a pblicos concretos. Ms an, es probabl e que Sos dest nat enos
constituyan un combinado de grupos diversos, l o que complica cont er a-
K*Hfcfr*V fffrcL.
Dememe su tarea l a onentaoon eficaz a determinados dest inat ari os modifica
ios Mrraies de la racionalidad apbcabte No est conf i nado a l as formas m
nesmngtas de razonamiento. Cuando la evaluacin se hace mas equvoca
tambin aumenta su grado de posibilidad
0 dilogo socrtico constituye un ideal de ia argumentacin entre dos
oartes, El dilogo se desarrolla como una cadena rigurosa de razonamiento
at alguien que pregunta y alguien que responde. El destinatario unipersonal
es persuadido nevndole a aceptar paso a paso ciertos principios. En lti mo
termino, en la interaccin se ponen sobre el tapete las preocupaciones
concretas del destinatario. Asimismo, el dilogo socrtico encierra tambin
gran fuerza respecto a terceros que puedan leerlo.
No obstante, el pblico ai que se enfrentan la mayora de los evaluadores
no suele reducirse a una sola persona. Es mucho ms corriente que est
formado por diversos grupos diferentes. Algunos tericos han sugerido formas
<te evaluacin en las que el evaluador mantenga frecuentes cambios de Im
presiones con los destinatarios durante el estudio. Con independencia de
la forma de la evaluacin, estoy convencido de que la que tiene xito en su
faceta persuasiva debe implicar a los destinatarios en el discurso fundamental,
aunque ese discurso pueda desarrollarse de maneras muy diferentes.
B discurso que se desarrolla de este modo es ms que un simple
debate en el que los correspondientes partidarios expongan sus distintos
puntos de vista. El dilogo debe consistir en una discusin en donde las
partes busquen de manera seria y sincera respuestas mutuas. Esta restriccin
descalifica en gran medida el empleo de los mtodos contradictorios en
cuanto instrumentos persuasivos, dado que puede suscitarse un conflicto
sin persuadir a nadie de nada.
Kemmis (1976) pretende que el destinatario sea uno mismo: la evaluacin
como autocrtica". Considera que los destinatarios primordiales han de ser
quienes intervienen en el programa. Convencido de que el nico camino
para perfeccionar el ejercicio profesional consiste en la dialctica entre
el conocimiento y la accin, seala que las normas de la evaluacin deben
depender de los mismos participantes en el programa y que los datos
consistan en los progresos que perciban los participantes. As, la evaluacin
se convierte en autocrtica teraputica. El objetivo final es que los participan-
tes consigan un mayor conocimiento y una idea ms clara que les conduz
ca a una accin eficaz.
Con independencia de quines sean los destinatarios, cuando se trata
de argumentaciones, stos deben compartir la responsabilidad. Como la
informacin no es definitiva, ios destinatarios gozan de libertad para estable'
cer su grado de compromiso. Deben escoger activamente en qu medida
estn dispuestos a creer, lo que exige que comprueben la evaluacin de un
modo activo en vez de aceptarla o rechazarla de forma pasiva. Los d e s t i na
taos tienen que comprometerse de modo personal y compartir la respon
sabilidad. La decisin racional corresponde a los destinatarios y no al eva
tuador.
6 6MA* MM, S
L a s p r e m i s a s d & i a c t i m d o
La elaboracin da la argumentacin evaluattva pate de la base det
acuerdo entre los destinatarios. Las premisas de la argumentacin <unsWuyeM
el principio de este acuerdo y el punto de partid* do acuet do* na* empati e
Del mismo modo que el sentido comn admita vent ados intocables e nnvs
cutibles, algunas de las premisas principales de una eval uaos atan tcita*
y no explcitas.
Segn Per eiman y Our ioht *Tyt ioa (1009), hay dos clases da pienueea
las ' reales' y las preferibles . Entre las reales otttan los hechos, las verdades
y los supuestos bsicos y, por regla general, la presuncin ci valida
respecto a una audiencia universal. Por otra parte, las preferibles se itieniiian
con unos destinatarios concretos y abarcan vsloiea, | eraiqulei* de valoies
compuestas y premisas de valor de carcter muy general, denominadas
toe/ ".
Los hechos y las verdades son datos 0ideas que no consideren acapto
das por la audiencia universal, es decir, compartidas por los seres pensantes
y, por tanto, sin necesidad de justificacin. Qu un tlnl constituya un hecho
depende de la propia concepcin de Id audiencia universal. Si 6*ta cambia,
tambin loa hechos y verdades. No obstante, el mantenimiento de la <atanor la
de hecho o verdad significa que, a los efectos del raionamlento, el dato ea
incontrovertible e indiscutible. SI se cuestiona el dato, pierde su catego*
ra de hecho y pasa a ser tema de argumentacin en ve/ de objeto d
acuerdo.
Cuando existe acuerdo sobre las condiciones de verificacin, como en
la ciencia moderna, pueden darse muchos hechos. La ciencia moderna no
concede la categora de hechos" a muchos datos Pol anvi (1P&0) pone de
manifiesto cmo la ciencia protege de la incoherencia a *us propios sistemas
de creencias medante la negacin de diversos datos que se oponen a
otras creencias que tienen el carcter de hechos. Asi, fluanlo muchos
aos, la ciencia descart que los efectos hipnticos se produjesen da ningn
modo. No se reconoca el carcter de hechos de los dato* en cuestin
porque entraban en contradiccin con el sistema cientfico da creencias
entonces vigente. Este sistema de creencias se modifica cada ciarto tiempo,
pero, con independencia de lo que excluya, loa argumentoque se produscen
en el marco del sistema de creencias deben basarr*e en hechos y verdades
indiscutibles.
Los argumentos tambin proceden de supuestos bsicos que eef Oift
de la autoridad y fiabilidad plenas de los hechos y verdades Loa supuestas
bsicos no pueden probarse, no obstante sean aceptados de modo bsteme
general como provisionalmente verdaderos. Muchos supuestos bSiOQeesttft
relacionados con el concepto de lo normal. En las evaluaciones que emplean
modelos y metforas estadsticos, se acepta de forma cae* 1torrarse! et
supuesto bsico que atribuye una distribucin normal a una pnNnctOn
La segunda case de objetos de acuerdo ea la de lo preJerSe tu*
objetos preferibles slo reclaman la adhesin de grupoe concreto* y no de
Eval uaci n, ti ca y POcjf
una audiencia universal. Los valores constituyen los ejemplos ms sobre,
salientes. El acuerdo respecto a un valor supone admitir que existe una in'
fluencia especifica sobre la accin o una disposicin a la accin que gj
evaluador puede utilizar. Aunque sea importante para un grupo determinado
no se considera que el valor vincule a nadie en concreto.
En la ciencia, los valores aparecen ante todo al seleccionar los objetos
de inters para la investigacin, ya que es imposible investigar el mundo
entero (Polanyi, 1958) y, quiz, en la aceptacin de las conclusiones cient
ficas por medio del juicio humano global (Wei z en b a u m, 1976). Pero, en el
desarrollo de la mayor parte de la argumentacin, sobre todo en las ciencias
exactas, los valores se dan por excluidos. El anlisis de las relaciones entre
causa y efecto de Enni is (1973) nos lleva a cuestionar esto mismo. En la
evaluacin, nada impide que los valores aparezcan a cada momento. Los
valores se utilizan para persuadir a los destinatarios y para justificar las
opciones que se hagan ante los dems.
Diversas combinaciones de argumentos pueden compendiarse en unas
pocas agrupaciones generales denominadas loci (Per el ma n y Ol br ech t s-
Ty t ec a , 1969). Los loci ms comunes son los de cantidad y calidad. Los
argumentos agrupados en torno a los loci de cantidad afirman que una
cosa es mejor que otra por razones cuantitativas (mayor nmero, mayor
grado, mayor durabilidad, etc.). Con frecuencia, la eficacia de los medios se
justifica mediante loci cuantitativos. Las ideas de "normal y "norma tambin
se basan en la cantidad.
En contraste con la cantidad, est la idea de calidad. Hay cosas que
ostentan un valor elevado a pesar de su pequeo nmero. La valoracin
elevada de lo nico se asocia a la calidad. Un individuo puede estar en
posesin de la verdad mientras la multitud permanece en el error. Por
ejemplo, Scri ven (1972) defiende que la nocin de objetividad no tiene por
qu estar vinculada a la cantidad de personas que sostienen determinada
idea, ni la de subjetividad a la propia percepcin de una persona, como se
piensa a menudo.
Junto a los razonamientos generales sobre hechos y valores, existen
acuerdos especiales restringidos a determinados destinatarios especiales y
propios de cada evaluacin. En la medida en que la evaluacin se dirige a
unos destinatarios tcnicos, stos compartirn determinados acuerdos y
convenciones. Un grupo de investigadores de la educacin constituye un
conjunto de destinatarios tcnicos de este tipo. Las evaluaciones que se
dirigen a unos destinatarios inexpertos en la materia no pueden basarse en
los mismos acuerdos.
Es posible que los acuerdos peculiares ms importantes de una eval a-
cin concreta se deriven de la negociacin que con frecuencia precede a la
evahiacin (acuerdos entre patrocinadores, personal que part i ci pa en
programa y evaluadores). En esta importantsima negociacin, pueden
canzarse acuerdos sobre los criterios, mtodos y procedimientos, acceso a
ios datos, divulgacin de resultados, etctera. Los desacuerdos sobre esto5
aspectos pueden acabar completamente con la credibilidad de la eval uaci n
La lgi ca de la argumentacin evaiuativa 77
En resumen, al principio de la evaluacin el evaluador debe basarse en
los acuerdos con los destinatarios. Estos acuerdos pueden ser tanto impldlos
como explcitos. En realidad, sera imposible especificar con minuciosidad
todos los aspectos, aunque es peligroso dar por supuesto el acuerdo sobre
temas importantes cuando no existe. El evaluador debe partir de la postura
de sus destinatarios, aunque las premisas iniciales no sean aceptables
para terceras partes ni para el mismo evaluador siquiera. En caso contrario,
la evaluacin no ser creble ni persuasiva. Como mnimo, debe darse una
comprensin compartida de la situacin. Si discrepan en exceso los valores
bsicos, el evaluador puede optar por no llevar a cabo el estudio. Por
supuesto, esta comprensin bsica est sometida a las concepciones de
decencia y justicia que prevalecen en la sociedad en conjunto, y el evaluador
puede basarse en estas concepciones sociales ms generales.
Todo esto no significa que el evaluador tenga que estar de acuerdo en
todo con sus destinatarios. Es probable que existan reas de desacuerdo,
pues, si no, no haran falta argumentos. Es posible que los destinatarios
quieran aprender algo nuevo o, de lo contrario, no hara falta evaluar. Pero
la evaluacin parte de reas en las que existe el acuerdo, para alcanzar
aquellas otras en las que el acuerdo es problemtico.
La argumentacin cuantitativa
El enfoque ms popular de la evaluacin es el cuantitativo. Algunos lo
consideran como la autntica esencia de la racionalidad y del mtodo
cientfico. Ha producido muchos buenos estudios de evaluacin (y muchos
malos tambin). Como este enfoque se ensea en los centros superiores y
se promueve en la bibliografa, no necesitamos extendernos en sus virtudes,
que son muchas. En este apartado pretendo mostrar que incluso la meto
dologa cuantitativa consiste esencialmente en argumentos y est sometida
a similares consideraciones. Utilizada de manera adecuada, puede ser una
valiosa herramienta de anlisis; empleada de forma inadecuada, es peli
grosa.
La metodologa cuantitativa constituye un cuerpo de mtodos matemticos
y tcnicas de medida a disposicin del evaluador. La utilidad de la meto
dologa depende de las semejanzas entre los problemas tericos de ios
que sta se ocupa y los problemas efectivos a los que se enfrenta el
evaluador en un medio concreto. Por su parte, Cr o n bac h (1974) ya ha
sealado que el ajuste entre los problemas tericos y efectivos no es buena
El contexto educativo es demasiado complejo.
Un matemtico de la Rand Corporation (St r a u c h , 1976) exami n las
dificultades que presenta la metodologa cuantitativa cuando se apl i ca a
estudios polticos, o sea, a cuestiones que surgen a partir de i os procesos
gubernamentales de toma de decisiones. Segn St r a u c h , en la medid* en
que la metodologa es matemtica, la estructura de lo determinado por las
$ ickcMMeeMan*, S t.
j* 19 iSMMMMI Lsjk /00nvUtijy&r' to*j ^xtoj ^ns y r
**j*rf*t. ?; <&&&&>* ws *&** wpme sahitr que exsl e t n ?
tap&S ifw&jAfj* 0t$$ & a c o n o ($$a dtspassac^fi a l a a c c i n que .
*fWj*tlFp iMtt $$2 A \ & t importante para un grupo det em-^v
*Ki | 4tsMr 41 * Jtar SSS^ a i$$($ en oonoreiP.
(/<* $l$| > ^ i^^isp iipareosH ams todo ai seteccionaf los o b ^-.
4$ MMI JNM9 l l ya Que (Si imposiste investigar ss
4rt| Ati9
cMz es
jf *e Jnepteciini de las conclusiones c* ^r-
i o n pm wto M po o 0MM (WnrrmMM 1976). Pero, en <-
def r*
irtsde ls
srgumanlacia eotxe todo en las deoe
wwM & tuto/reseed rpore*
iduxtof. O anlisis de las relaciones entre
mum i eiedo <
le IbifNft5(1973) i
w tieya a cuestionar esto mitsmo. En
Wldi wnpide <que tas valores aparezcan a cada momento. Los
yf i Vl i 19 Uflfc/Sm (Me p em ui
ir a los destmatanos y para justificar tas
of/ c*x*es y$ M
hagan <me los clems
0Mm coefcntcwnei de argumentos pueden compendiarse en unas
fKItf Mt t pt conf f 9nra#f denominadas 'toe/ " (Pzr el man y Ol srecht s.
rlTOCA. 1000) Lo# toe/ ms comunes son los de cantidad y calidad. Los
Mtf f iiintQl agrupados en torno a los toe/ de cantidad afirman que una
jjjp| e* ()U9 ot/a por fBZOfW$ cuantitativas (mayor nmero, mayor
yuto, m t durabilidad. etc j Con frecuencia, la eficacia de los medios se
0$f mediante loci cuantitativaos Las ideas de "normal" y "norma tambin
se bft^sn en 1$ centidad
i n contraste con la cantidad, est la idea de calidad. Hay cosas que
ostenten un valor afevado i posar do su pequeo nmero. La valoracin
eievsds d# lo nico se asocia a la calidad Un individuo puede estar en
posesin de la verdad mientras la multitud permanece en el error. Por
ejifwpto, toi ivf N (W2) defiende que la nocin de objetividad no tiene por
qu star vinculada la cantidad do personas que sostienen determinada
d, ni || (\tt subjetividad a la propia percepcin de una persona, como se
piensa i menudo.
Junto a los razonamiento! generales sobre hechos y valores, existen
oruardo* nprtcisles restringidos a determinados destinatarios especiales y
pr(i()int} rin r &ds evaluacin En la medida en que la eval uacin se dirige a
Kt $#itlliirl@8 tcnicos, stos compartirn determinados acuerdos y
oonvenftlones Un grupo de investigadores de la educacin constituye un
conjunto dn dimtinstarios tcnicos de este tipo. Las eval uaciones que se
dingan $ unos destinatarios inexpertos en la materia no pueden basarse en
ios mismos acuerdos.
I * posible qim km acuerdos peculiares ms Importantes de una e v a l a -
ion r iitK mtnn deriven do la negociacin que con frecuencia precede a Ia
evaluacin (acuerdos anuo patrocinadores, personal que participa en G'
prggrfiffia y evaluadores). Bn esta Importantsima negociacin, pueden al'
**n/ ars* fjt uerdos i obr los criterios, mtodos y procedimientos, acceso a
tos detos divulgacin da resultados, etctera. Los desacuerdos sobre esto5
iMifiorto* pueden acabar completamente con la credibilidad de la evaluacin
i a pea -fltete t gungrt Bct cr gagUuaftua
En resumen. ad prnopo de ta evafcjaoon ei evaluador debe desase en
os acuerdos con tos destnaftanos Estos acuerdos pueden ser tanto npficiios
como expl o tas En readad. seria npostoie espeoficar con mnuoi osxM
lodos tos aspectos, aunque es peigroso dar por supuesto e8 acuerdo sobre
lemas importantes cuando no existe B evaluador debe partir de la postura
de sus destinatarios, aunque las premisas nidales no sean aceptables
para terceras partes ni para el mismo evaluador siquiera. En caso contrario,
la evaluacin no ser creble ni persuasiva. Como mnimo, debe darse una
comprensin compartida de ta situacin. Si discrepan en exceso los valores
bsicos, el evaluador puede optar por no Nevar a cabo el estudio. Por
supuesto, esta comprensin bsica est sometida a las concepciones de
decencia y justicia que prevalecen en la sociedad en conjunta y el evaluador
puede basarse en estas concepciones sociales ms generales.
Todo esto no significa que el evaluador tenga que estar de acuerdo en
todo con sus destinatarios. Es probable que existan reas de desacuerdo,
pues, si no, no haran falta argumentos. Es posible que ios destinatarios
quieran aprender algo nuevo o, de !o contrario, no hara falta evaluar. Pero
la evaluacin parte de reas en las que existe el acuerdo, para alcanzar
aquellas otras en las que el acuerdo es problemtico.
La argumentacin cuantitativa
El enfoque ms popular de la evaluacin es el cuant it at i vo. Al gunos lo
consideran como la autntica esencia de la racionalidad y del mt odo
cientfico. Ha producido muchos buenos estudios de eval uaci n (y muchos
malos tambin). Como este enfoque se ensea en los cent ros superi ores y
se promueve en la bibliografa, no necesitamos extendemos en sus vi rt udes,
que son muchas. En este apartado pretendo mostrar que i ncl uso l a met o
dologa cuantitativa consiste esencialmente en argumentos y est somet i da
a similares consideraciones. Utilizada de manera adecuada, puede ser una
valiosa herramienta de anlisis; empleada de forma i nadecuada, es pel i
grosa.
La metodologa cuantitativa constituye un cuerpo de mt odos mat emt i cos
y tcnicas de medida a disposicin del evaluador. La ut i li dad de la met o
dologa depende de las semejanzas entre los problemas t eri cos de los
que sta se ocupa y los problemas efectivos a los que se enf rent a el
evaluador en un medio concreto. Por su parte, Cr o n b a c h (1974) ya ha
sealado que el ajuste entre los problemas tericos y efectivos no es buena
El contexto educativo es demasiado complejo.
Un matemtico de la Rand Corporation (St r a u ch , 1976) examin l as
dificultades que presenta la metodologa cuantitativa cuando se apl i ca a
estudios polticos, o sea, a cuestiones que surgen a part i r de los procesos
gubernamentales de toma de decisiones. Segn St r a u c h , en l a medi da an
que l a metodologa es matemtica, la estructura de lo det ermi nado por las
premisas que definen el sistema constituye un sistema cerrado*. El anlliir,
matemtico consiste en el estudio de esa estructura, tal como se deriva
lgicamente de las premisas. Los resultados estn conectados con |q s
pfpfls mediante inferencias lgicas En el sentido en que su valide?
puedo determinarse sobre la base de esa cadena de razonamiento, |q 8
resultados son "objetivos" (no hace falta apelar a la competencia o al juicio
de la persona que los obtuvo ni a sus destinatarios). Los resultados son
necesariamente lgreos. En la argumentacin, en cambio, no pueden sepa
rarse por completo de la persona que los obtiene.
La aplicacin de la metodologa cuantitativa a problemas efectivos utiliza
un modelo matemtico como representacin simplificada del problema. Los
resultados dependen, en parte, del anlisis matemtico, pero tambin del
ajuste entre el modelo y el problema real. En las aplicaciones ms sencillas,
como en las ciencias fsicas, los problemas reales son rigurosamente cuan-
tificables, El control experimental refuerza la capacidad del evaluador para
hacer que el problema real se adapte al modelo matemtico, por ejemplo la
seleccin aleatoria en los modelos estadsticos. En esos casos, las conclu
siones son objetivas" en el sentido de que estn sujetas a verificacin
independiente sobre la base de la lgica y del ajuste, sin referencia al juicio
de la persona que las elabor. Sin embargo, cuanto ms conductual o
poltico sea el problema real, ms difcil resulta definirlo sin ambigedad en
trminos matemticos. Las relaciones entre la realidad y el modelo se
hacen ms dbiles.
En un estudro cuantitativo del tipo mencionado, St r a u c h identifica los
siguientes componentes: la formulacin supone definir el problema formal a
partir del problema real, estableciendo despus un modelo matemtico del
problema formal. Se trata de un procedimiento de reduccin. El anlisis
ttpone el cmputo en el contexto matemtico definido por el modelo. Se
M u c e en enunciados matemticos. La interpretacin consiste en la reinte
gracin de los enunciados al problema formal; y, por ltimo, la interpretacin
S estas conclusiones depende tanto de la validez lgica del anlisis como
de la validez de las relaciones entre el modelo y el problema real. Aunque
te validez lgica puede determinarse sin referencia al juicio subjetivo del
anahsta, no as las relaciones. Estas ltimas se fundan en los juicios subjetivos
del analista. Tanto la formulacin como la interpretacin son procesos sub
jetivos La formulacin requiere reducir las dimensiones del problema r eal
El lrmtn utilizado en al original es "self-contained", traducido a vocea como "autocon
tenidoIndependiente", que tiene aus propios recuraos". Optamos por la expresin sistem'
cerrado" porque rattya de manera ms clara la intencin del autor, sobre todo t i tenemos en
coarta la importancia que, para el estudio de loa sistemas sociales, tiene la teora general de
M M m M * de jcMg von Bwtaianffy (General Systems Theory. Foundations, Q$velopmel,i
AfiphcMcmt, Nueva York George Braziller, 1968. Trad. cast.: Teora general dj/kjttem#'
fn de Cultura Econmica) y, ms en concreto, la dinmica de sistemas" de Jay
W Fowmst m (Industrial Dynamics. M.I.T. Presa, 1961). En este contexto, sistema cerrado '5
aqul que *o ntar acta con variables externas a si mismo, como 8ucede en el alaterna I I due
te ceia^e (N. del T.f
n Qvai uaoin, ai ioa u
L l gi ca d* la argument aci n t val uat l va 79
para hacerlas manejables mediante el anlisis, aadiendo, quiz, algunos
supuestos que hagan ms fcil el anlisis, aunque pueda resultar discutible
en la perspectiva real, por ejemplo, la independencia de los acontecimientos.
La interpretacin supone restaurar las consideraciones contextales que
hablan sido eliminadas y, posiblemente, ajustarlas a causa de los supuestos
slmpliflcadores. Tanto la formulacin como la interpretacin requieren dosis
considerables de juicio intuitivo. En consecuencia, las conclusiones no son,
en realidad, tan "objetivas" como se afirma (vase el tratamiento de la
objetividad que hacemos en un apartado posterior).
La forma usual de ocuparse del aspecto subjetivo de la metodologa
consiste en dejarlo de lado. En las ciencias naturales, en donde los mtodos
cuantitativos han cosechado tantos xitos, esto no constituye un gran pro
blema. La evidencia de "objetividad" en esos campos se toma como prueba
de objetividad en otras reas. Cuando se cuestiona esta relacin, empieza
a quedar claro que las premisas que le sirven de fundamento son muy
discutibles.
A menudo, de los estudios cuantitativos se han derivado perspectivas
interesantes, pero stas suelen deberse ms a los juicios intuitivos correctos
del analista que a los clculos bien hechos. Estos xitos se atribuyen con
facilidad a la metodologa cuantitativa en vez de al juicio. Las crticas suelen
centrarse ms en la calidad tcnica del anlisis matemtico que en la
calidad de los juicios asociados a la formulacin e interpretacin. Cuando
se discute la calidad del juicio, la justificacin debe basarse en el tipo de
razonamiento comn a toda argumentacin.
Un resultado de infravalorar el papel del juicio es lo que podemos denomi
nar, con St r a u c h , "anlisis orientado al mtodo". El analista deja de lado las
complejidades del contexto y se sumerge en su mtodo preferido. Vista en
una perspectiva superficial, la metodologa se aplica de forma directa, como
si no existiesen problemas de ajuste. Al final, se plantean unas cuantas adver
tencias, indicando que compete a los lectores decidir si el ajuste es bueno.
En su forma extrema, hay una escuela de pensamiento, que S t r a u c h
denomina "cuantificacionismo", que sostiene que la cuantificacin es un
valor positivo en s misma. Una respuesta cuantitativa siempre es mejor que
otra cualitativa. Cualquier problema puede reducirse a una solucin cuanti
tativa y ningn problema llega a comprenderse de manera adecuada hasta
que no se consigue. Por tanto, los mtodos cuantitativos deben aplicarse a
todos los problemas. Es probable que esta postura sea falsa, dado que, en
realidad, pocas personas la suscribiran.
Esa actitud, que favorece la metodologa "cientfica", se basa en un re-
duccionismo que trata un fenmeno como un sistema aislado, elabora un
modelo cuantitativo para ese sistema y utiliza el modelo como sustituto del
fenmeno. Como sealamos antes, el reduccionismo puede ser un elemento
de las ciencias fsicas intransferible a los fenmenos sociales.
La imagen de los proyectos cuantificacionistas es la de un proveedor de
"hechos" objetivos basados en datos contundentes. No se responsabiliza
personalmente de las conclusiones a las que puedan llegarse mediante su
% UMMi MonMi & t
mat odotoga. dado que no son suyas. Sk> se dimita a descubrirlas y a
H H de E resul t ados de sus mt odos obj et i vos. Desdea los datos c J!
ntatvo5> como suj et i vos
Est a acti tud se aproxi ma a lo que Pol anyi (1958) describa como obj e
t msmo en i a ci enci a. Es un i ntento para def i ni r un mtodo obj et i vo qu'
edrrne l a responsabi l idad del observador respect o de sus hallazgos. Pol an!
depende, en cambi o, que una convi cci n requi ere el compromiso y la res'
poosaMt dad personal es i ncl uso en ia ci enci a. El objetivismo ha t rat ado ^
represent ar ei conoci mi ent o ci ent f i co como t ot al ment e impersonal.
A menudo, el cuant f i caci oni smo y el obj et i vi smo convienen t ambi n ai
responsabl e de l as deci si ones en l a medi da en que ste pued^ j i j #f i cari a
medi ante la ref erenci a a un descubri mi ent o ci ent f i co". Esto puede ayudarl e
9 el udi r su responsabi l i dad personal . Las t ent at i vas de cuantificacin de
probl emas no cuantrf icabi es y de pasar por alto l os factores judiciales acaban
def ormando el proceso de deci si n.
Indi ca St rauch que un modo de el i mi nar esa deformacin consiste en
uti lizar los mt odos cuanti tati vos como perspectivas respecto del problema
real, en vez de como sustitutos. La acept aci n del modelo matemtico
como representaci n vl i da del probl ema real supone utilizarlo como sustituto.
i empl eo del model o para i nt egrar hal l azgos con el conocimiento que ya
se posee si gnif ica uti lizarlo como perspect i va.
Respecto a la mayor parte de los problemas reales, los destinatarios de
la evaluacin ya poseen imgenes bien elaboradas por s mismos. El anlisis
cuantitativo puede proporcionar a los destinatarios una visin adicional, aunque
no necesariamente mejor ni ms vlida, del problema. La interaccin ^entre
las propias imgenes y las perspectivas adicionales debe producirse en el
interior de cada destinatario, de cada responsable de depisiones o de qui en
corresponda. S slo se utiliza la metodologa cuantitativa como una pers
pectiva, se reduce el problema del ajuste entre el modelo y el problema real.
Por otra parte, tanto el evaluador como los destinatarios deben respon
sabilizarse de modo personal de los hallazgos, dado que no se derivan
necesariamente del anlisis. Las conclusiones no pueden Justificarse por
completo sobre la base de que se derivan, en buena lgica, de los supuest os
de partida. La evaluacin de cada uno de los supuestos debe co mp l e t a r s e
con la evaluacin global del total.
Por tanto, la argumentacin cuantitativa debe utilizarse siempre en con
juncin con el juicio humano y ste debe ocupar una posicin superior. Las
consecuencias para el argumento cuantitativo en la evaluacin son impoi''
tantea. La metodologa cuantitativa debe considerarse fundada en los juicios
humanos y en el razonamiento intuitivo, justificndose en consecuencia.
La argumentacin cuailtatlva
ti i &u articulo sobre el conocimiento cualitativo, Campbell (1974) indcate
,4iJf. $1 conocimiento cientfico depende del sentido comn v a u ^ o ^ i g d 2 L
La ilgica de la argumentacin evaiuativa Si
concret os, sean de l a ci enci a o del senti do comn, sl o Siegan a conocerse
en el conj unt o de muchos ot ros hechos. La proporci n ent re l o f i abl e y l o
dudoso es si empre una f racci n muy pequea . En reali dad, cual qui er co
noci mi ent o de al go depende del contexto y, segn Ca mp b el l , el conoct mi ent o
cual i t at i vo de t otal i dades y paut as" proporci ona el context o necesari o para
i nt erpret ar l os dat os cuanti tati vos. Por ej emplo, l a el aboraci n de hiptesi s
al t ernat i vas requi ere conocer bi en el medi o l ocal, un act o cuali tati vo.
Campbel l pi ensa que se ha dej ado de l ado el conoci mi ent o cuali tati vo
en benef i ci o de l os mt odos cuantitati vos. Le gustara que se uti lizaran
conj unt ament e l os mt odos cual i tati vos y cuantitati vos con el fin de ef ectuar
val i daci ones mut uas entre ambos ti pos. Cree que l os mt odos cuantitati vos
pueden proporci onar perspect i vas que l os cual i tati vos no son capaces de
f aci l itar, a pesar de l a mayor f undament aci n de estos lti mos. Asi mi smo,
como t odo conoci mi ent o es esenci al ment e comparati vo, cree que las tcnicas
cual i t at i vas, como l os est udi os de casos, pueden mej orarse medi ant e con
si deraci ones rel at i vas al di seo experi ment al , que, a su modo de ver, no
f orman part e excl usi va de l a met odol oga cuant i t at i va
Al sopesar de nuevo la necesidad e, incluso, la prioridad del saber
I cualitativo, Ca mpb e l l (1975) revisa la observacin naturalista, anecdtica y
de caso nico. La generalizacin cuantitativa se opondr en algunos as
pectos a este conocimiento, pero slo por confiar en un conjunto mucho
mayor de observaciones de ese tipo. En su clsico documento sobre el
diseo experimental, Ca mpbe l l y St a nl e y (1966) mencionan el estudio de
casos, considerando que carece de base de comparacin y, en conse-
I cuencia, de justificacin para extraer inferencias causales.
Ca mpb e l l ha modificado considerablemente su postura y ahora considera
que el estudioso de casos hace muchas previsiones sobre la base de su
teora, que puede quedar invalidada. Se trata de un proceso de ajuste del
modelo en el que los distintos aspectos de ste se confrontan con las
observaciones del medio local. En la actualidad, Ca mpbel l cree que el
estudio de caso nico constituye una base de conocimiento ms segura de
I lo que pensaba antes.
Segn Ca mpb e l l , cmo podemos conocer algo? A partir de las dificul
tades epistemolgicas actuales, busca un fundamento seguro del conoci-
I miento. El esfuerzo para eliminar la equivocidad, basando el conocimiento
en datos sensoriales concretos y el espritu del atomismo lgico se orien-
I tan en el mismo sentido de bsqueda de la certeza en los aspectos concre
tos (Ca mpb e l l , 1966). La certeza se lograra mediante la definicin de
I aspectos concretos incorregibles. Esto se traducira en trminos especifi-
cables de modo inequvoco y en una certeza de comunicacin.
En la actualidad, Ca mpb e l l cree que esta forma de positivismo es insos-
I tenible, tanto desde el punto de vista de la filosofa como de la psicologa.
Las cosas fuera de contexto no son interpretables. Pero, cmo podemos
an conocer algo partiendo de un conjunto de acontecimientos, cada uno
de los cuales es de por s indeterminado? Ca mpb e l l afirma que esto se
consigue mediante el "ajuste del modelo.
GcNoorm Morata, S L.
metodologa, dado que no son suyas. Slo se limita a descubrirlas y a
formar de los resultados de sus mtodos objetivos. Desdea los datos cn^
litativos como subjetivos.
Esta actitud se aproxima a lo que Po l a n y i (1958) describa como objp
tivismo en la ciencia. Es un intento para definir un mtodo objetivo qu'
elimine la responsabilidad del observador respecto de sus hallazgos. Pol ai ^
defiende, en cambio, que una conviccin requiere el compromiso y la res'
ponsabilidad personales incluso en la ciencia. El objetivismo ha tratado
representar el conocimiento cientfico como totalmente impersonal.
A menudo, el cuantificacionismo y el objetivismo convienen tambin ai
responsable de las decisiones en la medida en que ste puede justificarlas
mediante la referencia a un descubrimiento cientfico. Esto puede ayudarle
a eludir su responsabilidad personal. Las tentativas de cuantificacin de
problemas no cuantificables y de pasar por alto los factores judicialespcaban
deformando el proceso de decisin.
Indica St r a u c h que un modo de eliminar esa def ormaci n consiste en
utilizar los mtodos cuantitativos como perspectivas respect o del problema
real, en vez de como sustitutos. La aceptacin del model o matemtico
como representacin vlida del problema real supone ut il izarl o como sustituto.
El empleo del modelo para integrar hallazgos con el conocimiento que ya
se posee significa utilizarlo como perspectiva.
Respecto a la mayor parte de los problemas reales, los destinatarios de
la evaluacin ya poseen imgenes bien elaboradas por s mismos. El anlisis
cuantitativo puede proporcionar a los destinatarios una visin adicional, aunque
no necesariamente mejor ni ms vlida, del problema. La interaccin entre
las propias imgenes y las perspectivas adicionales debe producirse en el
interior de cada destinatario, de cada responsable de decisiones o de quien
corresponda. Si slo se utiliza la metodologa cuantitativa como un$ pers
pectiva, se reduce el problema del ajuste entre el modelo y el problema real.
Por otra parte, tanto el evaluador como los destinatarios deben respon
sabilizarse de modo personal de los hallazgos, dado que no se plerivan
necesariamente del anlisis. Las conclusiones no pueden justificarse por
completo sobre la base de que se derivan, en buena lgica, de los supuest os
de partida. La evaluacin de cada uno de los supuestos debe completarse
con la evaluacin global del total.
Por tanto, la argumentacin cuantitativa debe utilizarse siempre en con
juncin con el juicio humano y ste debe ocupar una posicin superior. Las
consecuencias para el argumento cuantitativo en la evaluacin son impor
tantes. La metodologa cuantitativa debe considerarse fundada en tos juicios
humanos y en el razonamiento intuitivo, justificndose en consecuencia.
La argumentacin cualitativa
En su artculo sobre el conocimiento cualitativo, Ca mpb e l l (1974) i n d i c a d
que el conocimiento cientfico depende del sentido comn y que los / hechos
dicK>nM Morarte, 8. L
La lgica de la argumentacin evaluativa w k
concret os, sean de la ci enci a o del sentido comn, sl o llegan a conocerse
en el conj unt o de muchos otros hechos. La proporcin entre lo fiable y lo
dudoso es si empre una f raccin muy pequea. En realidad, cualqui er co
noci mi ent o de al go depende del contexto y, segn Campbel l , el conocimiento
cual i tat i vo de t otal i dades y pautas proporci ona el contexto necesari o para
i nt erpret ar los dat os cuantitati vos. Por ej emplo, la el aboraci n de hiptesis
al t ernati vas requi ere conocer bi en el medi o local, un acto cualitativo.
Campbel l pi ensa que se ha dej ado de lado el conoci mi ento cualitativo
en benef i ci o de los mtodos cuantitativos. Le gustara que se utilizaran
conj unt ament e los mt odos cuali tati vos y cuantitativos con el fin de ef ectuar
val i daci ones mut uas entre ambos ti pos. Cree que los mtodos cuantitativos
pueden proporci onar perspecti vas que los cualitativos no son capaces de
f aci li tar, a pesar de la mayor f undamentaci n de estos ltimos. Asi mi smo,
como t odo conoci mi ent o es esencialmente comparativo, cree que las tcnicas
cual i t at i vas, como los est udi os de casos, pueden mej orarse medi ante con
si deraci ones rel at ivas al di seo experi mental, que, a su modo de ver, no
f orman parte excl usi va de la metodologa cuantitativa.
Al sopesar de nuevo la necesi dad e, i ncluso, la prioridad del saber
cual i t at i vo, Ca mp b e l l (1975) revi sa la observaci n naturalista, anecdti ca y
de caso ni co . La general i zaci n cuantitativa se opondr en al gunos as
pect os a est e conoci mi ent o, pero sl o por conf iar en un conjunto mucho
mayor de observaci ones de ese tipo. En su clsi co documento sobre el
di seo experi ment al , Ca mp be l l y St a n l e y (1966) menci onan el estudio de
casos, consi derando que carece de base de comparaci n y, en conse
cuenci a, de j ust if i caci n para extraer i nf erencias causales.
Campbel l ha modi f icado considerablement e su postura y ahora considera
que el est udi oso de casos hace muchas previ si ones sobre la base de su
t eora, que puede quedar i nval i dada. Se trata de un proceso de ajuste del
model o en el que los di sti ntos aspect os de ste se conf rontan con las
observaci ones del medi o l ocal. En la actual idad, Campbel l cree que el
est udi o de caso ni co consti tuye una base de conoci mi ent o ms segura de
lo que pensaba ant es.
Segn Campbel l , cmo podemos conocer al go? A partir de las dificul
t ades epi st emol gi cas act ual es, busca un f undamento seguro del conoci
mi ent o. El esf uerzo para el i mi nar la equivoci dad, basando el conoci mi ent o
en dat os sensori al es concret os y el espritu del atomismo l gico se orien
t an en el mi smo sent i do de bsqueda de la cert eza en los aspect os concre
t os (Campbel l , 1966). La cert eza se l ograra medi ant e la def i ni ci n de
aspect os concret os i ncorregi bl es . Est o se t raduci ra en t rmi nos especi f i -
cabl es de modo i nequvoco y en una cert eza de comuni caci n .
En la act ual i dad, Campbel l cree que est a f orma de posi ti vismo es i nsos
t eni bl e, tant o desde el punt o de vist a de la filosofa como de la psi col oga
Las cosas f uera de context o no son interpretabl es. Pero, cmo podemos
an conocer al go part i endo de un conj unt o de acont eci mi ent os, cada uno
de l os cual es es de por s i ndet ermi nado? Campbel l af i rma que esto se
consi gue medi ant e el aj uste del model o .
Frrinngrj Mo t h S (
f vil uacln, tica v *
----------
En acontecimientos relativos a la cognicin, como la visin binculo
los ojos reconocen los objetos corrientes mediante un proceso de triangul'
cin. Cuanto ms elaborado es el modelo, ms improbable resulta un err0
de reconocimiento, desde el punto de vista estadstico. Por medio de J
memoria, pueden compararse varios modelos. Ca mpb e l l considera el ajuste
del modelo como un proceso de ensayo y error. Se trata esencialmente de
pensamiento analgico, siempre presente, segn Campbel l , en el proceso
de conocimiento.
En realidad, la teora cientfica constituye la instancia ltima del conoc,
miento y la relacin entre la teora formal y los datos es de ajuste del
modelo, con un error asignado a la medida de los datos (puntuaciones
verdaderas y puntuaciones estimadas"), salvo cuando se est de acuerdo
en la necesidad de revisar la teora. Hay que ajustar dos modelos: el de la 1
teora y el de los datos. La aceptacin o rechazo de la teora est sometida
a algn criterio de ajuste entre ambos. En realidad, nunca se rechaza una
teora a causa de su falta de ajuste, salvo si existe una teora alternativa'que I
la sustituya. Lo que hace que una teora sea correcta es la falta de
hiptesis rivales aceptables.
Campbel l piensa que estas consideraciones se aplican de forma directa
a las cuestiones relativas a la evaluacin de programas. Creo que los pro
blemas de equivocidad de las pruebas respecto a la eficacia de los progra-
mas son tan afines a los problemas generales de inferencia cientfica que
nuestras extrapolaciones a recomendaciones sobre procedimientos de eva
luacin de programas pueden estar bien fundadas, con la adecuada crtica
mutua."
Si entiendo bien su postura, Campbel l afirma que la eval uaci n constituye
un aspecto de la investigacin cientfica y est sujeta a probl emas episte
molgicos semejantes. Aunque pueda ser cierto, al menos, en est e captulo, J
he invertido de alguna manera la relacin entre figura y f ondo, consi derando ]
la ciencia como una argumentacin dirigida a una audiencia universal que, I
por tanto, se ocupa del establecimiento de generalizaciones a l arg plazo, y I
la evaluacin como una argumentacin que se dirige a dest i nat ari os con
cretos, ocupndose de cuestiones relacionadas con un cont ext o deter-1
minado.
Podemos considerar que, en la evaluacin, el ajuste del model o no slo
se produce en la mente del evaluador, cuando estructura su est udi o y
examina el ajuste entre su descripcin del programa y el programa en s,
sino tambin en tas mentes de ios destinatarios, cuando comparan el estudie'
de evaluacin con su propia experiencia. Los destinatarios t ambi n tienen
imgenes, recuerdos y teoras sobre el programa sometido a eval uaci n
Utilizando la evaluacin como perspectiva (un modelo verbal, en est e caso)
los destinatarios comparan sta con su concepcin del programa. Los errori
se atribuirn dependiendo de la capacidad de persuasin de la eval uaci n
De este modo, I09 destinatarios operan como hitos independientes de va' 1
dacin de la evaluacin, debiendo asumir un papel activo en sSHpr pr et ac^
y responsabilizndose personalmente de esa interpretacin.
La lgica de la argumentacin avaluotiva
Segn Ca mp b el l , el proceso bsico de ajuste del modelo es ms anal
gico que lgico (aunque no cabe duda de que el proceso lleva consigo
muchas formas de razonamiento). En realidad, podemos llegar ms lejos
En una epistemologa basada en la eliminacin de la equvocidad y en el
establecimiento de la certeza del conocimiento mediante la definicin de
aspectos concretos incorregibles, el razonamiento deductivo y el inductivo
constituyen el modo adecuado de relacionar esos aspectos. La lgica forma)
depende de trminos unvocos que operen en un sistema cerrado.
En la medida en que los trminos sean ambiguos y el sistema abierto (o
no reducible a subsistemas aislados), la lgica formal slo puede aplicarse
de manera argumentativa. El razonamiento ha de incluir otras formas de
pensamiento, salvo que aceptemos la imposibilidad del anlisis racional. En
la evaluacin ste es posible, pero slo en raras ocasiones adoptar una
forma de silogismo4.
Revisin de la objetividad, validez e imparcialidad
Qu quiere decir que un estudio de evaluacin sea objetivo" o vlido?
Pocos conceptos se han confundido tanto y han provocado tanta desorien
tacin. Muchas personas se muestran reacias a aceptar o a creerse las
evaluaciones cualitativas slo porque se basan en las observaciones de
una sola persona. Se piensa que estas observaciones son en s y de por s
subjetivas y, en consecuencia, carentes de justificacin a efectos pblicos.
La clave de la confusin radica en la errnea concepcin de la objetivi
dad. Sc r i v en (1972) se ha ocupado esplndidamente de esta confusin,
poniendo de manifiesto la desafortunada historia de la definicin de la obje
tividad. El argumento fundamental de la mayora de las definiciones de
objetividad consiste en que hay algo extemo a la mente que puede verificarse
mediante el acuerdo pblico e intersubjetivo, y que podemos expresar o
probar tales cosas sin la influencia de los sentimientos personales. Una
evaluacin que pueda operar as es objetiva. Pero, acaso el punto de vis
ta de una persona puede ser objetivo? La dificultad radica en la confusin
de la objetividad con los procedimientos para determinar la intersubjetividad.
Sc r i v en (1972) sostiene que objetividad se utiliza en dos sentidos
diferentes: el cuantitativo y el cualitativo. En el sentido cuantitativo del trmino,
la opinin que una persona tenga de algo se considera subjetiva (se trata
de la disposicin de un individuo). La objetividad se consigue a travs de
las experiencias de un conjunto de sujetos u observadores. La experiencia
comn hace pblica la observacin mediante e acuerdo intersubjetivo. En
un plano ms formal, podemos decir que el conjunto de individuos nos
4 Vase en el Apndice A un anlisis ampliado de la evaluacin como argumantocirv En
el Apndice B, puede examinarse un anlisis de la "evaluacin naturalista
Ednones Mohul & L
64
Eval uaci n, tica y P0de
garantiza una representacin ms adecuada de la poblacin (un problema
demuestreo).
El sentido cualitativo de la objetividad es muy di f erente. Se refiere a ia
calidad de la observacin, con i ndependenci a de la cant i dad de personas
que la lleven a cabo. Se denomina objetiva la observaci n que se atiene 9
los hechos, mientras que se considera subjetiva la que de algn modo es
tendenciosa. Puede darse el caso de que las observaci ones de una persona
se atengan a los hechos concretos, mientras que las realizadas por un con
junto de individuos no lo sean? En efecto. Por tanto, una observacin puede
ser subjetiva, desde el punto de vista cuantitativo (la opinin de un individuo),
y al mismo tiempo objetiva, desde el punto de vista cualitativo (realmente
carente de sesgos y veraz).
En realidad, hemos de aceptar que los tipos de inclinaciones tendenciosas
que influyen en la opinin de una persona difieren de algn modo de los
sesgos propios de las opiniones grupales. Por ejemplo, un individuo puede
sucumbir con mayor facilidad ante los puntos de vista idiosincrsicos, dado
que slo es capaz de tener una perspectiva Por otra parte, existen sesgos
sociales y culturales ante los que un grupo se muestra ms susceptible que I
una persona concreta, p. ej., el chauvinismo. La objetividad cualitativa del j
individuo puede evaluarse por su trayectoria en relacin con estas cuestiones
y por sus intereses personales actuales. En todo caso, quien acepte total y I
exclusivamente la idea cuantitativa de objetividad nunca estar satisfecho 1
con enfoques del estilo del estudio de casos.
Cmo lleg la idea cuantitativa de equiparar la cantidad de individuos \
que efectan una observacin con su veracidad para adquirir un ascendiente
tal que excluyese la objetividad cualitativa? Sc r i v en remonta esta deformacin I
hasta los intentos de la psicologa para erradicar la introspeccin y las
tentativas de la filosofa para eliminar la oscura metafsica. Ambas disciplinas -
procuraron conseguir esas metas por medio del principio de verificacin. La 1
intersubjetividad se operativiz como el criterio de objetividad. En su forma j
extrema, la equiparacin de la objetividad con la idea cuantitativa de Inter-
subjetividad se manifest en el conductismo metodolgico y en el opera-
cionalismo. Pero la falacia del intersubjetivismo alcanza a todos los campos.
Scr i ven menciona el caso de la evaluacin de una antena de t el evi si n 1
en una revista de electrnica en la que el evaluador ve e informa de que la 1
imagen procedente de una de las antenas probadas es mejor. No obstante,
el evaluador pide disculpas por haber sido "subjetivo, ya que no utiliz
instrumento alguno para medir el incremento en decibelios. En real idad,
como seala Scr i v en, sin utilizar instrumentos, es posible llegar a acuer dos
ntersubjetivos respecto al funcionamiento de equipos electrnicos, sin que
la correlacin de estos juicios de calidad reunidos con cualesquiera lecturas
de instrumentos de medida sea elevada. Por qu, entonces, para este
evaluador confundido, la lectura de un instrumento es objetiva, mientras
que el juicio de una persona es subjetivo?
La razn est en que el evaluador es la nica persona que efecta I0
observacin y, aunque sabe que podra confirmarla apelando a sus colegas-
0 dicXHmMoritt, 9>I
La lgica de la argumentacin evaluatlva
86
cree que sera mejor disponer de un instrumento porque se llegara a un
acuerdo an mayor entre observadores sobre la lectura del aparato de
medida (aunque la medida que arroje el aparato no constituya un ndice
elevado de calidad). En este caso, la idea cuantitativa de intersubjetividad
suplanta la calidad de la percepcin.
En trminos operacionales, segn Sc r i v en , la medida en una escala
cuantitativa por medios mecnicos se convierte en indicador de veracidad
porque la fiabilidad entre jueces es superior. Al mismo tiempo, se sacrifica
en realidad la validez en beneficio de la fiabilidad, porque la lectura del apa
rato de medida, aunque fiable, no es un buen indicador de la calidad de
imagen. ste es uno de los errores corrientes de la evaluacin: la sustitu
cin de la observacin directa de la calidad por los instrumentos, la de la
validez por la fiabilidad. Y es un error de primera magnitud.
A part i r de esta idea lo que otros no pueden experimentar directamente
no puede t omarse como ciencia autntica (intersubjetivismo), se ha de
sarrol l ado el concepto de objetividad como exteriorizacin de todas las re
f erenci as, de manera que pueda conseguirse una prueba mltiple; segn
Sc r i v en , una excesiva y grosera simplificacin. En la investigacin educativa,
est o se ha manifestado en la equiparacin de la objetividad con la capa
ci dad de especificar y explicar del modo ms completo todos los procedi
mi ent os de recogida de datos. La exteriorizacin y objetivacin completas
permi t en l a rplica, la garanta de la fiabilidad. En educacin, ser objetivo ha
l l egado a significar disponer de un instrumento vlido (exactamente, como
un eval uador electrnico).
Lo que, en realidad, existe son instrumentos muy fiables cuya validez es
cuestionable. Su correlacin con los juicios de calidad no siempre es elevada
La deformacin del principio intersubjetivista de verificacin se ha traducido
en la equiparacin de la objetividad con procedimientos exteriorizados y
replicables, aunque stos puedan ser influidos por inclinaciones tendenciosas
y, en consecuencia, ser subjetivos, desde el punto de vista cualitativo.
La identificacin de la objetividad con un procedimiento externo com
pletamente especificable tiene otro efecto importante. Libera ai evaluador
de la responsabilidad respecto de los resultados y consecuencias de la
evaluacin. En realidad, si estos instrumentos y procedimientos objetivos
arrojan esos resultados, cmo vamos a culpar al evaluador? Habr que
acusar a la ciencia. Po l a n y i (1958) denomina "objetivismo a esta postu
ra. En este sentido, la objetividad significa que las observaciones estn
sometidas a una verificacin independiente sin referencia a la persona que
las efecta.
Ahora bien, no es posible especificar explcitamente todo el conocimiento
ni verificarlo por completo mediante procedimientos externos independientes.
Scr i ven sostiene que, incluso en las pruebas matemticas, cuyos pasos se
reducen a lo evidente de por s, la intuicin desempea un inevitable e
importante papel. La verificacin intersubjetiva no slo no es garanta de
veracidad, sino que no es necesaria. La verdad constituye un ideal ai que
EvtkCto, b c i y
slo podemos acercarnos mediante la interaccin entre introspeccin y
wrificactn pblica.
Dada su complejidad, nunca podrn explicarse del todo muchos juicios
intuitivos. No obstante, las conclusiones no tienen por qu ser menos ierta<>
por nuestra incapacidad de explicarlas. El acuerdo entre muchos quiz sea
necesario para explicar la verdad a terceros, pero no es preciso para
verdad en (.
Cmo podemos establecer la validez de una afirmacin si no podemos
separarla por completo de la persona que la hace? Una forma consiste en
comprobar la fiabilidad del observador en casos anteriores y constatar su
carencia de sesgos. Estas comprobaciones no garantizan la consecucin
de la verdad, pero aqu no hay garantas posibles. Segn Scriven^ hay
afirmaciones relativas al conocimiento, hbridas de manifestaciones internas
y externas, p. ej., enunciados de tendencias, analogas, aproximaciones,
que ton cierta# aunque no formen parte de los tipos de afirmaciones que
t oii inot asociar con los enunciados cientficos. Las llama afirmaciones de
"conocimiento dbil" y dice que representan el tipo de conocimiento del
que pueden disponer las ciencias sociales.
Estos enunciados de conocimiento se manifiestan ms como explica
ciones que como previsiones. La explicacin y la comprensin son funciones
del modo de codificarse la informacin en la mente. La explicacin ^upone
que existe una persona que la entiende. No existe de por s. En; ltimo
extremo, o la comprensin es reducible a algo ya presente en la mente de
sus destinatarios, que realizan el proceso de comprensin, o no habr |
explicacin.
De igual manera, salvo que la evaluacin proporcione una explicacin a I
unos destinatarios concretos, aumentando su comprensin por medio del
contenido y la forma de presentacin de las argumentaciones, no ser una J
evaluacin adecuada a esos destinatarios, aunque los hechos en los que J
se base puedan verificarse por otros procedimientos. Un indicador de la I
capacidad explicativa es el grado de persuasin de los destinatarios conse
guido. En consecuencia, una evaluacin puede ser cierta en el sentido 9
convencional, pero no persuasiva para unos destinatarios concretos, a quie-
nes no sirve de explicacin. Por tanto, en su sentido ms pleno, la e va l uaci n
depende tanto de la persona que efecta el informe evaluativo pomo de la I
que lo recibe.
No es necesaria la previsin para demostrar la comprensin. La inferencia
de un acontecimiento a partir de un coeficiente de correlacin ms a l gu n a s fl
condiciones antecedentes no constituye un test necesario de validez u I
objetividad. En cambio, el modelo de razonamiento se acerca al de aj ust e
del modelo, de encontrar interpretaciones, explicaciones y comprensi ones
razonables en un contexto dado. El test de una explicacin no es la exact i t ud
de la previsin de un hecho, sino que los destinatarios puedan cont empl a1* I
relaciones nuevas y responder preguntas pertinentes nuevas.
Por ltimo, respecto a la cuestin de la objetividad hemos de conclu' 1
dos cosas: o bien la objetividad no puede identificarse en exclusiva con un I
inmtmMor*!*, 8.1
Ul lgica ta argumentacin evaiuafcva
procedimiento exteriorizado, independente por completo de las memes quc
llevan a cabo tas observaciones y las comprenden, o bien gran parte de te
verdad es de carcter subj et i vo. En el primer caso, la objetividad significa
algo ms que lo que suele tomarse por tal; en el segundo, significa si go
menos.
Qu decir de la validez? Una definicin de validez consiste en qipe se
basa en procedimientos objetivos. La validez lleva consigo ideas sobre la
concordancia entre lo que se intenta y lo que se lleva a cabo, la derivacin
correcta y la sancin por parte de la autoridad. En el sentido estricto de la
objetividad cuantitativa, la validez se equipara con la previsin (comprobacin
de los datos en relacin con un criterio). Pero ello supone una tentativa
nica y el intersubjetivismo como principio de verificacin. Es un procedi
miento demasiado estricto. En ltimo trmino, dice Cronbach (1971), la
validez depende del uso que se haga de los datos y la utilidad depende de
los valores, no de las conexiones estadsticas de las puntuaciones.
Si no podemos conseguir una nica puntuacin que constituya un pre
sunto indicador de validez, cmo se determina sta? Quiz la mejor res
puesta consista en examinar las posibles causas de invalidez Una evaluacin
puede ser no vlida de diversos modos. Uno de ellos es que los hechos y
verdades en los que se basa sean errneos. Ambos se aceptan sin discu
sin. Otros datos han de determinarse mediante procedimientos aceptados
de recogida de datos que, a su vez, estn refrendados por una disciplina
concreta y sometidos a examen pblico. A menudo, la validez se refiere a
la utilizacin de tales procedimientos aceptados de recogida de datos, como
seala el artculo de Cr o n b a c h sobre vali daci n de los tests.
Otro modo de cuest i onar la validez tiene que ver con las relaciones que
se establezcan ent re l as conclusiones e interpretaciones y los datos. Como
afirma Cr o n b a c h , l a val i dez o no validez no se refiere tanto al test o a los pro
cedimientos de recogi da de datos como a las interpretaciones de los mismos.
Se trata de la val i dez de una inferencia: la inferencia se deriva correctamente
de los datos y premi sas?
Tambin est la cuestin de si la interpretacin es aplicable a situacio
nes distintas de aqulla de la que se ha derivado, pues las generalizaciones
dependen del contexto. El diseo experimental se ocupa de forma sistemti
ca de estas cuestiones en cuanto constituyen amenazas contra la validez
interna y externa.
En los estudios cualitativos, es ms difcil presentar pruebas de validez,
lo que no significa que no existan. La demostracin de la validez de los
estudios naturalistas suele consistir en la confirmacin de una clase de
datos con otra. Al proponer los estudios de casos en la enseanza de las
ciencias, Stake y Ea s l ey (1978) consideraban que las tendencias personales
y la experiencia anterior constituan la principal amenaza a la credibilidad
de los estudios de casos. Propusieron el uso generalizado de grabaciones
magnetofnicas de entrevistas; de citas directas, en la medida de lo posible,
e informar de los desacuerdos entre los entrevistados, si los hubiera. Las
personas conocedoras de la situacin local podran leer el informe escrito y
Evaluacin, ti ca y prj,(<
juzgar la exactitud de la descripcin. Habra que sealar los indicios <k
incoherencia de los trabajadores de campo con el fin de seguir supvolucir
posterior Tambin se documentaran y describiran los contextos de i ^
observaciones. El hecho de garantizar las observaciones de diversos part,
cipantes sobre una cuestin o acontecimiento concreto era un modo de
triangular lo que en realidad ocurriese.
La mayora de las amenazas contra la validez se contempla?desde ia
perspectiva de un destinatario universal. Pero hay otra forma de'Considerar
la validez de una evaluacin: si sta es vlida para destinatarios concretos
En realidad, la validez siempre est relacionada con los fines de alguien y
la utilidad que le proporcione. Si la evaluacin no se basa en valores
propios de la mayora de los destinatarios, stos quiz no la consideren
vlida, es decir, pertinente para ellos, en el sentido de bien fundamentada,
justificable o aplicable. La evaluacin puede pasar por alto, sin ms, las
principales cuestiones que se plantean unos destinatarios determinados. Al
mismo tiempo, la evaluacin puede ser vlida, en el sentido de que los i
hechos en los que se fija son reales y las inferencias efectuadas a partir de i
ios datos, correctamente derivadas. Desde el punto de vista de unos desti
natarios concretos, el error puede estar en las premisas de partida.
Por otra parte, una evaluacin tambin puede ser no vlida en este
sentido secundario si las formas de argumentacin utilizadas son errneas.
Por ejemplo, en esta sociedad, las argumentaciones de medios y fines,
sobre todo las correspondientes a las relaciones entre coste y eficacia, 1
tienen una fuerza singular. Si empleamos un argumento encaminado a I
favorecer la excelencia al mximo, en vez de escoger la mejor alternati- 1
va disponible, puede tener poco peso aunque, desde el punto de vista de 1
un destinatario generalizado, ambas orientaciones sean igualmente verda
deras y vlidas. Por tanto, la validez se aplica a la evaluacin de formas
muy diversas. (El debate entre Gl a ss y Sc r iv e n que aparece en el Apndi- |
ce A se refiere, ms que nada, a la forma del argumento.)
Tambin ocurre que, cuanto ms "naturalista sea la evaluacin, ms se 1
basar en sus destinatarios para extraer sus propias generalizaciones
(validez externa). Por ejemplo, cada lector puede interpretar un estudio de 1
casos de distinta manera, pues tiene presente su propio universo de casos
a efectos de comparacin. El lector puede ver semejanzas y diferencias ba- j
sadas en su experiencia, pudiendo hacer sus propias interpretaciones.
Concibiendo de este modo el proceso de generalizacin, se modi f i ca j
incluso el primer sentido en el que se utiliza la validez. El evaluador sigue I
siendo responsable de la confirmacin y comunicacin de los hechos y I
enunciados verdaderos", pero parte de la interpretacin se escapa de sus 1
posibilidades. Dado que, como dice Cronbach, la cuestin final consiste en 1
la validez de la interpretacin, que slo el lector conoce con seguridad, los I
destinatarios deben asumir una considerable responsabilidad respecto de 1
la validez de sus propias interpretaciones. En ltimo extremo, el e v a l u a d o '
debe suponer que el pensamiento de sus destinatarios sigue procesos
racinale.
La lgica de la argument acin evaiuatrva
Como sealaba Ennis (1973), la validez interna y la externa se refieren a
fenmenos muy diferentes. La validez extema tiene que ver con ta capacidad
de generalizacin de enunciados causales generales. La validez Interna
versa sobre enunciados causales especficos que no supone ta generaliza
cin a otros casos. La generalizacin implica siempre el conocimiento de
las leyes pertinentes que intervienen en la extrapolacin a mbitos distintos.
En cambio, un estudio de validez interna slo alude a la causalidad en el
pasado y en circunstancias especficas. No pretende la extrapolacin, siendo,
por tanto, menos dependiente de premisas externas.
Sin embargo, ni los enunciados causales especficos ni los generales se
derivan lgicamente de un modo perfecto de las observaciones, ni siquiera
en el caso de los mejores diseos experimentales. Incluso en tos diseos
ms estrictos, son necesarias algunas premisas empricas. Adems, segn
En n i s , la identificacin de un hecho concreto con la causa supone inevita
blemente un juicio de responsabilidad acerca de que un acontecimiento
concreto es responsable del efecto. Esta adscripcin de responsabilidad
requiere un importante conocimiento de base y un juicio de valor. Lleva
consigo la probable asignacin de alabanza o censura y muestra un mbito
de intervencin.
La mayora de los evaluadores asume la responsabilidad de enunciados
causales especficos del tipo x caus y en este estudio (validez interna),
aunque, en s, esto supone necesariamente un conjunto de premisas. Pero
algunos remitiran la capacidad de generalizacin de los hallazgos a los
juicios de los destinatarios, dado que sta se basa en una informacin
externa que pueden tener ellos, pero no el evaluador. Los destinatarios
podran efectuar algunas adscripciones de responsabilidad basndose en
su propio conocimiento de base y en sus valores. Algunos evaluadores,
sobre todo los naturalistas, podran decir que, en ltimo trmino, esto se
traduce en generalizaciones superiores.
Hay an otro problema relacionado con la objetividad. Basta decir, en
realidad, que el evaluador es objetivo? Si tomamos la objetividad en el
sentido en que suele utilizarse, en cuanto procedimiento exteriorizado, es-
pecificable, que produce resultados repetibles, es, sin duda, un criterio insu
ficiente para la evaluacin. La administracin de tests normalizados de
ejecucin constituye un procedimiento completamente exteriorizado y es-
pecificable que produce resultados repetibles. Al mismo tiempo, parece que
estos tests estn muy sesgados de muchas formas, sobre todo en relacin
con grupos minoritarios. En este sentido, tenemos un instrumento objetivo,
pero sesgado. De hecho, podemos elaborar un instrumento cuyo sesgo se
incline en el sentido opuesto. (Para mayor confusin, si lo que pretende tal
instrumento es la discriminacin racial, podemos disponer de un instrumento
objetivo, vlido, para este fin.)
Una evaluacin debe carecer de deformaciones y sesgos (debe ser
objetiva, desde el punto de vista cualitativo) y el hecho de que est exterio
rizada, sea especificable y repetible no basta para conjurar posibles 'inclina
ciones tendenciosas. Incluso, para la evaluacin, no es suficiente ta objeti-
$ CnaponmMcmHk. L
vidad cualitativa porque lleva consigo el aura de neutralidad. Las personas i
sometidas a evaluacin no quieren un evaluador neutral, que no se preocupe I
por los problemas. Una persona sometida a juicio no escogera un jue* I
totalmente independiente de su propio sistema social.
La postura desinteresada no nos da derecho a participar en una decisin I
que determina en gran medida la suerte de alguien. El conocimiento de I
tcnicas para lograr descubrimientos objetivos es inadecuado. En cambio I
el evaluador debe ser considerado como miembro del grupo sometido a I
juicio o vinculado con el mismo, de igual modo que un acusado es juzgado
por sus semejantes *. El evaluador ha de ser considerado como una persona I
preocupada, interesada y sensible a los argumentos pertinentes. Debe ser I
ms imparcial que simplemente objetivo.
La imparcialidad del evaluador debe considerarse como la de un actor 1
dentro de los acontecimientos, de alguien sensible a las argumentaciones I
adecuadas, en quien las fuerzas contendientes estn equilibradas, en vez I
de no existir. El evaluador debe ser considerado como alguien que no tema I
partido de antemano a favor de una u otra postura.
El evaluador puede remitirse a criterios objetivos para resolver los pro- I
blemas; pero, cuando se discute su propia imparcialidad, no basta con que I
d pruebas de objetividad. Debe demostrar su imparcialidad, sealando H
cmo, en el pasado, ha actuado en contra de sus propios intereses.
90 _____________________________ ___________________________________Eval uaci n, tica y pog^, I
El discurso evaluativo:
la buena vida (junto a la falla de San Andrs)
Empec este captulo hace varias semanas. Todava no se ha producido I
el gran terremoto de Los ngeles. Se suceden das magnficos, muy parec- I j
dos unos a otros; por tanto, parece que maana ser como hoy, un sueo H
placentero que se extiende indefinidamente.
Cada da que pasa hace que el terremoto parezca menos probable que H
antes. Sin embargo, si ha de producirse en este ao, debera ser ms pro- I
bable. Razono que el tiempo que tie permanecido aqu es slo una peqea I
fraccin del ao en curso, de manera que las posibilidades de que se I
produzca el terremoto son ahora menores que eran respecto a todo el ao I
correspondiente a la previsin. Razono que, aun en el caso de que!el I
terremoto se produzca, los efectos no sern desastrosos. Adems, el Medio I
Oeste est devastado por los tornados. Junto a esto, acaso muchos djp los I
hombres ms despiertos del pas, incluidos los sismlogos, viviran aqu si I
el peligro fuese tan grande? Me siento mejor. Mi ansiedad disminuye.
Mientras tanto, en los ltimos das, el New York Times Magazine r eavi va I
el drama en su edicin del bicentenario (4 de julio de 1976). Como el ement o I
simblico de America at 200", publica un reportaje sobre The G o o d Life I
B a u t o r alucie a la actuacin del jurado en un proceso judicial norteamericano. ( N d e l T J I
9 tonmMorata, 8 i
La lgica de la argumentacin evaluativa
(along the San Andreas Fault)*. En portada aparece una ilustracin de un
f ragment o de autopista zambullndose en pleno ocano, los restos de Los
Angel es tras el prximo terremoto. El artculo comienza con un panorama
de sei s prrafos sobre los efectos del terremoto previsto.
Qui enes viven encima de la lnea de fractura de nueve millas de profun
di dad t i enen sus propias razones para vivir all. Cuando su patio se desmorona
a di ari o, un trabajador de correos, que tiene tres coches, preferira mudarse,
pero no puede vender su casa. El gerente de un rancho, para quien la vida
en Cal i f orni a es mejor que en cualquier otro sitio en el que haya vivido, explica:
No me voy. Acaso existe algn lugar en el que no haya ninguna catstrofe?
Para algunos, la misma precariedad hace mucho ms valioso estar aqu. Un
consejero de inversiones en paro que vive en la falla dice: Vives en un punto
crtico. Puedes perder todo lo que tienes en cualquier momento.
No son las razones que yo dara, pero pueden ser correctas. Toda per
sona es libre para sopesar sus propias razones. Todos somos libres para
hacer nuestras propias opciones. Y as debe ser cuando nos enfrentamos
con esa incertidumbre. No podemos basar el juicio en una realidad irrefutable.
Aun cuando los terremotos sean mucho ms previsibles, sigue habiendo
margen para escoger la respuesta. En el campo de la decisin social, la
certeza parece remota, cuando no imposible.
Ante tales dificultades para llegar a una realidad irrefutable, hay quienes
tratan de hacer sencillas las complejidades de la vida. Insisten en pretender
que hay acuerdo cuando no lo hay, tanto respecto a hechos como a valores.
Ocupando con frecuencia posiciones de poder, imponen definiciones sim
plificadas de la realidad en beneficio de la accin. Sin embargo, con inde
pendencia de la mayor o menor aceptacin de la simplificacin, la realidad
sigue ah. Crean lo que crean veintin millones de californianos, el gran
terremoto llegar.
La alternativa no tiene por qu ser una vuelta a la irracionalidad. Si las
opiniones no pueden tener un fundamento irrefutable, tampoco deben con
siderarse completamente arbitrarias, como meros juicios de valor. Esa
clasificacin circunscribe el conocimiento a lo claro, distinto y unvoco. Esta
distincin crea un cisma entre el saber terico objetivamente verdadero, por
una parte, y la accin basada en motivos irracionales, por otra En ltimo
extremo, lleva a tildar de irracionales a quienes no concuerdan con la
propia perspectiva. La clasificacin de ciertas personas como irracionales
justifica el desprecio de sus opiniones y, quiz, de su dignidad e intereses:
incluso, justifica la utilizacin de la sugestin y la fuerza contra ellas.
La alternativa consiste en tratar como racionales a todos los hombres.
Entre el autoritarismo conservador de la tradicin y el autoritarismo liberal
del cientifismo, entre la certeza del fanatismo y la evasin de la responsabi
lidad del escepticismo se sita la deliberacin racional. Debemos tomar en
* El utor reproduce en l encabezamiento de la seccin el titulo de The NashYork Times
Magazine: La buena vida (junto a la falla de San Andrs). (N. de) T.l
92
^val uaci n, t ica y POcJe
serio las opiniones de los dems, introducindolas en un discurso riguroso
ste es el mbito de la argumentacin y la esfera adecuada de la evgj
luacin.
Partimos de la base de que los grupos de personas se adhieren a
opiniones diversas con intensidad variable y que estas opiniones pueden
ponerse a prueba en un discurso serio. Pueden considerarse incluso hechos
concretos y valores. El discurso racional consiste en dar razones, aunque
no razones indiscutibles. En el mbito de la acci n, en el que hay pocas
cosas claras y distintas, la motivacin puede ser racional. La prctica puede
ser razonable.
El evaluador debe hacer participar a sus destinatarios en un dilogo en
el que puedan emplear su razonamiento con toda l i bert ad. Esto significa
que los destinatarios deben asumir la responsabilidad personal de su inter
pretacin de la evaluacin, dado que el razonamiento que se les presenta I
no es del todo convincente ni compl et ament e arbitrari o. Est o supone que el I
evaluador asuma tambin la responsabil i dad personal de sus juicios, ya I
que no puede ocultarse tras un mtodo ci ego. Ambas part es deben poner I
en prctica su razn natural.
$ tMc&mMorMs, 8. L
CA P TUL O V
Coherenci a y credi bi l i dad
La esttica
El conductor ebrio
La humani dad permanece irremediablemente en la caverna de
Pl at n, gozando todava su antiqusima costumbre con meras
Imgenes de la verdad.
Susan Sont ag: O n P h o t o g r a p h y , 1977, pg. 1.
Consideremos dos imgenes distintas del conductor bebido. Imagin
monos al bebedor social corriente, al que suele tratrsele con excesiva
tolerancia, y a quien, tras desobedecer una seal de parada obligatoria,
detiene la polica y, por tanto, se enfrenta con un problema. Imaginemos
ahora al conductor que es bebedor habitual, siempre con unas copas de
ms, que va haciendo eses, dando tropezones y que, en la carretera, cons
tituye un grave peligro para todos, incluso para s mismo. La imagen que
nos hacemos del conductor que bebe tiene mucho que ver con las reco
mendaciones que, orientadas a la accin, podramos suscribir como medio
para eliminar a los conductores bebidos.
Hasta la pasada dcada se ha venido considerando al conductor que
bebe como un bebedor social, problema civil susceptible de correccin
mediante acciones legales, como la imposicin de castigos y multas. Sin
embargo, desde hace unos diez aos, un conjunto de estudios ha influido
en la transformacin de la imagen predominante del conductor bebido,
NOTA DEL AUTOR: Est e captulo fue publicado como: "Coherence and Creb<}\ The
Aesthetics of Evaluation", en Educational Evaluation and Policy Analysis, Vol. 1, n,5, septiembre-
octubre 1979, pgs. 5-17. Copyright 1979: American Educational Research Association. Was
hington, DC. Reimpreso con autori zacin. Gene Gl ass, Jo Friedman, Donald Hogbeh. Rochelle
M a y e r , John N i s b e t y Hel en Si mons me hicieron valiosos comentarios sobre el mismo.
Ediciones Mota*. S L
valuacin, tica
-----Poclo,
concibindosele ms en la actualidad como bebedor habitual,
patolgico
Las recomendaciones para solucionar el problema derivadas de esa i man
son de tipo sanitario y estn ms orientadas hacia un reducido subconjun?1
de transgresores que a todos los conductores que beben.
El socilogo Gus f i el d (1976) analiz la retrica empleada en estos es tuI
dios (la forma de presentacin de los datos para persuadir al lector de ia
conclusiones). Lo que descubri es realmente provocador. En las ci enci a!
sociales, se ha considerado axiomtico que, aunque un novelista pueda
persuadir a un lector con la emocin, el cientfico slo persuade con la I
gica. Gusf i el d alude a esta idea de la neutralidad del lenguaje como la teo' 1
ra del lenguaje de cristal de ventana: una expresin que revela la realidad 1
con absoluta transparencia y sin ninguna clase de adornos. El aut or de. 1
muestra que, en la prctica concreta, la valoracin de los estudios cientficos
se debe, en parte, a la utilizacin dramtica que en ellos se hace dpi
lenguaje.
Gusf iel d analiz con detalle el estudio ms influyente sobre los conduc- I
tores bebedores: Identification of Problem-Drinking Among Drunken Drivers'm
(Wal l er , 1967). Utilizando las categoras de Burke (1945) de escenario,
accin, agente, mediacin y objetivo, Gusf i el d puso de manifiesto que el
estudio de Wal l er operaba como un instrumento retrico persuasi vo. Como
el estilo literario de las ciencias es de carcter neutral, el estudio cientfico
debe parecer no literario, sin que medie en l punto de vista personal. En el I
estudio de Wal l er sobre los conductores bebidos, la neutralidad del esce
nario viene dada por el rol del autor investigador mdico, que escribe I
en el Journal of the American Medical Association. Establecida la neutrali dad!
del escenario, desaparece la figura del autor en cuanto persona que nter-1
viene en el asunto.
La forma que reviste el estudio es narrativa, con una evidente estructura
dramtica. La tensin aumenta con la opcin entre dos tipos de conductores
bebidos, descargndose en el desenlace. La progresin dramtica va desde
el bebedor problemtico como bebedor social hasta el problemtico como
conductor bebido. Segn Gus f i el d, en esta progresin es importante que el
cambio de perspectiva (resultado real del estudio) se considere como la
consecuencia de datos externos derivados mediante el mtodo cientfico
Por este motivo, el tono del informe es impersonal: Recientes informes hanB
indicado...; "se va poniendo cada vez ms de manifiesto que.... La forma I
impersonal sita la accin en la mediacin externa de los datos y el mtodo
ms que en el autor. Refuerza la idea de que las conclusiones surgen de1
universo de datos impersonales.
El estilo "cientfico" resultante es clnico, desinteresado, i mper sonal 1
carente de imgenes. El autor presenta el universo externo y per mi t e qjj
persuada al lector. El estilo sugiere que el observador se rige por el mt oc I
y las reglas de la integridad cientfica. La atencin prestada a l os det al l es y
a la descripcin meticulosa de los procedimientos, como la presentacin 1
lonmeros con siete cifras decimales, da impresin de p r e c i s i n ] 5eg
Gusweto, este estilo refuerza la premisa epistemolgica bsica: ut i l i zan j
# tdmrm Moreda, 8. i
coherenci a y credibilidad
el mismo mtodo, distintos observadores tienen que llegar a las mismas
conclusiones.
Aunque la exposicin de la metodologa se desarrolla con una neutralidad
evidente, las consecuencias que se extraen para la accin se manejan de
muy distinta manera. Los hechos de experiencia se convierten en imgenes.
En su estudio sobre los conductores bebidos, Wal l er menciona de manera
reiterada la expresin conductores bebidos, suscitando de ese modo im
genes poderosas, en vez de hacer una descripcin con trminos ms neutros,
como: conductores que sufren accidentes despus de beber. En el mis
mo ttulo del artculo se utiliza la expresin conductores bebidos. En
la actualidad, la categora de embriaguez se define operacionalmente por la
cantidad de alcohol en sangre, definicin legal cuya carga emocional es
muy diferente de la que suscita la imagen del conductor ebrio.
Segn Gu s f i el d , cuando Wal l er identific a los conductores bebidos
con los bebedores problemticos mediante su revisin de archivos judiciales
civiles, extrajo las consecuencias para la accin del conjunto de imgenes
de su clasificacin original. De este modo, el cientfico mdico dio sentido a
sus datos por reduccin a imgenes. La representacin del conductor bebido
ampli el significado de los datos primarios de manera que abarcasen
interpretaciones ya aceptadas y conocidas por sus destinatarios. No se
trataba de una simple extrapolacin de los datos.
En sntesis, la imagen del conductor bebido atribuye la responsabilidad
al agente, al mismo conductor, y no al escenario en el que ste acta. La
conduccin en estado de embriaguez se convierte en atributo del individuo
que requiere tratamiento mdico. Supone una conducta ms patolgica que
normal y, en consecuencia, soluciones diferentes. Incluso se trata de un
subgrupo diferente de personas. El delincuente civil se transforma en pa
ciente.
Gu s f i el d seala que este estudio es caracterstico, en cuanto al estilo
retrico, de los trabajos sobre la conduccin en estado de embriaguez,
aunque haya tenido una influencia especial. En un plano ms general, afirma
que la ciencia opera mediante esta clase de reducciones. El saber genera
l izare se crea mediante la vinculacin de objetos especficos con categoras
universales. En esta empresa (la ciencia) estn implcitas y son inherentes
a ella la definicin, descripcin e interpretacin de los datos a travs de
comunicaciones orales o escritas en la medida en que las conclusiones y
generalizaciones suponen significados para la accin" (pg. 31). Y ms
adelante: para que tengan relevancia o sean significativos, no slo hay
que seleccionar los datos, sino tipificarlos e interpretarlos tambin [ibid).
Aunque no todos los estudios de evaluacin utilizan unas imgenes tan
vividas, en la evaluacin surgen problemas similares. Las representaciones,
la estructura dramtica y la forma de exponer una evaluacin constituyen
cuestiones fundamentales para la importancia de la misma. Estos elementos,
a menudo considerados como pura cosmtica, pueden influir en la forma
de pensar y actuar de las personas. Cmo operan estos elementos y cul
es su relacin con el contenido el valor de verdad de una evaluacin'?
&fc0P6S
Evaluacin, tica v n
..m>>;
concibindosele ms en la actualidad como bebedor habitual, patlogo
Las recomendaciones para solucionar el problema derivadas de esa irnag60
son de tipo sanitario y estn ms orientadas hacia un reducido subconjum^
de transgresores que a todos los conductores que beben.
El socilogo Gus f ie l d (1976) analiz la retrica empleada en estos estu
dios (la forma de presentacin de los datos para persuadir al lector de |a'
conclusiones). Lo que descubri es realmente provocador. En las ciencia^
sociales, se ha considerado axiomtico que, aunque un novelista pueda
persuadir a un lector con la emocin, el cientfico slo persuade con la ir*
gica Gusf ie l d alude a esta idea de la neutralidad del lenguaje como la teo. ^
ra del lenguaje de "cristal de ventana: una expresin que revela la realidad
con absoluta transparencia y sin ninguna clase de adornos. El autor de
muestra que, en la prctica concreta, la valoracin de los estudios bentficos
se debe, en parte, a la utilizacin dramtica que en ellos se hace del I
lenguaje.
Gusf iel d analiz con detalle el estudio ms influyente sobre los conduc-1
tores bebedores: Identification of Prob/em-Drinking Among Drunken Drivers
(Wal l er , 1967). Utilizando las categoras de Bur k e (1945) de escenario,
accin, agente, mediacin y objetivo, Gusf i el d puso de manifiesto que el I
estudio de Wa l l er operaba como un instrumento retrico persuasivo. Como I
el estilo literario de las ciencias es de carcter neutral, el estudio cientfico 1
debe parecer no literario, sin que medie en l punto de vista personal. En el I
estudio de Wa l l er sobre los conductores bebidos, la neutralidad del esce- \
naro viene dada por el rol del autor investigador mdico, que escribe I
en el Journal ofthe American Medical Association. Establecida la neutralidad 1
del escenario, desaparece la figura del autor en cuanto persona que inter- J
viene en el asunto.
La forma que reviste el estudio es narrativa, con una evidente estructura 1
dramtica La tensin aumenta con la opcin entre dos tipos de conductores
bebidos, descargndose en el desenlace. La progresin dramtica va desde i
el bebedor problemtico como bebedor social hasta el problemtico como 1
conductor bebido. Segn Gu s f ie l d , en esta progresin es importante que ell
cambio de perspectiva (resultado real del estudio) se considere como l al
consecuencia de datos externos derivados mediante el mtodo cientfico- |
Por este motivo, el tono del informe es impersonal: Recientes informes han
indicado...; se va poniendo cada vez ms de manifiesto que... . La forma I
impersonal sita la accin en la mediacin externa de los datos y el mtodo
ms que en el autor. Refuerza la idea de que las conclusiones surgen de
universo de datos impersonales.
I estilo cientfico resultante es clnico, desinteresado, impersonal 1
carente de imgenes. El autor presenta el universo externo y permi t e ofi |
persuada ai lector. El estilo sugiere que el observador se rige por el mto1a 9
y las reglas de la integridad cientfica. La atencin prestada a los d e t a l l e s ya
a la descripcin meticulosa de los procedimientos, como la presentacin j
m nmeros con siete cifras decimales, da impresin de precisin.' Se9
6w* t o, este estilo refuerza la premisa epistemolgica bsica: utilizan ,
Coherenci a y credibi li dad
96
el mismo mtodo, distintos observadores tienen que llegar a las mismas
concl usi ones.
Aunque la exposicin de la metodologa se desarrolla con una neutralidad
evidente, las consecuencias que se extraen para la accin se manejan de
muy distinta manera Los hechos de experiencia se convierten en imgenes.
En su estudio sobre l os conductores bebidos, Wal l er menciona de manera
reiterada la expresin conductores bebidos, suscitando de ese modo im
genes poderosas, en vez de hacer una descripcin con trminos ms neutros,
como: conductores que sufren accidentes despus de beber. En el mis
mo ttulo del art cul o se utiliza la expresin conductores bebidos. En
la actualidad, l a categora de embriaguez se define operacionalmente por la
cantidad de al cohol en sangre, definicin legal cuya carga emocional es
muy diferente de l a que suscita la imagen del conductor ebrio.
Segn Gu s f i el d , cuando Wa l l e r identific a los conductores bebidos
con los bebedores problemticos mediante su revisin de archivos judiciales
civiles, extrajo las consecuencias para la accin del conjunto de imgenes
de su clasificacin original. De este modo, el cientfico mdico dio sentido a
sus datos por reduccin a imgenes. La representacin del conductor bebido
ampli el significado de los datos primarios de manera que abarcasen
interpretaciones ya aceptadas y conocidas por sus destinatarios. No se
trataba de una simple extrapolacin de los datos.
En sntesis, la imagen del conductor bebido atribuye la responsabilidad
al agente, al mismo conductor, y no al escenario en el que ste acta. La
conduccin en estado de embriaguez se convierte en atributo del individuo
que requiere tratamiento mdico. Supone una conducta ms patolgica que
normal y, en consecuencia, soluciones diferentes. Incluso se trata de un
subgrupo diferente de personas. El delincuente civil se transforma en pa
ciente.
Gu s f i el d seala que este estudio es caracterstico, en cuanto ai estilo
retrico, de los trabajos sobre la conduccin en estado de embriaguez,
aunque haya tenido una influencia especial. En un plano ms general, afirma
que la ciencia opera mediante esta clase de reducciones. El saber genera
li zare se crea mediante la vinculacin de objetos especficos con categoras
universales. En esta empresa (la ciencia) estn implcitas y son inherentes
a ella la definicin, descripcin e interpretacin de los datos a travs de
comunicaciones orales o escritas en la medida en que las conclusiones y
generalizaciones suponen significados para la accin (pg. 31). Y m s
adelante: para que tengan relevancia o sean significativos, no slo hay
que seleccionar los datos, sino tipificarlos e interpretarlos tambin {bldl
Aunque no todos los estudios de evaluacin utilizan unas imgenes tan
vividas, en la evaluacin surgen problemas similares. Las representaciones,
la estructura dramtica y la forma de exponer una evaluacin constituyen
cuestiones fundamentales para la importancia de la misma. Estos e l e m e n t o s ,
a menudo considerados como pura cosmtica, pueden influir en la f o r m a
de pensar y actuar de las personas. Cmo operan estos elementos y cul
es su relacin con el contenido el valor de ver dadde una evaluacin?
$ 6dieiOW&SMratfc. $
96 Eval uaci n, tica y p0tje
Los eval uadores uti lizan esos el ement os, aunque no si empre de manerM
consci ent e y en la mi sma medi da. Como seal a Gusf i el d, lo que se cuesJ
tiona, no obstante, es la necesi dad de la i nterpretaci n y la nt i ma conexi n!
entre esa i nterpretaci n y su f orma de present aci n, su el ement o art st i co!
(pg. 32).
Del mismo modo, en su anlisis del papel de las imgenes para definirl
los problemas sociales en la poltica social, Sc h n (1979) afirmaba que e| |
planteamiento de problemas sociales est mediado por lo que cuentan las I
personas sobre ciertas situaciones problemticas. El encuadre de los pro-
blemas sociales depende de las metforas subyacentes a los relatos. La I
forma de encuadrar los problemas es crtica respecto a las soluciones que I
se susciten. Por ejemplo, en todas partes se oye que los servicios sociales
son fragmentarios y la solucin implcita es que hace falta coordinarlos.
Pero los servicios que aparecen como fragmentarios pueden considerarse
tambin autnomos. La metfora subyacente configura y orienta la solucin
de los problemas.
Sc h n sostiene que nuestro pensamiento sobre la poltica social est
orientado por imgenes omnipresentes y tcitas que denomina metforas
generativas. stas se transfieren de un marco de referencia a otra situacin.
Por regla general, se inducen cuando nos sumergimos en la experiencia del
fenmeno. Estas imgenes orientadoras son necesarias para nuestro pen
samiento.
Por ejemplo, hay dos perspectivas muy distintas sobre la renovacin
urbana. Una considera que las barriadas baratas fueron en otras pocas
comunidades saludables que se han estropeado. Un planificador social que
tenga esa imagen pensar que la eliminacin de la ruina urbana llevar
consigo el rediseo y la reconstruccin completos. Otra visin muy distinta
de las barriadas baratas las representa como comunidades naturales, viables
y de renta baja que ofrecen a sus residentes importantes beneficio^ sociales.
Esta segunda perspectiva supone recomendaciones totalmente distintas
para la mejora de esas comunidades.
En la planificacin social de los aos cincuenta predominaba ante todo la
imagen de la barriada barata como ruina. En los aos sesenta, surge la de
la barriada barata en cuanto comunidad natural como metfora opuesta a la
primera, compitiendo con ella para ganar la atencin del pblico y de los
expertos. Segn Sc h n , a partir de una realidad que es ambigua e indeter
minada, cada imagen selecciona caractersticas que constituyen los temas
en los que se basan dichas imgenes. En la primera perspectiva, adqui eren
importancia expresiones como ruina, "salud, renovacin, ciclo de de
cadencia y plan integral. En la segunda, las ideas clave sern: hogar,
modelos de interaccin, redes informales y desarticulacin.
Cada imagen presenta una visin de la realidad social, sel ecci oni ando,
nombrando y relacionando elementos pertenecientes al marco escogido.
Segn Sc h n , los procesos clave son la denominacin y el enmarca-
miento. Mediante la seleccin de ciertos elementos y la coherente organi
zacin de los mismos, esos procesos explican lo inconveniente de una
d*ctonea Morata, S. L
tuacin determinada y sugieren una transformacin. Los datos se convierten
recomendaciones.
La denominacin y el enmarcamiento se llevan a cabo mediante la
metfora generativa. Los investigadores ven la barriada como ruina o como
c o m u n i d a d natural. Al ver A como B, la evaluacin implcita en 8 se traslada
a a La primera metfora es la de la enfermedad y la curacin. La segunda
es la de la comunidad natural (frente a la comunidad artificial). Las evalua
ciones transferidas se basan en imgenes profundamente asentadas en
nuestra cultura. Cuando vemos una situacin compleja como de salud/enfer
m e d a d o de naturaleza/ artificio, sabemos en qu direccin movemos.
La consideracin de A como B facilita mucho nuestra capacidad de
diagnosticar y prescribir. Por otra parte, puede llevarnos a pasar por alto
otras caractersticas importantes de la situacin que la metfora no capta
Como lasinetforas generativas suelen ser tcitas, podemos soslayar ca
ractersticas importantes. Sch n dice que tenemos que ser ms conscientes
de nuestras metforas generativas y que la mejor forma de conseguirlo
consiste en analizar lo que decimos del contexto del problema.
La metfora profunda explica por qu incluimos en lo que decimos
unos elementos y otros no, por qu se dan como ciertas algunas premisas
a pesar de las pruebas en su contra, y por qu parecen obvias algunas
recomendaciones. La imagen del conductor bebido o la metfora de la
barriada como enferma configura el estudio y orienta nuestras propias ac
ciones.
La trama
O sea, lo primero que hacemos con las imgenes es construir una trama, del
mismo modo que lo primero que hacemos con las palabras es decir algo; hacer
un enunciado... Las imgenes y las tramas constituyen los activos de la mente.
Susanne K. Langer, Philosophy in a New Key, 1942, pg. 128.
Pensemos en una evaluacin. En primer lugar, hay un conjunto de
hechos, la realidad tal como es, que siempre ser algo indeterminado. El
evaluador se enfrenta con un universo ambiguo. Gracias a diversas lentes
sociales y psicolgicas, el evaluador representa esos hechos en un informe.
El informe en s es un producto artificial. Como tal, ste tiene coherencia y
forma, cierta clase de estructura esttica, aun en el caso de que la estructu
racin no sea del todo consciente.
Los Rectores interpretan el informe y esa interpretacin variar depen
diendo de cada lector, de sus circunstancias y orgenes. Si a los lectores
les parece creble el informe, es ms probable que asuman la correspondiente
postura de valor frente al objeto evaluado. Es ms, los lectores pueden ser
impulsados a la accin, dependiendo de su disposicin y otras circunstancias.
El evaluador puede o no recomendar la accin.
Edi ci ones Moratft. S. L
Como artefacto artificial, el informe de evaluacin tendr cualidadJ
estticas, formas externas que susciten el inters, pero en un informe cj J
evaluacin hay aspectos ms fundamentales que stos. Toda evaluacin
debe tener un grado mnimo de coherencia. La coherencia mnima consiste!
en que la evaluacin narre una trama. Debe existir una sucesin, explcita o|
tcita, de hechos (o, con mayor precisin, una interpretacin de loa hechos)!
para que el lector utilce la evaluacin como gua para valorar. Tambin!
pueden aparecer recomendaciones del evaluador, pero no son necesarias.!
La trama est presente.
En este sentido, las imgenes no pueden ser evaluaciones de por s. I
Como indica Sq n t a g (1977) en su anlisis de la f ot ograf a:
El deseo no tiene historia: al menos, en cada caso se experimenta todo l en
primer plano, inmediato. Lo suscitan arquetipos y, en este sentido, es abstracto.
Pero los sentimientos morales estn inmersos en la historia, cuyas personas
son concretas, cuyas situaciones siempre son especficas. As, las reglas para
utilizar la fotografia con el fin de despertar el deseo y la conciencia son casi las
opuestas. Las imgenes que movilizan la conciencia siempre estn vinculadas a
una situacin histrica concreta. Cuanto ms generales sean, ms difcil resultar
que sean eficaces.
(Pgs. 16-17.)
Las fotografas pueden utilizarse para reforzar valoraciones e, incluso,
presentarse en secuencia para contar una trama (Templ i n , 1978). La trama
en s es, no obstante, necesaria para interpretar los hechos. stos deben
presentarse en un contexto histrico especfico. La trama, ms an que la
imagen y la metfora, constituye la estructura bsica subyacente a una
evaluacin.
Existen al menos dos formas convencionales de contar la trama. Una
consiste en presentar al evaluador como observador neutral, cientfico. En
este caso, lo que cuenta es el desarrollo de la trama. Sonara ms o menos
as: Soy un observador neutral, independiente, que ha efectuado determi
nadas medidas con arreglo a los cnones de la ciencia y ha descubierto
que ciertas cosas son asi. El programa se ha desarrollado tal como lo he
deserto, con los siguientes resultados.... Al manifestarse de este modo, el
evaluador especifica meticulosamente sus procedimientos metodolgicos
para realzar su credibilidad. Se espera que los lectores crean los resulta
do por la objetividad de la metodologa y por su experiencia previa y su
conviccin respecto de tal metodologa. Por regla general, el relato concluye
diciendo que se implement el programa y los resultados fueron stos y
aquellos Con frecuencia, escasean las descripciones de los hechos con-
Cf 11 El estudio sobre los conductores bebidos es un ejemplo de esta
Hnea de desarrollo argumenta!. La presentacin habitual consiste en describir
1 proyecto o tos objetivos de) mismo, el tratamiento, los resultados o ef ect os
y &s conclusiones
t i itgund* forma importante de llevar a cabo la trama consiste en que
M____________________ __________ ; ________________Eval uaci n, tica y P0() I
%MtWW & i
(a y w r t l b a d
99
I eval uador permanezca prximo al desarrollo del programa, como refleja
J v0Z de narrador, y cuente la trama describiendo los hechos con detalle.
Para ello, el evaluador puede utilizar una expresin emocionalmente cargada
una present aci n narrativa. El relato se parecer a un informe periodstico.
f \ pri mer enfoque de desarrollo de la trama se presta a la metodologa
cuant i t at i va y el segundo a la cualitativa, pero en ambos casos hay una
ordenaci n de los hechos que configuran un relato, aunque muchos de
el los se den por supuestos y no se hagan explcitos. Cuanto ms formal sea
la present aci n, ms cosas se darn por supuestas.
Hemos de distinguir la trama, que es una ordenacin interpretativa de
los hechos, bsica en todas las evaluaciones y requisito previo para la
valoracin que haga el lector, de la forma dramtica Dicha forma puede
variar, presentndose la misma trama de distintas maneras. Una trama
evaluativa puede resultar ms irrebatible, interesante y agradable por la for
ma dramtica y otros elementos estticos. Sin embargo, aunque la trama
sea ms bsica, la esttica con la que se presenta no es mera cosmtica
El buen arte y la buena ciencia unidas conducen al lector a experimentar
un hecho de modo parecido a como lo sinti el creador (Bronowsky, 1956).
Como mostraba Gu s f i el d en su anlisis de los estudios sobre la conduccin
en estado de embriaguez, la esttica que los envuelva puede producir un
efecto importante sobre las recomendaciones y significado de un estudio
poltico, incluso uno cientfico.
Tampoco puede sorprender a nadie que la trama de una evaluacin
sea ms bsica que su forma esttica, dado que el desarrollo de la trama
vincula especficamente unos hechos con otros, como en el caso de las
relaciones entre causa y efecto. Los hechos de la trama pueden presentarse
de distintas formas dramticas, pero tanto ella como los elementos estticos
contribuyen a la coherencia general. En igualdad de condiciones, una mayor
coherencia conduce a mayor credibilidad para los destinatarios. Las cosas
se ajustan mejor. Sin embargo, si la coherencia del informe no es realista,
la credibilidad se pierde.
Podemos pensar en la diferencia entre la trama y la presentacin dra
mtica como en la existente entre contenido y forma o, con trminos de
Pol anyi (Polanyi y Pr o s c h , 1975), la diferencia entre la trama y la "es
tructura. sta puede consistir en imgenes, medidas u otras formas "artifi
ciales de presentacin. Esto no significa que la estructura sea pura
cosmtica. El significado de una obra es la integracin de su apariencia y
su contenido. El significado de un poema no consiste slo en el contenido
del mismo, escrito en prosa.
La trama difiere de una cronologa de hechos porque implica inferencias
e interpretaciones de los mismos. Los acontecimientos se integran entre s
y las partes se ordenan en el conjunto. La trama misma puede estar integrada
con mayor o menor rigidez, proporcionando la necesaria coherencia para te
evaluacin en su conjunto.
A estos efectos, un concepto clave es el de coherencia". sta cons*sle
en la* conexin lgica, congruencia o consistencia al razonar o netactonar,
100
Evaluacin, t ica y Pode
de manera que una parte del discurso no destruya ni contradiga el resto-
conexin armoniosa entre las distintas partes de manera que el conjunto
sea lgico, como en la coherencia de un razonamiento o informe (Oxford
English Dictionary).
De acuerdo con Po l a nyi (Po l a ny i y Prosch, 1975), quisiera ampliar el
mbito de aplicacin de la "coherencia para que incluya tambin las i m^
genes, las estructuras dramticas y otros elementos estticos. Por ejemplo
podemos considerar la consistencia lgica del concepto de conductor be
bido, tal como se utiliza en la argumentacin, pero tambin, podemos
contemplar la imagen de dicho sujeto cuando se emplea de manera armo
niosa con otros elementos.
En s, la imagen sirve para condensar significados entremezclados, tanto
emocionales como cognitivos, con su propia coherencia compacta. Tiene
una relacin con lo cotidiano, con el mundo real de la que carece el con
cepto. Podemos definir el concepto de manera explcita, pero la imagen
slo a travs de la participacin tcita. Los significados multiestratificados
implcitos en las imgenes y dems elementos estticos hacen posible la
comunicacin de evaluaciones complejas, elaboradas y muy perfeccionadas
de los objetos sometidos a estudio. Los elementos estticos transmiten
intensidad, unidad y complejidad (Beardsley, 1958).
Los elementos estticos, como las imgenes y las estructuris gramticas,
se distinguen de las entidades lgicas porque aqullos se captan de forma
inmediata, sin recurrir a razonamientos formales. En este sentido, son como
las percepciones. Los elementos estticos pertenecen slo a la apariencia
y se captan mediante la influencia tcita, por la integracin inconsciente de
sus partes (Po l a n y i y Pr o s c h , 1975). As, si leemos el estudio sobre el
conductor bebido, asimilamos de algn modo inconsciente los significados
tcitos transmitidos por las imgenes y la estructura dramtica. En el apren
dizaje hay un bagaje considerable de percepcin subliminal, aunque, si
se indican, sea fcil detectar los elementos estticos.
Es ms, el lector participa activamente en ese aprendizaje y^ llega a
adquirir una postura activa en la integracin de las partes en significados
tcitos y, con frecuencia, se involucra profundamente en el proceso, aunque
la profundidad de su participacin vare entre unos y otros lectores. Ms
adelante, las inferencias tcitas y las explcitas se integrarn en una imagen
global individual, la estructura subjetiva de conocimiento. Se trata de la
imagen del mundo del sujeto que, en ltimo trmino, influye en l$ propia
conducta (Bo u l d i n g , 1956).
Y sostengo, de un modo explcito y no tcito, que cuanto mayor sea la
coherencia, ms creble y digno de confianza ser el informe de eval uaci n.
Un informe incoherente no es en absoluto creble y, en igualdad de condi
ciones, cuanto ms coherente sea (hasta cierto punto), ms creble, parecer.
Por regla general, tambin el evaluador procura ser persuasivo (para
llevar a sus destinatarios a determinado punto de vista o, incluso, lnea de
accin concreta, mediante la razn y la comprensin). La mayor parte del
peso de la persuasin recae en la argumentacin explcita, pero tambin en
0 Bdknort Mor ala, 8. L
101
te caso, l a coherenci a ref uerza la persuasi vi dad del argument o. Con
eS or f recuenci a, el eval uador aspi rar t ambi n a susci tar el compromiso,
ara vi ncul ar al l ect or con una post ura det ermi nada u obl igarl e a aceptarla,
patas eval uaci ones son l as ms poderosas, pero tienen que pagar el pre-
o de un conj unt o reduci do de desti natari os a cambi o del compromi so
ms prof undo de unos pocos. Desde la credi bi l idad hasta la persuasi vi dad
I e| compromi so, avanzamos cada vez ms haci a la accin. En la mayora
de las eval uaci ones, l a coherenci a desempea el papel ms humi lde de
realzar la credi bi l i dad.
La forma
La ciencia no es sino el intento de descubrir la unidad en la enorme diversidad
de la naturaleza o, con mayor exactitud, en la variedad de nuestra experiencia.
La poesa, la pintura, las artes constituyen la misma bsqueda... de la unidad en
la vari edad. Cada una a su modo busca la semejanza bajo la diversidad de la
experi enci a humana.
J. Br o no w sk i : Science and Human Vales, 1952, pg. 16.
Si ef contenido difiere de la estructura dramtica de su presentacin,
qu comprende la forma esttica? En un artculo clsico sobre "The Problem
of Esthetic F o r m Pa r k e r (1960), siguiendo a Ari st t el es, deca que la
forma esttica puede analizarse en relacin con seis principios: unidad
orgnica, tema, variacin temtica, equilibrio, jerarqua y evolucin. El principio
fundamental es el de unidad orgnica y los dems son subsidiarios de ste
de distintas maneras. Dicha unidad realza la coherencia plena.
El principio de unidad exige que la obra slo contenga elementos nece
sarios. En cierto sentido, la forma esttica est en contradiccin con la vida,
que contiene muchos elementos innecesarios, desde el punto de vista est
tico. Los otros cinco principios son manifestaciones del pricipio de unidad.
En un jhforme de evaluacin debemos disponer de un tema y, para
conseguir el efecto completo, ste no slo debe persistir, sino reaparacer
en distintas variaciones. En los estudios de evaluacin, se logra con fre
cuencia este efecto presentando datos que estructuran un tema comn.
Esta estructuracin y abreviacin de datos refuerzan la veracidad; movilizan
al lector.
El equilibrio supone una igualdad de elementos opuestos que se ba
lancean en la forma. Proporciona la tensin dramtica. La jerarqua cons
tituye un modo de organizar las distintas partes. Por ltimo, Park er aade
el principio de evolucin, indicando cmo puede crearse el sentido pleno
mediante una acumulacin en la que las partes primitivas determinan \o
Que suceda despus. La unidad evolutiva puede lograrse mediante un dmax
?&I problema de la forma esttica. (N. del T.)
@Ecbctooe Moris. S l
al final o asumiendo el mismo final mayor importancia que las dems par+
En la evaluacin, el informe puede evolucionar hacia conclusiones surgjH
de la presentacin de los datos.
Quiz sea ms fcil ver estos principios estticos en una narrac^
dramtica. The Fina/ Days, de Wo o d wa r d y Bernst ei n (1976), no es un^
evaluacin, pero constituye un tratamiento interesante de materiales prea
suntamente reales. Se narran paso a paso los das finales del rgimen
Nixon. Esta diaria cuenta atrs hasta el inevitable desenlace de su dimisin
contribuye a la intensidad dramtica de la obra. Woodward y Ber nst ei n no
se limitan a contar uno detrs de otro los relatos de di st i nt as personas
sobre los hechos, tal como fueron recogiendo la informacin, sino que corr,
binan diversas percepciones para constituir una representacin general
compleja, pasando de los pensamientos y acciones de una persona a los
de otra. A partir de esta interreiacin, surgen ciertos temas.
Distintas fuerzas convergen sobre un Nixon desafiante y recalcitrante.
De diversas maneras, uno a uno, sus defensores ms destacados van
convencindose de que es culpable y debe dimitir. Estas pequeas pince-
ladas personales en el marco de un drama ms amplio se repiten en
variaciones temticas que contribuyen al tema global del continuo desgaste
de la defensa de Nixon. l mismo duda entre dimitir y continuar en el poder.
Este equilibrio va perdindose da a da, hora a hora. A partir del tema del
creciente aislamiento de Nixon, surge otro trascendente: su desintegracin
personal. Estos temas se entretejen con maestra hasta desembocar en el
desenlace de su desgracia, su dimisin y su colapso como persona.
Principios estticos semejantes se aplican al material cuantitativo, aunque
a veces resulta ms difcil discernir sus efectos. La simplicidad, economa y
elegancia de un adecuado diseo experimental o anlisis multivariado son
manifestaciones del principio de unidad. De hecho, algunos cientficos-
filsofos, como Pol anyi , creen que, en los dominios ms elevados del pen
samiento, el matemtico se gua ante todo por su intuicin esttica.
Consideremos, por ejemplo, el atractivo esttico de un anlisis rnultivariado
en comparacin con una larga cadena de anlisis bivariados de datos. Esa
compresin suscita un atractivo que supera con mucho el mayor valor de
verdad que pueda encerrar un anlisis multivariado. La bsqueda de diseos
ms elegantes se basa, en parte al menos, en tales satisfacciones. O consi
deremos el atractivo que encierra una escala de Guttman. La parquedad de
ese tipo de escalas y de las teoras jerrquicas basadas en ese ordenamiento
apela a la sensibilidad esttica. Siempre buscamos problemas y datos que
se adapten a esos diseos.
El atractivo esttico de los estudios cuantitativos se refleja en expresiones
como coherencia, 'elegancia, economa y potencia". En cierto sentido,
las soluciones elegantes son compactas, sencillas, rpidas, proporci onan
una sensacin de control, utilidad y dominio semejantes a la bsqueda y
hallazgo de la 'palabra exacta para describir algo. Las soluciones elegantes
evitan pasos y procedimientos innecesarios. Son irresistibles.
No slo encontramos esta coherencia en los estudios cuantitativos. Ni
0 dwon* Morete, & f
C^ r g n c i a y o i b i l i d a d
l0s el ement os estructurados tienen por qu ser cifras o smbol os. Una de
las razones primordiales del carcter persuasivo de la evaluacin de las
grabaciones educativas de AERA efectuadas por Gl ass (1972) consiste en
la forma en que los argumentos se conjugan en una representacin general
(Apndice A). Los elementos son las argumentaciones. Gl ass consigue
integrar las partes lgicas de la evaluacin en una estructura retrica global
coherente. En este caso, la elegancia significa que pocas partes son pres
cindibles respecto a la lgica global de la evaluacin. Hay una estructura
orientadora clara, aunque compleja, en la que las partes se ajustan con
exacti tud y pulcritud en el conjunto.
Adems de la elegancia y la coherencia, hemos de afirmar que el trabajo
de Gl a s s resulta creble por su voz, la actitud del narrador en relacin
con su objeto de estudio. Gl a s s proyecta una persona en calidad de
narrador convencido por los datos, con independencia de cmo se manejen.
La i magen del narrador es la de un hombre racional dispuesto a dejarse
persuadi r por las pruebas. La identificacin de esta caracterstica como un
ef ect o del estilo no cuestiona su autenticidad.
Outward Bound (Salida)*
Evocar en uno mismo un sentimiento ya experimentado y evocado despus
en uno mi smo por medio de movi mi entos, lneas, colores, sonidos o formas
expresadas en palabras, para transmitir ese sentimiento de manera que otros
experi ment en el mismo sent imi ento: sta es la actividad artstica
To l s t o y : La comunicacin de la emocin".
La evaluacin que Smi t h , Ga b r i el , Sc h o t t y Pad i a (1976) hicieron de
Outward Bound resulta poco habitual por utilizar tanto mtodos cuantitativos
como cualitativos. Las dos partes se trataron por separado y ambas se
incluyeron en el informe final. Las lneas que abren el estudio sitan el
problema y la tensin dramtica:
Qu le ocurre al joven que opt a por afrontar las dificultades fsicas relacio
nadas con las rocas, peascos, campos nevados y torrentes de las Montaas
Rocosas y las dificultades i nterpersonal es de un pequeo grupo aislado en un
medio extrao? Los defensores del programa Outward Bound, al umnos y prole-
sores, sostienen que los efectos psi col gi cos son exclusivos en cada participante
sin qu$ puedan preverse. En cambi o, otros muchos afirman que el programa
* ComQ pbservar el lector, el programa Outward Bound consista en cursaos de verano
cuyo objetivo es el fortalecimiento de la personalidad de quienes participan en l por medio de
un ejercici o f sico inhabitual, la permanenci a en un ambiente imponente y hostil en relacin
con el medio ordi nario, y la vida en un grupo reducido de personas aisladas en el medio t aco
descrito. La denomi naci n del programa, cuya traduccin al castellano es "saWa es lo
bastante al usi va al respecto. (N. del T.)
causa cambios profundos y previsibles en los sentimientos de los part i ci pant es I
respecto a s mismos y a los dems.
(Pg. 401.) I
La tensin introducida en estas lneas proporciona ambiente dramtico I
significado e inters. La cuestin bsica se trata de dos maneras: mediante I
la medicin cuantitativa y por observacin cualitativa participante. Ambas I
reflejan la historia global de la evaluacin.
En la parte cuantitativa, se escogieron cuatro variables como criterios de I
resutados: autoestima, autoconciencia, autoafirmacin y "aceptacin I
por los dems. Se elaboraron instrumentos psicomtricos para medir las I
cuatro variables. La "voz del apartado cuantitativo era la del narrador neu- I
tral, cientfico. La oportunidad para la elegancia provena del diseo del I
estudio.
Trabajando con grupos de participantes que desarrollaban su entrena- I
miento en diferentes ocasiones durante el verano, los evaluadores asignaban I
al azar estudiantes a grupos, administrando los cuestionarios slo una vez I
a cada grupo en distintos momentos. As, pudieron utilizar un diseo complejo I
de series temporales en el que cada grupo serva de control de los dems. I
Se recogieron y analizaron 44 medias en cada uno de los cursos de junio, I
julio y agosto.
La unidad se consegua mediante la representacin grfica precisa de I
las 44 medias, de manera que pudiesen compararse entre s, tanto d& manera I
visual como matemtica. Una tabla de cuatro por tres entradas resuma de I
forma sucinta ia considerable masa de datos. El nico defecto esttico consista I
en que las cuatro variables de resultados no estaban relacionadas de ninguna I
manera entre s, rompiendo la unidad del anlisis. La observacin participante I
se ocup tambin de la misma cuestin bsica. La tensin dramtica qued I
establecida a travs de un relato de primera mano. El estilo era personal y I
participativo, en vez de neutral y desinteresado.
El viaje de seis horas de Denver a las montaas de San Juan permi t i que |
se incubaran nuestros temores y esperanzas. Mis propios t emores se cent r aban
en la dif erencia entre m mismo y mis compaeros de Outward Bound. Cal cul
que doblaba la edad de los dems y me pregunt aba si su f ortaleza y aguant e
superaran los mos. La perspectiva de fallar f sicamente y constituir un l astre
social era desalentadora. Como los nios de mi alrededor, saba algo de lo que
se supona era y me procuraba Outward Bound para m. Era consciente de sus
orgenes militares y de los rumoreados peligros f sicos del programa. Era t a m b i n
la indicacin de que experimentaramos la entrada mstica en la edad adul t a.
Aunque ya haca mucho tiempo que yo haba entrado en dicha edad, ci ert os
aspectos de mi mismo suscitaban dudas respecto a los prximos veintitrs das
mi temor a las alturas, mi inexperiencia en si tuaci ones competi ti vas, mi i nt ransi
genci a cuando me obligaban. Las dudas eran cuesti ones ment al es repet i das:
me dej arn atrs? Me entrar pni co a mitad del ascenso por una roca
escarpada? Fracasar en el papel de adulto, me har cargo de demasiada
104 Eval uaci n, ti ca y I
(dktenMMorata. 8. L
y f ^ i M a d
105
r e s p o n s a b i l i d a d y ser rechazado? Abandonar? El silencio que reinaba en el
autobs me llev a pensar que los dems tambin iban meditando sobre las
experiencias que se avecinaban. Cada uno de nosotros tena sus propias visiones
y pesadillas ntimas.
(Pgs. 411-412)
En l estudio, el drama personal y la expresin de sentimientos acre
centaban el inters. Los encabezamientos de las distintas secciones indica
ban la progresin dramtica: Esperanzas, Competiciones, Expediciones,
A solas, Desafo soci al , Expedicin final, Maratn. El clmax de la
narracin estaba constituido por el ascenso a una montaa peligrosa y una
carrera agotadora. La redaccin era a la vez penetrante y vivida.
Pens que Outward Bound estaba especialmente diseado para personas
como Chris. Nunca haba trabajado, nunca haba tenido que luchar, en realidad,
slo haba vivido esta experiencia de forma indirecta a travs de sus padres y
de los medios de comunicacin. El curso la obligaba a realizar una serie de
experiencias compendiadas, provocando la aceleracin de su maduracin. Casi
poda ver el aumento de su vigor y de su confianza a medida que progresaba el
curso. Ella luchaba con fuerza, pero nunca dejaba de quejarse. Era incapaz de
abandonar su juego de proclamar sus debilidades y ocultar sus capacidades. La
estratagema debe haberle dado resultado, acaso no le vali un paseo gratuito
por el Ro Grande a mis espaldas?
(Pg. 417.)
Se abandona la voz neutral para dar paso a un intenso relato de los
hechos en primera persona Se dejaba constancia de resultados como: la
autoafirmacin, la autoestima y la autoconciencia, en manifestaciones per
sonales. Esta versin de los hechos proporcionaba otro nivel de comprensin
y de significado, diferente de los hallazgos relativos a que el cursillo Outward
Bound tena una influencia positiva en la autoafirmacin y autoestima"
de los participantes, sin afectar de forma mensurable a la aceptacin de
los dems o a la autoconciencia de los participantes, que fueron los
resultados de la medida de las cuatro variables en la parte cuantitativa de la
evaluacin. No obstante, ambas secciones mostraban una estructura esttica
Juntos, los dos componentes proporcionaban una respuesta muy cualificada
pero tambin creble y persuasiva, a la pregunta planteada en el primer
prrafo del estudio.
Los dos anlisis juntos slo cuentan una misma historia de lo ocurrido, y
esa misma historia podra haberse presentado en distintas formas dramticas.
por ejemplo, la estructura general podra haber consistido en una narracin
dramtica completa, con los datos cuantitativos repartidos a lo largo de la
misma para apoyarla. El informe podra haber consistido primordialmente
tambin en un anlisis cuantitativo con explicaciones de los efectos que se
ncluyeran en la seccin de discusin. Tambin podra haberse redactado
104
Eval uaci n, t i ca y poder
causa cambios profundos y previsibles en los sentimientos de los participantes
respecto a s mismos y a los dems.
(Pg. 401.)
La tensin introducida en estas lneas proporciona ambiente dramtico
significado e inters. La cuestin bsica se trata de dos maneras: mediante
la medicin cuantitativa y por observacin cualitativa participante. Ambas
refiejan la historia global de ia evaluacin.
En ia parte cuantitativa, se escogieron cuatro variables como criterios de
resultados: autoestima, autoconciencia, autoafirmacin y aceptacin
por los dems. Se elaboraron instrumentos psicomtricos para medir las
cuatro variables. La voz del apartado cuantitativo era la del narrador neu
tral, cientfico. La oportunidad para la elegancia provena del diseo del
estudio.
Trabajando con grupos de participantes que desarrollaban su entrena
miento en diferentes ocasiones durante el verano, los evaluadores asignaban
al azar estudiantes a grupos, administrando los cuestionarios slo una vez
a cada grupo en distintos momentos. As, pudieron utilizar un diseo complejo
de series temporales en el que cada grupo serva de control de los dems.
Se recogieron y analizaron 44 medias en cada uno de los cursos de junio,
julio y agosto.
La unidad se consegua mediante la representacin grfica precisa de
las 44 medias, de manera que pudiesen compararse entre s, tanto de smanera
visual como matemtica. Una tabla de cuatro por tres entradas resuma de
forma sucinta la considerable masa de datos. El nico defecto esttico consista
en que las cuatro variables de resultados no estaban relacionadas de ninguna
manera entre s, rompiendo la unidad del anlisis. La observacin participante
se ocup tambin de la misma cuestin bsica. La tensin dramtica qued
establecida a travs de un relato de primera mano. El estilo era personal y
participativo, en vez de neutral y desinteresado.
El viaje de seis horas de Denver a las montaas de San Juan permiti que
se incubaran nuestros temores y esperanzas. Mis propios temores se centraban
en la diferencia entre m mismo y mis compaeros de Outward Sot//7d. Cal cul
que doblaba la edad de los dems y me preguntaba si su fortaleza y aguante
superaran los mos. La perspectiva de fallar fsicamente y constituir un lastre
social era desalentadora. Como los nios de mi alrededor, saba algo de lo que
se supona era y me procuraba Outward Bound para m. Era consciente de sus
orgenes militares y de los rumoreados peligros fsicos del programa. E r a [ | a m b i n
la indicacin de que experimentaramos la entrada mstica en la edad adulta.
Aunque ya haca mucho tiempo que yo haba entrado en dicha edad, qiertos
aspectos de m mismo suscitaban eludas respecto a los prximos veintitrs das:
m temor a las alturas, mi inexperiencia en situaciones competitivas, mi^ntransi'
gencia cuando me obligaban. Las dudas eran cuestiones mentales repetidas:
me dejarn atrs? Me entrar pnico a mitad del ascenso por una roca
escarpada? Fracasar en el papel de adulto, me har cargo de demasiada
Ediciones Mor ata, S. L
r e s p o n s a b i l i d a d y ser rechazado? Abandonar? El silencio que reinaba en el
autobs me llev a pensar que los dems tambin iban meditando sobre las
experi enci as que se avecinaban. Cada uno de nosotros tena sus propias visiones
y pesadil l as ntimas.
(Pgs. 411-412.)
En el estudio, el drama personal y la expresin de sentimientos acre
centaban el inters. Los encabezamientos de las distintas secciones indica
ban la progresin dramtica: Esperanzas, Competiciones, Expediciones,
A solas * "Desaf o social , Expedicin final, Maratn. El clmax de la
narracin estaba constituido por el ascenso a una montaa peligrosa y una
carrera agotadora. La redaccin era a la vez penetrante y vivida
Pens que Outward Bound estaba especialmente diseado para personas
como Chris. Nunca haba trabajado, nunca haba tenido que luchar, en realidad,
slo haba vivido esta experiencia de forma indirecta a travs de sus padres y
de los medios de comunicacin. El curso la obligaba a realizar una serie de
experiencias compendiadas, provocando la aceleracin de su maduracin. Casi
poda ver el aumento de su vigor y de su confianza a medida que progresaba el
curso. Ella luchaba con fuerza, pero nunca dejaba de quejarse. Era incapaz de
abandonar su juego de proclamar sus debilidades y ocultar sus capacidades. La
estratagema debe haberle dado resultado, acaso no le vali un paseo gratuito
por el Ro Grande a mis espaldas?
(Pg. 417.)
Se abandona la voz neutral para dar paso a un intenso relato de los
hechos en primera persona. Se dejaba constancia de resultados como: la
autoafirmacin, la autoestima y la autoconciencia, en manifestaciones per
sonales. Esta versin de los hechos proporcionaba otro nivel de comprensin
y de significado, diferente de los hallazgos relativos a que el cursillo Outward
Bound tena una influencia positiva en la autoafirmacin y autoestima
de los participantes, sin afectar de forma mensurable a la aceptacin de
los dems o a la autoconciencia de los participantes, que fueron los
resultados de la medi da de las cuatro variables en la parte cuantitativa de la
evaluacin. No obstante, ambas secciones mostraban una estructura esttica
Juntos, los dos componentes proporcionaban una respuesta muy cualificada,
pero tambin creble y persuasiva, a la pregunta planteada en el primer
prrafo del estudio.
Los dos anlisis juntos slo cuentan una misma historia de lo ocurrido, y
esa misma historia podra haberse presentado en distintas formas dramticas.
Por ejemplo, la estructura general podra haber consistido en una narracin
dramtica completa, con los datos cuantitativos repartidos a lo largo de la
misma para, apoyarl a. El informe podra haber consistido primordialmente
tambin en un anlisis cuantitativo con explicaciones de los efectos que se
incluyeran en la seccin de discusin. Tambin podra haberse redactado
Ediciones Morata, S. i
Eval uaci n, ti ca y Pode
el informe como un discurso socrtico o como una obra teatral. S mit h v
cois. (1976) optan por otorgar un peso igual a lo cuantitativo y lo cualitativo
Con independencia de la forma, el argumento de la eval uacin sera ei
mismo, aunque difiriera en cuanto a su fuerza esttica. La credibilidad de |a
evaluacin depende, en cierta medida, de la correspondenci a: de la parte
cuantitativa con los principios de la medida; de la parte cualitativa con la
experiencia personal de los destinatarios y de las partes entre s: su cohe
rencia Si estos elementos se ajustan adecuadamente entre s y la evaluacin
adopta una forma esttica, toda ella se considerar muy creble. En este
caso, las partes muestran una coherencia mutua y es fcil que los destina
tarios se convenzan de la eficacia del entrenamiento de Outward Bound. ei
nico fallo est en que la parte cuantitativa y la cualitativa no estn unidas
explcitamente, por lo que la unidad global no resulta tan intensa como
podra haber sido.
Con independencia de que una evaluacin abunde en metf oras o en
coeficientes, estructura dramtica o economa matemtica, toda evaluacin
debe cumplir algo fundamental: contar una trama. sta puede ser explcita,
truncada o implcita, pero siempre tiene que existir para poder extraer con
clusiones. Una evaluacin debe interpretar hechos sucedidos en el transcurso
del tiempo.
Con frecuencia, en muchas evaluaciones cuantitativas la trama se da
por supuesta. Por ejemplo, en la evaluacin cuantitativa de Outward Bound,
se presume la existencia de un programa de algn tipo, una serie de
acontecimientos, y que los instrumentos de la evaluacin miden los resul t ados
de ellos. El objetivo del diseo experimental consista en descubrir si los
presuntos acontecimientos eran las causas de los cambios observados en
las medidas. En tal caso, se derivan en todo ello determinadas inferencias.
La esttica agradable de la evaluacin depende del uso apropiado del
diseo experimental, la estadstica, etctera
En la seccin cualitativa de la evaluacin, los acontecimientos se repre
sentan de forma personal, en vez de darse por supuestos. La esttica est
en las imgenes y en la estructura dramtica. Los datos procedan de la
observacin directa en relacin con categoras cotidianas, en vez d derivarse
de interpretaciones de instrumentos sobre la base de categoras cientficas.
La trama presentada moviliza al lector y, en igualdad de condiciones, cuant o
mejor sea la presentacin esttica de la misma, ms se movilizar al l ect or.
Autenticidad
Una obra de arte no es autntica ni veraz en virtud de su contenido ni por su
pura" forma, sino por el contenido convertido en forma.
Herbert Ma r c u s e: The Aesthetic Dimensin, 1978, pg. 8-
Por qu son tan importantes los elementos estticos como las i mgenes
y ta estructura dramtica? Hay muchas explicaciones, en su mayora extra'
$ &Jkaon* t Morata, S, L
rrh^ ^ ^ d j b i l i d a d
^as l e teoras de la esttica o del arte, pero no existe una explicacin nica
acept ada (Di ck i e, 1971). Es obvio que contemplamos nuestras vidas en
forma d M | l c e n a rios y argumentos, que las imgenes estn configuradas
@n el lenguaje de nuestros pensamientos cotidianos. Las imgenes concretas
constituyen la trama que compone nuestra mente y nuestra memoria
El aHrplogo Tu r n e r (1973) afirmaba que el alecto es en s miao
concreto, piarticular y est asociado con la relacin nica del yo con su
ambi ent e objetivo (pg. 354). Los principios abstractos son inadecuados
p a r a actuar en el mundo real. Esa integracin en el ambiente se consigue
medi ante condensaciones concretas, afectivas, que slo pueden proporcionar
las imgenes, los smbolos, los rituales y los mitos. Estos instrumentos
transmiten fuerza afectiva y motivadora en el marco del significado subjetivo
de la persona.
De igual modo, Sul l i van (1977) indicaba que el papel de la imaginacin
consiste en proporc iona r imgenes y mitos integradores. El individuo acta
siempre en u r f contexto personal e histrico concreto. Las teoras de la
accin y de la c o nducta muy formales y abstractas pasan por alto este nivel
ms profundo d e la motivacin contingente1.
Aunque tal es anlisis son perspicaces, quiz subestimen la fuerza mtica
de la misma ci enc ia. A veces, las personas actan sobre la base de resul
tados que c o nside ran extrados de forma cientfica. La ciencia tiene sus
propios mitos y su propia autoridad mtica. Y la necesidad de una imaginera
concreta no e x p l i c a los efectos de las representaciones estticas ms abs
tractas
Por ej emplo, por q u es tan eficaz la forma dramtica? Segn Bhoudy
(1972), au n q u e la fo r m a dramtica no equivale al significado moral o meta-
fsico, es su p rim er indicio. La verdad literal suele ser confusa e insigni
ficante. D e b e conve rtirs e en ficciones plausibles. Las ilusiones son nece
sarias para el significado humano. Las interpretaciones estticas se convierten
en bsquedas d e significado de los acontecimientos humanos. Es ms, con
frecuencia, las p e rs o n a s juzgan la credibilidad de los hechos que se les co-
1En f st t i ca exi st en teoras similares. El objetivismo de la teora de Piaget tiene sus
anlogos erl posof a moral y en esttica. La teora de la justicia de Rawl s (1971) se predica
sobre la base de una* * situacin original en la que un velo de ignorancia limita el conocimiento
y las motivaciones que deben t ener las personas cuando escogen sus principios de justoa.
Los sujetos que se hall an en las situaciones originales hipotticas desconocen su posoon
social o sus part i cul ares talentos. Adems, son racionales y no altruistas. En otras palabras, e
inters individual se reduce en cuanto motivacin y podemos presumir que las personas
actuarn deSi aneral mparci al . Como en la psicologa de Pi aget, se concibe al actor como
'^personal, abst ract o, carent e de motivaciones contingentes.
En la filosofa de l a estti ca, la postura correspondiente recibe la denominacin de objetvemo
f enomenQlgi c| | ^nsHALK, 1962). Un individuo debe ver un objeto desde la adecuadaJfcid
esttica, que i ncl uye eli; desplazamiento de lo prctico y la prdida de la condenade y&
Asumiendo esa act itud, el i ndi vi duo es capaz de mostrar objetivamente cmo ciertas ca
rsticas de l i obra provocan determi nadas emociones (Bever, 1974). En cor#rss*& con este
perspectiva est $| post ura que sosti ene que el significado de un objeto esta W*
el inters del i ndi vi duo al ver el objeto (Beyer, 1977).
109
Eval uaci n, ti ca y p0(jef
munican obra la base de criterios estticos como la viveza y la unidad
intrnseca, sobre las apariencias.
Por tanto, una experiencia esttica es una experiencia y no mera expe
riencia. El artista selecciona acontecimientos cuyo impacto es acumulativo.
La tensin que surge de la estructura dramtica rige la atencin del pbl i co.
Por ejemplo, en el estudio del conductor ebrio, el investigador mantiene la
atencin entre las dos imgenes del conductor borracho que compi t en
entre si. Desde el punto de vista de Br o u d y , la alternativa de la representacin
imaginativa es la insignificancia. La presentacin esttica trata de captar la
esencia" de los acontecimientos ms que su mera realidad literal.
Tambin Pounvi considera que la cuestin subyacente es la si gni f i
cacin:
Nuestras vidas carecen de forma, sumergidas en un centenar de encrucijadas.
Las obras de arte son representaciones imaginativas, labradas en model os arti
ficiales; y estos modelos, cuando se integran juntamente con una constante
importante, producen un significado de una calidad caracterstica. Estos modelos
artificiales hacen... que las obras de arte queden aisladas del flujo de la experiencia
personal y de la vida pblica. Ellos hacen que las obras de arte sean algo
desligado, en muchos casos transportable y reproducible y, en potencia, inmortal.
(i; (Pg. 101.)
Desde una perspectiva ms radical, Ma r c u s e (1978) haca hincapi en
la importancia del sentimiento personal y de la forma artstica en la ref orma
social. La subjetividad la historia interna y personal del individuo puede
ser una fuerza liberadora si se expresa en una obra de arte. La real i dad
dada", la realidad configurada y verificada por las instituciones soci al es
dominantes, puede reconfigurarse en la obra de arte. sta constituye una
realidad alternativa en oposicin a la realidad dada. Asi, la obra de arte
desafia el monopolio de las instituciones establecidas respecto a la def ini ci n
de la realidad.
En este proceso, la forma esttica convierte el contenido en un conj unt o
nuevo con entidad propia. Esta nueva visin revela las dimensiones de la
realidad reprimidas en una realidad ficticia que capta slo la esencia de
los hechos. Por medio de la concentracin, la exageracin, el inters por lo
esencial y la reordenacion de los hechos, se reestructura la conciencia de
la audiencia. La experiencia se intensifica.
El contenido de la obra es un sentimiento subjetivo y la forma subj et i va
convierte el contenido en un conjunto con entidad propia, que permite que
la obra se enfrente a la realidad dada". Cuando el contenido se convi ert e
adecuadamente en forma, la obra adquiere el carcter de autenticidad. Por
eso Mar c u s e puede decir: La autntica utopia se funda en l a memori a"
(pg. 73),
# fidMena* Metala & L
la belleza del conductor ebrio
La sabi dura, la habi li dad para llegar al ncleo de la cuestin en situaciones
concret as, se adqui ere despaci o; es una disciplina de experiencia, imaginacin
e historia, no de i nteligencia desnuda.
.. M, Novak, Ascent of the Mountain, Flight of the Dove, 1971, pg. 58.
El real i zador de documentales Frederick Wiseman, muy conocido por
sus pel cul as sobre instituciones sociales, como el sistema de bienestar y la
industria de envasado de carnes, describa sus documentales para la tele
visin como ficcin de la realidad, como una estructura ficticia con la
ilusin de l a verdad (OCo n n er , 1976). A partir de la masa informe de
ci ncuenta horas de pelcula, Wiseman da forma al documental en el proceso
de mont aj e, en el que introduce los elementos de ritmo, estilo y estructura
Segn Wi seman, aunque la seleccin se hace arbitrariamente, el realizador
trata de capt ar una parte de la verdad, tal como l la ve.
Sin embargo, la evaluacin no es ficcin o, al menos, no debe serlo. Las
afirmaciones que se hacen respecto a las artes, incluso al arte documental,
no tienen por qu ser las que den forma a la evaluacin. De un informe de
evaluacin esperamos mayor veracidad que de una novela o pelcula Vol
viendo a la pregunta original, cmo podemos justificar una presentacin
artstica de tos datos que afecta a la misma interpretacin del estudio en
cuestin?
Lan g er (1942) deca que hay, al menos, dos tipos de significados: el
literal y elrartstico. El literal se refiere al contenido explcito y se expresa
mediante proposiciones. Pueden ser verdaderas o falsas. El significado
artstico versa sobre la forma tcita y se expresa como sentimiento. Puede
ser adecuado o inadecuado. En consecuencia, la referencia concreta y la
significacin? potica son dos relaciones muy diferentes entre smbolos y
sus significados, pero ambas pueden identificarse.
En la teora de Langer , la ciencia avanza gracias al pensamiento discur
sivo que puede reducirse a conceptos analticos y a "hechos. Langer
indica que el uso discursivo de los smbolos, que alcanza su clmax en la
ciencia, slo es una forma de conocimiento. Hay formas no discursivas de
conocer, como las visuales; formas en las que los elementos del conjunto
se presentan de modo simultneo, como en las pinturas, imgenes, metforas
y mitos. En cuanto tal, el significado artstico no est sometido a tests de
falsificacin similares a los que existen en los enunciados preposicionales.
En cambio, la f orma artstica es ms comprensible en trminos de con
sistencia, coherencia, economa y elegancia. No obstante la utilidad de los
smbolos discursivos, no tenemos ms remedio que acudir a la forma aitis&ca
PaI? exPresar el sentimiento. La teora del arte de Langer es una teona de
imitacin, en la que la forma artstica acta como anlogo de la emocin,
demismo modo que el lenguaje discursivo opera como anlogo lgico <W
mundo fsico (Di ck i e, 1971). Con independencia de la fuerza de la afirmacin
Eval uaci n, tica y poder
es innegable que el significado artstico puede oponerse, a veces, al literal.
Es posible, sin duda, que los usos inadecuados de la metfora, los hechos
errneamente reconstruidos o los datos omitidos pueden desorientar al
pblico.
Por ejemplo, The Final Days, de Woodward y Bernst ei n, suscitan cues
tiones sobre su veracidad. Se levant una polmica acerca de la veracidad
de los hechos mencionados e, incluso, sobre hasta qu punto podan conocer
los autores determinados sucesos ntimos. Algunos participantes dijeron
que los autores haban dejado de lado detalles discordantes con el fin de in
tensificar el drama sobre la desintegracin de Nixon. La credibilidad de
los autores se resinti porque el libro resultaba demasiado dramtico. Con
independencia de sus mritos en este caso concreto, no es difcil apreciar
cmo puede sacrificarse, a veces, la verdad literal a la forma dramtica. A
pesar de que John Keat s opine lo contrario, en ocasiones, la verdad y la
belleza son incompatibles.
Ms all de la veracidad de la obra se sita la pregunta de si es equitativa
respecto a las personas que representa. En otro lugar he tratado la cuestin
de la justicia relacionndola con el atentado contra el propio derecho a la
autoestima (Ho u s e, 1976). No cabe duda de que la relacin entre verdad y
justicia en The Final Days es discutible. Incluso columnistas liberales han
criticado que los autores fueron demasiado lejos en su representacin de
Nixon como persona en proceso de desintegracin.
Una evaluacin puede verse gravemente amenazada si se comprueba
que uno de sus elementos es falso o de origen discutible. Qu ocurrira,
por ejemplo, en la evaluacin de Outward Bound de Smi t h y cois. (1976),
si descubriramos que quien escribi el excelente relato en primera per
sona no ha experimentado en realidad la situacin? La autenticidad de la
obra se resentira si el redactor hubiera reconstruido las aventuras de un
tercero.
Y qu decir si el viaje a las Montaas Rocosas se basara, en realidad,
en tres viajes efectuados en tres ocasiones por tres personas distintas, y,
por razones estticas, el autor hubiese combinado las tres experiencias
diferentes en una nica narracin dramtica? La ventaja es evidente. De
ese modo, la narracin transmitira el tono del sentimiento de la experien
cia de ia montaa veracidad de sentimiento con una fuerza que no se
ria posible alcanzar con tres relatos distintos. Esto resultara positivo para la
coherencia de la obra, su credibilidad y su capacidad de persuasin.
Por otra parte, esa narracin no sera verdadera, en sentido literal. Est ara
justificado que el autor se tomara tales libertades? Debera darse una co
rrespondencia entre la veracidad literal y la de sentimientos, entre verdad y
belleza. An con la importancia que la belleza tiene en la evaluacin, si se
produce un conflicto entre verdad y belleza, la primera debe predominar. En
ftimo trmino, la evaluacin no es ficcin, aunque las imgenes y la f orma
sean necesarias para transmitir significados complejos. Es posible el equil i bri o
entre verdad y belleza. Podemos omitir ciertos hechos para que el i nf orme
sea ms coherente, ms legible. Pero slo sacrificaramos una pequea
a cambi o de una belleza de gran magnitud. La verdad es relativa-
nte ms valiosa.
' p a r a m, la solucin gira en torno a la idea de la trama eval uaba
den permi t i rse libertades en la estructura dramtica siempre que no se
ndifipue la t rama evaluativa. O sea, unas personas fueron a las montaas
experi ment aron estas cosas, aunque no exactamente como apareceran
^ un pl ant eami ent o literal? Si esas personas no experimentaran cosas
eimiiares o si el lenguaje figurativo sugiriese estados sentimentales diferentes
He los i nduci dos por el viaje a las montaas, la licencia sera excesiva en
una eval uaci n. Los destinatarios de la misma podran verse inducidos a
error de f orma significativa y tendran una representacin falsa del programa
Asimismo, t endran que decirnos que los acontecimientos relatados habran
sido reconst rui dos. Podramos comprobar la veracidad por la consistencia
nterna de l a narracin, por la coherenci a con el anlisis cuantitativo y por
su congruenci a con la propia experi enci a del lector.
Tampoco los estudios cuantitativos se ven libres de este conflicto. Las
tcnicas de medida y anlisis se basan a menudo en criterios estticos y, a
veces, se traducen en aplicaciones inadecuadas. Es ms, las secciones
dedicadas a la metodologa de la mayora de los estudios estn redactadas
desde una perspectiva reconstructiva de lo ocurrido ms que desde la
forma real de? recoger y analizar los datos. Esta reconstruccin debera
tener un lmite fijado en el punto en que la historia de la evaluacin se
modifica de manera significativa. Por ejemplo, los destinatarios pueden su
poner que se hayan adoptado las precauciones habituales en la recogida
de datos cuando, en realidad, no se hubieran tomado. Oesos mismos des
tinatarios pueden creer que se ha efectuado algn tratamiento cuando, de
hecho, su rr&jimentacin sera cuestionable. Como en un estudio cuantitativo
los destinatarios dan por supuestas tantas cosas, no aclaradas por los
autores, la reconstruccin de lo ocurrido constituye un problema permanente.
Volviendo al ejemplo inicial del estudio del conductor bebido, se justifica
que el investigador utilizara imgenes fuertes del conductor ebrio? La res
puesta es un s condicionado, si aceptamos que el propsito de una
evaluacin o estudio poltico consiste en informar la opinin y conducir a la
accin. La condicin se basa en que la imagen del conductor ebrio debe
ser congruente con el resto del estudio, pues no es la nica versin que
hubiera podido escoger el autor, y que la perspectiva adoptada refleje ade
cuadamente el mundo real. Estas versiones son esenciales para la accin
moral. Emplean el vocabulario de la accin que sigue constituyendo una
Aligacin del evaluador (Ho u s e , 1973). No obstante, en los casos concretos
en los que verdad y belleza se oponen, la primera es ms importante que ia
segunda, y la justicia, ms importante que ambas.
CAPTULO VI
Just i ci a
La justicia es la primera virtud de las instituciones sociales,
como la verdad lo es de los sistemas de pensamiento.
John Rawls: A Theory ofJ ustice.
Consideremos una situacin tpica del evaluador en ejercicio. Unobierno
contrata sus servicios para evaluar un programa educativo dirigido a alumnos
desventajados. Cmo acta? Qu busca? Las posibilidades son mayores
de lo que podramos pensar. Puede administrar un test normalizado de
rendimiento y comparar las puntuaciones con las de los alumnos que no
participan en ese programa. Puede elaborar un test especial, basado quiz
en objetivos, para evaluar determinadas reas de deficiencia acadmica.
Puede medir las actitudes, opiniones y autoconceptos de los estudiantes.
Por otra parte, puede: solicitar las opiniones, actitudes y juicios de los
profesores acerca del programa; observar cmo se comportan en clase, en
ios pasillos, en la calle alumnos y profesores; registrar y analizar lo que los
profesores dicen de los alumnos, cmo los clasifican, qu niveles fijan;
preguntar a los padres sobre el programa, los profesores, las escuelas;
examinar la participacin de los padres en las actividades escolares o ios
esfuerzos de las escuelas para hacer participar a los padres.
Puede: pedir las opiniones de los patronos sobre el contenido o los
resultados del programa; comparar el contenido del programa con las des-
NQTA DEL AUTOR; Este captulo constituye una amplia modificacin de las ideas cont e
nidaen Justice mEvaluaron", en: G.V, Gl ass (ed.): Evaluaban Studies Review Annual, Voi .
Beverly Hito; Sage Publications, 1976; y "The Role of Theories of Justice in Eval uat i on
ducaUot Tht&ty, Voi, 29, n. 4,1980 Este ltimo es una respuesta a la critica de St ri ke
OiTfll
# Mcwmi Me*, S t
^ | i a r i a s para las actividades ll ral es o estudiar las oportafedM
^ de l os alumnos, o el salario, o la actuacin despues del programa.
notas de cursos escolares posteriores; pedir a expertos en tas
feas cd| P>ondi ent es 0 a ,deres polticos que j uzguen el programa; hacer
fis propi os juicios; montar un pseudojuicio y hacer que juzguen ei programa
Personas det pblico. Podra hacer muchas otras cosas.
^ Qu hace el evaluador? Influyen en ello un conjunto de factores: su
experiencia, su formacin, lo que quiere el gobierno, k) que pretenden las
personas qujfcfiarticipan en el programa etc. Uno de estos factores * ^fluyentes
esia concepci n de justicia, tcita, por regla general, que tengan el evalua
dor y el pat roci nador de la evaluacin. Lo que crea correcto el evaluador y la
concepci n de justicia que predomina influirn de manera significativa en
la eval uaci n.
Hemos de admitir que la influencia es compleja y nada directa La
evaluacin no es una deduccin de la concepcin de la justicia La conexin
es ms vaga, ms implcita, pero en absoluto menos influyente. La concepcin
dominante de justicia limita los enfoques que se adopten, las actividades
que se consideren justificadas, los argumentos significativos. Las concep
ciones de l justicia operan ms en calidad de marcos de referencia que
como mquinas internamente coherentes para deducir conclusiones. Distn-
buyen el peso de los argumentos de determinadas formas.
Las tcnicas y las prcticas de evaluacin no forman, en s mismas,
parte de una determinada teora de la justicia, como el utilitarismo o la
justicia como equidad de Ra w l s . Por ejemplo, la regresin mltiple no es,
de por s, utilitaria, aunque un evaluador que creyera que son pocos los
indicadores ci| feffrtitativos de xito acabara utilizando una y otra vez la
regresin mltiple. Quien pensara que en una evaluacin deberian estar
representados de forma directa los intereses de diversas clases de pblico
empleara la entrevista mucho ms que un utilitarista. En s, la tcnica no es
utilitarista, sino el razonamiento que lleva a ciertas opciones que ha de
hacer el evaluador.
En parte, el evaluador acta por intuicin y la filosofa puede agudizar
las intuiciones y sensibilidad de aqul. Las intuiciones del evaluador no slo
se refieren a la justicia, sino al propio inters, y la filosofa puede hacer ms
agudas las mejores intuiciones mediante la reflexin sobre las teonas de la
justicia Las personas pueden justificar las evaluaciones en relacin con las
concepciones y las teoras de la justicia, y as lo hacen muy a menudo,
aunque de la forma intuitiva aqu indicada.
El evaluador tiene que escoger. Si piensa que una mayor cantxlad di
Puntuaciones de tests normalizados se traducir en mayor escolanzacii
un trabajo mejor, ms dinero y, quiz, mayor satisfaccin de los esluAartes
-en pocas palabras, que est convencido de las ventajas de tos l
s utilizar como indicadores de xito del programa. Si cree que k
Pacin de los padres es fundamental o que los intereses de lo
estn mejor representados por las opiniones de sus padres, He
Una Val uaci n muy diferente. Quiz todava utilice tests norm
Eval uaci n, tica y ,
forma de representar los intereses del alumno y de quines sean los interese!
registrados se traducir en evaluaciones significativamente distintas. El hechl
de que se representen intereses diversos es una cuestin que at ae a ul
teora democrtica, pero hay muchas concepciones de la j ustici#'coherentes I
con un punto de vista democrtico. Por ejemplo, un eval uador neomarxi st al
quiz busque desigualdades presentes en el medio escolar, mi ent ras q ^ J
un pluralista poltico procurar representar las opiniones y val ores de muy I
diversos grupos.
La evaluacin es una actividad poltica por naturaleza. Presta sus servicios
a los responsables de las decisiones, se traduce en redi st ri buci ones de
recursos y justifica que unos reciban ciertas cosas y otros ot ras. Est nt.
mmente vinculada con la distribucin de los bienes bsicos en la sociedad.
Es algo ms que un enunciado de ideas; se trata de un mecani smo social
para la distribucin, que aspira a adquirir una categora i nsti t uci onal ! La
evaluacin no slo debe ser veraz, sino tambin justa. Sus esquemas al
uso, con independencia de su valor de verdad, reflejan la j ust i ci a en grados
muy diversos. Y la justicia constituye una norma importante con respecto a
la cual juzgar la evaluacin.
En este captulo, presento tres concepciones de justicia la utilitaria, la
intuicionista pluralista y la justicia como equidad de Ra w l s , rel aci onndol as
con los enfoques actuales de la evaluacin. Trat o de seal ar al gunos puntos
fuertes y dbiles de las distintas concepciones y de llegar a est abl ecer un
juicio global sobre la que es preferible. Como seala St r i k (1979), una
teora de la justicia propia del sujeto no determina un ni co enf oque de la
evaluacin. No obstante, creo que la teora del sujeto li mita l os enf oques
posibles de la evaluacin y se utiliza para justificar esos enf oques (Hou-
SE, 1979).
Utilitarismo
Segn Rawl s (1971), la tica utilitarista estipula que una soci edad es
justa cuando sus instituciones estn organizadas de manera que se consiga
el mximo balance neto de satisfaccin, teniendo en cuent a el conj unt o de
los individuos. El principio de utilidad consiste en elevar al mxi mo' ese I
balance de satisfaccin. El utilitarismo requiere la existencia de una medi da 1
o ndice comn de satisfaccin que haga posible efectuar cl cul os cuant i t a
tivos. En educacin, esta medida comn est constituida casi si empre pr
las puntuaciones obtenidas en tests normalizados. Es el ndice sustituto (o
vicario) de satisfaccin.
La estructura bsica de una teora tica viene dada por l a f orma de
establecer la relacin entre dos conceptos bsicos: el bien y el derecho.
las teoras teleolgcas entre las que figura el utilitarismo el bien se
define de modo independiente y antecedente respecto al derecho. Despus
el derecho se convierte en lo que maximiza el bien (ya sea la s a t i s f a c c i n ,
la excelencia, o cualquier otra cosa). La misma racionalidad si gni f i ca eleva
<>Ediciones Mor ata, 8. L
hien al mximo, un concepto con una gran atraccin intuitiva Se considera
a no procurar el mximo bien es, como mnimo, ineficaz, poco inteligente
qncluso irracional. En la tica utilitarista, es inmoral.
6 ' por ejemplo, en el enfoque del anlisis de sistemas aplicado a la educa-
n, se toman las puntuaciones en los tests como ndice del bien. Aquello
aue las maximiza es, a la vez, lo que se debe y lo que conviene hacer. Los
mejores programas educativos son los que, entre las alternativas disponibles,
consi guen los mayores incrementos en las puntuaciones obtenidas en los
tests. El diseo experimental, la instrumentacin y la estadstica son medios
para determinar eficazmente las mejores alternativas, mediante el esta
blecimiento de la relacin lgica y cuantitativa entre lo ajustado a derecho y
el bien. La conveniencia social se convierte en el tema de maximizar las
puntuaciones obtenidas en los tests. La mayor parte de las discusiones
sobre la evaluacin giran en torno a la eficacia de la misma como medio
para determinar la veracidad y magnitud de ese incremento.
El efecto de una teora de este tipo consiste en la divisin de los juicios
morales en dos clases diferentes. El bien, los juicios de valor", constituyen
una clase independiente de juicios que puede especificarse de antemano
sin referencia a lo correcto. En sentido tradicional, el derecho abarca el
problema de la distribucin de los bienes bsicos. En la economa moderna,
muy dependiente del pensamiento utilitarista, se hace gran hincapi en la
produccin de bienes bsicos, prestndose mucha menos atencin al modo
de ditribucin de esos bienes. La atencin se centra en el incremento de la
produccin total y no en la distribucin de los bienes. En la evaluacin
utilitarista, se resalta el incremento de las puntuaciones de los tests y no la
distribucin d esas puntuaciones.
La justicia utilitarista significa llevar al mximo la satisfaccin total. Cada
uno de los deseos o esperanzas de los individuos ha de equipararse con el
de los otros, con independencia de que uno tenga mayores aspiraciones y
otro menores. En cierto sentido, si alguien tiene mayores aspiraciones, tiene
derecho a ms. Es posible suprimir satisfacciones a quienes tienen me
nos en beneficio de alguien que necesita ms. Este tipo de transaccin
es una de las causas del fracaso de la economa moderna en los pases en
vas de desarrollo. El producto nacional bruto de un pas puede aumentar
sustancialmente por medio de nuevas industrias. Sin embargo, el dinero o
la misma industria se ajusta a menudo para satisfacer las aspiraciones
crecientes de la nueva clase media, mientras las correspondientes a las
clases inferiores siguen como estaban. El incremento total de la riqueza no
supone la mejora de la parte que a cada uno le corresponde. La estabilidad
de las satisfacciones de las clases inferiores en beneficio del aumento de
las deparadas a las superiores es coherente con la justicia utilitarista La
satisfaccin global se maximiza.
Tanto en educacin como en otras reas de tipo social, a menudo las
Pretensionesjlgcesidades, objetivos, etc.) se dan por supuestas. Preparamos
valuaciones de necesidades" para determinar stas lo ms objetiva y
cuantitativamente posible. En nuestra teora de la medida, basada en las
^ ~ ~
Eval uaci n, ti ca y po<jer
diferencias individuales, las necesidades son intrnsecas y permanecen a la
espera de ser medidas, clasificadas por orden de prioridad y equi l i bradas
en relacin con otras necesidades. Si las personas de clase social el evada
albergan muy grandes aspiraciones respecto a sus hijos, todas ellas ent rarn
en el anlisis de necesidades y tendrn que ser satisfechas. Su cumpl i mi ent o
quedar reflejado en la medida comn del rendimiento y en todos los
bienes y valores que en la sociedad dependen de esas puntuaciones. La
distribucin entre las personas no es tan importante como la suma total. El
lema es elevado al mximo en todas partes.
Como slo se tiene en cuenta la puntuacin neta final, la disminucin
correspondiente a una persona se compensa con el incremento de otra.
Los estudiantes de clase social superior tienen que incrementar al mximo
sus puntuaciones de rendimiento y elevar su posicin social, aunque sea a
costa de los alumnos de clase inferior. Todos tienen libertad para aumentar
su propio bien y, como lo justo consiste en elevar al mximo el bien, las
acciones de la clase social superior son al tiempo buenas y justas.
Como todas las aspiraciones se valoran en cuanto a su apariencia
inmediata y las esperanzas y deseos son mucho mayores en las clases
sociales y econmicas superiores, el utilitarismo, en cuanto sistema de
justicia, lleva consigo la tendencia a favor de la clase alta. El deseo de un
Rolls Royce que tenga una persona es tan digno de satisfaccin como el
que otra experimente respecto de un Ford. Las mayores exigencias de los
estudiantes de clase alta o media se satisfacen a costa de las Clases
inferiores.
En el utilitarismo, es esencial que todo se encuadre en un sistema de
aspiraciones, de manera que pueda cumplirse la justicia Todo debe reducirse
a una unidad de medida que haga posibles las comparaciones. El mtodo
bsico de comparacin es el del clsico espectador imparcial utilitario. Al
ser imparcial y simpatizar con todas las partes, el espectador (evaluador de
necesidades) puede organizar todas las aspiraciones (necesidades) en un
sistema coherente de aspiraciones (conjunto de objetivos). Sopesa y equilibra
la intensidad de las aspiraciones y les otorga el peso adecuado en el
conjunto del sistema (evala). Despus, el administrador o legislador (el
omnipresente responsable de las decisiones) ajusta los medios limitados
con el fin de maximizar la satisfaccin de aquellas aspiraciones. El resultado
es una administracin eficaz con la mxima satisfaccin posible.
La semejanza del evaluador utilitarista con el espectador imparcial es
grande, En la economa y en la evaluacin modernas, el espectador imparcial
funda en alto grado su imparcialidad en medidas cuantitativas. Los econ-
metras modernos reclaman datos unvocos para medir la eficacia de los
programas sociales (Rivun, 1971). Estos datos pueden convertirse en el
diseo ms eficaz para la sociedad. El evaluador ideal tambin registra sin
ani mosi dad las aspiraciones mediante las evaluaciones de necesidades y
las definiciones de objetivos. Asigna pesos y mide los resultados de un
modo imparcial.
Mediante tcnicas de investigacin conocidas, el evaluador combina
# fiOtatanct Merata, $. L
js#
s |as necesidades educativas en un sistema. Dice Rawl s: El utilitarismo
torna en serio las diferencias entre las personas, confundiendo ta imper-
n0 adad con la imparcialidad. Pero este reduccionismo es esencial para
je la justicia utilitarista determine lo que se debe y conviene hacer.
^ Como i ndi qu en el Captulo III, los modelos de evaluacin de anlisis
, sstemas, de evaluacin por objetivos, de decisin y el modelo de objetivos
dependi ente parecen fundarse en una concepcin utilitarista de la justicia
Todos ellos tratan de conseguir la mayor utilidad elevando al mximo un
nmero reduci do de variables, un conjunto de objetivos, las preferencias
del responsabl e de las decisiones o sopesando resultados. Procuran llegar
a un j uicio de la utilidad social general que, a su vez, conduce a la mxima
felicidad en la sociedad. Como en la economa, el coste constituye una
consideracin primordial, dado que el dinero gastado podra utilizarse en
otras cosas para Aumentar la felicidad; o sea, podra mejorarse la utilidad.
El utilitarismo asume que la esencia de la conducta racional consiste en
elevar al mximo las satisfacciones o utilidades individuales (Macpher -
son, 1966). L# esencia humana consiste en la accin racional que maximiza
lautilidad. Como las aspiraciones de las personas respecto a toda clase de
satisfacciones son ilimitadas y los medios para realizarlas siempre son
escasos, el problema consiste en descubrir el sistema que pueda emplear
los mediosp&scasos para lograr la mxima satisfaccin. El bien ltimo consiste
en conseguir la mayor utilidad.
El utilitarismo se basa en la idea de que todo el mundo procura conseguir
el mximo posible. La mayor utilidad supone hallar una frmula mediante la
cual las personas consigan satisfacciones con el mnimo esfuerzo. Esto
plantea problemas en relacin a cmo identificar y reunir las satisfacciones
o utilidades que diferentes cosas procuran a las personas, y cmo compa
rarlas mediante una nica escala de medida. Esto es necesario para poder
decir que una determinada ordenacin de utilidades es la mejor, para afirmar
que un conjunto de ellas contribuye a una utilidad total mayor (Macpher -
son, 1 9 6 6 ) .
Entre los Enf oques utilitaristas de la evaluacin, el anlisis de sistemas
trata de identificar un conjunto crtico de variables en cuanto indicadores
sociales; el enfoque por objetivos parte de los objetivos del programa; el de
decisin seala como elementos crticos las decisiones clave de los res
ponsables, y el eval uador que prescinde de los objetivos se centra en los
efectos concretos del programa. Cada modelo adopta un enfoque ligeramente
distinto para lograr la mxi ma utilidad.
El utilitarismo ha constituido una forma brillante y productiva de pensa
miento; pero, como parte de las demandas tal como estn e insiste en una
pedida comn de bienestar, favorece con frecuencia a las clases sociales
levadas en detrimento de las inferiores. Cuando la medida comn se
convierte en i rri gadores como los tests normalizados de aprovechamiento,
* Problema se compl ica, porque esos mismos tests pueden estar sesgados
esde los puntos de vista social y racial; se basan en una teora e las
herencias individuales; desde el punto de vista histrico, se han utilizado
Evaluacin, tica y p0{jer
con el propsito explcito de seleccionar personas, apartndolas de |qs
grupos sociales (Kari er, 1973), y pueden emplearse para justificar las desi
gualdades. La justicia utilitarista no coincide con muchas sensibilidades
morales.
Pluralismo/lntuicionismo
La segunda teora de la justicia es la pluralista/ intuicionista. Esta teora
afirma que existe una familia irreductible de primeros principios que deben
sopesarse entre s buscando el equilibrio ms justo entre ellos (Rawls,
1971). No hay un principio fundamental, como el de la utilidad del utilitarismo,'
que puede servir para determinar los pesos que se asignen a los principios
ltimos. Por tanto, se da una pluralidad de primeros principios por medio de
los cuales se efectan los juicios sobre la justicia y no existe ningn mtodo
o conjunto explcito de reglas de prioridad para sopesar entre s. dichos
principios.
La mayor parte de las ideas de justicia de sentido comn son de este
tipo, como tambin la mayora de las doctrinas filosficas formales. Por
regla general, hay distintos grupos de preceptos especficos que se aplican
a problemas concretos de justicia, como los impuestos o la conducta criminal.
Estos preceptos especficos se aplican de manera ms o menos intuitiva
dentro de reas definidas, equilibrando unos los principios fundamentales
de una manera y otros de otra. Los pesos relativos de los principios espec
ficos pueden llevar a los ms intensos debates (como ocurre con la libertad
de expresin) aunque las personas estn de acuerdo en los principios :
fundamentales. La costumbre y los intereses de las partes implicadas con
ducen a otorgar pesos distintos.
Sin embargo, el equilibrio intuitivo entre los principios no proporciona
medio alguno de juzgar la justicia de las prcticas cotidianas. El intuicionista
espera que las personas se pongan de acuerdo en los principios, una vez
identificados, o que al menos acuerden algn procedimiento que permita
otorgar pesos. Al mismo tiempo, el pluralista/ intuicionista sostiene que no
existe ninguna concepcin tica suprema en la que se funden esospesos.
La complejidad de los hechos morales es demasiado grande para que un
principio de ese estilo d cuenta de ellos.
Para las escuelas de evaluacin que he denominado pluralistas/ in-
tuicionistas, el origen y el contenido de los principios de justicia son distintos.
En el modelo de evaluacin crtico artstico, el crtico educativo aplica prin
cipios a los que ha llegado a travs de su propia experiencia y preparacin
en los programas educativos. Podemos suponer que cada crtico tendr su
propio conjunto de principios que aplicar a una situacin dada de manera
intuitiva. Como el crtico de arte, el educativo llega a un juicio complejo del
programa o normativa.
El modelo profesional utiliza un conjunto de principios a menudo acep
tados de antemano. Por ejemplo, Evaluative Criteria menciona muchos cri-
& ttctorm MoraU, & L
aceptables para j uzgar los programas de ingls, otro conjunto para
^rtar los de matemticas, etc. Los expertos en ingls o en matemticas
rcan estos criterios establecidos -y quiz otros- de forma intuitiva. Cada
aP'rto equi l i bra los principios de acuerdo con sus propias disposiciones.
0* De un modo similar, el Council on Program Evaluation (COPE) presenta
na lar9a c.r^eros clue emPlea Para juzgar los departamentos uni-
Prsitarios. realidad, estos criterios pueden resumirse en unos pocos
Hncipios, eomo la calidad de Investigacin y de enseanza. A partir de ah,
I Council establece un conjunto de juicios mediante el equilibrio intuitivo
!ntre esos principios. Por regla general, estos juicios otorgan gran peso a la
i n v e s t i g a c i n . Tanto en el modelo de tipo crtico artstico como en el profe
sional, los criterios, los principios orientadores ltimos y los pesos proceden
de los profesionales de la educacin.
En cambio, los modelos de evaluacin cuasijurldico y de estudio de
casos suelen derivar sus principios y valores de la participacin de las
personas implicadas en el programa o en las decisiones sobre el mismo.
En el modelo cuasijurdico que emplea un procedimiento parajudicial, el
jurado y el juez determinan los criterios y principios que se utilicenpara
llegar a una decisin. Los principios concretos que se empleen dependen
de la forma de seleccionar el jurado, el juez o el tribunal de audiencia.
Puede tratarse de miembros del pblico en general, como en un jura
do autntico,, o fresponsables de decisiones encargados del programa en
cuestin.
En muchos pasos, como en un tribunal de audiencia "blue-ribbon" (tribu
nal de expertos) ste puede estar compuesto por miembros prestigiosos
del pblico o de un subgrupo profesional, a quienes se considere en general
con autoridad en la cuestin de que se trate, como un grupo de expertos en
temas fiscales, evaluadores o responsables de decisiones. Por ejemplo, el
Dissemination fteview Panel, en las evaluaciones de revisiones de programas
federales del departamento de Salud, Educacin y Bienestar, para determinar
si estos programas deben ser validados" para su divulgacin por el resto
del pas.
Por ltimo, Santre los pluralistas/ intuicionistas hay quienes valoran la
participacin de las personas implicadas en el programa. En general, sta
consiste en I# recogida de puntos de vista y opiniones de diversas personas
respecto al programa o normativa en cuestin. El evaluador registra y refleja
fielmente sus puntos de vista. De este modo, los principios, criterios y
valoraciones de la| personas participantes se utilizan para juzgar el programa.
Por supuesto, al seleccionar y resaltar algunos aspectos y puntos de vista
en detrimento de otros algo inevitable, entran en juego algunos principios
del propio evaluador.
Se trata de up j urado f ormado por expertos para juzgar asuntos muy especializados. Es
recuenta (por Ejemplo, en Estados Unidos) en la resolucin de conflictos en ios mbitos
ernPresarial mdi co. ( N . d e l R . )
4 os fuoos de cfesfemos grupos relacionados con el program
es** -juno entogue no slo es piurafesia en el sendo flosco de juza^
sobre la base de pmopos dwersos, smo tambin en el sentido potifco
'apresemar intereses poflftcos drenles Es obvio Que ios juicios de
par&cipanies y det evaluador se equibran casi siempre de manera KSva
La leona pnuraisia mfc*aonista de la justicia es la que ms se acerca
senteio comn. pero deja sometida la evaluacin a cualesquiera principios
f que se les ocurra uttzar a los jueces, con independencia
oe qui nes se trate En un extremo, existe epeligro de que el proceso o
juoo se rija por principios profesionales y. en el otro, de <xt completo
'etarasmo en e* que se considere tan buena la opinin de uno como la de
cualquier ofro Ninguno de los dos extremos coincide con la idea de justicia
de la mayora.
J usticia como equidad
La ms recente de las teoras modernas sobre la justicia es la de
Rmts {1971 Este autor menoona dos principios de justicia medante los
cuales pueden ser juzgadas las instituciones y convenios sociales. Raw l s
denomina su concepcin "justicia como equidad A diferencia del utilitarismo,
justicia como equidad** asume que siempre existe una pluralidad de
f^es y una detincin de personas que impiden combinar todas las aspira-
oonez en un sistema En primer lugar, hay que llegar a un acuerdo que
penrtfa repartir ei bien y saldar tas disputas que surjan. Ms tarde, ^acordados
los principios de reparto, los individuos tienen libertad para determinar su
propio bien y tratar de conseguirlo, pero siempre de acuerdo con los principios
aceptados que determinan lo que se ajusta a derecho.
Ai definir cmo se llega a estos principios, Ra w l s utiza el const ruct o
hipottico de l a posicin original . Suponiendo que todas las personas
sean iguales, desde e) punto de vsta moral, y se les conceda un tratami ento
justo (y desconozcan qu ventajas y desventajas tendrn en la soci edad
concreta), qu principios estarn dispuestas a aceptar para definir la j us
ticia?
La concepcin general de justicia de Rawls es la siguiente: 'Todos los
valores sociales libertad y oportunidad, ingresos y salud y tas bases del
respeto a s mismo se reparten por igual, salvo que la distribucin desi gual
de alguno, o de todos estos valores beneficie a alguien (Rawls, 1971, p
gina 62).
Los principios especficos de justicia para las instituciones son:
Primer principio:
Toda persona ha de tener igual derecho a los ms amplios si st emas
de libertades bsicas iguales, compatible con un sistema semej ant e de
libertad para todos,
Segunda prnctpio:
Las desguiairtades y
^ i e r a que:
;^ # Bnec*en a los meros
^ afgana*
ruarse oe
Sa^aoe
' ^ o t ej uf ca
empleos
deopoit
a iodos en
**Gaes Pags. 302-
3 obvio
pue fe jsica son
3 0 3 ).
Teniendo en cuenta estas premisas r&
^qudafestrmge otros fines. Pone frutes 1
hacer* En esa perspectiva, no podemos tom 00010 *** *3aSa'Ts
, aspiraciones, pues quedan sometidos a ios 058805
U^ppfcia como equidad excluye especfca**?3aacoa
zocr,ententes a unos pocos en beneltodeniS!icsn^ <npoaar gefV
de os dos principios de la justicia especifica are
antecede ai segundo. Se impulsan a) mxro 9e^3re
'cependencia de ios beneficios econnvcos v soca*^ -
pueden abordarse las desigualdades sociales y economcas. OeMsnn
con .i a segunda premisa, slo pueden pentrse esas 3
zeoeftdan a los menos favorecidos de la sociedad Noneteia^se
as desigualdades si no se benefician de ellas los peor &rooco
: ^eden aceptarse transacciones que afecten a las ftertaoes =
cambio de beneficios sociales y econmicos.
La segunda premisa, el principio de diferencia', singriaiza a posoor
de los menos favorecidos de l a sociedad para juzgar si pueden permrse las
desigualdades. Por ej empl o, si son necesarios salarios elevados para aiaer
a personas a ocupaciones que beneficien a los menos favorecidos, pueoe
aceptarse ta desigualdad.(Este juicio se opone a) principio de eicaca tiei
jtiitarismo. El principio de eficacia slo permite la redistrbucin de enes
pnmariosen 10 medida en que el beneficio de un grupo social no se pro&zca
endetrimento de otro grupo. Esto refuerza de forma considerable el orden
establecido. Una est ruct ura ser eficiente' al mxima o en grado oowro-
cuando sea imposible mejorar algo sin pejudicar a oros. En ei e ^ r
Rawls, la premisa de la justicia como equidad precede al pnndpio de escaaa
Se impulsan al mximo las aspiraciones a largo plazo de la poswon
favorecida, con las restricciones impuestas por la primera prems<L
Suponiendo por ahora que aceptamos la teorade la
Qu importancia tiene evaluar (si acaso tiene alguna! $
ambas premisas son lo bastante abstractas como
valuacin. Por otra parte, en cuanto mecanismorestnDJ f^_ a avric
Parece razonable que la evaluacin preste atencin a ^
cHdad. Las Ifeertades bsicas que protege^ , Je canaeroa y to
libertades polticas, la de expresin y reuni^
gpensamiento, libertad de personas y propiedades.
Evaluaoln, tica y pQcle||
Al reflejar los juicios de distintos grupos relacionados con el programa
este Ultimo enfoque no slo es pluralista en el sentido filosfico de j uzgar
sobre la base de principios diversos, sino tambin en el sentido poltico de
representar intereses polticos diferentes. Es obvio que los juicios de los
participantes y del evaluador se equilibran casi siempre de manera intuitiva.
La teora pluralista/ intuicionista de la justicia es la que ms se acerca ai
sentido comn, pero deja sometida la evaluacin a cualesquiera principios
y valoraciones que se les ocurra utilizar a los jueces, con independencia
de quienes se trate. En un extremo, existe el peligro de que el proceso de i
juicio se rija por principios profesionales y, en el otro, de un completo
relativismo en el que se considere tan buena la opinin de uno como la de
cualquier otro. Ninguno de los dos extremos coincide con la idea de justicia I
de la mayora.
J usticia como equidad
La ms reciente de las teoras modernas sobre la j ust i ci a es la de
Rawls (1971). Este autor menciona dos principios de justicia medi ant e los
cuales pueden ser juzgadas las instituciones y convenios soci al es. Ra w l s
denomina su concepcin justicia como equidad. A diferencia del utilitarismo,
la "justicia como equidad" asume que si empre existe una pl ural i dad de
fines y una distincin de personas que impiden combinar t odas l as aspi ra
ciones en un sistema. En primer lugar, hay que llegar a un acuerdo que
permita repartir el bien y saldar las disputas que surjan. Ms tarde, acordados
los principios de reparto, los individuos tienen libertad para det ermi nar su
propio bien y tratar de conseguirlo, pero siempre de acuerdo con los pri ncipi os
aceptados que determinan lo que se ajusta a derecho.
Al definir cmo se llega a estos principios, Raw l s utiiza el const ruct o
hipottico de la posicin original. Suponiendo que todas l as personas
sean iguales, desde el punto de vista moral, y se les conceda un t ratami ento
justo (y desconozcan qu ventajas y desventajas tendrn en la soci edad
concreta), qu principios estarn dispuestas a aceptar para def ini r la j us
ticia?
La concepcin general de justicia de Raw l s es la siguiente: Todos los
valores sociales libertad y oportunidad, ingresos y salud y las bases del
respeto a s mismo se reparten por igual, salvo que la distribucin desi gual
de alguno, o de todos estos valores beneficie a alguien" (Raw l s , 1971, p
gina 62).
Los pnncipios especficos de justicia para las instituciones son:
Primer principio:
Toda persona ha de tener igual derecho a los ms ampl i os si stemas
de libertades bsicas iguales, compatible con un sistema semej ant e de
libertad para todos.
# MwuawMwifr & i.
segundo principio:
Las desigualdades sociales y econmicas han de organizarse de
manera que:
a) benef i ci en a los menos agraciados, salvado el principio de justicia,
y
est n subordinadas a servicios y empleos abiertos a todos en
condiciones de equitativa igualdad de oportunidades (pgs. 302-
303).
Teniendo en cu enta estas premisas, resulta obvio que la justicia como
auidad restringe otros fines. Pone lmites en relacin con lo que podamos
hacer. En esa perspectiva, no podemos tomar como indiscutibles los deseos
v aspiraciones, pues quedan sometidos a los principios bsicos.
La justicia como equidad excluye especficamente la imposicin de in
convenientes a unos pocos en beneficio de muchos. Las reglas de prioridad
de los dos principios de la justicia especifican que el primero siempre
antecede al segundo. Se impulsan al mximo las libertades bsicas con
independencia de los beneficios econmicos y sociales. Slo entonces
pueden abordarse las desigualdades sociales y econmicas. De acuerdo
con la segunda premisa, slo pueden permitirse esas desigualdades si
benefician a los menos f avorecidos de la sociedad. No pueden aceptarse
las desigualdades si no se benefician de ellas los peor situados, ni tampoco
pueden aceptarse transacciones que afecten a las libertades bsicas a
cambio de beneficios sociales y econmicos.
La segunda premisa, el principio de diferencia, singulariza la posicin
de los menos f avorecidos de la sociedad para juzgar si pueden permitirse las
desigualdades. Por ejemplo, si son necesarios salarios elevados para atraer
apersonas a ocupaciones que beneficien a los menos favorecidos, puede
aceptarse la desigualdad. (Este juicio se opone al principio de eficacia del
utilitarismo. El principio de eficacia slo permite la redistribucin de bienes
primarios en la medida en que el beneficio de un grupo social no se produzca
endetrimento de otro grupo. Esto refuerza de forma considerable el orden
establecido. Una estructura ser eficiente al mximo, o en grado ptimo,
cuando sea imposible mejorar algo sin pejudicar a otros. En el esquema de
Jwls, la premisa de la justicia como equidad precede al principio de eficacia
6 mpulsan al mximo las aspiraciones a largo plazo de la posicin menos
V(?ecida, con las restricciones impuestas por la primera premisa.)
Suponiendo por ahora que aceptamos la teora de la justicia de Rawl s,
arnh 'mPrtanc'a tiene eval uar (si acaso tiene alguna)? Es evidente que
ev ias premisas son lo bastante abstractas como para no determinar la
par Uac*n. Por otra parte, en cuanto mecanismo redistributivo importante,
equidCV a20nab'e ciue *a evaluacin preste atencin a la justicia como
^ertari ^aspbertades bsicas que protege el primer principio son las
de nei?es RWcas, la de expresin y reunin, la libertad de conciencia y la
Sarniento, libertad de personas y propiedades, etctera
Eval uaci n, tica y Poria
Al reflejar los juicios de distintos grupos relacionados con el programa
este ltimo enfoque no slo es pluralista en el sentido filosfico de juzgar
sobre la base de principios diversos, sino tambin en el sentido poltico de
representar intereses polticos diferentes. Es obvio que los juicios de los
participantes y del evaluador se equilibran casi siempre de manera intuitiva.
La teora pluralista/ intuicionista de la justicia es la que ms se acerca al
sentido comn, pero deja sometida la evaluacin a cualesquiera principios
y valoraciones que se les ocurra utilizar a los jueces, con independencia
de quienes se trate. En un extremo, existe el peligro de que el proceso de
juicio se rija por principios profesionales y, en el otro, de un completo
relativismo en el que se considere tan buena la opinin de uno como la de
cualquier otro. Ninguno de los dos extremos coincide con la idea de justicia
de la mayora.
J usticia como equidad
La ms reciente de las teoras modernas sobre la justicia es la de
Rawls (1971). Este autor menciona dos principios de justicia mediante los j
cuales pueden ser juzgadas las instituciones y convenios sociales. Ra w l s j
denomina su concepcin justicia como equidad. A diferencia del utilitarismo,
la "justicia como equidad asume que siempre existe una pluralidad de
fines y una distincin de personas que impiden combinar todas las aspira-
clones en un sistema. En primer lugar, hay que llegar a un acuerdo que
permita repartir el bien y saldar las disputas que surjan. Ms tarde, acordados
los principios de reparto, los individuos tienen libertad para determinar su j
propio bien y tratar de conseguirlo, pero siempre de acuerdo con los principios
aceptados que determinan lo que se ajusta a derecho.
Al definir cmo se llega a estos principios, Rawl s utiiza el const ruct o
hipottico de "la posicin original. Suponiendo que todas l as personas
sean iguales, desde el punto de vista moral, y se les conceda un trat ami ent o
justo (y desconozcan qu ventajas y desventajas tendrn en la soci edad
concreta), qu principios estarn dispuestas a aceptar para def i ni r l a j us
ticia?,
La concepcin general de justicia de Raw l s es la siguiente: Todos los
valores sociales libertad y oportunidad, ingresos y salud y las bases del
respeto a si mismo se reparten por igual, salvo que la distribucin desigual
de alguno, o de todos estos valores beneficie a alguien (Raw l s , 1971, p
gina 62).
Los principios especficos de justicia para las instituciones son:
Primer principio:
Toda persona ha de tener igual derecho a los ms amplios si st emas
de libertades bsicas iguales, compatible con un sistema semej ant e de
ttberfad para todos.
121
sociales y econmicas han de organizarse de
maera que:
aj benef ici en a los menos agraciados, salvado el principio de justicia,
y
ya est n subordinadas a servicios y empleos abiertos a todos en
condi ci ones de equitativa igualdad de oportunidades (pgs. 302-
303).
Teniendo enicuenta estas premisas, resulta obvio que la justicia como
iidad restringe otros fines. Pone lmites en relacin con lo que podamos
hcer En esa perspectiva, no podemos tomar como indiscutibles los deseos
aspiraciones, pues quedan sometidos a los principios bsicos,
y La justicia como equidad excluye especficamente la imposicin de in
convenientes a unos pocos en beneficio de muchos. Las reglas de prioridad
delos dos principios de la justicia especifican que el primero siempre
antecede al segundo. Se impulsan al mximo las libertades bsicas con
independencia de los beneficios econmicos y sociales. Slo entonces
pueden abordarse las desigualdades sociales y econmicas. De acuerdo
con la segunda premisa, slo pueden permitirse esas desigualdades si
benefician a los menos f avorecidos de la sociedad. No pueden aceptarse
lasdesigualdades si no se benefician de ellas los peor situados, ni tampoco
pueden aceptarse transacciones que afecten a las libertades bsicas a
cambio de beneficios sociales y econmicos.
La segunda premisa, el principio de diferencia, singulariza la posicin
dlos menos favorecidos de la sociedad para juzgar si pueden permitirse las
desigualdades. Por ejemplo, si son necesarios salarios elevados para atraer
apersonas a ocupaciones que beneficien a los menos favorecidos, puede
aceptarse la desigualdad. (Este juicio se opone al principio de eficacia del
utilitarismo. El principio de eficacia slo permite la redistribucin de bienes
primarios en la medida en que el beneficio de un grupo social no se produzca
endetrimento de otro grupo. Esto refuerza de forma considerable el orden
establecido. Una estructura ser "eficiente al mximo, o en grado ptimo,
cuando sea imposible mejorar algo sin pejudicar a otros. En el esquema de
gWLS- Ia premisa de la justicia como equidad precede al principio de eficacia,
eimpulsan al mximo las aspiraciones a largo plazo de la posicin menos
orecida, con las restricciones impuestas por la primera premisa.)
qu ^0n'enc*0 ^or a^ora clue aceptamos la teora de la justicia de Rawl s,
arnh lm^or*anca tiene evaluar (si acaso tiene alguna)? Es evidente que
evalua y.rem'sas son l bastante abstractas como para no determinar la
Paree11 ^ r *ra Parte> en cuanto mecanismo redistributivo importante,
equ^ .razorable que la evaluacin preste atencin a la justicia como
libertad ,!'bertactes bsicas que protege el primer principio son las
depe Polticas, la de expresin y reunin, la libertad de conciencia y la
amiento, libertad de personas y propiedades, etctera.
Segundo principio:
I B desigualdades
Adems, segn Rawl s (pg. 440), el bien primario ms importante es e|
respeto a s mismo. Sin l, ia persona no podr creer que merezca la pena
tratar de dar cumplimiento a su propio plan de vida (cualquiera sea ste).
En tai caso, su vida carecer de sentido. Un argumento fundamental contra
el utilitarismo consiste en que algunos pueden verse obligados a abandonar
sus aspiraciones en beneficio de la utilidad general. La rebaja involuntaria
de stas en provecho de otros reduce el fundamento de su propio respeto a
s mismo. La justicia como equidad no admite esta situacin.
El primer principio puede aplicarse a la evaluacin de dos maneras;
segn si tiene en cuenta lo que busque el evaluador o la forma de llevar a
cabo la evaluacin, El primer principio garantiza las libertades bsicas, j
incluido el derecho a la autoestima. Por ejemplo, una queja fundamental de
quienes se oponen a los tests, en concreto, consiste en que las puntuaciones 1
obtenidas en los mismos reducen la autoestima de muchos nios en la ]
escuela. No slo los crticos dicen que los tests estn sesgados en los!
planos racial y de clase social; los economistas radicales (Bo w l es y Gi nt i sJ
1972-1973) sostienen que los tests se utilizan precisamente con el fin de I
justificar la estructura jerrquica del sistema de clases sociales, de manera i
que los miembros inferiores de la sociedad crean que merecen lo que son.
Uevan consigo la reduccin de las aspiraciones.
Con independencia de la veracidad de estos cargos, en la justicia como j
equidad estas cuestiones son motivo de grave preocupacin y para el
evaluador constituyen el problema principal. Con frecuencia, es ms fcil 1
determinar la conveniencia de una prctica concreta y ms cercana al co- |
metido real del evaluador. Por ejemplo, mandar a su casa a un nio con j
su puntuacin de Cl plantada encima (prctica corriente en algunas grandes
ciudades) puede resultar repulsiva incluso a los evaluadores ms fervientes j
partidarios de los tests. Otras prcticas, como la de pegar a los nios para
que suban sus puntuaciones en los tests suelen descartarse de antemano j
(incluso aunque provoquen un ascenso espectacular de tales puntuaciones).
Hay cosas que no pueden hacerse en nombre del bien comn.
Es posible que la aplicacin de ambas premisas reduzca, aunque de
ninguna manera elimine, los juicios intuitivos. Tras decidir que el respeto a
uno mismo es un derecho que precede a cualquier otra consideracin, con j
independencia de las pretensiones del programa o de sus patrocinadores,
todava tenemos que aplicar el principio. Esto lleva consigo una serie de
juicios intuitivos y el cometido del evaluador de aplicar los criterios a cir
cunstancias especficas sigue siendo difcil.
No obstante, la seleccin de criterios primarios para aplicarlos a la
mayor parte del resto de los criterios (por artificial que pueda parecemos a
quienes nos hemos formado en una tradicin emprica) proporciona un
fundamento moral ms til de lo que a primera vista pudiera parecer. A
veces, la visin resultante es informativa. Por ejemplo, si todo el mundo
tiene derecho a la autoestima, de ello tambin se desprende que, en una
sociedad justa, los menos favorecidos no pueden violar la autoestima de
quienes estn en mejor posicin. No se permiten las actividades denigrantes
" ^ ... ....... v:.:. ________ ! ..................... ^ Evaluacin, tica y pp^a.
faJ toWMW Mor ata & i
I ndj vi duo. Es obvio que ello presupone que la autoestima de los ms
| p3^ cjdos no se basa en la disminucin de la estima de los peor situados,
faVqi la i nf ormaci n lesiona el respeto a s mismo de la persona implicada,
Hebe incluirse en el informe de evaluacin, con independencia de su
[ , ncia en l a calidad del proyecto. Han de protegerse los derechos de los
| int'rdu0s ant es que el beneficio del proyecto. Slo podra violarse este
in ricipo en el caso de una transaccin entre este derecho y otro de igual
[ Pnortancia. Por supuesto, el problema bsico de un proyecto est constitu
an oor el sistema total de derechos iguales de todos los implicados. No
habra que t rat ar con tanto miramiento a un director desptico que lesione
la aut oest i ma de otros. Se permiten las transacciones entre derechos b-
I SlCAplicado por completo el primer principio, hemos de prestar atencin al
I segundo. La esencia de la segunda premisa consiste en que las desigual
dades sociales y econmicas slo son justas cuando benefician a los menos
| favorecidos de la sociedad. Un personaje representativo" del sector menos
I afortunado debe preferir las perspectivas que se le ofrecen con las desi-
; gualdades ms que sin ellas. Se juzga la estructura social desde una
posicin social determinada: la de los menos favorecidos. Las desventajas
de quienes estn situados en el escaln inferior de la estructura social no
pueden justificarse por las ventajas que de ello se deriven para los dems,
como acepta el utilitarismo. Por supuesto, este juicio ha de ser coherente
[ con el primer principio. No pueden sacrificarse las libertades bsicas a los
i beneficios sociales y econmicos.
Como en el caso del primer principio, el segundo puede aplicarse de
| dos maneras: como criterio del programa o como criterio de la misma
evaluacin. En la Illinois Gifted Evaluation, nos mantuvimos en contacto
directo con el personal que trabajaba en el programa, que fue muy equitativo
| en relacin con el primer principio. Visto en retrospectiva, el principal dficit
j consisti en que no se investigaron posibles efectos secundarios de la
agrupacin uniforme de los nios bien dotados. Analizamos los efectos que
se produjeron en estos mismos nios, pero no lo hicimos con los que no
I pertenecan a ese grupo ni consideramos el impacto social sobre el sistema
de clases. Hemos de admitir que estos problemas no son fciles de resolver,
en parte porque a menudo no se plantean lo suficiente. Sin embargo, deberan
haberse tratado con mayor profundidad.
En la justicia como equidad, no se considera que las desigualdades en
,os talentos naturales tengan que dar derecho a mayores aspiraciones
materiales en la sociedad, salvo que se empleen en beneficio de los menos
dotados. Por ejemplo, se podran conceder mayores recompensas a los
I Jodieos por la preparacin a la que han de someterse y esperando que el
f faraer ? ^ medicina a individuos mejor dotados beneficie a los menos
esrecic,0S asi como a cualesquiera otros. Pero el hecho de que alguien
I a<! * c,otacl0 con mayores talentos naturales no le da derecho a mayores
1 co?raCOnes- Cierto sentido, el contrato que surge de la "posicin originar
[ siste en- un acuerdo para compartir la suerte y la desgracia, como en
i CM>*
La objetividad, equidad y justicia
de la poltica federal de evaluacin
| La poltica federal de evaluacin
En 1965, el senador Robert Kennedy hizo hincapi en que se aadiese al
I TtuloI (educacin compensatoria) de la Elementary and Secondary Education
Act una clusula adicional relativa a la evaluacin. Pensaba que las escue-
I laseran, en parte, culpables del bajo nivel de rendimiento de los alumnos, y
i que la nueva financiacin federal no se utilizaba con provecho. El propsi-
I toque persegua la obligacin de elaborar informes era dar noticia a los pa-
I dres, sobre todo a los padres pobres, de cmo trabajaban sus escuelas. Los
educadores seran responsables ante sus usuarios. Ms adelante, la evalua-
I cinobligatoria se extendi a casi todos los programas sociales federales,
i En el mismo ao, el presidente Johnson introdujo en el gobierno federal
el Planning, Programming and Budgeting System(PPBS), ya entonces utili-
I zado de forma generalizada en el Pentgono. El secretario del departamen-
I tode Salud, Educacin y Bienestar, John Gardner, cre un nuevo organis-
I modenominado Assistant Secretary for Program Evaluation (ASPE). Al frente
i dedicho organismo puso a William Gorham, que contaba con gran expe-
| riencia en el departamento de Defensa. Sus subsecretarios eran Robert
f Grosse y Alice Rivlin. El objetivo consista en elaborar programas que
I Puedan enunciarse, medirse y evaluarse en trminos de coste/beneficio.
I U excelente historia de la evaluacin del Ttulo I de McLaughun (1975)
| cnsigna estos hechos.
I J TA AUTOR: Este captulo fue publicado como: The Objectivity, Fairness, and
I * ^ eral Evaluation Policy as Reflected in the Follow Through Evaluation, E d u c a t i o n a l
I c m U a ^ 0 f l a n d P o l i c y A n a l y s i s , vol. 1, n., 1979, pgs. 28-42. Copyright 1979: A m e r i c a n E d k h
Elisahf ^ e s e a r c h A s s o c i a t i o n , Washington, D.C. Reimpreso con autorizacin. Gene Cuss,
traba ^ UTCH,NS I Rochelle Mayer me hicieron valiosos comentarios al respecto, Este
| aJo fue pat roci nado por la F o r d F o u n d a t i o n .
<) Ediciones MorM, S. L
La objetividad, equidad y justicia
de la poltica federal de evaluacin
La poltica federal de evaluacin
En 1965, el senador Robert Kennedy hizo hincapi en que se aadiese al
Ttulo I (educacin compensatoria) de la Elementary and Secondary Education
Act una clusula adicional relativa a la evaluacin. Pensaba que las escue
las eran, en parte, culpables del bajo nivel de rendimiento de los alumnos, y
que la nueva financiacin federal no se utilizaba con provecho. El propsi
to que persegua la obligacin de elaborar informes era dar noticia a los pa
dres, sobre todo a los padres pobres, de cmo trabajaban sus escuelas. Los
educadores seran responsables ante sus usuarios. Ms adelante, la evalua
cin obligatoria se extendi a casi todos los programas sociales federales.
En el mismo ao, el presidente Johnson introdujo en el gobierno federal
el Planning, Programming and Budgeting System(PPBS), ya entonces utili
zado de forma generalizada en el Pentgono. El secretario del departamen
to de Salud, Educacin y Bienestar, John Gardner, cre un nuevo organis
mo denominado Assistant Secretary for Program Evaluation (ASPE). Al frente
ejedicho organismo puso a William Gorham, que contaba con gran expe
riencia en el departamento de Defensa. Sus subsecretarios eran Robert
Grosse y Alice Rivlin El objetivo consista en elaborar programas que
Puedan enunciarse, medirse y evaluarse en trminos de coste/beneficio '.
La excelente historia de la evaluacin del Ttulo I de McLaughun (1975)
consigna estos hechos.
NOTA DEL AUTOR- Est e captulo fue publicado como: The Objectivity, Faimess. and
Jstice of Federal Evaluat ion Pol icy as Reflected in the Follow Through Evaluation, Ejcstonal
^aluation and Policy Analysis, vol. 1, n, 1979, pgs. 28-42. Copyright 1979: Amanean Ecbh
National Research Association, Washington, D.C. Reimpreso con autorizacin. Gene Ciass,
E|isabeth Hu t c h in s y Rochell e Ma y e r me hicieron valiosos comentarios al respecto. Este
trabajo fue patrocinado por la Ford Foundation.
_________________________________
Mientras K e n n e d y e s t a b a preocup| do ^ M a res^nsiyidad de ,a
c u e l a s h a c i a l o s p o b r e s , e l g r u p o ASPE pretenda descubro los enS >
ms eficientes p a r a e d u c a r a l o s n i o s menos f avoreci dos. Operando >
l a p e r s p e c t i v a d e l "anlisis de sistemas el ASPE tratarte de dent i f ef "
r r . __w manara me a asinnanin Ha r o n ,____ ____ ,uori
[programas m s e f i c a c e s d e m a n e r a q u e la asignacin de recursos res.,*''*
m s e f i c i e n t e . E l e n f o q u e d e l A S P E supona que poda definirse una %Sjf
d e p r o d u c c i n d e l a e d u c a c i n , o sea, definir^de manera preci sa cmo
conjunto de entradas, como dinero o determinados programas, estara
donado con un conjunto de resultados, como las puntuaciones de ti
Definida la funcin, podra decidirse que slo se utilizaran los enfoa
educativos ms eficientes.
Los primeros aos de la evaluacin segn el Ttulo I no satisficieron
ASPE. Las evaluaciones se llevaron a cabo a nivel local y los resultad91
fueron positivos casi de un modo uniforme. Es ms, a falta de una medv8
comn de resultados para todos los programas, era imposible efectuar
anlisis coste/beneficio para determinar qu programas eran ms eficient
En parte con este fin y en parte para contrarrestar los efectos negativos di
informe Coleman, R i v u n y Whol ey, del ASPE, prepararon el estudio TEMPn
llevado a cabo por una divisin de General Electric. El objetivo era aver
guar la cantidad de recursos que producan un determinado incremento d
las puntuaciones en un test concreto. Los resultados fueron desalentado
res. El estudio no pudo descubrir incremento alguno en las puntuaciones
An peor, Moynihan, a la sazn en el gabinete de Nixon, utiliz los resulta
dos del estudio para oponerse a mayores incrementos en la ayuda a las
escuelas. j{ , 1B H M H f l
Dnde estaba el error? El personal del ASPE sostena que su enfoque
era absolutamente correcto, pero los datos facilitados por los distritos esco
lares no eran fiables. Optaron por centralizar el control de las actividades
de evaluacin. As recogeran sus propios datos para asegurar la fiabilidad.
A consecuencia de ello, se iniciaron las encuestas nacionales con arreglo
al Ttulo I. Adems, decidieron transformar el programa Follow Through que,
en principio, era de servicios y continuaba la educacin de los nios acogidos
al programa Head Start, convirtindolo en un experimento con variaciones
planificadas.
Las encuestas nacionales se llevaron a cabo en 1968 y 1969. Los re
sultados de la correspondiente a 1968 fueron tan decepcionantes como el
estudio TEMPO: no se observaron incrementos en las puntuaciones de los
tests. Los resultados de la encuesta de 1969 no llegaron a publicarse. Todo
ello le llev a decir al secretario Finch, del departamento de Salud, Educacin
y Bienestar, que los educadores no saban cmo educar. El presidente
Nixon utiliz los resultados como pretexto para impedir el incremento de la
financiacin correspondiente al Ttulo I. . . *3 'wjk t , 1
El grupo del ASPE estaba decepcionado, pero no dispuesto a abandonar-
Alice Rivun sostena que el problema consista en que los servicios socisi
no estaban organizados de forma adecuada para responder a las cuestioi
planteadas por el ASPE relativas a ia eficacia y la eficiencia. Los R9ra
Ediciones Mor ata, S. L
M
ns sociales deban organizarse de manera que pueran responder
$0^cl gtiones del evaluador. La solucin de Rivun con&sta en gue $
\g>c c0ntrolara ms las variables de iniciales del programa y su iHofio
%ern ia evaluacin. Los programas sociales tenan que plantearse como
tc tos con variaciones planificadas.
0xperirrl rama Follow Through se organiz de manera que pudiese re*
0 p las cuestiones del ASPE, a modo de experimento masivo. Las
ponderde( Follow Through tenan grupos de control con los que se compa-
claf eSge introdujo la idea de las variaciones planificadas. Si tos dtsfcnos
jaran- ^ podan disear programas lo bastante innovadores como {ara
loa e puntuaciones ms elevadas en los tests, se utilizaran programas
dales para introducir las variaciones planificadas en la educacin. No
Consi deraba que los cambios naturales fuesen lo bastante adecuados.
f el programa Follow Through se acudi a colaboradores con mooeios
oeciales de prctica claramente distintos de los de las escuelas pblicas
mpiementar nuevos programas. Las variaciones naturales fueron sus-
Lidas por las planificadas.
Aunque, segn Rivlin, a los efectos del ASPE, el programa FoHow
Through no era perfecto, s era el nico que se acercaba a los requisitos
propuestos por el ASPE. A pesar de sus defectos de diseo experimental,
el Follow Through es significativo como la primera tentativa importante del
gobierno federal para ensayar distintos enfoques educativos de manera
razonablemente sistemtica (Rivlin, 1971).
La poltica federal de evaluaci n, tal como aparece en Systemafc Tfmking
for Social Action, de Ri vl i n, adopt la siguiente forma: en los servicios
sociales, las decisiones cl ave deben tomarse en los niveles superiores de
gobierno federal. Los servi ci os sociales no estaban organizados de modo
eficiente y no se conoca bi en lo que producan dichos servicios. B nico
conocimiento autntico que pueda tenerse de ellos es una funcin de pro
duccin que especifique las relaciones estables entre las variables iniciates
y los resultados, y el nico medi o para adquirir ese conocimiento consiste
en los mtodos experi ment al es y las tcnicas estadsticas. 'Es imposfcie
obtener de otro modo la i nf ormacin necesaria para mejorar la eficacia de
los servicios sociales (Ri vl i n, 1971, pg. 108). Utilizando esas tcnicas, es
posible ponerse de acuerdo sobre los objetivos y sobre algunas medidas
de resultados, como las puntuaciones de los tests. El fin de la evakjaesor
consiste en la ef i ci enci a de la produccin de servicios sociales.
Segn la filosofa de Rivl in, existe un paralelismo entre la produccin de
servicios sociales y la de productos manufacturados. Se aplican tcneas
semejantes de anlisis y los programas sociales deben organizarse para
Proporcionar datos para ese anlisis. Los analistas federales descubrirn
era l ms correcto. No era necesario tener experiencia en tos programas
contacto con los mismos para poder evaluarlos. Es ms, ponern marcha
de|8 oclue de eval uaci n era cuestin de direccin estrela y de dominio
tare^roceso- Slo un gobi erno muy centralizado podra N H | cabo esta
ui dad y j ust i ci a de la poltica federal de evaluacin 10
Evaluacin, f ca ^ o *
Esta filosofade la evaluacin predomin en el gobierno federal de |0* '
Estados Unidos durante la pasada dcada. Para descubrir cmo oper en
laprctica, podemos examinar la evaluacin Follow Through.
Los comienzos de Follow Through
FollowThroughcomenz como un programa para proporcionar servicios
educativos a los alumnos menos favorecidos en los primeros aos de ^
escolarizacin. En 1967, a causa de dificultades financieras, el programa
slorecibi quince millones de dlares, en vez de los ciento cincuenta
millones previstos. En el departamento de Salud, Educacin y Bienestar, el I
grupodel ASPEvio ah la oportunidad para convertir el Follow Throughen
unexperimento de variaciones planificadas para descubrir qu funcionaba
mejor". Haney (1977) y Elmore (1976) han documentado estos hechos.
En 1967, WilliamGorham, a la sazn subsecretario de Planificacin y
Evaluacin (ASPE) del Departamento de Salud, Educacin y Bienestar,
organiz la White House Task Forc on Child Development (Grupo de
trabajosobre desarrollo infantil de la Casa Blanca). El grupo de trabajo
estabaconstituido por miembros del grupo de Gorham, del que formaba
parteAlice Rivun (El mor e, 1976, pg. 159). Este grupo llev a cabo su tarea
enunambiente de rgido control presupuestario impuesto por la Administra
cin. Por ello, el mximo inters se centr en la investigacin y el desarrollo,
ms baratos que los costosos programas de servicios.
El grupo de trabajo hizo veinte recomendaciones. Una abogaba por
lautilizacinde fondos federales para descubrir cmo hacer ms eficaz la
educacin. Otra sugera que el Follow Through se utilizase para evaluar las
variaciones ms destacadas que se registraran en la educacin compensa
toria El informe del grupo de trabajo conclua que el nico hecho patente-
es nuestra faltade conocimiento de formas eficaces de elevar el aprove
chamiento educativo de los estudiantes (El mor e, 1976). El Follow Through
servirapara solucionar ese problema de desconocimiento.
Con laplena cooperacin de la administracin del Follow Through, la
Oficinade Presupuestos y el ASPE, el Follow Through se convirti en un
experimento de variaciones planificadas. Sin embargo, ante el Congreso y
loslugares en los que ya estaba funcionando, el Follow Through sigui
definindosecomo accin comunitaria y programa de servicios sociales,
as como ante los padres de los alumnos.
Para quienes elaboraban los modelos de buena prctica durante la
primerainfancia, los colaboradores, el Follow Through constitua un pro*
grama de desarrollo. Uno de los colaboradores originales se quejaba de
que laideageneral de las variaciones planificadas mistificaba a los mismo
patrocinadores. "La reunin de los futuros colaboradores, cel ebr ada
Washington para presentar sus diversas orientaciones sobre el curriculu
laideadeque laevaluacin podra estar a cargo de un tercer organismo- y
los supuestos de que cada patrocinador dispusiera de un conjunto comp
Ediciones Morata, S. L
li cia de la poltica federal de evaluacin 189
gsentar, provocaron una sensacin de desconcierto y hast a de l ocura
Sart VBanet, 1975). Pocos eran, si es que exista alguno, los modelos
K a la primera infancia completamente elaborados y dispuestos para
molementacin, premisa de la idea de las variaciones planificadas. Por
psidad, para quienes fueron seleccionados como colaboradores, el pro-
a se transform en uno de desarrollo.
^Durante los aos siguientes, fueron aadindose, de forma un tanto
rtunista, nuevos colaboradores y nuevos lugares para proporcionar res
aldo poltico al frgil programa. Los alcaldes de las grandes ciudades
ueran que se sumaran nuevos centros de accin en sus municipios,
consiguindolo, en consecuencia. El estado de California quera convertirse
L patrocinador, por lo que fue designado. Esta estrategia tuvo un xito
admirable para garantizar el respaldo poltico. A mediados de los setenta, el
presupuesto anual del Follow Through haba ascendido hasta los sesenta
millones de dlares. Pero esto llev consigo importantes desajustes de la
correspondencia entre los grupos de comparacin que en el diseo experi
mental se haban escogido para la evaluacin. No obstante, esto no preo
cupaba en exceso a los administradores de la Oficina de Educacin, pues
crean que la elevacin de las puntuaciones de los tests derivada de los
modelos de actuacin en la primera infancia sera tan grande que el desajuste
de los grupos de control no provocara grandes diferencias (Eg ber t , 1977).
La evaluacin tuvo un comienzo vacilante con el contrato firmado con la
University of Pittsburgh, en 1967. Por alguna razn el informe final del grupo
de Pittsburgh slo presentaba las puntuaciones del pretest. La evaluacin
se reanud en 1968 con un importante contrato con el Stanford Research
Institute(SRI). Podemos dividir el transcurso de la evaluacin en tres fases,
que denominaremos con el apellido del funcionario responsable de la Office
ofEducation y el grupo contratante que ms caracterizara la evaluacin en
el perodo correspondiente. Las tres fases mencionadas son: la Eg b er t / SRI,
entre 1968 y 1971; la McDANiELS/ Huron Institute, entre 1972 y 1973, y la
Evans/Abt Associates, entre 1974 y 1977.
La fase EGBERT/Stanford Research Institute: 1968-1971
Esta fase de la evaluacin fue configurada sobre todo por Robert Eg b er t ,
director del Follow Through, Richard Sn y d er , director de la evaluacin, y el
SRI. Se caracteriz por una idea relativamente expansiva de lo que debera
ser la evaluacin, marcado por intentos, por regla general fracasados, de
esPonder a las crticas sobre diversos aspectos.
En febrero de 1968, en Kansas City, se asignaron noventa y una plazas
l0s colaboradores, en gran medida de forma voluntaria. En junio, el SRI
e 8 ^compensado de manera un tanto apresurada con un gran contrato de
6s u,acn posteriormente criticado por la General Accounting (Mee. En
asn Pca a* menos en teora, la evaluacin abarcaba gran cantidad de
Pectos. La relacin oficial de criterios de evaluacin era muy amplia (U.S.
.dad,equi dadyj usi
Edtctones Morata, S. L
190
Evaluacin, etica v n
~-5?er
O f f i c e o f E d u c a t i o n , 1969), incluyendo comparaciones relativas al desarroii
cognitivo y a f e c t i v o , comparaciones entre nios que haban estado en ,
H e a d S t a r t ; grado d e participacin de los padres; efectos sobre sus actitud*
g r a d o de atencin mdica, odontolgica, psicolgica y social; pruebas ?
cambios en los programas escolares y responsividad ante padres y ni?
con ingresos reducidos; pruebas de cambios de actitud de los participante
y de su comunidad, y pruebas de la coordinacin de los servicios comu
nitarios.
Los planes del SRI reconocan con toda claridad esta amplia responsa
bilidad. El objetivo general de esta evaluacin consiste en valorar el impacto
del F o l l o w T h r o u g h sobre los alumnos, padres, personal de las escuelas
miembros d e la comunidad y en la escuela, como institucin social, en los
ambientes en los que se han inaugurado los programas F o l l o w Through"
[ S t a n f o r d R e s e a r c h I n s t i t u t e , 1972, pg. 2). El SRI tambin consider como
objetivo primordial la descripcin de los programas que se iban a evaluar
Sin embargo, al final, el SRI acab administrando slo tests cognitivos en
cuarenta y siete lugares.
En octubre de 1968, en Atlanta, el congreso anual de F o l l o w Through
estallen protestas, sobre todo de los grupos minoritarios. Acusaban a los
evaluadores del SRI de tener una visin sesgada del programa y de ser
insensibles a los aspectos relativos a la participacin de los padres y comu
nidades" (Haney, 1977, pg. 27). La violencia de las protestas sorprendi a
los administradores del Follow Through. Se financiaron nuevos colaboradores
de los grupos minoritarios, convirtindose el cambio institucional en un
objetivo primordial de la evaluacin del SRI.
En consecuencia, el SRI emprendi diversos estudios de casos de co
munidades, pero no marcharon bien (Kr ul ee, 1973, pgs. 246-251). El per
sonal dedicado a estos menesteres qued aislado del resto del SRI, cuya
formacin bsica era de psicologa y no entenda bien el enfoque del estudio
de casos. Poco a poco, estos estudios se tradujeron a un nivel ms realista"
(Kr ul ee, 1973, pg. 248). Ms tarde, se publicaron algunos estudios de
casos, pero no influyeron en absoluto en la evaluacin global. Segn el SRI,
cada comunidad pareca diferente, por lo que era difcil efectuar generali
zaciones con fines normativos. Hacia 1971 (tras manifestaciones tan fuertes
como las del congreso de Atlanta), se abandon sin grandes alharacas la
evaluacin del cambio institucional.
A partir de los estudios de comunidades, surgieron, como estudio inde
pendiente, las entrevistas con los padres, subcontratadas como activida
autnoma con el National Opinin Research Center. Se l l evaron a ca
sesenta mil entrevistas. Esta actividad se prolong durante v a r i o s ne .
pero no tuvo efecto alguno en los resultados finales de l a eval uaci n. Mlen
tanto, el SRI continu con los tests cognitivos. 8 SS
En abril de 1969, en una reunin celebrada en Pajaro D u n e s (CaWO n >
los mismos colaboradores atacaron los trabajos de eval uaci n
Pensaban que la evaluacin estaba gravemente sesgada por su ex ^
confianza en las medidas cognitivas, dado que muchos col aborado
Ediciones Moria, 8. L
I I
varaban como objetivo primordial la elevacin de las puntuaciones en
K cnSImedi das. En concreto, exista la impresin de que las circunstancias
I ^han por la confianza depositada en las medidas de cambio cogntvo, a
I eS e los colaboradores de orientacin conductual (o sea, cognitiva) y en
I ^tra de t odos l os dems (Krulee, 1973, pg. 219). El resentimiento haba
I rreci endo con el tiempo e incluso los conductistas estaban de acuerdo.
I nuevo, los colaboradores insistieron en los objetivos de cambio insto-
I ^ nal El SRI reconoci pblicamente la validez de las crticas y prometi
I Suar en consecuencia.
I Tres meses ms tarde, en Palo Alto, los colaboradores volvieron a acusar
I con virulencia al SRI por su inexplicable lentitud para desarrollar medidas
I nocognitivas, estudios de comunidades, entrevistas con padres y con pro-
I fesores, y observaciones en las aulas. El personal del SRI estaba dividido al
I respecto. Unos pensaban que los estudios de comunidades no eran lo
I bastante neutrales para que se utilizaran como informacin. No obstante,
I ios colaboradores presionaron al SRI para que actuase en esta direccin.
Como es habitual, la cuestin que suscitaba ms pasin era que la
I evaluacin se centraba demasiado en medidas cognitivas convencionales,
I de las que, segn los colaboradores, se desprenderan juicios no muy
I equitativos respecto a ellos mismos. Las intenciones puestas de manifiesto
I por el SRI acerca de la ampliacin del mbito de la evaluacin, restablecie-
I ron hasta cierto punto la calma, aunque ellos todava mostraron su preocu-
I pacin por los juicios que pudieran derivarse de las medidas que en ese
I momento se estaban realizando. En parte como compensacin, los colabo-
I radores recibieron algunos fondos para que evaluaran sus propios programas.
I Esta pauta, consistente en fuertes crticas seguidas de promesas, aunque
I no de cambios importantes, fue caracterstica en las tres fases de la eva-
I luacin.
El SRI trat de elaborar medidas no normalizadas que reflejaran mejor
I algunos objetivos de los colaboradores. El SRI solicit de los colaboradores
I tems de tests cognitivos, recibiendo 1.500 tems. La estrategia consista en
K elaborar un banco de tems que reflejara los objetivos comunes a todos los
K colaboradores. Estos tems se redujeron a 600, disponindose, junto con
II u|Ja batera de tests normalizados, en 22 formas de 8 tests (Haney, 1977,
I Pag. 182). La administracin de los tests plante muy pronto problemas de
I ogstica y costes al SRI. De manera semejante, el SRI trat de elaborar
I frumentos no cognitivos pero, efectuadas pruebas de campo, las rechazo
1 hK'Ser demasiado poco fiables, El personal del SRI admiti que no se
I tan percatado de las limitaciones de los tests existentes ni de las dfficu*-
I lo , Para e,abrar otros nuevos (Haney, 1977, pg. 195). En consecuencia,
I 0k andonaron los esfuerzos para elaborar instrumentos sensibles a tos
I Jetivos propios de los colaboradores.
I efe t 1970, ,os resultados de la primera recogida de datos no mostraron
I tribi . Pos*ivos del F o l l o w T h r o u g h y no se publicaron. En mayo, un
I frac *a O f f i c e o f E d u c a t i o n revis la evaluacin y critic al SRI por su
aso en la comparacin de los modelos y en su evaluacin respecto a
h equidad y j ust ici a de la poltica federal de evaluacin ^
MniHh 11
192
Eyal uaci Mtj,
objetivos especficos. Se llev a cabo una serie de estudios complementar
ninguno de los cuales produjo efecto alguno en los resultados finales 8
En febrero de 1971, la Office ofEducation reafirm de nuevo sus I
dades para la evaluacin. Richard F a i r l e y , Director de Educacin Como
satoria, visit el Sfl y se quej de que los resultados no normalizados7
Sfl, relativos al aprovechamiento de los alumnos, no pudieran representar
en equivalentes graduados. El plan de F a i r l e y consista en descubrir a J-
mejores colaboradores y obligar a utilizar sus modelos en las accin*
derivadas del Ttulo I. Este plan requera una medida normalizada.
Durante 1971, la General Accounting Office, el departamento de Salud
Educacin y Bienestar e, incluso, los Naders Raiders* efectuaron invest
gaciones sobre la evaluacin del Follow Through. En el verano, tanto Egbert
como Snyder dimitieron de sus cargos. En noviembre, Garry McDaniels fue
nombrado director de evaluacin del Follow Through. Durante los cuatro
aos de contrato, la Office ofEducation gast doce millones de dlares en
ia evaluacin.
La fase McDANiELS/Huron Institute: 1972-1973
Bajo ladireccin de McDaniels, la Office ofEducation mantuvo un control
ms directo de la evaluacin. Cuatro meses antes, Laurence Lynn, director
del ASPE, haba recomendado al Secretario de Salud, Educacin y Bienestar,
Richardson, anonadado por el coste de la evaluacin, que el progra
ma debera volver ai rigor experimental. Michael Timpane y Joan Bissell,
del ASPE(Elmore, 1976, pgs. 291 -292), redactaron la recomendacin,
McDaniels concluy que haba que frenar el desarrollo de nuevos instru
mentos. Firm un contrato en exclusiva con el Hurn Institute, dirigido por
David Cohn y Marshall Smith. En un informe, Smith recomienda que
McDaniels consiga en la Office of Education un acuerdo sobre los objeti
vos a largo plazo de la evaluacin y formule un diseo que se ajuste al
mximo a los objetivos (Haney, 1977, pg. 45).
Jane David, del Hurn Institute, dise un plan de muestreo para "elevar
al mximo el potencial de comparaciones vlidas entre los colaboradores
y entreclases integradas en Follow Through y las no integradas en0
programa, as como para determinar la eficacia del Follow Through. t
fundamento del muestreo de Dav id exiga separar los efectos del tratarnien
de los colaboradores de los efectos propios de los lugares de aplica^
Esto podra conseguirse incluyendo varios lugares por cada patrocina
"Si se incluye una serie amplia de proyectos diferentes correspondiera ^
unmismo patrocinador, tendremos fundamento suficiente para corro-
RalphNader se hizo famoso por sus acciones en beneficio de los con^!<^$fs
usuarios norteamericanos durante los aos sesenta y setenta. Sus agentes son
Raiders". (N. del T.) - - :
Ediciones Mrala, S. L
equidad y just ici a de la poltica federal de evaluacin
sesgos restantes no sean muy fuertes. La confusin entre los efec-
[ Pri vados del modelo y del lugar de aplicacin se disipara. Al final, pre-
f ioS I ra est e diseo.
a nueva peticin de propuest as de McDani el s se refera a una evaiua-
del i mpact o sobre una porci n rest ringi da de los objetivos originales. Al
Ir que hacer frente a cost es y escndal os cada vez mayores, limit
Si ca me n t e el mbito de l a eval uaci n, que Haney (1977) denomin efecto
nbudo . El nuevo contrato para el anl i si s de datos se concedi a Abt
Associates, quienes estaban seguros de poder emplear nuevas tcnicas
estadsticas para manejar l os desordenados y complej os datos recogidos
encondi ci ones cuestionables. El obj et ivo bsi co consista en determinar
"deentre un conjunto de enf oques, cul y en qu condiciones es ms
l a z . La recogida de datos cont i nu ef ectundola el SRI.
El trabajo con los colaboradores para especificar sus objetivos y modelos
[dej de formar parte de la evaluacin. En la reorganizacin, McDaniels
[ reparti tareas entre distintos grupos. El Huron Institute prepar la muestra,
el SRI se encarg de recoger los datos, Abt Associates los analiz y un
tribunal nombrado por la Office of Education seleccion los instrumentos.
Aunque M c D a n i e l s ofreci dinero a los colaboradores para que trabajaran
sobre sus propios instrumentos, se le di la mnima prioridad al desarrollo
de los mismos. Esto suaviz considerablemente el golpe para los colabo
radores.
McDan i e l s convoc un tribunal de la Office of Education para determinar
| conjunto de medidas comunes respecto a las cuales se compararan los
modelos. Se escogi el Metropolitan Achievement Test porque a efectos
de comparacin, pareca deseable contar con un nico instrumento que
pudiera utilizarse en varios niveles (EPPS, s/f). El MATpresentaba tambin
propiedades psicomtricas adecuadas. Se seleccion el test de matices
progresivas en color de Ra v en porque el MAT era demasiado limitado y
porque no resulta fcil preparar un entrenamiento previo para realizar el de
Raven, por lo que los colaboradores no podran enserselo a sus alumnos.
El tribunal expres sus reservas en relacin con ambos tests.
Se manifestaron reservas sobre los dos tests no cognitivos, la Intellectual
Achievement Responsibility Scale y el Coopersmith Self-Esteem Inventory.
El tribunal crea que en real i dad, no exi sten medidas adecuadas en estas
reas (EPPS, s/ f).
De nuevo, pronto volvi a surgir el descontento. En el congreso anual
del Follow Through, celebrado en Denver, en octubre de 1972, tos padres
encabezaron las protestas; decan que no haban desempeado papel real
plguno en las decisiones, en la planificacin ni en la evaluacin, a pesar de
las apariencias (H a n e y , 1 9 7 7 , pgs. 60-61). Insistan en que se encargara a
lQs padres la evaluacin anual de los colaboradores. En el documento que
Presentaron se dice: Estamos cansados de que otros decidan cuancio un
programa es o no bueno para nosotros, basndose en su concepto de
datos y en su concepto de lo que es errneo para nuestros hijos y qu
"ay que hacer para corregir esos errores. Y contina: "Los expertos
194
deberan dedicarse a medir el tipo de programa que queremos, en ve? h
disear un programa que saben cmo medir . Pedan que los padres na*
cipasen en la interpretacin y recogida de datos (Steermg Committee
Los colaboradores redactaron un documento apoyando las reivind r
ciones de los padres y mostrando sus simpatas hacia ellas. Aunque ,
estallido fue semejante al que se produjo en el anterior congreso de Atlant
ste ocasion cambios inmediatos, aunque pasajeros. En esta ocasin !
siquiera se trat de estudiar las crticas. Ha n ey seala que la evaluacin
haba quedado, en realidad, aislada de la poltica dominante de la poca
De hecho, ste fue el ltimo congreso general anual del Follow Through de
manera que no pudieron producirse alborotos de este tipo. No obstante y
colaboradores siguieron reunindose peridicamente.
En 1973, se publicaron dos estudios auxiliares iniciados con anterioridad
Estudiando las clases, So ar (1973) descubri que los modelos no tenan
una gran coherencia interna. El estudio de St a l l i n g (1973) fue el nico que
tratde describir, desde el punto de vista emprico, cmo eran algunos
modelos, uno de los objetivos iniciales de la evaluacin. Aunque hall algunas
diferencias sistemticas entre clases incluidas en Follow Through y otras
no pertenecientes al programa, tambin descubri que los modelos no
constituan tratamientos unitarios. Estos estudios auxiliares no influyeron en
absoluto en la evaluacin final.
Aunque la fase Mc Dan i el s/ Hurn Institute slo dur un par de aos,
supuso modificaciones espectaculares en la evaluacin. La Office ofEdu-
cationadopt un control firme, reduciendo el mbito de la evaluacin a
unas pocas medidas normalizadas de resultados y transformando la eva
luacin de operacin poltica en actuacin tcnica. El Hurn Institute prest
su dominio tcnico de la cuestin y la justificacin racional de esos cambios.
La fase Evans/Abt Associates: 1974-1977
La ltima fase supuso la ejecucin tcnica del diseo de evaluacin a
cargo de Abt Associates y el completo dominio de la Office of Education en
laevaluacin. Eugene T uc ker sustituy a Garry M c D a n i e l s , transfirindose
toda la evaluacin del Bureau of Eiementary and Secondary Education a la
Office of Planning, Budgeting, and Evaluation (OPBE) en enero de 1974.
John Evans, director de la OPBE, fue el responsable efectivo de las deci
siones.
Cuando estaba en la Office of Economic Opportunity, Ev a n s fue el res
ponsable principal de la evaluacin Westinghouse/ Ohio del programa Hea^
StarL En muchos aspectos, la primitiva evaluacin de Head Starter seme
jante a la del Follow Through. El trabajo Head Start fue un estudio a
"impacto, concentrndose en la elevacin de las puntuaciones de
nios en los tests, aunque no era ste el aspecto planeado de la^variacio ^
El Head Start Research Council se manifest en contra del diseo de
estudio, realizando las mismas crticas que ms tarde se le haran, cua
T
mi n ( D a t t a , 1976). Las quejas en contra se referan a la insensibl-
$ete^ i seo, la dificultad de encontrar grupos de control y de supervi-
desde el punto de vista estadstico, los sesgos, la falta de medidas
sar>uaC|as de desarrollo personal y social, la falta de conocimiento de los
^ amas concretos, etctera. El grupo de Evans deca que la informacin
^ n e c e s a r i a para poder tomar decisiones y que los sesgos se anularan
efiLamente. El estudio se llev a cabo y no mostr diferencias entre las
^ eSpertenecientes al programa Head Starty las no incluidas en l. Los
cuitados fueron muy controvertidos, utilizndolos Nixon para impedir la
re cesi n de mayor cantidad de fondos para el programa.
para centralizar las operaciones de evaluacin en la Office of Education,
james Albert, vicesubsecretario del departamento de Salud, Educacin y
Bienestar para la Evaluacin y Supervisin, llev a Evans a la Office of
Education. Tanto Albert como Evans crean en la evaluacin del impacto, es
decir que los efectos de un programa se juzgaran por su repercusin en
las puntuaciones que los nios obtuvieran en los tests (McLaughun, 1975,
pgina 110). ' p J H B B M
Evans no perdi el tiempo enfrentndose a los colaboradores. En una
reunin celebrada en octubre de 1974 en Clinton (Michigan), respondiendo
aun patrocinador partidario de medir el cambio institucional, dijo:
La evaluacin es una carrera de caballos; una evaluacin comparativa de la
eficacia relativa de diversos enfoques... Decir que todos los modelos han realizado
avances importantes, es una poltica sentimentaloide, as que elijan ustedes".
Estamos de acuerdo en que los efectos ltimos del Follow Throughdeben
consistir en que, al cabo de diez aos, sus graduados tengan un estilode vida
diferente, siendo menor entre ellos el nmero de drogadictos o presidiarios. Pero
el problema es: cmo pueden ocuparse de esto los investigadores?Utiliza
mos las pruebas que tenemos como aproximacin a aquellos efectos a largo
plazo.
Las decisiones, incluso las de mayor peso poltico, pueden verse influidas
por las pruebas. Con frecuencia, el Congreso acta de forma irresponsable al no
hacer frente a los problemas. Responde a los padres desde las gradas del
Capitolio. Pero las pruebas an tienen fuerza. Sin embargo, si padres y nios se
muestran entusiastas, pero las pruebas son anecdticas y no persuasivas, seria
una irresponsabilidad de nuestra parte decir a otras comunidades que tuvieran
en cuenta el modelo. Los juicios que se hagan respecto a la cualidad irresistible
de las pruebas tendrn que ser arbitrarios. El problema consiste en el reparto de
recursos escasos.
(Informe de la Fourth Annual Follow Through Working Conference, 1974.)
r n ^ reunn de Clinton, algunos colaboradores sugirieron que la Ofqe
Education considerase algunos enfoques alternativos de la evaluacin,
PJl los antropolgicos. Sobre esto, Evans se mostr firme: No estoy de
^uerdo. La otra metodologa es de baja categora en relacin con la calidad
sus pruebas. Las ciencias sociales tienden hacia un mayor rigor. No
Ptaremos voluntariamente enfoques inferiores . Una vez ms, los cola-
y justicia de la poltica federal de evaluacin 195
196 ^valuacin, ti,^..