Sunteți pe pagina 1din 5

5.

-PROCEDIMIENTO DE CONSTRUCCIN
DE UNA PRUEBA O TEST

5.1.- Introduccin

El contenido de este tema se refiere al proceso general para la elaboracin de un test. Los aspectos
a tener en cuenta a la hora de construir un instrumento de medida pueden clasificarse en dos tipos
(Prieto y Delgado, 1996): Aspectos contextuales o externos al propio reactivo y aspectos internos
al atributo que se mide y a la forma de medirlo. Los primeros hacen referencia a las caractersticas
que diferencian a la poblacin con la que va a utilizarse la prueba y que si no son tenidas en cuenta
pueden interferir y sesgar1 inintencionadamente la evaluacin del atributo que se pretende medir. El
segundo es un aspecto ms estudiado en los manuales de psicometra y que hace referencia a la
definicin del constructo (dominio o atributo) que se pretende medir as como todo lo relacionado
con la descripcin, elaboracin y anlisis de los tems o reactivos que constituyen la prueba.
Antes de entrar en el desarrollo de los distintos pasos a seguir, por lo que respecta a los atributos
internos del test queremos apuntar algunas cuestiones referentes a los aspectos externos al propio
test:

- Caracterstica de la poblacin a la que va dirigida la prueba, por lo que respecta a edad, nivel
educativo y cultural, clase social, mbito de procedencia (rural o urbano), lengua materna,
presencia o ausencia de discapacidades especficas, pertenencia a minoras tnicas o
subculturas, etc (op. cit). Todos estos son aspectos a tener en cuenta a la hora de seleccionar
tanto el contenido como las caractersticas formales de los reactivos.
- Las restricciones temporales, as como la caracterstica de aplicarlo de forma colectiva o
impersonal (tests de papel y lpiz, con soporte informtico, alta importancia de las
instrucciones por escrito), pueden influir de forma diferencial a distintos subgrupos o estratos.
Dicho lo cual, la descripcin que se va a presentar a continuacin en este captulo secuenciar los
pasos que pueden garantizar la elaboracin de un buena escala o prueba, por lo que respecta a los
aspectos internos al propio test. Osterlind (1989) dice que el seguir unos pasos precisos y correctos
en la elaboracin de un test no es criterio de validez, pero s una cierta garanta de que los tems que
resulten de ese test bien elaborado muy posiblemente midan ese constructo que verdaderamente se
quiere medir. Pero eso no quiere decir que, por el simple hecho del proceso seguido, tengamos
garanta de que los expertos a los que se les pida opinin van a apreciarlo como un test de validez.
Para ilustrar esta explicacin, Osterlind (op. cit.) compara el proceso de elaborar un test1 con la
fabricacin de un violn. El violn puede haber sido construido siguiendo de forma precisa los pasos
correctos. Pero cuando un violinista lo toca ante un auditorio, lo que el auditorio valora no es como
haya sido construido sino cmo suena, que es el criterio de validez. Igualmente, en la construccin
de tests, el proceso seguido puede ser una cierta garanta de que posteriormente sus usos van a ser
vlidos, pero si lo son o no depender del correcto obrar del usuario en la situacin concreta en la
que le ha tocado aplicarlo. Como dice J. L. Padilla (1995) en la elaboracin de tests, como en las
disciplinas artsticas, la genialidad suele asentarse sobre un perfecto dominio de los fundamentos
tcnicos.

Dejando a un lado las comparaciones, presentamos a continuacin los pasos habituales para la
elaboracin de un test, un cuestionario, e incluso cualquier tipo de escala (Croker y Algina, 1986):
1. Delimitacin del objetivo para el que van a utilizarse las puntuaciones.
2. Definicin del constructo que se pretende medir con el test.
3. Descripcin general de los componentes del constructo.
4. Diseo del test.
5. Redaccin de los tems.
(Consulta a expertos y estudio de campo)
6. Anlisis de la calidad de los tems.
7. Estudio de la fiabilidad del test.
8. Estudio de la validez del test.
9. Elaboracin de las normas de aplicacin, interpretacin y baremacin de las puntuaciones.

Los pasos suelen completarse en el orden anterior. No obstante, la elaboracin de tests es un


proceso abierto y cclico en el que los resultados obtenidos en uno de los pasos aportan informacin
relevante para pasos anteriores y posteriores. En funcin de los resultados en determinados
momentos, suele ser frecuente tener que volver atrs para repetir el proceso y evitar los errores o
inconvenientes detectados. Por ejemplo, como podr comprobar el alumno en las clases prcticas,
no es necesario que los tems sean perfectos desde su primera redaccin, pues a veces los resultados
del anlisis de la calidad de los tems pueden llevarnos a revisar determinados tems y a modificarlos
o sustituirlos por otros. A continuacin se desarrollan cada uno de los pasos anteriores.

5.2.- Identificacin del objetivo para el que se utilizarn las puntuaciones.


Aunque parezca evidente, no siempre se realiza a nivel prctico el hecho de que el objetivo o
posibles usos ms frecuentes del test sea fundamental y determinante a la hora de concretar y dar
sentido al resto de pasos de la construccin de un test. La forma de aplicacin, la duracin de la
prueba, el tipo de tems, su nivel de dificultad, etc., todos ellos son aspectos que estn en funcin del
objetivo para el que se vayan a utilizar las puntuaciones. Objetivo que se concreta en: caractersticas
de la poblacin y tipo de inferencias o usos que se van obtener de la prueba. Hasta tal punto es
importante el objetivo o usos que se hagan del test, que ms correcto que decir de un test que es
vlido sera decir que es vlido o til para determinadas aplicaciones.
No es tan extrao encontrar tests que no tienen explicitada una definicin clara de objetivos. Con
cuntos exmenes nos encontramos que tienen como referente una simple evaluacin de contenidos,
ms o menos circunstanciales, pero sin un claro planteamiento de objetivos didcticos en ninguno
de sus niveles? Si los exmenes no se refieren a objetivos, posiblemente sea porque los programas
estn desprovistos de objetivos y posiblemente, lo que sera ms grave, hasta los planes de estudio
pudieran estar desprovistos de objetivos.

Las mediciones en Psicologa pueden responder a una gran variedad de objetivos y contextos:
evaluar el rendimiento acadmico, realizar diagnsticos clnicos, seleccionar aspirantes a puestos de
trabajo o a becas, orientar la trayectoria educativa, evaluar la congruencia o efectividad de
programas, etc. Es necesario ser conscientes de que cada uno de estos tipos de objetivos plantea unas
exigencias especficas a lo largo de todo el proceso de construccin. No es igual el test que pretende
la medicin de un constructo terico aptitudinal o de personalidad, que realizar una evaluacin
acadmica, una seleccin de personal o un diagnstico (ms informacin a este respecto en Prieto
y Delgado, 1996). No es lo mismo, por ejemplo, elaborar un tests de psicometra para establecer la
linea base de la que partir en unas clases de recuperacin (tems fciles), que hacerlo para diferenciar
los distintos niveles de conocimientos, que hacerlo para adjudicar una beca (tems difciles).

Podemos concluir que declarar explcitamente el objetivo para el que van a utilizarse las
puntuaciones ayuda a la definicin del constructo en sus dos posibles vertientes:

1. La definicin de una teora consistente y sustantiva que relaciona el constructo con otros
constructos o variables empricas de su entorno. Esto es lo que, dentro de la tcnica de
modelos estructurales, se suele llamar parte estructural de un modelo o teora.

2. La definicin de los comportamientos que pueden considerarse como indicadores del


constructo. Aspecto semntico u operativo de cada constructo que en los modelos
estructurales, se identifica con el modelo de medida del constructo (Bollen, 1989). Por
ejemplo, mediremos la actitud hacia la psicometra recogiendo informacin slo de los
componentes de dicha actitud que estn relacionados con el rendimiento en psicometra.

Los dos aspectos considerados anteriormente suelen corresponderse con dos acepciones o
evidencias de validez: Validez de contenido y validez predictiva. A su vez, la validez de Constructo,
ms global y defendida ltimamente, asume ambas acepciones de la definicin del constructo. A ello
vamos a dedicar el siguiente apartado.

5.3.- Definicin del constructo


Parece claro, por lo dicho, que es importante conocer los objetivos del test para as tener ms fcil
los contenidos o lo que, a un nivel superior de abstraccin, podemos llamar definicin del constructo.
Por lo tanto, a partir de los objetivos hemos de dar un paso ms que nos acerque a la elaboracin
de los tems que sern la materia prima con la que vamos a medir el atributo o constructo del que se
trate en cada caso, o los genes de los que depende la calidad del test resultante (Osterlind, 1989).
La definicin del constructo se debe realizar de la manera ms sistemtica posible. Hay dos
grandes aproximaciones para hacer la definicin de los constructos. En funcin de la novedad o no
del objetivo que nos planteemos con la prueba y del tipo de test del que se trate se insistir ms en
un procedimiento u otro. Pero las dos aproximaciones siguientes las presentamos separadas, ms en
aras de claridad terminolgica que porque creamos que son dos procesos excluyentes (Padilla, 1995)

1. Aproximacin inductiva o exploratoria. El autor del test escribe un gran nmero de tems que
supuestamente miden el constructo (despus presentaremos algunos recursos a los que acudir
para tener ciertas garantas de validez de contenido). A continuacin, se administran los tems
a un grupo grande de personas. Las respuestas de las personas a los tems son analizadas
mediante tcnicas estadsticas para buscar patrones de relacin entre los tems. El autor del test
pone nombre ... a esos patrones de relacin y de esta forma define el constructo. La
aproximacin trabaja desde las respuestas de las personas hacia la definicin del constructo.
Sobre este procedimiento de aproximacin al constructo hay que manifestar algunas reservas
si se llevara a cabo en sentido estricto. Un proceso inductivo en el que se parta de un total
desconocimiento de lo que se quiere medir, dar lugar a resultados azarosos y posiblemente
inesperados, pues dependera completamente de circunstancias o preferencias arbitrarias y
descontroladas.

2. Aproximacin deductiva o confirmatoria. El constructo no se mide en el vaco. Est insertado


en una teora que dirige la propia definicin del constructo indicando los comportamientos que
pueden considerarse indicadores del constructo. La contrastacin de las hiptesis estructurales
que pone de manifiesto la teora determinar la validez del test. Esta aproximacin va desde
la teora hacia los hechos.

Normalmente, se parte de situaciones en las que se tiene un cierto conocimiento del constructo
que se quiere medir, aunque a posteriori la investigacin tambin aumente el bagaje de conocimientos
sobre dicho constructo. As pues, se trata de dos procedimientos no excluyentes que, como suele
ocurrir en el proceso investigador en su conjunto, funcionan de forma complementaria. Adems, no
se debe confundir el proceso inductivo para la construccin de tems sobre un constructo novedoso,
con la despreocupacin por conocer sobre el constructo que se quiere medir.
Tradicionalmente, el autor del test ha obtenido la informacin necesaria para definir el constructo
mediante los siguientes procedimientos (Croker y Algina, 1989; Martnez-Arias, 1995):

1. Revisin bibliogrfica. Tener presentes las conductas o indicadores que hayan utilizado otros
investigadores para medir el mismo constructo y de los que podemos tener conocimiento por
sus publicaciones.
2. Anlisis de contenido. Este procedimiento consiste en hacer preguntas abiertas relativas al
constructo que nos interesa a personas conocedoras del constructo o que son elementos de la
poblacin objetivo y cuyas respuestas pueden indicar categoras conductuales representativas
del constructo.
3. Juicio de expertos. Se trata de pedir a personas expertas a travs de entrevistas o
cuestionarios que nos indiquen qu tener en cuenta y, por lo tanto, medir en los sujetos por lo
que respecta al constructo .
4. Identificacin de incidentes crticos. La particularidad de este procedimiento est en que
pedimos a personas cercanas a sujetos tpicos de nuestra poblacin objetivo, que nos
identifiquen comportamientos tipo de los distintos niveles del constructo.
5. Observacin directa. El autor del test recoge la informacin mediante observacin directa de
personas que manifiestan el constructo. Los comportamientos de estos sujetos que el autor
considere relevantes sern propuestos como posibles indicadores del constructo.
De esta forma hemos de conseguir la mejor aproximacin a una buena y clara definicin del
constructo o constructos a medir; tanto desde el punto de vista estructural o de teora psicolgica en
el que se encuadra, como operativo o de delimitacin del tipo de indicadores comportamentales que
habremos de utilizar.

Diseo del test.


El diseo del test consiste en el conjunto de decisiones que el autor debe tomar relacionadas con
la estructura o forma del test. En este momento del proceso de elaboracin debe considerar:
Disear el test es preparar la informacin necesaria para elaborar la poblacin inicial de tems.
El autor del test en este paso como en los anteriores debe asegurar que el test final aportar la
informacin necesaria para alcanzar el objetivo para el que van a utilizarse las puntuaciones. Todas
las decisiones que tome debe someterlas al criterio siguiente: contribuye a lograr el objetivo para
el que van a utilizarse las puntuaciones?
Examinemos con algn detalle cada una de las cuestiones anteriores, relativas al diseo del test.

Nmero de tems
Es imposible fijar a priori el nmero de tems que debemos hacer para constituir la poblacin
inicial de tems. Tambin es evidente que, como despus someteremos los tems de esa poblacin
inicial a un proceso formal de revisin para conocer su calidad, habr que elaborar ms tems de los
que en ltima instancia formarn el test final.
Tampoco podemos olvidar que el modelo lineal aditivo de las escalas tipo Likert y de la Teora
Clsica de los Tests recomienda elaborar tests largos, para favorecer el que podamos obtener
mediciones fiables. El supuesto sobre el valor nulo del promedio de los errores de medida de los
items del test slo se podr alcanzar cuando el nmero de tems es suficientemente grande.
La regla ms comn establece intentar elaborar tres o cuatro veces ms tems de los que prevemos
formarn el test final. Por ejemplo, para un test que previsiblemente tendr 10 tems podemos
intentar elaborar 30 40 para la poblacin inicial. No obstante, si por las peculiaridades de la
variable resulta especialmente difcil redactar tems, podemos disminuir la regla intentando elaborar
slo el doble de tems para formar la poblacin inicial.

Dado que el tiempo de realizacin de la prueba en su conjunto es algo a decidir previamente en


funcin del tipo de usuario y de la finalidad de la prueba, una vez fijado el tiempo deseable, es
conveniente calcular el nmero de tems que cualquier sujeto puede responder en ese tiempo y ello
estar en funcin del numero de alternativas que el sujeto tiene que leer en cada tem.
Tipo de tems y nmero de alternativas de respuesta
Cuando hablamos de tipo de tems nos referimos al formato del tem que se va a disear y que,
lgicamente, viene determinado por el tipo de constructo que se vaya a medir y por la finalidad de
uso que se le va a dar a la prueba. Por lo que respecta al formato de los tems, la primera decisin
a tomar es si el sujeto debe construir la respuesta (respuesta abierta) o si ha de seleccionarla de entre
las propuestas. Las primeras se adaptan mejor a los procesos cognitivos complejos y en los que es
primordial la actividad o produccin del sujeto, mientras que los segundos son ltimamente
preferidos por su mayor precisin o fiabilidad, adems de por su mayor rapidez de correccin.
El tipo de alternativa de respuesta es la forma en que se va a pedir a las personas que respondan
al test.

Redaccin de los tems.


La redaccin de los tems, tal y como hemos planteado el procedimiento de construccin de una
prueba, consiste en escribir los enunciados y dems componentes de los tems (el tipo de alternativa
de respuesta es elegido en el paso anterior). Al igual que ocurre con otros pasos, en la elaboracin
del test no hay unas normas, criterios o recomendaciones que garanticen totalmente la redaccin de
enunciados de calidad. Escribir buenos enunciados para los tems es una habilidad que progresa con
la prctica. Pero, para evitar en la medida de lo posible los primeros fracasos, creemos pertinente
transmitir algunas recomendaciones obtenidas del libro de Osterlind (1989).

Algo muy importante es la precisin en el lenguaje. El tem debe ser breve, no ambiguo, sin
palabras irrelevantes o tautolgicas y sin trminos polismicos. Se evitarn las palabras estereotipadas
y las dotadas de prejuicios o sesgos. No conviene intentar hacerse el simptico con la redaccin
de los tems, pues ello puede despertar en el sujeto que responde actitudes insospechadas y que, casi
seguro, no tendrn nada que ver con el atributo que se pretende medir. Del cumplimiento de estas
consignas se debe derivar que entre el escritor de tems y el que los responde haya un total acuerdo
en el significado de lo que se pregunta.

En su formato ms simple un tem est constituido por un tronco, enunciado o pregunta y, en el


formato ms frecuente, varias alternativas de respuesta: una es la respuesta correcta (o en su caso
la ms correcta) y los dems son los distractores. Frecuentemente esta unidad bsica va acompaada
por el planteamiento de algo (problema, texto, ilustracin, diagrama..etc) que se utiliza como objeto
sobre el que referir la/las pregunta/s. Cuando esto es as, el tem va acompaado por una instruccin
(en negrita) que dirige la actividad del sujeto a leer el texto, ver el grfico y responder al/los tem/s.
Si esta referencia va acompaada por varios tems que preguntan sobre ella se suele hablar de
supertem. Esta estructura de tem/s permite mayores posibilidades a la hora de preguntar sobre
referentes de una cierta complejidad y evaluar procesos cognitivos distintos.
Es recomendable evitar las frases incompletas como tronco del test y sustituirlas por enunciados
declarativos o interrogativos. Porque estos son ms consistentes con las alternativas, que adems as
estarn expresadas de forma ms completa. Con ello se ponen en funcionamiento procesos
cognitivos de nivel superior al de la simple memorieta de rellenar el hueco o completar la frase.
En los tests de ejecucin mxima, se suelen utilizar alternativas de una nica respuesta correcta,
o bien de las que una de ellas es la mejor respuesta correcta o la ms correcta. El primer tipo de
alternativas suele requerir del sujeto el recuerdo de hechos o informacin, mientras que las del tipo
de la mejor respuesta correcta requieren de juicio y discriminacin, consecuentemente son ms
difciles y pueden ser utilizadas para mayor variedad de propsitos de medida ( como por ejemplo, medir
los niveles cognitivos , capacidad de anlisis, sntesis, evaluacin, etc).

S-ar putea să vă placă și