permiten la libre expresión del sujeto obteniéndose un informe amplio, rico y matizado aunque poco riguroso y a menudo difuso. En su evaluación poca ingerencia tiene la estadística.
Cuantitativa.- limitan al individuo a dar determinadas
respuestas que son provocadas por estímulos estandarizados. Es breve, esquemático y preciso, se expresan mediante una cifra como resultado de un proceso de medición controlada. El puntaje obtenido por un individuo es por regla el numero de ítems que resolvió correctamente. Se deben escoger ítems que contribuyan lo máximo a la confiabilidad y a la validez, la elección debe basarse en un análisis de probabilidad de que cada ítem los incremente.
Este análisis puede hacerse por varios métodos.
.- Selección de los ítems.- la elección de un ítem depende en primer lugar del juicio de personas competentes en cuanto a su conveniencia respecto a los propósitos del test (Validez de contenido).
2.- Las dificultades de los ítems:
a.- Por el juicio de personas competentes que clasifican
los ítems por orden de dificultad.
b.- Por la rapidez con que el ítem puede resolverse.
c.- Por el numero de examinandos en el grupo que lo resuelven bien:
I.- Por la varianza del ítem y la dificultad, la proporción
(p) de los que resuelven bien un ítem es un índice de dificultad (90% fácil, 0% difícil).
La varianza es pxq, si p=0,50 y q=0,50, la varianza del
item es 0,25, que es la varianza máxima que un ítem puede tener.
Una p de 0,50 destaca más diferencias individualidades
(dispersa más a los examinandos) que otro más difícil o
más fácil. Cuanto mayor sea la varianza del ítem, cuanto mayor es el numero de separaciones entre individuos que el ítem del test es capaz de causar (40%,50%,60% son preferibles a aquellos que resultan mucho mas fáciles o difíciles.
II.- Las ínter correlaciones de ítems y la extensión de la
dificultad.- nunca será factible calcular todas las ínter correlaciones entre ítems (un test de 50 ítems tiene 225 ínter correlaciones entre ítems). Los constructores de tests concuerdan en que:
Para obtener una discriminación más nítida entre
examinandos, los ítems debieran agruparse alrededor del 50% en cuanto a dificultad.
Cuando una cierta proporción del grupo (25% superior)
ha de separarse del resto, no siendo de interés especial las comparaciones dentro de cada grupo, los índices de dificultad deberían estar cercanos al punto de separación Cuando las correlaciones entre ítems son altas y grande la amplitud de talento, la curva de normalidad puede tomarse como guía para la selección de índices de dificultad.
III.- La corrección de índices de dificultad por éxitos
casuales.- al aplicarla suponemos que :
Las respuestas erróneas se deben a la falta de
conocimientos.
Para una persona que desconozca la respuesta
correcta, todas las opciones de respuesta son igualmente atractivas. C- E
¢ K-)
¢
(.- La validez de los ítems.-
a.- Índice de validez.- el poder discriminativo de un ítem
se determina por el grado hasta el cual el ítem dado discrimina entre examinandos que difieren nítidamente en la función medida por el test.
La correlación biserial suele considerarse como el
procedimiento estándar que indica la relación de un ítem con el puntaje total del test o con puntajes de algún criterio independiente. Un método para determinar índices de validez, establece
grupos extremos:
Arreglar las anotaciones del test por orden de magnitud
referida a los puntajes.
Contar el 27% de las anotaciones superiores y el 27% de
las inferiores.
Separar las anotaciones del centro.
Marcar el numero del grupo superior e inferior que
resuelve cada ítem del test
Convertir esos números en probabilidades.
Si es pertinente corregir esas probabilidades por éxito casual.
Entrar en la tabla con esas probabilidades de ambos
grupos y leer la respuesta biserial entre columna y renglón.
Promediar las probabilidades para hallar el índice de
dificultad. La magnitud de un índice de validez aceptable depende de la longitud del test, la amplitud de los índices de dificultad y los objetivos que el test pretende lograr.