Documente Academic
Documente Profesional
Documente Cultură
- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Los estudios de fiabilidad → nos informan de si estamos midiendo con mucho o poco error
de medida, pero no informan de qué atributo estamos midiendo.
Los estudios de validez van a aportar significado a las puntuaciones que hemos ido
obteniendo, permitiéndonos conocer si el uso que pretendemos hacer de ellas es correcta o
no.
El concepto de fiabilidad sólo se ha ido matizando a lo largo de los años, ligado al desarrollo
de las distintas teorías de los test. En cambio, el concepto de validez, ha cambiado
enormemente. La validez ha sido definida de muchas maneras a lo largo de la historia de la
psicometría y su definición sigue cambiando. Lo único que se ha mantenido constante a lo
largo del tiempo es su consideración como la propiedad más importante y fundamental al
desarrollar y evaluar un test.
1
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Por ejemplo, se debe especificar todas las asunciones en las que se basa el test, los
componentes del constructo, las diferencias con otros constructos y sus relaciones
con otras variables.
Si las interpretaciones y usos no están claramente identificados entonces no pueden
ser evaluados.
1
Algo así como afirmaciones
2
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
El lógico → examinar el contenido o dominio de un test como primer paso para juzgar si un
instrumento puede usarse para un propósito particular.
(Este test puede usarse para medir drogadicción? Vamos a mirarlo por dentro.)
Sireci (2003) indica que hay al menos dos aspectos esenciales que se deben de tener en
cuenta para realizar la validación del contenido:
● Definición del dominio: Definición operativa del contenido. En la mayoría de test
educativos esta definición tiene forma de tabla de especificaciones de dos entradas:
Filas: áreas de contenido relevantes para el dominio en cuestión.
Columnas: Indican operaciones o procesos cognitivos implicados en la resolución de
las tareas planteadas.
Se especifican, además, los porcentajes de ítems asignados a cada combinación de
área y proceso cognitivo.
Ej:
Para definir el dominio de manera adecuada podemos usar varias fuentes. En los
tests educativos es habitual usar los libros de texto y los objetivos curriculares; en el
ámbito de selección de personal es frecuente usar los resultados de analizar los
puestos de trabajo.
Los datos obtenidos en tales análisis se usan para defender la evaluación de las
áreas especificadas y para establecer su importancia en el test (ej. la proporción de
ítems de cada una. En los tests de aptitudes se utilizan las teorías sobre las
habilidades mentales y su funcionamiento.
Para que los datos recogidos mediante cualquiera de los procedimientos que hemos
detallados sean informativos hay que garantizar que existe una adecuada fiabilidad
interjueces, es decir, que las valoraciones que realizan son consistentes.
Una limitación de los índices de congruencia y de relevancia que acabamos de describir, es
que, al informar a los jueces de lo que el test se supone que mide, estamos restringiendo
sus evaluaciones a las dimensiones propuestas, y por lo tanto, influenciando sus
percepciones sobre lo que mide el ítem. El conocimiento por parte de los jueces de los
objetivos del test puede sensibilizarse con las expectativas de los constructores del test y
crear un sesgo potencial de demandas de la tarea que contamine sus juicios. Esto
probablemente sobreestima los índices de relevancia y congruencia obtenidos. Para
superar estos problemas se han propuesto métodos que intentan descubrir las
percepciones de los jueces sin informarles de las áreas específicas del contenido del test.
Concretamente Sireci y Geisinger utilizaron métodos de escalamiento multidimensional y
análisis de conglomerados con los juicios sobre la similaridad del contenido medido por
pares de ítems. En este caso, la tarea de los jueces es evaluar, usando escala tipo Likert, la
similaridad entre todos los posibles pares de ítems del test con respecto al conocimiento o
habilidades cognitivas medidas. El objetivo era determinar si la estructura propuesta en la
tabla de especificaciones era congruente con las evaluaciones de similaridad dadas por los
expertos.
4
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
5
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Las relaciones empíricas que mantiene el test con otras variables externas del atributo
medido están en consonancia con el modelo teórico que define este atributo.
Ej. Moltó (1988) predice (y comprueba) que la escala de susceptibilidad al castigo (mide el
grado de evitación de situaciones aversivas) debe proporcionar puntuaciones relacionadas
directamente con neuroticismo e inversamente con estabilidad emocional. Si las relaciones
observadas son consonantes con lo predicho por el modelo teórico en el que se inserta el
constructo medido por el test, entonces hemos obtenido evidencia favorable a la
interpretación propuesta. Si las relaciones observadas no son las esperadas hay que
cuestionar la adecuación de las pruebas, la adecuación de las medidas de las otras
variables, incluso el modelo teórico.
Las variables externas relevantes a las que hacemos alusión pueden ser:
● otras medidas del mismo constructo medidas con diferentes test.
● Medidas de constructos diferentes pero que se insertan en el modelo teórico
donde se encuadra el constructo de interés
● Algún tipo de variable (criterio) que pretendemos predecir a partir de las
puntuaciones en el test.
Examinaremos por separado las evidencias para establecer la relación del test con otros
constructos (evidencia convergente y discriminante) y del test con algún criterio
(validez referida a un criterio).
6
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
7
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
8
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
OBJETIVO: Establecer las condiciones para que las correlaciones entre las puntuaciones
de diferentes rasgos, medidos con distintos métodos, se aproximen a zero.
La matriz MRMM se organiza por método. De modo que cada constructo medido está
incrustado en cada bloque por método.
Para interpretar esta matriz hay que identificar 4 grupos o regiones de correlaciones
1) Correlaciones obtenidas entre = constructos y =métodos. Correlaciones
monorasgo-monométodo.
2) Correlaciones obtenidas = constructo y diferentes métodos. Correlaciones
monorasgo-herterométodo.
3) Correlaciones obtenidas entre diferentes constructos y = métodos. Correlaciones
heterorasgo-monométodo.
4) Correlaciones obtenidas entre diferentes constructos y diferentes métodos.
Correlaciones heterorrasgo-heterométodo.
9
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
10
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Para obtener la relación entre el test (X) y el criterio (Y), si son variables continuas, se
calcula la correlación entre ambas variables, que se denomina coeficiente de validez (rxy).
Este indica el grado en que las puntuaciones en el test sirven para pronosticar con
precisión las puntuaciones en el criterio.
Ej. correlación entre un test de conocimientos y las calificaciones obtenidas en 2º de
bachillerato fuese de 0.85 en una muestra representativa. Como la correlación es elevada,
cometeríamos errores de pronóstico no excesivamente elevados (haciendo uso eq. de
regresión adecuada) al predecir las calificaciones del alumno sabiendo los resultados del
test de conocimientos.
El coeficiente de validez (rxy) no es una propiedad del test, sino que habrá un
coeficiente específico para cada muestra donde se obtenga y para los diferentes
criterios que puedan establecerse.
En muchas ocasiones no resulta sencillo establecer criterios pertinentes (relacionados con
el test), fiables, y fácilmente mensurables, lo cual afectará a la precisión con la que podrán
estimarse.
Ej. los test que se emplean en el examen teórico para obtener el permiso de conducir
deberían predecir en parte la habilidad futura de conducción, un criterio que probablemente
no resulta sencillo de medir de forma fiable, además, seguramente resultaría muy costoso
obtener evidencias de validez referida a este criterio para todos los diferentes test teóricos
que se aplican
La validez referida al criterio puede ser de dos tipos, dependiendo del intervalo de tiempo
transcurrido entre las mediciones en el test y en el criterio.
11
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Capacidad diagnóstica
Ej:
criterio externo 8 enfermos, 6 sanos.
Se pasa el cuestionario. 20 para arriba sano, 20 para abajo enferma.
Resultados test:
Ej. en evaluación neuropsicológica, es usual pasar una batería de test a una persona y
decidir a partir de su rendimiento si se diagnostica o no como perteneciente al grupo de
personas con los síntomas de la enfermedad de Alzheimer.
En estos casos, una prueba CRUCIAL para la validez de las puntuaciones de los tests es
comprobar en qué grado asignan puntuaciones distintas a personas pertenecientes al
grupo diagnóstico y a las que no pertenecen a ningún grupo diagnóstico o otro
diferente del que se está examinando.
12
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
El criterio es una variable dicotómica, pertenencia a uno de los dos grupos o diagnósticos
diferentes. O politómica, pertenencia a uno de 3, 4 grupos.
Los procedimientos a aplicar son distintos cuando se quiere estudiar la validez diagnóstica a
partir de un único test o de varios.
Caso hipotético:
2 grupos:
-uno formado por personas con diagnóstico confirmado de “Trastorno depresivo mayor”.
-formado por un grupo que no tienen síntomas depresivos.
(equiparados en otras variables)
Los resultados de la siguiente tabla muestra los resultados obtenidos tras aplicar el test a
200 personas depresivas y a 200 personas no depresivas.
El criterio de clasificación será tanto más válido cuantos más sujetos se clasifiquen en las
casillas de la diagonal principal → cuantos más resultados correctos se produzcan.
Sensibilidad (S)=160/200=0.8
Especificidad (E)=190/200=0.95
13
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Existen situaciones concretas de diagnóstico (ej. enfermedad muy grave) donde además de
pretender una alta sensibilidad se exige una alta especificidad, dadas las consecuencias
que una falsa alarma podría tener en la persona.
Otro punto de corte del test daría lugar a otra tabla distinta con distintos niveles de E y de S.
Curvas ROC:
Las curvas ROC (Receiver Operating Characteristic) muestran los valores de E y S (en
realidad los valores 1-E→ FA y S) asociados a los diferentes puntos de corte que podemos
establecer a partir de las puntuaciones del test, y por tanto facilitan la selección del más
apropiado para los objetivos diagnóstico que interese optimizar. Se tiene que pensar qué
tipos de decisiones erróneas se quieren minimizar.
La curva ROC surge de conectar mediante segmentos rectilíneos los puntos (1-E, S) que
genera cada punto de corte posible.
El área del cuadrado que queda por debajo de la curva ROC es una medida global de
validez diagnóstica del test.
14
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Los contrastes estadísticos requieren que las variables independientes sean cuantitativas y
que su distribución conjunta sea normal.
15
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Si las p. del test (X) y en el criterio que se desea pronosticar (Y) son variables continuas, el
modelo de regresión lineal permite cuantificar la capacidad predictiva del test.
Hipótesis básica del modelo → linealidad de la relación entre ambos. Un diagrama de
dispersión nos permite obtener una aproximación sencilla al estudio del grado de relación
lineal.
Es importante complementar el cálculo del coeficiente de validez con el correspondiente
diagrama de dispersión, ya que un mismo coeficiente puede ser obtenido con diferentes
pautas relación y el diagrama es una forma sencilla de visualizar estas pautas.
Ej.
Ej. rxy=0.532 indica que con el test se explica un 28.3% de la variabilidad o diferencias
individuales en el criterio, mientras que el 71.7% restante se debe a variables diferentes del
16
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
test (errores de medida de ambos y otras variables no contempladas que influyen en las
calificaciones).
Resulta muy difícil realizar pronósticos precisos a partir de las puntuaciones de un único
test. Cuando se desea predecir de la forma más precisa posible las puntuaciones en un
criterio, es común utilizar las puntuaciones en varias variables predictoras.
Ej. En los estudios sobre predicción en el desempeño laboral se ha encontrado que la mejor
combinación de predictores es la formada por un test de capacidad cognitiva general, una
entrevista conductual estructurada y un test de personalidad que mida el factor
Responsabilidad.
En este caso, los pronósticos se realizarán con la técnica estadística análisis de
Regresión Múltiple, que proporciona los pesos (coeficientes de regresión parcial) de cada
predictor según la importancia que tengan para la predicción.
Si el criterio que hay que pronosticar fuera una variable discreta se pueden utilizar otras
técnicas multivariadas (análisis discriminante, regresión logística)
Un modo de obtener información sobre las inferencias que podemos realizar con las
puntuaciones de un test es analizar los procesos de respuesta que los sujetos deben
realizar para obtener dichas puntuaciones.
17
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
Ej. Ejemplo de cómo se puede utilizar el análisis de los procesos de respuesta para obtener
evidencias sobre la validez de las puntuaciones de un test diseñado para medir la
capacidad espacial. El análisis de procesos permitió distinguir dos tipos de ítems:
aquellos que para su resolución requerían rotación mental y los que podían resolverse por
un procesamiento perceptual general.
Algunos autores:
(Bejar, 2002) → Test basados en modelos → para referirse a los test que han tenido un
diseño guiados por una teoría psicológica sobre el procesamiento de respuestas.
(Embretson, 2002) → Representación del constructo → conjunto de procesos, estrategias
y estructuras de conocimiento que están implicados en la solución de los ítems.
Para Embretson, el diseño de test desde un enfoque cognitivo debería seguir el siguiente
procedimiento (ejemplarizando con el trabajo realizado para elaborar un test de
razonamiento abstracto):
1. Especificar los objetivos de la medición: Por ejemplo, la medición del razonamiento
abstracto como componente esencial de la inteligencia fluida.
Se trata de identificar el tipo de tareas y las características que deben manipularse
para alterar la exigencia cognitiva que se plantean.
Concretando, en el test de razonamiento abstracto deben establecerse ítems
relativamente independiente de los conocimientos previos de las personas.
Se elige un formato de “completar matrices”.
18
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
4. Evaluar empíricamente las previsiones del modelo sobre el rendimiento de los sujetos en
los ítems, así como establecer los oportunos estudios de validez.
Varios estudios empíricos mostraron la influencia que tenían las variables consideradas en
la fase de elaboración de los ítems sobre su dificultad empírica.
Por ejemplo, la cantidad de reglas incluidas, el grado de abstracción de las figuras y otras
características perceptivas explicaron un 79% de la varianza de dificultad de los ítems, y un
77% de las latencias de respuesta.
Vemos que en este enfoque no sólo se miden las respuestas del sujeto a los ítems, sino
que se consideran los pasos intermedios ejecutados para obtener dichas respuestas.
Por otra parte, el conocimiento sobre los componentes requeridos para la respuesta
correcta de los ítems no sólo es importante para la obtención de evidencias de validez.
También permite una información diagnóstica mucho más completa, pues es posible
conocer los componentes en los que los examinados tienen dominio y aquellos en los que
presentan dificultades.
Resulta cada vez más usual la aplicación de test psicológicos y educativos en determinados
marcos de ámbitos institucionales y organizacionales.
19
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
20
102569.- Psicometría
Tema 3: Validez
1391951.- Camila Bellone
En la edición más reciente de las normas sobre los test (la de 1999), que recoge el
concepto de validez actualmente dominante, se establecen algunas aclaraciones
importantes:
21