Sunteți pe pagina 1din 4

TEMA 2. VALIDEZ DE LAS PUNTUACIONES DE UN TEST.

CONCEPTO DE VALIDEZ.
Grado en el que un instrumento de medida mide lo que se propone medir. Otros añaden que un test es válido para algún fin o
propósito.
Se valida un instrumento de medida con relación al fin o propósito para el que se usa.
La validez se encarga de analizar qué mide realmente el test y de probar cuál es realmente su utilidad para predecir otras variables
relacionadas.
Aspectos a destacar en su definición.
Destacan 2 aspectos:
 Relevancia del test para el propósito al que se aplica.
 Utilidad del test en la situación en la que se aplica.
Cronbach (1988), indica que debe considerarse también las consecuencias sociales del uso del test. Se deben evitar los sesgos
culturales (sexo, raza,etc).
Messick (1995), vuelve a plantear el proceso de validación de un test como un proceso continuo nunca acabado.
Diversos autores han intentado unificar las distintas acepciones de validez en un único tipo de validez. La validez de constructo
como criterio unificador. Pero se mantendrá estas dos áreas:
 Válido por su significación (v. de constructo y v. de contenido)
 Válido por su utilidad (v. referida al criterio)

VALIDEZ DE CONTENIDO.
Si la muestra del test refleja el dominio del contenido. Expresa el grado en el que una medida empírica representa un dominio
específico de contenido. Debe ser analizada por sujetos expertos en el contenido que se muestra en los ítems del test.
Para que una prueba tenga validez de contenido se debe:
1. Especificar el dominio completo de contenido que es relevante a la situación medida particular.
2. Especificar una muestra representativa de ese dominio.
3. Definir los ítems del test (revisar bibliografía, encontrar las dimensiones más importantes, dividir estas dimensiones en
subdimensiones, y construir ítems que reflejen el significado asociado a cada subdimensión.

Es el enfoque menos empírico. Hay muchos procedimientos que ayudan a valorar la validez de contenido. Uno de estos es analizar
el grado de acuerdo entre los jueces expertos en el contenido expresado en forma de ítems del test. La representación de los
ítems con relación al dominio de contenido se puede analizar con la Teoría de la Generalización.

VALIDEZ APARENTE.
Si mide lo que parece medir. Y suele venir dada por los sujetos que responden al test.Validez aparente <> Validez real.

VALIDEZ DE CRITERIO O EMPÍRICA.


Es la capacidad del test para predecir un criterio relevante. El grado en el que el test es útil para predecir un objetivo determinado
viene dado por su relación con un criterio externo al test. Mide la utilidad del test, para que sirve.
La utilidad de la validez de criterio va a depender de la calidad de la medida del criterio y del instrumento en sí.
Su limitación más importante es que en muchas de las medidas no existen o es difícil definir variables de criterio relevantes.
Cuanto más abstracto es un concepto, más difícil es encontrar un criterio adecuado y dar una medida de él. Se conoce como el
problema del criterio decidir qué medir como criterio.
A mayor grado de relación del criterio con el test más alta es la significación.
Ejemplos de variables de criterio: grupos de edad, grupo de sujetos sin trastorno, grupo de sujetos con trastorno….
Hay tantos coeficientes de validez de criterios como criterios se puedan definir para una medida particular.
 La elección del procedimiento estadístico para analizar la v. de criterio depende de: nº predictores, el nº de criterios y el
nivel de medida de las puntuaciones del test y del criterio.
 Si hay un solo criterio, el grado de v. c se expresa mediante un coeficiente que indica el grado de asociación que hay entre
el test y el criterio. Y se obtiene mediante el coeficiente de correlación de Pearson (si son continuas y lineal). El test es útil
si hay una correlación alta.
Tipos de validez de criterio.
 V. c. concurrente. Es el grado de relación entre el test y el criterio, medidos al mismo tiempo. >=0,75 se consideran altos
si es un test criterio con garantías suficientes.
 V. c. predictiva. Concierne con la relación entre las puntuaciones de un test y un criterio medido posteriormente.
Puntuaciones medidas antes que el criterio.
Ej: Test de inteligencia. Criterio “Rendimiento académico”.
Test de selección para un puesto trabajo. Criterio “éxito en el trabajo”, otro “tasa de absentismo laboral”.
 V. c. retrospectiva. Es el grado de relación entre las puntuaciones de un test aplicado en un momento dado y un criterio
medido con anterioridad.
Ej: Diferencias adolescentes que tuvieron una infancia hostil o acogedora.

Coeficientes de correlación entre las puntuaciones obtenidas en un test y en un criterio.


Organizamos en una tabla las puntuaciones obtenidas por un grupo N de sujetos a un test (X) y un criterio (Y). Dependiendo del
nivel de medida de las variables se pueden obtener los siguientes coeficientes de correlación:

1. X Continua – Y Continua.
Coeficiente de correlación de Pearson. (rxy).

Coeficiente de determinación. r2xy .porcentaje de variabilidad de las puntuaciones en el criterio que se puede explicar a
partir de la variabilidad de las puntuaciones de un test y 1-r2xy de la variabilidad del criterio que no se puede explicar a
partir del test.

Cuando se elige un “buen criterio”, la correlación más alta se da del test consigo mismo (fiabilidad). La fiabilidad no suele
ser mayor de 0,9, por tanto, la validez de criterio será menor de 0,9. Un test puede ser muy fiable y poco válido.

2. X Ordinal – Y Ordinal
Coeficiente de correlación rho de Spearman (ρxy)
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o
ambas escalas de medida son posiciones. Ejemplo: Orden de llegada en una carrera y peso de los atletas. -1<= ρxy<=1.
Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes más elevados le asignamos el rango 1 al siguiente el
rango 2 y así sucesivamente. Si se repiten dos puntajes o más se calculan las medias aritméticas.

El valor del coeficiente se interpreta como, hay una correlación si es + o – y baja, moderada o alta.

3. X Continua – Y Dicotómica.
Coeficiente de correlación Biserial – puntual (rbp)
4. X Dicotómica – y Dicotómica.
Coeficiente de correlación Phi (ϕ )

VALIDEZ DE CONSTRUCTO.

Cronbach y Meehl (1955) introducen este concepto. Para ellos, un test se crea para medir un constructo, para ello se
especifica la teoría acerca de este constructo y lo que se espera acerca de la relación entre:

 Este constructo y otros constructos.


 Este constructo y otras medidas (test) y
 El test que se va a validar y otras medidas.

A estas relaciones les llama red nomológica. La validez se prueba si se puede demostrar que los resultados obtenidos
con el test se ajustan al constructo. No se identifica las puntuaciones del test con el constructo. La validez de
constructo es la acumulación de evidencias que apoyan que la puntuación del test es una de sus manifestaciones.

Es el grado en el que una medida (puntuación obtenida en un test) se relaciona con otras medidas (consistente con
hipótesis derivadas de la teoría) de los conceptos o constructos que se van a medir.

Su validez requiere el uso de una teoría sustantiva (T. Psicológica) para definir el constructo que se va a medir y de la
teoría de la medida para proporcionar una medida del mismo. No se expresa mediante un único coeficiente, sino que
el estudio es un proceso continuo que requiere muchos tipos y fuentes de evidencia.

Aspectos a tener en cuenta en el estudio de la validez de constructo.

 Desde el punto de vista teórico. Interpretar la teoría del constructo. Analizar las interrelaciones entre el
constructo y otros constructos o variables. Diferenciarlo de otras interpretaciones (constructos o variables).
 Procedimientos de análisis.
o Validez estructural (de rasgo o estructura interna del constructo)
o Validez nomológica (grado en que una medida se relaciona/ diferencia de un conjunto de constructo
teóricos y sus medidas)
o Validez convergente y divergente (discriminante. Procedimientos basados en matrices multirasgo-
multimétodo (MRMM) para sacar relaciones con otras medidas del constructo.
o Plantear nuevas investigaciones a partir de los resultados derivados de las hipótesis.
o El análisis del sesgo o funcionamiento diferencial de los ítems o test.
o Determinar el grado de generalizabilidad de las puntuaciones obtenidas con el test
o Diferenciar grupos (validez diferencial).
El estudio de la estructura interna del constructo consiste en encontrar las dimensiones que subyacen a un conjunto
de ítems. Se usa una técnica de Análisis Multivariante. La más usada es Análisis Factorial (AF).

El análisis factorial trata de encontrar las dimensiones o factores que subyacen a un conjunto de variables o ítems,
pudiendo ser exploratorio o confirmatorio.

S-ar putea să vă placă și