Sunteți pe pagina 1din 12

LA VALIDEZ

1. Introduccin:

Normalmente buscamos que el test tenga un valor inferencial


(adelantarnos, actuar de forma adecuada, hacer pronsticos y tomar
decisiones). Ese valor inferencial cuantitativamente es la validez de
un instrumento, hasta que punto nos permite predecir o no. Un
instrumento no es vlido si no es fiable, primero tiene que demostrar
que es fiable, es una condicin sin la cual no hay validez, pero tiene
que haber ms condiciones para ser vlido.

Con la validez demostramos la utilidad del instrumento, se haya en


un proceso permanente, en continua revisin, se ve el uso que se le
da. Es vlido para una persona, sistema y tiempo determinado. Si le
vamos a dar un uso diferente al test tiene que ser adaptado. La
validacin tiene una caducidad (10-15 aos), no hay garantas de que
el test sea igualmente til, hay que revisar si aun los datos de validez
son aceptables.

Al aplicar un test buscamos tres propsitos:

1. Establecer una relacin funcional con una variable.

2. Medimos para analizar rasgos psicolgicos.

3. Analizar comportamientos manifiestos.

Todas esas medidas con diferentes propsitos, tienen diferentes tipos


de validez:

a. Validez predictiva, predecir un comportamiento.

b. Validez de contenido (tems)

c. Validez de constructo (rasgo)

Un mismo test si tiene diferentes usos necesita diferentes tipos de


validez. La validez nos tiene que dar la utilidad de un instrumento,
hasta que punto es til y es ms til que otros instrumentos que
estn en el mercado.

2.
2. Definicin de validez:

Un test es vlido cuando mide aquello que pretendemos medir, lo


mide bien y mide solo lo que quiere medir (solo esa caracterstica).
La validez de un test es la exactitud con la que puede hacer
mediciones significativas y adecuadas. En el sentido que solo mide lo
que pretende medir, para lo que est construido. Primero hay que
analizar que variables o caractersticas desea medir el test y que uso
le vamos a dar y en quin lo vamos a medir. Si vamos a medir ms
de un uso habr que hallar ms de un tipo de validez.

La validez es estimada a travs de un coeficiente de validez


(coeficiente de correlacin), correlaciona los datos obtenidos
(medidas del test) con los criterios (datos externos). El test no tiene
un coeficiente de validez fijo, depende del contexto, sujeto y
propsitos (pueden haber diferentes coeficientes en un mismo test).
Es necesario saber elegir el criterio adecuadamente para que la
validez sirva.

3. Problemas de criterio de validez:


El criterio no debe estar incluido en el test, debe ser mensurable de
forma directa o indirecta que nos permita cuantificar. Un criterio
raramente es exacto, puede estar contaminado porque lo mide
alguien, nos encontramos criterios parciales pues no son verdaderos.

Es importante definir lgica y operativamente el criterio, que guarde


relacin con lo que pretendo medir. Aunque el criterio sea adecuado
sigue siendo un criterio parcial: el dato de validez es relativo y
tambin es relativo a ese criterio. Condiciones de un buen criterio:

1. Adecuado, consideracin lgica, grado en que se acerca a la


caracterstica que quiero evaluar y a su contexto.

2. Excepto de prejuicios, ofrece las mismas oportunidades a todas las


personas que puedan responder, que no est sesgado.

3. Que haya demostrado confiabilidad, que sea estable en el tiempo


mnimamente. Los criterios tambin evolucionan, varan, por lo que
hay que revisarlos despus de un tiempo (p.e.10 aos).

4. Deber ser vlido.

5. Disponible, hay que buscar un equilibrio entre un buen criterio y


que sea prctico y econmico (no caro en tiempo, esfuerzo, dinero).

Todas estas condiciones para elegir un criterio y quien elige el criterio


es el autor del test. El criterio debe ser totalmente independiente al
test, debe estar valorado por un juez externo al test, nunca puede
ser el autor. El criterio puede medir la misma variable del test pero
debe ser de forma independiente, no debe interferir el test con el
criterio.

Para que no este contaminado el criterio, tendr un cierto nivel de


subjetividad y error, y eso influir luego en cmo hallemos la validez
del test. An as el criterio del test lo elige el autor, no hay criterios
absolutamente verdaderos y es responsabilidad del autor y editor que
estn bien elegidos.

El criterio de validez debe ser independiente al test y muchos autores


escogen otro test como criterio de validez, valorado por otros jueces
diferentes al autor. En los test paralelos, el propio autor los escoge y
los utiliza como criterio de validez, la aplicacin y validez externa no
lo hace el autor y hay un intervalo de tiempo entre una aplicacin y
otra.
4. Tipos de validez:

Hay diferentes tipos, parte de que la validez no es emprica


(coeficiente de validez) sino lgica (que se analiza a travs de
jueces).

Validez lgica, no hay un coeficiente de correlacin, variable


cualitativa:

- Validez de apariencia.

- Validez de contenido (intrnseca, relevancia, circular,


representatividad).

- Validez de constructo, una parte.

Validez emprica o estadstica:

- Validez concurrente.

- Validez predictiva.

- Validez de constructo.

- Validez discriminante y convergente.

Validez lgica:

a. Validez de apariencia. El instrumento parece que mide lo que


pretende medir, lo dicen los usuarios potenciales (que representa
bien lo que quiere medir). Un test puede tener buena apariencia y no
ser bueno, y no siempre los usuarios no valoran bien un test,
concierne al juicio de que si el test esta bien o mal construido,
implica una tendencia de parte del usuario.

No nos da ningn dato acerca de su poder predictivo, no da la


imagen del producto para luego hacer orientaciones claras con el.
Sirve para saber si es vendible, llama la atencin, se valora
positivamente (p.e. comprarme una lavadora azul por su apariencia
pero sesga nuestro juicio acerca de su calidad). Es el primer tipo de
validez, ms superficial, ms sencillo y ms subjetivo

b. Validez de contenido. Ms profunda y lgica. Es un validez


importante porque nos interroga hasta que punto el test o tem,
tienen que ver con los objetivos marcados, representa todo lo que
queremos evaluar (p.e. analizar que estos tems representan todas
las caractersticas de personalidad, MMPI, se analiza cada uno de los
tems de cara a lo que pretenda medir el test, detallar al atributo que
quiere medir el test). Describir el constructo de forma calara y
precisa segn lo que vamos a medir. Analizar al tem respecto a esa
definicin.

Anlisis cualitativo: orden, presentacin de los tems, no negaciones,


nivel de lectura y vocabulario del sujeto, no tecnicismos. Lo analizan
expertos independientes al test, pueden ser profesionales de la
propia especialidad u otros, dependiendo del campo y para qu sirva
el test. Normalmente son varios jueces los que lo analizan.

A veces solo se hace ese tipo de validez, en aquellos en los


instrumentos en los que voy a describir al sujeto de forma cualitativa,
sin hacer comparaciones (incluso cuantitativamente pero sin hacer
comparaciones). Por ejemplo, la escala de miedo, algunos test de
rendimiento. Es necesario que los jueces al valorar el contenido y la
representatividad tengan en cuenta a quien va dirigido el test y su
uso.

Validez emprica o estadstica:

a. Validez predictiva. Relacionada con el criterio. Es una variable


emprica o estadstica, que se halla de forma cuantitativa y por lo
tanto, tenemos que definir y elegir un criterio de validez. Tenemos
que definir y elegir un criterio de validez. Tenemos que encontrar la
validez predictiva cuando nuestro objetivo con un instrumento es
predecir, pronosticar o hacer inferencias. Esta validez se halla
siempre a travs de un coeficiente de validez, que es una correlacin
(se correlacionan los datos del test y los datos del criterio de
validacin). Ese criterio lo ha elegido el autor del test, pero no est
presente en el test, y lo evala un juez no el autor del test.

Los valores de la validez se dan entre 0 y 1, solo se toman los datos


positivos. Tambin tiene un error tpico de medida. Los datos del test
no se dan a la vez que los datos del criterio (p.e. un sujeto puede
puntuar alto en un test de aptitudes para vendedores, luego habr
que ver si es un buen vendedor; si tiene una puntuacin alta y
tambin es un buen vendedor hay una gran correlacin y una gran
capacidad predictiva).

En la validez predictiva hay que esperar al futuro para que se de el


criterio, debe pasar un intervalo de tiempo. Todos los test con los que
voy a realizar un pronstico tienen que tener una validez predictiva
(p.e. en la seleccin de personal, orientacin vocacional).

b. Validez concurrente. Es una validez emprica y lgica, hay un


criterio de validez que tenemos que elegir, sus valores van de 0 a 1
(se correlacionan los datos del test y los criterios que hemos elegido
de antemano). Pero a diferencia de la validez predicativa, en la
validez concurrente el criterio est presente en el test, en el
momento que recogemos los datos (los datos del test y los criterios
se dan a la vez). Por ejemplo, para ver la depresin de una persona,
tenemos que saber si hoy est deprimido no si se va a deprimir en el
futuro. Para hacerlo lo ms rpido posible en situaciones clnicas o de
psicodiagnstico, utilizamos instrumentos que tengan ese poder
diagnstico (tiene que demostrar su validez concurrente).

Un instrumento para diagnosticar, clasificar y predecir tendra que


hallar la validez predictiva (caso particular en que se usa) y
concurrente. Por cada uso que le demos al instrumento debemos
encontrar su validez y por cada tipo de poblacin (si cambio de sujeto
o circunstancias cambia la validez). Por ejemplo, si queremos saber si
un examen de estadstica es un buen test de rendimiento debemos
demostrar su validez de contenido, si queremos saber si es un buen
predictor de xito en psicometra (validez predictiva) y si lo queremos
utilizar para clasificar a los alumnos de clase (variable concurrente).

Cualquier validez emprica tambin se analiza con un error tpico de


medida (el mismo que el de la confiabilidad, ETM errores a la hora de
hacer una medida, cuando mido). El coeficiente de validez est
relacionado con el ETM, ms pequeo el ETM mayor validez.

c. Validez de constructo. Se denomina tambin validez de concepto,


conceptual o de construccin. Es lgica y emprica, es una validez
relativamente nueva, la desarroll Cronbach para poder validar
mediad psicolgicas, especialmente aquellas que tienen que ver con
constructor tericos que se infieren (para saber hasta que punto la
teora se corresponde con la realidad). Es una validez ms compleja
de hallar y existen diferentes formas de hacerlo:

1. Matriz multivariable o multivalores (Campbell y Fiske).

2. Mtodo de Cronbach y Meehl.

3. Modelos causales para la validez de constructo.

La validez de constructo se utiliza para saber el grado de coincidencia


entre los planteamientos o hiptesis de una teora y los resultados de
una prueba. Tambin para medir los rasgos para los que se construyo
el instrumento y ver su eficacia (al validar el instrumento tambin se
valida la teora).

A travs de las respuestas del sujeto en el instrumento se analiza que


la respuesta es correcta y la teora tambin, se hace de forma
emprica y lgica, los pasos a seguir son:

1. Especificar el atributo y sus manifestaciones. Definir el atributo


que pretende medir el test de forma operativa y lgica. Cuanto ms
grande es el atributo ms difcil es saber que variables le pertenecen
o no. Tambin es necesario de limitar una parte de la realidad,
determinar al constructo dentro de unos lmites, especificar para
poder medir. Al mismo hay que definir que tipo de variables le
pertenecen, una o ms (si hay ms, cmo se relacionan entre s) y
que pesos tienen esas variables para analizar ese atributo.

2. Determinar el grado en que las observaciones se correlacionan


entre s.

3. Peso de las variables sobre el atributo.

No hay un criterio externo nico que pueda tomarse de base para la


validez emprica (si no hay un criterio externo no podemos hacer una
validez emprica, correlacionar los datos del test y del criterio), otras
formas de hallarla, cada autor la desarrolla de una manera
determinada:

Mtodo de Cronbach-Meehl. Para hallar la validez emprica, esta


basado en que el atributo se puede manifestar de diferentes
maneras:

1. Lgico: comparar cada uno de los tems de la prueba con la


definicin del atributo que hemos definido (si lo representa o no).
Emprico: comprando cada uno de los tems con el test total
(puntuacin).

2. El test tiene que mostrar una correlacin ms alta con otros


instrumentos que estn diseados para medir la misma
caracterstica, que con instrumentos que estn diseados para
caractersticas diferentes.

3. Trabajar con diferentes grupos (p.e. que en un grupo se da ms la


socializacin que en otro), esperamos a priori que haya una
diferenciacin de grupos, si est bien construido el test tiene que
detectar esa diferencia (ver si tiene poder diferenciador ese test).

4. Si yo intervengo experimentalmente, deliberadamente para


cambiar las manifestaciones del atributo, el test debe detectar los
cambios en el grupo que he tratado (detectar un tratamiento
experimental).

5. A travs de hiptesis contrarias (p.e. test de socializacin y test de


habilidades intelectuales), si el test mide otras cosas, no las para las
que esta construido, est mal construido, si correlaciona con otras
variables para las que no ha sido construido.

Todas estas fases se basan en la correlacin (inferencias algo que


pronosticas, medir algo que tienes hoy). Pueden ser varias variables
en el mismo atributo y se pueden evaluar varias (p.e. cuatro
variables de un atributo) pero no se pueden evaluar dos atributos. Lo
ideal es hacer todas estas fases para ser exactos o sino no queremos
hacer todas: tenemos que coger siempre la primera y una ms
(algunos autores toman solamente alguna).

Mtodo de Campbell y Fiske. Aunque define lgicamente los atributos


es un mtodo bastante cuantitativo-emprico. Utiliza varios mtodos
para evaluar varias variables (tres mtodos por cada uno de los
atributos, ms sencillo 3 mtodos-3 variables). Matriz de
correlaciones: son correlaciones mltiples, coger tres test para medir
tres cosas diferentes, se van a correlacionar todos los test con todas
las variables.
Coeficiente de confiabilidad (r tt). El ndice de confiabilidad (raz
cuadrada de r tt) nos dice hasta que punto las puntuaciones
obtenidas de un test correlacionan con las puntuaciones verdaderas
de un sujeto. Capacidad de detectar puntuaciones verdaderas, ms
all de ese ndice no puede ir la validez (es el tope terico de la
validez, p.e. si el ndice de confiabilidad es de 0.85, la validez no
puede ser mayor). Cuanto ms alto es el ndice de confiabilidad
existe ms oportunidad de que el test sea vlido, luego hay que
comprobar de que realmente es vlido el test

Ejemplo:

Variables: socializacin, depresin y personalidad.

Mtodos: Test de socializacin para adolescentes (TSA, es el que


quiero validar), Test de depresin de Beck y 16PF. Hago una matriz
de correlacin con ellos:

Socializacin (1) Personalidad (2) Depresin (3)

A TSA r A1 r A2 r A3

B 16PF r B1 r B2 r B3

C - Beck r C1 r C2 r C3

Cuando medimos con el A, detectamos algo de las otras


caractersticas (B, C).
La correlacin tiene que ser mayor a 0 y es necesario contrastar la
relacin de A, B y C con 1 ( para que demuestre que sirve para lo que
fue construido y mide mejor que otros), la correlacin de A con 2 y 3
tiene que ser menor.

La mayor correlacin de la matriz tiene que ser A-1 y 1-A porque


para eso ha sido construido. Si otros test correlacionan con mi
caracterstica (socializacin) significa que otros test en el mercado
miden mejor que mi instrumento o que mi instrumento mide otras
cosas.

Anlisis cualitativo: especifica el contenido del constructo que quiere


evaluar, el grado en que todas o algunas de las reas del contenido
que correlacionan entre s y el peso de cada una de las reas
(delimitacin de contenido).

d. Validez discriminante. Si tuviramos varios mtodos que evalan


la misma variables (p.e. sociabilidad: TSA, Bell y BAS), tratar de
valorar que test correlaciona ms con la variable. Si un test tiene
capacidad discriminativa es el test que mide mejor esa variable (el
mejor que correlaciona con esa variable), los otros test medirn la
variable con menos eficacia.

e. Validez convergente. Conseguir que la correlacin de rA1 es mayor


que rB1 y rC1. Mi instrumento correlaciona ms con la variable. En
rAB y rAC tiene que existir una correlacin significativa para
comprobar de que estamos tratando con la misma variables (si miden
la misma variable tienen que correlacionar entre s). rBC no nos
interesa esa correlacin porque se supone que ya esta validada y lo
que nos interesa es comprobar que nuestro test correlaciona con los
otros (B-C) que ya estn validados. (Los test deben ser validados en
la misma poblacin: A, B y C en Espaa no en diferentes pases).

Dependiendo del uso que le quiera dar al test tendr que escoger un
tipo de validez (p.e. si quiero diagnosticar y clasificar utilizar la
validez discriminativa y convergente).

Antes de empezar a analizar el coeficiente de validez es necesario


saber:

1. Cmo se ha definido la variable o caracterstica que interesa


medir?, qu pretende medir el test?

2. En quin lo mide: tipo de poblacin, en que muestra se ha


validado el test?

3. Cul ha sido el criterio de validez?

5. Interpretacin del coeficiente de validez:

Teniendo en cuenta esto, no hay un dato de validez exacto, es muy


relativo y no podemos comparar la validez de un instrumento con la
de otro, debe cumplir unas condiciones: que midan la misma
variable, construidos en base a la misma poblacin, que tengan un
mismo uso y utilicen el mismo tipo de validez.

Adems tenemos que analizar:

1. El error tpico de medida (ETM), cuanto ms pequeo es, ms


probabilidad de que el instrumento sea vlido.

2. El coeficiente de confiabilidad del test y su ndice de fiabilidad: a


mayor coeficiente e ndice de confiabilidad, mayor probabilidad de
que el test sea vlido.

3. Cuanto mayor es la confiabilidad y validez demuestre el criterio, es


mayor la probabilidad de que el test sea vlido.
4. En ms fcil encontrar un coeficiente de validez en grupos
heterogneos (a priori sabemos que los datos cuantitativos van a ser
mayor que en grupos homogneos porque el error tpico de medida
influir menos en el grupo heterogneo).

5. Tipo de grupo que es, es disperso o no (por la varianza y


desviacin tpica del grupo).

6. Finalidad y usos del test, as tendremos diferentes tipos del


coeficiente de validez.

El criterio no es confiable porque puede estar contaminado: no elegir


bien el criterio, que no plasme bien el criterio verdadero, que este
valorado por jueces muy subjetivos y que no haya un acuerdo,
validez de forma poco representativa (no son medidas adecuadas,
superficiales, no significativas) o porque est sesgado el propio
criterio (ms oportunidad de salgan mejor unos sujetos que otros).
Todo esto puede reducir la validez porque no est bien diseado.

El criterio debe ajustarse a las circunstancias y a la poblacin, no


siempre sirve el mismo criterio. Un instrumento es vlido segn para
quin y para qu, por lo tanto, los datos de validez siempre son
relativos y tienen que validarse continuamente (cada 10 o 15 aos)
pues cambian los grupos, las condiciones, hay que validar el uso del
test no el test en s. Tambin hay que valorar la practicidad del test,
que existe un equilibrio entre la validez del test emprica y prctica).
3. http://psicologiamx.blogspot.pe/2012/04/la-validez.html
4.

S-ar putea să vă placă și