Sunteți pe pagina 1din 14

VALIDEZ Y CONFIABILIDAD

Integrantes:
Alibardi Glorimar
Hoyer Gabriel

Temas
Medicin: en qu consiste?
Validez
De contenido
De criterio
De constructo
Confiabilidad
Test-retest
Formas paralelas
Split-halves
Coeficiente Alfa de Cronbach
Coeficiente KR-20

Medicin: en qu consiste?
La medicin se define como la asignacin de nmeros a objetos o
eventos, es decir, a las unidades de anlisis, de acuerdo a ciertas reglas. A esta
caracterizacin se ha incorporado la importancia de que dicha asignacin
corresponda a diferentes niveles de calidad, en la representacin del concepto a
medir.
La medicin es un aspecto relevante en la investigacin cientfica, es
necesario precisar este concepto para poder alcanzar los objetivos de la
investigacin. Los acadmicos reconocen que la aplicacin de un enfoque
inadecuado de la medicin en su estudio puede generar datos inapropiados. De
esta manera, es importante que el investigador desarrolle instrumentos de
medicin adecuados, tales como:
La entrevista
El cuestionario
La observacin
La encuesta

Validez
La validez es una de las propiedades bsicas de las medidas empricas,
mediante las cuales se trata de responder a la pregunta relacionada con el grado o
la manera de determinar cmo un indicador emprico o un conjunto de ellos
representa a un concepto terico.
La validez se infiere de la manera en que una escala se elabora o
construye, de su habilidad para predecir eventos especficos, o de su relacin a
mediciones de otros constructos. Lo anterior representa los tres tipos de validez:
1. Validez de contenido
2. Validez relacionada con el criterio
3. Validez de constructo.
El aspecto a enfatizar con respecto a la validez, consiste en saber s el
instrumento validado, realmente lo es, con respecto al propsito con el que fue
planteado. De esta manera, se trata de establecer, s la validez permite interpretar
los datos, con el fin con el que se planearon.

Validez de contenido
La validacin de contenido se define como una serie de actividades que
se desarrollan despus que se ha creado una forma inicial del cuestionario o
instrumento y que busca determinar si los tems incluidos en el cuestionario son
adecuados.
Un estudio de validez de contenido busca determinar si los tems de un
cuestionario representan adecuadamente el dominio o constructo que se quiere
medir.
Esta bsqueda de evidencias es prioritaria sobre todo al inicio del
proceso de construccin del cuestionario. Se puede observar en tres momentos
del proceso:
En la determinacin de los diversos aspectos que se van a incluir en el
cuestionario de forma que stos representen el universo de contenido.
En la asignacin de importancia a estos diferentes aspectos del universo de
contenido.
En la seleccin de los tems que concuerden con estos aspectos.

Validez de criterio
Se refiere al grado de eficacia con que se puede predecir o pronosticar
una variable de inters (criterio) a partir de las puntuaciones en un test. Un criterio
es una variable distinta del test que se toma como referencia, que se sabe que es
un indicador de aquello que el test pretende medir o que se sabe que debe
presentar una relacin determinada con lo que el test pretende medir.
La eleccin del criterio es el aspecto crtico en este procedimiento de
determinacin de la validez, ya que es muy difcil obtener buenos criterios. Un
mismo test puede tener ms de un tipo de validez, es decir puede estar validado
con respecto a varios criterios y los diferentes coeficientes de validez que resultan
pueden tener valores diferentes.

Validez de criterio
As pues, la operacionalizacin del concepto se realiza a partir del
denominado coeficiente de validez, que es la correlacin entre el test y el criterio.
A mayor correlacin, mayor capacidad predictiva del test. Existen distintos diseos
experimentales que permiten determinar esta correlacin. La eleccin de
un diseo u otro depender de las necesidades y circunstancias especficas de
cada caso:
Validez concurrente o simultnea: El test y el criterio se miden al mismo tiempo
(concurrentemente). Puede utilizarse para validar un nuevo test por
comparacin con otro ya validado previamente.
Validez de pronstico: El criterio se mide pasado un periodo de tiempo tras la
aplicacin del test. Es el tipo ms habitual en los procesos de seleccin de
personal, en los que se pretende predecir el rendimiento futuro de los sujetos.
Validez retrospectiva: El test se aplica un tiempo despus del criterio que se
pretende evaluar. til cuando se pretende dilucidar mediante una prueba algn
aspecto del pasado que actualmente no es accesible.

Validez de constructo
La validez de constructo, hace referencia a la recogida de evidencias
empricas que garanticen la existencia de un constructo psicolgico en las
condiciones exigibles a cualquier otro modelo o teora cientfica. Por todo ello, la
validez de constructo se presenta como una condicin indispensable a la hora de
valorar la eficacia de un instrumento de evaluacin sobre una variable psicolgica
determinada.
Para Messick (1980; p.1015) la validez de constructo es el concepto
unificador que integra las consideraciones de validez de contenido y de criterio en
un marco comn para probar hiptesis acerca de relaciones tericamente
relevantes. Asimismo, Cronbach (1984; p.126) refiere que la meta final de la
validacin es la explicacin y comprensin, y por tanto, esto nos lleva a considerar
que toda validacin es validacin de constructo.
Los procedimientos metodolgicos ms utilizados en la validez de
constructos psicolgicos han sido el anlisis factorial y la matriz multirrasgomultimtodo. Ambos sistemas son indicadores respectivos de las denominadas
"validez factorial" y "validez convergente-discriminante"

Confiabilidad
Hernndez (2003:243), indican que la confiabilidad de un instrumento de
medicin se refiere al grado en que su aplicacin repetida al mismo sujeto u
objeto, produce iguales resultados.
Un instrumento de medicin tiene un grado alto de confiabilidad si es
afectado mnimamente por elementos que representan el error de medicin
aleatorio. En este sentido, la confiabilidad tiene un matiz plenamente emprico, sin
embargo, dicho instrumento para una aceptacin cientfica completa, requiere de
la validez, la cual tiene una relacin muy fuerte con la teora, ya que con la validez
surge la pregunta siguiente: con qu propsito se busca la validez? Por lo tanto,
un indicador o un instrumento con validez deben reflejar lo que se supone el
concepto terico plantea explicar. Con la validez, lo que se busca evitar, es reflejar
un fenmeno diferente, o evitar un error de medicin no aleatorio.

Test-retest
Con este mtodo el coeficiente de fiabilidad se calcula pasando el mismo
test dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando
un intervalo de tiempo entre el test y el retest. Despus se calcula la correlacin de
Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido
ser el coeficiente de fiabilidad. Se considera un caso especfico de formas
paralelas, dado que evidentemente un test es paralelo a s mismo.
Al resultado obtenido se le denomina coeficiente de estabilidad, al
servir de indicador de hasta qu punto son estables las mediciones realizadas
durante la primera aplicacin del test. Las diferencias en los resultados se
atribuyen al grado de consistencia interna o muestreo de los tems de la prueba en
el caso de pasar el retest de forma inmediata, y se le suman las fluctuaciones en el
tiempo en el caso del intervalo temporal.

Formas Paralelas
Este procedimiento es el que se deriva naturalmente del modelo.
Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan
lo mismo de forma diferente (por ejemplo, dos tests que con diferentes preguntas
midan un determinado rasgo). Despus se comparan los dos tests, calculando
el coeficiente de correlacin de Pearson. Esta correlacin ser, como hemos visto
en el apartado anterior, el coeficiente de fiabilidad.
Si la correlacin es alta, se considera que hay una buena fiabilidad. Al
valor obtenido tambin se le conoce como coeficiente de equivalencia, en la
medida en que supone un indicador del grado de equivalencia entre las dos
formas paralelas de un test.
La dificultad de este procedimiento radica en conseguir que dos
instrumentos sean realmente "paralelos", dada la dificultad que supone realizar
dos pruebas que midan exactamente lo mismo, pero con diferentes tems. No
obstante, en condiciones ideales en las que se pueda garantizar el paralelismo de
ambas formas, este es el mtodo ms recomendable.

Split-halves
Este mtodo trata las dos mitades de una medida como formas alternas.
Proporciona una solucin simple para el problema que enfrenta el mtodo
paralelo-formas . A diferencia de los anteriores, este mtodo slo requiere una
aplicacin del test. Tras obtener las puntuaciones obtenidas por los sujetos en
cada una de las dos mitades en que se habr dividido, se procede a calcular
la correlacin entre las dos puntuaciones.
El resultado obtenido ser un indicador de la covariacin entre ambas
mitades, es decir, de la consistencia interna del test. La principal dificultad de este
sistema es asegurarse de que ambas mitades sean efectivamente paralelas. Un
sistema habitual es dividir el test entre los tems pares y los impares; no es
recomendable dividirlo sin ms por la mitad, dado que muchos tests muestran un
incremento gradual de la dificultad de sus tems.

Coeficiente Alfa de Cronbach


El Alfa de Cronbach es un coeficiente que sirve para medir
la fiabilidad de una escala de medida, y cuya denominacin Alfa fue realizada
por Cronbach en 1951, aunque sus orgenes se encuentran en los trabajos de
Hoyt (1941) y de Guttman (1945).

El alfa de Cronbach no deja de ser una media ponderada de las


correlaciones entre las variables (o tems) que forman parte de la escala. Puede
calcularse de dos formas: a partir de las varianzas (alpha de Cronbach) o de las
correlaciones de los tems (Alpha de Cronbach estandarizado). Hay que advertir
que ambas frmulas son versiones de la misma y que pueden deducirse la una de
la otra. El alpha de Cronbach y el alpha de Cronbach estandarizados, coinciden
cuando se estandarizan las variables originales (items)

Coeficiente KR-20
Para el ao 1937 Kuder y Richardson, desarrollaron el conocido KR20, se
denomin de esta forma porque fue la frmula nmero 20 presentada por el
famoso artculo de los autores.
Tambin existen varios modelos para estimar la confiabilidad de
consistencia interna de una prueba, entre ellos los ms conocidos son los
siguientes: Alpha de Croncbach, Dos mitades, Sperman-Brown, Mtodo de Hoyt.
El Mtodo KR20 representa un coeficiente de consistencia interna del instrumento,
que proporciona la media de todos los coeficientes de divisin por mitades para
todas las posibles divisiones del instrumento en dos partes (Magnusson, 1995).
La frmula KR-20 tan solo es una variante de alfa especialmente
orientada a items dicotmicamente valorados (especficamente, valorados con los
valores 0 y 1). (Bolvar, 1997) Caractersticas:
Permite calcular la confiabilidad con una sola aplicacin del instrumento.
No requiere el diseo de pruebas paralelas.
Es aplicable slo en instrumentos con tems dicotmicos, en los cuales slo
existen respuestas correctas e incorrectas.

S-ar putea să vă placă și