Documente Academic
Documente Profesional
Documente Cultură
HISTORIA------Raices en Francia a principios de siglo XX. Binet, colocar a los niños en clases
apropiadas. Apogeo pruebas psi en 1950 y principios 1960. Segunda guerra mundial: termino evaluación.
1- CONFIABILIDAD
Una prueba es confiable, es decir, consistente y precisa al margen de lo que mida exactamente. Es
decir, que la confiabilidad tiene que ver con que la prueba mida bien, más allá de qué mida. Los mejores
sinónimos en psicología del término técnico confiabilidad son consistencia, replicabilidad y fiabilidad. Una
prueba confiable es la que consistentemente genera la misma puntuación o una similar en el caso de un
individuo. La calificación puede replicarse (o reproducirse) al menos con cierto margen de error. Podemos
fiarnos (o depender) de que una prueba confiable genere en buena medida la misma puntuación en un
individuo. Una medición puede ser confiable sin ser válida, pero no puede ser válida sin ser confiable.
La confiabilidad permite evaluar si una misma técnica funcionara de igual forma bajo diferentes
condiciones.
Cambio real----No son fuente de inestabilidad. No explica tampoco los errores constantes. Solo se
relaciona con los no sistemáticos.
TEST RETEST
Coeficiente de confiabilidad se obtiene aplicando la misma prueba a los mismos individuos en ocasiones
diferentes. Margen de un dia o hasta un mes. El coeficiente de confiabilidad es la correlación. Si la
correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento es
confiable. Evalúa los cambios en las condiciones personales, condiciones en las aplicaciones y condiciones
en los calificadores dependiendo si la prueba califica la misma persona o proceso. Coeficiente = la
correlacion entre el puntaje de una prueba y el de la otra. Desventajas--------No evalúa los cambios en
el contenido de la prueba, porque siempre es la misma que se aplica. No explica el error no sistematico.
Efecto del aprendizaje---- Preocupa el efecto de la primera prueba en la segunda, quizá el examinado
recuerde la primera y de las mismas respuestas en la segunda ocasión, o también puede equivocarse en la
primera y resolverlo en los días intermedios y así contestarlo bien en el segundo. El intervalo debe ser lo
suficientemente largo para que la primera prueba ejerza una influencia mínima en la segunda, pero no debe
ser tan largo que el rasgo medido pueda sufrir un cambio verdadero entre ambas.
CONSISTENCIA INTERNA------Se utiliza cuando no interesa cuanto han cambiado los sujetos en el
tiempo, sino en saber si los ítems o las partes del cuestionario responden a las mismas especificaciones y si
los ítems son representativos del constructo a estudiar. Es imprescindible que todas las partes del
cuestionario representen al mismo dominio de contenido, además de que los ítems estén bien construidos.
- División por mitades------Division non-par, segunda mitad mas difícil se realiza la aplicación de
una sola prueba, pero se califica a la misma por dos mitades, como si cada mitad fuera una forma alterna de
la prueba. Luego se correlacionan los puntajes de ambas partes. A la correlación entre las dos mitades se le
aplica correccion spearman-brown.
-Error en el estándar de medición-----El error estándar de medición tiene una relación inversa
con la confiabilidad. Un instrumento altamente confiable, tiene un nivel de error pequeño. Un instrumento
con confiabilidad baja mide su objeto con un alto índice de error. Por lo tanto, el mayor índice de error de
medición, menor confiabilidad, y viceversa. Es la diferencia de las puntuaciones observadas con respecto a
las puntuaciones verdaderas de las personas. Interpretacion practica de la confiabilidad a traves de el. Es la
desviacion estandar de una cantidad hipoteticamente infinita de puntuaciones obtenidas en torno a la
puntuacion verdadera de la persona. Puede usarse para crear un intervalo de confianza. Se expresa en
unidades de puntuacion natural.
-Error constante----Es aquel que genera una puntuación sistemáticamente elevada o baja
en una persona al margen de la constancia que haya en la persona en el rasgo medido. Estos errores
son aleatorios, constantes y no sistematizados que no afectan a la confiabilidad (por ejemplo: si a
niño de lengua materna español se le evalúa ingles obtendrá un puntaje inferior a sus capacidades de
forma constante). Puede afectar a todas las observaciones por igual y ser un error constante, o afectar
a cierto tipo de observaciones, y ser un sesgo. Es difícil predecir y controlar ya que está relacionado a
factores casuales. Se suele decir que son tendencias que desplazan las puntuaciones en una
determinada dirección.
*Contenido de la prueba: Las variaciones del muestreo de los reactivos de una prueba
pueden generar un error no sistemático en las puntuaciones. Las puntuaciones aumentan o
disminuyen no por diferencias reales sino por cambios aleatorios en el conjunto de los
reactivos que se presentan a la prueba (por ejemplo: de 6 temas, un alumno estudia los
primeros 3 y el otro alumno estudia los otros 3; la profesora pregunta sobre los primeros 4
temas, los dos estudiaron la misma cantidad de temas, pero al primero le va mejor).
2- VALIDEZ
Es el grado en el que una prueba mide lo que pretende medir. Validez se refiere a la puntuacion de una
prueba, no a la prueba en si, y no en abstracto, si en funcion de un uso. Es una cuestion de grado. Depende
de la confiabilidad de la prueba y de la confiabilidad del criterio. Si una prueba carece por completo de
confiabilidad, entonces no tiene validez.
Se refiere a lo que mide una prueba, es decir si la prueba mide lo que dice medir. Consigna el uso
particular para el que se planea usar el instrumento. Cada ítem debe ser representativo de la prueba y esta ha
de serlo, a su vez, del constructo que dice medir. La validez es una cuestión de grado, no es un asunto de
todo o nada. La nueva concepción de la validez supone que la misma no es una propiedad del test, sino,
del significado de las puntuaciones de los test.
El termino SUBREPRESENTACION DEL CONSTRUCTO alude a que una prueba no capta aspectos
importantes del constructo, y la varianza irrelevante se refiere a la influencia de procesos ajenos al
constructo que ejerce en la puntuación de la prueba.
El aspecto básico consiste en ofrecer evidencia de que las puntuaciones en una prueba son indicadores
del rasgo o constructo de interés. La validez es la característica aislada mas importante de una prueba, es
la consideración fundamental al desarrollar y evaluar pruebas.
VALIDEZ APARENTE
La Prueba "parece" medir su constructo meta. Parece medir lo que dice medir. Nunca sustituirá la
validez empírica, no es posible tan solo ver una prueba y saber su grado de validez. Ej: test de revista. Esto
se utiliza en el caso de que dos pruebas contengan una validez establecida en forma empírica, es preferible
utilizar la que tiene mejor validez aparente.
VALIDEZ DE CONTENIDO
Pone el acento en el contenido que los compone, en qué medida reflejan el constructo. Tiene que ver con
la relacion entre el contenido de una prueba y cierto campo de conocimiento o comportamiento bien
definido. Debe haber correspondencia adecuada entre el contenido y el campo de interés. Supone la noción
de muestreo, el contenido de la prueba ha de medir una muestra representativa del área de la conducta que
debe medir, es decir que abarca una muestra representativa de todos los posibles contenidos del campo.
Tiene dos tipos de aplicaciones: 1. aprovechamiento educativo; 2. laborales.
2. Se fija la validez del contenido de la prueba haciendo que corresponda el contenido y el cuadro de
especificaciones, se realiza reactivo por reactivo.
El método para corroborar esta validez es el análisis sistemático de los contenidos de la prueba a través de
diferentes jueces (varias personas puntúan y se correlacionan) o también se pueden comparar los resultados
con otra prueba validada para saber si correlacionan los resultados. Complicaciones: Obtener la
especificiacion del campo de contenido.
VALIDEZ DE CRITERIO.
Establecer un vinculo entre el desempeño de la prueba y algun otro criterio que se toma como indicador
importante del constructo de interes. Establecer relacion entre el desempeño de la prueba y la posicion en
algún otro constructo. Hay dos criterios generales para la validez de criterio:
- Criterio externo--------Criterio externo que ofrece una definición realista del constructo de interés,
define lo que en específico se quiere conocer. El coeficiente de validez es la correlación entre los criterios.
- Grupos de contraste-----Se quiere demostrar que la prueba diferencia a un grupo de otro, cuanto mejor
sea la diferenciación entre grupos más valida será la prueba.
- Correlación con otras pruebas--------- Se utiliza cuando es probable que la nueva tenga mejores normas
o procedimientos de calificación más eficaces.
- Matriz multirasgo------Pruebas que poseen distintos rasgos, por lo tanto, se espera que en todas
las dimensiones o rasgos se encuentre validez discriminante.
VALIDEZ DE CONSTRUCTO.
Se refiere al grado en que puede afirmarse que se mide el constructo o rasgo teórico. Centra su atención
en la función que cumple la teoría psicológica en la elaboración de la prueba y en la necesidad de formular
hipótesis que puedan ser comprobadas o refutadas en el proceso de validación, para lo cual requiere la
acumulación de diversas fuentes de información.
Una prueba que trata de medir cierto constructo que en ocasiones no tiene puntos de referencia obvios y
pueden darse distintas clases de evidencia que sustenten la proposicion de aquel a prueba mide el constructo.
Esos metodos son la validez de constructo. Como algo que incluye a la validez de contenido y relacionada
con el criterio. Los métodos para corroborar esta validez son:
- Análisis factorial-----Se evalúa la correlación de los ítems con las dimensiones de la definición del
constructo a estudiar. Forma de cotejar que los ítems del test se relacionen con el constructo y la teoría. Se
utiliza como herramienta la estadística. Remite reducir un numero de variables, ordenar los distintos ítems
en distintos factores. Su cantidad puede ser libre o regulada por el experimentador, y se tienen que relacionar
con las dimensiones teóricas de las que se parte en la conformación del instrumento.
- Correlación c/ otras pruebas------Se correlaciona la técnica c/ otra prueba que mida el constructo.
VALIDEZ ECOLOGICA
Grado en que la prueba tiene sentido en el ambito en que se se aplica. Insiste por un lado en la semejanza
entre las condiciones de investigacion y las condiciones del mundo real en que se produce un fenomeno, y
por otro, en que el sujeto experimente la situacion de investigacion con las mismas propiedades que el
investigador supone.