Sunteți pe pagina 1din 40

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE PSICOLOGIA

PSICOMETRIA

Mg. Luis Miguel Escurra M.

TURNO DIURNO

2 0 1 6
Temas a tratar

1. Introducción a la confiabilidad.
2. Teoría Clásica de los tests.
3. Coeficiente de confiabilidad.
4. El error estándar de medida.
1. Introducción a la confiabilidad

Las mediciones que proporcionan los tests


psicológicos están contaminadas por el error,
lo cual sucede con cualquier instrumento de
medida.

Para los psicólogos es importante que al tomar


decisiones se tenga en cuenta la presencia de
los errores de medición, pues de acuerdo a la
precisión de las medidas se puede hablar de la
calidad de un test.
En las ciencias físicas es sencillo determinar la
confiabilidad de una puntuación.

Por ejemplo: para evaluar la precisión de una


balanza bastara pesar un objeto ya conocido y
observar cuanto difiere el peso indicado por la
báscula del peso "real" del objeto.

Cuanto mayor es la diferencia entre el peso


observado y el real, mayor será el error
cometido por la báscula y, por tanto, menos
precisas o confiables serían sus mediciones.
Este procedimiento no se puede aplicar al campo
de la medición psicológica, debido a que no se
cuentan con valores conocidos en el ámbito de
los constructos psicológicos.

Una posibilidad sería medir el mismo objeto en


múltiples ocasiones. Cuanta mayor variación
se observe en los resultados de las distintas
ocasiones, menos confianza se puede tener en
que el resultado de una medición concreta
fuese similar a la verdadera.
No se puede afirmar que la estabilidad de las
mediciones sea una prueba definitiva de la
calidad de la medida, una gran estabilidad de las
mediciones no garantiza, necesariamente, un
acierto pleno en las mediciones.

Por ejemplo: si la balanza indicara un resultado un


kilo superior al peso real del objeto.

La medida sería estable, y podría concluirse,


erróneamente, que la balanza indica con precisión
del peso real del objeto, lo que no es cierto, pues
la balanza, siempre incrementa el peso del objeto.
El método de la repetición puede brindar información
útil en determinadas circunstancias.

Por ejemplo, si no estamos tan interesados en


conocer el peso real de un objeto sino en
determinar cuál es el más pesado de un conjunto
de objetos, como es el caso de la balanza anterior,
que siempre añade un kilo al peso de cualquier
objeto, podría servir perfectamente a al propósito
de ordenar los objetos en función de su peso.
Esta situación es extrapolable al terreno de la
medición de constructos psicológicos por medio
de pruebas, tests, escalas y cuestionarios, dado
que gran parte de las decisiones que se toman por
los usuarios de los tests se basan en la ordenación
de las personas.

Por ejemplos: la elección de la carrera universitaria a


partir de los puntajes de un inventario de
intereses; la selección de aspirantes a un puesto
de trabajo, la interpretación de las mediciones de
la inteligencia mediante tablas normativas, etc.
En la medición psicológica es habitual el interés, no
en determinar la cantidad con que una persona
tiene una habilidad o destreza, sino en comparar
su ejecución en los tests con otras personas para
encontrar, las más hábiles, por ejemplo.

En este contexto, los tests que proporcionen medidas


estables pueden ser suficientemente precisos
para el objetivo de la medición. Esta perspectiva
"pragmática" sobre la confiabilidad es la más
utilizada a la hora de analizar la precisión de las
mediciones psicológicas.
La confiabilidad se debe entender en términos de la
estabilidad de las mediciones entre repetidas
administraciones del mismo instrumento de medida a
un mismo grupo de personas.

Para Muñiz (1998) la confiabilidad se refiere a la


estabilidad de las mediciones, siempre que no existan
razones teóricas, ni empíricas para pensar que la
variable haya sufrido cambios ni diferencias para las
distintas personas.
Por ejemplo: un test que mida el desarrollo psicomotriz
de bebés pueda dar como resultado medidas
inestables.

Esta inestabilidad se debe a cambios en el objeto de


medida como es el proceso de maduración
psicomotriz en el niño, el cual provoca que, de
tiempo en tiempo, la ejecución del bebé en el test
varíe.
El instrumento de medida refleja ese cambio madurativo.
Por lo que no hay contradicción entre el concepto de
confiabilidad y la naturaleza cambiante del
comportamiento humano.
.
Los errores de medición
Todas las mediciones psicológicas presentan errores
de medida.

El usuario de los tests debe identificar qué fuentes de


error afectan a sus mediciones y cuantificar su
efecto.

Antes de tomar una decisión a partir de las


mediciones proporcionadas por un test, el usuario
debe examinar su confiabilidad ya que debe ser
consciente de que no es posible una precisión
perfecta.
Los factores que contaminan las mediciones producidas
por los tests son:
a) La persona responde a un conjunto de ítems y su
puntuación representa una muestra limitada de
comportamiento, es decir, responde a un subconjunto
de todos los ítems que, idealmente, podrían haber
sido utilizados para "provocar" todos los
comportamientos indicadores del constructo.
b) Las circunstancias derivadas del contexto de
administración de los tests (luminosidad, nivel de
ruido, temperatura, entre otros)
c) El "estado psicofísico" de las personas (fatiga,
motivación, cansancio, etc.).
Los errores de medida, incluyen todas las fuentes
de variación en las mediciones que no son
atribuibles al objeto de medida.

Los errores de medida pueden ser:

A) Errores sistemáticos.

B) Errores aleatorio.
Afectan de manera consistente a la puntuación de un
sujeto debido a alguna característica de la persona o
del test que no tiene nada que ver con el constructo
que se está midiendo.
Por ejemplo, un niño que padece de dificultades en la
audición confundiendo los fonemas “r” y “n”, puede
llegar a equivocar las palabras “sana” y “rana”
cuando las escucha.

Si se le pide que realice una tarea para categorizar


palabras como sustantivos o adjetivos y éstas le son
presentadas por el canal auditivo, puede que
clasifique “rana” como adjetivo porque él ha
entendido “sana”, aun sabiendo distinguir la
diferencia si las lee.
b) Errores aleatorios
Afectan a las puntuaciones individuales de forma
aleatoria o azarosa.

Pueden afectar sobrestimando o subestimando la


puntuación del sujeto.

Ejemplos de este tipo de errores son: los aciertos


por azar, distracciones en la situación de prueba,
errores en la administración del test, en la
puntuación, fluctuaciones en el estado interno del
sujeto, etc.
Los errores sistemáticos no alteran la estabilidad de la
medida, ya que afectan siempre en la misma dirección,
pero sí afectan a la seguridad en la medida (no
representan la posición real del objeto en el continuo
psicológico) y, por tanto, tiene repercusiones prácticas
adversas.
Los errores aleatorios, afectan a la estabilidad en la medida
y, en consecuencia, desvirtúan el proceso de
comparación entre sujetos, ya que los errores afectan
en diferente cuantía a cada uno de los sujetos.
Por lo tanto, es necesario desarrollar teorías y
procedimientos empíricos para evaluar la estabilidad
de las puntuaciones.
La teoría dominante en Psicología es Teoría Clásica de los
Tests (TCT).
2. LA TEORÍA CLÁSICA DE LOS TESTS (TCT)
La Teoría Clásica de los Tests, fue formulada en 1904 por Charles
Spearman (Muñiz, 1996) y desarrollada más tarde por
diversos autores como Guilford (1936), Gulliksen (1950),
Magnuson (1967) y Lord y Novick (1968).
La teoría indica que la puntuación observada en un test o
puntuación empírica (X) es el resultado de dos elementos
hipotéticos: la puntuación verdadera (V) y un componente
error (E).
X= V + E
La definición formal de cada componente del modelo es
tautológica, es decir, los elementos se definen unos en función
de los otros. Así, por ejemplo, la definición de error es:
E = X - V.
a) La puntuación verdadera, es un concepto
estadístico que parte del análisis del proceso
de respuesta a un test.

La puntuación observada en un test puede


considerarse una variable aleatoria, es decir,
una variable que puede asumir distintos
valores de acuerdo a un conjunto de
probabilidades.
b) La puntuación de error, incluye únicamente
a los errores aleatorios de medida. El error
puede ser definido como:

Ej = Xj - Vj

Donde Ej es el componente error para el sujeto j,


Xj la puntuación observada en el test para el
sujeto j y Vj su puntuación verdadera.
HIPOTESIS DE LA TCT

1. Hipótesis fundamental, cualquier


puntuación observada X es función de dos
componentes:
X=V+e

2. Hipótesis de Nulidad de los errores, La


media aritmética de los errores, es cero, es
decir su esperanza matemática es cero:
E(e) = 0
3. No existe correlación entre las
puntuaciones y el error de una misma
prueba.
Ve = 0

4. No existe correlación entre los errores.


Para todo i,j se cumple:
eiej = 0
5. No existe correlación entre las puntuaciones
verdaderas y los errores en formas distintas
de un mismo test o en test diferentes. Esto es
para todo i,j con i ≠ j se tiene que:
Viej = 0

De estas cinco hipótesis se deducen las relaciones


que son básicas para el desarrollo de la TCT
y se refieren a los valores esperados, a las
varianzas de las puntuaciones y a las
correlaciones entre ellas.
DERIVACIONES TEORICAS
1. El valor esperado de la puntuación verdadera
es igual al valor esperado de la puntuación
observada.
E[V] = E[X]

2. La ecuación de regresión de la puntuación


observada sobre la puntuación verdadera es
la ecuación de una línea recta que pasa por el
origen y cuya pendiente es la unidad
E[X/V= vg] = vg
3. La varianza de las puntuaciones observadas es la
suma de las varianzas de las puntuaciones
verdaderas más la varianza de error:
2 2
𝛿𝑋 = 𝛿𝑉 + 𝛿𝑒2
4. El cuadrado del coeficiente de correlación lineal
entre las puntuaciones observadas y sus
correspondientes puntuaciones verdaderas es igual
al cociente entre la varianza de las puntuaciones
verdaderas y las varianzas observadas:
2
𝛿𝑉2
𝜌𝑋𝑉 = 2
𝛿𝑋
5. De (3) y (4) se deduce la igualdad:
2 2 2
2
𝛿𝑋 − 𝛿𝑒 𝛿𝑒
𝜌𝑋𝑉 = = 1 −
𝛿𝑋2 𝛿𝑋2

6. El cuadrado de la correlación entre la puntuación


observada y el error es igual a la razón de la varianza
de los errores con respecto a la varianza de las
puntuaciones observadas:
2
𝛿𝑒2
𝜌𝑋𝑒 = 2
𝛿𝑋
*
3. COEFICIENTE DE CONFIABILIDAD
La TCT utiliza un “puente matemático” para estimar el
índice de confiabilidad. Se trata del "modelo de
tests paralelos". Este modelo proporciona la base
para la definición del coeficiente de confiabilidad.

Dos tests son paralelos si proporcionan medidas


equivalentes de las personas, es decir, para el
usuario debe resultar indiferente utilizar uno u otro
a la hora de tomar decisiones a partir de sus
puntuaciones.
El modelo de tests paralelos fija las condiciones formales
que deben cumplir dos tests para ser considerados
"paralelos":

a) Cada sujeto tiene la misma puntuación verdadera en


cada test.
b) Las varianzas de las puntuaciones error es la misma para
ambos tests.

Por lo tanto, ambos tests tendrán la misma media y la


misma varianzas observadas.
El cálculo del coeficiente de confiabilidad se basa
en el concepto de medidas repetidas, es decir,
en la medición en más de una ocasión, las que
se consideran "mediciones paralelas".

Si repetimos la administración del test, y


suponemos que la naturaleza de la variable es
estable, mediciones semejantes indican
estabilidad y, por tanto, confiabilidad.
El coeficiente de confiabilidad es la razón entre la
varianza de las puntuaciones verdaderas y la varianza de
las puntuaciones observadas.

La relación entre el índice y el coeficiente es inmediata:


el coeficiente de confiabilidad es el cuadrado del índice
de confiabilidad. Formalmente:

 X X   xv 
1 2
2
Crocker y Algina (1986) señalan tres consideraciones que
se deben tener en cuenta para interpretar el coeficiente
de confiabilidad:

X X
a) 1 Representa la proporción de la varianza de las
2

puntuaciones observadas que se puede atribuir a la


varianza de las puntuaciones verdaderas.
De manera que, el coeficiente vale 1 si toda la
varianza de las puntuaciones observadas se debe a la
varianza de las puntuaciones verdaderas, es decir, no
hay errores de medida.
2)   Al elevar al cuadrado el coeficiente de
2
X1 X 2

confiabilidad, su resultado indica la


proporción de la varianza de las puntuaciones
observadas en el primer test paralelo que se
puede predecir a partir de la varianza de las
puntuaciones observadas en el segundo test
paralelo.

3)  xv Es la correlación entre las puntuaciones


verdaderas y las puntuaciones observadas.
No se debe olvidar que el coeficiente de
confiabilidad es al igual que el índice
una cantidad estrictamente teórica,
debido a que no se dispone de medidas
estrictamente paralelas.
4. EL ERROR ESTÁNDAR DE MEDIDA
El coeficiente de confiabilidad permite describir la
proporción de varianza de las puntuaciones
observadas que se debe a la varianza de las
puntuaciones verdaderas.
La TCT proporciona un método para describir la
desviación esperada de la puntuación
observada de un individuo respecto de su
puntuación verdadera.
Para ello se puede aplicar la siguiente formula:
 E   X 1   XX '

El error estándar de medida proporciona un índice del


grado de desviación de las puntuaciones observadas
respecto de las puntuaciones verdaderas.

Cuanto menor sea el error típico de medida con respecto a


la desviación de las puntuaciones observadas, menor
será su varianza y, por lo tanto, menor será la
proporción de la varianza observada debido al error (y
mayor la debida a la varianza de las puntuaciones
verdaderas).
Por ejemplo: supongamos que SE= 3.5 (SE es
el estimador muestral de E ).

¿Qué podemos concluir acerca de este error


típico de medida?

¿Es lo suficientemente importante como para


comprometer la confiabilidad del test?
Para contestar a estas preguntas, es necesario
comparar ese valor con SX, el estimador de la
desviación típica de las puntuaciones
observadas.

Cuanto menor sea SE con respecto a SX, menor


impacto tendrá sobre la confiabilidad del test.
Supongamos que en el grupo 1: SE= 12 y SX=
60, mientras que en el grupo 2: SE= 3 y
SX= 9.

¿En cuál de los dos grupos el error estándar de


medida será más perjudicial?.

En el grupo 2, ya que supone 1/3 (3/9) de la


desviación estándar de las puntuaciones
observadas y en el grupo 1, sólo representa
1/5 (12/60).
El error estándar de medida es necesario a la
hora de estimar la puntuación verdadera
de los sujetos.

Ésta no puede ser determinada exactamente,


sino que se estimará un intervalo en el
cual estará incluida la puntuación
verdadera, siempre con una cierta
probabilidad de que así sea.

S-ar putea să vă placă și