Documente Academic
Documente Profesional
Documente Cultură
Introducción
de tal forma que una puntuación cualquiera X i , podría considerarse integrada por la
por ei ; así:
X i X v ei
Parece claro que mientras menor sea el error mas fiable es el instrumento dado que
comete errores pequeños. Los errores pueden ser de dos formas:
Alcance
El presente taller contempla los aspectos teóricos de la fiabilidad y validación de
Cuestionarios comprendiendo la teoría de la fiabilidad así como los distintos tipos de
validez. Para lograr lo anterior se consultará literatura especializada sobre el tema ya
que es de real importancia para todos los niveles de educación e investigación en
Educación pues un instrumento validado puede ser aplicado en todo el país.
Objetivo General
METODOLOGIA
Confiabilidad:
Se entiende por fiabilidad a la confianza que se tiene en los datos recolectados, debido
a que hay una repetición constante que arroja una medida estable. La siguiente figura
nos muestra una interpretación del índice de confiabilidad
figura 1
Fiabilidad relativa
En reiteradas ocasiones hay elementos que pueden ser considerados error en unas
ocasiones y no en otras, corresponde igualmente considerar diferentes tipos o
conceptos de fiabilidad. Si se expresara la fiabilidad como la constancia de las
puntuaciones de los sujetos o como la concordancia entre varias mediciones de una
misma realidad se deberían diferenciar matices que dan lugar a distintos tipos de
fiabilidad.
Fórmula de Spearman-Brown
donde:
R xx coeficiente de confiabilidad
2rxx
rxx = coeficiente de correlación entre las dos mitades R xx
1 rxx
y
n A B A B
rxx
n A2 A n B 2 B
2 2
n = número de casos.
ΣA= suma total de preguntas impares.
ΣB= suma total de preguntas pares.
KR20
ne S pq
t
2
(ne 1 St2
donde;
ne = número de elementos
p = cociente del número de sujetos que aciertan un elemento por el total.
q 1 p
KR21
ne S t2 X ne X
S t2 (ne 1
ne S S
t
2 2
e
KR20
(ne 1 S t2
ne = número de elementos
Estos métodos son preferibles a los métodos de las dos mitades porque equivalen a la
fiabilidad media que obtendríamos dividiendo un test en sus posibles dos mitades.
k
k
S i
2
1 i !
k 1 S t2
Siendo
S i2 = la suma de varianzas de cada ítem.
N 1 s t2 24 1 10,27
donde,
N = representa el número de ítems o elementos de la prueba.
p = cuociente entre el número de sujetos que aciertan el ítem y el total.
q = (1-p) es el complemento de p.
A B
encontrar el rxx = coeficiente 2 2 2 2 2 2
.
Método de Rulon:
x
2
D
2
x 2
n
D 2
n
S SD 1,138 S 2 D 1,3
n 1 n 1
T 2
T 2
n
ST 2,94 S 2T 8,64
n 1
S 2
1,3
rxx 1 D
2
rxx 1 0,85
S T 8,64
Es decir, la diferencia entre la fiabilidad perfecta (1) y el cociente entre la varianza de
S T2 ).
Método de Guttman-Flanagan:
rxx 2
1 S 1
2
S 22 0,84880637
2
S t
donde;
S1 = representa la varianza de la primera mitad.
S 2 = representa la varianza de la segunda mitad.
S t = representa la varianza total.
Fiabilidad Absoluta
Se define en términos del error de medida e i que representa la diferencia entre una
n= número de sujetos.
x Es la media observada.
Esta es la misma para las dos puntuaciones, dado que al ser los errores de carácter
aleatorio, la distribución de las infinitas puntuaciones de su sujeto o de infinitos sujetos
con la misma puntuación verdadera es idéntica y tiene la misma desviación estándar.
Estos errores pueden aplicarse fundamentalmente, para resolver dos tipos de
problemas:
1. determinar los límites entre los que esperamos, con una determinada
probabilidad, que se encuentre la puntuación verdadera de un sujeto.
2. comparar las puntuaciones de varios sujetos en el mismo instrumento o del
mismo sujeto en instrumentos de medición.
1
med S x 1 rxx 2 3.20 1 0.60 2.02
Por lo que la puntuación verdadera es:
X v X i z 0.95 med 18 1.96 2.02 14.04 ;21.96
Lo que quiere decir que la verdadera puntuación para un nivel de 95% de confianza
para el sujeto estaría entre 14.04 y 21.96.
La validez de un instrumento varía de acuerdo con el propósito con que se use. Por
ejemplo, si una prueba de aptitud académica predice el rendimiento (variable criterio)
de los estudiantes en el primer semestre de la universidad, es de esperarse que la
mayoría de los estudiantes que obtuvieron altas calificaciones en la prueba de aptitud,
también sean los que obtengan más éxito en dicho lapso académico. Sin embargo, el
hecho de que la prueba de aptitud académica haga una predicción razonable del
rendimiento universitario, no garantiza que también pueda predecir la motivación al
logro de dichos estudiantes, o quiénes se graduarán al final de la carrera, ni muchos
menos quiénes tendrán éxito en sus respectivos campos profesionales.
Cabe hablar de cuatro grandes objetivos o metas a lograr por los instrumentos de
medición que exigen cuatro tipos de validez diferente:
1. Determinar el grado en que cada una de las personas que realizan una prueba
posean el rasgo definido por la misma.
2. Avanzar un pronóstico sobre el comportamiento futuro de cada uno de los
sujetos en un área de conducta determinada en función de su reacción al
instrumento de medición.
Validez de contenido
También en este tipo de validez el test puede ya estar creado por expertos quienes se
preocuparan de la suficiencia y la representabilidad de la muestra de conductas
incluidas en el instrumento respecto de la población que se esta estudiando. La
suficiencia se refiere al tamaño de prueba (número de elementos mínimos que se
debe incluir para abarcar lo esencial), mientras que la representabilidad admite dos
soluciones distintas que son la claridad y precisión (dificultad ortográfica, símbolos,
etc.) .En tal caso un muestreo al azar de la población podría ser la forma mas correcta
para verificar esto. Pero esto no siempre es posible es mas es poco frecuente por las
complicaciones que trae esto (como el conocimiento exhaustivo de la población o la
relación entre las tareas incluidas en la prueba y lo que se desea medir no es tan
directa).
A continuación, se señala un ejemplo de la validez de contenido (juicio a expertos),
donde se seleccionaron seis jueces con el fin de juzgar, de manera independiente la
validez del cuestionario. En la tabla Nº19 se nombran los títulos y grados de los
expertos consultados.
Tabla N°19: Títulos y Grados de Expertos.
Experto Título/Grado(s)
1 Bachiller en Matemática / Magíster en Estadística
Si todos los ítems se consideran con igual ponderación, entonces la evaluación global al
instrumento hecha por los expertos, corresponde a un 63%.
Validez Aparente
Tipos de validez externa: establecen la validez de una prueba comparándola con los
resultados obtenidos por los mismos alumnos en otras pruebas. Esa comparación se
realiza mediante instrumentos estadísticos (normalmente, el coeficiente de correlación,
que mide numéricamente el grado en que dos conjuntos de resultados resultan
coincidentes).
Validez Concurrente
Supone comparar los resultados de la prueba con los de otro instrumento (examen,
auto evaluación, notas del profesor, etc.). Ambas pruebas deben evaluar a los mismos
alumnos en un mismo momento y los resultados deben poder expresarse
numéricamente para poder establecer el mencionado coeficiente de correlación.
Validez de Constructo
Este tipo de validez desde el punto científico es la más interesante, pero a la vez la
más compleja de todas ya que requiere los procedimientos más elaborados y técnicas
estadísticas mas elevadas.
La validez de constructo intenta responder la pregunta ¿hasta dónde un instrumento
mide realmente un determinado rasgo y con cuánta eficiencia lo hace? Esta pregunta
tiene sentido, particularmente en los instrumentos que se utilizan en la investigación
psicoeducativa. En consecuencia, es necesario que podamos mostrar evidencia de
que, efectivamente, el instrumento mide el rasgo o constructo que pretende medir. Por
ejemplo, en lugar de hablar de los puntajes que una persona obtuvo en un instrumento
determinado, podemos hablar de: la satisfacción o disfrute con el aprendizaje de la
matemática, la valoración o significado de la matemática. Todas éstas son cualidades
hipotéticas llamadas construcciones, cuya existencia se supone para explicar la
conducta en muchas y diferentes situaciones específicas.
La validez de constructo tratará de demostrar que aquello que mide el instrumento es
una variable consistente. Una validación de este tipo implica según Cronbach:
Validez Predictiva
Coeficiente de Validez
N XY X Y
XY
N X
1
2 2
X N Y 2 N Y
2 2