Validación de Cuestionarios

 Teoría y nociones de la medición
 Análisis de confiabilidad
 Análisis de validez
 ¿ Qué es medir?, ejemplo: Felicidad
“La medición no es simplemente asignar números a las propiedades de los objetos. Las
magnitudes deben permitir operar matemáticamente con ellas, conservando su sentido
y propiedades, ser resistentes a la manipulación experimental y que sea posible que se
establezcan comparaciones y hacer predicciones” (Santisteban, 2009).
 Pregunta Importante:
¿Si yo represento la magnitud de una variable psicológica con un número, todas las
operaciones que realice, serán admisibles y representarán la realidad de esa
variable?
Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Original: Juan Carlos Bazo Álvarez - UPCH
Si la TEORÍA es correcta, el NÚMERO
refleja la MAGNITUD genuina de la
VARIABLE
Variable no
La TEORÍA nos permite definir esta La PRUEBA PSICOLOGICA El NÚMERO
observable
variable en función a sus indicadores permite convertir esos representa la
que deseo
(constructo) indicadores en números realidad empírica y
medir
se espera que se
comporte de forma
coherente con la
teoría del constructo
EL procedimiento que confirma lo anterior otorga validez de constructo a la prueba; de modo

que, el NÚMERO es una expresión adecuada de la MAGNITUD del constructo

 Medición de lo objetivo:
El medir las cosas que podemos ver y tocar, la acción de medir nos resulta mucho
mas familiar y comprensible. (Accesible a todos – metodología diferente)
 Medición de lo subjetivo
El intentar medir las cosas “invisibles e intocables” a través de sus expresiones
observables a las que todos conocemos como INDICADORES.

 El conjunto de indicadores (manifestaciones o expresiones) ubicados en un constructo
(una construcción), procura dar sentido, claridad y cuerpo a aquello que no es
observable.
 Siendo necesario que la variable a estudiar esté construida con mucha precisión, y para
ello es necesario definirlo.
 La definición permite aclarar el marco concreto de mi constructo (concepto), es decir

que logre diferenciar con otros objetos (diferencia específica) y que se entienda con
claridad su naturaleza (género próximo)…. (validez de contenido)
 Esta definición debe ser operacional; es la que ayuda a medir la variable, es decir esta
definición nos otorga una explicación de la variable en termino de sus indicadores, dado
que es una variable que no puedo ver pero que si puedo medirla. Por eso es primordial,
necesario y obligatorio que esta sea lo mas precisa y clara posible.
Dimensió
Constructo Ítem
n
CDE3: Para atraer a mi pareja busco deslumbrarla o divertirla
Búsqueda de
atención CDE4: Hago todo lo posible por ser el centro de atención en la vida de mi
pareja
CDE1: Me siento desamparado cuando estoy solo Balanceo, en
una situación
Miedo a la CDE18: Siento una fuerte sensación de vacío cuando estoy solo obvio
Soledad +
Dependencia CDE19: No tolero la soledad -
Emocional CDE16: Si mi pareja me propone un programa dejo todas las actividades
que tenga para estar con ella
CDE21: Si tengo planes y mi pareja aparece los cambio sólo por estar con
Modificación ella
de Planes
CDE22: Me alejo demasiado de mis amigos cuando tengo una relación de
pareja
CDE23: Me divierto solo cuando estoy con mi pareja
Original: Juan Carlos Bazo Álvarez – UPCH, Métodos y diseños del comportamiento, Lima: URP
 Nominal (clasificar en una única categoría)
 Ordinal (clasificar + orden)
 Intervalo (distancia entre puntos son =s)
 Razón ( todas las operaciones + cero, ejm: peso)
 Por lo tanto, conociendo los niveles y las operaciones como análisis estadísticos
podemos hacer con ellas, lo que se buscaría entonces es poder trabajar con la
escala de razón dado que proporciona mayor información sobre la magnitud que se
desea medir. Sin embargo la mayoría de las mediciones en los constructos sólo
alcanzan al nivel ORDINAL, y sólo los test construidos mediante la TEORÍA DE
RESPUESTA AL ITEM, logran alcanzar a la medición INTERVÁLICA.

Original: Juan Carlos Bazo Álvarez – UPCH, Córdova, M. (2009). Estadística Descriptiva e Inferencial ; Métodos y diseños del comportamiento, Lima: URP
 Actitudes: plano no óptico, predisposición (preguntas, en escalas, dicotómicas,
etc)
 Conductas: plano óptico (observación)
 Habilidades: capacidad, competencia, destreza (tareas)
 Conocimientos (pregunta directa, sobre contenido específico, acumulación de
información)
 Aptitudes (capacidad potencial, en un escenario simulado)
 Escalas del instrumento:

 Unidimensionales
 Multidimensionales
Original: Juan Carlos Bazo Álvarez – UPCH; Métodos y diseños del comportamiento, Lima: URP
 Grado en que un instrumento produce resultados consistentes y coherentes. Es
decir su aplicación repetida al mismo sujeto produce resultados semejantes.
 Es una expresión de la PRECISIÓN de la medida de todo el test, por lo tanto afinar
la confiabilidad nos ayudaría a reducir al mínimo posible, el error de medida.
 Lo ideal es que el valor que representa esa variabilidad + el error sea positivo y
cercano a 1.
Se puede evaluar por: Diseños de evaluación:
• Estabilidad • Test-retest
• Acuerdo entre observadores • Formas paralelas o alternativas
• Consistencia Interna • División por mitades
• Alpha de Cronbach

Original: Juan Carlos Bazo Álvarez – UPCH; Hernandez R. (2009). Metodología de la Investigación; Métodos y diseños del comportamiento, Lima: URP
 Es la capacidad del instrumento para obtener resultados idénticos o similares
cuando se aplica al mismo sujeto en dos ocasiones distintas.
T1 = T2 => + estables en el tiempo=> menor error
 Entonces, no es lógico evaluar para instrumentos que miden manifestaciones o

expresiones temporales (ESTADOS), pero si para los que perduran (RASGOS).
 Es evaluado mediante un índice de correlación, Pearson.

Original: Juan Carlos Bazo Álvarez – UPCH
 Grado de concordancia (consistencia) entre dos o mas observadores sobre un
mismo instrumento al evaluar a un mismo sujeto.
 Si concuerdan, entonces el instrumento es robusto porque resiste la variabilidad
de los evaluadores, de lo contrario puede generar incertidumbre. ¿De dónde
proviene el error?
Cualitativa Cuantitativa
Correlación
Índice Kappa Intraclase
Coeficiente de Lin
0 1

 Grado de homogeneidad entre ítems de un instrumento (correlaciones +).
 Estos ítems deben comportarse de manera similar si dos o mas ítems miden
aspectos ligeramente diferentes.
 Multidimensionales: 1ero. Consistencia por cada dimensión
 Si las preguntas tienen orientación

negativa, entonces se invierten.
 Se evalúan mediante:
r de Pearson
Coeficiente KR-20
Alfa de Cronbach (unidimensional)
 Evalúo estabilidad de T1 y T2 a un mismo grupo, pueden ser sujetos pareados.
 La correlación debe ser positivo y cercano a uno.
 Apropiado para test que miden rasgos.
T1
T2

 Se evalúa ESTABILIDAD de dos formas paralelas de un mismo test en tiempos
diferentes. El test versión A y test versión B, miden lo mismo, pero con diferentes
preguntas.
 En ambos casos se aleatoriza la asignación en cada tiempo (T1, T2)
 La correlación debe ser positivo y cercano a uno.
Id Evaluado Forma-T1 Medición -1 Forma-T2 Medición-2

1 Luis A 8 B 15
2 Luis B 25 A 22
3 Franco B 29 A 35
4 Ricardo A 49 B 41
5 Heber A 50 B 55
6 Rubeth A 69 B 66
7 Boris B 71 A 78
8 Emma A 89 B 81
9 Lizie B 98 A 92
10 Blanca B 98 A 97

 Se parte el test en dos mitades evaluándose CONSISTENCIA INTERNA mediante la
correlación entre ambas mitades.
 La correlación de las puntuaciones debe ser positivo y cercano a uno(Pearson);
ajustar la confiabilidad mediante Spearman Brown.
Id Evaluado item1 item2 item3 item4 Suma_t Mitad par Mitad impar
1 Luis 5 1 1 3 10 4 6
2 Luis 5 3 4 1 13 4 9
3 Franco 1 3 2 3 9 6 3
4 Ricardo 5 2 3 2 12 4 8
5 Heber 5 5 1 5 16 10 6
6 Rubeth 2 1 1 2 6 3 3
7 Boris 5 3 4 2 14 5 9
8 Emma 2 2 4 2 10 4 6
9 Lizie 4 3 1 2 10 5 5
10 Blanca 5 4 5 2 16 6 10

 Evalúa la CONSISTENCIA INTERNA con base a la varianza de cada ítem y el de la
escala total (todos los ítems juntos).
 Escala continua y unidimensional, de lo contrario utilizar índices teta.
Id Evaluado item1 item2 item3 item4 Suma_t

1 Luis 5 1 1 3 10 Interpretación Alpha de Cronbach y
2 Luis 5 3 4 1 13 KR 20
3 Franco 1 3 2 3 9 Rango Confiabilidad
4 Ricardo 5 2 3 2 12 ≤ 0,50 Muy Pobre
5 Heber 5 5 1 5 16
0,51 – 0,60 Pobre
6 Rubeth 2 1 1 2 6
0,61 – 0,70 Débil
7 Boris 5 3 4 2 14
8 Emma 2 2 4 2 10 0,71 – 0,80 Aceptable
9 Lizie 4 3 1 2 10 0,81 – 0,90 Buena
10 Blanca 5 4 5 2 16 > 0,90 Excelente

 Grado de la evidencia y la teoría apoya a las interpretaciones de la medición del
test. (mide lo que intenta medir)
 Grado en que instrumento mide a la variable que se busca medir.
 No se resume por índices, dado que necesita evidencia por diferentes tipos.
 La confiabilidad es una condición necesaria, pero no suficiente para la validez.
Confiable pero no válido Válido y confiable

 Grado en que un instrumento refleja un dominio específico de contenido de lo que se
mide. (Validez de juicio de experto)
 Ejemplo: Un cuestionario sobre actitud frente a la investigación no tendrá validez de
contenido, si explora la opinión de los presentes sobre el desempeño del Director de
Investigación.
 Lograr que el conjunto de ítems se aproximen a la medición de ese constructo y que
éste no se confunda con otro. Balanceo
 Los ítems deben ser representativos (relevantes y suficientes).

Jueces Visión - Población Objetivo
• Teoría Suficiente • Exploración fenomenológica de su

• Proceso interactivo entre juez y autor visión(cualitativo)
• Revisión final del instrumento(juicios de • Proceso interactivo entre la población y el
expertos≈3). autor
• Cierre: concordancia • Focus Group/piloto para refinar.

 Conocida como validez de estructura o de estructura interna; se usan datos de la
aplicación de la prueba, para verificar el grado de homogeneidad de los
ítems(correlaciones cercanas a 1).
 Se verifican a través de la matriz ítem-ítem, la matriz ítem-resto(la correlación de la
sumatoria del ítem frente a la sumatoria del resto de los ítems).
ítem Obs Sign Item-test item-rest alpha item_1 item_2 item_3 item_4 item_5
item_1 1
item_1 20 + 0,3966 0,1278 0,8835
item_2 0,0567 1
item_2 20 + 0,8360 0,7207 0,7034
item_3 20 + 0,7792 0,6658 0,7322 item_3 0,1202 0,6384 1
item_4 20 + 0,8757 0,7765 0,6800
item_4 0,1469 0,7594 0,6605 1
item_5 20 + 0,8285 0,6848 0,7121
test 0,7918 item_5 0,1176 0,6654 0,5654 0,6856 1
Ítem-resto >0,65 0,3<Ítem-Ítem<0,8

 Se establece al validar un instrumento de medición al compararlo
con algún criterio externo que pretende medir lo mismo. Validez
concurrente y la validez predictiva. En las campañas electorales, los
sondeos se comparan con los resultados finales de las elecciones.
Ejm: Coeficiente de Contingencias, Spearman – Brow, Pearson, Alfa
de Cronbach y la Técnica Aiken
 Indice de Kappa
 Se establece al validar un instrumento de medición al compararlo con algún criterio
externo que pretende medir lo mismo.Validez concurrente y la validez predictiva
 Se utiliza, un criterio externo al test o instrumento para poder validarlo, ese criterio
puede ser un valor otro instrumento previamente validado o cualquier otro criterio
que tenga un valor previo.(correlaciones cercanas a 1).
 Ejemplo: Si estoy tratando de validar instrumento para medir depresión, un criterio
externo puede ser la opinión o el diagnóstico de un psiquiatra calificado. Con ello
voy a revisar la validez de esta prueba sobre la validez que ya tiene aprobación o
verificación previa(contraste externo).
 Puede darse en el mismo tiempo o momento del estudio (convergente -
concurrente) o ese criterio puede ser a futuro (diseño longitudinal- predictiva).

 Debe explicar el modelo teórico empírico que subyace a la variable de interés.
Ejm: El Análisis de Factores y Análisis de Cofactores, el Análisis de Covarianza
“Mide lo que se pueda medir y lo que no se
pueda medir, hazlo medible”
Galileo Galilei
(según Jostein Gaarder)

Validación de Cuestionarios

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Validación de Cuestionarios

Încărcat de

Drepturi de autor:

Formate disponibile

 Teoría y nociones de la medición

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

EL procedimiento que confirma lo anterior otorga validez de constructo a la prueba; de modo

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 La definición permite aclarar el marco concreto de mi constructo (concepto), es decir

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 Escalas del instrumento:

Se puede evaluar por: Diseños de evaluación:

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

T1 = T2 => + estables en el tiempo=> menor error

 Entonces, no es lógico evaluar para instrumentos que miden manifestaciones o

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 Multidimensionales: 1ero. Consistencia por cada dimensión

 Si las preguntas tienen orientación

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 La correlación debe ser positivo y cercano a uno.

Id Evaluado Forma-T1 Medición -1 Forma-T2 Medición-2

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Id Evaluado item1 item2 item3 item4 Suma_t

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 La confiabilidad es una condición necesaria, pero no suficiente para la validez.

Confiable pero no válido Válido y confiable

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

 Los ítems deben ser representativos (relevantes y suficientes).

• Teoría Suficiente • Exploración fenomenológica de su

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Ítem-resto >0,65 0,3<Ítem-Ítem<0,8

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

Edición setiembre 2016: Génesis Masiel Guevara Vásquez - HRL

(según Jostein Gaarder)

S-ar putea să vă placă și