Documente Academic
Documente Profesional
Documente Cultură
Introducción
Dentro del proceso de investigación, se requiere elaborar instrumentos en los que se pueda
recolectar datos; con la finalidad que la información recogida sea objetiva y real, en otras palabras
que sea válida y confiable. Tal vez sea esta el gran problema para muchos investigadores, ya que
la realización de una buena investigación va depender del hecho que la información recogida
concuerde lo más cercano posible al problema, suceso o fenómeno que se está investigando.
Cuando queremos recoger información o datos para la toma de decisiones, el dilema surge
si el instrumento a utilizar cumple los objetivos de la investigación, cubre el dominio de las
variables a investigar. En las diferentes áreas de conocimiento existen una diversidad de
instrumentos que ayudan a recoger información, entre ellos tenemos: los cuestionarios, ficha de
observación, lista de cotejo, pruebas, test, rúbricas, fichas técnicas u otros; la pregunta es
¿realmente el instrumento elaborado nos ayudará a tomar decisiones?. En este sentido, un
instrumento según Alvarado, Canales y Pineda (1994) “…es el mecanismo que utiliza el
investigador para recolectar y registrar la información” (p.125).
Conceptos previos
Definición de medir: se entiende por medir cuando se asigna números, símbolos o valores a las
características o propiedades de objetos o eventos de acuerdo con reglas” (Stevens, 1951). Desde
luego, no se asignan a los objetos, sino a sus propiedades (Bostwick y Kyte, 2005).
Definición de medición: se puede definir a la medición como “el proceso de vincular conceptos
abstractos con indicadores empíricos”, el cual se realiza mediante un plan explícito y organizado
para clasificar (y con frecuencia cuantificar) los datos disponibles (los indicadores), en términos
del concepto que el investigador tiene en mente (Carmines y Zeller, 1991).
Validez de un instrumento
Ebel (1977, citado por Fuentes, 1989) establece que validez “…designa la coherencia con
que un conjunto de puntajes de una prueba miden aquello que deben medir” (p. 103). La validez se
refiere al grado en que una prueba proporciona información que es apropiada a la decisión que se
toma. La validez responde a la pregunta ¿con qué fidelidad corresponde el universo o población al
atributo que se va a medir? Por ejemplo: Una prueba de conocimientos de regresión lineal tiene
que medir esto y no conocimientos de regresión cuadrática.
Tipos de validez:
Validez de Contenido
La validez de contenido se refiere al grado en que un instrumento refleja un dominio específico del
contenido de lo que se quiere medir, se trata de determinar hasta dónde los ítems, reactivos o
criterios de un instrumento son representativos del universo de contenido de la característica o
rasgo que se quiere medir, responde a la pregunta cuán representativo es el comportamiento elegido
como muestra del universo que intenta representar. Por ejemplo, un cuestionario sobre la actitud
de los alumnos ante la investigación no tendrá validez de contenido si explora la opinión de los
alumnos sobre las características de los docentes dentro de la cátedra de estadística. También se le
denomina validez racional o lógica.
Según plantea (De Arquer, M. I. 2011) se debe considerar que la validez de contenido
cualitativamente es una cuestión de juicio, se estima de manera subjetiva o intersubjetiva
empleando, usualmente, el denominado Juicio de Expertos. Los juicios de expertos se pueden
obtener por el método de agregados individuales (en forma individual dan sus opiniones), el método
Delphi (en forma grupal y sin debate dan sus opiniones en forma anónima, en este caso se emplea
la mediana y el intercuartil cuyas puntuaciones son en forma asimétrica), la técnica de grupo
nominal (reunidos el grupo en forma individual entregan sus puntuaciones, luego cada uno expone
y se debate para obtener coincidencias, se emplea la media aritmética para las puntuaciones), y el
método de consenso grupal (la tarea del grupo consiste en lograr un consenso sobre las
puntuaciones de los ítems)
Nota
La técnica utilizada con mayor frecuencia por los investigadores es el Método de Agregados
Individuales por la facilidad de elección de expertos y otros aspectos como tiempo y economía.
Método de Agregados Individuales: Se pide individualmente a cada experto que dé una estimación
directa de los ítems, reactivos o criterios del instrumento. Se seleccionan al menos cinco expertos
o jueces, para juzgar de manera independiente. Cada experto debe recibir la información escrita
suficiente sobre: el propósito de la prueba (objetivos), conceptualización del universo de contenido,
tabla de especificaciones o de operacionalización de las variables del estudio y la ficha de
validación del instrumento. Se recogen y analizan los instrumentos de validación y se decide:
Un resultado de validez mayor al 61% es considerado aceptable y por lo tanto, el instrumento es
aplicable. El porcentaje de validez menor a 61% implicará que el investigador deberá revisar el
instrumento para que sea evaluado nuevamente.
Ejemplo:
El coeficiente V de Aiken para cada Juez se obtiene reemplazando los datos en la expresión
matemática
Luego, el promedio de todos los coeficientes V de Aiken es 0,877; indica que el instrumento tiene
alta validez de contenido.
Validez de Constructo
Al respecto Babbie (2014); Grinnell, Williams y Unrau (2009); The SAGE Glossary of the Social
and Behavioral Sciences (2009d); y Sawilowsky, (2006), mencionan que “la validez de constructo
es probablemente la más importante, sobre todo desde una perspectiva científica, y se refiere a qué
tan bien un instrumento representa y mide un concepto teórico” (citado por Hernández, Fernández
y Baptista, 2014, p. 203)
Un constructo es una variable medida y tiene lugar dentro de una hipótesis, teoría o modelo
teórico. Es un atributo que no existe aislado sino en relación con otros y debe ser inferido de la
evidencia que tenemos en nuestras manos y que proviene de las puntuaciones del instrumento
aplicado.
Ejemplo:
Tabla
Validez de criterio
Ejemplo:
Los resultados, en puntuaciones, obtenidos por los estudiantes en la prueba sobre objetivos en la
investigación científica, simbolizados por la variable “x”, y los logrados en la redacción de
objetivos de la investigación, considerados como variable criterio por la variable “y”, pueden
observarse en la siguiente tabla.
La validez de criterio con correlación producto momento de Pearson empleando el software SPSS,
es:
La correlación de producto momento de Pearson resultó 0,93 indica que la validez de criterio del
instrumento es alta.
Confiabilidad del instrumento
La confiabilidad tiene que ver con la exactitud y precisión del procedimiento de medición.
Los coeficientes de confiabilidad proporcionan una indicación de la extensión, en que una medida
es consistente y reproducible. La utilidad práctica está relacionada con factores, tales como:
economía, conveniencia e interpretación para determinar si una prueba es práctica para usarla
ampliamente.
Se refiere al grado en que su aplicación repetida al mismo sujeto u objeto produce iguales
resultados Silva (2009).
Según Rodríguez, 2006a y Krauss y Chen, 2003) citado por Hernández, et al (2014, p. 294),
En este procedimiento un mismo instrumento de medición se aplica dos o más veces a un mismo
grupo de personas o casos, después de cierto periodo. Si la correlación entre los resultados de las
diferentes aplicaciones es muy positiva, el instrumento se considera confiable.
Donde:
Ejemplo
Un grupo de 16 alumnos fue sometido en dos ocasiones a una misma prueba de resistencia física.
Los minutos que cada alumno logró durar en la ejecución de lo ejercicio solicitados se señalan en
la tabla. Determinar la confiabilidad de la estabilidad.
La confiabilidad test retest del instrumento empleando el coeficiente de correlación de Pearson se puede
efectuar manualmente o usando el software SPSS, cuya ruta es: Analiza> Correlacionar>
Bivariadas> correlación de Pearson.
El coeficiente de correlación de Pearson resultó 0,75; indica que la confiabilidad del instrumento es alta,
por lo tanto, es aplicable a la muestra de investigación.
En este esquema no se administra el mismo instrumento de medición, sino dos o más versiones
equivalentes de éste. Las versiones (casi siempre dos) son similares en contenido, instrucciones,
duración y otras características, y se administran a un mismo grupo de personas simultáneamente
o dentro de un periodo corto. El instrumento es confiable si la correlación entre los resultados de
ambas administraciones es positiva de manera significativa (Rodríguez, 2006b). Citado por
Hernández, et al (2014, p. 294),
Ejemplo
En este caso se hará la confiabilidad con el método de paralelas, siempre usando SPSS.
La confiabilidad del instrumento mediante el método de las paralelas resultó 0,97; en este caso
estamos considerando fiabilidad de escala sin sesgo. Por lo tanto, el instruemnto tiene alta
confiabilidad.
a) Coeficiente de Pearson:
𝑟(∑ 𝑟𝑟) − (∑ 𝑟)(∑ 𝑟)
𝑟𝑟𝑟 =
2 2
√[𝑟 ∑ 𝑟2 − (∑ 𝑟) ] [𝑟 ∑ 𝑟2 − (∑ 𝑟) ]
2 ∙ 𝑟𝑟𝑟
𝑟𝑟𝑟 =
1 + 𝑟𝑟𝑟
∑ (𝑟𝑟 ∙ 𝑟𝑟 )
Correlación entre mitades (𝑟𝑟𝑟 ): 𝑟𝑟𝑟 = 𝑟
Determinación de Z:
2
𝑟− 𝑟 ∑ 𝑟2 ∑ 𝑟
𝑟= Donde: X = cada una de las puntuaciones 𝑟 = √ − ( )
𝑟 𝑟 𝑟
𝑟 = promedio de puntuaciones
𝜎 = desviación estándar
c) Coeficiente de Rulón
𝑟2𝑟
𝑟𝑟𝑟 = 1 −
𝑟2𝑟
Donde:
𝑟𝑟𝑟 : Coeficiente de confiabilidad
𝑟2𝑟 : Varianza de la diferencia entre las puntuaciones de las mitades
𝑟2𝑟 : Varianza de las puntuaciones del test total
d) Coeficiente de Guttman
𝑟2𝑟 + 𝑟2𝑟
𝑟𝑟𝑟 = 2 [1 − ]
𝑟2𝑟
Donde:
𝑟𝑟𝑟 : Coeficiente de confiabilidad
𝑟2𝑟 : Varianza de las puntuaciones de los ítems pares
𝑟2𝑟 : Varianza de las puntuaciones de los ítems impares
𝑟2𝑟 : Varianza de las puntuaciones del test total
Ejemplo: la base de datos en la tabla adjunta, corresponde a los resultados del post prueba de 50 ítems; el
código 0 indica respuesta incorrecta y el código 1 indica respuesta correcta, efectuamos la prueba
de confiabilidad con la prueba de dos mitades.
Tabla
Resumen de procesamiento de casos
N %
Casos Válido 10 100,0
a
Excluido 0 ,0
Total 10 100,0
a. La eliminación por lista se basa en todas
las variables del procedimiento.
Tabla
Estadísticos de fiabilidad
Como cada parte tiene igual cantidad de ítems, para el análisis de la prueba de confiablidad con dos
mitades se tomará en cuenta el coeficiente de igual longitud, en este caso resultó 0,940; esto
significa que el instrumento tiene alta confiablidad; por lo tanto, es aplicable a la muestra de
estudio.
Miden la homogeneidad de los ítems. Requiere una sola administración del instrumento
de medición. No necesita dividir los ítems del instrumento. Se aplica la medición y se calcula el
coeficiente de confiabilidad, Hernández, et al (2014). Para obtener el coeficiente se emplea:
a) Alfa de Cronbach. Se usa cuando los ítems tienen alternativas policotómicas como las
escalas Likert; la cual puede tomar valores entre 0 y 1, donde 0 significa confiablidad nula y 1
representa confiabilidad total, el coeficiente 𝛼 de Cronbach se puede calcular con la siguiente
fórmula:
𝑟 ∑ 𝑟𝑟 2
𝑟= (1 − )
𝑟−1 𝑟𝑟 2
Si2 = varianza de las puntuaciones en cada ítem por todos los examinados.
St2 = varianza total de las puntuaciones de filas de todos los examinados.
K = número de ítems
Resumen de procesamiento de
casos
N %
Casos Válido 12 100,0
Excluidoa 0 ,0
Total 12 100,0
a. La eliminación por lista se basa en todas las
variables del procedimiento.
Estadísticas de fiabilidad
Alfa de
Cronbach N de elementos
,882 20
𝑟 𝑟2𝑟 − ∑ 𝑟𝑟
𝑟𝑟20 = ∗
𝑟−1 𝑟2𝑟
Donde:
K: número de ítems
St2 = varianza total de las puntuaciones obtenidas por todos los examinados.
Se debe de tener en cuenta, que si bien, el enfoque cualitativo se basa en métodos de recolección
de datos no estandarizados ni predeterminados completamente, tal recolección consiste en obtener
las perspectivas y puntos de vista de los participantes (sus emociones, prioridades, experiencias,
significados y otros aspectos más bien subjetivos). También resultan de interés las interacciones
entre individuos, grupos y colectividades. El investigador hace preguntas más abiertas, recaba datos
expresados a través del lenguaje escrito, verbal y no verbal, así como visual, los cuales describe,
analiza y convierte en temas que vincula, y reconoce sus tendencias personales. Debido a ello, la
preocupación directa del investigador se concentra en las vivencias de los participantes tal como
fueron (o son) sentidas y experimentadas (Sherman y Webb, 1988). Patton (2011) define los datos
cualitativos como descripciones detalladas de situaciones, eventos, personas, interacciones,
conductas observadas y sus manifestaciones.
En este contexto Hernández, S., Fernández, C., & Baptista, L. (2014) señalan que el investigador
cualitativo utiliza técnicas para recolectar datos, como la observación no estructurada, entrevistas
abiertas, revisión de documentos, discusión en grupo, evaluación de experiencias personales,
registro de historias de vida, e interacción e introspección con grupos o comunidades, los cuales
deberán seguir los mismos procedimiento descritos anteriormente para obtener su confiabilidad y
validez (pág. 9).
Ténganse en cuenta finalmente que el proceso de indagación es más flexible y se mueve entre las
respuestas y el desarrollo de la teoría. Su propósito consiste en “reconstruir” la realidad, tal como
la observan los actores de un sistema social definido previamente. Es holístico, porque se precia de
considerar el “todo” sin reducirlo al estudio de sus partes.
Referencias
Bostwick, G.J. y Kyte, N.S. (2005). Measurement. En Grinell, R.M. y Unrau, Y.A.
(Eds.). Social work: Research and evaluation. Quantitative and qualitative approaches
(7ª ed., pp.97-111). Nueva York: Oxford University Press
Sherman, R. R., & Webb, R. B. (1988). Qualitative research in education: A focus. Qualitative
research in education: Focus and methods, 2-21.