Documente Academic
Documente Profesional
Documente Cultură
MARCO TEÓRICO
Factores culturales
Uno de los aspectos importantes en la construcción de pruebas, cuestionarios,
baterías, test psicométricos, es la cultura, como el lugar donde este es originado o
creado, como también cualquier lugar diferente donde este se desea aplicar.
Comprender la variación de la conducta humana en función de los factores biológicos,
ecológicos, sociales, económicos, institucionales y políticos que la condicionan. La
cultura es, desde este punto de vista, el resultado de la variación conjunta de estos
factores, generando las condiciones concretas para el desarrollo de cada grupo humano.
Por lo tanto, por su efecto modulador, la cultura constituye el principal factor contextual
para la comprensión de la conducta (Pepitone y Triandis, 1987). Partiendo de aquí, de
la importancia de los factores culturales, se vuelve un reto diseñar y construir test,
escalas, protocolos y pruebas psicométricas que midan variables psicológicas.
Los test constituyen uno de los instrumentos de medida utilizados por los
psicólogos en el ejercicio de la profesión. Como cualquier otro instrumento de medida,
en otras áreas científicas, los test pueden utilizarse de forma correcta o incorrecta, donde
con frecuencia están implicadas decisiones de gran importancia para la vida de las
personas. La mayoría de los problemas en torno a los test, proviene de su uso
inadecuado, más que del test. Y este uso inadecuado es el responsable de muchas de las
críticas que reciben los test, cuestionarios y escalas psicológicas. Pero en realidad los
test siguen siendo un instrumento imprescindible. Los test deben adaptarse
cuidadosamente en función de las diferencias interculturales entre el idioma, cultura
originaria y aquellos en los que se pretende utilizar. Traducir un test, no es una cuestión
de saber dos idiomas. Es algo más complejo, por tanto más que traducción habría que
hablar de adaptación. (Vallo Ruiz, Iñigo. 2010. Pág. 10.)
Estándar 6.2. Cuando se hacen cambios sustanciales en el formato del test, modo
de aplicación, instrucciones, idioma o contenido, el test debe revalidarse para las nuevas
condiciones, o tener argumentos que apoyen que no es necesaria o posible una
validación adicional.
Estándar 13.6. Cuando se pretende que las dos versiones de un test en idiomas
distintos sean comparables, hay que aportar pruebas acerca de la compatibilidad de los
test.
Estos estándares, proporcionan un marco para analizar las fuentes de error o
invalidez, que pueden surgir en la adaptación y pueden organizarse en varias categorías
como son, por un lado las diferencias culturales y de idioma, los aspectos técnicos y
métodos y por último, la interpretación de los resultados. Esta es la razón fundamental
por la que la Comisión Internacional de Tests, se planteó la tarea de elaborar un
documento técnico al respecto, donde hay cuatro (4) grandes áreas implicadas en la
confección de un test, en las cuales se pueden tomar decisiones erróneas como son
(Tomado de Vallo Ruiz, Iñigo. 2010):
1. Contexto: Se refiere al ámbito sociocultural en el que están enmarcadas las
personas a las que se aplicará el test. La mayoría de los constructos utilizados en
Psicología son altamente dependientes de los aspectos culturales, por tanto, lo primero
de lo que hay que cerciorase es que el constructo a evaluar es equiparable en ambas
culturas. Si no se da esa equivalencia razonable carece de sentido la adaptación.
2. Construcción y adaptación: La filosofía general que ha de guiar la adaptación,
es que el test mida el mismo constructo de la misma forma, pero ajustándose a las
peculiaridades de la nueva población.
3. Aplicación: En general, interpretar los resultados de cualquier test, requiere
un psicólogo especialista en el área del test, con la formación psicométrica apropiada. Y
esto sigue siendo válido cuando el test, proviene de una adaptación. Lo que ocurre es
que con los tests adaptados hay un peligro adicional, a saber, la tentación de comparar
grupos o países en el test y establecer una clasificación de ganadores y perdedores.
Como señalan algunos autores (Hambleton y Bollwark, 1991; Wesbury, 1992), los
estudios comparativos deberían de usarse para comprender las semejanzas y diferencias
entre los grupos analizados, pero nunca para establecer comparaciones sin más. Además
de que hay una cantidad de factores tanto personales y socioculturales que afecta estas
pruebas como puede ser: como la motivación a la hora de hacer las pruebas, curricula
escolares, valores culturales, nivel de vida, políticas educativas, oportunidades de
acceso a la educación, etc.
Propiedades Psicométricas de un Inventario De Ansiedad.
Por otro lado, existen dos grandes teorías que sustentan la ciencia psicológica la
Teoría Clásica de los Test (TCT) y la Teoría de Respuesta al Item (TRI), sin embargo
para efectos de la presente investigación se profundizará solo en la primera de estas
teorías.
Así, para tener un acercamiento sobre el concepto de los Test, Muñiz en el
2010 establece que estos:
“Son muestras de conducta que permiten llevar a cabo inferencias relevantes
sobre la conducta de las personas. Bien utilizados son herramientas claves en la
profesión del psicólogo. Los tests nacen con un afán de objetividad y justicia, para
evaluar a las personas por lo que realmente valen, evitando evaluaciones sesgadas por
aspectos tales como la clase social, la raza, el sexo, las creencias y otros sistemas de
evaluación subjetivos. Unas veces estos nobles fines se han alcanzado mejor que otras,
pero ésa era y sigue siendo la idea central, evaluar a todos por el mismo rasero”
Pero surge la pregunta ¿Por qué hacen falta teorías de los test? para lo que
Muñiz en el 2010, establece que:
“Los test son instrumentos de medida sofisticados mediante los cuales los
psicólogos llevan a cabo inferencias y toman decisiones sobre aspectos importantes de
las personas. Por tanto hay que asegurarse de que esas inferencias son adecuadas y
pertinentes, de lo contrario se puede perjudicar notablemente a las personas que
acuden a los psicólogos por la razón que sea. Las teorías estadísticas de los test van a
permitir la estimación de las propiedades psicométricas de los test para de ese modo
garantizar que las decisiones tomadas a partir de ellos son las adecuadas”
Los test poseen todo un recorrido histórico que tiene sus orígenes en las pruebas
que los emperadores chinos hacían por el año 3000 antes de Cristo para evaluar la
competencia profesional de los oficiales que iban a entrar a su servicio. Pero los test
actuales tienen sus orígenes en las pruebas senso-motoras utilizadas por Galton en su
laboratorio antropométrico, sin embargo fue James McKeen Cattell (1860-1944) el
primero en utilizar el término test mental, en 1890, estos primeros test senso-motores no
eran buenos predictores de las capacidades cognoscitivas de las personas por lo que
Binet y Simon en 1905, dieron un giro radical al introducir en su nueva escala tareas
cognoscitivas para evaluar aspectos como el juicio, la comprensión y el razonamiento.
Propiedades Psicométricas de un Inventario De Ansiedad.
“Otro impulso importante de los tests fue la aparición de los test colectivos Alfa
y Beta en 1917 a raíz de la necesidad del ejército norteamericano de reclutar
rápidamente soldados para la primera guerra mundial. El test Alfa iba dirigido a la
población general y el Beta a personas analfabetas o que no dominaban el inglés. Las
pruebas tuvieron éxito y terminada la guerra las empresas y otras instituciones
adoptaron de forma entusiasta el uso de los test para distintos fines” (Muñiz, 2010).
El modelo teórico de la teoría clásica de los test (TCT) parte de la siguiente
ecuación:
X=V+e
En donde, los puntajes observados (X) son una combinación lineal de los
puntajes verdaderos (V) y el error (e).Este modelo fue postulado en 1904 por Charles
Spearman y durante un amplio periodo fue el único modelo de medición que respaldaba
los procesos psicométricos hasta las primeras ampliaciones de Cronbach y otros en los
años 50 (Teoría de la Generaliabilidad) y los aportes independientes de Lord y Rasch en
los años 60 (Teoría de Respuesta al Ítem y Análisis Rasch).
“La TCT ha sido durante gran parte del siglo XX, el modelo estrella en el que se
ha fundamentado la medida psicológica y educativa a través de test” (Gómez-Benito &
Hidalgo, 2003).
Es importante que los instrumentos sean confiables. Los test son utilizados en
diversas áreas y en todos los casos, quien lo utiliza supone que el mismo mide con
precisión determinado atributo, éste es el sentido de su aplicación. Pero si el
instrumento es poco confiable y se le usara por ejemplo, para una investigación, podría
ocurrir, de no cumplirse las hipótesis planteadas, que tal error sea producto no de las
mismas hipótesis, sino de instrumentos de medición erróneos, poco confiables. Así
mismo si hubiera que tomar decisiones respecto de un caso individual y como parte de
los elementos de juicio se utilizara un test, el riesgo de tomar una decisión equivocada,
se vería incrementado por la poca confiabilidad del instrumento.
inventario estén midiendo lo mismo, es decir, que sus distintos ítems correlacionen
entre sí.
“Es importante destacar que el concepto de consistencia interna se diferencia
de la homogeneidad en cuanto a que esta última se refiere específicamente a la
unidimensionalidad y no al grado de interrelación entre los ítems. La consistencia
interna, es una condición necesaria pero no suficiente para la homogeneidad. Un
conjunto de ítems pueden estar relativamente interrelacionados, pero ser al mismo
tiempo multidimensionales” (Cortina, J. 1993).
El coeficiente alpha ponderado: “se usa cuando una escala tiene ítems con
diferentes tipos de respuesta. Se le proporciona un peso a cada discrepancia y se
supone los ítems están igualmente ponderados y se realiza una sumatoria de los valores
de alpha ponderados para cada ítems” (Campo A., 2005).
“El valor mínimo aceptable para el coeficiente alpha de cronbach es 0,70 por
debajo de este valor la consistencia interna del instrumento es baja, por su parte el
valor máximo esperado es 0,90 por encima de ese valor se considera que hay
redundancia o duplicación, es decir, varios ítems están midiendo exactamente el mismo
elemento de un constructo por tanto deben eliminarse aunque usualmente, se prefieren
valores de Alpha entre 0,80 y 0,90” (Campo A., 2005).
test en ítems pares e impares, pero puede dividirse en dos mitades cualesquiera. Cada
mitad debe tener el mismo número de ítems o muy parecido.
2. Si al dividir el instrumento en dos mitades se emparejaran los ítems según sus
contenidos de manera que cada mitad del test conste de ítems muy parecidos, se
obtendrá una estimación más alta y preferible de la fiabilidad.
3. Cuando la mitad (o casi la mitad) de los ítems son positivos y la otra mitad
son negativos (favorables o desfavorables al rasgo medido, con distinta clave de
corrección), es útil que las dos mitades estén compuestas una por los ítems positivos y
otra por los negativos. En este caso la correlación entre los dos tipos de ítems es muy
informativa en sí misma, aunque no se calcule después la fiabilidad por este
procedimiento.
Una correlación entre los dos subtests en torno a .50 o mayor indica suficiente
coherencia entre los dos tipos de ítems, y que no se manifiesta de modo apreciable la
aquiescencia o tendencia a mostrar acuerdo (o responder sí) a ítems que expresan ideas
contradictorias.
“La validez de un instrumento tiene que ver con las preguntas siguientes: ¿qué
miden los puntajes del test? y ¿qué predicen dichas puntuaciones?” (Guilford, 1954;
Nunnally, 1967; Anastasi, 1976; Magnusson, 1982).
Ebel (citado por Fuentes, 1989) establece que validez “…designa la coherencia
con que un conjunto de puntajes de una prueba miden aquello que deben medir” (p.
103). La validez se refiere al grado en que una prueba proporciona información que es
apropiada a la decisión que se toma”.
coincidencia desfavorable entre los jueces quedan excluidos del instrumento. c) Los
ítems que tengan una coincidencia parcial entre los jueces deben ser revisados,
reformulados o sustituidos, si es necesario, y nuevamente validados.
2. Método delphi: Este método fue creado en 1948 para obtener la opinión de
expertos de una manera sistemática. En un primer momento, cada experto responde de
manera individual y anónima a un cuestionario. Después se analizan las respuestas del
conjunto de expertos, se remite a cada uno la respuesta mediana obtenida, así como el
intervalo intercuartil para cada cuestión y se les pide que reconsideren su juicio anterior,
teniendo en cuenta estos datos.
3. Técnica de grupo nominal: El primer paso es reunir a los expertos (entre ocho
y diez personas) y pedirles que registren, individualmente y sin intercambiar opiniones,
sus propias puntuaciones y consideraciones respecto a las probabilidades de error para
cada una de las preguntas o tareas que se les detallan.
Después, cada experto expone a los demás las puntuaciones y principales
consideraciones registradas y al acabar esta ronda, se establecen las coincidencias del
grupo. Luego se realiza un debate de cada uno de los apartados de ésta. Finalmente,
cada experto, de manera individual y por escrito, puntúa y argumenta las probabilidades
de error para cada tarea/pregunta considerada.
4. Método del consenso grupal: Se reúne a los expertos en un lugar
determinado, se indica al grupo que su tarea consiste en lograr una estimación de la
pertinencia y otros aspectos relacionados con la elaboración de los ítems, que sea
satisfactoria para todos los expertos. Con estas instrucciones se maximizan los
intercambios de información y opiniones dentro del grupo de expertos. Este método,
como el anterior, también precisa que el grupo de expertos sea pequeño, se fomente la
libre expresión y se eviten las discusiones tensas y los sistemas de votación (Corral,
Yadira, 2009, pág. 228-247).
Para esta investigación el método utilizado es el Método de Agregados
Individuales. El instrumento fue presentado a tres expertos, los cuales evaluaron de
manea independiente tanto la relevancia y congruencia de los reactivos con su
respectivo contenido teórico, como también la claridad en la redacción de los ítems.
Toda la información fue suministrada a los jueces de manera escrita; Este documento
contenía los objetivos generales y específicos del sustento teórico del instrumento.
Luego de recibir la respuesta de los jueces, se analizaron sus valoraciones para escoger
Propiedades Psicométricas de un Inventario De Ansiedad.
los ítems o reactivos que iban a permanecer en el instrumentos pues cumplía con los
criterios del constructo principal.
El formato de evaluación suministrado a los jueces. (Ver Anexo 1).
Cronbach (1960), sugiere los siguientes pasos: a) Identificar las construcciones que
pudieran explicar la ejecución en el instrumento. b) Formulación de hipótesis
comprobables a partir de la teoría. c) Recopilación de los datos para probar las hipótesis
(Corral, Yadira, 2009, pág. 228-247).
Para que un instrumento mida el constructo o rasgo teórico que debe medir;
Requiere de la acumulación gradual de diversas fuentes de información. Referente a
esto Isabel M. Mikulic (2010), señala lo siguiente sobre esas fuentes:
1. Cambios en el desarrollo: la diferenciación por edad es un importante criterio
utilizado en la validación, una prueba validada con este criterio evolutivo mira
características conductuales que se incrementan con la edad en las condiciones existente
en el entorno en el que se estandarizó el instrumento. Como diferentes culturas pueden
estimular y fomentar el desarrollo de características conductuales disímiles, no puede
suponerse que el criterio de diferenciación por edad sea universal. Como cualquier otro
criterio está circunscrito por el contexto cultural particular del que fue derivado.
2. Correlaciones con otras pruebas: se citan las correlaciones entre una prueba
nueva y otros instrumentos similares como evidencia de que la nueva mide
aproximadamente la misma área de conducta que otras que llevan el mismo nombre.
Análisis factorial: Desarrollado como medio para identificar rasgos psicológicos. Es una
refinada técnica estadística para analizar las interrelaciones de los datos conductuales
y reducir el número de variables o categorías en cuyos términos puede describirse el
desempeño de cada individuo a un número relativamente pequeño de factores o rasgos
comunes. Una vez que los factores se han identificado, sirven para describir la
composición factorial de las pruebas. El análisis de factores es definido por Campo
Arias (2012) como “… una forma de las varias formas de estimar la validez de
constructo de un instrumento, de mostrar en forma matemática como la construcción
teórica de un concepto abstracto complejo se refleja en el patrón de respuesta de un
grupo poblacional”, es decir si el instrumento muestra las dimensiones que propone la
conceptualización teórica. El análisis de factores tiene como funcionalidad principal
discriminar que reactivos aportan más varianza al instrumento y así entrar en una fase
donde se decida qué puntos, que reactivos deben eliminarse o mantenerse y conservar
utilidad práctica; como lo expresa Campo Arias (2012) “El análisis de factores permite
explicar un número amplio de ítems que hacen parte de una escala con un número
Propiedades Psicométricas de un Inventario De Ansiedad.
otras variables con las que en teoría debe hacerlo, sino también que no tiene una
correlación significativa con variables de las que se supone debe diferir.
5. Modelamiento de ecuaciones estructurales: investigar cómo es que un
constructo o rasgo personal identificado conduce a un buen o mal desempeño
contribuye sustancialmente a la comprensión de por qué una prueba tiene una elevada o
baja validez en una situación dada. Facilita dicho análisis un procedimiento estadístico
conocido como modelamiento de ecuaciones estructurales que está relacionado con el
análisis de “paths”. Este modelamiento utiliza ecuaciones de regresión para predecir las
variables dependientes a partir de las independientes en los diseños de series de tiempos
u otros modelos causales.
Otros puntos a tener en cuenta en este proceso de validación es el coeficiente de
validez; el coeficiente de validez es la correlación entre la puntuación de la prueba y la
medida de criterio. Los datos empleados al calcular cualquier coeficiente de validez
también pueden expresarse como tablas o gráficos que muestran la probabilidad de que
un individuo que obtiene cierta puntuación en la prueba obtenga un nivel especificado
de desempeño en el de criterio.
Hay condiciones que afectan a los coeficientes de validez por lo cual resulta
esencial especificar la naturaleza del grupo en el que se calculó el coeficiente de
validez. La misma prueba puede medir diferentes funciones cuando se aplica a
individuos que difieren en características importantes (edad, género, nivel educativo,
ocupación, etc.). Existen otros puntos a tener en cuenta tales como: la heterogeneidad de
la muestra, la preselección o intencionalidad de la muestra, la diferente forma de
relación entre la prueba y el criterio, etc.
REFERENCIAS
Aiken, Lewis. 2003. Test psicológicos y evaluación. Undécima edición. México
Alvarado, Jesús M; Santisteban, Carmen. 2006. La Validez En La Medición
Psicológica. Ediciones UNED. Primera Edición. Madrid.
Argibay, Juan Carlos. 2006. Técnicas psicométricas. Cuestiones de Validez y
Confiabilidad.
Buela, Gualberto; Sierra, Juan C. 1997. Manual De Evaluación Psicológica;
Fundamentos, Técnicas Y Aplicación. España editores, S.A. (pág. 190) primer Edición.
España.
Campo Arias, Adalberto. Oviedo, Heidy. 2008. Propiedades psicométricas de
una escala. Consistencia interna. Instituto de Investigación del Comportamiento
Humano. Bogotá, Colombia.