MARCO TEÓRICO Shiley and Yucelis

Propiedades Psicométricas de un Inventario De Ansiedad.
MARCO TEÓRICO
Factores culturales
Uno de los aspectos importantes en la construcción de pruebas, cuestionarios,
baterías, test psicométricos, es la cultura, como el lugar donde este es originado o
creado, como también cualquier lugar diferente donde este se desea aplicar.
Comprender la variación de la conducta humana en función de los factores biológicos,
ecológicos, sociales, económicos, institucionales y políticos que la condicionan. La
cultura es, desde este punto de vista, el resultado de la variación conjunta de estos
factores, generando las condiciones concretas para el desarrollo de cada grupo humano.
Por lo tanto, por su efecto modulador, la cultura constituye el principal factor contextual
para la comprensión de la conducta (Pepitone y Triandis, 1987). Partiendo de aquí, de
la importancia de los factores culturales, se vuelve un reto diseñar y construir test,
escalas, protocolos y pruebas psicométricas que midan variables psicológicas.
Los test constituyen uno de los instrumentos de medida utilizados por los
psicólogos en el ejercicio de la profesión. Como cualquier otro instrumento de medida,
en otras áreas científicas, los test pueden utilizarse de forma correcta o incorrecta, donde
con frecuencia están implicadas decisiones de gran importancia para la vida de las
personas. La mayoría de los problemas en torno a los test, proviene de su uso
inadecuado, más que del test. Y este uso inadecuado es el responsable de muchas de las
críticas que reciben los test, cuestionarios y escalas psicológicas. Pero en realidad los
test siguen siendo un instrumento imprescindible. Los test deben adaptarse
cuidadosamente en función de las diferencias interculturales entre el idioma, cultura
originaria y aquellos en los que se pretende utilizar. Traducir un test, no es una cuestión
de saber dos idiomas. Es algo más complejo, por tanto más que traducción habría que
hablar de adaptación. (Vallo Ruiz, Iñigo. 2010. Pág. 10.)
Actualmente se reconoce que la adaptación de un Test es un proceso mucho más

complejo que la mera traducción de ese test en un idioma diferente. Una adaptación
implica considerar no sólo las palabras utilizadas al traducir la prueba sino también las
variables culturales involucradas. (Mikulic, Isabel M. 2010. pág. 41). Estas variables
culturales son la edad, el sexo, grado de escolarización, estrato socioeconómico, entre
otras, que afecta tanto los resultados obtenidos y sus interpretaciones con relación a una
prueba.
Los problemas relacionados con los factores socioculturales en el empleo y

estandarización de los test, son principalmente, problemas de lenguaje, de tiempo,
familiaridad con ciertos tipos de test, problemas de la aplicación y diferencias en las
actitudes hacia la medición mental y la selección de alumnos. Los problemas de
lenguaje son un impedimento muy importante para la traducción y adaptación de los
test. La primera dificultad se refiere al logro de una buena traducción para algunos
ítems. Algunas veces una traducción literal no logra el significado de una frase y una
traducción más libre puede añadir matices que no estaban en la intención del autor del
test (Cortada de Kohan Nuria, 1947, 1968). A pesar de esta diferencia, los lingüistas
consideran que cualquier concepto puede ser expresado en cualquier idioma. Pero un
determinado concepto puede ser más fácil de verbalizar en un idioma que en otro. El
estilo de pensamiento de una determinada cultura puede ser apreciada a través de sus
formas léxicas y sin tácticas, pero estas relaciones son muy sutiles y difícil de
establecer. (Locke, 1955. Tomado de (Cortada de Kohan Nuria, 1972). En una oración,
el significado depende de tres factores: 1) el significado lexicológico, esto es, las
categorías que las palabras de las frases señala; 2) el significado estructura, que depende
de las relaciones entre las palabras; y el 3) el significado extralingüístico, que depende
de las inferencias que puede ser extraídas cuando la frase está integrada en un
determinado contexto (Miller, 1964. Tomado de (Cortada de Kohan Nuria, 1972).
Las asociaciones americanas American ducational Research Asoociation

(AERA), America Psychological Association (APA) y Nacional in Meansurement in
Education (NCME), elaboraron en 1985, unas directrices para la selección, construcción
y aplicación de pruebas. Tres de los estándares son especialmente relevantes en el
contexto de la aplicación y el uso:
Estándar 6.2. Cuando se hacen cambios sustanciales en el formato del test, modo
de aplicación, instrucciones, idioma o contenido, el test debe revalidarse para las nuevas
condiciones, o tener argumentos que apoyen que no es necesaria o posible una
validación adicional.
Estándar 13.4. Cuando se traduce un test de un idioma o dialecto a otro, debe de

establecer su fiabilidad y validez en los nuevos grupos lingüísticos a los que se aplique.
Estándar 13.6. Cuando se pretende que las dos versiones de un test en idiomas
distintos sean comparables, hay que aportar pruebas acerca de la compatibilidad de los
test.
Estos estándares, proporcionan un marco para analizar las fuentes de error o
invalidez, que pueden surgir en la adaptación y pueden organizarse en varias categorías
como son, por un lado las diferencias culturales y de idioma, los aspectos técnicos y
métodos y por último, la interpretación de los resultados. Esta es la razón fundamental
por la que la Comisión Internacional de Tests, se planteó la tarea de elaborar un
documento técnico al respecto, donde hay cuatro (4) grandes áreas implicadas en la
confección de un test, en las cuales se pueden tomar decisiones erróneas como son
(Tomado de Vallo Ruiz, Iñigo. 2010):
1. Contexto: Se refiere al ámbito sociocultural en el que están enmarcadas las
personas a las que se aplicará el test. La mayoría de los constructos utilizados en
Psicología son altamente dependientes de los aspectos culturales, por tanto, lo primero
de lo que hay que cerciorase es que el constructo a evaluar es equiparable en ambas
culturas. Si no se da esa equivalencia razonable carece de sentido la adaptación.
2. Construcción y adaptación: La filosofía general que ha de guiar la adaptación,
es que el test mida el mismo constructo de la misma forma, pero ajustándose a las
peculiaridades de la nueva población.
3. Aplicación: En general, interpretar los resultados de cualquier test, requiere
un psicólogo especialista en el área del test, con la formación psicométrica apropiada. Y
esto sigue siendo válido cuando el test, proviene de una adaptación. Lo que ocurre es
que con los tests adaptados hay un peligro adicional, a saber, la tentación de comparar
grupos o países en el test y establecer una clasificación de ganadores y perdedores.
Como señalan algunos autores (Hambleton y Bollwark, 1991; Wesbury, 1992), los
estudios comparativos deberían de usarse para comprender las semejanzas y diferencias
entre los grupos analizados, pero nunca para establecer comparaciones sin más. Además
de que hay una cantidad de factores tanto personales y socioculturales que afecta estas
pruebas como puede ser: como la motivación a la hora de hacer las pruebas, curricula
escolares, valores culturales, nivel de vida, políticas educativas, oportunidades de
acceso a la educación, etc.
Teoría clásica de los test
Por otro lado, existen dos grandes teorías que sustentan la ciencia psicológica la
Teoría Clásica de los Test (TCT) y la Teoría de Respuesta al Item (TRI), sin embargo
para efectos de la presente investigación se profundizará solo en la primera de estas
teorías.
Así, para tener un acercamiento sobre el concepto de los Test, Muñiz en el
2010 establece que estos:
“Son muestras de conducta que permiten llevar a cabo inferencias relevantes
sobre la conducta de las personas. Bien utilizados son herramientas claves en la
profesión del psicólogo. Los tests nacen con un afán de objetividad y justicia, para
evaluar a las personas por lo que realmente valen, evitando evaluaciones sesgadas por
aspectos tales como la clase social, la raza, el sexo, las creencias y otros sistemas de
evaluación subjetivos. Unas veces estos nobles fines se han alcanzado mejor que otras,
pero ésa era y sigue siendo la idea central, evaluar a todos por el mismo rasero”
Pero surge la pregunta ¿Por qué hacen falta teorías de los test? para lo que
Muñiz en el 2010, establece que:
“Los test son instrumentos de medida sofisticados mediante los cuales los
psicólogos llevan a cabo inferencias y toman decisiones sobre aspectos importantes de
las personas. Por tanto hay que asegurarse de que esas inferencias son adecuadas y
pertinentes, de lo contrario se puede perjudicar notablemente a las personas que
acuden a los psicólogos por la razón que sea. Las teorías estadísticas de los test van a
permitir la estimación de las propiedades psicométricas de los test para de ese modo
garantizar que las decisiones tomadas a partir de ellos son las adecuadas”
Los test poseen todo un recorrido histórico que tiene sus orígenes en las pruebas
que los emperadores chinos hacían por el año 3000 antes de Cristo para evaluar la
competencia profesional de los oficiales que iban a entrar a su servicio. Pero los test
actuales tienen sus orígenes en las pruebas senso-motoras utilizadas por Galton en su
laboratorio antropométrico, sin embargo fue James McKeen Cattell (1860-1944) el
primero en utilizar el término test mental, en 1890, estos primeros test senso-motores no
eran buenos predictores de las capacidades cognoscitivas de las personas por lo que
Binet y Simon en 1905, dieron un giro radical al introducir en su nueva escala tareas
cognoscitivas para evaluar aspectos como el juicio, la comprensión y el razonamiento.
En el año de 1016 Terman llevó a cabo la revisión de esta escala en la Universidad de

Stanford, la cual se conoce como la revisión Stanford-Binet utilizando por primera vez
el concepto de Cociente Intelectual (CI) para expresar la puntuación de las personas.
“Otro impulso importante de los tests fue la aparición de los test colectivos Alfa
y Beta en 1917 a raíz de la necesidad del ejército norteamericano de reclutar
rápidamente soldados para la primera guerra mundial. El test Alfa iba dirigido a la
población general y el Beta a personas analfabetas o que no dominaban el inglés. Las
pruebas tuvieron éxito y terminada la guerra las empresas y otras instituciones
adoptaron de forma entusiasta el uso de los test para distintos fines” (Muñiz, 2010).
El modelo teórico de la teoría clásica de los test (TCT) parte de la siguiente
ecuación:
X=V+e
En donde, los puntajes observados (X) son una combinación lineal de los
puntajes verdaderos (V) y el error (e).Este modelo fue postulado en 1904 por Charles
Spearman y durante un amplio periodo fue el único modelo de medición que respaldaba
los procesos psicométricos hasta las primeras ampliaciones de Cronbach y otros en los
años 50 (Teoría de la Generaliabilidad) y los aportes independientes de Lord y Rasch en
los años 60 (Teoría de Respuesta al Ítem y Análisis Rasch).
“La TCT ha sido durante gran parte del siglo XX, el modelo estrella en el que se
ha fundamentado la medida psicológica y educativa a través de test” (Gómez-Benito &
Hidalgo, 2003).
Así, Los trabajos pioneros de Spearman a principios del siglo XX establecieron

las bases de esta teoría que se desarrolla bajo tres fundamentos: a) Reconocimiento de la
presencia de errores en la medida; b) la concepción de que el error de medida es una
variable aleatoria; c) la idea de correlación entre variables y de un coeficiente para
expresarla, junto al desarrollo de la distribución normal bivariada.
Gómez-Benito & Hidalgo en el 2003 establecen que, a pesar de su simplicidad y

fácil adaptación a diversos campos de la Psicología, la TCT ha recibido críticas
referidas tanto a los conceptos que maneja como a los supuestos en los que se
fundamenta, resumidas por de la siguiente forma: a) La definición de test paralelos es
muy restrictiva; b) Homoscedasticidad de los errores de medida (constancia en la
variable de los errores); c) Dependencia muestral de las propiedades psicométricas de
los test; d) Dependencia muestral de las características de los ítems; e) Dependencia de

X (puntuación observada) de la longitud del test.
En definitiva, cualquiera que sea el constructo psicológico que se pretenda medir

es necesario poseer la claridad sobre los fundamentos que rigen la construcción de ítems
que redunde positivamente, tanto en la exploración psicométrica como en una precisa y
rigurosa evaluación del constructo a medir.
La exploración psicométrica de las propiedades que caracterizan el diseño del

inventario se establecerán a través de los múltiples criterios técnicos que permiten
estimar la solidez psicométrica del inventario, estos criterios son: confiabilidad, validez
y los estándares internacionales para la construcción de una prueba.
En cuanto a la Confiabilidad es uno de los aspectos centrales en la TCT, para la

cual algunos autores desde esta postura han dado definiciones significativas como: “La
confiabilidad hace referencia a la propiedad del test para mostrar resultados similares
libre de error, en repetidas mediciones” (Kaplan, R. 2006. Citado por Campo, A;
Oviedo, H. 2008) “se entiende por confiabilidad el grado de estabilidad, precisión o
consistencia que manifiesta el test como instrumento de medición de un rasgo
determinado” (Ponsada, 2006) o como establece Martínez Arias (1996) “la
confiabilidad es la consistencia en un conjunto de medidas de un atributo” y de forma
muy clara Rodríguez & Lopera (2002) establecen que “Una medición es muy precisa
cuando presenta prácticamente el mismo valor cada vez que se mide, esta precisión en
mediciones sucesivas se conoce como confiabilidad”.
Sin embargo, es necesario considerar la postura de Streiner, D. (2003) quien

establece que: “no existe un test confiable o no confiable, la confiabilidad es una
propiedad de las puntuaciones que obtiene una población examinada en un test”. De
ahí, “la recomendación de explorar las propiedades psicométricas siempre que se vaya
a hacer uso del instrumento” (Cronbach, L. 1951).
De esta forma medir la confiabilidad o precisión de los instrumentos de medida

en Psicología, es uno de los problemas asociados a las escalas de medida que merecen
atención ya que si una prueba psicométrica no es confiable en su medición, su
inconsistencia repercutirá no solo en la validez del instrumento sino en todos los
procesos en el cual se relaciona y es labor de la psicometría establecer el grado de

estabilidad del instrumento de medición.
Es importante que los instrumentos sean confiables. Los test son utilizados en
diversas áreas y en todos los casos, quien lo utiliza supone que el mismo mide con
precisión determinado atributo, éste es el sentido de su aplicación. Pero si el
instrumento es poco confiable y se le usara por ejemplo, para una investigación, podría
ocurrir, de no cumplirse las hipótesis planteadas, que tal error sea producto no de las
mismas hipótesis, sino de instrumentos de medición erróneos, poco confiables. Así
mismo si hubiera que tomar decisiones respecto de un caso individual y como parte de
los elementos de juicio se utilizara un test, el riesgo de tomar una decisión equivocada,
se vería incrementado por la poca confiabilidad del instrumento.
De esta forma si un instrumento es poco confiable está midiendo, a parte del

atributo que pretende medir, diversas variables que son fuente de errores aleatorios, lo
cual distorsionaría la medición de la variable de interés. Ya que como sugieren Polit y
Hungler (1995/1997) citado por Argibay en 2009 “si el instrumento es errático,
inconsistente e impreciso difícilmente pueda medir con validez el atributo en cuestión”.
Existen tres formas básicas de medir la confiabilidad y todas buscan determinar

la proporción de la varianza en una escala a) estabilidad temporal; b) equivalencia; c)
consistencia interna.
La primera hace alusión a la estabilidad temporal, puesto que al hablar de la

estabilidad de un instrumento se debe contemplar el factor tiempo y observar en qué
grado se obtienen las mismas medidas al aplicar dos veces el mismo instrumento,
mediando entre ambas tomas un tiempo determinado. Ya que entre las aplicaciones
pueden intervenir una serie de factores que pueden ser fuentes de varianza de error,
disminuyendo la confiabilidad de las medidas, de esta forma al obtener determinadas
puntuaciones de N personas en un test y después de transcurrido un tiempo, se vuelve a
medir a las mismas personas en el mismo test, cabe suponer que siendo el test fiable, se
debería obtener una correlación de Pearson significativa entre ambos mediciones.
Dicha correlación entre la evaluación test y la evaluación retest se denomina coeficiente
de fiabilidad test-retest, e indicará tanta mayor estabilidad temporal de la prueba cuanto
más cercano a 1 sea. Cabe resaltar que Argibay (2006), establece que hay varias
cuestiones que podrían afectar la confiabilidad en estos estudios test-retest como:
1. Modificaciones en la actitud de los sujetos respecto de la prueba o cambios en la

información que éstos manejen pueden afectar los puntajes de la segunda toma del test,
incidiendo sobre los valores de correlación, ya sea incrementando artificialmente la
confiabilidad o infravalorándola.
2. Puede haber efectos derivados de la primera aplicación del test que afecten el
rendimiento en el segundo. Por ejemplo, que algunos sujetos recuerden las respuestas y
al contestar el segundo test tiendan a poner las mismas respuestas, no tanto porque se
correspondan con su perfil en el atributo que se mide, sino por contestarlo igual.
También en tests que midan aptitudes o destrezas los sujetos pueden ver condicionado
su rendimiento por la práctica previa.
3. Un tema de fundamental importancia es el lapso que medie entre ambas tomas.
Un lapso demasiado breve podría incrementar el efecto distorsivo de la memoria y la
práctica. Si bien esto se solucionaría incrementando el tiempo, esto a su vez produciría
otro problema, la aparición de variables relacionadas con: a) la maduración, que según
define Arnau Gras (1982), “abarca el conjunto de procesos biológicos y psicológicos
que se operan en los sujetos como consecuencia del paso del tiempo”. Suele ser mucho
más relevante si los sujetos son niños, ya que en ellos se pueden esperar cambios
pronunciados en lapsos de tiempo breve b) la historia, incluye todos aquellos eventos
que pudieran tener lugar en el lapso que medie entre ambas aplicaciones y que podrían
llegar a afectar el resultado de la segunda prueba.
En cuanto a la equivalencia que se aplica cuando se quiere determinar la

confiabilidad de dos instrumentos que se consideran paralelos. Polit & Hungler
(1995/1997) retomados por Argibay (2009) establece que “Se trata de poder establecer
la consistencia o equivalencia de los instrumentos, que suponen medir el mismo
constructo, al aplicarlos a los mismos sujetos”. A veces ambas formas no se aplican
simultáneamente, sino que se deja transcurrir un tiempo entre ambas, de manera que la
correlación que se obtiene sirve tanto para estimar la equivalencia como la estabilidad
de las dos formas para medir el atributo (Argibay, 2009).
El tercer aspecto a considerar en el análisis de la confiabilidad y que más se

tendrá en cuenta en la presente investigación, en la cual el constructo a indagar será la
ansiedad basada en una perspectiva humanista existencial y enfocada a una población
joven, es la consistencia interna que consiste en que las partes que componen el
inventario estén midiendo lo mismo, es decir, que sus distintos ítems correlacionen
entre sí.
“Es importante destacar que el concepto de consistencia interna se diferencia
de la homogeneidad en cuanto a que esta última se refiere específicamente a la
unidimensionalidad y no al grado de interrelación entre los ítems. La consistencia
interna, es una condición necesaria pero no suficiente para la homogeneidad. Un
conjunto de ítems pueden estar relativamente interrelacionados, pero ser al mismo
tiempo multidimensionales” (Cortina, J. 1993).
Existen procedimientos que nos permiten determinar el grado de consistencia

interna dentro de un instrumento como como a) Alpha de Cronbach; b) Dos mitades; c)
kuder-Richardson.
El coeficiente Alpha de Cronbach es la fórmula más usada y corresponde al

“índice usado para medir la confiabilidad del tipo consistencia interna de una escala,
es decir, para evaluar la magnitud en la que los ítems de un instrumento están
correlacionados” (Campo A., 2005). El coeficiente alpha de cronbach se puede
considerar entonces como la correlación que existe entre los distintos ítems que hacen
parte del instrumento. Su popularización se debe a la practicidad de su uso ya que
requiere una sola administración de la prueba.
Así mismo se pueden establecer diferentes tipos de coeficiente Alpha de

Cronbach:
El coeficiente alpha estratificado: “una manera de mejorar el valor del
coeficiente de consistencia interna cuando las escalas tienen varios dominios es
estratificarla en sub-escalas dependiendo del contenido, de esta forma se puede hallar
un mejor estimado de la consistencia interna” (Campo A., 2005).
El coeficiente alpha ponderado: “se usa cuando una escala tiene ítems con
diferentes tipos de respuesta. Se le proporciona un peso a cada discrepancia y se
supone los ítems están igualmente ponderados y se realiza una sumatoria de los valores
de alpha ponderados para cada ítems” (Campo A., 2005).
Para la interpretación de coeficiente Alpha de Cronbach se siguen los siguientes

parámetros:
“El valor mínimo aceptable para el coeficiente alpha de cronbach es 0,70 por
debajo de este valor la consistencia interna del instrumento es baja, por su parte el
valor máximo esperado es 0,90 por encima de ese valor se considera que hay
redundancia o duplicación, es decir, varios ítems están midiendo exactamente el mismo
elemento de un constructo por tanto deben eliminarse aunque usualmente, se prefieren
valores de Alpha entre 0,80 y 0,90” (Campo A., 2005).
Como establece Campo Arias (2005) el coeficiente Alpha de Cronbach es la

forma más sencilla y conocida de medir la consistencia interna y es la primera
aproximación a la validación del constructo de un instrumento. Sin embargo, es
necesario tener en cuenta que el valor de Alpha es afectado directamente por el número
de ítems que componen el instrumento pues es más fidedigno cuando se calcula a una
escala de veinte ítems o menos ya que las escalas mayores que miden un solo constructo
pueden dar la falsa impresión de una alta consistencia interna cuando realmente no la
poseen.
El coeficiente Alpha resulta útil cuando se usa para determinar la consistencia

interna de una prueba con un único dominio o dimensión ya que si se usa en
instrumentos con ítems que exploran dos o más dimensiones distintas, aunque hagan
parte de un mismo constructo, se corre el riesgo de subestimar la consistencia interna.
En estos casos lo más recomendable es calcular un valor de Alpha para cada grupo de
ítems que componen una dimensión o calcular un coeficiente Alpha estratificado lo cual
significa que este coeficiente se debe emplear para conocer la consistencia interna en
escalas unidimensionales y no en escalas multidimensionales.
Otra forma de medir la consistencia interna de un test es la aplicación de la

prueba de las dos mitades (Half Split) que consiste en “dividir el test en dos mitades
equivalentes, normalmente una con los elementos pares y otra con los impares, lo cual
garantiza su equivalencia” (Ponsada, 2006) en otras palabras se entiende como un
procedimiento que permite la expresión de la consistencia entre las dos mitades de un
instrumento.
Para la división del instrumento Morales (2007) aconseja que:
1. Como cualquier instrumento puede dividirse en muchas dos mitades, puede
haber muchos coeficientes distintos de fiabilidad. El resultado es sólo una estimación
que puede infravalorar o supervalorar la fiabilidad. Es habitual la práctica de dividir el
test en ítems pares e impares, pero puede dividirse en dos mitades cualesquiera. Cada
mitad debe tener el mismo número de ítems o muy parecido.
2. Si al dividir el instrumento en dos mitades se emparejaran los ítems según sus
contenidos de manera que cada mitad del test conste de ítems muy parecidos, se
obtendrá una estimación más alta y preferible de la fiabilidad.
3. Cuando la mitad (o casi la mitad) de los ítems son positivos y la otra mitad
son negativos (favorables o desfavorables al rasgo medido, con distinta clave de
corrección), es útil que las dos mitades estén compuestas una por los ítems positivos y
otra por los negativos. En este caso la correlación entre los dos tipos de ítems es muy
informativa en sí misma, aunque no se calcule después la fiabilidad por este
procedimiento.
Una correlación entre los dos subtests en torno a .50 o mayor indica suficiente
coherencia entre los dos tipos de ítems, y que no se manifiesta de modo apreciable la
aquiescencia o tendencia a mostrar acuerdo (o responder sí) a ítems que expresan ideas
contradictorias.
Finalmente, otra manera de medir la confiabilidad de tipo consistencia interna de

un instrumento y es el método kuder - Richardson, que según Corral (2009) “permite el
cálculo de la confiabilidad de un instrumento aplicable sólo a investigaciones en las
que las respuestas a cada ítem sean dicotómicas o binarias, es decir, puedan
codificarse como (1) ó (0)- (SI - No, Correcto – incorrecto, presente – ausente, a favor
– en contra, etc.), donde un coeficiente de 0 significa una confiabilidad nula y 1
representa un máximo de confiabilidad óptima (confiabilidad total)”.
En definitiva el método Kuder Richardson, se trata de la misma fórmula que el
Alpha de Cronbach solo que esta última es utilizada para ítems politomicos y Kuder
Richardson para ítems dicotómicos.
4. Interpretación de las puntuaciones: Finalmente, para interpretar las
puntuaciones el psicólogo debe de disponer de una documentación exhaustiva acerca de
cómo se llevó a cabo el proceso de adaptación. El manual del test deberá incluir todo
tipo de detalles del proceso adaptativo, que en determinadas circunstancias pueden dar
las claves interpretativas de un resultado.
Otro aspecto importante en la determinación de las propiedades psicométricas de
un test es la Validez.
La Validez está considerada como un requisito y aspecto fundamental para el

uso y aplicación de cualquier instrumento de medida psicométrico. El término validez
ha recibido varias conceptualizaciones alrededor del tiempo, algunas de las definiciones
más representativas al concepto de validez son:
“La validez es un proceso de acumulación de evidencias que justifiquen las
inferencias” (Messick, 1980).
“La validez de un instrumento tiene que ver con las preguntas siguientes: ¿qué
miden los puntajes del test? y ¿qué predicen dichas puntuaciones?” (Guilford, 1954;
Nunnally, 1967; Anastasi, 1976; Magnusson, 1982).
Ebel (citado por Fuentes, 1989) establece que validez “…designa la coherencia
con que un conjunto de puntajes de una prueba miden aquello que deben medir” (p.
103). La validez se refiere al grado en que una prueba proporciona información que es
apropiada a la decisión que se toma”.
“Validez es el grado en el que un instrumento mide aquello que dice medir. La

validez garantiza que medimos aquello que nos proponemos medir”… “La validación
hace referencia al proceso que permite ir depurando, delimitando y perfeccionando
cada vez más nuestro instrumento de medida” (Camacho & Sánchez, 1997).
Partiendo de estas definiciones se concluye lo siguiente: la validez indica el

grado de exactitud con que mide el constructo teórico que pretende medir y si se puede
utilizar con el fin previsto. Es decir, un test es válido si "mide lo que dice medir". Por
eso es importante saber a ciencia cierta qué rasgos o características se desean estudiar.
Al respecto, cuando se habla de validez, se debe tener en cuenta que es la cualidad más
importante de un instrumento de medida. Un instrumento puede ser fiable pero no
válido; pero si es válido ha de ser también fiable. Por lo tanto los instrumentos de
medición deben ser tanto validos como confiable. Valido aludiendo a la capacidad del
instrumento de medir el constructo que pretende cuantificar (Campo, A. 2008), en esta
investigación es la ansiedad desde la perspectiva humanista existencial.
Otro cambio observado en la evolución del concepto de la validez se refiere al

número y tipos de validez definidos. Ya en el año 1954, en los Standards, la APA
publica un manual con recomendaciones técnicas para el uso y diagnostico con test
psicológicos. En esta primera publicación se pretendía establecer algún orden en la
práctica de la construcción de test. La consecuencia que tuvo para la validez fueron

inmediatas ya que se delimitaron y denominaron los distintos tipos de validez que un
test debe incluir, de aquí se define los tres tipos de validez: validez referida al criterio,
validez de contenido y validez de constructo donde aparece por primera vez (AERA,
APA, NCME, 1985; Silva, 1989. Tomado de (Gómez & Dolores, 2005).
Validez predictiva o referida al criterio: Cuando se habla normalmente de la

palabra predicción o predictiva se asocia con visión o anticipación del futuro. En sentido
a esto, validez predictiva determinar hasta dónde se puede anticipar el desempeño futuro
de una persona en una actividad determinada.
Los procedimientos de validación de criterio-predicción indican la efectividad de

la prueba para predecir el desempeño del individuo en actividades específicas. La
medida de criterio contra la que se validan los resultados del instrumento puede
obtenerse aproximadamente al mismo tiempo que los resultados de la prueba o después
de un intervalo establecido. La validez predictiva se estudia comparando los puntajes de
un instrumento con una o más variables externas denominadas variables de criterio. Se
establece una correlación, la cual se interpreta como índice de validez (Corral, Yadira,
2009, pág. 228-247).
Este tipo de validez se refiere a la concordancia empírica del instrumento en

estudio, con otras técnicas que miden la misma característica en tres momentos del
tiempo: antes, durante y después de que el instrumento es aplicado (Rodríguez &
Jaramillo, 2002, pág. 37).
Por ejemplo; si se va realizar una investigación sobre “La ansiedad desde la

perspectiva humanista existencial: hacia una propuesta de medición”, Para este
propósito, interesa el grado en que el instrumento se correlaciona con algunos de los
criterios escogidos para medir, se tomaría el criterio procedente de una entrevista clínica
de “ansiedad definida por el humanismo”, y juzgamos el cuestionario elaborado en
términos de su relación con esa medida de criterio.
Por su parte la Validez De Contenido comprende el examen sistemático del

contenido de la prueba para determinar si cubre una muestra representativa del área de
conducta que debe medirse. El área de conducta por examinar debe analizarse
sistemáticamente para garantizar que los reactivos cubran todos los aspectos
importantes y en la proporción correcta. Básicamente se deben contestar dos preguntas:

a) ¿cubre la prueba una muestra representativa de las habilidades y conocimientos
especificados? b) ¿el desempeño en la prueba está razonablemente libre de la influencia
de variables irrelevantes? (Mikulic, Isabel M, 2010, pág. 16).
Por lo tanto un test tendrá validez de contenido si el conjunto de preguntas en él

incluidos constituye una muestra suficiente extensa y representativa del rasgo al que
hace referencia. (Buela, Gualberto & Sierra, Juan C. 1997).
Hay que considerar que, la validez de contenido no puede expresarse

cuantitativamente es más bien una cuestión de juicio, se estima de manera subjetiva o
intersubjetiva empleando, usualmente, el denominado Juicio de Expertos. Se recurre a
ella para conocer la probabilidad de error en la configuración del instrumento. Mediante
el juicio de expertos se pretende tener estimaciones razonablemente buenas, las mejores
conjeturas. Sin embargo, estas estimaciones pueden y deben ser confirmadas o
modificadas a lo largo del tiempo, según se vaya recopilando información. Los juicios
de expertos se pueden obtener por métodos grupales o por métodos de experto único. Se
pueden seguir, entre otros, el método de Agregados Individuales, el método Delphi, la
técnica de Grupo Nominal y el método de Consenso Grupal (Corral, Yadira, 2009, pág.
228-247). Al respecto Yadira Corral, dedica un estudio a estos métodos grupales e
individuales que participan de manera activa en la Validez de contenido, que permiten
disminuir la probabilidad de error del instrumento, por medio de estimaciones
razonables dadas por los jueces. Corral (2009) señala lo siguiente con relación a estos
cuatro métodos:
1. Método de agregados individuales: Se pide individualmente a cada experto
que dé una estimación directa de los ítems del instrumento. Se seleccionan al menos tres
expertos o jueces, para juzgar de manera independiente la relevancia y congruencia de
los reactivos con el contenido teórico, la claridad en la redacción y el sesgo o
tendenciosidad en la formulación de los ítems, es decir, si sugieren o no una respuesta.
Cada experto debe recibir la información escrita suficiente sobre: el propósito de
la prueba (objetivos), conceptualización del universo de contenido, tabla de
especificaciones o de operacionalización de las variables del estudio. Se recogen y
analizan los instrumentos de validación y se decide: a) Los ítems que tienen 100% de
coincidencia favorable entre los jueces (congruentes, claros en su redacción y no
tendenciosos) quedan incluidos en el instrumento. b) Los ítems que tengan 100% de
coincidencia desfavorable entre los jueces quedan excluidos del instrumento. c) Los
ítems que tengan una coincidencia parcial entre los jueces deben ser revisados,
reformulados o sustituidos, si es necesario, y nuevamente validados.
2. Método delphi: Este método fue creado en 1948 para obtener la opinión de
expertos de una manera sistemática. En un primer momento, cada experto responde de
manera individual y anónima a un cuestionario. Después se analizan las respuestas del
conjunto de expertos, se remite a cada uno la respuesta mediana obtenida, así como el
intervalo intercuartil para cada cuestión y se les pide que reconsideren su juicio anterior,
teniendo en cuenta estos datos.
3. Técnica de grupo nominal: El primer paso es reunir a los expertos (entre ocho
y diez personas) y pedirles que registren, individualmente y sin intercambiar opiniones,
sus propias puntuaciones y consideraciones respecto a las probabilidades de error para
cada una de las preguntas o tareas que se les detallan.
Después, cada experto expone a los demás las puntuaciones y principales
consideraciones registradas y al acabar esta ronda, se establecen las coincidencias del
grupo. Luego se realiza un debate de cada uno de los apartados de ésta. Finalmente,
cada experto, de manera individual y por escrito, puntúa y argumenta las probabilidades
de error para cada tarea/pregunta considerada.
4. Método del consenso grupal: Se reúne a los expertos en un lugar
determinado, se indica al grupo que su tarea consiste en lograr una estimación de la
pertinencia y otros aspectos relacionados con la elaboración de los ítems, que sea
satisfactoria para todos los expertos. Con estas instrucciones se maximizan los
intercambios de información y opiniones dentro del grupo de expertos. Este método,
como el anterior, también precisa que el grupo de expertos sea pequeño, se fomente la
libre expresión y se eviten las discusiones tensas y los sistemas de votación (Corral,
Yadira, 2009, pág. 228-247).
Para esta investigación el método utilizado es el Método de Agregados
Individuales. El instrumento fue presentado a tres expertos, los cuales evaluaron de
manea independiente tanto la relevancia y congruencia de los reactivos con su
respectivo contenido teórico, como también la claridad en la redacción de los ítems.
Toda la información fue suministrada a los jueces de manera escrita; Este documento
contenía los objetivos generales y específicos del sustento teórico del instrumento.
Luego de recibir la respuesta de los jueces, se analizaron sus valoraciones para escoger
los ítems o reactivos que iban a permanecer en el instrumentos pues cumplía con los
criterios del constructo principal.
El formato de evaluación suministrado a los jueces. (Ver Anexo 1).
Y por último la Validez De Constructo, es considerada el principal tipo de validez, en

tanto que la validez de constructo es el concepto unificador que integra las
consideraciones de validez de contenido y de criterio en un marco común para probar
hipótesis acerca de las relaciones teóricamente relevantes, en este sentido la meta final
de esta validación es la explicación y comprensión, lo cual lleva a pensar que toda
validez es una validación de constructo (Messick, 1980, tomado de Pérez, J. 2000 ), en
este mismo sentido (Cronbach, 1984; p.126, tomado de Pérez, J. 2000) señala que ¨la
meta final de la validación es la explicación y comprensión...¨ (Pérez, J. 2000).
El término constructo se usa en psicología para referirse a algo que no es

observable, pero que literalmente es construido por el investigador para resumir o
explicar las regularidades o relaciones que él observa en la conducta. La validez de
constructo ha centrado la atención en la función que cumple la teoría psicológica en la
elaboración de la prueba y en la necesidad de formular hipótesis que puedan ser
comprobadas o refutadas en el proceso de validación. La validez de constructo de un
instrumento es el grado en el que puede afirmarse que mide un constructo o rasgo
teórico (Corral, Yadira, 2009, pág. 228-247).
De esta forma, se concluye lo siguiente: Un test tiene validez de constructo si

evalúa realmente el rasgo que pretende evaluar. La validez de constructo hace referencia
al grado de concordancia entre los resultados obtenidos al aplicar un test y los
planteamientos o hipótesis teóricas sobre el rasgo evaluado. Partiendo de aquí, la
validez de constructo incluye la planificación y ejecución de determinados estudios de
investigación orientados a comprobar empíricamente que un test mide realmente el
constructo o rasgo que pretendemos.
La validez de constructo se emplea cuando se quiere usar el desempeño de los

sujetos con el instrumento para inferir la posesión de ciertos rasgos. Para el estudio de
este tipo de validez es necesario que exista una conceptualización clara del rasgo
estudiado basado en una teoría determinada, es decir, tener claro que es lo que se
pretende medir. La teoría sugiere las pruebas que son apropiadas para observar el
atributo o rasgo y las evidencias a considerarse en la evaluación. Para lograr esto
Cronbach (1960), sugiere los siguientes pasos: a) Identificar las construcciones que
pudieran explicar la ejecución en el instrumento. b) Formulación de hipótesis
comprobables a partir de la teoría. c) Recopilación de los datos para probar las hipótesis
(Corral, Yadira, 2009, pág. 228-247).
Para que un instrumento mida el constructo o rasgo teórico que debe medir;
Requiere de la acumulación gradual de diversas fuentes de información. Referente a
esto Isabel M. Mikulic (2010), señala lo siguiente sobre esas fuentes:
1. Cambios en el desarrollo: la diferenciación por edad es un importante criterio
utilizado en la validación, una prueba validada con este criterio evolutivo mira
características conductuales que se incrementan con la edad en las condiciones existente
en el entorno en el que se estandarizó el instrumento. Como diferentes culturas pueden
estimular y fomentar el desarrollo de características conductuales disímiles, no puede
suponerse que el criterio de diferenciación por edad sea universal. Como cualquier otro
criterio está circunscrito por el contexto cultural particular del que fue derivado.
2. Correlaciones con otras pruebas: se citan las correlaciones entre una prueba
nueva y otros instrumentos similares como evidencia de que la nueva mide
aproximadamente la misma área de conducta que otras que llevan el mismo nombre.
Análisis factorial: Desarrollado como medio para identificar rasgos psicológicos. Es una
refinada técnica estadística para analizar las interrelaciones de los datos conductuales
y reducir el número de variables o categorías en cuyos términos puede describirse el
desempeño de cada individuo a un número relativamente pequeño de factores o rasgos
comunes. Una vez que los factores se han identificado, sirven para describir la
composición factorial de las pruebas. El análisis de factores es definido por Campo
Arias (2012) como “… una forma de las varias formas de estimar la validez de
constructo de un instrumento, de mostrar en forma matemática como la construcción
teórica de un concepto abstracto complejo se refleja en el patrón de respuesta de un
grupo poblacional”, es decir si el instrumento muestra las dimensiones que propone la
conceptualización teórica. El análisis de factores tiene como funcionalidad principal
discriminar que reactivos aportan más varianza al instrumento y así entrar en una fase
donde se decida qué puntos, que reactivos deben eliminarse o mantenerse y conservar
utilidad práctica; como lo expresa Campo Arias (2012) “El análisis de factores permite
explicar un número amplio de ítems que hacen parte de una escala con un número
reducido, mucho menor, de nuevas variables (factores), sin pérdida importante de

información de los ítems originales ”, (Campo Arias 2012).
El análisis factorial se divide en dos tipos, el primero es denominado análisis de

factores exploratorio (AFE), este se utiliza con el fin de representar en forma sencilla
como se relaciona entre si un número determinado de ítems, (Campo Arias 2012). Y el
segundo tipo denominado el análisis de factores confirmatorio (AFC), en este análisis
“se comienza con un número predeterminado de factores, que ya tienen un significado
específico, los ítems que hacen parte de cada factor o si los factores se encuentran alta
o pobremente correlacionados. Y al final, se busca conocer la bondad del ajuste para el
modelo final que se acepte” (Campo Arias 2012).
Para esta investigación se realizó un análisis factorial exploratorio, debido a que

cada dimensión del instrumento y las subdimenciones de las mismas fueron abordadas
de manera independiente. Los análisis empleados fueron la estimación del coeficiente
KMO, el cual brinda información en cuanto a si existe correlación entre los ítems (son
aceptables valores por encima de 0.7). Otro de los estadígrafos aplicados fue la prueba
de esfericidad de Barlett, mediante la cual se prueba la hipótesis de nulidad de que los
ítems que conforman la dimensión son independientes, para rechazar la hipótesis de
nulidad se esperan valores altos del chi cuadrado (X2) con valores de probabilidad por
debajo de 0.05. Para determinar si un ítem aporta significativamente al factor se tomó
como valor el criterio de Stevens (Stevens, J. 1986 citado por Campo, A. 2012), el cual
arroja un valor esperado no inferior de 0,33. Así mismo, se establece la varianza total
explicada por cada subdimensión (son esperables niveles de varianza del 50%).
3. Consistencia interna: la característica esencial de este método es que el
criterio no es otro que la calificación total del propio instrumento. En cada reactivo se
compara la ejecución del grupo criterio superior con el desempeño del grupo inferior.
Los reactivos que no logran mostrar una proporción significativamente mayor de
“aciertos” en el grupo superior que en el inferior se consideran inválidos y se revisan o
eliminan.
4. Validez convergente y discriminante: En un minucioso análisis de la
validación de constructo, D. Campbell (1960) señaló que para demostrar la validez de
constructo no basta con demostrar que una prueba tiene una correlación elevada con
otras variables con las que en teoría debe hacerlo, sino también que no tiene una
correlación significativa con variables de las que se supone debe diferir.
5. Modelamiento de ecuaciones estructurales: investigar cómo es que un
constructo o rasgo personal identificado conduce a un buen o mal desempeño
contribuye sustancialmente a la comprensión de por qué una prueba tiene una elevada o
baja validez en una situación dada. Facilita dicho análisis un procedimiento estadístico
conocido como modelamiento de ecuaciones estructurales que está relacionado con el
análisis de “paths”. Este modelamiento utiliza ecuaciones de regresión para predecir las
variables dependientes a partir de las independientes en los diseños de series de tiempos
u otros modelos causales.
Otros puntos a tener en cuenta en este proceso de validación es el coeficiente de
validez; el coeficiente de validez es la correlación entre la puntuación de la prueba y la
medida de criterio. Los datos empleados al calcular cualquier coeficiente de validez
también pueden expresarse como tablas o gráficos que muestran la probabilidad de que
un individuo que obtiene cierta puntuación en la prueba obtenga un nivel especificado
de desempeño en el de criterio.
Hay condiciones que afectan a los coeficientes de validez por lo cual resulta
esencial especificar la naturaleza del grupo en el que se calculó el coeficiente de
validez. La misma prueba puede medir diferentes funciones cuando se aplica a
individuos que difieren en características importantes (edad, género, nivel educativo,
ocupación, etc.). Existen otros puntos a tener en cuenta tales como: la heterogeneidad de
la muestra, la preselección o intencionalidad de la muestra, la diferente forma de
relación entre la prueba y el criterio, etc.
Factores que afectan la validez, Yadira Corral en su ensayo titulado “Validez Y

confiabilidad De Los Instrumentos De Investigación Para La Recolección De Datos”
brinda un apartado para hablar sobre varios factores que tienden a distorsionar los
coeficientes de validez y a complicar su interpretación, entre ellos está:
1. Construcción del instrumento: Algunos de los factores a evitar, para que el
instrumento sea válido son: a)Instrucciones imprecisas o vagas, b)Estructura sintáctica
de las oraciones muy difíciles, c)Preguntas inadecuadas respecto a las especificaciones
(sobre todo en pruebas escritas y orales), d)Preguntas que sugieren la respuesta,
e)Ambigüedad en la formulación de los reactivos, que lleven a diferentes
interpretaciones, f)Cuestionarios demasiado cortos (no incluyen una muestra adecuada
de los indicadores a medir), con pocos reactivos, g)Ítems incongruentes con el

contenido, sin relación con los rasgos o características a medir, h)Ordenamiento
inadecuado de los ítems, I) Patrón identificable de respuestas (sobre todo en pruebas de
selección).
2. Administración y calificación del instrumento: Entre estos factores están: 1)
Tiempo insuficiente para responder, b) Ayuda adicional de otros sujetos, en caso de
pruebas: las chuletas o copias, la subjetividad en los puntajes de las preguntas.
3. Respuestas de los sujetos: Algunos factores son, el bloqueo de los sujetos al
responder debido a situaciones emocionales y las respuestas al azar.
4. Naturaleza del Grupo y del Criterio: Debe ser aplicado el instrumento para el
grupo al cual fue diseñado, puede ser inapropiado para otros grupos.
REFERENCIAS
Aiken, Lewis. 2003. Test psicológicos y evaluación. Undécima edición. México
Alvarado, Jesús M; Santisteban, Carmen. 2006. La Validez En La Medición
Psicológica. Ediciones UNED. Primera Edición. Madrid.
Argibay, Juan Carlos. 2006. Técnicas psicométricas. Cuestiones de Validez y
Confiabilidad.
Buela, Gualberto; Sierra, Juan C. 1997. Manual De Evaluación Psicológica;
Fundamentos, Técnicas Y Aplicación. España editores, S.A. (pág. 190) primer Edición.
España.
Campo Arias, Adalberto. Oviedo, Heidy. 2008. Propiedades psicométricas de
una escala. Consistencia interna. Instituto de Investigación del Comportamiento
Humano. Bogotá, Colombia.
Campo, A; Oviedo, H. (2008). Propiedades psicométricas de Una Escala: La

Consistencia Interna. Rev. salud pública. 10(5), 831-839.
Campo, A; Herazo, E & Oviedo, H. (2012). Análisis de Factores: Fundamentos

para la Evaluación de Instrumentos de Medición en Salud Mental. Revista Colombiana
de Psiquiatría. 41(3), 659 – 671.
Carretero-Dios, Hugo. Pérez, Cristino. 2005. Normas para el Desarrollo y

Revisión de Estudios Instrumentales. International Journal of Clinical and Health
Psychology. Vol. 5, número 003.
Contini de González, E. Norma. 2001. Multiculturalismo Y Evaluación

Psicológica: Una Respuesta A La Diversidad En El Comportamiento. 28º Congreso
Interamericano de Psicología, Santiago de Chile.
Cortada de Kohan, Nuria. 2001. Psicología Y Psicopedagogía: Importancia Del
Avance En La Investigación Psicométrica. Universidad de buenos aires. Argentina.
Septiembre 2001. Conferencia. XXVIII Congreso Interamericano de Psicología.
Santiago de Chile.
Cortada de Kohan, Nuria. 1972. Problemas Para La Elaboración Y Tipificación
De Test En Distintos Ambientes Culturales. (pág. 189-196). Vol. 4. Número 002.
Revista Latinoamérica de psicología, Fundación Universitaria Konrad Lorenz Bogotá,
Colombia.
Cortina, J. (1993). What is Coefficient Alpha? An Examination of Theory and
Applications. Journal of Applied Psychology. 78(1), 98 – 104.
Corral, Yadira. 2009. Validez y confiabilidad de los instrumentos de
investigación para la recolección de datos. Revista ciencias de la educación.(pag. 241-
242).vol. 19. Facultad de Ciencias Económicas Y Sociales Universidad de Carabobo.
Valencia, Venezuela.
Cronbach, L. (1951). Coeficient Alpha and the Internal Structure of Test.
Psychometrika, 16(3), 297 – 334.
Dadis. 2013. Perfil Epidemiológico de Cartagena 2012. Programa de vigilancia
en salud pública Departamento Administrativo Distrital de Salud. Cartagena de Indias
D. T. y C.
Eyzaguirre, Bárbara. 2003. Exigencias para la Construcción de una Prueba de
Selección a la Universidad. Estudios Públicos, 90. Chile.
Gomez-Benito, Juana & Hidalgo-Montesinos, Dolores. 2003. Desarrollo
recientes en psicometría. Avances en medición. (Pág. 18 – 31. España
Gomez C, Sánchez R. Cálculo del tamaño de la muestra en psiquiatría y salud

mental. RevColomb Psiquiatr 1998; 27: 131-142.45. Charter RA. Sample size
requirements for precise estimates of reliability, generalizability,and validaty
coefficients. J Clin Exp Neuropsychol 1999; 21: 559-566.46. Norman GR, Streiner DL.
Bioestadística. Madrid: Mosby Doyma Libros; 1996.
Gómez Juana & Dolores María. 2005. La Validez En Los Test, Escalas Y
Cuestionarios. Centro de estudio de opinión. Universidad Antioquia.
Grad, Héctor & Vergara, Ana. I. 2003. Cuestiones Metodológicas En La
Investigación transcultural. Pág. 71-107. No. 77. Boletín de Psicología.
Ley 1090 de 2006. Ejercicio de la profesión de psicología, código deontológico
y bioético y otras disposiciones. Bogotá Colombia.
May, Rollo. (1967). Psychology and the Human Dilema. New Jersey, USA. D.
Van Nostrand Company.
May, Rollo. (1976). Existence: a new dimensión in psychiatry and psychology.
Editorial NewYork, NY Basic Books.
May, Rollo. 1969. Capítulo IV, Bases Existenciales De La Psicoterapia.
Psicología Existencial. Buenos Aires. Paidos.
May, Rollo. (2000). El Dilema del Hombre. Barcelona, España. Editorial Paidos.
Morales, Pedro. 2007. Estadística aplicada a las ciencias sociales. La fiabilidad
de los test y escalas. Universidad pontificia comillas. Facultad de ciencias humanas y
sociales. Madrid.
Mikulic, Isabel. 2010. Construcción y Adaptación de Pruebas Psicológicas.
Facultad de Psicología. Buenos Aires, Argentina.
Muñiz, José. 2010. Las teorías de los test: teoría clásica y teoría de respuesta al
ítem. Papeles del psicólogo. (pág. 57-64). Vol.31. España.
Ponsada, Vicente.2006. Introducción a la Psicometría. Teoría Clásica de los Test
y Teoría de la Respuesta al Ítem. Universidad autónoma de Madrid. Faculta de
psicología.
Pérez-Gil, J. Chacón, S & Moreno, R. 2000. Validez de constructo: el uso de
análisis factorial exploratorio-confirmatorio para obtener evidencias de validez (pág.
442 -446) volumen 12 – No 2. Universidad de Sevilla.
Rodríguez, María & Lopera josefina. 2002. Conceptos básicos de validación de
escalas en salud mental. Revista CES MEDICINA. (Pág. 38) Volumen 16- No 3.
Rojas. E. (2000) La Ansiedad. Madrid , España: Ediciones Temas Hoy.
Romero, E. (2005). Estaciones en el camino de la vida el desarrollo los afectos

en las diversas etapas de la vida. Editorial Norte Sur San Pablo. Brasil.
Streiner, D. (2003). Starting at the Beginning: An Introduction to Coefficient
Alpha and Internal Consistency. Journal of personality Assessment, 80(1), 99-103.
Vallo Ruiz, Iñigo.2010. Directrices Para La Adaptación Y Uso De Los Test.

MARCO TEÓRICO Shiley and Yucelis

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

MARCO TEÓRICO Shiley and Yucelis

Încărcat de

Drepturi de autor:

Formate disponibile

Propiedades Psicométricas de un Inventario De Ansiedad.

Actualmente se reconoce que la adaptación de un Test es un proceso mucho más

Los problemas relacionados con los factores socioculturales en el empleo y

Las asociaciones americanas American ducational Research Asoociation

Estándar 13.4. Cuando se traduce un test de un idioma o dialecto a otro, debe de

Teoría clásica de los test

En el año de 1016 Terman llevó a cabo la revisión de esta escala en la Universidad de

Así, Los trabajos pioneros de Spearman a principios del siglo XX establecieron

Gómez-Benito & Hidalgo en el 2003 establecen que, a pesar de su simplicidad y

los test; d) Dependencia muestral de las características de los ítems; e) Dependencia de

En definitiva, cualquiera que sea el constructo psicológico que se pretenda medir

La exploración psicométrica de las propiedades que caracterizan el diseño del

En cuanto a la Confiabilidad es uno de los aspectos centrales en la TCT, para la

Sin embargo, es necesario considerar la postura de Streiner, D. (2003) quien

De esta forma medir la confiabilidad o precisión de los instrumentos de medida

procesos en el cual se relaciona y es labor de la psicometría establecer el grado de

De esta forma si un instrumento es poco confiable está midiendo, a parte del

Existen tres formas básicas de medir la confiabilidad y todas buscan determinar

La primera hace alusión a la estabilidad temporal, puesto que al hablar de la

1. Modificaciones en la actitud de los sujetos respecto de la prueba o cambios en la

En cuanto a la equivalencia que se aplica cuando se quiere determinar la

El tercer aspecto a considerar en el análisis de la confiabilidad y que más se

Existen procedimientos que nos permiten determinar el grado de consistencia

El coeficiente Alpha de Cronbach es la fórmula más usada y corresponde al

Así mismo se pueden establecer diferentes tipos de coeficiente Alpha de

Para la interpretación de coeficiente Alpha de Cronbach se siguen los siguientes

Como establece Campo Arias (2005) el coeficiente Alpha de Cronbach es la

El coeficiente Alpha resulta útil cuando se usa para determinar la consistencia

Otra forma de medir la consistencia interna de un test es la aplicación de la

Finalmente, otra manera de medir la confiabilidad de tipo consistencia interna de

La Validez está considerada como un requisito y aspecto fundamental para el

“Validez es el grado en el que un instrumento mide aquello que dice medir. La

Partiendo de estas definiciones se concluye lo siguiente: la validez indica el

Otro cambio observado en la evolución del concepto de la validez se refiere al

práctica de la construcción de test. La consecuencia que tuvo para la validez fueron

Validez predictiva o referida al criterio: Cuando se habla normalmente de la

Los procedimientos de validación de criterio-predicción indican la efectividad de

Este tipo de validez se refiere a la concordancia empírica del instrumento en

Por ejemplo; si se va realizar una investigación sobre “La ansiedad desde la

Por su parte la Validez De Contenido comprende el examen sistemático del

importantes y en la proporción correcta. Básicamente se deben contestar dos preguntas:

Por lo tanto un test tendrá validez de contenido si el conjunto de preguntas en él

Hay que considerar que, la validez de contenido no puede expresarse

Y por último la Validez De Constructo, es considerada el principal tipo de validez, en

El término constructo se usa en psicología para referirse a algo que no es

De esta forma, se concluye lo siguiente: Un test tiene validez de constructo si

La validez de constructo se emplea cuando se quiere usar el desempeño de los

reducido, mucho menor, de nuevas variables (factores), sin pérdida importante de

El análisis factorial se divide en dos tipos, el primero es denominado análisis de

Para esta investigación se realizó un análisis factorial exploratorio, debido a que

Factores que afectan la validez, Yadira Corral en su ensayo titulado “Validez Y

de los indicadores a medir), con pocos reactivos, g)Ítems incongruentes con el

Campo, A; Oviedo, H. (2008). Propiedades psicométricas de Una Escala: La

Campo, A; Herazo, E & Oviedo, H. (2012). Análisis de Factores: Fundamentos

Carretero-Dios, Hugo. Pérez, Cristino. 2005. Normas para el Desarrollo y

Contini de González, E. Norma. 2001. Multiculturalismo Y Evaluación

Gomez C, Sánchez R. Cálculo del tamaño de la muestra en psiquiatría y salud

Romero, E. (2005). Estaciones en el camino de la vida el desarrollo los afectos

S-ar putea să vă placă și