Psi Come Tria

PSICOMETRÍA
Hitos en la historia de la
psicometría
AÑO HITO O ACONTECIMIENTO
1115 a.C. En China se utilizan tests para acceder a puestos en el gobierno.
1869 d C. Francis Galton publica el libro Genio Hereditario (1869) donde plantea a través
de estudios estadísticos que la inteligencia se hereda.
1904 – 1910 d. C. Charles Spearman funda la Teoría Clásica de los tests o del modelo lineal
y publica su teoría de los factores de la inteligencia y las formulas de atenuación.
1905 d.C. Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para niños,
con el fin de establecer su edad mental y predecir su rendimiento académico.
1918 d.C. Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elaboró el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.
1931 d.C. Thurstone publica su libro The reliability and validity of tests.
1939 d.C. Wechsler propone su escala de medida para la inteligencia.
1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Inventory (MMPI).
1960 d.C. Cronbach propone su Teoría de la Generalización en la cual utiliza el análisis de
varianza para interpretar las fuentes de error en los puntajes.
1980 d.C. Rasch plantea la Teoría de la Respuesta al Ítem o del rasgo latente que permite
conocer la información de cada ítem para diseñar pruebas individualizadas.
La psicometría
 Es la rama de la
psicología que
desarrolla y estudia
las propiedades de las
pruebas psicológicas
o tests para medir las
variables psicológicas
con la mayor
precisión posible.
Diferencia entre psicometría y
evaluación psicológica
Psicometría Evaluación psicológica
Énfasis en la medición Énfasis en el diagnóstico
Instrumentos y tests La persona

Historia de la psicometría
 Antecedentes históricos.
 Modelos de medición.
Antecedentes históricos
 Hacia el año 1115 a.C. se utilizan comienzan a utilizar en
China los primeros tests que buscan medir las
capacidades de aspirantes para acceder a puestos del
gobierno (primera medición de capacidades).
 En 1869 Francis Galton publica el libro Genio Hereditario

donde plantea a través de estudios estadísticos que la
inteligencia se hereda y que es posible medirla
(estudios estadísticos en psicología).
 Entre 1904 y 1910 Charles Spearman funda la
Teoría Clásica de los tests o del modelo lineal y
publica su teoría de los factores de la
inteligencia y las formulas de atenuación
(Estrategias de medición y TCT).
 En 1905 Alfredo Binet y Theodore Simon

publican la primera escala de inteligencia para
niños, con el fin de establecer su edad mental y
predecir su rendimiento académico (uno de los
primeros tests psicológicos).
 En 1960 Lee Cronbach propone su Teoría de la
Generalización en la cual utiliza el análisis de
varianza para interpretar las fuentes de error en
los puntajes. Igualmente él desarrolló
estrategias para la medición de la confiabilidad
de un test.
 En 1980 Rasch plantea la Teoría de la Respuesta

al Ítem o del rasgo latente que permite conocer
la información de cada ítem para diseñar
pruebas individualizadas.
Modelos de medición
Teoría Clásica de los Teoría de la Respuesta al
Tests (TCT) Ítem (TRI)
Análisis de la prueba Análisis de ítems

completa individuales
En una muestra pequeña En grandes muestras de

de sujetos (N < 500) sujetos (N ≥ 500)
Teoría clásica de los Tests
 El modelo de puntuación verdadera se concreta en
un primer supuesto:
X=V+E
que indica que la puntuación empírica directa
de una persona en un test (X) está compuesta por
la puntuación verdadera de la persona (V) y un
error de medida (E) que se comete al medir el rasgo
con el test.
 El error de medida se establece como la diferencia

entre la puntuación empírica y la verdadera:
E=X-V
 La puntuación verdadera se obtiene con el promedio
de las puntuaciones empíricas que obtiene la
persona en un número elevado de aplicaciones del
test:
V = E[X]
 Si en una población se conocen las puntuaciones V

y E de los individuos, la correlación entre ambas
variables sería nula, porque se asume que
puntuaciones verdaderas elevadas no tienen porqué
tener asociados errores elevados:
r VE = 0
 Si en una población conociéramos los errores de
medida de cada individuo quien ha realizado dos
tests diferentes (j y k), la correlación entre
ambas variables también sería nula:
ρEjEk = 0
 Si en una población conociéramos las

puntuaciones E en un test j y las puntuaciones V
en un test k, ambas variables correlacionarían
cero:
ρE jVk = 0
Limitaciones de la Teoría Clásica
 Las características de los ítems (dificultad y
discriminación) dependen del grupo de personas en el
que se han aplicado.
 La puntuación que una persona obtenga será diferente

si se le aplican dos tests que midan la misma
característica pero cuyo nivel de dificultad sea diferente.
 La TCT supone que el error de medida es una propiedad

del test y, por lo tanto, igual para todos los sujetos,
independientemente de cual sea su puntuación.
Teoría de la Respuesta al Ítem
 Unidimensionalidad: todos los ítems que forman el test han
de medir un mismo y único rasgo. El supuesto de
unidimensionalidad exige que todos y cada uno de los ítems
del test midan una única dimensión.
 No hay como tal puntuaciones verdaderas sino una

probabilidad de acierto determinada por unos parámetros.
 Independencia local: entre los ítems de un test si la respuesta

que una persona da a uno de ellos no depende de las
respuestas que da a los otros, ni por el orden de presentación
de los ítems, las respuestas que ya se hayan dado, etc.
Un prueba psicológica o test
 Es un instrumento en formato impreso o digital
que consta de una serie de preguntas o
reactivos que miden unas variables psicológicas
especificas a través de un sistema de
puntuación.
 Puede aplicarse en diferentes campos de la

psicología, para fines diversos como diagnóstico
clínico (psicología clínica) , selección de personal
(psicología organizacional) o análisis de
aptitudes vocacionales (psicología educativa).
Estructura general de un test
impreso
 Cuadernillo de instrucciones.
 Cuadernillo de preguntas.
 Hoja(s) de respuestas.
 Plantilla de corrección.
 Tabla de puntuaciones y baremos.

El cuadernillo de instrucciones
 Es un documento donde se menciona:

- El nombre de la prueba, sus autores y el
año de publicación.
- La(s) variable(s) que mide y sus objetivos.
- Los antecedentes (marco conceptual y
teórico) de la prueba.
- Las instrucciones generales de aplicación
(para los psicólogos).
El cuadernillo de preguntas
 Es un documento que consta de:
- Las instrucciones de respuesta (para quien la va
a responder).
- Los ítems o preguntas.
 No puede rayarse ni se puede escribir sobre este

ya que se usa en diferentes aplicaciones.
La hoja de respuestas y plantilla de
corrección
 Es la hoja donde la persona anota las respuestas

a de los ítems planteados en el cuadernillo de
preguntas.
 Una vez que la persona entrega la hoja de

respuestas al psicólogo, él o ella la califican
poniendo encima de la hoja de respuestas, la
plantilla de corrección para ver en cuales acertó
el sujeto y en cuales no.
El sistema de puntuación
Puntuación cruda o bruta
∑ Puntuación de los ítems – Errores
Puntuación estándar o típica
Centiles Puntuaciones T, S o Z
Perfil del sujeto

La tabla de puntuaciones y
baremos
 Una vez que se han obtenido los aciertos y
errores de la persona con ayuda de la plantilla,
se obtiene una puntuación cruda o bruta,
que es especifica para ese sujeto.
 Esa puntuación bruta se analiza en la tabla de

puntuaciones estándar, para obtener una
puntuación estándar o típica del sujeto
dentro de la población o muestra de sujetos que
presentó la prueba (baremo).
Los baremos
 Son tablas de puntuaciones estándar que se
clasifican por grupos poblacionales o muestrales
según la edad, profesión o género.
 Por ejemplo, para una misma prueba existen

baremos para hombres, mujeres, hombres
profesionales, mujeres profesionales,
estudiantes de secundaria, etc.
Tipos de pruebas o tests
Clasificación de las pruebas
Según Según la forma de Según la(s) variable(s)

la aplicación medir la(s) variable(s) que miden
- Autoaplicación -De desempeño - De capacidad mental

- Individual - De poder - De conocimientos
- Grupal - De velocidad - De personalidad
Clasificación de las pruebas por aplicación
 Pruebas de autoaplicación: son tests que no requieren la
aplicación por parte de un psicólogo sino que puede
hacerlas la persona con ayuda de un computador.
 Pruebas de aplicación individual: son aquellas que el

psicólogo administra a una sola persona. Por ejemplo,
en un caso clínico.
 Pruebas de aplicación grupal: son aquellas que el

psicólogo pueden aplicar a varias personas al mismo
tiempo, pero controlando que no conversen entre ellas.
Por ejemplo, una prueba de aptitudes e intereses
vocacionales.
Clasificación de las pruebas según la forma
de medir la(s) variable(s)
 Pruebas de desempeño: miden el rendimiento máximo
(individual) o el rendimiento normal o típico (de un
grupo).
 Pruebas de poder: miden el nivel de destreza mental de

un sujeto o su nivel de conocimiento.
 Pruebas de velocidad: miden cuantos ítems responde el

sujeto en un tiempo especifico.
 Pruebas con referencia a la norma o al criterio: mide la

variables psicológica según objetivos específicos.
Clasificación de las pruebas según las
variables que miden
 Pruebas de capacidad mental (inteligencia).
 Pruebas de aprovechamiento o conocimiento.
 Pruebas de personalidad.
 Pruebas de actitudes, aptitudes, intereses,

motivación, opinión y valores.
 Pruebas neuropsicológicas.
Estructura general de un ítem
 Enunciado: menciona las instrucciones para contestar el
ítem y plantea un contexto o situación a partir del cual
se hace la pregunta.
 Pregunta(s): son cuestionamientos que evalúan

directamente la variable psicológica de forma implícita.
Pueden ser abiertas (libre respuesta) o cerradas
(opciones especificas).
 Opciones de respuesta: incluyen una(s) respuestas(s)

correcta(s) y un(os) distractor(es) o respuesta(s)
falsa(s).
Clasificación del formato de respuestas
Clasificación de los ítems
En tests de En tests de
rendimiento óptimo rendimiento típico
- De elección - De opción binaria

- De adjetivos
- De emparejamiento - De categorías ordenadas
Clasificación de las respuestas en tests
de rendimiento óptimo
 Elección binaria: de dos alternativas, se elige la
que se considera correcta (Sí o No) o
(verdadero-falso).
 Elección múltiple: entre más de dos alternativas

se elige la que se considera correcta.
 Emparejamiento: consiste en encontrar las

parejas entre dos conjuntos de conceptos.
Clasificación de las respuestas en tests
de rendimiento típico
 Opción binaria: la persona debe manifestar si está de

acuerdo o en desacuerdo con una afirmación.
 Categorías ordenadas: el formato establece un continuo

ordinal de más de dos categorías, que permite a la
persona matizar mejor su respuesta.
 Adjetivos bipolares: este formato es típico de lo que se

denomina "diferencial semántico".
Confiabilidad
 Es el grado en el cual las mediciones

repetidas de un fenómeno relativamente
estable son aproximadas entre sí o
consistentes.
 Permite predecir el desempeño de un

grupo o de un sujeto e igualmente sirve
para describirlo en ambos casos.
Formas de medir la confiabilidad
 Test-retest: consiste en aplicar un test dos veces a un
mismo grupo en un intervalo de días o meses (no
superior).
 Formas paralelas: consiste en aplicar un test homologo o

equivalente a un mismo grupo pero en tiempos
diferentes.
 División por mitades: consiste en comparar los

resultados de los ítems pares e impares en la aplicación
grupal de un test.
Coeficientes de confiabilidad
 Test-retest: coeficiente de estabilidad (r).
 Formas paralelas: coeficiente de

equivalencia (r).
 División por mitades: coeficiente de

consistencia interna (r).
Coeficientes más usados en división
por mitades
Formas de mejorar la confiabilidad
de un test
 Para calcular el número de ítems K para lograr
una confiabilidad RXY deseada (superior a 0.7)
se usa la formula:
K = RXY * (1 – rXY) / rXY) * (1 – RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el número K se multiplica por
el número de items inicial y luego se le resta a
ese resultado el número de ítems inicial.
 Para calcular la confiabilidad al quitar un
número de ítems X con un total de ítems Y
y con una confiabilidad conocida C se usa
la siguiente formula:
Y–X/Y
El resultado obtenido con esta formula
debe operarse con la formula 2:
[resultado 1 * C]
[1 + (resultado 1 – 1) * C]
VALIDEZ
 Es el grado en el cual una prueba mide lo
que pretende medir.
 Conjunto de pruebas y datos que han de

recogerse para garantizar la pertinencia
predictiva de las inferencias que hacen a
partir de un test.
Tipos de validez
 Validez del contenido.
 Validez con relación a criterio.
 Validez del constructo.

VALIDEZ DEL CONTENIDO
 Es la muestra adecuada y representativa de los
contenidos que se pretende evaluar con un test.
 Los ítems o preguntas se seleccionan según su:

- Coherencia: con las características y variables.
- Relevancia: de acuerdo con el indicador.
- Buena redacción: la gramática del ítem.
- Validez aparente: para el evaluado.
VALIDEZ CON RELACIÓN AL
CRITERIO
 Es la comparación del desempeño de un
grupo de sujetos en un test respecto
patrones de medida ya establecidos.
 Se clasifica en:
- Validez concurrente.
- Validez predictiva.
Validez concurrente
 Es el análisis de variabilidad que efectúa al
comparar el desempeño de dos grupos de
distintos de sujetos en un mismo test.
 También se le denomina validez cruzada o

entre distintas muestras.
Validez predictiva
 Es el grado de precisión con que las

calificaciones de la prueba predicen las
calificaciones del criterio.
 Se obtiene mediante la correlación entre

una variable de indicador y una variable
criterio a partir de r (Pearson), cuyo valor
es igual o menor a 0,60.
Factores que afectan la validez con
relación a los criterios
 Las diferencias de grupo:
sexo, edad y rasgos de personalidad.
 La contaminación de los criterios:

evidencias falsas que les restan validez.
 El índice de base (debe ser mayor de 50):

número de personas que poseen la variable medida.
 El incremento de la validez:
costo razonable del instrumento.
VALIDEZ DEL CONSTRUCTO
 Es el grado de exactitud con el que se
mide un constructo o concepto psicológico
particular.
 Depende de unas condiciones que son

externas al evaluador y la persona que
diseña la prueba.
Condiciones de la
validez del constructo
 Valoración por parte de jueces expertos
de la correspondencia contenido-concepto.
 Análisis de la consistencia interna de la

prueba.
 Estudio de las variables intervinientes en

la calificación.
 Análisis factorial y correlación con otras
pruebas.
 Análisis de las respuestas.
 Correlaciones altas con otras medidas o

métodos para medir el mismo constructo
(Validez convergente).
 Correlaciones bajas con las medidas de

constructos diferentes (Validez
discriminante).
CONSTRUCCIÓN DE LOS ÍTEMS
La Taxonomía de Bloom
 El dominio cognoscitivo comprende 6
categorías:
2. Recuerdo
3. Comprensión
4. Aplicación
5. Análisis
6. Síntesis
7. Evaluación
Recuerdo:
Incluye situaciones de examen que acentúan la
importancia del recuerdo de datos, ideas, materiales
o fenómenos, ya sea como reconocimiento o
evocación. Supone, el recuerdo o reconocimiento
de: Datos específicos como terminologías o hechos;
modos y medios para el tratamiento de datos
específicos como convenciones, clasificaciones,
metodologías, técnicas o procedimientos y,
universales y abstracciones en un campo
determinado como principios, generalizaciones,
teorías y estructuras (Herrera, 2003).
Ejemplo 1: Pregunta que evalúa Recuerdo
A continuación encontrará preguntas que constan de un enun-

ciado y cuatro (4) o cinco (5) opciones de respuesta. Usted
debe marcar en su hoja de respuesta, aquella opción que
considere correc-ta.
El modelo de control social propuesto por Max Weber para las

organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrático
C.- estructuralista
D.- de las organizaciones
Comprensión:
Implica la intelección y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta que vaya
desde la presentación de una proposición con palabras distintas
de las del enunciado original, hasta la aplicación de un principio
en una situación nueva para el examinado, pasando por la
ejemplificación. Se define en términos de tres operaciones: a)
Traducción o capacidad para expresar un concepto o mensaje
conocido en palabras diferentes o pasarlo de un sistema
simbólico a otro, b) Interpretación o reordenamiento de ideas de
una comunicación en una nueva configuración. Incluye la
habilidad para captar el contenido de una comunicación como un
todo y distinguir entre conclusiones legítimas y contradictorias y
c) Extrapolación o hacer explícitas algunas conclusiones,
colorarios, consecuencias o efectos de una comunicación dada
(Herrera, 2003).
Ejemplo 2: Pregunta que evalúa Comprensión
Si un psicólogo afirma que una prueba que ha preparado para
selección de personal tiene un coeficiente de validez predictiva mas
alto que el de fiabilidad, concluiría que
A.está bien, por cuanto lo mas importante para la selección es la

validez de predicción
B.debería tener mas alta fiabilidad que validez ya que lo principal es
la confianza en el instrumento
C.debe tener un error ya que la validez predictiva NO puede ser
mayor al coeficiente de fiabilidad
D.debe tener un error ya que los dos coeficientes, el de validez y el
de fiabilidad deben tener igual valor
E.no debería utilizar la prueba ya que debe tener mas alta fiabilidad
que validez para el objeto propuesto
Aplicación:
Se refiere a la capacidad para aplicar teorías, principios,
métodos o ideas en la solución de un problema práctico. Es la
habilidad para aplicar principios y generalizaciones a nuevos
problemas y situaciones. Comprende entonces tareas como a)
identificar los principios o generalizaciones apropiados para
resolver un problema o reformularlo para lograr tal
identificación, b) especificar los límites dentro de los cuales un
principio o generalización es verdadero o relevante y reconocer
las excepciones a los mismos y las razones para ello, c) explicar
nuevos fenómenos a partir de principios o genera-li-zaciones
conocidas, predecir lo que sucederá en una situación nueva
mediante el uso de principios y generalizaciones apropiadas, y
d) determinar o justificar una decisión o acción en una situación
usando principios o generalizaciones e indicar el razonamiento
que apoya la utilización de los mismos ante un determinado
problema (Herrera 2003).
Ejemplo 3: Pregunta que evalúa Aplicación
Escoja la característica del pensamiento infantil que mejor se ajusta a

la conducta descrita por Piaget:
- Cómo se hace para tener madera? Se cortan los troncos de los
árboles.
- Qué se hace para tener árboles? Se siembran los granos. - Y los
granos? Se compran.
- Dónde? En los almacenes. - Y el dueño del almacén? Piénsalo un
poco. Los hace.
-Con qué? Con otros granos. - Cuando vinieron los primeros
hombres, había ya árboles? No.
-Cómo han comenzado? Por los granos. - De dónde venían estos
granos? Del almacén.
A. Realismo
B. Animismo
C. Artificialismo
D. Sincretismo
E. Funcionalismo
Análisis:
Hace referencia a la habilidad para fraccionar una comunicación en sus
elementos, de manera que aparezcan explícitas la jerarquía de las ideas
y las relaciones existentes entre ellas. Esta es un proceso complejo que
implica las tres categorías anteriores; recuerdo, com-prensión y
aplicación, pero va mas allá de ellas. Aquí se incluyen tres
subcategorías: a) análisis de elementos o habilidad para fraccionar una
información en sus elementos, como supues-tos no explícitos, hechos e
hipótesis; b) análisis de relaciones o identificar la relaciones que
existen entre los elementos de una comunicación; inferir los criterios,
relaciones, cualidades, suposiciones o condiciones implícitas en una
comunicación; o bien, determinar las relaciones entre las hipóte-sis y
las pruebas que la apoyan, entre las conclusiones y las hipótesis, o
entre las conclusiones y las evidencias; y c) análisis de principios de
organización que es la habilidad para explicitar los principios
organizadores que ha seguido un autor, reducir su propósito, su punto
de vista, su actitud o su interpretación (Herrera 2003).
Ejemplo 4: Pregunta que evalúa Análisis
Considere los resultados del siguiente estudio:

En una investigación sobre heredabilidad de rasgos psicosociales, en este caso
la criminalidad, se conformaron tres grupos de sujetos así: el grupo A por
parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y
el grupo C por parejas de hermanos naturales. En ningún caso los hermanos
fueron separados. Una vez aplicados los instrumentos de medida
(cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de
acuerdo en relación con la presencia de conductas criminales:
GRUPOS A B C
% DE ACUERDO 77 35 8
Escoja la interpretación que mejor se ajuste a los datos de la investigación
A.A mayor concordancia genética corresponde un mayor porcentaje de
acuerdo
B.La criminalidad depende del medio ambiente en un 23%.
C.El bajo porcentaje registrado por el grupo C se debe a que es el grupo con
el menor nivel de homogeneidad genética
D.No se puede concluir en favor de la heredabilidad de las conductas
criminales.
Síntesis:
Es la capacidad para reunir diferentes elementos o partes
para formar un todo. Esto es, la habilidad para combinar
elementos con el fin de constituir una estructura o
esquema que no estaba presente con claridad. La
capacidad de síntesis incluye: a) producción de una
comunicación única, b) producción de un plan o conjunto
de operaciones con un fin determinado y c) derivación de
un conjunto de relaciones abstractas, explicaciones o
hipótesis para dar cuenta de un fenómeno dado. Es difícil
construir preguntas estructuradas que evalúen esta
categoría, son mucho más frecuentes las preguntas
abiertas de tipo ensayo (Herrera 2003).
Evaluación:
Es la capacidad para emitir juicios sobre ideas, obras,
métodos, materiales o soluciones, con algún propósito
determinado. Esta catego-ría incluye formulación de
juicios: a) con base en pautas internas como exactitud,
precisión y cuidado con que ha sido elabora-da una
comunicación dada; consistencia de los razona-mientos,
relaciones entre supues-tos, evidencias y conclusiones y
reco-noci-miento de los valores y puntos de vista utiliza-
dos en un juicio particular sobre una obra b) en términos
de criterios externos como comparación de un trabajo u
obra con otros, utilizando criterios o normas explícitas. Al
igual que en la categoría anterior, es difícil construir
preguntas estructuradas que evalúen esta categoría, son
más apropiadas las preguntas abiertas de tipo ensayo
(Herrera 2003).
Tipos de Preguntas
NOMBRE ELEMENTOS CARACTERISTICAS
Elección Un enunciado y cuatro Sólo una de las opciones completa correctamente el enunciado. Puede
múltiple o cinco opciones utilizarse para evaluar cualquier objetivo educativo especialmente
con única de respuesta recuerdo, comprensión y aplicación.
respuesta
Elección Un enunciado y cuatro Una, dos, tres o todas las opciones de respuesta pueden completar
múltiple (4) opciones de correctamente el enunciado, el examinado debe elegir una
con respuesta combinación de ellas. Adecuado para evaluar cualquier objetivo
múltiple educativo.
respuesta
Un problema y dos Una o las dos informaciones pueden ser necesarias y suficientes para
Información informaciones resolver el problema o pueden ser necesarias pero no suficientes. El
suficiente relacionadas con el evaluado no debe resolver el problema, sólo evaluar la información
mismo disponible. Excelente para evaluar aplicación.
Análisis de Una afirmación y dos Tanto la afirmación como los postulados son VERDADEROS. El
postulado postulados examinado evalúa la relación lógica entre ellos. Excelente para
s evaluar análisis.
Dos afirmaciones Tanto la afirmación como la razón pueden ser VERDADERAS o FALSAS.
Análisis de
separadas por la El examinado evalúa tanto su valor de verdad como la relación lógica
relaciones
palabra PORQUE entre ellas. Excelente para evaluar análisis.
Elección Múltiple con Única
Respuesta
Es el tipo de pregunta más conocido y usado en las pruebas
objetivas. Están conformadas por un enunciado y cuatro (4)
o cinco (5) opciones de respuesta. El enunciado puede
contener una frase incompleta, una interrogación, un texto o
una gráfica; las opciones de respuesta aparecen identificadas
con las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado. Este tipo
de pregunta es útil para evaluar cualquiera de las cuatro
primeras categorías de la taxonomía de Bloom. Los ejemplos
1 a 4 son preguntas de elección múltiple con única respuesta.
Elección Múltiple con Única
Respuesta
Además de las consideraciones generales sobre
construcción de preguntas, en este tipo de ítems es
altamente recomendable evitar expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES. Si más de una opción es correcta
probablemente la pregunta quede mejor formulada
con el formato de elección múltiple con múltiple
respuesta.
Elección Múltiple con Múltiple
Respuesta
Este tipo de pregunta consta de un enunciado y cuatro
(4) opciones de respuesta identificadas con los
números 1, 2, 3 y 4. Una o varias opciones de estas
pueden completar correctamente el enunciado. Este
tipo de pregunta es útil para evaluar cualquiera de las
categorías de objetivos educativos. Sin embargo, se
usa frecuentemente para evaluar comprensión y
aplicación utilizando: a) una situación en la que es
necesario considerar varias consecuencias posibles, b)
una situación en la que es necesario especificar una o
más condiciones para definirla adecuadamente, c) dos
situaciones semejantes o disímiles con respecto a uno
o más puntos de comparación, d) un principio que
puede aplicarse a más de una situación o e) varias
consideraciones que pueden conducir al mismo
Respuesta
Las instrucciones que se dan al examinado son,
generalmente de la siguiente forma:
"A continuación encontrará preguntas que constan de

un enunciado y cuatro (4) opciones de respuesta. Una
o varias opciones pueden completar correctamente el
enunciado. Usted debe marcar su hoja de respuestas
según el cuadro siguiente:
Marque A si las opciones 1, 2 y 3 son correctas

Marque B si las opciones 1 y 3 son correctas
Marque C si las opciones 2 y 4 son correctas
Marque D si sólo la opción 4 es correcta
Respuesta
Este tipo de pregunta no debe incluir distractores

mutuamente excluyentes por cuanto estarían anulando
una o varias opciones de respuesta; tampoco debe
incluir en las opciones de respuesta expresiones como
TODAS LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES.
Respuesta
Ejemplo:
La investigación empírica ha encontrado que:
1.Las personas toman menos tiempo en el aprendizaje de un

concepto cuando hay muchos atributos irrelevantes
2.Enel aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3.Enel aprendizaje de un concepto la velocidad de
aprendizaje es una función directa del número de atributos
4.Las personas toman más tiempo en el aprendizaje de un
concepto cuando hay muchos atributos relevantes
Información Suficiente
Estas preguntas constan de un problema y dos
informaciones identificadas con los números I y II.
No se requiere que el examinado resuelva el
problema, sino que decida si las informaciones
proporcionadas son necesarias y suficientes para
resolverlo. Este tipo de pregunta es muy útil para
evaluar aplicación.
Las instrucciones son, generalmente, las siguientes:
"Las preguntas que encontrará a continuación constan de

un problema y dos informaciones identificadas con los
números I y II. Usted debe decidir si las informaciones son
necesarias y suficientes para solucionar el problema y
marcar su hoja de respuestas según el cuadro siguiente: ...
Marque A sí necesita y basta con las informaciones I y II

Marque B si necesita y basta con la información I
Marque C si necesita y basta con la información II
Marque D si cualquiera de las dos informaciones sirve
Marque E si no es suficiente con las dos informaciones
Además de las normas generales, para la construcción
de este tipo de preguntas es necesario tener en
cuenta: a) las informaciones NO deben ser
contradictorias entre sí o mutuamente excluyentes, b)
en las preguntas de clave A, el problema debe poder
solucionarse con las dos informaciones sin requerir de
otra, c) en las preguntas de clave B, C o D, el
problema planteado debe poder solucionarse con una
sola información y d) en las preguntas de clave E las
informaciones deben ser necesarias pero NO
suficientes para resolver el problema.
Ejemplo 6: Pregunta de Información Suficiente
Se quiere comparar el tiempo de reacción ante un

estímulo en dos poblaciones. Se toman muestran
aleatorias de las poblaciones, se recogen los datos y
se elige un estadístico de prueba. Para decidir si se
acepta o rechaza una hipótesis de igualdad de medias
con un nivel de significancia , se requiere conocer:
I.la distribución del estadístico de prueba
II.la probabilidad de obtener un valor mayor que el
observado en el estadístico de prueba
Análisis de Postulados
 Este tipo de pregunta consta de una afirmación y dos
postulados identificados con los números I y II. Entre la
afirmación y los postulados se encuentra la palabra
POR CONSIGUIENTE. Para responder este tipo de
pregunta el examinado no necesita evaluar el valor de
verdad de las afirmaciones, todo se supone verdadero;
solo debe analizar la relación lógica existente entre
afirmación y postulados. Es un tipo de pregunta de
difícil elaboración y requiere de cuidadoso análisis
previo para que la respuesta sea inequívoca. Es muy
adecuado para evaluar análisis.
Las instrucciones para responder este tipo de pregunta son,
generalmente, como se muestra a continuación
"Las preguntas que encontrará a conti-nuación constan de

una afirmación VERDADERA y dos postulados también
VERDADEROS identifica-dos con los números I y II. Usted
debe deci-dir si los postula-dos se deducen lógicamente de
la afir-mación y contestar según el cuadro siguiente: ...
Marque A sí de la tesis se deducen los postulados I y II

Marque B si de la tesis solo se deduce el postulado I
Marque C si de la tesis solo se deduce el postulado II
Marque D si ninguno de los postulados se deduce de la tesis
Ejemplo 7: Pregunta de Análisis de Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno mental
POR CONSIGUIENTE
I.Un psicótico puede ser inimputable
II.Un inimputable comete un hecho típico y
antijurídico pero no culpable ni punible
 Además de las normas generales, para la construcción de este
tipo de preguntas es necesa-rio tener en cuenta: a) aun
cuando la instrucción le indica al examinado que debe suponer
todo verdadero, es recomendable que las afirmaciones lo sean
en efecto o, por lo menos que no sean absurdos u obviamente
falsos, b) todas las afirmaciones deben ser gramaticalmen-te
completas e independientes unas de otras, c) la construcción
de la pregunta debe ser tal que la deduc-ción lógica sea
indiscutible, de manera que la respues-ta co-rrecta sea
inequívoca y d) este tipo de pregunta es útil para poblaciones
de alto nivel educativo.
Análisis de Relaciones
 Las preguntas de este tipo presentan dos afirmaciones
unidas por la palabra PORQUE y la segunda afirmación se
considera una RAZON verdadera o supuesta de la primera.
El examinado debe evaluar tanto el valor de verdad de las
afirmaciones como la relación entre ellas. A diferencia de
las preguntas de análisis de postulados, en éstas las
afirmaciones pueden ser verdaderas o falsas. Este tipo de
preguntas es particularmente útil para evaluar análisis y
presenta menos dificultades prácticas que la pregunta de
análisis de postulados.
Las preguntas que encontrará a conti-nua-ción constan de una
afirmación y una razón unidas por la pala-bra PORQUE. Usted
debe juzgar tanto el grado de verdad o falsedad de cada una de
ellas como la relación existente entre las mismas, y contestar en
su hoja de respuestas según el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la segunda

es una razón o explicación correcta de la primera
Marque B si ambas afirmaciones son verdaderas pero la
segunda NO es una razón o explicación correcta de la primera
Marque C si la primera afirmación es verdadera pero la
segunda es falsa
Marque D si la primera afirmación es falsa pero la segunda
es verdadera
Marque E si ambas afirmaciones son falsas
Las preguntas que encontrará a conti-nua-ción constan de
una afirmación y una razón unidas por la pala-bra PORQUE.
Usted debe juzgar tanto el grado de verdad o falsedad de
cada una de ellas como la relación existente entre las
mismas, y contestar en su hoja de respuestas según el
cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la

segunda es una razón o explicación correcta de la primera
Marque B si ambas afirmaciones son verdaderas pero la
segunda NO es una razón o explicación correcta de la
primera
Marque C si la primera afirmación es verdadera pero la
segunda es falsa
Marque D si la primera afirmación es falsa pero la segunda
es verdadera
Marque E si ambas afirmaciones son falsas
 Para la construcción de este tipo de preguntas es
necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre sí o mutuamente excluyen-
tes y c) las afirmaciones deben estar construidas
de manera que pueda juzgarse su verdad o
falsedad independientemente, es decir, deben ser
frases gramaticalmente completas.
 Para la construcción de este tipo de preguntas es
necesario tener en cuenta: a) las afirmaciones no
deben ser obviamente falsas u obviamente
verdaderas, b) las afirmaciones no deben ser
contradictorias entre sí o mutuamente excluyen-
tes y c) las afirmaciones deben estar construidas
de manera que pueda juzgarse su verdad o
falsedad independientemente, es decir, deben ser
frases gramaticalmente completas.
Ejemplo 8: Pregunta de Análisis de Relaciones
El hemisferio cerebral izquierdo regula las

contracciones musculares del lado derecho del
cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en el

bulbo
ANÁLISIS DE LOS ÍTEMS
Estimación de la Dificultad del ítems
Éxito en la estimación en contextos variados
Propiedades del sujeto Propiedades de los ítems
Halo Azar
Covarianza con la prueba
Juicios Subjetivos (Homogeneidad)
Frecuencia de cada opción
Calificación Dificultad
Discriminación
Administración
Correlación con la prueba
Rapport
INDICE DE DIFICULTAD
 Indica la proporción de aciertos en la muestra de
alumnos que estamos utilizando. Es la media de éste
50% de sujetos analizados.
 El término de dificultad se presta a equívocos: in índice

mayor indica un pregunta mas fácil.
 Este índice de dificultad sirve para evaluar cuatro

variables:
6. La complejidad de la habilidad medida.
7. Las características del logro del grupo.
8. La comparación de distintos reactivos que miden la
misma habilidad.
9. La comparación de reactivos que miden la misma
habilidad pero con una relación jerárquica.
INDICE DE DIFICULTAD
Se fija un mínimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida inferior a
0.5, aunque no quiere decir que el reactivo no sirve, es
mejor no usarlo porque podría ser que lo que está mal son
las instrucciones.
Criterios para calificar la dificultad de los reactivos de

acuerdo al valor del índice de dificultad de los reactivos p.
Muy difícil Optima Ligeramente fácil Muy fácil

0% - 49% 50% - 69% 70% - 89% 90% - 100%
INDICES DE DISCRIMINACION
 Los índices de discriminación expresan en que
medida cada pregunta o ítem diferencia a los que
mas saben de los que menos saben.
 Es el índice probablemente más utilizado. Expresa

hasta que punto la pregunta discrimina, establece
diferencias, contribuye a situar a un sujeto en el
grupo superior e inferior.
 A mayor diferencia, en numero de acertantes entre

los grupos superior e inferior, el ítem es mas
discriminante, contribuye mas a situar a un sujeto
entre los primeros o entre los últimos.
 Las preguntas muy fáciles y muy difíciles no
discriminan, no establecen diferencias; nos dicen
que todos saben o no saben una pregunta, pero
no quien sabe mas y quien menos. Estas
preguntas no contribuyen a la fiabilidad del test,
pero eso no quiere decir necesariamente que
sean malas preguntas.
 Si todos y solos los del grupo superior

responden correctamente, tendremos que:
ID=1.
 Si todos y solos los del grupo inferior

responden correctamente, tendremos que: ID=
-1.
 Si el ID es menor de 0.30 el ítem debe
eliminarse porque no discrimina, aún
cuando su nivel de dificultad sea óptimo.
 Si el ítem tiene un ID igual o superior a

0.30 y su nivel de dificultad no es óptimo
debe entonces corregirse y mejorarse ya
que discrimina y puede considerarse como
un ítem adecuado para la prueba. A
mayor valor, mayor poder discriminativo.
Forma de calcular D y P
 Procedimiento:
2. Hallar los puntajes totales por sujeto.
4. Ordenarlos de mayor a menor o al revés. Nos

interesan los puntajes extremos (27% de
bajos) y (27% de altos) y los puntajes
promedio no sirven para el análisis, se ocultan.
Por ejemplo, si hay 100 datos el 27% serian 27
datos y si fueran 70 datos el 27% seria
equivalente a 18 datos.
1. Calcular el número de sujetos del grupo de los
altos que responde correctamente bien cada
ítem y calcular el número de sujetos del grupo
de los bajos que responde bien cada ítem.
2. Identificar el índice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el índice de dificultad con la formula:
D = GA + GB
G(total).

Psi Come Tria

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Psi Come Tria

Încărcat de

Drepturi de autor:

Formate disponibile

PSICOMETRÍA

1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Psicometría Evaluación psicológica

Énfasis en la medición Énfasis en el diagnóstico

Instrumentos y tests La persona

 En 1869 Francis Galton publica el libro Genio Hereditario

 En 1905 Alfredo Binet y Theodore Simon

 En 1980 Rasch plantea la Teoría de la Respuesta

Análisis de la prueba Análisis de ítems

En una muestra pequeña En grandes muestras de

 El error de medida se establece como la diferencia

 Si en una población se conocen las puntuaciones V

 Si en una población conociéramos las

 La puntuación que una persona obtenga será diferente

 La TCT supone que el error de medida es una propiedad

 No hay como tal puntuaciones verdaderas sino una

 Independencia local: entre los ítems de un test si la respuesta

 Puede aplicarse en diferentes campos de la

 Tabla de puntuaciones y baremos.

 Es un documento donde se menciona:

 No puede rayarse ni se puede escribir sobre este

 Es la hoja donde la persona anota las respuestas

 Una vez que la persona entrega la hoja de

Puntuación cruda o bruta

∑ Puntuación de los ítems – Errores

Puntuación estándar o típica

Perfil del sujeto

 Esa puntuación bruta se analiza en la tabla de

 Por ejemplo, para una misma prueba existen

Clasificación de las pruebas

Según Según la forma de Según la(s) variable(s)

- Autoaplicación -De desempeño - De capacidad mental

 Pruebas de aplicación individual: son aquellas que el

 Pruebas de aplicación grupal: son aquellas que el

 Pruebas de poder: miden el nivel de destreza mental de

 Pruebas de velocidad: miden cuantos ítems responde el

 Pruebas con referencia a la norma o al criterio: mide la

 Pruebas de aprovechamiento o conocimiento.

 Pruebas de actitudes, aptitudes, intereses,

 Pregunta(s): son cuestionamientos que evalúan

 Opciones de respuesta: incluyen una(s) respuestas(s)

Clasificación de los ítems

- De elección - De opción binaria

 Elección múltiple: entre más de dos alternativas

 Emparejamiento: consiste en encontrar las

 Opción binaria: la persona debe manifestar si está de

 Categorías ordenadas: el formato establece un continuo

 Adjetivos bipolares: este formato es típico de lo que se

 Es el grado en el cual las mediciones

 Permite predecir el desempeño de un

 Formas paralelas: consiste en aplicar un test homologo o

 División por mitades: consiste en comparar los

 Test-retest: coeficiente de estabilidad (r).

 Formas paralelas: coeficiente de

 División por mitades: coeficiente de

 Conjunto de pruebas y datos que han de

 Validez del contenido.

 Validez con relación a criterio.

 Validez del constructo.

 Los ítems o preguntas se seleccionan según su:

 También se le denomina validez cruzada o

 Es el grado de precisión con que las

 Se obtiene mediante la correlación entre

 La contaminación de los criterios: