Psicometra 100509194052 Phpapp01

PSICOMETRA
Diseado por:
Germn Andrs Torres
Escobar
Hitos en la historia de la
psicometra
AO HITO O ACONTECIMIENTO
1115 a.C. En China se utilizan tests para acceder a puestos en el gobierno.
1869 d C. Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs
de estudios estadsticos que la inteligencia se hereda.
1904 1910 d. C. Charles Spearman funda la Teora Clsica de los tests o del modelo lineal
y publica su teora de los factores de la inteligencia y las formulas de atenuacin.
1905 d.C. Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios,
con el fin de establecer su edad mental y predecir su rendimiento acadmico.
1918 d.C. Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados
durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal
Data Sheet para detectar los soldados que pudieran tener crisis nerviosas.
1931 d.C. Thurstone publica su libro The reliability and validity of tests.
1939 d.C. Wechsler propone su escala de medida para la inteligencia.
1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Inventory (MMPI).
1960 d.C. Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de
varianza para interpretar las fuentes de error en los puntajes.
1980 d.C. Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite
conocer la informacin de cada tem para disear pruebas individualizadas.
La psicometra
Es la rama de la
psicologa que
desarrolla y estudia
las propiedades de
las pruebas
psicolgicas o tests
para medir las
variables psicolgicas
con la mayor
precisin posible.
Diferencia entre psicometra y
evaluacin psicolgica
Psicometra Evaluacin
psicolgica
nfasis en la nfasis en el
medicin diagnstico
Instrumentos y tests La persona

Historia de la psicometra
Antecedentes histricos.
Modelos de medicin.
Antecedentes histricos
Hacia el ao 1115 a.C. se utilizan comienzan a
utilizar en China los primeros tests que buscan
medir las capacidades de aspirantes para acceder a
puestos del gobierno (primera medicin de
capacidades).
En 1869 Francis Galton publica el libro Genio

Hereditario donde plantea a travs de estudios
estadsticos que la inteligencia se hereda y que es
posible medirla (estudios estadsticos en
psicologa).
Entre 1904 y 1910 Charles Spearman funda
la Teora Clsica de los tests o del modelo
lineal y publica su teora de los factores de
la inteligencia y las formulas de atenuacin
(Estrategias de medicin y TCT).
En 1905 Alfredo Binet y Theodore Simon

publican la primera escala de inteligencia
para nios, con el fin de establecer su edad
mental y predecir su rendimiento
acadmico (uno de los primeros tests
psicolgicos).
En 1960 Lee Cronbach propone su Teora
de la Generalizacin en la cual utiliza el
anlisis de varianza para interpretar las
fuentes de error en los puntajes.
Igualmente l desarroll estrategias para la
medicin de la confiabilidad de un test.
En 1980 Rasch plantea la Teora de la

Respuesta al tem o del rasgo latente que
permite conocer la informacin de cada
tem para disear pruebas individualizadas.
Modelos de medicin
Teora Clsica de Teora de la Respuesta
los Tests (TCT) al tem (TRI)
Anlisis de la prueba Anlisis de tems

completa individuales
En una muestra En grandes muestras

pequea de sujetos (N de sujetos (N 500)
< 500)
Teora clsica de los Tests
El modelo de puntuacin verdadera se concreta
en un primer supuesto:
X=V+E
que indica que la puntuacin emprica
directa de una persona en un test (X) est
compuesta por la puntuacin verdadera de la
persona (V) y un error de medida (E) que se
comete al medir el rasgo con el test.
El error de medida se establece como la

diferencia entre la puntuacin emprica y la
verdadera:
E=X-V
La puntuacin verdadera se obtiene con el
promedio de las puntuaciones empricas que
obtiene la persona en un nmero elevado de
aplicaciones del test:
V = E[X]
Si en una poblacin se conocen las puntuaciones

V y E de los individuos, la correlacin entre
ambas variables sera nula, porque se asume
que puntuaciones verdaderas elevadas no
tienen porqu tener asociados errores elevados:
r VE =0
Si en una poblacin conociramos los
errores de medida de cada individuo quien
ha realizado dos tests diferentes (j y k), la
correlacin entre ambas variables tambin
sera nula:
E jEk = 0
Si en una poblacin conociramos las

puntuaciones E en un test j y las
puntuaciones V en un test k, ambas
variables correlacionaran cero:
E jVk = 0
Limitaciones de la Teora
Clsica
Las caractersticas de los tems (dificultad y
discriminacin) dependen del grupo de personas
en el que se han aplicado.
La puntuacin que una persona obtenga ser

diferente si se le aplican dos tests que midan la
misma caracterstica pero cuyo nivel de dificultad
sea diferente.
La TCT supone que el error de medida es una

propiedad del test y, por lo tanto, igual para todos
los sujetos, independientemente de cual sea su
puntuacin.
Teora de la Respuesta al
tem
Unidimensionalidad: todos los tems que forman el
test han de medir un mismo y nico rasgo. El
supuesto de unidimensionalidad exige que todos y
cada uno de los tems del test midan una nica
dimensin.
No hay como tal puntuaciones verdaderas sino una

probabilidad de acierto determinada por unos
parmetros.
Independencia local: entre los tems de un test si la

respuesta que una persona da a uno de ellos no
depende de las respuestas que da a los otros, ni por el
orden de presentacin de los tems, las respuestas
que ya se hayan dado, etc.
Un prueba psicolgica o test
Es un instrumento en formato impreso o digital
que consta de una serie de preguntas o
reactivos que miden unas variables psicolgicas
especificas a travs de un sistema de
puntuacin.
Puede aplicarse en diferentes campos de la

psicologa, para fines diversos como diagnstico
clnico (psicologa clnica) , seleccin de
personal (psicologa organizacional) o anlisis
de aptitudes vocacionales (psicologa
educativa).
Estructura general de un test
impreso
Cuadernillo de instrucciones.
Cuadernillo de preguntas.
Hoja(s) de respuestas.
Plantilla de correccin.
Tabla de puntuaciones y baremos.

El cuadernillo de
instrucciones
Es un documento donde se menciona:
- El nombre de la prueba, sus autores y el
ao de publicacin.
- La(s) variable(s) que mide y sus objetivos.
- Los antecedentes (marco conceptual y
terico) de la prueba.
- Las instrucciones generales de aplicacin
(para los psiclogos).
El cuadernillo de preguntas
Es un documento que consta de:
- Las instrucciones de respuesta (para quien
la va a responder).
- Los tems o preguntas.
No puede rayarse ni se puede escribir

sobre este ya que se usa en diferentes
aplicaciones.
La hoja de respuestas y plantilla de
correccin
Es la hoja donde la persona anota las

respuestas a de los tems planteados en el
cuadernillo de preguntas.
Una vez que la persona entrega la hoja de

respuestas al psiclogo, l o ella la califican
poniendo encima de la hoja de respuestas,
la plantilla de correccin para ver en cuales
acert el sujeto y en cuales no.
El sistema de puntuacin
Puntuacin cruda o bruta
Puntuacin de los tems Errores
Puntuacin estndar o tpica
Centiles Puntuaciones T, S o Z
Perfil del sujeto

La tabla de puntuaciones y
baremos
Una vez que se han obtenido los aciertos y
errores de la persona con ayuda de la plantilla,
se obtiene una puntuacin cruda o bruta,
que es especifica para ese sujeto.
Esa puntuacin bruta se analiza en la tabla de

puntuaciones estndar, para obtener una
puntuacin estndar o tpica del sujeto
dentro de la poblacin o muestra de sujetos que
present la prueba (baremo).
Los baremos
Son tablas de puntuaciones estndar que se
clasifican por grupos poblacionales o
muestrales segn la edad, profesin o
gnero.
Por ejemplo, para una misma prueba existen

baremos para hombres, mujeres, hombres
profesionales, mujeres profesionales,
estudiantes de secundaria, etc.
Tipos de pruebas o tests
Clasificacin de las pruebas
Segn Segn la forma de Segn la(s) variable(s)

la aplicacin medir la(s) variable(s) que miden
- Autoaplicacin -De desempeo - De capacidad mental

- Individual - De poder - De conocimientos
- Grupal - De velocidad - De personalidad
Clasificacin de las pruebas por
aplicacin
Pruebas de autoaplicacin: son tests que no
requieren la aplicacin por parte de un psiclogo
sino que puede hacerlas la persona con ayuda de
un computador.
Pruebas de aplicacin individual: son aquellas

que el psiclogo administra a una sola persona.
Por ejemplo, en un caso clnico.
Pruebas de aplicacin grupal: son aquellas que el

psiclogo pueden aplicar a varias personas al
mismo tiempo, pero controlando que no
conversen entre ellas. Por ejemplo, una prueba
de aptitudes e intereses vocacionales.
Clasificacin de las pruebas segn la
forma de medir la(s) variable(s)
Pruebas de desempeo: miden el rendimiento
mximo (individual) o el rendimiento normal o
tpico (de un grupo).
Pruebas de poder: miden el nivel de destreza

mental de un sujeto o su nivel de conocimiento.
Pruebas de velocidad: miden cuantos tems

responde el sujeto en un tiempo especifico.
Pruebas con referencia a la norma o al criterio :

mide la variables psicolgica segn objetivos
especficos.
Clasificacin de las pruebas segn las
variables que miden
Pruebas de capacidad mental (inteligencia).
Pruebas de aprovechamiento o
conocimiento.
Pruebas de personalidad.
Pruebas de actitudes, aptitudes, intereses,

motivacin, opinin y valores.
Pruebas neuropsicolgicas.
Estructura general de un
tem
Enunciado: menciona las instrucciones para
contestar el tem y plantea un contexto o
situacin a partir del cual se hace la pregunta.
Pregunta(s): son cuestionamientos que evalan

directamente la variable psicolgica de forma
implcita. Pueden ser abiertas (libre respuesta) o
cerradas (opciones especificas).
Opciones de respuesta: incluyen una(s)

respuestas(s) correcta(s) y un(os) distractor(es) o
respuesta(s) falsa(s).
Clasificacin del formato de
respuestas
Clasificacin de los tems
En tests de En tests de
rendimiento ptimo rendimiento tpico
- De eleccin - De opcin binaria

- De adjetivos
- De emparejamiento - De categoras ordenadas
Clasificacin de las respuestas en
tests de rendimiento ptimo
Eleccin binaria: de dos alternativas, se elige
la que se considera correcta (S o No) o
(verdadero-falso).
Eleccin mltiple: entre ms de dos

alternativas se elige la que se considera
correcta.
Emparejamiento: consiste en encontrar las

parejas entre dos conjuntos de conceptos.
Clasificacin de las respuestas en
tests de rendimiento tpico
Opcin binaria: la persona debe manifestar si est

de acuerdo o en desacuerdo con una afirmacin.
Categoras ordenadas: el formato establece un

continuo ordinal de ms de dos categoras, que
permite a la persona matizar mejor su respuesta.
Adjetivos bipolares: este formato es tpico de lo

que se denomina "diferencial semntico".
Confiabilidad
Es el grado en el cual las mediciones
repetidas de un fenmeno
relativamente estable son
aproximadas entre s o consistentes.
Permite predecir el desempeo de un

grupo o de un sujeto e igualmente
sirve para describirlo en ambos casos.
Formas de medir la
confiabilidad
Test-retest: consiste en aplicar un test dos veces
a un mismo grupo en un intervalo de das o
meses (no superior).
Formas paralelas: consiste en aplicar un test

homologo o equivalente a un mismo grupo pero
en tiempos diferentes.
Divisin por mitades: consiste en comparar los

resultados de los tems pares e impares en la
aplicacin grupal de un test.
Coeficientes de
confiabilidad
Test-retest: coeficiente de estabilidad
(r).
Formas paralelas: coeficiente de

equivalencia (r).
Divisin por mitades: coeficiente de

consistencia interna (r).
Coeficientes ms usados en
divisin por mitades
Formas de mejorar la
confiabilidad de un test
Para calcular el nmero de tems K para
lograr una confiabilidad RXY deseada
(superior a 0.7) se usa la formula:
K = RXY * (1 rXY) / rXY) * (1 RXY)
donde rX es la confiabilidad inicial.
Una vez obtenido el nmero K se multiplica
por el nmero de items inicial y luego se le
resta a ese resultado el nmero de tems
inicial.
Para calcular la confiabilidad al quitar
un nmero de tems X con un total de
tems Y y con una confiabilidad
conocida C se usa la siguiente formula:
YX/Y
El resultado obtenido con esta formula
debe operarse con la formula 2:
[resultado 1 * C]
[1 + (resultado 1 1) * C]
VALIDEZ
Es el grado en el cual una prueba
mide lo que pretende medir.
Conjunto de pruebas y datos que han

de recogerse para garantizar la
pertinencia predictiva de las
inferencias que hacen a partir de un
test.
Tipos de validez
Validez del contenido.
Validez con relacin a criterio.
Validez del constructo.

VALIDEZ DEL CONTENIDO
Es la muestra adecuada y representativa de los
contenidos que se pretende evaluar con un test.
Los tems o preguntas se seleccionan segn su:

- Coherencia: con las caractersticas y variables.
- Relevancia: de acuerdo con el indicador.
- Buena redaccin: la gramtica del tem.
- Validez aparente: para el evaluado.
VALIDEZ CON RELACIN AL
CRITERIO
Es la comparacin del desempeo de
un grupo de sujetos en un test respecto
patrones de medida ya establecidos.
Se clasifica en:
- Validez concurrente.
- Validez predictiva.
Validez concurrente
Es el anlisis de variabilidad que
efecta al comparar el desempeo
de dos grupos de distintos de sujetos
en un mismo test.
Tambin se le denomina validez

cruzada o entre distintas muestras.
Validez predictiva
Es el grado de precisin con que las
calificaciones de la prueba predicen
las calificaciones del criterio.
Se obtiene mediante la correlacin

entre una variable de indicador y una
variable criterio a partir de r (Pearson),
cuyo valor es igual o menor a 0,60.
Factores que afectan la validez
con relacin a los criterios
Las diferencias de grupo:
sexo, edad y rasgos de personalidad.
La contaminacin de los criterios :

evidencias falsas que les restan validez.
El ndice de base (debe ser mayor de 50) :

nmero de personas que poseen la variable medida.
El incremento de la validez:
costo razonable del instrumento.
VALIDEZ DEL CONSTRUCTO
Es el grado de exactitud con el que
se mide un constructo o concepto
psicolgico particular.
Depende de unas condiciones que

son externas al evaluador y la
persona que disea la prueba.
Condiciones de la
validez del constructo
Valoracin por parte de jueces expertos
de la correspondencia contenido-
concepto.
Anlisis de la consistencia interna de la

prueba.
Estudio de las variables intervinientes en

la calificacin.
Anlisis factorial y correlacin con
otras pruebas.
Anlisis de las respuestas.
Correlaciones altas con otras medidas

o mtodos para medir el mismo
constructo (Validez convergente).
Correlaciones bajas con las medidas

de constructos diferentes (Validez
discriminante).
CONSTRUCCIN DE LOS
TEMS
La Taxonoma de Bloom
El dominio cognoscitivo comprende 6
categoras:
1. Recuerdo
2. Comprensin
3. Aplicacin
4. Anlisis
5. Sntesis
6. Evaluacin
Recuerdo:
Incluye situaciones de examen que acentan la
importancia del recuerdo de datos, ideas,
materiales o fenmenos, ya sea como
reconocimiento o evocacin. Supone, el recuerdo o
reconocimiento de: Datos especficos como
terminologas o hechos; modos y medios para el
tratamiento de datos especficos como
convenciones, clasificaciones, metodologas,
tcnicas o procedimientos y, universales y
abstracciones en un campo determinado como
principios, generalizaciones, teoras y estructuras
(Herrera, 2003).
Ejemplo 1: Pregunta que evala Recuerdo
A continuacin encontrar preguntas que constan de un

enunciado y cuatro (4) o cinco (5) opciones de respuesta.
Usted debe marcar en su hoja de respuesta, aquella
opcin que considere correcta.
El modelo de control social propuesto por Max Weber para

las organizaciones, se denomina modelo:
A.- de los sistemas
B.- burocrtico
C.- estructuralista
D.- de las organizaciones
Comprensin:
Implica la inteleccin y fraccionamiento de un mensaje.
Operacionalmente se define como cualquier conducta
que vaya desde la presentacin de una proposicin con
palabras distintas de las del enunciado original, hasta la
aplicacin de un principio en una situacin nueva para el
examinado, pasando por la ejemplificacin. Se define en
trminos de tres operaciones: a) Traduccin o capacidad
para expresar un concepto o mensaje conocido en
palabras diferentes o pasarlo de un sistema simblico a
otro, b) Interpretacin o reordenamiento de ideas de una
comunicacin en una nueva configuracin. Incluye la
habilidad para captar el contenido de una comunicacin
como un todo y distinguir entre conclusiones legtimas y
contradictorias y c) Extrapolacin o hacer explcitas
algunas conclusiones, colorarios, consecuencias o efectos
de una comunicacin dada (Herrera, 2003).
Ejemplo 2: Pregunta que evala Comprensin
Si un psiclogo afirma que una prueba que ha preparado para
seleccin de personal tiene un coeficiente de validez predictiva
mas alto que el de fiabilidad, concluira que
A. est bien, por cuanto lo mas importante para la seleccin es

la validez de prediccin
B. debera tener mas alta fiabilidad que validez ya que lo
principal es la confianza en el instrumento
C. debe tener un error ya que la validez predictiva NO puede ser
mayor al coeficiente de fiabilidad
D. debe tener un error ya que los dos coeficientes, el de validez
y el de fiabilidad deben tener igual valor
E. no debera utilizar la prueba ya que debe tener mas alta
fiabilidad que validez para el objeto propuesto
Aplicacin:
Se refiere a la capacidad para aplicar teoras, principios,
mtodos o ideas en la solucin de un problema prctico.
Es la habilidad para aplicar principios y generalizaciones a
nuevos problemas y situaciones. Comprende entonces
tareas como a) identificar los principios o generalizaciones
apropiados para resolver un problema o reformularlo para
lograr tal identificacin, b) especificar los lmites dentro de
los cuales un principio o generalizacin es verdadero o
relevante y reconocer las excepciones a los mismos y las
razones para ello, c) explicar nuevos fenmenos a partir
de principios o generalizaciones conocidas, predecir lo que
suceder en una situacin nueva mediante el uso de
principios y generalizaciones apropiadas, y d) determinar o
justificar una decisin o accin en una situacin usando
principios o generalizaciones e indicar el razonamiento
que apoya la utilizacin de los mismos ante un
determinado problema (Herrera 2003).
Ejemplo 3: Pregunta que evala Aplicacin
Escoja la caracterstica del pensamiento infantil que mejor se

ajusta a la conducta descrita por Piaget:
- Cmo se hace para tener madera? Se cortan los troncos de los
rboles.
- Qu se hace para tener rboles? Se siembran los granos. - Y los
granos? Se compran.
- Dnde? En los almacenes. - Y el dueo del almacn? Pinsalo
un poco. Los hace.
- Con qu? Con otros granos. - Cuando vinieron los primeros
hombres, haba ya rboles? No.
- Cmo han comenzado? Por los granos. - De dnde venan estos
granos? Del almacn.
A. Realismo
B. Animismo
C. Artificialismo
D. Sincretismo
E. Funcionalismo
Anlisis:
Hace referencia a la habilidad para fraccionar una
comunicacin en sus elementos, de manera que aparezcan
explcitas la jerarqua de las ideas y las relaciones existentes
entre ellas. Esta es un proceso complejo que implica las tres
categoras anteriores; recuerdo, comprensin y aplicacin,
pero va mas all de ellas. Aqu se incluyen tres subcategoras:
a) anlisis de elementos o habilidad para fraccionar una
informacin en sus elementos, como supuestos no explcitos,
hechos e hiptesis; b) anlisis de relaciones o identificar la
relaciones que existen entre los elementos de una
comunicacin; inferir los criterios, relaciones, cualidades,
suposiciones o condiciones implcitas en una comunicacin; o
bien, determinar las relaciones entre las hiptesis y las
pruebas que la apoyan, entre las conclusiones y las hiptesis,
o entre las conclusiones y las evidencias; y c) anlisis de
principios de organizacin que es la habilidad para explicitar
los principios organizadores que ha seguido un autor, reducir
su propsito, su punto de vista, su actitud o su interpretacin
(Herrera 2003).
Ejemplo 4: Pregunta que evala Anlisis
Considere los resultados del siguiente estudio:

En una investigacin sobre heredabilidad de rasgos psicosociales, en este
caso la criminalidad, se conformaron tres grupos de sujetos as: el grupo A
por parejas de gemelos univitelinos, el grupo B por parejas de gemelos
bivitelinos y el grupo C por parejas de hermanos naturales. En ningn caso
los hermanos fueron separados. Una vez aplicados los instrumentos de
medida (cuestionarios, encuestas, etc.,), se encontraron los siguientes
porcentajes de acuerdo en relacin con la presencia de conductas
criminales:
GRUPOS A B C
% DE ACUERDO 77 35 8
Escoja la interpretacin que mejor se ajuste a los datos de la investigacin
A. A mayor concordancia gentica corresponde un mayor porcentaje de
acuerdo
B. La criminalidad depende del medio ambiente en un 23%.
C. El bajo porcentaje registrado por el grupo C se debe a que es el grupo
con el menor nivel de homogeneidad gentica
D. No se puede concluir en favor de la heredabilidad de las conductas
criminales.
Sntesis:
Es la capacidad para reunir diferentes elementos o
partes para formar un todo. Esto es, la habilidad
para combinar elementos con el fin de constituir
una estructura o esquema que no estaba presente
con claridad. La capacidad de sntesis incluye: a)
produccin de una comunicacin nica, b)
produccin de un plan o conjunto de operaciones
con un fin determinado y c) derivacin de un
conjunto de relaciones abstractas, explicaciones o
hiptesis para dar cuenta de un fenmeno dado. Es
difcil construir preguntas estructuradas que
evalen esta categora, son mucho ms frecuentes
las preguntas abiertas de tipo ensayo (Herrera
2003).
Evaluacin:
Es la capacidad para emitir juicios sobre ideas,
obras, mtodos, materiales o soluciones, con algn
propsito determinado. Esta categora incluye
formulacin de juicios: a) con base en pautas
internas como exactitud, precisin y cuidado con
que ha sido elaborada una comunicacin dada;
consistencia de los razonamientos, relaciones entre
supuestos, evidencias y conclusiones y reconoci
miento de los valores y puntos de vista utilizados
en un juicio particular sobre una obra b) en
trminos de criterios externos como comparacin
de un trabajo u obra con otros, utilizando criterios o
normas explcitas. Al igual que en la categora
anterior, es difcil construir preguntas estructuradas
que evalen esta categora, son ms apropiadas las
preguntas abiertas de tipo ensayo (Herrera 2003).
Tipos de Preguntas
NOMBRE ELEMENTOS CARACTERISTICAS
Eleccin Un enunciado y cuatro Slo una de las opciones completa correctamente el enunciado. Puede
mltiple o cinco opciones utilizarse para evaluar cualquier objetivo educativo especialmente
con nica de respuesta recuerdo, comprensin y aplicacin.
respuesta
Eleccin Un enunciado y cuatro Una, dos, tres o todas las opciones de respuesta pueden completar
mltiple (4) opciones de correctamente el enunciado, el examinado debe elegir una
con respuesta combinacin de ellas. Adecuado para evaluar cualquier objetivo
mltiple educativo.
respuesta
Un problema y dos Una o las dos informaciones pueden ser necesarias y suficientes para
Informacin informaciones resolver el problema o pueden ser necesarias pero no suficientes. El
suficiente relacionadas con el evaluado no debe resolver el problema, slo evaluar la informacin
mismo disponible. Excelente para evaluar aplicacin.
Anlisis de Una afirmacin y dos Tanto la afirmacin como los postulados son VERDADEROS. El
postulado postulados examinado evala la relacin lgica entre ellos. Excelente para
s evaluar anlisis.
Dos afirmaciones Tanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS.
Anlisis de separadas por la El examinado evala tanto su valor de verdad como la relacin lgica
relaciones palabra PORQUE entre ellas. Excelente para evaluar anlisis.
Eleccin Mltiple con nica
Respuesta
Es el tipo de pregunta ms conocido y usado en las
pruebas objetivas. Estn conformadas por un
enunciado y cuatro (4) o cinco (5) opciones de
respuesta. El enunciado puede contener una frase
incompleta, una interrogacin, un texto o una grfica;
las opciones de respuesta aparecen identificadas con
las letras A, B, C, D y E. Una sola de las opciones
completa o responde correctamente el enunciado.
Este tipo de pregunta es til para evaluar cualquiera
de las cuatro primeras categoras de la taxonoma de
Bloom. Los ejemplos 1 a 4 son preguntas de eleccin
mltiple con nica respuesta.
Eleccin Mltiple con nica
Respuesta
Adems de las consideraciones generales sobre
construccin de preguntas, en este tipo de
tems es altamente recomendable evitar
expresiones como TODAS LAS ANTERIORES o
NINGUNA DE LAS ANTERIORES. Si ms de una
opcin es correcta probablemente la pregunta
quede mejor formulada con el formato de
eleccin mltiple con mltiple respuesta.
Eleccin Mltiple con Mltiple
Respuesta
Este tipo de pregunta consta de un enunciado y cuatro (4)
opciones de respuesta identificadas con los nmeros 1, 2, 3
y 4. Una o varias opciones de estas pueden completar
correctamente el enunciado. Este tipo de pregunta es til
para evaluar cualquiera de las categoras de objetivos
educativos. Sin embargo, se usa frecuentemente para
evaluar comprensin y aplicacin utilizando: a) una
situacin en la que es necesario considerar varias
consecuencias posibles, b) una situacin en la que es
necesario especificar una o ms condiciones para definirla
adecuadamente, c) dos situaciones semejantes o dismiles
con respecto a uno o ms puntos de comparacin, d) un
principio que puede aplicarse a ms de una situacin o e)
varias consideraciones que pueden conducir al mismo
resultado.
Respuesta
Las instrucciones que se dan al examinado son, generalmente
de la siguiente forma:
"A continuacin encontrar preguntas que constan de un

enunciado y cuatro (4) opciones de respuesta. Una o varias
opciones pueden completar correctamente el enunciado. Usted
debe marcar su hoja de respuestas segn el cuadro siguiente:
Marque A si las opciones 1, 2 y 3 son correctas

Marque B si las opciones 1 y 3 son correctas
Marque C si las opciones 2 y 4 son correctas
Marque D si slo la opcin 4 es correcta
Marque E si todas las opciones son correctas
Respuesta
Este tipo de pregunta no debe incluir

distractores mutuamente excluyentes por
cuanto estaran anulando una o varias opciones
de respuesta; tampoco debe incluir en las
opciones de respuesta expresiones como TODAS
LAS ANTERIORES o NINGUNA DE LAS
ANTERIORES.
Respuesta
Ejemplo:
La investigacin emprica ha encontrado que:
1. Las personas toman menos tiempo en el aprendizaje

de un concepto cuando hay muchos atributos
irrelevantes
2. En el aprendizaje de un concepto son mejores los
ejemplos negativos que los positivos
3. En el aprendizaje de un concepto la velocidad de
aprendizaje es una funcin directa del nmero de
atributos
4. Las personas toman ms tiempo en el aprendizaje
de un concepto cuando hay muchos atributos relevantes
Informacin Suficiente
Estas preguntas constan de un problema y
dos informaciones identificadas con los
nmeros I y II. No se requiere que el
examinado resuelva el problema, sino que
decida si las informaciones proporcionadas
son necesarias y suficientes para resolverlo.
Este tipo de pregunta es muy til para
evaluar aplicacin.
Las instrucciones son, generalmente, las siguientes:
"Las preguntas que encontrar a continuacin constan de

un problema y dos informaciones identificadas con los
nmeros I y II. Usted debe decidir si las informaciones son
necesarias y suficientes para solucionar el problema y
marcar su hoja de respuestas segn el cuadro siguiente: ...
Marque A s necesita y basta con las informaciones I y II

Marque B si necesita y basta con la informacin I
Marque C si necesita y basta con la informacin II
Marque D si cualquiera de las dos informaciones sirve
Marque E si no es suficiente con las dos informaciones
Adems de las normas generales, para la
construccin de este tipo de preguntas es
necesario tener en cuenta: a) las informaciones
NO deben ser contradictorias entre s o
mutuamente excluyentes, b) en las preguntas
de clave A, el problema debe poder solucionarse
con las dos informaciones sin requerir de otra, c)
en las preguntas de clave B, C o D, el problema
planteado debe poder solucionarse con una sola
informacin y d) en las preguntas de clave E las
informaciones deben ser necesarias pero NO
suficientes para resolver el problema.
Ejemplo 6: Pregunta de Informacin Suficiente
Se quiere comparar el tiempo de reaccin ante un

estmulo en dos poblaciones. Se toman muestran
aleatorias de las poblaciones, se recogen los datos
y se elige un estadstico de prueba. Para decidir si
se acepta o rechaza una hiptesis de igualdad de
medias con un nivel de significancia , se requiere
conocer:
I. la distribucin del estadstico de prueba
II. la probabilidad de obtener un valor mayor que
el observado en el estadstico de prueba
Anlisis de Postulados
Este tipo de pregunta consta de una afirmacin y
dos postulados identificados con los nmeros I y II.
Entre la afirmacin y los postulados se encuentra
la palabra POR CONSIGUIENTE. Para responder
este tipo de pregunta el examinado no necesita
evaluar el valor de verdad de las afirmaciones,
todo se supone verdadero; solo debe analizar la
relacin lgica existente entre afirmacin y
postulados. Es un tipo de pregunta de difcil
elaboracin y requiere de cuidadoso anlisis
previo para que la respuesta sea inequvoca. Es
muy adecuado para evaluar anlisis.
Las instrucciones para responder este tipo de pregunta
son, generalmente, como se muestra a continuacin
"Las preguntas que encontrar a continuacin constan

de una afirmacin VERDADERA y dos postulados
tambin VERDADEROS identificados con los nmeros I
y II. Usted debe decidir si los postulados se deducen
lgicamente de la afirmacin y contestar segn el
cuadro siguiente: ...
Marque A s de la tesis se deducen los postulados I y II

Marque B si de la tesis solo se deduce el postulado I
Marque C si de la tesis solo se deduce el postulado II
Marque D si ninguno de los postulados se deduce de la
tesis
Ejemplo 7: Pregunta de Anlisis de
Postulados
Es inimputable quien comete el delito bajo
influencia determinante de un trastorno
mental
POR CONSIGUIENTE
I. Un psictico puede ser inimputable
II. Un inimputable comete un hecho tpico y
antijurdico pero no culpable ni punible
Adems de las normas generales, para la construccin
de este tipo de preguntas es necesario tener en
cuenta: a) aun cuando la instruccin le indica al
examinado que debe suponer todo verdadero, es
recomendable que las afirmaciones lo sean en efecto
o, por lo menos que no sean absurdos u obviamente
falsos, b) todas las afirmaciones deben ser
gramaticalmente completas e independientes unas de
otras, c) la construccin de la pregunta debe ser tal
que la deduccin lgica sea indiscutible, de manera
que la respuesta correcta sea inequvoca y d) este tipo
de pregunta es til para poblaciones de alto nivel
educativo.
Anlisis de Relaciones
Las preguntas de este tipo presentan dos
afirmaciones unidas por la palabra PORQUE y la
segunda afirmacin se considera una RAZON
verdadera o supuesta de la primera. El examinado
debe evaluar tanto el valor de verdad de las
afirmaciones como la relacin entre ellas. A
diferencia de las preguntas de anlisis de
postulados, en stas las afirmaciones pueden ser
verdaderas o falsas. Este tipo de preguntas es
particularmente til para evaluar anlisis y presenta
menos dificultades prcticas que la pregunta de
anlisis de postulados.
Las preguntas que encontrar a continuacin constan de una
afirmacin y una razn unidas por la palabra PORQUE. Usted
debe juzgar tanto el grado de verdad o falsedad de cada una
de ellas como la relacin existente entre las mismas, y
contestar en su hoja de respuestas segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la segunda

es una razn o explicacin correcta de la primera
Marque B si ambas afirmaciones son verdaderas pero la
segunda NO es una razn o explicacin correcta de la primera
Marque C si la primera afirmacin es verdadera pero la
segunda es falsa
Marque D si la primera afirmacin es falsa pero la segunda
es verdadera
Marque E si ambas afirmaciones son falsas
Las preguntas que encontrar a continuacin constan
de una afirmacin y una razn unidas por la palabra
PORQUE. Usted debe juzgar tanto el grado de verdad o
falsedad de cada una de ellas como la relacin
existente entre las mismas, y contestar en su hoja de
respuestas segn el cuadro siguiente:
Marque A si ambas afirmaciones son verdadera y la

segunda es una razn o explicacin correcta de la
primera
Marque B si ambas afirmaciones son verdaderas pero
la segunda NO es una razn o explicacin correcta de la
primera
Marque C si la primera afirmacin es verdadera pero
la segunda es falsa
Marque D si la primera afirmacin es falsa pero la
segunda es verdadera
Marque E si ambas afirmaciones son falsas
Para la construccin de este tipo de
preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben ser frases gramaticalmente completas.
Para la construccin de este tipo de
preguntas es necesario tener en cuenta: a)
las afirmaciones no deben ser obviamente
falsas u obviamente verdaderas, b) las
afirmaciones no deben ser contradictorias
entre s o mutuamente excluyentes y c) las
afirmaciones deben estar construidas de
manera que pueda juzgarse su verdad o
falsedad independientemente, es decir,
deben ser frases gramaticalmente completas.
Ejemplo 8: Pregunta de Anlisis de Relaciones
El hemisferio cerebral izquierdo regula las

contracciones musculares del lado derecho del
cuerpo
PORQUE
las fibras motoras y sensitivas se cruzan en el

bulbo
ANLISIS DE LOS TEMS
Estimacin de la Dificultad del tems
xito en la estimacin en contextos variados
Propiedades del sujeto Propiedades de los

tems
Halo Azar
Covarianza con la prueba
Juicios Subjetivos (Homogeneidad)
Frecuencia de cada opcin
Calificacin Dificultad
Discriminacin
Administracin
Correlacin con la prueba
Rapport
INDICE DE DIFICULTAD
Indica la proporcin de aciertos en la muestra de
alumnos que estamos utilizando. Es la media de
ste 50% de sujetos analizados.
El trmino de dificultad se presta a equvocos: in

ndice mayor indica un pregunta mas fcil.
Este ndice de dificultad sirve para evaluar cuatro

variables:
1. La complejidad de la habilidad medida.
2. Las caractersticas del logro del grupo.
3. La comparacin de distintos reactivos que miden
la misma habilidad.
4. La comparacin de reactivos que miden la misma
habilidad pero con una relacin jerrquica.
INDICE DE DIFICULTAD
Se fija un mnimo valor aceptable de p = 0.5 para
considerar el reactivo bueno, cualquier medida
inferior a 0.5, aunque no quiere decir que el reactivo
no sirve, es mejor no usarlo porque podra ser que lo
que est mal son las instrucciones.
Criterios para calificar la dificultad de los reactivos

de acuerdo al valor del ndice de dificultad de los
reactivos p.
Muy difcil Optima Ligeramente fcil Muy

fcil
0% - 49% 50% - 69% 70% - 89% 90% - 100%
INDICES DE DISCRIMINACION
Los ndices de discriminacin expresan en que
medida cada pregunta o tem diferencia a los
que mas saben de los que menos saben.
Es el ndice probablemente ms utilizado.

Expresa hasta que punto la pregunta discrimina,
establece diferencias, contribuye a situar a un
sujeto en el grupo superior e inferior.
A mayor diferencia, en numero de acertantes

entre los grupos superior e inferior, el tem es
mas discriminante, contribuye mas a situar a un
sujeto entre los primeros o entre los ltimos.
Las preguntas muy fciles y muy difciles
no discriminan, no establecen diferencias;
nos dicen que todos saben o no saben una
pregunta, pero no quien sabe mas y quien
menos. Estas preguntas no contribuyen a la
fiabilidad del test, pero eso no quiere decir
necesariamente que sean malas preguntas.
Si todos y solos los del grupo superior

responden correctamente, tendremos que:
ID=1.
Si todos y solos los del grupo inferior

responden correctamente, tendremos que:
ID= -1.
Si el ID es menor de 0.30 el tem debe
eliminarse porque no discrimina, an
cuando su nivel de dificultad sea ptimo.
Si el tem tiene un ID igual o superior a

0.30 y su nivel de dificultad no es ptimo
debe entonces corregirse y mejorarse ya
que discrimina y puede considerarse
como un tem adecuado para la prueba.
A mayor valor, mayor poder
discriminativo.
Forma de calcular D y P
Procedimiento:
1. Hallar los puntajes totales por sujeto.
2. Ordenarlos de mayor a menor o al revs.

Nos interesan los puntajes extremos
(27% de bajos) y (27% de altos) y los
puntajes promedio no sirven para el
anlisis, se ocultan. Por ejemplo, si hay
100 datos el 27% serian 27 datos y si
fueran 70 datos el 27% seria equivalente
a 18 datos.
3. Calcular el nmero de sujetos del grupo de
los altos que responde correctamente bien
cada tem y calcular el nmero de sujetos
del grupo de los bajos que responde bien
cada tem.
4. Identificar el ndice de dificultad por la
formula:
P = nG(altos)A + nG(bajos)B
G(total)A + G(total)B
y el ndice de dificultad con la formula:
D = GA + GB
G(total).

Psicometra 100509194052 Phpapp01

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Psicometra 100509194052 Phpapp01

Încărcat de

Drepturi de autor:

Formate disponibile

PSICOMETRA

1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality

Instrumentos y tests La persona

En 1869 Francis Galton publica el libro Genio

En 1905 Alfredo Binet y Theodore Simon

En 1980 Rasch plantea la Teora de la

Anlisis de la prueba Anlisis de tems

En una muestra En grandes muestras

El error de medida se establece como la

Si en una poblacin se conocen las puntuaciones

Si en una poblacin conociramos las

La puntuacin que una persona obtenga ser

La TCT supone que el error de medida es una

No hay como tal puntuaciones verdaderas sino una

Independencia local: entre los tems de un test si la

Puede aplicarse en diferentes campos de la

Tabla de puntuaciones y baremos.

No puede rayarse ni se puede escribir

Es la hoja donde la persona anota las

Una vez que la persona entrega la hoja de

Puntuacin cruda o bruta

Puntuacin de los tems Errores

Puntuacin estndar o tpica

Perfil del sujeto

Esa puntuacin bruta se analiza en la tabla de

Por ejemplo, para una misma prueba existen

Clasificacin de las pruebas

Segn Segn la forma de Segn la(s) variable(s)

- Autoaplicacin -De desempeo - De capacidad mental

Pruebas de aplicacin individual: son aquellas

Pruebas de aplicacin grupal: son aquellas que el

Pruebas de poder: miden el nivel de destreza

Pruebas de velocidad: miden cuantos tems

Pruebas con referencia a la norma o al criterio :

Pruebas de actitudes, aptitudes, intereses,

Pregunta(s): son cuestionamientos que evalan

Opciones de respuesta: incluyen una(s)

Clasificacin de los tems

- De eleccin - De opcin binaria

Eleccin mltiple: entre ms de dos

Emparejamiento: consiste en encontrar las

Opcin binaria: la persona debe manifestar si est

Categoras ordenadas: el formato establece un

Adjetivos bipolares: este formato es tpico de lo

Permite predecir el desempeo de un

Formas paralelas: consiste en aplicar un test

Divisin por mitades: consiste en comparar los

Formas paralelas: coeficiente de

Divisin por mitades: coeficiente de

Conjunto de pruebas y datos que han

Validez con relacin a criterio.

Validez del constructo.

Los tems o preguntas se seleccionan segn su:

Tambin se le denomina validez

Se obtiene mediante la correlacin

La contaminacin de los criterios :

El ndice de base (debe ser mayor de 50) :

Depende de unas condiciones que

Anlisis de la consistencia interna de la

Estudio de las variables intervinientes en

Anlisis de las respuestas.

Correlaciones altas con otras medidas

Correlaciones bajas con las medidas