Sunteți pe pagina 1din 39

PROBLEMAS

I.

Fiabilidad y Teora Clsica de los Tests.

1. Cul es el valor del coeficiente de fiabilidad de un test en el que la varianza de los


errores y la varianza de las puntuaciones verdaderas son iguales? Sol. 0,50
2. Cuntos tems tenemos que aadir a un test que tiene 120 tems y un coeficiente

de fiabilidad de 0,65 para alcanzar un coeficiente de fiabilidad igual a 0,65?. Sol.


138.
3. Se ha aplicado un test de razonamiento compuesto por 30 tems. El coeficiente de
fiabilidad del test vale 0,80. Cul es el porcentaje de varianza verdadera de las
puntuaciones?. Sol. 90%.
4. El coeficiente de fiabilidad de un test vale 0.75. La desviacin tpica de las
puntuaciones observadas es 10. Calcular el error tpico de medida. Sol. 5
5. La pendiente de la recta de regresin de V sobre X es 0. Qu puntuacin directa
de pronosticar a cualquier sujeto del grupo? Sol. La media de las puntuaciones
observadas de los sujetos del grupo.
6. Calcular la razn del error tpico de estimacin sobre el error tpico de medida
para xx ' 0,50 y xx ' 0,90 e interpretar el resultado. Para los dos casos calcular
el estimador de Kelley de la puntuacin verdadera para una puntuacin observada
X = 30, sabiendo que la media de las puntuaciones observadas es 40.
7. Se sabe que la varianza de las puntuaciones verdaderas de un test es 190 y que la
varianza de las puntuaciones observadas es 225. Cunto vale el coeficiente de
fiabilidad de las puntuaciones? Sol. 0,84.
8. El error tpico de medida de un test representa 1/3 de la desviacin tpica de las
puntuaciones verdaderas. Cul es el valor del coeficiente de fiabilidad del test?
Sol. 0,90.
9. Sea la siguiente matriz de varianzas y covarianzas para un test compuesto de
cuatro partes. Calcular y comparar las estimaciones de la fiabilidad L1, L2 y L3.
10. Cunto vale el coeficiente de fiabilidad de un test que se ha dividido en dos
mitades si la varianza de las puntuaciones de la primera mitad es 20, la varianza de
las puntuaciones de la segunda mitad es 25 y la varianza de las puntuaciones del
tes total es 60. Cul es la correlacin entre las dos mitades del test? Sol.
Coeficiente de fiabilidad = 0,50; Correlacin entre las dos mitades = 0,3354.
11. Un test se ha dividido en dos mitades. Las puntuaciones de la primera mitad tienen
una varianza de 10; las de la segunda mitad de 15. La correlacin entre las
puntuaciones de las dos mitades es 0,50 y la varianza de las puntuaciones del test
total es 37.2:
a. Calcular el coeficiente de fiabilidad con un procedimiento distinto de
Spearman-Brown. Sol. 0,66
1

b. Calcular el coeficiente de fiabilidad mediante la correccin de SpearmanBrown. Sol. 0,67


c. Comparar los resultados de a y b, explicando las discrepancias. Sol. La
falta de paralelismo entre las mitades.
12. Un test compuesto por 20 tems todos con la misma dificultad, tiene una media de
12 y una varianza de las puntuaciones observadas de 10. Cul es el valor del
coeficiente KR-21 para este test? Sol. 0,55.
13. Un cuestionario de actitudes formado por 8 tems puntuados de forma dicotmica
fue administrado a 10 sujetos. A continuacin se presenta la matriz de
puntuaciones Sujeto x Item

Items
1
2
3
4
5
6
7
8
9
10

1
1
1
1
0
1
1
0
1
1
1

2
1
1
1
0
1
1
1
1
1
1

3
1
1
0
0
1
1
1
1
0
1

4
1
0
1
0
1
1
1
1
0
1

5
1
0
0
1
1
1
1
1
0
1

6
1
1
0
0
1
0
0
1
0
0

7
0
0
0
1
1
0
0
1
0
1

8
0
0
0
1
1
0
1
0
0
1

Total
6
4
3
3
8
5
5
7
2
7

Calcular las correlaciones entre las puntuaciones de las dos mitades pares e impares.
Sol. 0,74
a. Calcular el valor del coeficiente de fiabilidad utilizando el procedimiento
de dos mitades basado en la divisin entre pares e impares. Sol. 0,85.
b. Calcular el valor del coeficiente KR-20. Sol. 0,63
c. Calcular el valor del coeficiente de fiabilidad por medio de ANOVA. Sol.
0,63.
14. En la tabla adjunta se presentan los estadstico descriptivos y coeficientes de
fiabilidad de dos formas alternativas de Matemticas A y B. Cada una de ellas
tiene dos partes, Clculo y Solucin de problemas.
Formas del Test

Clculo

Solucin de
Problemas

22
8
35
0,83

25
12
40
0,85

22
7
35
0,80

24
12
40
0,84

Forma A
Media
Desviacin Tpica
N de tems
KR-20
Forma B
Media
Desviacin Tpica
N de tems
KR-20

Responde a las siguientes preguntas:


a. Error tpico de medida de cada una de las formas del test. Sol. Forma AClculo, 3,30; Forma A-Solucin de problemas: 4,65; Forma B-Clculo:
3,13; Forma B- Solucin de problemas: 4,65.
b. Coeficientes de fiabilidad de los subtests de Solucin de problemas en las
dos formas si se eliminan 5 tems en cada uno de ellos. Sol. 0,8332 en los
dos casos.
c. La correlacin entre los dos subtests de la forma A es de 0,80 y entre los de
la forma B de 0,70. Teniendo en cuenta esta informacin calcule el
coeficiente de fiabilidad de las puntuaciones diferencia (Clculo Solucin
de Problemas) en puntuaciones tpicas para cada una de las formas. Sol.
Forma A: 0,4029; Forma B: 0,5835.
15. Se desea construir un test de inteligencia que tenga un coeficiente de fiabilidad de
0,94. Para ello se dispone como punto de partida de dos tests alternativos, A que
tiene 6 tems y un coeficiente de fiabilidad de 0,50 y otro con 12 tems y B
coeficiente de fiabilidad de 0,65. Cul de ellos se elegir de modo que se alcance
el coeficiente de fiabilidad deseado y que el test tenga el menor nmero de tems?
Sol. A requiere 91 tems y B, 101, por lo que es preferible A.
16. Un equipo de investigacin desarroll dos tests de Razonamiento, el primero de
Razonamiento Inductivo (RI) y el segundo de Razonamiento Deductivo (RD).
Ambos tests fueron aplicados a una muestra representativa de N=400 sujetos. En
el test de RI la varianza de las puntuaciones verdaderas represent el 80% de la
varianza de las puntuaciones observadas y en el de RD el 90%. La desviacin
tpica de las puntuaciones observadas en RI fue 8 y en RD 10. Responda a las
siguientes preguntas:
a. El test de RI tena 100 tems y resultaba excesivamente fatigoso para los
sujetos y se redujo a 60 tems. Cunto vale el coeficiente de fiabilidad
del test acortado?. Sol. 0,7059
b. Cuntos tems habra que eliminar del test de RD, que consta de 120
tems si se considera que es suficiente un coeficiente de fiabilidad de
0,80? Sol. 66 tems
c. Cul de los dos tests sera ms fiable si ambos tuviesen 60 tems?. Sol.
El test RD.
17. Se aplic una batera formada por tres tests a una muestra 500 sujetos. Los tres
tests fueron: Ortografa (A), Comprensin Lectora (B) y Estructuras Sintcticas
(C). La puntuacin media obtenida en el test total, T, sumando las puntuaciones de
los tres subtests : T = A +B + C fue 100 y la varianza 25. Calcular:
a. El coeficiente de fiabilidad del test A sabiendo que la varianza de las
puntuaciones observadas es 1,25 veces la varianza de las puntuaciones
verdaderas. Sol. 0,80.
b. Elementos paralelos que habra que aadir a los 60 que tiene el test B de
modo que su coeficiente de fiabilidad sea de 0,80, sabiendo que la
correlacin entre las puntuaciones pares e impares fue 0,40. Sol. 120.
c. El coeficiente de fiabilidad de C, sabiendo que en una muestra con una
varianza igual a la mitad de la de la muestra original su valor fue de 0,36.
Sol. 0,68.

18. El coeficiente de fiabilidad de un test es 0,50. Calcule el coeficiente de fiabilidad


si fuese alargado multiplicando por diversos valores de k (k= 2, 4, 10). Sol. 0,67;
080; 091.
19. El coeficiente de fiabilidad de un test X es 0,49. Cul sera la mxima correlacin
que se podra obtener entre este test y un criterio? Justifique la respuesta. Sol. 0,70
20. El coeficiente de fiabilidad de un test de comprensin verbal fue 0,70 y el de otra
forma alternativa de 0,60. Se aplicaron los dos tests a una muestra de 1000 sujetos,
encontrndose una correlacin entre sus puntuaciones de 0,50. Cunto vale el
coeficiente de fiabilidad de las diferencias en puntuaciones tpicas entre estos dos
tests? Sol. 0,30.
21. Un test de lectura consta de tres partes: Documentos (D), Expositiva (E) y
Narrativa (N). El test fue aplicado a una muestra de 1000 sujetos con cuyos datos
se calcularon los coeficientes de validez que fueron 0,90 en el test D, 0,80 en el
test E y 0,70 en el test N. Las medias fueron 5, 8 y 3 para D, E y N,
respectivamente. En la matriz adjunta se presentan las varianzas y covarianzas
entre los tres subtests, presentadas en el orden D, E y N.

4 2 3

2 9 1
3 1 5

Combinando los tres tests mediante la frmula siguiente : T = 3D + E + 2N se


obtiene una puntuacin total.
Calcular:
a. Coeficiente de fiabilidad de las puntuaciones totales T. Sol. 0,90.
b. Media y varianzas observada, verdadera y error de las puntuaciones T. Sol.
Media = 29; Varianza de las puntuaciones observadas = 117; Varianza
de las puntuaciones verdaderas = 105,30; Varianza de los errores =
11,70
c. Error tpico de medida de las puntuaciones T. Sol. 3,42.
d. Intervalo de confianza para la puntuacin total verdadera de un sujeto que
obtuvo las siguientes puntuaciones observadas en cada uno de los tests: D= 3,
E = 7 y N = 5. Utilice el nivel de confianza de 0,98 y la aproximacin de
Kelley. Sol. [18,75-33,85].
22. La media de un test de 80 tems calculada en una muestra de 500 sujetos fue 40, la
desviacin tpica 12 y la covarianza entre las dos mitades paralelas en las que se
dividi el test de 25,4. Calcular:
a. La correlacin entre las dos mitades. Sol. 0,545
b. La varianza de cada una de las mitades. Sol. 46,6.
c. El coeficiente de fiabilidad del test. Sol. 0,7055.

23. Se aplic un test de visualizacin espacial a una muestra de 500 sujetos. La


desviacin tpica del test fue 4 y la media 8. Se sabe que a un sujeto con una
puntuacin tpica de 1 se le pronostic una puntuacin diferencial verdadera (v)
que se encontr en el intervalo de confianza del 95% [-0,39 6,39]. Calcular:
a. Pendiente de la recta de regresin de V sobre X. Sol. 0,75.
b. Coeficiente de fiabilidad del test. Sol. 0,75.
c. Error tpico de medida. Sol. 2.
24. En la tabla adjunta se presentan las puntuaciones obtenidas por 10 sujetos en dos
formas paralelas de un test de 5 tems, X y X.
Sujetos
1
2
3
4
5
6
7
8
9
10

Forma X
5
4
4
4
2
3
5
2
1
1

Forma X
5
5
5
4
3
4
4
2
0
1

Calcular:
a. Coeficiente de fiabilidad del test como correlacin entre formas paralelas,
Sol. 0,8954.
b. Coeficiente de fiabilidad mediante ANOVA. Sol. 0,8896.
25. Un psiclogo est analizando las propiedades psicomtricas de un test de Rapidez
Perceptiva cuyos tems estn formados por tres caras de las cuales una es diferente
de las otras dos y la tarea del sujeto es encontrar la diferente. La puntuacin total
es el nmero de caras correctamente identificadas. Responda a las siguientes
preguntas:
a. Qu procedimientos de clculo del coeficiente de fiabilidad seran
adecuados para este test? Sol. Test-retest.
b. Sera adecuado calcular un coeficiente de consistencia interna? Por qu?
Sol. No.
26. En un test de matemticas se obtuvo una media de 40 y una desviacin tpica de
10. Se sabe que la desviacin tpica de los errores representa el 20% de la
desviacin tpica de las puntuaciones verdaderas. Calcular:
a. Coeficiente de fiabilidad. Sol. 0,96.
b. ndice de fiabilidad. Sol. 0,98.
27. En una muestra de 500 sujetos de educacin primaria se aplic un test de
Competencia Lectora alcanzndose una media de 14 y una desviacin tpica de
5. La varianza de los errores representa el 15% de la varianza de las puntuaciones
verdaderas. Calcular:
a. Error tpico de medida del test. Sol. 1,80.
b. La desviacin tpica de las puntuaciones verdaderas. Sol. 4,66.
c. Coeficiente de fiabilidad del test. Sol. 0,87.

d. Coeficiente de fiabilidad del test que se obtendra si se calculase en una


muestra en la que la varianza de las puntuaciones observadas fuese 49.
Sol. 0,93.
28. Una psicloga social aplic una escala de conservadurismo a una muestra de 500
estudiantes universitarios. La escala est formada por 30 tems y en este grupo la
media fue 10 y la desviacin tpica 2. La varianza de los errores represent el 30%
de la varianza de las puntuaciones verdaderas. Calcular:
a. El coeficiente de fiabilidad de la escala en este grupo. Sol. 0,77.
b. Coeficiente de fiabilidad en una muestra de la poblacin general de la
que se conoce que la desviacin tpica vale 10. Sol. 0,99.
c. Media y varianzas observada, verdadera y error si se aadiesen 15
elementos paralelos a los que ya tiene la escala. Sol. 15; 8,31; 6,93; 1,38.
d. Coeficiente de fiabilidad bajo el supuesto (c). Sol. 0,83.
29. Sean X e Y dos formas paralelas de un test y sean V y W dos nuevos tests tales
que:
V X Y
W X Y
sv2 400
sw2 30

Calcular:
a.
b.
c.
d.

Covarianza entre X e Y. Sol. 92,5.


Varianzas de X e Y. Sol. 107,5 en las dos formas.
Coeficientes de fiabilidad de X e Y. Sol. 0,86 en las dos formas.
Coeficiente de fiabilidad de V. Sol. 0,9247

30. La desviacin tpica de las puntuaciones observadas de un test es 45,3 y la


desviacin tpica de las diferencias entre las puntuaciones de la parte par y la
impar es 12,1. Cunto vale el coeficiente de fiabilidad del test bajo el supuesto de
que las mitades par e impar son paralelas? Sol. 0,9286.
31. Utilice la tabla adjunta para responder a las preguntas que se formulan a
continuacin.
Test
A
B
C
D

N de tems
50
100
80
200

Media
100
211,6
57,4
127,4

Desv. tpica
15
25,7
11,3
21,9

Coef. Fiabilidad
0,91
0,84
0,78
0,76

a. Calcular la desviacin tpica de las puntuaciones verdaderas, la correlacin entre


puntuaciones observadas y errores, ndice de fiabilidad y error tpico de medida
para cada uno de los tests.

Solucin:
Test

Desv.Tpica
Verdaderas

A
B
C
D

14,31
23,55
9,98
19,09

Correlacin
P.observadasError
0,30
0,40
0,47
0,49

ndice de
fiabilidad

Error tpico de
medida

0,95
0,92
0,88
0,87

4,50
10,28
5,30
10,73

b. Asumiendo una distribucin normal de los errores construya los intervalos de


confianza (1- = 0,96) para las puntuaciones verdaderas de cada uno de los
siguientes sujetos (Utilice la aproximacin de Kelley):
-

Un sujeto con una puntuacin de 115 en el test A. [ 104,86122,44]


Un sujeto con una puntuacin de 211 en el test B. [191,79230,41]
Un sujeto con una puntuacin de 31 en el test C. [27,22-46,40]
Un sujeto con una puntuacin de 100 en el test D. [87,41125,75]

32. Un test X est formado por tres subtests, X1, X2 y X3. A continuacin se presenta
la matriz de varianzas y covarianzas de los tres subtests.
X1
X2
X3
X1
8,0
6,0
8,0
X2
6,0
12,0
12,0
X3
8,0
12,0
17,0
Estimar el valor del coeficiente alpha utilizando los datos de la matriz. Sol. 0,88
33. Conocemos los siguientes datos de dos test X e Y:

x2 16, Y2 16, xx ' yy ' 0,80, xy 0,70


Calcular:
a. Varianzas observada y verdadera de las diferencias X-Y. Sol. 9,6; 3,2
b. Fiabilidad de las diferencias X-Y. Sol. 0,33
34. Se dispone de dos tests X e Y cuyos coeficientes de fiabilidad son xx ' = 0,80 y
yy ' = 0,60. Las varianzas de las puntuaciones observadas de los dos tests son
iguales y valen 25. La correlacin entre las puntuaciones de los dos tests es 0.
Calcular el coeficiente de fiabilidad del test compuesto T= X + Y. Sol. 0,70.

35. Sean los siguientes test cuyos principales datos se presentan en la tabla adjunta.
Test
A
B
C
D
E

Media
73,2
17,3
21,3
29,3
56,5

Desv.Tpica
12,7
3,8
7,1
7,9
13,7

N tems
120
25
50
75
100

Coef. Fiab.
0,92
0,86
0,80
0,84
0,89

N sujetos
300
250
430
150
200

Calcular:
a. Varianza observada de las puntuaciones del test A si su longitud se
aumentase hasta 240 tems. Sol. 619,35.
b. Varianza de las puntuaciones verdaderas del test B si se le aadiesen 75
tems a los que ya tiene. Sol. 198,69.
c. Error tpico de medida del test C si tuviese 150 tems. Sol. 5,49.
d. Cuntos tems deberan aadirse al test D para duplicar su varianza
observada? Sol. 31.
e. Cuntos tems debera tener el test E para duplicar su error tpico de medida?
Sol. 400.
f. Si deseamos aumentar hasta 7,6 la desviacin tpica observada del test B,
cuntos tems sera necesario aadir al test? Sol. 27.
g. Coeficiente de fiabilidad del test A en otra muestra de sujetos en la que la
varianza de las puntuaciones observadas sea 1/3 de la varianza mostrada en
la tabla. Sol. 0,76.
36. Un equipo llev a cabo una investigacin sobre el cambio del prejuicio hacia un
grupo tnico despus de la aplicacin de un programa. El programa consista en
ver una pelcula. Se administr una a los sujetos una escala de prejuicio antes y
despus de ver la pelcula. Utilice los estadsticos de la tabla adjunta para
responder a las preguntas que se le formulan a continuacin. Las puntuaciones de
la escala representan actitud favorable hacia el grupo tnico.
Media
Desviacin tpica
Actitud-Pretest
17,1
3,4
Actitud-Posttest
22,0
5,1
Correlacin entre puntuaciones pre y posttest = 0,47

Coef. Fiabilidad
0,75
0,70

a. Cul es la varianza de las puntuaciones del cambio: Xpost Xpre? Sol. 21,27.
b. Cunto vale el coeficiente de fiabilidad de las puntuaciones cambio
Xpost Xpre? Sol. 0,48.

37. En la tabla se presentan las respuestas de 20 sujetos a un tem dicotmico y las


puntuaciones de los mismos sujetos a la escala total corregida (de la que se han
eliminado en el caso de cada tem la puntuacin del tem).
Sujetos

Punt. tem

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

1
1
1
0
1
1
1
0
1
1
0
0
0
1
0
0
0
0
1
0

Punt. Total
corregida
9
8
7
5
6
4
7
2
5
8
3
2
4
5
1
3
2
4
9
2

a. Calcular la correlacin biserial puntual


Sol. 0,79
b. Calcular la correlacin biserial. La proporcin de aciertos al tem es 0,50. El
valor de z de la distribucin normal (0,1) por encima del que se encuentran el
50% de los casos es z=0,00 y la ordenada y de la curva en ese punto es 0,3989.
Sol. 0,99
38. Un tem de un dicotmico de un test fue contestado por 150 sujetos. Se conocen
los siguientes datos del grupo:
150

X
i 1

3000

150

98400

i 1

Donde Xi representan las puntuaciones totales del test. El tem fue acertado por 75
sujetos del grupo total. La media de las puntuaciones en el test de los sujetos que
acertaron el tem fue 25. Calcular el ndice de discriminacin del tem. Sol. 0,3125.

II.

TEORA DE LA GENERALIZABILIDAD

1. A continuacin se presenta la descripcin de una serie de estudios D y a partir de


ellos debe realizar las siguientes tareas:
a. Identificar las facetas del estudio
b. Establecer qu facetas, si las hay, que estn fijadas en el universo de
generalizacin.
c. Escribir las frmulas para las varianzas de las puntuaciones observadas y
del universo.
d. Asumiendo que se dispusiese d datos del estudio G con el mismo diseo
utilizado en D, cmo estimara los componentes de la varianza
requeridos?
Los estudios son los siguientes:
1) Un examen final de 50 tems administrado a todos los alumnos de una clase.
Sol. tems.
2) Una forma reducida del test TAT formada por 10 lminas se administr a 50
adolescentes diagnosticados con conducta antisocial. Las 10 historias
elaboradas por cada uno de los sujetos fueron grabadas en cinta y tres
psiclogas las evaluaron en cuanto al grado de rechazo a la autoridad y a las
normas. La puntuacin final asignada a cada sujeto fue el promedio en dicha
variable obtenido de las 10 historias. Sol. Lminas y psiclogos.
3) En un estudio sobre escritura cada uno de los sujetos participantes escribi 8
ensayos sobre dos temas en cada uno de los siguientes modos: descriptivo,
narrativo, expositivo y argumentativo. Todos los sujetos escribieron sobre
los mismos temas. Los resultados fueron puntuados en una medida T de
complejidad sintctica que fue elaborada por un calificador nico que puntu
todos los ensayos de los sujetos. La puntuacin final en T de cada sujeto es el
promedio de los 8 ensayos. Sol. Temas y modos.
2. Un grupo de investigadoras estudi mediante observacin la interaccin familiar
en las visitas a museos. Dos observadoras evaluaron la conducta de 15 familias
aleatoriamente seleccionadas ante tres cuadros. La variable analizada fue el
tiempo que los padres permanecan ante el cuadro sin interaccionar con los nios.
En la tabla adjunta se presentan los resultados del ANOVA.
Fuente de variacin
Familias (p)
Observadoras (i)
Cuadros (j)
p*i
P*j
i*j
Pij,e (residual)

Suma Cuadrados
2346,955
3,211
1231,622
18,288
2372,377
2,688
35,311

Grados de libertad
14
1
2
14
28
2
28

Media Cuadrtica
167,639
3,211
615,811
1,306
84,726
1,344
1,261

A partir de los resultados de la tabla, conteste a las siguientes preguntas:

10

a. Se pretende realizar un estudio en que las familias sern evaluadas por un


observador nico con un solo cuadro. Calcular el coeficiente de generalizabilidad
apropiado, considerando observadores y cuadros como factores aleatorios. Sol. 0,392
b. Si las investigadoras dispusiesen de recursos para ampliar el estudio, qu
sera ms importante aumentar, el nmero de observadores o el nmero de cuadros? Sol.
El nmero de cuadros.
3. En un experimento sobre Teora de la Atribucin, 89 sujetos fueron
informados sobre caractersticas de una persona ficticia y ms tarde se les aplic
un cuestionario formado por 15 tems para evaluar el recuerdo que mostraban
sobre dicha persona. En la tabla adjunta se presentan los resultados del ANOVA.
Fuente de
Suma de
Grados de
Media
F
variacin
cuadrados
libertad
Cuadrtica
Personas (p)
47,491
88,000
0,540
3,150
tems (i)
65,263
144,662
27,220
pi,e
211,004
1232,000
0,171
a. Calcular los componentes de la varianza relevantes y el porcentaje de la
varianza total que corresponde a cada uno. Sol. Personas: 0,025 (10%);
tems: 0,050 (20%) ; pi,e: 0,171 (70%).
b. Interpretar los componentes de la varianza estimados. Sol. El
componente de las personas es muy bajo; el de los tems es bastante
alto y el residual muy elevado.
c. A partir de los resultados anteriores, cmo optimizara el estudio? Sol.
Aumentar considerablemente el nmero de tems.
4. En la aplicacin de un test de 10 tems a 20 sujetos se encontraron los resultados
que se muestran en la tabla.

Personas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

1
1
1
0
1
1
1
1
0
1
1
1
1
1
0
1
1
1
1
1
1

2
1
0
0
1
1
1
0
0
1
1
1
1
1
1
0
0
1
1
1
1

3
0
1
0
0
1
0
1
0
1
1
1
1
1
1
1
0
0
1
1
1

4
1
0
1
1
1
0
0
0
1
1
1
0
1
1
1
1
1
1
1
1

tems
5
6
1
0
1
1
1
1
0
0
0
1
0
0
1
0
1
1
1
0
1
1
1
0
0
1
1
0
0
0
1
1
0
1
1
0
1
1
1
1
1
1

7
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
1
0
1
1

8
1
0
1
0
0
1
0
0
1
1
1
1
1
0
1
0
1
1
1
1

9
1
0
0
0
0
0
1
0
1
0
0
1
0
1
1
1
1
1
0
0

10
0
0
1
1
0
1
1
0
0
0
1
1
0
1
0
0
0
1
1
1
11

Calcular:
a.
b.
c.
d.

Varianzas de los tems y de las puntuaciones totales


Medias cuadrticas de tems, personas e interaccin
Los componentes de la varianza de personas e tems
Coeficiente de generalizabilidad, suponiendo que se ha realizado el
estudio D con 10 tems.
Puede utilizarse software estadstico para los clculos.
Soluciones:
a. Las varianzas de los tems son 0,1342; 0,2211; 0,2395; 0,1974; 0,2211; 0,2605;
0,2632; 0,2395; 0,2605 y 0,2632. La varianza de las puntuaciones totales es
4,011.
b. Medias cuadrticas: Personas: 0,4011; tems: 0,3244; Residual: 0,2110.
c. Componentes de la varianza: personas: 0,019; tems: 0,006;
d. Coeficiente de generalizabilidad (relativo): 0,0475. Se aplic un test de 15 tems de respuesta abierta a 500 sujetos. Las respuestas
fueron valoradas por cuatro jueces en un diseo completamente cruzado. Los
resultados del ANOVA se presentan en la tabla adjunta.
Fuente de Variacin
Personas (p)
tems (i)
Jueces (j)
p*i
p*j
i*j
pij,e (residual)

Media Cuadrtica
17,30
1051,65
420,80
6,65
0,80
45,65
0,65

Calcular los componentes de la varianza y los coeficientes de generalizabilidad para un


estudio D con 15 tems y 4 jueces.
Solucin:
Los componentes de la varianza son: interaccin tems x jueces: 0,090; Interaccin
personas x jueces: 0,010; Interaccin personas x tems: 1,500; Jueces: 0,05; tems: 0,50
y personas: 0,175.
El coeficiente de generalizabilidad para 15 tems y 4 jueces es 0,61.
6. Para los datos del ejercicio anterior calcular el coeficiente de generalizabilidad para
decisiones relativas suponiendo que el estudio se llevase a cabo con 30 tems y 4 jueces.
Sol. 0,75.
7. Se llev a cabo un estudio G sobre el rendimiento en tareas de auxiliar
administrativo. Un grupo de personas que realizan estas tareas fue evaluado por dos
observadores en 11 tareas diferentes mediante un diseo completamente cruzado
p * o * t. Los componentes de la varianza estimados fueron los que se presentan a
continuacin (aunque son estimadores, se ha prescindido del ^).

12

p2 0,00626; o2 0,00000; t2 0,00970;


2
po
0,00000; pt2 0,02584; ot2 0,00003;
2
pot
,e 0,00146

a. Qu implicaciones tienen los anteriores resultados para el diseo de un


estudio D? Sol. Los observadores no introducen variacin, pero s lo
hacen las tareas y su interaccin con las personas, por lo que debera
utilizarse un nmero amplio.
b. Calcular componentes de la varianza, varianzas de los errores y coeficientes
de generalizabilidad para decisiones absolutas y relativas para un supuesto
estudio D con 1 observador y 11 tareas. Sol. 0,62 y 0,75.
8. Una gran empresa a llev a cabo un estudio G sobre los requisitos de
razonamiento de 27 ocupaciones o puestos de trabajo. Las
evaluaciones fueron realizadas por 71 expertos en anlisis de puestos
de trabajo a los que se les proporcionaron descripciones escritas de
los 27 puestos en dos ocasiones diferentes. El objeto de medida en
este estudio son las ocupaciones o puestos. El diseo G fue
totalmente cruzado con todas las facetas aleatorias. En la tabla se
presentan los resultados del ANOVA.
Fuente de
variacin
Puestos (p)
Ocasiones (o)
Calificador (c)
p*o
p*c
o*c
poc,e

Suma de
cuadrados
2817,100
0,730
256,900
4,940
782,600
51,100
345,800

Grados de
libertad
26
1
70
26
1820
70
1820

Media
cuadrtica
108,350
0,730
3,670
0,190
0,430
0,730
0,190

2
0,760
0,000
0,050
0,000
0,120
0,020
0,190

a. Interprete los resultados del estudio G. Sol. La variacin ms importante es la


introducida por los calificadores y a sus interacciones con los puestos. La
variacin debida a las ocasiones es insignificante, por lo que en D sera
suficiente con evaluar en una ocasin, con varios calificadores.
b. En un posterior estudio D ser necesario evaluar los requisitos de razonamiento
de un nmero muy elevado de puestos. Describa las ventajas prcticas de utilizar
un diseo D anidado con c:p. Sol. Un estudio completamente cruzado sera
excesivamente costoso por la gran cantidad de datos que requerira.
c. Estimar los componentes de la varianza del diseo (c:p) * o. Sol. Puestos: 0,759;
Ocasiones: 0,000; p *o: 0,000; c,pc: 0,170; oc,poc,e: 0,210.

13

III.

TEORA DE LA RESPUESTA AL TEM

1. Para un sujeto s las probabilidades de respuesta correcta a dos tems son 0,7 y
0,8. Calcular las probabilidades de todos los patrones de respuesta posibles para
este sujeto. Sol.
2. Dos tems de un test son localmente independientes. Un sujeto tiene una
probabilidad de 0,50 de responder correctamente al primer tem y de 0,3 de
responder correctamente al segundo.
a. Cul es la probabilidad de que el sujeto acierte los dos tems? Sol. 0,15.
b. Cul es la probabilidad de que el sujeto acierte el segundo tem,
teniendo en cuenta que ha acertado el primero? Sol. 0,30.
3. Un test satisface los requisitos de independencia local de los examinados. Dos
sujetos tienen el mismo nivel de aptitud y una probabilidad de 0,10 de acertar un
tem.
a. Cul es la probabilidad de que los dos sujetos acierten el tem? Sol. 0,01.
4. Dos tems dicotmicos de un test siguen un modelo logstico de 2 parmetros.
Los valores de los parmetros son los siguientes:
a1 1, b1 0,50
a2 0,50, b2 0,00
a. En qu valor de alcanza la funcin de informacin el valor mximo
para cada uno de los tems? Sol. En 0,50.
b. Cules son los valores mximos de las correspondientes funciones de
informacin? Sol. 0,72 y 0,18.
5. La TRI permite bajo ciertos supuestos obtener estimadores de los parmetros de
los tems ai y bi a partir de estadsticos de los tems de la TCT. Supongamos que
la aptitud sigue una distribucin normal (0,1) y que conocemos los valores del
ndice de dificultad pi de la TCT y de la correlacin biserial, i que estima el
ndice de discriminacin. Estos valores se presentan en la tabla adjunta para tres
tems de un test.

Item
1
2
3

bis
0,80
0,50
0,40

pi
0,70
0,70
0,70

Estimar los parmetros a y b mediante dichos procedimientos, para cada uno de


los tems.
Sol. tem 1: 1,33 y -0,66; tem 2: 0,58 y -1,05; tem 3: 0,44 y -1,31

14

6. En la tabla se presentan los parmetros de 4 tems dicotmicos de un test que


siguen un modelo de tres parmetros.
tem
1
2
3
4

a
1,8
0,7
1,2
0,5

b
1,0
1,0
-0,5
0,0

C
0,00
0,00
0,20
0,10

a. Para cada uno de los tems anteriores calcula la probabilidad de acertar el


tem en los siguientes niveles de aptitud, : -3, -2, -1, 0, 1, 2, 3 y
represente grficamente las CCI. Sol. Las probabilidades de acierto son:
b. cul de los tems es el ms fcil? Sol. tem 3
c. Cul de los tems es el que menos discrimina? Sol. tem 4
d. En qu tem tendr mayor probabilidad de responder correctamente un
sujeto con =0?
7. Disponemos de dos tems que siguen un modelo logstico de 2 parmetros, con
los siguientes valores de los parmetros de dificultad y discriminacin:

tem1: a1 1, b1 0
tem 2 : a2 1, b2 1,5
a. Para los niveles de aptitud = 0, 0,05 y 2, calcule las probabilidades de
acierto de cada uno de los tems
b. Para los mismos niveles de aptitud de (a) obtenga la informacin de cada
uno de los dos tems.
Soluciones:
a. En = 0, tem 1: 0,500; tem 2 = 0,072; En = 0, 05: tem 1: 0,701; tem 2 =
0,154; En = 2, tem 1: 0,968; tem 2 = 0,701;
b. Informacin de los tems. En = 0, tem 1: 0,722; tem 2 = 0,194; En = 0,5
tem 1: 0,606; tem 2 = 0,378; En = 2, tem 1: 0,090; tem 2 = 0,606;

8. En la tabla siguiente se presentan los valores de los parmetros de 4 tems


dicotmicos.

tem
1
2
3
4

a
1,8
1,5
1,25
1,0

b
1,0
0,0
1,0
1,5

En los clculos en los que sea necesario, utilice los niveles de : -2, -1, 0, 1 y 2.

15

a. Obtenga los valores para las funciones de informacin de los tests formados por
los tems 1, 2 y 3 y los tems 2, 3 y 4.
Solucin:

Test(1,2,3)
Test (2,3,4)
-2
0,219
0,054
-1
1,361
0,540
0
2,918
2,250
1
1,738
2,172
2
0,492
1,076
b. Cul de los dos test anteriores ser ms adecuado para administrar a sujetos con
1 ?. Justifique la respuesta. Sol. El formado por los tems 2,3 y 4
9. En la tabla adjunta se presentan los valores de la informacin de seis tems en
diferentes niveles de aptitud.
tems

-3
-2
-1
0
1
2
3

1
0,02
0,06
0.10
0,20
0,15
0,08
0,04

2
0,00
0,00
0.05
0,10
1,10
0,25
0,10

3
0,00
0,03
0,10
0,25
0,50
0,40
0,15

4
0,15
1,25
1,45
0,10
0,02
0,00
0,00

5
0,00
0,10
0,60
0,70
0,20
0,05
0,00

6
0,00
0,00
0,02
0,40
2,20
0,40
0,15

a. Se construye un test con los tems 2, 3 y 6. Calcule la informacin


proporcionada por el test y el error tpico de estimacin para = 1. Sol. 3,8 y
0,51.
b. Se construyen dos tests el primero formado por los tems 1, 2 y 3 y el segundo
por los tems 4, 5 y 6. Construya la funcin eficiencia relativa de los dos tests e
interprete los resultados.
Solucin:

-3
-2
-1
0
1
2
3

I1()
0,02
0,09
0,25
0,55
1,75
0,73
0,29

I2()
0,15
1,35
2,07
1,20
2,42
0,45
0,15

ER (1 /2)
0,13
0,07
0,12
0,46
0,72
1,62
1,93

16

IV.

EVIDENCIAS DE VALIDEZ DE LAS PUNTUACIONES DE TEST

1. Utilizando la recta de regresin que permite pronosticar la puntuacin de un


sujeto en el criterio conocida su puntuacin en el test y sabiendo que el coeficiente
de determinacin es 0,85, cunto vale el coeficiente de validez del test? Sol. 0,92

2. A continuacin se presenta la parte triangular inferior de una matriz de


correlaciones Multi-Rasgo/Multi-mtodo. Se evaluaron 4 formas de autoconcepto
mediante dos mtodos diferentes: Escala de Autoconcepto de Gordon (mtodo A) y
Escala de Autoconcepto de Piers-Harris (Mtodo B). De cada una de las escalas se
seleccionaron 4 rasgos o modalidades del autoconcepto: Fsico, Social, interpersonal
y acadmico.

A
1. Fsico
2. Social
3. Interpersonal
4. Acadmico
B
1. Fsico
2. Social
3. Interpersonal
4. Acadmico

Mtodo A
2
3

1
0,70
0,64
0,97
0,60

0,64
0,75
0,88

0,73
0,92

0,66

0,78
0,59
0,53
0,59

0,66
0,59
0,57
0,81

0,63
0,62
0,55
0,68

0,50
0,42
0,52
0,80

0,80
0,87
0,72
0,90

Mtodo B
2
3

0,79
0,70
0,86

0,73
0,75

0,80

a. Estimaciones de la fiabilidad de las cuatro subescalas de cada


instrumento. Solucin. Mtodo a: 0,70; 0,64; 0,73; 0,66. Mtodo B:
0,80; 0,79; 0,73; 0,80.
b. Coeficientes de validez convergente para cada uno de los cuatro rasgos.
Sol. 0,78; 0,59; 0,55; 0,80.
c. Examine los coeficientes de correlacin de los tringulos heterorasgo/mono-mtodo y comente los resultados correspondientes a los
rasgos fsico y acadmico.
d.
3. Las puntuaciones de un test y las de un criterio muestran una correlacin de 0,50,
teniendo cada uno de ellos un coeficiente de fiabilidad de 0,50. Cunto vale la
correlacin entre las puntuaciones verdaderas de X e Y? Sol. 1.
4.Para un conjunto de pares de valores de un test y un criterio (X, Y) se sabe que la la
Suma de Cuadrados Total de Y es 40 y el coeficiente de correlacin de Pearson entre X
e Y es 0,60. Responda a las siguientes preguntas:
a. Valor de SCReg. Sol. 14,40
b. Valor de SCRes. Sol. 25,60
c. Proporcin de la varianza de Y asociada a X. Sol. 0,36

17

5.A continuacin se presentan la matriz de componentes no rotada resultante de la


aplicacin del anlisis de componentes principales realizado sobre la matriz de
correlaciones de subtests del WAIS con una muestra de N = 1000 sujetos y con una
retencin de 4 componentes (que no explican el 100% de la varianza total)

Subtests del WAIS


Informacin
Comprensin
Aritmtica
Semejanzas
Memoria de digitos
Vocabulario
Cdigos
Completar dibujos
Cubos
Ordenar dibujos
Ensamblaje

1
0,83
0,75
0,72
0,78
0,62
0,83
0,72
0,78
0,72
0,72
0,65

Componentes
2
3
0,33
-0,04
0,31
0,07
0,25
-0,08
0,14
0,00
0,00
-0,38
0,38
-0,03
-0,36
-0,26
-0,10
-0,25
-0,26
0,36
-0,23
0,04
-0,30
0,47

4
-0,10
-0,17
0,35
-0,21
0,58
-0,16
-0,08
-0,01
0,18
-0,05
0,13

a. Calcule la varianza explicada por cada uno de los cuatro componentes. Sol. 6,01;
0,78; 0,64; 0,62.
b. Represente el scree test con los cuatro componentes retenidos
c. Porcentaje de la varianza total que explica cada uno de los componentes. Sol.
60,82%; 7,1%; 5,82%; 5,64%
d. Se ajusta la tabla a una estructura simple de fcil interpretacin? Sol. No. Es la
matriz no rotada procedente de la fase de extraccin.
6. Se dispone de una escala de Conducta Antisocial (X) que se ha validado con el
criterio Nmero de delitos cometidos (Y) en una poblacin reclusa, encontrando
una correlacin de 0,49 entre las dos medidas. Las desviaciones tpicas de X e Y
son respectivamente 4,6 y 3,8.
Calcular:
a. El coeficiente de validez del test en un grupo menos seleccionado en el
que la desviacin tpica de Y es 7,2. Sol. 0,73
b. La desviacin tpica de este mismo grupo en el test X. Sol. 5,83.
7. Se dispone de un test general (X) formado por 75 elementos y que se considera
un buen predictor de las evaluaciones del rendimiento de un cierto tipo de
puestos de trabajo. Un grupo de 150 sujetos cumplimentaron el test y una
medida del criterio de trabajo (Y). La media de este grupo en el test X fue de 55
puntos y la varianza 16. Se sabe que el coeficiente de fiabilidad es 0,95. En la
medida del criterio la media fue de 14 puntos con una desviacin tpica de 6,
siendo de 0,80 el coeficiente de fiabilidad. En este grupo se obtuvo una
correlacin entre las puntuaciones del test y las del criterio rxy=0,75.
Calcular:
a. Cul sera el coeficiente de validez del test si el criterio no tuviese
errores de medida? Sol. 0,84
b. Cul sera el coeficiente de determinacin del test si las puntuaciones
del test y del criterio estuviesen medidas sin error? Sol. 0,74

18

c. Cul sera el coeficiente de validez si se aadiesen al test 60 elementos


paralelos a los 75 iniciales? Sol. 0,76
d. Porcentaje no explicado de la varianza del criterio si se incrementase el
coeficiente de fiabilidad del test hasta 0,99 y el del criterio hasta 0,95.
Sol. 26%
8. Se dispone de un test de 60 elementos para el diagnstico rpido de la depresin.
En este test, un grupo de 80 sujetos obtuvo una puntuacin media de 40 y una
desviacin tpica de 4, siendo el coeficiente de fiabilidad del test de 0,95. Estos
mismos sujetos fueron evaluados por un equipo de expertos mediante entrevista
clnica (criterio) obteniendo una calificacin media de 20 y una varianza de 4,
siendo el coeficiente de fiabilidad del criterio de 0,72. Se encontr una
correlacin de 0,60 entre las puntuaciones del test y las del criterio.
Calcular:
a. Coeficiente de validez corregida la atenuacin de los errores. Sol. 0,7443
b. Coeficiente de validez del test si se le aadiesen 30 elementos paralelos a
los 60 iniciales. Sol. 0,61
c. Coeficientes de determinacin, de alienacin y de valor predictivo si se
eliminasen los errores de medida del test y del criterio. Sol. 0,5540; 0,
6678; 0,3322.
d. Entre qu limites se encontrar la puntuacin en el criterio para un
sujeto que obtuvo en el test una puntuacin tpica de 1,3? Sol. [17,2125,91]
9. Hay 500 aspirantes a un puesto de trabajo, siendo la tasa de base del 60% y el
coeficiente de validez del test de seleccin de 0,50. Se seleccionan 100 sujetos.
Cuntos aspirantes potencialmente buenos fueron rechazados? Sol. 259
10. Carmines y Zeller (1979) presentan los resultados de un anlisis de componentes
principales de la escala de Autoestima (Rosenberg, 1965), seguido de una
rotacin Varimax. El anlisis fue realizado sobre los datos de una muestra de
N=340 sujetos, tras la recodificacin de los tems con formulacin negativa.

tems
1. Creo que tengo buenas cualidades
2. Me gustara tener ms respeto por m mismo/a
3. Siento que soy una persona valiosa
4. No tengo motivos para enorgullecerme
5. Tengo una actitud positiva hacia m mismo/a
6. Con frecuencia me siento intil
7. Me inclino a pensar que soy un fracaso
8. Hago las cosas tan bien como la mayora de la gente
9. Con frecuencia pienso que no soy bueno/a
10. En general, estoy satisfecho/a conmigo mismo/a

Componentes
1
2
0,50
0,34
0,10
0,36
0,63
0,19
0,36
0,48
0,61
0,33
0,16
0,65
0,37
0,66
0,66
0,11
0,20
0,71
0,48
0,20

a. Interprete los resultados.


b. Calcule la proporcin de varianza explicada por los dos factores. Sol. 40,8%

19

11. En una comunidad se pretende utilizar los resultados de un test de inteligencia


para la seleccin de sujetos aspirantes a participar en un programa de mejora de
la inteligencia dirigido a sujetos con ciertas deficiencias. En la tabla se presentan
en proporciones los resultados encontrados con un grupo de 200 sujetos en un
estudio de validacin del test.

Sujeto
admitido

Sujeto con necesidad


S
No
0,15
0,05
0,05
0,75
0,20
0,80

S
No
Total

Total
0,20
0,80
1,00

Calcular:

a. Sensibilidad. Sol. 0,75


b. Especificidad. Sol. 0,0667

12. Una estudiante de Psicologa encuentra en el manual de un inventario de


personalidad que el coeficiente de fiabilidad de las puntuaciones es 0,76 y que
un coeficiente de validez calculado como la correlacin entre las puntuaciones
de este cuestionario con las de otro que evala el mismo constructo es 0,78.
Sospecha que hay un error ya que ha odo que la correlacin de las puntuaciones
de un test con otra variable no puede alcanzar un valor mayor que su fiabilidad.
Es esto cierto? Sol. No. El lmite es el ndice de fiabilidad.
13. A continuacin se presentan datos referidos a dos tests (A y B) y un criterio (Y)
que debe utilizar para responder a las preguntas que se plantean a continuacin.
Variable

Media

D.Tpica

N tems

A
B
Y

19,3
10,2
117,8

4,1
4,2
20,1

30
20
200

Coef.
Fiabilidad
0,74
0,87
0,90

Correlacin
con criterio Y
0,69
0,70

a. Se ha realizado una seleccin de personal por medio del test A y que los datos
de la tabla se obtuvieron a partir de los sujetos del grupo seleccionado. Cunto
valdra el coeficiente de validez del test para el criterio Y en un grupo no
seleccionado en el que la desviacin tpica de las puntuaciones del test vale 6,7?.
Sol. 0,8415.
b. Se ha seleccionado un grupo de sujetos con puntuaciones en el test B superiores
al percentil 75, siendo la desviacin tpica de las puntuaciones en el test para
este grupo de 3,2. Cunto valdra el coeficiente de validez en este grupo
restringido de altas puntuaciones? Sol. 0,5983.
14. En una empresa se aplica un test X para la seleccin de personal. La empresa
est estudiando un nuevo test Z para sustituir a X y lo aplic a un grupo de
sujetos que previamente haban sido seleccionados mediante X. Estos sujetos
tambin fueron evaluados en un criterio Y. En este grupo seleccionado se
obtuvieron los siguientes estadsticos:
20

sx 3, sz 7, s y 5
rxz 0,80, rxy 0,35, rzy 0,55
En otra empresa del mismo grupo en la que no se emplea ningn procedimiento
selectivo para el mismo puesto, se sabe que la desviacin tpica de los sujetos en un
criterio Y idntico al anterior es 6. Se desea conocer el funcionamiento de los dos tests
en un grupo no seleccionado, como esta segunda empresa,
a. Cules sern las correlaciones de los dos tests X y Z con el criterio en esta
segunda empresa. Sol. Rxy = 0,625; Rzy = 0,71
b. Qu varianzas tendran los tests en esta empresa? Sol. Sx = 6,43; Sz=0,71
c. Proporcin de varianza del criterio en esta segunda empresa explicada por
cada uno de los tests. Sol. 0,39 y 0,51

15. Se utilizaron dos escalas psicolgicas diferentes A y B para la evaluacin de tres


rasgos en adolescentes: Autoestima, liderazgo y sociabilidad. A partir de las
puntuaciones recogidas en una muestra de 700 sujetos se construy la siguiente
matriz multimtodo-multirrasgo.

E. A
E. B
Autoestima Sociabilidad Liderazgo Autoestima. Sociabilidad Liderazgo
Autoestima.
0,71

E.
A Sociabilidad
Liderazgo

0,40
0,20

0,65
0,32

0,75

Autoestima.
E. Sociabilidad
B.
Liderazgo

0,80
0,30
0,32

0,20
0,79
0,20

0,41
0,30
0,70

0,84
0,30
0,23

0,85
0,40

0,79

a. Cul es el rasgo con menor validez convergente? Sol. Liderazgo


b. Coeficiente de fiabilidad de la Autoestima en la escala B. Sol. 0,84
c. Hay evidencias de validez convergente para todos los rasgos? S
V.

Funcionamiento diferencial de los tems e interpretacin de las


puntuaciones.
1. En la tabla se presentan cuatro intervalos de puntuaciones y el nmero de
examinados de cada uno de dos grupos que responden al tem (n1i y n2i) y el
nmero de sujetos que responden correctamente en cada grupo (a1i y a2i). Con
los datos de la tabla calcule los estadsticos de DIF de camilla y de MantelHaenszel.
Intervalo
1
2
3
4

a1j
16
31
41
40

n1j
56
47
53
43

a2j
36
48
44
33

n2j
100
72
62
35

Sol. Ninguno de los procedimientos pone en evidencia DIF.


21

2. Un test de 25 tems fue administrado a 199 varones y 269 mujeres. En la tabla se


presenta la distribucin de frecuencias de varones (grupo 1) y mujeres (grupo 2)
y el nmero de casos de ambos grupos que acertaron un tem particular en cada
puntuacin.
Varones
Intervalo
5
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

a1j
1
0
1
0
2
2
4
3
2
7
7
15
12
12
14
15
8
6

Mujeres
n1j
1
0
2
2
4
4
4
4
5
11
19
25
22
27
26
24
13
6

a2j
0
1
1
2
4
2
2
6
9
14
15
15
19
18
19
12
13
1

n2j
0
1
2
2
7
5
7
7
18
28
23
35
34
34
38
19
15
1

Existen evidencias de funcionamiento diferencial del tem? Pngalo a prueba con los
procedimientos de Mantel-Haenszel y la regresin logstica.
Sol. Ninguno de los procedimientos muestra evidencias de DIF.
3. En la tabla se presentan los estimadores de los parmetros de dificultad de varios
tems y sus correspondientes errores tpicos en un grupo de varones y otro de
mujeres, calculados segn el modelo de TRI de un parmetro. Las dificultades
estn en escala estandarizada con media 0
Varones

Mujeres

tem
b
ET(b)
b
ET(b)
1
-2,531
0,369
-2,071
0,252
2
0,758
0,154
0,511
0,130
3
-1,290
0,235
-1,466
0,202
4
1,469
0,156
1,218
0,131
5
0,238
0,162
0,142
0,135
Utilizando el nivel de confianza de 0,95, hay evidencias de funcionamiento diferencial
de algunos de los tems?. Sol. No

22

4. Un grupo de sujetos obtuvo en un test la siguiente distribucin de puntuaciones.


X
20-22
17-19
14-16
11-13
8-10
5-7
2-4

fi
30
20
20
60
40
20
10

a. Calcular la puntuacin correspondiente al percentil 60. Sol. 13


b. Calcular para dicha puntuacin la puntuacin tpica normalizada. Sol.
0,25
c. Calcular la puntuacin normalizada derivada T. Sol. 52,5
d. El eneatipo correspondiente. Sol. 5
5. Se aplic un test de razonamiento abstracto a un grupo de sujetos. La
distribucin de las puntuaciones para este grupo puede considerarse normal.
Dos sujetos obtuvieron en el test unas puntuaciones tales que el primero se
encontraba 15 rangos percentiles por encima del segundo y este ltimo superaba
al 64% de los sujetos del grupo normativo.
Calcular:
a. Puntuacin tpica normalizada de cada uno de los sujetos. Sol. 0,81; 0,36
b. Puntuacin Cociente Intelectual (media 100, desviacin tpica 15)
normalizada para cada uno de los sujetos. Sol. 112; 105
c. Eneatipo de cada sujeto. Sol. 7; 6
6. Una psicloga construy dos formas diferentes (A y B) de una escala para medir
las actitudes de los profesores hacia la docencia con sujetos de necesidades
educativas especiales. Aleatoriamente, 10 profesores fueron asignados a la
forma A y otros 10 a B, obteniendo ambos grupos las siguientes puntuaciones.

Forma A
50
41
42
51
37
53
50
54
48
53

Forma B
31
38
42
39
41
46
34
42
37
52

Equipare las puntuaciones de las dos formas utilizando los datos anteriores y el
procedimiento de equiparacin lineal.
Sol. B*=1,02(A-47,9) + 40,2.

23

7. Se construyeron dos formas alternativas de un test de 10 tems y ambas fueron


aplicadas a los mismos grupos. Las distribuciones de frecuencias de las
puntuaciones de las dos formas se presentan en la tabla. A partir de los datos
equipare las puntuaciones de ambas formas utilizando la equiparacin
equipercentil.
Puntuacin
0
1
2
3
4
5
6
7
8
9
10

Forma A
0
2
17
28
39
50
65
56
27
11
4

Forma B
13
19
54
36
39
40
49
27
17
12
5

Solucin.
La equiparacin equipercentil proporciona las siguientes equivalencias:
Percentil
5
10
25
35
50
60
70
85
90
95
99

Forma A
2
3
4
5
6
6
7
7
8
9
10

Forma B
1
1
2
3
4
5
6
7
8
9
10

8. Disponemos de un test referido a criterio (X) y de un criterio Y. la correlacin


entre las puntuaciones del test y las del criterio es de 0,60. la desviacin tpica
del test es 10 y la del criterio 6 y las correspondientes medias son 50 y 20. Los
valores de x y y son 60 y 25, respectivamente para X e Y. Con los datos
anteriores calcule el coeficiente validez para TRC propuesto por Livingston. Sol.
0,78.

24

PROBLEMAS PROPUESTOS
A continuacin se presentan un conjunto de problemas sin la solucin. Todos ellos
proceden de exmenes prcticos de la asignatura de Psicometra y estn apoyados en
clculos realizados con software estadstico o psicomtrico. En algunos apartados se
requiere realizar clculos (normalmente para ndices o coeficientes no proporcionados
directamente por el software y con frecuencia se requiere interpretacin. Se presentan
por bloques de examen, por lo que los diferentes ejercicios de cada bloque pueden
referirse a apartados muy diversos de la teora.

Bloque 1.
1. Se aplic un test de Inteligencia General (factor g) a una muestra
representativa de n=2000 estudiantes de 3 y 4 de ESO de la
Comunidad de Madrid. El test estaba formado por n = 30 items de
series numricas. El test no ofrece opciones de respuesta, sino que el
sujeto debe escribir la respuesta de cada tem. El anlisis del test se
realiz siguiendo el modelo de dos parmetros en mtrica normal. En
la tabla y en la figura adjuntas se presentan los resultados para
algunos de los tems y para el test global
ITEM
I08

INTERCEPTO
E.T.*)
|
|
|

I12
I14
I15

|
|
|
|
|
|
|

-0.305 |
0.651* |
|
-1.108 |
0.851* |
|
-0.017 |
0.668* |
|
-1.168 |
1.004* |

a
b
Saturacin
c
DISCRIMIN. DIFICULTAD LOADING
ASYMPTOTE ji-cuadrado
E.T.(a)
E.T(b)
E.T.(sat)
E.T.(c) (p-valor, g.l.
Signif.)
0.496 |
0.614 |
0.445 |
0.000 |
2.7
8.0
0.107* |
1.301* |
0.096* |
0.000* | (0.9536)
|
|
|
|
0.331 |
3.345 |
0.314 |
0.000 |
2.7
6.0
0.095* |
2.561* |
0.090* |
0.000* | (0.8440)
|
|
|
|
0.656 |
0.026 |
0.548 |
0.000 |
5.7
7.0
0.133* |
1.018* |
0.111* |
0.000* | (0.5734)
|
|
|
|
0.566 |
2.063 |
0.493 |
0.000 |
0.9
6.0
0.144* |
1.571* |
0.125* |
0.000* | (0.9906)

I18

| -0.005 |
0.914 |
0.006 |
0.675 |
0.000 |
5.3
5.0
|
0.735* |
0.180* |
0.804* |
0.133* |
0.000* | (0.3800)
|
|
|
|
|
|
I24
|
0.000 |
0.303 |
0.001 |
0.290 |
0.000 |
15.1
8.0
|
0.594* |
0.078* |
1.961* |
0.075* |
0.000* | (0.0500)
|
|
|
|
|
|
I30
| -0.018 |
0.726 |
0.025 |
0.587 |
0.000 |
13.6
6.0
|
0.684* |
0.149* |
0.942* |
0.121* |
0.000* | (0.0347)
-------------------------------------------------------------------------------

RESULTADOS PROMEDIO PARA EL TEST TOTAL


PARAMETRO
MEDIA Desv.Tpica
----------------------------------a
0.616
0.220
b
0.143
1.256

25

CURVAS CARACTERSTICAS Y FUNCIONES DE INFORMACIN DE ALGUNOS ITEMS


Item Characteristic Curv e: I28
a = 0.496

Item Characteristic Curv e: I31

Item Information Curv e: I28

a = 0.331

b = 0.614

Item Information Curv e: I31

b = 3.345
0.9

1.0

0.9

1.0

0.8

0.8

0.8

0.4

0.6

Probabil ity

0.6

0.5
0.4

0.7

Information

0.7

Information

Probabil ity

0.8

0.6

0.4

0.2

0
-3

-2

-1

0
-3

-2

-1

Ability

2-Parameter Model, Normal Metric

-2

-1

0.1
0
-3

2-Parameter Model, Normal Metric

Item: 3

-2

-1

0
Scale Score

Item: 5

The parameter a is the item discriminating power, the reciprocal (1/a) is the item
dispersion, and the parameter b is an item location parameter.

The parameter a is the item discriminating power, the reciprocal (1/a) is the item
dispersion, and the parameter b is an item location parameter.

a = 0.303

0
-3

Ability

Scale Score

Item Characteristic Curv e: I64

0.4

0.2

0.2

0.1

0.5

0.3

0.3
0.2

0.6

Item Information Curv e: I64

b = 0.001
0.9

1.0

0.8
0.7

Information

Probabil ity

0.8

0.6

0.4

0.6
0.5
0.4
0.3
0.2

0.2

0.1

b
0
-3

-2

-1

0
-3

-2

-1

Ability

Scale Score

2-Parameter Model, Normal Metric

Item: 18

The parameter a is the item discriminating power, the reciprocal (1/a) is the item
dispersion, and the parameter b is an item location parameter.

Item Characteristic Curv e: I48


a = 0.914

Item Information Curv e: I48

b = 0.006
0.9

1.0

0.8
0.7

Information

Probabil ity

0.8

0.6

0.4

0.6
0.5
0.4
0.3
0.2

0.2

0.1

b
0
-3

-2

-1

0
-3

Ability

2-Parameter Model, Normal Metric

-2

-1

Scale Score

Item: 13

The parameter a is the item discriminating power, the reciprocal (1/a) is the item
dispersion, and the parameter b is an item location parameter.

26

FUNCIONES DE INFORMACIN Y DE ERROR TPICO DEL TEST TOTAL

Subtest: MAINTEST
6

1.10

0.88

Information

0.66
3
0.44

Standard Error

2
0.22

0
-3

-2

-1

Scale Score

Test information curve: solid line


Standard error curve: dotted line
The total test information for a specific scale score is read from the left vertical axis.
The standard error for a specific scale score is read from the right vertical axis.

Nota: La curva en trazo continuo representa la funcin de informacin y sus


valores pueden leerse en el eje vertical de la izquierda. La lnea de puntos
representa la funcin error tpico y sus valores pueden leerse en el eje
vertical de la derecha.

ALGUNAS PUNTUACIONES ESTIMADAS, PARA ALGUNOS SUJETOS, CON


SUS CORRESPONDIENTES ERRORES TPICOS
Sujeto
125
240
630
780
850
1325

% de aciertos
15
90
60
35
100
5

estimada
-1,2316
1,8647
0,4203
-0,5418
2,45471
-2,0121

E.T.()
0,4636
0,5635
0,3790
0,3806
0,6215
0,5783

PREGUNTAS:
Con ayuda de las tablas y grficos, responde a las siguientes preguntas:
1. Interpreta los parmetros de los tems presentados en cuanto a su discriminacin
y dificultad
2. Comenta las funciones de informacin de los tems
3. Dnde se encuentra la informacin mxima del test completo? Y el mnimo
error tpico de estimacin?
27

4. Para qu niveles de habilidad sera inadecuado este test?


5. Comenta la tabla que presenta las estimaciones de los sujetos y los errores
tpicos
6. Calcula el Intervalo de confianza del 95% para la aptitud de los sujetos n 630
y 850, considerando que la distribucin es N(0,1) (el valor absoluto del z crtico
para este nivel de confianza, en valor absoluto, es 1.96) y comenta la amplitud o
precisin del intervalo comparando los dos casos.

2.- Un psiclogo escolar construy un modelo de regresin lineal mltiple


para la prediccin de las puntuaciones en un test de Matemticas
(MATEMA) de 2 de Bachillerato. Las variables predictoras utilizadas en
el modelo fueron las puntuaciones en tres tests: APTITUDES
NUMRICAS (APTNUM), aptitud verbal (APTVERB) y motivacin
acadmica (MOTIVAC). A continuacin se presentan resultados relevantes
para la interpretacin del modelo.
Correlaciones de los tests predictores con el
criterio Y
Correlaciones
APTNUM
Estadsticos descriptivos
N
APTNUM
APTVERB
MOTIVAC
MATEMA

341
341
341
341

Media
14,7595
13,0909
7,7155
7,9120

Desv . tp.
3,61381
3,62758
2,49906
1,75680

APTVERB

MOTIVAC

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

MATEMA
,673**
,000
341
,616**
,000
341
,570**
,000
341

**. La correlacin es signif icativ a al niv el 0,01


(bilateral).

Resumen del modelob


Modelo
1

R
,730a

R cuadrado
,532

R cuadrado
corregida
,528

Error tp. de la
estimacin
1,20668

a. Variables predictoras: (Constante), APTVERB, MOTIVAC,


APTNUM
b. Variable dependiente: MATEMA

28

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
558,666
490,695
1049,361

gl
3
337
340

Media
cuadrtica
186,222
1,456

F
127,894

Sig.
,000a

a. Variables predict oras: (Constante), APTVERB, MOTIVAC, APTNUM


b. Variable dependiente: MATEMA

Coeficientesa

Modelo
1

(Constante)
MOTI VAC
APTNUM
APTVERB

Coef icientes no
estandarizados
B
Error tp.
2,429
,289
,154
,034
,200
,025
,102
,026

Coef icientes
estandarizad
os
Beta
,219
,412
,211

t
8,412
4,590
7,941
3,939

Sig.
,000
,000
,000
,000

a. Variable dependient e: MATEMA

Los valores de los coeficientes de fiabilidad (coeficiente alpha) con el


nmero de tems que se sealan en cada uno de los tests son los siguientes:

MATEMA : n=15, alpha = .81


APTNUM: n = 30, alpha = .80
APTVERB: n = 30, alpha = .90
MOTIVAC: n = 12, alpha = .70

PREGUNTAS:
A continuacin, y utilizando toda la informacin anterior, responde a las
siguientes preguntas:
1. Coeficiente de determinacin mltiple para la prediccin del
rendimiento en matemticas
2. Interpretacin de la significacin estadstica del modelo global y de
cada uno de los predictores , as como la importancia relativa de cada
una de las variables para la prediccin
3. Escribe la ecuacin de prediccin en puntuaciones directas y tpicas
4. Qu puntuacin tpica le pronosticaras a un sujeto en Matemticas,
sabiendo que ha obtenido las siguientes puntuaciones directas en los
tests predictores: APTNUM = 16, APTVERB = 22, MOTIVAC =
10?. Construye el intervalo de confianza del 95% para la prediccin

29

anterior. Aunque la distribucin de referencia es la t de Student, dado


el tamao de la muestra, puedes utilizar los valores de la N(0,1).
5. Consideramos ahora solamente el test de APTNUM y el criterio
MATEMA. Responde a las siguientes preguntas:
a. Si duplicsemos la longitud del test APTNUM, Cunto
valdra el coeficiente de validez de este test par el criterio
MATEMA?
b. Coeficiente de alienacin del mencionado test para el criterio
c. Correlacin entre APTNUM y MATEMA corregida la
atenuacin debida a los errores
d. Cunto valdra el coeficiente de validez para el test con la
longitud original, si calculsemos la correlacin en un grupo
con mayor variabilidad, por ejemplo en un grupo con una
desviacin tpica en el test APTNUM de 6.

30

Bloque 2.
1. A continuacin se presentan diversos resultados de la aplicacin de un test de

Razonamiento Inductivo, formado por 30 elementos dicotmicos, a una muestra de


N = 3274 sujetos de Bachillerato.
En la tabla 1 se presentan los estadsticos descriptivos de algunos de los tems del test.
Tabla 1. Estadsticos descriptivos de algunos elementos
Desviacin
tpica

Media

ITEM3

,87

,331

3274

ITEM6

,25

,433

3274

ITEM17

,47

,499

3274

ITEM18

,72

,447

3274

ITEM20

,28

,450

3274

ITEM27

,92

,274

3274

ITEM28

,84

,367

3274

ITEM29

,55

,498

3274

ITEM30

,59

,491

3274

En la tabla 2 se presentan las respuestas a cada una de las cinco opciones del test,
habiendo sido codificada con un 8 la omisin de respuesta
Tabla 2. % de respuestas emitidas para las diferentes opciones
Resp.
correcta

ITEM3

%
3,0%

%
3,9%

%
3,5%

%
87,5%

%
2,1%

ITEM6

7,8%

25,0%

2,3%

27,9%

37,0%

ITEM17

10,2%

9,1%

47,1%

28,1%

5,5%

ITEM18

11,9%

72,4%

4,3%

3,7%

7,7%

ITEM20

4,5%

18,8%

29,0%

28,3%

19,5%

ITEM27

1,7%

91,8%

1,3%

,5%

4,6%

ITEM28

3,8%

1,8%

84,0%

2,5%

7,9%

ITEM29

14,7%

54,9%

2,9%

19,3%

8,2%

ITEM30

59,4%

4,7%

7,6%

2,3%

25,9%

En la tabla 3 se presentan los estadsticos tem-total para los elementos anteriores.


Tabla 3. Estadsticos total-elemento

31

Media de la
escala si se
elimina el
elemento

Varianza de la
escala si se
elimina el
elemento

Correlacin
elemento-total
corregida

Alfa de
Cronbach si
se elimina el
elemento

ITEM3

21,78

20,652

,433

,831

ITEM6

22,40

21,168

,178

,839

ITEM17

22,18

20,750

,234

,839

ITEM18

21,93

20,484

,342

,833

ITEM20

22,37

21,287

,139

,841

ITEM27

21,74

20,724

,508

,830

ITEM28

21,81

20,300

,494

,828

ITEM29

22,11

20,403

,315

,835

ITEM30

22,06

20,384

,325

,835

En la tabla 4 se presentan los estadsticos resumen de las puntuaciones totales del test
formado por los 30 items.
Tabla 4. Estadsticos de la escala o test completo

Media
22,65

Varianza
22,066

Desviacin
tpica
4,697

N de
elementos
30

En la tabla 5 se presentan los resultados del ANOVA.


Tabla 5. Resultados del ANOVA
Suma de
cuadrados
Inter-personas
Intra-personas

2407,374
Inter-elementos

Media
cuadrtica

gl
3273

,736

4414,523

29

152,225

Residual

11340,277

94917

,119

Total

15754,800

94946

,166

18162,174

98219

,185

Total

Sig.

1274,108

,000

En la tabla 6 se presentan datos correspondientes a la correlacin intraclase.


Tabla 6. Coeficiente de correlacin intraclase

Intervalo de confianza 95%

Medidas individuales
Medidas promedio

Prueba F con valor verdadero 0

Correlacin
intraclase(a)
,147(b)

Lmite inferior
,140

Lmite
superior
,154

Valor
6,156

gl1
3273,0

gl2
94917

Sig.
,000

,838(c)

,829

,845

6,156

3273,0

94917

,000

Finalmente, en la tabla 7 se presentan los resultados obtenidos mediante la divisin en


dos mitades, construyendo la primera mitad con los tems pares y la segunda con los
impares.

32

Tabla 7. Estadsticos de fiabilidad dos mitades


Alfa de Cronbach

Parte 1

Valor
N de elementos

Parte 2

Valor
N de elementos

N total de elementos
Correlacin entre formas
Coeficiente de
Spearman-Brown

,704
15(a)
,735
15(b)
30
,727

Longitud igual

,842

Longitud desigual

,842

Dos mitades de Guttman

,842

PREGUNTAS:
Teniendo en cuenta toda la informacin anterior, responda a las siguientes preguntas:
a. Coeficiente alpha del test y diga si dicho coeficiente es compatible con un
requisito impuesto de que el coeficiente de fiabilidad debe valer 0,90,
justificando la respuesta
b. Cuntos elementos paralelos a los anteriores deberamos aadir para
cumplir con el requisito anterior?
c. Si este test fuese utilizado para seleccionar sujetos en una empresa y la
empresa impusiese la condicin de alcanzar una puntuacin verdadera de 25
puntos, seleccionara a un sujeto con una puntuacin observada X = 23?
(NC = 0,95, utiliza la ecuacin de Kelley)
d. Qu tems eliminaras de los presentados en las tablas, para mejorar el valor
del coeficiente alpha? El examen de la tabla de respuestas a las opciones, te
sugiere por qu dichos tems son problemticos?
e. Calcula el ndice de dificultad para el tem 17
f. El examen de los resultados de la tabla 7 nos permitira decir que las dos
mitades pueden considerarse paralelas. Justifica la respuesta
El test anterior se ha aplicado a los sujetos junto con otro test de Razonamiento
Deductivo, formado por 30 elementos, del que sabemos que la varianza de los errores
representa el 20% de la varianza de las puntuaciones observadas, que fue de 25. La
correlacin entre ambos tests fue de 0,70. El psiclogo est interesado en construir
una puntuacin total en Razonamiento, T, mediante la siguiente expresin:
T = 1,5 RI + RD
h. Calcula el coeficiente de fiabilidad de las puntuaciones T
i. Un sujeto obtiene una puntuacin en razonamiento inductivo RI=25 y una
puntuacin en Razonamiento Deductivo, RD = 23. Podemos afirmar que dicho sujeto
es superior en Razonamiento Inductivo?

33

A continuacin se presentan los resultados de un estudio de


Generalizabilidad en el que se evaluaron mediante un diseo p x i x o, 10
personas por medio de cuatro tems de respuesta construida, que fueron
evaluados por 2 calificadores.
2.

Fuente
de
Variacin
Personas (P)
tems (I)
Calificadores
Px I
PxC
IxC
PIC,e
Total

Suma
de Grados
Cuadrados
libertad
62,20
9
37,45
3
3,20
1
56,30
27
12,05
9
7,50
3
25,25
27
203,95
79

de Media
cuadrtica
6,9111
12,4833
3,2000
2,0852
1,3389
2,5000
0,9352

Comp.
Varianza 2
0,5528
0,4417
0,0074
0,5750
0,1009
0,1565
0,9352

1) Interprete los resultados del estudio G:


a. Cules son los componentes de varianza ms influyentes y
qu repercusin tiene esto en posteriores estudios D?
b. Son estadsticamente significativos los efectos principales de
tems, calificadores, y la interaccin PxI ?
2) Este test se ha utilizado en un estudio D, de decisin, en el que se
utilizaron
ni = 10 tems y nc = 2 calificadores.
a. Calcula el coeficiente de generalizabilidad para las decisiones
absolutas y las decisiones relativas e interpreta los resultados

34

Bloque 3.
A continuacin se presentan algunos resultados procedentes de la aplicacin de un test
de Razonamiento Abstracto a una muestra de N=3274 sujetos. Todos los tems del test
son de eleccin mltiple, debiendo elegir el sujeto la opcin correcta de las cuatro
presentadas.
En la Tabla 1 se presentan las respuestas dadas a algunos tems seleccionados y algunos
estadsticos de dichos tems de la TCT. El 8 representa la omisin de respuesta y debajo
del nmero del tem en la primera columna se indica cual es la respuesta correcta.
Tabla 1. Respuestas y estadsticos de tems seleccionados.

ITEM6
(2)
ITEM18
(2)
ITEM20
(4)
ITEM29
(2)

I.Dificultad

Corr.
Corregida
item-total

7,8%

25,0%

2,3%

27,9%

37,0%

,25

0,178

11,9%

72,4%

4,3%

3,7%

7,7%

,72

0,342

4,5%

18,8%

29,0%

28,3%

19,5%

,28

0,139

14,7%

54,9%

2,9%

19,3%

8,2%

,55

0,315

Alpha si se
elimina el
tem
0,839
0,833
0,841
0,835

En la Tabla 2 se presentan los estadsticos de las puntuaciones totales del test.

Tabla 2. Estadsticos de la escala o test completo

Media

Varianza

22,65

Desviacin
tpica

22

N de
elementos

4,7

30

En la Tabla 3 se presenta los datos de la correlacin intraclase para el conjunto de los


30 tems.
Tabla 3. Coeficiente de correlacin intraclase

Correlacin
intraclase(a)

Intervalo de confianza 95%


Lmite inferior

Medidas promedio

,838

,829

Lmite
superior
,845

Teniendo en cuenta toda la informacin anterior, responde a las siguientes preguntas:


g. Valor del coeficiente alpha del test. Es compatible este valor con un
requisito impuesto de que el coeficiente de fiabilidad debe valer 0,90?.
Justifica la respuesta
h. Cuntos elementos paralelos a los anteriores deberamos aadir para
cumplir con el requisito anterior?
i. Si este test fuese utilizado para seleccionar sujetos en una empresa y la
empresa impusiese la condicin de alcanzar una puntuacin verdadera de
35

25 puntos, seleccionara a un sujeto con una puntuacin observada X = 23?


(NC = 0,95, utiliza la ecuacin de Kelley)
j. Qu tems eliminaras de los presentados en las tablas, para mejorar el
valor del coeficiente alpha? El examen de la tabla de respuestas a las
opciones, te sugiere por qu dichos tems son problemticos?
3. Supongamos que para la seleccin de soldados se utiliza una batera formada por 4

tests: Aptitud Verbal, Aptitud Numrica, Dependencia de Campo y Capacidad de


planificacin. Al cabo de algn tiempo en el puesto, los sujetos seleccionados son
evaluados en en criterio de rendimiento. Se quiere evaluar la validez de esta batera para
dicho criterio con los datos de N = 1576 sujetos seleccionados. En las tabla 4 y 5 se
presentan algunos datos de los tests y del criterio, necesarios para responder a las
preguntas.
Tabla 4. Estadsticos descriptivos, coeficientes de fiabilidad y n de items:
Tests
Aptitud Verbal

Media
50,4194

Desv. tp.
28,56382

Coef.
Fiabilidad
0,90

N de tems
40

Aptitud Numrica

50,0882

28,25405

0,85

50

49,9245

28,41486

0,70

10

50,7621

29,06389

0,75

12

0,70

20

Dependencia de
Campo
Planificacin
Criterio de
Rendimiento

50,3991

28,15375

Tabla 5. Correlaciones de las puntuaciones de los tests y con el criterio

Aptitud Verbal
1

Aptitud
Numrica
,628(**)

Dependencia
de campo
-,226(**)

Planificacin
,380(**)

Criterio Y
,408(**)

,628(**)

-,196(**)

,476(**)

,359(**)

-,226(**)

-,196(**)

-,322(**)

-,418(**)

,380(**)

,476(**)

-,322(**)

,420(**)

,408(**)
,359(**)
-,418(**)
,420(**)
El smbolo ** indica que la correlacin es estadsticamente significativa al nivel 0,01 (bilateral).

Aptitud Verbal
Aptitud Numrica
Dependencia de campo
Planificacin
Criterio Y

Los resultados obtenidos en el anlisis de la Regresin Lineal Mltiple se presentan an


las tablas 5, 6 y 7.
Tabla 5. Resumen del modelo

Modelo
1

R
,568(a)

R cuadrado
,322

R cuadrado
corregida
,321

Error tp. de la
estimacin
23,20686

a Variables predictoras: (Constante), intp, superp, metacogp, relacp

36

Tabla 6. ANOVA
Suma de
cuadrados

Media
cuadrtica

gl

Regresin

402323,099

100580,775

Residual

846074,860
1248397,95
9

1571

538,558

Total

Sig.

186,759

,000(a)

1575

Tabla 7. Coeficientes del modelo


Coeficientes
estandarizado
s

Coeficientes no
estandarizados
B
39,926

Error tp.
2,067

Aptitud Verbal

,221

,027

Aptitud Numrica

,061

,028

-,284
,206

(Constante)

Dependencia de
campo
Planificacin

Sig.

Beta
19,319

,000

,224

8,274

,000

,061

2,156

,031

,022

-,286

-12,961

,000

,024

,213

8,671

,000

A partir de los datos anteriores, responde a las siguientes preguntas.


CUANDO LAS PREGUNTAS HAGAN REFERENCIA A TESTS DE HIPTESIS
ESTADSTICAS TOMA COMO NIVEL DE SIGNIFICACIN = 0,01 ( P 0,01)
1) Coeficiente de determinacin mltiple
2) Coeficientes de validez, de eficiencia predictiva y de alienacin del test de
Aptitud verbal para el criterio suponiendo que se duplicasen las longitudes de ambos
tests
3) Con el nivel de significacin establecido, explica las siguientes cuestiones:
a) Podemos decir que son estadsticamente significativos (p < .01) todos los
tests predictores. Por qu?
b) Importancia relativa de los predictores para el criterio. Justifica la respuesta
c) Cul sera las ecuaciones resultantes en puntuaciones directas y tpicas, si
dejamos nicamente los predictores significativos (p < .01)? (Considera los
coeficientes que aparecen en la tabla, aunque en la realidad deberamos repetir
los clculos) en directas y tpicas.

4. Se aplic un test de Razonamiento a una muestra representativa de


N=2000 estudiantes 4 de ESO de la Comunidad de Madrid. El test estaba
formado por n = 30 items de series numricas. El test no ofrece opciones de
respuesta, sino que el sujeto debe escribir la respuesta de cada tem. El
anlisis del test se realiz siguiendo el modelo TRI de dos parmetros. En
la tabla adjunta se presentan los resultados para algunos de los tems.
ITEM
I08
I12

INTERCEPTO
E.T.*)
|
|
|

-0.305 |
0.651* |
|
-1.108 |

DISCRIMIN. DIFICULTAD SATURACIN


E.T.(a)
E.T(b)
E.T.(sat)
0.496 |
0.107* |
|
0.331 |

0.614 |
1.301* |
|
3.345 |

0.445 |
0.096* |
|
0.314 |

Adivinac. ji-cuadrado
E.T.(c) (p-valor, g.l.
Signif.)
0.000 |
2.7
8.0
0.000* | (0.9536)
|
0.000 |
2.7
6.0

37

|
|
|
|
|
|
|

I14
I15

0.851* |
|
-0.017 |
0.668* |
|
-1.168 |
1.004* |

0.095* |
|
0.656 |
0.133* |
|
0.566 |
0.144* |

2.561* |
|
0.026 |
1.018* |
|
2.063 |
1.571* |

0.090* |
|
0.548 |
0.111* |
|
0.493 |
0.125* |

0.000* | (0.8440)
|
0.000 |
5.7
0.000* | (0.5734)
|
0.000 |
0.9
0.000* | (0.9906)

7.0
6.0

I18

| -0.005 |
0.914 |
0.006 |
0.675 |
0.000 |
5.3
5.0
|
0.735* |
0.180* |
0.804* |
0.133* |
0.000* | (0.3800)
|
|
|
|
|
|
I24
|
0.000 |
0.303 |
0.001 |
0.290 |
0.000 |
15.1
8.0
|
0.594* |
0.078* |
1.961* |
0.075* |
0.000* | (0.0500)
|
|
|
|
|
|
I30
| -0.018 |
0.726 |
0.025 |
0.587 |
0.000 |
13.6
6.0
|
0.684* |
0.149* |
0.942* |
0.121* |
0.000* | (0.0347)
-------------------------------------------------------------------------------

En la siguiente figura se presentan las funciones de informacin y error tpico del test total.
FUNCIONES DE INFORMACIN Y DE ERROR TPICO DEL TEST TOTAL
Subtest: MAINTEST
6

1.10

0.88

Information

0.66
3
0.44

Standard Error

2
0.22

0
-3

-2

-1

Scale Score

Test information curve: solid line


Standard error curve: dotted line
The total test information for a specific scale score is read from the left vertical axis.
The standard error for a specific scale score is read from the right vertical axis.

Nota: La curva en trazo continuo representa la funcin de informacin y sus


valores pueden leerse en el eje vertical de la izquierda. La lnea de puntos
representa la funcin error tpico y sus valores pueden leerse en el eje
vertical de la derecha.
ALGUNAS PUNTUACIONES ESTIMADAS, PARA ALGUNOS SUJETOS, CON SUS CORRESPONDIENTES
ERRORES TPICOS
Sujeto
% de aciertos
estimada
E.T.()
125
15
-1,2316
0,4636
240
90
1,8647
0,5635
630
60
0,4203
0,3790
780
35
-0,5418
0,3806
850
100
2,45471
0,6215
1325
5
-2,0121
0,5783

PREGUNTAS: Con ayuda de las tablas y grficos, responde a las


siguientes preguntas:
7. Interpreta los parmetros de los tems presentados en cuanto a su discriminacin
y dificultad
8. Podemos decir que todos los tems se ajustan al modelo de 2P? (p < .05)
9. Dnde se encuentra la informacin mxima del test completo? Y el mnimo
error tpico de estimacin?
10. Comenta la tabla que presenta las estimaciones de los sujetos y los errores
tpicos

38

39

S-ar putea să vă placă și