Problemas Resueltos de Psicometria II-patatabrava

PROBLEMAS RESUELTOS DE PSICOMETRIA II.
Prof. J.L. Meli.
Problema Tipo 1. Frmulas bsicas.

Tenemos un test cuya desviacin tpica es 6 y cuyo coeficiente de
fiabilidad es 081.
Calculad el ndice de fiabilidad, el error tpico de medida, la varianza
verdadera, la varianza de error.
Datos:
Solucin:
Indice de fiabilidad:
Error tpico de medida:
Varianza Emprica:
Varianza de Error:
Varianza Verdadera:
Coeficiente de Fiabilidad (Comprobacin):
Problema Tipo 2. Constancia del Error Tpico de Medida.

En la muestra 1 el Test X presenta una varianza de 25 y un coeficiente
de fiabilidad de 0'9. Se sabe que en la muestra 2 el test presenta una
varianza de 36. Cul ser el coeficiente de fiabilidad que se espera en
esa segunda muestra si se sostiene el supuesto de constancia del error

tpico de medida?
Datos:
Solucin:
Desviacin tpica emprica en la muestra 1:
Error tpico de medida en la muestra 1:
Desviacin tpica en la muestra 2:
Supuesto de constancia del error tpico de medida:
Coeficiente de fiabilidad en la segunda muestra
(Comprobacin:
Problema Tipo 3. Fiabilidad Test-Retest.

Aplicamos el test X en el tiempo 1 a una muestra de 10 sujetos, y el
retest en tiempo 2. Calculad el coeficiente de fiabilidad por el mtodo
test-retest.
Datos:
Caso: I II
1 17 17
2 18 19
3 12 12
4 11 10
577
643
7 19 18
8 10 11
934
10 27 28
Resultados:
Coeficiente de fiabilidad:
Problema Tipo 4. Fiabilidad Formas "Paralelas".

Aplicamos las formas A y B del test X a una muestra de 8 sujetos.
Calculad el coeficiente de fiabilidad por el mtodo de formas paralelas.
Datos:
Caso: I II
1 13 15
2 38 39
3 12 12
4 11 10
534
643
7 40 38
8 15 13
Resultados:
Coeficiente de fiabilidad:
Problema Tipo 5. Mtodo de Dos Partes aplicando la Correccin de

Spearman-Brown.
Aplicamos un test que tiene 10 items a una muestra de 10 sujetos.
Obtened el coeficiente de fiabilidad por el mtodo de dos mitades
aplicando la frmula de Spearman-Brown.
Datos:
Items:
Caso: I1 2 3 4 5 6 7 8 9 I10
S1 1 2 1 2 1 1 2 3 1 1
22233334222
33344333443
41111121121
55544444554
64334343434
71123111321
82222222212
91111211112
S10 5 5 5 4 5 5 5 4 5 5
Solucin:
Necesitamos elaborar en la tabla una columna P1 que refleje el total de
la primera parte (suma de puntos de los cinco primero items) y otra P2
que refleje el total de la segunda parte (suma de puntos de los items 6 a
10) y obtener la correlacin entre ambas. (Para obtener la correlacin
puede ayudar utilizar una columna "P1.P2" de productos, si es
necesario).
Cas
o:
S1
I1
9 I10 P1
P2
P1.P
2
8
56
13
13
169
17
17
289
35
22
22
484
17
18
306
64
10
90
36
S10
24
24
576
Sum
25
25
26
28
25
26
26 29
26
25
129
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,
9
2,6 2,5 12,9 13,2 210,

5
DT
132 2105
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1, 1,49 1,3 6,45 6,27 186,
5
2
6
6
5
6
6 3
7
6
7
4
1
Correlacin de Pearson r entre los totales P1 y P2 de ambas partes:
Estimacin del coeficiente de fiabilidad del test aplicando la correccin de

Spearman-Brown caso de longitud doble a la correlacin anterior:
Observacin:
Ntese que hay tres mtodos de clculo para obtener el coeficiente de
fiabilidad por un mtodo de partes (Spearman-Brown, Rulon y Guttman).
Cualquiera de ellos puede aplicarse sobre cualquiera de los tres mtodos
de particin en dos partes de los items de un test (dos mitades, paresimpares, o "ad hoc"). Distintas particiones dan, en general, distintas
estimaciones del coeficiente de fiabilidad del mismo test.
Problema Tipo 6. Mtodo de Dos partes aplicando la frmula de
Rulon.
Obtener el coeficiente de fiabilidad por el mtodo de las dos mitades
aplicando la frmula de Rulon.
Datos:
(Nota: Son los mismos datos del problema anterior).
Items:
Caso: 1 2 3 4 5 6 7 8 9 10
11212112311
22233334222
33344333443
41111121121
55544444554
64334343434
71123111321
82222222212
91111211112
10 5 5 5 4 5 5 5 4 5 5
Solucin:
Necesitamos una columna P1 que refleje el total de la primera parte
(suma de puntos de los cinco primero items) y otra P2 que refleje el total
de la segunda parte (suma de puntos de los items 6 a 10) y, adems, una
columna "d" que refleje la diferencia entre ellas (d= P1-P2), y otra X que
refleje el total (X=P1+P2) para obtener sus varianzas y aplicar la frmula
de Rulon.
Cas
o:
I1
9 I10 P1
P2
S1
15
-1
13
13
26
17
17
34
12
-2
22
22
44
17
18
35
-1
16
10
19
12
S10
24
24
48
Sum
25
25
26
28
25
26
26
29
26
25 129 132 261
-3
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,9
2,6 2,5 12,9 13,2 26,1 -0,3
DT
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1,3 1,49 1,3 6,45 6,27 12,7 0,78
5
2
6
6
5
6
6
7
6
7
4
1
1
Var
2,45 2,05 1,84 1,36 1,65 1,84 1,84 1,6 2,24 1,8 41,6 39,3 161, 0,61
9
5
9
6
5
Aplicando la frmula de Rulon obtenemos el coeficiente de fiabilidad del

test:
Problema Tipo 7. Mtodo de Dos partes aplicando la frmula L4 de

Guttman.
Obtener el coeficiente de fiabilidad por el mtodo de las dos mitades
aplicando la frmula de Guttman.
Datos:
Los mismos datos del problema anterior.
Solucin:
Necesitamos la misma tabla del problema anterior, pero podemos
prescindir de la columna de diferencias d.
Cas
o:
S1
I1
9 I10 P1
P2
15
13
13
26
17
17
34
12
22
22
44
17
18
35
16
10
19
12
S10
24
24
48
Sum
25
25
26
28
25
26
26
29
26
25 129 132
261
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,9
2,6 2,5 12,9 13,2 26,1
DT
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1,3 1,49 1,3 6,45 6,27 12,7
5
2
6
6
5
6
6
7
6
7
4
1
Var
2,45 2,05 1,84 1,36 1,65 1,84 1,84 1,6 2,24 1,8 41,6 39,3 161,
9
5
9
6
5
Aplicando la frmula de Guttman:
Observacin:
Los mtodos de Rulon y Guttman siempre dan el mismo resultado para
una misma particin del test. El mtodo de Spearman-Brown aplicado
sobre la misma particin dar igual que estos otros si las varianzas son
iguales. Si las varianzas de las partes no son iguales, el procedimiento
de Spearman-Brown dar una estimacin del coeficiente de fiabilidad
superior a la de Rulon y Guttman; (en general, solo ligeramente superior).
PROBLEMAS RESUELTOS DE PSICOMETRIA II. Parte

Segunda.
Prof. J.L. Meli.
Problema Tipo 8.
Pronstico de la fiabilidad de un test, aumentando su longitud,
mediante la frmula de Spearman-Brown.
Tenemos un test cuya longitud inicial es 20 y cuyo coeficiente de
fiabilidad es 081.
Cul ser su fiabilidad si doblamos su longitud.(aadiendo items
paralelos)?
Datos:
Longitud inicial del test (n de items inicial):
Longitud final del test (n de items final):
Fiabilidad inicial:
Solucin:
Relacin entre longitud final y longitud inicial:
Fiabilidad final pronosticada:
Problema Tipo 9.
Pronstico de la fiabilidad de un test, disminuyendo su longitud,
mediante la frmula de Spearman-Brown.
Tenemos un test cuya longitud inicial es de 100 items y cuyo coeficiente
de fiabilidad es 099.
Cul ser su fiabilidad si obtenemos una forma abreviada de 75 items ?

Datos:
Longitud inicial del test (n de items inicial):
Fiabilidad inicial:
Primera longitud final del test (n de items final):
Segunda longitud final del test (n de items final):
Tercera longitud final del test (n de items final):
Cuarta longitud final del test (n de items final):
Solucin:
Primera longitud final:
Fiabilidad final pronosticada para 75 items:
Segunda longitud final:

Tercera longitud final:

Cuarta longitud final:

Puede apreciarse que al tratarse de un test con una fiabilidad inicial muy
elevada, aun drsticas reducciones en el nmero de items permiten
mantener el pronstico de coeficientes de fiabilidad elevados. Los
primeros 75 items eliminados solo logran reducir la fiabilidad unas 3
centsimas (una variacin despreciable en trminos prcticos). Todava
para una longitud final de 1 tem se pronosticara un coeficiente de
fiabilidad de 0'5 aproximadamente.
Tabla . Reduccin de la fiabilidad al reducir la longitud del test

(multiplicando esta por el factor n) para tests de fiabilidad inicial
0'99, 0'95, 0'90, 0'85 y 0'80.
Fiabilidad inicial: .
n .990 .950 .900 .850 .800
.010 .497 .160 .083 .054 .038
.020 .664 .275 .153 .102 .074
.030 .748 .363 .213 .145 .107
.040 .798 .432 .265 .185 .138
.050 .832 .487 .310 .221 .167
.060 .856 .533 .351 .254 .194
.070 .874 .571 .387 .284 .219
.080 .888 .603 .419 .312 .242
.090 .899 .631 .448 .338 .265
.100 .908 .655 .474 .362 .286
.110 .916 .676 .497 .384 .306
.120 .922 .695 .519 .405 .324

.130 .928 .712 .539 .424 .342
.140 .933 .727 .558 .442 .359
.150 .937 .740 .574 .459 .375
.160 .941 .752 .590 .476 .390
.170 .944 .764 .605 .491 .405
.180 .947 .774 .618 .505 .419
.190 .950 .783 .631 .518 .432
.200 .952 .792 .643 .531 .444
.210 .954 .800 .654 .543 .457
.220 .956 .807 .664 .555 .468
.230 .958 .814 .674 .566 .479
.240 .960 .820 .684 .576 .490
.250 .961 .826 .692 .586 .500
.260 .963 .832 .701 .596 .510
.270 .964 .837 .708 .605 .519
.280 .965 .842 .716 .613 .528
.290 .966 .846 .723 .622 .537
.300 .967 .851 .730 .630 .545
.310 .968 .855 .736 .637 .554
.320 .969 .859 .742 .645 .561
.330 .970 .862 .748 .652 .569
.340 .971 .866 .754 .658 .576
.350 .972 .869 .759 .665 .583
.360 .973 .872 .764 .671 .590
.370 .973 .875 .769 .677 .597
.380 .974 .878 .774 .683 .603
.390 .975 .881 .778 .688 .609
.400 .975 .884 .783 .694 .615
.410 .976 .886 .787 .699 .621
.420 .977 .889 .791 .704 .627

.430 .977 .891 .795 .709 .632
.440 .978 .893 .798 .714 .638
.450 .978 .895 .802 .718 .643
.460 .979 .897 .805 .723 .648
.470 .979 .899 .809 .727 .653
.480 .979 .901 .812 .731 .658
.490 .980 .903 .815 .735 .662
.500 .980 .905 .818 .739 .667
.510 .981 .906 .821 .743 .671
.520 .981 .908 .824 .747 .675
.530 .981 .910 .827 .750 .679
.540 .982 .911 .829 .754 .684
.550 .982 .913 .832 .757 .688
.560 .982 .914 .834 .760 .691
.570 .983 .915 .837 .764 .695
.580 .983 .917 .839 .767 .699
.590 .983 .918 .842 .770 .702
.600 .983 .919 .844 .773 .706
.610 .984 .921 .846 .776 .709
.620 .984 .922 .848 .778 .713
.630 .984 .923 .850 .781 .716
.640 .984 .924 .852 .784 .719
.650 .985 .925 .854 .786 .722
.660 .985 .926 .856 .789 .725
.670 .985 .927 .858 .792 .728
.680 .985 .928 .860 .794 .731
.690 .986 .929 .861 .796 .734
.700 .986 .930 .863 .799 .737
.710 .986 .931 .865 .801 .740
.720 .986 .932 .866 .803 .742

.730 .986 .933 .868 .805 .745
.740 .987 .934 .869 .807 .747
.750 .987 .934 .871 .810 .750
.760 .987 .935 .872 .812 .752
.770 .987 .936 .874 .814 .755
.780 .987 .937 .875 .815 .757
.790 .987 .938 .877 .817 .760
.800 .988 .938 .878 .819 .762
.810 .988 .939 .879 .821 .764
.820 .988 .940 .881 .823 .766
.830 .988 .940 .882 .825 .769
.840 .988 .941 .883 .826 .771
.850 .988 .942 .884 .828 .773
.860 .988 .942 .886 .830 .775
.870 .989 .943 .887 .831 .777
.880 .989 .944 .888 .833 .779
.890 .989 .944 .889 .835 .781
.900 .989 .945 .890 .836 .783
.910 .989 .945 .891 .838 .784
.920 .989 .946 .892 .839 .786
.930 .989 .946 .893 .841 .788
.940 .989 .947 .894 .842 .790
.950 .989 .948 .895 .843 .792
.960 .990 .948 .896 .845 .793
.970 .990 .949 .897 .846 .795
.980 .990 .949 .898 .847 .797
.990 .990 .950 .899 .849 .798
1.00 .990 .950 .900 .850 .800
Representacin grfica del efecto sobre la fiabilidad de la reduccin

de la longitud.
En la figura siguiente se ha representado la relacin entre el valor n (en
el eje de abscisas) y la fiabilidad final (en ordenadas) al reducir la
longitud del test para un test de fiabilidad inicial 0'99 (linea superior). 0'95
(linea siguiente), 0'90 (tercera linea), 0'85 (cuarta linea) y 0'80 (ltima
linea).
Es decir, la figura siguiente es la representacin grfica de los datos de la
tabla anterior.
El eje de abscisas puede leerse como la proporcin que el test final
representa de uno inicial de tamao unidad. As por ejemplo el valor 0'8
en abscisas se refiere a un test compuesto solo por el 80% de items del
test inicial, En ordenadas podemos leer que fiabilidad se espera despus
de aplicar esa reduccin para un test de fiabilidad inicial dada.
Por ejemplo, para un test cuya fiabilidad inicial es 0'99 al reducir el
nmero de sus elementos multiplicndolo por 0'8 la frmula de
Spearman-Brown pronostica una fiabilidad de 0'0988.
Para un test de fiabilidad inicial 0'8 al reducir sus elementos hasta dejar
un 80% de los iniciales la fiabilidad pronosticada es 0'762.
Puede apreciarse que cuanto menor es la fiabilidad inicial (posicin de
cada curva sobre el valor 1 de abscisas, a la derecha del grfico), mayor
es el efecto sobre la fiabilidad de una determinada reduccin de la
longitud.
La reduccin de la fiabilidad al acortar la longitud de una prueba es
inversamente proporcional a n (que es el factor reductor), de modo que a
ms n menos reduccin de la fiabilidad. Si se prefiere decirlo de otra
forma, la fiabilidad final es directamente proporcional a n, cuanto mayor
es n mayor es la fiabilidad final (menos se reduce est).
Obsrvese que la reduccin de la fiabilidad al acortar la longitud depende
por entero de n bajo este planteamiento, y es independiente del valor
absoluto de la longitud inicial o final. Por ejemplo, si un test tiene una
fiabilidad x y 100 items que reducimos a 50 (n=0'5) obtendremos la
misma fiabilidad final que si el test tena solo 10 items los reducimos a 5
(n=0'5) con la misma fiabilidad inicial x.
Figura. Efecto sobre la fiabilidad de la reduccin de la longitud para
tests de fiabilidad inicial 0'99, 0'95, 0'90, 0'85 y 0'80.
Problema tipo 10.

Estimacin del nmero de items a aadir para mejorar una
determinada fiabilidad inicial.
Tenemos un test con 40 items cuyo coeficiente de fiabilidad es 0'6.
Cuntos items habr que aadir para alcanzar una fiabilidad de 0'8?
Solucin:
El problema puede resolverse planteando la frmula de Spearman-Brown
y despejando n en ella:
Despus, puede despejarse la longitud final en la frmula de n:
Es decir, la forma final debera tener unos 107 items.

(Dado que el nmero de items es variable discreta redondeamos al
entero superior).
De aqu es inmediato que, segn el pronstico de Spearman-Brown,
habr que aadir 67 items a los 40 iniciales para alcanzar esa fiabilidad
final
Para resolver esta clase de problemas puede resultar prctico despejar n
en la frmula anterior, para facilitar los clculos:
Dado que se persigue generalmente obtener la longitud final todava es

posible dar un paso ms:
de donde:
Aplicndolo al problema anterior tenemos:
Obtenindose, obviamente, las mismas conclusiones.
Problema tipo 11.

Estimacin del nmero de items que se pueden eliminar para
obtener una determinada fiabilidad final.
Tenemos un test con 167 items cuyo coeficiente de fiabilidad es 0'95.
Cuntos items podramos suprimir para mantener una fiabilidad de 0'9?
Solucin:
El problema puede resolverse planteando la frmula de Spearman-Brown
y despejando o aplicando las frmulas con n o f despejados que hemos
deducido en el problema anterior.
La forma final tendra unos 80 items (redondeamos los items finales al

entero superior), y, por tanto, podramos eliminar unos 87 items.
Aplicando la frmula de f llegamos a los mismos resultados:
Problema tipo 12.

Clculo del coeficiente alfa.
Hemos aplicado un test compuesto de 8 items a 10 personas observando
los siguientes resultados. Obtener el coeficiente alfa.
i1
i2
i3
i4
i5
i6
i7
i8
s1
11
s2
28
s3
26
s4
35
s5
13
s6
31
s7
12
s8
35
s9
17
s10
32
Suma
34
32
33
33
33
32
27
16
240
Media
3,4
3,2
3,3
3,3
3,3
3,2
2,7
1,6
24
Des Tip
1,562 1,4696 1,735

9
Varianz
a
2,44
2,16
3,01
Sum. Var. Items=
1,1 1,005
1,21
1,01
1,4 1,487
1,96
0,8 9,263
2,21
0,64
85,8
14,64
Var. Total=
85,8
N de items=
Una vez calculadas las varianzas de los items y del total del test
(columna T), simplemente se aplica la frmula del coeficiente alfa:
El coeficiente alfa vale 0'94.

Obsrvese que en la frmula de alfa n significa el nmero de items, 8 en
el ejemplo.
Problema tipo 13.

Clculo del coeficiente KR-20.
Hemos aplicado un test compuesto de 10 items valorados
dicotmicamente a 12 personas que han obtenido los siguientes
resultados. Calculad el coeficiente KR-20.
i1
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
s3
10
s4
s5
s6
s7
s8
s9
s10
s11
s12
1
6,75
0,5 0,8333 0,583 0,833

3
0,75 0,583
0,75 0,917 0,167 0,833
0,5 0,1666 0,417 0,167

7
0,25 0,417
0,25 0,083 0,833 0,167
var
0,25 0,1388 0,243 0,139 0,188 0,243 0,188 0,076 0,139 0,139 7,854
9
des
tip
0,5 0,3726 0,493 0,373 0,433 0,493 0,433 0,276 0,373 0,373 2,803
8
La frmula KR-20 tan solo es una variante de alfa especialmente

orientada a items dicotmicamente valorados (especficamente,
valorados con los valores 0 y 1). All donde puede aplicarse KR-20 puede
aplicarse alfa con el mismo resultado (pero lo inverso no es cierto,
porque KR-20 es un caso particular y no sirve donde los items no estn
valorados dicotmicamente).
Una vez obtenido p (=A/N) y q (=1- p) para cada tem, se procede a
obtener la varianza de cada tem como producto de p por q. Tambin
necesitamos la varianza del total y la suma de la varianza de los items
para aplicar finalmente la frmula:
Problema tipo 14.

Clculo del coeficiente KR-20 y KR-21.
El coeficiente KR-21 es una variante de KR-20 que iguala a este cuando
todos los items presentan igual p. Si alguno de los items presenta un p
distinto a los dems entonces KR-21 infraestima KR-20 y carece de
sentido aplicarlo. Si todos los items tienen exactamente igual p entonces
da igual aplicar KR-20 KR-21. Adems, la situacin en que todos los

items tengan igual p es en trminos prcticos inverosmil. Por estas
razones KR-21 carece de inters prctico, sin que aporte nada
tericamente. El problema siguiente se introduce nicamente a efecto de
ilustrar estos extremos de una frmula clsicamente presente en los
manuales de psicometra.
Caso 1. Todos los items tienen igual p. Hemos aplicado un test
compuesto de 10 items valorados dicotmicamente a 12 personas que
han obtenido los siguientes resultados. Calculad el coeficiente KR-20 y
KR-21.
i1
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
10
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
var
0,25
des
tip
0,5
5 Medi
a
0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 11,6
7
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 3,41
6
KR-21 utiliza otra frmula (ver pgina siguiente) para expresar la suma
de la varianza de los items, basada en la igualdad de las p entre estos
siendo todos los dems trminos iguales. Dado que en el problema
anterior todos los items tienen igual p (es irrelevante que adems en el
ejemplo p=q) entonces se obtiene que KR-20=KR-21.
Por cierto que dado que si todos los items tienen igual p tambin tienen
necesariamente igual varianza, entonces, en mi opinin, la frmula
clsica de KR-21 es innecesariamente complicada bastara aplicar esta
otra nueva frmula para KR-21:
dado que, obviamente, en este caso:
Aplicada la nueva frmula de KR-21 al problema anterior tenemos:
La nueva frmula de KR-21 que he propuesto no sirve si todos los items

no tienen igual varianza, pero en ese caso tampoco sirve ni tiene sentido
calcular KR-21.
Caso 2. Para ilustrar el efecto de la alteracin de un solo valor p sobre
KR-21 hemos variado en la tabla anterior el valor p del tem 10. Como
,puede apreciarse entonces KR-21 infraestima KR-20 (y no procede
utilizarlo):
i1
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
10
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 0,33
3
4,83
3
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 0,66
7
var
0,25
des
tip
0,5
0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,22

2
0,5
0,5
Frmula clsica de
0,5
0,5
0,5
0,5
0,5
11,3
1
0,5 0,47
1
3,36
2
Caso 2. Segundo ejemplo.

En general la presencia de mayores diferencias entre los valores p de los
items (como es usual y requerido en la mayora de los tests con
respuesta verdadera) producen una discrepancia mayor entre KR-21 y
KR-20.
As por ejemplo, en los siguientes datos, donde, como es usual cada tem
presenta su propio valor p, KR-20= 0'568 y KR-21=0'401. Por supuesto,
en este caso el valor que habra que considerar es el de KR-20.
i1
s1
i2
1
i3
0
i4
1
i5
1
i6
1
i7
0
i8
1
i9
1
i10
1
T
1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,917 0,0833
3
0,58
3
0,5
0,41
7
0,25
0,5
0,83
3
0,66
7
0,33
3
5,08
3
0,083 0,9166
7
0,41
7
0,5
0,58
3
0,75
0,5
0,16
7
0,33
3
0,66
7
var
0,076 0,0763
9
0,24
3
0,25
0,24
3
0,18
8
0,25
0,13
9
0,22
2
0,22
2
3,91
des
tip
0,276 0,2763
9
0,49
3
0,5
0,49
3
0,43
3
0,5
0,37
3
0,47
1
0,47
1
1,97
7
Problema tipo 15.

La estimacin de las puntuaciones verdaderas.
Una persona ha obtenido una puntuacin de 25 en un test cuya media es
20, cuya desviacin tpica es 5 y cuyo coeficiente de fiabilidad es 0'7.
Obtened su puntuacin verdadera estimada en directas, en diferenciales
y en tpicas.
Datos:
Solucin:
Puntuaciones empricas:
Emprica directa, est en los datos:
Emprica diferencial
Emprica tpica:
Puntuaciones verdaderas estimadas:

Verdadera estimada directa:
Verdadera estimada diferencial:
Verdadera estimada tpica:

(Indice de fiabilidad).
El problema puede ser resuelto por varios caminos equivalentes entre s.

Tal vez sea particularmente fcil convertir empricas diferenciales a
verdaderas estimadas diferenciales (simplemente multiplicando por el
coeficiente de fiabilidad, como acabamos de hacer) y desde ah obtener
las verdaderas estimadas directas y tpicas. Una vez tenemos la
verdadera estimada diferencial procederamos as:
Verdadera estimada directa:
Verdadera estimada tpica:

(Desviacin tpica de las
verdaderas).
Problema tipo 16.

Intervalo confidencial en torno a la puntuacin verdadera estimada.
Una vez obtenida la puntuacin verdadera estimada puede establecerse
en torno a ella un intervalo confidencial para un nivel de confianza
determinado.
Por ejemplo, para establecer un intervalo con un nivel de confianza del
95% en torno a la puntuacin verdadera estimada directa, con los datos
del problema anterior procederemos del siguiente modo.
Paso 0.
Establecer la puntuacin verdadera estimada directa. Como hemos visto
es igual a 23'5.
Calcular el error tpico de estimacin de las puntuaciones verdaderas a

partir de las empricas:
Paso 1.
Determinar la puntuacin tpica crtica correspondiente al nivel de
confianza escogido.
(Contraste bidireccional)
Paso 2.
Calcular el error mximo:
Establecer el Intervalo de Confianza:
Es decir, en estas condiciones (para un test de esas caractersticas

mtricas) puede afirmarse con un nivel de confianza del 95% que una
persona que ha obtenido una puntuacin emprica directa de 25
presentar una puntuacin verdadera estimada directa entre 19'01 y
27'99.
Existe todava un margen de error del 5%, es decir, 5 de cada 100 veces
que efectuemos este pronstico la puntuacin verdadera estar fuera de
este intervalo.
Comentario:
Este tipo de estimacin por intervalo es cierta si, adems de los
supuestos generales de la teora clsica y de los que implica la
estimacin de la puntuacin verdadera mediante las ecuaciones de
regresin implcitas en el paso 0, es cierto que las puntuaciones
empricas distribuyen normalmente en torno a la verdadera al menos en
el punto de la escala del test en que est ubicada la puntuacin emprica
directa de la que se parte.
Obsrvese que cuanto mayor es el nivel de confianza menor es el
margen de error (nivel alfa en trminos de probabilidades), pero este
incremento de la confianza en el pronstico se efecta siempre a costa
de abrir el intervalo, de modo que si el error de estimacin es grande (lo
que depende esencialmente de la fiabilidad del test) entonces el intervalo
obtenido para un nivel de confianza alto (p.e. 99%) puede ser tan amplio
que carezca de sentido operativo.
Es obvio, por ejemplo, que si la escala de un test va entre 0 y 30 puntos
podemos afirmar con un nivel de confianza del 100% que la puntuacin
verdadera de cualquier sujeto, sea cual sea su puntuacin emprica, ha
de estar entre esos dos valores, porque la escala no puede reconocer
otros niveles ms all de los que discrimina empricamente (plantear otra
cosa lleva a diversos absurdos). Pero, tambin obviamente, un intervalo
como este no ayudara para nada.
Por cierto que es posible por este mtodo que el intervalo de confianza
en torno a las puntuaciones verdaderas estimadas rompa los lmites de la
escala emprica del test planteando un intervalo que exceda en su
mximo o en su mnimo el mximo o el mnimo de la escala. Basta para
ello plantear el problema con un valor emprico inicial lo bastante prximo
a los lmites empricos de la escala. Este es un tema que no se suele
plantear; en mi opinin no tiene sentido extender el intervalo confidencial
ms all del rango emprico de la escala del test y la interpretacin
debera restringirse a la zona en la que se produce una discriminacin
conocida (es decir, al rango de la variable). Por supuesto, una situacin
as insina que es posible que la persona este ms all del suelo
(mnimo) o del techo (mximo) que la escala es capaz de evidenciar y
que quizs proceda utilizar un test que opere en esa zona inferior o
superior, segn el caso, para medir esa dimensin de esa persona. Sin
embargo, no creo que ello autorice a establecer un brazo del intervalo
sobre una zona donde la escala simplemente no alcanza.
Esta situacin paradjica de encontrar brazos de intervalo confidencial
fuera de escala es consecuencia de un viejo problema con varias
facetas: el problema de homocedasticidad en los extremos de la
distribucin (como va a distribuir normalmente el error de medida en el
extremo de la escala si esto implica necesariamente "salirse de la
escala"?) y de la regresin a la media (cmo va distribuir normalmente
la segunda medicin en torno a un valor en los extremos de la escala si
esto implica "salirse de la escala?). Por supuesto esta una discusin
divertida ms all de los sencillos fines de nuestro problema.
Problema tipo 17.

Mtodo general de contraste de puntuaciones individuales.
Caso 1. Puntuaciones en escalas distintas.
Una persona ha sido evaluada en dos tests que pretenden medir dos
aptitudes, distintas pero razonablemente relacionadas, la precisin en el
desempeo mecnico manual (Aptitud A) y la rapidez en ese desempeo
(Aptitud B), obteniendo en ambas 101 puntos del test. El primer test
presenta una media de 95, una desviacin tpica de 8 y un coeficiente de
fiabilidad de 0'8. El segundo test presenta una media de 105, una
desviacin tpica de 7 y un coeficiente de fiabilidad de 0'9. Puede
afirmarse que existen diferencias significativas entre ambas puntuaciones
a un nivel alfa 0'05?
Datos:
Test A Test B
Medias:
Des.Tip.:
Co. Fiab.:
Punt.:
Resultados:
Cundo hay que convertir a puntuaciones tpicas las puntuaciones
antes de efectuar el contraste?
La primera cuestin ante este tipo de problemas es plantearse si las
unidades en que estn medidas las puntuaciones son conmensurables y
comparables desde la misma escala. Si las mediciones pertenecen a
tests distintos en distinta escala de medida conviene efectuar la
tipificacin antes de comparar. No siempre es del todo claro si las
unidades pueden ser comparadas sin ms, y pueden haber algunos
casos discutibles, segn que criterio se adopte. En general, si las
mediciones provienen de tests distintos con distinta media y/o distinta
desviacin tpica conviene tipificar las puntuaciones antes de proceder al
contraste.
En este caso no hay duda, las puntuaciones a comparar provienen de
tests distintos con distinta media y desviacin tpica, por tanto, antes de
comparar las puntuaciones en el contraste las convertiremos en tpicas.
Transformacin de las puntuaciones directas a tpicas:
Paso 0. Calcular el error tpico de la diferencia.
Para calcular el error tpico de la diferencia es necesario obtener la

varianza de error de cada test. Puede recordarse que la varianza de error
de un test no es ms que su error tpico de medida al cuadrado. En este
caso, como vamos a comparar las puntuaciones una vez tipificadas
hemos de considerar que la varianza (y la desviacin tpica) de cualquier
variable en tpicas vale siempre 1.
Paso 1. Tipificar la diferencia entre las puntuaciones.
Paso 2. Nivel de significacin de la diferencia.

Este paso puede darse con distintos enfoque de trabajo que pasamos a
comentar.
Enfoque de nivel de significacin.
Utilizando una tabla de curva normal (o una calculadora que tenga esta
funcin) (Ver la "Tabla de Nivel de Significacin Bidireccional (P) de una
puntuacin tpica (z) en valor absoluto") se determina cual es el rea que
queda entre las colas y la
. (se toman ambas colas para un contraste
bidireccional).
En este caso ese valor es 0'015840 (El valor obtenido en una tabla ser
una aproximacin al anterior y puede diferir ligeramente. En adelante
redondeamos a 0'016 por simplicidad).
Este valor representa la probabilidad de encontrar una diferencia tan
grande o mayor que 2'412586 cuando la hiptesis nula es cierta (es

decir, cuando realmente ambas puntuaciones no difieren entre s y toda
variacin se debe al error de medicin).
Es decir, una diferencia tan grande o mayor que 2'41 todava aparecera
por mero azar, que se atribuye al error de medida, aproximadamente 16
veces de cada mil con tests de estas caractersticas mtricas.
(El valor 0'016 es la probabilidad de lo que se suele denominar error tipo
I: es decir, la probabilidad de rechazar la hiptesis nula cuando en
realidad es cierta. El valor 0'016 es la probabilidad de error tipo I
asociada a una diferencia
de 2'412586).
En resumen, mediante una tabla de curva normal determinamos que a
una
de 2'412586 le corresponde un nivel de significacin de 0'016
(aproximadamente).
Contraste de hiptesis utilizando el nivel de significacin:
Como se ha pedido una decisin al nivel alfa 0'05 rechazaremos la
hiptesis nula siempre que la probabilidad asociada a la diferencia bajo la
hiptesis nula sea menor o igual a 0'05.
En este problema, dado que, efectivamente 0'015840 < 0'05, hemos de
rechazar la hiptesis nula y considerar la diferencia entre ambas
puntuaciones como significativa.
Contraste de hiptesis sin obtener el nivel de significacin exacto de
la
.
En este caso, como el problema se ha planteado en trminos de efectuar
un contraste de hiptesis sin que se haya solicitado el nivel de
significacin asociado a la
, podamos haber efectuado efectivamente
el contraste de hiptesis sin pasar por la obtencin del nivel de
significacin de la
por medio de una tabla o de una calculadora.
Simplemente, como sabemos que cualquier puntuacin tpica mayor (en
trminos de valores absolutos) que 1'959964 (que suele redondearse por
simplicidad a 1'96) deja a ambos lados de la distribucin normal menos
del 5% de los casos, entonces, en trminos prcticos, es suficiente con
comparar la
obtenida con el valor de la puntuacin tpica "crtica" ( ).
La puntuacin tpica crtica ( ) expresa la menor tpica posible (en valor
absoluto) que representa una diferencia significativa. En este caso, para
nivel alfa 0'05 bidireccional, esa puntuacin sera
.
En resumen, comparamos
con
y si
entonces rechazamos
la hiptesis nula y decimos que hay diferencias significativas. (Como en
este problema).
Por el contrario, si
entonces no podemos rechazar la hiptesis
nula y decimos que no hay diferencias significativas.
Obsrvese que en aquellos casos en que decimos que "no podemos
rechazar la hiptesis nula", se quiere afirmar que las diferencias
detectadas no son lo suficientemente grandes (o "raras" en trminos de
muestreo) para afirmar que estn ms all de las que podran suceder
"fcilmente" por azar, pero esto no equivale a establecer la igualdad
entre ellas. No debe entenderse que se ha probado que las puntuaciones
son iguales (, en contrastes estadsticos con muestras, que se
haprobado que en la poblacin no hay diferencias).
Caso 2. Puntuaciones en la misma escala.

Se administra a una persona un test que mide la variable X. Despus de
unos meses trabajando para mejorar la posicin de la persona en esa
variable (lo que significar conseguir reducir su puntuacin) volvemos a
medirla con el mismo test. El test en cuestin tiene una media de 30, una
desviacin tpica de 5 y un coeficiente de fiabilidad de 0'9. La primera vez
la persona obtuvo 35 puntos, y la segunda logr reducir su puntuacin
hasta 30. Ha habido un cambio significativo estadsticamente en la
evolucin de la persona? (Responded la cuestin utilizando un nivel alfa
0'01 bidireccional).
Datos:
Solucin:
Obviamente ambas mediciones estn en la misma escala, por lo que no
es necesario convertirlas previamente a tpicas.
(No obstante, aunque es innecesario, si se convierte a tpicas se ha de
obtener exactamente el mismo resultado al final del contraste -es decir,
se obtendr justo la misma
y por tanto justo la misma probabilidad-.
Queda como ejercicio planteado comprobar esta afirmacin.)
Paso 0. Calcular el error tpico de la diferencia.
Para obtener el error tpico de la diferencia es necesario obtener la
varianza de error:
Paso 1. Tipificar la diferencia entre las puntuaciones.
Paso 2. Nivel de significacin de la diferencia.

Nivel de significacin. A la puntuacin 2'236068 le corresponde un nivel
de significacin (alfa) de 0'025347. (Mediante una tabla de curva normal
se obtendr una aproximacin a este nmero).
Contraste. Por tanto, a un nivel alfa 0'01 bidireccional no puede
rechazarse la hiptesis nula (dado que la probabilidad obtenida es mayor
que 0'01).
Analizado desde el valor de las puntuaciones tpicas, la
es menor que
la
por lo que no puede rechazarse la hiptesis nula (la
diferencia entre las puntuaciones no es significativa a un nivel alfa 0'01
bidireccional).
Grfico. Nivel de significacin bidireccional (NSB) para cada tpica
(Z).
Caso 3. Diferencia Significativa Mnima (DSM).

He introducido el concepto de DSM -que es una novedad en este campo
de las comparaciones individuales bajo teora clsica-, inspirado por
analoga en tests de Fisher para comparar mltiples muestras bajo unas
mismas condiciones.
Este estadstico sirve para evitar tener que realizar un contraste de
diferencias individuales para cada par de puntuaciones cuando estamos
interesados en comparar muchos pares de puntuaciones individualmente

(par a par) ms que como grupo.
Por ejemplo, supongamos que medimos a una clase de estudiantes de 5
grado con un amplio test de vocabulario orientado a los objetivos de ese
grado educativo. Para cada persona efectuamos dos mediciones, una a
comienzo de curso y otra al final. El grupo est formado por 30
estudiantes, y estamos interesados en discernir si existen diferencias
significativas (alfa 0'01 bidireccional) entre la primera y la segunda
medicin de cada uno de los 30 estudiantes individualmente. El test tiene
una media de 97, una deviacin tpica de 6'8 y un coeficiente de fiabilidad
de 0'97. En esta situacin habra que hacer 30 contrastes individuales
(dado que el foco del problema son las personas individuales y no el
grupo como un todo). En lugar de ello tiene sentido preguntarse cul es
la diferencia mnima entre puntuaciones que resulta significativa?
Datos:
Respuesta:
La diferencia significativa mnima (DSM) es:
A su vez:
Por tanto:
Resultado que se interpreta en el sentido de que una diferencia entre dos

puntuaciones individuales obtenidas con este test ser significativa al
nivel alfa 0'01 si es igual o mayor a 4'29 puntos. Esto permite contrastar
las diferencias individuales entre las puntuaciones a ese nivel de
significacin cmodamente.
Comentario:
El problema anterior es una versin simplificada de las dificultades
reales. Si estuviramos interesados en conocer si existen diferencias
significativas entre las mediciones del grupo antes y despus el problema
es muy sencillo. Bastara con tomar los datos de la primera medicin y
los de la segunda medicin y compararlos mediante una prueba t para
muestras dependientes (una t de Gosset o una t de Welch, segn se
asumiera o no igualdad de varianzas entre ambas mediciones). Esto
permitira comparar el comportamiento de los dos grupos de

puntuaciones a travs de sus medias y decidir si existen o no diferencias
significativas.
Sin embargo, tal y como est enfocado el problema, orientados a
averiguar para cada persona individual si puede hablarse de cambio
significativo en sus puntuaciones no hay ms remedio que abordar la
comparacin desde una perspectiva individual. Esto supone algunas
dificultades adicionales, pero realmente estas 30 preguntas individuales
son para el psiclogo orientado a informar sobre el curso de la evolucin
de cada una de estas personas tan o ms importantes que la cuestin
sobre el grupo como un todo.
Las dificultades prcticas son de diversa ndole.
Primero, por supuesto, en la prctica es altamente improbable que
ambas mediciones presenten la misma media y la misma desviacin
tpica, y si se calcula el coeficiente de fiabilidad separadamente con los
datos de cada una de ellas probablemente tambin diferira. Estas
diferencias en medias (y desviaciones tpicas) son la base que permite
que la pregunta sobre la comparacin de los grupos tenga sentido pero
plantean preguntas para la comparacin de puntuaciones individuales
Dado que la media y la desviacin tpica de ambas mediciones no son
iguales debemos tipificar las puntuaciones antes del contraste? Puede
responderse a esta cuestin de diferentes modos desde diferentes
criterios. En primer lugar, si los grupos no difieren estadsticamente
pueda obtenerse la media y la desviacin tpica para las 60
puntuaciones, dado que puede argumentarse que ambas mediciones
pertenecen a una misma poblacin de mediciones y dado que una
estimacin conjunta de media y de varianza puede considerarse en ese
caso ms adecuada. En este caso no sera necesario tipificar antes de
comparar puntuaciones individuales. En segundo lugar, si los grupos
difieren significativamente en media (prueba t ) o en varianza (test de
Levene, p.e.) no puede sostenerse que pertenezcan a una misma
poblacin de mediciones y no puede recomendarse obtener una
estimacin conjunta de media o varianza. En ese caso para cada
medicin corresponde calcular su varianza de error separadamente y
convendra tipificar las puntuaciones antes del contraste individual.
Segundo, un problema inherente a la realizacin de muchos contrastes
entre puntuaciones individuales es que se acumula error tipo I, es decir,
la probabilidad de rechazar la hiptesis nula cuando en realidad debera
aceptarse. Si, pongamos por caso, para un contraste a nivel alfa 0'05
tenemos que de cada 100 veces que hiciramos el contraste, en
promedio, 5 rechazaramos la hiptesis nula equivocadamente, entonces,
si efectuamos 30 contrastes puede esperarse que 1 2 de ellos
presenten diferencias significativas por mero azar, es decir, diferencias
que nos llevaran rechazar la hiptesis nula cuando en realidad es cierta.
Pueden ensayarse diversas soluciones para esta cuestin aunque
pueden resultar discutibles. En primer lugar, si el nmero de contrastes a
realizar puede establecerse de antemano puede pensarse en un
procedimiento tipo Bonferroni, dividiendo el nivel de significacin por el
nmero de contrastes para garantizar el nivel de significacin originario.
En la prctica, si el nmero de contrastes es muy elevado este
procedimiento puede ser demasiado exigente con las diferencias para se

consideradas significativas, y, desde un punto de vista de las diferencias
para un caso individual, aceptar hiptesis nulas que en realidad son
falsas, llevando a juicios sobre el comportamiento de las puntuaciones de
personas concretas equivocados. En segundo lugar, puede pensarse en
"proteger" los contrastes individuales mediante un contraste estadstico
general a nivel de grupos. Esta aproximacin puede no ser razonable
para algunos de los variados casos en que puede aplicarse el contraste
individual de puntuaciones, para empezar simplemente porque no este
claro de que grupos se habla en algunos casos. De todas formas aun en
los casos en que sea razonable aplicar el mtodo, como en el ejemplo
del problema donde se podra aplicar previamente una t para muestras
dependientes, es difcil considerar, en trminos psicomtricos de
comparacin entre puntuaciones individuales que si no puede rechazarse
la hiptesis nula a nivel de grupos necesariamente no pueda rechazarse
para un caso individual: un razonamiento as sera una peticin de
principio que desaconsejara en cualquier caso efectuar cualquier
contraste que no fuera de grupos de puntuaciones.
En sntesis, de la discusin anterior puede concluirse que el contraste
estadstico de puntuaciones individuales es procedimiento que debe
tomarse con precaucin muy particularmente cuando hay que efectuar
mltiples contrastes individuales.
Problema 18.
Indice de discriminacin basado en p.
Tenemos un test de aptitudes y estamos interesados en obtener el ndice
de discriminacin basado en p para el tem 1. Para ello, calculamos la
puntuacin total del test que obtiene cada persona de una muestra de
N=300, y obtenemos el valor de la mediana en esa puntuacin total.
Utilizando la mediana como punto de corte descomponemos la muestra
total en dos submuestras, inferior y superior, de 150 personas cada una.
En la submuestra inferior aciertan el tem 25, mientras que en la
submuestra superior lo aciertan 125. Calculad el ndice de discriminacin
basado en p.
Solucin:
Segn la clasificacin de Ebel. dado que el ndice de discriminacin
basado en p es mayor que 0'39 podemos decir que el tem es muy

discriminativo, que "funciona muy bien" en el propsito de distinguir entre
los mas capaces y los menos capaces.
Problema 19.
Frmula de correccin de la respuesta al azar.
Suponiendo que se dan las condiciones adecuadas para aplicar la
frmula de correccin, una persona, en una prueba objetiva de 20 tems
de tipo V/F, ha acertado 15 items y ha fallado 3. Qu puntuacin le
corresponde en una escala de 0 a 10?
Solucin:
Puesta la calificacin en la escala usual de 0 a 10 tenemos:
La persona ha obtenido un 6 como "calificacin".
Problema tipo 20.

Frmula de atenuacin.
Tenemos un test con coeficiente de fiabilidad de 0'9 y un criterio con
coeficiente de fiabilidad de 0'91. El coeficiente de validez de este test con
este criterio es 0'7. Cul ser la correlacin entre test y criterio una vez
atenuados los errores de medida?
Solucin:
PROBLEMAS PLANTEADOS DE PSICOMETRIA.

Prof. J.L. Meli.
Estos problemas que se presentan planteados sin resolver

pretenden ofrecer material adicional para practicar personalmente
algunos problemas bsicos.
De cada una de las matrices de datos siguientes calculad:
Para cada una de las formas paralelas:
1. La correlacin entre dos mitades.
Tomando como esta correlacin como estimacin del coeficiente
de fiabilidad, calculad el ndice de fiabilidad, el error tpico de
medida, y la varianza verdadera.
2. La fiabilidad del test por el mtodo de las dos mitades (mediante
la correccin de Spearman-Brown, la frmula de Rulon y la de
Guttman).
3. La fiabilidad del test por el procedimiento de pares-impares
(mediante la correccin de Spearman-Brown, la frmula de Rulon y
la de Guttman).
4. La correlacin inter-tem promedio.
5. El coeficiente alfa, o en su caso el KR-20 si corresponde.
6. Tomando alfa ( KR-20) como estimacin del coeficiente de
fiabilidad, calculad el ndice de fiabilidad, el error tpico de medida,
y la varianza verdadera.
Entre las dos formas paralelas:
7. La fiabilidad calculada por el procedimiento de formas paralelas
(Correlacin entre mitades).
Con las dos formas tomadas conjuntamente (como si entre las dos
formaran una sola forma):
8. La fiabilidad por el mtodo de pares-impares (mediante la
correccin de Spearman-Brown, la frmula de Rulon y/ la de
Guttman).
9. La correlacin inter-tem promedio.
10. La fiabilidad estimada segn el espacio muestral de items.
11. El coeficiente alfa o el KR-20 si procede.
12. En los items valorados dicotmicamente (0-1) el ndice de
dificultad de cada tem (tomando el 1 como acierto en el tem).
13. Las correlaciones entre cada tem y el total del test.
De las dos formas tomadas conjuntamente con las variables Y1 y
Y2:
14. Suponiendo que Y1 es un criterio, calculad la validez criterial
del test total.
15. Suponiendo que Y2 es otro criterio, calculad la validez criterial

del test total.
16. Calcular la correlacin adecuada de los items del test con el
criterio Y1.
17. Calcular la correlacin adecuada de los items del test con el
criterio Y2.
PROBLEMA 1.
FORMA PARALELA A. FORMA PARALELA B CRITERIOS:
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
11101010134
21110101034
31000110023
41011110034
50111011022
60111011134
70001000012
80001000112
90000000112
10 0 1 0 0 0 0 1 0 1 2
PROBLEMA 2.
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
11111011144
21110101134
31100110033
41111111044
50111011133
60111111144
71000010011
80000000121
90000000112
10 0 1 0 1 0 0 1 0 2 1
PROBLEMA 3.
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 2 4 3 4 3 3 4 3 12 16
21211112186
3 6 7 6 6 7 7 6 6 24 27
4 8 9 9 9 8 7 9 9 36 32
51012212142
6 6 7 6 6 7 6 6 6 24 27
7 5 5 6 5 5 5 5 6 20 22
81000121024
9 3 4 4 3 4 3 4 5 12 8
10 4 4 5 5 5 6 4 4 16 19
PROBLEMA 4.
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 10 11 12 10 10 9 12 10 40 43
2 7 7 7 6 8 7 6 7 28 32
3 3 3 2 3 3 3 3 2 12 8
4 4 5 4 5 6 5 6 5 30 20
51212211142
60101000101
7 21 17 21 20 18 17 16 20 80 69
8 5 5 5 4 3 2 5 6 20 16
9 9 8 9 8 8 8 8 7 29 31
10 3 4 5 1 3 2 1 5 12 12
PROBLEMA 5.
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 1 1 2 10 7 6 6 0 40 43
2 7 7 7 6 8 7 6 7 58 32
3 3 3 1 3 3 3 3 2 12 38
4 4 5 4 5 6 5 6 5 10 20
5 1 1 1 2 2 1 1 1 4 27
6 0 1 10 1 10 0 10 1 0 1
7 2 1 1 0 8 7 6 0 0 69
8 5 5 5 4 3 2 5 6 20 16
9 9 8 9 8 8 8 8 7 39 31
10 3 4 5 1 3 2 1 5 12 12
11 2 2 2 2 1 2 3 2 0 76
12 1 2 1 2 1 0 1 10 60 56
13 1 1 1 0 3 7 2 10 15 90
14 1 4 6 2 3 10 2 7 90 3
15 10 1 10 1 3 7 9 9 21 71

Problemas Resueltos de Psicometria II-patatabrava

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Problemas Resueltos de Psicometria II-patatabrava

Încărcat de

Drepturi de autor:

Formate disponibile

PROBLEMAS RESUELTOS DE PSICOMETRIA II.

Prof. J.L. Meli.

Problema Tipo 1. Frmulas bsicas.

Error tpico de medida:

Coeficiente de Fiabilidad (Comprobacin):

Problema Tipo 2. Constancia del Error Tpico de Medida.

esa segunda muestra si se sostiene el supuesto de constancia del error

Error tpico de medida en la muestra 1:

Desviacin tpica en la muestra 2:

Supuesto de constancia del error tpico de medida:

Coeficiente de fiabilidad en la segunda muestra

Problema Tipo 3. Fiabilidad Test-Retest.

Problema Tipo 4. Fiabilidad Formas "Paralelas".

Problema Tipo 5. Mtodo de Dos Partes aplicando la Correccin de

2,6 2,5 12,9 13,2 210,

Correlacin de Pearson r entre los totales P1 y P2 de ambas partes:

Estimacin del coeficiente de fiabilidad del test aplicando la correccin de

Problema Tipo 6. Mtodo de Dos partes aplicando la frmula de

25 129 132 261

2,6 2,5 12,9 13,2 26,1 -0,3

Aplicando la frmula de Rulon obtenemos el coeficiente de fiabilidad del

Problema Tipo 7. Mtodo de Dos partes aplicando la frmula L4 de

2,6 2,5 12,9 13,2 26,1

Aplicando la frmula de Guttman:

PROBLEMAS RESUELTOS DE PSICOMETRIA II. Parte

Fiabilidad final pronosticada:

Cul ser su fiabilidad si obtenemos una forma abreviada de 5 items ?

Fiabilidad final pronosticada para 75 items:

Segunda longitud final:

Fiabilidad final pronosticada para 50 items:

Tercera longitud final:

Fiabilidad final pronosticada para 25 items:

Cuarta longitud final:

Fiabilidad final pronosticada para 5 items:

Tabla . Reduccin de la fiabilidad al reducir la longitud del test

.120 .922 .695 .519 .405 .324

.420 .977 .889 .791 .704 .627

.720 .986 .932 .866 .803 .742

Representacin grfica del efecto sobre la fiabilidad de la reduccin

Problema tipo 10.

Despus, puede despejarse la longitud final en la frmula de n:

Es decir, la forma final debera tener unos 107 items.

Dado que se persigue generalmente obtener la longitud final todava es

Aplicndolo al problema anterior tenemos:

Obtenindose, obviamente, las mismas conclusiones.

Problema tipo 11.

La forma final tendra unos 80 items (redondeamos los items finales al

Problema tipo 12.

1,562 1,4696 1,735

Sum. Var. Items=

El coeficiente alfa vale 0'94.

Problema tipo 13.

0,5 0,8333 0,583 0,833

0,75 0,917 0,167 0,833

0,5 0,1666 0,417 0,167

0,25 0,083 0,833 0,167

La frmula KR-20 tan solo es una variante de alfa especialmente

Problema tipo 14.

da igual aplicar KR-20 KR-21. Adems, la situacin en que todos los

dado que, obviamente, en este caso:

Aplicada la nueva frmula de KR-21 al problema anterior tenemos:

La nueva frmula de KR-21 que he propuesto no sirve si todos los items

0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,22