Documente Academic
Documente Profesional
Documente Cultură
Solucin:
Indice de fiabilidad:
Varianza Emprica:
Varianza de Error:
Varianza Verdadera:
Solucin:
Desviacin tpica emprica en la muestra 1:
(Comprobacin:
3 12 12
4 11 10
577
643
7 19 18
8 10 11
934
10 27 28
Resultados:
Coeficiente de fiabilidad:
Coeficiente de fiabilidad:
I1
9 I10 P1
P2
P1.P
2
8
56
13
13
169
17
17
289
35
22
22
484
17
18
306
64
10
90
36
S10
24
24
576
Sum
25
25
26
28
25
26
26 29
26
25
129
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,
9
DT
132 2105
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1, 1,49 1,3 6,45 6,27 186,
5
2
6
6
5
6
6 3
7
6
7
4
1
Observacin:
Ntese que hay tres mtodos de clculo para obtener el coeficiente de
fiabilidad por un mtodo de partes (Spearman-Brown, Rulon y Guttman).
Cualquiera de ellos puede aplicarse sobre cualquiera de los tres mtodos
de particin en dos partes de los items de un test (dos mitades, paresimpares, o "ad hoc"). Distintas particiones dan, en general, distintas
estimaciones del coeficiente de fiabilidad del mismo test.
Rulon.
Aplicamos un test que tiene 10 items a una muestra de 10 sujetos.
Obtener el coeficiente de fiabilidad por el mtodo de las dos mitades
aplicando la frmula de Rulon.
Datos:
(Nota: Son los mismos datos del problema anterior).
Items:
Caso: 1 2 3 4 5 6 7 8 9 10
11212112311
22233334222
33344333443
41111121121
55544444554
64334343434
71123111321
82222222212
91111211112
10 5 5 5 4 5 5 5 4 5 5
Solucin:
Necesitamos una columna P1 que refleje el total de la primera parte
(suma de puntos de los cinco primero items) y otra P2 que refleje el total
de la segunda parte (suma de puntos de los items 6 a 10) y, adems, una
columna "d" que refleje la diferencia entre ellas (d= P1-P2), y otra X que
refleje el total (X=P1+P2) para obtener sus varianzas y aplicar la frmula
de Rulon.
Cas
o:
I1
9 I10 P1
P2
S1
15
-1
13
13
26
17
17
34
12
-2
22
22
44
17
18
35
-1
16
10
19
12
S10
24
24
48
Sum
25
25
26
28
25
26
26
29
26
-3
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,9
DT
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1,3 1,49 1,3 6,45 6,27 12,7 0,78
5
2
6
6
5
6
6
7
6
7
4
1
1
Var
2,45 2,05 1,84 1,36 1,65 1,84 1,84 1,6 2,24 1,8 41,6 39,3 161, 0,61
9
5
9
6
5
I1
9 I10 P1
P2
15
13
13
26
17
17
34
12
22
22
44
17
18
35
16
10
19
12
S10
24
24
48
Sum
25
25
26
28
25
26
26
29
26
25 129 132
261
Med
2,5
2,5
2,6
2,8
2,5
2,6
2,6 2,9
DT
1,56 1,43 1,35 1,16 1,28 1,35 1,35 1,3 1,49 1,3 6,45 6,27 12,7
5
2
6
6
5
6
6
7
6
7
4
1
Var
2,45 2,05 1,84 1,36 1,65 1,84 1,84 1,6 2,24 1,8 41,6 39,3 161,
9
5
9
6
5
Observacin:
Los mtodos de Rulon y Guttman siempre dan el mismo resultado para
una misma particin del test. El mtodo de Spearman-Brown aplicado
sobre la misma particin dar igual que estos otros si las varianzas son
iguales. Si las varianzas de las partes no son iguales, el procedimiento
de Spearman-Brown dar una estimacin del coeficiente de fiabilidad
superior a la de Rulon y Guttman; (en general, solo ligeramente superior).
Problema Tipo 8.
Pronstico de la fiabilidad de un test, aumentando su longitud,
mediante la frmula de Spearman-Brown.
Tenemos un test cuya longitud inicial es 20 y cuyo coeficiente de
fiabilidad es 081.
Cul ser su fiabilidad si doblamos su longitud.(aadiendo items
paralelos)?
Datos:
Longitud inicial del test (n de items inicial):
Longitud final del test (n de items final):
Fiabilidad inicial:
Solucin:
Relacin entre longitud final y longitud inicial:
Problema Tipo 9.
Pronstico de la fiabilidad de un test, disminuyendo su longitud,
mediante la frmula de Spearman-Brown.
Tenemos un test cuya longitud inicial es de 100 items y cuyo coeficiente
de fiabilidad es 099.
Cul ser su fiabilidad si obtenemos una forma abreviada de 75 items ?
Cul ser su fiabilidad si obtenemos una forma abreviada de 50 items ?
Cul ser su fiabilidad si obtenemos una forma abreviada de 25 items ?
Solucin:
Primera longitud final:
Relacin entre longitud final y longitud inicial:
Puede apreciarse que al tratarse de un test con una fiabilidad inicial muy
elevada, aun drsticas reducciones en el nmero de items permiten
mantener el pronstico de coeficientes de fiabilidad elevados. Los
primeros 75 items eliminados solo logran reducir la fiabilidad unas 3
centsimas (una variacin despreciable en trminos prcticos). Todava
para una longitud final de 1 tem se pronosticara un coeficiente de
fiabilidad de 0'5 aproximadamente.
final
Para resolver esta clase de problemas puede resultar prctico despejar n
en la frmula anterior, para facilitar los clculos:
de donde:
i2
i3
i4
i5
i6
i7
i8
s1
11
s2
28
s3
26
s4
35
s5
13
s6
31
s7
12
s8
35
s9
17
s10
32
Suma
34
32
33
33
33
32
27
16
240
Media
3,4
3,2
3,3
3,3
3,3
3,2
2,7
1,6
24
Des Tip
Varianz
a
2,44
2,16
3,01
1,1 1,005
1,21
1,01
1,4 1,487
1,96
0,8 9,263
2,21
0,64
85,8
14,64
Var. Total=
85,8
N de items=
Una vez calculadas las varianzas de los items y del total del test
(columna T), simplemente se aplica la frmula del coeficiente alfa:
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
s3
10
s4
s5
s6
s7
s8
s9
s10
s11
s12
1
6,75
0,75 0,583
0,25 0,417
var
0,25 0,1388 0,243 0,139 0,188 0,243 0,188 0,076 0,139 0,139 7,854
9
des
tip
0,5 0,3726 0,493 0,373 0,433 0,493 0,433 0,276 0,373 0,373 2,803
8
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
10
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
var
0,25
des
tip
0,5
5 Medi
a
0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,25 11,6
7
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 3,41
6
KR-21 utiliza otra frmula (ver pgina siguiente) para expresar la suma
de la varianza de los items, basada en la igualdad de las p entre estos
siendo todos los dems trminos iguales. Dado que en el problema
anterior todos los items tienen igual p (es irrelevante que adems en el
ejemplo p=q) entonces se obtiene que KR-20=KR-21.
Por cierto que dado que si todos los items tienen igual p tambin tienen
necesariamente igual varianza, entonces, en mi opinin, la frmula
clsica de KR-21 es innecesariamente complicada bastara aplicar esta
otra nueva frmula para KR-21:
i2
i3
i4
i5
i6
i7
i8
i9
i10
s1
10
s2
10
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 0,33
3
4,83
3
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5
0,5 0,66
7
var
0,25
des
tip
0,5
0,5
Frmula clsica de
0,5
0,5
0,5
0,5
0,5
11,3
1
0,5 0,47
1
3,36
2
i2
1
i3
0
i4
1
i5
1
i6
1
i7
0
i8
1
i9
1
i10
1
T
1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
0,917 0,0833
3
0,58
3
0,5
0,41
7
0,25
0,5
0,83
3
0,66
7
0,33
3
5,08
3
0,083 0,9166
7
0,41
7
0,5
0,58
3
0,75
0,5
0,16
7
0,33
3
0,66
7
var
0,076 0,0763
9
0,24
3
0,25
0,24
3
0,18
8
0,25
0,13
9
0,22
2
0,22
2
3,91
des
tip
0,276 0,2763
9
0,49
3
0,5
0,49
3
0,43
3
0,5
0,37
3
0,47
1
0,47
1
1,97
7
Solucin:
Puntuaciones empricas:
Emprica directa, est en los datos:
Emprica diferencial
Emprica tpica:
Paso 1.
Determinar la puntuacin tpica crtica correspondiente al nivel de
confianza escogido.
(Contraste bidireccional)
Paso 2.
Calcular el error mximo:
este intervalo.
Comentario:
Este tipo de estimacin por intervalo es cierta si, adems de los
supuestos generales de la teora clsica y de los que implica la
estimacin de la puntuacin verdadera mediante las ecuaciones de
regresin implcitas en el paso 0, es cierto que las puntuaciones
empricas distribuyen normalmente en torno a la verdadera al menos en
el punto de la escala del test en que est ubicada la puntuacin emprica
directa de la que se parte.
Obsrvese que cuanto mayor es el nivel de confianza menor es el
margen de error (nivel alfa en trminos de probabilidades), pero este
incremento de la confianza en el pronstico se efecta siempre a costa
de abrir el intervalo, de modo que si el error de estimacin es grande (lo
que depende esencialmente de la fiabilidad del test) entonces el intervalo
obtenido para un nivel de confianza alto (p.e. 99%) puede ser tan amplio
que carezca de sentido operativo.
Es obvio, por ejemplo, que si la escala de un test va entre 0 y 30 puntos
podemos afirmar con un nivel de confianza del 100% que la puntuacin
verdadera de cualquier sujeto, sea cual sea su puntuacin emprica, ha
de estar entre esos dos valores, porque la escala no puede reconocer
otros niveles ms all de los que discrimina empricamente (plantear otra
cosa lleva a diversos absurdos). Pero, tambin obviamente, un intervalo
como este no ayudara para nada.
Por cierto que es posible por este mtodo que el intervalo de confianza
en torno a las puntuaciones verdaderas estimadas rompa los lmites de la
escala emprica del test planteando un intervalo que exceda en su
mximo o en su mnimo el mximo o el mnimo de la escala. Basta para
ello plantear el problema con un valor emprico inicial lo bastante prximo
a los lmites empricos de la escala. Este es un tema que no se suele
plantear; en mi opinin no tiene sentido extender el intervalo confidencial
ms all del rango emprico de la escala del test y la interpretacin
debera restringirse a la zona en la que se produce una discriminacin
conocida (es decir, al rango de la variable). Por supuesto, una situacin
as insina que es posible que la persona este ms all del suelo
(mnimo) o del techo (mximo) que la escala es capaz de evidenciar y
que quizs proceda utilizar un test que opere en esa zona inferior o
superior, segn el caso, para medir esa dimensin de esa persona. Sin
embargo, no creo que ello autorice a establecer un brazo del intervalo
sobre una zona donde la escala simplemente no alcanza.
Esta situacin paradjica de encontrar brazos de intervalo confidencial
fuera de escala es consecuencia de un viejo problema con varias
facetas: el problema de homocedasticidad en los extremos de la
distribucin (como va a distribuir normalmente el error de medida en el
extremo de la escala si esto implica necesariamente "salirse de la
escala"?) y de la regresin a la media (cmo va distribuir normalmente
la segunda medicin en torno a un valor en los extremos de la escala si
esto implica "salirse de la escala?). Por supuesto esta una discusin
divertida ms all de los sencillos fines de nuestro problema.
Por el contrario, si
entonces no podemos rechazar la hiptesis
nula y decimos que no hay diferencias significativas.
Obsrvese que en aquellos casos en que decimos que "no podemos
rechazar la hiptesis nula", se quiere afirmar que las diferencias
detectadas no son lo suficientemente grandes (o "raras" en trminos de
muestreo) para afirmar que estn ms all de las que podran suceder
"fcilmente" por azar, pero esto no equivale a establecer la igualdad
entre ellas. No debe entenderse que se ha probado que las puntuaciones
son iguales (, en contrastes estadsticos con muestras, que se
haprobado que en la poblacin no hay diferencias).
Solucin:
Obviamente ambas mediciones estn en la misma escala, por lo que no
es necesario convertirlas previamente a tpicas.
(No obstante, aunque es innecesario, si se convierte a tpicas se ha de
obtener exactamente el mismo resultado al final del contraste -es decir,
se obtendr justo la misma
y por tanto justo la misma probabilidad-.
Queda como ejercicio planteado comprobar esta afirmacin.)
Paso 0. Calcular el error tpico de la diferencia.
Para obtener el error tpico de la diferencia es necesario obtener la
varianza de error:
Respuesta:
La diferencia significativa mnima (DSM) es:
A su vez:
Por tanto:
Comentario:
El problema anterior es una versin simplificada de las dificultades
reales. Si estuviramos interesados en conocer si existen diferencias
significativas entre las mediciones del grupo antes y despus el problema
es muy sencillo. Bastara con tomar los datos de la primera medicin y
los de la segunda medicin y compararlos mediante una prueba t para
muestras dependientes (una t de Gosset o una t de Welch, segn se
asumiera o no igualdad de varianzas entre ambas mediciones). Esto
Problema 18.
Indice de discriminacin basado en p.
Tenemos un test de aptitudes y estamos interesados en obtener el ndice
de discriminacin basado en p para el tem 1. Para ello, calculamos la
puntuacin total del test que obtiene cada persona de una muestra de
N=300, y obtenemos el valor de la mediana en esa puntuacin total.
Utilizando la mediana como punto de corte descomponemos la muestra
total en dos submuestras, inferior y superior, de 150 personas cada una.
En la submuestra inferior aciertan el tem 25, mientras que en la
submuestra superior lo aciertan 125. Calculad el ndice de discriminacin
basado en p.
Solucin:
Problema 19.
Frmula de correccin de la respuesta al azar.
Suponiendo que se dan las condiciones adecuadas para aplicar la
frmula de correccin, una persona, en una prueba objetiva de 20 tems
de tipo V/F, ha acertado 15 items y ha fallado 3. Qu puntuacin le
corresponde en una escala de 0 a 10?
Solucin:
90000000112
10 0 1 0 1 0 0 1 0 2 1
PROBLEMA 3.
FORMA PARALELA A. FORMA PARALELA B CRITERIOS:
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 2 4 3 4 3 3 4 3 12 16
21211112186
3 6 7 6 6 7 7 6 6 24 27
4 8 9 9 9 8 7 9 9 36 32
51012212142
6 6 7 6 6 7 6 6 6 24 27
7 5 5 6 5 5 5 5 6 20 22
81000121024
9 3 4 4 3 4 3 4 5 12 8
10 4 4 5 5 5 6 4 4 16 19
PROBLEMA 4.
FORMA PARALELA A. FORMA PARALELA B CRITERIOS:
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 10 11 12 10 10 9 12 10 40 43
2 7 7 7 6 8 7 6 7 28 32
3 3 3 2 3 3 3 3 2 12 8
4 4 5 4 5 6 5 6 5 30 20
51212211142
60101000101
7 21 17 21 20 18 17 16 20 80 69
8 5 5 5 4 3 2 5 6 20 16
9 9 8 9 8 8 8 8 7 29 31
10 3 4 5 1 3 2 1 5 12 12
PROBLEMA 5.
FORMA PARALELA A. FORMA PARALELA B CRITERIOS:
SUJ: ITEMS: ITEMS:
1 2 3 4 1 2 3 4 Y1 Y2
1 1 1 2 10 7 6 6 0 40 43
2 7 7 7 6 8 7 6 7 58 32
3 3 3 1 3 3 3 3 2 12 38
4 4 5 4 5 6 5 6 5 10 20
5 1 1 1 2 2 1 1 1 4 27
6 0 1 10 1 10 0 10 1 0 1
7 2 1 1 0 8 7 6 0 0 69
8 5 5 5 4 3 2 5 6 20 16
9 9 8 9 8 8 8 8 7 39 31
10 3 4 5 1 3 2 1 5 12 12
11 2 2 2 2 1 2 3 2 0 76
12 1 2 1 2 1 0 1 10 60 56
13 1 1 1 0 3 7 2 10 15 90
14 1 4 6 2 3 10 2 7 90 3
15 10 1 10 1 3 7 9 9 21 71