Sunteți pe pagina 1din 8

Universidad del Valle

Facultad de Ingeniería
Escuela de Estadística
Programa Académico de Estadística
Estadística no parametríca
Cali, febrero de 2018

Test Ansari – Bradley (Comparación de Varianzas)

1. Fundamento teórico de la prueba


Esta prueba no parametrica recibe su nombre gracias a, Freund y Ansari (1957),David y Barton (1958)
y por Ansari y Bradley (1960).

El objetivo de este informe es mostrar el método usado por ellos para comparar las variaciones y probar si
existe o no diferencia entre ellas. Este tipo de comparación la podemos encontrar en diferentes situciaciones
por ejemplo: Una empresa turística requiere analizar los gastos diarios de sus clientes que visitan España
e Italia, con el fin de contrastar los gatos medios de turistas con destino España tienen igual dispersión
o diferente a Italia.

Es usada bajo el supuesto de que la hipotesis nula sea igualdad de varianzas, contra la hipotesis alternativa
que asume la diferencia entre ellas.
2 2 2 2 2 2 2 2
H0 : σA = σB vs H0 : σA 6= σB , σA < σB ,σA > σB

El test de Ansari-Bradley es no parametrico ya que puede tener distribución desconocida, es decir los
supuestos de normalidad y varianza regulares permiten restricciones como trabajar con muestras pequeñas

2. Presentación de supuestos
• La prueba de Ansari-Braley asume las medianas de ambas poblaciones iguales
• La hipotesis nula para este test es que las varianzas de sus poblaciones deben ser identicas
• La prueba clasifica sus observaciones en orden ascendente como el procedimiento de Wilcoxon –
Mann- Whitney
• La prueba de Ansari- Bradley trabaja bajo el supuesto de que sus poblaciones deben ser continuas
e independientes
• Cabe destacar que el test de Ansari-Bradley se puede aplicar tambien en poblaciones con diferentes
medianas, siempre que estas sean conocidas.

3. Metodología de aplicación.
En muestras no parametrícas, bajo el supuesto de poblaciones continuas, se emplea la prueba de
Ansari-Bradley para analizar la homogeneidad de las variaciones.

• Contraste bilateral

1
Estadística no parametríca 2

2 2 2 2
H0 : σA = σB vs H0 : σ A 6= σB

Pn 1 valorA
Estadístico de contraste: W = i=1 ci .Ri donde ci =
0 valorB
Se asigna a cada valor un coeficiente de Ri

• Cuando n es impar:

Ri = 1, 2, 3, ..., n+1
2 , ..., 3, 2, 1

• Cuando n es par

Ri = 1, 2, 3, ..., n2 , ..., 3, 2, 1

Cuando el tamaño de la muestra conjunta n = nA + nB > 20 se emplea la aproximación asintótica a una


distribución normal N (0, 1)
Estadistico de contraste:

Zp = |W
√ −E[W ]|
V ar[W ]

Se acepta la hipotesis nula cuando

Zp = |W
√ −E[W ]| ≤ Z α
2
V ar[W ]

ó cuando el nivel de significancia α = 0.05 es menor al Valor p

• Contraste unilateral a la derecha

2 2 2 2
H0 : σA ≤ σB vs H0 : σ A > σB

W −E[W ]
Estadístico de contraste: Zp = √
V ar[W ]

• Cuando el tamaño de la muestra es impar

nA (n+1)2 nA .nB (n+1).(n2 +3)


E(W ) = 4n V ar(W ) = 48n2

Cuando hay presencia de empates se utiliza la varianza corregida


Pg 2
nA nB i=1 th Rh nA nB (n+1)4
V arc (W ) = n(n−1) − 16n2 (n−1)

• Cuando el tamaño de la muestra es par

nA (n+2)2 nA .nB .(n2 −4)


E(W ) = 4 V ar(W ) = 48n2

Cuando hay presencia de valores empatados se utiliza la varianza corregida


Pg 2
nA nB i=1 th Rh nA nB (n+2)2
V arc (W ) = n(n−1) − 16(n−1)

- g = Número de rangos diferentes que aparecen observaciones repetidas


- th = Tamaño h-ésimo grupo

Estadística no parametríca (2018)


Estadística no parametríca 3

- Rh = Rango medio h-ésimo grupo

Entonces se acepta la hipotesis nula cuando


W −E[W ]
Zp = √ ≤ Zα
V ar[W ]

ó cuando el nivel de significancia α = 0.05 es menor al Valor p

• Contraste unilateral a la izquierda

2 2 2 2
H0 : σA ≥ σB vs H0 : σ A < σB

Su estadístico de contraste y la forma de arreglar los empates es similar al contraste unilateral a la derecha

Por lo tanto aceptamos la hipotesis nula cuando


W −E[W ]
Zp = √ ≤ Zα−1
V ar[W ]

ó cuando el nivel de significancia α = 0.05 es menor al Valor p

4. Presentación caso practico


Cierta empresa dedicada a la fabricación de bebidas alcohólicas en Colombia, requiere analizar los
costos laborales unitarios de dos sectores de su producción. En la tabla adjunta aparecen dos muestras
aleatorias del sector A y el sector B

Sector A Sector B
1200 1263
1150 1370
1326 1614
1480 1416
1235 1139
1215 1041
1515 1493
1375 1817
1296 1388
1463 1110
1514
1409
1268
1377
1091

a. Contrastar que los costos unitarios de los dos sectores tienen la misma dispersión, suponiendo que
las medianas de las dos poblaciones son iguales

Solución: Siendo las dos poblaciones continuas se emplea la prueba de Ansari-Bradley. Primero se estable
la prueba bilateral
Hipótesis estadística:

Estadística no parametríca (2018)


Estadística no parametríca 4

2 2 2 2
H0 : σsectorA = σsectorB vs H0 : σsectorA 6= σsectorB

Podemos observar que sus poblaciones son continuas, entonces se construye una muestra conjunta de
tamaño n = nA + nB = 15 + 10 = 25 > 20(impar)por lo tanto se emplea la aproximación asintotica a
una distribución normal N (0, 1)
Se ordenan los valores de menor a mayor, dando al coeficiente instrumental ci el valor 1 a los valores de
A y 0 a los valores de B
Se asigna a cada valor un coeficiente: 1, 2, 3, ... n+1
2 , ..., 3, 2, 1

Sector A Sector B Sectores A-B Posición Ci Ri Ci .Ri


1200 1263 1200 1041 0 1 0
1150 1370 1150 1091 1 2 2
1326 1614 1326 1110 0 3 0
1480 1416 1480 1139 0 4 0
1235 1139 1235 1150 1 5 5
1215 1041 1215 1200 1 6 6
1515 1493 1515 1215 1 7 7
1375 1817 1375 1235 1 8 8
1296 1388 1296 1263 0 9 0
1463 1110 1463 1268 1 10 10
1514 1514 1296 1 11 11
1409 1409 1326 1 12 12
1268 1268 1370 0 13 0
1377 1377 1375 1 12 12
1091 1091 1377 1 11 11
1263 1388 0 10 0
1370 1409 1 9 9
1614 1416 0 8 0
1416 1463 1 7 7
1139 1480 1 6 6
1041 1493 0 5 0
1493 1514 1 4 4
1817 1515 1 3 3
1388 1614 0 2 0
1110 1817 0 1 0
113

P25
- W = i=1 Ci .Ri = 113
nA .(n+1)2 15∗262
- E(W ) = 4n = 4∗25 = 101.4
nA .nB (n+1)(n2 +3) 15∗10∗26(252 +3)
- V ar[W ] = 48n2 = 48∗252 = 81.64

Estadístico de contraste: Zp = |W
√ −E[W ]| = 113∗101.4

81.64
= 1.284
V ar[W ]
Decisión: como Zp = −1.284 < 1.96 = Z0.025 entonces aceptamos la hipotesis nula de igualdad de
variaciones.

b. Contrastar que los costes unitarios de los dos sectores tienen la misma dispersión, suponiendo que
las medianas de las dos poblaciones son distintas

Estadística no parametríca (2018)


Estadística no parametríca 5

Solución: se establece el contraste de hipótesis bilateral


Hipótesis estadística:
2 2 2 2
H0 : σsectorA = σsectorB vs H0 : σsectorA 6= σsectorB

Al no conocer las medianas de las poblaciones, para calcular el estadístico de contraste se calcula
las medianas muestrales M esectorA y M esectorB . Para esto, se ordena los valores muestrales de menor a
mayor.

• Mediana del sector A

nA 15
2 = 2 = 7.5 con lo que se encuentra en la octava posición es decir M esectorA = 1326

• Mediana del sector B


nB 10
2 = 2 = 5 con lo que se encuentra en la quinta posición es decir M esectorB = 1370
Se hacen las diferencias de estas por lo tanto di = M esectorB − M esectorA = 53. Para que las medianas
sean iguales restamos las observaciones del sector B con di como se obeserva en a siguiente tabla

Sector A Sector B Xi − M esectorA Xi − M esectorB


1091 1041 -235 -329
1150 1110 -176 -260
1200 1139 -126 -231
1215 1263 -111 -107
1235 1370 -91 0
1268 1388 -58 18
1296 1416 -30 46
1326 1493 0 123
1375 1614 49 244
1377 1817 51 447
1409 83
1463 137
1480 154
1514 188
1515 189

Se construye la muestra conjunta de las diferencias de tamaño n = nA + nB , ordenando las diferencias


de menor a mayor, se da ci el valor de 1 a las diferencias de A y 0 a las diferencias de B
Se asigna a cada valor un coeficiente Ri = 1, 2, 3..., n+1
2 , ..., 3, 2, 1 atribuyendo el rango cuando hay
valores empatados

Estadística no parametríca (2018)


Estadística no parametríca 6

Wi Ci Ri Ci ∗ Ri
-329 0 1 0
-260 0 2 0
-235 1 3 3
-231 0 4 0
-176 1 5 5
-126 1 6 6
-111 1 7 7
-107 0 8 0
-91 1 9 9
-58 1 10 10
-30 1 11 11
0 0 12.5 0
0 1 12.5 12.5
18 0 12 0
46 0 11 0
49 1 10 10
51 1 9 9
83 1 8 8
123 0 7 0
137 1 6 6
154 1 5 5
188 1 4 4
189 1 3 3
244 0 2 0
447 0 1 1

P25
El estadistico de contraste W procedentes de la muestra A sera: W = i=1 Ci .Ri = 108.5
Como el tamaño de la diferencia de la muestra n = nA +nB > 20 se emplea la aproximación asintótica a
a una distribución normal N (0, 1) considerando una varianza corregida por presencia de datos empatados

nA (n+1)2 15∗262
- E(W ) = 4n = 4∗25 = 101.4
Pg 2
nA .nB i=1 th Rh nA .nB (n+1)4
- V arc (W ) = n(n−1) − 16.n2 (n−1)

donde:

* g= Número de rangos diferentes cuando hay datos empatados


* th = Tamaño h-ésimo grupo
* Rh = Rango medio h-ésimo grupo
Pg 2
Para hallar i=1 th .Rh se construye la siguiente tabla:

Estadística no parametríca (2018)


Estadística no parametríca 7

th Rh Rh2 th .Rh2
1 1 1 1
1 2 4 4
1 3 9 9
1 4 16 16
1 5 25 25
1 6 36 36
1 7 49 49
1 8 64 64
1 9 81 81
1 10 100 100
1 11 121 121
2 12.5 156.25 312.5
1 12 144 144
1 11 121 121
1 10 100 100
1 9 81 81
1 8 64 64
1 7 49 49
1 6 36 36
1 5 25 25
1 4 16 16
1 3 9 9
1 2 4 4
1 1 1 1
1468.5

P24 2
- i=1 th .Rh = 1468.5
Pg 2
nA .nB i=1 th Rh nA .nB (n+1)4 15∗10∗1468.5
- V arc (W ) = n(n−1) − 16.n2 (n−1) = 25∗24 = 81.515

Estadístico de contraste:
|W −E[W ]| |108.5−101.4|
Zp = √ = √
81.515
= 0.786
V arc [W ]

Decisión:como Zp = 0.786 < 1.96 = Z0.025 se acepta la hipotesis nula de igualdad de varianzas

Estadística no parametríca (2018)


Estadística no parametríca 8

5. Pruebas similares en el campo paramétrico y no paramétrico.


Como el test de ansari-bradley, existen diferentes test que permiten evaluar la distribución de la
varianza. Todos ellos consideran como hipótesis nula que la varianza es igual entre los grupos y como
hipótesis alternativa que no lo es. La diferencia entre ellos es el estadístico de centralidad que utilizan,
algunos trabajan con la media de la varianza lo cual son mas potentes cuando las poblaciones se distriuyen
de forma normal.

• F-test (razón de varianzas) - Parametrico


• Test de Brown-Forsyth- Parametrico
• Test de Fligner-Killeen - No parametrico

• Test Sieguel Tukey - No parametrico

6. Conclusiones
1. El efecto de alinear las muestras, sobre la base de las medianas muestrales significa que la prueba
no es exacta en el sentido de que hay una tendencia de dar valores p pequeños.
2. Haciendo una revisión de la literatura, en la mayoria de estudios de simulación han confirmado esta
tendencia, aunque los valores p exactos se abordan para muestras muy grandes
3. En la mayoria de articulos del test de ansari-bradley se hallaron diferentes metodologías de aplica-
ción, donde se realiza el calculo convencial, en contraste con otros libros se encontro que el calculo
de la desviación del promedio de los rangos hace un poco diferente su desarrollo.
4. Haciendo una comparación con la prueba de Siegel Tukey para el mismo ejemplo planteado se puede
obeservar que el valor p de este estudio es ligeramente mayor que el de la prueba de Tukey.
5. Se encontró que hay una forma analoga a la prueba de Ansari-Bradley llamada prueba Mood, se
sustenta en una alternativa de usar |di | como score pero elevadolo al cuadrado

Referencias
[1] Peter Sprent
Applied Nonparametric Statistical Methods, third edition
[2] Brenda Maria Duarte Reyes,
Elementos de Inferencia no Paramétrica-Universidad de Sevilla
[3] Contrastes no parametricos Universidad Autonoma de Madrid

[4] Nathaniel E. Helwig Nonparametric Dispersion and Equality Tests. Statistics University of Minnesota
(Twin Cities)
[5] Practical nonparametric statistics. Conover, W. J.(1971).New York
[6] https://rpubs.com/JoaquinA R/218466

[7] https://www.youtube.com/watch?v=1Igy1Yt9TFIt=315s

Estadística no parametríca (2018)

S-ar putea să vă placă și