Sunteți pe pagina 1din 8

1 PRUEBA DE NORMALIDAD

Prueba de Shapiro-Wilk

Cuando la muestra es como mximo de tamao 50 se puede contrastar la


normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la
media y la varianza muestral, S2, y se ordenan las observaciones de menor a
mayor. A continuacin se calculan las diferencias entre: el primero y el ltimo; el
segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos
coeficientes tabulados por Shapiro y Wilk. El estadstico de prueba es:

Donde D es la suma de las diferencias corregidas.

Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el


valor crtico proporcionado por la tabla elaborada por los autores para el tamao
muestral y el nivel de significacin dado.

La secuencia para realizar los contrastes de normalidad es:

Analiza

Estadsticos, Descriptivos y Explorar

En el cuadro de dilogo que aparece al activar el botn Grficos se activa la


opcin Grficos con pruebas de normalidad.

EJEMPLO

Ejemplo 1.

Con los datos correspondientes a la variable Trans de la encuesta Enctrans.sav y


con referencia a los encuestados que viven en Barcelona, se quiere comprobar si
su distribucin en cuanto al tipo de transporte utilizado se adapta a los resultados
de un estudio realizado por el Ayuntamiento de Barcelona, que son los siguientes:
el 40% de los desplazamientos al trabajo se realizan en metro; el 30% en autobs;
el 20% en transporte privado y 10% otros medios.
La distribucin de frecuencias de la variable Trans es:

En este caso para realizar el contraste Chi-cuadrado es necesario definir las


cuatro categoras contempladas en la hiptesis nula. Para ello, se crea una nueva
variable, Trans2, a partir de Trans con las siguientes categoras: Metro, Bus,
Privado (que resultar de agregar Coche y Moto) y Otros (que agrupar Tren y
Otros).Una vez creada la nueva variable, con la secuencia Analizar > Pruebas no
paramtricas > Chi-cuadrado se llega al cuadro de dilogo en donde se selecciona
la variable Trans2 y se introduce en Valores esperados las frecuencias relativas de
cada categora segn la hiptesis nula correctamente ordenadas: 0,4 para la
categora 1; 0,3 para la 2; 0,2 para la 3 y 0,10 para la 4. Al aceptar se obtienen los
siguientes resultados:
Como todas las categoras presentan frecuencia esperada mayor que 5 se puede
aplicar el contraste Chi-cuadrado sin modificar el nmero de categoras. El valor
del estadstico Chi-cuadrado permite rechazar la hiptesis nula para niveles de
significacin superiores al 2,7%. As pues, al 5% de significacin se llega a la
Conclusin de que la distribucin del tipo de transporte que utilizan los alumnos
no se adapta a la publicada por el ayuntamiento.

Prueba de K-cuadrado de D'Agostino

En las estadsticas, de D'Agostino K 2 prueba, llamada as por Ralph D'Agostino ,


es una bondad de ajuste medida de la desviacin de la normalidad , es decir, la
prueba tiene como objetivo establecer si la muestra dada proviene de una
poblacin distribuida normalmente. La prueba est basada en las
transformaciones de la muestra curtosis y la asimetra, y tiene el poder slo contra
las alternativas que la distribucin est sesgada y / o Kurtic.

Ejemplo de utilizacin de prueba de DAgostino

La prueba es utilizada para corroborar si es razonable asumir que un conjunto de


datos tiene distribucin normal. Aplicacin de la prueba a los siguientes datos:

8.27 - 3.34 - 10.50 - 11.15 - 5.41 - 14.76 - 14.76 - 9.85 - 11.31 - 10.70 - 9.25 -
12.90

Planteo de hiptesis de la prueba

H0: Los datos tienen distribucin normal

H1: No es H0Clculo del estadstico del test:

Dnde:
- Xi: indica el dato que apareci en el lugar i en la muestra. Por ejemplo, para la
muestra dada

X2 = 3.34, X5 = 5.41

- Xi: son los datos ordenados en la muestra. Por ejemplo, para la muestra dada

X3 = 8.27,

X5 = 9.85

- n: indica la cantidad de datos de la muestra, para este ejemplo n = 12

- n se calcula de la siguiente manera:

Para el clculo del estadstico realizamos la siguiente tabla, la cual nos facilita los
clculos.

Comentarios sobre la creacin de la tabla:


- Columna 1: colocamos los ndices, en nuestro caso como hay 12 datos va de 1
a 12.

- Columna 2: tiene los datos en el orden que fueron dados en la letra del problema.

- Columna 3: tiene los datos en forma ordenada de menor a mayor.

- Columna 4: realizamos la operacin en cada fila, a i (elementos de la columna 1)


le quitamos n+1/2

- Columna 5: en cada fila realizamos multiplicamos el elemento de la columna 3


(de esa fila) con el elemento de la columna 4 de esa fila.

Por ejemplo:

-18.36 se obtiene del producto: (3.34)(-5.5).

-24.36 se obtiene del producto: (-4.5) (5.41) y as con el resto de los elementos.

Finalmente calculamos el estadstico:

Para eso, primero hallamos el numerador sumando todos los elementos de la


columna 5 de la tabla:

Para el clculo del denominador hallamos n, utilizando su definicin: n =


3.3859.

Entonces el denominador: n

2n = 487.5721

Finalmente, el estadstico es el cociente: DA = 128.29/487.5721 = 0.26312


Decisin del test:

Para decidir entre H0 o H1 nos fijamos en la tabla de DAgostino para n = 12.

Como el estadstico DA (0.2653, 0.2841), podemos concluir que el p-valor es


mayor a 0.2.

Entonces: p-valor0.1, por lo que acepto H0.

2 PRUEBA HOMOGNEA

PRUEBA F-MAX DE HARTLEY

Fue propuesta por Hartley (19401950). Asume que las poblaciones son normales
e independientes y los tamaos de las muestras son iguales.

El estadstico de prueba es:

Fmax = mx(si2) / mn(si2)

Donde i = 1, . . . , k, con k igual al nmero de muestras.

Si la hiptesis nula es cierta y los tamaos de las muestras son iguales n = n1 =


n2 = = nk, la distribucin muestral del estadstico Fmax (asumiendo
independencia de las muestras aleatorias tomadas de las poblaciones normales)
es FMAX con k grados de libertad en el numerador y v = n1 grados de libertad en
el denominador.

Si el diseo es desbalanceado, es decir, si los tamaos de muestras no son


iguales, entonces hay dos versiones sobre el clculo de v:

1. Se puede obtener una prueba liberal (la probabilidad de error tipo I es mayor
que ) haciendo v = mx(ni)1 (Milliken & Johnson 1984, pg. 18).

2. Si los tamaos no son tan diferentes, una prueba conservativa puede hacerse
usando v = mn(ni) 1 (Lentner & Bishop 1986, pg. 64).
PRUEBA DE LEVENE

El estadstico de prueba de Levene se define como:

Dnde: Zij puede tener una de las siguientes tres definiciones:

1. Zij = | Xij. Xi.| donde Xi. es la media del i-simo subgrupo

2. Zij = | Xij Xi.| donde Xi. Es la mediana del i-simo subgrupo.

3. Zij = | Xij Xi. | donde X i. la media recortada al 10 % del i-simo subgrupo.

Z.. es la media global de Zij y Zi. Es la media del i-simo subgrupo de los Zij.

La prueba de Levene rechaza la hiptesis de que las varianzas son iguales con un
nivel de significancia si W > F,k1,Nk donde F,k1,Nk es el valor critico
superior de la distribucin F con k 1 grados de libertad en el numerador y N k
grados de libertad en el denominador a un nivel de significancia .

La prueba de Levene ofrece una alternativa ms robusta que el procedimiento de


Bartlett, ya que es poco sensible a la desviacin de la normalidad. Eso significa
que ser menos probable que rechace una verdadera hiptesis de igualdad de
varianzas slo porque las distribuciones de las poblaciones muestreadas no son
normales.

S-ar putea să vă placă și