Documente Academic
Documente Profesional
Documente Cultură
SOFTWARE ESTADSTICO
EQUIPO NO. 10
DOCENTE: ING. ANA MARITZA RAMREZ GOVEA. MATERIA: ESTADSTICA INFERENCIAL ITURNO: MATUTINO. CARRERA: INGENIERA INDUSTRIAL. 3 SEMESTRE INTEGRANTES DEL EQUIPO: GARCA SNCHEZ MARIO ALBERTO LOMBARD MONTERO WENDY MARICRUZ RODRGUEZ OLVERA KARLA ABIGAIL TORRES DE LA ROSA SANDRA NOHEM ZERMEO GONZLEZ KARLA YESENIA
PRUEBAS NO PARAMTRICAS
Se estudiarn las pruebas NO PARAMTRICAS, las cuales no requieren asumir
normalidad de la poblacin y que en su mayora se basan en el ordenamiento de los datos. Todas las pruebas vistas en este captulo requieren que la poblacin sea continua. El parmetro que se usa para hacer las pruebas estadsticas es la Mediana y no la Media. En MINITAB, para las pruebas no paramtricas se elige la secuencia: Abrir programa. Estadsticas. No Paramtricos.
Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar.
C1
Nos aseguramos que los datos se distribuyan normalmente con la prueba de KolmogorovSmirnov como sigue. Estadsticas Estadsticas Bsicas Prueba de Normalidad Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice prueba de normalidad seleccionamos Kolmogorov-Smirnov. Presionamos Aceptar.
El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.
PRUEBA DE ANDERSON-DARLIN
La prueba Anderson-Darling es, en general, ms potente que la pruebas X2 de Pearson y la de Kolmogorov-Smirnov . Resulta lgico pensar que la X2 de Pearson es menos potente que la de Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupados debido al agrupamiento. Hay prdida de informacin. Por otro lado, la prueba KolmogorovSmirnov es menos sensible a desajustes que pudieran haber en las colas de la distribucin, que la prueba Anderson- Darling (Easterling 1976; Stephens 1974, Cap 4). En particular, la prueba Anderson- Darling funciona mejor que cualquiera otra, cuando haya casos extraordinarios o aberrantes (outliers). La estadstica Anderson-Darling est dada por la siguiente expresin: A 2 =-n- (1/n)[(2i - 1) Ln(P ( i ) ) + (2n +1 - 2i)Ln{1 - p ( i ) }] Donde P(i) es el rea bajo la curva normal para el intervalo (-oo,z( i ) ), o sea es la funcin distribucin normal estndar evaluada en el i-simo elemento (en orden ascendente) de la muestra. Se presentan dos situaciones para la estadstica Anderson-Darling: la primera en que se conocen los parmetros de la distribucin llamado caso 0 (cero), y la otra en que se desconoce al menos uno de ellos (casos 1, 2 y 3). Situndonos en el caso de bondad de ajuste a la distribucin normal se consideran los siguientes casos: Caso 0: y s2 conocidos. Caso 1: s2 conocida y desconocida y estimada por X. Caso 2: conocida y s2 desconocida y estimada por s(n) = (x i - )2 /n Caso 3: ambos desconocidos, estimados por X y sn-1 = (x i- x)2 /n-1 Para cada uno de los casos existe una tabla estadstica para realizar la prueba de la hiptesis, Ho: "La muestra aleatoria proviene de una distribucin normal". La estadstica de Anderson-Darling se calcula para los cuatro casos de la misma manera; sin embargo, en el caso 3 se debe multiplicar por un factor de correccin el cual es: 1 + (0.75/n) + (2.25/n 2), que mejora la aproximacin. La prueba Anderson-Darling para la bondad de ajuste normal, en el caso 0, se realiza siguiendo los siguientes pasos:
Supongamos que tenemos 40 pesos en libras de estudiantes varones. Provienen estos datos d una distribucin normal? 154 136 144 163 147 135 128 145 164 148 126 138 145 165 149 138 147 176 168 150 132 140 156 173 150 135 152 157 146 142 125 142 158 146 119 135 144 161 140 153
Ho: Los datos se ajustan a un modelo normal. Ha: Los datos no se ajustan a un modelo normal. PASOS A SEGUIR EN MINITAB: Introducimos los 40 datos de los pesos en C1. Estadsticas.
Estadsticas Bsicas. Mostrar Estadsticas descriptivas. Aparecen estadsticas. Estadsticas Bsicas. Prueba de Normalidad.
El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P = 0.926, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.
PRUEBA DE RYAN-JOINER
La prueba de Ryan - Joiner es usada para probar si una muestra viene de una distribucin especifica. Esta prueba es una modificacin de la prueba de Kolmogorov-Smirnov donde se le da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov . En estadstica, la prueba de Ryan - Joiner es una prueba no paramtrica sobre si los datos de una muestra provienen de una distribucin especfica. La frmula para el estadstico determina si los datos (observar que los datos se deben ordenar) vienen de una distribucin con funcin acumulativa F. Formulas: A2 = N S Donde:
El estadstico de la prueba se puede entonces comparar contra las distribuciones del estadstico de prueba (dependiendo que F se utiliza) para determinar el P-valor.
Ejemplo: En el mtodo de Anderson Darling o Ryan Joiner, si el valor de probabilidad P de la prueba es mayor a 0.05, se considera que los datos son normales. Seguir los siguientes pasos: H= Los datos tienen una distribucin normal H= Los datos NO tienen una distribucin normal PASOS A SEGUIR EN MINITAB: 1.-Generaremos 100 datos aleatorios con una Media= 264.6 y una Desviacin Estndar de 32.02, de la siguiente manera: Calc. Datos Aleatorios Normal Damos doble clic.
Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar.
10
Nos aseguramos que los datos se distribuyan normalmente con la prueba de Ryan-Joiner como sigue. Estadsticas Estadsticas Bsicas Prueba de Normalidad Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice prueba de normalidad seleccionamos Ryan-Joiner. Presionamos Aceptar. De ah les aparecer el grafico donde se observa la distribucin de los datos.
11
El VALOR P > 0.05 para que los datos se distribuyan normalmente. Y como se puede observar en el grafico el Valor P > 0.100, lo que nos indica que los datos si se distribuyen normalmente y por lo tanto Aceptamos H y rechazamos H.
Otra opcin por medio de una grfica de probabilidad normal, se tiene: Grfica. Grfica de Probabilidad. Individual. Clic Aceptar. Aparece Grfica de Probabilidad.
12
En la variable seleccionan C1, y luego distribucin dan clic en distribucin normal. Luego Aceptar. Los puntos deben quedar dentro del intervalo de confianza para indicar que es normal la distribucin.
13
PRUEBA DE SHAPPIRO-WILK
En estadstica, el Test de ShapiroWilk, se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hiptesis nula que una muestra x1xn proviene de una poblacin normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se considera uno de los test ms potentes para el contraste de normalidad, sobre todo para muestras pequeas. El estadstico del test es:
Donde
x(i) (con el subndice i entre parntesis) es el nmero que ocupa la i-sima posicin en la muestra; = (x1 + ... + xn) / n es la media muestral; las constantes ai se calculan2
Donde
Siendo m1...mn son los valores medios del estadstico ordenado, de variables aleatorias independientes e idnticamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadstico de orden. La hiptesis nula se rechazar si W es demasiado pequeo. Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X 1, X2,, Xn) han sido extrados de una poblacin normal. Los parmetros de la distribucin no tienen porqu ser conocidos y est adecuado para muestras pequeas (n<50).Un contraste de ajuste tiene como objetivo comprobar si con base en la informacin suministrada por una muestra se puede aceptar que la poblacin de origen sigue una determinada distribucin de probabilidad, en nuestro caso, la distribucin normal
14
PASOS A SEGUIR EN MINITAB: 1.-Generaremos 25 datos aleatorios con una Media= 152.05 y una Desviacin Estndar de 48.09, de la siguiente manera: Calc Datos Aleatorios Normal Damos doble clic.
Rellenamos la pantalla con los datos que nos proporcionaron en el problema, como se observa en la imagen, y damos un clic ms en aceptar. Aparecern 25 datos en la columna C1. Realizaremos la prueba de Wilcoxon para 1 muestra. Estadsticas. No paramtricas. Wilcoxon de 1 muestra.
Rellenamos los datos que nos piden: en variable seleccionamos C1 y ah en donde dice media de la prueba rellenamos con 152 y damos clic en aceptar. Nos aparece otra ventana
15
Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilstico normal. Este tipo de representacin tambin lo proporcionan algunos programas de estadstica, de tal manera que nos permite adems apreciar el ajuste o desajuste de forma visual: En escala probabilstica normal se representa en el eje horizontal, para cada valor observado en nuestros datos, la funcin de distribucin o probabilidad acumulada observada, y en el eje vertical la prevista por el modelo de distribucin normal. Si el ajuste es bueno, los puntos se deben distribuir aproximadamente segn una recta a 45. En la imagen vemos que en este ejemplo existe cierta discrepancia. En cualquier caso siempre es adecuado efectuar una representacin grfica de tipo histograma de los datos, y comparar el valor de la media y la mediana, as como evaluar el coeficiente de asimetra y apuntamiento, adems de llevar a cabo una representacin en escala probabilstica de la distribucin de probabilidad esperada versus observada, como la de la figura.
16