Sunteți pe pagina 1din 8

Teora de la decisin estadstica, ensayos de hiptesis y significacin

Escisiones estadsticas Muy a menudo, en la prctica, se tienen que tomar decisiones sobre poblaciones, partiendo de la informacin muestral de las mismas. Tales decisiones se llaman decisiones estadsticas. Por ejemplo, se puede querer decidir a partir de los datos del muestreo, si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda determinada est o no cargada. etc. Hiptesis estadsticas. Hiptesis nula Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hiptesis estadsticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones. En muchos casos se formulan las hiptesis estadsticas con el solo propsito de rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda est cargada, se formula la hiptesis de que la moneda est bien, s decir, p = 0.5; donde p es la probabilidad de cara. Anlogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hiptesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se llaman tambin hiptesis nulas y se denotan por Ho. Cualquier hiptesis que difiera de una hiptesis dada se llama hiptesis alternativa. Por ejemplo, si una hiptesis es p = 0.5, hiptesis alternativas son p = 0.7; p ? 0,5 o p > 0,5. Una hiptesis alternativa de la hiptesis nula se denota por H 1. Ensayos de hiptesis y significacin Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los resultados observados en una muestra al azar difieren marcadamente de aquellos que caba esperar con la hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son significativas y se estara en condiciones de rechazar la hiptesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estara inclinado a rechazar la hiptesis de que la moneda est bien, aunque sera posible que fuese un rechazamiento errneo.

Los procedimientos que facilitan el decidir si una hiptesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman ensayos de hiptesis, ensayos de significacin o reglas de decisin. ERRORES DE TIPO I Y TIPO II Si se rechaza una hiptesis cuando debera ser aceptada, se dice que se comete un error del Tipo I. Si, por el contrario, se acepta una hiptesis que debera ser rechazada, se dice que se comete un error del Tipo II. En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe disearse de forma que minimice los errores de decisin. Esto no es tan sencillo como pueda parecer puesto que para un tamao de muestra dado, un intento de disminuir un tipo de error, va generalmente acompaado por un incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms importancia que el otro, y as se tiende a conseguir poner una limitacin al error de mayor importancia. La nica forma de reducir al tiempo ambos tipos de error es incrementar el tamao de la muestra, lo cual puede ser o no ser posible. NIVEL DE SIGNIFICACION La probabilidad mxima con la que en el ensayo de una hiptesis se puede cometer un error del Tipo I se llama nivel de significacin del ensayo. Esta probabilidad se denota frecuentemente por a; generalmente se fija antes de la extraccin de las muestras, de modo que los resultados obtenidos no influyen en la eleccin.

En la prctica se acostumbra a utilizar niveles de significacin del 0.05 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo, se elige un nivel de significacin del 0.05 5 % al disear un ensayo de hiptesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazara la hiptesis cuando debera ser aceptada, es decir, se est con un 95 % de confianza de que se toma la decisin adecuada. En tal caso se dice que la hiptesis ha sido rechazada al nivel de significacin del 0.05, lo que significa que se puede cometer error con una probabilidad de 0.05.

Ensayos referentes a la distribucin normal

Para aclarar las ideas anteriores, supngase que con una hiptesis dada, la distribucin muestral de un estadstico S es una distribucin normal con media s Y desviacin tpica uso Entonces la distribucin de la variable tipificada (representada por z) dada por z = (S s) /ss, es una normal tipificada (media 0, varianza 1) y se muestra en la figura. Como se indica en la figura, se puede estar con el 95 % de confianza de que, si la hiptesis es cierta, el valor de z obtenido de una muestra real para el estadstico S se encontrar entre -1.96 y 1.96 (puesto que el rea bajo la curva normal entre estos valores es 0.95). Sin embargo, si al elegir una muestra al azar se encuentra que z para ese estadstico se halla fuera del rango -1.96 a 1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (rea sombreada de la figura) si la hiptesis fuese verdadera. Entonces puede decirse que esta z difiere significativamente de la que caba esperar bajo esta hiptesis y se estara inclinado a rechazar la hiptesis. El rea total sombreada 0.05 es el nivel de significacin del ensayo. Representa la probabilidad de cometer error al rechazar la hiptesis es decir, la probabilidad de cometer error del Tipo I. As, pues, se dice que la hiptesis se rechaza al nivel de significacin del 0.05 o que la z obtenida del estadstico muestral dado es significativa al nivel de significacin del 0.05. El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama regin crtica o regin de rechace de la hiptesis o regin de significacin. El conjunto de las z que se encuentran dentro del rango -1,96 a 1,96 poda entonces llamarse regin de aceptacin de la hiptesis o regin de no significacin. De acuerdo con lo dicho hasta ahora; se puede formular la siguiente regla de decisin o ensayo de hiptesis o significacin.

(a) Se rechaza la hiptesis al nivel de significacin del 0.05 si la z obtenida para el estadstico S se encuentra fuera del rango -1.96 a 1.96 (es decir, z > 1,96 o z < 1,96). Esto equivale a decir que el estadstico muestral observado es significativo al nivel del 0,05. (b) Se acepta la hiptesis (o si se desea no se toma decisin alguna) en caso contrario. A causa de su importante papel en los ensayos de hiptesis y significacin, z recibe tambin el nombre de ensayo estadstico.

Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de significacin. Por ejemplo, si se utilizase el nivel del 0.01 se sustituira 1.96 en todo lo visto anteriormente por 2.58 (vase Tabla). Ensayos de una y dos colas En el ensayo anterior se atenda a los valores extremos del estadstico S o su correspondiente z a ambos lados de la media, es decir, en las dos colas de la distribucin. Por esta razn, tales ensayos se llaman ensayos de dos colas o ensayos bilaterales. Sin embargo, con frecuencia, se puede estar solamente interesado en los valores extremos a un solo lado de la media, es decir, en una cola de la distribucin, como, por ejemplo, cuando se estn ensayando la hiptesis de que un proceso es mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En tales casos, la regin crtica es una regin a un lado de la distribucin, con rea igual al nivel de significacin. La Tabla anterior, que da los valores crticos de z para ensayos de una y dos colas a distintos niveles de significacin, ser de utilidad para propsitos de referencia. Valores crticos de z para otros niveles de significacin, se pueden encontrar utilizando la tabla que da las reas bajo la curva normal.

Ensayos especiales Para muestras grandes, las distribuciones muestrales de muchos estadsticos son distribuciones normales (o al menos casi normales) con media s y desviacin tpica ss. En tales casos, se pueden utilizar los resultados anteriores para formular reglas de decisin o ensayos de hiptesis y significacin. Los siguientes casos especiales, son solamente unos pocos de los estadsticos de inters prctico. En cada caso, los resultados son para poblaciones infinitas o para muestreo con reemplazo. Para muestreo sin reemplazo de poblaciones finitas los resultados debern modificarse. l. Medias. Aqu S = x, la media muestral; s = x = , media poblacional; ss = sx = s/vN, donde es la desviacin tpica poblacional y N es el tamao de la muestra. El valor de z viene dado por

Donde se utiliza la desviacin muestral s o S para estimar s. 2. Proporciones. Aqu S = P, la proporcin de xitos en una muestra; s = p = p, donde p es la proporcin de xitos en la poblacin y N es el tamao de la muestra; ss = sp = vpq/N, donde q = 1 - p. El valor de z viene dado por

En el caso de que P = X/N, donde X es el nmero real de xitos en una muestra, z se convierte en

Anlogamente pueden obtenerse los resultados para otros estadsticos.

Curvas caractersticas de operacin. Potencia de un ensayo Se ha visto cmo el error del Tipo I puede limitarse eligiendo adecuadamente un nivel de significacin. Es posible evitar el riesgo de error del Tipo II totalmente, simplemente no aceptando nunca la hiptesis. Sin embargo, en muchos casos prcticos esto no puede hacerse. En tales casos, se utilizan a menudo curvas caractersticas de la operacin o curvas OC, que son grficos que muestran las probabilidades de errores del Tipo II bajo diferentes hiptesis. Estos suministran informacin de cmo en ensayos dados se logra minimizar los errores del Tipo II, es decir, indican la potencia de un ensayo para evitar el tomar decisiones equivocadas. Son tiles en diseo de experimentos por mostrar, por ejemplo, qu tamaos de muestras deben emplearse. GRAFICOS DE CONTROL Es a menudo en la prctica importante conocer cundo un proceso ha cambiado suficientemente, de modo que puedan darse los pasos necesarios para remediar la situacin. Tales problemas aparecen, por ejemplo, en el control de calidad, donde uno debe, a veces rpidamente, decidir si los cambios observados se deben simplemente a fluctuaciones aleatorias o a cambios reales en el proceso de fabricacin a causa de deterioro en las mquinas, errores de los empleados, etc. Los grficos de control suministran un mtodo til y sencillo para tratar tales problemas. Ensayos de significacin en relacin con diferencias muestrales 1. Diferencias de medias Sean X 1 Y X 2 las medias muestrales obtenidas en dos muestras grandes de tamao N 1 Y N 2 extradas de poblaciones respectivas que tienen de media 1 y 2 Y desviaciones tpicas s1 Y s2. Considrese la hiptesis nula de que no hay diferencia entre las medias poblacionales, es decir, 1 = 2 o que las muestras son extradas de dos poblaciones que tienen la misma media. Haciendo 1 = 2 se ve que la distribucin muestral de la diferencia de medias se distribuye aproximadamente como una normal con media y desviacin tpica dadas por

donde se puede, si es necesario, utilizar las desviaciones tpicas muestrales S1 y S2 como estimas de s1 y s2. Con la variable tipificada z que viene dada por

se puede ensayar la hiptesis nula contra la hiptesis alternativa (o la significacin de una diferencia observada) a un nivel de significacin apropiado. 2. Diferencias de proporciones Sean P1 y P2 las proporciones muestrales de dos grandes muestras de tamaos N1 y N2 extradas de poblaciones respectivas que tienen proporciones P1 y P2. Considrese la hiptesis nula de que no hay diferencia entre los parmetros poblacionales, es decir, P1 = P2, Y as las muestras son realmente ex- tradas de la misma poblacin. Haciendo P1 = P2 = P, se ve que la distribucin muestral de la diferencia de proporciones se distribuye aproximadamente como una normal con media y desviacin tpica dadas por

donde

se utiliza como una estima de la proporcin poblacional, y q = 1 - p. Con la variable tipificada z dada por

se puede ensayar las diferencias observadas a un nivel de significacin apropiado y de este modo ensayar la hiptesis nula. Ensayos referentes a otros estadsticos pueden disearse anlogamente. Ensayos referentes a la distribucin binomial

Ensayos que envuelven a la distribucin binomial as como otras distribuciones, pueden disear- se de una manera anloga a los utilizados para la distribucin normal, los principios bsicos son esencialmente los mismos.

S-ar putea să vă placă și