Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los
resultados observados en una muestra al azar difieren marcadamente de aquellos que caba esperar con la hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son significativas y se estara en condiciones de rechazar la hiptesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estara inclinado a rechazar la hiptesis de que la moneda est bien, aunque sera posible que fuese un rechazamiento errneo. Los procedimientos que facilitan el decidir si una hiptesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman ensayos de hiptesis, ensayos de significacin o reglas de decisin. ERRORES DE TIPO I Y TIPO II Si se rechaza una hiptesis cuando debera ser aceptada, se dice que se comete un error del Tipo I. Si, por el contrario, se acepta una hiptesis que debera ser rechazada, se dice que se comete un error del Tipo II. En cualquiera de los dos casos se comete un error al tomar una decisin equivocada. Para que cualquier ensayo de hiptesis o reglas de decisin sea bueno, debe disearse de forma que minimice los errores de decisin. Esto no es tan sencillo como pueda parecer puesto que para un tamao de muestra dado, un intento de disminuir un tipo de error, va generalmente acompaado por un incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms importancia que el otro, y as se tiende a conseguir poner una limitacin al error de mayor importancia. La nica forma de reducir al tiempo ambos tipos de error es incrementar el tamao de la muestra, lo cual puede ser o no ser posible. NIVEL DE SIGNIFICACION La probabilidad mxima con la que en el ensayo de una hiptesis se puede cometer un error del Tipo I se llama nivel de significacin del ensayo. Esta probabilidad se denota frecuentemente por a; generalmente se fija antes de la extraccin de las muestras, de modo que los resultados obtenidos no influyen en la eleccin.
En la prctica se acostumbra a utilizar niveles de significacin del 0.05 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo, se elige un nivel de significacin del 0.05 5 % al disear un ensayo de hiptesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazara la hiptesis cuando debera ser aceptada, es decir, se est con un 95 % de confianza de que se toma la decisin adecuada. En tal caso se dice que la hiptesis ha sido rechazada al nivel de significacin del 0.05, lo que significa que se puede cometer error con una probabilidad de 0.05. Ensayos referentes a la distribucin normal
Para aclarar las ideas anteriores, supngase que con una hiptesis dada, la distribucin muestral de un estadstico S es una distribucin normal con media s Y desviacin tpica uso Entonces la distribucin de la variable tipificada (representada por z) dada por z = (S s) /ss, es una normal tipificada (media 0, varianza 1) y se muestra en la figura. Como se indica en la figura, se puede estar con el 95 % de confianza de que, si la hiptesis es cierta, el valor de z obtenido de una muestra real para el estadstico S se encontrar entre -1.96 y 1.96 (puesto que el rea bajo la curva normal entre estos valores es 0.95). Sin embargo, si al elegir una muestra al azar se encuentra que z para ese estadstico se halla fuera del rango -1.96 a 1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (rea sombreada de la figura) si la hiptesis fuese verdadera. Entonces puede decirse que esta z difiere significativamente de la que caba esperar bajo esta hiptesis y se estara inclinado a rechazar la hiptesis. El rea total sombreada 0.05 es el nivel de significacin del ensayo. Representa la probabilidad de cometer error al rechazar la hiptesis es decir, la probabilidad de cometer error del Tipo I. As, pues, se dice que la hiptesis se rechaza al nivel de significacin del 0.05 o que la z obtenida del estadstico muestral dado es significativa al nivel de significacin del 0.05. El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama regin crtica o regin de rechace de la hiptesis o regin de significacin. El conjunto de las z que se encuentran dentro del rango -1,96 a 1,96 poda entonces llamarse regin de aceptacin de la hiptesis o regin de no significacin. De acuerdo con lo dicho hasta ahora; se puede formular la siguiente regla de decisin o ensayo de hiptesis o significacin. (a) Se rechaza la hiptesis al nivel de significacin del 0.05 si la z obtenida para el estadstico S se encuentra fuera del rango -1.96 a 1.96 (es decir, z > 1,96 o z < -1,96). Esto equivale a decir que el estadstico muestral observado es significativo al nivel del 0,05. (b) Se acepta la hiptesis (o si se desea no se toma decisin alguna) en caso contrario. A causa de su importante papel en los ensayos de hiptesis y significacin, z recibe tambin el nombre de ensayo estadstico.
Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de significacin. Por ejemplo, si se utilizase el nivel del 0.01 se sustituira 1.96 en todo lo visto anteriormente por 2.58 (vase Tabla). Ensayos de una y dos colas En el ensayo anterior se atenda a los valores extremos del estadstico S o su correspondiente z a ambos lados de la media, es decir, en las dos colas de la distribucin. Por esta razn, tales ensayos se llaman ensayos de dos colas o ensayos bilaterales. Sin embargo, con frecuencia, se puede estar solamente interesado en los valores extremos a un solo lado de la media, es decir, en una cola de la distribucin, como, por ejemplo, cuando se estn ensayando la hiptesis de que un proceso es mejor que otro (que es diferente a ensayar si un proceso es mejor o peor que otro). Tales ensayos se llaman ensayos de una cola o ensayos unilaterales. En tales casos, la regin crtica es una regin a un lado de la distribucin, con rea igual al nivel de significacin. La Tabla anterior, que da los valores crticos de z para ensayos de una y dos colas a distintos niveles de significacin, ser de utilidad para propsitos de referencia. Valores crticos de z para otros niveles de significacin, se pueden encontrar utilizando la tabla que da las reas bajo la curva normal.