4.2. Prueba de hipótesis, Conceptos básicos A menudo se leen o escuchar expresiones como las siguiente: 4.3. Prueba de hipótesis relativas a medias y proporciones. “Esta pasta dental es recomendada por el 90% de los dentistas” 4.4. La prueba de bondad de ajuste “En promedio, las pilas de la marca A duran más 4.5. Análisis de tablas de contingencia que las pilas de la marca B” Se trata de conjeturas referidas a parámetros (media, proporción, etc.) de una distribución asociada a una población. Provienen, a menudo, de muestras aleatorias por ello es importante averiguar si se deben a la causalidad o reflejan la realidad. Los procedimientos permitiran decidir el rechazo o no de tales conjeturas “pruebas o contrastes de 2 hipótesis” M.Sc. Emerson D. Norabuena Figueroa 4.2. Prueba de hipétesis Se basa en el resultado obtenido de una muestra aleatoria, y su objetivo es probar si este resultado es significativamente diferente o no de lo que se afirma acerca de un parámetro de una población. Si se puede probar que la diferencia observada se debe al carácter aleatorio de la muestra, diremos que la diferencia no es significativa y que la conjetura no debe ser rechazada; caso contrario esta deberá ser rechaza. M.Sc. Emerson D. Norabuena Figueroa 4.2.1. Procedimiento para realizar una prueba de hipótesis
4.2 Prueba de hipótesis
i. Hipótesis Estadística ii. Nivel de significancia iii. Función de prueba iv. Regla de decisión v. Cálculos vi. Decisión vii. Conclusión 4
M.Sc. Emerson D. Norabuena Figueroa
Caso: ¿El gerente de producción Paccini tiene razón?
M.Sc. Emerson D. Norabuena Figueroa
Error tipo I , II
Como las pruebas de hipótesis se basan en
la información obtenida en una muestra aleatoria y no en toda la población, existe el riesgo de tomar decisiones erróneas. Y es así que pueden cometerse: El error de tipo I, ocurre al rechazar la hipótesis nula siendo esta verdadera. El error de tipo II, sucede al no rechazar la hipótesis nula siendo falsa.
M.Sc. Emerson D. Norabuena Figueroa
Error tipo I , II
Como no se conoce el estado real de la situación, es imposible medir exactamente los
errores que se cometen; sin embargo, usando la probabilidad se podrá obtener cierta 7 información acerca de ello. M.Sc. Emerson D. Norabuena Figueroa Error tipo I , II A la probabilidad de cometer el error de tipo I se le denota α y se le llama nivel de significación de la prueba. Y la probabilidad de cometer el error de tipo II se le denota por β.
El nivel de significación α proporciona una medida de confiabilidad de la
decisión de rechazar la hipótesis nula y aceptar la alternativa. Los valores que suelen usarse para α son: 0.05 y 0.01. Si el costo de cometer el error de tipo I es alto, se usará de preferencia el valor 0.01. El valor de β es una medida de la confiabilidad de la decisión de aceptar la hipótesis nula; sin embargo, no es posible, en general, controlar este valor. Por consiguiente si logramos rechazar la hipótesis nula será posible medir el error que se puede cometer, caso contrario no se puede hacer lo mismo. Por 8 ello la hipótesis nula simplemente se rechaza o se acepta. M.Sc. Emerson D. Norabuena Figueroa Estadístico de prueba y región de rechazo A la probabilidad de cometer el error de tipo I se le denota α y s le llama nivel de significación de la prueba. Y la probabilidad de cometer el error de tipo II se le denota por β. l nivel de significación α proporciona una medida de confiabilidad de la decisión de rechazar la hipótesis nula y aceptar la alternativa. Los valores que suelen usarse para α son: 0.05 y 0.01. Si el costo de cometer el error de tipo I es alto, se usará de preferencia el valor 0.01. El valor de β es una medida de la confiabilidad de la decisión de aceptar la hipótesis nula; sin embargo, no es posible, en general, controlar este valor. Por consiguiente si logramos rechazar la hipótesis nula será posible medir el error que se puede cometer, caso contrario no se puede hacer lo mismo. Por ello la hipótesis nula simplemente se rechaza o se acepta. 9
M.Sc. Emerson D. Norabuena Figueroa
Estadístico de prueba y región de rechazo A la probabilidad de cometer el error de tipo I se le denota α y s le llama nivel de significación de la prueba. Y la probabilidad de cometer el error de tipo II se le denota por β. l nivel de significación α proporciona una medida de confiabilidad de la decisión de rechazar la hipótesis nula y aceptar la alternativa. Los valores que suelen usarse para α son: 0.10 (10%), 0.05 (5%) y 0.01 (1%). Si el costo de cometer el error de tipo I es alto, se usará de preferencia el valor 0.01, y esto lo declarará el investigador antes de comenzar su investigación. El valor de β es una medida de la confiabilidad de la decisión de aceptar la hipótesis nula; sin embargo, no es posible, en general, controlar este valor. Por consiguiente si logramos rechazar la hipótesis nula será posible medir el error que se puede cometer, caso contrario no se puede hacer lo mismo. Por ello la hipótesis nula simplemente se rechaza o se acepta. 10
M.Sc. Emerson D. Norabuena Figueroa
Caso: Proposiciones para diferencias error I, II
Proposición: “Hoy va llover, por lo tanto , llevo paraguas”
Si llueve: la decisión de llevar paraguas es acertada. Si no llueve: se comete error de tipo II, al aceptar una hipótesis que resultó ser falsa.
Proposición: “ Hoy no va a llover, por lo tanto no llevo
paraguas” Si no llueve: la decisión es acertada. Si llueve: se comete error tipo I, al rechazar la hipótesis de lluvia, que resultó ser verdadera.
11
M.Sc. Emerson D. Norabuena Figueroa
Consideraciones interesantes:
Para disminuir el error tipo I, se podría llevar paraguas todo
los días. En efecto, con esto disminuye el error de tipo I, pero aumenta el error de tipo II. Por lo tanto, esa no es buena medida.
Para disminuir el error de tipo II, mejor sería no llevar nunca
paraguas. Con esta medida disminuye, en efecto, el error de tipo II, pero aumenta el error de tipo I. Por tanto, tampoco es una buena medida. Nota: No hay manera de escapar a estos dos tipos de errores. No es lo mismo cometer error de tipo I que cometer 12 error de tipo II, porque tiene distintos efectos. M.Sc. Emerson D. Norabuena Figueroa 4.2.2. Hipótesis usuales Hipótesis de la media: µ = µ𝟎 Esto es, que la media poblacional tiene un valor determinado µ𝟎 Hipótesis de la diferencia de medias: µ𝑨 -µ𝑩 Esto es, que la diferencia de medias poblacionales entre A y B tiene un valor determinado. Hipótesis: µ𝑴 - µ𝑯 > 0 Hipótesis de la proporción: p = p𝟎 Esto es, que la proporción poblacional tiene un valor determinado p𝟎 . Hipótesis: p = 0 Hipótesis de la diferencia de proporción: p𝑨 - p𝑩 Se plantea la hipótesis de que la diferencia de proporciones poblacionales tiene 13 un valor determinado. Hipótesis: P - P < 0 M.Sc. Emerson D. Norabuena Figueroa 4.2.3. Chi cuadrado