La estadstica inferencial es el proceso de usar la informacin de una muestra para
describir el estado de una poblacin. Sin embargo es frecuente que usemos la informacin de una muestra para probar un reclamo o conjetura sobre la poblacin. El reclamo o conjetura se refiere a una hiptesis. El proceso que corrobora si la informacin de una muestra sostiene o refuta el reclamo se llama prueba de hiptesis. HIPTESIS Y NIVELES DE SIGNIFICANCIA En la prueba de hiptesis se pone a prueba un reclamo hecho sobra la naturaleza de una poblacin a base de la informacin de una muestra. El reclamo se llama hiptesis estadstica. Hiptesis Estadstica: Una hiptesis estadstica es un reclamo hecho sobre la naturaleza de una poblacin. Por ejemplo, la premisa formulada por un productor de bateras para autos de que su batera dura en promedio 48 meses, es una hiptesis estadstica porque el manufacturero no inspecciona la vida de cada batera que l produce. Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La hiptesis estadstica sometida a prueba se llama la hiptesis nula, y se denota como H 0 . COMO ESTABLECER LA HIPTESIS NULA Y LA ALTERNA Hiptesis Nula (H 0 ): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias poblaciones. Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de bateras debemos probar la hiptesis estadstica de que > 48. Por lo tanto, la hiptesis nula es: H 0 : > 48. Luego se procede a tomar una muestra aleatoria de bateras y medir su vida media. Si la informacin obtenida de la muestra no apoya el reclamo en la hiptesis nula (H 0 ), entonces otra cosa es cierta. La premisa alterna a la hiptesis nula se llama hiptesis alterna y se representa por H 1 . Hiptesis Alterna: Una premisa que es cierta cuando la hiptesis nula es falsa.
Por ejemplo, para el productor de bateras H 0
: > 48 y H 1 : < 48 Para probar si la hiptesis nula es cierta, se toma una muestra aleatoria y se calcula la informacin, como el promedio, la proporcin, etc. Esta informacin muestral se llama estadstica de prueba.
Estadstica de Prueba: Una estadstica de prueba se basa en la informacin de la muestra como la media o la proporcin .
ERROR TIPO 1 Y ERROR TIPO 2 A base de la informacin de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisin. 1. Podemos rechazar un H 0
que es cierto. 2. Podemos aceptar un H 0 que es falso. El primero se llama error Tipo 1 Error Tipo 1: Cuando rechazamos una Hiptesis Nula que es cierta cometemos error tipo 1.
Y el segundo error se llama error Tipo 2. Error Tipo 2: Cuando aceptamos una Hiptesis Nula que es falsa cometemos error tipo 2.
NIVEL DE SIGNIFICANCIA (o) Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H 0 , denotada por o. A sta se le llama nivel de significancia.
Nivel de Significancia: La probabilidad (o) ms alta de rechazar H 0 cuando H 0 es cierto se llama nivel de significancia. Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeo de o. Usando un valor preasignado de o se construye una regin de rechazo o regin crtica en la curva normal estndar o en la curva t que indica si debemos rechazar H 0 . Regin Crtica o de Rechazo: Una regin crtica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H 0 . La regin puede ser de una cola o de dos dependiendo de la hiptesis alterna.
Ejemplos Para H 1 : > valor aceptado, la regin de rechazo est dada por: (cola derecha, z t) Para H 1 : < valor aceptado, la regin de rechazo est dada por: (cola izquierda, z t) Para H 1 : = valor aceptado, la regin de rechazo es de dos colas y est dada por: (2-colas, z t) Ejemplo 1: Determine si la regin de rechazo es de la cola derecha, de la cola izquierda o de dos colas. a. H 0 : = 15, H 1 : = 15, o=.05 b. H 0 : p s 0.7, H 1 : p > 0.7, o=.02 Solucin: La forma de la regin de rechazo est determinada por la hiptesis alterna. a. H 1 : = 15 significa que la regin est en ambas colas.
b. H 1 : p > 7 significa que la regin est en la cola derecha.
Ejemplo 2: En el Ejemplo 1a, presumamos que la regin de rechazo es parte de la curva normal estndar. Complete el dibujo de la regin crtica para los valores o siguientes: a. o = .05
o o o/2 o/2 .05/2 .05/2 .02 Solucin: a. Del ejemplo 1(a), tenemos:
Ejemplo 3: En el ejemplo 1a, presumamos que la regin de rechazo es parte de la curva t. Complete el dibujo de la regin de rechazo para: a. o = .05 y u = 14
Solucin: a. Del ejemplo 1(a), o = .05, y u = 14, tenemos:
Ejemplo 4: Establezca las hiptesis nula y alterna. a. Las millas por galn (mpg) promedio de un nuevo modelo de automvil es 32. b. Ms del 65% de los empleados de un colegio aportan a Fondos Unidos. c. En promedio, los empleados de cierta compaa viven a no ms de 15 millas de la misma. d. Al menos un 60% de la poblacin adulta de una comunidad votar en las prximas elecciones Presidenciales. e. El peso promedio de un pollo para asar es de al menos cuatro libras. Solucin: a. H 0 : = 32 b. H 0 : p > .65 c. H 0 : s 15 H 1 : = 32 H 1 : p < .65 H 1 : > 15 d. H 0 : p > .6 e. H 0 : > 4 H 1 : p < .6 H 1 : < 4 .05/2=0.025 .05/2=0.025 De la tabla de la distribucin normal, la P(Z<z) =.025 corresponde a un valor Z= -1.96. Por simetra la P(Z>z)=.025 corresponde a Z= 1.96. 1.96 -1.96 .05/2=0.025 .05/2=0.025 De la tabla de la distribucin t, la P(T<t) =.025 corresponde a un valor t= -2.086. Por simetra la P(T>t)=.025 corresponde a t= 2.086. 2.086 -2.086 EJ ERCI CI OS En los ejercicios (1-6) determine si la regin de rechazo para la hiptesis nula est en la cola izquierda, en la cola derecha, o ambas colas. Para el nivel de significancia o dibuje la regin de rechazo. 1. H 0 : s 11; H 1 : > 11 2. H 0 : > 5.8; H 1 : < 5.8 3. H 0 : p = 0.4; H 1 : p = 0.4 4. H 0 : = 110; H 1 : = 110 5. H 0 : p > 0.3; H 1 : p < 0.3 6. H 0 : p > 0.8; H 1 : p < 0.8 En los ejercicios (7 - 18) complete la regin de rechazo (encuentre el valor de z y t). 7. a) z, si o = .05 b) t, si o = .025 y u = 9 8. a) z, si o = .01 b) t, si o = .05 y u = 13 9. a) z, si o = .02 b) t, si o = .01 y u = 5 10. a) z, si o = .025 b) t, si o = .01 y u = 9 11. a) z, si o = .05 b) t, si o=.05 y u = 10 12. a) z, si o = .01 b) t, si o=0.1 y u = 7 o o o o o/2 o/2 o/2 o/2 En los ejercicios (13 - 18) establezca las hiptesis nula y alterna. 13. Los automviles estacionados en el estacionamiento de periodo prolongado del aeropuerto internacional de Baltimore permanecen un promedio de 2.5 das. 14. Una nueva marca de llantas radiales dura en promedio ms de 48,000 millas. 15. El balance promedio de una cuenta de cheques en el First State Bank es de al menos $150. 16. Se reclama que al menos el 60% de las compras realizadas en cierta tienda por departamentos son artculos de especiales. 17. Se reclama que el 20% de los graduados de cierto colegio privado solicitan admisin a escuelas de medicina. 18. Un dentista reclama que el 5% de sus pacientes sufren enfermedades en las encas.
Prueba? de hiptesis La inferencia estadstica o estadstica inferencial se refiere a un conjunto de mtodos mediante los cuales podemos hacer afirmaciones con respecto a una poblacin completa a partir nicamente de la observacin de una parte de ella.
Dos formas bsicas para realizar inferencia estadstica son la estimacin y el contraste de hiptesis, tambin llamado "prueba de hiptesis". Una hiptesis estadstica es una afirmacin con respecto a una distribucin de probabilidad (por ejemplo, podramos decir que un cierto fenmeno se comporta de forma que puede explicarse por una distribucin binomial). En particular, una hiptesis estadstica puede ser una afirmacin con respecto a un parmetro (si sabemos que la distribucin es binomial, entonces podramos establecer la hiptesis de que la probabilidad de xito es p = 0.5).
Un contraste estadstico de hiptesis es un procedimiento mediante el cual se compara lo propuesto por una hiptesis contra la evidencia emprica que proporciona la observacin de datos provenientes de la poblacin sobre la cual se hace la hiptesis. El ttulo que se ha dado a esta discusin tiene qu ver con una cuestin bsica en el contraste de hiptesis, por la cual podra considerarse que no es muy adecuado el nombre prueba. Lo anterior, porque este sustantivo podra dar al lector la impresin de que el procedimiento implica certeza, lo cual en estadstica desde luego difcilmente se tiene.
Adicionalmente, una situacin que suele causar dudas en los estudiantes que aprenden por primera vez el mtodo de contraste estadstico de hiptesis con el enfoque de Neyman-Pearson es la de por qu se dice: No se rechaza la hiptesis nula
y no puede simplemente decirse Se acepta la hiptesis nula
Consideremos la siguiente situacin, muy simplificada, pero que nos sirve para aclarar ideas:
Supongamos que se nos presenta una caja opaca y cerrada, dentro de la cual sabemos hay 100 canicas que pueden ser rojas, blancas o una mezcla de ambas. A nosotros nos interesa decir algo con respecto a todas las canicas dentro de la caja (son todas rojas, todas blancas o cuntas hay de cada tipo). Cul sera una forma completamente segura de hacerlo? Si tuviramos la posibilidad de vaciar la caja, por ejemplo, y examinar el contenido completo, entonces sabramos con toda certeza las condiciones que existen dentro de la caja; pero, qu pasa entonces si por algn motivo no podemos examinar todo el contenido, aunque s una parte de l?
Una forma de lidiar con la imposibilidad de examinar todo el contenido es hacer intervenir a la probabilidad. Supongamos que se nos dice que la caja contiene solamente canicas blancas, pero que nuestra suposicin es que en realidad hay algunas rojas dentro.
Podemos plantear nuestro primer contraste de hiptesis prototipo de la siguiente forma: H 0 : En la caja solamente hay canicas blancas H a : En la caja hay al menos una canica roja
Ahora necesitamos contrastar nuestra hiptesis nula contra la evidencia que obtenemos al observar datos, para lo cual sacamos una pequea cantidad de canicas de la caja (sin poder observar las dems) y examinamos su color.
Nuestro estadstico de prueba, al que llamaremos X, en este caso es el nmero de canicas rojas entre las extradas. Dado que la aparicin de al menos una canica roja hara completamente evidente que la hiptesis nula no es verdadera, la regin de rechazo es R = {X 1}. Por tanto rechazaramos la hiptesis nula si X 1.
Supongamos que las limitaciones de recursos nos permiten solamente extraer cinco canicas, lo cual hacemos, y observamos que TODAS son blancas.
Ahora surgen dos preguntas importantes:
1. Los datos observados contradicen la hiptesis nula? Desde luego no lo hacen, porque el estadstico de la prueba no tom un valor que estuviera dentro de la regin de rechazo, es decir, ninguna de las canicas extradas fue roja. En este punto estamos en la imposibilidad de comprobar nuestra suposicin de que al menos algunas canicas de la caja son rojas, por lo cual lo ms que podemos decir es: "No existe evidencia estadstica en contra de H 0 ", con lo que justamente indicamos que la pequea porcin de la realidad que las limitaciones de recursos nos permitieron observar no est en desacuerdo con lo que dice la hiptesis nula. Hasta aqu, entonces, "No podemos rechazar H 0 ".
2. Por otro lado, el que ninguna de las canicas que extrajimos sea roja DEMUESTRA que todas las de la caja son blancas? Claro que no. La nica manera en que nuestra observacin demostrara que todas las canicas de la caja son blancas sera la situacin en que las observramos todas, lo cual inicialmente dijimos que no era posible.
Por tanto, aunque nuestra observacin no contradice la hiptesis nula, tampoco la demuestra de manera irrefutable. En consecuencia, no sera correcto decir "Aceptamos que H 0 es verdadera", porque esto en realidad no nos consta.