Sunteți pe pagina 1din 47

Inferencia estadística

23 de agosto de 2019
Definición: Inferencia estadística
• El objetivo de la inferencia estadística es hacer afirmaciones válidas acerca de
la población o proceso con base en la información contenida en una muestra.
• Estas afirmaciones tienen por objetivo coadyuvar en la toma de decisiones.
• La inferencia estadística por lo general se divide en estimación y prueba de
hipótesis, y se apoya en cantidades o datos estadísticos calculados a partir de
las observaciones en la muestra.
• Un estadístico se define como cualquier función de los datos muestrales que
no contiene parámetros desconocidos.
• Un ejemplo de estadístico es la media muestral 𝑋ത con la cual se tratan de hacer
afirmaciones sobre la media, µ, que es un parámetro poblacional.
• Un aspecto clave en la interpretación y utilización de cualquier estadístico es que
se trata de una variable aleatoria, ya que su valor depende de los elementos que
son seleccionados en la muestra y, por lo tanto, varía de una muestra a otra.
• La forma de tomar en cuenta este hecho es conocer la distribución de probabilidad
de cada estadístico.
Distribuciones de probabilidad e inferencia
• La distribución de probabilidad o distribución de una variable aleatoria X
relaciona el conjunto de valores posibles de X (rango de X), con la
probabilidad asociada a cada uno de estos valores y los representa a través
de una tabla o por medio de una función planteada como una fórmula.
• la distribución de probabilidad de la media muestral 𝑋ത señala qué valores
se espera que tome X, de acuerdo con los supuestos asumidos.
• Las distribuciones de probabilidad que más se usan en intervalos de
confianza y pruebas de hipótesis son las distribuciones: normal, T de
Student, ji-cuadrada y F.
Distribuciones de probabilidad e inferencia
La distribución normal estándar como la T de Student son
simétricas y centradas en cero

La distribución normal estándar es una curva única, por ello


existen tablas que proporcionan cualquier área o probabilidad
de interés bajo esta curva

Las distribuciones ji-cuadrada y F son sesgadas y sólo toman


valores positivos

Las tablas de estas distribuciones sólo reportan los valores que


separan las áreas de mayor uso en inferencia estadística

Las cuatro distribuciones están relacionadas entre sí, ya que las distribuciones T de Student, ji-cuadrada y F se definen en
términos de la distribución normal estándar.

Los parámetros que definen por completo las distribuciones T de Student, ji-cuadrada y F, reciben el nombre de grados
de libertad, que tienen que ver con los tamaños muestrales involucrados
Distribución Uniforme continua
• Esta distribución se caracteriza por una función de densidad que es “plana”, por lo cual la
probabilidad es uniforme en un intervalo cerrado, digamos [A, B].
• Aunque las aplicaciones de la distribución uniforme continua no son tan abundantes como
las de otras distribuciones, es apropiado para el principiante que comience esta introducción
a las distribuciones continuas con la distribución uniforme,
Distribución Normal
• La distribución de probabilidad continua más importante en todo el campo de la
estadística es la distribución normal,
• describe de manera aproximada muchos fenómenos que ocurren en la naturaleza,
la industria y la investigación. Por ejemplo, las mediciones físicas en áreas como los
experimentos meteorológicos, estudios de la precipitación pluvial y mediciones de
partes fabricadas a menudo se explican más que adecuadamente con una
distribución normal.
• Además, los errores en las mediciones científicas se aproximan muy bien mediante
una distribución normal. En 1733, Abraham DeMoivre desarrolló la ecuación
matemática de la curva normal, la cual sentó las bases sobre las que descansa gran
parte de la teoría de la estadística inductiva. La distribución normal a menudo se
denomina distribución gaussiana en honor de Karl Friedrich Gauss (1777-1855),
quien también derivó su ecuación a partir de un estudio de errores en mediciones
repetidas de la misma cantidad.
Distribución Normal

La distribución de una variable aleatoria normal con media 0 y varianza 1 se llama


distribución normal estándar
Distribución Gamma (Γ(𝛼))
• Aunque la distribución normal se puede utilizar para resolver muchos problemas de
ingeniería y ciencias, aún hay numerosas situaciones que requieren diferentes tipos de
funciones de densidad. En esta sección se estudiarán dos de estas funciones de densidad,
la distribución gamma y la distribución exponencial.
• Los tiempos entre llegadas en instalaciones de servicio y los tiempos de operación antes de
que partes componentes y sistemas eléctricos empiecen a fallar a menudo se representan
bien mediante la distribución exponencial.
Distribución Gamma (Γ(𝛼))
2
Distribución ji-cuadrada (𝜒 )
• Otro caso especial muy importante de la distribución gamma se obtiene al permitir que α =
v/2 y β = 2, donde v es un entero positivo. Este resultado se conoce como distribución chi
cuadrada. La distribución tiene un solo parámetro, v, denominado grados de libertad.

La distribución chi cuadrada es un componente importante de la prueba estadística de hipótesis y de la estimación


estadística
Distribución ji-cuadrada 2
(𝜒 )
El teorema del límite central
Distribución t
• Sus aplicaciones giran en torno a las inferencias sobre una media de la
población o a la diferencia entre dos medias de población.
• A menudo, de hecho, una estimación de σ debe ser proporcionada por la
misma información muestral que produce el promedio muestral 𝑥.ҧ Como
resultado, un estadístico natural a considerar para tratar con las inferencias
sobre μ es.

Para n  30 y se aproxima a la distribucion normal


Distribución t
Tiene una distribución chi cuadrada con v = n – 1 grados
de libertad

La distribución de T se parece a la distribución de Z en


que ambas son simétricas alrededor de una media de
cero,
Distribución F
La distribución F tiene una amplia aplicación en la comparación de varianzas muestrales y
también es aplicable en problemas que implican dos o más muestras

El estadístico F se define como el cociente de dos variables aleatorias chi cuadrada


independientes, dividida cada una entre su número de grados de libertad. En consecuencia,
podemos escribir.

Donde U y V son variables aleatorias independientes que tienen distribuciones chi


cuadrada con v1 y v2 grados de libertad, respectivamente. Estableceremos ahora la
distribución muestral de F
Distribución F

La distribución F se usa en situaciones de dos muestras para hacer inferencias acerca de


las varianzas de población. Sin embargo, la distribución F también se puede aplicar a
muchos otros tipos de problemas que involucren varianzas muestrales. De hecho, la
distribución F se llama distribución de razón de varianzas.
Distribuciones de probabilidad e inferencia
• Las distribuciones normal y T de Student sirven para hacer inferencias sobre las medias 𝑥.ҧ
• La distribución ji-cuadrada será de utilidad para hacer inferencias sobre varianzas 𝑆 2 .
• La distribución F se empleará para comparar varianzas 𝑆 2 .

Es por esto la distribución F es la de mayor relevancia (importancia) en diseño de experimentos, dado que el análisis de la
variabilidad que se observó en un experimento se hace comparando varianzas.
Estimación puntual y por intervalo
Las distribuciones de probabilidad que tienen una variable que representa cierta característica de una población se
definen completamente cuando se conocen sus parámetros, pero cuando éstos no se conocen, será necesario estimarlos
con base en los datos muestrales para hacer inferencias sobre la población.

Los parámetros de una distribución normal son la media, µ, y la desviación estándar, , que en caso de desconocerse
será necesario estimarlos a partir de los datos en la muestra. Hay dos tipos de estimación:
• puntual
• y por intervalo

• Estimación puntual
Un estimador puntual de un parámetro desconocido es un estadístico que genera un valor numérico simple, que
se utiliza para hacer una estimación del valor del parámetro desconocido; por ejemplo, tres parámetros sobre los
que con frecuencia se desea hacer inferencia son:
• La media 𝑥ҧ del proceso (población).
• La varianza 2 o la desviación estándar  del proceso.
• La proporción p de artículos defectuosos.
Estimación puntual
• Los estimadores puntuales (estadísticos) más recomendados para estimar estos
parámetros son, respectivamente:

• La media muestral 𝝁
ෝ =𝑿ഥ.
• La varianza muestral 
ෝ2 = S2.
• La proporción de defectuosos en la muestra, 𝒑
ෝ = x/n, donde x es el número de artículos defectuosos
en una muestra de tamaño n.
Estimación por intervalo
• la estimación puntual dirá poco sobre el parámetro analizado, cuando la variación entre una estimación y
otra es muy grande. Una forma de saber qué tan variable es el estimador, consiste en calcular la
desviación estándar o error estándar del estadístico, visto como una variable aleatoria.
• Consideremos la desviación estándar S 𝝈 y la media 𝐗 ഥ de una muestra de tamaño n. Puesto que 𝑿
ഥ es una variable aleatoria,
ésta tiene su propia desviación o error estándar, que se puede estimar mediante
𝑺
ෝ 𝑿ഥ =
𝝈
𝒏
• Para saber qué tan precisa es la estimación consiste en calcular un intervalo de confianza que indique un rango “donde puede
estar el parámetro” con cierto nivel de seguridad o confianza. Donde L y U forman el intervalo de confianza buscado [L, U].

𝑃 𝐿 ≤𝜃 ≤𝑈 =1−𝛼

Donde L y U dependen del valor estadístico, puntos extremos del intervalo son valores de las variables
aleatorias correspondientes. Son los limites de confianza

Construir un intervalo al 100(1– )% de confianza para un parámetro desconocido , consiste en estimar dos números
(estadísticos) L y U, de manera que la probabilidad de que  se encuentre entre ellos sea 1– .
Intervalo de confianza para una media 𝑥ҧ
El procedimiento general para deducir el intervalo consiste en partir de un estadístico que involucra al parámetro de
interés y que tiene una distribución conocida. Tal estadístico, sigue una distribución T de Student con n–1 grados de
libertad.

La tabla de esta distribución o en su gráfica se pueden ubicar dos valores críticos t/2 y – t/2, tales que

Son los números buscados que definen un intervalo 100 1 − 𝛼 % para una media µ desconocida.
Intervalo de confianza para una media 𝑥ҧ
Intervalo para la varianza 2
La distribución de referencia es una ji-cuadrada con n–1 grados de libertad

𝑆2
El estadístico 𝑛 − 1 𝜎2
Intervalo para la proporción
Bajo el supuesto de que el número de artículos defectuosos en una muestra sigue una distribución binomial, y
suponiendo que se inspecciona una cantidad grande de n artículos y se encuentra una proporción 𝑝Ƹ de defectuosos,
se puede construir un intervalo de confianza para la proporción poblacional p, apoyándose en la aproximación de la
distribución binomial por la normal.

En estas condiciones se puede afirmar que la proporción muestral 𝑝Ƹ sigue una distribución normal con media p y
varianza

Donde Z/2 es un percentil de tabla de la distribución normal estándar


Resumen
Prueba de hipótesis
• el problema al que se enfrentan el científico o el ingeniero no es tanto la
estimación de un parámetro de la población, sino la formación de un
procedimiento de decisión que se base en los datos y que pueda producir
una conclusión acerca de algún sistema científico.
• Por ejemplo, un investigador médico puede decidir con base en evidencia
experimental si beber café incrementa el riesgo de cáncer en los seres humanos; un
ingeniero quizá tenga que decidir con base en datos muestrales si hay una
diferencia entre la precisión de un tipo de medidor y la de otro.
• En cada uno de estos casos el científico o el ingeniero postulan o
conjeturan algo acerca de un sistema. En cada caso la conjetura se puede
expresar en forma de hipótesis estadística.
Hipótesis Estadística
• Una hipótesis estadística es una aseveración o conjetura respecto a una o
más poblaciones.
• La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certeza,
a menos que se examine toda la población, lo cual, por supuesto, sería poco práctico
en la mayoría de las situaciones.
• En vez de eso se toma una muestra aleatoria de la población de interés y se
utilizan los datos contenidos en ella para proporcionar evidencia que
respalde o no la hipótesis.
• La evidencia de la muestra que es inconsistente con la hipótesis planteada
conduce al rechazo de la misma.
Hipótesis Estadística
• Un procedimiento de toma de decisiones debe implicar la conciencia de la
probabilidad de llegar a una conclusión errónea.
• Por otro lado, es muy importante enfatizar que la aceptación o, más bien, la
falta de rechazo no descarta otras posibilidades. Como resultado, el analista
de datos establece una conclusión firme cuando se rechaza una hipótesis.
• Lo anterior implica que cuando el analista de datos formaliza la evidencia
experimental con base en la prueba de hipótesis, es muy importante el
planteamiento formal de la hipótesis.
Hipótesis nula y la hipótesis alternativa

• La estructura de la prueba de hipótesis se establece usando el término


hipótesis nula, el cual se refiere a cualquier hipótesis que se desea probar y se
denota con H0
• El rechazo de H0 conduce a la aceptación de una hipótesis alternativa, que se
denota con H1
• La hipótesis alternativa H1 por lo general representa la pregunta que se responderá o la
teoría que se probará, por lo que su especificación es muy importante,
• La hipótesis nula H0 anula o se opone a H1 y a menudo es el complemento lógico de H1.
• rechazar H0 a favor de H1 debido a evidencia suficiente en los datos o no rechazar H0
debido a evidencia insuficiente en los datos.
Hipótesis nula y la hipótesis alternativa
• La cuestión práctica podría ser el interés en que la probabilidad histórica de
artículos defectuosos de 0.10 ya no sea verdadera. De hecho, la conjetura
podría ser que p excede a 0.10. Entonces podríamos afirmar que,

Ahora, 12 artículos defectuosos de cada 100 no refutan p=0.10, por lo que la conclusión
es “no rechazar H0”. Sin embargo, si los datos revelan 20 artículos defectuosos de cada
100, la conclusión sería “rechazar H0” a favor de H1: p > 0.10
Hipótesis nula y la hipótesis alternativa
• El mejor ejemplo para un principiante sea el dilema que enfrenta el jurado
en un juicio. Las hipótesis nula y alternativa son

La acusación proviene de una sospecha de culpabilidad. La hipótesis H0 (el status quo) se


establece en oposición a H1 y se mantiene a menos que se respalde H1 con evidencia
“más allá de una duda razonable”. Sin embargo, en este caso “no rechazar H0” no implica
inocencia, sino sólo que la evidencia fue insuficiente para lograr una condena. Por lo
tanto, el jurado no necesariamente acepta H0 sino que no rechaza H0
Prueba de una hipótesis estadística
• Se sabe que, después de un periodo de dos años, cierto tipo de vacuna contra un
virus que produce resfriado ya sólo es 25% eficaz. Suponga que se eligen 20
personas al azar y se les aplica una vacuna nueva, un poco más costosa, para
determinar si protege contra el mismo virus durante un periodo más largo.
• Aquí la muestra es de 20 sólo porque lo único que se busca es demostrar los pasos
básicos para realizar una prueba estadística). Si más de 8 individuos de los que
reciben la nueva vacuna superan el lapso de 2 años sin contraer el virus, la nueva
vacuna se considerará superior a la que se usa en la actualidad.
• El requisito de que el número exceda a 8 es algo arbitrario, aunque parece razonable,
ya que representa una mejoría modesta sobre las 5 personas que se esperaría
recibieran protección si fueran inoculadas con la vacuna que actualmente está en
uso.
• En esencia probamos la hipótesis nula de que la nueva vacuna es igual de eficaz
después de un periodo de 2 años que la que se utiliza en la actualidad.
Prueba de una hipótesis estadística
• La hipótesis alternativa es que la nueva vacuna es mejor, y esto equivale a
poner a prueba la hipótesis de que el parámetro binomial para la probabilidad
de un éxito en un ensayo dado es p = ¼, contra la alternativa de que p > ¼.
Esto por lo general se escribe como se indica a continuación:
El estadístico de prueba
• El estadístico de prueba en el cual se basa nuestra decisión es X, el número
de individuos en nuestro grupo de prueba que reciben protección de la
nueva vacuna durante un periodo de al menos 2 años. Los valores posibles
de X, de 0 a 20, se dividen en dos grupos: los números menores o iguales
que 8 y aquellos mayores que 8.
• El último número que observamos al pasar a la región crítica se llama valor
crítico. En nuestro ejemplo el valor crítico es el número 8.
• Por lo tanto, si x > 8, rechazamos H0 a favor de la hipótesis alternativa H1. Si x ≤ 8, no
rechazamos H0.
La probabilidad de error tipo I
• El procedimiento de toma de decisiones recién descrito podría conducir a
cualquiera de dos conclusiones erróneas.
• Por ejemplo, es probable que la nueva vacuna no sea mejor que la que se usa en la
actualidad (H0 verdadera) y, sin embargo, en este grupo específico de individuos
seleccionados aleatoriamente más de 8 pasan el periodo de 2 años sin contraer el
virus.
• Si rechazáramos H0 a favor de H1 cuando, de hecho, H0 es verdadera, cometeríamos
un error que se conoce como error tipo I.
• El rechazo de la hipótesis nula cuando es verdadera se denomina error tipo I.
también llamada nivel de significancia, se denota con la letra griega α.
La probabilidad de error tipo I
• En nuestro ejemplo un error tipo I ocurriría si más de 8 individuos inoculados
con la nueva vacuna superan el periodo de 2 años sin contraer el virus y los
investigadores concluyen que la nueva vacuna es mejor, cuando en realidad
es igual a la vacuna que se utiliza en la actualidad.
• Por lo tanto, si X es el número de individuos que permanecen sin contraer el virus por
al menos dos años

Decimos que la hipótesis nula, p = 1/4, se prueba al nivel de significancia α = 0.0409


La probabilidad de error tipo II
• Si 8 o menos miembros del grupo superan exitosamente el periodo de 2 años
y no concluimos que la nueva vacuna es mejor cuando en realidad sí lo es (H1
verdadera).
• Cometemos un segundo tipo de error, el de no rechazar la hipótesis H0 cuando en
realidad es falsa. A este error se le conoce como error tipo II.
• No rechazar la hipótesis nula cuando es falsa se denomina error tipo II.
La probabilidad de error tipo II
• La probabilidad de cometer un error tipo II, que se denota con β, es
imposible de calcular a menos que tengamos una hipótesis alternativa
específica.
• Si probamos la hipótesis nula p = 1/4 contra la hipótesis alternativa p = 1/2, entonces
podremos calcular la probabilidad de no rechazar H0 cuando es falsa.
• Simplemente calculamos la probabilidad de obtener 8 o menos en el grupo que
supera el periodo de 2 años cuando p = 1/2.

Se trata de una probabilidad elevada que indica un procedimiento de prueba en el cual es muy probable que se
rechace la nueva vacuna cuando, de hecho, es mejor a la que está actualmente en uso.
La probabilidad de error tipo II
• Es posible que el director del programa de prueba esté dispuesto a
cometer un error tipo II si la vacuna más costosa no es
significativamente mejor. De hecho, la única ocasión en la que desea
evitar un error tipo II es cuando el verdadero valor de p es de al
menos 0.7. Si p = 0.7, este procedimiento de prueba da.

Con una probabilidad tan pequeña de cometer un error tipo II es muy improbable que se rechace la nueva vacuna
cuando tiene una efectividad de 70% después de un periodo de 2 años. A medida que la hipótesis alternativa se
aproxima a la unidad, el valor de β tiende a disminuir hasta cero
El papel que desempeñan α, β y el tamaño de la
muestra
• Supongamos que el director del programa de prueba no está dispuesto a come ter un
error tipo II cuando la hipótesis alternativa p = 1/2 es verdadera, aun cuando se
encuentre que la probabilidad de tal error es β = 0.2517.
• Siempre es posible reducir β aumentando el tamaño de la región crítica.
• Por ejemplo, considere lo que les sucede a los valores de α y β cuando cambiamos nuestro
valor crítico a 7, de manera que todos los valores mayores que 7 caigan en la región crítica y
aquellos menores o iguales que 7 caigan en la región de no rechazo.
• Así, al probar p = 1/4 contra la hipótesis alternativa p = 1/2, encontramos que
El papel que desempeñan α, β y el tamaño de la
muestra
• la probabilidad de cometer ambos tipos de errores se puede reducir
aumentando el tamaño de la muestra
n = 100 individuos
Si mas de 36 individuos superan el periodo de 2 años
Hipotesis:
1 Todos los valores posibles mayores de 36 constituyen la
Hipotesis nula p = , rechazo
4 región crítica y todos los valores posibles menores o
1 iguales que 36 caen en la región de aceptación.
Hipotesis nula p , aceptacion
4
Valor critico 36
El papel que desempeñan α, β y el tamaño de
la muestra
• Para determinar la probabilidad de cometer un error tipo I debemos utilizar
la aproximación a la curva normal con

necesitamos el área bajo la curva normal a la derecha de x =


36.5. El valor z correspondiente es

En la tabla A.3 encontramos que


El papel que desempeñan α, β y el tamaño de
la muestra

Si H0 es falsa y el verdadero valor de H1 es p = 1/2, determinamos la probabilidad de un error tipo


II usando la aproximación a la curva normal con

La probabilidad de que un valor caiga en la región de no rechazo cuando H0 es verdadera es dada por el área de la región
sombreada a la izquierda de x = 36.5 en la figura . El valor z que corresponde a x = 36.5 es
El papel que desempeñan α, β y el tamaño de
la muestra

Con esto queremos decir que debería determinarse un valor razonable a una α fija para la probabilidad de aceptar
de manera errónea H0, es decir, el valor de β, cuando la verdadera situación representa alguna desviación
importante de H0. Por lo general, es posible determinar un valor para el tamaño de la muestra, para el que existe un
equilibrio razonable entre los valores de α y β que se calcula de esta manera
Metodo de cálculo
Resumen: Elección del tamaño de la muestra para la prueba de medias

S-ar putea să vă placă și