Sunteți pe pagina 1din 12

Nombre: Matrícula:

Nombre del curso: Nombre del profesor:


Definición y medición de sistemas de
calidad
Módulo 2: Actividad 6:
Tema 8. Modelos Estadísticos y Pruebas Intervalos de confianza y prueba de
de hipótesis hipótesis
Fecha: 26 de Enero 2018
Bibliografía:
Douglas, M. (2014). Guía del participante para Lean Six Sigma Green Belt de Sigma
Pro Parte 1. Estados Unidos: Sigma Pro Inc.

Objetivo:
Interpretar los resultados de la medición de los intervalos de confianza y la prueba de
hipótesis.

Procedimiento:
1. Leer el tema del módulo que correspondan.
2. Entrar en la plataforma para identificar la información adecuada.
3. Mediante fuentes de información realizar los diferentes puntos de la actividad y lograr
el objetivo.
4. Dar los resultados deseados.
5. Concluir los conocimientos adquiridos y subir la actividad al espacio correspondiente.

Resultados:

Contesta las siguientes preguntas:


1. ¿Cuál es la conclusión principal sobre el Teorema del Límite Central?, ¿cuál es el
resultado comúnmente conocido de esta conclusión principal?

Es un teorema fundamental de probabilidad y estadística. El teorema establece que la


distribución de X, que es la media de una muestra aleatoria de una población con
varianza finita, tiene una distribución aproximadamente normal cuando el tamaño de la
muestra es grande, independientemente de la forma de la distribución de la población.
Este teorema indica que, en condiciones muy generales, si Sn es la suma de “n” variables
aleatorias independientes y de varianza no nula pero finita, entonces la función de
distribución de Sn ≪se aproxima bien≫ a una distribución normal (también llamada
distribución gaussiana, curva de Gauss o campana de Gauss). Así pues, el teorema
asegura que esto ocurre cuando la suma de estas variables aleatorias e independientes
es lo suficientemente grande. En conclusión, este teorema dice que la suma de los
números tiende a ser de distribución normal inclusive si la distribución original de los
datos es normal.

2. ¿Qué es una distribución de muestreo?

Este describe la probabilidad de obtener cada valor posible de un estadístico de una


muestra aleatoria de una población, en otras palabras, que proporción de todas las
muestras aleatorias de ese tamaño ofrecerá ese valor. En conclusión, es una distribución
de probabilidad de una estadística.

3. ¿Qué es un error estándar?

Es la desviación estándar de la distribución muestra de un estadístico. El termino se


refiere también a una estimación de la desviación estándar, derivada de una muestra
particular usada para computar la estimación. Este error es una estadística se define
como la desviación estándar de su distribución de muestreo

4. Menciona tres distribuciones de muestreo conocidas y haz una lista de las


estadísticas que se asocian a cada una de ellas.

La distribución de muestreo puede ser totalmente determinada por dos valores: la media
y la desviación estándar. Estos dos parámetros son importantes para calcular la
distribución de muestreo si se nos da la distribución normal de toda la población. La
distribución normal es una de las distribuciones de probabilidad más simples, por lo que
es muy fácil de estudiar y analizar. Podemos encontrar fácilmente fórmulas matemáticas
para las estadísticas de distribución de muestreo que queremos encontrar. Sin embargo,
cuando la distribución no es normal, esto puede ser muy complicado y tales
formulaciones matemáticas sencillas podrían ser difíciles de encontrar o hasta
imposibles en algunos casos. En estos casos, usamos métodos aproximados porque
encontrar el valor exacto implicará el estudio de cada muestra de tamaño n tomada de
la población, lo que es muy difícil y requiere mucho tiempo.

Las distribuciones muestrales adoptan diferentes formas según las estadísticas


investigadas y las características de la población estudiada.

Distribución Normal:
Media (X): el centro de los datos. La media es la sumatoria de los datos divido entre el
número de ellos.
Desviación estándar (s): la separación esperada de los datos. La desviación estándar es
la diferencia de los datos de la media, al cuadrado dividido entre la población menos 1 y
con raíz cuadrada.
Distribución de probabilidad de Weibull
La función de densidad de Weibull contiene dos parámetros, α y β. El parámetro de
escala β refleja el tamaño de las unidades en las que la variable aleatoria y es medida.
El parámetro α es el parámetro de forma. Cambiando el parámetro de forma α se puede
generar una gran variedad de curvas para modelar datos experimentales. La función de
distribución, la media y la varianza para la distribución de Weibull son:

La distribución log-normal
Una distribución log-normal es una distribución que puede ser transformada a una
distribución normal tomando el logaritmo natural de los valores individuales. No
obstante, no hay una función de densidad de probabilidad universalmente aceptada
para la distribución log-normal. La más comúnmente usada para la distribución log-
normal es:

La distribución exponencial negativa


Cuando α = 1 la función de densidad gamma se conoce como distribución exponencial
negativa. Esta función de densidad se utiliza como modelo de la distribución de
frecuencia relativa de la cantidad de tiempo entre eventos, cuando la probabilidad de
que ocurra un evento durante una unidad de tiempo es igual a la probabilidad para
cualquier otra unidad de tiempo. Esta distribución es muy importante para modelación
de confiabilidad y de servicio.

La familia de distribuciones gamma


Muchas variables aleatorias solo pueden asumir valores no negativos. Las distribuciones
de frecuencia relativa con datos de este tipo pueden ser modeladas a menudo mediante
funciones de densidad del tipo gamma.
La función de distribución de probabilidad, la media y la varianza para una distribución
de la familia gamma son:

Distribución muestral de una proporción muestral


Es la distribución de los valores de las proporciones muestrales de todas las posibles
muestras del mismo tamaño “n” tomadas de la misma población. Las distribuciones de
muestreo generalmente son difíciles de encontrar, excepto en casos simples o por
simulación.

Teorema del límite central


Cuando muestras aleatorias del mismo tamaño son tomadas de la población, las
distribuciones de las medias de las muestras se acercarán a la distribución Normal.
Las estadísticas principales son: Media, Desviación estándar, Error estándar
El error estándar (ES o ESM) de la distribución de muestreo es dado por la fórmula:

S/√𝑛
Donde, n = tamaño de muestra
S= desviación estándar de la muestra
X= media de la muestra

5. Cuando alguien declara que un parámetro es igual a un valor, ¿cuál es el nivel de


confianza asociado a dicha declaración?

El nivel de confianza mostrado es dé %100


Se llama intervalo de confianza en estadística a un par de números entre los cuales se
estima que estará cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un parámetro poblacional.
La probabilidad de éxito en la estimación se representa por 1-ά y se denomina nivel de
confianza. Estas circunstancias, ά es en llamado error aleatorio o nivel de significación,
esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo

6. ¿Qué es una prueba IOT?

Es una regla que especifica si se puede aceptar o rechazar una afirmación acerca de una
población dependiendo de la evidencia proporcionada por una muestra de datos. Una
prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa.

7. ¿Qué es una hipótesis nula?

La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un


enunciado de que "no hay efecto" o "no hay diferencia".

8. ¿Qué es una hipótesis alternativa?

La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de


acuerdo con la evidencia proporcionada por los datos de la muestra.

9. ¿Qué es el valor P?

“P” se utiliza para determinar si los resultados son estadísticamente significativos. Los
valores “P” suelen utilizarse en las pruebas de hipótesis, donde usted rechaza o no puede
rechazar una hipótesis nula.
Cuando se realiza una prueba de hipótesis, el elemento clave de la salida en el que hay
que concentrarse es el valor “P”

10. ¿Cuál es la diferencia entre los errores Tipo I y Tipo II?

Error Tipo I: Rechazar la hipótesis nula siendo verdadera. La probabilidad de que esto
ocurra se denota con el símbolo a, y algunas veces es llamado el riesgo alfa.
Error Tipo II: aceptar la hipótesis nula siendo falsa. La probabilidad de que esto ocurra se
denota con el símbolo b, y algunas veces es llamado el riesgo beta.

11. ¿Para qué sirve la prueba t de 1 muestra?

Calcula un intervalo de confianza o desempeña una prueba de hipótesis en la media


asumiendo “S” conocida, donde n-1 son los grados de libertad para t.

12. ¿Para qué sirve la prueba t de 2 muestras?

Calcula un intervalo de confianza y desempeña una prueba de hipótesis de la diferencia


entre dos medias poblacionales asumiendo que las “S” son desconocidas y que las
muestras son independientes, normales.

13. ¿Para qué sirve la prueba t pareada?

La prueba T pareada calcula un intervalo de confianza y desarrolla una prueba de


hipótesis de la diferencia de las medias de dos poblaciones cuando las observaciones son
idénticas.

14. ¿Para qué sirve la prueba de varianza de 1 muestra?


Ayuda a contrastar la hipótesis nula de que las medias de “K” poblaciones (K >2) son
iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones
difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el
análisis de resultados experimentales, en los que interesa comparar los resultados de “K”
'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.

15. ¿Para qué sirve la prueba de varianza de 2 muestras?

Permite identificar la diferencia promedio que hay entre cada uno de los valores
respecto a su punto central (Media). Este promedio es calculado, elevando cada una de
las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su
promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor
respecto a la media y dividiendo este resultado por el número de observaciones que se
tengan.

16. ¿Cuál es el dicho en el que siempre se tienen que recordar alternativas y los
valores P?

La probabilidad, asumiendo que Ho es verdadera, al observar un valor de la prueba


estadística que es al menos tan grande como el valor calculado. Un valor menor de “P”
significa que la prueba tiene mayor significancia.

17. En general, ¿cómo se puede calcular un tamaño de muestra requerido asociado


con un intervalo de confianza?

Este procedimiento se basa en una distribución normal, de manera que, para las
muestras pequeñas, este procedimiento funciona mejor si sus datos fueron extraídos de
una distribución normal o una distribución cercana a normal. A partir del Teorema del
límite central, usted puede utilizar este procedimiento si tiene una muestra grande,
sustituyendo la desviación estándar de la muestra por “s”.

18. Accede a la herramienta Minitab y analiza los datos en EX01.MTW.


19. Supón que las columnas de datos representan el tiempo de ciclo del proceso
recolectados en tres diferentes operaciones en una operación de procesamiento
de facturas.
a. Prueba con un nivel de confianza del 95% si:
 La media de X1 es igual a 10
Histograma de X1
(con Ho e intervalo de confianza t de 95% para la media)

10

6
Frecuencia

0 _
X
Ho
3 6 9 12 15
X1

Gráfica de caja de X1
(con Ho e intervalo de confianza t de 95% para la media)

_
X
Ho

2 4 6 8 10 12 14 16
X1

 La media de X3 es igual a 10
Histograma de X3
(con Ho e intervalo de confianza t de 95% para la media)
12

10

8
Frecuencia

0 _
X
Ho
0 5 10 15 20
X3

Gráfica de caja de X3
(con Ho e intervalo de confianza t de 95% para la media)

_
X
Ho

0 5 10 15 20 25
X3

 La diferencia entre las medias de X1 y X3 es igual a cero


Gráfica de caja de X1, X3
25

20

15
Datos

10

0
X1 X3

Gráfica de valores individuales de X1, X3


25

20

15
Datos

10

0
X1 X3

 Las varianzas para X1 y X3 son iguales


Gráfica de valores individuales de X1, X3
25

20

15
Datos

10

0
X1 X3
Gráfica de caja de X1, X3
25

20

15
Datos

10

0
X1 X3

b. Límites de especificación:
 X1 < 15 unidades
 X2 < 5 unidades
 X3 < 20 unidades
20. En caso de tener alguna duda te puedes apoyar con su instructor o consultar
tutoriales en línea.
21. Elabora una conclusión de aprendizaje
22. Genera un reporte con las repuestas a las preguntas 1 a 17, integren el punto 19
y su conclusión de aprendizaje.

Conclusión: Durante la actividad pude hacer un análisis e interpretar los resultados de


las pruebas de hipótesis e intervalos de confianza, en intervalos de confianza se analizan
las razones por las que el uso de los intervalos de confianza es altamente recomendable.
Entre estas razones, destacan la aproximación al conocimiento de la importancia real de
un resultado, independientemente de la significación estadística, y la valoración de
equivalencia entre dos variables. Así también las pruebas de hipótesis tienen gran
importancia ya que se desea encontrar un resultado a cualesquiera hipótesis que sea
significativo estadísticamente.

S-ar putea să vă placă și