Sunteți pe pagina 1din 48

Prueba de hipótesis

Six Sigma
¿Qué es una hipótesis? D M A I C

 Suposición de algo posible o imposible, para extraer


de ello una consecuencia.
 Suposición o explicación propuesta, hecha con base
en evidencia limitada, como punto de partida para
una investigación posterior.
 Proposición hecha como base para razonamiento, sin
suposiciones acerca de su veracidad.
 Una solución propuesta para un problema.
¿Hipótesis o teoría? D M A I C

 Una teoría es un principio o conjunto de principios


generales, científicamente aceptables o plausibles,
que explican un fenómeno.
 Científicamente aceptable o plausible: comprobado,
por medio de experimentos, evidencias, hechos,
datos…
Algunos ejemplos D M A I C

 La nieve se derrite más rápido que el hielo.


 Si se mantiene el nivel de presión de aire de las
llantas de un automóvil, se obtendrá un mayor
rendimiento de gasolina.
 Un nuevo medicamento es efectivo para curar la
enfermedad para la cual fue desarrollado.
 Si se incrementa la cantidad de agua utilizada para
regar un jardín, las plantas tendrán mayor
crecimiento.
Características de una buena hipótesis D M A I C

 Está basada en información u observaciones previas.


 Se puede hacer alguna predicción a partir de ella.
 Puede ser sujeta de experimentación y
comprobación.
 La predicción contiene al menos una variable
independiente y una variable dependiente.

6σ 𝑦 = 𝑓(𝑥1 , 𝑥2 , … 𝑥𝑛 )
Prueba de hipótesis D M A I C

 Las hipótesis no son “correctas” o “equivocadas”.


 Los datos recolectados, las evidencias soportan o
contradicen las hipótesis.
Historia del marino estadístico D M A I C

 Will regresó a casa el día de Navidad, después de haber


pasado todo el año cumpliendo su maldición en el mar.
Pasado Año Nuevo, volvió a irse. Al regresar la Navidad
siguiente, encuentra a Elizabeth con un nuevo bebé.
 – ¿Cuándo nació? – pregunta Will.
 – El 15 de Octubre –contesta Elizabeth.
 – ¡10 meses y medio de embarazo! ¡Ese niño no es mío!–
grita encolerizado.
Historia del marino estadístico D M A I C

 Ayuda a Jack a resolver esta situación…


Historia del marino estadístico D M A I C

 Jack podría recopilar datos, o consultar la


información existente acerca de la duración típica de
un embarazo:
µ = 270 días
σ = 16 días
Historia del marino estadístico D M A I C

315

222 238 254 270 286 302 318


Conceptos básicos D M A I C

 Hipótesis nula H0
 Hipótesis alternativa Ha o H1
 Valor P
Hipótesis nula H0 D M A I C

 Afirmación inicial basada en análisis previos o en


conocimiento especializado.
 Típicamente se formula en términos que indican falta
de relación entre variables.
 Se asume que es verdadera, a menos que la evidencia
demuestre lo contrario.
 Establece que un parámetro poblacional (media,
desviación estándar…) es igual a un valor hipotético.
Hipótesis alternativa Ha o H1 D M A I C

 Lo que podría pensarse que es cierto, o esperar


probar que es cierto.
 Se acepta en lugar de H0 cuando la evidencia permite
rechazar H0.
 Establece que un parámetro poblacional (media,
desviación estándar…) es menor, mayor o diferente al
valor hipotético de H0.
 Puede ser unilateral o bilateral.
¿Qué es el valor P? D M A I C

 La probabilidad de que los datos evaluados puedan ser


explicados por una hipótesis nula verdadera.
 Un valor de P alto significa que hay una alta probabilidad
de que los datos obtenidos ocurran en caso de que la
hipótesis nula sea verdadera
 Un valor de P bajo significa que hay una baja probabilidad
de que los datos obtenidos ocurran en caso de que la
hipótesis nula sea verdadera
De manera práctica… D M A I C

 Si el valor P es bajo, rechazar H0


 Baja probabilidad de que los datos obtenidos ocurran en
caso de que la hipótesis nula sea verdadera
 Si el valor P es alto, mantener H0
 Altaprobabilidad de que los datos obtenidos ocurran en
caso de que la hipótesis nula sea verdadera
Prueba de normalidad

p > 0.05 entonces


la distribución es normal
Estudio R&R
Estudio R&R del sistema de medición - método ANOVA

Tabla ANOVA de dos factores con interacción

Fuente GL SC MC F P
Muestra 9 88.3619 9.81799 492.291 0.000
Operador 2 3.1673 1.58363 79.406 0.000
Muestra * Operador 18 0.3590 0.01994 0.434 0.974
Repetibilidad 60 2.7589 0.04598
Total 89 94.6471

α para eliminar el término de interacción = 0.05

Tabla ANOVA dos factores sin interacción

Fuente GL SC MC F P
Muestra 9 88.3619 9.81799 245.614 0.000
Operador 2 3.1673 1.58363 39.617 0.000
Repetibilidad 78 3.1179 0.03997
Total 89 94.6471
¿Qué tan bajo debe ser el valor P? D M A I C

 Sería deseable una probabilidad menor de 10% de que los


datos analizados validaran H0 por cuestión aleatoria…
 Sería todavía mejor si el valor fuera 5%...
 Sería más seguro aún si se utilizara 1%...
 Depende de la criticidad de las consecuencias de una
decisión errónea…
 ¿En qué casos aceptarían 0.05? ¿0.01? ¿0.10?
 0.05 es un valor típico, 0.01 para aspectos críticos o de
seguridad
Algunos ejemplos D M A I C

 Un constructor de automóviles desea evaluar si el


rendimiento de gasolina de su nuevo automóvil supera el
promedio del mercado…
 H0: rendimiento nuevo automóvil = rendimiento promedio
 Ha: rendimiento nuevo automóvil > rendimiento promedio
Algunos ejemplos D M A I C

 Se desea evaluar si una bomba de gasolina despacha el


volumen exacto de combustible…
 H0: volumen despachado = volumen comprado
 Ha: volumen despachado ≠ volumen comprado
Algunos ejemplos D M A I C

 Una empresa farmacéutica desea evaluar si su nuevo


medicamento para reducir la presión arterial es
efectivo…
 H0: reducción presión arterial = 0
 Ha: reducción presión arterial > 0
Algunos ejemplos D M A I C

 Una empresa farmacéutica desea evaluar si su nuevo


medicamento para reducir la presión arterial es
efectivo…
 H0: ∆ sujetos medicados = ∆ sujetos no medicados
 Ha: ∆ sujetos medicados ≠ ∆ sujetos no medicados
Su turno… D M A I C

 Una empresa de electrodomésticos compra cable aislado


e inspecciona la cantidad de defectos de aislamiento por
metro de cable. Desea evaluar si un posible nuevo
proveedor de cable tiene mejor desempeño que el
proveedor actual…
 H0: defectos actual = defectos nuevo
 Ha: defectos actual > defectos nuevo
Su turno… D M A I C

 La UPSLP desea evaluar si sus alumnos obtienen


calificaciones en los EGEL superiores a la media
nacional…
 H0: evaluación promedio UPSLP = media nacional
 Ha: evaluación promedio UPSLP > media nacional
Su turno… D M A I C

 Se desea evaluar si mantener una presión de llenado alta


de las llantas de un automóvil incrementa el rendimiento
de combustible…
 Rendimiento 1 = rendimiento con presión alta
 Rendimiento 2 = rendimiento con presión baja
 H0: rendimiento 1 = rendimiento 2
 Ha: rendimiento 1 > rendimiento 2
De manera general… D M A I C

 H0: µ = x
 Ha: µ ≠ x

 H0: σ = x
 Ha: σ ≠ x
De manera general… D M A I C

 H0: µ1 = µ2
 Ha: µ1 ≠ µ2

 H0: σ1 = σ2
 Ha: σ1 ≠ σ2
De manera general… D M A I C

 H0: la variable Y es independiente de la variable X


 Ha: la variable Y no es independiente de la variable X

 H0: la pendiente de la recta es 0


 Ha: la pendiente de la recta no es 0
Errores de decisión
DECISIÓN

No alarma Alarma

No incendio
Falsa alarma
REALIDAD

Incendio

Heridos
Errores de decisión
DECISIÓN

Aceptar H0 Rechazar H0

H0 verdaera
Error Tipo I
Riesgo α
REALIDAD

H0 falsa

Error Tipo II
Riesgo β
Errores de decisión
H0: El acusado es inocente DECISIÓN

Aceptar H0 Rechazar H0

H0 verdaera
Condena de
un inocente
REALIDAD

H0 falsa
Exoneración
de un culpable
Errores de decisión
H0: La parte es conforme DECISIÓN

Aceptar H0 Rechazar H0

H0 verdaera
Rechazo de
una parte
conforme
REALIDAD

H0 falsa Aceptación de
una parte no
conforme
Recapitulando… D M A I C

 Se formula una hipótesis para explicar un fenómeno.


 Típicamente en la forma 𝑦 = 𝑓(𝑥1 , 𝑥2 … 𝑥𝑛 )
 Se asume que la hipótesis nula H0 es verdadera.
 Se plantea un experimento que permita recolectar datos
para comprobar o refutar la hipótesis, probando el efecto de
las variables independientes sobre la variable dependiente.
 Se establece el nivel aceptable de riesgo y sensibilidad de la
prueba (valor P).
Recapitulando… D M A I C

 Se analiza si la evidencia recolectada valida o refuta la


hipótesis.
 Si no se puede aceptar la hipótesis nula H0, entonces se
acepta la hipótesis alternativa Ha.
Diferentes tipos de datos… D M A I C

 Datos discretos, atributos


 Nivel socio-económico, educativo, rango de edad…
 Cantidad de eventos discretos (piezas, personas, días…)
 Atributos cualitativos (bueno/malo, alto/bajo…)
 Categorías (línea de producción, turno, modelo…)
 Datos continuos, variables
 Magnitudes físicas divisibles (tiempo, distancia, fuerza,
velocidad, temperatura…)
Diferentes tipos de análisis… D M A I C

Variables independientes X
Una sola X Múltiples X
Variables dependientes Y
Una sola Y
Ver tabla Ver tabla
Múltiples Y

Análisis multivariado
Diferentes tipos de análisis… D M A I C

Una sola X Múltiples X


Discreta Continua Discreta Continua
Discreta

Regresión logística Regresión logística


Chi-cuadrado Regresión logística
múltiple múltiple
Una sola Y

ANOVA múltiples
ANOVA
Continua

factores
Regresión Regresión múltiple
Prueba de medias
Prueba de
o medianas
medianas
Ejemplo D M A I C

 En un proceso de reclutamiento, se quiere analizar si el


rango de edad de un candidato influye en la decisión de
que sea o no contratado.
 Los candidatos son agrupados en 3 rangos de edad:
 Menor de 30 años
 Entre 30 y 45 años
 Mayor de 45 años
 Se registra para cada caso la decisión de ser contratado o
no.
Ejemplo D M A I C

 Variable dependiente y tipo:


 Variable independiente y tipo:

 H0:
 Ha:
Ejemplo D M A I C

 Variable dependiente y tipo: Decisión de contratación –


discreta
 Variable independiente y tipo: Rango de edad – discreta

 H0:
 Ha:
Diferentes tipos de análisis… D M A I C

Una sola X Múltiples X


Discreta Continua Discreta Continua
Discreta

Regresión logística Regresión logística


Chi-cuadrado Regresión logística
múltiple múltiple
Una sola Y

ANOVA múltiples
ANOVA
Continua

factores
Regresión Regresión múltiple
Prueba de medias
Prueba de
o medianas
medianas
Diferentes tipos de análisis… D M A I C

Una sola X Múltiples X


Discreta Continua Discreta Continua
Discreta

Regresión logística Regresión logística


Chi-cuadrado Regresión logística
múltiple múltiple
Una sola Y

ANOVA múltiples
ANOVA
Continua

factores
Regresión Regresión múltiple
Prueba de medias
Prueba de
o medianas
medianas
Ejemplo D M A I C

 Variable dependiente y tipo: Decisión de contratación –


discreta
 Variable independiente y tipo: Rango de edad – discreta

 H0:
 Ha:
Ejemplo D M A I C

 Variable dependiente y tipo: Decisión de contratación –


discreta
 Variable independiente y tipo: Rango de edad – discreta

 H0: La decisión de contratación no depende del rango de


edad (no hay relación entre las variables)
 Ha: La decisión de contratación sí depende del rango de
edad (hay relación entre las variables)
Un análisis diferente… D M A I C

 Se sospecha que existe una relación entre el nivel de


pobreza y la tasa de natalidad de la población.
 ¿Qué hipótesis podrían plantearse?
 ¿Qué experimento podría formularse?
Un análisis diferente… D M A I C

 Datos recolectados:
 Tasa de natalidad: promedio estatal de nacimientos por año
por cada 1000 mujeres entre 15 y 17 años de edad.
 Nivel de pobreza: porcentaje de la población del estado que
vive debajo de la línea de pobreza.
 Nota:los datos disponibles corresponden a los Estados
Unidos de América en el año 2002
Diferentes tipos de análisis… D M A I C

Una sola X Múltiples X


Discreta Continua Discreta Continua
Discreta

Regresión logística Regresión logística


Chi-cuadrado Regresión logística
múltiple múltiple
Una sola Y

ANOVA múltiples
ANOVA
Continua

factores
Regresión Regresión múltiple
Prueba de medias
Prueba de
o medianas
medianas
Diferentes tipos de análisis… D M A I C

Una sola X Múltiples X


Discreta Continua Discreta Continua
Discreta

Regresión logística Regresión logística


Chi-cuadrado Regresión logística
múltiple múltiple
Una sola Y

ANOVA múltiples
ANOVA
Continua

factores
Regresión Regresión múltiple
Prueba de medias
Prueba de
o medianas
medianas

S-ar putea să vă placă și