Documente Academic
Documente Profesional
Documente Cultură
Pruebas de hipótesis
Se acepta Ho
Se establecen Se formula Se toma una
Se selecciona Se identifica
las hipótesis una regla muestra, se
un nivel de el estadístico
nula y para tomar llega a una
significancia de prueba Se rechaza
alternativa decisiones decisión
Ho y se
acepta H1
1. Formulación de Ho y H1
• Hipótesis nula (Ho) → Enunciado relativo al valor de un parámetro poblacional que se formula con
el fin de probar evidencia numérica.
• 0 → no hay diferencia
• Es una afirmación que no se rechaza a menos que la información de la muestra ofrezca evidencia
convincente de que es falsa.
• Incluye el signo igual
• Al seleccionar una muestra de una población, el estadístico de la muestra es numéricamente
distinto del parámetro poblacional hipotético.
• La diferencia es significativa o se debe al error de muestreo → Prueba de hipótesis
1. Formulación de Ho y H1
• Hipótesis alternativa (H1) → Hipótesis de investigación
• Enunciado que se acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la
hipótesis nula.
2. Selección del nivel de significancia
α → Probabilidad de rechazar la hipótesis nula cuando es verdadera.
P(Error tipo I) → α
1. El primer paso es agrupar las desviaciones estándares de acuerdo con la fórmula siguiente:
2. El valor de t se calcula a partir de la fórmula siguiente:
Con un nivel de significancia de 0.05, ¿hay alguna diferencia entre el número medio de defectos por
turno?
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) ¿Cuál es el valor del estadístico de prueba?
d) ¿Cuál es su decisión respecto de la hipótesis nula?
e) ¿Cuál es el valor p?
f ) Interprete el resultado.
g) ¿Cuáles son las suposiciones necesarias de esta prueba?
IV. Si no es posible suponer que las desviaciones estándares de la población son iguales,
A. Utilice la distribución t como el estadístico de prueba, pero ajuste los grados de libertad mediante
la fórmula siguiente:
¿Es razonable concluir que el saldo medio de los tarjetahabientes que fueron contactados por teléfono es mayor
que el de quienes solicitaron la tarjeta por cuenta propia? Suponga que las desviaciones estándares de las
poblaciones no son iguales. Utilice el nivel de significancia 0.05.
a) Formule las hipótesis nula y alternativa.
b) ¿Cuántos grados de libertad hay?
c) ¿Cuál es la regla de decisión?
d) ¿Cuál es el valor del estadístico de prueba?
e) ¿Cuál es su decisión respecto de la hipótesis nula?
f ) Interprete el resultado.
Pruebas de hipótesis para muestras dependientes
Hay dos tipos de muestras dependientes:
• Las que se caracterizan por una medición, una intervención de algún tipo y después otra medición
(estudio de “antes” y “después”)
1) Una relación o agrupación de las observaciones.
V. Se supone que la distribución de las diferencias apareadas entre las poblaciones tiene una media de 0.
A. Primero se calcula la media y la desviación estándar de las diferencias muestrales.
B. El valor del estadístico de prueba se calcula a partir de la fórmula siguiente:
11.5 La publicidad que realiza Sylph Fitness Center afirma que, al terminar su entrenamiento, las
personas bajarán de peso. Una muestra aleatoria de ocho participantes recientes reveló los pesos
siguientes antes y después de terminar el entrenamiento. Con un nivel de significancia de 0.01, ¿se
puede concluir que los participantes bajan de peso?
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es el valor crítico de t?
c) ¿Cuál es el valor calculado de t?
d) Interprete el resultado. ¿Cuál es el valor p?
e) ¿Qué suposición necesita acerca de la distribución
de las diferencias?
Análisis de la varianza
Medidas de Dispersión
Rango
Desviación
Varianza
Desviación estándard
Coeficiente de variación de 𝜎
𝑟=
𝜇
Pearson 44
Distribución F
• Ronald Fisher
• Es continua.
• Sus valores no pueden ser negativos.
• Tiene sesgo positivo.
• Hay una familia de distribuciones F.
• Dos parámetros: grados de libertad del numerador y los grados de
libertad del denominador.
• Prueba si dos muestras provienen de poblaciones que tienen
varianzas iguales
• Comparar varias medias poblacionales en forma simultánea
(ANOVA).
Distribución F
Con la distribución F se prueba si son iguales dos varianzas poblacionales.
A. Las poblaciones muestreadas deben seguir la distribución normal.
B. La mayor de las dos varianzas muestrales se coloca en el numerador, para forzar que la razón sea al menos
1.00.
C. Las hipótesis nula y alternativa son:
• VARIACIÓN TOTAL Suma de las diferencias entre cada observación y la media global elevadas al cuadrado.
• VARIACIÓN DE TRATAMIENTO Suma de las diferencias entre la media de cada tratamiento y la media total
o global elevadas al cuadrado.
• VARIACIÓN ALEATORIA Suma de las diferencias entre cada observación y su media de tratamiento
elevadas al cuadrado.
Prueba ANOVA
1. La fórmula de SS total, el total de la suma de los cuadrados, es:
IV. Si se rechaza una hipótesis nula de tratamiento de medias iguales, se identifican los pares de
medias diferentes a partir del intervalo de confianza siguiente.
Si el intervalo de confianza incluye
cero, no existe diferencia entre las
medias.
• Desde hace algún tiempo las aerolíneas han reducido sus servicios, como
alimentos y bocadillos durante sus vuelos, y empezaron a cobrar un precio
adicional por algunos de ellos, como llevar sobrepeso de equipaje, cambios de
vuelo de último momento y por mascotas que viajan en la cabina. Sin embargo,
aún están muy preocupadas por el servicio que ofrecen.
• Hace poco un grupo de cuatro aerolíneas contrató a Brunner Marketing Research,
Inc., para encuestar a sus pasajeros sobre la adquisición de boletos, abordaje,
servicio durante el vuelo, manejo del equipaje, comunicación del piloto, etc.
Hicieron 25 preguntas con diversas respuestas posibles: excelente, bueno, regular
o deficiente. Una respuesta de excelente tiene una calificación de 4, bueno 3,
regular 2 y deficiente 1. Estas respuestas se sumaron, de modo que la calificación
final fue una indicación de la satisfacción con el vuelo. Entre mayor la calificación,
mayor el nivel de satisfacción con el servicio. La calificación mayor posible fue
100. Brunner seleccionó y estudió al azar pasajeros de las cuatro aerolíneas. A
continuación se muestra la información. ¿Hay alguna diferencia entre los niveles
de satisfacción medios con respecto a las cuatro aerolíneas? Use el nivel de
significancia de 0.01.
• 12.2 Citrus Clean es un nuevo limpiador multiusos a prueba en el mercado, del cual se han
colocado exhibidores en tres lugares distintos dentro de varios supermercados. A continuación se
reporta la cantidad de botellas de 12 onzas que se vendieron en cada lugar del supermercado.
A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los promedios de botellas que se
vendieron en los tres lugares?
a) Formule las hipótesis nula y alternativa.
b) ¿Cuál es la regla de decisión?
c) Calcule los valores de SS total, SST y SSE.
d) Elabore una tabla ANOVA.
e) ¿Cuál es su decisión respecto de la hipótesis nula?
Análisis de la varianza de dos vías
V. En una ANOVA de dos vías se considera una segunda variable de tratamiento.
A. La segunda variable de tratamiento se denomina variable de bloqueo.
C. El término SSE, o suma de los errores al cuadrado, se determina a partir de la siguiente ecuación:
D. El estadístico F de la variable de tratamiento y de la variable de bloqueo se determina en la
siguiente tabla:
• El director de WARTA, Warren Area Transit Authority, considera ampliar el servicio
de autobuses del suburbio de Starbrick al distrito comercial central de Warren. Se
consideran cuatro rutas de Starbrick al centro de Warren: 1) por la carretera 6, 2)
por el West End, 3) por Hickory Street Bridge, y 4) por la ruta 59. El director
realizó varias pruebas para determinar si había una diferencia entre los tiempos
de recorrido medios por las cuatro rutas. Como habrá muchos conductores
distintos, la prueba se diseñó para que cada conductor manejara a lo largo de
todas ellas. A continuación se presenta el tiempo del recorrido, en minutos, de
cada combinación conductor-ruta.
• A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de
recorrido medios a lo largo de las cuatro rutas?
• Si elimina el efecto de los conductores, ¿hay alguna diferencia entre los tiempos
de recorrido medios?
ANOVA de dos vías con interacción
VI. En una ANOVA de dos vías con observaciones repetidas se
consideran dos variables de tratamiento y la interacción posible
entre las variables.