Documente Academic
Documente Profesional
Documente Cultură
4.4 A continuación se muestra parte del ANOVA para un diseño en bloques, que tiene tres tratamientos y cinco bloques
con una sola repetición por tratamiento-bloque
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.
Fuente de variación s. de cuadrados G. libertad C. medio Razón F Valor-p
Tratamiento 600 2 300 4,8 0,00748315
Bloque 850 4 212,5 3,4 0,0662071
Error 500 8 62,5
Total 1950 14
b) Interprete en forma práctica, para cada caso, lo que está estimando el cuadrado medio.
El cuadrado medio ayuda a estimar la variación entre las medias de las muestras (tratamiento y bloques) y se utiliza
para estimar los factores más significativos, pues mientras mayor sea el cuadrado medio de un factor más significativo
es el efecto de dicho factor.
c) Escriba el modelo estadístico y las hipótesis pertinentes.
Se trata de un diseño con un solo factor y bloques, de tal manera las hipótesis son:
Factor =Ho = µ1= µ2= µ3
Bloque Ho=γ1= γ2 = γ3 = γ4 = γ5
Modelo estadístico Yij = µ + + +
Donde Yij es la respuesta que corresponde al tratamiento i al bloque j, µ es la media global; es el efecto debido al
tratamiento i, es el efecto del bloque y corresponde al error.
4.5 Realice el problema anterior, pero ahora suponga que no se bloqueó. ¿Se hubiesen obtenido las mismas
conclusiones?
Como el bloque no tiene efecto, los resultados al no bloquear serían muy similares a los anteriores, ya que el factor
seguiría teniendo efecto sobre la variable respuesta y este efecto sería aún más significativo.
Puesto que los dos valores-p son menores que 0,005 se rechazan las Ho tanto para el tratamiento como para el bloque y
se dice que 95% de confianza que el factor tratamiento influye en la variable respuesta y que también el factor de
bloque tiene influencia sobre la variable de respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta
d) Obtenga la diferencia mínima significativa (LSD) para comparar tratamientos en este diseño en bloques.
Pruebas de Múltiple Rangos para Y por Tratamiento
Método: 95,0 porcentaje LSD
Tratamiento Casos Media LS Sigma LS Grupos Homogéneos
1 4 3,75 0,478714 X
3 4 5,0 0,478714 X
2 4 7,25 0,478714 X
4.10 Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto
se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron
seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta
fuente de variación. Los datos obtenidos se muestran a continuación:
74
70
porcentaje
66
62
58
54
1 2 3
Marca.
d) ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento?
No, ya que de acuerdo al análisis de varianza ANOVA el bloque (día) no tiene efecto sobre el porcentaje de moscas que
matan cada marca de atomizador, así como el valor-p obtenido es de 0,42017 y es mayor a 0,05 se acepta la Ho para el
bloque y se dice con 95% de confianza que el día no influye en los resultados obtenidos.
10
6
residuos
-2
-6
-10
50 55 60 65 70 75
predichos
Para verificar la normalidad se aplicó la prueba de Shapiro-Wilk para los datos de cada marca. Donde la Ho= los datos
provienen de una distribución normal.
Como se observa para cada marca los valores-p encontrados son mayores a 0,05, así que con un 95% de confianza se
acepta la hipótesis nula y se dice que los datos provienen de una distribución normal.
Pruebas de Normalidad para Porcentaje con marca 1
Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,937992 0,660323
4.19. Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I,
II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino
4.18 Con respecto a los problemas 16 y 17, además de eliminar el factor día ahora elimine el factor lote
b) Después de la doble eliminación, señale el nombre del diseño, el modelo y la(s) hipótesis más adecuada(s) al
problema.
El diseño más apropiado es un Diseño Experimental completamente aleatorizado unifactorial.
Donde el modelo estadística Yij =µ+ + donde Yij es la respuesta, µ media global, efecto del tratamiento
y error
Ho= µ1 = µ2 = µ3…Es decir que no hay diferencias entre el tiempo promedio de cada catalizador en la reacción
H1 = µi ≠ µj
d) Compare el cuadro medio del error obtenido con los de los problemas 16 y 17. ¿Qué observa? ¿Cómo lo explica?
Con los factores de bloque y factor tratamiento:
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:dia 12,24 4 3,06 0,98 0,4550
B:Lote 15,44 4 3,86 1,23 0,3476
C:Catalizador 141,44 4 35,36 11,31 0,0005
RESIDUOS 37,52 12 3,12667
TOTAL (CORREGIDO) 206,64 24
e) ¿Por qué se obtienen las mismas conclusiones en los tratamientos de este problema y de los dos anteriores?
Se obtiene la misma conclusión de que los tratamientos (catalizadores) si afectan la variable respuesta ya que como los
factores de bloque no tienen un efecto estadísticamente significativo, al eliminarlos del análisis, solo se hace que el
efecto del tratamiento se haga más significativo, pero que la conclusión de que los catalizadores si tienen efecto no
cambie.
f) ¿Cree que esta eliminación hubiese afectado si los factores de bloque hubieran sido significativos?
Si, ya que al eliminar los efectos de los bloques siendo estos significativos pueden afectarse los resultados en la
experimentación, pues los experimentos se realizarían sin bloquear y así se afectaría la variable respuesta y el error
tendría una mayor significancia.
5.19. Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la
extrusión en la fabricación de botellas de polietileno de alta densidad. Los factores investigados son: molde (con dos
niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:
c) Dibuje las gráficas de medias para los dos efectos principales con los métodos LSD y de Tukey. Compare los resultados
de ambos métodos.
Medias y 95,0% de Tukey HSD
Medias y 95,0% de Tukey HSD
94
93
93
92
92
91
91
Y
Y
90 90
89 89
88
88
-1 0 1
-1 1 Catalizador.
Molde
Medias y 95,0% de Fisher LSD
93 Medias y 95,0% de Fisher LSD
94
92
93
91
92
Y
90 91
Y
89 90
89
88
-1 1
Molde 88
-1 0 1
Catalizador.
Las gráficas de medias para cada uno de los factores son las
mismas cuando se realizan con el método LSD o con el de Tukey, ya que con ambos métodos se está graficando los
intervalos de confianza para cada factor en su respectivo nivel y se indica la media o promedio de los datos, que sin
importar el método usado es el mismo.
d) Haga la gráfica de interacción con intervalos de confianza sobrepuestos
Interacciones y 95,0% Intervalos de Confianza
96 Catalizador.
-1
0
94 1
92
Y
90
88
86
-1 1
Molde
Como se muestra en la gráfica de interacción, al cambiar el nivel de molde de -1 a 1 no hay cambios significativos en la
respuesta, sobre todo cuando el catalizador está en el nivel medio (0). Como las rectas son prácticamente paralelas se
comprueba lo que se concluyó en la tabla ANOVA y es que no hay interacción.
e) Determine cuál es el mejor tratamiento. ¿Cuál es el hinchamiento predicho en el mejor tratamiento
Para determinar el mejor tratamiento, ya que no hay efecto de interacción puede verse las gráficas de medias o
utilizarse la tabla de medias, como se busca que el hinchamiento del catalizador sea el menor la mejor opción es usar el
molde A2 (nivel1) o si se tiene en cuenta la interacción, aunque no se encontró un efecto estadísticamente significativo
para la interacción el mejor tratamiento sería el molde en el nivel 1 con el catalizador en el nivel 0 ya que el
hinchamiento seria de 88,7
Tabla de Medias por Mínimos Cuadrados para Y con intervalos de confianza del 95,0%
Error Límite Límite
Nivel Casos Media Est. Inferior Superior
MEDIA GLOBAL 60 90,8333
Molde
-1 30 92,5667 0,232538 92,1005 93,0329
1 30 89,1 0,232538 88,6338 89,5662
Catalizador.
-1 20 89,35 0,2848 88,779 89,921
0 20 90,1 0,2848 89,529 90,671
1 20 93,05 0,2848 92,479 93,621
Molde por Catalizador.
-1,-1 10 91,3 0,402768 90,4925 92,1075
-1,0 10 91,5 0,402768 90,6925 92,3075
-1,1 10 94,9 0,402768 94,0925 95,7075
1,-1 10 87,4 0,402768 86,5925 88,2075
1,0 10 88,7 0,402768 87,8925 89,5075
1,1 10 91,2 0,402768 90,3925 92,0075
99
95
80
porcentaje
50
20
0,1
-2,2 -0,2 1,8 3,8 5,8
RESIDUOS
Los datos se ajustan a una distribución normal, pues como se observa en el gráfico de residuos la mayoría de los datos
no se ajustan a la recta.
Para verificar el supuesto de varianza constante se realizó el gráfico de residuos vs predichos y en general los datos
están igualmente dispersos, por lo que se asume que hay homoscedasticidad.
Gráfico de Residuos para Y
Gráfico de Residuos para Y
6 6
4 4
2
2
residuos
residuos
0
0
-2
-2
-4
-4
-6
-1 0 1
-6 Catalizador.
87 89 91 93 95 97
predichos
g) Utilice la gráfica de residuos contra factores para detectar posibles efectos sobre la dispersión del hinchamiento. ¿En
cuál molde parece que es menor la dispersión?
Gráfico de Residuos para Y
6
2
residuos
-2
-4
-6
-1 1
Molde
Al observar las gráficas de los residuos vs molde y residuos vs catalizador se observan unos datos anormales, es decir,
que son muy diferentes en comparación con la mayoría y estos hacen que se afecte la dispersión en la respuesta. Como
en el factor molde en el nivel más alto está el dato anormal, existe una menor dispersión en el hinchamiento con el
molde A1, que corresponde al nivel bajo.
5.26. Los siguientes datos corresponden a diseño 3 × 3 con tres réplicas. Interesa investigar el efecto de ambos factores
sobre Y, para encontrar las condiciones adecuadas para maximizar.
porcentaje
dentro del rango esperado para datos provenientes una 50
distribución normal 20
0,1
-11 -7 -3 1 5 9 13
RESIDUOS
Para verificar la homoscedasticidad se realizó la gráfica de Gráfico de Residuos para Y.
residuos vs predichos y se concluye que los datos tienen
igualdad de varianzas ya que cubre la franja horizontal. 12
0
12
-4
8
-8
4
residuos
-12
0
0 20 40 60 80 100
predichos
-4
Por último, se hizó la gráfica de residuos vs número de
-8 filas con el fin de verificar el supuesto de independencia y
-12 como se observa si hay independencia.
0 5 10 15 20 25 30
número de fila
5.28. Se cree que la adhesividad de un pegamento depende de la presión y de la temperatura al ser aplicado. Se realiza
un experimento factorial con ambos factores fijos.
a) Formule las hipótesis y el modelo estadístico que se desea probar.
Al tratarse de un diseño con 2 factores el modelo estadístico más apropiado 𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗+(𝛼𝛽)𝑖𝑗+𝜀𝑖𝑗𝑘
Con un diseño 4x3 y las hipótesis:
Efecto de Presión (α) = 0
Ho: Efecto de temperatura (β) = 0
Para la interacción Ho: presión x temperatura (αβ) = 0
Debido a que la suma de cuadrados del error es igual a cero, no pudo encontrarse el valor-p pues la división para hacer el cálculo de la razón F no
puede realizarse. Esto ocurre porque se están considerando los factores fijos, para poder hallar los valores-p y hacer comprobar las hipótesis se
deberían considerar los factores como aleatorio.
c) ¿Se puede analizar si hay interacción entre los dos factores controlados? No es posible encontrar la interacción entre
estos dos factores, pues la división para razón F de AB no es posible.
Libro de Montgomery
5.11
Se realizó un análisis de varianza con dos factores y no se consideró la interacción. Como los valores-p encontrados para
los dos factores son menores a 0,05, con 95% de confianza se rechazan las Ho para los efectos principales y se dice que
la posición y la temperatura si tienen efecto sobre el espesor de endurecimiento del ánodo de carbono.
Se rechazaron las hipótesis nulas para los efectos principales de un diseño 2x3 y con un modelo estadístico
𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗 +𝜀𝑖𝑗𝑘 , en donde a diferencia de los otros modelos factoriales no se está considerando la interacción
entre los factores
Ho: Efecto de posición(α) = 0 H1: Efecto posición (α) ≠ 0
Ho: Efecto de Temperatura (β) = 0 H1: Efecto de la temperatura (β) ≠ 0
12.2 Un fabricante sospecha que los lotes de materia prima difieren de manera significativa en el contenido de calcio.
Se seleccionaron al azar 5 lotes para hacer el estudio.
Pero como se observa en este caso, el factor que más contribuye a la varianza es ERROR. Su contribución representa
51,6619% de la variación total en el contenido de Calcio, mientras que el factor lote solo contribuye a la variación en
48,34%, al estimar estos componentes de la varianza puede concluirse que el diseño planteado para este caso no es el
más adecuado porque el error explica con más del 50% la variación en el contenido de Calcio
99,9
99
95
80
porcentaje
50
20
0,1
-0,08 -0,04 0 0,04 0,08 0,12
RESIDUOS
Homoscedasticidad, se verifica con gráfica de residuos vs predichos y como se observa que los datos están igualmente
dispersos, que dice que si hay igualdad de varianzas
Gráfico de Residuos para Calcio
0,12
0,08
0,04
residuos
-0,04
-0,08
-0,12
1 2 3 4 5
C.Lote
12.9 Se hizo un experimento para investigar la capacidad de un sistema de medición, se escogieron al azar 10 piezas y 2
operadores midiendo 3 veces cada pieza
12.12 Suponga que en el problema 5.11 la posición del horno es de tipo aleatorio.
Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
C.Temperatura 945342, 2 472671, 1155,52 0,0009
Posición 7160,06 1 7160,06 17,50 0,0527
C.Temperatura*Posición 818,111 2 409,056 0,91 0,4271
Residuo 5370,67 12 447,556
Total (corregido) 958691, 17
Cuando se considera que la posición en el horno es un factor de tipo aleatorio, este pierde significancia y como se
observa en la tabla ANOVA el factor posición ya no tendría efecto sobre la variable respuesta pues su valor-p es mayor a
0,05 y por tanto se acepta la Ho donde la variación de la posición no afecta los datos. Como tampoco hay efecto de
interacción, solo el efecto fijo que es temperatura, estaría teniendo efecto sobre el espesor(variable respuesta)
A pesar que la posición de acuerdo a la tabla ANOVA no tiene efecto sobre la respuesta, este factor es de tipo aleatorio y
las componentes de la varianza están dadas así:
Componentes de Varianza
Fuente Estimado
Posición 750,111
C.Temperatura*Posición -12,8333
Residuo 447,556
Posición 99,2064%