Sunteți pe pagina 1din 14

Universidad de Nariño

Taller Diseño de experimentos- Diseños Factoriales


Lina María Jojoa Chamorro
Libro de Gutiérrez

4.4 A continuación se muestra parte del ANOVA para un diseño en bloques, que tiene tres tratamientos y cinco bloques
con una sola repetición por tratamiento-bloque
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.
Fuente de variación s. de cuadrados G. libertad C. medio Razón F Valor-p
Tratamiento 600 2 300 4,8 0,00748315
Bloque 850 4 212,5 3,4 0,0662071
Error 500 8 62,5
Total 1950 14

b) Interprete en forma práctica, para cada caso, lo que está estimando el cuadrado medio.
El cuadrado medio ayuda a estimar la variación entre las medias de las muestras (tratamiento y bloques) y se utiliza
para estimar los factores más significativos, pues mientras mayor sea el cuadrado medio de un factor más significativo
es el efecto de dicho factor.
c) Escriba el modelo estadístico y las hipótesis pertinentes.
Se trata de un diseño con un solo factor y bloques, de tal manera las hipótesis son:
Factor =Ho = µ1= µ2= µ3
Bloque Ho=γ1= γ2 = γ3 = γ4 = γ5
Modelo estadístico Yij = µ + + +
Donde Yij es la respuesta que corresponde al tratamiento i al bloque j, µ es la media global; es el efecto debido al
tratamiento i, es el efecto del bloque y corresponde al error.

d) Apóyese en las tablas de la distribución F para aceptar o rechazar las hipótesis.


* Factor: De acuerdo a la tabla se obtiene con 2 grados de libertad para el numerador y 8 para el denominador un
valor F=4,46. Como F calculado es de 4,8 y 4,8> 4,46 se rechaza la Ho para el factor.
* Bloque: con 4 grados de libertad para numerador y 8 para denominador F=3,84. Como F calculado es 3,4 y 3,4<3,84 se
acepta la Ho para bloque.
e) Con apoyo de un software obtenga el valor-p para cada caso. Interprete sus resultados.
Los resultados están de acuerdo a lo mencionado en punto anterior, para el factor se rechaza la Ho porque valor-p
0,0075 es menor a 0,05, es decir el factor si tiene efecto sobre la variable repuesta y el bloque no tiene efecto sobre la
respuesta porque el valor-p 0,066 es mayor a 0,05 y por lo tanto se acepta la Ho para bloque. Así se puede decir que el
bloque no debe tenerse en cuenta en futuros experimentos sobre esta misma respuesta, porque no influye
significativamente.

4.5 Realice el problema anterior, pero ahora suponga que no se bloqueó. ¿Se hubiesen obtenido las mismas
conclusiones?
Como el bloque no tiene efecto, los resultados al no bloquear serían muy similares a los anteriores, ya que el factor
seguiría teniendo efecto sobre la variable respuesta y este efecto sería aún más significativo.

4.9 A continuación se muestran los datos para un diseño en bloques al azar.


a) Complete las sumas totales que se piden en la tabla anterior.
tratamiento Bloque Yi.
1 2 3 4
A 3 4 2 6 15
B 7 9 3 10 29
C 4 6 3 7 20
Y.j = 14 19 8 23 Y..=64
b) Calcule las sumas de cuadrados correspondientes: SCTRAT, SCB, SCT y SCE.
SCTRAT= 25,1667
SCB=42,0
SCT= 72,6667 y SCE=5,5.

c) Obtenga la tabla de análisis de varianza y anote las principales conclusiones.


Análisis de Varianza para Y - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:Tratamiento 25,1667 2 12,5833 13,73 0,0058
B:bloque 42,0 3 14,0 15,27 0,0032
RESIDUOS 5,5 6 0,916667
TOTAL (CORREGIDO) 72,6667 11

Puesto que los dos valores-p son menores que 0,005 se rechazan las Ho tanto para el tratamiento como para el bloque y
se dice que 95% de confianza que el factor tratamiento influye en la variable respuesta y que también el factor de
bloque tiene influencia sobre la variable de respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta
d) Obtenga la diferencia mínima significativa (LSD) para comparar tratamientos en este diseño en bloques.
Pruebas de Múltiple Rangos para Y por Tratamiento
Método: 95,0 porcentaje LSD
Tratamiento Casos Media LS Sigma LS Grupos Homogéneos
1 4 3,75 0,478714 X
3 4 5,0 0,478714 X
2 4 7,25 0,478714 X

Contraste Sig. Diferencia +/- Límites


1-2 * -3,5 1,65657
1-3 -1,25 1,65657
2-3 * 2,25 1,65657
Se aplicó la prueba de rangos múltiples LSD y con un 95% de confianza se dice que no existe diferencia estadísticamente
significativa entre el tratamiento 1 y 3, pero si entre los tratamientos 1 y 2 y 2 y 3.

4.10 Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto
se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron
seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta
fuente de variación. Los datos obtenidos se muestran a continuación:

a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.


Si se asume un diseño de bloques completamente aleatorizado el modelo estadístico que se usa:
Yij = µ + + + donde µ es la media, el efecto del factor(marca del atomizador), es el efecto del bloque (día) y
error aleatorio.
Las hipótesis para el factor: Ho = µ1= µ2= µ3 es decir que no existe diferencia entre las medias de las marcas de
atomizador.
Bloque: Ho=γ1= γ2 = γ3 = γ4 = γ5 = γ6 así la hipótesis nula es que el día no influye en la respuesta.

b) ¿Existe diferencia entre la efectividad promedio de los atomizadores?


Con ayuda del programa Statgraphics se aplica la prueba ANOVA
Análisis de Varianza para porcentaje - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:Marca. 296,333 2 148,167 2,88 0,1028
B:Dia 281,333 5 56,2667 1,09 0,4207
RESIDUOS 514,333 10 51,4333
TOTAL (CORREGIDO) 1092,0 17
Teniendo en cuenta la tabla ANOVA se puede decir con 95% de confianza que no existe diferencia entre la efectividad
promedio de los atomizadores, pues el valor-p para la marca de atomizador es mayor a 0,05 por tanto se acepta la
hipótesis nula. Esto también ocurre con el efecto del bloque, así se dice con 95% de confianza que el bloque no tiene
efecto sobre la efectividad del atomizador.

c) ¿Hay algún atomizador mejor?


No, ya que de acuerdo a la prueba ANOVA no se encontró diferencia entre las efectividades promedio de los 3
atomizadores, pero de acuerdo a la gráfica de medias el atomizador de la marca 1 podría ser mejor que los otros, pues
éste mata un mayor porcentaje de moscas; aunque estadísticamente no existe diferencia significativa entre los 3
atomizadores
Medias y 95,0% de Fisher LSD

74

70
porcentaje

66

62

58

54
1 2 3
Marca.

d) ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento?
No, ya que de acuerdo al análisis de varianza ANOVA el bloque (día) no tiene efecto sobre el porcentaje de moscas que
matan cada marca de atomizador, así como el valor-p obtenido es de 0,42017 y es mayor a 0,05 se acepta la Ho para el
bloque y se dice con 95% de confianza que el día no influye en los resultados obtenidos.

e) Verifique los supuestos de normalidad y de igual varianza entre las marcas.


Para verificar la igualdad de varianzas se usó la gráfica de residuos vs predichos donde se observa que los datos están
casi que igualmente dispersos, por tanto, se asume que se cumple el supuesto de homoscedasticidad.
Gráfico de Residuos para porcentaje

10

6
residuos

-2

-6

-10
50 55 60 65 70 75
predichos
Para verificar la normalidad se aplicó la prueba de Shapiro-Wilk para los datos de cada marca. Donde la Ho= los datos
provienen de una distribución normal.
Como se observa para cada marca los valores-p encontrados son mayores a 0,05, así que con un 95% de confianza se
acepta la hipótesis nula y se dice que los datos provienen de una distribución normal.
Pruebas de Normalidad para Porcentaje con marca 1
Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,937992 0,660323

Pruebas de Normalidad para porcentaje con marca 2


Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,906395 0,396615

Pruebas de Normalidad para porcentaje con marca 3


Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0,994682 0,997466

4.19. Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I,
II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino

a) ¿Hay diferencias entre los proveedores?


Se realizó un análisis de varianza ANOVA y se obtuvo la siguiente gráfica
Análisis de Varianza para Peso - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:proveedor. 10,8889 2 5,44444 49,00 0,0200
B:Escala 32,8889 2 16,4444 148,00 0,0067
C:Inspector 0,222222 2 0,111111 1,00 0,5000
RESIDUOS 0,222222 2 0,111111
TOTAL (CORREGIDO) 44,2222 8
Como el valor-p encontrado para el factor proveedor es menor a 0,05 se rechaza la hipótesis nula y con 95% de
confianza se dice que el proveedor si afecta la variable respuesta que es el peso del material, es decir si hay diferencias
ente los proveedores.

b) ¿Hay diferencias entre los inspectores y entre las escalas?


Como se observa en la tabla ANOVA, para la escala si hay diferencias pues el valor-p es menor a 0,05 y por tanto se
rechaza la hipótesis nula, es decir, el factor escala (bloque) si influye en la variable respuesta y se debe tener en cuenta
para los experimentos realizados.
Mientras que el inspector no presenta diferencias, se acepta la Ho y con 95% de confianza se dice que el inspector no
afecta la respuesta y no se debe tener en cuenta en posteriores experimentos con la misma variable respuesta.

c) Si el peso debe ser 15 g, ¿cuál proveedor es mejor?


Para saber cuál es el mejor proveedor, se realizó la tabla de medias y como se indica el proveedor A tiene su intervalo de
confianza más cercano al peso de 15g, así el proveedor A sería el mejor.
Tabla de Medias por Mínimos Cuadrados para Peso con intervalos de confianza del 95,0%
Error Límite Límite
Nivel Casos Media Est. Inferior Superior
MEDIA GLOBAL 9 12,4444
proveedor.
A 3 13,6667 0,19245 12,8386 14,4947
B 3 12,6667 0,19245 11,8386 13,4947
c 3 11,0 0,19245 10,172 11,828
Escla
1 3 14,6667 0,19245 13,8386 15,4947
2 3 10,0 0,19245 9,17195 10,828
3 3 12,6667 0,19245 11,8386 13,4947
Inspector
I 3 12,3333 0,19245 11,5053 13,1614
II 3 12,6667 0,19245 11,8386 13,4947
III 3 12,3333 0,19245 11,5053 13,1614

d ) Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado.


Como el factor de bloqueo inspector no afecta de manera significativa la variable respuesta se elimina y se realizó
nuevamente el análisis de varianza.
Análisis de Varianza para Peso - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:proveedor. 10,8889 2 5,44444 49,00 0,0015
B:Escla 32,8889 2 16,4444 148,00 0,0002
RESIDUOS 0,444444 4 0,111111
TOTAL (CORREGIDO) 44,2222 8
De esta manera el factor proveedor y el bloque(escala) siguen tiendo efecto sobre la variable respuesta, pero tienen
valores-p menores a los encontrados anteriormente, es decir al eliminar un factor de bloque que no es significativo se
hace que los factores que si afectan las respuestas se hagan aún más significativos.

4.18 Con respecto a los problemas 16 y 17, además de eliminar el factor día ahora elimine el factor lote

a) ¿Se justifica esta segunda eliminación en ambos problemas?


Si se justifica el haber eliminado los factores de bloques (día y lote) pues como se muestra en la tabla ANOVA, estos no
influyen en la variable respuesta ya que los valor-p son mayores a 0,05, por lo tanto, con 95 % de confianza se acepta la
Ho y se dice que el día y el lote no tienen efecto estadísticamente significativo.
Análisis de Varianza para tiempo - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:dia 12,24 4 3,06 0,98 0,4550
B:Lote 15,44 4 3,86 1,23 0,3476
C:Catalizador 141,44 4 35,36 11,31 0,0005
RESIDUOS 37,52 12 3,12667
TOTAL (CORREGIDO) 206,64 24
Todas las razones-F se basan en el cuadrado medio del error residual

b) Después de la doble eliminación, señale el nombre del diseño, el modelo y la(s) hipótesis más adecuada(s) al
problema.
El diseño más apropiado es un Diseño Experimental completamente aleatorizado unifactorial.
Donde el modelo estadística Yij =µ+ + donde Yij es la respuesta, µ media global, efecto del tratamiento
y error
Ho= µ1 = µ2 = µ3…Es decir que no hay diferencias entre el tiempo promedio de cada catalizador en la reacción
H1 = µi ≠ µj

c) Pruebe las hipótesis y obtenga conclusiones


para comprobar las hipótesis se realiza un análisis de varianza ANOVA y ya que el valor-p es menor a 0,05, con 95 % de
confianza se rechaza la Ho, es decir que si existe diferencias estadísticamente significativas entre los 5 catalizadores
Tabla ANOVA para tiempo por Catalizador
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Entre grupos 141,44 4 35,36 10,85 0,0001
Intra grupos 65,2 20 3,26
Total (Corr.) 206,64 24

d) Compare el cuadro medio del error obtenido con los de los problemas 16 y 17. ¿Qué observa? ¿Cómo lo explica?
Con los factores de bloque y factor tratamiento:
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:dia 12,24 4 3,06 0,98 0,4550
B:Lote 15,44 4 3,86 1,23 0,3476
C:Catalizador 141,44 4 35,36 11,31 0,0005
RESIDUOS 37,52 12 3,12667
TOTAL (CORREGIDO) 206,64 24

Eliminando el factor bloque día:


Análisis de Varianza para tiempo - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:Lote 15,44 4 3,86 1,24 0,3331
B:Catalizador 141,44 4 35,36 11,37 0,0001
RESIDUOS 49,76 16 3,11
TOTAL (CORREGIDO) 206,64 24
Lo que se observa en este caso es que el cuadrado medio del error disminuye al eliminar un factor de bloque que no
influye en la variable respuesta y de esta manera el efecto de los factores que si afectan se hace más significativo.

e) ¿Por qué se obtienen las mismas conclusiones en los tratamientos de este problema y de los dos anteriores?
Se obtiene la misma conclusión de que los tratamientos (catalizadores) si afectan la variable respuesta ya que como los
factores de bloque no tienen un efecto estadísticamente significativo, al eliminarlos del análisis, solo se hace que el
efecto del tratamiento se haga más significativo, pero que la conclusión de que los catalizadores si tienen efecto no
cambie.

f) ¿Cree que esta eliminación hubiese afectado si los factores de bloque hubieran sido significativos?
Si, ya que al eliminar los efectos de los bloques siendo estos significativos pueden afectarse los resultados en la
experimentación, pues los experimentos se realizarían sin bloquear y así se afectaría la variable respuesta y el error
tendría una mayor significancia.

5.19. Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la
extrusión en la fabricación de botellas de polietileno de alta densidad. Los factores investigados son: molde (con dos
niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:

a) Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.


El modelo estadístico para un diseño factorial con 2 factores: 𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗+(𝛼𝛽)𝑖𝑗+𝜀𝑖𝑗𝑘, donde: μ media general,
𝛼𝑖 efecto debido al i-ésimo nivel del factor A, 𝛽j efecto del j-ésimo nivel del factor B, (𝛼𝛽)𝑖𝑗 efecto de interacción en la
combinación y 𝜀𝑖𝑗𝑘 es el error aleatorio.
Las hipótesis para este problema son:
Para el factor A Ho: Efecto del molde (α) = 0 H1: Efecto del molde (α) ≠ 0
Para el factor B Ho: Efecto del catalizador (β) = 0 H1: Efecto del catalizador (β) ≠ 0
Para la interacción Ho: Molde x catalizador (αβ) = 0 H1 Molde x catalizador (α β) ≠ 0
b) Construya la tabla de análisis de varianza y determine cuáles efectos están activos.
De acuerdo al análisis de varianza realizado, los factores tienen efectos principales pues los valores-p encontrados son
menores a 0,05 y tambien se concluye que no hay efecto de interacción, pues el valor-p es mayor a 0,05; de esta manera
con 95% de confianza se dice que el molde y catalizador influyen en la variable respuesta pero no hay efecto de
interacción.
Análisis de Varianza para Y - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:Molde 180,267 1 180,267 111,12 0,0000
B:Catalizador. 153,033 2 76,5167 47,17 0,0000
INTERACCIONES
AB 3,43333 2 1,71667 1,06 0,3542
RESIDUOS 87,6 54 1,62222
TOTAL (CORREGIDO) 424,333 59
Todas las razones-F se basan en el cuadrado medio del error residual

c) Dibuje las gráficas de medias para los dos efectos principales con los métodos LSD y de Tukey. Compare los resultados
de ambos métodos.
Medias y 95,0% de Tukey HSD
Medias y 95,0% de Tukey HSD
94
93

93
92
92

91
91
Y
Y

90 90

89 89

88
88
-1 0 1
-1 1 Catalizador.
Molde
Medias y 95,0% de Fisher LSD
93 Medias y 95,0% de Fisher LSD
94
92
93

91
92
Y

90 91
Y

89 90

89
88
-1 1
Molde 88
-1 0 1
Catalizador.

Las gráficas de medias para cada uno de los factores son las
mismas cuando se realizan con el método LSD o con el de Tukey, ya que con ambos métodos se está graficando los
intervalos de confianza para cada factor en su respectivo nivel y se indica la media o promedio de los datos, que sin
importar el método usado es el mismo.
d) Haga la gráfica de interacción con intervalos de confianza sobrepuestos
Interacciones y 95,0% Intervalos de Confianza
96 Catalizador.
-1
0
94 1

92
Y

90

88

86
-1 1
Molde
Como se muestra en la gráfica de interacción, al cambiar el nivel de molde de -1 a 1 no hay cambios significativos en la
respuesta, sobre todo cuando el catalizador está en el nivel medio (0). Como las rectas son prácticamente paralelas se
comprueba lo que se concluyó en la tabla ANOVA y es que no hay interacción.
e) Determine cuál es el mejor tratamiento. ¿Cuál es el hinchamiento predicho en el mejor tratamiento
Para determinar el mejor tratamiento, ya que no hay efecto de interacción puede verse las gráficas de medias o
utilizarse la tabla de medias, como se busca que el hinchamiento del catalizador sea el menor la mejor opción es usar el
molde A2 (nivel1) o si se tiene en cuenta la interacción, aunque no se encontró un efecto estadísticamente significativo
para la interacción el mejor tratamiento sería el molde en el nivel 1 con el catalizador en el nivel 0 ya que el
hinchamiento seria de 88,7
Tabla de Medias por Mínimos Cuadrados para Y con intervalos de confianza del 95,0%
Error Límite Límite
Nivel Casos Media Est. Inferior Superior
MEDIA GLOBAL 60 90,8333
Molde
-1 30 92,5667 0,232538 92,1005 93,0329
1 30 89,1 0,232538 88,6338 89,5662
Catalizador.
-1 20 89,35 0,2848 88,779 89,921
0 20 90,1 0,2848 89,529 90,671
1 20 93,05 0,2848 92,479 93,621
Molde por Catalizador.
-1,-1 10 91,3 0,402768 90,4925 92,1075
-1,0 10 91,5 0,402768 90,6925 92,3075
-1,1 10 94,9 0,402768 94,0925 95,7075
1,-1 10 87,4 0,402768 86,5925 88,2075
1,0 10 88,7 0,402768 87,8925 89,5075
1,1 10 91,2 0,402768 90,3925 92,0075

f) Verifique los supuestos de normalidad y varianza constante.


Para verificar el supuesto de normalidad se realizó la siguiente gráfica
Gráfico de Probabilidad Normal
99,9

99

95

80
porcentaje

50

20

0,1
-2,2 -0,2 1,8 3,8 5,8
RESIDUOS

Los datos se ajustan a una distribución normal, pues como se observa en el gráfico de residuos la mayoría de los datos
no se ajustan a la recta.
Para verificar el supuesto de varianza constante se realizó el gráfico de residuos vs predichos y en general los datos
están igualmente dispersos, por lo que se asume que hay homoscedasticidad.
Gráfico de Residuos para Y
Gráfico de Residuos para Y
6 6

4 4

2
2

residuos
residuos

0
0
-2
-2
-4
-4
-6
-1 0 1
-6 Catalizador.
87 89 91 93 95 97
predichos

g) Utilice la gráfica de residuos contra factores para detectar posibles efectos sobre la dispersión del hinchamiento. ¿En
cuál molde parece que es menor la dispersión?
Gráfico de Residuos para Y
6

2
residuos

-2

-4

-6
-1 1
Molde

Al observar las gráficas de los residuos vs molde y residuos vs catalizador se observan unos datos anormales, es decir,
que son muy diferentes en comparación con la mayoría y estos hacen que se afecte la dispersión en la respuesta. Como
en el factor molde en el nivel más alto está el dato anormal, existe una menor dispersión en el hinchamiento con el
molde A1, que corresponde al nivel bajo.

5.26. Los siguientes datos corresponden a diseño 3 × 3 con tres réplicas. Interesa investigar el efecto de ambos factores
sobre Y, para encontrar las condiciones adecuadas para maximizar.

a) Especifique el modelo estadístico para el problema y las hipótesis pertinentes


El modelo estadístico para un diseño factorial con 2 factores: 𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗+(𝛼𝛽)𝑖𝑗+𝜀𝑖𝑗𝑘, donde: μ media general,
𝛼𝑖 efecto debido al i-ésimo nivel del factor A, 𝛽j efecto del j-ésimo nivel del factor B, (𝛼𝛽)𝑖𝑗 efecto de interacción en la
combinación y 𝜀𝑖𝑗𝑘 es el error aleatorio.
Las hipótesis para este problema son:
Para el factor A Ho: Efecto de A (α) = 0 H1: Efecto A(α) ≠ 0
Para el factor B Ho: Efecto de B (β) = 0 H1: Efecto de B (β) ≠ 0
Para la interacción Ho: A x B (αβ) = 0 H1: A x B (α β) ≠ 0

b) Haga un análisis de varianza y obtenga conclusiones.


Análisis de Varianza para Y. - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:A 21492,1 2 10746,0 271,67 0,0000
B:B 230,296 2 115,148 2,91 0,0803
INTERACCIONES
AB 227,259 4 56,8148 1,44 0,2626
RESIDUOS 712,0 18 39,5556
TOTAL (CORREGIDO) 22661,6 26
Como se observa en la tabla ANOVA, el factor B no tiene efecto sobre la variable respuesta, pues su valor-p es mayor a
0,05 y tampoco hay efecto de interacción. Así el diseño más adecuado es un diseño completamente aleatorizado
unifactorial, pues el factor A si tiene efecto sobre la variable respuesta y con 95% de confianza se rechaza la Ho ya que el
valor-p es menor a 0,05.

c) Interprete con detalle el efecto de interacción.


El efecto de interacción de acuerdo al análisis de varianza no es estadísticamente significativo, el valor-p encontrado es
mayor a 0,05 y así se rechaza la Ho. De esta manera como el factor B no tiene efecto principal ni tampoco un efecto de
interacción con el factor A se puede eliminar del diseño.

d) Verifique supuestos. Gráfico de Probabilidad Normal


99,9
Para verificar la normalidad se hace la gráfica de residuos
99
y aunque hay algunos datos que no se ajustan a la recta,
95
En este caso, el valor del sesgo estandarizado se encuentra 80

porcentaje
dentro del rango esperado para datos provenientes una 50
distribución normal 20

0,1
-11 -7 -3 1 5 9 13
RESIDUOS
Para verificar la homoscedasticidad se realizó la gráfica de Gráfico de Residuos para Y.
residuos vs predichos y se concluye que los datos tienen
igualdad de varianzas ya que cubre la franja horizontal. 12

Gráfico de Residuos para Y. 4


residuos

0
12

-4
8

-8
4
residuos

-12
0
0 20 40 60 80 100
predichos
-4
Por último, se hizó la gráfica de residuos vs número de
-8 filas con el fin de verificar el supuesto de independencia y
-12 como se observa si hay independencia.
0 5 10 15 20 25 30
número de fila

e) ¿Hay un tratamiento mejor? Argumente con pruebas estadísticas.


Se realizó la prueba de rangos múltiples usando el procedimiento de diferencia mínima significativa (LSD) de Fisher, y
como anteriormente se mencionó solo el factor A afecta la respuesta por tanto entre los niveles del factor A el mejor es
el nivel medio (0), es decir el tratamiento A2 es el mejor si se quiere maximizar el proceso.
Pruebas de Múltiple Rangos para Y. por A
A Casos Media LS Sigma LS Grupos Homogéneos
Contraste Sig. Diferencia +/- Límites Método: 95,0
-1 9 4,77778 2,09644 X
-1 - 0 * -68,2222 6,22886 porcentaje LSD
1 9 29,3333 2,09644 X
-1 - 1 * -24,5556 6,22886
0 9 73,0 2,09644 X
0-1 * 43,6667 6,22886

5.28. Se cree que la adhesividad de un pegamento depende de la presión y de la temperatura al ser aplicado. Se realiza
un experimento factorial con ambos factores fijos.
a) Formule las hipótesis y el modelo estadístico que se desea probar.
Al tratarse de un diseño con 2 factores el modelo estadístico más apropiado 𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗+(𝛼𝛽)𝑖𝑗+𝜀𝑖𝑗𝑘
Con un diseño 4x3 y las hipótesis:
Efecto de Presión (α) = 0
Ho: Efecto de temperatura (β) = 0
Para la interacción Ho: presión x temperatura (αβ) = 0

b) Analice los datos y obtenga las conclusiones apropiadas.


Análisis de Varianza para Y - Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:presión 0,580692 3 0,193564
B:temperatura 4,65765 2 2,32882
INTERACCIONES
AB 2,15388 6 0,358981
RESIDUOS 0 0
TOTAL (CORREGIDO) 7,39222 11

Debido a que la suma de cuadrados del error es igual a cero, no pudo encontrarse el valor-p pues la división para hacer el cálculo de la razón F no
puede realizarse. Esto ocurre porque se están considerando los factores fijos, para poder hallar los valores-p y hacer comprobar las hipótesis se
deberían considerar los factores como aleatorio.
c) ¿Se puede analizar si hay interacción entre los dos factores controlados? No es posible encontrar la interacción entre
estos dos factores, pues la división para razón F de AB no es posible.

Libro de Montgomery

5.11

Se realizó un análisis de varianza con dos factores y no se consideró la interacción. Como los valores-p encontrados para
los dos factores son menores a 0,05, con 95% de confianza se rechazan las Ho para los efectos principales y se dice que
la posición y la temperatura si tienen efecto sobre el espesor de endurecimiento del ánodo de carbono.
Se rechazaron las hipótesis nulas para los efectos principales de un diseño 2x3 y con un modelo estadístico
𝑌𝑖𝑗𝑘=𝜇+𝛼𝑖+𝛽𝑗 +𝜀𝑖𝑗𝑘 , en donde a diferencia de los otros modelos factoriales no se está considerando la interacción
entre los factores
Ho: Efecto de posición(α) = 0 H1: Efecto posición (α) ≠ 0
Ho: Efecto de Temperatura (β) = 0 H1: Efecto de la temperatura (β) ≠ 0

Análisis de Varianza para Espesor - Suma de Cuadrados Tipo III


Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
EFECTOS PRINCIPALES
A:C.Temperatura 945342, 2 472671, 1069,26 0,0000
B:Posición 7160,06 1 7160,06 16,20 0,0013
RESIDUOS 6188,78 14 442,056
TOTAL (CORREGIDO) 958691, 17
Todas las razones-F se basan en el cuadrado medio del error residual

12.2 Un fabricante sospecha que los lotes de materia prima difieren de manera significativa en el contenido de calcio.
Se seleccionaron al azar 5 lotes para hacer el estudio.

a) Hay diferencia en el contenido de calcio de un lote a otro.


Para saber si existe diferencia estadísticamente significativa se realizó el análisis de varianza y como se observa el factor
lote si tienen efecto sobre el contenido de calcio ya que su valor-p es menor a 0,05, así con 95 % de confianza se dice
que cada lote tiene diferente contenido promedio de calcio
Tabla ANOVA para Calcio por C.Lote
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Entre grupos 0,085856 4 0,021464 5,68 0,0032
Intra grupos 0,0756 20 0,00378
Total (Corr.) 0,161456 24

b) estimar componentes de la varianza.


Como solo se tiene en cuenta el factor lote, la varianza se descompone en el factor(lote) y el error.
Análisis de Componentes de Varianza
Variable dependiente: Calcio
Factores: Lote Número de casos completos: 25

Análisis de Varianza para Calcio


Fuente Suma de Cuadrados Gl Cuadrado Medio Comp. Var. Porciento
TOTAL (CORREGIDO) 0,161456 24
C.Lote 0,085856 4 0,021464 0,0035368 48,34
ERROR 0,0756 20 0,00378 0,00378 51,66

Pero como se observa en este caso, el factor que más contribuye a la varianza es ERROR. Su contribución representa
51,6619% de la variación total en el contenido de Calcio, mientras que el factor lote solo contribuye a la variación en
48,34%, al estimar estos componentes de la varianza puede concluirse que el diseño planteado para este caso no es el
más adecuado porque el error explica con más del 50% la variación en el contenido de Calcio

c) encuentre un intervalo de confianza del 95%


Tabla de Medias para Calcio por C.Lote con intervalos de confianza del 95,0%
Error Est.
C.Lote Casos Media (s agrupada) Límite Inferior Límite Superior
1 5 23,458 0,0274955 23,4174 23,4986
2 5 23,492 0,0274955 23,4514 23,5326
3 5 23,524 0,0274955 23,4834 23,5646
4 5 23,4 0,0274955 23,3594 23,4406
5 5 23,364 0,0274955 23,3234 23,4046
Total 25 23,4476
Usando la tabla de medias se dan los intervalos con 95% de confianza.

d) Analizar los residuales


el análisis de los residuos se hace con el fin de verificar los supuestos:
Normalidad se verifica con gráfica de residuos y como se muestra hay algunos datos que no se ajustan a la recta de
probabilidad normal, pero en general la mayoría de los datos si se ajustan a la recta por lo que se dice en este caso, el
valor del sesgo estandarizado se encuentra dentro del rango esperado para datos provenientes una distribución normal
y el valor de curtosis estandarizada se encuentra dentro del rango esperado para datos provenientes de una distribución
normal.
Gráfico de Probabilidad Normal

99,9

99

95

80
porcentaje

50

20

0,1
-0,08 -0,04 0 0,04 0,08 0,12
RESIDUOS
Homoscedasticidad, se verifica con gráfica de residuos vs predichos y como se observa que los datos están igualmente
dispersos, que dice que si hay igualdad de varianzas
Gráfico de Residuos para Calcio

0,12

0,08

0,04
residuos

-0,04

-0,08

-0,12
1 2 3 4 5
C.Lote

12.9 Se hizo un experimento para investigar la capacidad de un sistema de medición, se escogieron al azar 10 piezas y 2
operadores midiendo 3 veces cada pieza

a) analizar los datos.


Al realizar el analisis de varianza se concluye que el factor que tiene efecto sobre la variable respuesta es la pieza, ya que
su valor-p es menor a 0,05 y por ende se rechaza la hipotesisi nula.
El factor operador y la interaccion no tienen efecto sobre la respuesta, por tanto lo mejor sería eliminarlos del diseño.
Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Pieza 99,0167 9 11,0019 18,28 0,0001
Operador 0,416667 1 0,416667 0,69 0,4269
Pieza*Operador 5,41667 9 0,601852 0,40 0,9270
Residuo 60,0 40 1,5
Total (corregido) 164,85 59

b) Estimar componentes de la varianza.


Si se asume como un diseño factorial con dos factores, los componentes de la varianza serían
Componentes de Varianza
Fuente Estimado
Pieza 1,73333
Operador -0,00617284
Pieza*Operador -0,299383
Residuo 1,5
Es decir, el factor pieza contribuye con 46,3148% a la variación de los datos, mientras que el factor operador y la
interacción no contribuyen y el error explicaría la variación con un 53,6852%.
Pero como se sabe que el factor operador no tiene efecto y tampoco hay interacción, si se elimina del diseño y este se
trabaja como un diseño unifactorial las componentes de la varianza cambian y el factor pieza tendría mayor significancia
y explicaría la variación con 55%
Análisis de Componentes de Varianza
Variable dependiente: Col_11
Factores :Pieza Número de casos completos: 60
Análisis de Varianza para Col_11
Fuente Suma de Cuadrados Gl Cuadrado Medio Comp. Var. Porciento
TOTAL (CORREGIDO) 164,85 59
Pieza 99,0167 9 11,0019 1,6142 55,08
ERROR 65,8333 50 1,31667 1,31667 44,92

12.12 Suponga que en el problema 5.11 la posición del horno es de tipo aleatorio.
Suma de Cuadrados Tipo III
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
C.Temperatura 945342, 2 472671, 1155,52 0,0009
Posición 7160,06 1 7160,06 17,50 0,0527
C.Temperatura*Posición 818,111 2 409,056 0,91 0,4271
Residuo 5370,67 12 447,556
Total (corregido) 958691, 17
Cuando se considera que la posición en el horno es un factor de tipo aleatorio, este pierde significancia y como se
observa en la tabla ANOVA el factor posición ya no tendría efecto sobre la variable respuesta pues su valor-p es mayor a
0,05 y por tanto se acepta la Ho donde la variación de la posición no afecta los datos. Como tampoco hay efecto de
interacción, solo el efecto fijo que es temperatura, estaría teniendo efecto sobre el espesor(variable respuesta)
A pesar que la posición de acuerdo a la tabla ANOVA no tiene efecto sobre la respuesta, este factor es de tipo aleatorio y
las componentes de la varianza están dadas así:
Componentes de Varianza
Fuente Estimado
Posición 750,111
C.Temperatura*Posición -12,8333
Residuo 447,556
Posición 99,2064%

S-ar putea să vă placă și