Sunteți pe pagina 1din 15

Diseño de bloques completos al azar

Cuando se quieren comparar ciertos tratamientos o estudiar el factor, es deseable que las
posibles diferencias se deban principalmente al factor de interés y no a otros factores que
no se consideran en el estudio. Cuando esto no ocurre y existen otros factores que no se
controlan o nulifican para hacer la comparación, las conclusiones podrían ser afectadas
sensiblemente.
Para evitar el sesgo hay dos maneras de anular el posible efecto del factor operador: la
manera lógica es utilizar el mismo operador en las cuatro máquinas; sin embargo, tal
estrategia no siempre es aconsejable, ya que utilizar al mismo sujeto elimina el efecto del
factor operador, pero restringe la validez de la comparación con dicho operador, y es
posible que el resultado no se mantenga al utilizar otros operadores. La otra forma de
anular el efecto en la comparación consiste en que cada operador, y es posible que el
resultado no se mantenga al utilizar otros operadores. La otra forma de anular el efecto
operador en comparación consiste en que cada operador trabaje durante el experimento
con cada una de las maquinas. Esta estrategia es la más recomendable, ya que utilizar a
todo el operador con todas las maquinas permite tener resultados de la comparación que
son validos para todos los operadores. Esta última forma de nulificar el efecto de
operadores recibe el nombre de bloqueo.

Factores de bloque
A los factores adicionales al factor de interés que se incorporan de manera explicita en un
experimento comparativo se les llama Factores de bloque. Estos tienen la particularidad de
que no se incluyen en le experimento porque interese analizar su efecto, sino como un
medio para estudia de manera adecuada y eficaz al factor de interés.
Los factores de bloque entran al estudio en el nivel de importancia secundaria con respecto
al factor de interés y, en este sentido, se afirma que se estudia un solo factor, porque es
uno en el factor de interés.

En un diseño en bloques completos al azar (DBCA)


Se consideran tres fuentes de variabilidad:

 El factor de tratamientos
 El factor de bloque
 El error aleatorio
Ósea se tienen 3 posibles culpables de la variabilidad presente en los datos. La palabra
completo en el diseño se debe a que en cada bloque se prueban todos los tratamientos o
sea los bloques están completos. La aleatorización se hace dentro de cada bloque; es esta
la diferencia que tiene con el diseño completamente al azar. El hecho de que existan
bloques hace no sea practico o que incluso sea imposible de aleatorizar en su totalidad.

Modelo estadístico
Cuando se decide utilizar un DBCA, el experimentador piensa que cada medición será el
resultado del efecto del tratamiento donde se encuentre, del efecto del bloque al que
pertenece y de cierto error que se espera sea aleatorio. El modelo estadístico para este
diseño esta dado por:

Donde Yij es la medición que corresponden al tratamiento i y al bloque j; µ es la media


global poblacional; ԏi es el egecto debido al tratamiento i, Yj es el efecto debido al bloque
j, y Ɛij es el error aleatorio atribuible a la medición Yij. Se supone que los errores se
distribuyen de manera normal con media cero y varianza constante y que son
independientes entre sí.

Hipótesis para probar


La Hipótesis de interés es la misma para todos los diseños comparativos y está dada por:
Que también la podemos expresar como:

En cualquiera de estas Hipótesis la afirmación a probar es que la respuesta media


poblacional lograda con cada tratamiento es la misma para los K tratamientos y que, por lo
tanto, cada respuesta media µi es igual a la media global poblacional µ, es posible afirmar
que todos los efectos del tratamiento sobre la variable de respuesta son nulos, ya que la
respuesta media del tratamiento es igual a la media global, solo cuando se cumple este
efecto:

Análisis de varianza
La Hipótesis anteriormente dada se prueba con un análisis de varianza con dos criterios de
clasificación, porque se controlan dos fuentes de variación:

 El factor de tratamientos
 El factor de bloque
Los cálculos necesarios pueden se manuales, pero siempre es mas practico hacerlos con un
software estadístico, porque además proporciona muchas otras opciones gráficas y
tabulares útiles.

Las formulas de las sumas cuadradas son


Y la de error se obtiene por sustracción:

Ejemplo 4.1
Aquí haremos la comparación de 4 métodos de ensamble, donde vamos a controlar
activamente en el experimento a los operadores que realizaran el ensamble. para comparar
los cuatro métodos se plantea la Hipótesis:

La cual se prueba mediante el análisis de varianza aquí observamos

Por lo que se rechaza la Hipótesis nula de que el tiempo medio poblacional de los métodos
de ensamble son iguales, y se acepta que al menos dos de los métodos son diferentes en
cuanto al tiempo promedio que requieren. De la misma manera para operadores como su
valor P,

el factor de bloques (operadores) también afecta,


es decir, existen diferencias entre los operadores en cuanto al tiempo promedio. Sin
embargo, recordemos que no es objetivo del experimento comparar a los operadores y su
control en el estudio se utiliza para lograr una comparación más justa y precisa de los
métodos de ensamble. En otras palabras, mientras que los métodos de ensamble se
comparan con el objetivo final de elegir el más eficiente en términos de tiempo, con los
operadores no se trata de elegir uno; en todo caso quizá como información extra se pueda
tomar alguna decisión sobre los operadores, como por ejemplo dar mayor entrenamiento
a quien lo requiera por salirse en forma significativa del comportamiento del resto.

Cuando mediante un diseño de bloques se concluye que los tratamientos son diferentes, es
probable que no se haya llegado a esa conclusión, si no que se haya considerado el factor
bloque. En el ejemplo de la tabla de arriba no se considera el efecto de bloque(operador),
entonces la variabilidad y los grados de libertad atribuirles a operadores se irían al error, lo
cual puede modificar las conclusiones sobre los tratamientos (métodos).

Para calcular estas sumas es necesario obtener la media global y los totales por tratamiento
y por bloque como se ilustra:
Con estos totales las sumas de cuadrados se obtienen de esta forma:

Los grados de libertad de la SCͲ corresponden al número total de observaciones menos uno 8n-1 =
16 -1 =15), mientras que los de las SCͲrat y SCβ son el número de tratamiento menos uno y el número
de operadores menos uno respectivamente.

Comparación de parejas de media de tratamiento en el DBCA.

Cuando se rechaza la Hipótesis de igualdad de los cuatros tratamientos es natural preguntarte


cuales de ellos son diferentes entre sí, para averiguar esto se utiliza alguna de la pruebas que se
estudiaron en la sección “comparaciones o pruebas de rango múltiples” del capítulo anterior. La
diferencia mínima significativa esta dada en un bloque por:
Donde B es el numero de bloques, que hace las veces de numero de replicas.

Efecto de bloque
Como ya vimos en el ejemplo anterior la tabla ANOVA también proporciona una prueba para el
defecto de los bloques.

Que en caso de rechazarse se acepta que el efecto de un bloque es diferente de cero.

Esta no es una prueba de F exacta, sino aproximada, debido a la restricción de aleatorización (solo
se aleatoriza dentro del bloque). Sin embargo, en la práctica se recomienda su interpretación
porque es evidencia a favor en contra de que valió la pena el esfuerzo de controlar el factor de
bloque. Si resulta significativa implica que el factor de bloque tiene influencia sobre la variable de
respuesta, y debe ser tomado en cuenta para mejorar la calidad de esta. Pero si no se rechaza y se
acepta que los bloques son iguales en respuesta media, entonces se tiene que el argumento a favor
de no controlar este favor en futuros experimentos sobre esta misma respuesta, además de que su
influencia en la calidad de la respuesta no es significativa.

La restricción de aleatorización se debe al hecho de que no se aleatoriza el orden de las corridas


experimentales dentro de cada bloque, lo cual evita sesgos en la comparación de los tratamientos,
pero no los impide en la comparación de los bloques. De hecho, todas las corridas de un bloque
particular se pueden hacer de manera consecutiva, lo que puede causar sesgos a la hora de
comparar los bloques. Estos sesgos se deben a factores de ruido que actúan en el transcurso de las
corridas experimentales, como las variables ambientales. El error de restricción no es estimable
porque se confunde con el efecto de los bloques. Por lo general se apuesta que dicho error sea
pequeño, de aquí que se recomiende interpretar la prueba F para lo bloques dada en el ANOVA. Si
fuera de interés el estudio del factor bloque al mismo nivel del factor de tratamientos, entonces se
debería correr el experimento aleatorizando completamente el orden de todas las combinaciones
posibles entre bloques y tratamientos. Si ese fuera el caso y suponiendo que sea posible aleatorizar
por completo, el resultado seri k x b, que se presenta en el capitulo 5. Otro puesto del diseño de
bloques al azar es que no existe efecto de interacción entre el factor de bloque y el factor de
tratamientos. Cuando este supuesto no se cumple la variabilidad debida a la interacción se
incorpora como parte del error que. Al ser grande y artificial, enmascara el efecto de los
tratamientos. La existencia del efecto de interacción se puede evaluar obteniendo una suma de
cuadrados aproximada para dicho efecto en el ANOVA (se debe ver el siguiente capítulo)

Diseño en cuadro latino


En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se estudia un factor de
tratamientos, por lo que se tiene 4 fuentes de variabilidad que pueden afectar la respuesta
observada estas son: los tratamientos, el factor de bloque I(columnas), el factor de bloque II
(renglones) y error aleatorio. Se llama cuadro latino por dos razones: es un cuadro debido a que
tiene la restricción adicional de que los tres factores involucrados se prueban en la misma cantidad
de niveles, y es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles del
factor de interés. Sean A, B,C,D,…..K, los K tratamientos a comparar, por lo tanto ambos factores de
bloques tienen también k niveles cada uno.

Análisis del diseño


El modelo estadístico para describir el comportamiento de las observaciones esta dado por:

Tabla ANOVA para el cuadro latino

Donde Υijɭ es la observación del tratamiento i, en el nivel j del factor renglón y en el nivel ɭ del factor
columna; Ɛijɭ es el error atribuible a dicha observación. De acuerdo con este modelo de variabilidad
total presente en los datos se puede descomponer como

Y los grados de libertad correspondientes son

Selección y aleatorización del cuadro latino


No cualquier arreglo de letras latinas en forma de cuadro es un cuadro latino. La regla fundamental
es que cada letra debe aparecer solo una vez en cada renglón y en cada columna. Siempre es fácil
construir un cuadro latino estándar. En el que en la primera columna y en el primer renglón
aparecen las letras en orden alfabético. Por ejemplo:
Existen además los siguientes tres cuadros latinos estándar de dimensión cuatro

Para cuatro tratamientos se pueden construir un total de 576 cuadros latinos, de los cuales cuatro
son estándar. La selección del diseño debería ser elegido uno al azar de los 576 posible; no obstante,
es prácticamente imposible construir. todos para seleccionar uno al azar. Sin embargo, ocurre que,
dado un cuadro latino, cualquier intercambio de columnas o de renglones también es un cuadro
latino. Por eso la estrategia de selección y aleatorización recomendada es:

A. Se construye el cuadro latino estándar más sencillo


B. Se aleatoriza el orden de los renglones (o columnas) y después se aleatoriza el orden de las
columnas (o renglones).
C. Por último, los tratamientos a compara se asignan en forma aleatoria a las letras latinas.

El cuadro latino tiene dos restricciones a la aleatorización que se deben a los dos factores de bloque,
lo cual implica que a la hora de correr por columna o por renglón según convenga. Lo que no es
correcto es hacer todas las pruebas de un tratamiento, luego todas las del del otro y así
sucesivamente, puesto que se puede introducir ruido adicional debido a factores no controlables
que cambian con el tiempo.

Diseño en cuadro grecolatino


Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque, además del factor
tratamientos. Se llama cuadro grecolatino porque los cuatro cuadros involucrados a favor se
prueban en la misma cantidad de niveles, de aquí que pueda escribir como un cuadro, además se
utilizan las letras latinas para detonar los tratamiento y letras griegas para nombrar los niveles del
tercer factor de bloque. Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer
son la una vez en el renglón columna. Además, casa para de letras debe aparece solo una vez en
todo el arreglo.
El modelo estadístico que describe a las mediciones en un cuadro grecolatino esta dado por

Donde Υijɭm es la observación o respuesta que se encuentra en el tratamiento i(i-esima letra latina),
en el renglón j ,en la columna del factor ɭ y en la factor columna y en la m-esima; ԏi es el efecto del
tratamiento i,Υj es el efecto del renglón j,Ơɭ representa el efecto de la columna ɭ y Ƥm representa el
efecto de la m-esima letra griega, que son los niveles del tercer factor de bloque. La variabilidad
total presente en los datos se puede partir de manera usual como

Donde las sumas SCB1, SCB2 , SCB3 miden la variabilidad debida a los factores de bloque renglón,
columna y de letras griegas, respectivamente. Para k tratamiento los grados de libertad
correspondiste a cada suma son

ANOVA para el diseño en cuadro grecolatino


Glosario
1. Aleatorización: La aleatorización es una de las formas de evitar los sesgos de
selección; su propósito es posibilitar las comparaciones en los grupos de asignación
de los tratamientos.
2. Fuentes de variabilidad: son los factores que provocan la variabilidad en los datos.
3. Factores de bloque: son las variables adicionales al factor de interés que se incorporan de
manera explicita en un experimento comparativo para no sesgar la comparación.
4. Diseño de bloque: es un diseño frecuentemente utilizado para minimizar el efecto de
la variabilidad cuando se asocia con unidades discretas.
5. Bloque completo. En el DBCA se refiere a que en cada bloque se aprueban todos los
tratamientos.
6. Efecto de interacción: es cuando dos factores interactúan, es decir cuando el efecto de uno
depende del nivel del otro.
7. Cuadro latino estándar: que tiene en la primera columna y en el primer renglón en orden
alfabético.
8. Cuadro latino: Diseño en el que se controlan dos factores de bloque y uno de tratamientos;
los tres factores tienen la misma cantidad de niveles. Los tratamientos se representan por
letras latinas y se distribuyen en forma adecuada en un cuadro.
9. Cuadro grecolatino: Diseño en el que se controlan tres factores de bloques y un factor de
tratamiento; los cuatro factores utilizan la misma cantidad de niveles.
10. Erros aleatorio: se denomina error aleatorio a todo termino de desajuste, discrepancia o
impresión no deseada, cuyo valor es impredecible a priori pero sigue una distribución
estadística.

Problemas
1. En una empresa lechera se tienen varios silos para almacenar leche (cisternas de 60 000 L).
Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. Se
sospecha que en algunos silos hay problemas, por ello, durante cinco días se decide registrar
la temperatura a cierta hora crítica. Obviamente la temperatura de un día a otro es una
fuente de variabilidad que podría impactar la variabilidad total.

a) En este problema, ¿cuál es el factor de tratamiento y cuál el factor de bloque?


Factor de tratamiento: silo
Factor de bloqueo: día
b) Suponga un DBCA, formule las Hipótesis adecuadas y el modelo estadístico.
H0: la temperatura media de cada día en cada silo es igual.
H1: la temperatura media de almenos dos dia en cada silo es diferente-
c) ¿Hay diferencia entre los silos?

Fuente GL SC MC F P
SILO 4 4.460 1.115 0.69 0.609
DÍA 4 9.760 2.440 1.51 0.246
Error 16 25.840 1.615
Total 24 40.060
Aquí podemos observar que el valor-p de los solos es mayor que el valor de
significancia, es decir que el valor-p de los silos es 0.246 y el nivel es 0.05 y por lo tanto
es mayor, lo que significa que estadísticamente son iguales.

d) ¿La temperatura de un día a otro es diferente?


Por medio del problema anterior se observa que la temperatura es igual debido a que
el valor-p de los bloque es mayor que la significancia y por lo tanto las temperaturas
también son iguales.
e) Revise residuos, ¿hay algún problema evidente?

 Grafica de probabilidad Normal:


Nos muestra que el supuesto de normalidad se cumple porque los residuos o
puntos están bastante cerca de la línea recta.
 Recuadro vs ajuste:
El mismo cumple con el supuesto de varianza porque los residuos se ubican
aleatoriamente dentro de una banda horizontal.

16. Se requiere estudiar el efecto de cinco catalizadores diferentes (A, B, C, D y E) sobre el


tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas
y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco
corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro
latino para controlar activamente a los lotes y días. Los datos obtenidos son:
Día
1 2 3 4 5
Lote 1 A=8 B=7 D=1 C=7 E=3
2 C=11 E=2 A=7 D=3 B=8
3 B=4 A=9 C=10 E=1 D=5
4 D=6 C=8 E=6 B=6 A=10
5 E=4 D=2 B=3 A=8 C=8

a) ¿Cómo se aleatorizó el experimento?

Primero se construyó el cuadro latino estándar, y después se aleatoriza el orden de los renglones, y
después el de las columnas. La regla fundamental es que cada letra debe aparecer sólo una vez en
cada renglón y en cada columna.

b) Anote la ecuación del modelo y las Hipótesis estadísticas correspondientes.

El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:

𝑌𝑖𝑗𝑙 = 𝜇 + 𝜏𝑖 + 𝛾𝑗 + 𝛿𝑙 + 𝜀𝑖𝑗𝑙

Hipótesis:

Tratamiento:

𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇
𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖 ≠ 𝑗

Bloque 1:

𝐻0 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗

Bloque 2:

𝐻0 : 𝛾𝐴 = 𝛾𝐵 = 𝛾𝐶 = 𝛾𝐷 = 𝛾𝐸 = 0
𝐻𝐴 : 𝛾𝑗 ≠ 0 para algún 𝑏𝑙𝑜𝑞𝑢𝑒 𝑗

c) ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son diferentes entre sí?

Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 26 5.2 9.2
Fila 2 5 31 6.2 13.7
Fila 3 5 29 5.8 13.7
Fila 4 5 36 7.2 3.2
Fila 5 5 25 5 8

Columna 1 5 33 6.6 8.8


Columna 2 5 28 5.6 11.3
Columna 3 5 27 5.4 12.3
Columna 4 5 25 5 8.5
Columna 5 5 34 6.8 7.7

sA= 5 42 8.4 1.3


sB= 5 28 5.6 4.3
sC= 5 44 8.8 2.7
sD= 5 17 3.4 4.3
sE= 5 16 3.2 3.7

ANÁLISIS DE VARIANZA
Origen de Promedio Valor
las Suma de Grados de de los crítico para
variaciones cuadrados libertad cuadrados F F
Tratamiento 141.44 4 35.36 11.3092 3.26
Días (B1) 12.24 4 3.06 0.9787 3.26
Lotes (B2) 15.44 4 3.86 1.2345 3.26
Error 37.52 12 3.1267

Total 206.64 24

En tratamiento:

Dado que 𝐹0 > 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se rechaza, es decir, los tratamientos (catalizadores) son
diferentes entre sí.

En bloque 1:

Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, es decir, en que el día no tiene un efecto en los
catalizadores.

En bloque 2:

Como 𝐹0 < 𝐹𝑐𝑟𝑖𝑡𝑖𝑐𝑎 , la hipótesis nula se acepta, es decir, que el número de lote no tiene eecto sobre
el catalizador.
d) ¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?

No, lo efectos de ruido (lote y día) no tienen influencia significativa sobre la reacción del proceso
(catalizadores), es decir no influyen en los resultados de los tratamientos.

e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento
es mejor?

Hipótesis:

𝐻0 : 𝜇𝑖 = 𝜇𝑗

𝐻𝐴 : 𝜇𝑖 ≠ 𝜇𝑗
2𝐶𝑀𝐸
𝐿𝑆𝐷 = 𝑡𝛼⁄2,(𝑘−1)(𝑏−1) √
𝑏

𝑡𝛼⁄2,(𝑘−1)(𝑏−1) = 𝑡0.25,12 = 2.1788128

𝐶𝑀𝐸 = 3.12667

𝑏=5

𝐿𝑆𝐷 = 2.1788√2(3.12667)/5 = 2.4366

Utilizando LSD
µi-µj LSD H0
µA µB 2.8 > 2.43663628
µA µC 0.4 < 2.43663628
µA µD 5 > 2.43663628
µA µE 5.2 > 2.43663628
µB µC 3.2 > 2.43663628
µB µD 2.2 < 2.43663628
µB µE 2.4 < 2.43663628
µC µD 5.4 > 2.43663628
µC µE 5.6 > 2.43663628
µD µE 0.2 < 2.43663628

En base a esta comparación los catalizadores E, D y B son estadísticamente iguales y los que
resultan mejores, ya que el tempo de reacción es menor.