Documente Academic
Documente Profesional
Documente Cultură
1
Ecuatoriano, Doctor en Ciencias, PhD., especializado en Fisicoquímica, Termodinámica y
Coloideofísica. Dignísimo profesor de la Universidad Central del Ecuador, autor de 9 obras científicas y
cinco obras filosóficas; miembro de varias academias científicas.
2
Cuestiones Lógico-Filosóficas de la Ciencia, primera edición, 1.994, Editorial Universitaria, Quito.
INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.
1.1.3 TRATAMIENTO
1.1.4 FACTOR
Este término describe el fracaso de llegar a resultados idénticos con dos o más
unidades experimentales sometidas al mismo tratamiento y bajo iguales condiciones
de experimentación. Si a dos o más unidades experimentales se les aplica igual
tratamiento y condiciones de experimentación, si son tratadas idénticamente, es de
esperar que den igual resultado, el fracaso de obtener igual resultado en estas
condiciones se conoce como error experimental.
1. Errores de experimentación
2. Errores de observación
3. Errores de medición
4. La variación del material experimental
5. Los efectos combinados de todos los factores extraños que pudieran influir
en las características en estudio.
CONTROL LOCAL: La función del control local es hacer más eficiente el diseño
experimental, hace más sensitiva cualquier prueba de significancia o hace más
poderosos los procedimientos de prueba; este aumento de eficiencia resulta porque el
uso adecuado del control local reducirá la magnitud de la estimación del error
experimental. En este sentido el control local se refiere a la cantidad de balanceo,
bloqueo y agrupamiento de las unidades experimentales.
1.4 LA VARIANZA
Parámetro: σ 2
=
∑ (x i − µ )2
σ 2
=
∑x 2
i
− µ2
N N
Estadística: s 2
= ∑ ( xi − x ) 2
s 2
=
∑x i
2
− (∑ x ) 2 / n
n −1 n −1
E (s 2 ) = σ 2
2σ 4
Var ( s 2 ) =
n −1
2σ 4
El error estándar es igual a: es ( s ) = Var ( s 2 ) =
n −1
E(s 2 ) = σ 2
1 (n − 3) 2
Var ( s ) = µ4 − µ2
n (n − 1)
σ = σ2 s = s2
2 ((n − 2) / 2)!
E ( s) = σ
n − 1 ((n − 3) / 2)!
y su error estándar:
σ
es( s) =
2n
No existen fórmulas exactas para el valor esperado; cuando las muestras son
relativamente grandes ( n ≥ 30) la esperanza matemática de la distribución en el
muestreo del desvío típico muestral es igual a:
E (s) ≅ σ
σ
es ( s) = (r2 / 2) + 1
2n
µ4
en el que: r2 =
µ 22
Si los tratamientos tienen igual efecto en la variable respuesta, los valores de ésta son
en promedio iguales entre los tratamientos, por tanto no registran variación y la
variación total se explica únicamente por el error experimental. Si el error
experimental está ausente, entonces la variación total se explicaría únicamente por el
efecto de los tratamientos o del factor en la variable respuesta.
∑ (x ij − µ ) 2 = n j ∑ ( µ j − µ ) 2 + ∑ ( xij − µ j ) 2
en donde:
Σ (Xij - µ)2 = Suma de cuadrados total = SCT
nj Σ (µj - µ) = Suma de cuadrados entre Tratamientos = SCE
2
de donde:
SCT = SCE + SCR.
En general, las suposiciones básicas del análisis de varianza son las mismas
asociadas con el análisis de regresión:
Aditividad Independencia
Linealidad Varianzas homogéneas
Normalidad
CAPITULO II
DISEÑO A UN CRITERIO DE CLASIFICACION
Bajo este diseño se encuentran los experimentos cuyos tratamientos tienen igual
número de observaciones cada tratamiento, de forma que el número de
observaciones y de unidades experimentales es igual al número de observaciones por
tratamiento multiplicado por el número de tratamientos. La función matemática que
define este modelo es:
X ij = µ + α j + ε ij
en el que:
TRATAMIENTO
OBSERV. T1 T2 ? Tj ?. Ta
1 X11 X12 .. X1j J. X1a
2 X21 X22 J X2j J. X2a
i Xi1 Xi2 J Xij J. Xia
:
n Xn1 Xn2 ... Xnj .... Xna
TOTALES X1 X2 ? Xj ?. Xa X
# OBSER n1 n2 J nj J. na n
MEDIAS µ1 µ2 J µj J. µa µ
µj =
∑X ij
nj
X =∑Xj
n = ∑nj
µ =
∑X j
∑ (x ij − µ ) 2 = n j ∑ ( µ j − µ ) 2 + ∑ ( x ij − µ j ) 2
en donde:
∑ ( x − µ ) = Variación Total = SCT
ij
2
de donde:
Variación total = Variación entre tratamientos + Variación Residual
SCT = SCE + SCR
Vamos a suponer que todos los tratamientos aplicados a las unidades experimentales
tienen el mismo efecto en la variable respuesta, entonces, los promedios de cada
tratamiento serán iguales entre si: µ1 = µ2 = µj = ... = µa = µ, el efecto diferencial de los
tratamientos (µj - µ) no existe, por lo tanto Σ(µj - µ)2 = 0; y, consecuentemente, la
variación total de la variable respuesta estaría explicada únicamente por el error
experimental.
Supongamos que no existe el error experimental, por tanto Σ (Xij - µj)2 = 0 entonces, la
variación en la variable respuesta se explica por el efecto diferencial de los
tratamientos en ésta variable.
tampoco existe el error experimental, por lo tanto Σ (Xij - µj) = 0, entonces, la variable
2
Desde luego, las situaciones expuestas son ideales y nos sirven únicamente para
ilustrar el origen o la fuente de variación entre los valores de la variable respuesta al
interior de cada tratamiento o entre tratamientos.
(∑ X ) 2
SCT = ∑ X −
2 ij
ij
n
(∑ X ) 2
(∑ X ) 2
SCE = ∑ −
ij ij
nj n
(∑ X ) 2
SCR = ∑ X 2
ij −∑
n
ij
(∑ x ij ) 2
FC =
n
SCT = ∑ x ij2 − FC
x 2j
SCE = ∑ − FC
nj
SCR = SCT − SCE
1. Formulación de la Hipótesis:
Por lo general, el problema plantea la dócima de que los promedios de los diferentes
tratamientos del diseño experimental, "a" número de tratamientos, son iguales; si esto
es verdad, entonces el promedio poblacional también lo es, de forma que la hipótesis
nula (H0) recoge éste enunciado y lo contrasta con la hipótesis alternativa (HA) tal que
la formulación matemática propuesta será:
H0 : µ1 = µ2 = µj = ..... = µa
HA : µ1 ≠ µ2 ≠ µj ≠ ..... ≠ µa
Si todos los promedios son iguales se aceptará las hipótesis nula, basta que uno de
ellos no sea igual para que se rechace la hipótesis nula. Vale hacer notar que en la
hipótesis alternativa descrita (HA) se propone que los promedios de todos los
tratamientos son entre si diferentes; sin embargo, pudiera suceder que dos o más
promedios sean iguales y que uno o más de los restantes sean diferentes, pudiera
suceder que todos los promedios menos uno sean iguales, basta que uno de ellos sea
diferente al resto para que en efecto se rechace la hipótesis nula planteada.
Situaciones que no están representadas por la formulación propuesta para la
hipótesis alternativa.
H0 : µ1 = µ2 = µj = ..... = µa
HA : Por lo menos una µj es diferente
H0 : µj - µ = 0
HA : µj - µ ≠ 0
H0 : αj = 0
HA : αj ≠ 0
Rechazar la H0 si : Fc ≥ Fα , v1, v 2
en el que v1, corresponde a los grados de libertar del numerador, grados de libertad de
tratamientos (a - 1); y, v2, corresponde a los grados de libertad en el denominador,
grados de libertad del error (n - a). El valor tabular de F se lo obtiene directamente de
tablas pre calculadas, las mismas que se encuentran en las tablas del Anexo de
cualquiera de los textos de bibliografía presentados para el curso.
4. Ejecución de cálculos
Con los datos que el problema proporciona deben calcularse todas las sumas de
cuadrados, los cuadrados medio y el valor de la estadística de prueba conforme se
presentó en el cuadro de análisis de varianza.
5. Decisión
El proceso de prueba no termina si el estadístico no toma una decisión sobre la
aceptación o rechazo de la hipótesis nula planteada y si no responde al interrogante
que plantea el problema. Con la decisión concluye el proceso de prueba y del análisis
de varianza.
EJEMPLO:
Con el 95% de seguridad, puede el fabricante afirmar que esa clase de automóvil
tiene un rendimiento exactamente igual con los tres tipos de gasolina?
SOLUCION:
Formulación de la Hipótesis:
H0 : αj = 0
HA : αj ≠ 0
CME
Estadística de Prueba: Fc =
CMR
Cálculos:
GASOLINAS ∑ ( x ij − µ ) 2
∑ (x ij − µ j ) 2
A B C A B C A B C
47 46 51 0 1 16 18.0625 2.25 7.5625
39 42 50 64 25 9 14.0625 6.25 14.0625
43 45 56 16 4 81 0.0625 0.25 5.0625
42 45 58 25 4 121 0.5625 0.25 18.0625
ΣXj = 171 178 215 105 34 227 32.75 9 44.75
nj = 4 4 4
µj = 42.75 44.50 53.75 ΣXij = 564 µ = 47.00
Por otro lado, si los tipos de combustible tuviesen el mismo efecto en el kilometraje de
recorrido del automóvil, el promedio para cada tipo de combustible sería el mismo. En
el ejemplo desarrollado, encontramos que los promedios son diferentes y
verificaremos si esta diferencia es estadísticamente significativa; la diferencia entre el
promedio de cada tratamiento y el promedio general es una medida del efecto
diferencial del combustible en el kilometraje de recorrido que se expresa en la Suma
de Cuadrados entre Tratamientos que tiene un valor de 279.5.
condiciones del problema, se tiene un nivel de significación del 5%, con 2 grados de
libertad en el numerador, en correspondencia con el CME, y 9 grados de libertad en el
denominador, en correspondencia con el CMR, que visto en tablas corresponde a:
Decisión:
Sólo cuando se tomado una decisión sobre el problema planteado, podemos decir que
el análisis estadístico ha concluido.
2
GASOLINAS X ij
A B C A B C
47 46 51 2,209 2,116 2,601
39 42 50 1,521 1,764 2,500
43 45 56 1,849 2,025 3,136
42 45 58 1,764 2,025 3,364
ΣXj = 171 178 215 7,343 7,930 11,601
nj = 4 4 4
ΣXij = 564 ΣX
2
ij = 26,874
ΣX
SCT = 2 2
ij - (Σ Xij ) / n
SCT = 2
26,874 - (564) /12 =
SCT = 26,874 - 26,508 = 366
SCE = 2 2 2 2
(171 /4 + 178 /4 + 215 /4) - ((564) /12) =
SCE = 26,787.5 - 26,508 = 279.5
Σ X ij - Σ (ΣXij) / ni
SCR = 2 2
SCR = 2 2 2
26,874 - (171 /4 + 178 /4 + 215 /4) =
SCR = 26,874 - 26,787.5 = 86.5
Los cálculos presentados, sirven para aplicar una forma abreviada de cálculo como se
presenta a continuación:
SCT = Σ x2ij - FC
SCT = 26,874 - 26,508 =
SCT = 366
RESUMEN
Grupos Cuenta Suma Promedio Varianza
GASOLINA A 4 171 42.75 10.92
GASOLINA B 4 178 44.50 3.00
GASOLINA C 4 215 53.75 14.92
ANÁLISIS DE VARIANZA
Total 366 11
Como puede observarse, los resultados son exactamente los mismos que los
obtenidos con los procesos de cálculo anteriores; así, el valor calculado de la
estadística de prueba Fc = 14,540, es exactamente igual al obtenido en el cálculo
anterior; el valor tabular de la estadística de prueba Fc = 4,256, es el mismo que en
los cálculos anteriores.
EJEMPLO:
El área urbana de cierta zona del país tiene la atención de tres hospitales públicos.
Los siguientes datos muestran el número de intervenciones quirúrgicas diarias
practicadas a pacientes no hospitalizados, en cada hospital en la semana pasada. Al
nivel de significación 0.05, ¿ es posible concluir que hay diferencia en el número
promedio de operaciones realizadas entre los hospitales?
SOLUCION:
Formulación de la Hipótesis:
H0 : αj = 0
HA : αj ≠ 0
Estadística de Prueba:
CME
Fc =
CMR
Criterio de Decisión:
Rechazar la H0 si : Fc ≥ Fα, v1, v2
Cálculos:
CALCULO DE LA SUMA DE CUADRADOS
HOSPITALES X2ij
H1 H2 H3 H1 H2 H3
14 18 24 196 324 576
20 24 14 400 576 196
16 22 14 256 484 196
18 28 22 324 784 484
20 24 400 - 576
SUMA 88 92 98 1,576 2,168 2,028
nj 5 4 5
2
∑Xij = 278 ∑Xij = 5,772
FC = (∑Xij )2 /n
FC = (278)2 /14 = 5.520,29
SCT = ∑Xij2 - FC
SCT = 5,772 - 5,520,29 = 251.71
SCT = 251,71
Nótese que con respecto al cálculo del ejemplo anterior, la única diferencia está en el
cálculo de la Suma de Cuadrados de Tratamientos, SCE; para la situación presente, el
denominador para la suma de cada tratamiento corresponde al número de
observaciones del tratamiento.
Decisión:
RESUMEN
Grupos Cuenta Suma Promedio Varianza
HOSPITAL 1 5 88 17.60 6.80
HOSPITAL 2 4 92 23.00 17.33
HOSPITAL 3 5 98 19.60 26.80
ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Entre grupos 65.314 2 32.6571 1.927 0.1916 3.982
Dentro de grupos 186.4 11 16.9455
Total 251.714 13
En este modelo se supone que los tratamientos incluidos en el experimento son todos
los posibles o constituyen la población de tratamientos. El atributo que lo distingue es
que los efectos de los tratamientos o clases medidos por αj, se consideran cantidades
fijas pero desconocidas para ser estimadas.
X ij = µ + α j + ε ij i = 1,2 J n
j = 1,2 J a
La hipótesis que se plantea para dócima es:
H0 : αj = 0
HA : αj ≠ 0
Los cuadrados medios esperados, del cuadro de Análisis de Varianza, para cada
fuente de variación operándose con igual número de repeticiones o diferente número
de repeticiones por tratamiento son los siguientes:
X ij = µ + A j + ε ij i = 1, 2 J n
j = 1, 2 J.a
en donde:
µ = Es el promedio general o promedio poblacional
Aj = Es el efecto del j-ésimo tratamiento, que es variable aleatoria
independiente normalmente distribuida con Ν (0, σ2A),
εij = Es el error o valor residual de la i-ésima observación del j-ésimo
tratamiento, que se considera es independiente de observación
a observación y está normalmente distribuido con valor esperado
igual a cero y varianza igual a σ , Ν (0,σ ).
2 2
Los cuadrados medios esperados, del cuadro de Análisis de Varianza, para cada
fuente de variación operándose con igual número de repeticiones o diferente número
de repeticiones por tratamiento son los siguientes:
σ σ
Residual (Error) 2 2
σ2 + noσ2A
Adicionalmente a las pruebas citadas, existe otra de mayor versatilidad porque permite
la comparación entre pares de tratamientos y/o entre subconjuntos de tratamientos,
sin las limitaciones y restricciones de aplicación que los métodos anteriores exigen,
éste método es conocido como Función Lineal, el mismo que será examinado con
algún detenimiento.
H0 : µ1 = µ2
HA : µ1 ≠ µ2
Si Dij ≥ DMS
Dij x1 x2 x3 x4 xj
x1 - D12 D13 D14 D1j
SI x2 - - D23 D24 D2j ≥ DMS
x3 - - - D34 D3j
xi - - - Dij
La función lineal puede expresarse en términos de los totales de los tratamientos o del
promedio de cada tratamiento. Utilizando los promedios de los tratamientos tenemos:
La comparación que se realiza a través de la función lineal puede incluir todas las
medias de los tratamientos o sólo una parte de éstas. A manera de ejemplo, si el
experimento tiene 3 tratamientos, entonces podríamos estar interesados en realizar
pruebas para verificar si ciertas comparaciones entre los tratamientos son
significativas. Las posibles comparaciones que puede realizar el investigador con las
hipótesis nulas y los correspondientes coeficientes ortogonales, son los siguientes:
(µ1 + µ2)/2 - µ3 = 0 1 1 -2 0
(µ1 + µ3)/2 - µ2 = 0 1 -2 1 0
(µ2 + µ3)/2 - µ1 = 0 -2 1 1 0
El cálculo del error estándar de la función lineal depende de si los tratamientos tienen
o no igual número de repeticiones por tratamiento.
Si todos los tratamientos tienen igual número de repeticiones “r”, el error estándar de
la función lineal es igual a:
σL = σ/√r * √∑λj2
σL = σ/√r * √(λ12 + λ22 + λj2 + ... + λa2)
en donde: σ = √CMR
σL = σ * √∑(λj /rj)
2
en donde: σ = √CMR
tc ≥ t α/2, v
En la que los grados de libertad del valor tabular de “t” está dado por la suma del
número de repeticiones de los tratamientos involucrados en la prueba menos el
número de tratamientos considerados.
EJEMPLO:
TRATAMIENTO DE FERTILIZANTE
T1 T2 T3 T4 T5
37 67 95 102 123
26 68 95 96 93
39 57 91 102 112
23 74 105 103 120
48 61 78 99 113
50 68 85 117 124
SOLUCION:
Formulación de la Hipótesis:
H0 : αj = 0
HA : αj ≠ 0
Estadística de Prueba:
Fc = CME / CMR
Criterio de Decisión:
Rechazar la H0 si : Fc ≥ Fα, v1, v2
Cálculos:
FC = (∑Xij )2 /n
FC = (2471)2 /30 = 203528.03
SCT = ∑Xij2 - FC
SCT = 228737 – 203528.03 =
25208.97
SCT = 25208.97
Decisión:
El criterio de Decisión:
Se rechaza la hipótesis nula si: Xi - Xj ≥ 11.92
DIFERE. T1 T2 T3 T4 T5
T1 28,67 54,33 66,00 77,00
T2 25,67 37,33 48,33
T3 11,67 22,67
T4 11,00
T5
H0 : µ1 - (µ2 + µ3 + µ4 + µ5)/4 = 0
HA : µ1 - (µ2 + µ3 + µ4 + µ5)/4 ≠ 0
Siendo los λi coeficientes ortogonales, se requiere que su sumatoria sea igual a cero;
para tal efecto tomamos de referencia la formulación de la hipótesis nula planteada de
manera que si λ1 = 4 entonces los restantes λj serán iguales a –1, se verifica que ∑λj
=0, reemplazando en la función lineal tenemos:
de donde: tc = L / σL
tc = -225.69 / 16.919 = -13.357
de donde: tc = L / σL
tc = -60.01 / 7.566 = -7.932
tc ≥ t α/2, v
-7.932 ≥ t 0.025, 20
-7.932 ≥ 2.086
CAPITULO III
Conocido también como Modelo de dos vías o como Diseño en Bloque Completo
Azarizado, es aquel en el que el diseño experimental mantiene bajo control a dos
factores, cada uno con sus propios niveles de factor o categorías de variable, uno de
éstos factores es denominado como “Tratamientos” y el segundo “Bloques”, de
manera que:
Xij = µ + αi + β j + εij
en el que:
El efecto del i-ésimo tratamiento está dado por la diferencia entre su promedio y el
promedio general, esto es: µ - µi , diferencia que está representada por αi ; de
similar manera, el efecto del j-ésimo bloque está dado por la diferencia entre su
promedio y el promedio general, esto es: µ - µj , diferencia que es representada por
β j . Lo que se probará es si los efectos de los tratamiento y de los bloques son
estadísticamente significativos
Al igual que en el modelo de una vía, éste modelo supone: aditividad, linealidad,
normalidad, independencia y varianzas homogéneas.
Se acepta además que para cada tratamiento ∑β j = 0 y que para cada bloque ∑αi = 0;
por lo tanto: ∑β j = ∑αi = 0.
B L O Q U E
TRATAMIENTO B1 B2 Bj ... Bb ∑ Xi••
T1 X11 X12 X1j ... X1b X1•⋅
T2 X21 X22 X2j ... X2b X2•
Ti Xi1 Xi2 Xij ... Xib Xi•
? ... ... ... ... ... ...
Ta Xa1 Xa2 Xaj ... Xab Xa•
∑ X•j X• 1 X• 2 X•j ... X• b X••
Nótese que el total marginal de cada tratamiento es utilizado para calcular la suma de
cuadrados para tratamientos, SCE, luego de ser elevado al cuadrado y dividido su
resultado por el número de bloques, b; y que el total marginal de cada bloque, elevado
al cuadrado y dividido para el número de tratamientos, a, se utiliza para estimar la
suma cuadrado de bloques, SCB.
Los Cuadrados Medios esperados para el Modelo I, o de efectos fijos, son los
siguientes:
1. Los efectos de los tratamientos no están influidos por las β j , porque la suma de
éstas en cada tratamiento es igual a cero, esto es: ∑β j = 0; de manera que Xi• es
un estimador imparcial de µ + αi
2. De igual forma, los efectos de los bloques no están influidos por las αi , porque la
suma de éstas en cada bloque es igual a cero: ∑αi = 0; de manera que X•j es un
estimador imparcial de µ + β j
1. Formulación de la Hipótesis:
H0 : αi = 0
HA : αi ≠ 0
y H0 : β j = 0
HA : β j ≠ 0
3. Criterio de Decisión
El criterio de decisión planteado es válido tanto para tratamientos como para bloques.
4. Ejecución de cálculos
Con los datos que el problema proporciona deben calcularse las sumas de cuadrados,
los cuadrados medios y el valor de la estadística de prueba conforme se presentó en
el cuadro de análisis de varianza.
5. Decisión
EJEMPLO:
PROCEDIMIENTO OPERADOR
DE PRODUCCION 1 2 3 4 5 6 TOTAL
A 43 39 40 40 43 44 249
B 40 40 41 42 43 43 249
C 40 41 41 43 45 45 255
D 41 42 44 44 46 42 259
TOTAL 164 162 166 169 177 174 1012
Probar para un nivel de significación del 5%, que no existe una diferencia significativa
entre los procedimientos de producción; y que, la diferencia en el promedio de
producción de los operadores se debe únicamente al azar.
SOLUCION:
1. Formulación de la Hipótesis:
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα, v1, v2
4. Ejecución de cálculos
PROCED. Xij2
PRODUCC. 1 2 3 4 5 6TOTAL
A 1849 1521 1600 1600 1849 1936 10355
B 1600 1600 1681 1764 1849 1849 10343
C 1600 1681 1681 1849 2025 2025 10861
D 1681 1764 1936 1936 2116 1764 11197
TOTAL 6730 6566 6898 7149 7839 7574 42756
FC = 1067089 / 24
FC = 42672,7
Análisis de varianza de dos factores con una sola muestra por grupo
ANÁLISIS DE
VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilida Ft
Variación Cuadrados Libertad Medio d
Filas 12.00 3 4.00 2.105 0.14247 3.287
Columnas 42.83 5 8.57 4.509 0.01042 2.901
Error 28.50 15 1.90
Total 83.33 23
5. Decisión
Aplicando el criterio de decisión formulado, para la dócima de los tratamientos, o
procedimientos de producción, se tiene que:
No se cumple la desigualdad, por lo tanto, acepto la hipótesis nula y concluyo que los
procedimientos de producción no son significativamente diferentes, o lo que es lo
mismo, éstos son igualmente efectivos.
rechazar la H0 si : Fc ≥ F0.05, 5, 15
4,509 ≥ 2,901 se cumple.
utilizando la Función Lineal, cuyo procedimiento utiliza los totales de los tratamientos y
su finalidad es particionar la SCE, así como realizar comparaciones entre
tratamientos. En tal virtud, se enunciarán varias reglas que deben ser observadas.
Nótese que el subíndice “i” varía desde 1 hasta “a” número de tratamientos; y que,
éste ha reemplazado al subíndice “j” del capítulo anterior porque hemos representado
a los tratamientos en sentido de filas. Además, en un diseño de bloques el número de
unidades experimentales es igual para cada tratamiento, por lo tanto “r” siempre
tendrá el mismo valor para todos los tratamientos.
Para que dos o más funciones lineales formen parte independiente o sean
componentes independientes de la suma de cuadrados de tratamientos, es
indispensable que éstas sean mutuamente ortogonales.
L12 / (r ∑λ1i2 )
L2 / (r ∑λ2i )
2 2
Si estuviéramos analizando un modelo a una sola vía en el que los tratamientos tienen
diferente número de repeticiones, las reglas señaladas arriba cambian un poco. Si el
tratamiento i-ésimo tiene ri repeticiones, se ha demostrado que la SCE, suma de
cuadrados de tratamientos es:
SCE = ( T12 /r1 + T22 /r2 + J + Ta2 /ra) - ((T1 + T2 + J + Ta)2 / ∑ ri)
r 1 λ 1 + r2 λ 2 + J + ri λ i + J + ra λ a = 0
o lo que es lo mismo: ∑ ri λ i = 0
L12 / ∑ riλ1i2
L2 / ∑ riλ2i
2 2
Las últimas reglas expuestas, las relacionadas con diferente número de repeticiones
por tratamiento, sirven especialmente cuando se desea particionar de la SCE en
subgrupos de tratamientos, mayor información y referencia del procedimiento que
debe ser empleado lo encontrará en la sección 3.43 del libro Diseños Experimentales
de Cochran y Cox.
EJEMPLO:
Bloque 1 B F A C E D
Bloque 2 A E D F C B
Bloque 3 E A C B D F
Bloque 4 F D E A B C
El incremento diario promedio del peso de cada novillo, expresado en kilogramos, fue
registrado con los siguientes resultados:
BLOQUE
RACION B1 B2 B3 B4 TOTAL
A 1,5 0,9 0,5 0,9 3,8
B 1,4 2,3 3,2 1,9 8,8
C 0,9 1,4 1,4 2,3 6.0
D 2,3 1,8 2,3 2,3 8,7
E 2,7 2,3 2,3 3,6 10,9
F 3,6 3,2 4,5 4,1 15,4
TOTAL 12,4 11,9 14,2 15,1 53,6
Todos los novillos tuvieron como base de la ración la misma cantidad de pasto fresco
al que se añadieron determinados componentes, conforme se detalla:
Se desea verificar, para una significancia del 0.05, si existe una diferencia significativa
en la ganancia de peso de los novillos:
1. Debido a las raciones alimenticias.
2. Debido a las categorías de peso de los novillos al inicio del experimento.
3. Entre sólo pasto y las restantes raciones alimenticias
4. Entre las raciones que incluyen complemento alimenticio + vitamina vs. Las que
incluyen sólo complemento alimenticio.
5. Entre la ración que incluye complemento alimenticio más vitamina vs. La que
incluye 1.5 veces complemento alimenticio más vitamina.
6. Entre los novillos de mayor peso con los de menor peso al inicio del experimento.
SOLUCION:
1. Formulación de la Hipótesis:
3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα, v1, v2
4. Ejecución de cálculos
X2ij
RACION B1 B2 B3 B4 TOTAL
A 2,25 0,81 0,25 0,81 4,12
B 1,96 5,29 10,24 3,61 21,1
C 0,81 1,96 1,96 5,29 10,02
D 5,29 3,24 5,29 5,29 19,11
E 7,29 5,29 5,29 12,96 30,83
F 12,96 10,24 20,25 16,81 60,26
TOTAL 30,56 26,83 43,28 44,77 145,44
FC = 2872,96 / 24
FC = 119,71
Nótese que se han reemplazo los valores para la determinación del cuadrado medio
esperado de tratamientos y de bloques; en éstos, el efecto de los i-ésimos
tratamientos sumados en todos los casos es igual a 0.29 + 4 ∑ αi / (5-1). De similar
manera, el efecto de los j-ésimos bloques sumados en todos los bloques es igual a
0.29 + 6 ∑ β j / (4-1).
Análisis de varianza de dos factores con una sola muestra por grupo
ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Filas 20.178 5 4.036 13.680 3.88E-05 2.901
Columnas 1.130 3 0.377 1.277 0.318186 3.287
Error 4.425 15 0.295
Total 25.733 23
Visto en la tabla el valor teórico de la estadística de prueba, Fα, v1, v2 , para un nivel de
significación de 0.05, para la dócima de tratamientos como para la dócima de los
bloques, es respectivamente:
Fα, v1, v2 = F0.05, 5, 15 = 2.901
Fα, v1, v2 = F0.05, 3, 15 = 3.287
Decisión:
Aplicando el criterio de decisión previsto, tenemos que rechazo la hipótesis nula si:
Fc ≥ Fα, v1, v2 reemplazando valores para los tratamientos tenemos
4.4 ≥ 2.90 se cumple.
por lo tanto, al cumplirse la desigualdad, rechazo la hipótesis nula planteada para las
raciones y concluyo que el efecto de las raciones en el incremento de peso de los
novillo es significativamente diferencial.
Para el caso de los bloques, o de la categorización del novillo por su peso al inicio del
experimento, tenemos que:
Fc ≥ Fα, v1, v2 reemplazando valores para los tratamientos tenemos
1.277 ≥ 3.287 no se cumple.
H0 : µA - (µB + µC + µD + µE + µF)/5 = 0
HA : µA - (µB + µC + µD + µE + µF)/5 ≠ 0
El valor 7.905 es una partición de la SCE con un grado de libertad, que explica el 39%
de la variación en los tratamientos. Además, se observará que r = 4 corresponde al
número de bloques o repeticiones y que cada tratamiento tiene igual número r = 4; se
verifica que la suma de los coeficientes ortogonales empleados en la función es igual
a cero; y que el valor de 30 corresponde a la suma de los cuadrados de los
coeficientes ortogonales empleados en la función lineal.
Para resolver el numeral 4 del problema, esto es para probar que no existe
diferencia significativa entre las raciones que incluyen complemento alimenticio +
vitamina con aquellas que incluyen sólo complemento alimenticio, formulamos una
segunda partición que deberá probar la hipótesis:
Este valor es una partición de la SCE con un grado de libertad; al igual que en caso
anterior r = 4 y se confirma que la suma de los coeficientes ortogonales empleados en
la función es igual a cero.
Debemos notar que las dos funciones lineales utilizadas son mutuamente ortogonales,
toda vez que se verifica que la suma de la multiplicación de los coeficientes de la
primera y segunda función, es igual a cero:
∑ λ1iλ2i = 0
Numeral 5 del problema, para verificar que no existe diferencia significativa entre la
ración que incluye complemento alimenticio más vitamina vs. La que incluye 1.5 veces
complemento alimenticio más vitamina, plantearemos otra función lineal que nos
permita realizar la comparación entre estos tratamientos y que pruebe la hipótesis:
H0 : µD - µF = 0
HA : µD - µF ≠ 0
H0 : µB1 - µB4 = 0
HA : µB1 - µB4 ≠ 0
El factor Ración explica el 78.4% de la Variación Total, el factor Bloque explica el 4.4%
y el error experimental comprende el 17.2% de la variación total. Al explorar con
mayor profundidad en la variación del factor ración, está fue dividida en tres
comparaciones mutuamente ortogonales que son componentes independientes que
explican el 83.1% de la variación detectada en el factor, logrando mayor profundidad
de análisis en los datos. Nótese además, que el factor bloques puede también ser
explicado mediante la partición de sus componentes, en el problema se obtuvo uno de
éstos que explica el 54% de la variación del factor.
En lo que tiene relación con la ración alimenticia de los novillos, todas las fuentes de
variación tienen valor calculado de F superior al valor tabular, por tanto las
comparaciones sometidas a prueba tienen diferencia significativa. Podemos afirmar
con el 95% de seguridad que la ración de sólo pasto produce un incremento de peso
significativamente menor al que producen raciones alimenticias que contienen pasto
más otros elementos. De igual manera se puede afirmar que las dietas que contienen
pasto + complemento alimenticio + vitamina, producen mayor incremento en el peso
de los novillos que aquellas dietas que contienen sólo pasto + complemento
alimenticio. Además, se comprobó que las raciones de pasto + complemento
alimenticio + vitamina, incrementan significativamente el peso si al complemento
alimenticio se dosifica con el 50% adicional de la dosis normal.
En cuanto a los bloques vemos que el valor calculado de F del factor bloques y su
partición es inferior al valor tabular, por tanto se concluye que no existe diferencia
significativa del incremento de peso de los novillos debido a la categoría del peso del
novillo al ingreso en el experimento; esto se ratifica cuando al comparar los resultados
de los novillos más pesados B1 con los menos pesados B4, existen diferencias que no
son estadísticamente significativas.
La comparación entre las varianzas residuales del diseño de bloques con el diseño a
un solo criterio de clasificación, teniendo en cuenta el cambio del número de grados
de libertad para el error, hace posible una estimación del aumento en precisión que
resulta del agrupamiento en bloques o repeticiones.
ED = CMB + (a – 1) CMRB
(a – 1) CMRB
ED = 0.38 + (6 – 1) 0.29 .
(6 – 1) 0.29
ED = 1.262
Este resultado nos indica que el diseño de bloques utilizado para el análisis es
superior a si se hubiera utilizado un diseño de una sola vía para el análisis de los
tratamientos, la mejora es del 26.2%.
En este modelo a más de considerar los dos factores de clasificación, deben tomarse
en cuenta dos aspectos adicionales:
1. Cada combinación del i-ésimo tratamiento con el j-ésimo bloque, tiene 2 o más
observaciones por celda; y,
Lo que implica que para cualquier tratamiento, los bloques no tienen efecto debido a
que los efectos parciales de los bloques en el tratamiento se compensan; de igual
manera, el efecto de la interacción es nula en cada tratamiento. De forma análoga,
para cada bloque, los tratamientos no tienen efectos porque los efectos parciales de
los tratamientos se compensan al igual que los de interacción. La representación
simbólica de datos de éste diseño es la siguiente:
TRATAMIENTO BLOQUE
Repetición B1 B2 ... Bj ... Bb ∑
En el modelo existe “a” número de tratamientos, “b” número de bloques y “c” número
de repeticiones para cada i-ésimo tratamiento y j-ésimo bloque, de manera que el
número total de observaciones “n” es el producto de “a*b*c”. n = a*b*c
La formulación de cálculo para determinar las sumas de cuadrados total, de
tratamientos, de bloques, de interacción y el residual se presenta a continuación:
FC = (Σ xijk)2/abc
SCT = Σ x2ijk - FC
Σ(x i•• / bc) - FC
2
SCE = = A
SCB = Σ(x2•j• / ac) - FC = B
SCI = (Σ(x2ij• / c) – FC) – (A + B) = C
SCR = SCT – (A+B+C) = D
Los Cuadrados Medios esperados para el Modelo I, o de efectos fijos, son los
siguientes:
σ
2
Residual (Error)
TOTAL
H0 : αi = 0
HA : αi ≠ 0
H0 : β j = 0
HA : β j ≠ 0
H0 : Iij = 0
HA : Iij ≠ 0
Con esta formulación se prueba la hipótesis de que los dos criterios de clasificación,
tratamientos y bloques, son mutuamente independientes y que por lo tanto no existe
interacción entre estos factores.
Fc = CMI /CMR
EJEMPLO:
SOLUCION:
1. Formulación de la Hipótesis:
3. Criterio de Decisión
4. Ejecución de cálculos:
2
MQ. REP. X ij
O1 O2 O3 Suma
M1 1
1,806.25 1,568.16 1,840.41
2
1,544.49 1,592.01 1,730.56
M2 1
1,584.04 1,640.25 1,806.25
2
1,608.01 1,789.29 1,857.61
M3 1
1,780.84 1,789.29 2,016.01
2
1,892.25 1,883.56 2,034.01
M4 1
1,874.89 1,892.25 2,106.81
2
1,866.24 1,953.64 1,789.29
SUMA
13,957.01 14,108.45 15,180.95 43,246.41
n = a*b*c = 4 * 3 * 2 = 24
FC = (1017,9)2 / 24 = 43.171,68
SCT = 43246,41 - 43.171,68 = 74,73
TOTAL 23 74.73
5. Decisión:
En el caso de los bloques, los operarios, encontramos que también existe una
diferencia significativa en el tiempo promedio de producción de un artículo entre los
obreros y por lo tanto rechazo la hipótesis nula.
Por último, acepto la hipótesis nula sobre la interacción, esto es, que los dos factores
considerados son independientes. Llegaremos a iguales resultados y conclusiones si
procesamos la información en Excel; el resultado final del procesamiento se expone a
continuación:
RESUMEN O1 O2 O3 Total
M1
Cuenta 2 2 2 6
Suma 81.8 79.5 84.5 245.8
Promedio 40.90 39.75 42.25 40.97
Varianza 5.12 0.05 0.85 2.45
M2
Cuenta 2 2 2 6
Suma 79.9 82.8 85.6 248.3
Promedio 39.95 41.40 42.80 41.38
Varianza 0.04 1.62 0.18 1.99
M3
Cuenta 2 2 2 6
Suma 85.7 85.7 90 261.4
Promedio 42.85 42.85 45 43.57
Varianza 0.845 0.605 0.02 1.53
M4
Cuenta 2 2 2 6
Suma 86.5 87.7 88.2 262.4
Promedio 43.25 43.85 44.1 43.73
Varianza 0.005 0.245 6.48 1.50
Total
Cuenta 8 8 8
Suma 333.9 335.7 348.3
Promedio 41.74 41.96 43.54
Varianza 2.98 3.09 2.41
Los resultados del análisis presentan información básica del número de elementos
considerados en el cálculo, la suma, promedio y varianza de cada nivel de la variable
considerada. Los resultados del análisis de varianza se presentan a continuación:
ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Muestra 37.36 3 12.45 9.31 .0019 3.49
Columnas 15.39 2 7.70 5.75 .0177 3.89
Interacción 5.92 6 0.99 0.74 .6294 3.00
Dentro del grupo 16.06 12 1.34
Total 74.73 23
El diseño a dos criterios de clasificación prevé que para cada categoría del factor
tratamiento y cada categoría del factor bloque, se registre por lo menos una
observación, manteniendo igual número de observaciones para cada celda. Por lo
general, se obtiene una observación por celda, cuando alguna de éstas falta porque la
unidad experimental se perdió o destruyó en la realización del experimento sin que
pudiera obtenerse el valor de la variable respuesta correspondiente, entonces la
observación faltante se estima en función de los datos reales obtenidos en el
experimento, mediante la aplicación de la siguiente formula:
Xij = (aT + bB - S)
(a – 1)(b – 1)
en donde:
Xij = Observación faltante a estimar.
a = Número de tratamientos
T = Total del tratamiento en el que existe un dato faltante.
b = Número de bloques
B = Total del bloque en el que existe el dato faltante.
S = Sumatoria de todas las observaciones.
CAPITULO IV
DISEÑO CUADRADO LATINO
Este diseño permite controlar los tratamientos de experimentación con dos factores
adicionales ubicados uno en filas y otro en columnas; difiere de los diseños antes
descritos porque controla dos fuentes de variación de las cuales el investigador tiene
algún conocimiento lo que le permite ganar eficiencia, aumentar la precisión del
análisis y explicar con mayor profundidad la variación en la variable respuesta.
CUADRADOS LATINOS
3X3 4X4
COLUMNA COLUMNA
FILA 1 2 3 FILA 1 2 3 4
1 A B C 1 A B C D
2 B C A 2 B C D A
3 C A B 3 C D A B
4 D A B C
Xijk = µ + αi + β j + γk + εij k
en el que:
La suposición aditividad del modelo implica que los tres factores: tratamientos, filas y
columnas son aditivos; y, se infiere que la media de tratamientos X••k es una estimatriz
imparcial de µ + γk , en la que los efectos de filas y de columnas se cancelan debido a
la simetría del diseño. Las demás características del modelo a dos criterios son
similares.
Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:
FC = (Σ xijk)2/a2
SCT = Σ x2ijk - FC
Σ(x i•• / a) - FC = A
2
SCF =
SCC = Σ(x2•j• / a) - FC = B
SCE = Σ(x2••k / a) - FC = C
SCR = SCT – (A + B+ C) = D
El análisis de varianza del cuadrado latino permite aislar las variaciones debidas al
factor fila, las variaciones del factor columna y aquellas debidas a los tratamientos; en
consecuencia disminuye la variación del error experimental y la prueba resulta más
sensible para detectar cualquier diferencia significativa.
1. Formulación de la Hipótesis:
Para tratamientos H0 : γk = 0
HA : γk ≠ 0
2. Estadística de prueba
3. Criterio de Decisión
4. Ejecución de cálculos
Con los datos que el problema proporciona deben calcularse las sumas de cuadrados,
los cuadrados medios y el valor de la estadística de prueba conforme se presentó en
el cuadro de análisis de varianza.
5. Decisión
EJEMPLO:
PERIODOS DE VACAS
PRODUCCION 1 2 3 4 5 TOTAL
1 A B C D E
33.1 34.4 26.4 34.6 33.9 162.4
2 C D E A B
30.7 28.7 24.9 28.8 28.0 141.1
3 D E A B C
28.7 28.8 20.0 31.9 22.7 132.1
4 E A B C D
31.4 22.3 18.7 31.0 21.3 124.7
5 B C D E A
28.9 22.3 15.8 30.9 19.0 116.9
TRATAMIENTO3 A B C D E TOTAL
123.2 141.9 133.1 129.1 149.9 677.2
Probar para un nivel de significación del 1%, si la producción promedio diaria de leche
es significativamente diferente debido a la dieta alimenticia, a las vacas o al período
de producción.
DESARROLLO:
3
Nótese que los tratamientos han sido sumados independientemente de fila y de columna y se presentan
como totales al final del cuadro.
1. Formulación de la Hipótesis:
3. Criterio de Decisión
4. Ejecución de cálculos
FC = (677,2)2 / 25 = 18.343,99
2 2 2
SCE = ((123,2 + 141,9 + .... + 149,9 )/5) - 18.343,99 = 89,27
2 2 2
SCF = ((162,4 + 141,1 + ... + 116,9 )/5) - 18.343,99 = 245,82
5. Decisión:
Como puede observarse, las tres hipótesis nulas planteadas son rechazadas y
concluimos que: El promedio diario de producción de leche es significativamente
diferente debido a la dieta alimenticia; debido al período de producción de la vaca y
debido a la vaca.
Sustituyendo los valores con los resultados del ejemplo desarrollado tenemos que la
eficiencia relativa es igual a:
lo que significa que el diseño cuadrado latino mejoró el análisis, lo hizo más eficiente
en un 1.368,7%, con respecto a si el diseño hubiese sido a un criterio de clasificación.
CMC + (a – 1)CMR
a*CMR
que significa que el diseño empleado fue más eficiente que un diseño en bloques en
un 971,9%.
la información perdida, pero realiza una estimación más adecuada con los datos con
que se cuenta, la fórmula de cálculo para la estimación del valor es:
a (F + C + T) - 2S
(a – 1) (a – 2)
CAPITULO V
DISEÑO FACTORIAL
Por ejemplo, si el factor A interviene con dos niveles: a1 y a2; y el factor B interviene
con niveles b1 y b2, entonces el número de tratamientos del experimento es cuatro,
formado por las combinaciones: a1b1, a1b2, a2b1 y a2b2; si el factor B tuviese tres
niveles, entonces el número de tratamientos del experimento será de seis: a1b1, a1b2,
a1b3, a2b1, a2b2 y a2b3.
Un experimento factorial es aquel que se realiza con dos o más factores y los ensayos
del experimento se realizan en todas las combinaciones de los niveles de los factores.
Los conceptos estadísticos presentados en los capítulos precedentes son válidos para
el diseño factorial y en particular se continuará con el uso del análisis de varianza
como herramienta básica para el análisis estadístico de datos.
Entre las principales ventajas de la utilización del diseño factorial está en que este
significará un ahorro considerable de tiempo y material dedicado a los experimentos;
permite detectar e identificar los efectos simples y principales, así como aquellos
debidos a una combinación particular de niveles de los factores, proporcionando
información sobre los efectos de los factores y sobre sus relaciones entre sí.
4
Luis Romo Saltos, Métodos de Experimentación Científica, capítulo XI, página 261.
Cuando los factores que se van a investigar son numerosos, la principal desventaja
del experimento factorial estriba en su tamaño y complejidad; otra, radica en la
dificultad que tienen los experimentadores en interpretar los resultados porque
parecen presentar una confusa variedad de comparaciones de tratamientos.
FACTOR B FACTOR A
a1 a2
b1 a1b1 a2b1
b2 a1b2 a1b2
Si a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, entonces la
diferencia (a2 - a1) proporciona una medida del cambio del factor A. De similar
manera, si b1 representa el nivel inferior del factor B y b2 el nivel superior del factor,
entonces la diferencia (b2 - b1) proporciona una medida del cambio del factor B.
Supongamos que se realiza una sola medición de la variable respuesta para cada
combinación aibj , entonces la diferencia:
que se conocen como efectos simples o efectos parciales de a en cada nivel del factor
b. El efecto principal se mide promediando los efectos del factor en todos los niveles
del restante factor:
De similar manera:
son los efectos simples o efectos parciales de b en cada nivel del factor a. El efecto
principal se mide promediando los efectos del factor en todos los niveles del restante
factor:
2
6.2 DISEÑO FACTORIAL 2
Este diseño es aquel en el que intervienen dos factores a dos niveles cada factor; en
2
la expresión 2 , la base corresponde el número de niveles por factor y el exponente
al número de factores.
Los factores son A y B, cada uno a dos niveles: a1 y a2 para el factor A; y, b1 y b2 para
el factor B. El número de tratamientos posibles es igual al número de niveles del
factor A por el número de niveles del factor B, esto es: 2 x 2 = 4 tratamientos
específicos: a1b1, a1b2, a2b1 y a2b2.
En los que a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, b1
representa el nivel inferior del factor B y b2 el nivel superior del factor. Cada
tratamiento puede tener una o más repeticiones.
Nótese que el tratamiento que considera los niveles inferiores de los dos factores se
expresan como (1). Si los indicados son tratamientos, entonces, la suma de
cuadrados de tratamientos puede ser particionada para obtener los efectos principales
de cada factor así como su interacción, examinemos su procedimiento con la nueva
notación:
Los efectos simples del factor A para cada nivel del factor B son:
El efecto principal de A se mide promediando los efectos simples del factor en todos
los niveles factor B:
( (a - (1)) + (a - b) ) / 2 =
(ab + a - b - (1)) / 2 = Es el efecto principal del factor A.
El efecto principal de B se mide promediando los efectos simples del factor en todos
los niveles del factor A:
( (b - (1)) + (ab - a) ) / 2 =
(ab + b2 - a - (1)) / 2 = Es el efecto principal del factor B.
AB = ( (ab - b) - (a - (1)) ) / 2
= ( (ab - a) - (b2 - (1)) ) / 2
= (ab + (1) - b2 - a) ) / 2
Una forma sencilla y útil para establecer los signos de los coeficientes ortogonales
consiste en que para obtener el efecto principal de un factor, los coeficientes serán
positivos si el tratamiento tiene el nivel superior del factor y será negativo si tiene el
nivel inferior del factor. Por ejemplo, si deseamos encontrar el efecto principal del
factor A tenemos que los signos de los coeficientes serán:
FACTOR a1 b1 a2 b1 a 1 b2 a2 b2
(1) a b ab
A -1 +1 -1 +1
FACTOR a1 b1 a2 b1 a 1 b2 a2 b2
(1) a b ab
A -1 +1 -1 +1
B -1 -1 +1 +1
AB +1 -1 -1 +1
Los cuadrados medios esperados suponiendo que los factores A y B son fijos, son los
siguientes:
Para el residual σ2
Xijk = µ + φi + γk + εijk
Las hipótesis que se prueban corresponde a la dómima para cada factor e interacción
y a las replicaciones. Se comenzará probando que el factor A no tiene un efecto
significativo en la variables respuesta, esto es:
H0 : αi = 0
HA : αi ≠ 0
H0 : β j = 0
HA : β j ≠ 0
H0 : αβij = 0
HA : αβ ij ≠ 0
El cuadro que resume el análisis de varianza para un diseño factorial de 22 con “r”
replicaciones por tratamiento es:
En el cuadro de Análisis de Varianza que antecede, los grados de libertad y las sumas
de cuadrados de los factores A, B y a su interacción AB, son iguales a los grados de
libertad y a la suma de cuadrados de Tratamientos, respectivamente:
EJEMPLO:
RECUBRIMIENT HUMEDAD
BAJA ALTA
SOLUCION:
Formulación de Hipótesis:
Cálculos:
Nótese que de acuerdo con el modelo propuesto αi representa el efecto del primer
factor, R recubrimiento; β j representa el efecto del segundo factor, H humedad
relativa; αβij representa el efecto de la interacción RH; y, γk representa el efecto de las
replicaciones. Por otro lado, se observa que el experimento cuenta con seis
replicaciones en cada tratamiento, para facilitar el proceso de cálculo podemos
reordenar los datos del experimento y proceder de la siguiente manera:
TRATAMIENTO REPLICACIONES
P1 P2 P3 P4 P5 P6
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 2.143.794,83 3 714.598,28 5,877 0,0048 3,098
Del que se puede concluir que los tratamientos son significativamente diferentes y que
las replicaciones no tienen un efecto significativo diferencial. Procedemos a calcular la
significación del efecto principal de cada factor y su interacción.
EFECTO FACTORIAL
TRATAMIENTO
R H RH
-1 (4.659,00) (4.659,00) 4.659,00
h (6.358,00) 6.358,00 (6.358,00)
r 3.218,00 (3.218,00) (3.218,00)
rh 1.495,00 1.495,00 1.495,00
SUMA (6.304,00) (24,00) (3.422,00)
Divisor para el Efecto Principal 12 12 12
Efecto Principal (525) (2) (285)
Divisor para Suma de Cuadrados 24 24 24
Contribución a Suma de Cuadrados 1.655.850,67 24,00 487.920,17 2.143.794,83
Decisión:
En respuesta a las hipótesis planteadas y de acuerdo con el criterio de decisión
propuesto a un nivel de significación del 5%, tenemos que:
Por último, decido aceptar la hipótesis nula de la cuarta formulación de hipótesis, por
la que concluyo que las repeticiones no son significativas, 0.491 ≤ 4.54.
Para cada factor es prudente determinar su efecto principal así como los efectos
simples a cada nivel del otro factor.
Así, manteniendo constante la humedad relativa baja, h1, el efecto del recubrimiento
es medido mediante:
r2h1 - r1h1 = r - (1) = la medida del efecto de r en h1
(3.218 - 4.659) / 6 = - 240,17
lo que nos indica que si mantenemos constante la humedad relativa del 20-25%, al
colocar en el aluminio el recubrimiento anodizado, la fatiga de corrosión del aluminio
disminuye en 240,17 miles de ciclos de fracaso, unidad de medida de la variable
respuesta.
que nos indica que manteniendo constante el nivel alto de la humedad relativa, 86-
91%, el recubrimiento anodizado en el aluminio disminuye la fatiga de corrosión en
810,5 miles de ciclos de fracaso.
Otra forma de obtener el mismo resultado es utilizar, la suma del efecto factorial –
6.304 y dividirlo para el “Divisor para el Efecto Principal” 12
que nos indica que, cuando el metal no tiene recubrimiento, el cambio de la humedad
relativa baja a la humedad relativa alta, produce un incremento en la fatiga de
corrosión del metal de 283,17 miles de ciclos de fracaso.
El cálculo del efecto principal se realiza promediando los efectos simples del factor,
por lo tanto, el efecto principal de H es igual a: ( 283,17 + (-287,17)) / 2 = -2, lo que
nos indica que al cambiar la humedad relativa de la baja a la alta la fatiga de corrosión
se decrementa en promedio en 2 miles de ciclos de fracaso. La comprobación de si
este efecto promedio es significativo en el cambio de la variable respuesta, se realizó
al docimar la segunda hipótesis H0 : β j = 0, la misma que fue aceptada conforme el
cuadro de análisis de varianza.
Dado que la respuesta del factor es diferencial entre los niveles del otro factor, la
interacción tiene una magnitud, que debe ser comprobada si ésta es o no significativa
en el cambio de la variable respuesta. La mejor manera de probar si la interacción es
significativa, si esta sospecha es o no verdadera, es mediante una prueba de hipótesis
que docime: H0 : αβ ij = 0, propuesta como tercera hipótesis, realizada la prueba se
decidió que la magnitud de interacción encontrada no es significativa al nivel del 5%,
por lo tanto se aceptó la hipótesis nula planteada.
3
6.3 DISEÑO FACTORIAL 2
El diseño factorial dos al cubo es aquel en el que intervienen tres factores a dos
3
niveles por cada factor; en la expresión 2 , la base corresponde el número de niveles
por factor y el exponente al número de factores.
Los factores son A, B y C, cada uno a dos niveles: a1 y a2 para el factor A; b1 y b2 para
el factor B; y, c1 y c2 para el factor C. El número de tratamientos posibles es igual 23,
que corresponde al producto del número de niveles de A por el número de niveles de
B y de C, esto es: 2 x 2 x 2 = 8 tratamientos específicos: a1b1c1, a1b1c2, a1b2c1, a1b2c2,
a2b1c1, a2b1c2, a2b2c1, a2b2c2,
en el que:
Las hipótesis que se prueban corresponden a la dócima para cada factor e interacción
y a las replicaciones, esto es:
H0 : αi = 0 H0 : βj = 0 H0 : γc = 0 H0 : αβ ij = 0
HA : αi ≠ 0 HA : β j ≠ 0 HA : γc ≠ 0 HA : αβ ij ≠ 0
Como era de esperarse, existen 7 formulaciones de hipótesis que deben ser probadas
a un nivel de significación determinado; cada hipótesis corresponde a un factor
determinado o a la interacción entre éstos y la última formulación desea probar la
significación de las replicaciones del experimento. Las pruebas de las interacciones
son importantes para verificar si los factores son mutuamente independientes; si la
interacción está presente, debemos tener cuidado con el análisis de los efectos
principales, sólo aquellos que son significativos tienen sentido en su análisis, aquellos
efectos principales no significativos en presencia de interacción podrían muy bien ser
el resultado del encubrimiento y plantear la necesidad de observar la influencia de
cada factor para niveles fijos de otro factor.
El cuadro que resume el análisis de varianza para un diseño factorial de 23 con “r”
replicaciones por tratamiento es:
De igual manera se verifica que las sumas de cuadrados de los factores y sus
interacciones son mutuamente ortogonales y por tanto son componentes
independientes de la suma de cuadrados de tratamientos de forma que:
EJEMPLO:
FACTOR REPETICIONES
Lisina Proteína Sexo 1 2 3 4 5
0 12 M 1.11 0.97 1.09 0.99 0.85
H 1.03 0.97 0.99 0.99 0.99
14 M 1.52 1.45 1.27 1.22 1.67
H 1.48 1.22 1.53 1.19 1.16
SOLUCION
Formulación de Hipótesis:
H0 : αi = 0 La lisina no tiene un efecto significativo en el incremento
diario promedio del peso de cerdos.
HA : αi ≠ 0 La lisina tiene un efecto significativo en el incremento
diario promedio del peso de cerdos.
Las restantes hipótesis tienen similar contexto de redacción, por tanto se presentará la
formulación con la indicación del factor o interacción que está docimándose.
Análisis de varianza de dos factores con una sola muestra por grupo
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 0,93647 7 0,134 6,527 0,000 2,313
Error 0,68888 32 0,020
Total 1,62535 39
Procede, encontrar mayor explicación sobre las causas que originan la variación
significativa de los tratamientos; para lo cual debe examinarse el efecto de cada factor
y de cada interacción en la variable respuesta a través de su contribución a la suma
de cuadrados de tratamientos. Se determinarán, entonces, los multiplicadores
ortogonales para cada caso y su contribución a la SCE, con igual procedimiento de
cálculo que el empleado anteriormente, cuyos resultados se expresan seguidamente.
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 0,93647 7 0,134 6,527 0,000 2,313
Se desprende del cuadro presentado que la Proteína es el factor proteína que más
aporta a la variación registrada como suma de cuadrados de tratamientos, SCE, con
el 62%; la interacción lisina proteína, LP, es el segundo componente que más aporta a
la SCE con el 18.6%; y, el factor Sexo aporta con el 9.8% ; éstos tres efectos
factoriales explican el 90% de la variación en los tratamientos; la participación de los
restantes efectos factoriales es relativamente marginal.
Decisión
Con los resultados presentados en el cuadro anterior, tomamos la decisión de
rechazar la hipótesis nula planteada para los factores: Proteína y Sexo; y para la
interacción Lisina Proteína, se concluye que éstos tienen un efecto significativo en el
incremento del peso en el cerdo. Los restantes efectos factoriales calculados: Lisina y
las interacciones LS, PS y LPS no tienen un efecto significativo en la variable
respuesta.
Los resultados numéricos del cálculo de los efectos nos indica que el factor Proteína
es el más grande y tiene una dirección positiva, esto es, que el aumento en el
porcentaje de proteína del 12 al 14%, incrementa el peso del cerdo en 0.241
kilogramos; el efecto principal de la lisina también es positivo aunque su magnitud no
es significativa, apenas 0.046 kg.; en el caso del factor sexo al analizar su efecto
principal es importante considerar que el nivel inferior del factor es macho y el nivel
superior es hembra, el signo del efecto nos indica que el incremento del peso del
macho es superior al incremento del peso de la hembra y su magnitud nos indica que
del macho a la hembra el incremento del peso disminuye en 0.096 kg. Miremos con
algún detalle el comportamiento de los componentes de cada efecto principal.
Nótese que para obtener el efecto simple, en cada diferencia dividimos para 5 para
promediar ésta por unidad experimental; una forma alternativa hubiera sido restar sus
promedios, que en este caso sería igual a: 1.288 – 1.002 = 0.286, exactamente igual;
los demás efectos simples se calculan de forma similar. El signo del efecto principal
(+) nos indica que el poner lisina en la dieta de los cerdos ( del 0% al 0.6%)
incrementa su peso en 0.046 kilogramos en promedio, valor que no es significativo.
En proteína:
Por sí misma: p – (1) = (7.13 – 5.01) / 5 = 0.424
Con lisina: lp – l = (6.53 – 6.44) / 5 = 0.018
Con sexo: ps – s = (6.58 – 4.97) / 5 = 0.322
Con lisina y sexo: lps – ls = (6.32 – 5.32) / 5 = 0.200
Sumatoria: 0.964
Efecto principal: 0.964 / 4 = 0.241
En este caso, el resultado del cálculo del efecto principal nos indica que el factor
Proteína tiene un efecto positivo en la dieta del cerdo; al incrementarse un 2% (del
12% al 14%) el peso del cerdo se incrementa en 0.241 kilogramos en promedio, valor
significativo al 5%; nótese que el aporte de la proteína con los restantes factores es
positivo y muy significativo el aporte de este factor con el sexo que representa el 33%
del aporte total de la proteína.
En Sexo:
Por sí misma: s – (1) = (4.97 – 5.01) / 5 = -0.008
Con lisina: ls – l = (5.32 – 6.44) / 5 = -0.224
Con proteína: ps – p = (6.58 – 7.13) / 5 = -0.110
Con lisina y proteína: lps – lp = (6.32 – 6.53) / 5 = -0.042
Sumatoria: -0.384
Efecto principal: -0.384 / 4 = -0.096
Este método proporciona un procedimiento más eficaz para calcular los totales de los
efectos factoriales; éste consiste en:
TRATAMIENTO COLUMNA
Efecto factorial Total C1 C2 C3
(1) 5.01 9.98 23.69 48.3
s 4.97 13.71 24.61 -1.92
p 7.13 11.76 -0.59 4.82
ps 6.58 12.85 -1.33 0.4
l 6.44 -0.04 3.73 0.92
ls 5.32 -0.55 1.09 -0.74
lp 6.53 -1.12 -0.51 -2.64
lps 6.32 -0.21 0.91 1.42
La tercera columna se forma con los valores de la segunda y sus resultados son
exactamente los mismos que aquellos obtenidos en el desarrollo del ejemplo.
En este diseño intervienen cuatro factores a dos niveles cada factor; es una extensión
de los diseños descritos anteriormente y su procedimiento de prueba y cálculo son
similares. El número de tratamientos es 16 que corresponden a la multiplicación del
número de niveles de cada factor: 2 x 2 x 2 x 2 = 16
TRATAMIENTO NOTACION
a1b1c1d1 (1)
a1b1c1d2 d
a1b1c2d1 c
a1b1c2d2 cd
a1b2c1d1 b
a1b2c1d2 bd
a1b2c2d1 bc
a1b2c2d2 bcd
a2b1c1d1 a
a2b1c1d2 ad
a2b1c2d1 ac
a2b1c2d2 acd
a2b2c1d1 ab
a2b2c1d2 abd
a2b2c2d1 abc
a2b2c2d2 abcd
Al igual que en los casos anteriores, la presencia o ausencia de la letra del factor en la
denominación del tratamiento determina el signo “+” en presencia o “-” en ausencia;
para las interacciones se multiplican los signos de los factores que intervienen en la
interacción.
En todos los casos el divisor para el efecto principal es “8r”, en el que el número “8”
representa el número de comparaciones simples que deben efectuarse en cada factor
y “r” corresponde al número de tratamientos; el efecto principal del factor A, por
ejemplo, se obtiene multiplicando el total de cada tratamiento por el coeficiente
ortogonal de la columna “A” y su suma (A) la dividimos para “8r”.
en el que:
EJEMPLO
Los datos obtenidos en las mediciones del porcentaje ponderado del compuesto de
fósforo para cada tratamiento se presenta en el siguiente cuadro:
REPETICIONES
TRATAMIENTO R1 R2 Total
(1) 30.3 28.6 58.9
a 28.5 31.4 59.9
b 24.5 25.6 50.1
ab 25.9 27.2 53.1
c 24.8 23.4 48.2
ac 26.9 23.8 50.7
bc 24.8 27.8 52.6
abc 22.2 24.9 47.1
d 31.7 33.5 65.2
ad 24.6 26.2 50.8
bd 27.6 30.6 58.2
abd 26.3 27.8 54.1
cd 29.9 27.7 57.6
acd 26.8 24.2 51
bcd 26.4 24.9 51.3
abcd 26.9 29.3 56.2
Total 428.1 436.9 865
Nótese que los tratamientos están expresados con la notación simplificada; y que en
adelante se omitirá todo el procedimiento inicial de la solución del problema para
presentar directamente los resultados del procesamiento.
Análisis de varianza
RESUMEN Cuenta Suma Promedio Varianza
(1) 2 58.9 29.45 1.445
a 2 59.9 29.95 4.205
b 2 50.1 25.05 0.605
ab 2 53.1 26.55 0.845
c 2 48.2 24.1 0.98
ac 2 50.7 25.35 4.805
bc 2 52.6 26.3 4.5
abc 2 47.1 23.55 3.645
d 2 65.2 32.6 1.62
ad 2 50.8 25.4 1.28
bd 2 58.2 29.1 4.5
abd 2 54.1 27.05 1.125
cd 2 57.6 28.8 2.42
acd 2 51 25.5 3.38
bcd 2 51.3 25.65 1.125
abcd 2 56.2 28.1 2.88
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamientos 178.149 15 11.877 4.828 2,352 0,000
Total 217.509 31
Los resultados que se exponen en el cuadro anterior, nos permiten tomar las
decisiones necesarias para explicar el experimento; decidimos primero que el conjunto
de los tratamientos es significativamente diferente, no así las repeticiones.
Contrastada la hipótesis nula referente a que el factor, o alguna interacción, no tiene
efecto significativo en el cambio de la variable respuesta, encontramos que ésta
hipótesis debe ser rechazada para todos los factores, A, B, C y D; y, para las
interacciones AD, BC, ABD y ACD. Por tanto, concluimos que el porcentaje de fósforo
en el refinamiento (A), el porcentaje de material redisuelto (B), el tiempo de mezclado
(C) y el tiempo de duración (D) si causan un efecto significativo en la concentración de
un compuesto específico de fósforo en un material a ser moldeado, medido en el
porcentaje ponderado del compuesto de fósforo. También se concluye que existe un
efecto importante en la acción conjunta del porcentaje de fósforo y el tiempo de
duración (AD); entre el porcentaje de material redisuelto y el tiempo de mezclado (BC);
y en la acción conjunta de los factores ABD y ACD; una consecuencia inmediata es
considerar la posibilidad de que los factores que intervienen en el experimento no son
mutuamente independientes, que tienen una acción conjunta importante que debe ser
analizada con mayor profundidad.
Otra forma de obtener similar respuesta es a través del método de Yates, que
calculado conforme el procedimiento antes descrito y con los datos del problema se
tienen los siguientes resultados:
METODO DE YATES
CALCULO DEL EFECTO PRINCIPAL Y LA CONTRIBUCION A LA SUMA DE CUADRADOS
Es aquel en el que intervienen tres factores, el factor A con a niveles y el factor B con
b niveles y el factor C con c niveles; el número de tratamientos es igual a “a x b x c”; si
tenemos r replicaciones en el experimento, entonces el número de observaciones y
unidades experimentales es de “a x b x c x r”, en el que éstas se asignan
aleatoriamente a cada tratamiento.
EJEMPLO
El aumento diario promedio del peso de los cerdos expresado en kilos, se presenta en
el siguiente cuadro:
FACTORES REPLICACION
LISINA METIONINA PROTEINA TRATAMIENTO R1 R2 TOTAL
0 0 12 b1m1p1 1.11 0.97 2.08
14 b1m1p2 1.52 1.45 2.97
0.025 12 b1m2p1 1.09 0.99 2.08
14 b1m2p2 1.27 1.22 2.49
0.05 12 b1m3p1 0.85 1.21 2.06
14 b1m3p2 1.67 1.24 2.91
0.05 0 12 b2m1p1 1.3 1 2.3
14 b2m1p2 1.55 1.53 3.08
0.025 12 b2m2p1 1.03 1.21 2.24
14 b2m2p2 1.24 1.34 2.58
0.05 12 b2m3p1 1.12 0.96 2.08
14 b2m3p2 1.76 1.27 3.03
0.1 0 12 b3m1p1 1.22 1.13 2.35
14 b3m1p2 1.38 1.08 2.46
0.025 12 b3m2p1 1.34 1.41 2.75
14 b3m2p2 1.4 1.21 2.61
0.05 12 b3m3p1 1.34 1.19 2.53
14 b3m3p2 1.46 1.39 2.85
0.15 0 12 b4m1p1 1.19 1.03 2.22
14 b4m1p2 0.8 1.29 2.09
0.025 12 b4m2p1 1.36 1.16 2.52
14 b4m2p2 1.42 1.39 2.81
0.05 12 b4m3p1 1.46 1.03 2.49
14 b4m3p2 1.62 1.27 2.89
TOTAL 31.5 28.97 60.47
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamiento 12.756 23 0,056 1,740 1,993 0,092
Error 0,7653 24 0,032
Total 20.409 47
FC = (60.47)2 / 48 = 76.1796
3. Para obtener la suma de cuadrados de cada factor, fórmese para cada par de
factores un cuadro de dos vías, sumando las observaciones que correspondan
para cada combinación de los niveles de cada factor “i,j”
LISINA
METIONINA 0 0.05 0.1 0.15 TOTAL
0 5.05 5.38 4.81 4.31 19.55
0.025 4.57 4.82 5.36 5.33 20.08
0.05 4.97 5.11 5.38 5.38 20.84
TOTAL 14.59 15.31 15.55 15.02 60.47
Total tabla LM: (5.052 + 5.382 + 4.812 + ... + 5.382) / 4 - 76.1796 = 0.3496
El divisor “4” corresponde al número de observaciones que contiene cada valor del
cuadro: 5.05, 5.38, 4.81, etc..
5. Para calcular la suma de cuadrados de un factor, (L, M), eleve al cuadrado los
totales marginales del factor, divida para el número de observaciones que
contiene cada total marginal y réstele FC;
De igual forma se opera con los siguientes cuadros de dos vías: Lisina – Proteína y
Metionina – Proteína, con los siguientes resultados:
LISINA
PROTEINA 0 0.05 0.1 0.15 TOTAL
12 6.22 6.62 7.63 7.23 27.7
14 8.37 8.69 7.92 7.79 32.77
TOTAL 14.59 15.31 15.55 15.02 60.47
Total tabla LP: (6.222 + 6.622 + 7.632 + ... + 7.792) / 6 - 76.1796 = 0.8181
2 2 2 2
Lisina (L): (14.59 + 15.31 + 15.55 + 15.02 ) /12 - 76.1796 = 0.0427
2 2
Proteína (P): ( 27.7 + 32.77 ) / 24 – 76.1796 = 0.5355
Interacción LP: 0.8181 – (0.0427 + 0.5355) = 0.2399
METIONINA
PROTEINA 0 0.025 0.05 TOTAL
12 8.95 9.59 9.16 27.7
14 10.6 10.49 11.68 32.77
TOTAL 19.55 20.08 20.84 60.47
2 2 2
Total tabla MP: (8.95 + 9.59 + ... + 11.68 ) / 8 - 76.1796 = 0.6702
Metionina (M): ( 19.552 + 20.082 + 20.842 ) / 16 – 76.1796 = 0.0526
Proteína (P): ( 27.72 + 32.772 ) / 24 – 76.1796 = 0.5355
Interacción LP: 0.6702 – (0.0526 + 0.5355) = 0.08121
Se lo hace por diferencia, toda vez que las particiones realizadas a la SCE son
mutuamente ortogonales y por tanto componentes independientes de la SCE. Debe
tenerse en cuenta que los grados de libertad están en función del número de niveles
de cada factor y sus interacciones tienen grados de libertad igual a la multiplicación de
los grados de libertad de los factores que en él intervienen. Con estos valores
conformamos el cuadro definitivo del análisis de varianza, conforme se presenta a
continuación.
ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamiento 12.756 23 0,056 1,740 1,993 0,092
Total 20.409 47
Por último, considero prudente recomendar que en los diseños factoriales puede ser
importante discriminar de la variación total aquella que corresponda a las
replicaciones, ésta separación disminuye la variación del error experimental y hace
más sensibles las pruebas para factores e interacciones.