Sunteți pe pagina 1din 95

CAPITULO I

DISEÑO DE INVESTIGACIONES EXPERIMENTALES

“La observación de los fenómenos naturales, la acumulación de datos de observación


y experimentales, la comparación sistemática de especimenes, la formulación de
esquemas de clasificación, la cuantificación de la información acumulada son
actividades esenciales para el desarrollo de la Ciencia que en conjunto constituyen el
cuerpo básico de conocimiento para eventualmente lograr una unificación teórica a un
alto nivel de abstracción”, así se expresa el Dr. Luís Romo Saltos1 al desarrollar su
capítulo sobre Observación y Experiencia en su libro “Cuestiones Lógico
2
Filosóficas de la Ciencia”

El conocimiento científico deviene del reconocimiento de la uniformidad de


características, modelos y comportamientos observados en un evento o hecho,
realizado por observadores independientes o mediante evidencia material. Una
característica de la ciencia es su capacidad para plantear explicaciones de los
fenómenos en estudio de manera corroborable o verificable, y su propósito la
comprensión y la descripción de la ocurrencia de los fenómenos que forman la
realidad concreta.

En las ciencias empíricas, la principal característica es que dependen de manera


directa de la experiencia para demostrar el valor de verdad de sus enunciados y para
ello existen dos formas de realizar tal demostración: la observación sistemática y la
experimentación.

En la observación sistemática, el investigador no interviene en el fenómeno de


estudio, asume el papel de observador diligente para advertir, medir y registrar
sistemáticamente las características significativas del fenómeno en estudio.

En la experimentación, el investigador modifica de manera deliberada, intencionada y


controlada algunos factores cuyo efecto sobre el objeto de estudio se quiere conocer.
De allí que se defina como un experimento al conjunto de observaciones
específicamente definidas, efectuadas bajo condiciones controladas y reproducibles.

1.1 CONCEPTOS BASICOS

El diseño de experimentos utiliza con relativa frecuencia palabras, vocablos o


expresiones que deben ser entendidas en un contexto definido; para este efecto, se
puntualiza la definición de los términos más utilizados.

1.1.1 DISEÑAR UN EXPERIMENTO

Diseñar un experimento significa planificar un conjunto de acciones perfectamente


definidas que serán realizadas bajo condiciones totalmente controladas y
reproducibles de modo que se asegure obtener los datos apropiados que permitan un
análisis objetivo que conduzca a deducciones válidas con respecto al problema
establecido. Esto implica que la persona que formule el diseño entienda claramente
los objetivos de la investigación propuesta.

1
Ecuatoriano, Doctor en Ciencias, PhD., especializado en Fisicoquímica, Termodinámica y
Coloideofísica. Dignísimo profesor de la Universidad Central del Ecuador, autor de 9 obras científicas y
cinco obras filosóficas; miembro de varias academias científicas.
2
Cuestiones Lógico-Filosóficas de la Ciencia, primera edición, 1.994, Editorial Universitaria, Quito.
INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

1.1.2 PROPOSITO DE UN DISEÑO EXPERIMENTAL

El propósito de cualquier diseño experimental es proporcionar la máxima cantidad de


información al mínimo costo (con ahorro de tiempo, dinero, personal y material
experimental). Es importante que el diseño, plan o programa de prueba sea tan
simple como sea posible. El investigador que planee un experimento deberá
esforzarse por lograr eficiencia estadística y económica.

1.1.3 TRATAMIENTO

Para el estadístico, la palabra tratamiento se refiere al conjunto particular de


condiciones experimentales que se aplican a cada unidad experimental en el diseño
seleccionado. Estas condiciones son controladas por el investigador y a cada unidad
experimental le corresponde un conjunto particular de condiciones; de una unidad
experimental a otra pueden variar las condiciones de aplicación.

1.1.4 FACTOR

En el lenguaje del diseño experimental, a una variable independiente se le conoce


como Factor y es independiente porque no depende del fenómeno en estudio; es
aquella variable que está siendo controlada y modificada intencionalmente por el
investigador para conocer el efecto que esta modificación intencional produce en la
variable respuesta observada en la unidad experimental. Por lo general se usan letras
mayúsculas latinas para representarlas.

1.1.5 NIVELES DE FACTOR

A los diversos valores o clasificaciones del Factor se le conoce como Niveles de


Factor. Estos niveles son los que permiten la modificación controlada del factor para
medir su efecto en la variable respuesta observada en cada unidad experimental.

1.1.6 UNIDAD EXPERIMENTAL

Es la unidad de observación y análisis a la cual se le aplica un solo tratamiento en una


realización del experimento básico. En todas las unidades experimentales en estudio
se observa, mide y registra la misma característica o variable, conocida como variable
respuesta; el valor que ésta variable registra expresa el efecto de la aplicación
controlada de un factor.

1.1.7 VARIABLE RESPUESTA

Conocida también como variable dependiente, por variable respuesta entenderemos a


la característica, variable, que será observada en cada unidad experimental; es la
variable que mide o que manifiesta el efecto que produce cada tratamiento en las
unidades experimentales.

1.1.8 ERROR EXPERIMENTAL

Este término describe el fracaso de llegar a resultados idénticos con dos o más
unidades experimentales sometidas al mismo tratamiento y bajo iguales condiciones
de experimentación. Si a dos o más unidades experimentales se les aplica igual
tratamiento y condiciones de experimentación, si son tratadas idénticamente, es de

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 2


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

esperar que den igual resultado, el fracaso de obtener igual resultado en estas
condiciones se conoce como error experimental.

La palabra “Error Experimental” tiene para el Estadístico un significado mucho más


general que en una situación particular y reflejará:

1. Errores de experimentación
2. Errores de observación
3. Errores de medición
4. La variación del material experimental
5. Los efectos combinados de todos los factores extraños que pudieran influir
en las características en estudio.

Algunas recomendaciones generales para reducir el error experimental sugieren


adoptar una o más de las técnicas siguientes:

1. Usar material experimental más homogéneo o por la estratificación


cuidadosa del material disponible.
2. Utilizar información proporcionada por variables aleatorias relacionadas.
3. Tener más cuidado en la dirección, ejecución y control del experimento.
4. Usar un diseño experimental más eficiente.

1.2 PRINCIPIOS BASICOS DEL DISEÑO EXPERIMENTAL

Hay tres principios básicos del diseño experimental: reproducción, aleatorización y


control local.

REPRODUCCION: Por reproducción se debe entender la repetición del experimento


básico. La reproducción es deseable porque: 1) proporciona una estimación del
error experimental que actúa como “unidad básica de medida”; 2) proporciona una
estimación más aproximada del error experimental; y, 3) nos capacita para obtener
una estimación más precisa del efecto medio de cualquier factor.

ALEATORIZACION: Es la asignación al azar del tratamiento a las unidades


experimentales, que asegura independencia de errores. La aleatorización hace válida
la prueba de significación, haciéndola apropiada para analizar datos como si la
suposición de errores independientes fuera cierta. No se dice que la aleatorización
garantiza la independencia, sino sólo que nos permite proceder como si la
independencia fuera un hecho.

La completa y verdadera independencia de errores es sólo ideal, porque los errores


asociados con unidades experimentales adyacentes en espacio o tiempo tenderán a
correlacionarse.

CONTROL LOCAL: La función del control local es hacer más eficiente el diseño
experimental, hace más sensitiva cualquier prueba de significancia o hace más
poderosos los procedimientos de prueba; este aumento de eficiencia resulta porque el
uso adecuado del control local reducirá la magnitud de la estimación del error
experimental. En este sentido el control local se refiere a la cantidad de balanceo,
bloqueo y agrupamiento de las unidades experimentales.

Agrupamiento: Por agrupamiento se debe entender la colocación de un conjunto de


unidades experimentales homogéneas en grupos diversos, de modo que los

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 3


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

diferentes grupos puedan sujetarse a distintos tratamientos. Estos grupos pueden


constar de diferente número de unidades experimentales.

Bloqueo: Damos a entender la distribución de las unidades experimentales en


bloques, de tal manera que la mayor parte de la variación predecible entre las
unidades quede confundida con el efecto de los bloques.

Balanceo: Damos a entender que la obtención de las unidades experimentales, el


agrupamiento, el bloqueo y la asignación de los tratamientos a las unidades
experimentales sea tal modo que resulte una configuración balanceada.

1.3 COMO PLANEAR UN EXPERIMENTO

Planear un experimento es buscar el valor de verdad de un evento en particular, es un


trabajo dedicado a logro del conocimiento aislando el evento en estudio de su estado
natural. A este efecto, el investigador debe seguir un procedimiento concatenado y
responder con precisión los cuestionamientos de cada fase del planeamiento
experimental.

De forma similar al un proceso de investigación científica, la planificación de un


experimento se resume en tres fases perfectamente definidas:

1. Fase 1. Diseño, planificación y organización del experimento


2. Fase 2. Ejecución del experimento
3. Fase 3. Procesamiento y análisis de resultados del experimento.

Cada fase contiene etapas conforme se expresa a continuación:

Fase 1. Diseño, planificación y organización del experimento:

1. Definir y delimitar el experimento. Consiste en establecer con claridad y


precisión lo que se desea experimentar; determinar la unidad experimental y
las características que serán observadas en la unidad experimental (variables
respuesta), los factores que inciden o actúan sobre las características que se
observarán en la unidad experimental y establecer aquellos que serán
controlados y la forma o manera de estandarizar el comportamiento de
aquellos factores que no serán controlados.
2. Justificar la importancia y relevancia del experimento. Comienza con la
recopilación bibliográfica de toda referencia bibliográfica relevante sobre el
tema de experimentación, los resultados alcanzados por otros investigadores,
los temas que requieren mayor investigación y aquellos que han sido
investigados. Explicitar las razones que fundamentan y sustentan la ejecución
del proceso experimental.
3. Establecer los objetivos del estudio. En términos de los resultados que se
espera alcanzar al término de la experimentación. Debe recordarse que todo
objetivo debe ser específico, medible, observable y fundamentalmente
alcanzable.
4. Formular las hipótesis de trabajo. Establecer con precisión las hipótesis de
trabajo que guiarán la experimentación, las mismas que serán docimadas con
los resultados del experimento. Es imprescindible que para el planteamiento
definitivo de las hipótesis, éstas consideren una hipótesis para cada factor a
controlar y para sus interacciones. Recordemos que la formulación de una
hipótesis de trabajo requiere observar una estructura científica, gramatical,

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 4


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

lógica y matemática; y que, toda hipótesis debe ser observable, medible


mensurable y verificable.
5. Diseñar el programa de experimentación. Definida la unidad experimental
es imperativo establecer las características básicas que cada unidad debe
reunir para su inclusión en el estudio, su ubicación y proceso de selección; las
variables respuesta que serán observadas en la unidades experimentales,
momento, tiempos, forma y procedimientos de observación y medición de
cada variable respuesta; los factores que serán controlados, forma y
procedimiento de control y dosificación de los niveles de factor que serán
utilizados; de igual manera se indicará la forma en que la ocurrencia de los
factores no controlados será estandariza para todas las unidades
experimentales. Conjuntamente con la forma y procedimientos para la
ejecución del experimento, así como para la observación y medición de la
variable respuesta y para el control del factor, se establecerán la
instrumentación técnica requerida.
Todos estos elementos sirven para establecer el mejor diseño experimental a
ser utilizado y con ello los procedimientos estadísticos de análisis; es
conveniente, prever los posibles resultados del experimento, así como las
limitaciones en términos de tiempo, instrumentación, recursos y resultados.
El diseño implica no sólo precisar lo antes citado, incluye elaborar un programa
sistemático y completo de ejecución del experimento que establezca las
técnicas experimentales que serán utilizadas.

Fase 2. Ejecución del experimento:

1. Establecer los procesos de control. Del procedimiento de ejecución del


experimento, de la observación y registro de la variable respuesta y de la
dosificación de los factores.
2. Diseñar instrumentos de registro. De control y verificación de resultados,
así como de observación y medición de la variable respuesta y de factores.
3. Ejecución del experimento. Aplicar los procedimientos, técnicas y rutinas
experimentales diseñadas.

Fase 3. Procesamiento y análisis de resultados:

1. Procesamiento de la información. Consiste en depurar los datos obtenidos


e ingresar al computador la información de manera sistemática.
2. Análisis de resultados. El análisis implica la aplicación de técnicas
estadísticas previstas para el análisis de datos experimentales, docimar las
hipótesis planteadas, plantear sus conclusiones; establecer las limitaciones a
las conclusiones obtenidas a partir de la ejecución experimental y a la
evidencia de los datos.
3. Elaborar el informe final. Consiste en elaborar la memoria técnica del
experimento que recoja toda la información relevante desde el diseño hasta el
análisis y conclusiones de sus resultados.

Con el procedimiento propuesto se desea responder a preguntas tales como:


1. ¿Qué se va a medir, cómo, dónde?
2. ¿Qué características que se van a analizar?
3. ¿Qué factores afectan las características que se van a analizar?
4. ¿Cuáles de esos factores se estudiarán en esta investigación?
5. ¿Cuántas veces debería ejecutarse el experimento básico?
6. ¿Cuál sería la forma de los análisis?
7. ¿A partir de qué valor se considera importante un efecto?

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 5


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

1.4 LA VARIANZA

Es un estadígrafo que proporciona una medida del grado de dispersión, de


esparcimiento o el grado de concentración de los valores de la variable respecto a su
valor promedio. Se la define como el desvío medio cuadrático de los valores de
variable respecto a su valor central. Como parámetro, se denota por σ2 y representa
2
a la varianza poblacional; como estadística se denota por s y representa a la
varianza muestral. La formulación de cálculo es :

Parámetro: σ 2
=
∑ (x i − µ )2
σ 2
=
∑x 2
i
− µ2
N N

Estadística: s 2
= ∑ ( xi − x ) 2
s 2
=
∑x i
2
− (∑ x ) 2 / n
n −1 n −1

La varianza muestral, s2, como estimador de la varianza poblacional es consistente,


eficiente y suficiente; si se calcula con los grados de libertad como denominador (n -
1) el estimador es además insesgado

La distribución en el muestreo de la varianza tiene características específicas en


función de si la muestra proviene de una población normal, o de cualquier población,
conforme se expone seguidamente:

Muestras de una población normal.

La distribución de las varianzas muestrales tiene la forma de una distribución χ2, el


valor medio de una distribución χ2 es "v" y su varianza es "2v"; de forma que el valor
esperado de la distribución en el muestreo de la varianza muestral es igual a su
parámetro, esto es:

E (s 2 ) = σ 2

La varianza de la distribución en el muestreo de la varianza muestral es:

2σ 4
Var ( s 2 ) =
n −1

2σ 4
El error estándar es igual a: es ( s ) = Var ( s 2 ) =
n −1

Muestras de cualquier población:

Desconociendo si la muestra proviene de una población normal o conociendo que no


proviene de una población normal; tenemos que el valor esperado de la distribución en
el muestreo de la varianza muestral es igual al valor poblacional, esto es:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 6


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

E(s 2 ) = σ 2

La varianza de la distribución en el muestreo de la varianza muestral es:

1 (n − 3) 2 
Var ( s ) =  µ4 − µ2
n (n − 1) 

en donde µ4 y µ2 son momentos del universo de valores individuales

El error estándar es igual a: es es( s) = Var ( s 2 )

1.5 LA DESVIACION TIPICA

Es la raíz cuadrada de la varianza y se expresa en unidades de la variable; es un


estadígrafo que proporciona una medida del grado de dispersión o el grado de
concentración de los valores de la variable respecto a su valor promedio. Se la define
como el desvío medio de los valores de variable respecto a su valor central. Como
parámetro, se denota por σ y representa a la varianza poblacional; como estadística
se denota por s y representa a la varianza muestral. Su formulación de cálculo es
sencilla:

σ = σ2 s = s2

La desviación típica muestral, s, como estimador de la desviación típica poblacional es


consistente, eficiente y suficiente; si se calcula con el denominador (n - 1) el estimador
es insesgado si la muestra proviene de una población normal.

Las principales características de la distribución en el muestreo de la desviación típica


muestral son las siguientes:

Muestras de una población normal

El valor esperado de la distribución en el muestreo de la desviación típica para


muestras provenientes de una población normal se calcula mediante:

2 ((n − 2) / 2)!
E ( s) = σ
n − 1 ((n − 3) / 2)!

y su error estándar:
σ
es( s) =
2n

Muestras de cualquier universo:

No existen fórmulas exactas para el valor esperado; cuando las muestras son
relativamente grandes ( n ≥ 30) la esperanza matemática de la distribución en el
muestreo del desvío típico muestral es igual a:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 7


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

E (s) ≅ σ

El error estándar de la desviación típica muestral es aproximadamente igual a :

σ
es ( s) = (r2 / 2) + 1
2n

µ4
en el que: r2 =
µ 22

1.6 ANALISIS DE VARIANZA

El procedimiento básico de análisis para un diseño experimental es el conocido como


Análisis de Varianza que consiste en partir la suma de los mínimos cuadrados debido
a la variación total, de una serie de observaciones, en las sumas de los mínimos
cuadrados correspondientes a las variantes independientes incluidas en el plan
experimental; y, en la suma de los mínimos cuadrados del error experimental.

Los valores registrados corresponden a la variable respuesta observados en cada


unidad experimental; la variación que registren los diferentes valores de la variable
respuesta es una medida del efecto que produce uno o más factores en esta variable
y del error experimental. El objetivo del Análisis de Varianza es particionar la variación
total observada en aquella debida a efecto del factor o factores incluidos en el diseño
y en aquella debida al error experimental.

Si el experimento utiliza un solo factor o variable independiente, entonces la suma de


cuadrados de la variación total observada en la variable respuesta se divide en dos
partes: la primera que determina la variación debido al efecto del factor considerado, o
variación entre los tratamientos; y la segunda, que representa a la variación debido al
error experimental, esto es:

Variación total = Variación entre tratamientos + Variación del Error

Si los tratamientos tienen igual efecto en la variable respuesta, los valores de ésta son
en promedio iguales entre los tratamientos, por tanto no registran variación y la
variación total se explica únicamente por el error experimental. Si el error
experimental está ausente, entonces la variación total se explicaría únicamente por el
efecto de los tratamientos o del factor en la variable respuesta.

En general, la variación debe ser conceptualizada como la diferencia entre un valor de


variable y su promedio; cuando se hace referencia a la variación total, ésta se
determina mediante la suma de cuadrados entre la diferencia de cada valor de la
variable respuesta con el promedio general de todas las observaciones y se expresa
mediante: Σ (Xij - µ)2; la variación entre tratamientos se determina mediante la suma
de cuadrados de la diferencia entre el promedio de cada tratamiento µj con el
promedio general, ponderado por el número de observaciones de cada tratamiento;
ésta relación se expresa mediante: nj Σ (µj - µ)2 ; y, la variación debido al error
experimental se determina mediante la suma de cuadrados entre la diferencia de cada
valor de la variable respuesta con el promedio de cada tratamiento y se expresa
mediante Σ (Xij - µj) . De forma que la igualdad indicada anteriormente queda
2

expresada matemáticamente de la siguiente manera:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 8


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

∑ (x ij − µ ) 2 = n j ∑ ( µ j − µ ) 2 + ∑ ( xij − µ j ) 2

en donde:
Σ (Xij - µ)2 = Suma de cuadrados total = SCT
nj Σ (µj - µ) = Suma de cuadrados entre Tratamientos = SCE
2

Σ (Xij - µj)2 = Suma de cuadrados Residual = Error = SCR

de donde:
SCT = SCE + SCR.

Si en el experimento intervienen de manera controlada dos o más factores, entonces


la variación total o suma de cuadrados total se particiona en la suma de cuadrados
para cada factor y la suma de cuadrados del error o residual.

En general, las suposiciones básicas del análisis de varianza son las mismas
asociadas con el análisis de regresión:

Aditividad Independencia
Linealidad Varianzas homogéneas
Normalidad

Existen varios "modelos" en el análisis de varianza dependiendo del diseño formulado,


los más utilizados son:

• Modelo aleatorizado de una variable, o a un criterio de clasificación


• Modelo aleatorizado de dos variables, o de dos criterios de clasificación, o de
bloques
• Modelo aleatorizado de tres variables, o de tres criterios de clasificación, en el que
el modelo Cuadrado Latino es de especial interés.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 9


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CAPITULO II
DISEÑO A UN CRITERIO DE CLASIFICACION

En este diseño, el experimento se realiza con la participación de un solo factor o


variable independiente que está siendo controlado, asumiendo y verificando que los
restantes factores se mantienen en iguales condiciones para todas las unidades de
experimentación en cada realización del experimento.

El factor se presenta dividido en categorías de variable o niveles de valor de la


variable, a las cuales conoceremos con el nombre de tratamientos, de forma que a
una unidad experimental se le aplicará un solo tratamiento; suele ser común que uno
de los tratamientos implique la no aplicación del factor, o que el factor tiene en éste
tratamiento su nivel mínimo, cero; en este caso, al tratamiento así asignado se le
denomina "testigo" y servirá de elemento base para medir el efecto de los restantes
niveles del factor en la variable respuesta.

Este es un modelo en el cual los tratamientos, sometidos a experimentación, son


asignados completamente al azar a las unidades experimentales o viceversa.

2.1 MODELO DE ANALISIS CON IGUAL NUMERO DE OBSERVACIONES POR


TRATAMIENTO

Bajo este diseño se encuentran los experimentos cuyos tratamientos tienen igual
número de observaciones cada tratamiento, de forma que el número de
observaciones y de unidades experimentales es igual al número de observaciones por
tratamiento multiplicado por el número de tratamientos. La función matemática que
define este modelo es:

X ij = µ + α j + ε ij

en el que:

Xij = Valor de la variable respuesta correspondiente a la iésima


observación del j-ésimo tratamiento, el que se considera
normalmente distribuido alrededor del promedio del tratamiento
µj .
µ = Es el promedio general o promedio poblacional
αj = Es el efecto del j-ésimo tratamiento
εij = Es el error o valor residual de la i-ésima observación del j-ésimo
tratamiento, que se considera es independiente de observación
a observación y está normalmente distribuido con valor esperado
igual a cero y varianza igual a σ , Ν (0, σ ).
2 2

La representación simbólica de datos de éste diseño es el siguiente:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 10


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TRATAMIENTO
OBSERV. T1 T2 ? Tj ?. Ta
1 X11 X12 .. X1j J. X1a
2 X21 X22 J X2j J. X2a
i Xi1 Xi2 J Xij J. Xia
:
n Xn1 Xn2 ... Xnj .... Xna

TOTALES X1 X2 ? Xj ?. Xa X
# OBSER n1 n2 J nj J. na n
MEDIAS µ1 µ2 J µj J. µa µ

En esta representación, el tratamiento se generaliza como “Tj” y el número de los j-


ésimos tratamientos incluidos en el experimento va de 1 hasta a, siendo “a” el número
total de tratamientos. Una observación o medida de la variable respuesta en una
unidad experimental se generaliza por Xij y el número de las i-ésimas observaciones o
repeticiones del experimento en cada tratamiento va de 1 hasta n, generalizándose el
número de repeticiones en cada tratamiento por nj.

para los que X j = ∑ X ij

µj =
∑X ij

nj
X =∑Xj
n = ∑nj

µ =
∑X j

La identidad fundamental del Análisis de Varianza de un modelo construido a un solo


criterio de clasificación es:

∑ (x ij − µ ) 2 = n j ∑ ( µ j − µ ) 2 + ∑ ( x ij − µ j ) 2

en donde:
∑ ( x − µ ) = Variación Total = SCT
ij
2

n ∑ ( µ − µ ) = Variación entre Tratamientos = SCE


j j
2

∑ ( x − µ ) = Variación del Error = SCR


ij j
2

de donde:
Variación total = Variación entre tratamientos + Variación Residual
SCT = SCE + SCR

En la igualdad, la variación está expresada como la suma de cuadrados y nos indica


que la variación total en la variable respuesta (SCT), se descompone en una variación
explicada por el efecto que producen los tratamientos en la variable respuesta,
variación entre tratamientos (SCE); y, en la variación debida al error experimental o

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 11


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

residual (SCR), o lo que es lo mismo, la variación dentro de cada tratamiento debido a


los efectos aleatorios en la variable respuesta.

La diferencia entre cada valor de la variable Xij y el promedio general µ, expresa el


desvío del valor de variable con respecto al promedio general o Variación Total, el
cuadrado del desvío y su sumatoria Σ(Xij - µ)2 representa la Suma de Cuadrados
Total.

El valor de µj representa el promedio del j-ésimo tratamiento, la diferencia entre éste y


el promedio general (µj - µ) representa el desvío del tratamiento al promedio general y
es una medida del efecto diferencial del tratamiento, o Variación entre Tratamientos, el
cuadrado del desvío y su sumatoria ponderada por el número de observaciones en
cada tratamiento nj Σ (µj - µ)2 representa la Suma de Cuadrados entre los
tratamientos.

Vamos a suponer que todos los tratamientos aplicados a las unidades experimentales
tienen el mismo efecto en la variable respuesta, entonces, los promedios de cada
tratamiento serán iguales entre si: µ1 = µ2 = µj = ... = µa = µ, el efecto diferencial de los
tratamientos (µj - µ) no existe, por lo tanto Σ(µj - µ)2 = 0; y, consecuentemente, la
variación total de la variable respuesta estaría explicada únicamente por el error
experimental.

Si a dos o más unidades experimentales se les somete a las mismas condiciones de


experimentación, al mismo tratamiento, se puede esperar que tengan igual resultado
en la medición o en la observación de la variable respuesta. Si no se obtiene igual
resultado, la diferencia entre éstos es una manifestación del error experimental, de allí
que se ha definido como error experimental, al fracaso de llegar a resultados idénticos
con dos o más unidades experimentales tratadas en las mismas condiciones.

Si los valores de la variable respuesta en dos o más unidades de experimentación


sometidas al mismo tratamiento tienen la igual medida, esto es X11 = X21 = ... Xi1 = J
= Xn1, entonces el error experimental está ausente, consecuentemente el promedio del
tratamiento µj tiene igual valor que cualquiera de las observaciones del tratamiento.
La diferencia entre una observación cualquiera (Xij) y el promedio de su tratamiento
(Xij - µj) representa la Variación dentro del Tratamiento y es una medida del error
experimental, la sumatoria de éste desvío al cuadrado Σ (Xij - µj)2 representa la Suma
de Cuadrados del Error o Residual.

Supongamos que no existe el error experimental, por tanto Σ (Xij - µj)2 = 0 entonces, la
variación en la variable respuesta se explica por el efecto diferencial de los
tratamientos en ésta variable.

Ahora, supongamos que los tratamientos aplicados a las unidades experimentales


tienen el mismo efecto en la variable respuesta, por lo tanto Σ (µj - µ) = 0; y que,
2

tampoco existe el error experimental, por lo tanto Σ (Xij - µj) = 0, entonces, la variable
2

respuesta tampoco tendría variación Σ (Xij - µ)2 = 0.

Desde luego, las situaciones expuestas son ideales y nos sirven únicamente para
ilustrar el origen o la fuente de variación entre los valores de la variable respuesta al
interior de cada tratamiento o entre tratamientos.

El cálculo de las sumas de cuadrados para cada expresión de la identidad, puede


realizarse directamente de las expresiones propuestas en la identidad fundamental;
una expresión matemática que puede disminuir el laborioso cálculo es la siguiente:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 12


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

(∑ X ) 2

SCT = ∑ X −
2 ij
ij
n
(∑ X ) 2
(∑ X ) 2

SCE = ∑ −
ij ij

nj n
(∑ X ) 2

SCR = ∑ X 2
ij −∑
n
ij

Una forma abreviada de calcularlo es:

(∑ x ij ) 2
FC =
n
SCT = ∑ x ij2 − FC
 x 2j 
SCE = ∑   − FC
 nj 
 
SCR = SCT − SCE

Realizados los cálculos, en cualquiera de las formulaciones propuestas, se procede a


resumir los resultados en el cuadro de Análisis de Varianza cuyo contenido y
representación es el siguiente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Residual (Error) n-a SCR CMR = SCR / (n -a)
Total n-1 SCT

En este cuadro, la "Fuente de Variación" identifica las principales fuentes de variación


que puede tener una variable respuesta; así, la primera fuente de variación está en los
Tratamientos y la segunda en el Error Experimental, o Residual, que agregadas
suman igual que la Variación Total.

Como "Grados de Libertad" se asigna al número de tratamientos menos uno, esto es


(a - 1) para los tratamientos; al total de observaciones menos el número de
tratamientos (n - a) para el residual; y, por el total de observaciones menos 1 (n - 1)
como grados de libertad de la variación total; nótese que la suma de los grados de
libertad de tratamientos más el residual es igual a los grados de libertad del total.

En la columna de "Suma de Cuadrados" se registra el resultado del cálculo para cada


fuente de variación; el "Cuadrado Medio" es el resultado de dividir la suma de
cuadrados para los grados de libertada en cada fuente de variación; y, en la columna
de "Estadística de Prueba" se registra el cuociente del cuadrado medio de
tratamientos divido para el cuadrado medio residual.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 13


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Todo el proceso se encamina a verificar, estadísticamente, si los tratamientos tienen


un efecto diferencial significativo en la variable respuesta o si las variaciones
detectadas son debidas al azar.

2.2 PROCEDIMIENTO DE DOCIMA

Para instrumentalizar el procedimiento de prueba de hipótesis aplicado al diseño


experimental y al análisis de varianza en particular se procede de igual manera que la
que la descrita en el capítulo de inferencia; esto es, mediante la formulación
matemática de la hipótesis, la determinación de la estadística de prueba, la
especificación del criterio de decisión, la ejecución de los cálculos y la toma de
decisión que corresponda.

1. Formulación de la Hipótesis:
Por lo general, el problema plantea la dócima de que los promedios de los diferentes
tratamientos del diseño experimental, "a" número de tratamientos, son iguales; si esto
es verdad, entonces el promedio poblacional también lo es, de forma que la hipótesis
nula (H0) recoge éste enunciado y lo contrasta con la hipótesis alternativa (HA) tal que
la formulación matemática propuesta será:

H0 : µ1 = µ2 = µj = ..... = µa
HA : µ1 ≠ µ2 ≠ µj ≠ ..... ≠ µa

En la que µj representa el promedio del j-ésimo tratamiento del diseño y µa representa


el promedio del a-ésimo tratamiento.

Si todos los promedios son iguales se aceptará las hipótesis nula, basta que uno de
ellos no sea igual para que se rechace la hipótesis nula. Vale hacer notar que en la
hipótesis alternativa descrita (HA) se propone que los promedios de todos los
tratamientos son entre si diferentes; sin embargo, pudiera suceder que dos o más
promedios sean iguales y que uno o más de los restantes sean diferentes, pudiera
suceder que todos los promedios menos uno sean iguales, basta que uno de ellos sea
diferente al resto para que en efecto se rechace la hipótesis nula planteada.
Situaciones que no están representadas por la formulación propuesta para la
hipótesis alternativa.

Para solucionar esta dificultad de expresión, se puede proponer como formulación de


la hipótesis la siguiente:

H0 : µ1 = µ2 = µj = ..... = µa
HA : Por lo menos una µj es diferente

Ahora, si todos los promedios de los tratamientos son iguales, lo es también el


promedio poblacional, esto es µj = µ, por lo tanto no existe un efecto diferencial debido
al tratamiento, éste planteamiento es igual a proponer que µj - µ = 0, con esta base la
formulación de la hipótesis será:

H0 : µj - µ = 0
HA : µj - µ ≠ 0

Cualquier diferencia entre el promedio de j-ésimo tratamiento con el promedio


poblacional (µj - µ) será un indicativo del efecto diferencial de ese tratamiento en las
unidades experimentales, el diferencial puede o no ser estadísticamente significativo;

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 14


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

al representar al efecto del tratamiento con αj , entonces µj - µ = αj = 0, con lo


que la formulación de la hipótesis a docimar se puede plantear como:

H0 : αj = 0
HA : αj ≠ 0

2. Determinación de la estadística de prueba


La estadística de prueba que se utilizará es:
CME
Fc =
CMR
3. Criterio de Decisión
El criterio de decisión para la aceptación o el rechazo de la hipótesis planteada en el
problema es:

Rechazar la H0 si : Fc ≥ Fα , v1, v 2

en el que v1, corresponde a los grados de libertar del numerador, grados de libertad de
tratamientos (a - 1); y, v2, corresponde a los grados de libertad en el denominador,
grados de libertad del error (n - a). El valor tabular de F se lo obtiene directamente de
tablas pre calculadas, las mismas que se encuentran en las tablas del Anexo de
cualquiera de los textos de bibliografía presentados para el curso.

4. Ejecución de cálculos
Con los datos que el problema proporciona deben calcularse todas las sumas de
cuadrados, los cuadrados medio y el valor de la estadística de prueba conforme se
presentó en el cuadro de análisis de varianza.

5. Decisión
El proceso de prueba no termina si el estadístico no toma una decisión sobre la
aceptación o rechazo de la hipótesis nula planteada y si no responde al interrogante
que plantea el problema. Con la decisión concluye el proceso de prueba y del análisis
de varianza.

Conviene observar la mecánica de aplicación del procedimiento y del cálculo del


Cuadro de Análisis de Varianza, con el desarrollo del siguiente ejercicio.

EJEMPLO:

Una empresa fabricante de vehículos desea probar el rendimiento de un determinado


modelo de automóvil con tres tipos diferentes de gasolina; con cada tipo de gasolina
se realizan cuatro pruebas, en cada prueba se carga en el motor 3 galones de
gasolina y un conductor realiza el mismo recorrido hasta que el automóvil se pare.
Los datos que se presentan a continuación corresponden al kilometraje recorrido por
el automóvil en cada prueba.

KILOMETRAJE RECORRIDO POR EL AUTOMOVIL


PRUEBA GASOLINA A GASOLINA B GASOLINA C
1 47 46 51
2 39 42 50
3 43 45 56
4 42 45 58

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 15


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Con el 95% de seguridad, puede el fabricante afirmar que esa clase de automóvil
tiene un rendimiento exactamente igual con los tres tipos de gasolina?

SOLUCION:

Para iniciar la resolución del problema planteado, es conveniente identificar las


características más importantes del problema, plantear las hipótesis que
correspondan, especificar la estadística de prueba, formular el criterio de decisión y
aplicar las fórmulas al procesamiento de los datos.

Características del problema:


FACTOR: Combustible
TRATAMIENTO: Clase de gasolina: A, B y C.
UNIDAD EXPERIMENTAL: Automóvil
VARIABLE RESPUESTA: Kilometraje recorrido
NIVEL DE SIGNIFICACION: 0,05
MODELO: X ij = µ + α j + ε ij

Como se trata de una prueba controlada del rendimiento de un determinado modelo


de automóvil, se supone que el factor combustible está bajo control y que los demás
factores (conductor, ruta, procedimiento de manejo, etc.), que pueden tener efecto en
la variable respuesta, son idénticos para todas las unidades experimentales e iguales
en todas las realizaciones del experimento.

Formulación de la Hipótesis:
H0 : αj = 0
HA : αj ≠ 0

H0 : El kilometraje recorrido por el automóvil es igual con cada tipo de gasolina; o


alternativamente: No existe diferencia significativa en el kilometraje recorrido
por el automóvil, debido al tipo de gasolina.

HA : El kilometraje recorrido por el automóvil es diferente con cada tipo de gasolina;


o alternativamente: Existe diferencia significativa en el kilometraje recorrido por
el automóvil debido al tipo de gasolina.

CME
Estadística de Prueba: Fc =
CMR

Criterio de Decisión: Rechazar la H0 si : Fc ≥ Fα , v1, v 2

Cálculos:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 16


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

GASOLINAS ∑ ( x ij − µ ) 2
∑ (x ij − µ j ) 2

A B C A B C A B C
47 46 51 0 1 16 18.0625 2.25 7.5625
39 42 50 64 25 9 14.0625 6.25 14.0625
43 45 56 16 4 81 0.0625 0.25 5.0625
42 45 58 25 4 121 0.5625 0.25 18.0625
ΣXj = 171 178 215 105 34 227 32.75 9 44.75
nj = 4 4 4
µj = 42.75 44.50 53.75 ΣXij = 564 µ = 47.00

SCT = 105 + 34 + 227 = 366


SCE = 4 ((42.75 - 47)2 + (44.5 - 47)2 + (53.75 - 47)2 )
SCE = 4 (18.0625 + 6.25 + 45.5625) = 279.5
SCR = 32.75 + 9 + 44.75 = 86.5
SCT = SCE + SCR
366 = 279.5 + 86.5
366 = 366

Realicemos algunas reflexiones del experimento y de los resultados del cálculo.


Podemos observar que cada tratamiento tiene 4 observaciones o repeticiones del
experimento, éstas realizaciones son ejecutadas con el mismo tipo de automóvil, con
el mismo chofer, en la misma ruta y utiliza la misma cantidad de combustible, por lo
que era de esperar que la medición de la variable respuesta en las 4 observaciones de
cada tratamiento sean iguales; al no serlo, encontramos que la diferencia entre éstas y
su promedio representa el error experimental y que la Suma de Cuadrados del Error o
Suma de Cuadrados Residual, agregado en todos los tratamientos, es de 86.5.

Por otro lado, si los tipos de combustible tuviesen el mismo efecto en el kilometraje de
recorrido del automóvil, el promedio para cada tipo de combustible sería el mismo. En
el ejemplo desarrollado, encontramos que los promedios son diferentes y
verificaremos si esta diferencia es estadísticamente significativa; la diferencia entre el
promedio de cada tratamiento y el promedio general es una medida del efecto
diferencial del combustible en el kilometraje de recorrido que se expresa en la Suma
de Cuadrados entre Tratamientos que tiene un valor de 279.5.

Se verifica que la Suma de Cuadrados Total, 366, es igual a la Suma de Cuadrados


entre tratamientos, 279.5, más la Suma de Cuadrados Residual, 86.5. Estos
resultados sirven para la elaboración del cuadro de Análisis de Varianza, tal como se
presenta a continuación:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS MEDIO PRUEBA
Gasolinas 3-1 = 2 SCE = 279.5 CME =139.75 Fc = 14.5406
Residual (Error) 12 - 3 = 9 SCR = 86.5 CMR = 9.611
Total 12 - 1 = 11 SCT = 366.0

Antes de aplicar el criterio de decisión formulado para la verificación de la hipótesis


debemos obtener el valor teórico o tabular de la estadística de prueba, Fα, v1, v2 , el
mismo que se lo obtiene de tablas de valores calculados para niveles de significación
del 5% y 1% y diferentes valores de grados de libertad; de acuerdo con las

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 17


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

condiciones del problema, se tiene un nivel de significación del 5%, con 2 grados de
libertad en el numerador, en correspondencia con el CME, y 9 grados de libertad en el
denominador, en correspondencia con el CMR, que visto en tablas corresponde a:

Fα, v1, v2 = F0.05, 2, 9 = 4.256

Decisión:

El criterio de decisión propuesto indica que se rechazará la H0 si se cumple: Fc ≥ Fα,


v1, v2; reemplazando valores tenemos que 14.54 ≥ 4.256.

Dado que la desigualdad se cumple, rechazo la H0 y concluyo que no es verdadera la


afirmación del fabricante, el vehículo tiene un rendimiento diferencial significativo
respecto del tipo de gasolina que se utilice.

Sólo cuando se tomado una decisión sobre el problema planteado, podemos decir que
el análisis estadístico ha concluido.

A iguales resultados, decisión y conclusión llegaremos aplicando la formulación de


cálculo alternativa. En el siguiente cuadro se observa el desarrollo del proceso de
cálculo mediante la aplicación de las siguientes formulaciones de cálculo:

SCT = Σ X2ij - (Σ Xij )2 / n


SCE = Σ (Σ Xij )2/ nj - (Σ Xij )2/ n
SCR = Σ X2ij - Σ (Σ Xij )2/ nj

TABLA 2.3 CALCULO DE LA SUMA DE CUADRADOS

2
GASOLINAS X ij
A B C A B C
47 46 51 2,209 2,116 2,601
39 42 50 1,521 1,764 2,500
43 45 56 1,849 2,025 3,136
42 45 58 1,764 2,025 3,364
ΣXj = 171 178 215 7,343 7,930 11,601
nj = 4 4 4
ΣXij = 564 ΣX
2
ij = 26,874

ΣX
SCT = 2 2
ij - (Σ Xij ) / n
SCT = 2
26,874 - (564) /12 =
SCT = 26,874 - 26,508 = 366

Σ(ΣXij) /nj - (ΣXij) /n


SCE = 2 2

SCE = 2 2 2 2
(171 /4 + 178 /4 + 215 /4) - ((564) /12) =
SCE = 26,787.5 - 26,508 = 279.5

Σ X ij - Σ (ΣXij) / ni
SCR = 2 2

SCR = 2 2 2
26,874 - (171 /4 + 178 /4 + 215 /4) =
SCR = 26,874 - 26,787.5 = 86.5

SCT = SCE + SCR


366 = 279.50 + 86.5
366 = 366.00

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 18


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Los cálculos presentados, sirven para aplicar una forma abreviada de cálculo como se
presenta a continuación:

FC = (Σ xij)2/n = (Σxij)2 /Σnj = X2/n


2
FC = (564) /12 =
FC = 26,508

SCT = Σ x2ij - FC
SCT = 26,874 - 26,508 =
SCT = 366

SCE = Σ(x2j / nj) - FC = x2j/nj - FC


SCE = 26,787.5 - 26,508 =
SCE = 279.50

SCR = SCT - SCE =


SCR = 366 - 279.5 =
SCR = 86.5

Conforme lo refiere el Dr. Luis Romo Saltos en su texto "Métodos de Experimentación


Científica", el aplicar las fórmulas abreviadas de cálculo, tiene ventajas dado que es
un procedimiento más rápido y susceptible a menores errores porque utiliza un menor
número de cifras para calcular los cuadrados.

De forma similar, podemos aprovechar el sofware instalado en los utilitarios de mayor


uso como la hoja electrónica EXCEL de Windows. En éste programa se puede
encontrar un módulo de aplicación para análisis estadístico de datos, en el que se
incluye el Análisis de Varianza; aplicado el sofware a los datos del problema, los
resultados que proporciona el sistema son los siguientes:

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
GASOLINA A 4 171 42.75 10.92
GASOLINA B 4 178 44.50 3.00
GASOLINA C 4 215 53.75 14.92

ANÁLISIS DE VARIANZA

Fuente de Suma de Grados de Cuadrado


Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Entre grupos 279.5 2 139.75 14.54 0.00152 4.256
Dentro de grupos 86.5 9 9.611

Total 366 11

Como puede observarse, los resultados son exactamente los mismos que los
obtenidos con los procesos de cálculo anteriores; así, el valor calculado de la
estadística de prueba Fc = 14,540, es exactamente igual al obtenido en el cálculo
anterior; el valor tabular de la estadística de prueba Fc = 4,256, es el mismo que en
los cálculos anteriores.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 19


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Sin embargo, es necesario destacar que en la primera parte de la salida de resultados


se presentan: el número de elementos o de repeticiones de cada tratamiento; la
sumatoria, el promedio y la varianza de la variable respuesta en cada tratamiento, ésta
última corresponde al error experimental. En la segunda parte, se presenta el cuadro
de Análisis de Varianza formulado de manera semejante a lo expuesto en los párrafos
anteriores de este capítulo, incluyendo la probabilidad de obtener un valor F mayor o
igual al valor calculado ( P( F ≥ 14.54) = 0.00152); y, el valor tabular de F (Ft = 4.256).
La interpretaciones de sus resultados son exactamente iguales a las descritas
anteriormente.

2.3 MODELO DE ANALISIS CON DIFERENTE NUMERO DE OBSERVACIONES


POR TRATAMIENTO.

En ocasiones, debido a la disponibilidad de las unidades experimentales o a la pérdida


de éstas en el proceso de aplicación del diseño experimental, o debido a la
concepción misma del diseño, puede encontrarse que los tratamientos tienen diferente
número de observaciones o de repeticiones por tratamiento. En esta situación el
proceso de cálculo es similar al anterior, conforme se expone en el siguiente ejemplo:

EJEMPLO:

El área urbana de cierta zona del país tiene la atención de tres hospitales públicos.
Los siguientes datos muestran el número de intervenciones quirúrgicas diarias
practicadas a pacientes no hospitalizados, en cada hospital en la semana pasada. Al
nivel de significación 0.05, ¿ es posible concluir que hay diferencia en el número
promedio de operaciones realizadas entre los hospitales?

NUMERO DE OPERACIONES DIARIAS A PACIENTES NO HOSPITALIZADOS

HOSPITAL 1 HOSPITAL 2 HOSPITAL 3


14 18 24
20 24 14
16 22 14
18 28 22
20 24

SOLUCION:

Características del problema:


FACTOR: Hospitales públicos
TRATAMIENTO: Hospital 1, 2 y 3.
UNIDAD EXPERIMENTAL: Día laborable de la semana pasada
VARIABLE RESPUESTA: Número de intervenciones quirúrgicas a pacientes
no hospitalizados.
NIVEL DE SIGNIFICACION: 0,05
Modelos: X ij = µ + α j + ε ij

Formulación de la Hipótesis:
H0 : αj = 0
HA : αj ≠ 0

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 20


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

H0 : El número de intervenciones quirúrgicas a pacientes no hospitalizados es igual


en todos los hospitales públicos; o alternativamente: No existe diferencia
significativa en el número de intervenciones quirúrgicas a pacientes no
hospitalizados, entre los hospitales públicos.

HA : El número de intervenciones quirúrgicas a pacientes no hospitalizados es


diferente en todos los hospitales públicos; o alternativamente: Existe diferencia
significativa en el número de intervenciones quirúrgicas a pacientes no
hospitalizados, entre los hospitales públicos.

Estadística de Prueba:
CME
Fc =
CMR

Criterio de Decisión:
Rechazar la H0 si : Fc ≥ Fα, v1, v2

Cálculos:
CALCULO DE LA SUMA DE CUADRADOS

HOSPITALES X2ij
H1 H2 H3 H1 H2 H3
14 18 24 196 324 576
20 24 14 400 576 196
16 22 14 256 484 196
18 28 22 324 784 484
20 24 400 - 576
SUMA 88 92 98 1,576 2,168 2,028
nj 5 4 5
2
∑Xij = 278 ∑Xij = 5,772

FC = (∑Xij )2 /n
FC = (278)2 /14 = 5.520,29

SCT = ∑Xij2 - FC
SCT = 5,772 - 5,520,29 = 251.71
SCT = 251,71

SCE = ∑(Xj2 /nj) - FC


SCE = (882 /5 + 922 /4 + 982 /5) - 5,520,29
SCE = 5,585,60 - 5,520,29 = 65,31

SCR = SCT - SCE


SCR = 251,71 - 65,31 = 186,40
SCR = 186,40

SCT = SCE +SCR


251,71 = 65,31 + 186,40
251,71 = 251,71

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 21


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Nótese que con respecto al cálculo del ejemplo anterior, la única diferencia está en el
cálculo de la Suma de Cuadrados de Tratamientos, SCE; para la situación presente, el
denominador para la suma de cada tratamiento corresponde al número de
observaciones del tratamiento.

Con los resultados obtenidos elaboramos el cuadro de Análisis de Varianza.

CUADRO DE ANALISIS DE VARIANZA


FUENTE DE GRADOS DE SUMA DE CUADRADO ESTADISTICA
VARIACION LIBERTAD CUADRADOS MEDIO DE PRUEBA
Hospitales 3-1 = 2 65.31 32.655 Fc = 1.927
Residual (Error) 14 - 3 = 11 186.4 16.945
Total 14 - 1 = 13 251.71

El valor teórico o tabular de la estadística de prueba, Fα, v1, v2 , para un nivel de


significación de 0.05, de acuerdo con las condiciones del problema, con 2 grados de
libertad en el numerador y 11 grados de libertad en el denominador, es igual a:

Fα, v1, v2 = F0.05, 2, 11 = 3.982

Decisión:

El criterio de decisión propuesto indica que se rechazará la H0 si se cumple la


siguiente desigualdad: Fc ≥ Fα, v1, v2; reemplazando valores tenemos que 1.927 ≤
3.982.

Al no cumplirse la desigualdad, acepto la H0 planteada y concluyo que el número


promedio de intervenciones quirúrgicas de pacientes no hospitalizados es igual en los
hospitales públicos.

Al igual que en el caso anterior, se procesó el cálculo del Análisis de Varianza en la


hoja electrónica Excel con resultados aproximadamente iguales a los obtenidos en el
cálculo anterior, por efecto de los decimales se produce un pequeño desface en
ciertos valores. La interpretación de sus resultados es igual a la descrita
anteriormente, los resultados son:

Análisis de varianza de un factor

RESUMEN
Grupos Cuenta Suma Promedio Varianza
HOSPITAL 1 5 88 17.60 6.80
HOSPITAL 2 4 92 23.00 17.33
HOSPITAL 3 5 98 19.60 26.80

ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Entre grupos 65.314 2 32.6571 1.927 0.1916 3.982
Dentro de grupos 186.4 11 16.9455

Total 251.714 13

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 22


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

2.4 MODELOS DEL ANÁLISIS Y CUADRADOS MEDIOS ESPERADOS

En el modelo de análisis a un solo criterio de clasificación, el investigador debe decidir


sobre la conformación de los Tj tratamientos incluidos en el experimento, ésta decisión
implica definir si:

a) El investigador está interesado en la población de tratamientos esto es, en


los "a" tratamientos que están presentes en el experimento, en el que los
efectos de los tratamientos se consideran cantidades fijas desconocidas
pero que van a ser estimadas.. Este modelo se denomina como Modelo I, o
de Efectos fijos o de análisis de varianza.

b) El investigador está interesado en una muestra de tratamientos de los


cuales “a” tratamientos están presentes en el experimento, en el que los
efectos medidos de los tratamientos son variables aleatorias normalmente
distribuidos con promedio cero y varianza αA, N(0,αA). A este modelo se le
conoce como Modelo II o de efectos aleatorios; o de componente de
varianza.

MODELO I.- EFECTOS FIJOS.-

En este modelo se supone que los tratamientos incluidos en el experimento son todos
los posibles o constituyen la población de tratamientos. El atributo que lo distingue es
que los efectos de los tratamientos o clases medidos por αj, se consideran cantidades
fijas pero desconocidas para ser estimadas.

El modelo que lo representa es el expuesto anteriormente, así:

X ij = µ + α j + ε ij i = 1,2 J n
j = 1,2 J a
La hipótesis que se plantea para dócima es:
H0 : αj = 0
HA : αj ≠ 0

Los cuadrados medios esperados, del cuadro de Análisis de Varianza, para cada
fuente de variación operándose con igual número de repeticiones o diferente número
de repeticiones por tratamiento son los siguientes:

CUADRADO MEDIO ESPERADO.- MODELO I, DE EFECTOS FIJOS

FUENTE DE CON IGUAL NUMERO DE CON DIFERENTE NUMERO


VARIACION OBSERVACIONES DE OBSERVACIONES
Tratamientos σ2 + n Σα2j/ (a-1) σ2 + Σ nj α2j/ (a-1)
σ σ
Residual (Error) 2 2

MODELO II.- EFECTOS ALEATORIOS

En este modelo, conocido como componente de varianza, los tratamientos que


intervienen en el experimento son una muestra de la población de tratamientos,
consecuentemente los efectos de los tratamientos se consideran variables aleatorias.

El modelo matemático del modelo que se plantea es:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 23


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

X ij = µ + A j + ε ij i = 1, 2 J n
j = 1, 2 J.a
en donde:
µ = Es el promedio general o promedio poblacional
Aj = Es el efecto del j-ésimo tratamiento, que es variable aleatoria
independiente normalmente distribuida con Ν (0, σ2A),
εij = Es el error o valor residual de la i-ésima observación del j-ésimo
tratamiento, que se considera es independiente de observación
a observación y está normalmente distribuido con valor esperado
igual a cero y varianza igual a σ , Ν (0,σ ).
2 2

La hipótesis que se plantea para dócima es:


H0 : Aj = 0
HA : Aj ≠ 0

Los cuadrados medios esperados, del cuadro de Análisis de Varianza, para cada
fuente de variación operándose con igual número de repeticiones o diferente número
de repeticiones por tratamiento son los siguientes:

CUADRADO MEDIO ESPERADO.- MODELO II, DE EFECTOS ALEATORIOS

FUENTE DE CON IGUAL NUMERO DE CON DIFERENTE NUMERO


VARIACION OBSERVACIONES DE OBSERVACIONES
σ + nj σ A σ + no σ A
Tratamientos 2 2 2 2

σ σ
Residual (Error) 2 2

En muestras con diferente número de repeticiones por tratamiento, la estimación


imparcial de la media cuadrada entre tratamientos es:

σ2 + noσ2A

En donde no se estima con el promedio de de las nj

El componente de la varianza es:


σ L = σ + njσ Α
2 2 2

σ Α = (σ L - σ ) / nj que se estima por:


2 2 2

S2Α = (S2L - S2) / nj

2.5 COMPARACIONES ENTRE TRATAMIENTOS

En la mayoría de experimentos, el investigador está interesado en realizar


comparaciones específicas entre determinados tratamientos que están involucrados
en el experimento. Tales comparaciones pueden estar dirigidas a establecer
diferencias significativas entre pares de tratamientos o entre varios tratamientos
agrupados en subconjuntos.

Cuando el investigador desea comparar pares de tratamientos, tiene a su disposición


varias técnicas o procedimientos de los que puede hacer uso, como por ejemplo: la
Diferencia Mínima Significativa; la prueba de rango múltiple de Duncan; la prueba de
Tukey; la prueba de Scheffé, de Bonferroni, y otras. De éstos analizaremos
únicamente la prueba de Diferencia Mínima Significativa.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 24


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Adicionalmente a las pruebas citadas, existe otra de mayor versatilidad porque permite
la comparación entre pares de tratamientos y/o entre subconjuntos de tratamientos,
sin las limitaciones y restricciones de aplicación que los métodos anteriores exigen,
éste método es conocido como Función Lineal, el mismo que será examinado con
algún detenimiento.

2.5.1 DIFERENCIA MINIMA SIGNIFICATIVA.

La Diferencia Mínima Significativa, denotada por DMS, es probablemente la prueba


más utilizada para la comparación entre pares de medias de tratamientos por su fácil
cálculo. El procedimiento parte del hecho de que en el Análisis de Varianza se
rechazó la Hipótesis nula y que consecuentemente la prueba F dio un valor
significativo; y que, los tratamientos a compararse tienen igual número de
repeticiones, esto es:

Fc significativo en el Análisis de Varianza


n1 = n2 = r igual número de repeticiones por tratamiento; y,
σ12 = σ22 = σ2 = CMR Igual varianza por tratamiento.

El valor de la DMS se calcula mediante:

DMS = t α / 2,v * σ x1− x 2


DMS = t α / 2 ,v 2σ / r
2
DMS = t α / 2,v CMR en el que v = 2r – 2
r

La hipótesis que se plantea para dócima es:

H0 : µ1 = µ2
HA : µ1 ≠ µ2

La estadística de prueba es:


2
DMS = t α / 2,v CMR
r
El criterio de Decisión:

Se rechaza la hipótesis nula si: x i − x j ≥ DMS

Si la diferencia observada entre dos promedios, i ≠ j, es mayor o igual a la DMS,


entonces rechazamos la hipótesis nula y concluimos que existe una diferencia
significativa entre los dos tratamientos sometidos a prueba.

Habiéndose calculado la DMS, se puede observar en una matriz de diferencias de


promedios aquellas que son significativas y las que no lo son. De forma que se
rechazará la Hipótesis nula:

Si Dij  ≥ DMS

Esto es que se rechazará la Hipótesis nula:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 25


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Dij x1 x2 x3 x4 xj
x1 - D12 D13 D14 D1j
SI x2 - - D23 D24 D2j ≥ DMS
x3 - - - D34 D3j

xi - - - Dij

Es importante tener precaución con la utilización de esta prueba; probablemente la


principal está en considerar que si el experimento tiene más de dos tratamientos, la
prueba de las diferencias binarias aumentan la probabilidad de error tipo I con el que
se está trabajando. Recordemos que su utilización presupone que la hipótesis nula
del Análisis de Varianza fue rechazada, el valor de F fue significativo, y que los
tratamientos tienen igual número de repeticiones.

2.5.2 FUNCION LINEAL

Este procedimiento de prueba permite la comparación de dos tratamientos o más al


mismo tiempo; entre subconjuntos de tratamientos; y, además permite la subdivisión
de la Suma de Cuadrados para Tratamientos en sus componentes simples.

La función lineal puede expresarse en términos de los totales de los tratamientos o del
promedio de cada tratamiento. Utilizando los promedios de los tratamientos tenemos:

Cualquier combinación lineal de la forma:

Se denomina comparación de las medias de tratamientos, en donde:


λj = Son coeficientes ortogonales o números fijos, tales que:
∑ λj = 0

en el que: λj = Coeficiente ortogonal correspondiente al j-ésimo tratamiento.


= Promedio del j-ésimo tratamiento.

La comparación que se realiza a través de la función lineal puede incluir todas las
medias de los tratamientos o sólo una parte de éstas. A manera de ejemplo, si el
experimento tiene 3 tratamientos, entonces podríamos estar interesados en realizar
pruebas para verificar si ciertas comparaciones entre los tratamientos son
significativas. Las posibles comparaciones que puede realizar el investigador con las
hipótesis nulas y los correspondientes coeficientes ortogonales, son los siguientes:

HIPOTESIS NULA COEFICIENTE ORTOGONAL


A DOCIMAR λ1 λ2 λ3 ∑λj
(µ1 - µ2) = 0 1 -1 0 0
(µ1 - µ3) = 0 1 0 -1 0
(µ2 - µ3) = 0 0 1 -1 0

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 26


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

(µ1 + µ2)/2 - µ3 = 0 1 1 -2 0
(µ1 + µ3)/2 - µ2 = 0 1 -2 1 0
(µ2 + µ3)/2 - µ1 = 0 -2 1 1 0

El cálculo del error estándar de la función lineal depende de si los tratamientos tienen
o no igual número de repeticiones por tratamiento.

Si todos los tratamientos tienen igual número de repeticiones “r”, el error estándar de
la función lineal es igual a:

σL = σ/√r * √∑λj2
σL = σ/√r * √(λ12 + λ22 + λj2 + ... + λa2)
en donde: σ = √CMR

Si el número de repeticiones por tratamiento es diferente, esto es que si el j-ésimo


tratamiento tiene “rj” repeticiones entonces, el error estándar de la función lineal
considera al cuadrado de cada coeficiente ortogonal dividido para el número de
repeticiones por tratamiento, esto es:

σL = σ * √∑(λj /rj)
2

σL = σ * √(λ12 /r1 + λ22 /r2 + λ32 /r3 + ... + λa2/ra )

en donde: σ = √CMR

La estadística de prueba que se utiliza en la comparación de medias es la estadística t


calculada en donde:
tc = L / σL

El criterio de decisión será el de rechazar la Hipótesis nula planteada si:

tc  ≥ t α/2, v

En la que los grados de libertad del valor tabular de “t” está dado por la suma del
número de repeticiones de los tratamientos involucrados en la prueba menos el
número de tratamientos considerados.

EJEMPLO:

Un agrónomo efectuó un ensayo para comparar los efectos relativos de 4 fertilizantes,


respecto al rendimiento de cebada Trebi. El ensayo consideró 5 esquemas de
fertilización, el que incluyó un tratamiento como testigo, consistente en la siembra de
cebada en parcelas sin la utilización de fertilizante, T1; y, 4 tratamientos con
fertilizante, dos de los cuales son de naturaleza similar en base de nitrógeno, T2 y T3,
y dos en base de potasio, T4 y T5. Se disponía de 30 parcelas experimentales
homogéneas y al azar se asignaron 6 a cada tratamiento. En la cosecha se midió la
producción de cebada en kilogramos por parcela, obteniéndose los siguientes
resultados:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 27


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

PRODUCCION DE CEBADA EN KILOGRAMOS

TRATAMIENTO DE FERTILIZANTE
T1 T2 T3 T4 T5
37 67 95 102 123
26 68 95 96 93
39 57 91 102 112
23 74 105 103 120
48 61 78 99 113
50 68 85 117 124

Para un 95% de confianza, se desea:


1. Probar si los tratamientos son significativamente diferentes.
2. Establecer las comparaciones binarias entre los tratamientos, mediante DMS.
3. Verificar si existe diferencia significativa en los rendimientos de producción de
las parcelas con fertilización y de aquellas sin fertilización; y,
4. Probar si la diferencia en los rendimientos de las parcelas tratadas con
fertilizante en base a nitrógeno y aquellas tratadas con fertilizante con base a
potasio, se deben al azar.

SOLUCION:

Características del problema:


FACTOR: Fertilizante
TRATAMIENTO: Esquemas de fertilización, T1 al T5.
UNIDAD EXPERIMENTAL: Parcela
VARIABLE RESPUESTA: Producción de cebada medida en Klg.
NIVEL DE SIGNIFICACION: 0,05.
MODELO: Modelo I, de efectos fijos.
X ij = µ + α j + ε ij

Formulación de la Hipótesis:

H0 : αj = 0
HA : αj ≠ 0

H0 : No existe diferencia significativa en la producción de cebada entre parcelas


debido a los diferentes esquemas de fertilización.

HA : Existe diferencia significativa en la producción de cebada entre parcelas debido a


los diferentes esquemas de fertilización.

Estadística de Prueba:
Fc = CME / CMR

Criterio de Decisión:
Rechazar la H0 si : Fc ≥ Fα, v1, v2

Cálculos:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 28


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CALCULO DE LA SUMA DE CUADRADOS


2
TRATAMIENTO DE Xij
FERTILIZANTE
F1 F3 F3 F4 F5 F1 F3 F3 F4 F5
37 67 95 102 123 1369 4489 9025 10404 15129
26 68 95 96 93 676 4624 9025 9216 8649
39 57 91 102 112 1521 3249 8281 10404 12544
23 74 105 103 120 529 5476 11025 10609 14400
48 61 78 99 113 2304 3721 6084 9801 12769
50 68 85 117 124 2500 4624 7225 13689 15376
223 395 549 619 685 8899 26183 50665 64123 78867
∑Xij 2471 ∑Xij2 228737

FC = (∑Xij )2 /n
FC = (2471)2 /30 = 203528.03

SCT = ∑Xij2 - FC
SCT = 228737 – 203528.03 =
25208.97
SCT = 25208.97

SCE = ∑(Xj 2 /nj) - FC


SCE = (2232/6 + 3952/6 + 5492/6 + 6192/6 + 6852/6) – 203528.03
SCE = 226590.17 – 203528.03 = 23062.13

SCR = SCT - SCE


SCR = 25208.97 – 23062.13
SCR = 2146.84

Con los resultados obtenidos elaboramos el cuadro de Análisis de Varianza, conforme


se presenta en la tabla siguiente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS SUMA DE CUADRADO Fc CUADRADO


VARIACION LIBERTAD CUADRADOS MEDIO MEDIO
ESPERADO
Fertilizante 4 23,062.13 5765.53 67.14 85.873 + (6/4)
∑αj2
Residual 25 2,146.84 85.87
(Error)
Total 29 25,208.97

El valor teórico o tabular de la estadística de prueba, Fα, v1, v2 , para un nivel de


significación de 0.05, de acuerdo con las condiciones del problema, con 4 grados de
libertad en el numerador y 25 grados de libertad en el denominador, es igual a:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 29


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Fα, v1, v2 = F0.05, 4, 25 = 2.759

Decisión:

El criterio de decisión propuesto indica que se rechazará la H0 si se cumple la


siguiente desigualdad: Fc ≥ Fα, v1, v2 ; reemplazando valores tenemos que 67.140 ≥
2.759.

Al cumplirse la desigualdad, rechazo la H0 planteada y concluyo que la producción


promedio de cebada es significativamente diferente entre los tratamientos, lo que nos
revela que el fertilizante tiene un efecto significativo en la producción promedio de
cebada por parcela.

Con esta decisión hemos resuelto el primer punto del problema.

Para resolver el segundo punto propuesto, verifico que en el Análisis de Varianza


se rechazó la hipótesis nula y que la prueba F resultó significativa; luego verifico que
los tratamientos tienen igual número de repeticiones, r = 6, y procedo con las
comparaciones binarias:

La formulación de la hipótesis a docimar es:


H0 : µi = µj
HA : µi ≠ µj para i ≠ j
La estadística de prueba es:
DMS = t α/2, v √(2/r * CMR)
DMS = t 0.025, 10 √(2/6 * 85.873)
DMS = 2.228 * 5.35
DMS = 11.92

El criterio de Decisión:
Se rechaza la hipótesis nula si: Xi - Xj  ≥ 11.92

La matriz de diferencias de promedios nos indicará que diferencias son significativas,


de manera que se rechazará la Hipótesis nula si:
Dij  ≥ 11.92

DIFERENCIAS DE PROMEDIOS ENTRE TRATAMIENTOS

DIFERE. T1 T2 T3 T4 T5
T1 28,67 54,33 66,00 77,00
T2 25,67 37,33 48,33
T3 11,67 22,67
T4 11,00
T5

Como era de esperar, existen 10 comparaciones binarias posibles entre los 5


tratamientos del experimento. Se puede verificar que todas las diferencias binarias
son significativas y por lo tanto rechazo la hipótesis nula planteada, excepto las
comparaciones entre los tratamientos T3 vs. T4 y T4 vs. T5 cuyos valores son
inferiores a la DMS, en cuyo caso acepto la hipótesis nula planteada.

Este resultado nos indica que la producción de cebada es significativamente diferente


entre las parcelas sin fertilización (T1) con aquellas que si fueron tratadas con

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 30


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

fertilización (T2 a T5). De similar manera se establece una diferenciación significativa


entre el tratamiento T2 con los restantes tratamientos; y que, el tratamiento T3 es
significativo con los tratamiento T1, T2 y T5.

Para resolver el tercer punto propuesto, se requiere realizar la comparación entre el


tratamiento que no que contiene fertilizante, T1, con los que si lo tienen T2 hasta T5;
ésta comparación sólo es posible efectuarla con la utilización de la Función Lineal y el
procedimiento es el siguiente:

La formulación de la hipótesis a docimar es:

H0 : µ1 - (µ2 + µ3 + µ4 + µ5)/4 = 0
HA : µ1 - (µ2 + µ3 + µ4 + µ5)/4 ≠ 0

La estadística de prueba es:


tc = L / σL

El criterio de decisión será el de rechazar la Hipótesis nula planteada si:


tc  ≥ t α/2, v

La función lineal para el cálculo es:

Siendo los λi coeficientes ortogonales, se requiere que su sumatoria sea igual a cero;
para tal efecto tomamos de referencia la formulación de la hipótesis nula planteada de
manera que si λ1 = 4 entonces los restantes λj serán iguales a –1, se verifica que ∑λj
=0, reemplazando en la función lineal tenemos:

L = 4(37.17) + (-1)65.83 + (-1)91.5 + (-1)103.17 +(-1)114.17


L = -225.69

El error estándar de la función:


σL = σ/√r * √∑λj2
σL = σ/√r * √(λ12 + λ22 + λ32 + ... + λa2)
σL = 9.267/√6 * √(42 + (-1)2 + (-1)2 + (-1)2 + (-1)2 )
σL = 16.919

de donde: tc = L / σL
tc = -225.69 / 16.919 = -13.357

El criterio de decisión será el de rechazar la Hipótesis nula planteada si:


tc  ≥ t α/2, v
-13.357 ≥ t 0.025, 25
-13.357 ≥ 2.060

La decisión será la de rechazar la H0 y concluimos que la utilización de fertilizante en


las parcelas produce un efecto diferencial significativo en la producción promedio de
cebada; la producción promedio de cebada entre las parcelas sin fertilizante y aquellas
con fertilizante son significativamente diferentes.

Para resolver el cuarto punto propuesto, se requiere realizar la comparación entre


los tratamientos que tienen como base el nitrógeno, T2 y T3, con aquellos que tienen
como base el potasio, T4 y T5, el procedimiento es el siguiente:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 31


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

La formulación de la hipótesis a docimar es:


H0 : (µ2 + µ3 ) - (µ4 + µ5) = 0
HA : (µ2 + µ3 ) - (µ4 + µ5) ≠ 0

La estadística de prueba es:


tc = L / σL

El criterio de decisión será el de rechazar la Hipótesis nula planteada si:


tc  ≥ t α/2, v

La función lineal para el cálculo es:

En este caso, el primer tratamiento no participa en la relación planteada bajo la


hipótesis nula, consecuentemente su λi será igual a 0, el valor de λ2 = λ3 = +1 y el
valor de λ4 = λ5 = -1; al igual que en el caso anterior se verifica que ∑λj =0.
Reemplazando tenemos:

L = 0(37.17) + (1)65.83 + (1)91.5 + (-1)103.17 +(-1)114.17


L = -60.01

El error estándar de la función:


σL = σ/√r * √∑λj2
σL = σ/√r * √(λ12 + λ22 + λ32 + ... + λa2)
σL = 9.267/√6 * √(02 + (1)2 + (1)2 + (-1)2 + (-1)2 )
σL = 7.566

de donde: tc = L / σL
tc = -60.01 / 7.566 = -7.932

El criterio de decisión será el de rechazar la Hipótesis nula planteada si:

tc  ≥ t α/2, v
-7.932  ≥ t 0.025, 20
-7.932  ≥ 2.086

La decisión será la de rechazar la H0 y concluimos que la producción promedio de


cebada es superior en las parcelas sembradas con fertilizante en base a potasio; este
tipo de fertilizante produce un efecto diferencial significativo en la producción de
cebada por parcela.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 32


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CAPITULO III

DISEÑO A DOS CRITERIOS DE CLASIFICACION

Conocido también como Modelo de dos vías o como Diseño en Bloque Completo
Azarizado, es aquel en el que el diseño experimental mantiene bajo control a dos
factores, cada uno con sus propios niveles de factor o categorías de variable, uno de
éstos factores es denominado como “Tratamientos” y el segundo “Bloques”, de
manera que:

1. Las unidades experimentales se distribuyen bloques o estratifican en grupos de


manera que en cada grupo o bloque las unidades experimentales sean iguales o
relativamente homogéneas y que el número de unidades experimentales sea igual
al número de tratamientos por investigar, o un múltiplo de éstos; y,

2. Los tratamientos se asignan al azar a las unidades experimentales dentro de cada


bloque, de forma que aleatoriamente se determina un tratamiento a una unidad
experimental en cada bloque.

De acuerdo a lo especificado, una unidad experimental pertenece a un bloque o


agrupación y es sometida a un solo tratamiento de investigación.

La agrupación de las unidades experimentales en bloques homogeniza las unidades


experimentales en cada bloque, juntando en cada bloque aquellas unidades que son
iguales o muy similares en sus características, con la intención de que al interior del
bloque las unidades tengan la menor variación posible; y, refleja el criterio del
investigador para encontrar y explicar el comportamiento diferencial de las unidades
experimentales ante la aplicación de tratamientos y el de disminuir el error
experimental; mientras que la asignación aleatoria de un tratamiento cualquiera a una
unidad experimental justifica la suposición de independencia que incluye el modelo.

Entre las principales ventajas de la utilización del diseño de bloques al azar se


mencionan las siguientes:

1. Por medio de la agrupación se obtienen resultados más exactos que cuando se


emplean diseños completamente al azar.

2. Puede incluirse cualquier número de tratamientos y de repeticiones, de forma que


cada tratamiento tenga el mismo número de repeticiones.

3. El análisis estadístico es sencillo, tiene el mismo fundamento que el análisis


realizado para el diseño completamente azarizado de una variable de clasificación.

4.1 MODELO A DOS CRITERIOS DE CLASIFICACION CON UNA


OBSERVACIÓN POR UNIDAD EXPERIMENTAL.

En este primer modelo de estudio, cada combinación de un bloque con un tratamiento


contiene una unidad experimental que provee una sola observación. La función
matemática del modelo es:

Xij = µ + αi + β j + εij
en el que:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 33


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Xij = Valor de la variable respuesta correspondiente en al iésimo


tratamiento del j-ésimo bloque.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento
β j = Es el efecto del j-ésimo bloque o repetición.
εij = Es el error o valor residual del i-ésimo tratamiento y del j-ésimo
bloque o repetición, que se considera es independiente de
observación a observación y está normalmente distribuido con
valor esperado igual a cero y varianza igual a σ , Ν (0,σ ).
2 2

Para i = 1, 2, ... a, número de tratamientos


j = 1, 2, ... b, número de bloques.

El efecto del i-ésimo tratamiento está dado por la diferencia entre su promedio y el
promedio general, esto es: µ - µi , diferencia que está representada por αi ; de
similar manera, el efecto del j-ésimo bloque está dado por la diferencia entre su
promedio y el promedio general, esto es: µ - µj , diferencia que es representada por
β j . Lo que se probará es si los efectos de los tratamiento y de los bloques son
estadísticamente significativos

Al igual que en el modelo de una vía, éste modelo supone: aditividad, linealidad,
normalidad, independencia y varianzas homogéneas.

Se acepta además que para cada tratamiento ∑β j = 0 y que para cada bloque ∑αi = 0;
por lo tanto: ∑β j = ∑αi = 0.

La representación simbólica de datos de éste diseño es la siguiente:

B L O Q U E
TRATAMIENTO B1 B2 Bj ... Bb ∑ Xi••
T1 X11 X12 X1j ... X1b X1•⋅
T2 X21 X22 X2j ... X2b X2•
Ti Xi1 Xi2 Xij ... Xib Xi•
? ... ... ... ... ... ...
Ta Xa1 Xa2 Xaj ... Xab Xa•
∑ X•j X• 1 X• 2 X•j ... X• b X••

En esta representación, Xi• representa al total del i-ésimo tratamiento y su promedio


se obtiene dividiendo este total para el número de bloques “b”. De manera análoga,
X•j representa el total del j-ésimo bloque y su pormedio se obtiene dividiendo éste para
el número de tratamientos “a”. Con “a” número de tratamientos y “b” número de
bloques el número total de observaciones y unidades experimentales “n” es igual al
producto de “a*b”.

La formulación de cálculo para determinar las sumas de cuadrados total, de


tratamientos, de bloques y el residual se presenta a continuación:
2
FC = (Σ xij) /ab
SCT = Σ x2ij - FC
SCE = Σ(x2i• / b) - FC
Σ(x •j / a) - FC
2
SCB =
SCR = SCT – SCE – SCB

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 34


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Nótese que el total marginal de cada tratamiento es utilizado para calcular la suma de
cuadrados para tratamientos, SCE, luego de ser elevado al cuadrado y dividido su
resultado por el número de bloques, b; y que el total marginal de cada bloque, elevado
al cuadrado y dividido para el número de tratamientos, a, se utiliza para estimar la
suma cuadrado de bloques, SCB.

Realizados los cálculos, se procede a resumir los resultados en el cuadro de Análisis


de Varianza cuyo contenido y representación es el siguiente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Bloques b-1 SCB CMB = SCB / (b-1) Fc = CMB / CMR
Residual (Error) (a-1) (b-1) SCR CMR = SCR/(a-1)(b-1)
TOTAL n-1 SCT

La estructura del cuadro es similar al del diseño de un criterio de clasificación,


añadiéndose a éste una línea completa para expresar los resultados del factor
“bloque” como fuente de variación adicional al de los tratamientos; por tanto contiene
por igual lo grados de libertad, la suma de cuadrados, el cuadrado medio y el
resultado de la estadística de prueba Fc.

Los Cuadrados Medios esperados para el Modelo I, o de efectos fijos, son los
siguientes:

FUENTE DE CUADRADO MEDIO


VARIACION ESPERADO
Tratamientos σ2 + b ∑ αi / (a-1)
Bloques σ2 + a ∑ βj / (b-1)
Residual (Error) σ2
TOTAL

El modelo tiene varias características que anotamos seguidamente:

1. Los efectos de los tratamientos no están influidos por las β j , porque la suma de
éstas en cada tratamiento es igual a cero, esto es: ∑β j = 0; de manera que Xi• es
un estimador imparcial de µ + αi

2. De igual forma, los efectos de los bloques no están influidos por las αi , porque la
suma de éstas en cada bloque es igual a cero: ∑αi = 0; de manera que X•j es un
estimador imparcial de µ + β j

3. En el análisis de varianza, la media cuadrada residual o del error, CMR, es un


estimador imparcial de σ .
2

El procedimiento de análisis del diseño experimental planteado es similar al diseño


anterior; esto es, se realiza mediante la formulación matemática de la hipótesis, la
determinación de la estadística de prueba, la especificación del criterio de decisión, la
ejecución de los cálculos y se concluye con la toma de la decisión, así:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 35


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

1. Formulación de la Hipótesis:

Se realizarán dos pruebas, la primera que verifique si los tratamientos son


significativamente diferentes y la segunda comprobando si los bloques son
significativamente diferentes:

H0 : αi = 0
HA : αi ≠ 0

y H0 : β j = 0
HA : β j ≠ 0

2. Determinación de la estadística de prueba

La estadística de prueba que se utilizará es:


Fc = CME / CMR para tratamientos
Fc = CMB / CMR para bloques

3. Criterio de Decisión

El criterio de decisión para la aceptación o el rechazo de la hipótesis planteada en el


problema es: Rechazar la H0 si : Fc ≥ Fα, v1, v2

El criterio de decisión planteado es válido tanto para tratamientos como para bloques.

4. Ejecución de cálculos

Con los datos que el problema proporciona deben calcularse las sumas de cuadrados,
los cuadrados medios y el valor de la estadística de prueba conforme se presentó en
el cuadro de análisis de varianza.

5. Decisión

El proceso de prueba termina cuando el investigador toma una decisión sobre la


aceptación o rechazo de la hipótesis nula planteada y responde al interrogante que
plantea el problema. Con la decisión concluye el proceso de prueba y del análisis de
varianza.

EJEMPLO:

En cierto experimento, se consideró probar cuatro procedimientos diferentes para la


producción de cierto producto. Se decidió utilizar seis operadores para comprobar la
bondad de los procedimientos de producción, para esto cada operador debía trabajar
con cada uno de los procedimientos; la operacionalización de los procedimientos de
producción requiere cierta destreza manual y se anticipa que habrá una diferencia en
la velocidad con que los operadores manejen los procedimientos; para evitar cualquier
sesgo los procedimientos son asignados a cada operador al azar y sólo por un día de
8 horas de trabajo. Al término de cada día, se contabilizó el número de unidades
producidas por el operador, los siguientes datos corresponden al número de unidades
producidas por día:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 36


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

UNIDADES DE PRODUCCIÓN DIARIA POR OPERADOR SEGÚN PROCEDIMIENTO


DE PRODUCCIÓN

PROCEDIMIENTO OPERADOR
DE PRODUCCION 1 2 3 4 5 6 TOTAL
A 43 39 40 40 43 44 249
B 40 40 41 42 43 43 249
C 40 41 41 43 45 45 255
D 41 42 44 44 46 42 259
TOTAL 164 162 166 169 177 174 1012

Probar para un nivel de significación del 5%, que no existe una diferencia significativa
entre los procedimientos de producción; y que, la diferencia en el promedio de
producción de los operadores se debe únicamente al azar.

SOLUCION:

Características del problema:

FACTORES: Procedimiento de producción; y, Operadores


TRATAMIENTOS: Procedimientos de producción A, B, C y D.
BLOQUES: Operador 1 al operador 6
UNIDAD EXPERIMENTAL: Día de 8 horas de trabajo.
VARIABLE RESPUESTA: Número de unidades producidas
NIVEL DE SIGNIFICACION 0.05
MODELO: Modelo I de Efectos Fijos
Xij = µ + αi + β j + εij

1. Formulación de la Hipótesis:

H0 : αi = 0 No existe diferencia en el número de unidades


producidas por día de trabajo, debido a los
procedimientos de producción.
HA : αi ≠ 0 Existe diferencia en el número de unidades producidas
por día de trabajo, debido a los procedimientos de
producción.

H0 : βj = 0 No existe diferencia en el número de unidades


producidas por día de trabajo, entre los operadores.
HA : βj ≠ 0 Existe diferencia en el número de unidades producidas
por día de trabajo, entre los operadores.

2. Determinación de la estadística de prueba


Fc = CME / CMR para tratamientos
Fc = CMB / CMR para bloques

3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα, v1, v2

4. Ejecución de cálculos

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 37


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

PROCED. Xij2
PRODUCC. 1 2 3 4 5 6TOTAL
A 1849 1521 1600 1600 1849 1936 10355
B 1600 1600 1681 1764 1849 1849 10343
C 1600 1681 1681 1849 2025 2025 10861
D 1681 1764 1936 1936 2116 1764 11197
TOTAL 6730 6566 6898 7149 7839 7574 42756

Del cálculo de la suma de cuadrados tenemos:

FC = 1067089 / 24
FC = 42672,7

SCT = 42756 -4462


SCT = 83,33

SCE = (2492/6 + 2492/6 + 2552/6 + 2592/6) -42672,7


SCE = 12
2 2 2 2 2 2
SCB = (164 /4 + 162 /4 + 166 /4 + 169 /4 + 177 /4 + 174 /4) - 42672,7
SCB = 42,83

SCR = 83,33 -12 - 42,83


SCR = 28,50
CUADRO DE ANÁLISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO


VARIACION LIBERTAD CUADRADOS MEDIO Fc
Procedimientos 3 12,00 4,00 2,105
Operadores 5 42,83 8,57 4,509
Residual 15 28,50 1,90
TOTAL 23 83.33

El procesamiento de los datos utilizando el análisis de varianza mediante Excel


proporciona los mismos resultados, presentando adicionalmente un resumen de cada
nivel de factor, conforme se presenta a continuación:

Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


A 6 249 41.50 4.30
B 6 249 41.50 1.90
C 6 255 42.50 4.70
D 6 259 43.17 3.37

OP 1 4 164 41.00 2.00


OP 2 4 162 40.50 1.67
OP 3 4 166 41.50 3.00
OP 4 4 169 42.25 2.92
OP 5 4 177 44.25 2.25
OP 6 4 174 43.50 1.67

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 38


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

ANÁLISIS DE
VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilida Ft
Variación Cuadrados Libertad Medio d
Filas 12.00 3 4.00 2.105 0.14247 3.287
Columnas 42.83 5 8.57 4.509 0.01042 2.901
Error 28.50 15 1.90

Total 83.33 23

Nótese que en el reporte que se obtiene sobre el cuadro de análisis de varianza se


indica como fuente de variación a Filas, que corresponde al factor Procedimientos; y,
se expresa como fuente de variación a Columnas en representación del factor
Operadores. Además, se hace constar la probabilidad de obtener un valor de Fc
mayor o igual al calculado; los demás términos y componentes de cuadro son los
vistos anteriormente.

5. Decisión
Aplicando el criterio de decisión formulado, para la dócima de los tratamientos, o
procedimientos de producción, se tiene que:

Para los tratamientos, cuyo factor de análisis es Procedimiento de Producción, la


decisión consiste en rechazar la H0 si : Fc ≥ F0.05, 3, 15
2,105 < 3,287

No se cumple la desigualdad, por lo tanto, acepto la hipótesis nula y concluyo que los
procedimientos de producción no son significativamente diferentes, o lo que es lo
mismo, éstos son igualmente efectivos.

Aplicado el criterio de decisión para bloques, que representan a los operarios, se


propone:

rechazar la H0 si : Fc ≥ F0.05, 5, 15
4,509 ≥ 2,901 se cumple.

por lo tanto, al cumplirse la desigualdad, rechazo la hipótesis nula y concluyo que el


número de unidades producidas tiene diferencias significativas entre los obreros, se
pone en evidencia que la destreza en la aplicación de los procedimientos de
producción es significativamente diferencial entre los operarios; en consecuencia,
respondiendo a la pregunta del problema, las diferencias existentes no se deben al
azar.

4.2 PARTICIÓN DE LA SUMA DE CUADRADOS DE TRATAMIENTOS

Cuando el investigador ha planificado la comparación entre diferentes tratamientos, es


a menudo posible fraccionar la suma de cuadrados de tratamientos en el análisis de
varianza, lo que permite encontrar mayor explicación a la variación detectada.

La partición de la suma de cuadrados se realiza con los totales de los tratamientos, en


lugar de sus promedios, lo que evita errores por redondeo de cifras. Esta se realiza

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 39


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

utilizando la Función Lineal, cuyo procedimiento utiliza los totales de los tratamientos y
su finalidad es particionar la SCE, así como realizar comparaciones entre
tratamientos. En tal virtud, se enunciarán varias reglas que deben ser observadas.

Cualquier combinación lineal de la forma:

L = λ1T1 + λ2T2 + λjTi + .... λaTa

Es una comparación entre lo totales de tratamientos, sujeta a la restricción de que:


∑ λi = 0
L / (r ∑λi )
2 2
Entonces la relación:

Es parte de la suma de cuadrados de tratamientos asociado con 1 grado de libertad,


en la que:
λi = Coeficiente ortogonal correspondiente al i-ésimo tratamiento.
Ti = Total del i-ésimo tratamiento.
r = Número de observaciones en uno cualquiera de los tratamientos

Nótese que el subíndice “i” varía desde 1 hasta “a” número de tratamientos; y que,
éste ha reemplazado al subíndice “j” del capítulo anterior porque hemos representado
a los tratamientos en sentido de filas. Además, en un diseño de bloques el número de
unidades experimentales es igual para cada tratamiento, por lo tanto “r” siempre
tendrá el mismo valor para todos los tratamientos.

Para que dos o más funciones lineales formen parte independiente o sean
componentes independientes de la suma de cuadrados de tratamientos, es
indispensable que éstas sean mutuamente ortogonales.

Dos funciones lineales:

L1 = λ11T1 + λ12T2 + λ1iTi + .... λ1aTa


L2 = λ21T1 + λ22T2 + λ2iTi + .... λ2aTa

son mutuamente ortogonales si:

λ11λ21 + λ12λ22 + λ13λ23 + ... + λ1iλ2i + ... + λ1aλ2a = 0

o lo que es lo mismo: ∑ λ1iλ2i = 0

Por lo tanto, si dos comparaciones son ortogonales, sus contribuciones

L12 / (r ∑λ1i2 )
L2 / (r ∑λ2i )
2 2

Son partes independientes de la suma de cuadrados de tratamientos, cada una con


un grado de libertad. Esto significa que la suma de cuadrados de tratamientos puede
dividirse en las contribuciones de L1 y L2 más cualquier remanente con (a – 3) gl..

Una consecuencia de lo anterior es que si las comparaciones de L1 , L2 , L3 , ... La-1


son mutuamente ortogonales, entonces, sus contribuciones son componentes
individuales de la suma de cuadrados de tratamientos:

SCE = L12 + . L22 + . L32 + . La-12 .


r ∑λ1i2 r ∑λ2i2 r ∑λ3i2 r ∑λa-1i2

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 40


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

El número total de componentes en los que puede particionarse la suma de cuadrados


de tratamientos es igual a su número de grados de libertad, estos es (a – 1)
componentes.

Si estuviéramos analizando un modelo a una sola vía en el que los tratamientos tienen
diferente número de repeticiones, las reglas señaladas arriba cambian un poco. Si el
tratamiento i-ésimo tiene ri repeticiones, se ha demostrado que la SCE, suma de
cuadrados de tratamientos es:

SCE = ( T12 /r1 + T22 /r2 + J + Ta2 /ra) - ((T1 + T2 + J + Ta)2 / ∑ ri)

Entonces, cualquier combinación lineal de la forma:


L = λ1T1 + λ2T2 + λiTi + .... λaTa

Es una comparación entre los totales de tratamientos, sujeta a la restricción de que:

r 1 λ 1 + r2 λ 2 + J + ri λ i + J + ra λ a = 0
o lo que es lo mismo: ∑ ri λ i = 0

Entonces la relación: L2 / ∑ ri λi2

En donde: ∑ ri λi2 = r1λ12 + r2λ22 + J + riλi2 + J + raλa2

Es una partición de la suma de cuadrados de tratamientos asociado con 1 grado de


libertad.

Dos comparaciones lineales:

L1 = λ11T1 + λ12T2 + λ1iTi + .... λ1aTa


L2 = λ21T1 + λ22T2 + λ2iTi + .... λ2aTa

son mutuamente ortogonales si:


r1λ11λ21 + r2λ12λ22 + r3λ13λ23 + ... + riλ1iλ2i + ... + raλ1aλ2a = 0

o lo que es lo mismo: ∑ riλ1iλ2i = 0

Por lo tanto, si dos comparaciones son ortogonales, sus contribuciones

L12 / ∑ riλ1i2
L2 / ∑ riλ2i
2 2

Son partes independientes de la suma de cuadrados de tratamientos, cada una con


un grado de libertad.

Las últimas reglas expuestas, las relacionadas con diferente número de repeticiones
por tratamiento, sirven especialmente cuando se desea particionar de la SCE en
subgrupos de tratamientos, mayor información y referencia del procedimiento que
debe ser empleado lo encontrará en la sección 3.43 del libro Diseños Experimentales
de Cochran y Cox.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 41


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

EJEMPLO:

Se van a probar seis raciones de alimentación respecto de sus diferencias en el


engorde de novillos. Se dispone de 24 novillos para la experimentación, que se
distribuyen en cuatro bloques, 6 novillos por bloque, clasificados en base a su peso al
inicio del experimento de engorde, los 6 novillos más pesados se agruparon en un
bloque, en otro se agruparon los siguientes 6 novillos más pesados y así
sucesivamente. Las raciones de alimentación, denotadas por A, B, C, D, E, F y G,
fueron asignados aleatoriamente a los novillos dentro de cada bloque, de la siguiente
manera:

Bloque 1 B F A C E D
Bloque 2 A E D F C B
Bloque 3 E A C B D F
Bloque 4 F D E A B C

El incremento diario promedio del peso de cada novillo, expresado en kilogramos, fue
registrado con los siguientes resultados:

BLOQUE
RACION B1 B2 B3 B4 TOTAL
A 1,5 0,9 0,5 0,9 3,8
B 1,4 2,3 3,2 1,9 8,8
C 0,9 1,4 1,4 2,3 6.0
D 2,3 1,8 2,3 2,3 8,7
E 2,7 2,3 2,3 3,6 10,9
F 3,6 3,2 4,5 4,1 15,4
TOTAL 12,4 11,9 14,2 15,1 53,6

Todos los novillos tuvieron como base de la ración la misma cantidad de pasto fresco
al que se añadieron determinados componentes, conforme se detalla:

RACION COMPONENTES DE LA RACION


A Solo pasto
B Pasto + complemento alimenticio
C Pasto + vitamina
D Pasto + complemento alimenticio + vitamina
E Pasto + 1.5 complemento alimenticio
F Pasto + 1.5 complemento alimenticio + vitamina

Se desea verificar, para una significancia del 0.05, si existe una diferencia significativa
en la ganancia de peso de los novillos:
1. Debido a las raciones alimenticias.
2. Debido a las categorías de peso de los novillos al inicio del experimento.
3. Entre sólo pasto y las restantes raciones alimenticias
4. Entre las raciones que incluyen complemento alimenticio + vitamina vs. Las que
incluyen sólo complemento alimenticio.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 42


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

5. Entre la ración que incluye complemento alimenticio más vitamina vs. La que
incluye 1.5 veces complemento alimenticio más vitamina.
6. Entre los novillos de mayor peso con los de menor peso al inicio del experimento.

SOLUCION:

Características del problema:

FACTORES: Alimentación y Categoría de peso al inicio


TRATAMIENTO: Ración alimenticia A, B, C, D, E y F.
BLOQUE: Categoría de peso al inicio: B1, B2, B3 y B4
UNIDAD EXPERIMENTAL: Novillo
VARIABLE RESPUESTA: Incremento diario promedio del peso medido en
Klg.
NIVEL DE SIGNIFICACION 0.05
MODELO: Modelo I, de efectos fijos
Xij = µ + αi + β j + εij

Para responder a las preguntas 1 y 2:

1. Formulación de la Hipótesis:

H0 : αi = 0 No existe diferencia en el incremento diario del peso en


los novillos, debido a las raciones alimenticias
HA : αi ≠ 0 Existe diferencia en el incremento diario del peso en los
novillos, debido a las raciones alimenticias

H0 : βj = 0 No existe diferencia en el incremento diario del peso en


los novillos, debido a las categorías del peso inicial
HA : βj ≠ 0 Existe diferencia en el incremento diario del peso en los
novillos, debido a las categorías del peso inicial

2. Determinación de la estadística de prueba


Fc = CME / CMR para tratamientos
Fc = CMB / CMR para bloques

3. Criterio de Decisión
Rechazar la H0 si : Fc ≥ Fα, v1, v2

4. Ejecución de cálculos

X2ij
RACION B1 B2 B3 B4 TOTAL
A 2,25 0,81 0,25 0,81 4,12
B 1,96 5,29 10,24 3,61 21,1
C 0,81 1,96 1,96 5,29 10,02
D 5,29 3,24 5,29 5,29 19,11
E 7,29 5,29 5,29 12,96 30,83
F 12,96 10,24 20,25 16,81 60,26
TOTAL 30,56 26,83 43,28 44,77 145,44

FC = 2872,96 / 24

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 43


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

FC = 119,71

SCT = 145,44 - 119,71


SCT = 25,73

SCE = (559,54/4) - 119,71


SCE = 20,18

SCB = (725,02/6) - 119,71


SCB = 1,13

SCR = 25,73 - 20,18 - 1,13


SCR = 4,42

Con los resultados obtenidos elaboramos el cuadro de Análisis de Varianza

CUADRO DE ANALISIS DE VARIANZA


Fuente de Grados de Suma de Cuadrado Fc Cuadrado medio
Variación Libertad Cuadrados Medio esperado

Ración 5 20,18 4,04 13,680 0.29 + 4 ∑ αi / (5-1)


Bloque 3 1,13 0,38 1,277 0.29 + 6 ∑ βj / (4-1)
Residual 15 4,42 0,29 0.29
Total 23 25,73

Nótese que se han reemplazo los valores para la determinación del cuadrado medio
esperado de tratamientos y de bloques; en éstos, el efecto de los i-ésimos
tratamientos sumados en todos los casos es igual a 0.29 + 4 ∑ αi / (5-1). De similar
manera, el efecto de los j-ésimos bloques sumados en todos los bloques es igual a
0.29 + 6 ∑ β j / (4-1).

Con el procesamiento de la información en el Excel, tenemos los siguientes


resultados:

Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


A 4 3.8 0.950 0.170
B 4 8.8 2.200 0.580
C 4 6 1.500 0.340
D 4 8.7 2.175 0.063
E 4 10.9 2.725 0.376
F 4 15.4 3.850 0.323

B1 6 12.4 2.067 0.987


B2 6 11.9 1.983 0.646
B3 6 14.2 2.367 1.935
B4 6 15.1 2.517 1.354

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 44


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Filas 20.178 5 4.036 13.680 3.88E-05 2.901
Columnas 1.130 3 0.377 1.277 0.318186 3.287
Error 4.425 15 0.295

Total 25.733 23

En el cuadro, la fuente de variación denominada Filas corresponde al factor Ración y


el denominado Columnas corresponde al factor Bloque.

Visto en la tabla el valor teórico de la estadística de prueba, Fα, v1, v2 , para un nivel de
significación de 0.05, para la dócima de tratamientos como para la dócima de los
bloques, es respectivamente:
Fα, v1, v2 = F0.05, 5, 15 = 2.901
Fα, v1, v2 = F0.05, 3, 15 = 3.287

Decisión:
Aplicando el criterio de decisión previsto, tenemos que rechazo la hipótesis nula si:
Fc ≥ Fα, v1, v2 reemplazando valores para los tratamientos tenemos
4.4 ≥ 2.90 se cumple.

por lo tanto, al cumplirse la desigualdad, rechazo la hipótesis nula planteada para las
raciones y concluyo que el efecto de las raciones en el incremento de peso de los
novillo es significativamente diferencial.

Para el caso de los bloques, o de la categorización del novillo por su peso al inicio del
experimento, tenemos que:
Fc ≥ Fα, v1, v2 reemplazando valores para los tratamientos tenemos
1.277 ≥ 3.287 no se cumple.

al no cumplirse la desigualdad, acepto la hipótesis nula planteada para los bloques y


concluyo indicando que el peso del novillo al inicio del experimento no tiene un efecto
diferencial significativo en el incremento del peso del animal.

Para resolver el numeral 3 del problema, debemos proceder con la partición de la


suma de cuadrados. De manera que, para probar si existe diferencia significativa
entre las ración que contiene sólo pasto y las restantes raciones alimenticias, procedo
con la primera partición de la SCE que deberá comprobar la hipótesis:

H0 : µA - (µB + µC + µD + µE + µF)/5 = 0
HA : µA - (µB + µC + µD + µE + µF)/5 ≠ 0

La función lineal a ser aplicada será:

L1 = λAYA + λBYB + λCYC + λDYD + λEYE + λFYF


L1 = 5(3.8) + (-1)8.8 + (-1)6 + (-1)8.7 + (-1)10.9 + (-1)15.4
L1 = - 30.8

Su contribución a la suma de cuadrados: L12 / (r ∑λ1i2 )


(-30.8)2 / 4(30) = 7.905

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 45


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

El valor 7.905 es una partición de la SCE con un grado de libertad, que explica el 39%
de la variación en los tratamientos. Además, se observará que r = 4 corresponde al
número de bloques o repeticiones y que cada tratamiento tiene igual número r = 4; se
verifica que la suma de los coeficientes ortogonales empleados en la función es igual
a cero; y que el valor de 30 corresponde a la suma de los cuadrados de los
coeficientes ortogonales empleados en la función lineal.

Para resolver el numeral 4 del problema, esto es para probar que no existe
diferencia significativa entre las raciones que incluyen complemento alimenticio +
vitamina con aquellas que incluyen sólo complemento alimenticio, formulamos una
segunda partición que deberá probar la hipótesis:

H0 : (µD + µF ) - (µC + µE) = 0


HA : (µD + µF ) - (µC + µE) ≠ 0

La función lineal a ser aplicada es:

L2 = λAYA + λBYB + λCYC + λDYD + λEYE + λFYF


L2 = 0(3.8) + 0(8.8) + (-1)6 + 1(8.7) + (-1)10.9 + 1(15.4)
L2 = 7.2

Su contribución a la suma de cuadrados: L12 / (r ∑λ1i2 )


(7.2)2 / 4(4) = 3.24

Este valor es una partición de la SCE con un grado de libertad; al igual que en caso
anterior r = 4 y se confirma que la suma de los coeficientes ortogonales empleados en
la función es igual a cero.

Debemos notar que las dos funciones lineales utilizadas son mutuamente ortogonales,
toda vez que se verifica que la suma de la multiplicación de los coeficientes de la
primera y segunda función, es igual a cero:
∑ λ1iλ2i = 0

λ1Aλ2A + λ1Bλ2B + λ1Cλ2C + λ1Dλ2D + λ1Eλ2E + λ1Fλ2F = 0


5(0) + (-1)0 + (-1)(-1) + (-1)1 + (-1)(-1) + (-1)1 = 0

Consecuentemente, las dos funciones lineales planteadas son componentes


independientes de la suma de cuadrados de los tratamientos, con un grado de libertad
cada una.

Numeral 5 del problema, para verificar que no existe diferencia significativa entre la
ración que incluye complemento alimenticio más vitamina vs. La que incluye 1.5 veces
complemento alimenticio más vitamina, plantearemos otra función lineal que nos
permita realizar la comparación entre estos tratamientos y que pruebe la hipótesis:

H0 : µD - µF = 0
HA : µD - µF ≠ 0

La función lineal a ser aplicada es:

L3 = λAYA + λBYB + λCYC + λDYD + λEYE + λFYF


L3 = 0(3.8) + 0(8.8) + 0(6) + 1(8.7) + 0(10.9) + (-1)15.4
L3 = -6.7

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 46


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Su contribución a la suma de cuadrados: L12 / (r ∑λ1i2 )


2
(-6.7) / 4(2) = 5.611

es una partición de la suma de cuadrados de tratamientos SCE, con un grado de


libertad. Podemos verificar que las tres funciones lineales planteadas son mutuamente
ortogonales, toda vez que
∑ λ1iλ2i λ3i = 0

λ1Aλ2Aλ3A + λ1Bλ2Bλ3B + λ1Cλ2Cλ3C + λ1Dλ2Dλ3D + λ1Eλ2Eλ3E + λ1Fλ2Fλ3F = 0


5(0)(0) + (-1)0(0) + (-1)(-1)0 + (-1)1(1) + (-1)(-1)0 + (-1)1(-1) = 0

Por lo tanto, las contribuciones de la sumas de cuadrados de cada partición es


componente independiente de la suma de cuadrados de tratamientos SCE, con un
grado de libertad cada una. Con cada partición logramos explicar con mayor detalle la
variación de la SCE, en el presente caso, con la tres particiones realizadas explicamos
el 83% de la variación determinada en la SCE.

Numeral 6 del problema, para resolver el último interrogante del problema, es


necesario considerar la partición a la suma de cuadrados de los bloques que pruebe la
hipótesis:

H0 : µB1 - µB4 = 0
HA : µB1 - µB4 ≠ 0

La función lineal a ser aplicada será:

L = λB1YB1 + λB2YB2 + λB3YB3 + λB4YB4


L = 1(12.4) + 0(11.9) + 0(14.2) + (-1)15.1
L = -2.7

Su contribución a la suma de cuadrados: L12 / (r ∑λ1i2 )


(-2.7)2 / 6(2) = 0.6075

es una partición de la suma de cuadrados de tratamientos SCB, con un grado de


libertad, que explica el 53.8% de la variación registrada en los bloques.

Para docimar las hipótesis planteadas, reestructuramos el Cuadro de Análisis de


Varianza con la información obtenida, calculando en cada caso el valor de la
estadística de prueba F que será contrastado, conforme se presenta seguidamente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO


VARIACION LIBERTAD CUADRADOS MEDIO Fc Ft

Ración 5 20.18 4.04 13.68 2.90


A vs. Resto 1 7.91 7.91 26.83 4.54
D y F vs. C y E 1 3.24 3.24 11.00 4.54
D vs. E 1 5.61 5.61 19.04 4.54
Bloques 3 1.13 0.38 1.28 3.29
B1 vs. B4 1 0.61 0.61 2.06 4.54
Residual 15 4.42 0.29
TOTAL 23 25.73

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 47


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

El factor Ración explica el 78.4% de la Variación Total, el factor Bloque explica el 4.4%
y el error experimental comprende el 17.2% de la variación total. Al explorar con
mayor profundidad en la variación del factor ración, está fue dividida en tres
comparaciones mutuamente ortogonales que son componentes independientes que
explican el 83.1% de la variación detectada en el factor, logrando mayor profundidad
de análisis en los datos. Nótese además, que el factor bloques puede también ser
explicado mediante la partición de sus componentes, en el problema se obtuvo uno de
éstos que explica el 54% de la variación del factor.

En lo que tiene relación con la ración alimenticia de los novillos, todas las fuentes de
variación tienen valor calculado de F superior al valor tabular, por tanto las
comparaciones sometidas a prueba tienen diferencia significativa. Podemos afirmar
con el 95% de seguridad que la ración de sólo pasto produce un incremento de peso
significativamente menor al que producen raciones alimenticias que contienen pasto
más otros elementos. De igual manera se puede afirmar que las dietas que contienen
pasto + complemento alimenticio + vitamina, producen mayor incremento en el peso
de los novillos que aquellas dietas que contienen sólo pasto + complemento
alimenticio. Además, se comprobó que las raciones de pasto + complemento
alimenticio + vitamina, incrementan significativamente el peso si al complemento
alimenticio se dosifica con el 50% adicional de la dosis normal.

En cuanto a los bloques vemos que el valor calculado de F del factor bloques y su
partición es inferior al valor tabular, por tanto se concluye que no existe diferencia
significativa del incremento de peso de los novillos debido a la categoría del peso del
novillo al ingreso en el experimento; esto se ratifica cuando al comparar los resultados
de los novillos más pesados B1 con los menos pesados B4, existen diferencias que no
son estadísticamente significativas.

4.3 EFICIENCIA DEL DISEÑO

La comparación entre las varianzas residuales del diseño de bloques con el diseño a
un solo criterio de clasificación, teniendo en cuenta el cambio del número de grados
de libertad para el error, hace posible una estimación del aumento en precisión que
resulta del agrupamiento en bloques o repeticiones.

La relación entre la estimación de la varianza que se hubiera obtenido si el diseño


hubiese sido totalmente aleatorio (SCRA) y la varianza del diseño de bloques (SCRB),
nos permite medir la eficiencia relativa del uso del diseño de bloques para aumentar la
precisión de las comparaciones, esto es:
ED = SCRA
SCRB

Conforme la notación utilizada, CMB es el cuadrado medio de bloques y CMRB es el


cuadrado medio residual del diseño en bloques, entonces:

ED = CMB + (a – 1) CMRB
(a – 1) CMRB

ED = 0.38 + (6 – 1) 0.29 .
(6 – 1) 0.29

ED = 1.262

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 48


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Este resultado nos indica que el diseño de bloques utilizado para el análisis es
superior a si se hubiera utilizado un diseño de una sola vía para el análisis de los
tratamientos, la mejora es del 26.2%.

4.4 MODELO A DOS CRITERIOS DE CLASIFICACION CON DOS O MAS


OBSERVACIONES POR CELDA.

En este modelo a más de considerar los dos factores de clasificación, deben tomarse
en cuenta dos aspectos adicionales:

1. Cada combinación del i-ésimo tratamiento con el j-ésimo bloque, tiene 2 o más
observaciones por celda; y,

2. Suponemos que existe una interacción entre los factores considerados en el


experimento, que debe ser estimado y docimado. Si se encuentra que la
interacción es significativa, entonces los factores considerados en el diseño no son
independientes.

El modelo matemático del diseño es:

Xijk = µ + αi + β j + Iij + εijk


en el que:
Xijk = Valor de la variable respuesta correspondiente en el iésimo
tratamiento del j-ésimo bloque.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo tratamiento
β j = Es el efecto del j-ésimo bloque o repetición.
Iij = Interacción del i-ésimo tratamiento con el j-ésimo bloque
εijk = Es el error o valor residual del i-ésimo tratamiento, del j-ésimo
bloque y de la c-ésima repetición, que se considera es
independiente de observación a observación y está normalmente
distribuido con valor esperado igual a cero y varianza igual a σ2 ,
Ν (0,σ ).
2

Para i = 1, 2, ... a, número de tratamientos


j = 1, 2, ... b, número de bloques.
k = 1, 2, ... c, número de repeticiones

Se acepta además que: ∑β j = ∑αj = ∑Iij = 0.

Lo que implica que para cualquier tratamiento, los bloques no tienen efecto debido a
que los efectos parciales de los bloques en el tratamiento se compensan; de igual
manera, el efecto de la interacción es nula en cada tratamiento. De forma análoga,
para cada bloque, los tratamientos no tienen efectos porque los efectos parciales de
los tratamientos se compensan al igual que los de interacción. La representación
simbólica de datos de éste diseño es la siguiente:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 49


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TRATAMIENTO BLOQUE
Repetición B1 B2 ... Bj ... Bb ∑

T1 1 X111 X121 X1j1 X1b1


2 X112 X122 X1j2 X1b2
X11• X12• X1j• X1b• X1••

T2 1 X211 X221 X2j1 X2b1


2 X212 X222 X2j2 X2b2
X21• X22• X2j• X2b• X2••
....
Ti 1 Xi11 Xi21 Xij1 Xib1
2 Xi12 Xi22 Xij2 Xib2
Xi1• Xi2• Xij• Xib• Xi••
....
Ta 1 Xa11 Xa21 Xaj1 Xab1
2 Xa12 Xa22 Xaj2 Xab2
Xa1• Xa2• Xaj• Xab• Xa••

∑ X•1• X•2• X•j• X•b• X•••

En el modelo existe “a” número de tratamientos, “b” número de bloques y “c” número
de repeticiones para cada i-ésimo tratamiento y j-ésimo bloque, de manera que el
número total de observaciones “n” es el producto de “a*b*c”. n = a*b*c
La formulación de cálculo para determinar las sumas de cuadrados total, de
tratamientos, de bloques, de interacción y el residual se presenta a continuación:

FC = (Σ xijk)2/abc
SCT = Σ x2ijk - FC
Σ(x i•• / bc) - FC
2
SCE = = A
SCB = Σ(x2•j• / ac) - FC = B
SCI = (Σ(x2ij• / c) – FC) – (A + B) = C
SCR = SCT – (A+B+C) = D

Realizados los cálculos, se procede a resumir los resultados en el cuadro de Análisis


de Varianza cuyo contenido y representación es la siguiente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a - 1) Fc = CME / CMR
Bloques b-1 SCB CMB = SCB / (b-1) Fc = CMB / CMR
Interacción (a-1) (b-1) SCI CMI = SCI /(a-1)(b-1) Fc = CMI / CMR
Residual (Error) a*b (c-1) SCR CMR = SCR/ab(c-1)
TOTAL n–1 SCT

Los Cuadrados Medios esperados para el Modelo I, o de efectos fijos, son los
siguientes:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 50


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

FUENTE DE CUADRADO MEDIO


VARIACION ESPERADO
σ + cσ ab + cbσ a
2 2 2
Tratamientos
σ + cσ ab + caσ b
2 2 2
Bloques
Interacción σ + cσ ab
2 2

σ
2
Residual (Error)
TOTAL

El procedimiento de prueba y de análisis del diseño experimental planteado es similar


al diseño anterior; esto es, sigue el procedimiento formal de dócima hasta la toma de
la decisión. Las hipótesis a docimar son las siguientes:

H0 : αi = 0
HA : αi ≠ 0

Con αi = 0 se prueba la hipótesis de que los tratamientos no tienen un efecto


diferencial significativo en la variable respuesta.

H0 : β j = 0
HA : β j ≠ 0

Con βj = 0 se prueba la hipótesis de que los bloques no tienen un efecto diferencial


significativo en la variable respuesta.

H0 : Iij = 0
HA : Iij ≠ 0

Con esta formulación se prueba la hipótesis de que los dos criterios de clasificación,
tratamientos y bloques, son mutuamente independientes y que por lo tanto no existe
interacción entre estos factores.

Los restantes elementos del procedimiento se mantienen constantes, a éstos


debemos agregar la estadística de prueba para la interacción que es:

Fc = CMI /CMR

Y el criterio de decisión para la aceptación o el rechazo de la hipótesis planteada es:

Rechazar la H0 si : Fc ≥ Fα, v1, v2

EJEMPLO:

Un microempresario debe tomar la decisión de comprar una de cuatro máquinas que


le han sido ofertadas para la producción de su taller. Con la finalidad de contar con
suficientes elementos de juicio, decide que los tres operarios que laboran O1, O2 y
O3, trabajen durante un día completo con cada máquina ofertada, M1, M2, M3 y M4, y
toma dos mediciones del tiempo que se demora cada obrero en la producción de un
artículo. Los datos que contiene el cuadro siguiente expresa el tiempo registrado en
minutos.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 51


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TIEMPO EN MINUTOS PARA LA PRODUCCIÓN DE UN ARTICULO

MQ. REP. OPERARIO


O1 O2 O3 Suma
M1 1 42.5 39.6 42.9
2 39.3 39.9 41.6
81.8 79.5 84.5 245.8

M2 1 39.8 40.5 42.5


2 40.1 42.3 43.1
79.9 82.8 85.6 248.3

M3 1 42.2 42.3 44.9


2 43.5 43.4 45.1
85.7 85.7 90 261.4

M4 1 43.3 43.5 45.9


2 43.2 44.2 42.3
86.5 87.7 88.2 262.4

SUMA 333.9 335.7 348.3 1017.9

Se desea probar si las máquinas trabajan a igual velocidad; si los operarios se


demoran igual tiempo para producir una unidad del bien; y, existe algún efecto
combinado entre la máquina y el operario que esté afectando al tiempo medio de
producción. Considere un 95% de confianza para la toma de decisiones.

SOLUCION:

Características del problema:

FACTORES: Máquinas y Operarios


TRATAMIENTO: Máquina M1, M2, M3 y M4
BLOQUE: Operario O1, O2 y O3
UNIDAD EXPERIMENTAL: Día de Trabajo
VARIABLE RESPUESTA: Tiempo que toma la producción de un artículo
NUMERO DE REPLICAS 2
NIVEL DE SIGNIFICACION 0.05
MODELO: Modelo I, de efectos fijos
Xijk = µ + αi + β j + Iij + εijk

Para resolver los dos primeros interrogantes, procederé de la siguiente manera:

1. Formulación de la Hipótesis:

H0 : αi = 0 No existe diferencia en el tiempo de producción de un


artículo debido a las máquinas.
HA : αi ≠ 0 Existe diferencia en el tiempo de producción de un
artículo debido a las máquinas.

H0 : βj = 0 No existe diferencia en el tiempo de producción de un


artículo debido a los operarios.
HA : βj ≠ 0 Existe diferencia en el tiempo de producción de un
artículo debido a los operarios.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 52


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

H0 : Iij = 0 No existe interacción entre las máquinas y los operarios.


Los dos factores son independientes.
HA : Iij ≠ 0 Existe interacción entre las máquinas y los operarios.
Los dos factores no son independientes.

2. Determinación de la estadística de prueba

Fc = CME / CMR para tratamientos


Fc = CMB / CMR para bloques
Fc = CMI / CMR para la interacción

3. Criterio de Decisión

Rechazar la H0 si : Fc ≥ Fα, v1, v2 válidos para las tres hipótesis

4. Ejecución de cálculos:
2
MQ. REP. X ij
O1 O2 O3 Suma
M1 1
1,806.25 1,568.16 1,840.41
2
1,544.49 1,592.01 1,730.56

3,350.74 3,160.17 3,570.97 10,081.88

M2 1
1,584.04 1,640.25 1,806.25
2
1,608.01 1,789.29 1,857.61

3,192.05 3,429.54 3,663.86 10,285.45

M3 1
1,780.84 1,789.29 2,016.01
2
1,892.25 1,883.56 2,034.01

3,673.09 3,672.85 4,050.02 11,395.96

M4 1
1,874.89 1,892.25 2,106.81
2
1,866.24 1,953.64 1,789.29

3,741.13 3,845.89 3,896.10 11,483.12

SUMA
13,957.01 14,108.45 15,180.95 43,246.41

n = a*b*c = 4 * 3 * 2 = 24

FC = (1017,9)2 / 24 = 43.171,68
SCT = 43246,41 - 43.171,68 = 74,73

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 53


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

SCE = (( 245,82 + 248,32 + 261,42 + 262,42) / (3*2)) - 43.171,68


SCE = 37,36

SCB = (( 333,92 + 335,72 + 348,32) / (4*2)) - 43.171,68


SCB = 15,39

SCI = (( 81.82 + 79.52 + ... + 88.22) / 2) - 43171,68 -(37,36 + 15,39)


SCI = 5,92

SCR = 74,73 - 37,36 - 15,39 - 5,92


SCR = 16,06

Con los resultados obtenidos estructuramos el cuadro de Análisis de Varianza

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO


VARIACION LIBERTAD CUADRADOS MEDIO Fc Ft

Maquinaria 3 37.36 12.45 9.307 3.49


Operarios 2 15.39 7.70 5.751 3.89
Interacción 6 5.92 0.99 0.738 3.00
Residual 12 16.06 1.34

TOTAL 23 74.73

5. Decisión:

El criterio de decisión establece que si el valor calculado de la estadística F es igual o


mayor al valor tabulado de F, entonces se rechazará la hipótesis nula. Con los
resultados expuestos en el cuadro anterior y aplicado este procedimiento,
examinemos las decisiones que debemos tomar.

En general, Fc ≥ Fα, v1, v2 reemplazando valores para los tratamientos tenemos


9.307 ≥ 3.49 se cumple,
5.751 ≥ 3.89 se cumple,
0.738 ≥ 3.00 no se cumple.

En el caso de los tratamientos, la maquinaria, se encontró que el valor calculado es


mayor que el tabulado, por lo tanto decido rechazar la hipótesis nula planteada y
concluyo que el tiempo promedio de producción de un artículo es significativamente
diferente entre las máquinas.

En el caso de los bloques, los operarios, encontramos que también existe una
diferencia significativa en el tiempo promedio de producción de un artículo entre los
obreros y por lo tanto rechazo la hipótesis nula.

Por último, acepto la hipótesis nula sobre la interacción, esto es, que los dos factores
considerados son independientes. Llegaremos a iguales resultados y conclusiones si
procesamos la información en Excel; el resultado final del procesamiento se expone a
continuación:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 54


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Análisis de varianza de dos factores con varias muestras por grupo

RESUMEN O1 O2 O3 Total
M1
Cuenta 2 2 2 6
Suma 81.8 79.5 84.5 245.8
Promedio 40.90 39.75 42.25 40.97
Varianza 5.12 0.05 0.85 2.45

M2
Cuenta 2 2 2 6
Suma 79.9 82.8 85.6 248.3
Promedio 39.95 41.40 42.80 41.38
Varianza 0.04 1.62 0.18 1.99

M3
Cuenta 2 2 2 6
Suma 85.7 85.7 90 261.4
Promedio 42.85 42.85 45 43.57
Varianza 0.845 0.605 0.02 1.53

M4
Cuenta 2 2 2 6
Suma 86.5 87.7 88.2 262.4
Promedio 43.25 43.85 44.1 43.73
Varianza 0.005 0.245 6.48 1.50

Total
Cuenta 8 8 8
Suma 333.9 335.7 348.3
Promedio 41.74 41.96 43.54
Varianza 2.98 3.09 2.41

Los resultados del análisis presentan información básica del número de elementos
considerados en el cálculo, la suma, promedio y varianza de cada nivel de la variable
considerada. Los resultados del análisis de varianza se presentan a continuación:

ANÁLISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrado Fc Probabilidad Ft
Variación Cuadrados Libertad Medio
Muestra 37.36 3 12.45 9.31 .0019 3.49
Columnas 15.39 2 7.70 5.75 .0177 3.89
Interacción 5.92 6 0.99 0.74 .6294 3.00
Dentro del grupo 16.06 12 1.34

Total 74.73 23

El análisis es exactamente el mismo que el descrito en los párrafos anteriores.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 55


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

4.5 DATOS FALTANTES

Cuando me encuentro e un diseño a un criterio de clasificación, la pérdida o falta de


un dato no significa mayor problema, el procedimiento de cálculo se realiza como si el
modelo hubiese sido concebido con diferente número de repeticiones por tratamiento,
cuyo proceso se detalló en el capítulo anterior.

El diseño a dos criterios de clasificación prevé que para cada categoría del factor
tratamiento y cada categoría del factor bloque, se registre por lo menos una
observación, manteniendo igual número de observaciones para cada celda. Por lo
general, se obtiene una observación por celda, cuando alguna de éstas falta porque la
unidad experimental se perdió o destruyó en la realización del experimento sin que
pudiera obtenerse el valor de la variable respuesta correspondiente, entonces la
observación faltante se estima en función de los datos reales obtenidos en el
experimento, mediante la aplicación de la siguiente formula:

Xij = (aT + bB - S)
(a – 1)(b – 1)

en donde:
Xij = Observación faltante a estimar.
a = Número de tratamientos
T = Total del tratamiento en el que existe un dato faltante.
b = Número de bloques
B = Total del bloque en el que existe el dato faltante.
S = Sumatoria de todas las observaciones.

Si el número de datos faltantes es de dos o más, se utiliza un método iterativo de


estimación, que consiste en anotar un valor razonablemente aproximado para uno de
los datos faltantes y se calcula el segundo, mediante el procedimiento propuesto;
luego se reemplaza este valor en el cuadro y se calcula el dato primero cuyo valor fue
registrado en forma aproximada. Este procedimiento se repite tantas veces cuantas
sean necesarias hasta obtener el valor final de estimación.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 56


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CAPITULO IV
DISEÑO CUADRADO LATINO

Este diseño permite controlar los tratamientos de experimentación con dos factores
adicionales ubicados uno en filas y otro en columnas; difiere de los diseños antes
descritos porque controla dos fuentes de variación de las cuales el investigador tiene
algún conocimiento lo que le permite ganar eficiencia, aumentar la precisión del
análisis y explicar con mayor profundidad la variación en la variable respuesta.

Se lo utiliza con mucha frecuencia en experimentos agrícolas e industriales porque le


permite al investigador delimitar los efectos relativos a varios tratamientos cuando se
imponen controles de doble vía a las unidades de experimentación.

En este diseño, el número de tratamientos “k” determina el número de filas y de


columnas, consecuentemente el número de ensayos es K2 y cada tratamiento debe
hallarse una sola vez en cada fila y en cada columna. Los tratamientos se denotarán
por letras latinas mayúsculas: A, B, C, ....

Para elaborar un cuadrado latino se anotará un arreglo sistemático de letras y se


reacomodarán filas y columnas en forma aleatoria, luego se asignan aleatoriamente
tratamientos a las letras, así por ejemplo:

CUADRADOS LATINOS

3X3 4X4

COLUMNA COLUMNA
FILA 1 2 3 FILA 1 2 3 4
1 A B C 1 A B C D
2 B C A 2 B C D A
3 C A B 3 C D A B
4 D A B C

Cada unidad experimental es asignada a un tratamiento y pertenece a un nivel del


factor fila y a un nivel del factor columna; el número total de realizaciones del
experimento es el cuadrado del número de tratamientos.

El orden de las letras, tratamientos, en el cuadrado latino pueden permutarse dando


origen a cierto número de planes primarios y la permutación opera a partir de la
segunda fila y segunda columna. En la práctica se aconseja no utilizar cuadrados
latinos mayores o iguales a 8, porque el número de ensayos se vuelve demasiado
grande y por la dificultad que puede acarrear en la determinación de niveles del factor
columna o fila; y, no utilizar cuadrados latinos inferiores a 4 por el limitado número de
grados de libertad del error experimental que no permite una estimación suficiente
para la varianza.

5.1 MODELO DE ANALISIS


La función matemática del modelo cuadrado latino es:

Xijk = µ + αi + β j + γk + εij k

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 57


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

en el que:

Xijk = Valor de la variable respuesta correspondiente al iésimo nivel del


factor fila, al j-ésimo nivel del factor columna y al k-ésimo
tratamiento.
µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor fila
β j = Es el efecto del j-ésimo nivel del factor columna.
γk = Es el efecto del k-ésimo tratamiento.
εijk = Es el error o valor residual del k-ésimo tratamiento, del i-ésimo
factor fila y del j-ésimo factor columna, que se considera es
independiente de observación a observación y está normalmente
distribuido con valor esperado igual a cero y varianza igual a σ2 ,
Ν (0,σ ).
2

Para i = j = k = 1, 2, 3 ..... a número de niveles de filas, columnas y tratamientos.

El modelo postula además que: ∑αj = ∑β j = ∑γk = 0.

La suposición aditividad del modelo implica que los tres factores: tratamientos, filas y
columnas son aditivos; y, se infiere que la media de tratamientos X••k es una estimatriz
imparcial de µ + γk , en la que los efectos de filas y de columnas se cancelan debido a
la simetría del diseño. Las demás características del modelo a dos criterios son
similares.

Las formulaciones de cálculo para las sumas de cuadrados son las siguientes:

FC = (Σ xijk)2/a2
SCT = Σ x2ijk - FC
Σ(x i•• / a) - FC = A
2
SCF =
SCC = Σ(x2•j• / a) - FC = B
SCE = Σ(x2••k / a) - FC = C
SCR = SCT – (A + B+ C) = D

Realizados los cálculos, se procede a resumir los resultados en el cuadro de Análisis


de Varianza cuyo contenido y representación es la siguiente:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos a-1 SCE CME = SCE / (a -1) Fc = CME / CMR
Filas a-1 SCF CMF = SCF / (a-1) Fc = CMF / CMR
Columnas a-1 SCC CMC = SCC / (a-1) Fc = CMC / CMR
Residual (Error) (a-1) (a-2) SCR CMR = SCR/(a-1)(a-2)
2
TOTAL a -1 SCT

El análisis de varianza del cuadrado latino permite aislar las variaciones debidas al
factor fila, las variaciones del factor columna y aquellas debidas a los tratamientos; en
consecuencia disminuye la variación del error experimental y la prueba resulta más
sensible para detectar cualquier diferencia significativa.

La principal restricción en la utilidad del cuadrado latino es que el número de


repeticiones es igual al número de tratamientos.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 58


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

El procedimiento de análisis de éste diseño experimental es similar a los diseños


anteriores.

1. Formulación de la Hipótesis:

Se realizarán tres pruebas de hipótesis, una para cada factor. En la primera se


prueba que el factor fila no tiene un efecto diferencial significativo en la variable
respuesta y por tanto se docima que αi = 0:

Para el factor fila H0 : αi = 0


HA : αi ≠ 0

La segunda prueba verifica que el factor columna no tiene un efecto diferencial


significativo en la variable respuesta y su formulación es:

Para el factor columna H0 : βj = 0


HA : β j ≠ 0

Por última se prueba la hipótesis de que los tratamientos no tienen un efecto


diferencial significativo en la variable respuesta y por tanto su formulación es:

Para tratamientos H0 : γk = 0
HA : γk ≠ 0

2. Estadística de prueba

La estadística de prueba que se utilizará es:

Fc = CMF / CMR para filas


Fc = CMC / CMR para columnas
Fc = CME / CMR para tratamientos

3. Criterio de Decisión

El criterio de decisión para la aceptación o el rechazo de las hipótesis planteadas en el


problema es:

Rechazar la H0 si : Fc ≥ Fα, v1, v2

El criterio de decisión planteado es válidopara tratamientos como para filas y


columnas.

4. Ejecución de cálculos

Con los datos que el problema proporciona deben calcularse las sumas de cuadrados,
los cuadrados medios y el valor de la estadística de prueba conforme se presentó en
el cuadro de análisis de varianza.

5. Decisión

Con la decisión del investigador sobre la aceptación o rechazo de las hipótesis,


concluye el proceso de prueba y del análisis de varianza.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 59


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

EJEMPLO:

Se realizó un experimento para estudiar el efecto de cinco raciones de alimentación


(A, B, C, D, E), con diferencias en el contenido proteínico, aplicadas a cinco vacas
diferentes en las que se midió el promedio diario de producción de leche durante cinco
períodos de producción de leche. Los siguientes datos muestran la producción
promedio diaria en kilogramos, registrados durante el año pasado.

PERIODOS DE VACAS
PRODUCCION 1 2 3 4 5 TOTAL
1 A B C D E
33.1 34.4 26.4 34.6 33.9 162.4
2 C D E A B
30.7 28.7 24.9 28.8 28.0 141.1
3 D E A B C
28.7 28.8 20.0 31.9 22.7 132.1
4 E A B C D
31.4 22.3 18.7 31.0 21.3 124.7
5 B C D E A
28.9 22.3 15.8 30.9 19.0 116.9

TOTAL 152.8 136.5 105.8 157.2 124.9 677.2

TRATAMIENTO3 A B C D E TOTAL
123.2 141.9 133.1 129.1 149.9 677.2

Probar para un nivel de significación del 1%, si la producción promedio diaria de leche
es significativamente diferente debido a la dieta alimenticia, a las vacas o al período
de producción.

DESARROLLO:

Características del problema:

FACTORES: Alimentación, vacas y período de producción


TRATAMIENTO: Raciones de alimentación A, B, C, D y E.
FACTOR FILA: Período de producción 1, 2, 3, 4 y 5.
FACTOR COLUMNA: Vaca 1, 2, 3, 4 y 5.
VARIABLE RESPUESTA: Producción diaria promedio de leche
UNIDAD EXPERIMENTAL: Vaca en producción de leche.
NIVEL DE SIGNIFICACION 0.01
MODELO Xijk = µ + αi + β j + γk + εij k

3
Nótese que los tratamientos han sido sumados independientemente de fila y de columna y se presentan
como totales al final del cuadro.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 60


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

1. Formulación de la Hipótesis:

H0 : αi = 0 No existe diferencia significativa en la producción diaria


de leche debido al período de producción de la vaca.
HA : αi ≠ 0 Existe diferencia significativa en la producción diaria de
leche debido al período de producción de la vaca.

H0 : βj = 0 La producción diaria de leche es igual en todas las


vacas.
HA : βj ≠ 0 Por lo menos en una de las vacas el diario de producción
de leche no es igual.

H0 : γk = 0 No existe diferencia significativa en la producción diaria


de leche debido a la dieta alimenticia.
HA : γk ≠ 0 Existe diferencia significativa en la producción diaria de
leche debido a la dieta alimenticia.

2. Determinación de la estadística de prueba

Fc = CMF / CMR para períodos de producción


Fc = CMC / CMR para vacas
Fc = CME / CMR para dieta alimenticia

3. Criterio de Decisión

Rechazar la H0 si : Fc ≥ Fα, v1, v2

4. Ejecución de cálculos

FC = (677,2)2 / 25 = 18.343,99

SCT = (33,12 + 34,42 + .... + 19,02 ) - 18.343,99 = 709,55

2 2 2
SCE = ((123,2 + 141,9 + .... + 149,9 )/5) - 18.343,99 = 89,27

2 2 2
SCF = ((162,4 + 141,1 + ... + 116,9 )/5) - 18.343,99 = 245,82

SCC = ((152,82 + 136,52 + ... + 124,92 )/5) - 18.343,99 = 353,12

SCR = 709,55 - (89,27 + 245,82 + 353,12) = 21,34

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS SUMA DE CUADRADO


VARIACION LIBERTAD CUADRADOS MEDIO Fc

Alimentación 4 89.27 22.32 12.55


Períodos 4 245.82 61.46 34.56
Vacas 4 353.12 88.28 49.64
Residual 12 21.34 1.78
Total 24 709.55

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 61


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

5. Decisión:

Conforme se estableció como criterio de decisión, se rechazará la Hipótesis nula si el


valor calculado de la estadística de prueba fuera superior o igual al valor tabulado de
la misma, esto es:
si : Fc ≥ Fα, v1, v2
Fc ≥ 5,41

Como puede observarse, las tres hipótesis nulas planteadas son rechazadas y
concluimos que: El promedio diario de producción de leche es significativamente
diferente debido a la dieta alimenticia; debido al período de producción de la vaca y
debido a la vaca.

5.2 EFICIENCIA DEL DISEÑO

La eficiencia relativa de un experimento de cuadrado latino, en comparación a un


completo sistema aleatorio o de una variable de clasificación, es igual a:

CMF + CMC + (a – 1)CMR


(a + 1)CMR

en donde: CMF = Cuadrado medio del factor Fila


CMC = Cuadrado medio del factor Columna
CMR = Cuadrado medio Residual
a = Número de tratamientos

Sustituyendo los valores con los resultados del ejemplo desarrollado tenemos que la
eficiencia relativa es igual a:

61,46 + 88,28 + (5 – 1) * 1,78 = 14,687


(5 + 1) * 1,78

lo que significa que el diseño cuadrado latino mejoró el análisis, lo hizo más eficiente
en un 1.368,7%, con respecto a si el diseño hubiese sido a un criterio de clasificación.

Si lo que interesa es obtener la eficiencia del diseño cuadrado latino en comparación a


un diseño en bloques, o diseño a dos criterios de clasificación, ésta es igual a:

CMC + (a – 1)CMR
a*CMR

Reemplazando valores tenemos: 88,28 + (5 – 1) * 1,78 = 10,719


5 * 1,78

que significa que el diseño empleado fue más eficiente que un diseño en bloques en
un 971,9%.

5.3 DATOS FALTANTES

Para el caso de que en el diseño se produzca la pérdida de un dato, por cualquier


motivo, la formulación empleada para estimar este valor de ninguna manera recupera

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 62


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

la información perdida, pero realiza una estimación más adecuada con los datos con
que se cuenta, la fórmula de cálculo para la estimación del valor es:

a (F + C + T) - 2S
(a – 1) (a – 2)

en donde: a = Número de tratamientos


F = Suma de la fila del dato faltante
C = Suma de la columna del dato faltante
T = Suma del tratamiento del dato faltante
S = Suma total de todas las observaciones.

De faltar dos o más observaciones, el procedimiento de estimación de éstos será igual


al propuesto para el diseño a dos criterios de clasificación.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 63


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CAPITULO V
DISEÑO FACTORIAL

“Uno de los adelantos notables de la metodología de la experimentación consiste en


combinar las variantes independientes, subdividas, a propósito, en niveles, de tal
modo que el plan factorial resultante permita determinar cuantitativamente los efectos
que tienen en la variable dependiente, las variables independientes o factores por sí
4
mismos y en todas las combinaciones”

En épocas pasadas se aconsejaba que se estudiara cada factor a la vez, dedicándole


un experimento por separado a cada factor; más tarde Fisher indicó que se obtenían
ventajas de importancia si se combinaban varios factores en un mismo experimento
factorial, siendo ésta altamente eficaz porque cada observación proporciona
información sobre todos los factores comprendidos en el experimento y determina las
relaciones entre los efectos de los diferentes factores.

En un experimento factorial se investigan simultáneamente los efectos de cierto


número de factores con igual o diferente número de niveles por factor. Los
tratamientos del experimento corresponden a las combinaciones que puedan formarse
entre los distintos niveles de cada factor.

Por ejemplo, si el factor A interviene con dos niveles: a1 y a2; y el factor B interviene
con niveles b1 y b2, entonces el número de tratamientos del experimento es cuatro,
formado por las combinaciones: a1b1, a1b2, a2b1 y a2b2; si el factor B tuviese tres
niveles, entonces el número de tratamientos del experimento será de seis: a1b1, a1b2,
a1b3, a2b1, a2b2 y a2b3.

Un experimento factorial es aquel que se realiza con dos o más factores y los ensayos
del experimento se realizan en todas las combinaciones de los niveles de los factores.
Los conceptos estadísticos presentados en los capítulos precedentes son válidos para
el diseño factorial y en particular se continuará con el uso del análisis de varianza
como herramienta básica para el análisis estadístico de datos.

Entre las principales ventajas de la utilización del diseño factorial está en que este
significará un ahorro considerable de tiempo y material dedicado a los experimentos;
permite detectar e identificar los efectos simples y principales, así como aquellos
debidos a una combinación particular de niveles de los factores, proporcionando
información sobre los efectos de los factores y sobre sus relaciones entre sí.

Cochran y Cox, sugieren que es recomendable utilizar la experimentación factorial en:

1. Trabajos de exploración, en los que el objeto es determinar rápidamente los


efectos de cada uno de cierto número de factores dentro de un intervalo
específico.
2. En investigaciones de las interacciones entre los efectos de varios factores;
frecuentemente la información se obtiene mejor probando todas las
combinaciones.
3. En experimentos diseñados para poder llegar a recomendaciones que deben
aplicarse a una gran variedad de condiciones similares a las encontradas en la
población en la cual se van a aplicar dichas recomendaciones.

4
Luis Romo Saltos, Métodos de Experimentación Científica, capítulo XI, página 261.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 64


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Si sabemos que dos factores son interdependientes, o si estamos dudosos de la


validez de una suposición de independencia, entonces debe recomendarse un diseño
experimental que estime tanto los efectos principales como las interacciones, éste
diseño es el factorial.

Cuando los factores que se van a investigar son numerosos, la principal desventaja
del experimento factorial estriba en su tamaño y complejidad; otra, radica en la
dificultad que tienen los experimentadores en interpretar los resultados porque
parecen presentar una confusa variedad de comparaciones de tratamientos.

Algunas aplicaciones del diseño factorial están en: la caracterización de un proceso; la


optimización de recursos; diseño de un producto; detección de fallas en procesos;
desarrollo y optimización de procesos; evaluación de materiales y alternativas;
confiabilidad y pruebas de duración; pruebas de rendimiento; determinación de
tolerancia de componente, etc..

6.1 EFECTOS E INTERACCIONES

Dados dos factores, o variables independientes, A y B, cada uno a dos niveles


diferentes: a1 y a2 para el factor A; y, b1 y b2 para el factor B, que intervienen en un
experimento, entonces se requerirá de por lo menos cuatro observaciones para
determinar el efecto de éstos factores en la variable respuesta, correspondiendo cada
observación un tratamiento específico: a1b1, a1b2, a2b1 y a2b2.

FACTOR B FACTOR A
a1 a2
b1 a1b1 a2b1
b2 a1b2 a1b2

Si a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, entonces la
diferencia (a2 - a1) proporciona una medida del cambio del factor A. De similar
manera, si b1 representa el nivel inferior del factor B y b2 el nivel superior del factor,
entonces la diferencia (b2 - b1) proporciona una medida del cambio del factor B.

Supongamos que se realiza una sola medición de la variable respuesta para cada
combinación aibj , entonces la diferencia:

a2b1 - a1b1 = es una medida del efecto de a en b1


a2b2 - a1b2 = es una medida del efecto de a en b2

que se conocen como efectos simples o efectos parciales de a en cada nivel del factor
b. El efecto principal se mide promediando los efectos del factor en todos los niveles
del restante factor:

( (a2b1 - a1b1) + (a2b1 - a1b2) ) / 2 =


(a2b2 + a2b1 - a1b2 - a1b1) / 2 = Es el efecto principal del factor A.

De similar manera:

a1b2 - a1b1 = es una medida del efecto de b en a1


a2b2 - a2b1 = es una medida del efecto de b en a2

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 65


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

son los efectos simples o efectos parciales de b en cada nivel del factor a. El efecto
principal se mide promediando los efectos del factor en todos los niveles del restante
factor:

( (a1b2 - a1b1) + (a2b2 - a2b1) ) / 2 =


(a2b2 + a1b2 - a2b1 - a1b1) / 2 = Es el efecto principal del factor B.

Podemos definir, entonces, como Efecto Principal de un Factor a la medida del


cambio de la variable respuesta correspondiente a cambios en el nivel de un factor
promediados sobre todos los niveles de los otros factores.

Si A y B estuvieran actuando independientemente, el efecto de a en b1 y el efecto de a


en b2 sería el mismo; cualquier diferencia en estos dos efectos es una medida del
grado de interdependencia entre los factores, esto es, de la forma en la que
interactúan A y B en la variable respuesta.

La medida de interacción entre los dos factores se la obtiene mediante:

AB = ( (a2b2 - a1b2) - (a2b1 - a1b1) ) / 2


= ( (a2b2 - a2b1) - (a1b2 - a1b1) ) / 2
= (a2b2 + a1b1 - a1b2 - a2b1) ) / 2

Podemos decir que Interacción es la respuesta diferencial a un factor en combinación


con niveles variables de un segundo factor aplicado simultáneamente. Es decir, la
interacción es un efecto adicional debido a la influencia combinada de dos, o más,
factores.

2
6.2 DISEÑO FACTORIAL 2

Este diseño es aquel en el que intervienen dos factores a dos niveles cada factor; en
2
la expresión 2 , la base corresponde el número de niveles por factor y el exponente
al número de factores.

Los factores son A y B, cada uno a dos niveles: a1 y a2 para el factor A; y, b1 y b2 para
el factor B. El número de tratamientos posibles es igual al número de niveles del
factor A por el número de niveles del factor B, esto es: 2 x 2 = 4 tratamientos
específicos: a1b1, a1b2, a2b1 y a2b2.

En los que a1 representa el nivel inferior del factor A y a2 el nivel superior del factor, b1
representa el nivel inferior del factor B y b2 el nivel superior del factor. Cada
tratamiento puede tener una o más repeticiones.

Una notación más compacta y estándar en el trabajo estadístico es aquella que


reemplaza la presencia del nivel superior con la letra latina minúscula del factor, por
ejemplo, si en el tratamiento está presente el nivel “a2” entonces se anotará
únicamente “a”, si está presente el nivel “b2” se anotará únicamente “b”; si en el
tratamiento está presente el nivel inferior del factor, se omite escribir la letra del factor,
por ejemplo si el tratamiento es y “a1b2” se escribirá únicamente “b”. De esta forma los
tratamientos a considerar, serán expresados por:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 66


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

NOTACION ANTERIOR NOTACION


COMPACTA
a1b1 (1)
a1b2 b
a2b1 a
a2b2 ab

Nótese que el tratamiento que considera los niveles inferiores de los dos factores se
expresan como (1). Si los indicados son tratamientos, entonces, la suma de
cuadrados de tratamientos puede ser particionada para obtener los efectos principales
de cada factor así como su interacción, examinemos su procedimiento con la nueva
notación:

Los efectos simples del factor A para cada nivel del factor B son:

a - (1) = es una medida del efecto de a en b1


ab - b = es una medida del efecto de a en b2

El efecto principal de A se mide promediando los efectos simples del factor en todos
los niveles factor B:

( (a - (1)) + (a - b) ) / 2 =
(ab + a - b - (1)) / 2 = Es el efecto principal del factor A.

Análogamente, los efectos simples del factor B son:

b - (1) = es una medida del efecto de b en a1


ab - a = es una medida del efecto de b en a2

El efecto principal de B se mide promediando los efectos simples del factor en todos
los niveles del factor A:

( (b - (1)) + (ab - a) ) / 2 =
(ab + b2 - a - (1)) / 2 = Es el efecto principal del factor B.

La interacción entre los dos factores se la obtiene mediante:

AB = ( (ab - b) - (a - (1)) ) / 2
= ( (ab - a) - (b2 - (1)) ) / 2
= (ab + (1) - b2 - a) ) / 2

Todas estas expresiones se sintetizan en el siguiente cuadro, que muestra los


multiplicadores ortogonales que serán utilizados para obtener los efectos principales y
la interacción entre tratamientos. De igual manera, expresa la forma de obtener la
contribución a la suma de cuadrados de tratamientos.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 67


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

CALCULO DE EFECTOS PRINCIPALES E INTERACCIONES


2
EN UN DISEÑO FACTORIAL DE 2

TRATAMIENTO MULTIPLICADOR PARA EL TOTAL


A B AB
a1 b1 = (1) -1 -1 1
a2 b1 = a 1 -1 -1
a1 b2 = b -1 1 -1
a2 b2 = ab 1 1 1
Sumatoria (A) (B) (AB)
Divisor para el efecto principal 2r 2r 2r
Efecto principal (A)/2r (B)/2r (AB)/2r
Divisor Suma de cuadrados 4r 4r 4r
2 2
Contribución suma de Cuadrados (A) / 4r (B) / 4r (AB)2 / 4r

Como puede observarse los multiplicadores propuestos son ortogonales y cumplen


con la condición de ser en sumatoria iguales a cero (∑ λi = 0). Estos provienen de la
relación establecida en párrafos anteriores para obtener el efecto principal de cada
factor; así para obtener el efecto principal del factor A se suman “ab” y “a” por tanto su
coeficientes son “+1”; y, se restan “b” y “(1)” que tienen un coeficiente de “-1”. De
similar manera se opera para la obtención del efecto principal de B y de la interacción
AB.

Conforme la explicación anterior, si existiese una sola observación por tratamiento,


para obtener el efecto principal debe dividirse la sumatoria de los coeficientes
ortogonales por el total del tratamiento, denotado en el cuadro como (A), (B) o (AB)
para 2; en el caso de que existiesen “r” repeticiones por tratamiento el divisor para el
efecto principal será entonces “2r”, tal como se expresa en el cuadro, en donde el “2”
indica el número de efectos simples, o comparaciones, obtenidos para cada factor.

La contribución a la suma de cuadrados de tratamientos SCE, se la obtiene conforme


se ilustró en la partición de la suma de cuadrados de tratamientos del diseño a dos
criterios de clasificación L2 / (r ∑λi2 ); de acuerdo con ésta, la suma del coeficiente
ortogonal por el total del tratamiento se eleva al cuadrado y su resultado se divide para
“4r” en donde el número “4” corresponde a la suma del cuadrado de los coeficientes
ortogonales ∑λi
2

(1 + 1 + 1 + 12) y “r” corresponde al número de repeticiones.


2 2 2

Una forma sencilla y útil para establecer los signos de los coeficientes ortogonales
consiste en que para obtener el efecto principal de un factor, los coeficientes serán
positivos si el tratamiento tiene el nivel superior del factor y será negativo si tiene el
nivel inferior del factor. Por ejemplo, si deseamos encontrar el efecto principal del
factor A tenemos que los signos de los coeficientes serán:

FACTOR a1 b1 a2 b1 a 1 b2 a2 b2
(1) a b ab
A -1 +1 -1 +1

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 68


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Para obtener los signos de los coeficientes ortogonales correspondientes a la


interacción se multiplican los coeficientes de los factores que intervienen en la misma,.
En el caso presente tenemos que en la segunda columna del siguiente cuadro (-1)*(-
1) = +1 y así sucesivamente.

FACTOR a1 b1 a2 b1 a 1 b2 a2 b2
(1) a b ab
A -1 +1 -1 +1
B -1 -1 +1 +1
AB +1 -1 -1 +1

El modelo matemático lineal que se aplica al diseño es:

Xijk = µ + αi + β j + αβij + εijk


en el que:

Xij = Valor de la variable respuesta.


µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor A.
β j = Es el efecto del j-ésimo nivel del factor B.
αβij = Representa el efecto de la interacción de los factores A y B.
εijk = Es el error o valor residual que se considera es independiente de
observación a observación y está normalmente distribuido con
valor esperado igual a cero y varianza igual a σ , Ν (0,σ ).
2 2

Para i = 1, 2 a número niveles del factor A


j = 1, 2 b número niveles del factor B.
k = 1, 2, ... r, número de replicaciones

Se acepta además que: ∑β j = ∑αj = ∑ αβij = 0.

El número de observaciones está dado por 2 * 2 * r

Los cuadrados medios esperados suponiendo que los factores A y B son fijos, son los
siguientes:

Para el factor A σ2 + br Σ αi2 / (a-1)


σ + ar Σ β j / (b-1)
2 2
Para el factor B
Para la interacción AB σ + r Σ αβ ij2 / (a-1)(b-1)
2

Para el residual σ2

La identidad fundamental de la suma de cuadrados se expresa por:

SCT = SCA + SCB + SCAB + SCR


En donde:
SCT = Suma de Cuadrados Total
SCA = Suma de Cuadrados del factor A
SCB = Suma de Cuadrados del factor B
SCAB = Suma de Cuadrados de la interacción AB
SCR = Suma de Cuadrados del error.

Debemos notar que en el modelo matemático los elementos: αi + β j + αβ ij,


corresponden a los componentes independientes de los Tratamientos y por tanto

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 69


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

puede ser expresado como φi tratamientos, de forma que el modelo matemático,


expresado en función de los tratamientos y de las replicaciones, puede escribirse
como un diseño a dos criterios de clasificación:

Xijk = µ + φi + γk + εijk

Las hipótesis que se prueban corresponde a la dómima para cada factor e interacción
y a las replicaciones. Se comenzará probando que el factor A no tiene un efecto
significativo en la variables respuesta, esto es:

H0 : αi = 0
HA : αi ≠ 0

Luego se probará que el factor B no tienen un efecto diferencial significativo en la


variable respuesta.

H0 : β j = 0
HA : β j ≠ 0

También se docima la hipótesis de que no existe interacción y consecuentemente no


tienen un efecto significativo en la variable respuesta.

H0 : αβij = 0
HA : αβ ij ≠ 0

La estadística de prueba que se utiliza es la F, calculada como el cuociente entre el


cuadrado medio del factor divido para el cuadrado medio residual;

el criterio de decisión es igual al utilizado en el análisis de varianza; y, el procedimiento


de cálculo igual al de análisis de varianza y a la partición de la suma de cuadrados.

El cuadro que resume el análisis de varianza para un diseño factorial de 22 con “r”
replicaciones por tratamiento es:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos ab - 1 SCE CME = SCE / (ab - 1) Fc = CME / CMR

A a-1 SCA CMA = SCA / (a-1) Fc = CMA / CMR


B b-1 SCB CMB = SCA / (b-1) Fc = CMB / CMR
AB (a-1)(b-1) SCAB CMAB = SCA /(a-1)(b-1) Fc = CMAB / CMR

Residual (Error) (n - ab) SCR CMR = SCR/(ab-1)(c-1)


TOTAL n–1 SCT

En el cuadro de Análisis de Varianza que antecede, los grados de libertad y las sumas
de cuadrados de los factores A, B y a su interacción AB, son iguales a los grados de
libertad y a la suma de cuadrados de Tratamientos, respectivamente:

(a – 1) + (b – 1) + ((a-1)(b-1)) = ab – 1 grados de libertad; y,

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 70


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

SCA + SCB + SCAB = SCE.

EJEMPLO:

Se ha definido la fatiga de corrosión en los metales como la acción simultánea del


esfuerzo cíclico y del ataque químico en una estructura de metal. Una técnica
ampliamente utilizada para minimizar el daño de la fatiga de corrosión en el aluminio
involucra la aplicación de un recubrimiento protector. El estudio realizado por el
Departamento de Ingeniería Mecánica de Virginia Polytechnic Institute and State
University en 1.979 se utilizaron dos diferentes niveles de humedad:

Bajo: 20 – 25% de humedad relativa


Alto: 86 – 91% de humedad relativa

Y dos tipos de recubrimiento de la superficie:

Sin recubrimiento: No cubierto


Anodizado: Recubrimiento óxido anódico de ácido sulfúrico.

Se registraron lo datos de fatiga de corrosión, expresados en miles de ciclos de


fracaso, como sigue:

RECUBRIMIENT HUMEDAD
BAJA ALTA

Sin recubrimiento 361 469 1344 1216


466 937 1027 1097
1069 1357 663 1011

Anodizado 114 1032 78 466


1236 92 387 107
533 211 130 327

Efectuar el análisis de varianza con un nivel de significación del 5% para probar la


significancia de los efectos principal e interacción.

SOLUCION:

Características del problema:

FACTORES: Recubrimiento (R) a dos niveles:


r1 = Sin recubrimiento
r2 = Anodizado
Humedad Relativa (H) a dos niveles: h1 = Baja
h2 = Alta
TRATAMIENTOS: Cuatro tratamientos de la combinación de niveles:
r1h1 r1h2 r2h1 r2h2.
VARIABLE RESPUESTA: Fatiga de corrosión expresado en miles de ciclos de
fracaso.
UNIDAD EXPERIMENTAL: Planchas de aluminio.
NIVEL DE SIGNIFICACION 0.05
MODELO: Xijk = µ + αi + β j + αβ ij + εijk

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 71


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Formulación de Hipótesis:

H0 : αi = 0 El recubrimiento de las planchas de aluminio no tiene un


efecto diferencial significativo en la fatiga de corrosión
del metal.
HA : αi ≠ 0 El recubrimiento de las planchas de aluminio tiene un
efecto diferencial significativo en la fatiga de corrosión
del metal.

H0 : βj = 0 La humedad relativa no tienen un efecto diferencial


significativo en la fatiga de corrosión del aluminio.
HA : βj ≠ 0 La humedad relativa tienen un efecto diferencial
significativo en la fatiga de corrosión del aluminio.

H0 : αβ ij = 0 La acción conjunta del recubrimiento y de la humedad


relativa no tienen un efecto diferencial significativo en la
fatiga de corrosión del aluminio.
HA : αβ ij ≠ 0 La acción conjunta del recubrimiento y de la humedad
relativa tienen un efecto diferencial significativo en la
fatiga de corrosión del aluminio

Estadística de prueba: Una para cada hipótesis:


Fc = CMA CMB CMAB
CMR CMR CMR

Criterio de Decisión: Igual para todas las hipótesis


Rechazar la H0 si : Fc ≥ Fα, v1, v2

Cálculos:

Nótese que de acuerdo con el modelo propuesto αi representa el efecto del primer
factor, R recubrimiento; β j representa el efecto del segundo factor, H humedad
relativa; αβij representa el efecto de la interacción RH; y, γk representa el efecto de las
replicaciones. Por otro lado, se observa que el experimento cuenta con seis
replicaciones en cada tratamiento, para facilitar el proceso de cálculo podemos
reordenar los datos del experimento y proceder de la siguiente manera:

TRATAMIENTO REPLICACIONES
P1 P2 P3 P4 P5 P6

r1h1 = (1) 361 469 466 937 1069 1357


r1h2 = h 1344 1216 1027 1097 663 1011
r2h1 = r 114 1032 1236 92 533 211
r2h2 = rh 78 466 387 107 130 327

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 72


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Los resultados del análisis de varianza a dos criterios: tratamientos y replicaciones


son:

RESUMEN Cuenta Suma Promedio Varianza


(1) 6 4659.0 776.50 162.380.70
h 6 6358.0 1.059.67 53.491.87
r 6 3218.0 536.33 243.373.87
rh 6 1495.0 249.17 27.156.57

P1 4 1897.0 474.25 352.028.25


P2 4 3183.0 795.75 149.308.25
P3 4 3116.0 779.00 173.995.33
P4 4 2233.0 558.25 284.906.25
P5 4 2395.0 598.75 149.770.92
P6 4 2906.0 726.50 301.270.33

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 2.143.794,83 3 714.598,28 5,877 0,0048 3,098

R 1.655.850,67 1 1.655.850,67 13,617 0,0015 4,351


H 24,00 1 24,00 0,000 0,9889 4,351
RH 487.920,17 1 487.920,17 4,012 0,0589 4,351

Error 2.432.015,00 20 121.600,75


Total 4.575.809,83 23

Del que se puede concluir que los tratamientos son significativamente diferentes y que
las replicaciones no tienen un efecto significativo diferencial. Procedemos a calcular la
significación del efecto principal de cada factor y su interacción.

MULTIPLICADORES PARA EL TOTAL DE TRATAMIENTOS

TRATAMIENTO EFECTO FACTORIAL


R H RH
(1) -1 -1 1
h -1 1 -1
r 1 -1 -1
rh 1 1 1

En esta primera parte, se determinan los multiplicadores ortogonales que serán


utilizados para el cálculo del efecto principal. Estos se multiplican por el total de cada
tratamiento y con su suma se obtiene la contribución del factor a la suma de
cuadrados de tratamientos.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 73


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

EFECTO FACTORIAL
TRATAMIENTO
R H RH
-1 (4.659,00) (4.659,00) 4.659,00
h (6.358,00) 6.358,00 (6.358,00)
r 3.218,00 (3.218,00) (3.218,00)
rh 1.495,00 1.495,00 1.495,00
SUMA (6.304,00) (24,00) (3.422,00)
Divisor para el Efecto Principal 12 12 12
Efecto Principal (525) (2) (285)
Divisor para Suma de Cuadrados 24 24 24
Contribución a Suma de Cuadrados 1.655.850,67 24,00 487.920,17 2.143.794,83

La contribución de la suma de cuadrados de R se la obtiene: (-6.304)2 / (4 * 6) =


1’655.850,67; en el que “4” es la suma de los cuadrados de los coeficientes
ortogonales empleados para el factor R, y “6” corresponde al número de repeticiones
por tratamiento.

Las contribuciones de los factores R, H y su interacción RH son mutuamente


ortogonales y por tanto componentes independientes de la suma de cuadrados de
tratamientos (SCE = 2.143.794.83); nótese que la sumatoria de las contribuciones de
los factores R, H y su interacción RH, totalizan igual que la suma de cuadrados de
Tratamientos:

SCR + SCH + SCRH = SCE


1665850.67 + 24 + 487920.17 = 2143794.83

Decisión:
En respuesta a las hipótesis planteadas y de acuerdo con el criterio de decisión
propuesto a un nivel de significación del 5%, tenemos que:

El factor recubrimiento tiene un efecto significativo en la fatiga de corrosión del


aluminio, el poner recubrimiento anodizado al aluminio disminuye significativamente la
fatiga de corrosión, a esta conclusión llegamos porque rechazamos la hipótesis nula
planteada toda vez que: 11.88 ≥ 4.54 (Fc ≥ Fα, v1, v2 ).

En cuanto al factor Humedad Relativa, observamos que el valor calculado es menor


que el valor el valor tabular (0.00017 ≤ 4.54), por tanto aceptamos la hipótesis nula y
concluimos que el factor, Humedad Relativa, no tiene un efecto significativo en la
fatiga de corrosión del aluminio.

La decisión para la tercera hipótesis relativa a la interacción del factor Recubrimiento


con Humedad Relativa, RH, es aceptar la hipótesis nula y concluimos que la
interacción no tiene un efecto significativo en la fatiga de corrosión del aluminio, dado
que el valor calculado de la estadística es menor al valor tabular 3.50 ≤ 4.54.

Por último, decido aceptar la hipótesis nula de la cuarta formulación de hipótesis, por
la que concluyo que las repeticiones no son significativas, 0.491 ≤ 4.54.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 74


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Efectos simples y principales:

Para cada factor es prudente determinar su efecto principal así como los efectos
simples a cada nivel del otro factor.

Analizando el factor Recubrimiento tenemos que éste considera dos niveles, el


primero sin recubrimiento y el segundo con recubrimiento anodizado del aluminio, es
de esperar que el efecto de colocar recubrimiento anodizado en el aluminio reduzca,
como efecto, la fatiga de corrosión del metal; la magnitud de esta reducción puede ser
igual o aproximadamente igual si el material es sometido a cualquiera de los niveles
del segundo factor, humedad relativa baja, o humedad relativa alta. El efecto del
recubrimiento para cada nivel de humedad relativa se obtiene examinando el efecto
simple del factor.

Así, manteniendo constante la humedad relativa baja, h1, el efecto del recubrimiento
es medido mediante:
r2h1 - r1h1 = r - (1) = la medida del efecto de r en h1
(3.218 - 4.659) / 6 = - 240,17

lo que nos indica que si mantenemos constante la humedad relativa del 20-25%, al
colocar en el aluminio el recubrimiento anodizado, la fatiga de corrosión del aluminio
disminuye en 240,17 miles de ciclos de fracaso, unidad de medida de la variable
respuesta.

El efecto del recubrimiento manteniendo constante el nivel alto de humedad, h2, se


mide mediante:

r2h2 - r1h2 = rh - h = la medida del efecto de r en h2


(1.495 - 6.358) / 6 = - 810,5

que nos indica que manteniendo constante el nivel alto de la humedad relativa, 86-
91%, el recubrimiento anodizado en el aluminio disminuye la fatiga de corrosión en
810,5 miles de ciclos de fracaso.

En ambos casos, hemos dividido la sumatoria para 6 porque la sumatoria de la


variable respuesta en cada tratamiento corresponde a seis replicaciones, de forma
que el efecto de “R” en cada nivel de “H” se expresa como el efecto medio por unidad
experimental.

El efecto principal es el promedio de los efectos simples, por lo tanto, el efecto


principal de R es igual a: ((-240,17) + (-810,5)) / 2 = -525,33, lo que nos indica que
al colocar el anodizado en el aluminio y someterlo a una humedad relativa baja o alta,
cualquiera, en promedio se reduce la fatiga de corrosión en 525,33 miles de ciclos de
fracaso (unidad de medida de la variable respuesta). La verificación de si este efecto
promedio es significativo en el cambio de la variable respuesta, se lo hizo al docimar la
primera hipótesis H0 : αi = 0, la misma que fue rechazada conforme el último cuadro
de análisis de varianza y concluyendo que el factor R si tiene un efecto significativo.

Igual resultado obtendríamos si aplicamos directamente la relación establecida para el


cálculo del efecto principal:

((r2h1 - r1h1) + (r2h2 - r1h2)) / 2


(rh + r - h - (1)) / 2
(1.495 + 3.218 – 6.358 – 4.659) / (2*6) = -525,33

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 75


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Otra forma de obtener el mismo resultado es utilizar, la suma del efecto factorial –
6.304 y dividirlo para el “Divisor para el Efecto Principal” 12

Examinemos que pasa con el factor H, humedad relativa. Si mantenemos constante


el nivel r1 del factor R, sin recubrimiento, el efecto de la humedad relativa se mide
mediante:

(r1h2 - r1h1) / 6 = (h - (1)) =


(6.358 - 4.659) / 6 = 283,17

que nos indica que, cuando el metal no tiene recubrimiento, el cambio de la humedad
relativa baja a la humedad relativa alta, produce un incremento en la fatiga de
corrosión del metal de 283,17 miles de ciclos de fracaso.

Si examinamos el efecto del cambio de la humedad relativa, medido en metales con


recubrimiento anodizado, encontramos que:

(r2h2 - r2h1) / 6 = (rh - r) =


(1.495 - 3.218) / 6 = -287,17

nos indica que, cuando el metal tiene recubrimiento anodizado, el cambio de la


humedad relativa baja a la humedad relativa alta, produce una reducción de la fatiga
de corrosión del metal en 287,17 miles de ciclos de fracaso.

Al igual que en el factor R, dividimos la sumatoria para 6 porque ésta se extiende a


seis replicaciones en cada tratamiento, de forma que el efecto de “H” en cada nivel de
“R” se expresa como el efecto medio por unidad experimental.

El cálculo del efecto principal se realiza promediando los efectos simples del factor,
por lo tanto, el efecto principal de H es igual a: ( 283,17 + (-287,17)) / 2 = -2, lo que
nos indica que al cambiar la humedad relativa de la baja a la alta la fatiga de corrosión
se decrementa en promedio en 2 miles de ciclos de fracaso. La comprobación de si
este efecto promedio es significativo en el cambio de la variable respuesta, se realizó
al docimar la segunda hipótesis H0 : β j = 0, la misma que fue aceptada conforme el
cuadro de análisis de varianza.

Si los factores fueran mutuamente independientes, entonces el efecto simple del


primer factor sería el mismo para el nivel inferior y el nivel superior del segundo factor.
En ambos casos, factor R y factor H, encontramos que la respuesta es diferencial y
podríamos sospechar que existe una interacción significativa entre los factores.

El cálculo de la interacción se realiza mediante:


RH = ((r2h2 - r1h2) - (r2h1 - r1h1)) / 2
RH = (rh - r - h + (1)) / 2
RH = (1.495 - 3.218 – 6.358 + 4.659) / (4*6) = -142,58

Lo que indica que la acción conjunta del recubrimiento y de la humedad relativa


reduce, en promedio, la fatiga de corrosión del aluminio. Nótese que en el
denominador (4*6) el valor de “4” corresponde a la suma del cuadrado de los
coeficientes ortogonales utilizados en la relación y el “6” corresponde al número de
repeticiones del experimento.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 76


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Dado que la respuesta del factor es diferencial entre los niveles del otro factor, la
interacción tiene una magnitud, que debe ser comprobada si ésta es o no significativa
en el cambio de la variable respuesta. La mejor manera de probar si la interacción es
significativa, si esta sospecha es o no verdadera, es mediante una prueba de hipótesis
que docime: H0 : αβ ij = 0, propuesta como tercera hipótesis, realizada la prueba se
decidió que la magnitud de interacción encontrada no es significativa al nivel del 5%,
por lo tanto se aceptó la hipótesis nula planteada.

3
6.3 DISEÑO FACTORIAL 2

El diseño factorial dos al cubo es aquel en el que intervienen tres factores a dos
3
niveles por cada factor; en la expresión 2 , la base corresponde el número de niveles
por factor y el exponente al número de factores.

Los factores son A, B y C, cada uno a dos niveles: a1 y a2 para el factor A; b1 y b2 para
el factor B; y, c1 y c2 para el factor C. El número de tratamientos posibles es igual 23,
que corresponde al producto del número de niveles de A por el número de niveles de
B y de C, esto es: 2 x 2 x 2 = 8 tratamientos específicos: a1b1c1, a1b1c2, a1b2c1, a1b2c2,
a2b1c1, a2b1c2, a2b2c1, a2b2c2,

Expresando los tratamientos en la notación utilizada, tenemos que:

NOTACION ANTERIOR NUEVA NOTACION


a1b1c1 (1)
a1b1c2 c
a1b2c1 b
a1b2c2 bc
a2b1c1 a
a2b1c2 ac
a2b2c1 ab
a2b2c2 abc

Para el cálculo de los efectos principales (A, B, C) y de las interacciones de primer


orden (AB, AC, BC) y la de segundo orden (ABC), se utilizarán los multiplicadores
ortogonales que se presentan en el siguiente cuadro, en el que se expresa la forma de
obtener la contribución a la suma de cuadrados de tratamientos.

TRATAMIENTOS MULTIPLICADORES PARA EL TOTAL DE TRATAMIENTOS


A B AB C AC BC ABC
a1b1c1 (1) -1 -1 1 -1 1 1 -1
a2b1c1 a 1 -1 -1 -1 -1 1 1
a1b2c1 b -1 1 -1 -1 1 -1 1
a2b2c1 ab 1 1 1 -1 -1 -1 -1
a1b1c2 c -1 -1 1 1 -1 -1 1
a2b1c2 ac 1 -1 -1 1 1 -1 -1
a1b2c2 bc -1 1 -1 1 -1 1 -1
a2b2c2 abc 1 1 1 1 1 1 1
SUMA (A) (B) (AB) (C) (AC) (BC) (ABC)
Divisor Efecto Principal 4r 4r 4r 4r 4r 4r 4r
Efecto Principal
(A)/4r (B)/4r (AB)/4r (C)/4r (AC)/4r (BC)/4r (ABC)/4r
Divisor Suma Cuadrados 8r 8r 8r 8r 8r 8r 8r
2 2 2 2 2 2 2
Contrib. Suma Cuadra. (A) /8r (B) /8r (AB) /8r (C) /8r (AC) /8r (BC) /8r (ABC) /8r

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 77


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Para determinar el efecto principal del factor A se multiplican el total de cada


tratamiento por el coeficiente ortogonal de la columna “A” y su suma (A) la dividimos
para “4r”, en donde el número “4” corresponde a las cuatro comparaciones posibles
que deben realizarse para obtener los efectos simples, cuatro tratamientos que
incluyen a2 menos cuatro tratamientos que incluyen a1; y, “r” es el número de
replicaciones del experimento. De igual manera debe actuarse con los restantes
factores e interacciones.

La contribución a la suma de cuadrados, corresponde a la partición de suma de


cuadrados de tratamientos SCE, se la calcula elevando al cuadrado la suma (A) y
dividiéndola para “8r” (L2 / (r ∑λi2 )), en donde el número “8” corresponde a la
sumatoria del cuadrado de los coeficientes ortogonales ∑λi2; y, “r” al número de
replicaciones del experimento. La forma como se calculó la contribución del factor A
sirve para el cálculo de los restantes factores e interacciones.

Para determinar los signos de los coeficientes ortogonales correspondientes al efecto


principal de A, se opera de similar manera al diseño anterior, el signo será positivo
cuando el tratamiento tiene el nivel superior del factor y será negativo cuando tenga el
nivel inferior del factor.

Los supuestos presentados en el diseño factorial del dos al cuadrado se extienden al


presente modelo matemático, siendo lineal y aditivo conforme se presenta:

Xijk = µ + αi + βj + αβij + γc + αγic + βγjc + αβγijc + εijck

en el que:

Xij = Valor de la variable respuesta correspondiente.


µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor A.
β j = Es el efecto del j-ésimo nivel del factor B.
αβij = Representa el efecto de la interacción de los factores A y B.
γc = Es el efecto del c-ésimo nivel del factor C.
αγic = Representa el efecto de la interacción de los factores A y C.
βγjc = Representa el efecto de la interacción de los factores B y C.
αβγijc = Representa el efecto de la interacción de los factores A, B y C.
εijck = Es el error o valor residual que se considera es independiente de
observación a observación y está normalmente distribuido con
valor esperado igual a cero y varianza igual a σ , Ν (0,σ ).
2 2

Para i= j = c = 1, 2 número niveles del factor


k = 1, 2, ... r replicaciones

Las hipótesis que se prueban corresponden a la dócima para cada factor e interacción
y a las replicaciones, esto es:

H0 : αi = 0 H0 : βj = 0 H0 : γc = 0 H0 : αβ ij = 0
HA : αi ≠ 0 HA : β j ≠ 0 HA : γc ≠ 0 HA : αβ ij ≠ 0

H0 : αγic = 0 H0 : βγjc = 0 H0 : αβγijc = 0


HA : αγic ≠ 0 HA : βγjc ≠ 0 HA : αβγijc ≠ 0

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 78


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Como era de esperarse, existen 7 formulaciones de hipótesis que deben ser probadas
a un nivel de significación determinado; cada hipótesis corresponde a un factor
determinado o a la interacción entre éstos y la última formulación desea probar la
significación de las replicaciones del experimento. Las pruebas de las interacciones
son importantes para verificar si los factores son mutuamente independientes; si la
interacción está presente, debemos tener cuidado con el análisis de los efectos
principales, sólo aquellos que son significativos tienen sentido en su análisis, aquellos
efectos principales no significativos en presencia de interacción podrían muy bien ser
el resultado del encubrimiento y plantear la necesidad de observar la influencia de
cada factor para niveles fijos de otro factor.

La estadística de prueba que se utiliza es la F, calculada como el cuociente entre el


cuadrado medio del factor divido para el cuadrado medio residual; y, el criterio de
decisión es rechazar la hipótesis nula si el valor calculado de la estadística de prueba
es igual o mayor que el valor tabular de la estadística de prueba: Fc ≥ Fα, v1, v2 .

El cuadro que resume el análisis de varianza para un diseño factorial de 23 con “r”
replicaciones por tratamiento es:

CUADRO DE ANALISIS DE VARIANZA

FUENTE DE GRADOS DE SUMA DE CUADRADO MEDIO ESTADISTICA DE


VARIACION LIBERTAD CUADRADOS PRUEBA
Tratamientos abc - 1 SCE CME = SCE / (ab - 1) Fc = CME / CMR

A a-1 SCA CMA = SCA / (a-1) Fc = CMA / CMR


B b-1 SCB CMB = SCA / (b-1) Fc = CMB / CMR
C c-1 SCC CMC = SCC/ (c-1) Fc = CMC / CMR
AB (a-1)(b-1) SCAB CMAB = SCAB/(a-1)(b-1) Fc = CMAB / CMR
AC (a-1)(c-1) SCAC CMAC = SCAC/(a-1)(c-1) Fc = CMAC / CMR
BC (b-1)(c-1) SCBC CMBC = SCBC/(b-1)(c-1) Fc = CMBC / CMR
ABC (a-1)(b-1)(c-1) SCABC CMABC = SCABC/g.l. Fc = CMABC / CMR

Residual (Error) (abc – 1) (r-1) SCR CMR = SCR/(ab-1)(c-1)


TOTAL n–1 SCT

De igual manera se verifica que las sumas de cuadrados de los factores y sus
interacciones son mutuamente ortogonales y por tanto son componentes
independientes de la suma de cuadrados de tratamientos de forma que:

SCA + SCB + SCC + SCAB + SCAC + SCBC + SCABC = SCE.

EJEMPLO:

Se realizó un experimento para determinar el efecto de suplementos alimenticios a


una ración de maíz para alimentar cerdos. Los factores bajo control fueron: Lisina (L)
a dos niveles: 0% y 0.6%; Proteína (P) administrada con Harina de soya y medida en
cantidades adicionales para proveer 12% y 14% de proteína; y, Sexo (S) del cerdo,
macho o hembra. Al experimento se incorporaron 40 cerdos, 20 machos y 20
hembras, asignándose aleatoriamente 5 cerdos para cada tratamiento. El aumento
diario promedio del peso de los cerdos expresado en kilos, se presenta en el siguiente
cuadro:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 79


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

AUMENTO DIARIO PROMEDIO DE CERDOS. En Kilogramos

FACTOR REPETICIONES
Lisina Proteína Sexo 1 2 3 4 5
0 12 M 1.11 0.97 1.09 0.99 0.85
H 1.03 0.97 0.99 0.99 0.99
14 M 1.52 1.45 1.27 1.22 1.67
H 1.48 1.22 1.53 1.19 1.16

0.6 12 M 1.22 1.13 1.34 1.41 1.34


H 0.87 1.00 1.16 1.29 1.00
14 M 1.38 1.08 1.40 1.21 1.46
H 1.09 1.09 1.47 1.43 1.24

Realizar el análisis de varianza correspondiente y verificar si los factores y sus


interacciones son significativas al nivel del 5%.

SOLUCION

Características del problema:

FACTORES: Lisina (L), con niveles: b1 = 0% y b2 = 0.6%


Proteína (P), con niveles: p1 = 12% y p2 =14%
Sexo (S): s1 = macho y s2 = hembra
TRATAMIENTOS: Ocho tratamientos resultante de la combinación de
niveles
VARIABLE RESPUESTA: Aumento diario promedio, expresado en kilogramos
UNIDAD EXPERIMENTAL: Cerdo.
NIVEL DE SIGNIFICACION 0.05
MODELO: Xijk = µ + αi + β j + αβ ij + γc + αγic + βγjc + αβγijc + εijck

Formulación de Hipótesis:
H0 : αi = 0 La lisina no tiene un efecto significativo en el incremento
diario promedio del peso de cerdos.
HA : αi ≠ 0 La lisina tiene un efecto significativo en el incremento
diario promedio del peso de cerdos.

H0 : βj = 0 La proteína no tiene un efecto significativo en el


incremento diario promedio del peso de cerdos.
HA : βj ≠ 0 La proteína tiene un efecto significativo en el incremento
diario promedio del peso de cerdos.

H0 : αβ ij = 0 La acción conjunta de la Lisina y Proteína no tienen un


efecto significativo en el incremento diario promedio del
peso de cerdos.
HA : αβ ij ≠ 0 La acción conjunta de la Lisina y Proteína tienen un
efecto significativo en el incremento diario promedio del
peso de cerdos.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 80


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Las restantes hipótesis tienen similar contexto de redacción, por tanto se presentará la
formulación con la indicación del factor o interacción que está docimándose.

Para el sexo: Interacción Lisina - Sexo


H0 : γc = 0 H0 : αγic = 0
HA : γc ≠ 0 HA : αγic ≠ 0

Interacción Proteína – Sexo Interacción Lisina – Proteina - Sexo


H0 : βγjc = 0 H0 : αβγijc = 0
HA : βγjc ≠ 0 HA : αβγijc ≠ 0

Estadística de prueba: Una para cada hipótesis:

Fc = CML CMP CMLP CMS CMLS CMPS SMLPS CMT


CMR CMR CMR CMR CMR CMR CMR CMR

Criterio de Decisión: Igual para todas las hipótesis


Rechazar la H0 si : Fc ≥ Fα, v1, v2

Cálculos: Iniciamos con el cálculo del análisis de varianza entre tratamientos y


replicaciones, exactamente como un diseño a dos criterios de clasificación,
conservando la misma estructura del cuadro de datos presentado en el problema, con
los siguientes resultados:

Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN Cuenta Suma Promedio Varianza


(1) 5 5.01 1.002 0.01092
s 5 4.97 0.994 0.00048
p 5 7.13 1.426 0.03393
ps 5 6.58 1.316 0.03053
l 5 6.44 1.288 0.01247
ls 5 5.32 1.064 0.02653
lp 5 6.53 1.306 0.02458
lps 5 6.32 1.264 0.03278

R1 8 9.7 1.2125 0.0529


R2 8 8.91 1.11375 0.0257
R3 8 10.25 1.28125 0.0358
R4 8 9.73 1.21625 0.0273
R5 8 9.71 1.21375 0.0737

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 0,93647 7 0,134 6,527 0,000 2,313
Error 0,68888 32 0,020
Total 1,62535 39

De la información obtenida, se concluye que los tratamientos, combinaciones entre


niveles de los factores, son significativamente diferentes y que las replicaciones no
tienen efecto significativo en la variable respuesta.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 81


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Procede, encontrar mayor explicación sobre las causas que originan la variación
significativa de los tratamientos; para lo cual debe examinarse el efecto de cada factor
y de cada interacción en la variable respuesta a través de su contribución a la suma
de cuadrados de tratamientos. Se determinarán, entonces, los multiplicadores
ortogonales para cada caso y su contribución a la SCE, con igual procedimiento de
cálculo que el empleado anteriormente, cuyos resultados se expresan seguidamente.

MULTIPLICADORES PARA EL TOTAL DEL TRATAMIENTO

TRATAMIENTO EFECTO FACTORIAL


L P S LP LS PS LPS
(1) -1 -1 -1 1 1 1 -1
s -1 -1 1 1 -1 -1 1
p -1 1 -1 -1 1 -1 1
ps -1 1 1 -1 -1 1 -1
l 1 -1 -1 -1 -1 1 1
ls 1 -1 1 -1 1 -1 -1
lp 1 1 -1 1 -1 -1 -1
lps 1 1 1 1 1 1 1

EFECTO PRINCIPAL Y CONTRIBUCION A LA SUMA DE CUADRADOS

TRATAMIENTO EFECTO FACTORIAL


L P S LP LS PS LPS
(1) -5.01 -5.01 -5.01 5.01 5.01 5.01 -5.01
s -4.97 -4.97 4.97 4.97 -4.97 -4.97 4.97
p -7.13 7.13 -7.13 -7.13 7.13 -7.13 7.13
ps -6.58 6.58 6.58 -6.58 -6.58 6.58 -6.58
l 6.44 -6.44 -6.44 -6.44 -6.44 6.44 6.44
ls 5.32 -5.32 5.32 -5.32 5.32 -5.32 -5.32
lp 6.53 6.53 -6.53 6.53 -6.53 -6.53 -6.53
lps 6.32 6.32 6.32 6.32 6.32 6.32 6.32
SUMA 0.92 4.82 -1.92 -2.64 -0.74 0.4 1.42
Divisor Efecto
Principal 20 20 20 20 20 20 20
Efecto Principal 0.046 0.241 -0.096 -0.132 -0.037 0.02 0.071
Divisor S.C. 40 40 40 40 40 40 40
Contribución a
Suma Cuadrados 0.02116 0.58081 0.09216 0.17424 0.01369 0.004 0.05041

En el cuadro de Multiplicadores para el Total de Tratamientos, se verifica que para


cada efecto factorial la sumatoria de los coeficientes es igual a cero, ∑λi = 0; también
se verifica que todas las particiones de las sumas de cuadrados son mutuamente
ortogonales y por tanto sus contribuciones son componentes independientes de la
suma de cuadrados de tratamientos.

El divisor para obtener el efecto principal es igual a 4 * 5 = 20, en donde “4”


corresponde al número de comparaciones que se realizan entre el nivel superior e

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 82


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

inferior del factor y el “5” corresponde al número de replicaciones. El divisor para la


contribución a la suma de cuadrados, 40, se lo obtiene de la suma de los cuadrados
de los coeficientes ortogonales de cada factor, ∑λi2 = 8, multiplicado por el números
de replicaciones. La contribución se calcula elevando al cuadrado la suma del efecto
factorial dividido para 40, (EF2 / (r ∑λi2 )); se verifica que la suma de las contribuciones
es igual a la suma de cuadrados de tratamientos. Con estos cálculos podemos
estructurar el cuadro de análisis de varianza final.

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Probabilidad Ft
Tratamientos 0,93647 7 0,134 6,527 0,000 2,313

L 0,02116 1 0,021 1,032 0,317 4,149


P 0,58081 1 0,581 28,336 0,000 4,149
S 0,09216 1 0,092 4,496 0,042 4,149
LP 0,17424 1 0,174 8,501 0,006 4,149
LS 0,01369 1 0,014 0,668 0,420 4,149
PS 0,004 1 0,004 0,195 0,662 4,149
LPS 0,05041 1 0,050 2,459 0,127 4,149

Error 0,68888 32 0,020


Total 1,62535 39

Se desprende del cuadro presentado que la Proteína es el factor proteína que más
aporta a la variación registrada como suma de cuadrados de tratamientos, SCE, con
el 62%; la interacción lisina proteína, LP, es el segundo componente que más aporta a
la SCE con el 18.6%; y, el factor Sexo aporta con el 9.8% ; éstos tres efectos
factoriales explican el 90% de la variación en los tratamientos; la participación de los
restantes efectos factoriales es relativamente marginal.

Decisión
Con los resultados presentados en el cuadro anterior, tomamos la decisión de
rechazar la hipótesis nula planteada para los factores: Proteína y Sexo; y para la
interacción Lisina Proteína, se concluye que éstos tienen un efecto significativo en el
incremento del peso en el cerdo. Los restantes efectos factoriales calculados: Lisina y
las interacciones LS, PS y LPS no tienen un efecto significativo en la variable
respuesta.

Análisis de los Efectos


Si bien hemos determinado los efectos que son significativos en la variación de la
variable respuesta y los que no lo son, debemos examinar con algún detalle los
efectos que tiene cada factor por sí mismo y en acción conjunta con uno o más de los
restantes factores; esto es, examinar la magnitud y el sentido de los efectos simples
como del efecto principal de cada factor.

Los resultados numéricos del cálculo de los efectos nos indica que el factor Proteína
es el más grande y tiene una dirección positiva, esto es, que el aumento en el
porcentaje de proteína del 12 al 14%, incrementa el peso del cerdo en 0.241
kilogramos; el efecto principal de la lisina también es positivo aunque su magnitud no
es significativa, apenas 0.046 kg.; en el caso del factor sexo al analizar su efecto
principal es importante considerar que el nivel inferior del factor es macho y el nivel
superior es hembra, el signo del efecto nos indica que el incremento del peso del
macho es superior al incremento del peso de la hembra y su magnitud nos indica que
del macho a la hembra el incremento del peso disminuye en 0.096 kg. Miremos con
algún detalle el comportamiento de los componentes de cada efecto principal.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 83


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

En Lisina. Comencemos obteniendo los efectos simples de la


Lisina, utilizando la suma del tratamiento que corresponda, así:

Por sí misma: l - (1) = 6.44 - 5.01 = 1.43 / 5 = 0.286


Con la proteína: lp - p = 6.53 - 7.13 = -0.60/ 5 = -0.12
Con el sexo: ls - s = 5.32 - 4.97 = 0.35 / 5 = 0.07
Con proteína y sexo: lps – ps= 6.32 - 6.58 = -0.26/ 5 = -0.052

Su efecto principal es el promedio de los efectos simples, por tanto si sumamos el


resultado de los efectos parciales: (0.286 – 0.12 + 0.07 – 0.052) = 0.184 y lo dividimos
para el número de comparaciones, 4, encontramos que el efecto principal de la
Lisina es de 0.046, tal como se presentó en el cuadro respectivo.

Nótese que para obtener el efecto simple, en cada diferencia dividimos para 5 para
promediar ésta por unidad experimental; una forma alternativa hubiera sido restar sus
promedios, que en este caso sería igual a: 1.288 – 1.002 = 0.286, exactamente igual;
los demás efectos simples se calculan de forma similar. El signo del efecto principal
(+) nos indica que el poner lisina en la dieta de los cerdos ( del 0% al 0.6%)
incrementa su peso en 0.046 kilogramos en promedio, valor que no es significativo.

En proteína:
Por sí misma: p – (1) = (7.13 – 5.01) / 5 = 0.424
Con lisina: lp – l = (6.53 – 6.44) / 5 = 0.018
Con sexo: ps – s = (6.58 – 4.97) / 5 = 0.322
Con lisina y sexo: lps – ls = (6.32 – 5.32) / 5 = 0.200
Sumatoria: 0.964
Efecto principal: 0.964 / 4 = 0.241

En este caso, el resultado del cálculo del efecto principal nos indica que el factor
Proteína tiene un efecto positivo en la dieta del cerdo; al incrementarse un 2% (del
12% al 14%) el peso del cerdo se incrementa en 0.241 kilogramos en promedio, valor
significativo al 5%; nótese que el aporte de la proteína con los restantes factores es
positivo y muy significativo el aporte de este factor con el sexo que representa el 33%
del aporte total de la proteína.

En Sexo:
Por sí misma: s – (1) = (4.97 – 5.01) / 5 = -0.008
Con lisina: ls – l = (5.32 – 6.44) / 5 = -0.224
Con proteína: ps – p = (6.58 – 7.13) / 5 = -0.110
Con lisina y proteína: lps – lp = (6.32 – 6.53) / 5 = -0.042
Sumatoria: -0.384
Efecto principal: -0.384 / 4 = -0.096

En el factor sexo, recordemos, el nivel inferior es macho y el inferior es hembra, y lo


que estamos contrastando es el efecto de pasar del nivel inferior al superior; el signo
del efecto principal del sexo es negativo lo que indica que el peso del macho es
superior al de la hembra; el efecto promedio de sexo en el peso de los cerdos indica
que éste disminuye en 0.096 kilogramos.

Al analizar los efectos principales estamos docimando la hipótesis nula en la que el


nivel inferior y el nivel superior del factor tienen el mismo efecto en la variable
respuesta y que siendo iguales su diferencia es cero, contra la hipótesis alternativa

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 84


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

que la diferencia entre estos niveles (superior – inferior) es significativamente diferente


de cero.

Método de Yates para calcular los totales de efectos factoriales

Este método proporciona un procedimiento más eficaz para calcular los totales de los
efectos factoriales; éste consiste en:

1. Escribir la combinación de tratamientos en orden sistemático, las letras de los


factores se ingresan por turno para formar el tratamiento; la introducción de
cualquiera de las letras es seguida por sus combinaciones con todas las
combinaciones de tratamientos anteriores; por ejemplo, en un diseño
experimental de tres factores los tratamientos deben ser descritos de la
siguiente manera:
(1) a b ab c ac bc abc

2. Descritos los tratamientos se escribe los totales de cada tratamiento.

3. La primera columna, luego de los tratamientos y sus totales, se opera de la


siguiente manera: la mitad superior de la columna se forma con la suma de los
tratamientos (Ti + Ti+1; para valores de i = 1, 3, 5, ...) por pares y en la
segunda mitad de la columna se registra la diferencia entre el dato par menos
el dato impar (Ti+1 - Ti para i = 1, 3, 5, ...). La segunda columna se forma
con los valores de la primera y con igual procedimiento, esto es sumando los
pares consecutivos, para la mitad superior de la columna, y restando los pares
consecutivos, para la mitad inferior; en idéntica forma se opera la tercera
columna.

4. El primer número de la columna 3, contiene los totales de los efectos


fatoriales; los efectos factoriales subsecuentes aparecen en el orden en el que
las combinaciones de tratamientos se han escrito. Si se trata de un diseño
factorial dos al cubo, 23, el cuadro tendrá sólo 3 columnas de operación; si el
diseño factorial es 2n, el cuadro tendrá “n” columnas operativas que se forman
de igual manera.

Para el último ejemplo desarrollado, el procedimiento de Yates se presenta en el


siguiente cuadro, verificándose que los valores resultantes son exactamente iguales a
los calculados con el procedimiento anterior.

SUMA DEL EFECTO FATORIAL, PROCEDIMIENTO DE YATES

TRATAMIENTO COLUMNA
Efecto factorial Total C1 C2 C3
(1) 5.01 9.98 23.69 48.3
s 4.97 13.71 24.61 -1.92
p 7.13 11.76 -0.59 4.82
ps 6.58 12.85 -1.33 0.4
l 6.44 -0.04 3.73 0.92
ls 5.32 -0.55 1.09 -0.74
lp 6.53 -1.12 -0.51 -2.64
lps 6.32 -0.21 0.91 1.42

La primera mitad de la columna 1 se forma sumando los pares consecutivos:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 85


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

5.01 + 4.97 = 9.98;


7.13 + 6.58 = 13.71, y así sucesivamente.

La segunda mitad de la columna 2 se forma restando los pares consecutivos:


4.97 – 5.01 = -0.04
6.58 – 7.13 = -0.55, y así sucesivamente.

La segunda columna se forma con los resultados de la primera y con igual


procedimiento:
9.98 + 13.71 = 23.69, y así sucesivamente para la primera mitad de la
columna;
13.71 – 9.98 = 3.73, y así sucesivamente para la segunda mitad de la columna.

La tercera columna se forma con los valores de la segunda y sus resultados son
exactamente los mismos que aquellos obtenidos en el desarrollo del ejemplo.

6.4 DISEÑO FACTORIAL 24

En este diseño intervienen cuatro factores a dos niveles cada factor; es una extensión
de los diseños descritos anteriormente y su procedimiento de prueba y cálculo son
similares. El número de tratamientos es 16 que corresponden a la multiplicación del
número de niveles de cada factor: 2 x 2 x 2 x 2 = 16

Si denotamos a los factores con A, B, C y D, los tratamientos y su notación


simplificada, tenemos que:

TRATAMIENTO NOTACION
a1b1c1d1 (1)
a1b1c1d2 d
a1b1c2d1 c
a1b1c2d2 cd
a1b2c1d1 b
a1b2c1d2 bd
a1b2c2d1 bc
a1b2c2d2 bcd
a2b1c1d1 a
a2b1c1d2 ad
a2b1c2d1 ac
a2b1c2d2 acd
a2b2c1d1 ab
a2b2c1d2 abd
a2b2c2d1 abc
a2b2c2d2 abcd

Para el cálculo de los efectos principales (A, B, C, D) de las interacciones de primer


orden (AB, AC, AD, BC), la de segundo orden (ABC, ABD, ACD, BCD) y la de tercer
grado (ABCD), se utilizarán los multiplicadores ortogonales que se presentan en el
siguiente cuadro.

Al igual que en los casos anteriores, la presencia o ausencia de la letra del factor en la
denominación del tratamiento determina el signo “+” en presencia o “-” en ausencia;
para las interacciones se multiplican los signos de los factores que intervienen en la
interacción.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 86


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TRATAMIENTO MULTIPLICADORES PARA EL TOTAL DE TRATAMIENTO


A B C D AB AC AD BC BD CD ABC ABD ACD BCD ABCD
(1) -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 -1 -1 1
d -1 -1 -1 1 1 1 -1 1 -1 -1 -1 1 1 1 -1
c -1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 1 -1
cd -1 -1 1 1 1 -1 -1 -1 -1 1 1 1 -1 -1 1
b -1 1 -1 -1 -1 1 1 -1 -1 1 1 1 -1 1 -1
bd -1 1 -1 1 -1 1 -1 -1 1 -1 1 -1 1 -1 1
bc -1 1 1 -1 -1 -1 1 1 -1 -1 -1 1 1 -1 1
bcd -1 1 1 1 -1 -1 -1 1 1 1 -1 -1 -1 1 -1
a 1 -1 -1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1
ad 1 -1 -1 1 -1 -1 1 1 -1 -1 1 -1 -1 1 1
ac 1 -1 1 -1 -1 1 -1 -1 1 -1 -1 1 -1 1 1
acd 1 -1 1 1 -1 1 1 -1 -1 1 -1 -1 1 -1 -1
ab 1 1 -1 -1 1 -1 -1 -1 -1 1 -1 -1 1 1 1
abd 1 1 -1 1 1 -1 1 -1 1 -1 -1 1 -1 -1 -1
abc 1 1 1 -1 1 1 -1 1 -1 -1 1 -1 -1 -1 -1
abcd 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

En todos los casos el divisor para el efecto principal es “8r”, en el que el número “8”
representa el número de comparaciones simples que deben efectuarse en cada factor
y “r” corresponde al número de tratamientos; el efecto principal del factor A, por
ejemplo, se obtiene multiplicando el total de cada tratamiento por el coeficiente
ortogonal de la columna “A” y su suma (A) la dividimos para “8r”.

El divisor para la contribución a la suma de cuadrados, es “16r” en donde el número


“16” corresponde a la sumatoria del cuadrado de los coeficientes ortogonales ∑λi2; y,
“r” al número de replicaciones del experimento; la contribución a la suma de
cuadrados, se la calcula elevando al cuadrado la suma (A) y dividiéndola para “16r”.

El modelo matemático, es lineal y aditivo conforme se presenta:

Xijk = µ + αi + β j + αβ ij + γc + αγic + βγjc + αβγijc + δm + αδim + βδjm + αβδijm +


γδcm + αγδicm + βγδjcm + αβγδjjcm + εijcmk

en el que:

Xij = Valor de la variable respuesta correspondiente.


µ = Es el promedio general o promedio poblacional
αi = Es el efecto del i-ésimo nivel del factor A.
β j = Es el efecto del j-ésimo nivel del factor B.
γc = Es el efecto del c-ésimo nivel del factor C.
δm = Ese el efecto del m-ésimo nivel del factor D
αβij αγic βγjc αβγijc αδim βδjm αβδijm γδcm αγδicm βγδjcm
αβγδijcm Representa las interacciones de los factores.
εijcmk = Es el error o valor residual que se considera es independiente
de observación a observación y está normalmente distribuido
con valor esperado igual a cero y varianza igual a σ , Ν (0,σ ).
2 2

Para i= j = c = m = 1, 2 número niveles del factor

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 87


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Las hipótesis que se prueban corresponden a cada factor, interacción y a las


replicaciones, su procedimiento es exactamente igual al utilizado en los ejemplos
anteriores.

La estadística de prueba que se utiliza es la F, calculada como el cuociente entre el


cuadrado medio del factor divido para el cuadrado medio residual; y, el criterio de
decisión es rechazar la hipótesis nula si el valor calculado de la estadística de prueba
es igual o mayor que el valor tabular de la estadística de prueba: Fc ≥ Fα, v1, v2 .

EJEMPLO

En un experimento de metalurgia se desea probar el efecto de cuatro factores y sus


interacciones en la concentración (porcentaje ponderado) de un compuesto específico
de fósforo en un material a ser moldeado. Las variables son A, porcentaje de fósforo
en el refinamiento; B, porcentaje del material redisuelto; C, tiempo de mezclado y D,
tiempo de duración; todos los factores se probaron a dos niveles. Se variaron los
cuatro factores en un experimento factorial 24, en el cual se tomaron dos moldes y se
midió el contenido para cada combinación de tratamientos. Considere un nivel de
significación del 5%.

Los datos obtenidos en las mediciones del porcentaje ponderado del compuesto de
fósforo para cada tratamiento se presenta en el siguiente cuadro:

PORCENTAJE PONDERADO DEL COMPUESTO DE FOSFORO

REPETICIONES
TRATAMIENTO R1 R2 Total
(1) 30.3 28.6 58.9
a 28.5 31.4 59.9
b 24.5 25.6 50.1
ab 25.9 27.2 53.1
c 24.8 23.4 48.2
ac 26.9 23.8 50.7
bc 24.8 27.8 52.6
abc 22.2 24.9 47.1
d 31.7 33.5 65.2
ad 24.6 26.2 50.8
bd 27.6 30.6 58.2
abd 26.3 27.8 54.1
cd 29.9 27.7 57.6
acd 26.8 24.2 51
bcd 26.4 24.9 51.3
abcd 26.9 29.3 56.2
Total 428.1 436.9 865

Nótese que los tratamientos están expresados con la notación simplificada; y que en
adelante se omitirá todo el procedimiento inicial de la solución del problema para
presentar directamente los resultados del procesamiento.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 88


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Análisis de varianza
RESUMEN Cuenta Suma Promedio Varianza
(1) 2 58.9 29.45 1.445
a 2 59.9 29.95 4.205
b 2 50.1 25.05 0.605
ab 2 53.1 26.55 0.845
c 2 48.2 24.1 0.98
ac 2 50.7 25.35 4.805
bc 2 52.6 26.3 4.5
abc 2 47.1 23.55 3.645
d 2 65.2 32.6 1.62
ad 2 50.8 25.4 1.28
bd 2 58.2 29.1 4.5
abd 2 54.1 27.05 1.125
cd 2 57.6 28.8 2.42
acd 2 51 25.5 3.38
bcd 2 51.3 25.65 1.125
abcd 2 56.2 28.1 2.88

R1 16 428.1 26.756 5.993


R2 16 436.9 27.306 8.346

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamientos 178.149 15 11.877 4.828 2,352 0,000

A 11.52 1 11,52 4,683 4,494 0,046


B 12.005 1 12.005 4.880 4,494 0,000
C 39.605 1 39.605 16.100 4,494 0,000
D 17.701 1 17.701 7.196 4,494 0,000
AB 7.801 1 7.801 3.171 4,494 0,000
AC 3.001 1 3.001 1.220 4,494 0,000
AD 14.045 1 14.045 5.709 4,494 0,000
BC 11.281 1 11.281 4.586 4,494 0,000
BD 3.125 1 3.125 1.270 4,494 0,000
CD 3.92 1 3,92 1,593 4,494 0,225
ABC 2.42 1 2,42 0,984 4,494 0,336
ABD 24.151 1 24.151 9.817 4,494 0,000
ACD 17.701 1 17.701 7.196 4,494 0,000
BCD 5.951 1 5.951 2.419 4,494 0,000
ABCD 3.92 1 3,92 1,593 4,494 0,225

Error 39,36 16 2,460

Total 217.509 31

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 89


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Para encontrar la contribución a la suma de cuadrados de los tratamientos, se


procede conforme fue descrito en los diseños 22 y 23 ; debemos tener en cuenta que
el divisor para determinar el efecto principal es “8r = 16” y el divisor para la
contribución es “16r = 32”.

Los resultados que se exponen en el cuadro anterior, nos permiten tomar las
decisiones necesarias para explicar el experimento; decidimos primero que el conjunto
de los tratamientos es significativamente diferente, no así las repeticiones.
Contrastada la hipótesis nula referente a que el factor, o alguna interacción, no tiene
efecto significativo en el cambio de la variable respuesta, encontramos que ésta
hipótesis debe ser rechazada para todos los factores, A, B, C y D; y, para las
interacciones AD, BC, ABD y ACD. Por tanto, concluimos que el porcentaje de fósforo
en el refinamiento (A), el porcentaje de material redisuelto (B), el tiempo de mezclado
(C) y el tiempo de duración (D) si causan un efecto significativo en la concentración de
un compuesto específico de fósforo en un material a ser moldeado, medido en el
porcentaje ponderado del compuesto de fósforo. También se concluye que existe un
efecto importante en la acción conjunta del porcentaje de fósforo y el tiempo de
duración (AD); entre el porcentaje de material redisuelto y el tiempo de mezclado (BC);
y en la acción conjunta de los factores ABD y ACD; una consecuencia inmediata es
considerar la posibilidad de que los factores que intervienen en el experimento no son
mutuamente independientes, que tienen una acción conjunta importante que debe ser
analizada con mayor profundidad.

Las restantes interacciones no son significativas al 5% de significación y en ellas se


acepta la hipótesis nula planteada.

Otra forma de obtener similar respuesta es a través del método de Yates, que
calculado conforme el procedimiento antes descrito y con los datos del problema se
tienen los siguientes resultados:

METODO DE YATES
CALCULO DEL EFECTO PRINCIPAL Y LA CONTRIBUCION A LA SUMA DE CUADRADOS

TRATAMIENTO COLUMNA EFECTO CONTRIB.


NOMBRE TOTAL C1 C2 C3 C4 PRINCIPAL SUM. CUAD.
(1) 58.9 118.8 222 420.6 865
a 59.9 103.2 198.6 444.4 -19.2 -1.200 11.52
b 50.1 98.9 228.3 1 -19.6 -1.225 12.005
ab 53.1 99.7 216.1 -20.2 15.8 0.988 7.801
c 48.2 116 4 -14.8 -35.6 -2.225 39.605
ac 50.7 112.3 -3 -4.8 9.8 0.613 3.001
bc 52.6 108.6 -18.5 -6 19 1.188 11.281
abc 47.1 107.5 -1.7 21.8 -8.8 -0.550 2.420
d 65.2 1 -15.6 -23.4 23.8 1.488 17.701
ad 50.8 3 0.8 -12.2 -21.2 -1.325 14.045
bd 58.2 2.5 -3.7 -7 10 0.625 3.125
abd 54.1 -5.5 -1.1 16.8 27.8 1.738 24.151
cd 57.6 -14.4 2 16.4 11.2 0.700 3.920
acd 51 -4.1 -8 2.6 23.8 1.488 17.701
bcd 51.3 -6.6 10.3 -10 -13.8 -0.863 5.951
abcd 56.2 4.9 11.5 1.2 11.2 0.7 3.920

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 90


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

Los valores de las columnas 1 a 4 se obtienen conforme el procedimiento señalado;


los valores de la columna 4, C4, expresan los resultados finales para cada efecto
factorial y a partir de éstos se calcula el efecto principal y la contribución a la suma de
cuadrados de tratamientos. Del cuadro anterior, se verifica que los resultados
correspondientes a la contribución a la suma de cuadrados de tratamientos así como
del efecto principal, son iguales a los presentados en el cuadro de Análisis de
Varianza, validando el resultado presentado en la columna 4, C4.

6.5 EXPERIMENTO GENERAL DE TRES FACTORES

Es aquel en el que intervienen tres factores, el factor A con a niveles y el factor B con
b niveles y el factor C con c niveles; el número de tratamientos es igual a “a x b x c”; si
tenemos r replicaciones en el experimento, entonces el número de observaciones y
unidades experimentales es de “a x b x c x r”, en el que éstas se asignan
aleatoriamente a cada tratamiento.

El modelo supone lineal y aditividad de lo efectos, se probarán hipótesis para cada


factor e interacción entre los factores y el efecto de las replicaciones. El
procedimiento de cálculo y de elaboración y conformación del cuadro de análisis de
varianza se explica a continuación con el desarrollo de un ejemplo:

EJEMPLO

Se realizó un experimento para determinar el efecto de suplementos alimenticios a


una ración de maíz para alimentar cerdos. Los factores bajo control fueron: Lisina (L)
a cuatro niveles: 0, 0.05, 0.10 y 0.15; Meteonina (M) con tres niveles: al 0, 0.025 y
0.050; y, Proteína (P) a dos niveles, administrada con Harina de soya y medida en
cantidades adicionales para proveer 12% y 14% de proteína; se utilizaron solamente
machos en dos repeticiones por cada tratamiento.

El número de tratamientos es 4 x 3 x 2 = 24 y el número de observaciones y unidades


experimentales es de 4 x 3 x 2 x 2 = 48. Para facilitar la descripción de los
tratamientos, los niveles para cada factor serán denotados por:

Lisina (L), con niveles: b1 = 0; b2 = 0.05; b3 = 0.010 y b4 = 0.15


Meteionina (M), con niveles: m1 = 0; m2 = 0.025; m3 = 0.050
Proteína (P), con niveles: p1 = 12% y p2 =14%

El aumento diario promedio del peso de los cerdos expresado en kilos, se presenta en
el siguiente cuadro:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 91


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

AUMENTO DIARIO PROMEDIO EN CERDOS


En Kilogramos

FACTORES REPLICACION
LISINA METIONINA PROTEINA TRATAMIENTO R1 R2 TOTAL
0 0 12 b1m1p1 1.11 0.97 2.08
14 b1m1p2 1.52 1.45 2.97
0.025 12 b1m2p1 1.09 0.99 2.08
14 b1m2p2 1.27 1.22 2.49
0.05 12 b1m3p1 0.85 1.21 2.06
14 b1m3p2 1.67 1.24 2.91
0.05 0 12 b2m1p1 1.3 1 2.3
14 b2m1p2 1.55 1.53 3.08
0.025 12 b2m2p1 1.03 1.21 2.24
14 b2m2p2 1.24 1.34 2.58
0.05 12 b2m3p1 1.12 0.96 2.08
14 b2m3p2 1.76 1.27 3.03
0.1 0 12 b3m1p1 1.22 1.13 2.35
14 b3m1p2 1.38 1.08 2.46
0.025 12 b3m2p1 1.34 1.41 2.75
14 b3m2p2 1.4 1.21 2.61
0.05 12 b3m3p1 1.34 1.19 2.53
14 b3m3p2 1.46 1.39 2.85
0.15 0 12 b4m1p1 1.19 1.03 2.22
14 b4m1p2 0.8 1.29 2.09
0.025 12 b4m2p1 1.36 1.16 2.52
14 b4m2p2 1.42 1.39 2.81
0.05 12 b4m3p1 1.46 1.03 2.49
14 b4m3p2 1.62 1.27 2.89
TOTAL 31.5 28.97 60.47

1. Se lista los tratamientos con sus respectivas observaciones, conformando un


cuadro de doble entrada: tratamientos y repeticiones;
2. Se realiza el análisis de varianza de dos vías con los valores calculados y
tabulados de F para filas (tratamientos) y columna (repeticiones); y se obtiene
el cálculo del factor de corrección FC;

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamiento 12.756 23 0,056 1,740 1,993 0,092
Error 0,7653 24 0,032

Total 20.409 47

FC = (60.47)2 / 48 = 76.1796

3. Para obtener la suma de cuadrados de cada factor, fórmese para cada par de
factores un cuadro de dos vías, sumando las observaciones que correspondan
para cada combinación de los niveles de cada factor “i,j”

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 92


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TABLA DE RESUMEN LISINA METIONINA (LM)

LISINA
METIONINA 0 0.05 0.1 0.15 TOTAL
0 5.05 5.38 4.81 4.31 19.55
0.025 4.57 4.82 5.36 5.33 20.08
0.05 4.97 5.11 5.38 5.38 20.84
TOTAL 14.59 15.31 15.55 15.02 60.47

Para ejemplificar la obtención de los valores de la tabla, mencionemos que el valor


5.05 proviene de la suma de los primeros cuatro valores de la tabla inicial, 1.11 + 0.97
+ 1.52 + 1.45, éstos valores tiene “0” lisina y “0” metionina. Para obtener el valor de
“0.05” de lisina y “0.025” de metionina se suman: 1.03 + 1.21 + 1.24 + 1.34 = 4.82 y
así sucesivamente. Cada valor de la tabla representa a 4 observaciones.

4. Calcule el Total de cada cuadro de dos vías, elevando al cuadrado el valor de


cada Xij, la sumatoria de éstos valores se divide para el número de
observaciones que contiene cada Xij, y se le resta FC;

Total tabla LM: (5.052 + 5.382 + 4.812 + ... + 5.382) / 4 - 76.1796 = 0.3496
El divisor “4” corresponde al número de observaciones que contiene cada valor del
cuadro: 5.05, 5.38, 4.81, etc..

5. Para calcular la suma de cuadrados de un factor, (L, M), eleve al cuadrado los
totales marginales del factor, divida para el número de observaciones que
contiene cada total marginal y réstele FC;

Lisina (L): (14.592 + 15.312 + 15.552 + 15.022 ) /12 - 76.1796 = 0.0427


El total marginal para el primer nivel de lisina es 14.59 y en éste están contenidos 12
observaciones originales, por eso la sumatoria de los cuadrados de los marginales se
divide para 12. El resultado, 0.0427, es la contribución del factor L a la suma de
cuadrados de tratamientos.

Metionina (M): ( 19.552 + 20.082 + 20.842 ) / 16 – 76.1796 = 0.0526


El total marginal del segundo nivel de metionina es 20.08 y representa a 16
observaciones originales, por tanto el divisor para la suma de los cuadrados de sus
marginales es 16. El resultado, 0.0526, es la contribución del factor M a la suma de
cuadrados de tratamientos.

6. El valor de la interacción de cada par de factores es igual al total de cuadro de


dos vías menos el aporte de cada factor.

Interacción LM: 0.3496 – (0.0427 + 0.0526) = 0.2543


Nótese que del Total del cuadro de dos vías, 0.3496, se resta la contribución de cada
factor; el resultado, 0.2543, es la contribución de la interacción LM a la suma de
cuadrados de tratamientos.

De igual forma se opera con los siguientes cuadros de dos vías: Lisina – Proteína y
Metionina – Proteína, con los siguientes resultados:

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 93


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

TABLA DE RESUMEN LISINA PROTEINA (LP)

LISINA
PROTEINA 0 0.05 0.1 0.15 TOTAL
12 6.22 6.62 7.63 7.23 27.7
14 8.37 8.69 7.92 7.79 32.77
TOTAL 14.59 15.31 15.55 15.02 60.47

Total tabla LP: (6.222 + 6.622 + 7.632 + ... + 7.792) / 6 - 76.1796 = 0.8181
2 2 2 2
Lisina (L): (14.59 + 15.31 + 15.55 + 15.02 ) /12 - 76.1796 = 0.0427
2 2
Proteína (P): ( 27.7 + 32.77 ) / 24 – 76.1796 = 0.5355
Interacción LP: 0.8181 – (0.0427 + 0.5355) = 0.2399

El divisor “6” para el total del cuadro corresponde al número de observaciones


originales que contiene cada valor Xij del cuadro. El divisor “24” para proteína
corresponde a las 24 observaciones originales que contiene cada total marginal del
factor.

TABLA RESUMEN METIONINA PROTEINA (MP)

METIONINA
PROTEINA 0 0.025 0.05 TOTAL
12 8.95 9.59 9.16 27.7
14 10.6 10.49 11.68 32.77
TOTAL 19.55 20.08 20.84 60.47

2 2 2
Total tabla MP: (8.95 + 9.59 + ... + 11.68 ) / 8 - 76.1796 = 0.6702
Metionina (M): ( 19.552 + 20.082 + 20.842 ) / 16 – 76.1796 = 0.0526
Proteína (P): ( 27.72 + 32.772 ) / 24 – 76.1796 = 0.5355
Interacción LP: 0.6702 – (0.0526 + 0.5355) = 0.08121

Se verifica, que la contribución a la suma de cuadrados de tratamientos SCE, de los


factores L, M y P son exactamente los mismos si se calculan en un cuadro o en otro;
puede, entonces, omitirse el cálculo del factor antes realizado para abreviar el cálculo.
Resta únicamente calcular el efecto factorial de los tres factores LMP.

7. Para calcular la interacción de segundo orden LMP, se resta de la SCE, suma


de cuadrados de tratamientos, 1.2756, las contribuciones calculadas de los
factores y de las interacciones de primer orden.

Interacción LMP: SCE – (L + M + P + LM + LP + MP)


LMP: 1.2756 – ( 0.0427 + 0.0526 + 0.5355 + 0.2543 + 0.2399 + 0.0821) =
0.0685.

Se lo hace por diferencia, toda vez que las particiones realizadas a la SCE son
mutuamente ortogonales y por tanto componentes independientes de la SCE. Debe
tenerse en cuenta que los grados de libertad están en función del número de niveles
de cada factor y sus interacciones tienen grados de libertad igual a la multiplicación de
los grados de libertad de los factores que en él intervienen. Con estos valores
conformamos el cuadro definitivo del análisis de varianza, conforme se presenta a
continuación.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 94


INTRODUCCIÓN AL ANÁLISIS ESTADÍSTICO DE DISEÑOS EXPERIMENTALES ING. OSCAR CISNEROS G.

ANÁLISIS DE VARIANZA
FV SC GL CM Fc Ft Probabilidad
Tratamiento 12.756 23 0,056 1,740 1,993 0,092

L 0,0427 3 0,014 0,446 3,009 0,722


M 0,0526 2 0,026 0,825 3,403 0,450
P 0,5355 1 0,536 16,793 4,260 0,000
LM 0,2543 6 0,042 1,329 2,508 0,283
LP 0,2399 3 0,080 2,508 3,009 0,083
MP 0,0821 2 0,041 1,287 3,403 0,294
LMP 0,0685 6 0,011 0,358 2,508 0,898

Error 0,7653 24 0,032

Total 20.409 47

En base a los resultados obtenidos, podemos indicar que únicamente el factor


Proteína tiene un efecto significativo en el incremento del peso de los cerdos; los
restantes factores y sus interacciones no son significativas al nivel del 5%. Resulta
interesante observar que las replicaciones tienen efecto significativo en la variable
respuesta, lo que puede ser un indicativo de diferencias en las unidades
experimentales.

Por último, considero prudente recomendar que en los diseños factoriales puede ser
importante discriminar de la variación total aquella que corresponda a las
replicaciones, ésta separación disminuye la variación del error experimental y hace
más sensibles las pruebas para factores e interacciones.

DISEÑO DE INVESTIGACIONES EXPERIMENTALES 95

S-ar putea să vă placă și