Documente Academic
Documente Profesional
Documente Cultură
SUBPROYECTO
DISEÑO EXPERIMENTAL
MÓDULO II
ASPECTOS TEÓRICOS DE LA INVESTIGACIÓN CIENTÍFICA,
LOS DISEÑOS EXPERIMENTALES Y EL ANÁLISIS DE VARIANZA
FACILITADOR:
Objetivos de Aprendizaje
Objetivo específicos
1. Identificar los procedimientos del método experimental.
2. Reconocer los pasos que se usan en el planeamiento de un experimento.
3. Discutir los principios básicos del diseño experimental en ingeniería en producción
animal.
4. Analizar los tipos de diseño experimentales como el diseño completamente al azar, el
diseño e bloques al azar, el diseño cuadrado latino y el diseño factorial.
Contenido
La investigación y la experimentación,
Características de la experimentación,
El método experimental, El modelo clásico de un experimento,
Etapas del planeamiento y de la ejecución de un experimento y
Principios básicos del diseño experimental.
Tipos de diseños experimentales
El Análisis de Varianza (ANOVA)
Pruebas de comparación de medias
¿Por qué experimentamos? para comparar las respuestas de los diferentes niveles de
los factores de interés para el investigador, para encontrar las condiciones que permitan
alcanzar un valor ideal en la variable respuesta, para identificar las principales causas
Prof. Econ. Carlos M. Díaz N. Subproyecto Diseño Experimental Página 3 de 40
de variación en los resultados, y construir modelos que permitan obtener predicciones
de la variable respuesta.
REALIDAD
PROBLEMA
CIENTÍFICO-TECNOLÓGICO
DATOS
ANÁLISIS
SPSS
CONCLUSIONES
Por ejemplo, Tomado de López & González (2014), si se está interesado en estudiar el
efecto del factor frecuencias de riego en el rendimiento y evapotranspiración del maíz
(Zea mays) en la unidad de riego San Cristóbal Acasaguastlán, El Progreso. Las
frecuencias: 8, 10, 12 y 14 días, son los niveles (o tratamientos) de este factor.
Otro ejemplo: Tomado de López & González (2014), si el interés fuera diseñar un
experimento para estudiar el efecto de 4 niveles de nitrógeno (0, 50, 100 y 150
kg/ha/año) y 4 niveles de fósforo (0, 40, 80 y 120 kg/ha/año) en el rendimiento de
cardamomo (Elettaria cardamomun M.) en la Serie de Suelos Tamahu, en aldea Choval,
Cobán, Alta Verapaz; se tendrían dos factores: nitrógeno con 4 niveles y fósforo con 4
niveles. Se puede decir también que este experimento involucra 16 combinaciones de
niveles de los dos factores considerados.
Prof. Econ. Carlos M. Díaz N. Subproyecto Diseño Experimental Página 7 de 40
IX.- PRINCIPIOS BÁSICOS DEL DISEÑO EXPERIMENTAL
Los principios básicos del diseño experimental son: repetición, aleatorización, y control
local.
Para Navarro, Ramírez & Villagrán (2012), la aleatorización consiste en asignar al azar
los tratamientos a las unidades experimentales. El azar persigue: i) que cada unidad
experimental tiene equiprobabilidad de recibir cualquier tratamiento, ii) eliminar el sesgo
de favorecer o discriminar sistemáticamente algún tratamiento, por ser asignado a las
unidad experimental en mejores condiciones, iii) independencia entre las
observaciones, la cual es necesaria para hacer contrastes y estimar intervalos,
significativamente válidos, de los parámetros.
Control Local (Control del error Experimental): Consiste en tomar medidas dentro del
diseño experimental para hacerlo más eficiente, de tal manera que pueda permitir la
reducción del error experimental y así hacerla más sensible a cualquier prueba de
significación.
Para Navarro, Ramírez & Villagrán (2012), se refiere a distribuir el material experimental
en grupos o bloques de unidades experimentales más o menos uniformes y luego,
asignar aleatoriamente los tratamientos a las unidades experimentales dentro de los
bloques. En el análisis estadístico: i) se elimina la variación entre bloques del error
experimental, lo que aumenta la precisión del experimento ya que con él se eliminan las
diferencias entre bloques, ii) se comparan los tratamientos dentro de bloques de
unidades experimentales uniformes, en condiciones de mayor igualdad. El bloqueo
aumenta la información del experimento en muchas condiciones, pues no es necesario
colocar ni ensayar los bloques en el mismo sitio ni al mismo tiempo.
La manipulación experimental consiste en establecer los niveles de las VI; por ejemplo,
para saber si el consumo dietético de un prebiótico aumenta la ganancia de peso
corporal de gazapos recién destetados, en un experimento simple se forman dos grupos
de gazapos y se les asigna aleatoriamente dos concentraciones diferentes del
prebiótico (una a cada grupo), manteniendo las demás condiciones experimentales
controladas; cada grupo de gazapos es una unidad experimental y cada uno dentro del
grupo es una unidad de muestreo, el prebiótico es el factor y cada concentración del
mismo, el nivel o tratamiento.
Una vez formuladas las hipótesis y definidas las variables, las unidad experimental y las
unidad de muestreo, se requiere que el diseño sea parsimonioso: el más simple que
aporte la precisión deseada; que la unidad experimental que reciban distinto tratamiento
difieran de forma no sistemática entre sí; que el error experimental sea pequeño,
usando el mínimo de unidad experimental; que el diseño propicie hacer el análisis
estadístico de los resultados sin suposiciones artificiales y que las conclusiones del
experimento tengan validez externa (que sean extrapolables).
Ahora bien, es imprescindible precisar la fecha de la toma de los datos, ya que éstos
van a representar la fase inicial del probable experimento. Además, con el Marco
Muestral se facilita la asignación aleatoria de las unidades experimentales a los niveles
del factor. Posteriormente, deben crearse la hoja de registro para la investigación,
precisando las variables que se van a medir cuando finalice el experimento.
En este orden de ideas, se puede observar que se requiere una recolección de datos en
la fase inicial del experimento, en la fase pre-experimental y cuando finalice el estudio
como tal.
En este ejemplo hipotético, la variable que se va a medir es litros de leche por animal y
el peso, lo que se conoce como variable dependiente. La variable dependiente siempre
va hacer cuantitativa continua.
Los niveles del factor son los siguientes: (a) pastoreo más alimento concentrado y maíz
y (b) pastoreo más alimento concentrado y excretas de pollo. Entonces (a) y (b) son los
niveles del factor “Alimentación”, que es la variable independiente, la variable que
manipula el investigador y que siempre va hacer cualitativa.
Finalmente, para Rosselló & Fernández (1993), No se deben emplear ensayos con
menos de tres repeticiones o con más de diez, los valores más utilizados son entre
cuatro y seis.
Ventajas
i.- La estructura del análisis estadístico es simple.
ii.- Permite máxima flexibilidad en cuanto al número de tratamientos y número de
repeticiones.
iii.- La pérdida de observaciones durante la conducción del experimento no genera
dificultades en el análisis y en la interpretación de los resultados.
iv.- Reúne el mayor número de grados de libertad en el residuo, en comparación con
otros diseños.
Inconvenientes:
i.- Cuando el número de unidades experimentales es muy grande es difícil encontrar
lugares grandes que presenten la homogeneidad requerida.
ii.- Debido a que las fuentes de variación no asociadas a los tratamientos o a los niveles
del factor en estudio, están incluidas en el residuo como variación del azar, la buena
precisión de los análisis se ve comprometida.
Hipótesis
Ho: t = ti (todos los tratamientos producen el mismo efecto)
Ha: t ≠ ti para al menos un i; i= 1, 2, … t. (Al menos unos de los tratamientos produce un
efecto distinto)
Modelo estadístico
El modelo aditivo general es una expresión algébrica que condensa todos los factores
presentes en la investigación. Resulta útil para visualizar cuales factores son
independientes o dependientes, para este diseño el modelo aditivo es:
Yij= µ + ti + εij
ii.- La variable dependiente Y debe estar distribuida normalmente en cada nivel del
factor. ► Estadístico: Shapiro-Wilk (n≤50) o Kolmogorov-Smirnov (n>50). Según Cerón,
Galeano & Restrepo (2013, pág. 29).
iii.- La variable dependiente Y debe tener la misma varianza en cada nivel del factor. ►
Estadístico: Levene. Según Pedrozo & Dicovskyi (2006, pág. 58)
iv.- Los errores están normalmente distribuidos en cada nivel del factor. ► Estadístico:
Shapiro-Wilk (n≤50) o Kolmogorov-Smirnov (n>50). Según Cerón, Galeano & Restrepo
(2013, pág. 35).
v.- Los errores deben tener la misma varianza en cada nivel del factor. con media cero y
varianza constante. ► Estadístico: Levene. Según Cerón, Galeano & Restrepo (2013,
pág. 35).
vi.- Los errores son independientes entre sí. ► Estadístico: Rachas. Según Spiegel &
Stephens (2009, pág. 449)
Para Segura (2000, pág. 5), en los supuestos del Anova, los efectos del tratamiento y
los efectos ambientales son aditivos: la suma de cuadrados del tratamiento y la suma
de cuadrados del error es igual a la suma de cuadrados total.
El término error (ε ij) es la diferencia entre los valores de Y (Yi), y el estimado de Y (Ŷ).
En ese sentido, εij =(Yi – Ŷi).
Para Valdivia (2008, pág. 4), describe los ejemplos clásicos de un DCA
Xg =
∑x ij
, donde i es la fila y j es la columna (promedio general)
n
xj =
∑ xj , es el promedio aritmético del tratamiento (columna)
n
r c
SCT = ∑ ∑ (x ij − xg ) 2
i =1 i =1
SCE = ∑∑ ( xij − x j ) 2
Cuadrados medios
5.- Cuadrado medio total
SCT
CMT =
n −1
SCTr
CMTr =
c −1 ; c es el número de niveles del factor
SCE
CME =
n−c
CMTr
F=
CME
El Diseño en Bloques completos al Azar (DBA) toma en cuenta los tres principios
básicos de la experimentación: repetición, aleatorización y control local. En este diseño
las unidades experimentales se distribuyen en grupos homogéneos. Cada uno de estos
grupos es llamado: bloque. Este tipo de diseño se caracteriza porque el material
experimental presenta un factor de heterogeneidad definido, siendo necesario formar
grupos, clúster o bloques para que las unidades experimentales presentes dentro de
cada bloque sean homogéneas entre sí.
En experimentos agrícolas, los criterios de bloqueo para López & González (2014),
manifiestan que este diseño es conveniente cuando se logra determinar un gradiente de
variabilidad en un sentido, que esté influyendo sobre los tratamientos, por ejemplo:
grado de inclinación del terreno donde se realizará el experimento, dirección del viento,
gradiente de temperatura, gradiente de fertilidad, de luminosidad, altitud sobre el nivel
del mar, tipo de arado, variedad de planta, entre otros. Los bloques se construyen
perpendiculares a la dirección del gradiente de variabilidad.
Pérez (2005), el DBA corresponde a dos factores fijos sin interacciones en el que uno
de los dos factores corresponde a los bloques y el otro factor es el tratamiento. En ese
sentido, el número de unidades experimentales dentro de cada bloque es igual al
número de tratamientos incluidos en el experimento. Un caso particular de diseño de
Los tratamientos son distribuidos en las unidades experimentales dentro de cada bloque
aleatoriamente, así, cada bloque irá a constituir una repetición. Este tipo de experimento
es seleccionado cuando se tienen dudas acerca de la homogeneidad del ambiente o
cuando, por experiencia, se sabe de su heterogeneidad.
Hipótesis a evaluar
Ho: i= 1,2,…/ti=t (todos los tratamientos tienen el mismo efecto)
Ha: i= 1,2,…/ti≠t (al menos un tratamiento no tiene el mismo efecto)
Modelo estadístico
Yij= µ + ti + Bj + εij
Yij= variable de respuesta observada o media del i-ésimo tratamiento y el j-ésimo bloque
µ= media general de la variable respuesta
ti= efecto del i-ésimo tratamiento
Bi= efecto del j-ésimo bloque
εij= error asociado a la ij-ésima unidad experimental.
Se supone que los efectos de tratamientos y bloques son aditivos. La aditividad significa
que no hay interacción entre tratamientos y bloques. Es decir, la relación entre los
tratamientos es la misma en cada uno de los bloques.
ii.- La variable dependiente debe estar distribuida normalmente en cada nivel del factor
y niveles del bloque. ► Estadístico: Shapiro-Wilk (n≤50) o Kolmogorov-Smirnov (n>50).
Según Cerón, Galeano & Restrepo (2013, pág. 29).
iii.- La variable dependiente Y debe tener la misma varianza en cada nivel del factor y
en cada nivel del bloque. Según Pedrozo & Dicovskyi (2006, pág. 58)
Prof. Econ. Carlos M. Díaz N. Subproyecto Diseño Experimental Página 16 de 40
iv.- Los errores están normalmente distribuidos con media cero y varianza constante en
cada nivel del factor y en cada nivel del bloque. ► Estadístico: Shapiro-Wilk (n≤50) o
Kolmogorov-Smirnov (n>50). Según Cerón, Galeano & Restrepo (2013, pág. 35).
v.- Los errores son independientes entre sí. ► Estadístico: Rachas. Según Spiegel &
Stephens (2009, pág. 449).
vi.- No existe interacción entre bloque y tratamiento, lo que significa que un tratamiento
no debe modificar su acción (o efecto) por estar en uno u otro bloque. ►SPSS:
construcción del modelo sin interacción y efectos principales.
Para Segura (2000, pág. 5), en los supuestos del Anova, los efectos del tratamiento y
los efectos ambientales son aditivos: la suma de cuadrados del tratamiento y la suma
de cuadrados del error es igual a la suma de cuadrados total.
El término error (ε ij) es la diferencia entre los valores de Y (Yi), y el estimado de Y (Ŷ).
En ese sentido, εij =(Yi – Ŷi).
En este orden de ideas, los animales confinados, como: cerdos, aves y conejos, donde
determinada área de las galeras tienen mejor ventilación, se debe bloquear para
eliminar efectos de la ventilación. En otras palabras, se bloquea para eliminar el factor
perturbador y que no es de interés en la investigación.
Los horarios de alimentación fueron los siguientes: T1 06:00 – 12:00 – 18:00 T2 06:00 –
18:00 y T3 08:00 – 16:00 horas.
La hipótesis alternativa
ii.- Ha: µB ≠ µJ ≠ µCa≠µCR ≠ µS
Ha: no todas las medias son iguales
Ha: Al menos unos de los tratamientos producen un efecto distinto
Los diseños cuadrado latinos son una extensión lógica del diseño de bloques al azar y
poseen una serie de características muy similares, por tanto, se describen en su
conjunto. Para Castejón (2011), en los planes del investigador tiene como propósito la
variación del material experimental, a medida que este se hace más heterogéneo es
preciso controlar la variación bloqueando por cada característica que varíe. Es evidente,
que el diseño cuadrado latino lo que persigue es bloquear dos fuentes de variación
reconocidas por el investigador sobre las unidades experimentales. El investigador al
controlar estas dos fuentes de variación logra reducir la varianza del error posibilitando
la expresión de la diferencia entre los tratamientos.
En este orden de ideas, el diseño cuadrado latino se conoce también como diseño de
doble bloqueo, y se caracteriza porque el número de filas, columnas y tratamientos es
igual, formando un cuadrado perfecto. Adicionalmente, los tratamientos no se pueden
repetir al interior de la fila o de la columna, como se indica a continuación en un arreglo
de cuadrado latino con tres tratamientos:
Yijk= µ + Fi + Cj + tk + εijk
i= 1, 2, 3, …t
j= 1, 2, 3, …t h=c=t
k= 1, 2, 3, …t
Supuestos:
Bloque de
SCBC r-1 CMC= SCBC/r-1
Columna
Suma de cuadrados
∑ + & ∑'
∑ ,&
'&
Prosiguiendo con Continuado con Valdivia (2008, pág. 6), ejemplifica el DBA
Si son cuatro dietas sería cuatro períodos, en los cuales los tratamientos a
probar son utilizados por cada animal en diferentes períodos. En este caso,
los animales pueden ser utilizados como filas (primera fuente de variación) y
los períodos como columnas (segunda fuente de variación). Este tipo de
diseño se denomina cuadrado latino 4 x 4, pues son cuatro tratamientos y
cuatro períodos. El nombre lo reciben según el número de tratamientos que
deben siempre formar un cuadrado, si fuesen cinco tratamientos serían
cinco períodos por lo tanto, será un cuadrado latino 5 x 5.
El diseño factorial surge como la necesidad de evaluar de forma simultánea los efectos
que tienen varios factores sobre la variable dependiente, se utilizan experimentos
factoriales en los que todos los niveles de un factor se combinan con todos los niveles
de cualquier otro factor para formar los tratamientos. Así, en un experimento factorial de
tres factores A, B y C, con a, b y c niveles respectivamente, el número de tratamientos
es a×b×c.
Establecer inferencias sobre el efecto de un factor para los diferentes niveles de otros
factores, y sobre las relaciones entre ellos, es lo que diferencia principalmente a un
experimento factorial de varios experimentos de factor único en los que se incluyan los
diferentes tratamientos analizados. Comparativamente, el experimento factorial
presenta una mayor precisión y, por tanto, un considerable ahorro de tiempo y material
dedicado a los experimentos.
En este orden de ideas, en el Anova factorial existe una hipótesis nula por cada factor y
por cada posible combinación de factores. La hipótesis nula referida a cada factor
afirma que las medias de las poblaciones definidas por los niveles del factor son
iguales. Por otro lado, la hipótesis nula referida al efecto de una interacción afirma que
tal efecto es nulo.
Ventajas y desventajas
Para Benitez, Pece & de Galindez (2010), las ventajas y desventajas en el Anova
factorial se encuentran:
Supuestos
2 1
- '̅ . ,5 &
'̅ . ,5 &
Para aumentar el crecimiento de una planta o para aumentar el rendimiento de una fruta
o verdura, existen muchos factores que influyen directamente en el resultado, como
puede ser el tipo de riego, el nivel de fertilización, densidad de siembra, la aplicación de
hormonas, etc.
Igual sucede con los animales, si se desea el aumento de peso, se puede lograr
modificando algunos factores, como es las dietas, las hormonas, el manejo y otros.
Cada uno de los factores puede tener varios niveles, por ejemplo, la fertilización puede
ser 0.01, 0.05 o 0.1 kg por planta; igualmente el riego puede ser una lámina de 1, 2 o 3
cm.
Los diseños factoriales consisten en un análisis de varianza donde se van a probar dos
o más factores donde cada uno va a tener dos o más niveles. A cada factor se le
llamará factor A, B, C...etc, y los niveles de cada factor serán 0,1,2,3...
Una vez que se ha seleccionado el diseño, sea este DCA o DBA. Dependiendo del
objetivo de la investigación, a los tratamientos se les realizan arreglos en las unidades
experimentales. Es lo que se conoce como arreglos factoriales.
Por ejemplo:
Se quiere probar las respuesta en producción de maíz NB-6 y NBS a dos tipos de
fertilizantes nitrogenados urea y nitrato de amonio, utilizando cuatro niveles de
utilización., 0 kg. 50 kg, 100 kg, y 150 kg.
Puede ser que para este mismo estudio en otras condiciones se requiera remover un
efecto perturbador como puede ser el efecto de la pendiente o efecto de sombra o
cualquier otro efecto. En cualquiera de estos casos se realizará un DBA con arreglo
factorial, 2 x 2 x 4.
En caso de que no se tenga solo hembras o solo machos para hacer el ensayo y hay
una combinación de hembras y machos, entonces el diseño será un DBA (bloquear por
sexo) con arreglo factorial 3 x 2 x 4.
c. Reducir las fuentes de error, tanto del experimento como de aquellos errores o
equivocaciones operacionales. Es muy importante que en la selección de datos,
muestreo, entre otras., el personal responsable esté constituido por técnicos o personas
con entrenamiento.
En todos los diseños las unidades experimentales se clasifican por tratamientos; pero
en algunos, estos se clasifican preferentemente en bloques, filas, parcelas principales y
otras modalidades.
Esta técnica tiene como objetivo identificar la importancia de los diferentes factores o
tratamientos en estudio y determinar cómo interactúan entre sí.
Cuando una prueba F indica que el cuadrado medio de una de las fuentes de variación
es significativamente mayor que el cuadrado medio debido a efectos aleatorios,
decimos que existen diferencias reales entre las medias de aquella fuente particular de
variación; pero, recuérdese: siempre existe una probabilidad definida de que estemos
equivocados en semejante conclusión. Está en manos del experimentador seleccionar
las probabilidades para las cuales se encuentra dispuesto a concluir que existen efectos
reales.
Es frecuente descubrir los resultados que cabría esperar con una probabilidad del 5% o
menor como significativos y aquellos esperados con un 1% o menor como altamente
significativos. Cuando un experimentador aplica la frase “los tratamientos son
significativamente diferentes”, realmente está diciendo que si la hipótesis nula es
verdadera, las probabilidades de obtener tales diferencias de medias del tratamiento
son sólo de un 5%. Está afirmando que no hubo tal probabilidad de ocurrencia en su
experimento y que, por tanto, el resultado significativo se debió a un efecto real del
tratamiento.
Hipótesis estadística
Es el supuesto que se hace sobre el valor de un parámetro (constante que caracteriza a
una población) el cual puede ser validado mediante una prueba estadística. En la
investigación agraria al realizar un análisis estadístico utilizando el ANOVA de un diseño
experimental, la hipótesis a probar es si los tratamientos tienen el mismo efecto sobre la
variable que se estudia, es así como se tienen las hipótesis nula (Ho) e hipótesis
alterna (Ha):
Error Tipo I: Se comete cuando se rechaza la hipótesis que se plantea, siendo esta
hipótesis falsa; la magnitud de este error es fijado por el investigador y constituye el
“nivel de significación de la prueba”; usualmente los valores usados como nivel de
significación son 0.05 ó 0.01.
Error tipo II: Se comete cuando no se rechaza la hipótesis que se plantea, siendo esta
hipótesis falsa; la magnitud de este error no se puede fijar, pero si es posible minimizar
utilizando un tamaño adecuado de muestra.
a. Aditividad: Los factores o componentes del modelo estadístico son aditivos, es decir
la variable respuesta es la suma de los efectos del modelo estadístico.
b. Linealidad: La relación existente entre los factores o componentes del modelo
estadístico es del tipo lineal.
c. Normalidad: Las observaciones del experimento provienen de una distribución de
probabilidad «Normal» con media µ y variancia σ2.
e. Variancias Homogéneas (Homocedasticidad): Las diversas poblaciones generadas
por la aplicación de dos o más tratamientos tienen variancias homogéneas (variancia
común).
d. Los residuos del modelo se distribuyen como una Normal con media cero y varianza
constante. Así mismo, los residuos son independientes.
Según Pardo & Ruiz (2002), la selección de los tratamientos y otros factores se tiene la
siguiente clasificación: