Manual de Diseño Experimental

Manual de Diseño Experimental
El presente manual contiene:
- Definiciones claves analizadas en clases

- Información resumida de los distintos diseños vistos en clases.
- Guía de ejercicios para el certamen 3
I) Definiciones claves
- Un valor p < 0,05 indica que en menos de 5 veces de cada 100 que repitiéramos el mismo estudio,
nuestro resultado se debería al AZAR.
- Cuanto mayor sea la p (p > 0,1) más fuerte y segura será la evidencia a favor de la hipótesis nula
(igualdad).
- Variables CUALITATIVAS: Representan una cualidad o atributo que clasifica a cada

individuo en una de varias categorías. Pueden ser de dos tipos:
- Dicotómicas o binarias: La situación más sencilla es aquella en la que se clasifica
cada individuo en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no
fumador).
- Policotómicas: Es necesario un mayor número de categorías (color de los ojos,
grupo sanguíneo, profesión, etcétera).
-Escalas nominales: Variables NOMINALES: ésta es una forma de observar o medir
en la que los datos se ajustan por categorías que no mantienen una relación de orden
entre sí.
- Sexo.
- Grupo sanguíneo.
- Presencia o ausencia de una enfermedad.
- Presencia o ausencia de un factor de riesgo.
-Escalas ordinales: Variables ORDINALES: En las escalas utilizadas para medirlas
existe un cierto orden, grado o jerarquía entre las categorías.
- Grado de disnea.
- Grado de dolor.
- Intensidad del hábito tabáquico.
- Tipo de fumador.
- Variables CUANTITATIVAS: Son aquellas que pueden medirse, cuantificarse o

expresarse numéricamente. Pueden ser de dos tipos:
- Continuas: Son aquellas que si admiten tomar cualquier valor dentro de un rango
numérico determinado, con uno o varios decimales (peso, talla, edad).
- Discretas: Son aquellas que NO admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (número de hijos, abortos, partos,
hermanos).
ANÁLISIS DE VARIANZA
- El análisis de varianza se usa para probar las diferencias entre varias medias poblacionales.
- La hipótesis nula (H0) es que las diversas medias poblacionales son mutuamente iguales.
- El procedimiento de muestreo empleado consiste en la recolección de varias muestras

aleatorias independientes, una para cada categoría de datos (niveles de tratamiento).
- El supuesto en el que se basa el uso del análisis de varianza es que las diversas medias
muestrales se obtuvieron de poblaciones con distribución normal y con la misma varianza σ 2
Descripción:
El análisis de varianza o ANOVA (del inglés ANalysis Of VAriance) es una técnica paramétrica
utilizada cuando hay más de dos grupos independientes. Se trata de un método para comparar
medias, no varianzas como su nombre podría sugerir. Su hipótesis nula (H0) establece la igualdad
entre las medias de los a grupos o poblaciones (μ1 = μ2 =…=μa), mientras que la hipótesis
alternativa (H1) establece que al menos una de las medias es distinta. El análisis se completa
cuando se acepta la hipótesis H0, es decir, no hay diferencias entre grupos. En cambio, cuando se
rechaza H0, se sabe que hay diferencias entre grupos, pero para conocer en concreto cuáles son
esas diferencias es necesario continuar con los procedimientos de separación de medias y
contrastes.
El razonamiento básico que sirve de fundamento al análisis de varianza fue originalmente
desarrollado por el experto en estadística inglés Ronald Fisher, en honor de quien la distribución F
lleva ese nombre
¿Qué significa en términos estadísticos que una prueba sea sensible a normalidad u homogeneidad
de varianza?.
Significa que si realizamos una ANOVA con datos que presentan varianzas heterogéneas o falta de
normalidad, no podemos estar seguro en el Error tipo 1, es decir, rechazar la hipótesis nula cuando
es verdadera o cierta.
Esquema para un análisis de Varianza
Existen dos situaciones:
 Sí el número de grupos o tratamientos son dos, utilizar el test de t de Student.

 Si éxisten tres o más grupos (Tratamientos) utilizar el análisis de Varianza.
Si la variable de interés es discreta (medida en escala ordinal), se utiliza ANOVA NO
PARAMÉTRICO de Kruskal-Wallis (cuando existen sólo tratamientos) y Friedman (cuando existen
Bloques y tratamientos).
Si la variable de interés es continua (Medida en escala de intervalo o de razón), se utiliza el ANOVA
PARAMETRICO, para ello se comprueban los supuestos (homogenidad de varianza y normalidad),
si al menos uno no se cumple, se deben usar transformaciones, el ANOVA No paaramétrico, y si se
cumple utilizar el Anova Parametrico.
DISEÑOS ESTADÍSTICOS NO PARAMÉTRICOS
Pruebas NO paramétricas: Requisitos

- Las variables cuantitativas pueden ser ordinales o discretas.
- Los datos siguen una distribución libre (no necesariamente normal), uno de los
grupos puede tener una distribución normal mientras que el otro no.
- Los datos numéricos se expresan con la mediana y los intervalos intercuartílicos.
- Heterogeneidad de las varianzas muestrales (en uno o más de un grupo).
- Tamaño muestral < 30.
- Presentan un menor poder estadístico que los tests paramétricos.
- Trabajan con la simple ordenación y recuento (asignando rankings) a los valores de
la variable sin importar el tipo distribución.
Principales pruebas NO paramétricas

- Chi cuadrado de Pearson.
- Test exacto de Fisher.
- Chi cuadrado de Mc Nemar.
- Q de Cochran.
- U de Mann Whitney.
- Wilcoxon.
- Kruskall Wallis.
- Friedman.
El independizarse de la forma de la población llevó a estos modelos a otras aplicaciones no clásicas

, como en las ciencias de la conducta, marketing, ciencias sociales, etc. En algunas técnicas, como
la prueba de rango u orden se pueden asignar valores. Por ejemplo asignar rangos por textura,
coloración,sabor, olor, clasificar por infección.
Cuando se comparan dos muestras, se hace hincapié en la comparación de medianas.
1.- TEST DE KRUSKAL –WALLIS (DISEÑO AL AZAR)

Descripción:
Esta prueba, conocida como análisis de varianza unifactorial por rangos. Parte del supuesto de que
los datos provienen de muestras aletorias independientes, dentro y entre las muestras.Se utiliza para
probar si k muestras independientes, no necesariamente del mismo tamaño, provienen de la misma
población o de poblaciones con igual distribución. Es el procedimiento alternativo a la prueba F del
análisis de varianza. La variable de interés está medida al menos en escala ordinal.
Ventajas:
-Sencillo de usar.
-Sirve para probar si un grupo de datos proviene de la misma población.
-Puede comparar tres o más poblaciones.
-Realizar este modelo equivale a un análisis de varianza de una sola vía.
-No requiere supuesto de normalidad.
-No requiere supuesto de varianzas iguales (homogeneidad de varianzas).
Desventajas:
-A menudo no son tan eficientes o claras como las pruebas paramétricas.
-Ignoran cierta cantidad de información.
Hipótesis:
H0: Las funciones de distribución de cada muestra son idénticas (tienen igual mediana)
H1: No todas las poblaciones tienen la misma mediana
Procedimiento:
1) Se ordenan todas las observaciones en sentido creciente y se reemplaza por un rango
Rit, i = 1…,i, t = 1,…ni, en una muestra conjunta ordenada.
2) En caso de empates se asigna a cada una de las observaciones empatadas el rango promedio de
todas ellas.
3) Se suman entonces, los rangos de las observaciones procedentes del i-ésimo tratamiento,
4) Estadístico de contraste es:

𝟏𝟐 𝑹𝟐𝒊
∑ − 𝟑(𝒏 + 𝟏)
𝒏(𝒏 + 𝟏) 𝒏𝒊
Donde :
n= n° total de observaciones
𝑛𝑖 = n° de observaciones, para la i-ésima muestra o tratamiento.
𝑅𝑖2 =Suma de rangos al cuadrado, correspondiente a la i-ésima muestra.
Decisión:
Cuando los tamaños muestrales 𝑛𝑖 son razonablemente grandes (𝑛𝑖 > 5), H tiene una distribución
aprox. 𝑋 2 con k-1 grados de libertad bajo la hipótesis nula.
El criterio es entonces rechazar 𝐻0 a un nivel de significación α siempre que:

2
𝐻0 , si H>𝑋(𝛼);(𝑘−1)
2. Test de FRIEDMAN (Diseño en Bloques al Azar)

El Test de FRIEDMAN es la alternativa Paramétrica al Análisis de Varianza a 2-vías , cuando se
tiene tratamientos y Bloque.
Ventajas:
 Cuando es posible hacer solamente supuestos débiles acerca de la naturaleza de la

distribución.
 A veces, sólo será posible poco más que categorizar los datos por falta de una escala de
medición adecuada.
 Cuando es posible asignar rangos a los datos.
Supuestos:
-Los datos consisten en “b” bloques (repeticiones) mutuamente independientes.
-La variable de interés es al menos ordianal.
-No existe interacción entre los bloques(repeticiones) y tratamientos
-Las observaciones dentro de cada bloque pueden ranguearse (rango) en orden de magnitud.
Hipótesis:
H0: Las “t” tratamientos tienen los mismos efectos
H1: Al menos uno de los tratamientos tiene un efecto diferente.
Dócima:
𝑡
2
12
𝑋𝑓= ∑ 𝑟𝑖2 − 3𝑏(𝑡 + 1)
𝑏𝑡(𝑡 + 1)
𝑖=1
Dónde:
b= n°de bloques o repeticiones
t=n° de tratamientos
𝑟𝑖2 =Rangos al cuadrado, para cada tratamiento i.
Decisión:
2 2
Rechazar 𝐻0 , sí 𝑋𝑓= > 𝑋(𝑡−1)(1−𝛼)
DISEÑOS ESTADÍSTICOS PARAMÉTRICOS
Pruebas paramétricas: Requisitos

En la estadística paramétrica se asume que la población de la cual la muestra es extraída es
aprox. normal.
- Las variables cuantitativas tienen que ser continuas.
- Los datos siguen una distribución normal.
- Los datos numéricos se expresan con la media y la desviación estándar o el EEM
- Homogeneidad de las varianzas muestrales.
- Tamaño muestral > 30.
- Presentan un mayor poder de contraste que los tests no paramétricos, y pueden analizar interacciones
entre variables predictoras.
- Cuando se dan las condiciones de aplicación, las pruebas paramétricas tienen más potencia que las no
paramétricas, pero, cuando esto no es así, el riesgo alfa puede ser mayor que el especificado de antemano.
 La elección del diseño depende de la habilidad del investigador para identificar y controlar las
fuentes de variación (Localidad, bloques, tratamientos, etc.)
A continuación se presenta una breve descripción de los diseños de efectos fijos.
1. Diseño al Azar (DA)

Descripción: El diseño al azar es útil cuando las parcelas o unidades experimentales son
esencialmente homogéneas o la variación entre ellas es muy pequeña y al agruparlas en
bloques no aumenta la precisión de la prueba y los efectos ambientales no son fuente de
variación, es decir, están controlados.
 El experimentador asigna las unidades experimentales a los tratamientos al azar

 Sólo con unidades experimentales Homogéneas (laboratorio, invernadero), gl < 20
El modelo estadístico de éste diseño tiene la forma: Respuesta= efecto medio ensayo +
efecto tratamiento + error
Ventajas:
 Flexibilidad: el número de tratamientos y repeticiones está limitado sólo por el

número de unidades experimentales disponibles (árboles, plantas, etc).
 Simplicidad
 La pérdida de información debido a la pérdida de datos es pequeña,
 Fácil de instalar
Desventajas:
 Ineficiencia. El error experimental incluye toda la variación de las unidades

experimentales, excepto la debida a los tratamientos.
 Restringida a condiciones de sitio homogéneos. Sólo donde se pueda controlar el
error experimental (laboratorios, invernaderos) no en campo.
 No se puede utilizar cuando el número de tratamientos es muy grande
El modelo para un diseño al azar es el siguiente:
𝒀𝒊𝒋 = µ + ƫ𝒊 + 𝒆𝒊𝒋 ; Dónde
Yij = Variable respuesta, correspondiente j-ésima observación del i-ésimo tratamiento
µ = Es una constante común en todos los tratamientos, y corresponde al efecto medio del ensayo.
ƫi = efecto del i-ésimo tratamiento. Recoge la importancia de cada tratamiento

eij = es el error aleatorio, para la j-ésima observación del i-ésimo tratamiento.
El error se distribuye eij ~N (0, 𝜎 2 ). eij es la parte de la variable de 𝑌𝑖𝑗 no explicada por µ ni por ƫi, y
que se distribuye del mismo modo ( aunque independientemente) para cada observación, se
distribuye normal con media cero y varianza constante eij ~N (0, 𝜎 2 ).Esta es la condición de
homocedasticidad, y es fundamental en el análisis de varianza.
“Si mediante los contrastes estadísticos adecuados la variación producida por cierto factor es
significativamente mayor que la producida por el error experimental podemos aceptar la hipótesis de
que los distintos niveles del factor actúan de forma distinta.
Hipótesis para éste diseño es:
H0: µ1= µ2= µ3=… µi

H1: µi≠ µj
o equivalentemente, en términos de los efectos de tratamientos:
H0: ƫ1= ƫ2= ƫ3=… ƫi

H1: ƫ1≠ 0 , por lo menos para algún i
Es decir, H0 las medias entre los tratamientos son iguales y H1 las medias de los tratamientos son
distintos.
Las tablas del análisis de varianza con igual número de observaciones (Tabla 8) y distinto número de
observaciones por tratamiento son (Tabla x):
Fuente de Grados de Suma de Cuadrados Valor F P- Valor

Variación Libertad cuadrados medios
Tratamientos (a-1) S1 M1=S1/(a-1) F = M1/ M2
Error a (n-1) S2 M2=S2/a(n-1)

experimental
Total an-1
corregido
Decisión:
1.- Según el P-Valor
Se rechaza la hipótesis H0 si P-valor < 𝛼
2. Diseño en Bloques al azar (DBA)
Descripción: En este diseño el experimentador agrupa las unidades experimentales en bloques, a

continuación determina la distribución de los tratamientos en cada bloque y, por último, asigna al
azar las unidades experimentales a los tratamientos dentro de cada bloque.
Los bloques son considerados completos debido a que cada uno contiene todos los tratamientos, el
número de unidades en un grupo (bloque) es igual al número de tratamientos.
El objetivo del agrupamiento es tener las unidades en un bloque tan uniformes como sea posible, de
tal forma, que las diferencias observadas sean fundamentalmente, debidas a los tratamientos.
Mediante el establecimiento de bloques, la precisión del diseño aumenta, como resultado de un
mayor control del error experimental. La variabilidad (suelos) entre unidades en el mismo bloque
debe ser mínima. La variabilidad entre bloques no afecta las diferencias entre las medias de los
tratamientos, ya que en cada bloque aparece un mimo número de veces cada tratamiento.
En el análisis estadístico de un diseño en bloques, éstos se tartan como los niveles de único factor
de bloqueo.
El modelo estadístico de éste diseño es:
Respuesta= efecto medio+ efecto Bloque + efecto tratamiento + error.
Los diseños en bloques, al igual que el DAS, pueden ser completos, cuando el número de observaciones es
igual en todos los tratamientos, e incompletos cuando existe un número diferente de observaciones por
tratamiento.
Ventajas:
 Mayor precisión que el diseño completo al azar, por agrupar las unidades en bloques,
cuando existe variabilidad del suelo.
 No hay restricción en el número de tratamientos o de bloques
 Si por alguna razón los datos se pierden, estos datos se eliminan sin complicar el análisis
estadístico. Incluso se puede eliminar el bloque completo.
Desventajas:
 Cuando la variación entre unidades experimentales dentro del bloque es grande, aumentará
el valor de este componente.
Se recomienda como máximo un tamaño de bloque de 2.500 m2
El modelo estadístico para DBA
Yij     i   j   ij
Dónde:
Yij = Es la variable respuesta, corresponde al K-ésima observación en el j-ésimo bloque del i-ésimo
tratamiento.
µ= Promedio experimental
ƫi= Efecto del i-ésimo tratamiento
βj = Efecto de la repetición (bloque), o del j-ésimo bloque
eijk= Efecto del error, de la k-esima observación en el j-ésimo bloque del i-ésimo tratamiento. El error
se distribuye eij ~N (0, 𝜎 2 ).
El nuevo término βj, que corresponde a la variabilidad atribuida al bloque, con lo que el término eijk
corresponde a la variabilidad no explicada, entonces prueba más eficiente.
Hipótesis
En éste caso existirán 2 hipótesis:
i) Para los tratamientos:
H0: µƫ1= µƫ2= µƫ3=… µƫi

H1: µƫ1≠ 0 , por lo menos para algún i
ii) Para los bloques
H0: µB1= µB2= µB3=… µBb

H1:µbi≠µbj, por lo menos para algún bij
distintos, o por lo menos para alguno de ellos.
La Tabla ANOVA: Análisis de varianza, Modelo: Diseño en bloques al azar
Grados P-valor
Suma de cuadrados Cuadrados Cociente
Fuente de variación de
(SC) medios (CM) F
libertad (gl)
Entre grupos de
k
Tk2 T 2 SCA CMA
tratamientos (A)
K–1 SCA    CMA 
K 1
F
CME
k 1 N k N
Entre grupos de 1 j
T2
SCB   T j2 
SCB CMB
tratamientos J–1 CMB  F
o bloques (B) K j 1 N J 1 CME
Error de muestreo SSE
N–K SCE  SCT  SCA  SCB CME 
J  1K  1
(E)
j k
T2
Total (T) N–1 SCT   X 2 
j 1 k 1 N
En éste diseño aleatorizado por bloques disponemos de dos valores de F para contrastar: uno
relativo a la influencia del tratamiento y otro a la influencia del bloque; aunque de entrada se supone
que el bloque sí que influye en la variable medida y precisamente por eso acudimos a éste tipo de
diseño.
Decisión:
3.- Diseño Factorial (DF)

Descripción: Los diseños factoriales son aquellos en el que el conjunto de tratamientos consiste en
todas las combinaciones posibles de los niveles de varios factores.
En algunas ocasiones se está interesado en estudiar la influencia de dos (o más) factores

tratamientos. En este modelo es importante estudiar la posible interacción entre dos o más factores.
Los experimentos factoriales se utilizan en prácticamente en todos los campos de la investigación.

Son de gran valor en el trabajo exploratorio cuando se sabe poco sobre niveles óptimos de los
factores, o ni siquiera cuáles son importantes.
El modelo estadístico para dos factores (sin bloque) es:
Respuesta = efecto medio +efecto factor 1+efecto factor 2+efecto factor 1x efecto factor 2+ error.
La generalización de los modelos factoriales para 3 o más factores es relativamente sencillo desde
el punto de vista estadísctico, pero en su aspecto práctico tiene el inconveniente de que al aumentar
el número de factores aumenta rápidamente el número de observaciones para estimar el modelo.
Además se generan interacciones difíciles de abordar cuando no se tiene la expertise necesaria.
El modelo estadístico para 3 factores (sin bloque) es:
Respuesta= efecto medio+ F1+ F2+F3+F1xF2+F1xF2+F1xF3+F2xF3+F1xF2xF3 +Error
El modelo estadístico para 3 factores (con bloque) es:
Respuesta= efecto medio+ efecto bloque+F1+ F2+F3+F1xF2+F1xF2+F1xF3+F2xF3+F1xF2xF3

+Error. Donde F es el Factor.
 En innumerables investigaciones se ha observado que el investigador utiliza más de 3
factores en problemas en los que hay muchos factores que pueden influir en la variable
interés. La utilización de experimentos en estos problemas tiene el gran inconveniente de
necesitar un número elevado de observaciones, además puede una estrategia ineficaz
porque, por lo general, mucho de los factores en estudio no son influyentes y mucha
información recogida no es relevante. ¿Qué hacer en éstos casos? Mejor utilizar una técnica
secuencial donde se comienza por trabajar con unos pocos factores y según los resultados
que se obtienen se eligen los factores a estudiar en la segunda etapa.
 El concepto de Interacción es de gran utilidad para los estadísticos. Cuando el efecto de
ambos factores actuando en conjunto es mayor que el que tienen por separado, se dice que
hay sinergia, una especie de interacción positiva, lo contrario sería interferencia, cuando el
efecto en conjunto es menor.
Ventajas:
 Permiten detectar la existencia de efectos interacción entre los diferentes factores
tratamiento.
 Es una estrategia más eficiente que la estrategia clásica de examinar la influencia de un
factor manteniendo constante el resto de los factores.
Desventajas:
 Se requiere un número mayor de tratamientos

 Se requiere un número mayor de unidades experimentales.
DISEÑO PARA UN FACTORIAL DE 2 FACTORES
Modelo estadístico
γijk = µ + ƫi + βj + (ƫβ)ij + eij
γijk = Es la variable respuesta, corresponde al k-ésima observación en el j-ésimo nivel del factor B
por el i-esimo nivel del Factor A..
µ = Media Población.
ƫi = Efecto de i-ésimo nivel del Factor A
βj = Es el efecto de j-ésima nivel del factor B
ƫβij = Efecto AxB, interacción, del efecto del i-ésimo nivel del factor A por el j-ésimo nivel factor B.
eijk= Efecto del error, de la k-esima observación en el j-ésimo nivel del factor A por el i-ésimo nivel
del factor A. El error se distribuye eijk ~N (0, 𝜎 2 ).
Hipótesis
Para Factor 1: H0: µƫ1= µƫ2= µƫ3=… µƫi

H1: µƫi≠ µƫj , por lo menos para algún i
Factor 2:

H1:µbi≠µbj,
Para la interacción: H0: µƫ1β1= µƫ1B2=… µƫaβb

H1:µƫiβj≠µƫiβj
Análisis de varianza, Modelo: diseño factorial de 2 factores.
Grados
Fuente de Suma de cuadrados Cuadrados
de Cociente F
variación (SC) medios (CM)
libertad (gl)
CMA
Entre grupos de K–1 k
Tk2 T 2 CMA 
SCA F
tratamientos (A) SCA    K 1 CME
k 1 n j N
Entre grupos de
CMB
tratamientos j
T2 T j2 CMB 
SCB F
J–1 SCB    J 1 CME
j 1 nK N
o bloques (B)
Interacción
(entre) (J – 1) CMI
CSI
F
2
1 j k  n  T2 SMI 
SCI     X   SCA  SCB 
n j 1 k 1  i 1 
J  1K  1 CME
Factores (K – 1) N
(A y B)(I)
SSE
Error de muestreo CME 
(E)
JK(n – 1) JK n  1
SCE  SCT  SCA  SCB  SCI
n j k
T2
Total (T) N–1 SCT    X 2 
i 1 j 1 k 1 N
Decisión:
DISEÑO PARA UN FACTORIAL DE 2 FACTORES
Modelo estadístico
γijkl = µ + ƫi + βj + δk+(ƫβ)ij +(ƫδ)ik+(ƫβδ)ijk +eijkl

γijk = Es la variable respuesta, corresponde al l-ésimo observación en el k-ésimo nivel del factor C
por el j-ésimo nivel del Factor B por el i-ésimo nivel del factor A.
µ = Media Población.
ƫi = Efecto de i-ésimo nivel del Factor A
βj = Es el efecto de j-ésima nivel del factor B
δk = Es el efecto de j-ésima nivel del factor C
ƫβij =Es la interacción, del efecto del i-ésimo nivel del factor A por el j-ésimo nivel del factor B.
ƫδik = Es la interacción, del efecto del i-ésimo nivel del factor A por el k-ésimo nivel del factor C.
βδjk= Es la interacción, del efecto del j-ésimo nivel del factor B por el k-ésimo nivel del factor C.
ƫβδijk = Es la interacción, del efecto del i-ésimo nivel del factor A por el j-ésimo nivel factor B por el k-
ésimo nivel del factor C.
eijk= Efecto del error, error aleatorio de la I-ésima de la k-esima observación en el j-ésimo nivel del
factor C por el i-ésimo nivel del factor A. El error se distribuye eijk ~N (0, 𝜎 2 ).
Donde i = 1,…, a; j = 1,…, b; K =1,…, c: i =1,…, (n=número de observaciones).
Hipótesis
Para Factor 1: H0: µƫ1= µƫ2= µƫ3=… µƫi

H1: µƫi≠ µƫj , por lo menos para algún i
Factor 2:

H1:µbi≠µbj,
Factor 3 H0: µδ1= µ δ2=… µ δc
H1:µ δi≠µ δj
Interacción 1 H0: µƫ1β1= µƫ1B2=… µƫaβb
Interacción 2 H0: µƫ1δ1= µƫ1δ2=… µƫaδc
H1:µƫiδj≠µƫiδj
Interacción 3 H0: µβ1δ1= µβ1δ2=… µβbδc

H1:µβiδj≠µβiδj
Interacción 3 H0: µƫ1β1δ1= µ ƫ1β1δ2=…= µ ƫaβbδc

H1:µ ƫiβiδj≠µ ƫiβiδj
Análisis de varianza, Modelo: diseño factorial de 3factores.
Grados
Fuente de Suma de cuadrados Cuadrados
de Cociente F
variación (SC) medios (CM)
libertad (gl)
CMA
a– 1 k
Tk2 T 2 CMA 
SCA F
Factor (A) SCA    K 1 CME
k 1 n j N
CMB
j
T2 T j2 CMB 
SCB F
Factor (B) b–1 SCB    J 1 CME
j 1 nK N
i
Ti 2 T 2 CMC
Factor (c) (c-1) SCC    CMB 
SCB F
K 1 n K N i 1 CME
Interacción
(entre) (a – 1) CMI
CSI
F
2
1 j k  n  T2 SMI 
SCI     X   SCA  SCB 
n j 1 k 1  i 1 
J  1K  1 CME
Factores (b – 1) N
(A y B)(I)
AC (a-1)(c-1) S5* M5=S5/(a-1)(c-1) F= M5/CME
BC (b-1)(c-1) S6* M6=S6/(b-1)(c-1) F= M6/CME
(a-1)(b-1)(c- M5=S7/(a-1)(b-
ABC S7* F= M7/CME
1) 1)(c-1)
SSE
Error de muestreo CME 
(E)
abc(n – 1) JK n  1
SCE  SCT  SCA  SCB  SCI
n j k
T2
Total (T) Abcn- 1 SCT    X 2 
i 1 j 1 k 1 N
*formulas abreviadas.
Decisión:
Diseño Parcelas Divididas (DPD)

Descripción: Los diseños de parcelas divididas se utilizan en experimentos factoriales.
Principio básico es el siguiente: Las parcelas o unidades completas, a las cuales se les aplican
niveles de uno o más factores se dividen en subparcelas o subunidades a las cuales se les aplican
niveles de uno o más factores adicionales. De éste modo cada unidad completa se convierte en un
bloque para los tratamientos de subunidades.
Por ejemplo, considérese un experimento para probar el factor A con cuatro niveles en tres bloques
de un diseño de bloques al azar (DBA). Un segundo factor B, con dos niveles, puede superponerse
mediante la división de cada unidad del factor A en dos subunidades, y asignando los dos
tratamientos B a esas subunidades. Aquí las dos unidades A son las unidades completas (parcela
principal) y las unidades B son las subunidades (parcelas secundarias).
Ejemplo. Consideremos un experimento donde:
 Factor A (Poda en %), niveles: 0%, 20%, 40 %, 60 %.

 Factor B( Raleo), niveles: 800 árb/ha, 1200 árb/ha
PARCELA PRINCIPAL
Bloque 1
A4B2 A1B2 A2B1 A3B1

A4B1 A1B1 A2B2 A3B2
PARCELA SECUNDARIA
Aquí la aleatorización es en dos etapas. Primero aleatorizamos niveles del factor A en las unidades
completas; luego aleatorizamos niveles del factor B en las subunidades.
Modelos Estadísticos:
1) Diseño de Parcelas Divididas en un Diseño Completo al Azar. Dado que en este diseño la
aleatorización se realiza en dos etapas, el modelo aditivo lineal tendrá dos fuentes de error, una
desde las unidades completas y otra desde las subunidades.
En el caso de que los niveles del factor que va en las unidades completas se distribuyen
según un diseño completo al azar, el modelo aditivo lineal estará dado por:
Yijk = µ + αi +γij+βk+(σβ)ik+εijk
Dónde:
Yijk es el valor o rendimiento observado con el i-ésimo nivel del factor A, j-ésima repetición, y k-
ésimo nivel del factor B.
µ es el efecto de la media general.
αi es el efecto del i-ésimo nivel del factor A.
γij es el efecto del error experimental en parcelas (Error A).
βk es el efecto del K-ésimo nivel del factor B.
(σβ)ik es el efecto de la interacción del i-ésimo nivel del factor A y el k-ésimo nivel del factor B.
εijk es el efecto del error experimental en subparcelas (Error B).
Modelos: Diseño de Parcelas Divididas en un Diseño Completo al Azar
FactorA\FactorA>Bloque
FactorA>Bloque
FactorB
FactorB*FactorA
2) Diseño de Parcelas Divididas en un Diseño en bloques Completos al Azar.
Yijk = µ + αi + ρj + γij+βk+ (σβ) ik+εijk
Dónde:
ρj es el efecto del j-ésimo bloque
j= 1,…r (r = número bloques)
Supuestos: Se asume que tanto γij y εijk están normal e independientemente distribuidos con
media cero y varianza igual a 1.
Hipótesis:
Las hipótesis son, en términos de los efectos de los niveles de los factores las siguientes:
Para el efecto de A:
Ho: αi =0
H1: αi≠0 para al menos alguna i
Para el efecto de B:
Ho: βk =0
H1: βk i≠0 para al menos alguna k
Para el efecto de la interacción AB:
Ho: (σβ) ik =0
H1: (σβ) ik i≠0 para al menos alguna i,k
Tabla A. Análisis de varianza, Modelo de Parcelas divididas en un diseño en bloques completos al

azar.
Fuente de Grados de Suma de Cuadrados FC
Variación Libertad Cuadrados (SC) Medios (CM)
(gl)
Bloques r-1 SC(Bloques) 𝑆𝐶(𝐵𝑙𝑜𝑞𝑢𝑒𝑠) 𝐶𝑀(𝐴)
𝐺𝑙 (𝐵𝑙𝑜𝑞𝑢𝑒𝑠) 𝐸𝑎
A p-1 SC(A) 𝑆𝐶(𝐴)
𝐺𝑙(𝐴)
Error (a) (r-1)(p-1) SC(Error(a)) 𝑆𝐶(𝐸𝑟𝑟𝑜𝑟(𝑎))
𝑔𝑙(𝐸𝑟𝑟𝑜𝑟(𝑎))
Total Pr-1 SC(total Unid.)
Unidades
B q-1 SC(B) 𝑆𝐶(𝐵) 𝐶𝑀(𝐵)
𝐺𝑙(𝐵) 𝐸𝑏
AB (p-1)( q-1) SC(AB) 𝑆𝐶(𝐴𝐵) 𝐶𝑀(𝐴𝐵)
𝐺𝑙(𝐴𝐵) 𝐸𝑏
Error(b) P(q-1)(r-1) SC(Error (b))
Total
Subunidades Pqr-1 SC (Total subunid.)
Decisión:
Modelos: DPD Bloques al azar
Bloque\FactorA*Bloque
FactorA\FactorA*Bloque
FactorA*Bloque
FactorB
FactorB*FactorA

Manual de Diseño Experimental

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Manual de Diseño Experimental

Încărcat de

Drepturi de autor:

Formate disponibile

Manual de Diseño Experimental

El presente manual contiene:

- Definiciones claves analizadas en clases

- Variables CUALITATIVAS: Representan una cualidad o atributo que clasifica a cada

- Variables CUANTITATIVAS: Son aquellas que pueden medirse, cuantificarse o

- El procedimiento de muestreo empleado consiste en la recolección de varias muestras

Esquema para un análisis de Varianza

Existen dos situaciones:

 Sí el número de grupos o tratamientos son dos, utilizar el test de t de Student.

DISEÑOS ESTADÍSTICOS NO PARAMÉTRICOS

Pruebas NO paramétricas: Requisitos

Principales pruebas NO paramétricas

El independizarse de la forma de la población llevó a estos modelos a otras aplicaciones no clásicas

Cuando se comparan dos muestras, se hace hincapié en la comparación de medianas.

1.- TEST DE KRUSKAL –WALLIS (DISEÑO AL AZAR)

-A menudo no son tan eficientes o claras como las pruebas paramétricas.

-Ignoran cierta cantidad de información.

H1: No todas las poblaciones tienen la misma mediana

1) Se ordenan todas las observaciones en sentido creciente y se reemplaza por un rango

Rit, i = 1…,i, t = 1,…ni, en una muestra conjunta ordenada.

4) Estadístico de contraste es:

𝑛𝑖 = n° de observaciones, para la i-ésima muestra o tratamiento.

𝑅𝑖2 =Suma de rangos al cuadrado, correspondiente a la i-ésima muestra.

El criterio es entonces rechazar 𝐻0 a un nivel de significación α siempre que:

2. Test de FRIEDMAN (Diseño en Bloques al Azar)

 Cuando es posible hacer solamente supuestos débiles acerca de la naturaleza de la

-Los datos consisten en “b” bloques (repeticiones) mutuamente independientes.

-La variable de interés es al menos ordianal.

-No existe interacción entre los bloques(repeticiones) y tratamientos

H1: Al menos uno de los tratamientos tiene un efecto diferente.

b= n°de bloques o repeticiones

𝑟𝑖2 =Rangos al cuadrado, para cada tratamiento i.

DISEÑOS ESTADÍSTICOS PARAMÉTRICOS

Pruebas paramétricas: Requisitos

A continuación se presenta una breve descripción de los diseños de efectos fijos.

1. Diseño al Azar (DA)

 El experimentador asigna las unidades experimentales a los tratamientos al azar

 Flexibilidad: el número de tratamientos y repeticiones está limitado sólo por el

 Ineficiencia. El error experimental incluye toda la variación de las unidades

El modelo para un diseño al azar es el siguiente:

𝒀𝒊𝒋 = µ + ƫ𝒊 + 𝒆𝒊𝒋 ; Dónde

Yij = Variable respuesta, correspondiente j-ésima observación del i-ésimo tratamiento

ƫi = efecto del i-ésimo tratamiento. Recoge la importancia de cada tratamiento

H0: µ1= µ2= µ3=… µi

H0: ƫ1= ƫ2= ƫ3=… ƫi

Fuente de Grados de Suma de Cuadrados Valor F P- Valor

Error a (n-1) S2 M2=S2/a(n-1)

2. Diseño en Bloques al azar (DBA)

Descripción: En este diseño el experimentador agrupa las unidades experimentales en bloques, a

El modelo estadístico para DBA

i) Para los tratamientos:

H0: µƫ1= µƫ2= µƫ3=… µƫi

ii) Para los bloques

H0: µB1= µB2= µB3=… µBb

La Tabla ANOVA: Análisis de varianza, Modelo: Diseño en bloques al azar

3.- Diseño Factorial (DF)

En algunas ocasiones se está interesado en estudiar la influencia de dos (o más) factores

Los experimentos factoriales se utilizan en prácticamente en todos los campos de la investigación.

El modelo estadístico para dos factores (sin bloque) es:

El modelo estadístico para 3 factores (sin bloque) es:

Respuesta= efecto medio+ F1+ F2+F3+F1xF2+F1xF2+F1xF3+F2xF3+F1xF2xF3 +Error

El modelo estadístico para 3 factores (con bloque) es:

Respuesta= efecto medio+ efecto bloque+F1+ F2+F3+F1xF2+F1xF2+F1xF3+F2xF3+F1xF2xF3

 Se requiere un número mayor de tratamientos