Documente Academic
Documente Profesional
Documente Cultură
Diseos factoriales
Julio de 2011
ndice
ndice
Denicin Organizacin de los datos Ventajas de los diseos factoriales frente a la experimentacin clsica Objetivos El concepto de interaccin Hiptesis del modelo Consecuencias de las hiptesis del modelo Estimacin de los parmetros del modelo El Anlisis de la varianza en los diseos factoriales con dos factores El test de la F La tabla ADEVA Diagnosis y validacin del modelo Inferencia sobre los parmetros del modelo
ndice
En ocasiones, el experimentador est interesado en estudiar el efecto sobre la variable respuesta de varios factores. En estos casos la alternativa a la experimentacin clsica, en la que se estudia el efecto de cada factor en experimentos independientes, es el diseo factorial.
Definicin
Un diseo factorial con dos factores consiste en experimentar con todos los tratamientos que se obtienen al combinar cada nivel de un factor con los niveles del otro.
ndice
Ejemplo I
Se desea analizar si el rendimiento de un determinado cultivo depende del tipo de semilla y de fertilizante empleados. Se dispone de dos semillas (A y B ) y de tres fertilizantes 1, 2 y 3. El diseo factorial consta de 2 3 = 6 tratamientos, como se muestra en la tabla:
F E R T
1 2 3
A yA yA yA
SEMILLA
1 2 3
B yB yB yB
1 2 3
ndice
En general, si existen dos factores de inters, el primero con niveles y el segundo con J niveles distintos, el conjunto de datos del diseo factorial se resume en una tabla del tipo:
FACTOR F A C T O R
J yJ yJ
1 2
1 2 . . .
y y
1
11 12
. . .
y y
2
21 22
. . .
K yK yK
1 2
. . . yKJ
El valor yij representa la observacin realizada de la variable respuesta, en el nivel i del primer factor, y en el valor j del segundo.
5
ndice
Las ventajas fundamentales del diseo factorial frente a la experimentacin clsica son las siguientes: Eciencia: con menos experimentos se estiman los efectos con la misma precisin. Mayor informacin, pues con la experimentacin clsica no se exploran todas las combinaciones de los niveles de los factores. Mayor rango de validez de las conclusiones.
ndice
Los objetivos de un diseo factorial con dos factores son los siguientes:
1
Contrastar si existen diferencias entre las medias de la variable respuesta en cada uno de los niveles del factor 1. Contrastar si existen diferencias entre las medias de la variable respuesta en cada uno de los niveles del factor 2. Contrastar si los dos factores interaccionan.
ndice
El concepto de interaccin
Empricamente se comprueba que, en ocasiones, el efecto que, sobre la variable respuesta, se produce por el cambio de nivel en un determinado factor depende del nivel al que se encuentre el otro. Cuando esto sucede se dice que ambos factores interaccionan.
ndice
Ejemplo II
En el grco adjunto se observa el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 1.
1 2
R | B = 1
ndice
Ejemplo II
En este nuevo grco se observa el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 2.
1 2
R | B = 2
10
ndice
Ejemplo II
Al comparar ambos grcos, se observa cmo el cambio producido en la respuesta al pasar del nivel 1 al 2 el factor A, cuando el factor B se encuentra en su nivel 1, es signicativamente distinto del cambio producido cuando el factor B se encuentra a nivel 2. En este caso ambos factores interaccionan.
11
R | B = 1
R | B = 2
ndice
Ejemplo III
En el nuevo grco adjunto se observa, en otro caso, el cambio en la respuesta producido al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 1.
1 2
R | B = 1
12
ndice
Ejemplo III
En este grco se observa el cambio en la respuesta producido, en este caso, al pasar del nivel 1 al 2 del factor A, cuando el factor B se encuentra en su nivel 2.
1 2
R | B = 2
13
ndice
Ejemplo III
Al comparar ambos grcos, se observa, en esta ocasin, cmo el cambio producido en la respuesta al pasar del nivel 1 al 2 el factor A, cuando el factor B se encuentra en su nivel 1, no es signicativamente distinto del cambio producido cuando el factor B se encuentra a nivel 2. En este caso ambos factores no interaccionan.
14
R | B = 1 R | B = 2
ndice
La signicatividad de los factores y de la interaccin entre ellos se analiza bajo las siguientes hiptesis: La variable respuesta se puede descomponer en la forma:
( ) es la desviacin de la media debida a la conuencia del nivel i del primer factor con el nivel j del segundo. Este trmino representa la interaccin entre los dos factores.
15
ndice
eij N (0, ).
Todos los eij son independientes entre s. Por ltimo, para evitar problemas de indeterminacin en la estimacin del modelo, se impondr que:
K i =1
i =
J j =1
j =
K i =1
( )ij =
J j =1
( )ij = 0.
16
ndice
Como consecuencia de las hiptesis se cumple que: La variable respuesta en los individuos sometidos al nivel i del primer factor, y al valor j del segundo, sigue una distribucin:
(Y |F 1 = i F 2 = j ) N ( + i + j + ( )ij , ).
17
ndice
Grcamente,
Y
F1 = i F2 = j
18
ndice
Observaciones I
El objetivo fundamental del estudio es analizar si existen diferencias signicativas entre los valores de los i , de los de j , y de los de ( )ij . El nmero de parmetros del modelo que hay que estimar es: 1 + (I 1) + (J 1) + (I 1) (J 1) + 1 = I J + 1 = n + 1, por lo que no hay datos sucientes para la estimacin de todos los parmetros del modelo.
19
ndice
Observaciones II
El problema de la falta de un nmero suciente de observaciones para la estimacin de todos los parmetros del modelo tiene distintas soluciones en la literatura. La solucin ms empleada para soslayar este problema, cuando es econmicamente viable, es replicar el experimento varias veces. Una rplica de un experimento consiste en la realizacin completa, de nuevo, de dicho experimento. Lo que incluye la aleatorizacin del orden de los nuevos ensayos, etc.
20
ndice
Observaciones III
En lo sucesivo, se considerar que el experimento realizado consta de un diseo completo replicado R veces:
FACTOR
1 1
F A C T O R
y y y
1
111 112
J J J J y JR y JR
1 2
1 1 . . .
. . .
y y y
2
211 212
. . .
. . . . . . . . .
R . . . y1J 1 y1J 2 . . .
11
R . . . y2J 1 y2J 2 . . .
21
. . . yK 1 R . . . . . . yKJR
yK yK
K
11 12
yKJ yKJ
1 2
ndice
K i =1
J j =1
R y r =1 ijr
El valor de i , desviacin de la media global atribuible a que la observacin se realiza en el nivel i del factor 1, se estima por:
i y , i = y
donde:
i = y
22
J j =1
J R
R y r =1 ijr
ndice
Debe observarse que i se calcula como la diferencia entre la media de todas las observaciones realizadas en el nivel i del primer factor y la media global, lo que es coherente con el signicado de i en el modelo.
23
ndice
y
1
F A C T O R
1
111
. . .
. . .
. . .
yK yK
K
. . .
11
11
yJ
. . .
1
. . .
. . . . . .
1 1
yKJ
. . .
. . .
J
1
y JR ) = ( y y
1
yKJR ) = ( yK y
24
ndice
El valor de j , desviacin de la media global atribuible a que la observacin se realiza en el valor j del factor 2, se estima por:
j = y j y ,
donde:
j = y
K i =1
R y r =1 ijr R
25
ndice
De manera similar a como se hizo en el caso de i , debe observarse j se calcula como la diferencia entre la media de todas las que observaciones realizadas en el nivel j del segundo factor y la media global, lo que es coherente con el signicado de j en el modelo.
26
ndice
FACTOR
y
F A C T O R
1
111
1 . . .
. . .
y y
2
211
. . .
. . . . . . . . .
y JR y JR
1 2
R . . . y1J 1 . . .
11
R . . . y2J 1 . . .
21
. . . yK 1R . . . . . . yKJR
yK
K
11
1 = ( ) y1 y
yKJ
. . .
J = ( ) y J y
27
ndice
La interaccin ( )ij , que es la desviacin de la media general producida por la realizacin del ensayo experimental en los niveles i del factor 1 y j del factor 2, simultneamente, viene dada por:
) =y i y j + y , ( ij ij y
donde,
ij = y
R y r =1 ijr .
ij representa la media de todas las observaciones Es decir, y obtenidas en los niveles i del factor 1 y j del factor 2, simultneamente.
28
ndice
Por ltimo, la varianza del error experimental, 2 , se estima por la varianza residual:
2 sR =
eijr , K J (R 1)
2
donde
eijr
) ) = yijr y j + ( ij . = yijr ( + i + ij
29
ndice
Anlisis de la varianza I
Como en los casos anteriores, el anlisis de la existencia de diferencias en la variable respuesta debidas a los niveles de los factores, o a la interaccin, se puede realizar comparando la variabilidad explicada por cada uno de estos trminos con la variabilidad total. As:
) + eijr . j + ( ) = (yijr y i + ij
30
ndice
Anlisis de la varianza II
Llamando variabilidad total y variabilidad explicada por el factor 1, respectivamente, a los trminos:
K
=
VT
y
i =1 j = 1 r =1 K J R
)2 (yijr y
VE () =
i =1 j = 1 r =1
i = JR
2
K i =1
i2 .
31
ndice
Y, de forma anloga, llamando variabilidad explicada por el factor 2, variabilidad explicada por la interaccin, y variabilidad no explicada, respectivamente, a los trminos:
K J R J j =1
VE ( ) = VE ( ) =
y
K
i =1 j = 1 r =1 J R
j2 = KR
j2 .
i = 1 j =1 r =1
)2 = R ( ij
i =1 j = 1
)2 . ( ij
VNE
32
K
=
i =1 j = 1 r =1
eijr .
2
ndice
Anlisis de la varianza IV
VT
= VE () + VE ( ) + VE ( ) + VNE .
El trmino VE () depende slo de la variabilidad entre los distintos i . El trmino VE ( ) depende slo de la variabilidad entre los j . distintos El trmino VE ( ) depende slo de la variabilidad entre los )ij . distintos ( El trmino residuos.
33
ndice
Anlisis de la varianza V
Observaciones:
En la medida en que VE () sea grande en relacin con VNE , habr evidencia de diferencia entre los valores de los efectos sobre las respuesta de los distintos niveles del factor 1. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de diferencia entre los valores de los efectos sobre las respuesta de los distintos niveles del factor 2. En la medida en que VE ( ) sea grande en relacin con VNE , habr evidencia de la existencia de interaccin entre los dos factores.
34
ndice
Anlisis de la varianza VI
VE ( ), requiere
Teorema I
1
Si se verica la hiptesis:
1 = 2 = = K = 0,
la variable
2
Si se verica la hiptesis:
1 = 2 = = J = 0,
la variable
35
ndice
Teorema II
Si se verica que
( )ij = 0, para todos los valores de
i y j,
2 1 1
la variable
La variable VNE / 2 se distribuye, en cualquier caso, como una 2 KJ (R 1) y es independiente de las tres distribuciones anteriores.
Teorema III
ndice
Consecuencia I
Si se verica la hiptesis:
1 = 2 = = K = 0
la variable
VE () 2 (K 1)
2 KJ (R 1)
VNE
37
ndice
Anlisis de la varianza IX
Consecuencia II
Si se verica la hiptesis:
1 = 2 = = J = 0
la variable
VE ( ) 2 (J 1)
2 KJ (R 1)
VNE
38
ndice
Anlisis de la varianza X
Consecuencia III
Si se verica la hiptesis:
( )ij = 0, para todos los valores de
i y j,
la variable
VE ( ) 2 (K 1)(J 1)
2 KJ (R 1)
VNE
39
ndice
Anlisis de la varianza XI
2 Llamando se () al valor de 2 se ( ) al valor de 2 y sR al valor de
VE ()/(K-1),
VE ( )/(J-1),
VNE /(KJ(R-1)).
Y cuando 1 = 2 = = J = 0:
2 se ( ) F((J 1);KJ (R 1)). 2 sR
40
ndice
i y j,
ndice
H
frente a
: 1 = 2 = = K = 0,
= 0,
s 2 () = e2 sR
42
ndice
II
s 2 () = e 2 < F sR
se aceptar la hiptesis nula, (i = 0, para todo i ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:
43
ndice
III
H
frente a
: 1 = 2 = = J = 0,
s 2 ( ) = e2 sR
44
ndice
IV
s 2 ( ) = e 2 < F sR
se aceptar la hiptesis nula, (j = 0, para todo j ), que se rechazar en caso contrario. Ntese que el test de la F es un contraste unilateral, en coherencia con la hiptesis que se contrasta.
Observacin:
45
ndice
H
frente a
F
comparndolo con el
46
F apropiado.
s 2 ( ) = e 2 , sR
ndice
F se resumen en la F
2 ( ) se 2 sR 2 ( ) se 2 sR 2 ( ) se 2 sR
Tabla ADEVA
Fuentes de variac.
Suma de cuadrados
Grados de libertad
Varian.
p-v. p() p( ) p( )
JR KR R nsY
2
i2 2 j ) ( ij (eijr )2
2
K 1 J 1
(K-1)(J-1)
2 se () 2 se ( ) 2 se ( ) 2 sR 2 sY
KJ (R 1) n1
47
ndice
Como en los casos anteriores, una vez realizado el anlisis de la varianza, antes de emplear las conclusiones all extradas, es necesario vericar las hiptesis del modelo. Esta vericacin se lleva a cabo por medio del anlisis de los residuos.
La discusin de la normalidad se realiza a travs del papel probabilstico normal. La comprobacin de la homocedasticidad requiere grcos de los residuos frente a los distintos valores de los factores y frente a los valores previstos por el modelo.
48
ndice
Una vez realizada la diagnosis del modelo, puede ser necesario hacer inferencia respecto de los parmetros del mismo. La inferencia respecto del valor de i se puede hacer teniendo en cuenta que:
i i y sR / JR tKJ (R 1)
La comparacin de dos desviaciones de la media general provocadas por dos valores distintos del factor 1, i y j , se puede realizar si se tiene en cuenta que:
j ) (i j ) ( yi y sR
49
JR
tKJ (R 1)
ndice
Anlogamente, La inferencia respecto del valor de j se puede hacer teniendo en cuenta que:
j j y sR / KR tKJ (R 1)
La comparacin de dos desviaciones de la media general provocadas por dos valores distintos del bloque, i y j , se puede realizar si se tiene en cuenta que:
j ) (i j ) ( y i y sR
50
KR
tKJ (R 1)
ndice
KJ (R 1) sR
2
2 KJ (R 1)
51
ndice
La extensin a modelos con ms de dos factores se realiza de una manera natural. En el caso en que no se realicen rplicas, una tcnica habitual es considerar nulas las interacciones de orden superior o igual a tres, con lo que se disminuye el nmero de parmetros del modelo a estimar. El lector interesado en los puntos anteriores puede consultar el libro de Daniel Pea Regresin y diseo de experimentos. Alianza editorial. (2002)
52