Sunteți pe pagina 1din 19

Introduccion al diseno de experimentos

Luis Cayuela Junio de 2010

EcoLab, Centro Andaluz de Medio Ambiente, Universidad de Granada Junta de Andaluc Avenida del Mediterrneo s/n, E-18006, Granada. E-mail: a, a lcayuela@ugr.es.

88

Introduccin al dise o de experimentos (versin 1.0) o n o


Publicado por: Luis Cayuela

Se autoriza a cualquier persona a utilizar, copiar, distribuir y modicar esta obra con las siguientes condiciones: (1) que se reconozca la autor de la misma; a (2) que no se utilice con nes comerciales; y (3) que si se altera la obra original, el trabajo resultante sea distribuido bajo una licencia similar a sta. e

Para cualquier comentario o sugerencia por favor remitirse al autor de la obra.

89

Indice
1. Dise o factorial n 2. Dise o por bloques n 2.1. Supuestos estad sticos . . . . . . . . . . . . . . . . . . . . . . . . 3. ANOVA de medidas repetidas 3.1. Ventajas del ANOVA de medidas repetidas . . . . . . . . . . . . 3.2. Inconvenientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Supuestos estad sticos . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Diseo por bloques o medidas repetidas? . . . . . . . . . . . . . n 4. Split-plot 4.1. Supuestos estad sticos . . . . . . . . . . . . . . . . . . . . . . . . 5. ANOVA anidado o jerarquizado 91 92 93 93 95 95 96 96 97 99 99

5.1. Psuedorreplicacin . . . . . . . . . . . . . . . . . . . . . . . . . . 101 o 6. Modelos mixtos 103

6.1. Efectos jos o aleatorios? . . . . . . . . . . . . . . . . . . . . . . 105 6.2. Modelos mixtos una alternativa para representar y analizar otros diseos de experimentos? . . . . . . . . . . . . . . . . . . . . . . 105 n 6.3. Cuatro preguntas que hay que hacerse sobre el diseo de experin mentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7. Ejercicios 106

90

Luis Cayuela

Introduccin al diseo de experimentos o n

1.

Dise o factorial n

El diseo factorial, como estructura de investigacin, es la combinacin de dos n o o o ms diseos simples (o unifactoriales). El diseo factorial requiere la a n n manipulacin simultnea de dos o ms variables independientes (llamados o a a factores), en un mismo experimento. Este tipo de diseos se analizan por n medio del anlisis de la varianza (ANOVA, del ingls Analysis of Variance). a e Estos modelos han de cumplir los siguientes requisitos: 1. Asumen muestras independientes (los efectos se miden entre-sujetos); 2. Tienen todos los niveles de un factor representados en los niveles de los otros factores (cruzados); 3. Representan efectos jos, es decir, que han sido pre-denidos por el experimentador. Ejemplo 1: se quiere ver cmo dos factores, luz y agua, afectan al crecimiento o de una planta. Cada uno de estos factores tiene dos niveles (alto, bajo). Un diseo factorial completo con dos niveles se disear de tal manera n n a que tuviramos sujetos independientes muestreados bajo todas las e combinaciones posibles de cada uno de los dos niveles de luz y agua, como muestra la siguiente gura. Como los niveles de estos dos factores han sido denidos a priori y constituyen los unicos niveles que nos interesan en este estudio, representan efectos jos.

Una representacin esquemtica de este diseo vendr dada de la siguiente o a n a forma: 91

Luis Cayuela

Introduccin al diseo de experimentos o n

En ocasiones, estos requisitos no se cumplen, por lo que es necesario utilizar otros dise os de experimentos alternativos como: n 1. Dise o por bloques; n 2. ANOVA de medidas repetidas (factores dentro de sujetos); 3. Split-plot (factores entre y dentro de sujetos); 4. ANOVA anidado o jerarquizado (los niveles de un factor no se cruzan con todos los niveles del otro u otros factores); 5. Modelos mixtos (efectos jos y efectos aleatorios).

2.

Dise o por bloques n

Al estudiar la inuencia de un factor sobre una variable cuantitativa es frecuente que aparezcan otras variables o factores que tambin inuyen y que e deben ser controladas. A estas variables se las denomina variables bloque, y se caracterizan por: 1. No son el motivo del estudio sino que aparecen de forma natural y obligada en el mismo. 2. Tradicionalmente se asum que no tienen interaccin con el factor a o principal, aunque hoy en d este supuesto ya no tiene por qu hacerse. a e Ejemplo 2: Sobre el ejemplo anterior, imaginemos que parte de las plantas que estamos creciendo en condiciones experimentales se encuentran en un invernadero en Guadalajara y otra parte en un invernadero en 92

Luis Cayuela

Introduccin al diseo de experimentos o n

Toledo. Podemos pensar que la situacin geogrca (clima general, o a naturaleza del sustrato en dnde hacemos crecer las plantas, etc) puede o inuir sobre la variable respuesta. Como esta variable no es de inters e para el estudio pero queremos controlar como afecta a la variabilidad de la variable respuesta, la introducimos como un bloque en el anlisis. a

Recordemos que:
El modelo se dice que es de bloques aleatorizados completos cuando

en cada bloque se presentan todos los posibles tratamientos (o un mltiplo de ese nmero) y dentro de cada bloque se asignan los u u tratamientos de forma aleatoria.
En ocasiones no se pueden asignar todos los tratamientos sobre cada

bloque, de modo que se tienen los diseos por bloques aleatorizados n incompletos.

2.1.

Supuestos estad sticos

En principio los mismos supuestos que cualquier modelo lineal, es decir: normalidad, homocedasticidad, linealidad e independencia de los residuos (entre otras cosas, para eso incluimos un factor en el anlisis). Recordemos que a los supuestos del modelo siempre se comprueban sobre los residuos.

3.

ANOVA de medidas repetidas

Este diseo se aplica cuando todos los niveles del factor se aplican a los n mismos sujetos. La variabilidad que existe entre los niveles del factor se mide 93

Luis Cayuela

Introduccin al diseo de experimentos o n

dentro de los sujetos y no entre sujetos. El diseo ms sencillo de medidas repetidas consiste en medir dos variables (ej. n a dieta A y dieta B) en una misma muestra de sujetos. Los datos de este diseo n se analizar con lo que se conoce como la prueba T para muestras an relacionadas. Pero los diseos de medidas repetidas pueden tener ms de dos n a variables (esto es, niveles del factor, en el ejemplo anterior el factor ser tipo a de dieta y los niveles A, B, C, ..., F). Ejemplo 3: Imaginemos una investigacin diseada para conocer el efecto de o n cuatro tipos de dietas sobre el engorde de los cerdos. Podemos optar por seleccionar tantos grupos de sujetos como dietas disponibles (cuatro) y someter a cada grupo a un unico tipo de dieta. De esta manera tendremos un diseo con un factor (tipo de dieta, con cuatro niveles) y n tantos grupos de sujetos como niveles del factor (cuatro). Para analizar los datos de este diseo podemos utilizar un ANOVA de un factor n completamente aleatorizado.

En lugar de esto, podemos seleccionar un unico grupo de sujetos y someterles de manera secuencial (dejando un intervalo de tiempo entre la aplicacin de una dieta y otra) a los cuatros tipos de dietas distintas. En o este caso seguiremos teniendo un diseo de un factor (tipo de dieta, con n cuatro niveles), pero un slo grupo de sujetos que hacemos pasar por las o cuatro condiciones denidas por los niveles del factor (tendremos a todos los sujetos sometidos a todas las dietas). Para analizar los datos de este diseo podemos utilizar un ANOVA de medidas repetidas. n

94

Luis Cayuela

Introduccin al diseo de experimentos o n

Ejemplo 4: Se quiere ver el efecto de 3 tratamientos de depuracin de aguas o residuales distintos sobre la produccin de vertidos contaminantes al o cauce de un r Se prueban los tres tratamientos de manera consecutiva o. en 12 fbricas distintas y despus de implementar cada uno de los a e tratamientos de miden la produccin de vertidos contaminantes. o Ejemplo 5: En un estudio agr cola, se quiere ver el efecto de distintos fertilizantes (A, B, C, D) sobre la produccin de patatas. Se toman 20 o parcelas y cada una se subdivide en cuatro partes iguales y se aplica a cada sub-parcela un fertilizante distinto.

3.1.

Ventajas del ANOVA de medidas repetidas

Requieren menos sujetos que un dise o totalmente aleatorizado. n Se controla la variabilidad debida a la diferencia entre sujetos.

3.2.

Inconvenientes
una condicin antes de que haya terminado el efecto de otra o administrada previamente.

Efecto de arrastre (carry-over eects) ocurre cuando se administra

Efecto del aprendizaje por la prctica ocurre cuando las respuestas de a

los sujetos pueden mejorar con la repeticin (los ultimos tratamientos o 95

Luis Cayuela

Introduccin al diseo de experimentos o n

parecen ms efectivos que los primeros). Por ello es conveniente a aleatorizar los tratamientos dentro de cada sujeto, como en el ejemplo 3.

3.3.

Supuestos estad sticos

Los mismos que para cualquier modelo lineal (normalidad, homocedasticidad, linealidad e independencia), pero adems hay una nueva hiptesis que es la a o hiptesis de esfericidad. Esta hiptesis hace referencia a que los niveles del o o factor tienen que estar igualmente correlacionados dos a dos. Si la respuesta de un individuo a uno de los tratamientos es muy distinta a la del resto de los individuos muestreados, esta diferencia deber mantenerse en todos los a tratamientos. La prueba de esfericidad de Mauchly comprueba la hiptesis o nula de que las correlaciones entre los pares de niveles del factor son iguales. Esto es equivalente a decir que no hay interaccin entre los sujetos (como o bloque) y el factor.

3.4.

Dise o por bloques o medidas repetidas? n

Como podemos observar, hay una similitud muy grande entre el ANOVA de medidas repetidas y el ANOVA por bloques... es tanta la similitud que podemos decir que en realidad es lo mismo desde un punto de vista conceptual, aunque ya veremos que asumir un diseo por bloques aleatorizados n o un diseo de medidas repetidas puede implicar un anlisis de los datos n a ligeramente diferente.

96

Luis Cayuela

Introduccin al diseo de experimentos o n

Bloques Generalmente en un contexto ms a espacial, en dnde una serie de o muestras estn agrupadas dentro, a por ejemplo, de una misma regin o geogrca (ver ejemplos 2 y 5). a

El bloque es una caracter stica de las unidades experimentales que podemos posteriormente incorporar al diseo experimental. n

En el diseo por bloques, cada n bloque puede contener rplicas de e uno o varios de los niveles del factor.

Los bloques afectan a un conjunto de individuos que, de alguna forma, sustentan algn grado de u dependencia.

Medidas repetidas Se produce con mayor frecuencia (pero no exclusivamente) en un contexto temporal, con individuos a los que se aplica distintos tratamientos (niveles del factor de inters) en el tiempo (ver ejemplos 3 e y 4). En el ANOVA de medidas repetidas la aleatorizacin total de las o muestras es una restriccin del o propio diseo experimental y no n una caracter stica o condicin de las o unidades experimentales. En el diseo de medidas repetidas n cada sujeto experimenta todos o al menos varios de los niveles del factor, pero -salvo raras ocasionesno hay posibilidad de rplicas. e Los diseos de medidas repetidas n hacen referencia a sujetos independientes entre s pero que , experimentan cada uno de ellos los distintos niveles del facto. A veces, la dicultad puede estribar en denir lo que es un sujeto muestral.

Todas estas diferencias, ms bien sutiles, nos complican ms que nos ayudan. a a As pues es mejor que intentemos ver las similitudes y no las diferencias entre estos dos tipos de diseos experimentales. Desde esta perspectiva podemos n considerar el bloque como equivalente a la restriccin de la aleatorizacin de o o los niveles del factor estudiado dentro de individuos en el ANOVA de medidas repetidas y vice-versa. Lo importante aqu es que la variabilidad dentro de este factor (bloque o individuo) es intra-sujeto. Cuando tenemos variabilidad entre sujetos la variabilidad del factor estudiado (por ejemplo tipo de dieta) se puede confundir con respuestas diferenciales de los individuos a los distintos niveles del factor. Por ejemplo, cerdos de mayor complexin pueden o engordar menos con una dieta ms calrica, o cerdos machos y hembras a o pueden responder de distinta manera a los distintos tipos de dieta. Cuando la variabilidad es intra-sujetos signica que toda esta variabilidad atribuible a las diferencias existentes entre distintos individuos se elimina, ya que estamos comprobando los efectos de los distintos niveles del factor de inters dentro de e cada sujeto.

4.

Split-plot

Ahora que ya hemos visto el concepto de factor intra-sujetos en el contexto del ANOVA por bloques aleatorizados o el ANOVA de medidas repetidas, 97

Luis Cayuela

Introduccin al diseo de experimentos o n

estamos en disposicin de entender mucho ms fcilmente el diseo de tipo o a a n split-plot. El diseo de tipo split-plot se aplica cuando tenemos un factor n intra-sujetos (como en el modelo de medidas repetidas) y un factor inter-sujetos (como en el ANOVA factorial aleatorizado). Son por tanto modelos que combinan dos tipos de factores (por su naturaleza inter- o intra-sujetos). Los diseos de tipo split-plot se originaron en el campo de la agronom pero n a, ocurren frecuentemente en otros mbitos. Como su nombre indica, las parcelas a experimentales son divididas en varias subparcelas. La parcela es sometida a un unico nivel de uno de los factores (efecto entre-sujetos) mientas que los niveles del otro factor son aplicados a cada una de las subparcelas (efecto intra-sujetos). Este tipo de diseos surgen como consecuencia generalmente de n restricciones impuestas en las condiciones de experimentacin, lo que impide o una completa aleatorizacin del diseo. o n Ejemplo 6: Queremos investigar el efecto de tres frecuencias de riego (diario, cada dos d cada tres d y cuatro variedades de semilla (A, B, C, D) as, as) sobre la produccin de alfalfa. Bajo un diseo totalmente aleatorizado o n tendr amos que seleccionar parcelas de cultivo independientes entre s y someterlas a todas las posibles combinaciones de los dos factores riego x variedad. Es decir que tendr amos que asignar parcelas a un m nimo de 3 x 4 = 12 grupos y, para tener rplicas dentro de cada grupo y poder ver e el efecto de la interaccin entre estos dos factores necesitar o amos al menos 24 parcelas de cultivo. En experimentacin agr o cola esto supone una limitante muy importante. Una opcin ser subdividir cada parcela o a de cultivo en doce subparcelas y aplicar en cada una de ellas una combinacin de los niveles de los dos factores investigados. De esta o manera con 6 parcelas tendr amos un total de 6 x 12 = 72 muestras, eso s no independientes entre s Una manera de analizar estos datos ser , . a por medio de un anova factorial completo con un bloque (parcela, con 6 niveles) o un anova factorial completo de medidas repetidas, en dnde el o riego y la variedad ser dos factores intra-sujetos. an

Ahora imaginemos que no podemos imponer distintos tipos de riego dentro de cada parcela. Una opcin ser subdividir cada parcela en o a cuatro subparcelas y aplicar en cada una de ellas una variedad de semilla. Y podr amos aplicar cada tipo de riego a dos parcelas distintas. Tendr amos ahora 6 x 4 = 24 muestras, no independientes entre s pero , 98

Luis Cayuela

Introduccin al diseo de experimentos o n

con un grado menor de independencia que en el caso anterior ya que hay un factor, que es el riego, cuyo efecto se mide entre sujetos.

Ejemplo 7: En un estudio de produccin animal, se trata de ver la inuencia o de 4 tipos de dietas distintas sobre el engorde de los cerdos. Para ello se someten 30 cerdos a cada uno de los 4 tratamientos durante un cierto periodo de tiempo. Los individuos sometidos a los distintos tratamientos pertenecen a 3 razas distintas de cerdos Diseo split-plot: n - Factor intra-sujetos = Dieta (I = 4). - Factor inter-sujetos = Raza porcina (J = 3). Ejemplo 8: En un estudio agr cola, se quiere ver el efecto de distintos fertilizantes (A, B, C, D) y distintos tipos de suelos (arcillosos vs. calcreos) sobre la produccin de patatas. Se toman 10 parcelas en suelos a o arcillosos y 10 parcelas en suelos calcreos, y cada una se subdivide en a cuatro partes iguales y se aplica a cada sub-parcela un fertilizante distinto. Diseo split-plot: n - Factor intra-sujetos = Fertilizante (I = 4). - Factor inter-sujetos = Tipo de suelo (J = 2).

4.1.

Supuestos estad sticos

Los mismos que para el diseo de medidas repetidas, teniendo en cuenta que el n supuesto de esfericidad hace referencia slamente a los niveles del factor o intra-sujetos.

5.

ANOVA anidado o jerarquizado

Hasta ahora todos los diseos de experimentos que hemos visto son cruzados n (crossed ). Los diseos cruzados son aquellos en donde existen todas las n combinaciones posibles de los niveles de los factores (ver Ejemplo 1). A veces 99

Luis Cayuela

Introduccin al diseo de experimentos o n

puede ocurrir que En algunos diseos puede ocurrir que tengamos algunos n niveles de un factor combinados con unos niveles determinados de otro factor, sin que exista una representacin de todas las posibles combinaciones de los o niveles de los factores Ejemplo 9: Se investiga el efecto del riego (riego, no riego) y cuatro variedades de semilla (A, B, C, D) sobre el porcentaje de germinacin de o una especie leosa utilizada en la restauracin de taludes. n o

El factor anidado es, por lo general, un factor aleatorio (ver seccin 6). o Ejemplo 10: Se quiere estudiar el efecto de una droga en hombres y mujeres. Se toman 8 individuos (4 hombres y 4 mujeres). A 2 hombres y a 2 mujeres se les suministra la droga, y al resto se les da un placebo. Se toma a cada individuo tres muestras de sangre y se mide la concentracin de la droga en sangre. o - Factor 1 = droga (control, droga) - Factor 2 = sexo (hombre, mujer) Estos dos factores son cruzados, porque tenemos una representacin de o todos los niveles del factor 2 (sexo) en todos los niveles del factor 1 (droga). Si slo hubiramos tomado una muestra de cada individuo, o e tendr amos muestras independientes entre s y por tanto un diseo n ANOVA de dos factores completamente aleatorizado. Pero... tenemos tres muestras de cada individuo Cada individuo debe ser tratado, por tanto, como un factor anidado dentro de cada una de las combinaciones de los niveles cruzados. El factor individuo es aleatorio, porque representa una muestra de la poblacin (n = 20) de todos los posibles o tratamientos.

100

Luis Cayuela

Introduccin al diseo de experimentos o n

5.1.

Psuedorreplicacin o

La pseudorreplicacin ocurre cuando analizas los datos como si tuvieras ms o a grados de libertad de los que realmente tienes. Hay dos tipos de pseudorreplicacin: (1) temporal, que implica re-muestreos de los mismos o individuos1 ; y (2) espacial, que implica que las muestras han sido tomadas en puntos prximos entre s La pseudorreplicacin supone un problema grave o . o porque uno de los supuestos ms importantes de los anlisis estad a a sticos estndar es la independencia de los errores. La pseudorreplicacin temporal a o tendr errores no independientes porque las peculiaridades de los individuos a remuestreados quedarn reejadas en todas las medidas tomadas sobre ellos a (es decir, las muestras procedentes de los mismos individuos estarn a correlacionadas unas con otras). Las muestras tomadas en puntos prximos o entre s tendrn errores no independientes porque las peculiaridades de la a localidad sern comunes a todas las muestras (por ejemplo, si varias muestras a proceden de una zona con suelos muy frtiles, los valores de crecimiento en e plantas sern todos muy altos y parecidos entre s a ). La pseudorreplicacin es, por lo general, bastante fcil de distinguir. La o a pregunta que hay que hacerse es la siguiente: Cuntos grados de libertad para a los errores tiene el experimento realmente? Si un experimento de campo parece tener muchos grados de libertad, es posible que est pseudorreplicado. e Tomemos un ejemplo procedente del control de plagas de insectos en plantas. Tenemos 20 parcelas, 10 fumigadas y 10 no fumigadas. Dentro de cada parcela hay 50 plantas. Cada planta es medida 5 veces para asegurar que la medicin o est bien hecha. Este experimento genera 20x50x5 = 5000 valores. Hay dos a tratamientos (fumigado, no fumigado), as que debe de haber un grado de libertad para el factor y 4998 grados de libertad para el trmino error. e Contemos ahora las rplicas (es decir, muestras independientes que e experimentan el mismo nivel o combinaciones de los niveles de los factores)
1 Cuando existe pseudorreplicacin los individuos remuestreados representan un unico nio vel del factor. No confundir por tanto con los diseos de medidas repetidas, en dnde cada n o individuo experimenta distintos niveles del factor.

101

Luis Cayuela

Introduccin al diseo de experimentos o n

que hay en este experimento. Los remuestreos hechos sobre las mismas plantas (las cinco muestras por planta) no son rplicas. Las 50 plantas individuales e medidas dentro de cada parcela tmpoco son rplicas ya que es muy probable a e que las condiciones de cada parcela sean unicas y afecten por igual a cada grupo de 50 plantas muestreadas dentro de ellas independientemente de la aplicacin o no de la fumigacin. Hay 10 parcelas fumigadas y 10 no fumigadas o o y cada parcela va a proporcionar un unico valor no independiente de la variable respuesta (por ejemplo, la proporcin del rea de las hojas comida por o a los insectos). Por tanto, habr 9 grados de libertad dentro de cada nivel del a factor, y 9x2=18 grados de libertad para el trmino error en el experimento en e su conjunto. No es dif encontrar ejemplos de pseudorreplicacin parecidos a cil o ste en la literatura cient e ca. El problema es que, si no se identica correctamente la existencia de pseudorreplicacin, podemos acabar sacando o conclusiones equ vocas sobre la signicacin de los resultados (con 4998 grados o de libertad para el trmino error, es casi imposible no detectar alguna e diferencia estad sticamente signicativa). Hay varias cosas que se pueden hacer cuando tus datos estn a pseudorreplicados:
Promediar la pseudorreplicacin y llevar a cabo tu anlisis estad o a stico

con las medias;


Hacer un anlisis separado para cada periodo de tiempo en el caso de la a

pseudorreplicacin temporal; o
Utilizar un anlisis de series temporales o modelos mixtos. a

Ejemplo 11: Se toman tres muestras de agua de tres pozos distintos. Con cada muestra se hacen dos determinaciones del contenido de uoratos en el agua (miligramos/litro de agua). Se quiere ver si hay diferencias en los contenidos de uorato entre los tres pozos. - Factor 1 = localidad (A, B, C). - Factor 2 (anidado en F1) = muestra (1, .., 9).

102

Luis Cayuela

Introduccin al diseo de experimentos o n

Ejemplo 12. Se quiere ver el efecto de la luz articial sobre la produccin de o distintas especies de cereal. Se toman 4 invernaderos: 2 con luz natural, y 2 con luz articial. En cada uno de los 4 invernaderos se plantan las mismas 3 especies de cereal. En cada invernadero se toman 5 muestras de cada especie y se calcula la productividad (kg/ha). - Factor 1 = luz (2 niveles). - Factor 2 (anidado en F1) = invernadero (cuatro niveles). - Factor 3 = especie (tres niveles).

6.

Modelos mixtos

Son una expansin de los modelos lineales generales que permite la inclusin o o de variabilidad correlacionada y no constante. Los modelos mixtos proporcionan, por tanto, la exibilidad necesaria para modelar no slo las o medias, sino tambin las varianzas y covarianzas de los datos. Los modelos e mixtos son llamados as porque incluyen dos tipos de factores: 1. Factores jos. Son todos aquellos factores cuyos niveles han sido denidos a priori. Las conclusiones que saquemos de nuestro estudio no pueden, por tanto, extrapolarse a otros niveles del factor que no hayan sido incluidos en el modelo. Afectan slo a la media de y. o 2. Factores aleatorios. Son todos aquellos factores cuyos niveles representan una muestra aleatoria de todos los posibles niveles del factor. Las conclusiones que saquemos de nuestro estudio se reeren a todos los posibles nivels del factor, aunque no estn recogidos de forma expl e cita en el experimento. Afectan slo a la varianza de y. o A veces una variable explicativa representa una agrupacin en el espacio o o tiempo. Este tipo de diseos contradice los supuestos bsicos de los modelos n a 103

Luis Cayuela

Introduccin al diseo de experimentos o n

estad sticos estndar: la independencia de los errores. Los modelos mixtos a tienen en cuenta esta no-independencia de los errores al modelar la estructura de la covarianza introducida por el agrupamiento de los datos. Una de las grandes ventajas de los modelos mixtos es que economizan grados de libertad t picamnete utilizados por los niveles del factor. En vez de estimar una media para cada uno de los niveles del factor, el modelo de efectos aleatorios estima la distribucin de las medias (normalmente como la desviacin estndar de las o o a diferencias de las medias de cada uno de los niveles del factor alrededor de la gran media). Los modelos mixtos son particularmente utiles en los casos en dnde hay pseudorreplicacin temporal (medidas repetidas) o espacial (diseos o o n anidados o experimentos de tipo split-plot). En denitiva, los modelos mixtos nos van a permitir, por un lado, no desperciar grados de libertad en la estimacin de los parmetros de cada uno de los niveles del factor de o a agrupacin y, por otro, hacer uso de todas las mediciones que hemos realizado. o Un efecto aleatorio deber ser considerado como que proviene de una a poblacin de posibles efectos: la existencia de esta poblacin de posibles o o efectos es un supuesto extra que debemos de considerar en el caso de los modelos mixtos. As pues es ms propio hablar de predicin de efectos a o aleatorios que de estimacin de efectos aleatorios. Estimamos los efectos jos a o partir de los datos, pero hacemos predicciones sobre la poblacin de la cual o proceden nuestros efectos aleatorios. Los efectos jos son constantes desconocidas que estimamos a partir de los datos. Los efectos aleatorios gobiernan la estructura de varianza-covarianza de la variable respuesta. Los efectos jos son a menudo tratamientos experimentales que fueron aplicados bajo nuestra direccin, y los efectos aleatorios son variables que se distinguen o por el hecho de que no nos interesan desde el punto de vista de los parmetros a sino de la varianza que explican. Otra diferencia importante entre efectos jos y aleatorios es que los efectos jos tienen niveles del factor informativos, mientras que los efectos aleatorios tienen niveles del factor que no son informativos. La diferencia se ve mejor con un ejemplo. En los mam feros la variable categrica sexo tiene dos niveles: o macho y hembra. Para cualquier individuo que encuentres, el saber que es, por ejemplo, hembra, implica una gran cantidad de informacin sobre el individuo, o y esta informacin se desprende de la experiencia recogida de muchos otros o individuos hembra. Una hembra tendr una serie de atributos (asociados con a el hecho de ser hembra) sin importar la poblacin a la que pertenezca el o individuo en cuestin. Tomemos ahora una variable categrica como genotipo. o o Si tenemos dos genotipos en una poblacin podr o amos etiquetarlos A y B. Si tomamos dos genotipos de otra poblacin diferente podr o amos etiquetarlos igualmente A y B. En este caso, la etiqueta A no recoge ninguna informacin o de referencia sobre el genotipo en cuestin, salvo que es probable que sea o diferente al genotipo B. En el caso del sexo, el nivel del factor (macho o hembra) es informativo. Sexo es por tanto un factor jo. En el caso del genotipo, el nivel del factor (A o B) no es informativo: genotipo es, por tanto, un factor aleatorio. Los efectos aleatorios tienen niveles del factor que son extraidos de una poblacin mayor (potencialmente muy grande) en los cuales o los individuos pueden diferir en su respuesta de muchas maneras, pero en dnde nosotros no sabemos exactamente cmo o por qu dieren. o o e

104

Luis Cayuela

Introduccin al diseo de experimentos o n

6.1.

Efectos jos o aleatorios?

Es dif decidir si utilizar una variable explicativa categrica como efectos cil o jos o aleatorios. A continuacin se dan algunas claves que nos pueden ayudar o a decidir:
Estoy interesado en el tama o del efecto? Si la respuesta es s entonces n ,

factor jo.
Es razonable asumir que los niveles del factor provienen de una

poblacin de niveles? Si la respuesta es s entonces factor aleatorio. o ,


Hay sucientes niveles del factor a partir de los cuales estimar la

varianza de los efectos de la poblacin? Si la respuesta es no, entonces o factor jo. Zuur et al. (2007) estiman que al menos 5 niveles del factor son necesarios para poder considerar un factor como aleatorio, aunque es preferible que haya ms de 10 niveles para sto. En cualquier caso si slo a e o hay 2 o 3 niveles siempre se ha de tratar un factor como jo.
Son los niveles del factor informativos? Si la respuesta es s entonces ,

factor jo.
Son los niveles del factor simplemente etiquetas numricas? Si la e

respuesta es s entonces generalmente factor aleatorio. ,

6.2.

Modelos mixtos una alternativa para representar y analizar otros dise os de experimentos? n

Los modelos mixtos ofrecen una alternativa (pero no la unica) para la representacin y anlisis de los diseos de experimentos ms all de los diseos o a n a a n factoriales completamente aleatorizados, es decir, para todos los otros diseos n vistos en este curso, incluyendo el diseo por bloques aleatorizados, los diseos n n de medidas repetidas, los split-plot y los diseos anidados o jerarquizados. n Cualquier factor cuya respuesta se mida dentro de los sujetos (como en el caso de los diseos de medidas repetidas o el split-plot y la mayor de los diseos n a n anidados van a estar representados de alguna manera por un factor de agrupacin cuyos efectos son aleatorios. En la siguiente sesin se ver cmo o o a o analizar este tipo de diseos utilizando modelos mixtos. n

6.3.

Cuatro preguntas que hay que hacerse sobre el dise o de experimentos n

105

Luis Cayuela

Introduccin al diseo de experimentos o n

7.

Ejercicios

1. Se quiere ver cmo el efecto de la exposicin (solana, umbr rambla) y o o a, la localidad (Trbena, Crevillente) afectan al tamao de las hojas (en a n cm2 ) de encina. Para ello se disea un experimento en dnde se n o seleccionan aleatoriamente 24 individuos en tres zonas de solana, umbr a y rambla respectivamente dentro de cada una de las dos localidades de estudio. A cada individuo se le miden 20 hojas para evitar datos que pudieran ser at picos. Cmo es la naturaleza de cada uno de los o factores? 2. En un experimento agr colA se quiere investigar cmo la produccin de o o un determinado cultivo depende de tres variables: irrigacin (con dos o niveles: regado o no); densidad de siembra (con tres niveles: baja, media y alta); y fertilizacin (con tres niveles: baja, media y alta). El diseo o n experimental se plantea de la siguiente manera: se eligen cuatro parcelas agr colas independientes entre s Dichas parcelas son subidividas en dos . y a cada una de ellas se le aplica aleatoriamente uno de los dos tratamientos de irrigacin. Cada una de estas subparcelas es a su vez o dividida en tres partes y se aplica a cada una de ellas de manera aleatoria uno de los tres niveles de densidad de siembra. Por ultimo, a cada una de estas subparcelas ms pequeas se las divide en tres y se a n aplica a cada una de ellas uno de los tres niveles de fertilizacin. o Cuntos factores hay y cul es la naturaleza de cada uno de ellos? a a 3. En un experimento se quiere ver cmo el tipo de hbitat (bosque, o a matorral, pastizal) y distintos escenarios de cambio climtico (control, a aumento de la lluvia, disminucin de la lluvia) pueden afectar diferentes o respuestas en varias especies t picamente mediterrneas. Para ello se a selecciona una zona de bosque, una de matorral y una de pastizal, todas prximas entre s En cada una de ellas se instalan 8 parcelas de 2 x 2 m. o . Cada parcela es subdividida en 9 subparcelas y se simulan en tres de cada 9 uno de los tres escenarios de cambio climtico. Se plantan semillas a de las plantas objeto de estudio y se miden las respuestas al cabo de un tiempo (porcentaje de germinacin, crecimiento, produccin de biomasa o o leosa, etc). Cuntos factores tenemos en este estudio y cmo son? n a o

106

S-ar putea să vă placă și