Sunteți pe pagina 1din 5

Anlisis de la varianza (ANOVA) I: Conceptos y Definiciones

INTRODUCCION El anlisis de la varianza o ANOVA es una herramienta estadstica que permite comparar simultneamente varias medias muestrales de muestras independientes. Cuando se trabaja con dos muestras se usa el modelo de Student para muestras independientes. El ANOVA es un mtodo ms general, que se extiende a ms de dos muestras y se puede demostrar que coincide con Student si se aplica a solo dos muestras. Por lo tanto, el modelo de Student es un caso particular del ANOVA. Las medias se comparan para establecer si son todas iguales (hiptesis nula) o si al menos una de ellas es distinta a las dems (hiptesis alternativa). El nombre ANOVA hace alusin a que la comparacin de ms de dos medias se realiza mediante el clculo y la comparacin de dos varianzas, pero se debe tener presente que el objetivo es comparar medias y no varianzas. PRESENTACION DE DATOS PARA EN UN ANOVA SIMPLE (UN FACTOR) De una poblacin a estudiar, se eligen n elementos al azar. Estos n elementos sern las unidades experimentales sobre los cuales se evaluara varios tratamientos o niveles de un factor o criterio A. Por ejemplo: Supongamos que se desea evaluar el efecto de tres drogas A, B y C sobre el crecimiento de ratones. El factor o criterio ser el efecto de las drogas en el crecimiento, mientras que las distintas drogas A, B y C constituyen los niveles o tratamientos del factor. La cantidad de tratamientos o niveles a comparar se indica con la letra I. Por lo tanto, I ser un nmero mayor o igual que 2. En el ejemplo anterior, el nivel del factor es 3 ya que se cuenta con 3 drogas a comparar A, B y C. A su vez, a los distintos tratamientos individuales, se los denomina con la letra i, la cual puede tomar valores entre: 1 i I En el ejemplo, i puede tomar los valores 1,2 y 3 ya que se cuenta con tres drogas como mximo para comparar.

Las n unidades experimentales se dividen en i grupos, es decir, se dividirn en tantos grupos como tratamientos haya. En nuestro, ejemplo como hay tres tratamientos posibles, las n unidades experimentales se dividirn en tres grupos.

A su vez, llamaremos ni al nmero de unidades experimentales que reciben el tratamientos i. No es necesario, en general, que los grupos estn formados por la misma cantidad de individuos, pero debe cumplirse que: n = ni
i I

Es decir que la suma del total de unidades experimentales de cada grupo sea igual al nmero total de la muestra n. Cada tratamiento individual i se aplica sobre una unidad experimental ni . De esta manera es posible definir una variable aleatoria llamada variable de respuesta a la que llamaremos Y. Para distinguir los tratamientos i y las unidades experimentales j , la variable aleatoria de respuesta se indica con dos subndices : Yij = respuesta de la unidad experimental j que recibi el tratamiento i Donde: i = 1; 2;.....; I y j = 1; 2;.....; ni

Las distintas variables Yij son independientes y tienen una distribucin: Yij : N (ui ; ) Para: i = 1; 2;.....; I j = 1; 2;.....; ni Purd En los experimentos de un factor las medidas u observaciones se obtiene para a grupos Factor A N 1 2 3 . Grupo 1 Grupo 2 Grupo i Y11 Y11 Y11 . Y12 Y22 Y32 . Y13 Y23 Y33 . ... ... ... ... ... Grupo I YI1 YIj2 YI3 .

j . Total es Medi as de Grup o

Y1 j . n

Y2j . T1 T1

Y3j . T2 T2

... ... T3 T3

YIj . ... TI TI ...

Anlisis de la varianza II: Formulas De Calculo


SUMA DE CUADRADOS TOTALES T2 SCT = Y n ij
2 ij

SUMA DE CUADRADOS ENTRE Ti 2 T 2 Ti 2 Ti 2 Ti 2 T 2 SCE = = + + .... + n n1 n2 ni n i ni

SUMA DE CUADRADOS DENTRO


SCD = SCT SCE

CUADRADOS MEDIOS ENTRE CME = SCE ( I 1)

CUADRADOS MEDIOS DENTRO CME = SCD (n I )

ESTADISTICO DE PRUEBA

F=

CME SCE /( I 1) = CMD SCD /(n I )

TRANSFORMACION LINEAL YIJ = a YIJ + b

Anlisis de la varianza (ANOVA) III: Tests a Posteriori


TEST DE SCHEFFE Se utiliza cuando todos los ni son distintos. Se rechaza H0 si: 1 1 ( I 1) F ; I 1;n 1 CMD + ni ni

Yi g Yi g

O bien se rechaza H0 si el cero no se encuentra en el intervalo: C ( LS < i i < LI

) = 1

Donde los limites superior e inferior se calculan con: Yi g Yig 1 1 CMD + ( I 1) F ; I 1;n 1 ni ni

TEST DE TUCKEY

Se utiliza cuando todos los ni son iguales. Se rechaza H0 si el cero no se encuentra en el intervalo: C ( LS < i i < LI

) = 1

Donde los limites superior e inferior se calculan con

) q ; I ;n I CMD / J (Yi g Yi g O bien se rechaza H0 si q ; I ;n I CMD / J Yi g Yi g Donde : J = n1 = n2 = ..... = ni Y q es la distribucin de rango studentizado.