Sunteți pe pagina 1din 59

ANLISIS DE LA VARIANZA

(ANOVA)
En las Ciencias Agronmicas y Biolgicas a partir de
conocimientos cientficos

modelos (abstraccin y simplificacin de la realidad)

Un modelo estadstico funcin que relaciona variables

parte determinstica y parte estocstica

ei = valor observado - valor esperado por el modelo

justifica el uso de tcnicas estadsticas de inferencia


Ejemplo: Modelo de regresin

y i .x i i

Trminos determinsticos Trmino


aleatorio

datos experimentales

modelo que explica el comportamiento de


la variable de respuesta Y
Datos de un experimento modelo para explicar el
comportamiento de la variable de respuesta (Y)

Ejemplo: se desea evaluar el efecto de tres tipos de fertilizante


(A, B y C) sobre el rendimiento de trigo

A B C

datos de cada UE son una muestra de una poblacin de referencia

Supongo que:

- hay una poblacin de referencia para cada nivel de un factor

- las poblaciones tienen misma varianza ( 2)


Si las poblaciones tienen
diferentes valores de media (i)
1 2 3
Una observacin de Y puede definirse con el modelo COMPLETO:

y ij = i + ij

j-sima observacin
error experimental
del i-simo grupo

media del i-simo grupo

refleja que existe una relacin entre la variable Y


y la variable independiente
Si las poblaciones tienen
iguales valores de media ()

Una observacin puede definirse con el modelo REDUCIDO:

y ij = + ij

j-sima observacin
error experimental
del i-simo grupo

media general

no existe una relacin entre la variable Y


y la variable independiente
CUL DE LOS MODELOS CARACTERIZA MEJOR A LOS DATOS
DEL EXPERIMENTO, EL COMPLETO O EL REDUCIDO?

qu tan bien se ajustan los datos a cada modelo?

usando

suma de cuadrados estimada para el error experimental


(SCEE)

t r
SCEE ij2
i 1 j 1
suma de cuadrados estimada para el error experimental (SCEE)

modelo reducido modelo completo

1 2 3
una poblacin varias poblaciones

Ho : 1 = 2 = 3 = H1 : 1 2 3

y ij = + ij y ij = i + ij

ij = (yij - ) ij = (yij - i)

SCEER = (y ij - )2 SCEEC = (y ij - i)2


Las sumas de cuadrados sern diferentes

SCEER > SCEEC

diferencias entre las diferencias entre las


observaciones y la media
general
observaciones y la media de
su grupo

1 2 3

( yij .. ) ( yij i ) ( i .. )
t r
(SCEER SCEEc )= SCTr =
i 1 j 1
( i ) 2

la diferencia entre estas SCEE reduccin en la SCEE cuando


se incluyen los tratamientos en el modelo

suma de cuadrados de tratamientos (SCTr)

SCEER puede considerarse suma de cuadrados total (SCT): es la


diferencia de cada observacin respecto de la media general

SCT SCEEC = SCTr


t r

(SCEER SCEEc )= SCTr =


i 1 j 1
( i ) 2
SCT = SCTr + SCEE
t r t r t r

ij
( y Y
i 1 j 1
..) 2
i.
(Y Y ..) 2

i 1 j 1
ij i.
( y Y
i 1 j 1
) 2

estima a estima a i

Se hizo una particin de la variacin total en dos partes cada


una atribuible a una fuente de variacin independiente

Estas sumas de cuadrados son aditivas


GRADOS DE LIBERTAD
(representan el nmero de trminos con informacin independiente en
las sumas de cuadrados)

Para la SCT: = (n 1) se estim un parmetro ()

Para la SCEEc: e = (n t) se estimaron t parmetros ( 1, 2, ..., t)

Para SCTr: t = (n 1) (n t) = (t 1) se deduce por diferencia

Los grados de libertad tambin son aditivos


Anlisis de la Varianza (ANOVA)
Es el procedimiento aritmtico mediante el cual la variacin
total de un conjunto de datos se particiona o divide en dos o
ms componentes, cada uno de los cuales se puede atribuir a
una fuente o factor identificable (fuente de variacin).

efecto de factores
efecto de factores externos que han sido
experimentales controlados de alguna
(tratamientos) manera (opcional)

variacin debida a las fuentes de


variacin no controladas
(error experimental)
ANOVA
Qu hace el ANOVA?

Resume la magnitud de las fuentes de variacin del


experimento

Para qu se usa el ANOVA?

Para probar si son iguales las medias de varias


poblaciones (de los diferentes grupos, o de los
diferentes niveles del factor).

Ideal para analizar datos de experimentos


El ANOVA puede diferenciarse bsicamente en:

* ANOVA a un criterio de clasificacin = ANOVA de un


factor = ANOVA de una va

* ANOVA a dos criterios de clasificacin = ANOVA de


dos factores = ANOVA de dos vas
ANOVA I
(de un factor o a un criterio de clasificacin)

Las observaciones (datos) se clasifican de acuerdo


con un nico criterio

CRITERO: el que constituye los grupos


experimentales definidos por la variable
explicativa principal

Queremos comparar las medias de esos grupos


experimentales
ANOVA I
Las hiptesis que se plantean son:

Ho : 1 = 2 = 3 =... = t =

Hi : alguna de las medias es diferente

Si la Ho es V : i = i - = 0

efecto del tratamiento o factor


Si la Ho es F : i - = i (variacin debida a
la variable independiente)
ANOVA I

si i - = i i = + i

Si volvemos al modelo completo:

y ij = i + ij

entonces la expresin anterior puede escribirse como:


y ij = + i + ij

MODELO ESTADSTICO LINEAL DEL ANOVA I


MODELO ESTADSTICO LINEAL DEL ANOVA I

y ij = + i + ij

j-sima observacin del i-simo grupo

media general

efecto del i-simo tratamiento o factor

error experimental ij n (0, 2)

i = 1, 2, 3, ..., t t = n de grupos o tratamientos


j = 1, 2, 3, ..., r r = n de repeticiones del cada tratamiento
j = 1, 2, ri ri = tamao de la muestra del i-simo grupo o
n de repeticiones del i-simo tratamiento
r1 + r2 + r3 + ... + rt = n
Para este modelo se supone:

1.- Que los ij son independientes y tienen una distribucin


normal con media cero y varianza constante: ij n (0, 2E).

2.- Cuando planteamos un modelo de efectos fijos supone

que los i son parmetros desconocidos pero cumplen que


t


i 1
i 0

Cuando planteamos un modelo de efectos aleatorios los


efectos se denotan como Ai supone que los Ai son
independientes y tienen distribucin normal con media cero y
varianza 2A : Ai n (0, 2A)
notacin y forma de presentar los datos para el anlisis

grupos o tratamientos
repeticiones 1 2 3 .. i ... t
.
1 y11 y21 y31 .. yi1 ... yt1
.
2 y12 y22 y32 .. yi2 ... yt2
.
3 y13 y23 y33 .. yi3 ... yt3
.
... ... ... ... .. ... ... ...
.
R y1r y2r y3r .. yir ytr
.
Totales Y1. Y2. Y3. .. Yi. ... Yt. Y ..
.
Medias Y1 Y2 Y3 Yi Yt Y..
suma de cuadrados SC
CM
grados de libertad gl
E (CMTr ) 2
r
i
2

2
r
( i )2
2 r A2
t 1 t 1

valores = de 0 ?

Si Ho verdadera Si Ho es falsa
(valores = 0 ) (valores 0 )
es un buen estimador de 2 No es un buen estimador de 2
La E(CMTr) = 2 La E(CMTr) = 2 + r . 2A

componente de varianza
aadida por los tratamientos
existe una componente aadida de la
varianza debida a los tratamientos ( 2A)?
Para poder trabajar en forma ordenada

y ij = + i + ij
PRECISIN del experimento y

CONFIABILIDAD de las conclusiones


EJEMPLO ANOVA DE UN FACTOR
Variable explicativa principal: racin, con 5 niveles
Variable de respuesta: aumento de peso en kg
UE: cada cerdo n = 5 tratamientos x 6 rplicas = 30

Modelo estadstico: y ij = + i + ij

y ij = valor de aumento de peso para el j-simo cerdo que recibi la i-


sima racin
= media general de aumento de peso

i = efecto de la i-sima racin

ij = error o residuo del el j-simo cerdo que recibi la i-sima racin

ij n (0, 2)
i = 1 a 5 (5: n de raciones)
EJEMPLO ANOVA DE UN FACTOR
y ij = + i + ij
Hiptesis
Ho : 1 = 2 = 3 = 4 = 5 i = 0 el aumento de peso promedio
es el mismo para todas las raciones no hay efecto del factor racin
sobre el aumento de peso.

Hi : alguna i es diferente i 0 alguna racin es mejor ya que


produce un aumento de peso promedio mayor hay efecto del factor
racin sobre el aumento de peso
Funcin de densidad
F de Snedecor(4,25,0): p(evento)=0,0500
1,0

Estadstico de prueba: Criterio de decisin:


0,8

Densidad
CMTr
0,5

Fc F( t , e ) 0,3

CMEE 0,0
0,00 2,00 4,00 6,00 8,00
Variable
y ij = + i + ij

Decisin?

Conclusin?
y ij = + i + ij

Y.. 440 12,41


Y.. 14,67 CV .100 24,01%
n 30 14,67

Los datos son precisos, la variabilidad del aumento de


peso de los cerdos no controlada por el experimento
corresponde a un 24% del promedio
ANOVA A DOS CRITERIOS DE CLASIFICACIN

Corresponde al caso en que los datos pueden agruparse o clasificarse de


acuerdo a dos criterios (factores)
A es un factor con a niveles
B es otro factor con b niveles

Puede ser que


* se quiera evaluar el efecto de ambos factores
* se quiera evaluar slo al factor A y el factor B representa a los
diferentes niveles de un factor ambiental medible que se quiere controlar
(caso por ejemplo de Diseo en bloques completos al azar)
MODELO ESTADSTICO LINEAL DEL ANOVA II

y ij = + i + j + ij

una observacin cualquiera


j-sima observacin del i-simo grupo

media general

efecto del i-simo nivel del factor A

efecto del j-simo nivel del factor B

error experimental

i = 1, 2, 3, ..., a a = n de niveles del factor A


j = 1, 2, 3, ..., b b = n de niveles del factor B
ij n (0, 2)
Los datos se presentan de la siguiente forma:
y ij = + i + j + ij

Las hiptesis planteadas son:

1) Ho : 1. = 2. = 3. = ... = a. Hi : alguna es i. diferente

o i = 0 o i 0

2) Ho : .1 = .2 = .3 = ... = .b Hi : alguna es .j diferente

o j = 0 o j 0
y ij = + i + j + ij

La suma de cuadrados total (SCT) se particiona en:


SCA : variacin debida al factor A
SCB : variacin debida al factor B
SCEE : variacin residual, no explicada ni por A ni por B.
y ij = + i + j + ij
y ij = + i + j + ij
y ij = + i + j + ij
y ij = + i + j + ij
y ij = + i + j + ij
CLASIFICACIN DEL ANOVA

en funcin de qu tipo de efecto tiene el factor que estamos evaluando

Modelo de efectos fijos

Modelo de efectos aleatorios


Modelo de efectos fijos
Se toman k niveles de un factor para ser comparados
Los niveles son fijados (seleccionados especficamente) por el
investigador y son repetibles.
Los datos que surgen de experimentos diseados para contestar a una
pregunta particular.
El inters se centra en evaluar si algn tratamiento produce en promedio
efectos diferentes a otro, por lo que se efectan comparaciones de
medias. Las inferencias se refieren exclusivamente a los k niveles y no se
pueden hacer extensivas a otros que no fueron incluidos.
En este caso los efectos del factor (i) son constantes desconocidas
(parmetros). Las hiptesis que se plantean se refieren a estos
parmetros, tal como se plantearon ms arriba.

Ejemplo: se realiza un experimento para evaluar el efecto de cuatro tipos de


fertilizante sobre el rendimiento de una variedad de trigo.
Modelo de efectos aleatorios

Cuando los niveles del factor de inters son muchos y el investigador


selecciona al azar k de esos niveles.
El investigador no tiene inters en niveles particulares del factor que
incluy en el experimento, sino que desea realizar inferencia que puedan
extenderse a toda la poblacin de niveles del factor.
Dado que los efectos son aleatorios no interesa calcular la magnitud de
estos efectos (Ai), no interesa comparar sus medias.

Dado que los niveles del factor se seleccionaron al azar de una poblacin,
los efectos observados son valores de variables aleatorias Ai,
respectivamente.
Se supone que las Ai son normales, con media igual a cero y con varianza
2A

Se supone que las Ai son independientes de los trminos de error i

El parmetro de inters es 2A
Modelo de efectos aleatorios

Si los efectos de todos los niveles del factor son iguales 2A = 0


Si los efectos son muy diferentes, entonces 2A es muy grande (>0)

Si R Ho - no se realizan comparaciones entre las medias


- se calcula la magnitud de la componente aadida de la
varianza entre grupos o tratamientos
- se calcula el porcentaje de contribucin del factor a la
variacin total de los datos.

Ejemplo: Se desea evaluar si la localidad tiene efecto sobre el rendimiento de algn


cultivo, ya que las localidades tienen diferencias edficas y climticas entre ellas. Para
ello se realiza un experimento en el que analiza el rendimiento del cultivo en 6 de esas
localidades seleccionadas al azar.
El tipo de efecto se ver reflejado en el modelo estadstico del ANOVA:

efectos fijos y ij = + i + ij

efectos aleatorios y ij = + A i + ij

En el caso del ANOVA I el tipo de efecto del factor


- no afecta los clculos ni el anlisis
- la interpretacin de los resultados y el alcance de las conclusiones
son diferentes.
- el modelo de efectos aleatorios tendr mayor validez externa, ya
que se aplica a la poblacin de niveles del factor.
Cmo distinguir entre los efectos aleatorios y los fijos?
1) Si se repite el mismo estudio, tendremos los mismos niveles en la
variable independiente? Si es un efecto fijo
No es un efecto aleatorio
2) Los niveles del factor se pueden pensar como una muestra
aleatoria de una gran poblacin? Si es un efecto aleatorio
No es un efecto fijo
3) Se tiene inters en estos niveles particulares o simplemente son
niveles a los que se lleg al realizar este estudio?
Si es la primera opcin es un efecto fijo
Si es la segunda opcin es un efecto aleatorio.

4) Se quiere conocer la magnitud del efecto i ?

Si es un efecto fijo
No es un efecto aleatorio
Se termina aqu el anlisis?

Cmo se realiza el anlisis si el factor es de efectos aleatorios?

Cmo se hacen los clculos si el experimento no es balanceado?

i.
Y 2
t
Yi.2
SCTr 1
C SCTr C
r i 1 ri
Resumiendo

Definimos un modelo que expresa la relacin entre variable de


respuesta y variable independiente.

Presentamos la tcnica de ANOVA: particin de la variabilidad de un


conjunto de datos en componentes aditivas (variabilidad dentro de cada
grupo y variabilidad entre los grupos).

Expresamos estas variaciones de forma numrica mediante sumas de


cuadrados.

Con las sumas de cuadrados calculamos un estadstico de prueba para


contrastar la igualdad de las medias de los grupos.

Diferenciamos modelo de efectos fijos y de efectos aleatorios.

Desarrollamos ejemplos agronmicos de aplicacin del ANOVA I y del


ANOVA II.
BIBLIOGRAFA

Kuehl, R. O. 2001. Diseo de experimentos . 2 edicin.


Editorial Thomson Learning.

Steel, R. G. D. & J. H. Torrie. 1985. Bioestadstica:


principios y procedimientos. Editorial Mac Graw-Hill.

Di Rienzo, J.; Casanoves, F.; Gonzlez, L.; Tablada, E.;


Daz, M.; Robledo, C.; Balzarini, M. 2005. Estadstica
para las Ciencias Agropecuarias. Editorial Brujas.

Montgomery, D. C. 1991. Diseo y anlisis de


experimentos. Grupo Editorial Iberoamrica.

S-ar putea să vă placă și