Documente Academic
Documente Profesional
Documente Cultură
dentro
entre
s
s
Fc =
bioestadistica
ANOVA (ANalysis Of Variance)
Finalidad
Comparar simultneamente
varias medias
Modelo I efectos fijos
ij i ij
x c o + + =
x
grupos
A B C
C
c
Bj
o
B
Variacin total
x
Bj
( ) ( )
i ij
x
i ij
x + =
( ) ( )
i ij i ij
x x x x x x + =
( ) ( ) ( ) ( )( )
i ij i i ij i ij
x x x x x x x x x x + + = 2
2
2 2
( ) ( ) ( )
ij ij ij
i
x
ij
x
i
x
ij
x x x
2
2 2
En la poblacin
o
i
c
ij
En la muestra
Elevando al cuadrado:
Sumando:
SC TOTAL
SC ENTRE
grupos
SC DENTRO de
grupos (residual)
( ) ( ) ( )
ij ij ij
i
x
ij
x
i
x
ij
x x x
2
2 2
SC TOTAL
SC ENTRE
grupos
SC DENTRO de
grupos (residual)
1
) (
2
2
= =
a
x x
gl
SCentre
s
ij
ij
entre
entre
a n
x x
gl
SCdentro
s
ij
i ij
dentro
residual o dentro
= =
2
2
) (
Recordar
MEDIAS DE CUADRADOS ESTIMA
MC entre = SC entre/(a-1)
a = n
o
de grupos
tamao medio
del grupo
Mod I
MC dentro = SC dentro/(n-a )
n = tamao de la muestra total
( ) 1
2
2
+
a
n
i
i
o
o
2
o
Si Ho es verdadera : MC entre = MC dentro en la poblacin
0 : :
0
=
i
i
H
HIPOTESIS
Modelo I
En general
=
i
i
H : :
0
=
i
n
TEST DE HIPOTESIS
F
calc
= MC entre/ MC dentro
se compara con F
tab
(a-1) y (n-a) grados de libertad
Supuestos para la validez del test
Normalidad de
los residuos (c
ij
)
Homocedasticidad
de los residuos
Independencia de las observaciones
A
C B
n
T
n
T
entre SC
2
i
i
2
i
=
n
T
total SC
2
ij
2
ij
x
=
entre SC total SC dentro SC =
=
j
ij
x T
i
=
ij
ij
x T
=
i
i
n n
=
i
n
Donde:
En el i-simo grupo
Tamao del i-simo grupo
Gran total
Tamao total de la muestra
17
0.0
0.2
0.4
0.0 1.5 3.0 4.5
f (x)
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GL MEDIA DE
CUADRADOS
Fcalc
ENTRE
GRUPOS
SC entre a-1
DENTRO DE
GRUPOS
SC dentro n-a
TOTAL SC total n-1
1) (a entre SC
a) (n dentro SC
dentro MC
entre MC
El F
calculado
se compara con
el F
tabulado
con (a-1) y (n-a) GL
CALCULO DE LAS SUMAS DE CUADRADOS
A B C D
4.4 8.6 3.4 8.9
5.9 4.5 7.3 0.0
6.2 8.4 8.8 1.7
6.3 8.7 0.2
0.1
Ti 22.8 30.2 19.8 10.6 T =83.4
ni 4 4 5 3 n = 16
162.4775 16
2
83.4 597.2 total SC = =
39.1088
16
2
83.4
3
2
10.6
5
2
19.8
4
2
30.2
4
2
22.8
entre SC = + + + =
123.3687 39.1088 162.4775 entre SC total SC dentro SC = = =
2 . 597 =
ij
2
ij
x
=
i
i
H : :
0
16 = =
i
n n
4 = a
gl numerador (trat-1)
gl
denominador
(n-trat)
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GL MEDIA DE
CUADRADOS
Fcalc
ENTRE
GRUPOS
39.1088 3 13.036 1.27
DENTRO DE
GRUPOS
123.3687 12 10.281
TOTAL
162.4775 15
F
0.95
(3, 12)= 3.49
F
calc
menor que F
tab
No Se rechaza Ho
las medias no difieren entre s
3
12
A B C
2.6 3.2 2.4
2.4 3 2.8
2.9 2.8 2.5
2.6 2.9 2.7
2.7 3.3 2.5
2.9 3.1 2.9
2.5 3 2.4
2.8 3.4 2.6
2.5 3.2 2.2
3 3.2 2.6
-> trat = A
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.69 .2024846 2.4 3
-> trat = B
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 3.11 .1852926 2.8 3.4
-> trat = C
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.56 .2065591 2.2 2.9
2
2
.
5
3
3
.
5
g
a
n
a
n
c
i
a
d
e
p
e
s
o
(
k
g
)
A B C
(30 Preoperative Patients)
Ganancia de Peso por Tratamiento
. oneway x y,b
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 1.65266668 2 .826333338 21.01 0.0000
Within groups 1.06200005 27 .039333335
------------------------------------------------------------------------
Total 2.71466672 29 .093609197
Bartlett's test for equal variances: chi2(2) = 0.1124 Prob>chi2 = 0.945
Comparison of x by y (Bonferroni)
Row Mean-|
Col Mean | A B
---------+----------------------
B | .42
| 0.000
C | -.13 -.55
| 0.463 0.000
Supuestos del ANOVA
Observaciones Independientes.
Distribucin Normal.
Varianzas Homogneas.
Independencia de las Observaciones
Con el fin de obtener inferencias vlidas, resulta
importante determinar si los errores se encuentran
correlacionados.
El supuesto ms importante es la independencia de las
observaciones, pues si no hubo asignacin aleatoria de
tratamientos a unidades experimentales, entonces los
resultados pueden incluir un efecto persistente de factores
no considerados en el anlisis. Esto invalida el
experimento
Normalidad
No es tan importante como la Independencia de
las Observaciones, pues el ANOVA es robusto.
Esto quiere decir que, aunque las observaciones no
sean normales, las medias de los tratamientos son
aproximadamente normales debido al Teorema
Central del Limite.
Ante la falta de normalidad se puede optar por el
uso de transformaciones o, como ltimo recurso,
el uso de mtodos no paramtricos.
Homogeneidad de varianzas
Esta prueba resulta fundamental, pues cualquier situacin
de heterogeneidad de las varianzas invalida las inferencias
realizadas.
Pueden existir grupos muy homogneos y, en el caso de
existir un grupo muy heterogneo, sera posible no detectar
diferencias entre los grupos con varianzas homogneas por
el efecto de la contribucin a la varianza de ese grupo
heterogneo.
Cuando existe el problema de heterogeneidad de
varianzas, lo apropiado es emplear transformaciones o
mtodos no paramtricos.
Anlisis de residuos
Homogeneidad de Varianzas
Bartlett
Normalidad
Kolmogorov-Smirnov
Autocorrelacin
Durbin-Watson
Es importante mencionar que el empleo de estadstica no
paramtrica o el uso de transformaciones no elimina el
problema de la falta de aleatoriedad (falta de
independencia), es decir, la ejecucin incorrecta de un
experimento no tiene un remedio en la etapa del anlisis.