Sunteți pe pagina 1din 30

Anlisis de Varianza (ANOVA)

9. Comparando ms de dos medias. Anlisis de Varianza.





Objetivos:
Al finalizar esta unidad el estudiante ser capaz de:
9.1 Describir los elementos estadsticos de un diseo experimental.
9.2 Definir el objetivo de un anlisis de varianza.
9.3 Formular hiptesis adecuadas para las diferentes situaciones.
9.4 Describir la distribucin de F.
9.5 Construir la tabla de anlisis de varianza.
9.6 Calcular F e interpretar los resultados de la prueba de hiptesis.



Contenidos:
9.1 Elementos del diseo de experimentos.
9.2 Supuestos para la aplicacin del anlisis.
9.3 Anlisis de varianza simple.
9.4 Anlisis de varianza de dos vas.
SITUACION BASICA
Un factor ( tratamientos) Categrica
Una variable de respuesta: Cuantitativa
Pregunta principal: Las medias de cada grupo
difieren o estn afectadas por el tratamiento?
Nmero de grupos: El caso particular de dos
grupos , utilizamos test de t
Nmero de grupos: Cuando son ms de 2 grupos:
Problema de las comparaciones multiples
COMPARACION DE MAS DE DOS MEDIAS
Cuando se comparan dos medias a nivel de significacin o,
la probabilidad de cometer un error de tipo I es o

Cuando se comparan de a dos a medias tenemos
comparaciones posibles.
P(x=0)=(1-p)^n P(x>0)=1-[(1-p)^n]
Probabilidad de cometer un erro tipo I = 1-[(1-) ]

Para 5 grupos tenemos 10 comparaciones posibles
Para un o = 0,05 :
P(x>0)=1-[(1-0,05)^10]= 0,40
a
C
2
a
C
2
Una solucin para este problema es la
CORRECCION DE BONFERRONI :
a
C
2
'
o
o =
Suele ser excesivamente severa
En el ejemplo:
005 , 0
10
05 . 0
' = = o
HAY OTRAS ALTERNATIVAS: UNA DE ELLAS ES EL

ANALISIS DE LA VARIANZA
2
2

dentro
entre
s
s
Fc =
bioestadistica
ANOVA (ANalysis Of Variance)
Finalidad
Comparar simultneamente
varias medias
Modelo I efectos fijos
ij i ij
x c o + + =
x
grupos
A B C

C
c
Bj

o
B

Variacin total
x
Bj
( ) ( )
i ij
x
i ij
x + =
( ) ( )
i ij i ij
x x x x x x + =
( ) ( ) ( ) ( )( )
i ij i i ij i ij
x x x x x x x x x x + + = 2
2
2 2
( ) ( ) ( )


ij ij ij
i
x
ij
x
i
x
ij
x x x
2
2 2
En la poblacin
o
i

c
ij

En la muestra
Elevando al cuadrado:
Sumando:
SC TOTAL
SC ENTRE
grupos
SC DENTRO de
grupos (residual)
( ) ( ) ( )


ij ij ij
i
x
ij
x
i
x
ij
x x x
2
2 2
SC TOTAL
SC ENTRE
grupos
SC DENTRO de
grupos (residual)
1
) (

2
2


= =
a
x x
gl
SCentre
s
ij
ij
entre
entre
a n
x x
gl
SCdentro
s
ij
i ij
dentro
residual o dentro


= =
2
2
) (


Recordar
MEDIAS DE CUADRADOS ESTIMA

MC entre = SC entre/(a-1)
a = n
o
de grupos

tamao medio
del grupo



Mod I
MC dentro = SC dentro/(n-a )
n = tamao de la muestra total
( ) 1
2
2

+

a
n
i
i
o
o
2
o
Si Ho es verdadera : MC entre = MC dentro en la poblacin
0 : :
0
=
i
i
H
HIPOTESIS
Modelo I
En general
=
i
i
H : :
0
=
i
n
TEST DE HIPOTESIS
F
calc
= MC entre/ MC dentro

se compara con F
tab
(a-1) y (n-a) grados de libertad

Supuestos para la validez del test
Normalidad de
los residuos (c
ij
)
Homocedasticidad
de los residuos
Independencia de las observaciones
A
C B
n
T
n
T
entre SC
2
i
i
2
i

=
n
T
total SC
2
ij
2
ij
x

=
entre SC total SC dentro SC =

=
j
ij
x T
i

=
ij
ij
x T

=
i
i
n n
=
i
n
Donde:
En el i-simo grupo
Tamao del i-simo grupo
Gran total
Tamao total de la muestra
17
0.0
0.2
0.4
0.0 1.5 3.0 4.5
f (x)
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GL MEDIA DE
CUADRADOS
Fcalc
ENTRE
GRUPOS
SC entre a-1
DENTRO DE
GRUPOS
SC dentro n-a
TOTAL SC total n-1
1) (a entre SC
a) (n dentro SC
dentro MC
entre MC
El F
calculado
se compara con

el F
tabulado
con (a-1) y (n-a) GL
CALCULO DE LAS SUMAS DE CUADRADOS
A B C D
4.4 8.6 3.4 8.9
5.9 4.5 7.3 0.0
6.2 8.4 8.8 1.7
6.3 8.7 0.2
0.1
Ti 22.8 30.2 19.8 10.6 T =83.4
ni 4 4 5 3 n = 16
162.4775 16
2
83.4 597.2 total SC = =
39.1088
16
2
83.4
3
2
10.6
5
2
19.8
4
2
30.2
4
2
22.8
entre SC = + + + =
123.3687 39.1088 162.4775 entre SC total SC dentro SC = = =
2 . 597 =

ij
2
ij
x
=
i
i
H : :
0
16 = =

i
n n
4 = a
gl numerador (trat-1)
gl
denominador
(n-trat)
FUENTE DE
VARIACION
SUMA DE
CUADRADOS
GL MEDIA DE
CUADRADOS
Fcalc
ENTRE
GRUPOS
39.1088 3 13.036 1.27
DENTRO DE
GRUPOS
123.3687 12 10.281
TOTAL
162.4775 15
F
0.95
(3, 12)= 3.49

F
calc
menor que F
tab
No Se rechaza Ho
las medias no difieren entre s
3
12
A B C
2.6 3.2 2.4
2.4 3 2.8
2.9 2.8 2.5
2.6 2.9 2.7
2.7 3.3 2.5
2.9 3.1 2.9
2.5 3 2.4
2.8 3.4 2.6
2.5 3.2 2.2
3 3.2 2.6
-> trat = A
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.69 .2024846 2.4 3

-> trat = B
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 3.11 .1852926 2.8 3.4

-> trat = C
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.56 .2065591 2.2 2.9
2
2
.
5
3
3
.
5
g
a
n
a
n
c
i
a

d
e

p
e
s
o

(
k
g
)
A B C
(30 Preoperative Patients)

Ganancia de Peso por Tratamiento
. oneway x y,b
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 1.65266668 2 .826333338 21.01 0.0000
Within groups 1.06200005 27 .039333335
------------------------------------------------------------------------
Total 2.71466672 29 .093609197

Bartlett's test for equal variances: chi2(2) = 0.1124 Prob>chi2 = 0.945


Comparison of x by y (Bonferroni)
Row Mean-|
Col Mean | A B
---------+----------------------
B | .42
| 0.000
C | -.13 -.55
| 0.463 0.000
Supuestos del ANOVA
Observaciones Independientes.
Distribucin Normal.
Varianzas Homogneas.
Independencia de las Observaciones
Con el fin de obtener inferencias vlidas, resulta
importante determinar si los errores se encuentran
correlacionados.

El supuesto ms importante es la independencia de las
observaciones, pues si no hubo asignacin aleatoria de
tratamientos a unidades experimentales, entonces los
resultados pueden incluir un efecto persistente de factores
no considerados en el anlisis. Esto invalida el
experimento
Normalidad
No es tan importante como la Independencia de
las Observaciones, pues el ANOVA es robusto.
Esto quiere decir que, aunque las observaciones no
sean normales, las medias de los tratamientos son
aproximadamente normales debido al Teorema
Central del Limite.

Ante la falta de normalidad se puede optar por el
uso de transformaciones o, como ltimo recurso,
el uso de mtodos no paramtricos.

Homogeneidad de varianzas
Esta prueba resulta fundamental, pues cualquier situacin
de heterogeneidad de las varianzas invalida las inferencias
realizadas.

Pueden existir grupos muy homogneos y, en el caso de
existir un grupo muy heterogneo, sera posible no detectar
diferencias entre los grupos con varianzas homogneas por
el efecto de la contribucin a la varianza de ese grupo
heterogneo.

Cuando existe el problema de heterogeneidad de
varianzas, lo apropiado es emplear transformaciones o
mtodos no paramtricos.
Anlisis de residuos
Homogeneidad de Varianzas
Bartlett
Normalidad
Kolmogorov-Smirnov
Autocorrelacin
Durbin-Watson

Es importante mencionar que el empleo de estadstica no
paramtrica o el uso de transformaciones no elimina el
problema de la falta de aleatoriedad (falta de
independencia), es decir, la ejecucin incorrecta de un
experimento no tiene un remedio en la etapa del anlisis.

S-ar putea să vă placă și