Sunteți pe pagina 1din 60

ANALISIS DE VARIANZA

Sesin

JorgeCordovaE.com

AGENDA
1. Conceptos sobre el ANOVA
2. El ANOVA con un factor variable
3. El ANOVA con dos factores variables y una sola
muestra.
4. El ANOVA con dos factores variables y varias
muestras

JorgeCordovaE.com

4.1 Conceptos
p
A Qu
A.
Q es ell ANOVA?
Es un mtodo de clculo para probar la hiptesis de
que las medias de dos o mas poblaciones son iguales.
Ejemplos:

Comparacin de efectos logrado por cinco clases


de antibiticos.

Determinar cul de los cuatro mtodos de


capacitacin produce un aprendizaje ms rpido.

Identificar cul de los cuatro


distribucin es ms efeciente..
efeciente

canales

de

JorgeCordovaE.com

B.. S
Suposiciones
p
del ANOVA
O
La distribucin F tambin se usa para probar la
igualdad de ms de dos medias con una tcnica
llamada anlisis de variancia (ANOVA). El ANOVA
requiere las siguientes condiciones:
o La poblacin que se muestrea tiene una
distribucin normal
o Las poblaciones tienen desviaciones estndar
iguales
o Las muestras se seleccionan al azar y son
independientes
JorgeCordovaE.com

C Procedimiento para el anlisis de variancia


C.
o Hiptesis nula: las medias de las poblaciones son
iguales.
g
o Hiptesis alterna: al menos una de las medias es
diferente.
o Estadstico de prueba: F = (variancia entre
muestras)/(variancia dentro de muestras).
o Regla de decisin: para un nivel de significacin
, la hiptesis nula se rechaza si F calculada es
mayor que F terico (con grados de libertad del
numerador
d y del
d l denominador).
d
i d )
JorgeCordovaE.com

D El modelo aditivo lineal : MAL


D.
Se aplica como una suma y los exponentes son iguales a 1.
Explica cmo est formada una observacin.
observacin

Xi= + i

Xi

Donde
i = error, es decir la variabilidad (o diferencia) entre
la observacin y el p
promedio
JorgeCordovaE.com

4.2 El ANOVA de un factor


(Igual nmero de repeticiones)
El MAL para el ANOVA con un factor:

X ij i ij
Donde
i = Efecto del tratamiento
N

X
j1

ij

ij)

1 1
2 2
JorgeCordovaE.com

Si:

la Hp : 1= 2
Reemplazando tenemos
H p : + 1= + 2
H p : 1= 2
Slo se prueba la diferencia entre tratamientos

JorgeCordovaE.com

Simbolizando los datos

T1

T2

T3

X11

X12

X13

X21

X22

X23

X31

X32

X33

X41

X42

X43

X51

X52

X53

X.1

X.2

X.3

JorgeCordovaE.com

La tabla del ANOVA


Fuentes de
Variabilidad
Entre grupos
(Tratamientos)

Suma de
Cuadrados

GL

Cuadrado
Medio

F
calculado

SCtrat

2
j

j1

X2

rt

t-1

CMe

SCtrat
GL

Fc

CMe trat
CMe ee

F
terico
Ft con (t-1) y
(rt-t)

Dentro de los grupos


X2j
SCee

2
rt - t CMe
(Error Experimental) SCee Xij
r
GL

Total

X2 rt - 1
SCtotal Xij
rt
2

E
Excel
l realiza
li ttodos
d llos clculos
l l d
de lla T
Tabla
bl d
de ANOVA
JorgeCordovaE.com

Aplicacin 1
Una empresa de contabilidad desarroll tres mtodos con
el propsito de guiar a sus empleados temporales para
elaborar las declaraciones individuales de impuestos.
Para comparar la eficacia de estos mtodos, se prepara
una prueba en la cual cada uno de los 30 empleados
temporales se asigna de manera aleatoria para utilizar uno
de los tres mtodos para elaborar una supuesta solicitud
de devolucin de impuestos. Los tiempos de elaboracin
(en minutos)
min tos) aparecen a continuacin.
contin acin
Con un nivel de significacin de 0,05, podemos concluir
que los tres mtodos p
q
pueden tener la misma eficacia?
JorgeCordovaE.com

Los tiempos de elaboracin (en minutos):


I

II

III

48.6

68.0

67.5

49.4

67.0

62.5

50.1

70.1

64.2

49.8

64.5

62.5

50.6

68.0

63.9

50 8
50.8

68 3
68.3

64 8
64.8

50.8

71.9

62.3

47.1

71.5

61.4

52 5
52.5

69 9
69.9

67 4
67.4

49.0

68.9

65.4

50.6

67.8

63.2

549 3
549.3

755 9
755.9

705 1
705.1

JorgeCordovaE.com

Solucin

1. Planteamiento de hiptesis:
Hp : 1= 2= 3
Ha : 1 2 3 (no todos los tiempos medios son iguales)
2 Nivel de significacin
2.
= 0.05
3. Prueba estadstica
CMe trat
Fc
CMe ee
JorgeCordovaE.com

4. Criterios de decisin

3,32

Si {Fc>3,32} se rechaza la Hp, en caso contrario se acepta.

JorgeCordovaE.com

5. Clculos con Excel obtenemos:


Ruta : Datos

Anlisis de datos

Anlisis de varianza con un factor

Se compara con
el F terico

Se compara con
el F calculado
Se compara con el
nivel de significacin

JorgeCordovaE.com

6. Conclusiones

Se rechaza la hiptesis planteada, se acepta


la hiptesis alterna a un nivel de significacin
de 0,05. La prueba fue significativa.
Al menos un mtodo de capacitacin es
diferente a los dems.

JorgeCordovaE.com

Caso Especial:

El ANOVA de un factor
(Diferente nmero de repeticiones)
T1

T2

T3

X11

X12

X13

X21

X22

X23

X31

X32

X33

X42

X43

X52
X.1

X.2

X.3

JorgeCordovaE.com

L Tabla
La
T bl del
d l ANOVA
Fuentes de
Variabilidad

Suma de
Cuadrados

Entre grupos
(T t i t )
(Tratamientos)

X2j X2
SCtrat
r
j1 rj
j

GL

Cuadrado
C
d d
Medio

t-1

CMe

SCtrat
GL

Dentro de los
grupos (Error
Experimental)

Xij2
SCee X rt - t
r
j

CMe

SCee
GL

Total

X2 rt -1
SCtotal Xij
rj

2
ijj

F
calculado
Fc

CMe trat
CM ee
CMe

F
terico
Ft con (t-1) y
( t t)
(rt-t)

Excel realiza todos los clculos de la Tabla de ANOVA


JorgeCordovaE.com

Aplicacin 2
El director de entrenamiento de una compaa est
tratando de evaluar tres diferentes mtodos de
entrenamiento para empleados nuevos. El primer
mtodo consiste en asignar un empleado nuevo con un
trabajador experimentado para que ste lo asista en la
fbrica El segundo mtodo consiste en ubicar a todos
fbrica.
los empleados nuevos en un saln de entrenamiento
separado de la fbrica, y el tercer mtodo consiste en
utilizar pelculas de entrenamiento y materiales de
aprendizaje.

JorgeCordovaE.com

El director de entrenamiento escoge


g
al azar 16
empleados nuevos asignados a los tres mtodos y registra
su produccin diaria despus que terminaron sus
programas de entrenamiento:
Metodo 1

15

18

19

22

11

Metodo 2

22

27

18

21

17

Metodo 3

18

24

19

16

22

15

El director pregunta si existen diferencias en cuanto a la


efectividad entre los tres mtodos.
mtodos
JorgeCordovaE.com

Solucin :
1 Planteamiento de hiptesis:
1.

H0 : 1= 2= 3
Ha : 1= 2= 3 (no
( ttodas
d llas medias
di son iiguales)
l )
2. Nivel de significacin

= 0,05
0 05
3. Prueba estadstica
CMe trat
CM
Fc
CMe ee

JorgeCordovaE.com

4 Criterios
4.
C it i de
d d
decisin
i i

3,81

Si {Fc>3,3158} se rechaza la Hp, en caso contrario se


acepta.

JorgeCordovaE.com

5. Clculos
Excel nos brinda los siguientes resultados:

Se compara con
el F terico

Se compara con el
F calculado
Se compara con el
nivel de significacin

JorgeCordovaE.com

6. Conclusiones
Se acepta la hiptesis planteada, se rechaza la
hiptesis alterna a un nivel de significacin de
0,05. La prueba no result significativa.
Los datos muestrales no proporcionan evidencia
para afirmar que los mtodos de son diferentes.

JorgeCordovaE.com

4 3 El ANOVA de dos factor


4.3
El MAL para el ANOVA con dos factores:

X ij i j ij
Donde
i = Efecto del tratamiento
j = Efecto del bloque
Habrn dos hiptesis, una para tratamiento y otra
para bloques
bloques.
JorgeCordovaE.com

A li
Aplicacin
i
La Agencia ubicada en el Aeropuerto Jorge Chvez
funciona las 24 horas todos los das de la semana,
inclusive feriados. Los trabajadores cambian de turno
cada semana.
semana La gerencia est interesada en medir la
productividad de los empleados, verificando si existe
alguna diferencia en el nmero de clientes atendidos,
cuando un empleado labora en diversos turnos. Se tom
una muestra al azar de cinco empleados y se registr el
nmero de clientes atendidos en cada turno. A un
nivel de significacin de 0,05 puede concluirse que
hay diferencia en la productividad media por turno o
en la productividad media por trabajador? Interprete.
Interprete
JorgeCordovaE.com

Nmero de clientes atendidos por trabajador y por trabajador


CLIENTES ATENDIDOS

EMPLEADO

Maana

Tarde

Noche

Ricardo

14

18

24

Evelyn

20

24

14

Pedro

16

22

14

Sergio

18

20

22

Liliana

20

28

24

JorgeCordovaE.com

Solucin:
I Para TRATAMIENTOS (columna)
I.
1. Planteamiento de hiptesis:
H p : 1 = 2 = 3
Ha : 1 2 3 (al menos una productividad media
por turno es diferente)
2. Nivel de significacin
= 0.05
3. Prueba estadstica

CMe trat
Fc
CMe ee
JorgeCordovaE.com

4. Criterios de decisin

10,13

Si {Fc>10,13} se rechaza la Hp, en caso contrario se


acepta.

JorgeCordovaE.com

5. Clculos con Excel obtenemos:

Solucin

JorgeCordovaE.com

2. Para BLOQUES (filas)


1.

Planteamiento de hiptesis:
Hp : 1 = 2 = 3
Ha : 1 2 3 (al menos una productividad media
por trabajador es diferente)

2.

Nivel de significacin

= 0.05

3
3.

Prueba estadstica

CMe bloques
Fc
CMe ee
JorgeCordovaE.com

4 Criterios de decisin
4.

9,28

Si {Fc>9,28}
9 28} se rechaza
h
l Hp,
la
H en caso contrario
t i se acepta.
t

JorgeCordovaE.com

5. Clculos

JorgeCordovaE.com

Conclusiones
Se acepta la hiptesis planteada sobre empleado,
empleado
es decir, los datos de la muestra no permiten
identificar
diferencias
significativas
en
la
productividad media de los empleados.
Se acepta
p la hiptesis
p
planteada sobre el turno;; es
p
decir, no se evidencia diferencias significativas en
la productividad media en los diferentes turnos.

JorgeCordovaE.com

4.4 . El ANOVA de dos factores variables


y repeticiones
El MAL para el ANOVA con dos factores:

X ij i j i j ij
Donde
i = Efecto del tratamiento
j = Efecto del bloque
Habrn dos hiptesis, una para tratamiento y otra
para bloques.
JorgeCordovaE.com

Aplicacin
Despus
de un ao de estudiar un idioma
extranjero, se administr una prueba de
vocabulario de 50 items a 24 estudiantes de dos
niveles de inteligencia (superior y promedio) que
estudiaron siguiendo uno los de tres mtodos
(auditivo-oral
(auditivo-oral,
traduccin y combinado).
combinado)
Las
calificaciones obtenidas fueron las siguientes:

JorgeCordovaE.com

Mtodo

Mtodo

Mtodo

Auditivo-oral

Traduccin

Combinado

36

26

19

Superior

29

23

30

(115 o ms)

25

21

28

31

18

20

33

20

17

Promedio

19

22

13

(menos a 115)

37

14

23

28

15

18

Qu se observa?
Que se tiene igual nmero de alumnos de inteligencia superior y promedio,
g
nmero de alumnos q
que han estudiado p
por cada
tambin se observa igual
uno de los mtodos.
JorgeCordovaE.com

Construccin del MAL


Si se elige a un alumno al azar, entre los 24 que conforman
la muestra, se espera que su calificacin (Y) sea igual al
promedio de todos, es decir:

La calificacin promedio es 23 y es diferente a la mayora


de los datos. Se puede deducir entonces que existen
factores que estn ocasionando que las calificaciones no
sean iguales. A la diferencia entre el valor esperado y el
valor observado, se le llama error, quedando ahora
nuestro modelo as:

JorgeCordovaE.com

Tal vez el nivel de inteligencia del alumno (Factor A),


A)
explique algo de la desviacin entre los datos y el
promedio. El modelo quedar de esta manera:

Y
R
t ell efecto
f t d
de lla iinteligencia
t li
i sobre
b ell
: Representa
calificativo observado

El error en este segundo modelo, es menor al anterior,


pues se est explicando parte de la variacin por la
inteligencia del alumno
JorgeCordovaE.com

mtodo de estudio,, explicar


El
p
algo
g de la variacin de
las calificaciones de los alumnos? Tal vez Entonces el
modelo quedara de la siguiente manera:

: Representa el efecto del mtodo de estudio


sobre las calificaciones obtenidas

El error en este tercer modelo, es menor a de los


anteriores, pues se est explicando parte de la variacin
por el mtodo de estudio.
estudio
JorgeCordovaE.com

Finalmente, se puede pensar que tal vez ciertos


mtodos de estudios son ms eficientes para algn nivel
de inteligencia. A esto se conoce como interaccin de
factores El modelo quedar de la manera siguiente:
factores.

Representa el efecto de la interaccin de factores

A este modelo se conoce como modelo aditivo lineal,


para dos factores y varias repeticiones.
p
p
JorgeCordovaE.com

Simbolizando los datos


FACTOR B

a1

FACTOR
C O A
a2

b1

b2

b3

X111

X121

X131

X112

X122

X132

X113

X123

X133

X114
X11.

X124
X12.

X134
X13.

X211

X221

X231

X212

X222

X232

X213

X223

X233

X214
X21.

X224
X22.

X234
X23.

X 1.
X.

X 2.
X.

X 3.
X.

X1..

X2 ..

X
X...

JorgeCordovaE.com

Obteniendo los subtotales


FACTOR B: MTODOS DE ESTUDIO
b1

b2

b3

AUDITIVO-ORAL

TRADUCCIN

COMBINADO

X111

X121

X131

X112

X122

X132

X113

X123

X133

X114
X11. = 121

X124
X12.=88

X134
X13.=97

X211

X221

X231

a2

X212

X222

X232

PRO

X213

X223

X233

X214
X21.=117

X224
X22.=71

X234
X23.=71

X.1.=238

X.2.=159

X.3.=168

a1
SUP
FACTOR A
NIVELES DE
INTELIGENCIA

X1.. = 306

X2 ..= 256

X...=565

JorgeCordovaE.com

Formato de Tabla el anlisis de varianza


Fuente de
Variabilidad

Grados
de libertad

Suma
de cuadrados

Cuadrado
Medio

Estadstico
F

FACTOR A (Inteligencia)
FACTOR B (Mtodos)
(Mt d )
INTERACCIN (A*B)
ERROR EXPERIMENTAL
TOTAL

JorgeCordovaE.com

Suma de Cuadrados del Factor A


2

X 1.. X 2..
X...
SC A

ik
ijk

Donde
D
d
i = filas (Factor A)
j = columnas (Factor B)
k = repeticiones
epet c o es

306 2 256 2
565 2
SC A

92,04
(2)(4)
(2)(3)(4)

JorgeCordovaE.com

Suma de Cuadrados del Factor B


2

X 1 X 2 X 3
X
SCB

jjk
ijk
j

Donde
i = filas (Factor A)
j = columnas (Factor B)
k = repeticiones
ti i

238 2 159 2 168 2


565 2
SCB

467,58
(3)(4)
(2)(3)(4)

JorgeCordovaE.com

Suma de cuadrados de la interaccin A * B


2

SCA*B

X
X12 X13 X21 X22 X23
X
11
SCA SCB
k
ijk
Donde
i = filas (Factor A)
j = columnas (Factor B)
k = repeticiones
p

SC A *B

1212 88 2 97 2 117 2 712 712


X 2

SC A SCB
30,58
ijk
4
j

JorgeCordovaE.com

Los resultados se escriben en el siguiente formato:


Grados de
libertad

Suma de
cuadrados

Cuadrado
Medio

Estadstico
F

FACTOR A (Inteligencia)

92,04

92,042

3,56

FACTOR B (Mtodos)
(Mt d )

467 58
467,58

233 792
233,792

9 04
9,04

INTERACCIN (A*B)

30,58

15,292

0,59

ERROR EXPERIMENTAL

18

465,75

TOTAL

23

Fuente de Variabilidad

25,875

1055,96

JorgeCordovaE.com

Planteamiento de las Hiptesis

Acerca de la Interaccin de Factores

Hp : i j 0
Ha : i j 0
Como

p valor 0,564

Se acepta la hiptesis planteada, se rechaza la hiptesis


alternante La prueba fue no significativa.
alternante.
significativa La interaccin de
factores es irrelevante. Ello amerita realizar las pruebas
hiptesis de los efectos principales de cada uno de los
factores
JorgeCordovaE.com

La grfica de la interaccin
El MINITAB a travs
de la siguiente rutina, permite graficar la
interaccin: Stat ANOVA Interaction Plot

La grfica corrobora la
no existencia de
interaccin significativa

JorgeCordovaE.com

Acerca del Factor A (Inteligencia)

Hp : 1 2
Ha : 1 2
Como

p valor 0,076
Para un = 0,05, se acepta la hiptesis planteada: El
efecto de los niveles del factor A (INTELIGENCIA) sobre la
calificacin obtenida,
obtenida no es significativo.
significativo
JorgeCordovaE.com

Acerca del Factor B (Mtodos de Estudio)


Est dio)

Hp : 1 2 3
Ha : 1 2 3
Como

p valor 0,002
Para un = 0,05,
P
0 05 se rechaza
h
l hiptesis
la
hi t i planteada:
l t d
El efecto de los niveles de del factor B (MTODOS)
sobre la calificacin obtenida, es significativo.
JorgeCordovaE.com

5. Clculos con el Excel

JorgeCordovaE.com

5. Calculos en el MINITAB

MINITAB permite
identificar los factores
y los niveles de cada
uno. Muestra el
Anlisis de Varianza
incluyendo el
estadstico F y el pvalor.

JorgeCordovaE.com

MINITAB permite identificar los valores atpicos o


inusuales. En el ejemplo lo es la sexta observacin.

JorgeCordovaE.com

Comparaciones de medias: Tukey

Como el Factor B (Mtodo)


es el nico que afecta el
calificativo, se debe aplicar
una prueba a fin de
establecer si existen
diferencias significativas
entre los tres mtodos, es
decir si hay un mtodo
decir,
mejor que los otros.

JorgeCordovaE.com

Hiptesis acerca de las comparaciones de medias: Tukey


Mtodo 1 versus el Mtodo 2

Hp : 1 2
Ha : 1 2

t c 3.863
p valor 0,003

Se rechaza la hiptesis planteada.


Mtodo 1 versus el Mtodo 3

Hp : 1 3
Ha : 1 3

tc 3.440
p valor 0,0078

S rechaza
Se
h
lla hi
hiptesis
t i planteada.
l t d
JorgeCordovaE.com

Mtodo 2 versus el Mtodo 3

Hp : 2 3
Ha : 2 3

tc 0,4423
p valor 0,8984

Se acepta la hiptesis planteada.

JorgeCordovaE.com

Qu aprendimos en esta sesin?


1. Definir conceptos relacionados al ANOVA
1
2. Realizar el ANOVA con un factor variable
3. Realizar el ANOVA con dos factores variables y
una sola muestra.
4. Realizar el ANOVA con dos factores variables y
varias muestras.
5. Analizar los resultados de la prueba de
comparaciones mltiples de Tukey

JorgeCordovaE.com

Bibliografa

Box and Hanter. Estadstica para Experimentadores


(2004).

Montgomery. Diseo y anlisis de Experimentos.


(2004).
(2004)

JorgeCordovaE.com