Sunteți pe pagina 1din 50

1.

Anlisis de la Varianza
Curso 2011-2012
Estadstica

1.1 Dos tratamientos

Comparacin de dos
tratamientos
A
51,3
39,4
26,3
39,0
48,1
34,2
69,8
31,3
45,2
46,4

B
29,6
47,0
25,9
13,0
33,1
22,1
34,1
19,5
43,8
24,9

Sea desea comparar


dos tratamientos para
reducir el nivel de
colesterol en la sangre.
Se seleccionan 20
individuos y se asignan
al azar a dos tipos de
dietas A y B. La tabla
muestra la reduccin
conseguida despus de
dos meses.

Anlisis de la Varianza

Mtodo: 4 pasos
Definicin del modelo de distribucin
de probabilidad:
Hiptesis
Parmetros

Estimacin de los parmetros


Diagnosis de las hiptesis
Aplicacin

Anlisis de la Varianza

Modelo

y11

y 21

y12

y 22

y1n1

y 2 n2

M
O
D
E
L
O
D
A
T
O
S
5

Anlisis de la Varianza

Modelo: Hiptesis y Parmetros


Hiptesis bsicas:
Parmetros

Normalidad
yij

N( i, 2)

Homocedasticidad
Var [yij] =

1
2
2

Independencia
Cov [yij, ykl] = 0
Anlisis de la Varianza

Modelo
yij

uij ,

uij

N (0,

Las observaciones se descomponen en:


Parte predecible

uij

Parte aleatoria

0
7

Anlisis de la Varianza

Estimacin medias:
n1

y1 j
1:

y1

j 1

n1
n2

y2 j
2:

Anlisis de la Varianza

y2

j 1

n2

A
51,3
39,4
26,3
39,0
48,1
34,2
69,8
31,3
45,2
46,4
43,1

B
29,6
47,0
25,9
13,0
33,1
22,1
34,1
19,5
43,8
24,9
29,3

Estimacin varianza (residuos)


yij

uij , uij

uij

yij

eij

yij

N (0,

Residuos

A
8,2
-3,7
-16,8
-4,1
5,0
-8,9
26,7
-11,8
2,1
3,3
0,0

yi

eij : RES IDUO


2 ni
2

eij2

i 1 j 1

s R2

n 2

j 1

B
0,3
17,7
-3,4
-16,3
3,8
-7,2
4,8
-9,8
14,5
-4,4
0,0

2
0;s R

eij

130.95
9

Anlisis de la Varianza

2
s
Varianza residual: R

y21

y11
y12

( y1 j

s12

y1 ) 2

y22

n1 1

s22

( y2 j
n2

y2 ) 2
1

y2 n2

y1n1
2 ni

sR2
Anlisis de la Varianza

eij2

i 1j 1

n 2

n1 1 2
s1
n 1

n2 1 2
s2
n 1
10

Diferencia de medias: y1

y21
y22

y11
2

y12

N(

y1

1,

n1

y2

( y1

y2

N(

2,

n2

y2 n2

y1n1
y1

y2

N(

2,

y2 ) ( 1
1 1
n1 n2

n1

n2

2)

)
( y1

N (0,1)

y2 ) ( 1
1 1
sR
n1 n2

2)

tn

11

Anlisis de la Varianza

Contraste de igualdad de medias

t0

H0 :

H1 :

y1
sR

y2
1
n1

tn-2

1tn

1
n2

R.R

R.R.

/2

R. Acept.

-t

/2

t0

/2

No se rechaza H 0

t0

/2

Se rechaza H 0

Anlisis de la Varianza

/2

/2

12

Ejemplo:

t0

H0 :

H1 :

= 0.05
R.R.

R.R

t18

0.025

0.025

43.1 29.3
1 1
11.44
10 10

2.69
2.10

-2.10

2.69 2.10

Se rechaza H 0
13

Anlisis de la Varianza

Ejemplo:

t0

= 0.01

H0 :

H1 :

43.1 29.3
1 1
11.44
10 10

t18

0.99
0.005

0.005

2.69

2.69 2.88
Anlisis de la Varianza

R.R

R.R.

/2

-2.88

2.88

No se rechaza H 0
14

Nivel crtico (bilateral)

t0

H0 :

H1 :

43.1 29.3
1 1
11.44
10 10

p valor

t18
0.074

0.074

2.69

-2.69

Pr( t18

= 0.05 > p-valor


= 0.01 < p-valor

2.69)

2.69

0.0147

Se rechaza H0
No se rechaza H0
15

Anlisis de la Varianza

Conclusiones (fijado )
Si |to| > t /2 se dice
que la diferencia
de medias es
significativa. O
simplemente que
los tratamientos
son distintos
(tienen medias
distintas)

Anlisis de la Varianza

Si |to| t /2 se dice
que la diferencia
de medias no es
significativa. No
hay evidencia
suficiente para
afirmar que las
medias de los
tratamientos sean
diferentes.
16

No rechazar Ho, no implica


que Ho sea cierta
El resultado |to| t /2, (no se rechaza
Ho) no debe interpretarse como
se ha demostrado que las dos
medias son iguales
No-rechazar la hiptesis nula implica que
la diferencia entre las medias 1 - 2 no
es lo suficientemente grande como para
ser detectada con el tamao muestral
dado.
17

Anlisis de la Varianza

Intervalo de confianza para


la diferencia de medias:
1
( y1

y2 ) ( 1
1 1
sR
n1 n2

2)

tn

tn-2

/2

Anlisis de la Varianza

( y1

/2

( y1

y2 ) ( 1
1 1
sR
n1 n2
y2 )

/2

1-t

Pr { t

/2

2)

/ 2 sR

/2}

1
n1

1
n2

/2

18

Ejemplo: intervalo de confianza

t18
0.025

0.025

-2.10

2.10
t / 2 sR

1
n2

(43.1 29.3) 2.10 11.44

13.8

y2 )

1
n1

( y1

1
1
10 10

10.74
19

Anlisis de la Varianza

Hiptesis de homocedasticidad
1

y21
y22

y11
y12

s12

( y1 j

y1 ) 2

n1 1

( y2 j
n2

y2 ) 2
1

y2 n2

y1n1

H0 :
H1 :
Anlisis de la Varianza

s22

2
1
2
1

2
2
2
2
20

Distribucin F
y21

y11
y12

( y1 j

s12

y1 ) 2

y22

n1 1

( y2 j

s22

y2 ) 2

n2 1

y2 n2

y1n1
(n1 1) s12
2
1

2
n1 1

(n2 1) s22

2
n1 1

2
n2 1

2
2

2
n2 1

s12
(n1 1)
(n2 1)

2
1
s22
2
2

Fn1

1,n2 1

21

Anlisis de la varianza

Distribucin F

F40,40
F20,40
F10,40

F5,40

Anlisis de la varianza

22

Algunas distribuciones F
F10,80
F10,40
F10,20
F10,10

23

Anlisis de la varianza

Contraste de igualdad de varianzas


H0 :
H1 :

2
1
2
1

2
2
2
2
2
1

Si H 0 es cierto
F0

s12
s12

Fn1

2
2,

1,n2 1

RR

RR
/2

/2

1R.A. Ho

F1-

/2

/2

Si F0

F1

/ 2, F / 2

No se rechaza H 0

Si F0

F1

/ 2, F / 2

Se rechaza H 0

Anlisis de la varianza

24

Ejemplo: Contraste de igualdad de varianzas


H0 :
H1 :

2
1
2
1

2
2
2
2

s12 154.02 s22 111.7

0.248 1.37

154.02
1.37
111.7

F0

1.37

RR
0.025

RR
0.025

0.248,4.03

4.03

No se rechaza H 0
25

Anlisis de la varianza

F 1,

Tabla F

P( F 1 ,

F 1,

Grados de libertad del denominador:

=0.05
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

1
161,4
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,23
4,21
4,20
4,18
4,17
4,08
4,03
4,00
3,98
3,96
3,95
3,94
3,92
3,84
1

2
199,5
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,47
3,44
3,42
3,40
3,39
3,37
3,35
3,34
3,33
3,32
3,23
3,18
3,15
3,13
3,11
3,10
3,09
3,07
3,00
2

3
215,7
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
3,05
3,03
3,01
2,99
2,98
2,96
2,95
2,93
2,92
2,84
2,79
2,76
2,74
2,72
2,71
2,70
2,68
2,60
3

Ejemplo : P( F7,8

4
224,6
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,84
2,82
2,80
2,78
2,76
2,74
2,73
2,71
2,70
2,69
2,61
2,56
2,53
2,50
2,49
2,47
2,46
2,45
2,37
4

5
230,2
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,60
2,59
2,57
2,56
2,55
2,53
2,45
2,40
2,37
2,35
2,33
2,32
2,31
2,29
2,21
5

6
234,0
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,45
2,43
2,42
2,34
2,29
2,25
2,23
2,21
2,20
2,19
2,18
2,10
6

3.50) 0.05

7
236,8
19,35
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,49
2,46
2,44
2,42
2,40
2,39
2,37
2,36
2,35
2,33
2,25
2,20
2,17
2,14
2,13
2,11
2,10
2,09
2,01
7

8
238,9
19,37
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,37
2,36
2,34
2,32
2,31
2,29
2,28
2,27
2,18
2,13
2,10
2,07
2,06
2,04
2,03
2,02
1,94
8

9
240,5
19,38
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,37
2,34
2,32
2,30
2,28
2,27
2,25
2,24
2,22
2,21
2,12
2,07
2,04
2,02
2,00
1,99
1,97
1,96
1,88
9

10
241,9
19,40
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,32
2,30
2,27
2,25
2,24
2,22
2,20
2,19
2,18
2,16
2,08
2,03
1,99
1,97
1,95
1,94
1,93
1,91
1,83
10

12
243,9
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,00
1,95
1,92
1,89
1,88
1,86
1,85
1,83
1,75
12

15
245,9
19,43
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,18
2,15
2,13
2,11
2,09
2,07
2,06
2,04
2,03
2,01
1,92
1,87
1,84
1,81
1,79
1,78
1,77
1,75
1,67
15

20
248,0
19,45
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,10
2,07
2,05
2,03
2,01
1,99
1,97
1,96
1,94
1,93
1,84
1,78
1,75
1,72
1,70
1,69
1,68
1,66
1,57
20

24
249,1
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,51
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,01
1,98
1,96
1,95
1,93
1,91
1,90
1,89
1,79
1,74
1,70
1,67
1,65
1,64
1,63
1,61
1,52
24

30
250,1
19,46
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
2,01
1,98
1,96
1,94
1,92
1,90
1,88
1,87
1,85
1,84
1,74
1,69
1,65
1,62
1,60
1,59
1,57
1,55
1,46
30

40
251,1
19,47
8,59
5,72
4,46
3,77
3,34
3,04
2,83
2,66
2,53
2,43
2,34
2,27
2,20
2,15
2,10
2,06
2,03
1,99
1,96
1,94
1,91
1,89
1,87
1,85
1,84
1,82
1,81
1,79
1,69
1,63
1,59
1,57
1,54
1,53
1,52
1,50
1,39
40

60
252,2
19,48
8,57
5,69
4,43
3,74
3,30
3,01
2,79
2,62
2,49
2,38
2,30
2,22
2,16
2,11
2,06
2,02
1,98
1,95
1,92
1,89
1,86
1,84
1,82
1,80
1,79
1,77
1,75
1,74
1,64
1,58
1,53
1,50
1,48
1,46
1,45
1,43
1,32
60

100
253,0
19,49
8,55
5,66
4,41
3,71
3,27
2,97
2,76
2,59
2,46
2,35
2,26
2,19
2,12
2,07
2,02
1,98
1,94
1,91
1,88
1,85
1,82
1,80
1,78
1,76
1,74
1,73
1,71
1,70
1,59
1,52
1,48
1,45
1,43
1,41
1,39
1,37
1,24
100

120
253,3
19,49
8,55
5,66
4,40
3,70
3,27
2,97
2,75
2,58
2,45
2,34
2,25
2,18
2,11
2,06
2,01
1,97
1,93
1,90
1,87
1,84
1,81
1,79
1,77
1,75
1,73
1,71
1,70
1,68
1,58
1,51
1,47
1,44
1,41
1,39
1,38
1,35
1,22
120

Inf.
254,3
19,50
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76
1,73
1,71
1,69
1,67
1,65
1,64
1,62
1,51
1,44
1,39
1,35
1,32
1,30
1,28
1,25
1,00
Inf.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

F 1,

Tabla F

P( F 1 ,

F 1,

=0.025

Grados de libertad del denominador:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

1
647,8
38,51
17,44
12,22
10,01
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,83
5,79
5,75
5,72
5,69
5,66
5,63
5,61
5,59
5,57
5,42
5,34
5,29
5,25
5,22
5,20
5,18
5,15
5,02
1

2
799,5
39,00
16,04
10,65
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,77
4,69
4,62
4,56
4,51
4,46
4,42
4,38
4,35
4,32
4,29
4,27
4,24
4,22
4,20
4,18
4,05
3,97
3,93
3,89
3,86
3,84
3,83
3,80
3,69
2

3
864,2
39,17
15,44
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,82
3,78
3,75
3,72
3,69
3,67
3,65
3,63
3,61
3,59
3,46
3,39
3,34
3,31
3,28
3,26
3,25
3,23
3,12
3

4
899,6
39,25
15,10
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,48
3,44
3,41
3,38
3,35
3,33
3,31
3,29
3,27
3,25
3,13
3,05
3,01
2,97
2,95
2,93
2,92
2,89
2,79
4

Ejemplo : P( F7,8

5
921,8
39,30
14,88
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,25
3,22
3,18
3,15
3,13
3,10
3,08
3,06
3,04
3,03
2,90
2,83
2,79
2,75
2,73
2,71
2,70
2,67
2,57
5

6
937,1
39,33
14,73
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,09
3,05
3,02
2,99
2,97
2,94
2,92
2,90
2,88
2,87
2,74
2,67
2,63
2,59
2,57
2,55
2,54
2,52
2,41
6

7
948,2
39,36
14,62
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,97
2,93
2,90
2,87
2,85
2,82
2,80
2,78
2,76
2,75
2,62
2,55
2,51
2,47
2,45
2,43
2,42
2,39
2,29
7

8
956,6
39,37
14,54
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,87
2,84
2,81
2,78
2,75
2,73
2,71
2,69
2,67
2,65
2,53
2,46
2,41
2,38
2,35
2,34
2,32
2,30
2,19
8

9
963,3
39,39
14,47
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,80
2,76
2,73
2,70
2,68
2,65
2,63
2,61
2,59
2,57
2,45
2,38
2,33
2,30
2,28
2,26
2,24
2,22
2,11
9

10
968,6
39,40
14,42
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,73
2,70
2,67
2,64
2,61
2,59
2,57
2,55
2,53
2,51
2,39
2,32
2,27
2,24
2,21
2,19
2,18
2,16
2,05
10

12
976,7
39,41
14,34
8,75
6,52
5,37
4,67
4,20
3,87
3,62
3,43
3,28
3,15
3,05
2,96
2,89
2,82
2,77
2,72
2,68
2,64
2,60
2,57
2,54
2,51
2,49
2,47
2,45
2,43
2,41
2,29
2,22
2,17
2,14
2,11
2,09
2,08
2,05
1,94
12

15
984,9
39,43
14,25
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,53
2,50
2,47
2,44
2,41
2,39
2,36
2,34
2,32
2,31
2,18
2,11
2,06
2,03
2,00
1,98
1,97
1,94
1,83
15

20
993,1
39,45
14,17
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,42
2,39
2,36
2,33
2,30
2,28
2,25
2,23
2,21
2,20
2,07
1,99
1,94
1,91
1,88
1,86
1,85
1,82
1,71
20

24
30
40
60
100
120
Inf.
997,3 1001,4 1005,6 1009,8 1013,2 1014,0 1018,3
39,46 39,46 39,47 39,48 39,49 39,49 39,50
14,12 14,08 14,04 13,99 13,96 13,95 13,90
8,51
8,46
8,41
8,36
8,32
8,31
8,26
6,28
6,23
6,18
6,12
6,08
6,07
6,02
5,12
5,07
5,01
4,96
4,92
4,90
4,85
4,41
4,36
4,31
4,25
4,21
4,20
4,14
3,95
3,89
3,84
3,78
3,74
3,73
3,67
3,61
3,56
3,51
3,45
3,40
3,39
3,33
3,37
3,31
3,26
3,20
3,15
3,14
3,08
3,17
3,12
3,06
3,00
2,96
2,94
2,88
3,02
2,96
2,91
2,85
2,80
2,79
2,72
2,89
2,84
2,78
2,72
2,67
2,66
2,60
2,79
2,73
2,67
2,61
2,56
2,55
2,49
2,70
2,64
2,59
2,52
2,47
2,46
2,40
2,63
2,57
2,51
2,45
2,40
2,38
2,32
2,56
2,50
2,44
2,38
2,33
2,32
2,25
2,50
2,44
2,38
2,32
2,27
2,26
2,19
2,45
2,39
2,33
2,27
2,22
2,20
2,13
2,41
2,35
2,29
2,22
2,17
2,16
2,09
2,37
2,31
2,25
2,18
2,13
2,11
2,04
2,33
2,27
2,21
2,14
2,09
2,08
2,00
2,30
2,24
2,18
2,11
2,06
2,04
1,97
2,27
2,21
2,15
2,08
2,02
2,01
1,94
2,24
2,18
2,12
2,05
2,00
1,98
1,91
2,22
2,16
2,09
2,03
1,97
1,95
1,88
2,19
2,13
2,07
2,00
1,94
1,93
1,85
2,17
2,11
2,05
1,98
1,92
1,91
1,83
2,15
2,09
2,03
1,96
1,90
1,89
1,81
2,14
2,07
2,01
1,94
1,88
1,87
1,79
2,01
1,94
1,88
1,80
1,74
1,72
1,64
1,93
1,87
1,80
1,72
1,66
1,64
1,55
1,88
1,82
1,74
1,67
1,60
1,58
1,48
1,85
1,78
1,71
1,63
1,56
1,54
1,44
1,82
1,75
1,68
1,60
1,53
1,51
1,40
1,80
1,73
1,66
1,58
1,50
1,48
1,37
1,78
1,71
1,64
1,56
1,48
1,46
1,35
1,76
1,69
1,61
1,53
1,45
1,43
1,31
1,64
1,57
1,48
1,39
1,30
1,27
1,00
24
30
40
60
100
120
Inf.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

4.53) 0.025

F 1,

Tabla F

P( F 1 ,

F 1,

Grados de libertad del denominador:

=0.01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

1
4052,2
98,50
34,12
21,20
16,26
13,75
12,25
11,26
10,56
10,04
9,65
9,33
9,07
8,86
8,68
8,53
8,40
8,29
8,18
8,10
8,02
7,95
7,88
7,82
7,77
7,72
7,68
7,64
7,60
7,56
7,31
7,17
7,08
7,01
6,96
6,93
6,90
6,85
6,63
1

2
4999,3
99,00
30,82
18,00
13,27
10,92
9,55
8,65
8,02
7,56
7,21
6,93
6,70
6,51
6,36
6,23
6,11
6,01
5,93
5,85
5,78
5,72
5,66
5,61
5,57
5,53
5,49
5,45
5,42
5,39
5,18
5,06
4,98
4,92
4,88
4,85
4,82
4,79
4,61
2

3
5403,5
99,16
29,46
16,69
12,06
9,78
8,45
7,59
6,99
6,55
6,22
5,95
5,74
5,56
5,42
5,29
5,19
5,09
5,01
4,94
4,87
4,82
4,76
4,72
4,68
4,64
4,60
4,57
4,54
4,51
4,31
4,20
4,13
4,07
4,04
4,01
3,98
3,95
3,78
3

4
5624,3
99,25
28,71
15,98
11,39
9,15
7,85
7,01
6,42
5,99
5,67
5,41
5,21
5,04
4,89
4,77
4,67
4,58
4,50
4,43
4,37
4,31
4,26
4,22
4,18
4,14
4,11
4,07
4,04
4,02
3,83
3,72
3,65
3,60
3,56
3,53
3,51
3,48
3,32
4

Ejemplo : P( F7,8

5
5764,0
99,30
28,24
15,52
10,97
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,69
4,56
4,44
4,34
4,25
4,17
4,10
4,04
3,99
3,94
3,90
3,85
3,82
3,78
3,75
3,73
3,70
3,51
3,41
3,34
3,29
3,26
3,23
3,21
3,17
3,02
5

6
5859,0
99,33
27,91
15,21
10,67
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,81
3,76
3,71
3,67
3,63
3,59
3,56
3,53
3,50
3,47
3,29
3,19
3,12
3,07
3,04
3,01
2,99
2,96
2,80
6

7
5928,3
99,36
27,67
14,98
10,46
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,64
3,59
3,54
3,50
3,46
3,42
3,39
3,36
3,33
3,30
3,12
3,02
2,95
2,91
2,87
2,84
2,82
2,79
2,64
7

6.18) 0.01

8
5981,0
99,38
27,49
14,80
10,29
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,51
3,45
3,41
3,36
3,32
3,29
3,26
3,23
3,20
3,17
2,99
2,89
2,82
2,78
2,74
2,72
2,69
2,66
2,51
8

9
6022,4
99,39
27,34
14,66
10,16
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,40
3,35
3,30
3,26
3,22
3,18
3,15
3,12
3,09
3,07
2,89
2,78
2,72
2,67
2,64
2,61
2,59
2,56
2,41
9

10
6055,9
99,40
27,23
14,55
10,05
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,31
3,26
3,21
3,17
3,13
3,09
3,06
3,03
3,00
2,98
2,80
2,70
2,63
2,59
2,55
2,52
2,50
2,47
2,32
10

12
6106,7
99,42
27,05
14,37
9,89
7,72
6,47
5,67
5,11
4,71
4,40
4,16
3,96
3,80
3,67
3,55
3,46
3,37
3,30
3,23
3,17
3,12
3,07
3,03
2,99
2,96
2,93
2,90
2,87
2,84
2,66
2,56
2,50
2,45
2,42
2,39
2,37
2,34
2,18
12

15
6157,0
99,43
26,87
14,20
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
3,03
2,98
2,93
2,89
2,85
2,81
2,78
2,75
2,73
2,70
2,52
2,42
2,35
2,31
2,27
2,24
2,22
2,19
2,04
15

20
6208,7
99,45
26,69
14,02
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,88
2,83
2,78
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,37
2,27
2,20
2,15
2,12
2,09
2,07
2,03
1,88
20

24
6234,3
99,46
26,60
13,93
9,47
7,31
6,07
5,28
4,73
4,33
4,02
3,78
3,59
3,43
3,29
3,18
3,08
3,00
2,92
2,86
2,80
2,75
2,70
2,66
2,62
2,58
2,55
2,52
2,49
2,47
2,29
2,18
2,12
2,07
2,03
2,00
1,98
1,95
1,79
24

30
6260,4
99,47
26,50
13,84
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,72
2,67
2,62
2,58
2,54
2,50
2,47
2,44
2,41
2,39
2,20
2,10
2,03
1,98
1,94
1,92
1,89
1,86
1,70
30

40
6286,4
99,48
26,41
13,75
9,29
7,14
5,91
5,12
4,57
4,17
3,86
3,62
3,43
3,27
3,13
3,02
2,92
2,84
2,76
2,69
2,64
2,58
2,54
2,49
2,45
2,42
2,38
2,35
2,33
2,30
2,11
2,01
1,94
1,89
1,85
1,82
1,80
1,76
1,59
40

60
6313,0
99,48
26,32
13,65
9,20
7,06
5,82
5,03
4,48
4,08
3,78
3,54
3,34
3,18
3,05
2,93
2,83
2,75
2,67
2,61
2,55
2,50
2,45
2,40
2,36
2,33
2,29
2,26
2,23
2,21
2,02
1,91
1,84
1,78
1,75
1,72
1,69
1,66
1,47
60

100
6333,9
99,49
26,24
13,58
9,13
6,99
5,75
4,96
4,41
4,01
3,71
3,47
3,27
3,11
2,98
2,86
2,76
2,68
2,60
2,54
2,48
2,42
2,37
2,33
2,29
2,25
2,22
2,19
2,16
2,13
1,94
1,82
1,75
1,70
1,65
1,62
1,60
1,56
1,36
100

120
6339,5
99,49
26,22
13,56
9,11
6,97
5,74
4,95
4,40
4,00
3,69
3,45
3,25
3,09
2,96
2,84
2,75
2,66
2,58
2,52
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,17
2,14
2,11
1,92
1,80
1,73
1,67
1,63
1,60
1,57
1,53
1,32
120

Inf.
6365,6
99,50
26,13
13,46
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,36
2,31
2,26
2,21
2,17
2,13
2,10
2,06
2,03
2,01
1,80
1,68
1,60
1,54
1,49
1,46
1,43
1,38
1,00
Inf.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
120
Inf

1.2

K tratamientos

29

Anlisis de la varianza

Existen diferencias entre las


cuatro semillas?
Se desea comparar el rendimiento de
cuatro semillas A,B,C y D. Un terreno se
divide en 24 parcelas similares y se asigna
al azar cada semilla a 6 parcelas.
A
229.1
253.7
241.3
254.7
237.2
241.3
242.9
Anlisis de la varianza

B
233.4
233.0
219.2
200.0
224.3
202.0
218.7

C
211.1
223.1
217.5
211.8
207.6
213.7
214.1

D
270.4
248.6
230.0
250.7
230.0
245.8
245.9
30

Mtodo: 4 pasos
Definicin del modelo de distribucin
de probabilidad:
Hiptesis
Parmetros

Estimacin de los parmetros


Diagnosis de las hiptesis
Aplicacin

31

Anlisis de la varianza

Modelo

...
1

y21

y11
y12

y22

y1n

y2 n

Anlisis de la varianza

...

yK1
yK 2
y Kn

K
32

Hiptesis del modelo


Normalidad
yij

N( i, 2)

Homocedasticidad
Var [yij] =

Independencia
Cov [yij, ykl] = 0

33

Anlisis de la varianza

Modelo: Hiptesis y Parmetros


Hiptesis bsicas:

Parmetros

Normalidad

yij

N( i, 2)

Homocedasticidad
Var [yij] =

Independencia
Cov [yij, ykl] = 0
Anlisis de la varianza

K
2
34

Modelo: Forma alternativa


yij

uij ,

uij

N (0,

Las observaciones se descomponen en:


Parte predecible

uij

Parte aleatoria

0
35

Anlisis de la varianza

Estimacin medias:Max. Verosmil


n1

y1 j
1:

y1

j 1

n1
n2

y2 j
2

y2

j 1

n2
nK

y Kj
K

yK

Anlisis de la varianza

A
229.1
253.7
241.3
254.7
237.2
241.3
242.9

B
233.4
233.0
219.2
200.0
224.3
202.0
218.7

C
211.1
223.1
217.5
211.8
207.6
213.7
214.1

D
270.4
248.6
230.0
250.7
230.0
245.8
245.9

j 1

nK

36

Estimacin varianza (residuos)


yij

uij , uij

uij

yij

eij

yij

N (0,

A
-13.8
10.8
-1.6
11.8
-5.7
-1.6
0.0

yi

eij : RESIDUO

s R2

)
Residuos

K ni

eij2

i 1j 1

B
14.8
14.4
0.6
-18.7
5.7
-16.7
0.0

sR2

n K

C
-3.0
9.0
3.4
-2.3
-6.5
-0.4
0.0

D
24.5
2.7
-15.9
4.8
-15.9
-0.1
0.0

142.4
37

Anlisis de la varianza

Comparacin de medias
La comparacin de tratamientos con
este modelo se reduce a comparar
las medias 1, 2, ..., K , en primer
lugar con el contraste:

H0 :

H1 : Al menos una es diferente

Anlisis de la varianza

38

Descomposicin de la
variabilidad
yij
yij

uij

yij

( yi

yi

( yij

y ) ( yij

y i ) : restando y

yij
n

yi )

elevando al cuadrado y sumando para todo i,j


K ni

(donde

( yi

y )( yij

y i ) 0)

i 1j 1
K ni

( yij

y )

K ni

( yi

i 1j 1

y )

i 1j 1

K ni

( yij

y )

ni ( y i

i 1j 1

( yij
i 1j 1

K ni

y )

i 1

K ni

( yij
i 1j 1

y i )2
yi )2

39

Anlisis de la varianza

Variabilidades
Variabilid ades
K ni

VT

( yij
i 1j 1
K

VE
i 1

ni ( y i

K ni

VNE

( yij
i 1j 1

VT

yi )

Grados de libertad

y )2

n-1

y )2

K-1

VE

K ni

eij 2

n-K

i 1j 1

VNE

n 1 ( K 1) (n K )
Anlisis de la varianza

40

Descomposicin: ejemplo
y

230.4

Datos

Medias

229.1
253.7
241.3
254.7
237.2
241.3

233.4
233.0
219.2
200.0
224.3
202.0

211.1
223.1
217.5
211.8
207.6
213.7

270.4
248.6
230.0
250.7
230.0
245.8

-1.3
23.3
10.9
24.3
6.8
10.9

3.0
2.6
-11.2
-30.4
-6.1
-28.4

-19.3
-7.3
-12.9
-18.6
-22.8
-16.7

40.0
18.2
-0.4
20.3
-0.4
15.4

yij

Residuos

242.9
242.9
242.9
242.9
242.9
242.9

218.7
218.7
218.7
218.7
218.7
218.7

214.1
214.1
214.1
214.1
214.1
214.1

245.9
245.9
245.9
245.9
245.9
245.9

12.5
12.5
12.5
12.5
12.5
12.5

-11.7
-11.7
-11.7
-11.7
-11.7
-11.7

-16.3
-16.3
-16.3
-16.3
-16.3
-16.3

15.5
15.5
15.5
15.5
15.5
15.5

yi

-13.8
10.8
-1.6
11.8
-5.7
-1.6

14.8
14.4
0.6
-18.7
5.7
-16.7

-3.0
9.0
3.4
-2.3
-6.5
-0.4

24.5
2.7
-15.9
4.8
-15.9
-0.1

-13.8
10.8
-1.6
11.8
-5.7
-1.6

14.8
14.4
0.6
-18.7
5.7
-16.7

-3.0
9.0
3.4
-2.3
-6.5
-0.4

24.5
2.7
-15.9
4.8
-15.9
-0.1

yij

yi
41

Anlisis de la varianza

Variabilidades: ejemplo
Variabilid ades
K ni

VT

( yij
i 1j 1
K

VE

ni ( y i

Grados de libertad

y )2

7645.5

n-1 23

y )2

4798.1

K-1 3

i 1

K ni

VNE

eij 2

2847.4

n-K

20

4798.1

2847.4

i 1j 1

7645.5
23
Anlisis de la varianza

20
42

Interpretacin grfica de la
descomposicin
y1
y2
yi

y3

yij

yi

y4
y

yij

y
43

Anlisis de la varianza

Distribucin de VE
yij
Si

N( i,
1

yi

N( i,

ni

que llamaremos
2

yi

y1
/ n1

y1

y
/ n1

Anlisis de la varianza

y2
/ n2

y2

y
/ n2

N( ,
2

ni

)
yK
/ nK

yK

y
/ nK

2
2
K

2
2
K 1

44

Distribucin de VNE
ni

y i )2

( yij
yij

N( i,

( yij

yi )

i 1j 1

( ni 1) si2

ni 1
1

( y1 j

y1 )

j 1

( y2 j

nK

( y Kj

j 1

y K )2

n K
( n1 1) s12

( n1 1) s12

y2 )

j 1

n K

( n K ) s R2

2
ni 1

K ni

s R2

j 1

si2

( n2 1) s22
n K

( n2 1) s22

(nK 1) s K2

2
n1 1

(nK 1) s K2

2
n2 1

2
nK 1

2
n K

45

Anlisis de la varianza

Contraste (Anlisis de la Varianza)


H0 :

H1 : Al menos una es diferente


K ) s R2
2

(n

F0

i 1

F0

F0

ni ( y i

y )2

ni ( yi

2
n K

Si Ho es cierto : i

1
2

2
K 1

)2

2
( K 1) s R
No se rechaza H 0

FK

1, n K

Se rechaza H 0

Anlisis de la varianza

46

Tabla de Anlisis de la Varianza


Suma de
Cuadrados

Fuentes
Tratamient os

ni ( y i

Residual
Total

y )

Grados de
Libertad
2

K 1

( yij

yi )2

n K

( yij

y )2

n 1

Varianzas
ni ( y i

y ) /( K 1)

F
ni ( y i

y )2

( K 1) s R2

2
sR

47

Anlisis de la varianza

Tabla de Anlisis de la Varianza


Suma de

Grados de

Fuentes

Cuadrados

Libertad

Varianzas

Tratamient os
Residual

4798.1
2847.4

3
20

1599.3
142.4

11.2

Total

7645.5

23

Anlisis de la varianza

48

Intervalos de confianza para


las medias
yij

N( i,

yi

yi
i

N( i,

tn

sR
ni

R.R

R.R.
i

yi

N (0,1)

ni
yi

ni

tn-K

1-

/2

/2

R. Acept. H0

-t

/2

/2

R
/2 n
i
49

Anlisis de la varianza

Intervalos de confianza

Semilla
A
B
C
D

Anlisis de la varianza

Media
242.9
218.7
214.1
245.9

L. Inferior L. Superior
235.7
211.4
206.9
238.7

250.1
225.8
221.3
253.1

50

Intervalos de confianza (95%)

Rendimiento

260
250
240
230
220
210
200
A

Semilla
51

Anlisis de la varianza

Diferencia de medias: y1

y11
2

y12

y1

N(

1,

n1

y2
( y1

y21
y22

y2

N(

2,

n2

y2 n2

y1n1
y1

y2

N(
y2 ) (
1
n1

1
1

1
n2

Anlisis de la varianza

2,
2)

n1

n2

)
( y1

y2 ) (

1
n1

1
n2

N (0,1)
sR

2)

tn

52

Contraste multiples

H0 :

tij

H1 :

yi

yj

sR

R.R

R.R.

1
ni

tn-K

1/2

tn

1
nj

/2

R. Acept. H0

-t

/2

t0

/2

No se rechaza H 0

t0

/2

Se rechaza H 0

Anlisis de la varianza

Diagnosis del modelo

/2

53

Modelo

...
2

y21

y11
y12

y22

y1n

y2 n

...

yK1
yK 2
y Kn

K
55

Anlisis de la varianza

Hiptesis del modelo


Normalidad
yij

N( i, 2)

Homocedasticidad
Var [yij] =

Independencia
Cov [yij, ykl] = 0

Anlisis de la varianza

56

Residuos:
Normales y homocedsticos

yij

uij

uij

yij

uij

N (0,

eij

yij

yi

Residuos
A
-13,8
10,8
-1,6
11,8
-5,7
-1,6
0,0

B
14,8
14,4
0,6
-18,7
5,7
-16,7
0,0

C
-3,0
9,0
3,4
-2,3
-6,5
-0,4
0,0

D
24,5
2,7
-15,9
4,8
-15,9
-0,1
0,0

Anlisis de la varianza

57

Comprobacin de la
normalidad
Los residuos deben de tener distribucin normal.
Las observaciones originales tambin, pero cada
grupo con media diferente, por ello es preciso
estimar el modelo para descontar a cada
observacin su media y obtener valores con la
misma distribucin.

Herramientas de comprobacin:
Histograma de residuos
Grfico de probabilidad normal (Q-Q plot)
Contrastes formales (Kolmogorov-Smirnov)
Anlisis de la varianza

58

Grfico probabilista normal


Es un grfico X-Y de
los residuos frente a
los percentiles de la
distribucin normal.

Pasos:
Ordenar los residuos
de menor a mayor.
e(1) e(2)
e(n)

La idea bsica es que


cuando los residuos
tienen distribucin
normal, los puntos
deben formar
aproximadamente
una lnea recta

Calcular los
percentiles de la
distribucin normal
1

Yi

i 0.5
) sR , i 1,2,..., n
n

Representar

e(i ) , Yi
59

Anlisis de la varianza

Grfico prob. Normal


(ejemplo)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Resid. Probab. Percen. Percen.


eij
(i-0.5)/n N(0,1) N(0, )
-18,7
-16,7
-15,9
-15,9
-13,8
-6,5
-5,7
-3,0
-2,3
-1,6
-1,6
-0,4
-0,1
0,6
2,7
3,4
4,8
5,7
9,0
10,8
11,8
14,4
14,8
24,5

0,021
0,063
0,104
0,146
0,188
0,229
0,271
0,313
0,354
0,396
0,438
0,479
0,521
0,563
0,604
0,646
0,688
0,729
0,771
0,813
0,854
0,896
0,938
0,979

Anlisis de la varianza

-2,04
-1,53
-1,26
-1,05
-0,89
-0,74
-0,61
-0,49
-0,37
-0,26
-0,16
-0,05
0,05
0,16
0,26
0,37
0,49
0,61
0,74
0,89
1,05
1,26
1,53
2,04

-24,30
-18,30
-15,01
-12,58
-10,58
-8,85
-7,28
-5,83
-4,46
-3,15
-1,88
-0,62
0,62
1,88
3,15
4,46
5,83
7,28
8,85
10,58
12,58
15,01
18,30
24,30

Q-Q plot
30,0
20,0
10,0

Percentiles

Orden
i

0,0
-10,0
-20,0
-30,0
-30,0

-20,0

-10,0

0,0

10,0

20,0

30,0

Residuos ordenados

60

Grfico probabilista normal


99.9

Probabilidad

99
95
80
50
20
5
1
0.1
-30

-20

-10

10

20

30

Residuos
61

Anlisis de la varianza

Ejemplos
99,9
99
95
80
50
20
5
1
0,1

99,9
99
95
80
50
20
5
1
0,1

Normal
-2,6

-1,6

-0,6

99,9
99
95
80
50
20
5
1
0,1

0,4

1,4

2,4

3,4

0,4

0,8

Anlisis de la varianza

1,2

1,6

99,9
99
95
80
50
20
5
1
0,1

No normal
0

No normal

12

15

No normal
-3

-1

62

Comprobacin de la
homocedasticidad
En el proceso de estimacin se ha supuesto que los
distintos tratamientos tienen la misma varianza

Herramientas
Grficos de residuos:
Frente a valores previstos
Frente a tratamientos (o factor,etc.)

Contrastes formales:
Bartlett, Cochran, Hartley, Levene

63

Anlisis de la varianza

Residuos - Valores previstos


En este modelo los valores
previstos corresponden a
la media del tratamiento

30

residuos

20
10
0
-10
-20
-30
210

220

230

240

250

valores previstos
30

residuos

20
10
0
-10
-20
-30
0

10

Valores previstos

Anlisis de la varianza

15

Los puntos deben


aparecer dispuestos
al azar en una banda
horizontal alrededor
del eje horizontal.
Heterocedasticidad:
a veces la dispersin
aumenta conforme la
media crece.
64

Residuos por tratamientos


25

mx.

mn.

Residuos

15
5
-5
-15
-25
A

Semilla

En cada grupo los residuos aparecen esparcidos


con dispersin similar y media cero.
65

Anlisis de la varianza

Residuos por tratamientos


25

mx.

mn.

Residuos

15
5
-5

mx
mn

-15
-25
A

Semilla

En cada grupo los residuos aparecen esparcidos


con dispersin similar y media cero.
Anlisis de la varianza

66

Contrastes formales

H0 :

2
1

...

2
2

2
K

H1 : Alguna es distinta
67

Anlisis de la varianza

Contraste de Bartlett
n1=n2==nK=m
1

( y1 j y1 ) 2

s12

m 1

sG2

yK1
s22

( y2 j y2 ) 2
m 1

...

y2n2

y1m
s R2

y22

s12

s22

sK2
K

s12 s22

s K2

Anlisis de la varianza

y21

y11
y12

...

2
Si Ho n K log sR
2
sG
cierto 1 c

yK 2

sK2

( y Kj y K ) 2
m 1

yKm
2
K 1

K 1
3(n K )
68

Contraste de Bartlett (general)


sR2

(n1 1) s12 (n2 1) s22


n K
n K

sG2

s12

n1 1

(nK 1) sK2
s22

n2 1

1
3( K 1)

n K
sR2
log 2
1 c
sG

Si Ho
cierto

nK 1

sK2
K

1
1 n K

i 1 ni

2
K 1

69

Anlisis de la varianza

Contraste de Bartlett: ejemplo


Datos
B
233,4
233,0
219,2
200,0
224,3
202,0
218,7

C
211,1
223,1
217,5
211,8
207,6
213,7
214,1

D
270,4
248,6
230,0
250,7
230,0
245,8
245,9

96,8

216,2

29,9

227,2

Varianzas

p valor

0,25

A
229,1
253,7
241,3
254,7
237,2
241,3
Medias 242,9

2
3

0.177

0.05

0.01

0
0

12

16

sR2

96.8 216.2 29.9 227.2


142.4
4

sG2

96.8 216.2 29.9 227.2 109.1

Anlisis de la varianza

2
0

n K
s R2
log 2
1 c
sG
20
142.4
log
1 (5 / 60)
109.1

4.91

70

0,57

0,57

0,37

0,37

residuos

residuos

Diagnosis: Tres grficos bsicos


0,17
-0,03

0,17
-0,03
-0,23

-0,23

-0,43

-0,43
0

0,3

0,6

0,9

1,2

probabilidad

Tratamientos

Valores previstos
99,9
99
95
80
50
20
5
1
0,1
-0,33

Homocedasticidad

Normalidad
-0,13

0,07

0,27

0,47

residuos

probabilidad

Grfico probabilista normal


99,9
99
95
80
50
20
5
1
0,1
-0,33

-0,13

0,07

0,27

0,47

residuos
Anlisis de la varianza

72

Transformaciones z=h(y)
para estabilizar la varianza
Desarrollo de Taylor para z

h( y ) en

1
z h( ) h' ( )( y
)
h' ' ( )( y
2
La media y varianzas de z son aprox.
E[z]

h( )

E[y]
)2

1
h''( )Var (y)
2

h' ( ) 2 Var [ y ]

Var [ z ]

73

Anlisis de la varianza

Ejemplo

a by

La media y varianzas de z son


E[z]

a b

Var [ z ] b 2 Var [ y ]

La Var[ z ] depende de b
Observacin: Esta transformacin no altera
las caractersticas de y: si y no tiene varianza
constante, z tampoco.
Anlisis de la varianza

74

Ejemplo

log( y)

La media y varianzas de z son aprox.


E[z]

log ( )
2

Var [ z ]

1
2

Var (y)

Var [ y ]

Si Var[ y] k

Var[ z]

79

Anlisis de la varianza

h( yij )

zij homocedsticas

zij

yij heterocedsticas

Transformaciones Box-Cox
z ij1,5

p>1

p=1

p<1

0,5

y ij

0
1

-0,5
-1

z ij

-1,5

z ij

yijp 1
p
log yij

si

0
81

Anlisis de la varianza

Bsqueda de la
transformacin adecuada
0,57

La dispersin
aumenta al aumentar
la media

residuos

0,37
0,17
-0,03
-0,23
-0,43
0

0,3

0,6

0,9

1,2

p<1

Valores previstos
1,6

La dispersin
disminuye al
aumentar la media

residuos

1,1
0,6
0,1
-0,4
-0,9
-1,4
0

12

16

p>1

valores previstos

Anlisis de la varianza

82

Eleccin de la transformacin z ij

p
yij

Empezar con p=1 (datos sin


transformar) y decidir a partir de los
grficos si p>1 o p<1.
p 1/ 2
p 0
p 1

p
p

1/ 2
1

z ij
yij
z ij log yij
1
z ij
yij
1
z ij
yij2

Parar cuando los grficos estn ok


Anlisis de la varianza

83

Independencia
Es la hiptesis fundamental y con diferencia
la ms importante de las tres, adems es la
ms difcil de comprobar.
La falta de independencia suele ir ligada a
factores no controlados por el
experimentador y que influyen en los
resultados introduciendo errores
sistemticos.
La forma ms recomendable de evitar
errores sistemticos consiste en aleatorizar.
Anlisis de la varianza

84

Aleatorizacin
La aleatorizacin evita que se
produzcan errores que
sistemticamente aumenten o
disminuyan un conjunto de medidas por
causas no reconocibles: al aleatorizar
se reparten estos errores por igual
entre los diferentes tratamientos y se
convierten en errores aleatorios,
previstos en el modelo.
Anlisis de la varianza

85

Cmo aleatorizar?
Asignar las unidades experimentales al
azar a los distintos tratamientos.
Aleatorizar el orden de ejecucin de los
experimentos.
Aleatorizar respecto a cualquier otra
variable que implique diferenciar a los
tratamientos.
distorsiones que pueden ocurrir o no ocurrir, y que
pudieran
Anlisis de la varianza

86

Apndice: Anlisis de la Varianza con R


ARCHIVO TEXTO: centeno.txt

Anlisis de la Varianza

87

Tabla ANOVA

Anlisis de la Varianza

88

230
210

medias

250

Intervalos de confianza

Sem
Anlisis de la Varianza

89

Comparaciones Mltiples

Anlisis de la Varianza

90

Diagnosis
Normal Q-Q

12
10

225

230

235

240

2
1
0

-2

-1

Theoretical Quantiles

Scale-Location

Constant Leverage:
Residuals vs Factor Levels

230

235

Fitted values

Anlisis de la Varianza

240

245

2
1
0
-1

1.0
0.5

225

19

12
10

-2

19

220

12

Fitted values

10
12

215

10

245

Standardized residuals

1.5

220

0.0

Standardized residuals

215

19

-1

0 10
-20

Residuals

19

Standardized residuals

Residuals vs Fitted

centeno$Sem :
C

Factor Level Combinations

91

An
alisis de la Varianza
1. En una fabrica de automoviles se utiliza una misma planta para el ensamblaje de tres modelos
distintos (A, B y C). Para determinar si los modelos reciben el mismo tratamiento, se ha
realizado un control de calidad a una muestra tomada para cada modelo. El n
umero de
defectos encontrados para cinco vehculos del modelo A son 5, 4, 6, 6 y 7; para seis vehculos
del modelo B son 7, 8, 6, 7, 6 y 5; y para ocho vehculos del modelo C: 9, 7, 8, 9, 10, 11, 10 y
10. Contrastar si existen diferencias en el tratamiento que se da a los distintos modelos.
2. Una empresa debe elegir entre cinco procedimientos para fabricar un cierto producto qumico.
Se sospecha que existen diferencias entre ellos aunque peque
nas. Para detectar estas diferencias se pretende realizar un experimento a gran escala con el mismo n
umero de observaciones
en cada grupo. Para determinar este tama
no muestral se ha realizado un experimento piloto
con 6 observaciones de cada metodo y los resultados (medias de cada grupo) han sido los
siguientes:
METODO
Media

1
2
3
4
5
425.6 423.2 418.8 430.2 422.2

y la varianza residual s2R = 198.5.


(a) C
ual debe ser el tama
no muestral del experimento a gran escala para que el contraste
de analisis de la varianza sea significativo con = 0.01 si el coeficiente de determinacion
es igual al del experimento piloto?.
(b) Dar un intervalo de confianza ( = 0.05) para la prevision del rendimiento realizado
mediante el metodo D (Nota: Se pide un intervalo para una observacion, no para la
media.).
(c) El metodo A es el procedimiento habitual y el metodo D es el que se sospecha proporciona mejor rendimiento. Una hipotesis que se pretende contrastar es H0 : D = A ,
frente a la hipotesis alternativa H1 : D > A . Que condicion debe cumplir la diferencia entre las medias muestrales de los dos metodos para rechazar H0 con = 0.01?
3. Se ha realizado un experimento para estudiar el efecto de un u
nico factor con I niveles
en la variable respuesta y con un n
umero diferente de observaciones en cada tratamiento:
n1 , n2 , ..., nI siendo el total n = n1 + n2 + + nI . Llamando yij a la observacion j del
tratamiento i, i = 1, ..., I, j = 1, 2, ..., ni e yi la media del tratamiento i. Se desea estimar
la media general cual de los dos estimadores siguientes

y =

ni
I P
P

yij

i=1 j=1

I
P

i=1

yi

,
y =
n
I
tiene mnima varianza? Realiza la comprobacion para el caso I = 5, con ni = 3, 2, 3, 5, 6 el
n
umero de observaciones en cada tratamiento. Asumir que las observaciones son independientes y que se cumple la hipotesis de homocedasticidad.
1

4. Considere la comparacion de dos tratamientos en poblaciones normales. Demuestre que el


contraste t para comparar dos medias es analogo al contraste de la F en Analisis de la
Varianza (suponga n1 = n2 ).
5. Cinco tipos (A, B, C, D y E) de material sintetico se han sometido a un ensayo de desgaste.
Para cada tipo de material la prueba se repitio 6 veces. El desgaste medio y la desviacion
tpica corregida en cada caso es la siguiente:

media xi
d. tpica si

A
B
C
D
E
14.1 16.3 13.5 14.8 15.3
1.3 1.2 1.4 1.2 1.5

(a) Contrastar ( = 0.05) la hipotesis


H0 : A = B = C = D = E
frente a la hipotesis alternativa,
H1 : Alguna media es distinta a las demas.
(b) Indicar con nivel de confianza 0.95 el material con desgaste menor y que materiales
tienen desgaste medio, distinto.
(c) Obtener un intervalo de confianza con = 0.01 para la varianza del error experimental.
6. Se desea comprobar el efecto de un tratamiento termico sobre la resistencia de un nuevo
material. Se han tomado 15 probetas y se han asignado al azar a los tres tratamientos T1 ,
T2 y T3 obteniendo como medida de resistencia superficial los valores siguientes:
T1
2.65
2.67
2.46
1.90
2.62

T2
4.31
3.96
4.64
4.74
4.00

T3
4.81
5.32
4.93
5.49
4.45

(a) Contrastar mediante el test de analisis de la varianza si existen diferencias significativas


entre los tratamientos termicos ( = 0.01).
(b) La temperatura del tratamiento 2 es la media de las temperaturas de los otros dos
tratamientos. Si la relacion entre la resistencia y la temperatura es lineal, es de esperar
que la media del tratamiento 2 verifique : H0 : 2 = 21 (1 + 3 ). Hacer el contraste
bilateral de esta hipotesis con = 0.05. (Nota.- Usar la distribucion de y 2 (y 1 +y 3 )/2,
donde y i es la media de los datos correspondientes al tratamiento Ti ).
7. En el modelo de analisis de la varianza para contrastar la igualdad de medias de I grupos,
con n1 , n2 , ..., nI observaciones en cada grupo; indicar, justificando la respuesta, si y , yi y
eij son independientes. Calcular los coeficientes de correlacion.
2

8. Explicar detalladamente la descomposicion de la variabilidad en el modelo basico de analisis


de la varianza para comparar I tratamientos. Obtener el estadstico F de contraste, indicando en cada paso las hipotesis utilizadas.
9. Demostrar que en el modelo para la comparacion de las medias de K tratamientos con el
mismo n
umero de observaciones, la varianza residual estimada (b
s2R ) es igual a la media de
las varianzas muestrales corregidas de cada tratamiento. Utilizando esta relacion, demostrar
que el estimador sb2R es insesgado y obtener su distribucion de probabilidad. Suponer que
se cumplen las hipotesis de normalidad, independencia y homocedasticidad, y dar por demostrado que la varianza muestral corregida sb2 , en una muestra aleatoria simple de tama
no
n de una distribucion normal, es un estimador centrado de la varianza de la distribucion 2 ,
y que (n 1)b
s2 / 2 se distribuye como una 2 con n 1 grados de libertad).
10. Explicar la descomposicion de la variabilidad en el modelo basico de comparacion de K
tratamientos (modelo con un factor ). Demostrar que si todos los tratamientos tienen la
misma media
VE
2K1 .
2
Indicar en cada paso las hipotesis requeridas. Nota.- Tener en cuenta que si X1 , X2 , ..., Xn
son variables
aleatorias independientes con distribucion normal de media y varianza 2 , y
P
X = Xi /n,
2
n 
X
Xi X
2n1 .

i=1
11. Un fabricante sospecha que los lotes de materia prima recibidos de un proveedor difieren
significativamente de su contenido en calcio. Elige al azar 5 lotes diferentes y un qumico
hace cinco determinaciones del contenido en calcio de cada lote. Los resultados obtenidos
han sido
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.29 23.38
La tabla de analisis de la varianza se proporciona a continuacion. Comparar mediante el
metodo de Bonferroni las medias de los cinco tratamientos con nivel de significacion total
T = 0.10.

Fuente
Lote
Residuos
Total

Analisis de la varianza
Variabilidad g.l. Var. Media
F
0.096976
4
0.024244 5.54
0.08760 20
0.00438
0.184576 24

Nivel crtico
0.0036

S-ar putea să vă placă și