Sunteți pe pagina 1din 109

EXPERIMENTOS CON

EXPERIMENTOS CON UN
UN SOLO
SOLO
FACTOR: EL
FACTOR: EL ANLISIS
ANLISIS DE
DE VARIANZA
VARIANZA
CAPITULO 3
Diseo y Anlisis de Experimentos
Montgomery
Ing. Gina Galindo
Cridto parcial: Ing. Rodrigo Wadnipar, 1
Definiciones
Factor: cada una de las variables experimentales que
el experimentador puede controlar, pueden ser
cualitativos o cuantitativos.

Tratamiento o nivel: grado de intensidad de un factor.

Rplicas: es el nmero de observaciones que tiene


cada tratamiento.

2
Ejemplo 3.1 Pag. 70 - Peso porcentual del algodn
Un ingeniero de desarrollo de producto tiene inters en investigar la resistencia
a la tensin de la fibra sinttica nueva que se usar para hacer tela de camisas
para caballero. El ingeniero sabe por experiencia previa que la resistencia a la
tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de
materiales de la fibra. Adems, sospecha que al aumentar el contenido de
algodn se incrementar la resistencia. Sabe as mismo que el contenido de
algodn deber variar entre 10 y 40 por ciento para que el producto final tenga
otras caractersticas de calidad que se desean (como la capacidad de ser
sometido a un tratamiento de planchado permanente). El ingeniero decide
probar ejemplares en cinco niveles del peso porcentual del algodn: 15, 20, 25,
30 y 35 por ciento. Tambin decide probar cinco ejemplares en cada nivel del
contenido de algodn.

51
3
Peso porcentual del algodn (continuacin)

Aleatorizacin:
Ahora se generan 25 nmeros aleatorios del 1 al 25 de uno
en uno sin repeticin, as por ejemplo, si en primer lugar se
gener el numero 8 entonces la observacin nmero 8
(20%) se corre primero, luego se genera otro nmero del 1
al 25 diferente de 8 hasta cuando las 25 observaciones
tengan asignada una posicin en la secuencia de prueba.
Suponga que la secuencia de prueba es la siguiente:
4
Peso porcentual del algodn
(continuacin)

5
Peso porcentual del algodn (continuacin)

6
Resultados del Experimento
Aleatorizacin (continuacin):
La aleatorizacin es necesaria para evitar que los efectos
de variables perturbadoras desconocidas contaminen los
resultados, por ejemplo si se utilizan mquinas en el
proceso, stas pueden desajustarse o calentarse, lo cual
influye en las medidas realizadas; los turnos de trabajo y los
operarios tambin pueden influir en los resultados; lo que se
busca con la aleatorizacin es minimizar el efecto de
fuentes generadoras de ruido.

7
Peso porcentual del algodn (continuacin)

Figura 3-1 118


Peso porcentual del algodn (continuacin)

Observaciones Individuales
Promedio de la resistencia a la Tensin 63
Figura 3-2 9
EL ANALISIS DE VARIANZA

10
MODELO PARA LOS DATOS
Es til describir las observaciones mediante el modelo
estadstico lineal
yij i ij , donde i = 1, 2, ... , a; j = 1, 2, ... n (3.1)
yij es la observacin ij-sima.
i es la media del nivel del factor o tratamiento i-simo.
ij es un componente del error aleatorio que incorpora todas las
dems fuentes de variabilidad del experimento
A la ecuacin (3.1) se le llama modelo de medias.
Una forma alternativa de describir un modelo de los datos
es definiendo
i = + i , i = 1, 2, , a
yDe tal modo que la ecuacin (3.1) se convierte en
ij i ij
, donde i = 1, 2, ... , a; j = 1, 2, ... n (3.2)
es la media global
i es el efecto del tratamiento i-simo
11
A la ecuacin (3.2) se le llama el modelo de los efectos.
ANALIS DEL MODELO CON
EFECTOS FIJOS

12
Anlisis del Modelo con Efectos Fijos
n
i = + i
i 1
i 0
n _
yi. yij , , , , , y i. y i. / n, _ donde _ i 1,2,..., a.
j 1
(3.3)
a n
y.. yij , , , , y.. y.. / N
i 1 j 1
Donde N = an es el nmero total de observaciones.
El subndice punto implica la operacin suma sobre el
subndice que reemplaza.

a = Nmero de niveles o nmero de tratamientos.


n = Nmero de observaciones por nivel o tratamiento.
13
Anlisis del Modelo con Efectos Fijos (continuacin)
El inters se encuentra en probar la igualdad de las
a medias de los tratamientos; es decir,
E(yij) = + i = i, i = 1, 2, , a. Las hiptesis son:
Ho: 1 = 2 = ... = a
H1: i j para al menos un par (i, j)
Los efectos del tratamiento o factor pueden considerarse como
desviaciones de la media global.
Una forma de escribir las hiptesis anteriores es en trmino de
los efectos de los tratamientos i
El procedimiento apropiado para
Ho: 1 = 2 = ... = a = 0 probar la igualdad de las medias,
H1: i 0 para al menos una i es el anlisis de varianza

14
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL
El nombre anlisis de varianza se deriva de la particin de la
variabilidad total en sus partes componentes. La suma de
cuadrados total corregida
SS T
a n

i 1 j1
y y
ij ..
2

se usa como una medida de la variabilidad global de los datos.


La suma de cuadrados total corregida SST se puede escribir como

(3.4)
a

n

i 1 j 1
y
ij y..
2

n
a

i 1
yi. y..
2


a n

i 1 j 1
y
ij y i.
2

(3.5)
SS T
SS Tratamientos SS E

(3.6)
15
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
Es til examinar los dos trminos del lado derecho de la identidad
fundamental del ANOVA.

E
a n

SS y ij y i. y ij y i.
i 1 j 1
2 a

i 1
n

j 1
2

En esta forma es fcil ver que el trmino entre corchetes, si se divide


por n-1, es la varianza muestral del tratamiento i-simo, o
n

y ij y i. 2

S , , , , , para :, , , , i 1,2,..., a
2 j 1
i
n 1
Si se combinan las a varianzas muestrales se obtiene una sola
estimacin de la varianza poblacional
a n

2
yij y i.
n 1 S1 n 1 S 2 ... n 1 S a i 1 j 1
2 2 2
SS E

( n 1) ( n 1) ... ( n 1) a N a
n 1 16
i 1
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La relacin NSS a es una estimacin combinada
E

de la varianza comn dentro de cada uno de los a


tratamientos.
De manera similar, si no hubiera diferencia entre
las medias de los tratamientos, podra usarse la
variacin de los promedios de los tratamientos y el
gran promedio para estimar 2. Especficamente

SS
a
n yi. y.. 2

Tratamientos
i 1
a 1 a 1
Es una estimacin de 2 si las medias de los
tratamientos son iguales.
17
Formalmente:

Se puede demostrar que:

18
DESCOMPOSICION DE LA SUMA DE
CUADRADOS TOTAL (continuacin)
La identidad del anlisis de varianza (ecuacin 3.6) proporciona dos
estimaciones de 2:
Una basada en la variabilidad inherente dentro los tratamientos.
Una basada en la variabilidad entre los tratamientos.
Si no hay diferencias en las medias de los tratamientos, estas dos
estimaciones debern ser muy similares, y si no lo son, se sospecha
que la diferencia observada puede ser causada por diferencias en las
medias de los tratamientos.
SS Tratamientos (entre los tratamientos)
A las cantidades MS Tratamientos
a 1
y MS SSE
(dentro de los tratamientos)
E
N a
se les llama cuadrados medios.

19
TEOREMA DE COCHRAN
Puesto que los grados de libertad de SSTratamientos y SSE suman N 1 (
el nmero total de grados de libertad), el teorema de Cochran implica
que SSTratamientos / 2 y SSE / 2 son variables aleatorias ji-cuadrada con
una distribucin independiente. Por lo tanto, si la hiptesis nula de que
no hay diferencias en las medias de los tratamientos es verdadera, el
coeficiente
SS / a 1 MS
F
Tratamientos Tratamientos

SS / N a
0

E MS E

se distribuye como F con a -1 y N a grados de libertad. F0 es el


estadstico de prueba para la hiptesis. H0 se rechaza si:

F F
0 , a 1, N a

20
TEOREMA DE COCHRAN (continuacin)
Es posible obtener frmulas para calcular estas sumas de
cuadrados reescribiendo y simplificando las definiciones de
SSTratamientos y SST, as:
2
a n y
SS y
2 ..
T
N
ij
i 1 j 1

1
2
y a
y
2
SS
..
Tratamientos
n N
i.
i 1

La suma de cuadrados del error se obtiene por substraccin como:

SS SS SS
E T Tratamientos

El procedimiento de prueba se resume en las siguiente tablas:

21
Anlisis de Varianza

DATOS TIPICOS DE UN EXPERIMENTOS DE UN SOLO FACTOR


PARA LA TABLA ANOVA
Tratamiento
Observaciones Totales Promedios
(nivel)
1 y11 y12 y1n y1.
2 y21 y22 y2n y2.

. . . . . .
. . . . . .
. . . . . .

a ya1 ya2 yan ya.
y..

22
Anlisis de Variancia (continuacin)

23
Peso porcentual del algodn Anlisis de Variancia

24
Peso porcentual del algodn Anlisis de
Variancia (continuacin)

25
81
Ejercicio en clase 3-01
La fuerza de la tensin de la adhesin del mortero de cemento
portland es una caracterstica importante del producto. Un ingeniero
est interesado en comparar la fuerza de una formulacin
modificada en la que se han agregado emulsiones de ltex de
polmeros durante el mezclado, con la fuerza del mortero sin
modificar. El experimentador ha reunido 10 observaciones de la
fuerza de la formulacin modificada y otras 10 observaciones de la
formulacin sin modificar. Los datos se muestran a continuacin.
Podra hacerse referencia a las dos formulaciones diferentes como
dos tratamientos o como dos niveles del factor formulaciones.

Experimentos
Comparativos Simples
26
Ejercicio en clase 3-02

27
Ejercicio en clases 3-03
Se compar la poblacin de aves en cuatro reas de
Bosques diferentes, as: Un rodal de ciprs (RC), un bosque
secundario del noroeste (BSN), una plantacin de pinos patula
(PP), y un bosque secundario aislado (BSA); localizadas en
Piedras Blanca (Antioquia). El total de especies observadas
por da fue el siguiente:

a) Especifique el modelo,
construya la tabla ANOVA, e
interprete los resultados.
b) Estime las medias para
cada uno de los bosques y
construya los intervalos de
confianza respectivos fijando un
(1 - )100% apropiado.
28
ESTIMACIN DE LOS PARMETROS DEL MODELO

Es necesarios desarrollar estimadores para los parmetros


del modelo de clasificacin, partiendo de:

yij i ij
i es el efecto del tratamiento i-simo

Luego de desarrollar el mtodo de mnimos


cuadrados, derivar y simplificar obtenemos un sistema
de ecuaciones lineales, cuya solucin es la siguiente:


y ..

i y y , , , , , , , i 1,2,..., a
i. .. 29
ESTIMACIN DE LOS PARMETROS DEL MODELO (continuacin)

Ahora, es posible determinar un intervalo de confianza


para estimar la media del i-simo tratamiento, dicha media
es:
i
i

Un intervalo de confianza para (% para el i-simo


tratamiento podra ser:

y t , N a MS E
y t , N a MS E
i. n i i. n
De la misma manera para una diferencia de medias, digamos
i j, sera:

y y t , N a 2MS E
y y t , N a 2MS E
i. j. n i j i. j. 30 n
Ejemplo 3.3 Pag. 75: Siguiendo el ejemplo 3-1 pueden
encontrarse las estimaciones de la media global y de los

efectos de los tratamientos como: 376 / 25 15.04

Y utilizando la ecuacin: i y y , , , , , , , i 1,2,..., a


i. ..

Calculamos los efectos de 1 a 5.


1 y y 9.80 15.04 5.24


1. ..

2 y y 15.40 15.04 0.36


2. ..

3 y 3.
y ..
17.60 15.04 2.56

4 y y 21.60 15.04 6.56



4. ..

5 y y 10.80 15.04 4.24


5. ..
31
Ejemplo 3.3 (continuacin)

y t , N a MS E
y t , N a MS E
i. n i i. n
Con un intervalo de confianza del 95% para la media del
tratamiento 4 (30% de algodn), obtenemos: 21.60 2.651,
por lo que el intervalo quedara de la siguiente manera:

8.06 8.06
21.60 2.086 21.60 2.086
5 4 5
21.60 2.65 21.60 2.65
4
Por lo tanto, el intervalo de confianza de 95% es:

18.95 4 24.25 32
VERIFICACION DE LA
ADECUACION DEL
MODELO

33
EL SUPUESTO DE NORMALIDAD
La verificacin del supuesto de normalidad podra hacerse graficando
un histograma de los residuales.
Si se satisface el supuesto NID(0, 2) para los errores, esta grfica
deber parecerse como una muestra de una distribucin normal con
centro en cero. Pero con muestras pequeas suelen ocurrir
fluctuaciones significativas y pueden aparecer una desviacin
moderada de la normalidad.
Un procedimiento en extremo til es construir una grfica de
probabilidad normal de los residuales.
Los residuales se calculan as: Re sidualij yij yi .

34
EL SUPUESTO DE NORMALIDAD (continuacin)

pj = (( j 0.5) / N) * 100

35
EL SUPUESTO DE NORMALIDAD (continuacin)

pj = (( j 0.5) / N) * 100
Grfica de Probabilidad Normal de los Residuales

120

100
% de Probabilidad Normal
(Pj = (( j - 0.5)/N)100)

80

60

40

20

0
-6 -4 -2 0 2 4 6
Residual (eij = yij - ybi.)

36
GRAFICA DE LOS RESIDUALES EN
SECUENCIA EN EL TIEMPO

37
GRAFICA DE LOS RESIDUALES EN
SECUENCIA EN EL TIEMPO (cont.)

38
GRAFICA DE LOS RESIDUALES CONTRA
LOS VALORES AJUSTADOS

39
GRAFICA DE LOS RESIDUALES
VS. LOS NIVELES

40
PRUEBAS ESTADSTICAS
DE IGUALDAD DE
VARIANZA

41
42
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA
Aun cuando es frecuente el uso de las grficas residuales para
diagnosticar la desigualdad de varianzas, se han propuesto tambin
varias pruebas estadsticas.
Estas pruebas pueden considerarse como pruebas formales de las
hiptesis H0: 21 = 22 = ... = 2a
H1: 2i 2j Para al menos un par (i, j)
La igualdad de varianza se conoce como homocedasticidad.
Un procedimiento muy til es la prueba de Barlett.
q
0 2.3026 c
2 a

log10 S p ni log10 S i
2 2
donde q ( N a ) ( 1)
i 1

ni 1 N a
1 a 1 1
c 1
Si es la varianza
3 a 1
2
i 1
muestral de la

n 1 S
a
poblacin i-sima 2
i i
2
S p
i 1
N a
43
PRUEBAS ESTADISTICAS PARA
IGUALDAD DE VARIANZA (continuacin)
La cantidad q es grande cuando la diferencia entre las
varianzas muestrales Si2 es considerablemente grande, y es
igual a cero cuando todas las Si2 son iguales.
H0 deber rechazarse para los valores de 02 que sean muy
grandes; es decir, se rechaza H0 slo cuando
20 > ,a-1
Donde ,a-1 es el punto porcentual superior a la
distribucin ji-cuadrada con a - 1 grados de libertad.
La prueba de Barlett es muy sensible al supuesto de
normalidad. Por consiguiente, cuando la validez de este
supuesto est en duda, no deber usarse la prueba de
Barlett.
44
Ejemplo 3.4 Pag. 82
Ya que el supuesto de normalidad no est entre dicho en el
ejemplo de la resistencia a la tensin de la fibra sinttica
para fabricar tela, se puede usar la prueba de Barlett.
Se calculan primero las varianzas muestrales de cada
tratamiento y se encuentra que: S21=11.2, S22=9.8, S23=4.3,
a

S24=6.8, S25=8.2. Entonces log S n log S


2 2
q ( N a) p
( i
1) i
10 10
i 1

q
ni 1 N a
2 1 a 1 1
2.3026 c 1
3 a 1

0 c i 1

n 1 S
a
2

2 4(11.2) 4(9.8) 4(4.3) 4(6.8) 4(8.2) i i

Sp 8.06
2
Sp i 1

N a
25 5

q 20 log (8.06) 4 log 11.2 log 9.8 log 4.3 log 6.8 log 8.2 0.45
10 10 10 10 10 10

1 5 1
c 1 1.10
3(4) 4 20

0.45
0 2.3026 1.10 0.93
2

Y el estadstico de prueba es
Puesto que 0.05, 4 = 9.49, no puede rechazarse la hiptesis
nula y se concluye que las cinco varianzas son iguales.
45
5
(H0 se rechaza slo cuando 2
0>
,a-1 )
Ejemplo 3.5 Pag. 83
Un ingeniero civil est interesado en determinar si
cuatro mtodos diferentes para estimar la
frecuencia de las inundaciones producen
estimaciones equivalentes de la descarga pico
cuando se aplican a la misma cuenca.
Cada procedimiento se usa seis veces en la
cuenca, y los datos de las descargas resultantes
son:

46
Ejemplo 3.5 Pag. 83 (continuacin)

El anlisis de varianza implica que hay una


diferencia en las estimaciones de las descargas
pico promedio obtenidas en los cuatro
procedimientos como se muestra a continuacin.
ANOVA Table for Col_2 by Col_1

Source Sum of Squares Df Mean Square F-Ratio F0.05,3,20 P-Value

Between groups 708.3470 3 236.1160 76.0700 3.0984 0.0000


Within groups 62.0811 20 3.1041
Total (Corr.) 770.4280 23
47
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica de los residuales contra los valores ajustados es preocupante
porque la forma de embudo con la boca hacia afuera indica que no se
satisface el supuesto de una varianza constante.
yi eij
0.71 -0.370
0.71 -0.590
0.71 0.520
0.71 -0.010
0.71 1.040
0.71 -0.590
2.63 -1.717
2.63 0.313
2.63 -0.487
2.63 -0.267
2.63 0.233
2.63 1.923
7.93 -1.620
7.93 0.440
7.93 1.820
7.93 -1.840
7.93 1.890
7.93 -0.690
14.72 2.435
14.72 -2.895
14.72 -3.765
14.72 2.485
14.72 -0.365
14.72 2.105 48
Ejemplo 3.5 Pag. 83 (continuacin)
Seleccin emprica de una trasformacin:
Si los experimentadores conocieran la relacin entre la
varianza de las observaciones y la media, podran usar esta
informacin como gua para la seleccin de la forma de la
transformacin.
Se desarrolla ahora este punto: Sea E(y) = la media de
y, y suponga que la desviacin estndar de y es
proporcional a una potencia de la media de y tal que:
sy Quiere encontrarse una transformacin de y que
produzca una varianza constante. Suponga que la
transformacin es una potencia de los datos originales, por
ejemplo y* = y
Puede demostrarse entonces que: * 1
y
Evidentemente, si se hace = 1- , la varianza de los
datos transformados y* es constante. 49
Ejemplo 3.5 Pag. 83 (continuacin)
Transformaciones para estabilizar la varianza
Relacin entre
Transformacin Comentario
y y
y constante 0 1 Sin transformacin
1/2
y 1/2 1/2 Raz cuadrada Datos (nmeros) de Poisson
y 1 0 Log
3/2
y 3/2 -1/2 Raz cuadrada recproca
2
y 2 -1 Recproco

Con frecuencia las transformaciones tienen escaso efecto a menos


que el cociente ymx/ymn sea mayor que 2 3.

50
Ejemplo 3.5 Pag. 83 (continuacin)
Al graficar log Si contra log yi. de los datos originales, se
observa que la pendiente de la recta que pasa por los cuatro
puntos est cerca de ; por la tabla de transformaciones
para estabilizar la varianza, se considera que la
transformacin de la raz cuadrada puede ser apropiada.
log yi.

51
Ejemplo 3.5 Pag. 83 (continuacin)
La tabla de los datos originales ya transformados,
se muestra a continuacin:
Mtodo de
Observaciones Transformadas
Estimacin
1 0.58 0.35 1.11 0.84 1.32 0.35
2 0.95 1.71 1.46 1.54 1.69 2.13
3 2.51 2.89 3.12 2.47 3.13 2.69
4 4.14 3.44 3.31 4.15 3.79 4.10

El anlisis de varianza es entonces:


ANLISIS DE VARIANZA
Origen de las Suma de Grados de Promedio de Valor crtico
F0 P value
variaciones cuadrados libertad los cuadrados para F
Entre grupos 32.6842 3 10.8947 76.9965 3.1274 0.0000000001
Dentro de los grupos 2.6884 19 0.1415

Total 35.3726 22
52
Ejemplo 3.5 Pag. 83 (continuacin)
La grfica residual muestra una mejora sensible
en comparacin con la anterior.

53
DATOS NO BALANCEADOS

54
DATOS NO BALANCEADOS
En algunos experimentos de un solo
factor, el nmero de observaciones
recolectadas en cada tratamiento pueden
ser diferentes, cuando esto ocurre, se dice
que el diseo est desequilibrado, es no
balanceado.
Sigue siendo posible aplicar el anlisis de
varianza anteriormente establecido para
datos balanceados, pero deben hacerse
ligeras modificaciones en las frmulas de
las sumas de cuadrados. 55
DATOS NO BALANCEADOS (continuacin)
Hay dos ventajas al elegir un diseo
equilibrado:
Primera con muestras del mismo tamao,
la estadstica de la prueba es
relativamente insensible a pequeas
desviaciones de la suposicin de la
igualdad de las varianzas en los
tratamientos.
Segunda, el poder de la prueba se
maximiza cuando las muestras tienen el
mismo tamao. 56
DATOS NO BALANCEADOS (continuacin)
Sea que se hagan ni observaciones bajo el tratamiento
i (i = 1, 2, , a) y que N a
n i 1 i

Las frmulas para calcular manualmente SST y


SSTratamientos quedan como:
a
yi2. y..2
SSTratamientos
i 1 ni N
2
a n
y ..
SST y 2
ij
i 1 j 1 N

No se requieren ms cambios.
57
Ejercicio en clase 3-04 (datos no balanceados)
Se estn investigando cuatro catalizadores que
pueden afectar la concentracin de un componente en
una mezcla lquida de tres componentes. Se obtienen
las siguientes concentraciones:

a) Tienen los cuatro catalizadores el mismo efecto


sobre la concentracin?
b) Analizar los residuales de este experimento.
c) Construir la estimacin de un intervalo de confianza de
99% para la respuesta media del catalizador 1.
58
Ejercicio en clase 3-05 (datos no balanceados)

Se conjetura que el peso al nacer de un nio est asociado


con el nivel de consumo de cigarrillos de la madre durante el
primer trimestre de gestacin. Un estudio realizado en una
clnica de maternidad dio los siguientes resultados para
madres agrupadas segn el habito de fumar. Los datos son
los pesos (en gramos) de los nios al nacer (Rosner 1986).

a) Efecte el ANOVA e
interprete la prueba F.
b) Calcule medias y
varianzas para cada
grupo.
c) Compare los pesos
promedios de los 4
grupos.

59
INTERPRETACION
PRCTICA DE LOS
RESULTADOS

60
INTERPRETACION PRCTICA DE
LOS RESULTADOS

9
61
Un Modelo de Regresin

62
Un Modelo de Regresin (continuacin)

y = -0,0886x2 + 4,5926x -
30 30 y = -0,0076x3 + 0,4814x2 -
39,989 Serie1 Serie1
9,0114x + 62,611
R2 = 0,7921 R2 = 0,9286
25 25
Serie2 Serie2

20 20
Serie3 Serie3

15 Serie4 15 Serie4

10 Serie5 10 Serie5

5 Serie6 5 Serie6

Polinmica Polinmica
0 0
(Serie6) (Serie6)
0 20 40 0 20 4063
Un Modelo de Regresin (continuacin)

64
Comparacin Grfica de Medias
Es muy sencillo desarrollar un procedimiento grfico para la
comparacin de las medias despus de un ANOVA._ _ _
Suponga que el factor de inters tiene a niveles y quey1. , y2. ... ya .
son los promedios de los tratamientos. Si se conoce , el promedio de
cualquier tratamiento tendr una desviacin estndar i / n .
Entonces, si todas las medias_de los niveles del factor son idnticas, las
medias muestrales observadas y i . se comportaran como un conjunto _
de observaciones tomadas al azar de una distribucin normal con y ..
media / n estndar
y desviacin .
Visualice una distribucin normal con _la capacidad
_ _ de ser deslizada
sobre un eje abajo del cual estn graficadas
y1. , y2. ... ya. . Si todas las
medias de los tratamientos son iguales, deber _ haber una posicin de
yi .
esta distribucin que haga evidente que los valores se sacaron de la
misma distribucin.
_
Si no es este el caso, los valoresy que no parecen haberse sacado de
i.
esta distribucin se asocian con los niveles del factor que producen
respuestas medias diferentes. 65
Comparacin Grfica de Medias (continuacin)
Punto dbil: se desconoce , en este caso se sustituye con MS E
del anlisis de varianza y usar una distribucin t con factor de escala
MS E / n en lugar de la distribucin normal.
Ejemplo: Para trazar la distribucin t, simplemente se multiplica el valor de
la abscisa t por el factor de escala MS E

8.06
1.27
y se grafica
contra la ordenada de t en este punto. n 5
En la figura se ve que no hay ninguna posicin de la distribucin tal que
los cinco promedios puedan considerarse como observaciones tpicas
seleccionadas al azar de la distribucin.

15 35 20 25 30 Niveles (% Algodn)
5 10 15 20 25 Media (Res.Ten.)
Resistencia a la tensin promedio (lb/pulg )
2

Esto implica que las cinco medias no son iguales; por lo tanto, la figura es
una representacin grfica de los resultados del anlisis de varianza.
La figura indica que el 30% de algodn produce resistencia a la tensin
mucho ms alta que 20 25 por ciento de algodn y que 15 35 por
ciento de algodn producirn resistencias aun ms bajas. 66
Contrastes
Al principio podra sospecharse que los niveles 4 y 5 (30% y 35%)
producen la misma resistencia a la tensin, lo que implica que la
hiptesis a probar sera H0: 4 = 5
Hi: 4 5 (3.23)
Si desde el principio del experimento se hubiera sospechado que el
promedio de los niveles ms bajos del peso porcentual del algodn
(1 y 2) no difera del promedio de los niveles ms altos del peso
porcentual del algodn (4 y 5), entonces la hiptesis habra sido
H0: 1 + 2 = 4 + 5
Hi : 1 + 2 4 + 5 (3.24)

67
71
Contrastes (continuacin)
En general, un contraste es una combinacin lineal de parmetros de
a
la forma c
i 1
i i
donde las constantes de los contrastes c 1, c2,.., ca
a

suman cero; es decir,


c 0
i 1
i

Las dos hiptesis anteriores


a pueden expresarse en trminos de
contrastes. : H c
0
0
i 1
i i

a (3.25)
H : c
1
i 1
i i
0

Las constantes de los contrastes para las hiptesis de la ecuacin 3.23


son c1 = c2 = c3 = 0; c4 = +1; c5 = -1; mientras que para la ecuacin 3.24
son c1 = c2 = +1; c3 = 0; c4 = c5 = -1.
70 72
68
Contrastes (continuacin)
Las pruebas de hiptesis que incluyen contrastes pueden hacerse de
dos maneras bsicas. En el primer mtodo se utiliza la prueba t.
El contraste de inters se escribe en atrminos de los totales de los
C ci y
tratamientos, obtenindose
i.
i 1
a

n c
2 2
La varianza de C es V (C ) (3.26) cuando los
i
i 1
tamaos de las muestras de cada tratamiento son iguales. Si la
hiptesis nula de la ecuacin 3.25 es verdadera, el cociente
a

c y i i. tiene la distribucin N(0,1). Entonces se sustituira


i 1
a
la varianza desconocida 2 con su estimacin,
el error cuadrtico medio MSE, y se
n el
2 2

utilizara i 1
ci estadstico
a

c y i i.
(3.27)
para probar la hiptesis de la ecuacin
t
0
i 1
a 3.25.
E ci
2
La Hn0 se
MSrechaza si It0I excede t/2, N-a
i 1

69
71
Contrastes (continuacin)
En el segundo enfoque se utiliza la prueba F. Entonces, el cuadrado
de una variable aleatoria t con v grados de libertad es una variable
aleatoria F con un grado de libertad en el numerador y v grados de
libertad en el denominador. Por lo tanto puede obtenerse

a

c y
2
i i.
Como un estadstico F para probar la
F t
2 i 1
0 0 a
(3.28) ecuacin 3.25. La hiptesis nula se
n MS c
2
E
i 1
i
rechazara si F0>F,1,N-a
Este estadstico de prueba de la ecuacin 3.28 puede escribirse como

MS SS /1
F C
C

MS
0
E MS E

Donde la suma de cuadrados de los contrastes con un solo grado de


libertad es a 2


c y i i.

SS C
i 1
a (3.29)
n c 2
i
70
i 1
Intervalos de Confianza para un Contraste
En lugar de probar hiptesis acerca de un contraste, puede ser ms
til construir un intervalo de confianza. Entonces el contraste suele
expresarse en trmino de los promedios de los atratamientos yi.
Suponga que el contraste de inters es: c
i i
i 1

Al sustituir las medias de los tratamientos


a
con los promedios de los
tratamientos se obtiene C c y i i.
i 1

V (C ) c
2 a
2

n i 1
i

cuando los tamaos de las muestras son iguales. Si se usa MSE para
estimar 2, el intervalo de confianza de 100(1-a) por ciento para el
contraste i 1 ci i es
a

c y t MS a
2
a
ci ci
a

y t MS a
2
E
c (3.30) c E

i 1
i i. 2
, N a
n i 1
i
i 1
i
i 1
i. 2
, N a
n i 1
i

Evidentemente, si este intervalo de confianza incluye al cero, no podra


rechazarse la hiptesis nula en la ecuacin 3.25. 71
77
Contraste Estandarizado
Cuando hay inters en ms de un contraste, con frecuencia es
til evaluarlos en la misma escala. Una forma de hacer esto es
estandarizando el contraste para que su varianza sea 2.
Si el contraste i 1 ci
a
i
se expresa en trminos de los
totales de los tratamientos como ci y
a
al dividirlo por
i 1 i.
ni 1 ci
a 2
se obtendr un contraste estandarizado con
varianza 2. Entonces el contraste estandarizado es en
realidad
c y
a *
i 1 i i.

* c
donde ci
a
i

n c
2
i
i 1

72
Tamao de las Muestras Desiguales
Cuando los tamaos de las muestras de cada tratamiento son
diferentes, se introducen modificaciones menores en los resultados
anteriores. Primero, observe que la definicin de un contraste
nc
a
requiere ahora que 0
i 1 i i

Otros cambios requeridos son directos. Por ejemplo, el estadstico t


a
de la ecuacin 3.27 queda como y c i i.

t
0
i 1
a

MS ni c
2
E i
i 1

Y la suma de cuadrados de los contrastes de la ecuacin 3.29


queda como a


c y
2

i i.

SS C
i 1
a

ni c
2

i
i 1 73
Contrastes Ortogonales ( caso especial )
Dos contrastes con coeficientes { ci } y { di } son
a
ortogonales, si: ci d i 0
i 1

o, para un diseo no balanceado, si n c d


i 1
i i i
0

Para a tratamientos, el conjunto de a-1 contrastes


ortogonales hace la particin de la suma de cuadrados
debida a los tratamientos en a-1 componentes
independientes con un solo grado de libertad. Por lo tanto,
las pruebas que se realizan en los contrastes ortogonales
son independientes.

74
Contrastes Ortogonales ( caso especial )
Ejemplo: Si hay a = 3 tratamientos, donde el tratamiento 1 es el control
y donde los niveles del factor en los tratamientos 2 y 3 son de inters
para el experimentador, los contrastes ortogonales apropiados podran
ser los siguientes:

Contraste 1: ci = -2,1,1 ( compara el efecto promedio del factor con el


control ).
Contraste 2: di = 0,-1,1 ( compara los dos niveles del factor de inters )
En general, el mtodo de contrastes (o de contrastes ortogonales) es
til para lo que se llama comparaciones preplaneadas.

75
Ejemplo 3.6 Pag. 94
Considere los datos del ejemplo 3.1

Suponga que antes de correr el experimento se especific la


siguiente serie de comparaciones entre las medias de los
tratamientos
5 medias de tratamientos y 4 grados de libertad.
Hiptesis Contraste
Ho: 4 = 5 C1 = -y4. + y5.
Ho: 1 + 3 = 4 + 5 C2 = y1. + y3. - y4. - y5.
Ho: 1 = 3 C3 = y1. - y3.
76
Ho: 4 2 = 1 + 3 + 4 + 5 C4 = -y1. + 4y2. - y3. - y4. - y5.
80
Ejemplo 3.6 (continuacin)
Los coeficientes de los contrastes son ortogonales. Con los
datos de la tabla, se determina el valor numrico de los
contrastes y la suma de los cuadrados.
2
a

c y i


i.
i 1
Remplazando: SS C a
n ci
2

i 1

C1 = -54 SSc1 = ( -54 )2 / (5 * ( 2 )) = 291.6

C2 = -25 SSc2 = ( -25 )2 / (5 * ( 4 )) = 31.25

C3 = -39 SSc3 = ( -39 )2 / (5 * ( 2 )) = 152.1

C4 = 9 SSc4 = ( 9 )2 / (5 * ( 20 )) = 0.81 77
79
Ejemplo 3.6 (continuacin)
ANOVA - Resistencia a la Tensin del Peso porcentual del algodn
Grados Cuadra
Suma
de do
Fuente de Variacion Cuadrados Fo F0.05,4,20 P value
libertad Medio
(SS)
(Dof) (MS)
Peso porcentual del algodn 475.76 4 118.94 14.76 2.87 0.00000913
Contrastes ortogonales
C1 = -y 4. + y 5. 291.6 1 291.6 36.18 4.35 0.00000701
C2 = y 1. + y 3. - y 4. - y 5. 31.25 1 31.25 3.88 4.35 0.06295952
C3 = y 1. - y 3. 152.1 1 152.1 18.87 4.35 0.00031474
C4 = -y 1. + 4y 2. - y 3. - y 4. - y 5. 0.81 1 0.81 0.10 4.35 0.75452031

Error (Dentro de los tratamientos) 161.20 20 8.06


Total 636.96 24

Por los valores de P se concluye que hay diferencias


significativas entre los niveles 4 y 5, y 1 y 3 del peso porcentual
del algodn, pero que el promedio de los niveles 1 y 3 no
difiere del promedio de los niveles 4 y 5 con el nivel = 0.05,
y que el nivel 2 no difiere del promedio de los otros 4 niveles.
78
84 26
Mtodo de Scheff para Comparar todos
los Contrastes
Scheff ha propuesto un mtodo para comparar todos y cada uno de los
contrastes posibles entre las medias de los tratamientos.
Supongamos que se ha determinado un conjunto de m contrastes de las medias
de tratamientos.

u = c1u 1 + c2u 2 + .... + cau a u = 1, 2, ..., m (3.31)


yi.
El contraste correspondiente usando los promedios de tratamiento es:
Cu = c1u y1.+ c2u y2. + .... + cau ya. u = 1, 2, ..., m (3.32)

c
a

MS
2
El error estndar de este contraste es: Scu E iu
/ ni (3.33
i 1

ni es el nmero de observaciones en el tratamiento i-simo.


El valor crtico con el que debe ser comparado Cu es:
S a ,u S C (a 1) F ,a 1, N a (3.34)
u

Para probar la hiptesis nula de que el contraste u difiere de manera significativa


de cero, se compara Cu con el valor crtico. Si u
S ,u C
se rechaza la
79
hiptesis de que el contraste u es igual a cero.
Mtodo de Scheff para Comparar todos
los Contrastes (continuacin)
Para ilustrar el procedimiento, considere los datos del ejemplo 3.1 y suponga
que los contrastes de inters son:
1 =
2 =
Los valores numricos de estos contrastes son:
C1 =
y1. + y3. - y4. - y5. Puesto que | C1 | < S0.01,1, se
= 9.80 + 17.60 21.60 10.80 = 5.00 concluye que el contraste
C2 = y1. - y4. 1 = es igual
= 9.80 - 21.60 = -11.80 a cero; es decir, no existe
Los errores estndar se calculan con 3.33: evidencia slida para concluir
que las medias de los tratamientos
Sc MS c / n 8.06(1 1 1 1) / 5 2.54
5
2

1 y 3 como grupo difieren de las


1 E i1 i
i 1

Medias de los tratamientos 4 y 5


Sc MS c / n 8.06(1 1) / 5 1.80
5
2
2 E
i 1
i2 i como grupo.
Por la ecuacin 3.34, los valores crticos de 1% son Sin embargo, como | C2 | > S0.01,2,
se concluye que el contraste
S 0.01,1 S C (a 1) F0.01,a 1, N a 2.54 4(4.43) 10.69
1
1 = no es igual acero; es
S 0.01, 2 S C (a 1) F0.01,a 1, N a 1.80 4(4.43) 7.58 decir, las resistencias medias de
1

los tratamientos 1 y 4 difieren


significativamente.80
Prueba Tukey-Kramer

81
Prueba Tukey-Kramer

82
83
84
Mtodo de las Diferencias Significativas
Mnimas (LSD) de Fisher
En este procedimiento se utiliza el estadstico t para probar H0:
i j
y y
t i. j.
0
1 1
MS (3.39)
E n n
i j



i
j
1 1
E 1 / nhiptesis
i 1 / n j t / 2, N a MS E (3.40)
y Suponiendo
y t MSuna alternativa de dosLSD
colas, los pares de n medias
i nj
i. j. / 2, N a

y se declararan significativamente diferentes si


. A la cantidad

se le llama
LSDdiferencia
t , N a
2MS
significativa
E mnima, para un diseo no balanceado.
n
Si el diseo es balanceado, n1 = n2 = = na = n, y

y y LSD,

i usarelj procedimiento LSD de Fisher, simplemente85se compara la


Para i. j.

diferencia observada entre cada par de promedios con la LSD


Ejemplo 3.8 Pag. 99
Para ilustrar el procedimiento, se usan los datos del experimento 3.1, la
LSD con = 0.05 es 2MS 2(8.06)
LSD t 0.05, 20 E 2.086 3.75
5
n
Por lo tanto, cualquier par de promedios de los tratamientos que difiera
del valor absoluto por ms de 3.75 implicara que el par correspondiente
de medias poblacionales es significativamente diferente. Las diferencias
en los promedios son:
y1.
y 2.
9.8 15.4 5.6 *
RESUMEN DE LOS RESULTADOS
y y 9.8 17.6 7.8 *
1. 3.
y y y y y
y y 9.8 21.6 11.8 * 1. 5. 2. 3. 4.
1. 4.
9.8 10.8 15.4 17.6 21.6
y1.
y
5.
9.8 10.8 1.0

y 2.
y
3.
15.4 17.6 2.2
Los valores marcados con asterisco indican
y 2.
y
4.
15.4 21.6 6.2 * pares de medias que son significativamente
y y 15.4 10.8 4.6 * diferentes.
2. 5.
Los nicos pares de medias que no difieren
y y 17.6 21.6 4.0 *
3. 4.
significativamente son 1 y 5 y 2 y 3, y el
y 3.
y
5.
17.6 10.8 6.8 *
trmino 4 produce una resistencia
y 4.
y
5.
21.6 10.8 10.8 * significativamente mayor que los otros
tratamientos. 86
92
Prueba de Rango Mltiple de Duncan
Un procedimiento muy utilizado para comparar todos los pares de medias es
la prueba de rango mltiple desarrollada por Duncan.
Para aplicar esta prueba cuando los tamaos de las muestras son iguales,
los a promedios de los tratamientos se arreglan en orden ascendente, y el
error estndar de cada promedio se determina como
S yi MS E
n (3.42)
Para tamaos de las muestras desiguales, se sustituye n en la ecuacin
(3.42) con la media armnica nh del {nj}, donde a
h n
a
(3.43)
(1 / n )
i 1
i

Observe que si n1 = n2 = = na, nh = n. En la tabla de Duncan de rangos


significativos se obtienen los valores r(p,f) para p = 2, 3, , a donde es
el nivel de significacin y f es el nmero de grados de libertad del error.
Estos rangos se convierten en un conjunto de a 1 rangos mnimos de
significacin (por ejemplo Rp) para p = 2, 3, , a calculando

R r
p a
( p, f ) S y para p 2,3,..., a
i

87
88
Prueba de Rango Mltiple de Duncan
(continuacin)
Entonces, se prueban las diferencias observadas entre las medias,
empezando con la ms grande contra la menor, la cual se comparara
con el rango mnimo de significacin Ra.
Despus se calcula la diferencia de la mayor y la segunda menor y se
comparara con el rango mnimo de significacin Ra-1.
Estas comparaciones se continan hasta cuando todas las medias se
han comparado con la media mayor.
Por ltimo, se calcula la diferencia entre la segunda media mayor y la
menor y se compara con el rango mnimo de significacin Ra-1.
Este proceso se contina hasta cuando se han considerado las
diferencias entre todos los a(a-1)/2 pares de medias posibles.
Si una diferencia observada es mayor que el rango de significacin
mnima correspondiente, se concluye que el par de medias en
cuestin es significativamente diferente.
Para evitar contradicciones, ninguna de las diferencias entre un par
de medias se considera significativa si las dos medias en cuestin se
localizan entre otras dos medias que no difieren significativamente.
89
Ejemplo 3.9 Pag. 101 y 1.
9.8
La prueba del rango mltiple de Duncan puede aplicarse al y 10.8
experimento de ejemplo 3.1. Recuerde que MSE = 8.06, 5.

N = 25, n = 5 y hay 20 grados de libertad del error. Al arreglar


y 2.
15.4

los promedios en orden ascendente se tiene: y 3.


17.6

y 4.
21.6
El error estndar de cada promedio es
S y 8.06 / 5 1.27 . En el conjunto de R r
2 0.05
2,20 S y i.
(2.95)(1.27) 3.75
i.

rangos significativos basado en la tabla R r


3 0.05
3,20 S y (3.10)(1.27) 3.94
VII del apndice del texto para 20 GL y
i.

= 0.05 se obtiene r0.05(2, 20) = 2.95, R r


4 0.05
4,20 S y i.
(3.18)(1.27) 4.04
r0.05(3, 20) = 3.10, r0.05(4, 20) = 3.18, R r
5 0.05
5,20 S yi.
(3.25)(1.27) 4.13
r0.05(5, 20) = 3.25. Los rangos son

Los resultados de las comparaciones son

90
Ejemplo 3.9 (continuacin)
Por el anlisis se observa que hay diferencias
significativas entre todos los pares de media con
excepcin de la 3 y la 2 y la 5 y la 1.
En la grfica las medias que no son significativamente
diferentes aparecen subrayadas.
y1.
y5.
y2.
y 3.
y 4.

9.8 10.8 15.4 17.6 21.6


Resultados de la prueba de rangos
mltiples de Duncan

91
Prueba de Newman-Keuls
La diferencia con la prueba de Duncan, es que los valores crticos para
calcular la diferencia de medias son calculados de acuerdo a:
Kp= qa(p,f)S . p= 2,3,...,a (3-45)
i

Donde qa(p,f) es el punto porcentual superior de tamao del intervalo


studentizado para grupos de medias de tamao p y f grados de
libertad.

El rango se define mediante:


q = (max min)/[sqr(MSE/n)]
Donde ymax y ymin corresponden a las medias muestrales
mxima y mnima. Una vez se calculan los valores de K p, los pares
extremos de medias en grupos de tamao p se comparan con K p
exactamente como la prueba de intervalos mltiples de Duncan.

92
93
Prueba de Newman-Keuls (continuacin)
Esta prueba es ms conservadora que la de Duncan en el sentido
que generalmente la razn del error tipo I () es menor.

Observamos que si p > 2, se tiene que q(p,f) > r(p,f). Es decir, es


ms difcil declarar que dos medias son significativamente diferentes
al utilizar la prueba de Newman-Keuls que cuando se usa el
procedimiento de Duncan. Esto se ilustra a continuacin para el caso
en que = 0.01, a = 8 y f = 20:

94
DETERMINACIN DEL
TAMAO DE LA MUESTRA

95
DETERMINACIN DEL TAMAO DE
LA MUESTRA
En cualquier problema de diseo
experimental, una decisin crtica es la
eleccin del tamao de la muestra; es
decir, determinar el nmero de rplicas
que se deben correr.
Si el experimentador tiene inters en
detectar efectos pequeos, se necesitan
ms rplicas que cuando se interesa en
detectar efectos grandes.
96
DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica:

97
DETERMINACIN DEL TAMAO DE LA
MUESTRA (continuacin)
Curva de operacin caracterstica (cont.):

98
Curva de operacin caracterstica

99
Curva de operacin caracterstica (continuacin)

100
Curva de operacin caracterstica (continuacin)

101
Curva de operacin caracterstica (continuacin)

102
Ejercicio 3.11

103
Ejercicio 3.11 (continuacin)

104
Curva de operacin caracterstica

0.15

2,11
2.36
2.58
Alternativa
Usar una diferencia crtica entre medias
(D).
Si la diferencia entre las medias de dos
tratamientos cualesquiera es tan grabde
como D, puede demostrarse que el valor
mnimo de es:

Si D=10, cul es el n para el ejemplo


anterior?
106
Ejercicio en clases 3-06
Una compaa textil utiliza un gran nmero de telares. Se
desea que los telares sean homogneos con el objeto de
producir tela de resistencia uniforme. El ingeniero de
procesos supone que, aparte de la variacin usual en la
resistencia de la tela en muestras del mismo telar, puede
existir una variacin significativa de la resistencia entre
los distintos telares. Para investigar esto, selecciona
cuatro telares al azar y realiza cuatro determinaciones de
la resistencia de la tela manufacturada por cada uno.
Este experimento es realizado en orden aleatorio y los
datos que se recopilan aparecen en la Tabla 1.
a) Realice un anlisis de varianza.
b) De este anlisis, verifique si existe diferencia
significativa entre los telares de la planta.
107
Datos del experimento:

108
FIN
109

S-ar putea să vă placă și