Sunteți pe pagina 1din 13

2.

EL DISEO TRATAMIENTOS)

UNIFACTORIAL

(COMPARACION

DE

La idea principal en este capitulo es el inicio a planear los diseo experimentales y su correspondiente anlisis estadstico. En este caso iniciaremos con el diseo de un solo factor, que como su nombre lo indica es el estudio de un solo factor con respecto a una variable de respuesta.

2.1 EJEMPLO DE UN DISEO DE UN SOLO FACTOR En el desarrollo de un nuevo producto alimenticio se desea comparar el efecto del tipo de envase sobre la vida de anaquel del producto. Para ello existen tres tipos de envases: Envase A, Envase B, y Envase C. En el experimento se realizaron 10 replicas en cada tipo de envase y al final se mide los das de duracin del producto. Los datos obtenidos se muestran en la tabla No. 1. Respuesta: Das de duracin Factor: Tipo de envase A 23 28 21 27 35 41 37 30 32 36 Media 31

B C

35 36 29 40 43 49 51 28 50 52 50 43 36 34 45 52 52 43 44 34

41.3 43.3

Tabla No.1 Resultados del experimento En el ejemplo, podemos ver que: LA VARIABLE DE RESPUESTA: Das de duracin del producto alimenticio. EL FACTOR CONTROLADO: Tipo de envase (se tienen tres variantes). LOS NIVELES DEL FACTOR: 3 Tipos de envase

19

2.2 MODELO MATEMTICO O MODELO ESTADSTICO

El modelo matemtico del diseo unifactorial se expresa as,

y y

ij

ij

Donde

ij

es das de duracin;

media global o media general;

efecto del factor o

efecto del tipo de envase;

ij

error aleatorio.

2.3 HIPOTESIS DEL EXPERIMENTO El planteamiento estadstico corresponde al contrastar las siguientes Hiptesis: Hiptesis Nula:

H
H

: No influye el tipo de envase en la duracin de un producto alimenticio

Hiptesis Alternativa:
a

: El tipo de envase influye en la duracin de un producto alimenticio

2.4 ANALISIS ESTADISTICO DEL DISEO DE UN SOLO FACTOR (ANOVA) El Anlisis de Varianza (ANOVA) es una tcnica estadstica muy poderosa para el estudio del efecto de uno o ms factores sobre la media de una variable (y la varianza de la variable). La Idea bsica es Descomponer la variabilidad total observada de los datos en dos partes; una debido a las diferencias de los tratamientos y otra debido a un error aleatorio. 2.4.1 DESCOMPOSICION DE LA SUMA (DESCOMPOSICION DE LA VARIABILIDAD) TOTAL DE CUADRADOS
20

La variabilidad total de los datos se obtiene mediante la Suma de Cuadrados Totales (SCTOTALES), el cual a su vez se descompone en dos elementos: 1. La Suma de Cuadrados de Tratamientos (SCTRATAMIENTOS), 2. La Suma de Cuadrados del Error (SCerror).

Considerando los datos del ejemplo,

Suma de Cuadrados Total (SCTOTAL): mide la variabilidad total en los datos, y matemticamente se obtiene as, (23-38.53)2+(34-38.53)2+ ...... +(34-38.53)2= 2409.5 Donde el 38.53 es el promedio general de los treinta datos. Los Grados de libertad totales, se obtienen restndole uno al total de los datos (30-1=29). Suma de Cuadrados de Tratamientos (SCTRATAMIENTOS): mide la variabilidad en los datos asociada a los tratamientos, que en este caso seria asociada a cada tipo de envase, su clculo se efecta de la siguiente manera: 10x(31-38.53)2+10x(41.3-38.53)2+10x(43.3-38.53)2= 871.3 Donde el 10 representa el numero de replicas por tratamiento (o tipo de envase); el 31 es el promedio del envase A, el 41.3 es el promedio del envase B y el 43.3 es el promedio del envase C. Los grados de libertad son el numero de tratamientos menos uno, es decir cada tipo de envase es un tratamiento por consiguiente son 3 le restamos uno y obtenemos dos grados de libertad (3-1=2). Suma de Cuadrados Del Error (SCERROR): mide la variabilidad que no es debida a las diferencias entre tipo de envase o tratamientos es la variabilidad interna en los tratamientos o envases, en esta variabilidad se incluye la variabilidad de errores de medicin, de experimentador o cualquier fuente externa al experimento. Los clculos se efectan de la siguiente manera, (23-31)2+.+(36-31)2 +(35-41.3)2++(52-41.3)2 +(50-43.3)2+ ... + (34-43.3)2 = 1538.2 El calculo de sus grados de libertad son el total de datos menos el numero de tratamientos, en este caso, es 30-3=27.

21

Finamente, notemos que SCTOTAL= SCTRATAMIENTO + SCRESIDUAL, es decir 2409.5 = 871.3 + 1538.2

2.4.2 CUADRADOS MEDIOS Una vez obtenidos las sumas de cuadrados se procede a obtener los cuadrados medios, el primero es el Cuadrado Medio de los Tratamientos (CMTRATAMIENTOS), el cual se obtiene dividiendo la SCTRATAMIENTOS entre sus grados de libertad, como se muestra a continuacin

CM

SC

TRATAMIENT OS

TRATAMIENT OS

a 1

871.3 435.65 2

Donde a es el numero de tratamientos o envases. El segundo es el Cuadrado Medio del Error (CMerror), que se obtiene dividiendo la suma de cuadrados del error entre sus grados de libertad, su clculo se efecta as,

CM

ERROR

SC

ERROR

N a

1538.2 56.97 27

Donde N es el total de datos y a es el numero de tratamientos. 2.4.3 OBTENCION DE LA F CALCULADA O DE LA

La F-calculada o la F0, se obtiene al dividir el cuadrado medio del tratamiento en tre el cuadrado medio del error, como se muestra a continuacin,

CM TRATAMIENT O

CM

ERROR

435.65 7.6 56.97

2.4.4 OBTENCION DE LA F DE TABLAS F(tablas)


22

En las tablas de la distribucin F de Fisher (apndice) podemos ver que para un 0.05 con 2 grados de libertad en el numerador y 27 grados de libertad en el denominador se tiene que el valor de la F(tablas) es 3.35. 2.4.5COMPARACION DE LA Fo CON LA F(tablas) Si el valor de la Fo es mayor que el valor de la F(tablas) entonces se rechaza la hiptesis nula, en los resultados se puede ver que Fo=7.647>F(tablas)=3.35, entonces podemos concluir que si existen diferencias en los tipos de envase. En otras palabras el tipo de envase si influye en la duracin de un producto alimenticio. Todos los resultados anteriores se pueden ver en la siguiente tabla llamada Anlisis de Varianza. Tabla de Anlisis de Varianza, usando el programa Statgraphics Fuente de var. Tratamiento Error Total Suma de Cuad. 871.3 1538. 2 2409.5 g.l. 2 27 29 cuad. medio F-ratio P-value(7.647) 435.63 56.97 7.647 0.0023

Ntese que el anlisis de varianza solo nos indica que si existen diferencias entre los envases, pero no establece cual es mejor. Para ello se requiere hacer un anlisis complementario conocido como Prueba de Rangos Mltiples. La prueba de rangos mltiples consiste en comparacin de medias de los tratamientos. 2.5 COMPARACIN DE PAREJAS DE MEDIAS DE TRATAMIENTOS Existen varios mtodos de comparacin de tratamientos, los cuales consisten en comparar todas las medias de tratamientos, uno de los ms usuales es Mtodo de la Mnima Diferencia Significativa (LSD, del ingls least significant difference). Supongamos que despus de haber rechazado la hiptesis nula, con base en una prueba F de anlisis de varianza, se desea probar todas las posibles comparaciones de medias de los tratamientos. Para ello se realizan el siguiente procedimiento 1. Se calcula el valor del LSD mediante la siguiente formula

23

LSD = t/2,N -a

2 CM ERROR n

Donde t/2(N-a) es la t-student con un nivel de confianza y N-a grados de libertad; CMerror es el cuadrado medio del error del anlisis de varianza. En el ejemplo el valor del LSD es,

LSD= t (

2 , N a )

2CM Error 2(56.97) 2.052 6.9265 n 10

Donde el valor de t/2(N-a) se obtuvo analizando las tablas de la distribucin t-student, para un nivel de confianza =0.05 y 27 grados de libertad.

2. Se calculan las medias de los tratamientos Tipo de envase A B C Media 31 41.3 43.3

3. Se calculan el valor absoluto de las diferencias de medias de todos los tratamientos El envase A con el envase B

31 413 10.3 .
El envase A con el envase C

31 43.3 12.3
El envase B con el envase C

413 43.3 2 .
4. Comparacin del valor absoluto de la diferencia las medias de los tratamientos con el valor del LSD

. * 31 413 10.3 > 6.92, por lo tanto el tipo de envase A es diferente al tipo de envase B
* 31 43.3 12.3 >6.92, por lo tanto el tipo de envase A es diferente al tipo de envase C
24

* 413 43.3 2 <6.92, por consiguiente no hay diferencias entre los envases B y el C .

5. Conclusin: De acuerdo a los resultados anteriores podemos concluir que el tipo de envase A es el menos recomendable, ya que presenta menor promedio que los otros dos, por consiguiente se puede decidir por cualquiera de los dos tipos de envase restantes, es decir el tipo B o el tipo C, ya que en ellos no se encontraron diferencias. La salida de los resultados usando el programa de estadstica Statgraphics, se puede ver en la siguiente tabla: Tipo de envase A B C Media 31 41.3 43.3 Grupos homogneos X X X

Una grfica representativa de esto resultados es la grfica de medias. La siguiente figura es la grfica de medias de ejemplo que se est trabajando.

Means and 95,0 Percent LSD Intervals


47 43

dias

39 35 31 27 A B C

tipo
Ntese que esta grfica confirma los resultados anteriores.

25

2.6 SUPUESTOS
Algo fundamental en el anlisis de varianza son los supuestos de los residuales, los cuales deben cumplir con tres: 1.- Los residuales deben ser independientes 2.- Los residuales deben tener varianza constante 3.- Los residuales se distribuyen normal. Si alguno de esos tres no se cumple es suficiente para invalidar el Anlisis de Varianza. Para checar estos tres supuestos se deben calcular primeramente los residuales mediante la siguiente formula:

eij y ij y i .
Donde
y yi. i.

n es el promedio del i-simo tratamiento.

En el ejemplo los residuales se calculan as:


Envase A 23-31=-8 28-31=-3 21-31=-10 27-31=-4 35-31=4 41-31=10 37-31=6 30-31=-1 32-31=1 36-31=5 Envase B 35-41.3=-6.3 36-41.3=-5.3 29-41.3=-12.3 40-41.3=-1.3 43-41.3=1.7 49-41.3=7.7 51-41.3=9.7 28-41.3=-13.3 50-41.3=8.7 52-41.3=10.7 Envase C 50-43.3=6.7 43-43.3=-0.3 36-43.3=-7.3 34-43.3=-9.3 45-43.3=1.7 52-43.3=8.7 52-43.3=8.7 43-43.3=-0.3 44-43.3=0.7 34-43.3=-9.3

26

2.6.1 SUPUESTO DE VARIANZA CONSTANTE Para checar el supuesto de varianza constante, es necesario realizar una grafica tipo xy, en la cual en el eje x se colocan los niveles o tratamientos y en el eje y los residuales correspondientes a cada tratamiento como se ilustra en la siguiente figura obtenida mediante el programa Statgraphics:

GRAFICA DE RESIDUALES VS LOS NIVELES DEL FACTOR

Residual Plot for DURACION


16 11

residual

6 1 -4 -9 -14 A B C

ENVASE

En est figura se presentan grficamente los niveles del factor contra los residuales. La interpretacin de esta grfica consiste en analizar los patrones o tendencias de comportamiento en los puntos graficados. La variacin de los puntos tanto del los niveles A, B y C no deben presentar diferencias. No se debe distinguir la presencia de un embudo. En este caso no se presenta patrn inusual por lo que podemos concluir que si se cumple el supuesto de varianza constante.

27

2.6.2 SUPUESTO DE INDEPENDENCIA Para checar el supuesto de independencia se requiere tener el orden de corrida experimental, como se muestra a continuacin:
ORDEN DE CORRIDA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ENVASE A B C A B B C A C B B A C A B C C A C B A C B A C B A C B A RESIDUAL -8 -6.3 6.7 -3 -12.3 -1.3 -0.3 -10 -7.3 1.7 7.7 -4 -9.3 4 9.7 1.7 8.7 10 8.7 -13.3 6 -0.3 8.7 -1 0.7 10.7 1 -9.3 -5.3 5

Y en seguida graficarlos como se muestra a continuacin:

28

RESIDUALES VS ORDEN DE CORRIDA (O SECUENCIA DE TIEMPO)


Residual Plot for DIAS
16 11

residual

6 1 -4 -9 -14 0 5 10 15 20 25 30

row number

En esta figura se presenta grficamente el nmero de corrida contra el valor del residual. Es esta grfica no se debe presentar ningn tipo de patrn de comportamiento, los puntos deben verse completamente dispersos. De acuerdo a esta grfica se puede concluir que si se cumple el supuesto de independencia. 2.6.3 SUPUESTO DE NORMALIDAD Un procedimiento til consiste en construir una grfica de probabilidad normal de los residuos. Una grfica de este tipo es la representacin de la distribucin acumulada de los residuos sobre papel de probabilidad normal, en otras palabras, es papel para grficas cuya escala de ordenadas es tal que la distribucin normal acumulada sea una recta. Para construir una grfica de probabilidad normal se hace el siguiente procedimiento: 1. Se ordenan los residuos en orden ascendente:
RESIDUALES ORDENADOS -1.3 -1 -0.3 0.3 0.7 1.7 1.7 4 5

-13.3 -12.3 -10 -9.3 -8 -6.3 -5.3 -4 -4

6.7 7.3 7.7 8.7 8.7 8.7 9.3 9.7 10 29

-3

10.7

2. A cada residuo se le calcula su punto de probabilidad acumulada mediante la siguiente formula:


Pk
K 1 2 3 4 5 6 7 8 9 10

eij
-13.3 -12.3 -10 -9.3 -8 -6.3 -5.3 -4 -4 -3

Pk

( k 0.5 ) K 30

eij
-1.3 -1 -0.3 0.3 0.7 1.7 1.7 4 5 6

Pk

( k 0.5 ) 30

( k 0.5 ) N K e ( k 0.5 ) ij
Pk 30
0.683 0.716 0.75 0.783 0.816 0.85 0.883 0.916 0.95 0.983

0.016 0.05 0.083 0.116 0.15 0.183 0.21 0.25 0.283 0.316

11 12 13 14 15 16 17 18 19 20

0.35 0.383 0.416 0.45 0.483 0.516 0.55 0.583 0.616 0.65

21 6.7 22 7.3 23 7.7 24 8.7 25 8.7 26 8.7 27 9.3 28 9.7 29 10 30 10.7


( k 0.5 ) 30

3. Se grafican eij en el eje de las X's y los continuacin:

Pk

en el eje de las Y's, como se muestra a

Normal Probability Plot for RESIDUALS


99.9 99

percentage

95 80 50 20 5 1 0.1 -14 -9 -4 1 6 11

RESIDUALS
En est grfica se puede ver que la mayora de los puntos se ajustan a la lnea recta, lo que significa que los residuales si cumplen el supuesto de normalidad.

30

31

S-ar putea să vă placă și