Sunteți pe pagina 1din 82

DR.

PRIMITIVO REYES AGUILAR

DISEO DE EXPERIMENTOS
Teora
Dr. Primitivo Reyes Aguilar

Mail: primitivo_reyes@yahoo.com
Cel. 04455 5217 4912

Diseo de experimentos factorials de dos niveles, factoriales completos,


factorials fraccionales y diseos especiales: Taguchi, Mezclas. Se tomo
como referencia el texto de Douglas Montgomery, Diseo y anlisis de
experimentos, 2. edicin

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

OBJETIVO

Objetivo general del mdulo. Que los asistentes actualicen los


conocimientos necesarios para disear, analizar y obtener inferencias
sobre experimentos conducentes a la mejora de productos y procesos
en la industria y que sean capaces de aplicar la mejor estrategia
experimental para resolver un problema de desarrollo de productos, o
de calidad en los productos.

Contenido
1. INTRODUCCIN AL DISEO DE EXPERIMENTOS...............................4
1.1 Aplicaciones del diseo de experimentos...................................5
Definicin de experimento, diseo de experimentos y eficiencia
de un experimento.........................................................................7
1. 2 Principios bsicos del diseo de experimentos..........................7
1.3. Metodologa general para realizar un experimento..................9
1.4. Aplicaciones del diseo de experimentos................................13
2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1 VIA)..................15
2.1 Introduccin..............................................................................15
2.2 Tipos de variacin y sumas de cuadrados.................................16
2.3 Uso de Excel:.............................................................................18
2.4 Uso de Minitab...........................................................................19
2.5 Grafica de residuos contra el valor ajustado de y ij ....................20
2.6 Ejercicios...................................................................................21
3. ANALISIS DE VARIANZA DE DOS VAS o DIRECCIONES (ANOVA 2
VIAS)...................................................................................................23
3.1 Introduccin..............................................................................23
3.2 Ejemplos con clculo manual....................................................23
3.3 Procedimiento en Excel.............................................................24
3.4 ANOVA en Minitab.....................................................................25
4. DISEOS FACTORIALES...................................................................29
4.1 Principios y definiciones bsicas...............................................29
Ventajas de los diseos factoriales..............................................31
4.2 Diseo factorial de dos niveles (2^K).......................................32
5. DISEOS DE EXPERIMENTOS FRACCIONALES DE DOS NIVELES.....40
5.1 Concepto de replicacin fraccionada........................................40
Pgina 2 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

5.2 Fraccin un medio del diseo 2k................................................41


5.3 Resolucin del diseo................................................................44
6. DISEOS DE EXPERIMENTOS FACTORIALES COMPLETOS...............46
6.1 Diseo factorial completo de 2 factores....................................46
6.2 Anlisis Estadstico del Modelo de Efectos Fijos........................48
7. DISEO DE EXPERIMENTOS TAGUCHI.............................................56
7.1 Introduccin..............................................................................56
7.2 Arreglos ortogonales para experimentos a dos niveles.............57
7.3 Caso menor es mejor................................................................59
8. REGRESIN Y CORRELACIN LINEAL..............................................64
8.1 Introduccin..............................................................................64
8.2 Ejemplo manual.........................................................................66
8.3 Uso de Excel..............................................................................68
8.4 Uso de Minitab...........................................................................69
8.5 Ejercicios:..................................................................................71

Pgina 3 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

1. INTRODUCCIN AL DISEO DE EXPERIMENTOS

l diseo de experimentos es una tcnica estadstica que nos


ayuda a identificar qu factores o variables afectan El
comportamiento de un proceso productivo y de esta manera
poder mejorarlo.
O bien: es una prueba o una serie de pruebas en las cuales se
inducen cambios deliberados en las variables de entrada de un
proceso o sistema, de manera que sea posible observar e identificar
las causas de los cambios en la respuesta de salida.
Experimento: es una prueba o ensayo.
El proceso o sistema bajo estudio puede representarse por medio del
modelo de la figura 1.1.
Factores controlables
x1 x2 x3 x4 ... xp

Entradas

Proceso

Salida

z1 z2 z3 z4 ... zq
Factores incontrolables
Figura 1. Modelo general de un proceso o sistema

Pgina 4 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Algunas de las variables del proceso x 1, x2,..., xk son controlables,


mientras que otras z1, z2,...,zk son incontrolables (aunque pueden ser
controlables para los fines de prueba). Entre los objetivos del
experimento pueden incluirse:
1. Determinar cules variables tiene mayor influencia en la
respuesta, y.
2. Determinar el mejor valor de las x que influyen en y, de modo
que y tenga casi siempre un valor cercano a valor nominal
deseado.
3. Determinar el mejor valor de las x que influyen en y, de modo
que la variabilidad de y sea pequea.
4. Determinar el mejor valor de las x que influyen en y, de modo
que se minimicen los efectos de las variables no controlables z 1,
z2,...zq.
Lo mtodos de diseo experimental tiene un propsito que puede ser
desarrollar un proceso consistente o robusto; esto es, un
proceso que no sea afectado por fuentes de variabilidad
externas o ruido (las zi).
En el diseo
importantes:

de

experimentos

se

plantean

varias

preguntas

1. Son estas dos soluciones los nicos medios para lograr la


respuesta de inters?
2. Existen otros factores que pueden afectar la respuesta de las
muestras y que deban ser investigados o controlados?
3. Cuntas muestras deben ser sometidas a cada solucin de
templado?
4. En que forma debe asignarse cada muestra a los tratamientos,
y en qu orden deben realizarse las mediciones?
5. Qu mtodo de anlisis debe utilizarse?
6. Qu diferencia en los niveles promedio de respuesta entre los
dos tratamientos debe considerarse como significativa?
Estas, y quiz muchas otras preguntas, debern ser contestadas
satisfactoriamente antes de llevar a cabo el experimento.

Pgina 5 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

1.1 Aplicaciones del diseo de experimentos

l diseo de experimentos puede servir para mejorar el


rendimiento de un proceso de manufactura, desarrollo de
nuevos procesos con lo que se logra:

1. Mejorar el rendimiento del proceso.


2. Menor variabilidad y mayor apego a los requerimientos
nominales y objetivos.
3. Menor tiempo de desarrollo.
4. Menores costos totales.
Los mtodos de diseo de experimentos tambin se aplican al diseo
de productos como sigue:
1. Evaluacin y comparacin de conceptos de diseo bsicos.
2. Evaluacin de materiales alternativos.
3. Seleccin de parmetros de diseo de modo que el producto
funcione bien desde una amplia variedad de condiciones de uso
real; Esto es, de modo que el producto sea consistente (robusto).
El uso del diseo de experimentos en estas reas puede dar por
resultado productos con mayor confiabilidad y mejor funcionamiento
en el campo, menores costos, y menor tiempo de diseo y desarrollo
del producto.
El diseo estadstico de experimentos es el proceso de planear un
experimento para obtener datos apropiados, que pueden ser
analizados mediante mtodos estadsticos, con objeto de producir
conclusiones validas y objetivas.
Cuando se identifican los factores y su influencia en un sistema
productivo, se pueden tomar decisiones que efectivamente mejoren
la calidad del producto o servicio. Se pueden identificar las fuentes
de variacin reales para su reduccin en la bsqueda de la mejora
continua.
Cuando se usan experimentos pretendemos analizar el efecto de
cambios que nosotros inducimos ms que analizar variaciones al azar.
Por ejemplo, mediante un diagrama causa-efecto podemos identificar
las posibles causas o factores que inciden en un efecto o respuesta
especifica tal y como s muestra en la figura 2

Pgina 6 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

F1

F2

F11

F21
F12

F22

CARACTERISTICA
DE C ALIDAD

F41
F31
F32

F42
F4

F3

Figura 1.2 Diagrama de Causa Efecto

Mediante un experimento podemos inducir cambios en uno varios


factores (F2l. F33 y F11 por ejemplo) y analizar estadsticamente si el
cambio en los factores afecta o no el resultado o efecto del proceso.

Pgina 7 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Definicin de experimento, diseo de experimentos y


eficiencia de un experimento
Experimento

s un conjunto de pruebas estructurado y coherente que son


analizadas a fin de comprender la operacin del proceso.

Diseo de experimentos

s el proceso de planear, ejecutar y analizar el experimento de


manera que los datos apropiados sean recolectados, y que
estos tengan validez estadstica para obtener conclusiones
validas y tiles. Se entiende por validez estadstica, el que los
resultados se puedan repetir consistentemente sobre todo en la
operacin a gran escala o masiva.
Eficiencia de un experimento
Un experimento es eficiente cuando:
1. Se obtiene la informacin requerida.
2. Con el mnimo consumo de recursos.
Esto es, un experimento eficiente debe ser lo ms simple y
econmico posible pero efectivo. Las tcnicas del diseo de
experimentos pretenden que los experimentos sean eficientes.

1. 2 Principios bsicos del diseo de experimentos

ara que un experimento pueda tener validez estadstica se deben


de observar al menos tres principios:

Reproduccin. Esto significa que el experimento se pueda llevar


a cabo o repetir bajo las mismas condiciones en ms de una
ocasin.

La diferencia observada como resultado de un experimento es real, o


se debe a simple error aleatorio, o aun ms a otro factor como por
ejemplo diferente tipo del material. Para aclarar esto, es necesario
repetir el experimento y cuantificar si se presenta consistentemente o
no la variacin detectada.
Pgina 8 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

La reproduccin por lo tanto es importante por al menos dos razones:


i)
ii)

Permite cuantificar el error aleatorio inherente al proceso y


Permite una mejor estimacin de los parmetros.

Aleatoriedad. Esto significa que tanto el material asignado a un


experimento en particular, como el orden en que se efectan
las pruebas se efectu de una manera aleatoria.

Suponga por ejemplo, que se desea saber si la temperatura influye en


el nivel de contaminacin de un producto, medida en mgms/lt, para
esto primero efecta cuatro pruebas a una temperatura de 80C y
enseguida cuatro pruebas a 90C, los Resultados son:
80C
90C

2.2
3.4

2.8
3.9

3.2
4.3

3.6
4.7

2.95
4.07

A primera vista con la temperatura de 80C se ve que tiene menor


nivel de contaminacin, sin embargo, algo raro se observa, el nivel
de contaminacin siempre aumenta, esto se debe a que los residuos
que
quedan en el equipo aumentan constantemente la
contaminacin del producto. Esto se puede
evitar lavando
perfectamente el material, lo cual puede no ser fsicamente posible.
"En lugar de esto podemos confundir, anular o igualar este efecto,
realizando las pruebas en orden aleatorio bajo las dos temperaturas.
En una diagrama causa-efecto con un gran nmero de factores
afectando la caracterstica de calidad, si se desea analizar el efecto
de uno o varios factores, se debera controlar y medir todos los otros
factores y aun as no eliminara el error aleatorio, en lugar de esto se
puede "confundir" o anular el efecto de estos factores no controlables
al efectuar las pruebas siguiendo un orden aleatorio o al azar.
La aleatoriedad por lo tanto es importante por al menos dos razones
i)
ii)

Confunde el efecto de factores no controlables y


Valida las pruebas estadsticas al hacer que los errores
experimentales sean estadsticamente independientes.
Anlisis por bloques. Es una tcnica que se usa para
incrementar la precisin del experimento. Un bloque es una
porcin del material experimental que sea ms homognea que

Pgina 9 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

el total del material o cuando las condiciones son ms


homogneas. Al realizar un experimento por bloques se hacen
las comparaciones entre las condiciones de inters del
experimento dentro de cada bloque.

1.3. Metodologa general para realizar un


experimento

e sugieren varias metodologas en la literatura, la siguiente es una


de ellas:

1. Identifique claramente el problema o situacin a resolver. Antes de


poder planear un experimento necesitamos definir claramente que es
la que estamos buscando, aun cuando esto puede parecer trivial en
ocasiones es tanta la presin para tomar decisiones que corremos a
experimentar sin por lo menos definir claramente nuestros objetivos.
En este paso es necesario definir que tipo de informacin es
exactamente la que nos interesa, ya que no podemos medir o variar
todos y cada uno de los componentes de un experimento.
En ocasiones escuchamos que el experimento fue un xito pero la
calidad no mejor. Antes de planear un experimento se debe de
investigar y. analizar el conocimiento y datos que ya se tengan sobre
este problema. La participacin activa del personal involucrado en el
problema es de vital importancia en este paso.
En conclusin como resultado de este paso, la hiptesis a probar debe
quedar bien definida. Un diagrama causa-efecto es una buena ayuda
en este paso.
2. Identificar variables. En este paso dos tipos de variables se deben
de identificar, variables dependientes y factores o variables
independientes.
La variable dependiente o variable de respuesta es la caracterstica
de calidad que queremos mejorar y cuyo comportamiento deseamos
conocer, ejemplos de esta son: porcentaje de contaminacin,
satisfaccin de un cliente, desgaste de una herramienta, tiempo, de
falla, etc.

Pgina 10 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Es deseable que una variable dependiente rena las caractersticas


siguientes:

Cuantitativa
Precisa.
Que tenga algn significado fsico.

Las variables independientes o factores representan aquellas causas


o factores cuyo efecto sobre la variable dependiente se quiere
analizar. Cada uno de estos factores se deber probar al menos a dos
valores diferentes para evaluar su efecto, a cada uno de estos valores
o niveles se les llama tratamientos. Por ejemplo, si queremos
conocer el efecto de la temperatura sobre la dureza de un material y
para ello se realizan pruebas a 70, 80 y 90C se dice que tenemos un
experimento de un solo factor con tres tratamientos. Otra vez es de
vital importancia la participacin del personal involucrado en el
problema a fin de seleccionar apropiadamente los factores o variables
independientes y los niveles de cada factor o tratamiento de inters.
Cmo seleccionar los diferentes niveles de un factor?, En general un
factor puede ser cualitativo (proveedor, turno, operario, etc), o
cuantitativo (temperatura, presin, altura, tiempo, etc.). Los niveles
especficos en cualquier caso se pueden seleccionar ya sea
aleatoriamente dentro de un cierto rango o a un nivel fijo definido por
el experimentador previamente, esto nos lleva a cuatro situaciones
generales:
A. Factor fijo, cualitativo.
En este caso, de entre los diferentes niveles o tratamientos posibles
para el factor, el experimentador esta interesado en el efecto que
ciertos niveles seleccionados por l previamente tienen sobre la
variable de respuesta. Adems, el factor es del tipo cualitativo. Por
ejemplo tres proveedores, tres turnos, dos procesos diferentes, etc.

B. Factor fijo, cuantitativo.


Este caso es similar al anterior excepto que el factor es cuantitativo,
por ejemplo: temperatura, presin, tiempo, concentracin de un
componente, etc. Para este caso es recomendable que los diferentes
niveles o tratamientos se tomen equiespaciados, esto es, por ejemplo
10, 20, 30 y 40 C: 5, 10, 15, 20 y 25 psi; 8, 12, 16 y 20 minutos, etc.
Pgina 11 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

La conclusin a que se puede llegar con este caso es si la variable de


respuesta es diferente para cada uno de los tratamientos que se
seleccionaron y de ser as el tipo de relacin que existe entre el factor
y la variable de respuesta (lineal, cuadrtica, etc.).
C. Factor aleatorio, cualitativo.
En este caso los niveles o tratamientos se seleccionan al azar de
entre varios posibles. Por ejemplo: se tienen varios lotes de un mismo
proveedor, se selecciona al azar cules de ellos analizar, en este caso
la conclusin del experimento se extiende para cubrir todos los
posibles niveles..
D. Factor aleatorio, cuantitativo.
Igual que en el caso anterior los diferentes niveles o tratamientos son
seleccionados al azar.
Por ejemplo para la temperatura si el rango de inters es de 0 a 100.
Se puede al azar seleccionar 5 niveles 7, 36, 46, 80 y 8 C. La
conclusin que se puede obtener en este caso es similar al caso c.
En este material, a menos que se especifique lo contrario, los factores
se consideran fijos.
3. Definir el diseo del experimento. Esto imp1ica definir de qu
manera se efectuaran las pruebas y qu modelo matemtico describe
mejor el experimento. En el resto de este material se describen varios
tipos de experimentos de los cuales se tomar el que mejor se ajuste
a la situacin particular.
4. Efectuar el experimento. Esto de acuerdo a lo que se defina en el
paso 3.
5. Anlisis de los datos. Estos son bsicamente anlisis estadsticos.
6. Conclusiones y toma de decisiones.
Una metodologa (alterna)
Montgomery es la siguiente:

desarrollada

Pgina 12 de 82

por

Douglas

C.

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

ara usar un enfoque estadstico al disear y analizar un


experimento se requiere que todos los participantes en l
tengan de antemano una idea clara de qu es exactamente lo
que se va a estudiar, cmo se van a recopilar los datos y, al menos,
una idea cualitativa de cmo se van a analizar. A continuacin, se
ofrece una gua del procedimiento recomendado:
1. Comprensin y planteamiento del problema.
Este punto pudiera parecer obvio; sin embargo, en la prctica no es
sencillo darse cuenta de que existe un problema que requiere
experimentacin, ni disear un planteamiento claro y aceptable del
mismo. Es necesario desarrollar todas las ideas sobre los objetivos del
experimento. Suele ser importante solicitar la opinin de todas las
partes implicadas. Un planteamiento claro del problema contribuye a
menudo en forma sustancial a un mejor conocimiento del fenmeno y
de la solucin final del problema.
2. Eleccin de factores y niveles.
El experimentador debe elegir los factores que variarn en el
experimento, los intervalos de dicha variacin y los niveles
especficos de inters a los cuales se har el experimento. Tambin
debe considerarse la forma en que se controlarn estos factores para
mantenerlos en los valores deseados, y cmo se les medir. Para ello
es necesario conocer el proceso de manera prctica y terica.
3. Seleccin de la variable de respuesta.
Al seleccionar la respuesta o variable dependiente, el experimentador
debe estar seguro de que la respuesta que se va a medir realmente
provea informacin til acerca del proceso de estudio. Con mayor
frecuencia, el promedio o la desviacin estndar (o ambos) de la
caracterstica medida sern la variable de respuesta. No son raras las
respuestas mltiples. La capacidad de medicin (o el error de
medicin) tambin es un factor importante. Si la capacidad de
medicin es deficiente, slo puede esperarse que el experimento
detecte efectos relativamente grandes de los factores; en caso
contrario deben hacerse repeticiones.
4. Eleccin del diseo experimental.

Pgina 13 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Para elegir el diseo es necesario considerar el tamao muestral


(nmero de repeticiones), seleccionar un orden adecuado para los
ensayos experimentales, y determinar si hay implicado bloqueo u
otras restricciones de aleatorizacin.
Es importante tener presente los objetivos experimentales al
seleccionar el diseo, se tiene inters en identificar qu factores
causan diferencias en estimar la magnitud del cambio de la
respuesta. En otras situaciones habr ms inters en verificar la
uniformidad. Por ejemplo, pueden compararse dos condiciones de
produccin A y 8, siendo A la estndar y B una alternativa de menor
costo. El investigador estar interesado en demostrar que no hay
diferencia en cuanto a la productividad (por ejemplo), entre las dos
condiciones.
5. Realizacin del experimento.
Cuando se realiza el experimento, es vital vigilar el proceso
cuidadosamente para asegurar que todo se haga conforme a lo
planeado. En esta fase, los errores en el procedimiento suelen anular
la validez experimental. La planeacin integral es decisiva para el
proceso. En un complejo entorno de manufactura o investigacin y
desarrollo, es fcil subestimar los aspectos logsticos y de planeacin
de la realizacin de un experimento diseado.
6. Anlisis de datos.
Deben emplearse mtodos estadsticos para analizar los datos, de
modo que los resultados y conclusiones sean objetivos ms que
apreciativos. Existen muchos excelentes paquetes de software para el
anlisis de datos, y varios mtodos grficos sencillos son importantes
en la interpretacin de tales datos. El anlisis de residuos y la
verificacin de la idoneidad del modelo son tambin tcnicas de
anlisis de gran utilidad.
Hay que recordar que los mtodos estadsticos slo proporcionan
directrices para la veracidad y validez de los resultados. Los mtodos
estadsticos, aplicados adecuadamente, no permiten probar algo
experimentalmente, slo hacen posible obtener el probable error de
una conclusin, o asignar un nivel de confiabilidad a los resultados. La
principal ventaja de los mtodos estadsticos es que agregan
objetividad al proceso de toma de decisiones. Las tcnicas

Pgina 14 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

estadsticas, aunadas aun buen conocimiento tcnico o del proceso y


al sentido comn, suelen llevar a conclusiones razonables.
7. Conclusiones y recomendaciones.
Una vez que se han analizado los datos, l experimentador debe
extraer conclusiones prcticas de los resultados y recomendar un
curso de accin. En esta fase a menudo son tiles los mtodos
grficos, en especial al presentar los resultados a otras personas.
Tambin deben realizarse corridas de seguimiento y pruebas de
confirmacin para validar las conclusiones del experimento.

1.4. Aplicaciones del diseo de experimentos.

n muchas ocasiones l termino experimento se considera


asociado exclusivamente para cuestiones cientficas y tericas;
sin embargo tienen varias aplicaciones prcticas.

Algunos ejemplos son:

Si la materia prima que es entregada por tres diferentes


proveedores producen caractersticas diferentes en el producto
Si diferentes marcas de herramienta tienen o no vida diferente.
Si la temperatura de recocido afecta o no alguna propiedad
mecnica del producto.
Si diferentes cabezales de una misma mquina producen
productos similares.
Si un nuevo mtodo de ensamble incrementa o no la productividad
en una lnea de produccin.
Cul es el factor que ms influye en la variabilidad de alguna
caracterstica de calidad.

Es necesario tener claros y en todo caso revisar los siguientes


conceptos estadsticos antes de seguir:

Qu
Qu
Qu
Qu
Qu
Qu

es una prueba de hiptesis?


e s un error tipo I y Qu es un error tipo II?
es una prueba t para comparar dos medias?
es la potencia de una prueba de hiptesis?
es control estadstico?.
es nivel de significancia?.
Pgina 15 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Pgina 16 de 82

P.

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

2. ANALISIS DE VARIANZA DE UN FACTOR (ANOVA 1


VIA)
2.1 Introduccin
El anlisis de la varianza de un factor (ANOVA) es una metodologa
para analizar la variacin entre muestras y la variacin al interior de
las mismas mediante la determinacin de varianzas. Es llamado de
una va porque analiza un variable independiente o Factor ejemplo:
Velocidad. Como tal, es un mtodo estadstico til para comparar dos
o ms medias poblacionales. El ANOVA de un criterio nos permite
poner a prueba hiptesis tales como:

H 0 1 2 3 .... k
H 1 : Al menos dos medias poblaciona les son diferentes.
Los supuestos en que se basa la prueba t de dos muestras que
utiliza muestras independientes son:
1. Ambas poblaciones son normales.
2
2
2. Las varianzas poblacionales son iguales, esto es, 1 2 .
El estadstico tiene una distribucin muestral resultando:

sb2
Fc 2
sw
El valor crtico para la prueba F es:

F , ( k 1), k ( n 1))
Donde el nmero de grados de libertad para el numerador (Sb^2 >
Sw^2) es k-1 y para el denominador es k(n-1), siendo el nivel de
significancia.
k = nmero de muestras.
Por ejemplo:

Pgina 17 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Ejemplo: Se tienen 14 empleados seleccionados al azar que se


someten a
3 diferentes cursos de entrenamiento: Programa 1, Programa 2
y Programa 3.
Como los empleados se seleccionan aleatoriamente para cada
programa
el diseo se denomina DISEO COMPLETAMENTE
ALEATORIZADO
Se observa el aprovechamiento de los empleados en los
programas:
TRATAMIENTOS
c=3
c=2
J
Programa Programa
Programa 1 2
3
r=1
85
80
82
r=2
72
84
80
r=3
83
81
85
r=4
80
78
90
r=5
**
82
88
Medias
80.00
81.00
85.00
Xj
Media de medias o
media total
82.14
I

c=1

2.2 Tipos de variacin y sumas de cuadrados


1. Variacin total entre los 14 empleados, su puntuacin no fue
igual con todos
VARIACIN TOTAL RESPECTO A LA MEDIA GENERAL
r

SCT
i 1

( Xij X )

j 1

SCT = (85-82.14)2 + (72-82.14)2+(83-82.14)2+.....+(88-82.14)2


SCT = 251.7
2. Variacin entre los diferentes tratamientos o Variacin entre
muestras o variacin entre programa 1, programa 2 y programa 3

Pgina 18 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

EFECTO DE LA MEDIA DE CADA TRATAMIENTO RESPECTO A LA MEDIA


GENERAL
r

SCTR rj ( X j X ) 2
j 1

SCTR = 4(79.5 - 81.3333)2 + 5(81 - 81.3333)2 + 5(85 - 81.333)2


SCTR = 65.71
3. Variacin dentro de un tratamiento o muestra o programa
dado que no todos los empleados dentro de un mismo programa
obtuvieron los mismos puntajes. Se denomina Variacin dentro de los
tratamientos.
VARIACIN DENTRO DEL TRATAMIENTO O VARIACIN DEL ERROR
CADA VALOR RESPECTO A LA MEDIA DE SU TRATAMIENTO
r

SCE
i 1

(X
j 1

ij

X j )2

SCE = SCT - SCTR = 186


4. Grados de libertad
Grados de libertad totales = n - 1 = 14-1 = 13
Grados de libertad de los tratamientos = c - 1 = 3 - 1 = 2
Grados de libertad del error = gl. Totales - gl. Tratamientos = 13 - 2 =
11
gl SCT = gl SCTR + gl SCE
gl SCE = gl SCT - gl SCTR = (n -1) - (c - 1) = n -c

5. Cuadrados medios (Suma Cuadrados/ Grados libertad)


CMT =
Cuadrado medio total = SCT / (n-1) =
CMTR = Cuadrado medio del tratamiento = SCTR / (c -1) =
CME =
Cuadrado medio del error = SCE/ gle.=
Pgina 19 de 82

19.4
32.9
16.9

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

6. Estadstico de prueba Fc y estadstico F crtico de alfa


Fc = CMTR / CME=

1.946745562

Falfa, gl.numerador, gl.deno min ador F ,c 1,n c

Clculo de F con Excel


=DISTR.F.INV(ALFA, GL. TR, GL. ERR)
3.982297957

=DISTR.F.INV(0.05, 2, 11) =

Pgina 20 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

ZONA
DE
RECHAZO

NO
RECHAZAR
Distr. F

Como Fc es menor a Falfa no se rechaza Ho y las medias son iguales.


7. Valor de P Fc
P = distr.f(Fc, gl. SCTr, gl. SCE) = distr.f(1.946, 2, 11) = 0.18898099
Como P es mayor a alfa no se rechaza Ho
CONCLUSION: NO HAY SUFICIENTE EVIDENCIA PARA RECHAZAR HO,
LAS MEDIAS DE LOS TRATAMIENTOS SON IGUALES
TABLA DE ANOVA
FUENTE DE VARIACIN SUMA DE GRADOS DE
CUADRADO
CUADRADOS
LIBERTAD MEDIO
VALOR F
Entre muestras (tratam.)
SCTR
c-1
CMTR
CMTR/CME
Dentro de muestras (err.)
SCE
n-c
CME
Variacin total
SCT
n-1
CMT
Regla: No rechazar si la F de la muestra es menor que la F de Excel
para una cierta alfa

2.3 Uso de Excel:

En el men herramientas seleccione la opcin Anlisis de


datos, en funciones para anlisis seleccione Anlisis de
varianza de un factor.
En Rango de entrada seleccionar la matriz de datos (todas las
columnas a la vez).
Alfa = 0.05
En Rango de salida indicar la celda donde se iniciar la
presentacin de resultados.

Pgina 21 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

RESUMEN

P.

Anlisis de varianza de un
factor
Varianz
Cuenta
Suma Promedio
a
32.666
4
320
80
667

Grupos
Programa
1
Programa
2
Programa
3

405

81

425

85

17

Grado Promedio
ANLISIS DE VARIANZA s de
de
Variacione
Suma
liberta Cuadrado
s
cuadrados
d
s
Entre
65.714285
32.85714
grupos
71
2
286
Dentro de
16.90909
grupos
186
11
091
251.71428
Total
57
13

Probabili
Fc
dad
F crtica
1.9431 0.189377 3.98229
644
31
796

2.4 Uso de Minitab


Stat > ANOVA > One Way (Unstacked)
en Responses in separate columns Indicar las columnas de datos
En Confidence Level 95%
Seleccionar Comparisons Tukey 5%
OK
One-way ANOVA: Programa 1, Programa 2, Programa 3
Source
Factor
Error
Total

DF
2
11
13

SS
65.7
186.0
251.7

S = 4.112

MS
32.9
16.9

R-Sq = 26.11%

F
1.94

P
0.189

R-Sq(adj) = 12.67%

Individual 95% CIs For Mean Based on


Pooled StDev
Level
Programa 1
Programa 2

N
4
5

Mean
80.000
81.000

StDev
5.715
2.236

----+---------+---------+---------+----(------------*------------)
(----------*-----------)

Pgina 22 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009
Programa 3

85.000

4.123

P.

(-----------*----------)
----+---------+---------+---------+----77.0
80.5
84.0
87.5

Pooled StDev = 4.112

NOTA: Si los Intervalos de confianza se traslapan, las


medias son iguales estadsticamente
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Individual confidence level = 97.94%

Programa 1 subtracted from:

Programa 2
Programa 3

Lower
-6.451
-2.451

Center
1.000
5.000

Upper
8.451
12.451

--------+---------+---------+---------+(------------*-----------)
(-----------*------------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0

Upper
11.025

--------+---------+---------+---------+(-----------*----------)
--------+---------+---------+---------+-6.0
0.0
6.0
12.0

Programa 2 subtracted from:

Programa 3

Lower
-3.025

Center
4.000

NOTA: Si el cero se encuentra en el intervalo de confianza de la


diferencia entre medias, este par de medias no son diferentes.

2.5 Grafica de residuos contra el valor ajustado de y ij

i el modelo es correcto y las suposiciones se satisfacen, los


residuos no deben tener algn patrn, ni deben estar
relacionados con alguna variable, incluyendo la respuesta Y ij.
Una comprobacin sencilla consiste en graficar los residuos contra los
valores ajustados y ij (debe recordarse que para el modelo en un
sentido y ij - yi. , el promedio del tratamiento i-simo). En esta grafica no
debe revelarse ningn patrn obvio en la siguiente figura se grafican
los residuos contra los valores ajustados de los datos de la resistencia
a la tensin del ejemplo 2.3 Ningn patrn inusual es evidente.

Pgina 23 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Grafica de residuos contra valores ajustados


Un efecto que en ocasiones revela la grafica es el de una varianza
variable. Algunas veces la varianza de las observaciones lo hace. Esto
resulta cuando el error es proporcional a la magnitud de la
observacin (comnmente esto sucede en instrumentos de medicin
el error es proporcional a la escala de la lectura). Si este es el caso,
los residuos aumenta a medida que Yij lo hace, y la grafica de los
residuos contra Yij parecer un embudo que se ensancha o un
altavoz. La varianza variable tambin ocurre en casos cuyos datos no
tienen distribucin normal y estn sesgados, porque en las
distribuciones sesgadas la varianza tiende a ser funcin de la media.

2.6 Ejercicios
1. Cuatro catalizadores que pueden afectar la concentracin de un
componente en una mezcla lquida de tres componentes estn siendo
investigado.
Se obtienen las siguientes concentraciones:

A
58.2
57.2
58.4
55.8
54.9

Cataliza
dor
B
56.3
54.5
57
55.3

C
50.1
54.2
55.4

D
52.9
49.9
50
51.7

Pgina 24 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

2. Para determinar si existe diferencia significativa en el nivel de


Matemticas de 4 grupos de estudiantes de Ingeniera se realiz un
examen aleatorio a 6 individuos por grupo. Determine cuales son los
grupos en los cuales existen diferencias a un 95% de nivel de
confianza.
A
75
93
78
71
63
76

B
78
91
97
82
85
77

C
55
66
49
64
70
68

D
64
72
68
77
56
95

3. Las calificaciones en el examen a 18 empleados de tres unidades


de negocio
Se muestran a continuacin:
Probar si no hay diferencia entre las unidades a un 5% de nivel de
significancia.
A
85
75
82
76
71
85

B
71
75
73
74
69
82

C
59
64
62
69
75
67

4. Probar si hay diferencia en los tiempos de servicio de 4 unidades


de negocio para el mismo servicio a un nivel de significancia del 5%.
A
B
C
D
11.
5.4
8.7
1
9.9
10.
7.8
7.4
3
12.8
5.3
9.4
9.7 12.1
10.
7.4
10.1
3
10.8
8.4
9.2
9.2 11.3
7.3
9.8
8.8 11.5

Pgina 25 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

3. ANALISIS DE VARIANZA DE DOS VAS o


DIRECCIONES (ANOVA 2 VIAS)
3.1 Introduccin
En este caso las frmulas son parecidas a la del ANOVA de una va
pero ahora agregando el clculo por renglones adicional al de
columnas donde se incluye la variable de bloqueo. El bloqueo es
completamente al azar.
Se trata de bloquear un factor externo que probablemente tenga
efecto en la respuesta pero que no hay inters en probar su
influencia, slo se bloquea para minimizar la variabilidad de este
factor externo, evitando que contamine la prueba de igualdad entre
los tratamientos.
Los tratamientos se asignan a las columnas y los bloques a los
renglones. Un bloque indica condiciones similares de los sujetos al
experimentar con diferentes tratamientos.
Las hiptesis son:
Ho: No hay diferencia en las medias del factor de columna
Ha: Al menos una media del factor de columna es diferente
Ho: No hay diferencia en las medias de la variable de rengln
Ha: Al menos una media de la variable de rengln es diferente

3.2 Ejemplos con clculo manual


Ejemplo 1.
Suponiendo que se quiere investigar si la produccin de tres
diferentes mquinas es igual, tomando en cuenta la experiencia de
los operadores a un nivel de significancia del 5%.
Experiencia
de ops. En
aos
1
2
3

Mquinas
Maq
1
Maq 2 Maq 3 Promedios
27
21
25
24.33333
31
33
35
33
42
39
39
40

Pgina 26 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

4
5
Promedios

TABLA ANOVA
SS
SCTR
0.93333
=
3
SCBL
764.933
=
3
41.0666
SCE =
7
806.933
SCT =
3

38
45
36.6

41
46
36

GL

P.

37
45
36.2

CMTR
=
CMBL
=

CME=

CM
0.46666
7
191.233
3
5.13333
3

14

CMT=

57.6381

38.66667
45.33333
36.26667

Fc
Ftr =
0.09
Fbl =
37.25

Falfa
4.46
3.84

Conclusin: No hay diferencia entre mquinas a pesar de la diferencia


en experiencia de los operadores.
Ejemplo 2 (Problema 4.1 del Texto de Montgomery, Anlisis y
diseo de experimentos)
Un qumico quiere probar el efecto de 4 agentes qumicos sobre la
resistencia de un tipo particular de tela. Debido a que podra haber
variabilidad de un rollo de tela a otro, el qumico decide usar un
diseo de bloques aleatorizados, con los rollos de tela considerados
como bloques. Selecciona 5 rollos y aplica los 4 agentes qumicos de
manera aleatoria a cada rollo. A continuacin se presentan las
resistencias a la tencin resultantes. Analizar los datos de este
experimento (utilizar =0.05) y sacar las conclusiones apropiadas.
Rollo
Agente Qumico
1
2
3
4
5
1
73 68 74 71 67
2
73 67 75 72 70
3
75 68 78 73 68
4
73 71 75 75 69

3.3 Procedimiento en Excel

En el men herramientas seleccione la opcin Anlisis de datos,


en funciones para anlisis seleccione Anlisis de varianza de
dos factores con una sola muestra por grupo.
En Rango de entrada seleccionar la matriz de datos.
Alfa = 0.05

Pgina 27 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

En Rango de salida indicar la celda donde se iniciar la


presentacin de resultados.

Anlisis de varianza de dos factores con una sola


muestra por grupo
Cuent
Promedi Varian
RESUMEN
a
Suma
o
za
Fila 1
5
353
70.6
9.3
Fila 2
5
357
71.4
9.3
Fila 3
5
362
72.4
19.3
Fila 4
5
363
72.6
6.8
Columna
1
Columna
2
Columna
3
Columna
4
Columna
5

294

73.5

274

68.5

302

75.5

291

72.75

2.92

274

68.5

1.67

ANLISIS DE VARIANZA
Fuente
Suma Grados Cuadrad
de
de
de
os
variaci Cuadrad liberta
n
os
d
medios
Filas
12.95
3
4.32
Column
as
157
4
39.25
Error
21.8
12
1.82
Total
191.75
19
Total
231
24

Fc

F
Probabilid tabla
ad
s

2.38

Valor P
0.12

3.49

21.61

2.06E-05

3.26

En la tabla observamos que el estadstico de prueba Fc es menor al


valor crtico para F 2.38<3.49, por lo cual no rechazamos al Hiptesis
nula H0. No tenemos evidencia estadstica para afirmar que el agente
qumico tenga influencia en la respuesta.
Sin embargo observamos que el rollo si tiene influenza significativa en
la respuesta (P<0.05).

Pgina 28 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

3.4 ANOVA en Minitab


Utilice 0.05 para calcular si hay diferencias entre los efectos de las
columnas y los renglones.
Introducir los datos arreglados con las respuestas en una sola
columna e indicando a que rengln y columna pertenece cada uno de
estos, como sigue:

Resp
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69

Colum
na
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5

Fila
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

Instrucciones:
Stat > ANOVA > One two Way
Response Respuesta,
indicar Row factor y Column Factor,
Seleccionar ! Display Means
Seleccionar ! Store Residuals
! Store Fits
Confidence
level 95%
Graphs
Seleccionar Normal plot of residuals
OK
Resultados:

Pgina 29 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

La grfica normal de residuos debe mostrar los residuos aproximados


por una recta para validar el modelo:
Los residuos se aproximan a la distribucin normal por lo cual se
concluye que se est utilizando un modelo vlido.
Normal Probability Plot of the Residuals
(response is Resp)
99

95
90

Percent

80
70
60
50
40
30
20
10
5

-3

-2

-1

0
Residual

Two-way ANOVA: Resistencia versus Agente Qumico, Rollo


Source
Agente Qumico
Rollo
Error
Total
S = 1.348

DF
3
4
12
19

SS
12.95
157.00
21.80
191.75

R-Sq = 88.63%

MS
4.3167
39.2500
1.8167

F
2.38
21.61

P
0.121
0.000

R-Sq(adj) = 82.00%

Como el valor de P es menor a 0.05 el Rollo tiene


influencia significativa en la resistencia.
Agente
Qumico
1
2
3
4

Mean
70.6
71.4
72.4
72.6

Individual 95% CIs For Mean Based on


Pooled StDev
---+---------+---------+---------+-----(----------*----------)
(----------*----------)
(----------*----------)
(----------*----------)
---+---------+---------+---------+-----69.6
70.8
72.0
73.2

Pgina 30 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Rollo
1
2
3
4
5

Mean
73.50
68.50
75.50
72.75
68.50

P.

Individual 95% CIs For Mean Based on


Pooled StDev
--+---------+---------+---------+------(-----*-----)
(-----*-----)
(-----*-----)
(-----*-----)
(-----*-----)
--+---------+---------+---------+------67.5
70.0
72.5
75.0

Se seleccionaran en 2 y 5 rollo ya que tienen los valores ms


pequeos.

Pgina 31 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

4. DISEOS FACTORIALES
4.1 Principios y definiciones bsicas

uchos experimentos se llevan a cabo para estudiar los


efectos producidos por dos o ms factores. Puede
mostrarse que en general los diseos factoriales son los
ms eficientes para este tipo de experimentos. Por diseo factorial se
entiende aquel en el que se investigan todas las posibles
combinaciones de los niveles de los factores en cada ensayo
completo o rplica del experimento. Por ejemplo, si existen a
niveles del factor A y b niveles del factor B, entonces cada rplica
del experimento contiene todas las ab combinaciones de los
tratamientos. A menudo, se dice que los factores estn cruzados
cuando stos se arreglan en un diseo factorial.
El efecto de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel del factor. Con frecuencia, ste se
conoce como efecto principal porque se refiere a los factores de
inters primordial del experimento. Por ejemplo, consideremos los
datos de la tabla 1. El efecto principal del factor A podra interpretarse
como la diferencia entre la respuesta promedio en el primer y
segundo nivel de ese factor. Numricamente:
Factor B
B1

B2

A1

20

30

A2

40

52

Factor A

Tabla 1 Un experimento factorial

40 52
2

20 30
2

21

En otras palabras incrementar el factor A del nivel 1 al 2 produce un


cambio en la respuesta promedio de 21 unidades. Similarmente, el
efecto principal de B es:

Pgina 32 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009
B

30 52
2

20 40

P.

11

Si los factores tienen ms de dos niveles, el procedimiento anterior


debe ser modificado ya que las diferencias entre las respuestas
promedio pueden expresarse de muchas formas.
En algunos experimentos puede encontrarse que la diferencia en la
respuesta entre los niveles de un factor no es la misma en todos los
niveles de los otros factores. Cuando esto ocurre existe una
interaccin entre los factores. Por ejemplo, considrense los datos de
la Tabla 2.
Factor B
B1

B2

A1

20

40

A2

50

12

Factor A

Tabla 2. Un experimento factorial con interaccin


En el primer nivel del factor B, el efecto de A es:
A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B
porque el efecto de A depende del nivel elegido de B.
Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra
una grfica de la respuesta de los datos de la Tabla 1 contra los
niveles del factor A para ambos niveles del factor B. Se observa que
las rectas B1 y B2 son, aproximadamente, paralelas. Esto indica que no
hay interaccin entre los factores. De manera similar, en la Fig. 2 se
presenta una grfica de la respuesta de los datos de la Tabla 2.
60

B2

50

B1

40
30
20
10

B2
B1
A1

Factor A

A2

Pgina 33 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Figura 1 Un experimento factorial sin interacciones


En este caso se ve que las rectas B1 y B2 no son paralelas. Esto
muestra que existe una interaccin entre A y B. Sin embargo, no debe
ser la nica tcnica para analizar los datos, porque su interpretacin
es subjetiva y su apariencia, a menudo, es engaosa.

60

B1

50

B2

40
30
20

B1

10

B2

A1

Factor A

A2

Figura 2 Un experimento factorial con interacciones


Hay que notar que cuando una interaccin es grande los
correspondientes efectos principales tienen poco significado prctico.
Una estimacin del efecto principal de A de los datos de la Tabla 2 es:

50 12
2

20 40
2

El cual resulta ser muy pequeo corrindose el riesgo de concluir que


no existe un efecto debido a A. Sin embargo, cuando se examin el
efecto de A en niveles diferentes de B se concluy que ste no era el
caso. El factor A tiene un efecto, pero depende del nivel del factor B.
En otras palabras, es ms til conocer la interaccin AB que el efecto
principal. Una interaccin significativa oculta a menudo el significado
de los efectos principales.

Ventajas de los diseos factoriales

as ventajas de los diseos factoriales pueden ilustrarse


fcilmente. Supongamos que se tienen dos factores, A y B, cada
uno con dos niveles. Estos niveles se representan mediante A 1,
A2, B1 y B1. La informacin acerca de ambos factores puede obtenerse
variando un factor a la vez como aparece en la tabla 3. El efecto de
variar el factor A est dada por A 2B1 -A1B2. A causa de que existe error
experimental,
es
conveniente
realizar,
por
ejemplo,
dos
Pgina 34 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

observaciones de cada combinacin de tratamientos y hacer una


estimacin de los efectos de los factores usando las respuestas
promedio. Por lo tanto, se requiere un total de seis observaciones.

Pgina 35 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Factor B
B1

B2

A1

A1B1

A1B2

A2

A2B1

12

Factor A

Tabla 3 El mtodo de un factor a la vez


Los diseos factoriales poseen algunas ventajas.

Son ms eficientes que los experimentos de un factor a la vez.

Los diseos factoriales son necesarios cuando alguna


interaccin puede estar presente, para evitar hacer
conclusiones engaosas.

Los diseos factoriales permiten estimar los efectos de un


factor en diversos niveles de los otros factores, produciendo
conclusiones que son vlidas sobre toda la extensin de las
condiciones experimentales.

4.2 Diseo factorial de dos niveles (2^K)

l primer diseo de la serie 2 2 es aquel en el que solo dos


factores, A y B, cada uno con dos niveles. Este diseo se
conoce como diseo factorial 22. Arbitrariamente, los niveles
del factor pueden llamarse bajo y alto.
Ejemplo 1 Considrese una investigacin llevada a cabo para
estudiar el efecto que tiene la concentracin de un reactivo y la
presencia de un catalizador sobre el tiempo de reaccin de un
proceso qumico. Sea la concentracin del reactivo el factor A con dos
niveles de inters, 15% y 20%. El catalizador constituye el factor B; el
nivel alto o superior denota el uso de dos sacos de catalizador y el
nivel bajo o inferior denota el uso de un solo saco. El experimento se
realiza (replica o repite) tres veces, y los datos son como sigue:

A
A
A
A

Combinacin de
tratamientos
baja, B baja
alta, B baja
baja, B alta
alta, B alta

I
28
36
18
31
Pgina 36 de 82

II
25
32
19
30

Replica
III
27
32
23
29

Total
80
100
60
90

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

En la figura 3 siguiente se presentan grficamente las combinaciones


de tratamiento para este diseo, el efecto de un factor se denota por
la letra latina minscula. De este modo, A se refiere al efecto del
factor A, y B se refiere al efecto del factor B, y AB se refiere a
la interaccin entre AB. En el diseo 2 2 los niveles bajo y alto de A y B
se denotan por - y + respectivamente, en los ejes A y B. As en
el eje B representa el nivel bajo de catalizador mientras que + denota
el nivel alto.

Alto (2 sacos) +

bajo (1 saco) -

b = 60(18+19+23)

ab = 90(31+30+19)

(1) = 80(28+25+27)

a = 100(36+32+32)

bajo (15%)

+
alto (20%)

Concentracion de reactivo A

Fig.
3

Figura 1: Combinaciones de tratamiento en el diseo factoriall

Las cuatro combinaciones de tratamientos en el diseo pueden


representarse por letras minsculas, cono se muestra en la figura 3.
En esta figura se aprecia que el nivel superior de cualquier factor de
una combinacin de tratamientos est representado por la presencia
de la letra minscula correspondiente, mientras que la ausencia de
esta ultima representa el nivel inferior del factor.
As

a representa la combinacin de tratamientos, en la que A se


encuentra en el nivel superior y B en el nivel inferior;

b representa aquella en la que A se halla en el nivel inferior y


B en el superior, y

ab representa a ambos factores en el nivel superior.

Por convencin (1) se usa para representar a ambos factores en


el nivel inferior.

Pgina 37 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

El efecto promedio de un factor se define como el cambio en la


respuesta producida por un cambio en el nivel de ese factor,
promediado sobre los niveles del otro factor.

Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab


tambin se usan para representar los totales de las n replicas de las
combinaciones de tratamientos correspondientes. Ahora bien, el
efecto de A en el nivel B es {a-(1)}/n. Mientras que el nivel superior B
es {ab-b}/n. Tomando el promedio de estas dos cantidades se
obtiene:

1
2n

ab b a (1) 1 ab a b (1)
2n

El efecto promedio de B se determina a partir de su efecto en el nivel


inferior de A (esto es, {b-(1)}/n, y de su efecto en el nivel superior de
A (que es igual a [ab-a]/n obtenindose:

1
2n

ab a b (1)

1
2n

ab b - a (1)

El efecto de la interaccin AB se define como la diferencia promedio


entre el efecto de A en el nivel superior de B y su efecto en el nivel
inferior de B, as:

AB

1
2n

ab b a (1)

1
2n

ab (1) a (b)

Por otro lado se puede definir AB como la diferencia promedio entre el


efecto de B en el nivel superior de A y el efecto de B en el nivel
inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro
mtodo. El efecto de A puede hallarse como la diferencia en la
respuesta promedio de las dos combinaciones de tratamiento en la
mitad derecha (que llamaremos Y A+, puesto que es la respuesta
promedio para las combinaciones de tratamientos a las que A que se
encuentra en el nivel alto) y las dos combinaciones de tratamientos
en la mitad izquierda (o

Y A).

Esto es,

Pgina 38 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

A YA YA

ab a
2n
1
2n

b (1)

2n

ab a b (1)

Este es exactamente el mismo resultado, el efecto de B se encuentra


como la diferencia entre el promedio de las dos combinaciones de
tratamientos en la parte superior del cuadrado ( Y B+) y el promedio de
las dos combinaciones de tratamientos en la parte inferior ( Y B-), o

B YB YB

ab b
2n
1
2n

a (1)
2n

ab b a (1)

Finalmente el efecto de interaccin AB es el promedio de las


combinaciones de tratamientos en la diagonal de derecha a izquierda
del cuadrado ab y (1) menos el promedio de las combinaciones de
tratamientos en la diagonal de izquierda a derecha (a y b), o

AB

1
2n

ab (1)
2n

ab
2n

ab (1) a b
Pgina 39 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Con los datos que aparecen en la figura 1, las estimaciones de los


efectos promedio son:

1
2(3)
1

2(3)

AB

90 100 60 80 8.33

90 60 100 80 5.00

1
2(3)

90 80 100 60 1.67

El efecto de A (concentracin de reactivo) es positivo; esto sugiere


que al elevar A del nivel bajo (15%) al nivel alto (25%) incrementar
el rendimiento. El efecto de B (catalizador) es negativo; esto sugiere
que elevar la cantidad del catalizador agregada al proceso reducir el
rendimiento. Al parecer, el efecto de interacciones es pequeo
comparado con los dos efectos principales.
En muchos experimentos que implican diseos 2 K se examina la
magnitud y la direccin de los efectos de los factores para determinar
cuales variables es probable que sean importantes. Por lo general
puede emplearse el anlisis de varianza para confirmar esta
interpretacin. En el diseo 2k existen algunos mtodos rpidos
especiales para realizar los clculos del anlisis de varianza.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese la
primera ecuacin que se utiliza un contraste para estimar A; esto es,

ContrasteA ab a b (1)
Este contraste suele llamarse efecto total de A. A partir de la
segunda y tercera ecuacin, puede apreciarse que tambin se utilizan
contraste para estimar B y AB. Adems, estos tres contrastes son
ortogonales. La suma de cuadrados de cualquiera de ellos puede
calcularse usando la siguiente ecuacin:

aciyi.
SSc 1

2
n a
a ci

Pgina 40 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Esta ecuacin establece que la suma de cuadrados de contraste es


igual al contraste elevado al cuadrado entre el producto del nmero
de las observaciones de cada total del contraste por la suma de
cuadrados de los coeficientes del mismo. En consecuencia, se obtiene
que las sumas de cuadrados de A, B y AB sean:

ab a b (1)
SSA
n*4

ab b a (1)
SSB
n*4

ab (1) a b
SSAB
n*4

Con los datos de la figura 3, las sumas de cuadrados se pueden


calcular aplicando las ecuaciones anteriores, obtenindose:

SSA

SSB

50

2
208.33

4(3)
30

SSAB

4(3)
10

75.00

4(3)

8.33

La suma total de cuadrados se determina de la manera usual


mediante:

SST i21 2j1 n


k 1 Y ijk

2
Y ...
4n

En general SST tiene 4n 1 grados de libertad. La suma de cuadrados


del error, con 4(n-1) G.L. se puede calcular en la forma usual, por
diferencia, mediante.

Pgina 41 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

2
2 2 3
Y
2
SS E Yijk
9398.00 9075.00 323.00
i1j1k 1
4(3)

SS E SS T SS A SS B SS AB

323.00 208.33 75.00 8.33 31.34


El anlisis de varianza completo se presenta en la tabla siguiente.
Ambos efectos principales son significativos al 1%.
A menudo se es conveniente escribir las combinaciones de
tratamientos en el orden (1), a, b, y ab. Este orden se conoce como
orden estndar. Cuando se utiliza es posible apreciar que los
coeficientes de los contrastes usados para estimar los efectos son
Efectos
A:
B:
AB:

(1)
-1
-1
+1

a
+1
-1
-1

b
-1
+1
-1

Ab
+1
+1
+1

Tabla ANOVA para los datos del ejemplo 1 es la siguiente:


Fuente de
variacin
A
B
AB
Error
Total

SS
G.L.
208.33
1
75.00
1
8.33
1
31.34
8
323.00
11
a
significativo al 1%

MS
208.33
75.00
8.33
3.92

Signos algebraicos para calcular los efectos en un diseo 22


Combinacin
De
Tratamientos

Efecto Factorial

(1)
a
b
ab

+
+
+
+

I A B AB
+
+

- +
- + + +

Pgina 42 de 82

Fo
53.15a
19.13a
2.13

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Observe que los coeficientes de los contrastes usados para estimar la


interaccin
son iguales
al producto de los
coeficientes
correspondientes a los dos efectos principales. Los coeficientes de los
contrastes siempre son +1 o 1 y se puede usar una tabla de signos
positivos y negativos como la mostrada en la de signos algebraicos
para determinar el signo apropiado de cada combinacin de
tratamientos. En el encabezado de las columnas de tabla y se
encuentran los efectos principales (A y B), la interaccin AB, e I, que
representa el total el total o el promedio de todo el experimento. Se
observa que la columna encabezada por I se compone de solo de
signos positivos. Los renglones corresponden a las combinaciones de
tratamientos.

Para encontrar un contraste con el fin de estimar cualquier efecto,


simplemente se multiplican los signos de la columna apropiada de la
tabla por la correspondiente combinacin de tratamientos, y se suma.
Por ejemplo, el contraste para estimar A es (1) + a b + ab, lo cual
concuerda con la ecuacin.

1
2n

ab b a (1)

1
2n

ab a b (1)

Los tipos ms sencillos de diseos factoriales implican slo dos


factores o conjuntos de tratamientos. Haya a niveles del factor A y
b niveles del factor B, dispuestos en un diseo factorial; esto es,
cada A repeticin o rplica del experimento contiene todas las
combinaciones de tratamiento ab. En general, hay n repeticiones.

Pgina 43 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

5. DISEOS DE EXPERIMENTOS FRACCIONALES DE


DOS NIVELES
5.1 Concepto de replicacin fraccionada
Conforme el nmero de factores del experimento crece, el nmero de
casillas o condiciones experimentales (y por lo tanto el nmero de
lecturas o pruebas necesarias), crece exponencialmente en un
experimento factorial. El nmero de efectos a evaluar (interacciones
principalmente) crece exponencialmente tambin. El nmero de
efectos y casillas vara con el nmero de factores en una relacin
como se muestra en la tabla siguiente para un experimento factorial
2k.

As por ejemplo cuando se tienen siete factores, existen 128 posibles


condiciones experimentales, lo que implica que al hacer una
replicacin por celda de todo el experimento requiere un total de 128
observaciones. Si se decide tomar dos replicas por celda, entonces
serian necesarias 256 observaciones, lo cual es una cantidad excesiva
de pruebas para fines prcticos.
Por otro lado, se necesitan 128 observaciones para un experimento
con 7 factores por que se deben evaluar 127 posibles efectos (que
son los grados de libertad totales en 128 observaciones) de estos
efectos 7 son los factores principales, 21 interacciones de 2 factores,
35 de tres, 35 de cuatro, 27 de cinco en cinco, 7 de seis en seis y una
interaccin de 7 factores. En general el nmero de interacciones de k
factores tomados r en r es:

K!

r! (k r)!
Pgina 44 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

El concepto de replicacin fraccionada parte de las siguientes


hiptesis:
1. Las interacciones de tres o ms factores son sumamente raras
en la prctica, por lo que en general se pueden suponer como
no existentes.
2. En un experimento de varios factores lo ms probable es que
solo algunos de ellos sean relevantes para la variable de
respuesta.
3. La mayor parte del efecto se debe a los factores principales y
algunas interacciones de dos factores.
Lo anterior implica que por ejemplo para siete factores son necesarios
probablemente solo 28 grados de libertad (7 factores principales y 21
interacciones de dos factores), y esto equivale a solo 29 unidades de
informacin y no 128 como en el experimento original. Esto quiere
decir que no es necesario el correr una replicacin completa de todo
el experimento cuando el nmero de factores crece, sino solamente
algunas casillas o condiciones experimentales.
Cuando solamente una parte de las posibles casillas se prueban, se
dice que se tiene una replicacin fraccionada del experimento.
Las preguntas que surgen son:
1. Cuntas y cuales casillas probar?
2. Cmo analizar los resultados?
3. Qu informacin se pierde?
El responder a estas preguntas es uno de los objetivos de la
replicacin fraccionaria.

5.2 Fraccin un medio del diseo 2k

onsidrese el caso en el que se estudian tres factores de dos


niveles cada uno, pero en el que los experimentadores no
pueden costear las 23 = 8 combinaciones de tratamientos, sin
embargo, si se puede costear 4 observaciones. Esto sugiere una
fraccin un medio, de un diseo 2 3. la fraccin un medio del diseo 2 3
se conoce tambin como un diseo 2 3-1 porque tiene 23-1 = 4
combinaciones de tratamiento.
Pgina 45 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

En la tabla 1 aparecen signos positivos y negativos del diseo 2 3.


Supngase que para componer la fraccin un medio, se seleccionan
las combinaciones de tratamientos se usa indistintamente la notacin
convencional (a,b,c,...) y la de signos positivos y negativos. La
equivalencia de las dos notaciones se muestra a continuacin.

Pgina 46 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Notacin 1
a
b
c
abc

P.

Notacin 2
+ - - + - - +
+ + +
Efecto factorial

Combinacin de
Tratamientos

I
+
+
+
+
+
+
+
+

a
b
c
abc
ab
ac
bc
(1)

A
+
+
+
+
-

B
+
+
+
+
-

C
+
+
+
+
-

AB
+
+
+
+

AC
+
+
+
+

BC
+
+
+
+

ABC
+
+
+
+
-

Tabla 1 Signos positivos para el diseo 23


Ntese que el diseo 23-1 se forma al seleccionar solo las
combinaciones de tratamientos que producen un signo positivo sobre
la columna ABC. Por esto ABC se denomina generador de una fraccin
particular. Adems, la columna identidad I siempre es positiva, por lo
cual:
I = ABC
Se denominara relacin definitoria de nuestro diseo, en general, la
relacin definitoria de un factorial fraccionario siempre es el conjunto
de todas las columnas que son iguales a la columna identidad I.
abc

bc

ac

ab

B
A

(a) Fraccin principal I = ABC

(1 )

(b) Fraccin alterna I = -ABC

Las combinaciones de tratamientos del diseo 2 3-1 producen 3 G.L.


que pueden usase para estimar los efectos principales. En la tabla 1
Pgina 47 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

se muestra que las combinaciones lineales de las observaciones que


se utilizan para estimar los efectos principales A, B, y C son:

LA 1/2(a b c abc)
LB 1/2( a b c abc)
LC 1/2( a b c abc)
LBC 1/2(a b c abc)
LAC 1/2( a b c abc)
LAB 1/2( a b c abc)
Por lo tanto LA = LBC, LB = LAC y LC = LAB. En consecuencia, es
imposible distinguir entre A y BC, entre B y AC y entre C y AB. De
hecho, es posible mostrar que cuando se estima A, B y C, en realidad,
lo que s esta haciendo es estimar A + BC, CB + AC y C + AB,
respectivamente. Dos o ms efectos que tienen esta propiedad se
conoce como alias. En este ejemplo, A y BC, B y AC y C y AB son
alias. Esto se indica empleando la notacin:

LA A BC,
LB B AC
LC C AB
La estructura de los alias de este diseo pueden determinarse
fcilmente con la relacin I = ABC, multiplicando cualquier efecto por
la relacin que define al diseo, modulo 2, da como resultado los alias
de dicho efecto. En el ejemplo anterior, los alias son:
A*I = A*ABC = A2BC
O dado que el cuadrado de cualquier columna es simplemente la
identidad I.
A = BC
De modo similar, se encuentra que los alias de B y C son:
B*I = B*ABC = AB2C = AC
C*I = C*ABC = ABC2 = AB
Pgina 48 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Esta fraccin un medio o semifraccin, con I = +ABC, suele llamarse


fraccin principal.
Ahora supngase que se eligi la otra mitad de la rplica. Esta se
compone de las combinaciones de tratamientos de la tabla 1 que
tiene signo negativo asociado con ABC. Esta fraccin un medio o
alterna que consta de las siguientes corridas:
Notacin 1

Notacin 2
(1)
ab
ac
abc

--+++-+
-++

La relacin definitoria de este diseo es:


I = -ABC
Usando la fraccin alterna, las combinaciones lineales de las
observaciones, LA, LB y LC, son:

L' A A BC
L' B B AC
L' C C AB
Por lo tanto, en realidad se est estimando A BC, B AC y C AB al
estimar A, B y C con esta fraccin. En la prctica, no importa cual de
las dos fracciones se utilice. Generalmente la fraccin asociada con I
= +ABC se denomina fraccin principal. Ambas fracciones pertenecen
a la misma familia; en otras palabras, estas dos fracciones forman el
diseo 23 completo.

5.3 Resolucin del diseo

l diseo anterior 23-1 se conoce como diseo de resolucin III. En


tal diseo los alias de los efectos principales son interacciones
de dos factores. Un diseo es resolucin R si ningn efecto de p
factores es alias de otro efecto que tenga menos R p factores.
Usualmente, se emplea el numeral romano como subndice para
indicar la resolucin del diseo. As, la fraccin un medio del diseo 2 3

Pgina 49 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

definido por la relacin I = ABC (o bien I = - ABC) constituye un diseo


3 1

2III

Los diseos de resolucin III, IV y V son de importancia primordial. A


continuacin, se presenta la definicin de estos diseos junto con un
ejemplo.
1. Diseo con resolucin III: stos son diseos en los que ningn
efecto principal es alias de otro, pero si lo son de las
interacciones de dos factores; a su vez, estas ltimas son alias
entre s. El diseo 23-1 de la tabla 4.1 es de resolucin III.
2. Diseo con resolucin IV: En estos diseo ningn efecto principal
es alias de otro efecto principal, o bien, de alguna interaccin de
dos factores. Las interacciones de dos factores son alias entre
4 1
s. Un diseo 24-1 con I = ABCD es de resolucin IV ( 2IV ).

3. Diseos resolucin V: Estos son diseos en los que ningn efecto


principal o interaccin de dos factores es alias de ningn efecto
principal o interacciones entre dos factores, un diseo 2 5-1 con I =
5 1
ABCDE es de resolucin V ( 2 V ).

En general, la resolucin de un diseo factorial fraccionario de dos


niveles es igual al mnimo nmero de letras de cualquier palabra de la
relacin que define al diseo. En consecuencia, los diseos anteriores,
a menudo, se conocen como diseos de 3, 4 y 5 letras,
respectivamente. Por lo general se deben usar diseos fraccionarios
con la mayor resolucin posible congruentes con el fraccionamiento
requerido. A mayor resolucin, las suposiciones relativas a las
interacciones que deben despreciarse con el propsito de hacer una
interpretacin nica de los datos son menos restrictivas.

Pgina 50 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

6. DISEOS DE EXPERIMENTOS FACTORIALES


COMPLETOS
6.1 Diseo factorial completo de 2 factores
Un ingeniero decide probar los tres materiales de la cubierta, nico
factor controlable a tres niveles de temperatura (15, 70 y 125 F)
consistentes en el entorno de uso final del producto. Se prueban
cuatro bateras a cada combinacin de material de la cubierta y
temperatura, y las 36 pruebas se ejecutan al azar.
En la tabla 1 se presentan el experimento y los datos resultantes de
duracin observada de las bateras.
En este problema, el ingeniero desea contestar las siguientes
preguntas:
1. Qu efecto tienen el tipo de material y la temperatura sobre la
duracin de la batera?
2. Existe una eleccin del material que d por resultado una
duracin uniformemente larga sin importar la temperatura?

Tipo de material
1
3
3

130
74
150
159
138
168

15
155
180
188
126
110
160

Temperatura F
70
34
40
80
75
126
122
106
115
174
120
150
139

20
82
25
58
96
82

125
70
58
70
45
104
60

Tabla 1. Duracin en horas para el ejemplo del diseo de una batera


Esta ltima pregunta reviste particular importancia. Existe la
posibilidad de hallar un material que no sea muy afectado por la
temperatura. De ser as, el ingeniero puede hacer que la batera sea
robusta a la variacin de temperatura en el campo. ste es un
ejemplo del uso del diseo experimental estadstico para el diseo de
un producto robusto (o consistente), un importante problema de
ingeniera.

Pgina 51 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Este diseo es un ejemplo especfico del caso general de un diseo


con dos factores (bifactorial). Para pasar al caso general, sea Yijk la
respuesta observada cuando el factor A se encuentra en el i-simo
nivel (i -1, 2,..., n). En general, los datos observados se vern como en
la tabla 2. El orden en el cual se toman las abn observaciones es
aleatorio, de modo que ste es un diseo completamente
aleatorizado.

Tabla 2. Disposicin general para un diseo bifactorial


Las observaciones pueden describirse mediante el modelo estadstico
lineal:

i 1,2,..., a

Yijk i j ij ijk j 1,2,..., b

k 1,2,..., n

En donde es el efecto medio general, i es el efecto del i-simo nivel


del factor rengln A, j es el efecto del j-simo nivel del factor
columna B, ()ij es el efecto de la interaccin entre i y j, ijk es el
componente del error aleatorio. Inicialmente se supone que ambos
factores son fijos y que los efectos de tratamiento se definen como
ia1 i 0; bj1j 0

desviaciones de la media general, por lo tanto.


Se
supone que los efectos de interaccin son fijos y que se definen d
a

ij 0 . Hay un total de abn

manera que: i1
se realizan n rplicas.

Pgina 52 de 82

observaciones porque

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

En un diseo factorial de dos factores, tanto los factores (o


tratamientos) de rengln como de columna tienen la misma
importancia, especficamente el inters consiste en probar hiptesis
acerca de la igualdad de los efectos de tratamiento de rengln, es
decir:
Ho : 1 2 ...a 0
H1 : al menos una i 0

Y de la igualdad de los efectos de tratamiento de columna:


Ho : 1

2 ...b 0
H1 : al menos una j 0
Tambin es interesante determinar s los tratamientos de rengln y
columna
interaccionan. En otras palabras, resulta conveniente
probar:
Ho : ()i 0 para toda i, j
H1 : al menos una ()i 0

A continuacin, se muestra cmo pueden probarse estas hiptesis


usando un anlisis de variancia bifactorial o bidireccional (de dos
factores o en dos sentidos).

6.2 Anlisis Estadstico del Modelo de Efectos Fijos

ea Yi..; el total de las observaciones bajo el i-simo nivel del


factor A; Y.j. El total de las observaciones bajo el j-simo nivel
del factor B, Yij. El total de las observaciones de la ij-sima
celda, e Y... el total general de todas las observaciones. Se definen
Yi..; Y.j. y Yij. y Y... como los promedios de rengln, columna, celda y
general, respectivamente, matemticamente:

Pgina 53 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

b n

Yijk
Yi..
j1k 1

Yi..

a n
Y.j. Yijk
i1k 1

Y.j.

n
Yij. Yijk
k 1

Yij.

Yi..
bn
Y.j.

a b n
Y... Yijk
i1j1k 1

; i 1,2,..., a

; j 1,2,..., b

an

Y...

P.

i 1,2,..., a

j 1,2,...,b

Y...

Y...
abn

La suma total de cuadrados corregida puede expresarse mediante:

i1

2
n
b Yijk Y...

k 1
j1

Yi.. Y... Y.j. Y... Yij. Y... Y.j Y...


a b n

i1j1 k 1
Yijk Yij.

2
a b n
Yijk Y...

i1j1 k 1

2
2
2
a
b
a b
bn Yi.. Y... an Y.j. Y... n Yij. Yi.. Y.j. Y...
i1
j1
i1j1

2
a b n
Yijk - Yij.
i1j1 k 1

Dado que los seis productos cruzados del segundo miembro de la


ecuacin anterior son iguales a cero. Se observa que la suma total de
cuadrados se ha descompuesto en una suma de cuadrados debida a
los renglones o al factor A (SSA) en una suma de cuadrados
debida a las "columnas" o al factor B (SSB), en una suma de
cuadrados debida a la interaccin entre A y B (SSAB), y en una suma
de cuadrados debida al error (SS E): Analizando el ltimo trmino del
miembro derecho de la Ecuacin anterior es posible observar que es
Pgina 54 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

necesario tener al menos dos rplicas (n 2) para poder obtenerla


suma de cuadrados del error.
Simblicamente, la Ecuacin anterior puede expresarse mediante:

SST SSA SSB SSAB SSE


Los grados de libertad asociados a cada suma de cuadrados son:
Efecto
A
B
Interaccin AB
Error
Total

Grados de libertad
a-1
b-1
(a-1)(b-1)
ab(n-1)
abn-1

Esta descomposicin del total de abn -1 grados de libertad para las


sumas de cuadrados se puede justificar como sigue: Los efectos
principales de A y B tienen a y b niveles, respectivamente, por lo
tanto, tienen a -1 y b -1 grados de libertad como se muestra.
Los grados de libertad de la interaccin simplemente corresponden a
los grados de libertad de cada celda (los cuales son iguales a ab -1)
menos los grados de libertad de los dos efectos principales A y B en
otras palabras, ab -1 -(a -1) -(b -1) -(a- 1)(b -1). Dentro de cada una de
las ab celdas hay n -1 grados de libertad entre las n rplicas, por lo
tanto, hay ab(n -1) grados de libertad del error.
Se observa que la suma de los grados de libertad de los trminos del
miembro derecho de la ecuacin anterior es igual al total de los
grados de libertad.
Cada suma de cuadrados dividida entre sus grados de libertad
produce una media de cuadrados.
Por lo tanto, para probar el significado de ambos efectos principales,
as como de su interaccin, simplemente deben dividirse las medias
de cuadrados correspondientes entre la media de cuadrados del error.
Valores grandes de estas razones implican que los datos no
concuerdan con las hiptesis nulas.
Si se considera que el modelo estadstico es adecuado y que los
trminos del error ijk son independientes con distribuciones normales

Pgina 55 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

con variancia constante 2, entonces las razones de las medias de


cuadrados MSA/MSE, MSB/MSE y MSAB/MSE tienen distribucin F con a
-1, b- 1 y (a -1)(b -1) grados de libertad en el numerador,
respectivamente, y ab(n -1) grados de libertad en el denominador. Las
regiones crticas corresponden al extremo superior de la distribucin
F. Usualmente la prueba se presenta en una tabla de anlisis de
variancia como la que aparece en la tabla 2.

Fuente de
Variacin
SS
Tratamientos A SSA

G.L.
a-1

MS
MSA

SSA

Fo

MSA
MSE

a 1
Tratamientos B SSB

Interaccin

SSAB

b-1

MSB

MSB

SSB

MSE

b 1
(a - 1)(b - MSAB
1)

SSAB

MSAB
MSE

(a 1)(b 1)
Error

SSE

ab(n-1)

MSB
SSE
ab(n 1)

Total

SST

abn - 1

Tabla 2 ANOVA para el modelo bifactorial de efectos fijos


Es posible obtener las frmulas para calcular las sumas de cuadrados
de la ecuacin anterior. La suma total de cuadrados se calcula en
forma usual mediante:
2
a b n
Y ...
2
SST Y ijk
i1j1k 1
abn
Las sumas de cuadrados para los efectos principales son:

Pgina 56 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

2
2
a Y i.. Y ...
SSA

i1 bn
abn
2
2
b Y .j. Y ...
SSB

j1 an
abn
Es conveniente obtener SSAB en dos etapas. Primero se calcula la
suma de cuadrados entre los totales de las ab celdas, conocida como
la suma de cuadrados debido a los "subtotales":

2
2
a b Y ij. Y ...
SSsubtotales

i1j1 n
abn
Esta suma de cuadrados contiene a la SS A y SSB. Por lo tanto, la
segunda etapa consiste en calcular SSAB mediante:

SSAB SSsubtotales SSA SSB


La SSE se calcula por diferencia:

SSE

SST SSAB SSA SSB

o bien :

SSE

SST SSSubtotales

Ejemplo: Ms sobre el experimento de diseo de una batera. En la


tabla 3 se presenta la duracin efectiva (en horas) observada en el
ejemplo de diseo de una batera descrito en la anterior Los totales
de rengln y de columna se indican en los mrgenes de la tabla; los
nmeros subrayados son los totales de celda.
Temperatura (F)

Pgina 57 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Ti
p 15
o
d
e

70

P.

125

Yi.
.

M
at
.
1

1 1
3 5
0 5
7 1
4 8
0

1 1
5 8
0 8
1 1
5 2
9 6

1 1
3 1
8 0
1 1
6 6
8 0

Y.j 1738
.=

3 4
4 0
2
539 4
2
134.75 8 7 9
0 5

2 7
0 0

2 7
5 0

623

1 1
3 2
6 2 4
7
1 1 9
0 1
6 5

576

1 1
7 2
4 0 5
8
1 1 3
5 3
0 9

9 1
6 0
4 3 15
4
8 6 2 01
2 0

1291

770

2
99
3
8 5 0 8
2 8

1
13
9
5 4 8 00
8 5

Y..
.=
37
99

Tabla 3. Duracin (en horas) para el experimento de diseo de una


batera
Las sumas de cuadrados se calculan a continuacin:

Pgina 58 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

2
a b n 2
Y ...
SST Y ijk

i1j1 k 1
abn
130

2
2
2
2 3799
155 74 ... 60
77,646.97
36

2
2
a Y i.. Y ...
SSmaterial

i1 bn
abn
2
2
2
2
998 1300 1501
3799

10,683.72
(3)(4)
36
2
2
b Y .j. Y ...
SStemperat ura

j1 an
abn
2
2
2
2
1738 1291 770
3799

39,118.72
(3)(49
36
2
2
a b Y ij. Y ...
SSinteraccion

i1j1 n
abn
2
2
2
2
539 229 ... 342
3799

10,683.72
4
36
39,118.72 9,613.78

SSE SST SSmaterial SStemperatur a SSinteraccion


SSE 77,646.97 10,638.72 39,118.72 9,613.78
18,230.75

El anlisis de variancia aparece en la tabla 4. Se concluye que existe


una interaccin significativa entre el tipo de material y la temperatura
porque F0.05,4.27 = 2.73. Adems, tambin son significativos los efectos
principales del tipo de material y de la temperatura, porque F O.O5.2.27 =
3.35.

Pgina 59 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Fuente de variacin
Tipo de material
Temperatura
Interaccin
Error
Total

SS
10,683.72
39,118.72
9,613.78
18,230.75
77,646.97

P.

G.L.
2
2
4
27
35

MS
5,341.86
19,558.36
2,403.44
675.21

Fo
7.91
28.97
3.56

Tabla 4. ANOVA para los datos de la duracin de la batera


Como auxiliar en la interpretacin de los resultados de este
experimento resulta til la construccin de una grfica de las
respuestas promedio de cada combinacin de tratamiento. Esta
grfica se muestra en la figura 1.

175
150
125

Yij. 100

Material tipo 3

75

Material tipo 1
Material tipo 2

50
25
15

70
Tempera tura

125

Figura 1. Grfica de respuesta vs temperatura

El hecho de que las rectas no sean paralelas indica una interaccin


significativa. En general, a menor temperatura mayor duracin,
independientemente del tipo de material.

Al variar la temperatura de baja a intermedia, la duracin aumenta


con el material tipo 3, mientras que disminuye con los materiales tipo
1 y 2,
Pgina 60 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Cuando la temperatura vara de intermedia a alta, la duracin


disminuye con los materiales tipo 2 y 3, mientras que con el tipo 1
esencialmente permanece sin cambio. Al parecer, el material tipo 3
da los mejores resultados si lo que se desea es menor perdida de
duracin efectiva al cambiar la temperatura.
Para comprobar si el modelo es adecuado, se analizan los residuos
que tengan un comportamiento aleatorio y normal.

Pgina 61 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

7. DISEO DE EXPERIMENTOS TAGUCHI


7.1 Introduccin
La parte fundamental de la metodologa ideada por el matemtico
japons G. Taguchi es la optimizacin de productos y procesos, a fin
de asegurar productos robustos, de alta calidad y bajo costo.
La metodologa Taguchi consta de tres etapas:

a) Diseo del sistema


b) Diseo de parmetros
c) Diseo de tolerancias
De estas tres etapas, la ms importante es el diseo de parmetros
cuyos objetivos son:
a) Identificar qu factores afectan la caracterstica de calidad en
cuanto a su magnitud y en cuanto a su variabilidad.
b) Definir los niveles ptimos en que debe fijarse cada parmetro o
factor, a fin de optimizar la operacin del producto y hacerlo lo
ms robusto posible.
c) Identificar factores que no afectan substancialmente la
caracterstica de calidad a fin de liberar el control de estos factores y
ahorrar costos de pruebas.
Para lograr lo anterior se ha manejado una serie de herramientas
estadsticas conocida como diseo de experimentos, tratadas
anteriormente.
Taguchi ha propuesto una alternativa no del todo diferente que se que
conoce como: Arreglos Ortogonales y las Grficas Lineales.
La herramienta utilizada normalmente son
diseos Factoriales
fraccionados, sin embargo cuando el nmero de factores se ve
incrementado, las posibles interacciones aumentan, as como la
complicaciones para identificar cules son las condiciones especficas
a experimentar.

Pgina 62 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Un arreglo ortogonal se puede comparar con una replicacin


factorial fraccionada, de manera que conserva el concepto de
ortogonalidad y contrastes. Un experimento factorial fraccionado es
tambin un arreglo ortogonal .
Taguchi desarroll una serie de arreglos particulares que denomin:

La (b)C
Donde:
a = Representa el nmero de pruebas o condiciones experimentales
que se tomarn. Esto es el nmero de renglones o lneas en el
arreglo.
b = Representa los diferentes niveles a los que se tomar cada
factor.
c = Es el nmero de efectos independientes que se pueden analizar,
esto es el nmero de columnas.

7.2 Arreglos ortogonales para experimentos a dos


niveles
En esta seccin, se analiza qu son, cmo se usan y cules son los
arreglos ortogonales ms importantes para experimentos en los que
cada factor toma dos niveles.
No. (a)
1
2
3
4
1 ,

A
1
1
2
2
2

F A C T O R E S (c)
B
C
1
1
2
2
1
1
2
1

Resultado
Y1
Y2
Y3
Y4

Niveles de los Factores (b)

Un arreglo ortogonal es una tabla de nmeros. Como ejemplo de un


arreglo ortogonal tenemos el siguiente:
De acuerdo con la notacin empleada por Taguchi al arreglo
mostrado como ejemplo, se le llama un arreglo L4, por tener cuatro
renglones.
En general, para un arreglo a dos niveles, el nmero de columnas
(efectos o factores) que se pueden analizar, es igual al nmero de
renglones menos 1.

Pgina 63 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Taguchi ha desarrollado una serie de arreglos para experimentos


con factores a dos niveles, los ms utilizados y difundidos segn el
nmero de factores a analizar son:
No. de factores a Arreglo
analizar
utilizar
Entre 1 y 3
L4
Entre 4 y 7
L8
Entre 8 y 11
L12
Entre 12 y 15
L16
Entre 16 y 31
L32
Entre 32 y 63
L64

a No. de
probar
4
8
12
16
32
64

condiciones

El arreglo ortogonal ms popular es el arreglo L8, que se muestra a


continuacin junto con sus grficas lineales:
L8
Exp.
No.
1
2
3
4
5
6
7
8

Col.
1

Col.
2

Col.
3

Col.
4

Col.
5

Col.
6

Col.
7

1
1
1
1
2
2
2
2

1
1
2
2
1
1
2
2

1
1
2
2
2
2
1
1

1
2
1
2
1
2
1
2

1
2
1
2
2
1
2
1

1
2
2
1
1
2
2
1

1
2
2
1
2
1
1
2

3
2
1
(3)

4
5
6
7
(4)

5
4
7
6
1
(5)

6
7
4
5
2
1
(1)

Matriz o
tabla de
interacci
ones
Column
as
1
1
(1)
2
3
4
5
6
7

2
3
(2)

Pgina 64 de 82

7
6
5
4
3
2
6
(7)

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

1
3

5
1
.7

6
2

6
(a)

4
(b)

Grficas lineales
Los pasos para un diseo de experimentos de parmetros en el
caso de menor es mejor son:

7.3 Caso menor es mejor


1. Seleccionar una caracterstica de calidad de salida a ser optimizada.
2. Seleccionar factores de control y sus niveles, identificando sus
posibles interacciones.
3. Seleccionar los factores de ruido y sus niveles; si son demasiados
combinarlos en dos o tres factores combinados.
4. Seleccionar los arreglos interno y externo adecuados; asignar los
factores de control al arreglo interno y los factores de ruido al arreglo
externo.
5. Realizar los experimentos.
6. Realizar anlisis estadstico con base en S/N para identificar los
niveles de los factores de control ptimos Algunas veces ayuda
realizar un estudio de la interaccin entre factores de control y de
ruido.
7. Realizar anlisis estadstico con base en las medias para identificar
los niveles de los factores de control ptimos que ajustan a la
respuesta promedio en el nivel deseado. Si hay conflicto entre los
niveles de los factores para maximizar la relacin S/N y ajustar la
media, dar prioridad a los que sirven para maximizar la relacin S/N.
8. Predecir el desempeo de salida ptimo con base en una
combinacin ptima de niveles de factores de control y realiza un
experimento confirmatorio.
Ejemplo: Disminucin de la contaminacin
Optimizacin de un mtodo de purificacin para drenajes
contaminados con metales.
Pgina 65 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Las aguas residuales que contienen iones metlicos es muy riesgoso


por su toxicidad y no biodegradable. Se propone utilizar xidos de
hierro hidratados con un pH adecuado para remover los metales
dainos. La caracterstica de salida es la concentracin remanente de
metales en mg/L, con una respuesta menor es mejor.

Los factores de control son los siguientes:


A
B
C
D

Factores de control
Contaminacin de FeII
Temperatura C
Tiempo
de
aejamiento h
pH

Nivel 1
2
25

Nivel 2
7
50

Nivel 3
15
75

1
8

2
10

3
12

Pgina 66 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

El factor de ruido introducido artificialmente es permanganato de


potasio.
N

Factores de ruido
Conc. De KMnO4

Nivel 1 Nivel 2
0.00375 0.0375

Nivel 3
0.075

Se asume que no hay interacciones por lo que se puede utilizar un


arreglo L9, realizando los experimentos se obtienen los datos
siguientes con dos rplicas en cada nivel del factor de ruido:

L9

Col.1 Col.

Exp.
No.
1

Col.
4

Col.
3
C

2
3
4
5
6

1
1
2
2
2

2
3
1
2
3

2
3
2
3
1

2
3
3
1
2

7
8

3
3

1
2

3
1

2
3

N1
Rep.
1

N1
Rep.
2

N2
Rep.
1

N2
Rep.
2

2.24
1.75
5.32
0.37
7.2
39.1
7
0.57

0.59
5.07
0.65
0.32
0.49
27.0
5
1.26

3.88
15.4
2

7.85
25.5
2

5.29
1.05
0.4
0.34
0.48
46.5
4
0.61
22.7
4
35.2
7

1.75
0.41
1.07
0.68
0.44
25.7
7
0.7
36.3
3
48.6
1

N3
Rep.
1
155.
04
0.38
0.51
4.31
0.8
138.
08
0.91
92.8
67.5
6

1 n 2
yi
n i 1

S / N 10 log

Las sumas de cuadrados son las siguientes:


Para el arreglo L9 con nueve respuestas Y1 a Y9 se tiene:
La suma de cuadrados del factor A es:

A1 = Y1 + Y2 + Y3
A2 = Y4 + Y5 + Y6
A3 = Y7 + Y8 + Y9

Pgina 67 de 82

N3
Rep.
2
166.
27
0.48
0.36
0.65
0.88
165.
61
1.42
120.
33
72.7
3

Y
promedio

S/N

55.20
1.52
1.39
1.11
1.72

-39.36
-7.05
-7.05
-5.19
-9.54

73.70
0.91

-39.34
0.28

47.32

-36.20

44.19

-33.79

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

A12 A22 A33


CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
SSA

La suma de cuadrados del factor B es:

B1 = Y1 + Y4 + Y7
B2 = Y4 + Y5 + Y8
B3 = Y3 + Y6 + Y9
B12 B22 B33
CF
3
(Y Y .... Y9 ) 2
CF 1 2
9
SSB

De la misma forma se calculan las sumas de cuadrados para los


factores C y D:
La suma de cuadrados total es:

SST = SSA + SSB + SSC + SSD

Haciendo los clculos en Minitab se obtiene:

Taguchi Analysis: Rep. 1, Rep. 2, Rep. 1_1, Rep. 2_1, ...


versus A, B, C, D
Linear Model Analysis: SN ratios versus A, B, C, D
Estimated Model Coefficients for SN ratios

Term
Constant
A
A
B
B
C
C
D
D

1
2
1
2
1
2
1
2

Coef
-19.6915

1.8735
1.6687
4.9386
2.0970
-18.6078
4.3499
-7.8678
4.3221

Pgina 68 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

S = *
Analysis of Variance for SN ratios
Source
contribucin
A
B
C
D
Residual Error
Total

DF
2
2
2
2
0
8

Seq SS

56.52
234.86
1705.37
279.46
*
2276.21

Adj SS

56.52
234.86
1705.37
279.46
*

28.261
117.428
852.685
139.732
*

Adj MS
*
*
*
*

*
*
*
*

P
2.49%
10.32%
74.91%
12.28%

Linear Model Analysis: Means versus A, B, C, D


Estimated Model Coefficients for Means

Term
Constant
A
A
B
B
C
C
D
D

1
2
1
2
1
2
1
2

Coef
25.2281

-5.8598
0.2819
-6.1548
-8.3748
33.5124
-9.6215
8.4707
0.1513

S = *
Analysis of Variance for Means
Source
A
B
C
D
Residual Error
Total

DF
2
2
2
2
0
8

Seq SS
196.59
957.39
5359.29
438.35
*
6951.62

Adj SS
196.59
957.39
5359.29
438.35
*

Adj MS
98.30
478.69
2679.65
219.17
*

F
*
*
*
*

P
*
*
*
*

Response Table for Signal to Noise Ratios


Smaller is better
Level
1
2
3
Delta
Rank

A
-17.818
-18.023
-23.234
5.416
4

B
-14.753
-17.595
-26.727
11.974
3

C
-38.299
-15.342
-5.434
32.866
1

D
-27.559
-15.369
-16.146
12.190
2

Response Table for Means


Pgina 69 de 82

Porcentaje de

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009
Level
1
2
3

A
19.368
25.510
30.806

Delta
Rank

B
19.073
16.853
39.758

11.438
4

C
58.741
15.607
1.337

P.

D
33.699
25.379
16.606

22.904
2

57.403
1

17.093
3

Las grficas factoriales son las siguientes:


Main Effects Plot (data means) for SN ratios
A

-10

Mean of SN ratios

-20
-30
-40
1

2
C

2
D

-10
-20
-30
-40

Signal-to-noise: Smaller is better

Los niveles seleccionados son A en 1, B en 1, C en 3 y D en 2


Main Effects Plot (data means) for Means
A

60

45

Mean of Means

30
15
0
1

2
C

2
D

60
45
30
15
0

La respuesta estimada es:


Predicted values
S/N Ratio

Mean

Pgina 70 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

5.70044

-10.5261

Factor levels for predictions


A
B C D
1
1 3 2

Pgina 71 de 82

P.

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

8. REGRESIN Y CORRELACIN LINEAL


8.1 Introduccin
Son dos herramientas para investigar la dependencia de una variable
dependiente Y en funcin de una variable independiente X. Y = f(X)
Y = Variable dependiente que se desea explicar o predecir, tambin
se llama regresor o respuesta
X = Variable independiente, tambin se llama variable explicativa,
regresor o predictor
Regresin lineal - La relacin entre X y Y se representa por medio de
una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio
de una curva.

*
**
*

*
*

*
*

*
*

b1

* *

* *

*
*

*
*
*

b0
Correlacin positiva

Correlacin negativa

Sin
correlacin

La ecuacin de la recta es la siguiente:

El trmino de error es la diferencia entre los valores reales observados


Yi y los valores estimados por la ecuacin de la recta. Se trata de que
estos sean mnimos, para lo cual se utiliza el mtodo de mnimos
cuadrados.

Pgina 72 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

Pgina 73 de 82

P.

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Error Re siduo (Yi Yi )


Y
*

X
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error
se aplicarn en el siguiente ejemplo por claridad. Se tienen los
siguientes supuestos:
1. Los errores o residuos se distribuyen normalmente alrededor de la
recta de regresin poblacional
2. Las varianzas de los errores son las mismas en todos los valores de
X (Homoscedasticidad)
en caso contrario se tiene
(Heteroscedasticidad)
3. Los errores o residuos son independientes: No se muestra algn
patrn definido.
El coeficiente de Correlacin r desarrollado por Carl Pearson es un
indicador de la fuerza de la relacin entre las variables X y Y, puede
asumir valores entre -1 y 1 para correlacin negativa y positiva
perfecta respectivamente. Por ejemplo si se encuentra que la variable
presin tiene una correlacin positiva con el rendimiento de una
caldera, se deben buscar soluciones al problema mediante acciones
asociadas con la variable presin; de lo contrario, sera necesario
buscar la solucin por otro lado.
Se identifican tres medidas de desviacin como sigue:

Pgina 74 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Y
Yest = 4.4 + 1.08 X
Yi =
23

Desviacin no
explicada
Error = (Yi - Yest) =
1.32

Variacin
total
(Yimedia)=5.13

Desviacin
explicada
(Yest-Ymedia) =
3.81

Ymedia =17.87

X = 16

8.2 Ejemplo manual


Se sospecha que el tiempo requerido para hacer un mantenimiento
preventivo est relacionado con su nmero. Calcular el coeficiente de
correlacin y graficar. Los datos de tiempo tomados para n = 25
servicios se muestran a continuacin:
X Servicios
2
8
11
10
8
4
2
2
9
8
4
11
12
2
4
4
20
1

Y Tiempo
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
27.50
17.08
37.00
41.95
11.66
21.65
17.89
69.00
10.30

(Xi-X)*(Yi-Y)
119.076672
1.099872
7.499472
10.502272
0.963072
51.612672
91.433472
121.260672
-3.558928
0.367872
50.679872
21.989472
48.568672
108.406272
31.303072
47.245472
470.014272
135.625472

(Xi-X)^2
(Yi-Y)^2
38.9376 364.1533
0.0576
21.0021
7.6176
7.3832
3.0976
35.6075
0.0576
16.1026
17.9776 148.1771
38.9376 214.7045
38.9376 377.6337
0.5776
21.9286
0.0576
2.3495
17.9776 142.8694
7.6176
63.4763
14.1376 166.8541
38.9376 301.8142
17.9776
54.5057
17.9776 124.1620
138.2976 1,597.3771
52.4176 350.9178

Pgina 75 de 82

Yest
10.9199
28.3362
37.0443
34.1416
28.3362
16.7253
10.9199
10.9199
31.2389
28.3362
16.7253
37.0443
39.9470
10.9199
16.7253
16.7253
63.1686
8.0172

Error
0.9408
15.1022
28.0292
0.7369
10.9969
0.0181
11.9721
1.7422
47.4563
0.6991
0.1258
0.0020
4.0121
0.5477
24.2523
1.3564
34.0052
5.2111

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

10
15
15
16
17
6
5

34.93
46.59
44.88
54.12
56.63
22.13
21.15

10.379072
118.686672
107.127072
194.676672
241.751472
15.462272
25.540272

206

725.82

2,027.7132

698.5600

Sxy

Sxx

Syy = SST

Sxy

Sxx

Syy

X
promedio

Y Promedio

3.0976
45.6976
45.6976
60.2176
76.7376
5.0176
10.4976

34.7770
308.2553
251.1337
629.3676
761.6054
47.6486
62.1385

34.1416 0.6216
48.6551 4.2646
48.6551 14.2512
51.5578 6.5649
54.4605 4.7068
22.5307 0.1606
19.6280 2.3164
220.092
6,105.9447
6

Si todos los puntos estuvieran completamente sobre la recta la


ecuacin lineal sera y = a + bx. Como la correlacin no siempre es
perfecta, se calculan a y b de tal forma que se minimice la distancia
total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
Las ecuaciones para el clculo manual son las siguientes:
b1 1

b0 0

( Xi X )(Yi Y ) S
S
( Xi X )

XY

1 X i
n

XX

= 2.902704421

Y X

= 5.114515575

Las sumas de cuadrados son:

SST (Yi Y ) 2

6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2

220.0926

SSR SST SSE 5,885.8521


El coeficiente de determinacin r2 y el coeficiente de correlacin r se
calculan a continuacin:
Pgina 76 de 82

SSE

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

r2 1

P.

SSE ( SST SSE ) SSR

SST
SST
SST = 0.9639

El coeficiente de determinacin indica el porcentaje de la variacin


total que es explicada por la regresin.
r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen
los puntos a la lnea recta indicando el nivel de influencia de una
variable en la otra. El factor de correlacin r es un nmero entre 1
(correlacin negativa evidente) y +1 (correlacin positiva evidente), y
r = 0 indicara correlacin nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente
evidencia estadstica para afirmar que el tiempo de atencin esta
relacionado con el nmero de servicios atendidos.

8.3 Uso de Excel


1. En el men Herramientas seleccione la opcin Anlisis de
datos. Datos de ejemplo 6.
2. Seleccione la opcin Regresin.
3. Seleccione el rango de entrada, estos corresponden a los datos
numricos de la tabla.
4. Seleccione Resumen de estadsticas.
5. En opciones de salida seleccione en Rango de salida, una celda
de la hoja de clculo que este en blanco (a partir de esta celda
sern insertados los resultados).
Resumen
Estadsticas de la regresin
Coeficiente de
correlacin
0.981811
mltiple
778
Coeficiente de
determinacin
0.963954
R^2
368
0.962387
R^2 ajustado
167
Error tpico
3.093419
Pgina 77 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

627
25

Observaciones

ANLISIS DE VARIANZA
Grados
de
libertad

Residuos
Total

XServicios

Promedio
Suma de de

Cuadrad
os
5885.852
1
069
220.0926
23
348
6105.944
24
704

Regresin

Intercepcin

P.

Valor
cuadra
crtico de
dos
F
F
5885.852 615.0800 4.24118E
069
898
-18
9.569244
992

Coeficien
Error
Estadsti Probabili Inferior
tes
tpico
co t
dad
95%
5.114515 1.145804 4.463691 0.000177 2.744239
575
127
004
215
161
2.902704 0.117040 24.80080 4.24118E 2.660587
421
719
825
-18
249

En la grfica observamos que al aumentar el nmero de servicios el


tiempo de atencin aumenta.

8.4 Uso de Minitab


Para determinar la funcin de regresin y correlacin en Minitab se
siguen los pasos siguientes (despus de cargar los datos
correspondientes a X y a Y en las columnas C1 y C2):

Pgina 78 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

Stat >Regresin ... Indicar la columna de Respuestas Y y la de


predictores X y aceptar con OK. Observar el valor del
coeficiente de correlacin y de determinacin.
Para obtener la lnea de mejor ajuste de la regresin, se procede
como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y
y la de predictores X, seleccionar si se quiere ajustar con los
datos con una lnea, una funcin cuadrtica o cbica y aceptar
con OK. Observar el mayor valor del coeficiente de correlacin
que indica el mejor ajuste.
En Options: seleccionar Display Confidence (para media en X) y
Prediction Intervals para X.
En Graphs: Seleccionar Residual for plots Standardized y Normal
Plot of residuals
La grfica de residuos debe apegarse a la recta y tener siempre un
valor P value >0.05.
Fitted Line Plot
Y Tiempo = 5.115 + 2.903 X Servicios
Regression
95% CI
95% PI

70
60

S
R-Sq
R-Sq(adj)

Y Tiempo

50

3.09342
96.4%
96.2%

40
30
20
10
0
0

10
X Servicios

15

20

Regression Analysis: Y Tiempo versus X Servicios


The regression equation is
Y Tiempo = 5.115 + 2.903 X Servicios
S = 3.09342
R-Sq = 96.4%
R-Sq(adj) = 96.2%
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 5885.85 5885.85 615.08 0.000
Error
23
220.09
9.57
Total
24 6105.94

Pgina 79 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

La regresin tiene una r^2 de 96.4% y la influencia de una variable X


en Y es significativo.
Los intervalos de confianza para la media y el intervalo de
prediccin para un punto especfico X son los siguientes:

Pgina 80 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

8.5 Ejercicios:
1. La energa consumida en un proceso depende del ajuste de
mquinas, realizar una regresin cuadrtica con los datos siguientes y
responder las preguntas.
Cons_energ Ajuste
a
Mq.
Y
X
21.6
11.15
4
15.7
1.8
18.9
1
19.4
1
21.4
0.8
21.7
3.8
25.3
7.4
26.4
4.3
26.7
36.2
29.1
a) Trazar un diagrama de dispersin
b) Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c) Estimar el consumo de energa para un ajuste de mquina de 20
con regresin cuadrtica
d) Obtener los intervalos de prediccin y de confianza para un ajuste
de mquina de 20
e) Obtener el coeficiente de correlacin y de determinacin
2. En base al porcentaje de puntualidad se trata de ver si hay
correlacin con las quejas en una lnea area. Las quejas son por cada
100000 pasajeros.
%punto Queja
s
s
Aeroline
a
X
Y
A
81.8
0.21
B
76.6
0.58
C
76.6
0.85
D
75.7
0.68
E
73.8
0.74
F
72.2
0.93
G
70.8
0.72
H
68.5
1.22
a) Trazar un diagrama de dispersin
b) Obtener la ecuacin de regresin lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
Pgina 81 de 82

CURSO DE DISEO DE EXPERIMENTOS


Reyes / enero 2009

P.

d) Obtener los intervalos de prediccin y de confianza para una altura


de 63"
e) Obtener el coeficiente de correlacin y de determinacin

Pgina 82 de 82

S-ar putea să vă placă și