Sunteți pe pagina 1din 26

METODOLOGA DE LA

SUPERFICIE DE LA RESPUESTA

Optimizacin de procesos y productos


utilizando experimentos diseados

RAYMOND H. MYERS
Virginia Polytechnic University, Department of Statistics, Blacksburg, VA
DOUGLAS C. MONTGOMERY
Arizona State University, Department of Industrial Engineering, Tempe, AZ
CHRISTINE M. ANDERSON-COOK
Los Alamos National Laboratory, Los Alamos, NM
Tabla de contenido
1. INTRODUCCIN.......................................................................................................3
1.1 METODOLOGA DE LA SUPERFICIE DE RESPUESTA................................3
1.1.1 Aproximacin de las funciones de respuesta.................................................4
1.1.2 La naturaleza secuencial de RSM.................................................................9
1.1.3 Objetivos y aplicaciones tpicas de RSM.....................................................12
1.1.4 RSM y la Filosofa del Mejoramiento de la Calidad......................................13
1.2 DISEO Y FORMULACIN DEL PRODUCTO (PROBLEMAS DE MEZCLA)...14
1.3 DISEO ROBUSTO Y ESTUDIOS DE ROBUSTEZ DEL PROCESO................14
1.4 REFERENCIAS TILES SOBRE RSM..............................................................15
2.- CONSTRUIR MODELOS EMPIRICOS..................................................................16
2.1 MODELOS DE REGRESIN LINEAL................................................................16
2.2 ESTIMACIN DE LOS PARMETROS EN LOS MODELOS DE REGRESIN
LINEAL.................................................................................................................... 17
2.3 PROPIEDADES DE LOS ESTIMADORES DE MENOS CUADRADOS Y
ESTIMACIN DE 2................................................................................................24
2.4 PRUEBAS DE HIPTESIS EN REGRESIN MLTIPLE..................................26
2.4.1 Prueba de la significacin de la regresin...................................................26
1. INTRODUCCIN

1.1 METODOLOGA DE LA SUPERFICIE DE RESPUESTA

La metodologa de superficie de respuesta (RSM) es un conjunto de tcnicas estadsticas


y matemticas tiles para desarrollar, mejorar y optimizar procesos. Tambin tiene
importantes aplicaciones en el diseo, desarrollo y formulacin de nuevos productos, as
como en la mejora de los diseos de productos existentes.
Las aplicaciones ms extensas de RSM se encuentran en el mundo industrial,
particularmente en situaciones donde varias variables de entrada influyen
potencialmente en las medidas de desempeo o en las caractersticas de calidad del
producto o proceso. Estas medidas de rendimiento o caractersticas de calidad se llaman
la respuesta. Normalmente se miden en una escala continua, aunque las respuestas de
los atributos, las filas y las respuestas sensoriales no son inusuales. La mayora de las
aplicaciones del mundo real de RSM implicarn ms de una respuesta. Las variables de
entrada a veces se denominan variables independientes y estn sujetas al control del
ingeniero o cientfico, al menos para propsitos de una prueba o un experimento.
La Figura 1.1 muestra grficamente la relacin entre el rendimiento de la variable de
respuesta (y) en un proceso qumico y las dos variables de proceso (o variables
independientes) el tiempo de reaccin ( 1) y la temperatura de reaccin ( 2). Obsrvese
que para cada valor de 1 y 2 hay un valor correspondiente de rendimiento y y que
podemos ver estos valores del rendimiento de respuesta como una superficie situada por
encima del plano tiempo-temperatura, como en la Fig. 1.1a. Es esta perspectiva grfica
del entorno problema que ha llevado al trmino metodologa de superficie de respuesta.
Tambin es conveniente ver la superficie de respuesta en el plano bidimensional tiempo-
temperatura, como en la Fig. 1.1b. En esta presentacin estamos mirando hacia abajo en
el plano tiempo-temperatura y conectando todos los puntos que tienen el mismo
rendimiento para producir lneas de contorno de respuesta constante. Este tipo de
pantalla se denomina trazado de contorno.
Figura 1.1 (a) Una superficie de respuesta terica que muestra la relacin entre el rendimiento de
un proceso qumico y las variables de proceso tiempo de reaccin ( 1) y la temperatura de reaccin (
2). (B) Un grfico de contorno de la superficie de respuesta terica.

Claramente, si pudiramos construir fcilmente las representaciones grficas en la Fig.


1.1, la optimizacin de este proceso sera muy sencilla. Mediante la inspeccin de la
parcela, observamos que el rendimiento se maximiza en la proximidad del tiempo 1 = 4
h y la temperatura 2 = 525C. Desafortunadamente, en la mayora de las situaciones
prcticas, la funcin de respuesta verdadera en la Fig. 1.1 se desconoce. El campo de la
metodologa de la superficie de resolucin consiste en las estrategias experimentales
para explorar el espacio del proceso o variables independientes (aqu las variables 1 y
2), el modelado estadstico emprico para desarrollar una adecuada relacin aproximada
entre el rendimiento y las variables del proceso , Y mtodos de optimizacin para
encontrar los niveles o valores de las variables de proceso 1 y 2 que producen valores
deseables de las respuestas (en este caso, que maximizan el rendimiento).
1.1.1 Aproximacin de las funciones de respuesta
En general, supongamos que el cientfico o ingeniero se refiere a un producto, proceso o
sistema que implica una respuesta y que depende de las variables de entrada
controlables 1, 2, ..., k. Estas variables de entrada tambin se denominan a veces
factores, variables independientes o variables de proceso. La relacin real puede
escribirse

Donde la forma de la funcin de respuesta verdadera f es desconocida y quizs muy


complicada, y es un trmino que representa otras fuentes de variabilidad no
contabilizadas en f. As, incluye efectos tales como error de medida en la respuesta,
otras fuentes de variacin inherentes al proceso o sistema (ruido de fondo, o variacin
de causa comn / especial en el lenguaje del control estadstico de procesos), el efecto
de otros), Y as sucesivamente. Trataremos como un error estadstico, asumiendo a
menudo que tiene una distribucin normal con media cero y varianza 2. Si la media de
es cero, entonces
Figura 1.2 (a) Superficie de respuesta para el modelo de primer orden = 50 + 8x 1 + 3x2. (b)
Diagrama de contorno para el modelo de primer orden.

Las variables 1, 2, ..., k de la ecuacin 1.2 se denominan normalmente variables


naturales, ya que se expresan en las unidades naturales de medida, como grados Celsius
(C), libras por pulgada cuadrada Psi), o gramos por litro para la concentracin. En
muchos trabajos RSM es conveniente transformar las variables naturales en variables
codificadas x1, x2, ..., xk, que generalmente se definen como adimensionales con media
cero y la misma propagacin o desviacin estndar. En trminos de las variables
codificadas, la funcin de respuesta verdadera (1.2) se escribe ahora como

Debido a que la forma de la funcin de respuesta verdadera f es desconocida, debemos


aproximarla.
De hecho, el uso exitoso de RSM depende en gran medida de la capacidad del
experimentador para desarrollar una aproximacin adecuada para f. Normalmente, un
polinomio de orden bajo en alguna regin relativamente pequea del espacio variable
independiente es apropiado. En muchos casos, se utiliza un modelo de primer orden o
de segundo orden. Para el caso de dos variables independientes, el modelo de primer
orden en trminos de las variables codificadas es

La figura 1.2 muestra la superficie de respuesta tridimensional y el diagrama de


contorno bidimensional para un caso particular del modelo de primer orden, a saber,

En tres dimensiones, la superficie de respuesta para y es un plano situado por encima


del espacio x1, x2. El grfico de contorno muestra que el modelo de primer orden puede
representarse como lneas rectas paralelas de respuesta constante en el plano x1, x2.
Es probable que el modelo de primer orden sea apropiado cuando el experimentador
est interesado en aproximar la superficie de respuesta verdadera sobre una regin
relativamente pequea del espacio variable independiente en un lugar donde hay poca
curvatura en f. Por ejemplo, considere una pequea regin alrededor del punto A de la
Fig. 1.1b; El modelo de primer orden probablemente sera apropiado aqu.
Figura 1.3 (a) Superficie de respuesta para el modelo de primer orden con interaccin = 50 + 8x 1
+ 3x2 - 4x1. x2. (b) Diagrama de contorno para el modelo de primer orden con interaccin.

La forma del modelo de primer orden en la ecuacin 1.4 se denomina a veces modelo
principal de efectos, ya que slo incluye los efectos principales de las dos variables x1 y
x2. Si existe una interaccin entre estas variables, puede agregarse fcilmente al modelo
de la siguiente manera:

Este es el modelo de primer orden con interaccin. La figura 1.3 muestra la superficie
de respuesta tridimensional y el grfico de contornos para el caso especial

Observe que la adicin del trmino de interaccin -4x1 x2 introduce la curvatura en la


funcin de respuesta. Esto conduce a diferentes tasas de cambio de la respuesta como x1
se cambia para diferentes valores fijos de x2. Similarmente, la tasa de cambio en y a
travs de x2 vara para diferentes valores fijos de x1.
A menudo, la curvatura en la superficie de respuesta verdadera es lo suficientemente
fuerte como para que el modelo de primer orden (incluso con el trmino de interaccin
incluido) sea inadecuado. Es probable que se requiera un modelo de segundo orden en
estas situaciones. Para el caso de dos variables, el modelo de segundo orden es

Este modelo probablemente sera til como una aproximacin a la superficie de


respuesta verdadera en una regin relativamente pequea alrededor del punto B en la
Fig. 1.1b, donde existe una curvatura sustancial en la funcin de respuesta verdadera f.
La figura 1.4 presenta la superficie de respuesta y el grfico de contornos para el caso
especial del modelo de segundo orden

Observe la superficie de respuesta en forma de montculo y los contornos elpticos


generados por este modelo. Tal superficie de respuesta podra surgir al aproximar una
respuesta tal como el rendimiento, donde se esperara que estuviera operando cerca de
un punto mximo en la superficie.
Figura 1.4 (a) Superficie de respuesta para el modelo de segundo orden = 50 + 8x 1 + 3x2 - 7x12 -
3x2 2 - 4x1 x2. (B) Diagrama de contorno para el modelo de segundo orden.

El modelo de segundo orden es ampliamente utilizado en la metodologa de superficie


de respuesta por varias razones. Entre ellos estn los siguientes:
1. El modelo de segundo orden es muy flexible. Puede tomar una amplia variedad de
formas funcionales, por lo que a menudo funcionar bien como una aproximacin a la
verdadera superficie de respuesta. La Figura 1.5 muestra varias superficies de respuesta
y tramas de contorno diferentes que pueden ser generadas por un modelo de segundo
orden.

Figura 1.5 Algunos ejemplos de tipos de superficies definidas por el modelo de segundo orden en
dos variables x1 y x2. (Adaptado con permiso de Empirical Model Building y Response Surfaces, G.
E. P. Box y N. R. Draper, John Wiley & amp; Sons, New York, 1987)

2. Es fcil estimar los parmetros (los 's) en el modelo de segundo orden. El mtodo
de los mnimos cuadrados, que se presenta en el captulo 2, puede utilizarse para este
propsito.
3. Existe una considerable experiencia prctica que indica que los modelos de segundo
orden funcionan bien en la resolucin de problemas reales de superficie de respuesta.
En general, el modelo de primer orden es

Y el modelo de segundo orden es


En algunas situaciones, se usan polinomios aproximados de orden superior a dos. La
motivacin general para una aproximacin polinmica para la funcin de respuesta
verdadera f se basa en la expansin de la serie de Taylor alrededor del punto x10,
x20, ..., xk0. Por ejemplo, el modelo de primer orden se desarrolla a partir de la
expansin en serie de Taylor de primer orden

Donde x se refiere al vector de variables independientes y x0 es el vector de variables


independientes en el punto especfico x10, x20, ..., xk0. En la ecuacin 1.9 slo hemos
incluido los trminos de primer orden en la expansin, por lo que si dejamos que 0 = f
(x10, x20, ..., xk0), 1 = ( f / x1) ||, ..., k = ( f / xk) | , Tenemos el modelo de
aproximacin de primer orden en la Ecuacin 1.7. Si incluyramos trminos de segundo
orden en la Ecuacin 1.9, esto conducira al modelo de aproximacin de segundo orden
en la Ecuacin 1.8.
Finalmente, observe que existe una estrecha relacin entre RSM y anlisis de regresin
lineal. Por ejemplo, considere el modelo

Los 's son un conjunto de parmetros desconocidos. Para estimar los valores de estos
parmetros, debemos recopilar datos sobre el sistema que estamos estudiando. El
anlisis de regresin es una rama de la construccin de modelos estadsticos que utiliza
estos datos para estimar los 's. Debido a que, en general, los modelos polinomiales son
funciones lineales de las desconocidas, nos referimos a la tcnica como anlisis de
regresin lineal. Tambin veremos que es muy importante planificar cuidadosamente la
fase de recoleccin de datos de un estudio de superficie de respuesta. De hecho, los
tipos especiales de diseos experimentales, llamados diseos de superficies de
respuesta, son valiosos a este respecto. Una parte sustancial de este libro est dedicada a
diseos de superficies de respuesta. Tenga en cuenta que los anlisis y los diseos deben
ser cuidadosamente combinados. Si estamos planeando analizar datos de nuestro
experimento planeado usando un modelo de primer orden, entonces el diseo que
seleccionamos debera ser adecuado para este anlisis. De manera similar, si
anticipamos una curvatura similar a la que se puede modelar con un modelo de segundo
orden, entonces se debe seleccionar un diseo diferente.
Se han construido buenos diseos de superficies de respuesta para que funcionen bien
basndose en un modelo particular asumido, pero tambin se han estructurado de
manera que sean capaces de evaluar los supuestos del modelo que se est analizando
para determinar si las impresiones iniciales del sistema del experimentador Bajo estudio
coinciden con la verdadera relacin subyacente que produjo los datos a analizar. Por lo
tanto, el experimentador debe pensar cuidadosamente acerca de los objetivos de un
experimento en particular y lo que el anlisis anticipado implicar antes de seleccionar
el diseo para la recopilacin de datos.
1.1.2 La naturaleza secuencial de RSM
La mayora de las aplicaciones de RSM son de naturaleza secuencial. Es decir, al
principio se generan algunas ideas sobre qu factores o variables pueden ser importantes
en el estudio de superficie de respuesta. Esto suele conducir a un experimento diseado
para investigar estos factores con vistas a verificar el papel de los factores que influyen
en la respuesta y la eliminacin de los no importantes. Este tipo de experimento se
denomina usualmente un experimento de tamizaje. A menudo, al comienzo de un
estudio de superficie de respuesta, existe una lista bastante larga de variables que
podran ser importantes para explicar la respuesta. El objetivo del cribado de factores es
reducir esta lista de variables candidatas a un nmero relativamente pequeo para que
los experimentos posteriores sean ms eficientes y requieran menos pruebas o pruebas.
Nos referimos a un experimento de cribado como fase cero de un estudio de superficie
de respuesta. Dado que el inters en un experimento de deteccin se encuentra en la
comprensin del comportamiento bruto del sistema y cmo los factores estn
relacionados con la respuesta, un modelo de primer orden se selecciona comnmente.
La clase de diseos de superficie de respuesta que se utilizan para los experimentos de
cribado son bien adecuados para comprender mejor los efectos principales de diferentes
variables independientes y comparar sus contribuciones relativas con los cambios en los
valores de respuesta. Puesto que esto representa una etapa temprana en la secuencia
planificada de experimentos, el objetivo es determinar cules de los factores son ms
influyentes en la respuesta mientras se utiliza una proporcin tan pequea como sea
posible del presupuesto experimental total. Nunca debe realizar un anlisis de superficie
de respuesta hasta que se haya realizado un experimento de deteccin para identificar
los factores importantes.
Una vez que se identifican las variables independientes importantes, comienza la fase
uno del estudio de superficie de respuesta. En esta fase, el objetivo del experimentador
es determinar dnde se encuentran los datos recogidos en relacin con una respuesta
ideal. A menudo, hay dos resultados posibles con los niveles o ajustes actuales de las
variables independientes que resultan en un valor de la respuesta que est cerca del
ptimo (tal como el punto B en la figura 1.1b), o el proceso est funcionando en algn
otro Regin (posiblemente) alejada de la ptima (tal como el punto A de la figura 1.1b).
Si los ajustes o niveles actuales de las variables independientes no son consistentes con
el rendimiento ptimo, entonces el experimentador debe determinar un conjunto de
ajustes a las variables de proceso que movern el proceso hacia el ptimo. Esta fase de
la metodologa de superficie de respuesta hace un uso considerable del modelo de
primer orden y una tcnica de optimizacin llamada el mtodo de subida ms
pronunciada. Estas tcnicas sern discutidas e ilustradas en el Captulo 5.
La fase dos de un estudio de superficie de respuesta comienza cuando el proceso est
cerca del ptimo. En este punto, el experimentador suele querer un modelo que se
aproximar con precisin a la funcin de respuesta verdadera dentro de una regin
relativamente pequea alrededor del ptimo. Debido a que la superficie de respuesta
verdadera normalmente exhibe curvatura cerca del ptimo (ver la figura 1.1), se
utilizar un modelo de segundo orden (o muy ocasionalmente algn polinomio de orden
superior). Una vez que se ha obtenido un modelo de aproximacin apropiado, este
modelo puede ser analizado para determinar las condiciones ptimas para el proceso. El
captulo 6 presentar tcnicas para el anlisis del modelo de segundo orden y la
determinacin de condiciones ptimas.
Los diseos de superficies de respuesta para modelar la respuesta cerca del ptimo se
seleccionan de nuevo para coincidir con el anlisis anticipado. A menudo, el plan es
caracterizar la relacin entre la respuesta y las variables independientes clave utilizando
el modelo de segundo orden de la forma en la ecuacin 1.8. Los diseos se construyen
para poder estimar la respuesta para las combinaciones de factores de entrada alrededor
del ptimo esperado, donde la curvatura en la relacin es comn. Dado que esta etapa
de la experimentacin se centra en la determinacin de un mejor conjunto de valores de
entrada para los que el proceso de operar, una porcin generosa del presupuesto
experimental se reserva generalmente para esta parte del proceso.
Una etapa final de la experimentacin, que generalmente no requiere sofisticados
diseos de superficie de respuesta o una gran porcin del presupuesto experimental, es
un experimento confirmatorio. Esta recoleccin de datos es generalmente simple y
pequea, pero est diseada para confirmar que el ptimo identificado que se obtuvo en
la fase dos se puede lograr estableciendo las variables independientes en los ajustes
designados.
Este proceso experimental secuencial se realiza generalmente dentro de una regin del
espacio variable independiente denominada regin de operabilidad. Para el proceso
qumico ilustrado en la Fig. 1.1, la regin de operabilidad es 0 hr <1 7 h y 100C 2
800C. Supongamos que actualmente estamos operando a los niveles 1 = 2,5 hr y 2 =
500 C, mostrados como el punto A en la Fig. 1.6. Ahora es poco probable que
queramos explorar toda la regin de operabilidad con un solo experimento. En cambio,
usualmente definimos una regin de inters o regin de experimentacin ms pequea
alrededor del punto A dentro de la regin ms grande de operabilidad. Tpicamente, esta
regin de experimentacin es o bien una regin cuboidal, como se muestra alrededor del
punto A en la Fig. 1.6, o una regin esfrica, como se muestra alrededor del punto B. La
eleccin del diseo de la superficie de respuesta coincide con la regin especificada de
experimentacin.
Figura 1.6 La regin de operabilidad y la regin de experimentacin.

La naturaleza secuencial de la metodologa de superficie de respuesta permite al


experimentador aprender sobre el proceso o sistema en estudio a medida que avanza la
investigacin. Esto asegura que durante el curso de la aplicacin RSM el
experimentador aprender las respuestas a preguntas tales como (1) la ubicacin de la
regin del ptimo, (2) el tipo de funcin de aproximacin requerida, (3) la eleccin
apropiada de experimental Diseos, (4) cunta replicacin es necesaria y (5) si se
requieren o no transformaciones en las respuestas o en cualquiera de las variables del
proceso. Debido a que la naturaleza de un estudio superficial de respuesta tiene etapas
mltiples con objetivos diferentes, hay varios aspectos que se deben mejorar a lo largo
del proceso. En primer lugar, muchos estudios tienen restricciones presupuestarias que
indicarn cunto y qu datos se pueden recopilar. Es importante planificar todas las
etapas del estudio y permitir que se disponga de recursos adecuados para responder
eficazmente a las preguntas importantes en cada fase.
En segundo lugar, ya que los conocimientos adquiridos en las primeras fases del estudio
ayudan a determinar lo que los experimentos posteriores estudiarn, es importante
planificar cmo se conectarn las diferentes fases y qu informacin puede
aprovecharse de las primeras fases. En tercer lugar, la seleccin de un modelo para el
anlisis de los datos de cada fase se basa en la comprensin actual del proceso
subyacente. Es importante pensar en la secuencia de experimentos como un mecanismo
para no tener que hacer demasiadas suposiciones en cualquier etapa, Ejecutar un gran
experimento complicado que tiene muchas suposiciones no probadas puede conducir a
errores costosos y desperdicio de recursos. Por lo tanto, una serie de experimentos ms
pequeos pueden verificar algunas suposiciones al principio de la secuencia y pueden
permitir al experimentador proceder en etapas posteriores con mayor confianza.
Por ltimo, volvemos a mencionar la conexin entre la eleccin del experimento y el
anlisis planificado. Antes de saltar para recopilar datos, los objetivos de cada fase
deben estar claramente definidos y la naturaleza del diseo de la superficie de respuesta
debe reflejar las metas y el anlisis planeado. Puesto que a menudo hay sorpresas al
recolectar y analizar datos, es til considerar lo que podra salir mal con el experimento
y tener un plan para manejar algunas de estas sorpresas. Una parte sustancial de este
libro -captulos 3, 4, 8 y 9- se dedica a experimentos diseados tiles en RSM.
1.1.3 Objetivos y aplicaciones tpicas de RSM
La metodologa de superficie de respuesta es til en la solucin de muchos tipos de
problemas industriales. Generalmente, estos problemas se dividen en tres categoras:
1. Mapeo de una superficie de respuesta sobre una regin de inters particular.
Consideremos el proceso qumico de la Fig. 1,1b. Normalmente, este proceso
funcionara en un ajuste particular de tiempo de reaccin y temperatura de reaccin. Sin
embargo, ocasionalmente pueden ser necesarios algunos cambios en estos niveles
normales de operacin, tal vez para producir un producto que cumpla con otros
requisitos especficos del cliente. Si la funcin de respuesta desconocida verdadera ha
sido aproximada sobre una regin alrededor de las condiciones operativas actuales con
una superficie de respuesta adaptada adecuada (digamos una superficie de segundo
orden), entonces el ingeniero de proceso puede predecir por adelantado los cambios en
el rendimiento que resultarn de Cualquier reajuste a las variables de entrada, a saber,
tiempo y temperatura.
2. Optimizacin de la respuesta. En el mundo industrial, un problema muy importante
es determinar las condiciones que optimicen el proceso. En el proceso qumico de la
Fig. 1.1b, esto implica determinar los niveles de tiempo y temperatura que dan como
resultado un rendimiento mximo. Un estudio de RSM que comenz cerca del punto A
en la Fig. 1.1b conducira eventualmente al experimentador a la regin cerca del punto
B. Un modelo de segundo orden podra entonces ser utilizado para aproximar la
respuesta del rendimiento en una regin estrecha alrededor del punto B y del examen de
esta superficie aproximada de la respuesta los niveles ptimos o la condicin para
Tiempo y temperatura.
3. Seleccin de las condiciones de operacin para lograr las especificaciones o
requerimientos del cliente. En la mayora de los problemas de superficie de respuesta
hay varias respuestas que deben ser consideradas simultneamente. Por ejemplo, en el
proceso qumico de la Fig. 1.1, supongamos que adems del rendimiento, hay otras dos
respuestas: costo y concentracin. Nos gustara mantener el rendimiento por encima del
70%, mientras que al mismo tiempo mantener el costo por debajo de $ 34 / libra; Sin
embargo, el cliente ha impuesto especificaciones de concentracin de tal manera que
esta importante propiedad fsica debe ser de 65 3 g / litro.
Una forma de resolver este problema es obtener superficies de respuesta para las tres
respuestas-rendimiento, coste y concentracin- y luego superponer los contornos para
estas respuestas en el plano de tiempo-temperatura, como se ilustra en la Fig. 1.7. En
esta figura hemos mostrado los contornos para el rendimiento = 70%, costo = $ 34 /
libra, concentracin = 62 g / litro, y concentracin = 68 g / litro. La regin no
sombreada en esta figura representa la regin que contiene condiciones operativas que
satisfacen simultneamente todos los requisitos del proceso.
En la prctica, problemas complejos de optimizacin de procesos como este pueden
resolverse a menudo superponiendo contornos de superficie de respuesta apropiados.
Sin embargo, no es raro encontrar problemas con ms de dos variables de proceso y
requisitos de respuesta ms complejos para satisfacer. En tales problemas, sern
necesarios otros mtodos de optimizacin ms eficaces que la superposicin de trazos
de contorno y, a menudo, no slo pueden identificar una regin que satisface los
requisitos mnimos del cliente, sino tambin encontrar una combinacin ptima de
variables de entrada para lograr un rendimiento ideal. Discutiremos la metodologa para
resolver estos tipos de problemas en el Captulo 7.

Figura 1.7 La regin no sombreada que muestra las condiciones para las cuales el rendimiento
70%, el costo 34 $ / libra, y 62 g / litro concentracin 68 g / litro.

1.1.4 RSM y la Filosofa del Mejoramiento de la Calidad


Durante las ltimas dcadas, las organizaciones industriales de Estados Unidos y
Europa se han interesado por la calidad y la mejora de los procesos. Los mtodos
estadsticos, incluyendo el control estadstico de procesos (SPC) y el diseo de
experimentos, juegan un papel clave en esta actividad. La mejora de la calidad es ms
efectiva cuando ocurre temprano en el ciclo de desarrollo del producto y del proceso. Es
muy difcil, costoso e ineficiente fabricar un producto mal diseado. Industrias como
semiconductores y electrnica, aeroespacial, automotriz, biotecnologa y productos
farmacuticos, dispositivos mdicos, productos qumicos y industrias de procesos son
ejemplos en los que la metodologa de diseo experimental ha dado lugar a un menor
tiempo de diseo y desarrollo de nuevos productos, Fabricacin, tienen una mayor
fiabilidad, tienen un rendimiento de campo mejorado, y cumplir o superar los requisitos
del cliente.
RSM es una rama importante del diseo experimental en este sentido. RSM es una
tecnologa crtica para desarrollar nuevos procesos, optimizar su rendimiento y mejorar
el diseo y / o la formulacin de nuevos productos. A menudo es una importante
herramienta de ingeniera concurrente, ya que el diseo de productos, desarrollo de
procesos, calidad, ingeniera de fabricacin y personal de operaciones a menudo
trabajan juntos en un entorno de equipo para aplicar RSM. Los objetivos de la mejora
de la calidad, incluida la reduccin de la variabilidad y el mejoramiento del rendimiento
del producto y del proceso, pueden lograrse a menudo directamente utilizando RSM.
1.2 DISEO Y FORMULACIN DEL PRODUCTO (PROBLEMAS DE
MEZCLA)
Muchas actividades de diseo y desarrollo de productos implican problemas de
formulacin, en los que se mezclan dos o ms ingredientes. Por ejemplo, supongamos
que estamos desarrollando un nuevo producto de limpieza para el hogar. Este producto
se formula mezclando varios tensioactivos qumicos juntos. El ingeniero de producto o
cientfico desea encontrar una mezcla apropiada de los ingredientes para que la
capacidad de corte de grasa de la limpiadora sea buena, y de manera que genere un nivel
adecuado de espuma cuando est en uso. En esta situacin, las variables de respuesta, a
saber, la capacidad de cortar grasa y la cantidad de espuma, dependen de los porcentajes
o proporciones de los tensioactivos qumicos individuales (los ingredientes) que estn
presentes en la formulacin del producto.
Existen muchos problemas industriales en los que las variables de respuesta de inters
en el producto son una funcin de las proporciones de los diferentes ingredientes
utilizados en su formulacin. Este es un tipo especial de problema de superficie de
respuesta llamado problema de mezcla.
Aunque tradicionalmente pensamos en problemas de mezcla en el diseo del producto o
en el entorno de la formulacin, ocurren en muchos otros entornos. Considerar el
grabado por plasma de obleas de silicio, un proceso de fabricacin comn en la
industria de semiconductores. El grabado se realiza usualmente introduciendo una
mezcla de gases dentro de una cmara que contiene las obleas. Las respuestas medidas
incluyen la velocidad de ataque, la uniformidad del ataque qumico y la selectividad
(una medida de las velocidades de ataque relativas de los diferentes materiales sobre la
oblea). Todas estas respuestas son una funcin de las proporciones de los diferentes
ingredientes mezclados juntos en la cmara de grabado.
Existen tcnicas especiales de diseo de superficies de respuesta y mtodos de
construccin de modelos para problemas de mezcla. Estas tcnicas se discuten en los
captulos 12 y 13.
1.3 DISEO ROBUSTO Y ESTUDIOS DE ROBUSTEZ DEL PROCESO
Es bien sabido que la variacin en las caractersticas clave del rendimiento puede
resultar en una mala calidad del producto y del proceso. Durante los aos ochenta, se
prest considerable atencin a este problema, y se desarroll metodologa para el uso
del diseo experimental, especficamente para lo siguiente:
1. Para disear productos o procesos para que sean robustos a las condiciones
ambientales.
2. Para disear o desarrollar productos para que sean robustos a la variacin de
componentes.
3. Para minimizar la variabilidad en la respuesta de salida de un producto alrededor
de un valor objetivo.
Por robusto, queremos decir que el producto o proceso se desempea de forma
consistente en el objetivo y es relativamente insensible a los factores que son difciles de
controlar.
El profesor Genichi Taguchi us el trmino diseo robusto de parmetros (o RPD) para
describir su enfoque a esta importante clase de problemas industriales. Esencialmente,
la metodologa robusta de diseo de parmetros se esfuerza por reducir la variacin del
producto o proceso eligiendo niveles de factores controlables (o parmetros) que hacen
que el sistema sea insensible (o robusto) a los cambios en un conjunto de factores
incontrolables que representan la mayora de las fuentes de variabilidad. Taguchi se
refiri a estos factores incontrolables como factores de ruido. Estos son los factores
ambientales tales como los niveles de humedad, los cambios en las propiedades de las
materias primas, la forma en que el cliente utilizar el producto, el envejecimiento del
producto y la variabilidad de los componentes mencionados en los puntos 1 y 2
anteriores. Por lo general suponemos que estos factores de ruido son incontrolables en el
campo, pero pueden ser controlados durante el desarrollo del producto o proceso para
los propsitos de un experimento diseado.
Se ha prestado considerable atencin a la metodologa defendida por Taguchi, y se han
descubierto una serie de fallas en su enfoque. Sin embargo, hay muchos conceptos tiles
en su filosofa, y es relativamente fcil incorporarlos en el marco de la metodologa de
superficie de respuesta. En el captulo 11 se presentar el enfoque de superficie de
respuesta para estudios de robustez de diseo y proceso robustos.
1.4 REFERENCIAS TILES SOBRE RSM
El origen de RSM es el papel seminal de Box y Wilson (1951). Tambin describen la
aplicacin de RSM a procesos qumicos. Este documento tuvo un profundo impacto en
las aplicaciones industriales del diseo experimental, y fue la motivacin de gran parte
de la investigacin en el campo. Muchos de los documentos clave de investigacin y
aplicaciones se citan en este libro.
Tambin se han publicado cinco artculos sobre RSM: Hill y Hunter (1966), Mead y
Pike (1975), Myers et al. (1989), Myers et al. (2004) y Anderson-Cook et al. (2009a). El
artculo de Myers (1999) sobre las futuras orientaciones en RSM ofrece una visin de
las necesidades de investigacin en el campo. Tambin hay otros dos libros completos
sobre el tema: Box y Draper (1987) y Khuri y Cornell (1996). Una segunda edicin del
libro de Box y Draper fue publicada en 2007 con un ttulo ligeramente diferente [Box y
Draper (2007)]. Un volumen editado por Khuri (2006) considera algunos temas
especializados de RSM. La monografa de Myers (1976) fue el primer libro dedicado
exclusivamente a RSM.
2.- CONSTRUIR MODELOS EMPIRICOS

2.1 MODELOS DE REGRESIN LINEAL


La aplicacin prctica de la metodologa de superficie de respuesta (RSM) requiere el
desarrollo de un modelo aproximado para la superficie de respuesta verdadera. La
superficie de respuesta verdadera subyacente es normalmente impulsada por algn
mecanismo fsico desconocido. El modelo de aproximacin se basa en datos observados
del proceso o sistema y es un modelo emprico. La regresin mltiple es una coleccin
de tcnicas estadsticas tiles para construir los tipos de modelos empricos requeridos
en RSM.
A modo de ejemplo, supongamos que deseamos desarrollar un modelo emprico que
relacione la vida til de una herramienta de corte con la velocidad de corte y el ngulo
de la herramienta. Un modelo de superficie de respuesta de primer orden que podra
describir esta relacin es

Donde y representa la vida til de la herramienta, x1 representa la velocidad de corte y


x2 representa el ngulo de la herramienta. Se trata de un modelo de regresin lineal
mltiple con dos variables independientes. A menudo llamamos a las variables
independientes predictor variables o regresores. El trmino "lineal" se usa porque la
Ecuacin 2.1 es una funcin lineal de los parmetros desconocidos 0, 1 y 2. El
modelo describe un plano en el espacio bidimensional x1, x2. El parmetro 0 fija la
interseccin del plano. A veces llamamos coeficientes de regresin parcial 1 y 2,
porque 1 mide el cambio esperado en y por unidad de cambio en x1 cuando x2 se
mantiene constante y 2 mide el cambio esperado en y por unidad de cambio en x2
cuando x1 se mantiene constante.
En general, la variable de respuesta y puede estar relacionada con k variables de
regresin. El modelo

Se denomina modelo de regresin lineal mltiple con k variables de regresin. Los


parmetros j, j = 0, 1, ..., k, se llaman coeficientes de regresin. Este modelo describe
un hiperplano en el espacio k-dimensional de las variables regresivas {xj}. El parmetro
j representa el cambio esperado en la respuesta y por unidad de cambio en xj cuando
todas las variables independientes restantes xi (i j) se mantienen constantes.
Los modelos que son ms complejos en apariencia que la Ecuacin 2.2 a menudo
pueden ser analizados por mltiples tcnicas de regresin lineal. Por ejemplo, considere
agregar un trmino de interaccin al modelo de primer orden en dos variables, digamos

X3 = x1 x2 y 3 = 12, entonces la ecuacin 2.3 se puede escribir como

Que es un modelo estndar de regresin lineal mltiple con tres regresores. Como otro
ejemplo, considere el modelo de superficie de respuesta de segundo orden en dos
variables:

Si dejamos que x3 = x1 2, x4 = x2 2, x5 = x1 x2, 3 = 11, 4 = 22 y 5 = 12,


entonces esto se convierte en

Que es un modelo de regresin lineal. En general, cualquier modelo de regresin que


sea lineal en los parmetros (los valores ) es un modelo de regresin lineal,
independientemente de la forma de la superficie de respuesta que genere.
En este captulo presentaremos e ilustraremos mtodos para estimar los parmetros en
modelos de regresin lineal mltiple. A menudo se denomina ajuste de modelo.
Tambin se discutirn mtodos para probar hiptesis y construir intervalos de confianza
para estos modelos, as como para verificar la adecuacin del ajuste del modelo.
Nuestro enfoque se centra principalmente en los aspectos del anlisis de regresin til
en RSM. Para presentaciones ms completas de regresin, consulte Montgomery, Peck
y Vining (2012) y Myers (1990).
2.2 ESTIMACIN DE LOS PARMETROS EN LOS MODELOS DE
REGRESIN LINEAL
El mtodo de mnimos cuadrados se utiliza tpicamente para estimar los coeficientes de
regresin en un modelo de regresin lineal mltiple. Supongamos que n> k
observaciones sobre la variable de respuesta estn disponibles, digamos y1, y2, ..., yn.
Junto con cada respuesta observada yi, tendremos una observacin sobre cada variable
regresora, y xij denotamos la i-sima observacin o nivel de la variable xj. La Tabla 2.1
muestra el diseo de los datos. Suponemos que el trmino de error en el modelo tiene
E () = 0 y Var () = 2 y que las {i} son variables aleatorias no correlacionadas.
Tabla 2.1 Datos para la regresin lineal mltiple

y x1 x2 xk

y1 x11 x12 x1k


y2 x21 x22 x2k

yn xn1 xn2 xnk

Podemos escribir la ecuacin del modelo (Ec. 2.2) en trminos de las observaciones en
la Tabla 2.1 como

El mtodo de los mnimos cuadrados elige los en la ecuacin 2.7 para que la suma de
los cuadrados de los errores, i, se minimice. La funcin de mnimos cuadrados es

La funcin L debe minimizarse con respecto a 0, 1, ..., k. Los estimadores de


mnimos cuadrados, digamos b0, b1, ..., bk, deben satisfacer

Donde j = 1, 2, ..., k. Simplificando la Ecuacin 2.9, obtenemos

Estas ecuaciones se llaman las ecuaciones normales de mnimos cuadrados. Obsrvese


que hay p = k + 1 ecuaciones normales, una para cada uno de los coeficientes de
regresin desconocidos. La solucin a las ecuaciones normales ser los estimadores de
mnimos cuadrados de los coeficientes de regresin b0, b1, ..., bk.
Es ms fcil resolver las ecuaciones normales si se expresan en notacin matricial.
Ahora damos un desarrollo matricial de las ecuaciones normales que es paralelo al
desarrollo de la Ecuacin 2.10. El modelo en trminos de las observaciones, Ecuacin
2.7, puede escribirse en notacin matricial como

dnde

En general, y es un vector n 1 de las observaciones, X es una matriz de modelo n p


que consiste en los niveles de las variables independientes expandidas a la forma del
modelo, es el vector p 1 de los coeficientes de regresin, y es un N 1 vector de
errores aleatorios. Observe que X consiste en las columnas que contienen las variables
independientes de la Tabla 2.1 ms una columna adicional de 1s para explicar el trmino
de interceptacin en el modelo.
Deseamos encontrar el vector de estimadores de mnimos cuadrados, b, que minimiza

Obsrvese que L puede expresarse como

Ya que 'X'y es una matriz 1 1, o un escalar, y su transposicin ('X'y) '= y'X es el


mismo escalar. Los estimadores de mnimos cuadrados deben satisfacer

lo que simplifica a

La ecuacin 2.12 es el conjunto de ecuaciones normales de mnimos cuadrados en


forma de matriz. Es idntica a la Ecuacin 2.10. Para resolver las ecuaciones normales,
multiplique ambos lados de la ecuacin 2.12 por la inversa de X'X. As, el estimador de
mnimos cuadrados de es

Es fcil ver que la forma matriz de las ecuaciones normales es idntica a la forma
escalar. Escribiendo la Ecuacin 2.12 en detalle, obtenemos
Si se realiza la multiplicacin matricial indicada, se obtendr la forma escalar de las
ecuaciones normales (es decir, la Ec. 2.10). En esta forma es fcil ver que X'X es una
matriz simtrica p p y X'y es un vector de columna p 1. Obsrvese la estructura
especial de la matriz X'X. Los elementos diagonales de X'X son las sumas de cuadrados
de los elementos en las columnas de X y los elementos fuera de la diagonal son las
sumas de productos cruzados de los elementos en las columnas de X. Adems, observe
que los elementos de X X'y son las sumas de productos cruzados de las columnas de X
y las observaciones {yi}.
El modelo de regresin ajustado es

En la notacin escalar, el modelo ajustado es

La diferencia entre la observacin yi y el valor ajustado i es un residuo, digamos ei =


yi - i. El vector n 1 de residuos es denotado por

Ejemplo 2.1 Los datos de ganancia del transistor. La ganancia del transistor en un
dispositivo de circuito integrado entre emisor y colector (hFE) se relaciona con dos
variables que pueden ser controladas en el proceso de deposicin, el tiempo de entrada
del emisor (1, en minutos) y Emisor (2, unidades de 1014 iones). Catorce muestras
fueron observadas despus de la deposicin, y los datos resultantes se muestran en la
Tabla 2.2. Vamos a ajustar un modelo de regresin lineal utilizando la ganancia como la
respuesta y el tiempo de emisin de emisin y la dosis de emisor como las variables de
regresin.
TABLA 2.2 Datos sobre la ganancia del transistor (y) para el ejemplo 2.1
1 (drive-in 2 (dose,
Observation time, minutes) 1014 ions) x1 x2 y (gain or hFE)
1 195 4.00 1 1 1004
2 255 4.00 1 1 1636
3 195 4.60 1 0.6667 852
4 255 4.60 1 0.6667 1506
5 225 4.20 0 0.4444 1272
6 225 4.10 0 0.7222 1270
7 225 4.60 0 0.6667 1269
8 195 4.30 1 0.1667 903
9 255 4.30 1 0.1667 1555
10 225 4.00 0 1 1260
11 225 4.70 0 0.9444 1146
12 225 4.30 0 0.1667 1276
13 225 4.72 0 1 1225
14 230 4.30 0.1667 0.1667 1321

Las columnas 2 y 3 del cuadro 2.2 muestran los valores unitarios reales o naturales de 1
y 2, mientras que las columnas 4 y 5 contienen valores de las correspondientes variables
codificadas x1 y x2, donde

Este esquema de codificacin es ampliamente utilizado en el ajuste de modelos de


regresin lineal, y resulta en todos los valores de x1 y x2 cayendo entre -1 y +1, como
se muestra en la Tabla 2.2.
Nos adaptamos al modelo

Utilizando las variables codificadas. La matriz modelo X y el vector y son

La matriz X'X es

Y el vector X'y es
La estimacin de mnimos cuadrados de es

El ajuste de mnimos cuadrados con los coeficientes de regresin reportados con un


decimal es

Esto se puede convertir en una ecuacin usando las variables naturales 1 y 2


sustituyendo las relaciones entre x1 y 1 y x2 y 2 como sigue:

Tabla 2.3 Observaciones, valores ajustados, residuos y otra informacin de resumen del ejemplo 2.1

Observacin yi y ei hii ri ti Di
1 1004.0 ii
973.7 30.3 0.367 1.092 1.103 0.231
2 1636.0 1620.5 15.5 0.358 0.553 0.535 0.057
3 852.0 882.4 30.4 0.317 1.052 1.057 0.171
4 1506.0 1529.2 23.2 0.310 0.801 0.787 0.096
5 1272.0 1266.7 5.3 0.092 0.160 0.153 0.001
6 1270.0 1281.9 11.9 0.133 0.365 0.350 0.007
7 1269.0 1205.8 63.2 0.148 1.960 2.316 0.222
8 903.0 928.0 25.0 0.243 0.823 0.810 0.072
9 1555.0 1574.9 19.9 0.235 0.651 0.633 0.043
10 1260.0 1297.1 37.1 0.197 1.185 1.209 0.115
11 1146.0 1190.6 44.6 0.217 1.442 1.527 0.192
12 1276.0 1251.4 24.6 0.073 0.730 0.714 0.014
13 1225.0 1187.5 37.5 0.233 1.225 1.256 0.152
14 1321.0 1305.3 15.7 0.077 0.466 0.449 0.006
La tabla 2.3 muestra los valores observados de yi, los correspondientes valores
ajustados i, y los residuos de este modelo. Hay varias otras cantidades dadas en esta
tabla que sern definidas y discutidas ms adelante. La figura 2.1 muestra la superficie
de respuesta ajustada y el grfico de contorno para este modelo. La superficie de
respuesta para la ganancia es un plano situado por encima del espacio de tiempo-dosis.

Figura 2.1 (a) Superficie de respuesta para la ganancia, Ejemplo 2.1. (B) El grfico de contornos de
ganancia.

Software de clculo de estadsticas se emplea generalmente para ajustar modelos de


regresin. La Tabla 2.4 y la Fig. 2.2 presentan parte de la salida de los datos de ganancia
del transistor en el Ejemplo 2.1 de JMP, un paquete de software ampliamente utilizado
que soporta la regresin, el diseo experimental y RSM. Este modelo se ajust a las
variables codificadas en la Tabla 2.2. La primera parte de la pantalla de la Fig. 2.2 es un
grfico de los valores de la respuesta observada y frente a los valores predichos i
(vase la figura 2.2a). Los pares (yi, i) se encuentran a lo largo de una lnea recta (la
lnea recta en el grfico es el resultado de un ajuste por mnimos cuadrados). Esto suele
ser una buena indicacin de que el modelo es un ajuste satisfactorio a los datos.
Discutiremos otros controles de la adecuacin del modelo ms adelante en este captulo.
Obsrvese que las estimaciones de los coeficientes de regresin coinciden con las que
hemos calculado manualmente (no es raro encontrar pequeas diferencias entre los
clculos de regresin de software manual y de computadora debido al redondeo). En las
secciones siguientes mostraremos cmo se obtienen algunas de las otras cantidades en la
salida y cmo interpretarlas.
Tabla 2.4 Produccin de regresin de JMP
Summary of Fit
R-Square 0.979835
R-Square Adj 0.976168
Root Mean Square Error 34.92553
Mean of Response 1249.643
Observations (or Sum Wgts) 14
Analysis of Variance

Source DF Sum of Squares Mean Square F-Ratio

Model 2 651969.49 325985 267.2460


Error 11 13417.72 1220 Prob > F
C. Total 13 665387.21 <0.0001

Parameter Estimates
Term Estimate Std Error t-Ratio Prob > |t|
Intercept 1242.3181 9.373196 132.54 <0.0001
x1 323.4253 14.22778 22.73 <0.0001
x2 54.77165 13.2001 4.15 0.0016

Figura 2.2 Salida de regresin de JMP. (A) Respuesta y modelo entero, real por grfica
pronosticada. (B) Residuales segn la grfica prevista.

2.3 PROPIEDADES DE LOS ESTIMADORES DE MENOS CUADRADOS Y


ESTIMACIN DE 2
El mtodo de mnimos cuadrados produce un estimador no sesgado del parmetro en
el modelo de regresin lineal mltiple. Esta propiedad se puede demostrar fcilmente
encontrando el valor esperado de b como sigue:

Porque E () = 0 y (X'X) -1 X'X = I. As b es un estimador imparcial de . La propiedad


de varianza de b se expresa por la matriz de covarianza

La matriz de covarianza de b es una matriz simtrica p p cuyo (j, j) simo elemento es


la varianza de bj y cuyo (i, j) simo elemento es la covarianza entre bi y bj. La matriz de
covarianza de b es

Tambin es necesario estimar 2. Para desarrollar un estimador de este parmetro se


considera la suma de cuadrados de los residuos, digamos
Sustituyendo e = y - y = y - Xb, tenemos

La ecuacin 2.17 se denomina error o suma residual de cuadrados, y tiene n - p grados


de libertad asociados con ella. Se puede demostrar que

Por lo que un estimador imparcial de 2 est dado por

Ejemplo 2.2 Los datos de ganancia del transistor Estimaremos 2 para el modelo de
regresin para los datos de ganancia del transistor del ejemplo 2.1. Porque

La suma residual de cuadrados es

Por lo tanto, la estimacin de 2 se calcula a partir de la ecuacin 2.18 como sigue:

Observe que la salida de JMP en la Tabla 2.4 calcula la suma residual de cuadrados
(mirar bajo la seccin de anlisis de varianza de la salida) como 13,417.72. La
diferencia entre los dos valores es round-off. Tanto los clculos manuales como JMP
producen estimaciones prcticamente idnticas de 2.
La estimacin de 2 producida por la ecuacin 2.18 depende del modelo. Es decir,
depende de la forma del modelo que se ajuste a los datos. Para ilustrar este punto,
supongamos que ajustamos un modelo cuadrtico a los datos de ganancia, digamos

En este modelo se puede demostrar que SSE = 12.479,8. Debido a que el nmero de
parmetros del modelo, p, es igual a 6, la estimacin de 2 basada en este modelo es

Esta estimacin de 2 es en realidad mayor que la estimacin obtenida del modelo de


primer orden, lo que sugiere que el modelo de primer orden es superior al cuadrtico en
que hay menos variabilidad no explicada resultante del ajuste de primer orden. Si se
dispone de repeticiones (es decir, ms de una observacin sobre y en los mismos niveles
x), entonces se puede obtener una estimacin independiente de modelo de 2.
Mostraremos cmo hacerlo en la Seccin 2.7.4.
2.4 PRUEBAS DE HIPTESIS EN REGRESIN MLTIPLE
En los problemas de regresin lineal mltiple, ciertas pruebas de hiptesis sobre los
parmetros del modelo son tiles para medir la utilidad del modelo. En esta seccin,
describimos varios procedimientos de prueba de hiptesis importantes. Estos
procedimientos requieren que los errores i en el modelo sean distribuidos normalmente
e independientemente con media cero y varianza 2, abreviada ~ NID (0, 2). Como
resultado de esta suposicin, las observaciones yi se distribuyen normalmente e
independientemente con la media y la varianza 2.
2.4.1 Prueba de la significacin de la regresin
La prueba de significacin de la regresin es una prueba para determinar si existe una
relacin lineal entre la variable de respuesta y y un subconjunto de las variables de
regresin x1, x2, ..., xk. Las hiptesis apropiadas son

El rechazo de H0 en la ecuacin 2.19 implica que al menos una de las variables de


regresin x1, x2, ..., xk contribuye significativamente al modelo. El procedimiento de
prueba implica dividir la suma total de cuadrados en una suma de
cuadrados debido al modelo (oa la regresin) y una suma de cuadrados debido a residual
(o error), digamos

S-ar putea să vă placă și