Documente Academic
Documente Profesional
Documente Cultură
Resumen
En este tutorial se explicarán los principales conceptos y aplicaciones del
diseño experimental en química. Desafortunadamente, en la actualidad
el diseño experimental no es tan conocido y aplicado como debería ser,
y se pueden encontrar muchos artículos en los que la "optimización" de
un procedimiento se realiza una variable a la vez. El objetivo de este
documento es mostrar las ventajas reales en términos de esfuerzo
experimental reducido y de mayor calidad de información que se puede
obtener si se sigue este enfoque. Para ello, se mostrarán tres ejemplos
reales. Más que en los aspectos matemáticos, este documento se
centrará en la actitud mental requerida por el diseño experimental. Los
lectores interesados en profundizar su conocimiento de la parte
matemática y algorítmica pueden encontrar muy buenos libros y
tutoriales en las referencias [GEP Box, WG Hunter, JS
Hunter, Estadísticas para experimentadores: Introducción al diseño,
análisis de datos y construcción de modelos, John Wiley & Sons, Nueva
York, 1978; R. Brereton, Quimometría: Análisis de datos para el
laboratorio y la planta química, John Wiley & Sons, Nueva York,
1978; R. Carlson, JE Carlson, Diseño y optimización en síntesis
orgánica: Segunda edición revisada y ampliada, en: Manejo de datos en
ciencia y tecnología, vol. 24, Elsevier, Amsterdam, 2005; JA Cornell,
Experiments with Mixtures: Designs, Models and the Analysis of
Mixture Data, en: Series in Probability and Statistics, John Wiley &
Sons, Nueva York, 1991; RE Bruns, IS Scarminio, B. de Barros Neto,
Diseño estadístico — Quimometría, en: Manejo de datos en ciencia y
tecnología, vol. 25, Elsevier, Amsterdam, 2006; DC Montgomery,
Diseño y Análisis de Experimentos, 7ª edición, John Wiley & Sons, Inc.,
2009; T. Lundstedt, E. Seifert, L. Abramo, B. Thelin, Å. Nyström, J.
Pettersen, R. Bergman, Chemolab 42 (1998) 3; Y. Vander Heyden, LC –
GC Europe 19 (9) (2006) 469].
Introsducion
Como siempre lo hizo, comenzó realizando el experimento "más barato" (40 grados,
20 min), con un rendimiento del 20,6%. Entonces, para ahorrar tiempo, mantuvo el
tiempo constante a los 20 minutos y comenzó a aumentar la temperatura: a 50
grados el rendimiento era del 32,3%, a 60 grados era 39.9%, a 70 grados fue 43.5%,
a 80 grados fue 43.0%. Ya que el rendimiento a 80 grados fue menor que a 70 grados,
este significado Que la mejor temperatura fue inferior a 80 grados, realizó.
un nuevo experimento a 75 grados, con un rendimiento del 43.7%, que fue
El más alto hasta entonces obtenido. Por lo tanto, concluyó que los mejores
La temperatura había sido encontrada y que podía mantenerla constante.
Y comenzó a cambiar el tiempo de reacción. Esto lo llevó a hacer los siguientes
experimentos, todos ellos a una temperatura de 75 grados:
30 min (50,2%), 40 min (52,1%), 50 min (49,5%). Dado que el rendimiento en
50 minutos fue menor que a los 40 minutos, lo que significa que el mejor momento
fue inferior a 50 min, realizó un nuevo experimento a los 45 min, Con un
rendimiento del 51,4%. Así, el mejor tiempo de reacción fue de 40 min.
El hombre terminó su trabajo y quedó muy satisfecho: ya que había optimizado a la
primera temperatura y luego a la hora, estaba bastante seguro de que
Había encontrado las mejores condiciones: cuando trabajaba a 75 grados con
un tiempo de reacción de 40 minutos se obtuvo un rendimiento de 52.1%, que fue
El mayor rendimiento posible. Todo el proceso requirió un total de diez.
experimentos Entonces, convertirse en el nuevo Príncipe había sido bastante fácil ...
Pero entonces un segundo hombre fue al rey. Él era un hombre joven,
No tan famoso como el primero, sin ninguna experiencia directa de eso.
Tabla 1
Interacciones
Desafortunadamente, la gran mayoría de la gente se comporta como la
Primer “experto” de la historia. Al navegar por los documentos publicados en
Analytica Chimica Acta en 2009 (del volumen 631 al
volumen 645, más los documentos disponibles en la sección “Artículos en
prensa” el 3 de junio de 2009), encontré 165 de ellos con el título general
o un título de sección que contenga las palabras "optimización" o "desarrollo",
o "mejora", o "efecto de". Sólo en 11 artículos (es decir,
uno de cada 15 ...) se ha seguido un enfoque multivariado, mientras que
En la gran mayoría de ellos se realizó la “optimización”.
una variable a la vez, a veces con los títulos de las subsecciones
remarcándolo con orgullo ("3.1. Efecto del pH", "3.2. Efecto de la
temperatura", "3.3. Efecto del flujo", y así sucesivamente ...). Cinco de ellos [9-
13] tienen publicado en la sección “Extracción y manejo de muestras”,
dos [14,15] en la sección "Quimometría", dos [16,17] en la sección
"Electroquímica" y dos [18,19] en la sección "Separación
métodos ".
Como la historia ha demostrado, la "optimización" realizó OVAT
(Una variable a la vez) no garantiza en absoluto que se alcance el óptimo real.
Esto porque este enfoque solo sería válido si Las variables a optimizar serían
totalmente independientes de El uno al otro.
Modelado
Ecuación 1 y fig 1
Una empresa química producía un polímero, cuya viscosidad tenía que ser>
46.0 × 103 mPa s. Como consecuencia de la variación.
de una materia prima, obtuvieron un producto final bastante diferente de
El producto “original” (producido desde hace varios años), con
Una viscosidad por debajo del valor aceptable. Por supuesto, esta fue una muy
Gran problema para la empresa, ya que el producto no pudo ser vendido.
nunca más. La persona encargada del producto comenzó a actuar.
experimentos OVAT, pero después de unos treinta experimentos no pudo
Encuentra cualquier solución aceptable.
Una joven, que acababa de seguir un curso de tres días en diseño
experimental, decidió tratar de aplicar a este problema específico lo que
ella había aprendido
Al principio, detectó tres variables que podrían haber sido relevantes: eran
las cantidades de tres reactivos (llamémoslos A, B
y C). La formulación original fue de 10 g de A, 4 g de B y 10 g de C.
Decidió mantener este escenario experimental como punto de partida y
Para explorar sus alrededores. Dado que el número de experimentos posibles
era bastante limitado, decidió aplicar un Diseño Factorial 23,
Se requiere un total de ocho experimentos.
Tabla 2
Los diseños factoriales 2k son el diseño más simple posible, que requieren
una cantidad de experimentos igual a 2k, donde k es el número de
Variables en estudio. En estos diseños, cada variable tiene dos niveles,
codificados como −1 y +1, y las variables pueden ser cuantitativas
(por ejemplo, temperatura, presión, cantidad de un ingrediente) o cualitativo
(por ejemplo, tipo de catalizador, tipo de aparato, secuencia de operaciones).
La matriz experimental se reporta en la Tabla 2, y puede verse
que es bastante fácil de construir (no se requiere software!). La matriz
tiene ocho filas (23, cada fila correspondiente a un experimento) y
3 columnas (cada columna correspondiente a una variable); en el primero
la columna −1 y +1 se alternan en cada fila, en la segunda columna
alternan cada segunda fila, en la tercera columna alternan
cada cuarta fila El mismo procedimiento se puede utilizar para construir
cualquier
Diseño factorial, sea cual sea el número de variables.
Desde un punto de vista geométrico, como se muestra en la Fig. 3, un factorial
el diseño explora las esquinas de un cubo (si las variables son más
de tres será un hipercubo; nuestra mente ya no podrá
visualizarlo, pero desde el punto de vista matemático nada lo hará.
cambio).
Contrariamente a lo que sucede en el enfoque OVAT, en el cual la variable 1
se cambia mientras que las variables 2 y 3 se mantienen constantes, en el
La variable de diseños factoriales 1 se cambia mientras que las variables 2 y
3 tienen Valores diferentes (por supuesto, lo mismo ocurre con todas las
variables).
Esto significa que el diseño factorial es adecuado para estimar la
interacciones entre variables (es decir, la diferencia en el cambio de la
variable 1 cuando la variable 2 está en su nivel más alto o en su nivel más bajo,
y pronto).
El modelo matemático es por lo tanto el siguiente:
Ecuación 2
Figura 3 y tabla 3
El siguiente paso fue definir los niveles de las variables y
Anote el plan experimental.
Como se dijo antes, ella decidió mantener la receta original como centro
apunte y establezca los niveles −1 y +1 de cada variable simétricamente
al valor original (9 y 11 para los reactivos A y C, 3.6 y 4.4 para
Reactivo B), esto conduce al plan experimental reportado en la Tabla 3.
Como puede verse, mientras que la matriz experimental contiene el código
codificado.
valores (−1 y +1), el plan experimental informa los valores reales de
Las variables y por lo tanto pueden ser entendidas por cualquiera.
Después de haber realizado los ocho experimentos (en orden aleatorio,
no introducir efectos sistemáticos no deseados) y haber grabado
las respuestas, quedó inmediatamente claro que en varios casos la
¡La viscosidad fue mucho más alta que el valor mínimo aceptable!
¿Cómo fue posible no haber encontrado esas soluciones en más de
30 experimentos previos?
Para computar los coeficientes, debemos partir de lo experimental.
Matriz a la matriz del modelo (Tabla 4). Mientras que el primero tiene tantos
filas como experimentos y tantas columnas como variables, la última
tiene tantas filas como experimentos y tantas columnas como coeficientes y
se puede obtener fácilmente de la siguiente manera: la primera
la columna (b0) es una columna de +1, las columnas de los términos lineales
son
Al igual que la matriz experimental, las columnas de las interacciones se
obtienen mediante un producto punto a punto de las columnas de la
términos lineales de las variables involucradas en la interacción (por ejemplo,
la Se obtiene la columna b12 de la interacción entre las variables 1 y 2.
multiplicando punto a punto la columna b1 por la columna b2).
Calcular los coeficientes es muy simple (de nuevo, no hay software
¡necesario!). Para cada uno de ellos, multiplica punto a punto la columna.
correspondiente al coeficiente que debe ser estimado por el
columna de la respuesta, y luego tomar el promedio de los resultados.
Por ejemplo, para estimar b1 (el término lineal de X1), simplemente haga
(−51.8 + 51.6 - 51.0 + 42.4 - 50.2 + 46.6 - 52.0 + 50.0) / 8 = −1.8.
Una cosa interesante de notar es que, ya que cada columna de
La matriz del modelo tiene cuatro -1 y cuatro +1, cada coeficiente será
computarse como la mitad de la diferencia entre el promedio de la
Cuatro experimentos con signo positivo y la media de los cuatro.
Experimentos con signo negativo. Esto significa que cada coeficiente es
computado con la misma precisión, y que esta precisión, siendo
La diferencia de dos promedios de cuatro valores, es mucho mejor que
la de un experimento OVAT, donde la diferencia entre dos
experimentos (uno realizado a un nivel superior y uno realizado
en el nivel inferior) se suele calcular. Una vez más, se puede ver.
Tabla 4 y figura 4
Escuacion
Dado que se han estimado ocho coeficientes con ocho experimentos (y, por lo
tanto, no hay grados de libertad disponibles) y desde
La variabilidad experimental que se desconoce es imposible de definir.
Una significación estadística de los coeficientes. De todos modos, los de la
término lineal de X1 (Reactivo A) y la interacción X2 – X3 (Reactivo
B – Reactivo C) tiene valores absolutos mayores que los otros.
El gran coeficiente de X1 indica que al aumentar el
cantidad de Reactivo A se obtiene una disminución de la viscosidad (la
el signo del coeficiente es negativo), y por lo tanto se obtienen mejores
resultados
Se obtiene reduciendo su cantidad. Dado que X1 no está involucrado en
ningún
interacción relevante, podemos concluir que este efecto está presente
cualesquiera que sean los valores de los otros dos reactivos.
En lo que concierne a la interacción Reactivo B – Reactivo C, puede
solo se interpretará mirando la superficie de respuesta mostrada en
Fig. 4. Dado que estamos trazando la respuesta en el plano definido por
dos variables (piense en una rebanada del cubo representado en la Fig. 3),
nosotros
debemos definir el nivel de la variable 1 en el que queremos representar el
respuesta (es decir, donde cortar la rebanada ...). El efecto claro del reactivo.
A (cuanto más bajo, mejor), nos lleva a la elección de establecer el valor
de X1 en su nivel inferior (−1, correspondiente a 9 g).
La forma geométrica de un modelo lineal sin interacciones es.
Un plano (las líneas de isorrespuesta son paralelas); si hay interacciones
relevantes
están presentes, entonces se convierte en un plano distorsionado (las líneas
isoresponse no son paralelos). Este es el caso de la superficie de respuesta en
el plano Reactivo B – Reactivo C. Al observar la trama, se puede ver
que un aumento del Reactivo B disminuye la viscosidad cuando el Reactivo C
está en su nivel más bajo, mientras que tiene el efecto opuesto cuando el
Reactivo C está en su nivel más alto. Del mismo modo, un aumento de Reactivo
C.
disminuye la viscosidad cuando el Reactivo B está en su nivel más bajo,
mientras que tiene el efecto opuesto cuando el Reactivo B está en su nivel más
alto.
En cuanto a la trama, también se puede entender por qué el OVAT
El enfoque no produjo ningún buen resultado. Si vas al centro
Punto (correspondiente a la formulación original) y se cambia
la cantidad de Reactivo B o Reactivo C (pero no ambos en
al mismo tiempo!), este significado se mueve en paralelo a los ejes, te darás
cuenta de que, cualquier experimento que hagas, nada lo hará.
cambio. En cambio, debido a la fuerte interacción, solo tienes
variaciones relevantes cuando cambias ambas variables al mismo tiempo
hora
Una empresa tenía que encontrar las mejores condiciones operativas para un
carbón.
molino. Se estudiaron dos variables: la carga del molino (toneladas h − 1)
y la posición del clasificador (una cortina que cierra parcialmente el molino).
De los conocimientos previos, se sabía que ambas variables tenían
un comportamiento cuadrático y por lo tanto un modelo que contiene
también la
Se necesitaban términos cuadráticos. Por este motivo no fue posible.
usar el diseño factorial mostrado en el ejemplo anterior, ya que,
teniendo cada variable solo dos niveles, no es conveniente estimar
Los términos cuadráticos.
Luego se decidió utilizar un diseño centrado en la cara (el mismo
utilizado por el futuro Príncipe), con la matriz experimental reportada
en la tabla 5.
También en este caso, construir la matriz experimental es muy simple.
Teniendo k variables, los primeros 2k experimentos son los mismos que para
un
Diseño factorial. Entonces, los siguientes 2xk experimentos se obtienen por
Tabla 5
ecuación
Figura 5 y figura 6
Para cada experimento, se midieron dos respuestas: el porcentaje de
partículas "pequeñas" (con un diámetro <200 malla) y el
porcentaje de partículas “grandes” (con un diámetro> 50 mallas) (ver
Tabla 5). El objetivo del estudio fue encontrar las condiciones operativas.
dando lugar a un producto de calidad aceptable (Y1> 70 e Y2 <1).
Al comparar este estudio con los anteriores, podemos detectar
inmediatamente dos diferencias relevantes:
• Se estudia más de una respuesta, lo que significa que debemos
mire a todos al mismo tiempo, encontrando el mejor compromiso;
• En lugar de buscar las "mejores" condiciones, estamos interesados en
identificar la región del dominio experimental correspondiente a un producto
de calidad "aceptable"; dentro de esta región el
Se seleccionará la configuración más rentable (en nuestro caso, la que
corresponde a la carga más alta).
Se han obtenido los siguientes modelos:
Escuaiones 1, 2
Figura 7
tres puntos centrales (es decir, dos experimentos más) un plano muy ancho
Se habría obtenido la región. Por supuesto, al diseñar un conjunto de
Experimenta el mejor compromiso entre calidad de información.
Y se debe buscar esfuerzo experimental. Dos experimentos mas
habría mejorado nuestro diseño, pero habría valido la pena realizarlos (es
decir, cuál habría sido el costo adicional en
términos de tiempo y dinero)? Esta es una decisión que solo la gente.
En cargo del problema específico puede tomar!
La Fig. 9 muestra las gráficas de la semiamplitud del intervalo de confianza
del 95% para cada una de las dos respuestas. Estas parcelas, derivadas
De la trama del apalancamiento, son mucho más fáciles de interpretar.
Ya que dan una idea directa de la incertidumbre de lo previsto.
valor. Entonces, podemos ver inmediatamente que para la primera respuesta
el
la incertidumbre está entre aproximadamente ± 2 y aproximadamente ± 3,
mientras que para el segundo
La respuesta está en el rango ± 0.1– ± 0.2. Es muy importante darse cuenta.
que el intervalo de confianza cambia de acuerdo con la posición en
El dominio experimental y su forma dependen de la distribución de los
experimentos en el dominio experimental. De nuevo, que es
¡Lo importante es qué experimentos se realizan, no cuántos!
Para cualquier punto del dominio experimental tanto el predicho como el
Se conocen las respuestas y sus intervalos de confianza. Esto nos permite
para dibujar las parcelas reportadas en la Fig. 10. Como se esperaba, las
regiones en
lo que es "seguro" para trabajar son un poco más reducidos que cuando
figura 10
disminuir bastante rapido Así, por ejemplo, cuando se trabaja con una carga
de
12 toneladas h − 1 y el clasificador en la posición 2.4 (70% abierto), el
porcentaje de partículas grandes disminuirá a no más del 0.4%, y
por lo tanto la calidad del producto será mucho mayor.
Ahora, la pregunta es: ¿vale la pena producir 2 toneladas h − 1 menos?
¿Para tener tal aumento en la calidad del producto? Por supuesto,
Nadie más que la persona a cargo de la planta puede responder.
Esto muestra cómo el diseño experimental da muy buenas herramientas de
fabricación.
más fácil de entender el problema; De todos modos, la decisión final debe
confiar en una base practica
Diseño de la mezcla
figura 12
Ecuación
Tabla 6
Ecuación
Se puede observar que los coeficientes de los términos lineales corresponden.
A la respuesta obtenida con los componentes puros.
Los coeficientes de las interacciones de dos términos indican el efecto
sinérgico de los dos componentes. En el ejemplo descrito arriba,
el experimento con X1 puro dio una respuesta de 31, mientras que el
experimento con X2 puro dio una respuesta de 113. Si no hay efecto sinérgico
estaría presente, la mezcla hecha por 0.5 X1 y 0.5 X2
Da una respuesta de 72 (el promedio de 31 y 113). La respuesta de
esta mezcla es en cambio 42 (30 unidades menos), lo que significa que un
negativo
El efecto sinérgico está presente. Esto se puede encontrar en el término X1X2,
cuyo
coeficiente es −120. Se puede observar que la magnitud de la sinergia
Los efectos de las mezclas de dos componentes están dados por los
coeficientes.
dividido por 4.
De la misma manera, el coeficiente de la interacción de tres términos,
dividido por 27, corresponde a la magnitud del efecto sinérgico
de los tres componentes (esta es la razón por la cual los coeficientes de
las interacciones superiores suelen ser muy grandes).
A partir de la gráfica de isorrespuesta mostrada en la Fig. 13 se puede ver que
X2 tiene el mayor efecto en Y1 (carga de rotura). Para entender el
El efecto de cada variable debe seguir cómo cambia la respuesta.
al pasar de una composición sin ese componente a la
Componente puro (sin cambiar las cantidades relativas de la
otros componentes). En la parcela, comienza desde el centro del borde.
opuesto al componente en estudio (es decir, una mezcla hecha por
Los dos componentes restantes, al 50% cada uno) y van al vértice.
Representando el componente puro. En el caso de X2, la respuesta en
el punto de partida (sin X2) es 39, y luego continúa aumentando bastante
Regularmente hasta 113 para X2 puro.
Al hacer lo mismo con X1, se puede ver que tiene un efecto negativo:
la respuesta es 70 sin él, y luego disminuye regularmente a
31 para X1 puro.
X3 es el componente con el efecto más bajo y, debido a la
Interacción de tres componentes, tiene un comportamiento diferente: inicio.
de 42 para la mezcla hecha por 50% X1 y 50% X2, se reduce a
38 para X3 puro, pero la adición de X3 al principio aumenta la respuesta
(hasta 60 para la mezcla realizada en un 33,3% de cada uno de los
componentes),
luego lo disminuye.
El modelo para la segunda respuesta es:
Ecucacion
Al observar los coeficientes de las interacciones podemos entender
que el efecto sinérgico más fuerte es la sinergia positiva entre
X1 y X3. Al observar la gráfica de isorrespuesta de la Fig. 13, puede ser
Visto que la respuesta más alta corresponde a la mezcla hecha.
aproximadamente un 50% de X1 y un 50% de X3.
También para esta respuesta X2 es el componente con la mayor
efecto, ya que la respuesta disminuye de 67 (no X2) a 26 (puro
X2). Al comenzar a agregar X1, la respuesta aumenta de 30 hasta
más de 55 (aproximadamente 50% de X1), luego disminuye a 44
(X1 puro). X3 es el componente con el menor efecto, ya que el
la respuesta va desde 41 (sin X3) hasta aproximadamente 50
(aproximadamente 20%).
de X3), para permanecer casi constante hasta el X3 puro, teniendo una
respuesta de
52.
En los diseños experimentales para variables independientes vimos.
que el efecto de los factores y la importancia relativa de los términos se
pueden entender de inmediato con solo mirar el modelo
(cuanto mayor sea el coeficiente, más importante es el término)
Figura 13
Figura 14
Esta es la razón por la cual el número de componentes bajo estudio
en una mezcla de diseño por lo general no es superior a cuatro. En caso de un
Sistema más complejo, se sugiere dividir todo el dominio.
en dos o más subdominios, cada uno de ellos con un "aceptable"
Número de componentes, y luego estudiar cada uno de ellos por separado.
Por supuesto, al hacerlo, uno tiene que darse cuenta de que las interacciones
entre
los componentes de los diferentes subdominios no pueden ser estudiados,
pero
Este es el precio a pagar para aumentar la comprensibilidad.
de todo el sistema.
De vuelta a nuestro problema, la compañía farmacéutica estaba buscando.
para el mejor compromiso, con un valor mínimo aceptable de 50 para
Ambas respuestas. Como se esperaba, y como se muestra por las superficies
de respuesta,
Las dos respuestas tienen un comportamiento opuesto, y cuando una de ellas
Se incrementa el otro se disminuye.
La figura 14 muestra la región de aceptabilidad conjunta. Ya que es totalmente
interno al dominio, entonces solo las mezclas ternarias pueden producir
Resultados aceptables. El productor puede seleccionar la formulación más
conveniente sobre la base de las respuestas, pero también teniendo en cuenta
El precio de cada uno de los componentes.
Cabe destacar que, aparte de la industria farmacéutica,
Los diseños de mezclas son extremadamente importantes en muchos campos,
tales como
productos alimenticios (por ejemplo, formulación de una nueva receta),
bebidas (por ejemplo,
formulación de una mezcla), pinturas (por ejemplo, formulación de una
pintura),
Optimización del método (por ejemplo, fase móvil óptima para HPLC).
Conclusiones
Las aplicaciones descritas en este documento muestran claramente la
superioridad del diseño experimental en comparación con el OVAT "clásico"
enfoque. A pesar de que sus ventajas son bien conocidas.
y reconocido desde hace más de 70 años [21], el diseño experimental todavía
se aplica solo en una minoría muy pequeña de los casos
en el que podría (y debería) ser utilizado.
Por lo tanto, uno de los principales esfuerzos de la comunidad quimiométrica
debe ser hacerlo tan conocido y comprensible como
posible, de tal manera que podría convertirse en la forma estándar de
operando.
Es bien sabido que el OVAT no es en absoluto la forma correcta de
realizar una optimización o estudiar el efecto de varias variables,
Como no tiene en cuenta las interacciones entre las variables, solo
proporciona un conocimiento local del fenómeno y, a menudo,
requiere un esfuerzo experimental mucho mayor; por lo tanto, sería
Es recomendable que las principales revistas no acepten más artículos.
en el que el enfoque OVAT se realiza cuando un experimental
El diseño debe ser aplicado en su lugar.