DISEÑO EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON ...
Transcript of DISEÑO EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON ...
3 - METODOLOGÍA DE LA SUPERFICIE DE RESPUESTA (RSM)
M.S Cámara – M.M. De Zan – L. Vera Candioti – H. Goicoechea
2016
DISEÑO EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON MÚLTIPLES RESPUESTAS
Conocer el funcionamiento de un sistema o proceso.
Encontrar las condiciones óptimas de funcionamiento.
Mejoras en costo, tiempo, eficiencia, productividad y /o calidad.
Conocimiento del sistema
Mejora de la calidad
Metodología de la superficie de respuesta (MSR)
Desarrollo teórico y primeras aplicaciones (década 1990)
o Box y Draper (1987) o Cornell (1991) o Montgomery y Myers (1996) o Araujo y Brereton (1996)
Aplicaciones en expansión (softwares comerciales)
o Procesos de fabricación industrial oQuímica oFarmacéutica oBiotecnologica
JMP-IN MINITAB STATISTICA STATGRAPHICS
DESIGN-EXPERT oAlimenticia oMetalúrgica oElectrónica
Originada por el trabajo de Box y Wilson (1951) Box, G. E. P., Wilson, K. G. (1951),“On the experimental attainment of
optimum conditions”, Journal of the Royal Statistical Society, B 13, 1-45
Metodología de la superficie de respuesta (MSR)
),( 21 xxfy
RESPUESTA
Analizar el comportamiento de una
x1 x2
Conjunto de técnicas matemáticas y estadísticas
MODELO Construir un
Datos experimentales
niveles
OPTIMIZAR DISEÑO DE
EXPERIMENTOS
Metodología de la superficie de respuesta (MSR)
Encontrar el
ÓPTIMO
Representación Gráfica del Modelo
),( 21 xxfy
Metodología de la superficie de respuesta (MSR)
Graficas de Contorno y Superficie de Respuesta P
rod
ucc
ión
de
alm
en
dra
s
Respuesta en el espacio
tridimensional para la
producción de almendras en función de los
fertilizantes utilizados
Gráficos de la MSR
Pro
du
cció
n d
e a
lme
nd
ras
Gráficas de Contorno y Superficie de Respuesta
Cada línea de contorno está formada por
todas las combinaciones de los factores que producen
una misma respuesta
Gráficos de la MSR
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
Gráfica de Contorno
Gráficos de la MSR
Gráfica de contornos
Superficie de Respuesta
Líneas de Isorespuesta
Óptimo de la Respuesta
Niveles óptimos de las variables
Gráficos de la MSR
Producción
Surfactante Factores Significativos
1 Temperatura 20- 60 ºC
2 Tiempo de incubación 24-48 hs
¡Optimizar el rendimiento!
Rangos
Experimentos exploratorios
Selección de factores
Buscando las mejores condiciones…
T (°C) Tpo (Hs) R (g/L)
20 24 20.6
24 24 26.1
28 24 32.0
32 24 36.3
36 24 39.2
40 24 42.0
44 24 42.9
48 24 43.8
52 24 42.5
56 24 41.2
Variaciones de temperatura
Condiciones óptimas de temperatura
T= 48° R= 43.8 g/L
Temperatura (ºC)
Ren
dim
ien
to
Grafica de respuesta univariada
Valor óptimo de temperatura
Sección transversal de la superficie de respuesta
ESTRATEGIA “OVAT”
Optimización univariada
T (°C) Tpo (Hs) R (g/L)
48 24 43.8
48 28 47.8
48 32 50.6
48 36 50.8
48 40 49.2
48 44 45.6
Variaciones de tiempo
R= 50.8 g/L
Condiciones óptimas
de tiempo a 48ºC
Tpo= 36 hs Tiempo (horas)
Re
nd
imie
nto
Grafica de respuesta univariada
Valor óptimo de tiempo
ESTRATEGIA “OVAT”
Sección transversal de la superficie de respuesta 16 experimentos sucesivos: varios días de trabajo
(se pueden hacer en simultáneo en bloques)
Optimización univariada
Variaciones simultáneas de tiempo y temperatura
T (°C) Tpo (Hs) R (g/L)
20 24 20.6
20 36 44.9
20 48 51.0
35 24 39.9
35 36 54.9
35 48 52.1
50 24 43.0
50 36 49.1
50 48 37.0
Predicción del óptimo por modelado:
Rendimiento = 56.2 g/L T= 34°, Tiempo= 40 hs
Re
nd
imie
nto
Valor óptimo de tiempo y temperatura
Grafica de superficie de respuesta
9 experimentos menor trabajo
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
mínimo
máximo
Design-Expert® Softw are
Area NAPRO
2.17954E+006
1.18672E+006
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 0.94
2.00 3.25 4.50 5.75 7.00
900.00
1000.00
1100.00
1200.00
1300.00Area NAPRO
1.25639E+006
1.25639E+006
1.5569E+006
1.5569E+006
1.85741E+006
1.85741E+006
2.15791E+006
2.45842E+006
1.62857E+006
1.62857E+006
1.72323E+006
1.72323E+006
1.41702E+006
1.41702E+006
Tiem
po
(ho
ras)
Grafica de contorno
Temperatura (ºC)
X 1 X 3
X 2
X 1 constante
X 1 X 2
X 3
X 2 constante X 3 constante
),....,( 1 kxxfy
Una misma RESPUESTA puede depender de más de dos factores
Técnicas de optimización
¿Cuál es el óptimo?
MSR y optimización
Design-Expert® Softw are
Area SUL
513107
333539
X1 = B: Stirring rate
X2 = C: adición sal
Actual Factor
A: pH muestra = 7.00
900.00 1000.00 1100.00 1200.00 1300.00
0.18
0.63
1.09
1.55
2.00Area SUL
320153
369177
418200
467223
516246
10.965
15.847
9.732
7.921
5.396
Design-Expert® Softw are
Area CBZ
Design Points
205584
153080
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 1.66
1.00 2.75 4.50 6.25 8.00
800.00
950.00
1100.00
1250.00
1400.00
187103
190356
193610
196863
20011680.61
60.20
45.89
30.94
15.53
Design-Expert® Softw are
Area PIR
239736
163579
X1 = A: pH muestra
X2 = C: adición sal
Actual Factor
B: Stirring rate = 1116.22
2.00 3.25 4.50 5.75 7.00
0.18
0.63
1.09
1.55
2.00Area PIR
168276
183461
198646
213831
229016160.09
120.74
89.61
59.75
30.84
El comportamiento óptimo de un SISTEMA puede depender de más
de una RESPUESTA.
Respuesta 1 Respuesta 3 Respuesta 2
Técnicas de optimización de respuestas múltiples
¿Cuál es el óptimo global?
Creación de un Diseño de Experimentos Ajuste de un Modelo Utilización de una Técnica de Optimización
Explorar el modelo para obtener información sobre el óptimo
Requerimientos de la MSR
Diseño Modelo
No se le puede exigir al diseño más información de la que puede brindar
• Para construir un modelo se necesitan como mínimo la misma cantidad de puntos experimentales diferentes que coeficientes a estimar.
• Para evaluar la falta de ajuste se deben incluir repeticiones de un punto del diseño
22 121222110 xxxy
22 + pcentral
22 + pcentral + paxiales
curvaturaxxxy 121222110
2222
2111121222110 xxxxxy
? o ¿ 2222
2111 xx
Diseños y modelos matemáticos para la MSR
CONSTRUCCIÓN DE UN MODELO
Experimentos para optimizar la extracción de un alcaloide
pH (X1)
Temperatura (X2)
mg/g (y)
0 -1 43
-1 1 65
1 0 49
0 1 69
-1 -1 21
1 -1 43
1 1 62
-1 0 45
0 0 57
0 0 54
0 0 61
0 0 57
Lineal y= 52.2 + 3.8 x1
+ 14.8 x2
Lineal con Interacción y= 52.2 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
Cuadrático y= 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2 - 0.2 (x2)2
Construcción del Modelo
Modelo SC gl MC F0 p (Ft >F0) R2aj
LINEAL 0.70
Regresión 1408 2 704.2 13.6 0.001 significativa
Error Residual 465.3 9 51.7
FAj 440.6 6 73.4 8.9 0.039 significativa
INTERACCION 0.77
Regresión 1565 3 521.5 13.5 0.002 significativa
Error Residual 309.1 8 38.6
FAj 284.3 5 56.87 6.8 0.070 en el límite
CUADRATICO 0.95
Regresión 1826 5 365.2 46.0 <0.001 significativa
Error Residual 47.9 6 7.9
FAj 22.8 3 761 0.91 0.526 no significativa
Error Puro 24.8 3 8.2
Elegir Modelo: mayor F0 de regresión menor F0 de Falta Ajuste mayor R2
aj
Evaluación del Modelo (ANOVA)
Pruebas de Hipótesis para los coeficientes del modelo
Modelo Cuadrático Completo
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2 - 0.2 (x2)2
¿Todos los términos son significativos? ¿Todos son importantes? ¿Todos aportan información?
Las Hipótesis que hay que probar son: 0 i 1 iH : 0 H : 0
i
0 0.05,k,n k 1
E
CMF F
CM
Significancia del Coeficiente:
i0 0.05,2,n k 1
E
ˆt t
CM
Evaluación del los Coeficientes
Modelo completo
Utilizar el modelo más simple que describa el comportamiento del
sistema
MODELO CUADRÁTICO
SC gl MC F0 p (Ft >F0)
Regresión 1826 5 365.2 46.0 <0.001
x1 88.2 1 88.2 11.1 0.016
x2 1320 1 1320 166 <0.001
x1 x2 156 1 156 19.7 0.004
(x1)2 228 1 228 28.8 0.002
(x2)2 0.17 1 0.17 0.02 0.889
Residual 47.9 6 7.9
LOF 22.8 3 761 0.91 0.526
Error Puro 24.8 3 8.2
Variable no significativa
Eliminar del modelo
Evaluación del los Coeficientes
Principio de
Parsimonia
Manual Eliminación Backward Modelo Completo Modelo Depurado
Adición Forward Modelo Reducido Modelo Depurado
Técnicas para depurar los Modelos
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2 - 0.2 (x2)2
CATEGORÍA DE LOS MODELOS
Modelo Completo Modelo Jerárquico Modelo Reducido y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
y = 38.9 + 13.3 x1
- 0.3 x2
+ 0.1 x1 x2
- 9.2 (x1)2 - 1.2 (x2)2
y = 38.9 + 13.3 x1
- 9.2 (x1)2 - 1.2 (x2)2
y = 38.9 + 13.3 x1
- 0.3 x2
- 9.2 (x1)2 - 1.2 (x2)2
Un Modelo es Jerárquico cuando contiene todos los términos más simples que componen los términos de mayor orden que están en el modelo. Los modelos
jerárquicos tienen un comportamiento más estable que los no jerárquicos.
Se conserva el término de
primer orden
Categoría de los Modelos
00
k
i ii
y x
MODELO LINEAL o de PRIMER ORDEN
coeficiente del modelo que afecta al factor i ïx
0 término constante
Design-Expert® Software
T (A)1.51
0.77
X1 = B: pHX2 = C: Temp
Actual FactorsA: Apareante = 15.00D: Acetato = 60.00
3.000
3.250
3.500
3.750
4.000
25.00
28.75
32.50
36.25
40.00
1.090
1.123
1.155
1.188
1.220
R
esp
ue
sta
X2 X1
Para dos factores este modelo tiene 3 términos
Para k> 2 es un hiperplano
Modelos matemáticos para la MSR
00
k
i i ij i ji i j
y x x x
MODELO LINEAL CON INTERACCIÓN
coeficiente de interacción entre el factor y el factor ij ï jx x
Para dos factores este modelo tiene 4 términos
Design-Expert® Software
R (A)13.232
0.985
X1 = A: ApareanteX2 = D: Acetato
Actual FactorsB: pH = 3.500C: Temp = 32.50
12.00
16.50
21.00
25.50
30.00
20.00
52.50
85.00
117.5
150.0
0.0000
6.250
12.50
18.75
25.00
R
esp
ue
sta
X2 X1
Puede verse como X2 tiene distinto comportamiento
según X1
Modelos matemáticos para la MSR
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
MODELO CUADRATICO o de SEGUNDO ORDEN
2 coeficiente que explica la curvatura del factor ii ix
Para dos factores este modelo tiene 6 términos
Design-Expert® Software
Dureza5.56
2.09
X1 = A: % ManitolX2 = B: %Camphor
-1.00
-0.50
0.00
0.50
1.00
-1.00 -0.50
0.00 0.50
1.00
2
2.925
3.85
4.775
5.7
D
ure
za
A: % Manitol
B: %Camphor
Modelos matemáticos para la MSR
MODELO CÚBICO o de TERCER ORDEN
Para dos factores este modelo tiene 10 términos
Design-Expert® Software
R382
1.33
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
-8
10.75
29.5
48.25
67
R
3
A: A B: B
1222212
21112
32222
31111
2222
2111211222110
xxxx
xxxxxxxxy
Modelos matemáticos para la MSR
1 Definir los objetivos de la optimización
2 Seleccionar los factores que resultan significativos
Plantear adecuadamente el PROBLEMA a resolver y seleccionar la RESPUESTA a evaluar
3 Establecer la Región de Operabilidad
Considerar las posibilidades instrumentales y la información sobre el sistema
4 Seleccionar un Entorno Experimental Definir la región del espacio de los factores en donde vamos a planear los experimentos
Pasos de la MSR
6 Elaborar un Modelo Matemático
Graficar la SUPERFICIE DE RESPUESTA y evaluar resultados
7 Localizar el Óptimo buscado para la Respuesta Utilizar herramientas gráficas y/o matemáticas para predecirlo.
8 Verificar experimentalmente Confirmar el valor de la respuesta utilizando los niveles óptimos de los factores
5 Construir un Diseño Experimental de Optimización
Recabar datos experimentales
Repetir los pasos 4 , 5 y 6 si fuera necesario
Pasos de la MSR
Si conocemos poco del sistema, el punto óptimo puede encontrarse fuera del entorno experimental inicial
Región de Operabilidad
Condiciones en donde el proceso o equipo puede ser
operado
Entorno Experimental
Limitado por los niveles seleccionados para los factores
X1
X2
X3
El Entorno Experimental debe moverse hacia la localización del óptimo
Región de operabilidad y entorno experimental
Diseño Experimental de Optimización
Modelo probable
Conocimiento previo del sistema
• Comportamiento esperado para la Respuesta • Localización probable del Óptimo
Primer orden Segundo orden
SI
NO
Determinación del Óptimo
Aproximación al Óptimo
Planificación de los experimentos
Diseño de Optimización de Primer Orden
Modelo de Primer Orden
Mover el Entorno Experimental en el sentido
del Óptimo
lineal
no lineal
Establecer Condiciones Óptimas
Aproximación al Óptimo
Experimentar
Evaluar curvatura
Localización del Óptimo
Diseño de Optimización de Segundo Orden
Modelo de Segundo Orden
Caracterizar la Superficie
Experimentar
La Metodología de Superficie de Respuesta puede ser una Técnica Secuencial
Objetivo: Aplicar experimentos que permitan moverse rápidamente a las proximidades del óptimo buscado para la respuesta.
Diseños Experimentales de Primer Orden
Técnica de
ESCALAMIENTO ASCENDENTE (o descendente)
Esta técnica opera “paso a paso” , programando el paso siguiente en función de los resultados del anterior
En cada paso se estudia una región relativamente pequeña.
Modelos de Primer Orden
APROXIMACIÓN AL ÓPTIMO: cuando no se sabe nada sobre el sistema a estudiar
SIMPLEX: Figura geométrica con k + 1 vértices (k: nº de factores)
Diseño SIMPLEX
factor 1
facto
r 2
factor 1
facto
r 2
factor 1
facto
r 2
FACTORIAL EN DOS NIVELES: se estudian todas las combinaciones de los factores en +1 y -1
factor 1
facto
r 2
Diseño para superficie de
respuesta de primer orden
Diseño SIMPLEX
Paso 1
Simplex Inicial: experimentos 1, 2 y 3
La peor respuesta es la del experimento 3 Buscar un opuesto
Diseño SIMPLEX en escalamiento
ascendente
Paso 2
Segundo Simplex : experimentos 1, 2 y 4
La peor respuesta es la del experimento 2
Método de Escalamiento Ascendente sin ajustar Modelo
DISEÑO SIMPLEX en ESCALAMIENTO ASCENDENTE
Buscar un opuesto
Paso 3
Tercer Simplex : experimentos 1, 4 y 5
La peor respuesta es la del experimento 1 Buscar un opuesto
Paso 5
Quinto Simplex : experimentos 5, 6 y 7
Sexto Simplex : experimentos 4, 6 y 8 La mejor respuesta es la 6
Se recorre secuencialmente una trayectoria en sentido
de su máxima pendiente, es decir,
del mayor incremento o decremento de la
respuesta
ascenso
descenso
00
k
i ii
y x
Superficie ajustada con un Modelo de Primer Orden
Normal de la Superficie de
Respuesta ajustada
Método de la máxima pendiente
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
Paso 1 Establecer el Punto Base, o Punto de Origen
Paso 2 Elaborar un Diseño
2k (-1, +1)
o Punto Central
(xi = xj =…..xk = 0) coincidente con el
Punto de Origen
o Réplicas en el Punto Central
Paso 3 Ajustar un modelo lineal, obtener la Superficie de Respuesta
y evaluar curvatura
j
i
Diseño Factorial en método de la
máxima pendiente
Paso 4 Se elige una de las variables como variable de apoyo y se
establece un tamaño de incremento o escalón para la misma.
1 jx
Paso 5 Calcular el
incremento para las otras variables
jiki
xx
jj
ii
;,....2,1
ˆ
ˆ
j
iix
ˆ
ˆ
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
j
1 jx
i j
iix
ˆ
ˆ
kkjjii xxxy ˆ......ˆˆˆˆ0
Máxima Pendiente en el plano i x j
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
j
iPendiente
ˆ
ˆ
Paso 6 Convertir cada incremento a valores naturales para obtener un punto experimental en el sentido de la máxima pendiente.
Paso 7 Continuar
experimentando en esta dirección hasta no observar más incrementos
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
Paso 8 Crear un nuevo Diseño 2k con replicas en el punto central que debe coincidir con el último punto experimental de mejor respuesta.
Paso 9 Construir un
nuevo modelo de primer orden y evaluar curvatura
Paso 10 Experimentar en el
sentido de máximo ascenso del nuevo modelo hasta no obtener más incrementos.
Repetir Paso 8 y Paso 9 hasta encontrar curvatura significativa, o la respuesta óptima
Región del ÓPTIMO localizada
Optimización del rendimiento de una reacción de síntesis de un polímero
Primer entorno experimental: 30-40 minutos y 150-160ºC
Diseño factorial a dos nieles con cinco repeticiones del punto central
Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
30 150 -1 -1 39.3
30 160 -1 1 40.0
40 150 1 -1 40.9
40 160 1 1 41.5
35 155 0 0 40.3
35 155 0 0 40.5
35 155 0 0 40.7
35 155 0 0 40.2
35 155 0 0 40.6
Punto de base u origen: 35 min a155 ºC
DISEÑO FACTORIAL en MÉTODO DE MÁXIMA PENDIENTE
Modelo Ajustado
1 2ˆ 40.44 0.775 0.325 y x x
Pruebas de Adecuación del Modelo Lineal
Modelo Significativo Falta de Ajuste No Significativa Interacción No Significativa Curvatura No Significativa
Trayectoria de Máximo Ascenso
o Pasa por el punto 40.44 o Tiene una Pendiente =0.325/0.775
j
iPendiente
ˆ
ˆ
Selección de un incremento base para una de las variables
1 1 5min x
Selección del incremento de la otra variable en función de la máxima pendiente en ascenso
2 1(0.325/0.775) 0.42 2º x x C
Incrementos Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
Origen 35 155 0 0 40.5
O+Δ 40 157 1.00 0.42 49.5
O+2Δ 45 159 2.00 0.84 59.8
O+3Δ 50 161 3.00 1.26 70.4
O+4Δ 55 163 4.00 1.68 80.9
O+5Δ 60 165 5.00 2.10 75.1
Experimentos con pendiente en ascenso
Se crea un nuevo diseño alrededor del punto (55, 163)
Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
50 158 -1 -1 76.5
50 168 -1 1 77.0
60 158 1 -1 78.0
60 168 1 1 79.5
55 163 0 0 81.2
55 163 0 0 80.5
55 163 0 0 80.7
55 163 0 0 80.9
55 163 0 0 80.6
Modelo Lineal
Pruebas de Adecuación del Modelo Lineal
Modelo No Significativo Falta de Ajuste Significativa Interacción No Significativa Curvatura Significativa
Modelo Cuadrático Pruebas de Adecuación del Modelo Cuadrático
Modelo Significativo Falta de Ajuste No Significativa Interacción No Significativa Curvatura Significativa
Proximidad del óptimo
Seleccionar entorno experimental para diseño de segundo orden
1 Proporcionar una distribución razonable de puntos de
datos en el Entorno Experimental
N min= 1 + 2k + k (k-1)/2
2 Generar datos que permitan el ajuste de un modelo
matemático de segundo orden
Estudiar cada factor en al menos tres niveles análisis de curvatura.
Tener una cantidad de puntos que permitan estimar todos los términos del modelo cuadrático.
Diseños experimentales de
segundo orden
k = 3
X1
X2
X3
X1x2 x1x3 x2x3
X1x2x3
X12 X22 X32
N min= 1 + 2k + k (k-1)/2 = 1 + 2.3 + 3 (3-1)/2 = 10
3 Posibilitar el estudio de la Idoneidad del Modelo y la
Falta de Ajuste.
Repeticiones del punto central o de otro punto (4-6).
N = N min + Co
4 Ser Eficiente para el cumplir con el objetivo propuesto
sin requerir demasiados puntos experimentales.
6 Posibilitar la realización de experimentos en Bloques:
5 Minimizar la Varianza de los Coeficientes de Regresión
del Modelo:
Ortogonalidad
Cuando es necesario bloquear el diseño, es importante mantener la ortogonalidad de los bloques.
El punto central debe distribuirse por igual entre los bloques.
A B A x B
1 1 1
-1 1 -1
1 -1 -1
-1 -1 1
A con B:
[1x1]+[(-1)x1]+[1x(-1)]+(-1)x(-1) = 0
0.437
0.437
Error Estándar del Modelo
7 Proporcionar un error de predicción estable en el
entorno experimental:
Rotabilidad
8 Permitir la creación secuencial a partir de diseños de
primer orden
9 Posibilitar la obtención de diseños aumentados
2k 3k
3k D-Optimal
Dos factores Tres factores
Punto central
• Se investigan todas las posibles combinaciones de los niveles de los factores
• Número de experimentos (N= 3k )
• El número de experimentos crece rápidamente con el número de factores
3 niveles por factor (-1, 0 , +1)
Diseño Factorial Completo a 3 niveles
Diseño cúbico, que responde al diseño factorial completo 2k
Punto central
Diseño estrella, a una distancia del centro.
•Compuesto por:
5 niveles por factor (-α, -1, 0, +1, +α)
• Número de experimentos (N = 2k +2k + C0)
Diseño Central Compuesto
Puede generarse a partir de un diseño factorial de primer orden anterior cuando se observa curvatura y quiere
estudiarse mejor esta región del espacio experimental
Diseño inicial Aumento del Diseño
curvatura
Factorial en dos niveles Estrella
Bloque 2 Bloque 1
2k + Co
2k+ Co
•Centrado en las caras
•Circunscripto
o Rotable
o Esférico
o Práctico
Los puntos estrella o puntos axiales pueden tomar distintas ubicaciones en el entorno experimental, a una
distancia α del centro del diseño
4factn
1
1
k
4 k
Entorno experimental esférico
Puntos axiales posibles experimentalmente
Cuasi-Rotables
5k
Diseño Central Compuesto centrado en las caras
α = 1.0 Se transforma en un diseño de tres niveles
El entorno experimental es más acotado
Es útil cuando en la práctica no se pueden modificar
fácilmente los niveles de los factores
Diseño Esférico Diseño Rotable Diseño Práctico
k Valor de alfa
2 1.414 1.414 1.189
3 1.732 1.682 1.316
4 2.000 2.000 1.414
5 2.236 2.378 1.495
Punto central
• Compuestos por la combinación de diseños factoriales a dos
niveles con diseños de bloques incompletos
• Número de experimentos (N = 2k (k−1) + c0 )
• Puede aplicarse para k ≥ 3
Tres factores
3 niveles por factor (-1, 0 , +1)
Diseño Box-Behnken
• El dominio experimental es muestreado de manera uniforme, los puntos experimentales son equidistantes entre si.
• Los factores varían en diferente número de niveles cada uno. Para un diseño de 3 factores el primero toma tres niveles, el segundo cinco y el
tercero siete
x2
• Número de experimentos (N= k2+k+Co)
0 0.5 -0.5 1.0 -1.0
0
1.0
-1.0
x1
Matriz de Doherlet
Central compuesto (CC) N = 2k +2k + C0
Factorial completo (FC) N = 3k
2
3
4
5
6
7
Box-Behnken (BB) N = 2k (k−1) + C0
más eficiente
Factores Coeficientes Puntos Experimentales(N) Eficiencia (E) (modelo cuadrático) (1 punto central)
6
10
15
21
28
36
9
15
25
43
77
143
9
27
81
243
729
2187
-
13
25
41
49
57
0.67
0.67
0.60
0.49
0.36
0.25
-
0.77
0.60
0.51
0.57
0.63
BB CC FC BB CC FC
0.67
0.37
0.18
0.08
0.04
0.02
La Eficiencia de un diseño está dada por el cociente entre el número de coeficientes estimados por el modelo y el numero
total de puntos experimentales
Eficiencia
Son Diseños NO Simétricos, logrados mediante algoritmos computacionales cuyo fin es
satisfacer condiciones establecidas por el operador, tales como:
Cantidad de puntos experimentales
Tipo de modelo a ajustar
Rangos de las variables
Regiones no posibles de ensayo
Diseños óptimos
1 Región Experimental Irregular.
2 Falta de Ajuste de Modelo Cuadrático.
3 Necesidad de reducir la cantidad de puntos
experimentales.
• Se dividen en distintos tipos, nombrados por las letras del alfabeto.
• El tipo de Diseño Óptimo se refiere a la propiedad o criterio que se pondera en el diseño.
Diseños óptimos
Es un diseño basado en el criterio de proporcionar
una buena estimación de los parámetros de
regresión para el modelo seleccionado.
11 Puntos Experimentales distintos
Se pierde Rotabilidad
Diseño D-optimal
Se crean ecuaciones para restringir el área donde el
sistema genera combinaciones no favorables
Región de alta presión
1.0 2.0 20.0
40.0
Flujo (mL/min)
% M
etO
H
Región favorable
Se seleccionan puntos experimentales con una
Distribución óptima desde el punto de vista estadístico.
Diseño D-optimal con restricciones
Puntos Seleccionados
Determinante de XTX máximo
Selección de puntos experimentales en dominio asimétrico
Buena estimación de coeficientes y error de
predicción más o menos estable.
Error estándar en un diseño central compuesto al que se quitaron dos puntos
por no poder operarse en esa región
Diseños Experimentales de Segundo Orden
Análisis canónico
Candidato al Óptimo
Modelo de Segundo Orden
Localización del Punto Estacionario
Análisis de cordillera
Buen ajuste y R2aj mayor a 70%
para PREDECIR
Es el punto del espacio de los factores en el cual el plano tangente a la superficie tiene pendiente igual a cero y es un
“candidato al óptimo”
Punto Estacionario
Punto de Respuesta Máxima
Punto de Respuesta Mínima
Punto Silla
Loma Valle Silla de montar
Cuando hay un punto silla la superficie sube o baja a partir del punto estacionario dependiendo de la dirección en la
que nos movemos
Punto Silla
0ˆ......ˆˆ21 kxyxyxy
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
Paso 1 Ajustar un Modelo de Segundo Orden con niveles
codificados
Paso 2 Verificar el tipo de Superficie de Respuesta
obtenida Análisis gráfico Análisis canónico
Paso 3 Obtener el Punto Estacionario
Bxx' bx' 0ˆˆ y
En donde:
ˆ
ˆ
ˆ
b
x
1
2
k
1
2
k
x
x
x
β
β
β
kk
k
k
ˆsim
2ˆˆ
2ˆ...2ˆˆ
B 222
11211
Es el vector de los factores
Es el vector de los coeficientes de
regresión de primer orden
Es una matriz simétrica cuya diagonal principal está
formada por los coeficientes de los términos cuadráticos
puros
La derivada de la función respecto al vector x igualada a 0 es:
0Bx bx
2
y
bBx -1
02
1-
de donde puede calcularse el punto estacionario:
La respuesta predicha para el punto estacionario estará dada por:
0 o
1ˆy2
ox b
¿Qué tipo de punto estacionario es?
¿Es el óptimo que buscamos?
2 2 20 1 1 2 2 k k
ˆ ˆy y w w ..... w
0y Valor de la respuesta predicho por el modelo en el punto estacionario
iw Variables canónicas
i Autovalores de la matriz B
Forma Canónica del Modelo
Transformaciones de las variables codificadas
Análisis canónico
x1
x2 w2
w1
Punto estacionario
Origen del Diseño
Ecuación canónica: rotación y traslación de los ejes coordenados
Entorno Experimental
Cordillera de la Superficie
iPositivo para todas las i: Punto MÍNIMO VALLE
Negativo para toda i: Punto MÁXIMO LOMA
Ambos signos: Punto SILLA DE MONTAR
Formas clásicas
Punto Estacionario DENTRO del Entorno Experimental
Caracterización de la Superficie
Otras formas
Punto Estacionario FUERA del Entorno Experimental
iPositivo para todas las i: CRESTA DESCENDENTE
Negativo para toda i: CRESTA ASCENDENTE
Ambos signos: CORDILERA ESTACIONARIA
Caracterización de la Superficie
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50 0.13 0.75 1.38 2.00
-1.50
-1.13
-0.75
-0.38
0.00
R1
A: A
B: B
22.2
28.828.835.4
42
48.6
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50
0.13
0.75
1.38
2.00
-1.50
-1.13
-0.75
-0.38
0.00
0
14
28
42
56
R
1
A: A B: B
LOMA ASCENDENTE
¿Qué hacemos en este caso?
Seguimos experimentando en el sentido del óptimo, siempre que lo permitan las condiciones de operación del sistema.
Proponemos un óptimo alternativo, en donde la respuesta es favorable y las condiciones de operación son posibles
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00 -0.50 0.00 0.50 1.00
-1.50
-0.75
0.00
0.75
1.50
R1
A: AB
: B
2.42
2.42
3.94
3.94
5.45
5.45
6.97
6.97
8.48
8.48
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00
-0.50
0.00
0.50
1.00
-1.50
-0.75
0.00
0.75
1.50
0
2.5
5
7.5
10
R
1
A: A B: B
CORDILLERA ESTACIONARIA
¿Qué hacemos en este caso?
Podemos seleccionar el mejor punto desde el punto de vista operacional que de una respuesta satisfactoria.
En este caso habrá muchas soluciones posibles al problema y podemos decidir sobre la conveniencia del nivel de los factores
¿Qué hacemos cuando el punto estacionario no es el óptimo buscado?
Objetivo: MAXIMIZAR la Respuesta
Punto Estacionario
En este caso deberemos encontrar el mejor punto posible dentro del Entorno Experimental. Este punto se ubica en la cordillera de mayor
crecimiento de la superficie y se encuentra por el método conocido como “análisis de cordilleras”
LOCALIZACIÓN DEL ÓPTIMO- ANÁLISIS de CORDILLERA
Construir esferas (o círculos) concéntricas al centro del diseño
Objetivo: MAXIMIZAR la Respuesta
Centro del Diseño
Punto Óptimo en el Entorno Experimental
Puntos alternativos
Los softwares de optimización emplean ecuaciones matemáticas
para resolver este tipo de situaciones
Cordillera del sistema
El error de predicción de la respuesta es función del modelo postulado, el diseño y ubicación del punto
Está dado por el producto del Leverage en ese punto de la superficie
por el Error Experimental
expˆ VxLyV
El Intervalo de Confianza para la respuesta predicha puede
calcularse a partir de su desviación estándar
ySxtyIC ˆˆ)05.0(
Para estar seguros de haber encontrado un óptimo confiable para
nuestro sistema debemos tener en cuenta el error en la predicción
De una manera similar a cuando se obtiene la varianza en la
predicción en una curva de calibrado univariado
Error de predicción
Design-Expert® Software
StdErr of Design1.5
0.5
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
0.000
0.250
0.500
0.750
1.000
S
tdE
rr o
f D
esi
gn
A: A B: B
Leverage: función del diseño y del modelo ajustado
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
DCC
Modelo Lineal Modelo Cuadrático
puntos centrales
puntos axiales
Error de predicción
En los casos estudiados hasta
ahora (deseños experimentales
para variables independientes),
cada variable podía tomar
cualquier valor dentro de su
rango, independientemente del
valor tomado or las otras
variables.
Euna mezcla tenemos la restricción
de que la suma de todos los
componentes sea 1 (o 100%). Es
decir no pueden ser variados
independientemente, ya que al
hacerlo se puede pasar el porcentaje
de 100.
1
1
0
0 S = 0
S = 1
S = 1
S = 2
S = 1
¿Cuando es necesario realizar diseños de mezclas?
Composición de azúcares (u otro nutriente) de un
medio de cultivo que exige que se cumpla cierto
valor de osmolaridad.
Mezcla de solventes en un proceso extractivo
(diferentes polaridades para diferentes compuestos
a extraer).
Composición de fases en cromatografía.
Diferentes ligandos de un comprimido
farmacéutico.
Constituyentes de un alimento.
Otros.
Cuando los factores analizados son componentes
de una mezcla, sus niveles no son
independientes entres si.
El espacio experimental es una figura que tiene
tantos vértices como componentes, en un espacio
cuya dimensionalidad es igual al número de
componentes menos uno.
La respuesta es una función de las proporciones
de los componentes.
• Tres componentes (3)
• Espacio experimental: triángulo
(cada vértice corresponde a un
componente puro)
• Dimensionalidad: 2
0 x1
1
0
x
2
1
X1+x2 = 1 • Dos componentes (2)
• Espacio experimental:
segmento de recta (cada extremo
corresponde a 100 % un
componente)
•Dimensionalidad: 1
• Cuatro componentes (4)
• Espacio experimental:
pirámide (cada vértice
corresponde a un
componente)
•Dimensionalidad: 3
Modelo clásico para un sistema lineal de 2
componentes:
y = b0 + b1 x1 + b2 x2
y = X b + e = ypred + e
=
(XTX)-1XT y = (XTX)-1XTX b
b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]
ypred = X (XTX)-1XT y ypred = H y (H es conocida como matriz “hat” por sombrero)
Xb = X(XTX)-1XT y
Pero XTX es singular en un diseño de
mezclas
ya que x1+ x2 = 1
y = b0 + b1 x1 + b2 x2 + e
Si (x1+ x2= 1), podemos hacer:
ypred = b0 (x1+ x2)+ b1 x1 + b2 x2 (la suma no se altera)
ypred = (b0 + b1) x1 + (b0 + b2) x2
ypred = b1* x1 + b2 * x2
Si x1 = 1, x2 = 0, entonces y = b1*
Si x2 = 1, x1 = 0, entonces y = b2*
Con sólo dos experimentos se pueden calcular fácilmente los
coeficientes del “modelo lineal para dos componentes”
Reemplazando x12 = x1 (1- x2 ) y x2
2 = x2 (1- x1 ), se llega a :
ypred = b1* x1 + b2 * x2 + b12* x1 x2
Modelo cuadrático para dos componentes
De manera similar se puede llegar a:
ypred = b1* x1 + b2 * x2 + b3 * x3 + b12* x1 x2 + b13* x1 x3 +
+ b23* x2 x3
Modelo cuadrático para tres componentes
ypred = b1* x1 + b2* x2 + b3* x3 + b12* x1 x2 + b13* x1 x3 +
+ b23* x2 x3 + + b123* x1 x2 x3
Modelo cúbico especial para tres componentes
Modelo cuadrático cásico:
Yi = o + 1 X1 + 2 X2 + 12 X1 X2 + 11 X12 + 22 X2
2 + i
q
i
q
kjikjiijkjiijii xxxxxxy
1
Modelo de Scheffé:
Henry Scheffé (1907-1977)
Ejemplo 1 Formulación del un comprimido
en que se busca la mejor mezcla de los tres
ligandos (90.8% del total): alfa-lactosa monohidratada
(X1), beta-lactosa anhidra (X2) y almidón de arroz
modificado (X3).
Respuestas: fuerza que hay que hacer para romper la
tableta (Y1), y la velocidad de disolución (Y2).
(R. Leardi / Analytica Chimica Acta 652 (2009) 161–172)
• Los coeficientes de los términos lineales
corresponden a la respuesta obtenida
con el componente puro.
Modelo obtenido para la primer respuesta:
• Los coeficientes de las interacciones dobles
indican el efecto sinérgico. En el ejemplo, si no
hubiera interacción, el valor debería ser el promedio de los
coeficientes para X1 y X2, es decir 72 [(31+113)/2]. Pero
es 120/4 (así se calcula el efecto en las interacciones
dobles, dividiendo por cuatro), es decir 30, o sea 42
unidades menos.b
• Los coeficientes de las interacciones triples se
calculan dividiendo por 27
• En la figura puede verse que X2 tiene el mayor efecto sobre Y1 y
éste es positivo.
• X1 tiene menor efecto, pero negativo (pasa de 70 a 31).
• X3 es el componente con menor efecto (pasa de 42 a 38).
• Observar que estos efectos no se corresponden con los
valores de los coeficientes!
Y1 = 39 (X2 = 0)
Y1 = 113
(X2 = 100%) Y1 = 70 (X1 = 0)
Y1 = 31
(X1 = 100%)
Y1 = 42 (X3 = 0)
Y1 = 38
(X3 = 100%)
Ejemplo 2
Formulación de un comprimido
en el cual hay 20% de droga y el resto
corresponde a una mezcla de 3
excipientes:
1- Lactosa
2- Avicel PH 101 (una celulosa microcristalina)
3- Hidroximetilpropilcelulosa (HMPC)
Comprehensive Chemometrics. Vol 1, página 431
Gráfica de trazas: “Trace”
Es una especie de silueta de la superficie de respuesta.
Representa el efecto de cambiar cada componente en una línea imaginaria a partir de una mezcla referencia (el centroide)
Ejemplo: Formulación de un
detergente midiendo dos
respuestas: viscosidad y turbidez
Restricciones:
• 3% ≤ A (agua) ≤ 8%
•2% ≤ B (alcohol) ≤ 4%
•2% ≤ C (urea) ≤ 4%
A+B+C=9%
Tutorial DExpert
Pseudocomponentes
Efluente de la
industria lechera
Efluente de la
industria
cervecera
Efluente de la
industria
azucarera
Optimization of the Bacillus thuringiensis var. kurstaki HD-1 d-endotoxins production by using experimental mixture design
and artificial neural networks. GA Moreira, GA Micheloud, AJ Beccaria, HC Goicoechea, Biochem. Eng. J., 2007, 35, 48-55.
Ejemplo usando efluentes industriales para un medio de cultivo
y = f (x) x g (z)
y = (f1 x1 + f2 x2 + f3 x3) x (g1 z1 + g2 z2 + g3 z3)
y = (f1 x1 + f2 x2 + f3 x3) x g1 z1 + (f1 x1 + f2 x2 + f3 x3) x g2 z2 + (f1 x1
+ f2 x2 + f3 x3) x g3 z3
y = f1 x1 g1 z1 + f2 x2 g1 z1 + f3 x3 g1 z1 + f1 x1 g2 z2 + f2 x2 g2 z2 + f3
x3 g3 z3 + f1 x1 g3 z3 + f2 x2 g3 z3 + f3 x3 g3 z3
333332
3231
31
232322
2221
2113
1312
1211
11
zxbzxbzxb
zxbzxbzxbzxbzxbzxby
Modelo lineal mixto de mezclas cruzadas
para tres componentes
Ejemplo de uso en CE: optimización en la
separación de picos combinando dos variables de
proceso (pH y voltaje) y tres de mezclas (3
diferentes sales para los buffers)
Determinación de fluoroquinolonas por CE-DAD en
aguas
Se evaluó la separación de los 4 quinolonas fluoradas bajo diferentes soluciones
reguladoras compuestas por 3 naturalezas distintas de iones: fosfato, borato y
citrato, todas de sodio.
Enoxacina: ENO
Ciprofloxacina: CPF
Ofloxacina: OFN
Enrofloxacina: ENF
M.R. Alcaráz, L. vera-Candioti, MJ Culzoni, H.C. Goicoechea. Anal.
Bioanal. Chem. 406 (2014) 2571-2580.
Se tiene como objetivo reducir tiempo de
análisis, pero asegurándose que no se toquen los
picos 2 y 4
Optimización de un medio de cultivo para la
producción de una proteína recombinante
C. Didier, M. Etcheverrigaray, R. Kratjie, H.C. Goicoechea, Chemom. Intell. Laborat. Syst. 86 (2007) 1
Modelo mixto
Commercial product
of high price
Developed product of
low price
Response Modelo F p Adj. R2 p-LOF
IVC QxQ 6.46 < 0.0001 0.722 0.307
qprot QxQ 8.39 < 0.0001 0.781 0.013
BA QxQ 11.04 < 0.0001 0.832 0.052
qlact QxQ 5.46 < 0.0001 0.679 0.233
qamo QxQ 2.85 0.0055 0.500 0.005
Modelo mixto
La MSR es una técnica sumamente
versátil que permite la utilización de
diferentes diseños experimentales y
herramientas estadísticas para resolver
problemas de optimización de sistemas.
Puede aplicarse a la optimización de
una única respuesta o a la optimización
simultanea de varias respuestas.
Conclusiones
El buen criterio del operador y el
correcto uso de la metodología son
fundamentales para arribar a conclusiones
correctas.
Una vez obtenidas las condiciones
óptimas de operación del sistema, según el
criterio establecido, las mismas deben
confirmarse experimentalmente.
Conclusiones