Diseño Óptimo de Experimentos en Procesos Industriales · Diseños Óptimos para la Estimación...
Transcript of Diseño Óptimo de Experimentos en Procesos Industriales · Diseños Óptimos para la Estimación...
Universidad de Castilla-La Mancha
E. T. S. de Ingenieros Industriales
Instituto de Matemática Aplicada a la Ciencia
y a la Ingeniería
Departamento de Matemáticas
Diseño Óptimo de Experimentos
en Procesos Industriales
Memoria que presenta para optar al grado de Doctor:
D. Licesio J. Rodríguez Aragón.Dirigida por:
Prof. Dr. Jesús López Fidalgo.
Diciembre 2007
D. Jesús López Fidalgo, Catedrático del área de Estadística e In-vestigación Operativa de la Universidad de Castilla-la Mancha.
CERTIFICA:
Que la memoria titulada Diseño Óptimo de Experimentos enProcesos Industriales presentada por el Licenciado en MatemáticasDon Licesio J. Rodríguez Aragón para optar al Grado de Doctor, hasido realizada bajo mi dirección en el Programa de doctorado Física yMatemáticas de la Universidad de Castilla-La Mancha.
Y para que así conste, expedimos y rmamos la presente certica-ción en Ciudad Real a 20 de Diciembre del 2007.
Fdo: Dr. D. Jesús López Fidalgo.
i
Agradecimientos
Este trabajo ha sido realizado bajo la dirección del Prof. Dr. Don JesúsLópez Fidalgo cuyas orientaciones, consejos y valiosas correcciones quieroagradecer. Hubiese sido imposible llegar a puerto a no ser por el tiempoque tan generosamente siempre me ha ofrecido. Quiero además agradecerlela ayuda, la conanza y la amistad que me ha brindado.
Agradecer también a mis compañeros del Departamento de Matemáti-cas de la Universidad de Castilla-La Mancha que me han ayudado en todolo que han podido. En especial a Raúl Martín Martín y Mariano Amo Salas,compañeros de fatigas.
No puedo dejar de agradecer, ni olvidar, a mis compañeros de la Univer-sidad Rey Juan Carlos de Madrid, especialmente al Dr. D. Enrique CabelloPardos, director del Face Recognition and Articial Vision group (FRAV)del que formé parte, a Cristina Conde Vilda, a Ángel Serrano Sánchez deLeón y a Jorge Pérez López, con quienes he compartido tantas horas detrabajo. Agradecer también al Departamento de Informática, Estadísticay Telemática de la URJC, a su director el Prof. Dr. D. Luis Pastor Pérezy a todos sus miembros, en especial a todos con los que compartí tareasdocentes o de investigación, sería demasiado extenso nombrarlos a todos einjusto nombrar sólo a unos pocos.
Deseo hacer extensivo este agradecimiento a los investigadores en elcampo del Diseño Óptimo de Experimentos, de cuyos trabajos tanto heaprendido y me queda por aprender. Especialmente quiero agradecer alDr. D. Juan Manuel Rodríguez Díaz cuya Tesis Doctoral me ha servido demanual en tantos momentos y a tantos otros cuyos trabajos han servido defuente y apoyo para los desarrollos llevados a cabo en éste.
Agradecer también al Prof. Dr. D. Anatoly Zhigljavsky de la Universi-dad de Cardi que me acogió durante mi estancia en el School of Mathe-matics y que tan generosamente me dedicó su tiempo.
ii
En lo personal, quiero agradecer a todos aquellos que comparten estepequeño éxito conmigo, apoyándome en el proceso de, una vez más fracasare intentarlo siempre de nuevo1, a mis padres Maria Jesús y Licesio, a mihermano Jesús y a Cristina, fuente de todas mis energías.
No puedo dejar de recordar en estos momentos de revisión del trabajo,a todos mis mayores, en especial el recuerdo siempre tan cercano de la Dra.Gonzala García Delgado, mi abuela, que pasó sus años de doctorado en elMadrid de los años treinta, tan cerca...
The simple fact is that no measurement,no experiment or observation is possible
without a relevant theoretical framework.
D. S. Kothari2.
A mi familia,a mis amigos,
a mis maestros,a mis alumnos,y a Cristina,
...de baile de disfraces cada día.
Salamanca-Madrid-Ciudad Real,Festividad de la Inmaculada Concepción, 2007.
1William Faulkner (1897-1962), Escritor estadounidense.2Daulat Singh Kothari (1905-1993), Físico indio.
Índice general
Resumen vii
Summary xiii
Introducción 1
El Experimento y su Diseño 1
Modelos 3
Etapas del Diseño Óptimo de Experimentos 4
Nota Histórica 5
Capítulo 1. Diseño Óptimo 11
1.1. Modelos de Regresión 12
1.2. Método de los Mínimos Cuadrados Generalizados 13
1.3. Contexto del Diseño Óptimo 15
1.4. Diseños Exacto y Aproximado 16
1.5. Estimadores de Funcionales Lineales 17
1.6. Matriz de Información 19
1.7. Criterios de Optimización 26
1.8. Teorema de Equivalencia 37
iii
iv Índice general
1.9. Discriminación entre Modelos: T−optimización 43
Capítulo 2. Ecuación de Arrhenius 47
2.1. Velocidad de las Reacciones Químicas 47
2.2. Dependencia de la Constante de Velocidad de la Temperatura 50
2.3. Teoría de Arrhenius 52
2.4. Otras Teorías 53
2.5. La Ecuación de Arrhenius y Fenómenos de Transporte 58
Capítulo 3. Diseños Óptimos para la Ecuación de Arrhenius 63
3.1. Necesidad de Diseños Óptimos 63
3.2. Modelo no Lineal 65
3.3. Matriz de Información y Criterios de Optimización 67
3.4. Diseño D−Óptimo 69
3.5. Método de Elfving y Diseños c−Óptimos 73
3.6. Diseños Óptimos Compuestos 79
3.7. Comparación con otros Diseños 82
Capítulo 4. Fenómenos de Adsorción 87
4.1. Generalidades 87
4.2. Método Experimental 89
4.3. Quimisorción 90
4.4. Modelo de Langmuir 91
4.5. Fisisorción 92
4.6. Modelo de Brunauer, Emmett y Teller (BET) 94
4.7. Desviaciones de la Isoterma BET: Isoterma GAB 97
Capítulo 5. Diseños Óptimos para las Isotermas de Adsorción BET y
GAB 103
5.1. Aplicaciones de los Fenómenos de Adsorción 103
5.2. Isotermas de Adsorción 106
Índice general v
5.3. Discriminación entre Modelos: BET o GAB 110
5.4. Diseños Óptimos para la Estimación de los Parámetros 115
5.5. Diseños Óptimos para el Modelo BET 117
5.6. Diseños Óptimos para el Modelo GAB 124
5.7. Comparación de los Diseños 133
Capítulo 6. Estimadores Combinados en Quimiometría 137
6.1. Ecuaciones de Velocidad 138
6.2. Caso Simplicado 142
6.3. Estimación en dos Pasos frente a la Estimación Combinada 144
Conclusiones 151
Discusión de los Resultados 154
Líneas Futuras de Investigación 157
Conclusions 159
Results Discussion 162
Issues for Further Research 164
Apéndice A. Distribución de Boltzmann 167
A.1. Aplicación a la Deducción de la Distribución de Maxwell de
las Velocidades de las Moléculas de un Gas 172
Bibliografía 175
Resumen
El trabajo que se presenta se construye sobre los fundamentos mate-
máticos de la teoría del Diseño Óptimo de Experimentos. Como se sabe,
esta disciplina trata de lograr la mejor elección posible de las observacio-
nes en las que se basará un experimento para obtener la mayor y mejor
información posible acerca de un objeto. La modelización y la inferencia
estadística son procesos en los que se obtiene información a través de ex-
perimentos, planteados para situaciones concretas y sujetos en la mayoría
de las ocasiones a restricciones y costes de diversa naturaleza.
Existen múltiples aplicaciones industriales de los fenómenos y modelos
con los que hemos trabajado. Nuestro estudio ha estado centrado en dos
tipos de fenómenos, i) la inuencia de la temperatura sobre parámetros
cinéticos (modelo de Arrhenius) y ii) fenómenos de adsorción. El mode-
lo de Arrhenius explica la dependencia de las constantes de velocidad de
reacciones químicas con la temperatura así como la de los coecientes de
otros fenómenos de transporte. Por otro lado, los modelos de adsorción son
comunes en la industria alimentaria, en procesos de ltrado y depuración,
y en la industria de materiales de construcción, entre otros.
Los diferentes capítulos de la memoria están agrupados en orden cro-
nológico según han sido abordados, aunque desde luego han sido necesarias
vii
viii Resumen
continuas revisiones de su contenido. Asimismo, se han redactado de forma
autónoma, con las ventajas e inconvenientes que ello conlleva, repitiéndose
en algunos casos ideas y conceptos, pero siempre con un especial enfoque
según la necesidad del momento.
En la Introducción se presentan las ideas generales en las que se basa
la teoría de Diseño Óptimo de Experimentos, así como la situación actual
y los antecedentes históricos de los métodos usados.
El Capítulo 1 se centra en el Diseño Óptimo de Experimentos, teoría
general en la que está basado el trabajo. Se introduce la notación y métodos
generales de estimación y regresión para, a continuación, plantear los con-
ceptos, deniciones, teoremas y propiedades que se usarán en el desarrollo
posterior. Se presentan los criterios de optimización usados y el Teorema
de Equivalencia como pilar fundamental, que proporciona un instrumento
inestimable para la comprobación de la optimalidad de un diseño.
Para el desarrollo de este trabajo ha sido necesario realizar una ta-
rea interdisciplinar con el objeto de poder aplicar las técnicas del Diseño
Óptimo a los modelos estudiados. En Capítulo 2 se resumen brevemente
algunos conceptos y propiedades resultado del estudio que ha sido necesa-
rio llevar a cabo para obtener el mayor fruto posible. Con el objetivo de
realizar una exposición equilibrada hemos incluido en un Apéndice nal
algunas propiedades relacionadas con la estadística y los fenómenos físicos
y químicos, cuyo comportamiento se corresponde con el modelo planteado
por la ecuación de Arrhenius.
El Capítulo 3 se centra en la aplicación de los criterios de optimización
a esta ecuación y en los pasos que nos han llevado a la obtención de los di-
ferentes diseños óptimos. Con el objetivo de incrementar la precisión de las
estimaciones de los parámetros de la ecuación de Arrhenius, se han calcu-
lado y comparado diferentes diseños óptimos. Basándose en el Teorema de
Equivalencia, piedra clave del Diseño Óptimo de Experimentos, se ha calcu-
lado el diseño D−óptimo y mediante el Método de Elfving se han calculado
Resumen ix
diferentes diseños c−óptimos con el objetivo de estimar combinaciones li-
neales de los parámetros. Asimismo, se han obtenido diseños compuestos
por varios criterios, que proporcionan diferentes grados de precisión a la
hora de determinar cada parámetro.
Los diseños empleados tradicionalmente han sido comparados con los
diseños óptimos calculados y, como resultado, se ha obtenido un valioso
método que permite al investigador elegir el diseño más apropiado a sus
intereses, comparando cada diseño posible con el óptimo y obteniendo así
la eciencia de su diseño.
En particular, y a modo de ejemplos, estos procedimientos se han apli-
cado a la estimación de los parámetros de la ecuación de Arrhenius en
medidas relacionadas con la Química atmosférica. Estas estimaciones son
usadas en la modelización de los procesos que se llevan a cabo en la estra-
tosfera y en capas superiores de la atmósfera que dan lugar a fenómenos
como el Efecto Invernadero y la reducción de la Capa de Ozono. Se han
elegido este tipo de procesos por sus especiales características, por las di-
cultades experimentales que presentan, por la alta incertidumbre presente
en las estimaciones existentes de estos valores y por la importancia de la
correcta modelización de estos fenómenos.
Los resultados de esta parte del trabajo han sido presentados en el 5th
Congress of Romanian Mathematicians, celebrado en Pitesti, Rumania, y
en XXX Congreso Nacional de la Sociedad Estadística Española, celebrado
en Valladolid (Rodríguez-Aragón y López-Fidalgo, 2003; 2007c) así como
publicados, en la revista Chemometrics and Intelligent Laboratory Systems
(Rodríguez-Aragón y López-Fidalgo, 2005) estando el artículo dentro del
Top25 Hottest Articles3 de la revista durante el período Abril-Junio 2005.
El desarrollo de los modelos de adsorción se realiza en el Capítulo 4,
iniciándose con una descripción genérica del fenómeno de adsorción así co-
mo del proceso experimental a seguir para poder caracterizarlo. Se han
descrito los modelos más ampliamente usados: el modelo de Langmuir para
3http://top25.sciencedirect.com
x Resumen
adsorción en monocapa y los modelos BET y GAB para la adsorción en
multicapa. La aplicación del Diseño Óptimo de Experimentos permite re-
solver la elección del modelo más adecuado para describir el fenómeno de
adsorción en multicapa, aunque deja abiertos y sin resolver otros problemas
como el diseño de experimentos en condiciones de equilibrio.
En el Capítulo 5 se obtienen los diseños óptimos para los dos modelos
de adsorción en multicapa más usados, el modelo BET y el GAB. Las dife-
rentes opiniones de la comunidad cientíca acerca de la adecuación de uno u
otro modelo al fenómeno han dado pie para el cálculo de diseños T−óptimos
mediante un procedimiento numérico y con el objetivo de discriminar entre
ambos modelos. Aunque el espacio del diseño recomendado en la literatura
es diferente según el modelo elegido, la falta de ajuste del modelo BET se
atribuye a la linealización del modelo. Por otro lado la obtención de valores
de los parámetros contradictorios con su signicado físico, justicando su
mejor ajuste al modelo, hacen de los diseños T−óptimos una herramienta
de gran interés. La aplicación del Teorema de Equivalencia nos permite ob-
tener un criterio de parada del proceso numérico mediante una cota inferior
de la eciencia.
Una vez elegido el modelo, se han calculado diseños D− y c−óptimos
para ambos modelos; de forma analítica para el modelo BET, que posee dos
parámetros desconocidos, y de forma numérica para el modelo GAB, con
tres parámetros desconocido. El empleo del Método de Elfving de forma
gráca para calcular los diseños c−óptimos para el modelo GAB presenta
numerosas dicultades, por lo que se ha sustituido por un procedimiento
algorítmico.
Existen grandes reticencias por parte de los experimentadores para lle-
var a la práctica los diseños óptimos, debido a su reducido número de puntos
de soporte, así que una vez más se han calculado las eciencias de diferentes
diseños con un mayor número de puntos en su soporte, proporcionando así
una herramienta para decidir cuál de los posibles diseños resulta más intere-
sante según las necesidades del investigador. Al mismo tiempo es posible el
cálculo de las eciencias de los diseños T−óptimos respecto a los criterios
Resumen xi
de D− y c−optimización, para conocer las ventajas e inconvenientes de los
mismos.
Los ejemplos usados para ilustrar los diseños calculados provienen de la
industria alimentaria, más en concreto de la caracterización de la adsorción
de vapor de agua, que resulta de interés a la hora de juzgar la calidad de
numerosos productos alimenticios y en la determinación de la vida útil. No
es la única aplicación interesante de los fenómenos de adsorción. Entre otras
podemos destacar el cálculo del área supercial de sólidos pulverizados o su
aplicación al estudio de la catálisis heterogénea. Es notable la actualidad
que han cobrado de los estudios de Química de supercies4, entre los que se
encuentran los fenómenos de adsorción, a raiz de la concesión del Premio
Nobel de Química 2007.
Nuestros resultados del cálculo de diseños óptimos para fenómenos
de adsorción se han presentado en el International Congress of Mathe-
maticians, celebrado en Madrid; en la International Conference on Mat-
hematical and Statistical Modelling, celebrada en Ciudad Real y en el
8th Model Oriented Design and Analysis Workshop, celebrado en Alma-
gro (Rodríguez-Aragón y López-Fidalgo, 2006a; 2006b; 2007b). El trabajo
completo ha aparecido publicado en la revista Chemometrics and Intelli-
gent Laboratory Systems (Rodríguez-Aragón y López-Fidalgo, 2007a).
Por último, se presenta, en el Capítulo 6, la consideración de uno de
los problemas surgidos durante el desarrollo de los diseños óptimos para
la ecuación de Arrhenius. Éste es uno de los muchos problemas o cuestio-
nes que han aparecido durante la realización de nuestro trabajo, cuestiones
aparentemente sencillas desde el punto de vista matemático, que se com-
plican en el momento que se profundiza en las cuestiones interdisciplinares.
La dicultad aparece cuando en lugar de considerar la constante de velo-
cidad, dependiente de la temperatura, como una magnitud directamente
medible, se considera que esta variable es el resultado de un ajuste previo
de observaciones tomadas en el tiempo. Se han recopilado los diferentes
4Gerhard Ertl (1936), Premio Nobel de Química en 2007. For his studies of chemical processeson solid surfaces.
xii Resumen
modelos según los órdenes de las reacciones químicas y se ha planteado
un caso simplicado para el que se han calculado las diferencias entre el
proceso de estimación usual en dos pasos frente al proceso de estimación
combinado, que obtiene estimadores con menor varianza.
Finalmente, se presentan las conclusiones y se realiza una discusión
de las herramientas y de los resultados obtenidos,. Se adjuntan también
posibles líneas de investigación futuras que quedan abiertas.
Acompañan al trabajo las referencias bibliográcas, tanto generales de
la teoría de Diseño Óptimo como particulares, que han sido usadas como
obras de consulta y referencia.
Summary
The work hereby presented is built on the mathematical foundations of
Optimum Experimental Design theory. As it is known, this science deals
with the election of the best observations to be carried out in an experiment
in order to obtain the highest and best information about an object. Mo-
deling and statical inference are processes in which information is obtained
through experiments. These experiments are based on precise situations
and, in most occasions, subjected to restrictions of dierent nature.
There are multiple industrial applications of the phenomena and models
we have worked with. Our study has focused on two types of phenomena:
i) the inuence of temperature upon kinetic parameters (Arrhenius model)
and ii) adsorption phenomena. Arrhenius model explains the dependence of
the rate of chemical reactions on the temperature as well as the dependence
of other coecients of transport processes. On the other hand, adsorption
models are frequent in food technology, ltering and depollution processes,
and in construction material industry, to mention just a few.
The chapters included in this report are chronologically organized as
they have been studied and developed, even though permanent revisions
of their content have been required. However, they have been structured
in an autonomous way, with the advantages and disadvantages that this
xiii
xiv Summary
presents, duplicating ideas and concepts in some cases, but always with an
special emphasis on the requirements of the moment.
The Introduction presents the general ideas on which Optimum Ex-
perimental Design theory is based, as well as the present situation and
historical background of the used methods.
Chapter 1 refers to Optimum Experimental Design, theory in which
our work is based on. Notation, inference and regression methods are rstly
introduced to later consider concepts, denitions, theorems and properties
that will be applied in further developments. Optimum criteria being used
are also presented as well as the Equivalence Theorem as a fundamental
foundation that provides a crucial tool to check the optimality of a design.
In order to apply Optimum Design techniques to the studied models, an
interdisciplinary task has been required. Chapter 2 briey summarizes some
concepts and properties merged from the necessary study to obtain the best
possible result. For the sake of showing a well balanced exposition, a nal
Appendix containing some properties related to statistics and physical and
chemical phenomena, whose behaviour is related with the model specied
by Arrhenius equation, has been included.
Chapter 3 is centered in the application of optimization criteria to the
Arrhenius equation and in the steps that have been taken to obtain the
dierent optimum designs. In order to increase the accuracy of the esti-
mations of the parameters for Arrhenius equation, dierent optimum de-
signs have been calculated and compared. With the help of the Equivalence
Theorem, milestone of Optimum Experimental Design theory, D−optimumdesigns have been obtained. Elfving method has been used to obtain dif-
ferent c−optimum designs to obtain the best possible estimations of linear
combinations of the parameters. Compound designs have also been ob-
tained allowing the experimenter to tune the required eciencies for his
estimations.
Traditional designs used have been compared to optimum designs, and
as a result, a valuable method which allows the researcher to choose the
Summary xv
most suitable design has been proposed. This comparison is carried out by
comparing each possible design to an optimum, and therefore showing its
eciency.
As examples, these procedures have been applied to the estimation of
the parameters of Arrhenius equation on measures related to atmospheric
Chemistry. These estimations are used in the modeling of stratospheric pro-
cesses on higher atmospheric layers, which are used to explain the Green-
house Eect and the reduction of the Ozone Layer. This type of processes
have been chosen due to their special characteristics, to the implied expe-
rimental diculties, to the high uncertainty of the available estimations of
the parameters and due to the importance of the correct modeling of such
phenomena.
The results have been presented in the 5th Congress of Romanian Mat-
hematicians, celebrated in Pitesti, Romania, and in the XXX Congreso
Nacional de la Sociedad Estadística Española, celebrated in Valladolid,
Spain (Rodríguez-Aragón and López-Fidalgo, 2003; 2007c) and published in
the journal Chemometrics and Intelligent Laboratory Systems (Rodríguez-
Aragón and López-Fidalgo, 2005) being the article included in the Top25
Hottest Articles5 of the journal for the period April-June 2005.
Chapter 4 includes the development of adsorption models. It starts with
a general description of adsorption phenomena as well as the experimental
procedure to follow to characterize it. The most widely used models have
been described: Langmuir model for monolayer adsorption and BET and
GAB models for multilayer adsorption. The application of Optimum Expe-
rimental Design theory solves the problem of election of the most adequate
model to describe multilayer adsorption, although it leaves unsolved the
problem of designing for observations taken at equilibrium.
Chapter 5 includes the optimum designs for the two mostly used mul-
tilayer adsorption models, BET and GAB models. The dierent criteria of
the scientic community regarding the best adequacy of one or the other
5http://top25.sciencedirect.com
xvi Summary
model have given way to the obtention of T−optimum designs through a
numerical procedure, with the purpose to discriminate between both mo-
dels. Although the recommendations in literature for the design space are
dierent for each model, the lack of t of the BET model in wider design
spaces is blamed to the linearization of the model. Besides, the obtention
of estimations of the parameters with no physical meaning, justied by its
better t of the model to the data, makes of the T−optimum designs a
tool of the greatest interest. The use of the Equivalence Theorem provides
a stopping rule for the numerical algorithm in terms of a lower bound for
the eciency.
Once the model has been chosen, D− and c−optimum designs for both
models have been computed. For the BET model, in an analytical way, with
two unknown parameters, and numerically for the GAB model, with three
unknown parameters. The use of the graphical Elfving method to obtain
c−optimum designs for the GAB model presents several diculties, which
have been avoided by using a numerical algorithm.
Experimenters are suspicious to carry measurements following optimum
designs, due to their small number of support points, so once again, e-
ciencies for dierent designs with a greater number of support points have
been calculated. The process has provided a valuable tool to decide which
of the possible designs turns to be the most interesting for the researcher's
requirements. At the same time, the obtention of D− and c−eciencies for
T−optimum designs is possible, allowing to know in advance their perfor-
mance regarding these criteria.
The samples used to illustrate the obtained designs are referred to food
industry, more precisely to characterize the moisture adsorption, which
becomes so important when judging the quality of so many food stu and
the shelf life predictions of the products. That is not the only application
of adsorption phenomena. Among others, surface area estimations of solid
materials or the application to the study of heterogenous catalysis play an
Summary xvii
important role. It must be pointed out the relevance of surface Chemistry6,
among which adsorption phenomena are included, since it has been awarded
with the Nobel Prize in Chemistry 2007.
The results obtained have been presented in the International Congress
of Mathematicians, held in Madrid, Spain; in the International Conference
on Mathematical and Statistical Modelling, held in Ciudad Real, Spain, and
in the 8th Model Oriented Design and Analysis Workshop, held in Almagro,
Spain, (Rodríguez-Aragón and López-Fidalgo, 2006a; 2006b; 2007b). The
whole work was published in the journal Chemometrics and Intelligent
Laboratory Systems (Rodríguez-Aragón and López-Fidalgo, 2007a).
Chapter 6, brings into consideration one of the problems that have ap-
peared through the development of optimum designs for Arrhenius equa-
tion. It has been one of the many problems and questions that have merged
during the undertaking of our work. The problem appears when instead of
considering the rate of a chemical reaction, temperature dependent, as a
directly measurable magnitude, this variable is considered as a parameter
obtained in a previous t of several observations versus time. Dierent mo-
dels have been gathered for several reaction rates and a simplied model
has been set to analyze the dierences between the usual two stage esti-
mation and the pooled estimation process, which obtains estimators with
lower variance.
Finally, the conclusions and a discussion of the tools and results pre-
sented is included. Future research topics are also traced.
The work includes general Optimum Design and particular bibliograp-
hic references, that have been used for the development of our work.
6Gerhard Ertl (1936), Chemistry Nobel Prize 2007. For his studies of chemical processes onsolid surfaces.
Introducción
El Experimento y su Diseño
Como denición de experimento, suciente para comprender los obje-
tivos de este trabajo, podríamos decir que es un conjunto de observaciones
o medidas llevadas a cabo con el n de alcanzar un conocimiento profun-
do acerca de un objeto. Por lo tanto, multitud de actividades cotidianas
pueden ser catalogadas como experimentos.
Normalmente un experimento requiere de un complejo grupo de accio-
nes o medidas, necesita de la preparación de muestras, de instrumentos
de medida y de un equipo de investigadores capaz de llevarlas a cabo. Sin
embargo hoy en día el procesado de los datos obtenidos juega también un
papel crucial en los resultados del experimento.
La presencia de restricciones sobre las muestras, sobre los instrumentos
de medida y sobre los equipos de investigadores, hacen que los experimen-
tos obtengan información a partir del estudio de un número limitado de
observaciones. El aumento de la complejidad de algunos fenómenos que es-
tán siendo estudiados, hacen necesaria una teoría de Diseños Óptimos que
nos permita obtener la máxima información posible a un mínimo coste,
jugando un papel crucial en este aspecto las herramientas matemáticas.
1
2 Introducción
Tres grupos de herramientas matemáticas son las que se usan en las
actividades experimentales: la Modelización Matemática, el Procesado de
Datos y el Diseño Óptimo de Experimentos. Esto es un complemento ne-
cesario para las ciencias físicas, químicas y biológicas, entre otras ciencias
experimentales, con el objetivo de maximizar la información obtenida de
un experimento.
Así pues un experimento se realiza con el objetivo de obtener informa-
ción a partir del estudio de un número limitado de observaciones. Interesa
que las observaciones analizadas proporcionen una información suciente y
representativa acerca del fenómeno. A primera vista se aprecia que dicha
abilidad crece con el aumento de casos observados, y es cierto, pero en la
práctica, este número se ve limitado por factores económicos, temporales,
de falta de recursos, etc. Además, el tratamiento estadístico de los datos se
complica con el aumento de muestras tomadas.
De lo dicho anteriormente se desprende la necesidad de optimizar los re-
sultados nales empleando para ello las observaciones experimentales opor-
tunas y estrictamente necesarias. El Diseño Óptimo de Experimentos, como
su propio nombre indica, tratará de diseñar un experimento de forma que
se alcance la inferencia estadística más precisa posible con el mínimo coste.
Ya que el objetivo es conocer el comportamiento de un sistema real,
el modelo ha de considerar las características y valores que van a ser ob-
servados, normalmente medidos, en magnitudes físicas. Cuando jamos el
modelo, es necesario expresar el objetivo del experimento, dejando claro
cuáles son las necesidades del futuro usuario del diseño.
El objetivo de maximizar la información obtenida del experimento no
es suciente para la obtención del diseño óptimo, la teoría presenta varios
criterios de optimización entre los que tendremos que elegir a la hora de
crear el diseño óptimo. Para ello es útil combinar las propiedades teóricas
del modelo junto con las experiencias prácticas del observador.
Modelos 3
Modelos
En el presente trabajo estamos principalmente interesados en expe-
rimentos donde el objetivo es conocer el comportamiento de un sistema
ajustándolo a una función o modelo. Estos modelos pueden ser polinómi-
cos o bien, como en nuestro caso, una función no lineal, que representa las
teorías de comportamiento de diferentes fenómenos o mecanismos.
La Estadística actúa como puente entre los modelos matemáticos y
los fenómenos reales, analizando las diferencias que proporcionan los datos
experimentales de los teóricos que se supondrían a partir de un modelo.
Mediante el experimento, obtenemos unas observaciones que nos van a
permitir ajustar la realidad, objeto de estudio, a un modelo. Dicho modelo
debe contener una descripción del estado del objeto observado. Los conjun-
tos de puntos observables se conocen como espacio del diseño. Los estados
de la naturaleza serán las posibles realizaciones del modelo que represen-
tarán a la realidad. Las observaciones hechas en los puntos que el diseño
haya seleccionado serán consideradas como variables aleatorias.
Cualquier teoría de experimentos ha de contar con una consideración
inicial de un modelo matemático. Existen una serie de ventajas de resumir
e interpretar los resultados de un experimento, o el comportamiento de un
fenómeno a través del ajuste a un modelo. Entre estas ventajas se encuentra
la de poder realizar una predicción de los resultados del experimento o de
las respuestas del fenómeno dentro de la region del diseño. Ahora bien,
la optimización del modelo nos puede llevar a la toma de muestras fuera
de la región experimental considerada. Estas extrapolaciones han de ser
tomadas con cautela y comprobado que las condiciones del modelo se siguen
vericando para esa nueva región experimental.
El Diseño Óptimo de Experimentos, está íntimamente ligado a los mo-
delos lineales, es decir, al análisis de la varianza, la regresión y el análisis de
la covarianza. Cuando el modelo es no lineal veremos las técnicas que nos
permiten trabajar con ellos y los inconvenientes que se nos presentan. El ob-
jetivo es lograr la mejor estimación posible de los parámetros desconocidos
4 Introducción
que aparecen en el modelo. Nuestro cometido será elegir adecuadamente los
puntos sobre los que realizar la prueba para que dichos estimadores, tengan
la menor varianza posible, tratando a la vez de minimizar las covarianzas.
La manera en que se va a hacer esto se verá más adelante.
Un estudio apropiado sobre el mejor diseño experimental mejora en
gran medida la estimación en los modelos de regresión.
La elección del modelo para la búsqueda del diseño óptimo es un pro-
blema abierto que no tiene solución general. Interesa buscar un diseño que
dé estimadores precisos para el modelo elegido y que simultáneamente pro-
porcione protección contra modelos inadecuados.
Etapas del Diseño Óptimo de Experimentos
El procedimiento recomendado para la obtención de un diseño óptimo
se puede esquematizar en tres etapas:
1. Elección del modelo para el experimento.
Deben determinarse cuales son las observaciones que pueden
ser tomadas.
Especicar las relaciones entre los parámetros desconocidos del
modelo y las variables observadas.
Determinar la precisión de las observaciones.
Plantear posibles linealizaciones, cambio de parámetros, repa-
rametrizaciones, etc. en el modelo.
Excluir a priori determinadas observaciones que aporten infor-
mación redundante.
2. Cálculo mediante técnicas analíticas o algorítmicas del diseño óp-
timo, eligiendo el criterio de optimización más adecuado.
Especicar el objetivo del experimento de la forma más clara y
precisa posible para así poder elegir o desarrollar el criterio de
optimización más adecuado.
Nota Histórica 5
Intentar calcular el diseño mediante métodos analíticos o itera-
tivos y obtener las estimaciones iniciales de los parámetros en
los casos que sean necesarias.
3. Análisis del diseño obtenido.
Calcular y comparar la eciencia del diseño respecto a los dise-
ños obtenidos mediante otros métodos y respecto a los diseños
utilizados tradicionalmente.
Considerar la posibilidad de realizar cambios en el diseño ópti-
mo con el objetivo de facilitar o hacer posible en la práctica la
obtención de las observaciones, siendo capaces de determinar
la devaluación de la eciencia del modelo y jando límites o
umbrales.
Estas etapas intentan esquematizar el proceso de creación de un diseño
óptimo para un experimento determinado junto con determinadas observa-
ciones que pueden ser tomadas en cuenta a la hora de su cálculo.
Nota Histórica
Hagamos una pequeña introducción histórica para situar el tema. El
primer trabajo en Diseño Óptimo de Experimentos fue publicado en el
año 1918 por Smith. Propuso un criterio para la regresión polinomial que,
más tarde, fue llamado G-optimización (Generalized Variance) por Kiefer
y Wolfovitz 1959. Sin embargo ha sido a partir de los años cincuenta cuan-
do se ha comenzado a trabajar en mayor medida en este tema. El punto
de arranque para el desarrollo de esta teoría fue la matriz de dispersión
o matriz de covarianzas, obtenida por el método de mínimos cuadrados,
cuya inversa es proporcional a la llamada matriz de información. El Diseño
Óptimo de Experimentos se desarrolla en dos corrientes paralelas. Por una
parte G. E. P. Box y sus seguidores (N. R. Draper, J. S. Hunter, Lucas,
Wilson y otros) basan su trabajo en la matriz de dispersión para valorar
la elección de los puntos de observación, y no emplean los llamados crite-
rios alfabéticos. Desde este punto de vista la generalización a funciones
6 Introducción
no polinómicas se hace problemática. Por otro lado, J. Kiefer propondrá
el empleo de funciones de la matriz de dispersión como posibles criterios
de optimización, desarrollando así la llamada teoría convexa de diseños
aproximados. La novedad estriba en considerar un diseño como medida de
probabilidad. Algunos de sus seguidores son Atwood, Covey-Crump, Silvey,
Fedorov, Karlin, Studden, Whittle, Wynn, etc.
En 1943 Wald establece el criterio de maximización del determinante
de la matriz de información. Más tarde Kiefer y Wolfovitz en 1960 le darán
el nombre de D-optimización (Determinant) y extenderán su utilización
al modelo de regresión más general. Es éste el más popular de todos los
criterios. En 1953, Cherno utiliza el teorema de Taylor para linealizar mo-
delos no lineales. Emplea para ello un valor inicial de los parámetros y el
criterio de la maximización de la traza de la matriz de información (A-
optimización, Average), que ya había utilizado Elfving (1952). El propio
Elfving aborda el problema de la optimización de una combinación lineal
de los parámetros introduciendo el criterio de c-optimización y proporcio-
nando incluso un método gráco para el cálculo del diseño c-óptimo. En
1955 Ehrenfeld establece un nuevo criterio de optimización que consiste
en maximizar el mínimo autovalor de la matriz de información, y que sea
llamado E-optimización (Eigenvalues). Son estos, entre otros, los llamados
criterios alfabéticos, por la denominación que se les ha ido dando.
Hoel (1958) comprueba en algunos casos, que los criterios de Smith
y de Wald dan los mismos resultados. Con esto se muestra precursor del
Teorema de Equivalencia que establecerán Kiefer y Wolfovitz en 1959.
Kiefer y Wolfovitz han contribuido en gran medida al diseño óptimo de
experimentos. A ellos se deben dos grandes resultados: la idea del diseño
como medida, como ya se ha comentado, y el Teorema de Equivalencia
entre los criterios de D y G-optimización. También proviene de ellos la
consideración del problema de optimización parcial cuando no interesa o
no es necesaria la optimización de todos los parámetros. Kiefer extiende el
Teorema de Equivalencia a esta situación.
Nota Histórica 7
Por esas fechas Box y Lucas (1959) aplicaron el criterio de D-optimi-
zación en modelos no lineales. Usando un argumento geométrico obtienen
diseños de m puntos para modelos de m parámetros. Demuestran que el
diseño D-óptimo maximiza el volumen del elipsoide de conanza de las
estimaciones de los parámetros.
De modo independiente Wynn (1970) y Fedorov (1972) son los primeros
en desarrollar un método general para la construcción del diseño D-óptimo.
Demuestran también que dicho algoritmo converge y dan un valioso proce-
dimiento para calcular la matriz de información y su inversa en cada paso
a partir de los cálculos hechos en el paso anterior. El libro de Fedorov es
publicado en ruso en 1969. Wynn (1970) publica un artículo con el desarro-
llo del algoritmo de construcción de diseños D-óptimos. Cuando en 1972 se
publica la traducción del libro de Fedorov hecha por Studden aparece en él
reejado básicamente el mismo algoritmo. Hoy día se admite la producción
independiente del algoritmo por los dos autores.
Box y Hunter en 1965 obtienen un algoritmo para la determinación
del diseño D-óptimo en el modelo no lineal. Se trata esencialmente de una
aplicación de la versión de los algoritmos sugeridos por Fedorov y Wynn a
partir del Teorema de Equivalencia. Draper y Hunter (1967), discutieron el
problema de seleccionar distribuciones de parámetros a priori con el objeto
de obtener diseños para modelos no lineales. Atkinson y Hunter (1968)
extendieron los resultados de Box y Lucas al caso en que el diseño toma
más de m puntos. Box (1968a; 1968b; 1969; 1970) da algunos resultados
adicionales para modelos no lineales.
Por su parte Silvey y Titterington en 1973 dan una interpretación geo-
métrica del diseño óptimo y plantean un algoritmo para obtener un diseño
D−óptimo en el espacio dual. El propio Titterington (1976) ahondará en
los aspectos geométricos del D-óptimo. Whittle (1973) generaliza el Teo-
rema de Equivalencia para cualquier función criterio convexa, y al mismo
tiempo White (1973) lo extiende a diseños para modelos no lineales. Kie-
fer (1974) da resultados de equivalencia para otros criterios. Wu y Wynn
8 Introducción
(1978) dan condiciones generales para la convergencia de los algoritmos
para la obtención del diseño óptimo.
Hill (1980) demostró que si un modelo no es lineal en alguno de los pará-
metros, entonces el diseñoD-óptimo no depende del valor de los parámetros
en que es lineal. Currie (1982) compara diversos diseños para estimar los
parámetros en la ecuación de Michaelis-Menten, frecuentemente utilizada
en cinética de enzimas. Abdelbasit y Placket (1983) trabajan con modelos
de regresión logística y obtienen diseños que maximizan la información so-
bre los parámetros en el modelo. Otros desarrollos interesantes se deben a
Atkinson (1982) y Pázman (1980), entre otros.
El artículo de Ash y Hedayat (1978) es una amplia recopilación de la
bibliografía sobre diseño óptimo hasta ese momento. Una buena introduc-
ción al tema la hacen John y Draper en 1975. Los libros de Fedorov (1972),
Silvey (1980), Pázman (1986) y los más recientes de Atkinson y Donev
(1992) y Pukelsheim (1993) son un buen compendio de los resultados más
importantes obtenidos hasta esos momentos. En 1985 se publicó un libro
recogiendo una colección de artículos de Kiefer sobre diseño óptimo de ex-
perimentos (Brown et al., 1985). Dicha colección es de un inestimable valor
para los investigadores en esta materia. A la memoria de Kiefer está tam-
bién dedicado el libro de Shah y Sinha (1989). Entre los de más reciente
aparición destacar el de Schwabe (1996), que se centra en modelos multi-
factoriales, y el de Fedorov y Hackl (1997), donde se introducen temas y
modelos de interés en la investigación actual en diseño óptimo. En España
resaltar la aparición del libro de Rodríguez Torreblanca y Ortíz Rodríguez
(1999), el que posiblemente sea el primer volumen en español dedicado
íntegramente a Diseño Óptimo de Experimentos.
La teoría general del diseño se ha desarrollado inicialmente para mode-
los lineales. Para modelos no lineales se complican los métodos para obtener
los diseños óptimos y hay que realizar algunas modicaciones como las ya
anteriormente citadas de Box (1968a) y las posteriores de Ford, Tittering-
ton y Kitsos (1989) y Khuri y Lee (1998).
Nota Histórica 9
Entre las monografías más recientes dedicadas al diseño cabe destacar
la aplicación de los métodos algebraicos al diseño de experimentos por
parte de Pistone, Riccomagno y Wynn (2000) y el enfoque funcional por
parte de Melas (2005) que está formado por un compendio de los trabajos
del autor durante las dos últimas décadas. Además la aplicación de esta
disciplina a ramas aplicadas de la ciencia cobra cada vez más fuerza por
el interés de reducir costes en la realización de experimentos sin renunciar
a la eciencia en los procesos de inferencia estadística. Una colección de
trabajos aplicados a los campos de la Biología, Epidemiología, Medicina,
entre otros, ha sido recogida por Berger y Wong (2005).
Destacar la celebración periódica desde el año 1987, cada tres años, de
una reunión de carácter internacional con el objetivo de reunir a investiga-
dores de todo el mundo que trabajan en el campo del diseño óptimo. Los
trabajos presentados en estas reuniones han sido publicados y forman un
resumen de los avances de los investigadores más punteros en este ámbito.
La última de estas reuniones, mODa8, se ha celebrado en el año 2007 en Al-
magro (España), bajo el auspicio de la Universidad de Castilla-la Mancha
(López-Fidalgo et al., 2007a).
El uso de la informática en los diversos campos de la estadística supone
un avance considerable. En particular, en el Diseño Óptimo de Experimen-
tos, entre los primeros que investigan sobre esto están Box y Hunter (1965)
para modelos no lineales. La ayuda del ordenador fue estimulada con el
n de conseguir diseños óptimos exactos en N pruebas. El algoritmo infor-
mático más popular es DETMAX, desarrollado por Mitchell (1974) para
la búsqueda de diseños D-óptimos. En 1980, Galil y Kiefer hacen algunas
modicaciones. Welch (1982) desarrolla un nuevo programa más completo.
Más tarde Atkinson y Donev (1992) proponen un programa en FORTRAN
para diseños exactos. Paralelamente en 1974, Snee y Marquardt desarro-
llan el programa XVERT para el diseño óptimo en mixturas de modelos.
En 1983, Nigam y Gupta proponen una nueva versión de este algoritmo.
Hardin y Sloane crean en 1994 el programa GOSSET, capaz de buscar dise-
ños óptimos respecto de algunos criterios muy utilizados para los modelos
10 Introducción
polinómicos de grados bajos, con multitud de variables de tipos distintos y
restricciones de varias clases. En 1995, Rasch y Darius realizan una revisión
de los programas que se pueden utilizar para distintos aspectos del dise-
ño, tanto creados especícamente para este objetivo como formando parte
de otros paquetes más generales. El programa SAS incluye en sus últimas
versiones un módulo dedicado al cálculo de diseños óptimos, el trabajo de
Atkinson, Donev y Tobias (2007) presenta la teoría del Diseño Óptimo de
forma paralela al desarrollo de la misma usando SAS.
Capítulo 1
Diseño Óptimo
La Estadística actual, fruto de la unión del Cálculo de Probabilidades,
cuyo objetivo era el estudio de los juegos de azar, y de la Estadística,
centrada en la descripción de datos, actúa como puente entre los modelos
matemáticos y los fenómenos reales. Mediante ella y el uso de métodos
matemáticos, se modeliza un fenómeno natural. Para ajustar el modelo, se
lleva a cabo un experimento, se analizan los datos obtenidos y se mejora la
estrategia experimental generando un diseño óptimo.
Las ciencias experimentales (Física, Química, Biología, Medicina, So-
ciología,...) basan sus resultados nales en esta base matemática, y como
tal, su importancia no ha dejado de crecer paulatinamente hasta hacerse
casi indispensable en la mayoría de las disciplinas actuales.
En algunos problemas de Estadística se tiene cierto control sobre el
lugar y la proporción de datos experimentales que se van a recoger. Estos
problemas, en los que el experimentador puede elegir, al menos hasta cierto
punto, el experimento concreto que se va a llevar a cabo, se llaman pro-
blemas de Diseño de Experimentos. El diseño de experimentos y el análisis
estadístico de los datos están estrechamente relacionados: para diseñar ade-
cuadamente un experimento conviene tener en cuenta el análisis estadístico
que se realizará con los datos que se van a obtener, y no se debería llevar a
11
12 1. Diseño Óptimo
cabo un análisis estadístico de datos experimentales sin considerar el tipo
concreto de experimento del cual se obtienen los datos.
El Diseño Óptimo de Experimentos está íntimamente ligado a los mo-
delos lineales: al análisis de la varianza, la regresión y el análisis de la
covarianza. El objetivo es lograr la mejor estimación posible de los paráme-
tros desconocidos que aparecen en el modelo. En determinadas situaciones
es necesario el uso de modelos no lineales, preriéndose éstos a sus lineali-
zaciones, sobre todo en el caso en el que dejan de vericarse determinadas
hipótesis acerca del error (Ruppert et al., 1989).
1.1. Modelos de Regresión
En distintas ocasiones nos encontramos ante el hecho de intentar ex-
presar una variable y en función de otra u otras x1, . . . , xm. Esto se podría
escribir de la forma
y = η(x, θ) + ε,
donde θ representa un conjunto de parámetros desconocidos cuya especi-
cación determina completamente la función η, llamada supercie de res-
puesta. La hipótesis habitual es que se verica E[ε] = 0, siendo ε el error.De una manera alternativa el modelo se puede escribir
E[y] = η(x, θ).
La elección de la función η es esencial a la hora de construir el mode-
lo. Por un lado, x representa las condiciones experimentales que pueden
ser elegidas por el experimentador, a partir de un dominio experimental
X, también llamado espacio del diseño. Por otro lado, θ es un vector de
parámetros de un dominio Θ, desconocidos para el experimentador. El ex-
perimentador controla x, mientras que la naturaleza determina θ. El tér-
mino de error en el modelo puede englobar desde los errores al realizar las
medias hasta los errores debidos a la especicación del modelo. Debido a
1.2. Método de los Mínimos Cuadrados Generalizados 13
este error aleatorio, repetir experimentos nos lleva generalmente a diferen-
tes respuestas observadas incluso si las condiciones experimentales son las
mismas.
La situación más simple que podría darse es un modelo lineal
y = f t(x) θ + ε,
con f t(x) = (f1(x), . . . , fk(x)) y θt = (θ1, . . . , θk). La linealidad se reere
respecto de los parámetros θ.
Ahora bien, no todas las situaciones presentes en la naturaleza o nece-
sarias de una tarea de modelización siguen modelos lineales. Muchos fenó-
menos son modelizados mediante modelos no lineales en los que la variable
respuesta y depende de θ a través de una relación funcional del tipo
y = η(x, θ) + ε,
donde la función respuesta η es una función no lineal respecto del vector
de parámetros θ.
Una ventaja de los modelos no lineales es que acostumbran a tener
menos parámetros que modelos equivalentes de naturaleza polinómica y la
extrapolación a valores fuera del rango de valores muestreados, raramente
produce predicciones excesivamente erróneas. Como desventaja destacare-
mos la dependencia, en los diseños óptimos calculados para estos modelos,
de los propios parámetros.
1.2. Método de los Mínimos Cuadrados Generalizados
Parece ser que fue descubierto independientemente por Gauss1 y Le-
gendre2 y apareció por primera vez publicado por Legendre en 1805. Una
de sus primeras aplicaciones fue en el cálculo de órbitas de planetas.
El método, tal y como es usado hoy en día en Estadística, es el siguiente:
1Karl Friedrich Gauss (1777-1855).2Adrien Marie Legendre (1752-1833).
14 1. Diseño Óptimo
Consideremos un modelo general
y = η(x, θ) + ε,
siendo Σε la matriz de covarianzas de los errores.
La suma de cuadrados de los errores ponderada por la matriz de
covarianzas de las observaciones es entonces
εtΣ−1ε ε = [y − η(x, θ)]tΣ−1
ε [y − η(x, θ)].
El estimador mínimo cuadrático de θ es el valor θ que al ser sustituido
en la ecuación anterior minimiza εtΣ−1ε ε. Habitualmente se puede calcular
derivando la ecuación respecto de θ e igualando a cero.
En el caso lineal, detallado en el apartado anterior, y considerando el
caso de observaciones incorreladas, la solución tiene las siguientes propie-
dades:
Es un estimador de θ que minimiza la suma generalizada de cuadra-
dos de los errores, sean cuales sean las propiedades de la distribución
de éstos.
Los elementos de θ son funciones lineales de las observaciones y1,
. . . ,yN , y proporcionan estimadores centrados de θ con varianza
mínima, entre todas las funciones lineales de las observaciones que
proporcionan estimadores centrados, sea cual sea la distribución de
los errores.
Si los errores se distribuyen normalmente con media 0 y varianza
constante σ2, entonces θ es el estimador máximo verosímil de θ.
Esto es debido a que la función de verosimilitud para la muestra
sería en este caso
f(y1, . . . , yN ) =1
σn(2π)n/2exp
− 1
2σ2εtε
.
Así que para un valor jo de σ, maximizar la función de verosimi-
litud equivale a minimizar la suma generalizada de cuadrados de
1.3. Contexto del Diseño Óptimo 15
los errores. Esto es una buena justicación del empleo del procedi-
miento de mínimos cuadrados.
En los modelos no lineales suele ser necesario recurrir a algoritmos
numéricos, como el de Levenberg-Marquardt (Levenberg, 1944; Marquardt,
1963).
Si hemos utilizado el método de mínimos cuadrados para estimar θ por
θ, estén los errores distribuidos normalmente o no, tenemos los siguientes
resultados:
El vector de residuales es ε = y − y
En el caso del modelo lineal con varianza constante σ2, la ma-
triz de covarianzas de los estimadores de los parámetros es Σβ =(XtX)−1σ2. La varianza σ2 se puede estimar por máxima verosimi-
litud, y desde el punto de vista del diseño óptimo de experimentos
se puede eliminar sin más que introducirla en el modelo, incluso
aunque no sea constante.
1.3. Contexto del Diseño Óptimo
En lo que sigue utilizaremos modelos de regresión con observaciones
incorreladas. El modelo vendrá determinado por los integrantes que des-
cribimos a continuación. En primer lugar hemos de especicar el conjunto
de puntos observables, donde valoran las llamadas variables controlables.
Dicho conjunto recibe el nombre de espacio del diseño o dominio experi-
mental y será denotado por X. En la práctica el espacio X va a ser un
subconjunto compacto de un espacio euclídeo (con frecuencia un intervalo
de la recta real). Por este motivo no constituye restricción grave suponer
desde ahora en adelante que dicho conjunto es compacto.
Entenderemos por estado, ϑ, una función que asigna a cada punto de
X el promedio de las cantidades y(x) observadas en él. Estas cantidades
son variables aleatorias que dependen de la inestabilidad de las condiciones
16 1. Diseño Óptimo
siendo su varianza conocida:
σ2(x) = E(y(x)− E[y(x)]2),
mientras que la esperanza es parcialmente desconocida:
ϑ(x) = E[(y(x)] = η(x), x ∈ X.
Un buen diseño tratará de reducir al mínimo la inuencia de la inestabilidad
de las condiciones. También se podría expresar:
y(x) = η(x) + εx, x ∈ X, E(εx) = 0.
La función η se conoce como supercie respuesta o función de regresión.
Habitualmente supondremos que dicha función es parcialmente conocida,
es decir, que está dentro de un conjunto paramétrico de funciones:
η(x) = η(x, θ),
donde los parámetros θt = (θ1, . . . , θm) ∈ Rm son desconocidos y su especi-
cación determina totalmente a η. Del mismo modo, la varianza podría ser
parcialmente conocida, dependiente de estos mismos parámetros u otros,
que se introducirían en el modelo para la búsqueda del diseño óptimo.
1.4. Diseños Exacto y Aproximado
Si de antemano suponemos que el número de observaciones que pode-
mos realizar es N , llamaremos diseño de tamaño jo o diseño exacto de
tamaño N a una sucesión de N puntos de X, x1, . . . , xN , donde eventual-
mente podrían coincidir algunos de ellos. Con el objeto de no repetir puntos
denotaremos por Nx el número de observaciones realizadas en el punto x.
Podemos entonces asociar a este diseño la medida de probabilidad discreta:
ξ(x) =Nx
N, x ∈ X.
Esto sugiere una denición más general de diseño aproximado o asintó-
tico como una medida discreta de probabilidad, ξ, en X con soporte nito.
1.5. Estimadores de Funcionales Lineales 17
Cabría aún una denición más general del diseño como una medida de
probabilidad cualquiera, en cuyo caso aparecerían también diseños conti-
nuos (Atkinson y Donev, 1992). Aunque en ocasiones estos diseños podrían
ser poco viables en la práctica, son convenientes para demostrar ciertas pro-
piedades. Además eligiendoN sucientemente grande, podremos aproximar
un diseño de estas características a uno exacto, tomando un número cercano
a N · ξ(x) observaciones en el punto x. Por supuesto estas aproximaciones
proporcionan diseños tanto mejores cuanto mayor sea N , resultando peli-
grosas para tamaños pequeños. Con respecto a su eciencia véase Imhof,
López-Fidalgo y Wong (2001), que extienden los diseños exactos conocidos
en regresión polinomial y dan cotas de eciencia para diseños aproximados
redondeados con métodos tradicionales (Pukelsheim, 1993). El programa
BAZI3 permite realizar estos redondeos mediante diferentes métodos lo-
grando que el diseño exacto obtenido sea el de mayor eciencia respecto al
aproximado considerado.
El diseño concentrado en los puntos x1, ..., xN , con pesos respectivos
p1, ..., pN (0 ≤ pi ≤ 1 para i = 1, ..., N ;∑N
i=1 pi = 1) se denotará por
ξ =
(x1 ... xN
p1 ... pN
)y el peso de un punto xk, se denotará también como ξ(xk) = pk.
El soporte de un diseño ξ será:
Xξ = x ∈ X : ξ(x) > 0.
1.5. Estimadores de Funcionales Lineales
En muchas ocasiones va a resultar más interesante estimar determina-
das relaciones entre los parámetros que estimar cada uno de ellos. Esto
sugiere la denición de funcional lineal, g, como una función lineal del es-
pacio de estados en la recta real:
g : Θ −→ R.
3http://www.math.uni-augsburg.de/stochastik/bazi
18 1. Diseño Óptimo
Supondremos que la aplicación g tiene como matriz asociada en la base
f1, . . . , fm de Θ, el vector ct = (c1, . . . , cm). Es decir, dado un estado:
ϑ(x) =m∑i=1
θifi(x),
entonces g(θ) = θtc.
Buscaremos entonces una buena estimación de g(θ). Su valor será cal-
culado a partir de los datos experimentales, utilizando para ello una función
lineal de las variables respuesta:
N∑i=1
aiy(xi),
donde a1, . . . , aN son ciertos coecientes que habrá que determinar bajo
ciertas exigencias. A esta función se le llamará estimador lineal de g. Dire-
mos además que es un estimador centrado siempre que:
E
[N∑i=1
aiy(xi)
]= g(θ),
Diremos que g es estimable si existe al menos un estimador lineal cen-
trado de g. El mejor estimador lineal centrado será aquél que tenga mínima
varianza (BLUE, the Best Linear Unbiased Estimator), es decir, el estima-
dor:N∑i=1
a?i y(xi),
tal que:
V ar
[N∑i=1
a?i y(xi)
]= mın
V ar
[atY
]:a ∈ RN ,E[atY
]= g(θ), θ ∈ Θ
.
En resumen, dicho estimador vendrá dado por los coecientes a?i tales que:
N∑i=1
a?2i σ2i = mın
N∑i=1
a2iσ
2i : A ∈ RN ,
N∑i=1
aiθ(xi) = g(θ), θ ∈ Θ
.
Nos interesa obtener una expresión explícita de estos coecientes.
1.6. Matriz de Información 19
1.6. Matriz de Información
Dado un diseño de tamaño jo N , utilizaremos la siguiente notación:
Y = (y(x1), . . . , y(xN ))t,
θ = (θ1, . . . , θm)t,
X =
f1(x1) . . . fm(x1). . . . . . . . .
f1(xN ) . . . fm(xN )
.
Denición 1. La matriz de información de un diseño exacto x1, . . . , xN ,
se dene como la matriz:
M = XtΣ−1X,
donde Σ = diag(σ2(x1), . . . , σ2(xN )).
Generalizando para diseños aproximados o asintóticos.
Denición 2. Se dene la matriz de información asociada a un diseño
aproximado ξ como la matriz de orden m:
M(ξ) =∑x∈X
f(x)f t(x)σ−2(x)ξ(x)
Observación 1. La matriz de información de Fisher4, supuesta la norma-
lidad de las observaciones, coincidirá con la matriz de información denida
anteriormente:
M(ξ) = −Eξ[
∂2
∂αi∂αjlog l(y, θ, σ2)
]= Eξ
[∂ log l∂αi
∂ log l∂αj
],
donde l es la función de verosimilitud de la muestra. Esta denición será así
aplicable a modelos no lineales, pero entonces dependerá de los parámetros
que se quieran estimar.
Puede darse una denición análoga en cuanto a la matriz de información
de un diseño continuo. A partir de ahora utilizaremos solamente diseños
aproximados o asintóticos y los denominaremos simplemente diseños. Si ξ
4Ronald Aylmer Fisher (1890-1962).
20 1. Diseño Óptimo
es un diseño exacto x1, . . . , xN entonces, según esta nueva denición de
matriz de información asociada a un diseño, en general tendremos:
M(ξ) =1N
∑x∈X
fi(x)fj(x)σ−2(x)Nx =1NM
La ventaja de esta denición es que M(ξ) no depende del tamaño de la
muestra, N , sino de la proporción de observaciones en cada punto. Incluso,
si hay homocedasticidad, suele considerarse
M(ξ) =1
σ2NM,
de modo que no aparezca ningún parámetro en la matriz de información.
Denición 3. Sea A una matriz cualquiera de orden m. Se denen los
conjuntos siguientes:
M(A) = Au : u ∈ Rm
N (A) = u ∈ Rm : Au = 0,
que son los subespacios imagen y núcleo de la aplicación lineal asociada a
la matriz A.
Denotaremos por Ξ al conjunto de todos los diseños en el modelo, mien-
tras que el conjunto de todas las matrices de información será:
M = M(ξ) : ξ ∈ Ξ.
El conjunto M tiene en general una estructura más sencilla que el con-
junto Ξ. De hecho, como veremos en la siguiente proposición, M es un
subconjunto convexo de un espacio euclídeo, el de las matrices cuadradas
de orden m y simétricas. Además la varianza de un estimador será función
de la inversa generalizada de la matriz de información.
Nota: Dada una matriz cualquiera, A, diremos que A− es una inversa
generalizada (también llamada g-inversa o pseudoinversa) cuando AA−A =A. Otra denición equivalente a ésta es la siguiente: A− es una inversa
generalizada de A si A−u satisface la ecuación Ax = u para cada u de
M(A). La inversa generalizada existe siempre, pero en general no es única,
1.6. Matriz de Información 21
así A− denotará la clase de las inversas generalizadas de A. Si A es cuadrada
y regular entonces la inversa generalizada coincide con la matriz inversa.
Cuando la matriz A es simétrica, existe una g-inversa muy particular,
que se debe a Penrose, y que denotaremos por A+. Esta matriz es la única
que verica lo siguiente:
A+u =
0 si u ∈ N (A)wu si u ∈M(A)
donde wu es el único vector de M(A) tal que Awu = u. Por tanto A+
verica A+AA+ = A+ y AA+A = A, de modo que a su vez A es la g-
inversa de Penrose de A+.
Proposición 1. El conjuntoM es convexo.
Demostración: Sean ξ1, ξ2 ∈ Ξ y 0 < λ < 1, entonces:
(1− λ)M(ξ1) + λM(ξ2) = M [(1− λ)ξ1 + λξ2] ∈M.
Observación 2. En muchas ocasiones suponer, en el Diseño Óptimo de
Experimentos, que la varianza de las observaciones es uno, σ2(x) = 1, nosupone una pérdida de generalidad, sin más que sustituir σ−1(x)θ(x) y
σ−1(x)f(x) por θ(x) y f(x) respectivamente. En este caso la matriz de
información quedará:
M(ξ) =∑x∈X
f(x)f t(x)ξ(x).
En lo que sigue se supondrá siempre que σ2(x) = 1, salvo que se especiquelo contrario.
Proposición 2. Se verica que
1. La matriz de información es simétrica y semidenida positiva.
2. Si ξ tiene menos de m puntos en su soporte, entonces detM(ξ) = 0.
22 1. Diseño Óptimo
3. Se puede deducir la siguiente expresión explícita para el determi-
nante de la matriz de información:
detM(ξ) =∑
k1<...<km
ξ(xk1) · · · ξ(xkm) det[fi(xkj )]2.
Demostración:
1. La denición de la matriz de información muestra directamente
que se trata de una matriz simétrica. Además, sea u vector de Rm,
entonces:
utM(ξ)u =∑x∈X
utf(x)f t(x)uσ−2(x)ξ(x)
=∑x∈X‖ utf(x) ‖2 σ−2(x)ξ(x) ≥ 0.
Veremos más adelante que la inversa de la matriz de información
es proporcional a la matriz de covarianzas, que prueba directamente
la condición de denido positiva en el caso no singular.
2. Supongamos que ξ tiene en su soporte k < m puntos: x1, . . . , xk.
En el desarrollo del determinante aparecerán siempre al menos dos
columnas iguales y por tanto el determinante ha de ser cero.
3. Para simplicar supondremos que σ(x) = 1. En primer lugar tra-
taremos el caso en el que el soporte se reduce a m puntos, Xξ =x1, . . . , xm. Llamaremos:
mij =∑xk∈Xξ
fi(xk)fj(xk)ξ(xk),
aik = fi(xk)ξ(xk), bjk = fj(xk).
Denotando A = (aik) y B = (bjk) tendremos la siguiente expresión:
detM(ξ) = detAdetB =m∏k=1
ξ(xk) det[fi(xj)]2.
1.6. Matriz de Información 23
En el caso más general en que Xξ = x1, . . . , xr con r ≥ m ten-
dremos:
detM(ξ) = det [∑r
k=1 fi(xk)fj(xk)ξ(xk)]=
∑τ∈Sr det
[fi(xτ(j))fj(xτ(j))ξ(xτ(j))
]=
∑τ∈Sr
∏mk=1 ξ(xτ(j)) det[fi(xτ(j))]2
=∑
k1<...<kmξ(xk1) · · · ξ(xkm) det[fi(xkj )]2,
donde hemos llamado Sr al grupo simétrico de las permutaciones de
orden r. La tercera igualdad se ha obtenido a partir de la anterior.
La expresión del determinante para m puntos era bien conocida.
La fórmula más general que se proporciona aquí se debe a Ardanuy
et al. (1999).
Proposición 3. Se cumplen las siguientes propiedades:
1. g es estimable para el diseño ξ si, y sólo si c ∈M[M(ξ)]. Entoncesexiste un único vector zg ∈M[M(ξ)] de modo que c = M(ξ)zg. Lavarianza del BLUE es:
V ar(g) = N−1ztgM(ξ)zg= N−1ctM−(ξ)c
= N−1 sup (ctα)2
αtM(ξ)α : α ∈ Rm,M(ξ)α 6= 0= N−1 sup2ctα− αtM(ξ)α : α ∈ Rm.
2. Si g1 y g2 son funcionales estimables, entonces:
Cov(g1, g2) = N−1ct1M−(ξ)c2,
Observación 3. Estas expresiones no dependen de la g-inversa elegida.
En efecto, denotando A = M(ξ), si c ∈ M[M(ξ)] existe z tal que c = Az,
luego
ctA−c = ztAA−Az = ztAz,
que no depende de A−. Del mismo modo, si c1, c2 ∈M[M(ξ)] existirán z1,
z2 tales que
ct1A−c2 = zt1Az2,
que de nuevo no depende de la inversa generalizada elegida A−.
24 1. Diseño Óptimo
Observación 4. La denición general de funcional estimable hacía refe-
rencia a un diseño exacto. Así ha de entenderse la proposición anterior.
Estos resultados sugieren la siguiente denición:
Denición 4. Dado un diseño ξ y un funcional g, se dene la varianza
generalizada de g respecto del diseño ξ como:
V arξg = sup
(ctα)2αtM(ξ)α
: α ∈ Rm,M(ξ)α 6= 0,
que puede también escribirse de la forma:
V arξg =
ctM−(ξ)c si c ∈M[M(ξ)]∞ si c 6∈ M[M(ξ)]
.
Y se dene la covarianza generalizada de dos funcionales g1 y g2 respecto
de ξ como:
Covξ(g1, g2) = ct1M−(ξ)c2.
Estamos interesados en buscar ξ de manera que se hagan pequeñas
las varianzas y covarianzas de este tipo. A este n van encaminadas las
siguientes proposiciones, cuya demostración por brevedad se omite (véase
Pázman (1986) para más detalles).
Proposición 4. Si M(ξ) ≥ M(η), es decir M(ξ)−M(η) es semidenidopositiva, entonces V arξg ≤ V arηg cualquiera que sea el funcional lineal
g denido en el espacio de estados. Recíprocamente, si V arξg ≤ V arηg
entonces se cumple que:
M[M(ξ)] ⊃M[M(η)] y utM(ξ)u ≥ utM(η)u, u ∈M[M(η)].
Proposición 5. M(ξ) = M(η) si, y sólo si V arξg = V arηg, para cada
funcional lineal, g, denido en el espacio de estados.
Proposición 6. Si M(ξ) y M(η) son regulares, entonces:
M(ξ) ≥M(η)⇐⇒ V arξg ≤ V arηg, para cada funcional g.
Además:
M(ξ) > M(η)⇐⇒ V arξg < V arηg, para cada funcional g 6= 0.
1.6. Matriz de Información 25
Proposición 7. Si λ1(ξ) ≤ · · · ≤ λm(ξ) son los autovalores de M(ξ),entonces:
k∑i=1
λi(ξ) ≥k∑i=1
λi(η), k = 1, . . . ,m⇐⇒ V arξg ≤ V arηg, para cada g.
k∑i=1
λi(ξ) >k∑i=1
λi(η), k = 1, . . . ,m⇐⇒ V arξg < V arηg, para cada g 6= 0.
Teorema 1 (Caratheodory5). Sea T un subconjunto de un espacio euclídeo
de dimensión k. Todo punto del cierre convexo de T :
conv(T ) = z =n(z)∑i=1
βiti : βi ∈ [0, 1],n(z)∑i=1
βi = 1, ti ∈ T
puede ser expresado como una combinación convexa de a lo sumo k + 1puntos del conjunto T . Es decir, dado un elemento q de conv(T ), existirán
t1, . . . , tk+1 ∈ T y γ1, . . . , γk+1 ∈ [0, 1] conk+1∑i=1
γi = 1
tal que:
q =k+1∑i=1
γiti
Proposición 8. Si T es un conjunto acotado de Rk entonces conv(T ) escompacto en Rk.
Colorario 1. M es compacto.
Demostración: Denimos:
S = f(x)f t(x) : x ∈ X,
que es imagen de X por la aplicación continua:
X −→ Rm×m | x −→ f(x)f t(x),
y por tanto S es también compacto. Por la Proposición anterior M =conv(S) también lo será.
5Constantin Carathéodory (1873-1950).
26 1. Diseño Óptimo
Damos a continuación un resultado, muy interesante en cuanto a la
búsqueda del diseño óptimo más sencillo, basado en el Teorema de Carat-
heodory, y que es debido a Karlin y Studden (1966), pág. 787.
Proposición 9. Dado un diseño cualquiera ξ existe otro diseño η tal que
M(ξ) = M(η) y cuyo soporte tiene a lo sumo m(m+ 1)/2 + 1 puntos.
Demostración: Denimos el vector:
a(x) = (fi(x)fj(x) : 1 ≤ i ≤ j ≤ m)
A todo elemento de conva(x) : x ∈ X se le puede asociar una matriz de
información unívocamente. Por el Teorema de Caratheodory para el diseño
ξ existirá entonces:
γk ∈ [0, 1] y xk ∈ X, k = 1, . . . ,m(m+ 1)
2+ 1,
de modo que deniendo:
ξ =
(x1 x2 · · ·γ1 γ2 · · ·
),
se obtiene la matriz de información:
M(ξ) =
m(m+1)2
+1∑k=1
γkf(xk)f t(xk).
1.7. Criterios de Optimización
¾Qué queremos decir con diseño óptimo de un experimento? ¾Cómo
entender la expresión el mejor de los diseños posibles? Estas preguntas no
tienen una respuesta unívoca. Si bien es verdad que nos interesará el diseño
que haga mínima la varianza, también es cierto que un diseño puede hacer
mínima la varianza para un funcional lineal, y excesivamente grande para
otro.
Necesitamos por tanto elegir un criterio que sirva para buscar el me-
jor diseño en algún sentido. Su elección dependerá de los intereses que se
1.7. Criterios de Optimización 27
busquen al realizar el experimento, de la facilidad de cálculo, o de otros as-
pectos más o menos subjetivos. Vamos a dar ahora una primera denición
de lo que va a ser una función criterio.
Denición 5. Diremos que una función
Φ :M−→ R ∪ +∞
acotada inferiormente es una función criterio si se cumple lo siguiente:
M(ξ) ≥M(η) =⇒ Φ[M(ξ)] ≤ Φ[M(η)].
Diremos entonces que se trata de un criterio de Φ-optimización. Undiseño que minimice Φ[M(ξ)] se denominará diseño Φ-óptimo y lo denota-
remos por ξ?. El objeto del problema de diseño óptimo consistirá en calcular
un diseño ξ? que minimice Φ[M(ξ)].
Entre las propiedades que sería deseable que vericase una función cri-
terio podemos destacar:
1. Convexidad de la función criterio,
Φ[(1− α)M(ξ1) + αM(ξ2)] ≤ (1− α)Φ[M(ξ1)] + αΦ[M(ξ2)], α ∈ [0, 1].
Esta propiedad es necesaria para que el criterio sea sensible a los
métodos de optimización convexos y para que se verique el Teo-
rema de Equivalencia que consideraremos más adelante.
2. Positivamente homogénea en el sentido
Φ[δM(ξ)] =1δ
Φ[M(ξ)], δ ≥ 0.
Esta propiedad nos permitirá trabajar con M−1(ξ) en lugar deσ2
n M−1(ξ) que es la verdadera matriz de covarianzas de los esti-
madores de los parámetros del modelo. También permitirá dar una
medida apropiada de la eciencia de un diseño respecto de un cri-
terio, concepto que se usará mas adelante para comparar diseños.
28 1. Diseño Óptimo
Las funciones criterio que verican estas propiedades son las que más
nos interesan. A veces son precisas algunas otras condiciones para garanti-
zar la convergencia de algoritmos de cálculo.
Observación 5. Puede ocurrir que dos funciones criterio den lugar a un
mismo criterio de optimización, es decir, que produzcan los mismos diseños
óptimos. Es precisamente lo que demostrará el Teorema de Equivalencia
para algunos criterios que veremos más adelante. Desde luego, dado un
diseño óptimo, todos los diseños que tengan asociada esa misma matriz
de información serán óptimos. Pero también otras matrices de información
podrían corresponder a diseños óptimos. Algunos criterios permitirán esto,
otros no.
Por el Teorema de Caratheodory siempre existirá un diseño óptimo con
1 +m(m+ 1)/2 puntos o menos en su soporte. Para los criterios globales,
las matrices óptimas deben ser regulares, de modo que por la Proposición
2 un diseño óptimo ha de tener al menos m puntos en su soporte.
Notación 1. Llamaremos M+ = M ∈ M : detM > 0. L(M) es el
subespacio vectorial generado por el conjuntoM en el espacio vectorial de
las matrices simétricas de orden m . Si Φ es una función criterio denimos
los conjuntos:
MΦ = M ∈M : Φ(M) <∞,
Ξ?Φ = ξ ∈ Ξ : ξ es Φ-óptimo.
Proposición 10. Si Φ es una función convexa entonces el conjunto Ξ?Φ es
convexo.
Demostración: Supongamos que:
Φ[M(ξ1)] = Φ[M(ξ2)] = mınξ∈Ξ
Φ[M(ξ)],
entonces, por ser Φ convexa tendremos:
ΦM [(1− β)ξ1 + βξ2] = Φ(1− β)M(ξ1) + βM(ξ2)≤ (1− β)Φ[M(ξ1)] + βΦ[M(ξ2)]= mınξ∈Ξ Φ[M(ξ)].
1.7. Criterios de Optimización 29
Denición 6. Se dice que Φ es una función criterio estrictamente decre-
ciente cuando las condiciones M ≥ N y M 6= N implican Φ(M) < Φ(N).
Proposición 11. Si Φ es una función criterio estrictamente decreciente
entonces siempre se puede conseguir que el número de puntos del diseño
Φ-óptimo esté comprendido entre m y m(m+ 1)/2.
Demostración: La cota inferior es consecuencia inmediata de la Pro-
posición 2. En efecto, por el Teorema de Caratheodory sabemos que si ξ es
un diseño tal que M(ξ) está en la frontera deM entonces existen no más
de m(m + 1)/2 diseños unipuntuales de modo que M(ξ) se puede poner
como combinación convexa de ellos. En otras palabras, existe un diseño,
η, con soporte en no más de m(m + 1)/2 puntos tal que M(ξ) = M(η).Si demostramos que todo diseño Φ-óptimo, ξ?, tiene su matriz asociada
en la frontera de M, entonces habremos probado lo que queríamos. Su-
pongamos que no es así, y que M(ξ?) es un punto interior del conjunto
M. Existirá entonces un número positivo α tal que la matriz de informa-
ción (α + 1)M(ξ?) = M(µ) sigue estando en el conjunto M. Ahora bien
Φ[M(µ)] = Φ[(α+1)mM(ξ?)] < Φ[M(ξ?)] (ya que (α+1)mM(ξ?) ≥M(ξ?)y son distintas), que es contradictorio con el hecho de que ξ? es un diseño
Φ-óptimo.
Notación 2. En lo que sigue denotaremos indistintamente Φ[M(ξ)] ó Φ(ξ).
Denición 7. Se dene la eciencia de un diseño ξ respecto de una función
criterio positivamente homogénea Φ como
effΦ(ξ) =Φ(ξ?)Φ(ξ)
,
donde ξ? es el diseño óptimo para el criterio Φ.
Observación 6. En términos prácticos, supongamos que el diseño ξ es
ahora un diseño exacto de tamaño N . Hemos visto que NM(ξ) = M , de
modo que Φ[M(ξ)] = NΦ(M). Así, para conseguir una misma eciencia
con ambos diseños tendríamos que tomar N? observaciones con el diseño
30 1. Diseño Óptimo
ξ?, de modo que
1 =Φ(M?)Φ(M)
=NΦ(ξ?)N?Φ(ξ)
⇔ N?
N= effΦ(ξ).
Así por ejemplo, si la eciencia de un diseño es del 50% entonces bastará
tomar la mitad de observaciones con el diseño óptimo para obtener la misma
precisión que con el diseño original.
Presentamos ahora la denición de gradiente de una función criterio,
necesaria para algunas propiedades de los casos particulares que presenta-
remos a continuación.
Denición 8. Sea Φ una función denida en un entorno de la matriz A
en el espacioMm(R). Se dene el gradiente de Φ en la matriz A como la
matriz de componentes:
5Φ(A)ij =∂Φ(A)∂Aij
; i, j = 1, . . . ,m
Damos a continuación la denición de las funciones criterio utilizadas
en el desarrollo del presente trabajo. Para una relación más completa de di-
ferentes criterios, deniciones y proposiciones se pueden consultar Pázman
(1986) y Rodríguez-Díaz (2000).
1.7.1. D-optimización.
Denición 9. El criterio de D-optimización viene denido por la función
criterio siguiente:
ΦD[M(ξ)] =
log detM−1(ξ) = − log detM(ξ) si detM(ξ) 6= 0∞ si detM(ξ) = 0
Proposición 12. Se verica
1. ΦD es continua enM.
2. La función ΦD es convexa enM y estrictamente convexa enM+.
1.7. Criterios de Optimización 31
3. En las matrices en que ΦD es nita, también es diferenciable. Ade-
más su gradiente es:
5[− log detM ] = −M−1
Observación 7. La gran ventaja de esta función criterio radica en la fa-
cilidad de cálculo respecto al resto. Tiene además una sencilla e intuitiva
interpretación geométrica, ya que las longitudes de los ejes del elipsoide
de conanza de las estimaciones de los parámetros del modelo son pro-
porcionales a las raíces cuadradas de los valores propios de la matriz de
covarianzas. En otras palabras, el diseño D-óptimo, al minimizar el deter-
minante de la matriz de información, minimiza el volumen de la región de
conanza de los parámetros (véase por ejemplo Atkinson y Donev (1992),
pág. 42 y 48-53). También suele considerarse este criterio en la forma:
Φ[M(ξ)] = detM−1m (ξ).
De este modo se consigue homogeneidad, que permite el uso adecuado de la
eciencia. El logaritmo en la denición del criterio permite dar una prueba
más sencilla de la convexidad y proporciona un gradiente más simple.
1.7.2. G-optimización.
Denición 10. El criterio de G-optimización viene denido por la función
criterio siguiente:
ΦG[M(ξ)] = supx∈X
Varξgx, ξ ∈ Ξ.
Puesto que:
gx(θ) = θ(x), x ∈ X, θ ∈ Θ.
entonces:
Varξgx = f t(x)M−1(ξ)f(x),
cuando M(ξ) es regular. De modo que nuestra función puede escribirse de
la forma:
ΦG[M(ξ)] =
maxx∈X f t(x)M−1(ξ)f(x) si detM(ξ) 6= 0∞ si detM(ξ) = 0
32 1. Diseño Óptimo
Proposición 13. La función ΦG es:
1. continua enM.
2. convexa enM y estrictamente convexa enM+.
Observación 8. Para cada x, Varξgx es la varianza generalizada de la
predicción de la respuesta en x. Por tanto, este criterio busca optimizar la
predicción del modelo.
1.7.3. c-optimización.
Con este criterio el interés se centra en la estimación eciente de com-
binaciones lineales de los parámetros ctθ. De este modo se da la siguiente:
Denición 11. El criterio de c-optimización para un vector c de dimensión
m viene denido por la función criterio siguiente:
Φc[M(ξ)] = ctM−(ξ)c.
Se toma esta denición puesto que la varianza de ctθ es proporcional a
ctM−(ξ)c. La desventaja de los diseños c-óptimos es que son singulares con
cierta frecuencia. Elfving (1952) propone un método gráco para el cálculo
del diseño c-óptimo, aplicable sobre todo en el caso biparamétrico:
y = f(x)α+ g(x)β + ε(x), σ2(x) = σ2, x ∈ X.
El método es válido de forma genérica para cualquier dimensión, aunque la
dicultad para construir de forma gráca el conjunto de Elfving hace que
raramente sea usado para modelos con más de dos parámetros. López Fi-
dalgo y Rodríguez Díaz (2004) presentan un procedimiento computacional
para aplicar este método en casos de más de dos dimensiones.
Detallamos a continuación el procedimiento de Elfving para 2 paráme-
tros. Suponemos que se toma un diseño exacto cualquiera, ξ, concentra-
do en l puntos x1, . . . , xl, con pesos pi = Ni/N . Es decir, se toman Ni
observaciones en cada punto xi, siendo N el número total de observacio-
nes realizadas. Tenemos así l puntos del plano real denidos de la forma
1.7. Criterios de Optimización 33
X1 = (f(x1), g(x1)), . . . , Xl = (f(xl), g(xl)). La media de las observaciones
en cada punto xi tiene la siguiente ecuación de regresión:
yi = f(xi)α+ g(xi)β + εi
donde εi tiene varianza σ2/Ni. Denotemos ηi =√piεi, entonces Var(ηi) =
σ2/N . Por simplicidad de notación supondremos que σ2/N = 1, que no
signica ninguna merma en la generalidad de los resultados. De este modo
Var(ηi) = 1. Nos centraremos en estimadores de la forma ϕ =∑l
i=1 aiyi
(yi es el estimador lineal más eciente de f(xi)α + g(xi)β). Para que sea
centrado tiene que cumplir que
E[ϕ] =l∑
i=1
ai [f(xi)α+ g(xi)β] = c1α+ c2β, ∀α, β ∈ R,
es decir, se ha de satisfacer la ecuación vectorial:
l∑i=1
aiXi = c.
La varianza del estimador es
Var(ϕ) = σ2∑i
a2i
Ni=σ2
N
∑i
a2i
pi=∑i
a2i
pi.
Obsérvese que los pi no aparecen en la condición (1.7.3 y para minimizarla
y que se cumpla a la vez la condición∑pi = 1 utilizaremos los multiplica-
dores de Lagrange. Así habrá que hallar p1, . . . , pl, λ que minimicen∑i
a2i
pi− λ(1−
∑i
pi),
de lo que resulta
pi =| ai |∑j | aj |
=⇒ Var(ϕ) =
(l∑
i=1
| ai |
)2
.
34 1. Diseño Óptimo
Nuestro objetivo ahora es, por tanto, tomar los coecientes ai que hagan
mínima la varianza anterior bajo la condición (1.7.3), esto es,
mın
∑i
| ai |:l∑
i=1
aiXi = c
=
mın
∑i
| ai |:l∑
i=1
wi[sgn(ai)Xi] = t c
,
donde
wi =| ai |∑j | aj |
, t =1∑
j | aj |.
En consecuencia buscamos el mayor valor de t de modo que tc esté en el
cierre convexo de x1, . . . , xl. Por tanto
c? = tc =∑i
a?iXi =∑i
t ai Xi,
es una combinación convexa de los vectores ±X1, . . . ,±Xl.
La varianza alcanzará su mínimo cuando el extremo del vector c? coin-
cida con la intersección del vector c, o su prolongación, con el polígono
dado por el cierre convexo Λ de los vectores ±X1, . . . ,±Xl. La varianza es
entonces
Var(ϕ) =1t2
=‖c‖2
‖c?‖2,
y el diseño óptimo (x1 · · · xl|a1|∑j |aj |
· · · |al|∑j |aj |
).
La Figura 1.1 representa este procedimiento para el modelo biparamé-
trico. El punto de corte del vector c, o su prolongación, con la frontera de G
estará situado en el segmento que une dos de los puntos ±X1, . . . ,±Xl (en
este caso son X2 y −X1. Así c? = a?1(−X1) + a?2X2 (con a?1 + a?2 = 1). Co-mo, por otra parte, c? se podría expresar en la forma X2 +λ(−X1−X2) =λ(−X1) + (1− λ)X2, 0 ≤ λ ≤ 1 (por el hecho de estar en el segmento que
une los dos vectores), resulta inmediatamente que a?1(= λ) es proporcional
1.7. Criterios de Optimización 35
a la distancia d1 de c? a X2 sobre el segmento, y a?2 proporcional a la dis-
tancia d2 de c? a X1 sobre ese segmento, que es el método propuesto por
Elfving. \(Z
-4 -3 -2 -1 1 2 3 4
-6
-4
-2
2
4
6
X1
X2
cc*
d2
d1
] < 4 $R&YW:C @ A5 qQR: < $ & 'SP'&($R&t-T &(- 4 -t- RL P,QR/S
8_ 5 'Rd _ @ Fd 5 0 p @ _ PF$-'gDgI9 OQD&($Y-' % < /S[QR 4 4 - ?"qQR$% Dd|p]$% 4 -#QD&`/S.&MQD&(/S[QR$ 4 ' _ Fd IP$%PF$%'&(-&`-.& OQD&(.& ' & 5 0 %i$%H-c % < /S[QRp 2 0 P$%PF$%'&(-c&?-.& OQD&(.& 0 & 5 ' %i$% % % < /S[QRp 4 -c/ qQR:?P$%P 4 OQR+PF$-8 ": < C OQR S&(P-1&(i-hP'&($R& 4 &(- ( 4 $R&oP 4 [QR SPF %i- t- %P'&( - %rbC f8$QD&([QRpF6-.&YP$ &(qQR1&Sg'&(i$ &4 4 1&(- 4 -.&($9-$%$%+["|u,y _ d _ d_ %P'&(S- %rbrd 2 -.&t[QR$% % 7+-.&t$%qQD&S''&SPF$9-T"qQR$ )-.& $%[QR$R&Y?DgY$%$%(C
+ 3 #$ ' 4&# ) "! @! >! @)"! % %'-") , 8%'! !# ? ! @ .# ' # !#%'(%0 .#-?4%')@% % , ! !#%'&*%'? -@!# 4&#! .# , % %,> % @ @ )-%%'(% .# ,+ '-%'8% %! % )" )-% , ' # ! ) ,% , " (%%'(% .#-?4%')@% % %'&*%'? -@! %'-") , 8%'
# 4<4 #$# 4 #$
>qQ%QR)_ @~ NdHP$%PF 4 '&`/0&($R&h~" R&)tQR$R&MQD&($-.&( 4 ?$%#QR$%:'&( CkI7 4 [QD&0-.&( 98 $%[QR H/0& < #Q 4 9+- 9P'&($ &(/SqQR$% 9i:L%qQRH OQR/0&( Bp 4 P$%~":1&(i'&( 4 '&H/ 4,2 OQR[QD&9 4 .&- /S %/S
Figura 1.1. Método gráco debido a Elfving para calcular el diseñoc-óptimo para el modelo biparamétrico
Esto es aplicable para cualesquiera puntos posibles del espacio del di-
seño. Por tanto, en la práctica habrá que calcular el cierre convexo de
f(X) ∪−f(X) (X=espacio del diseño) y la intersección de la recta deni-
da por el vector c con la frontera de dicho cierre.
Observación 9. Este criterio proporciona en particular los mejores dise-
ños para estimar cada uno de los parámetros. Esto es una buena referencia
para estudiar la bondad (eciencia) de un diseño cualquiera para estimar
cada parámetro en particular.
1.7.4. Criterios Compuestos.
Hasta ahora hemos mostrado criterios denidos sobre el espacio de ma-
trices de información M. Existen muchos más criterios de los aquí men-
cionados, pudiéndose encontrar sus formulaciones y propiedades más ca-
racterísticas en la bibliografía existente acerca del tema, Pázman (1986),
36 1. Diseño Óptimo
Atkinson y Donev (1992), Fedorov y Hackl (1997) o Rodríguez Díaz (2000).
La elección de un criterio para el diseño de un experimento en concreto
se basa en los objetivos de dicho experimento. De los criterios presenta-
dos hasta ahora, el de D−optimización minimiza el volumen de la región
de conanza de las estimaciones de los parámetros, el de G−optimización
busca optimizar la predicción del modelo y el de c−optimización se cen-
tra en la estimación eciente de combinaciones lineales de los parámetros,
los demás criterios con los que se puede trabajar hacen especial hincapié
en determinadas características del modelo, presentándose como los más
adecuados para el diseño de determinados experimentos.
Existen también dos formas de combinar estos criterios haciendo que
el diseño calculado satisfaga las condiciones planteadas por diversos crite-
rios de optimización. Podríamos combinar dos criterios haciendo que uno
de ellos minimice su valor sujeto a una restricción del valor del otro o bien
planteando una combinación de ambos diseños mediante una media ponde-
rada de las funciones criterio. Cook y Wong (1994) plantean la equivalencia
de ambas formas, la restricción de un criterio a otro y la combinación de
varios criterios.
Si el experimento ha de satisfacer dos objetivos distintos planteados por
dos funciones criterio convexas Φ1 y Φ2, representando criterios principal
y secundario respectivamente y denidas sobre M, podríamos combinar
ambos criterios seleccionando un criterio que minimizase el valor del criterio
secundario restringido a la obtención de un valor mínimo previamente jado
para el criterio principal:
mın Φ2(ξ) sujeto a Φ1(ξ) ≤ c.
La restricción de un criterio a otro se demuestra equivalente a la ob-
tención de un único criterio compuesto a partir de los criterios primario y
secundario, considerando un diseño compuesto basado en una media pon-
derada de las funciones criterio Φ1 y Φ2,
Φ(ξ | λ) = λΦ1(ξ) + (1− λ)Φ2(ξ),
1.8. Teorema de Equivalencia 37
con 0 ≤ λ ≤ 1 una constante elegida. El valor de λ representa el peso
asignado a cada criterio, si es próximo a la unidad, hace que el criterio Φ1
tenga más peso en la determinación del diseño óptimo.
La obtención del diseño óptimo compuesto se realiza minimizando la
expresión de Φ(ξ | λ) con M(ξ) ∈M+ para λ ∈ (0, 1). Además se imponen
las siguientes condiciones:
1. Φ(ξ | λ) es considerada convexa enM y estrictamente convexa en
M+ para λ ∈ (0, 1). Con lo que las matrices de información de los
diseños óptimos son únicas para 0 ≤ λ ≤ 1 (al menos para criterios
globales).
2. Φ(ξ | λ) se supone continua sobre M, mientras que Φ1 y Φ2 se
consideran continuas sobreM+. Pázman (1986) establece las con-
diciones para asegurar la continuidad.
Como ya hemos dicho antes, se han denido en la literatura otros cri-
terios con mayor o menor grado de generalidad. Los aquí presentados son
algunos de los más utilizados y en particular los empleados en el cálculo de
diseños óptimos para la ecuación de Arrhenius.
1.8. Teorema de Equivalencia
El Teorema General de Equivalencia es una herramienta importante en
la teoría del Diseño Óptimo de Experimentos. Este teorema se utiliza para
comprobar si un diseño es el óptimo y forma la base de la mayor parte de
los procedimientos numéricos para calcular diseños óptimos aproximados
Kiefer y Wolfowitz (1960) demostraron la equivalencia de los criterios
D−óptimo y G−óptimo. Esto quiere decir que utilizando ambos criterios
siempre llegaremos al mismo diseño óptimo. En concreto:
Teorema 2. Suponiendo que σ(x) es constante para todo x de X, un diseño
ξ? es D−óptimo si, y sólo si es G−óptimo. Es decir son equivalentes:
1. detM(ξ?) = maxdetM(ξ) : ξ ∈ Ξ.
2. maxx∈X f t(x)M−1(ξ?)f(x) = mınξ∈Ξ maxx∈X f t(x)M−1(ξ)f(x).
38 1. Diseño Óptimo
Además, la última expresión es igual a m.
Observación 10. Se ha de tener en cuenta que:
1. Si σ(x) no es constante, el Teorema de Equivalencia se cumple
también haciendo una pequeña precisión. En este caso puede de-
mostrarse que ξ? es D−óptimo si, y sólo si
maxx∈X
σ−2(x)f t(x)M−1(ξ?)f(x) = mınξ∈Ξ
maxx∈X
σ−2(x)f t(x)M−1(ξ)f(x).
Siendo además la última expresión igual a m.
2. El Teorema de Equivalencia no se cumple para diseños exactos.
Atkinson y Donev (1992), pág. 98 y ss., proporcionan un ejemplo.
Observación 11. Veamos ahora con detalle la interpretación geométrica
del criterio de D-optimización. Sobre el elipsoide m-dimensional:
1. El volumen del elipsoide m-dimensional:
E = z ∈ Rm : ztM(ξ)z ≤ c2,
es igual a cmVm[detM−1(ξ)]1/2, donde Vm es el volumen de la esfera
m-dimensional de radio unidad. En efecto, por ser M(ξ) simétrica
existirá una matriz regular U tal que U tM(ξ)U = I.
Llamando w = 1cU−1z tendremos:
V ol(E) =∫Edz =
∫Scm | detU | dw = cmVm | detU |,
donde haciendo el cambio de variable anterior la región E se trans-forma en la región:
S = w : c2wtU tM(ξ)Uw ≤ c2 = w : wtw ≤ c2,
que es la esfera m-dimensional de radio unidad. Pero
(detU)2 detM(ξ) = 1,
con lo que queda probado el resultado.
1.8. Teorema de Equivalencia 39
2. Bajo la hipótesis de normalidad de las observaciones α = (α1, . . . ,
αm) se distribuye de acuerdo a una distribución normal multiva-
riante de modo que la media tiene como componentes los verdaderos
valores de los parámetros α y la matriz de covarianzas es proporcio-
nal aM−1(ξ). Supongamos sin pérdida de generalidad queM−1(ξ)es la matriz de covarianzas. Entonces la función de densidad de este
vector aleatorio será:
f(α | α) =[detM(ξ)]1/2
(2π)m/2exp
−12
(α− α)tM(ξ)(α− α)
Consideremos entonces el elipsoide siguiente:
E = α ∈ Rm : (α− α)tM(ξ)(α− α) ≤ c2,
donde c es un número jo. Además la variable v = U−1(α−α) segui-rá una distribución normal de media cero y vector de covarianzas la
identidad. De este modo vtv seguirá una distribución χ2m, es decir∫
Ef(α | α) dα =
∫vtv≤c2
(2π)−m/2 exp[−1
2vtv
]dv = P (χ2
m ≤ c2).
Se deduce, por tanto, que el elipsoide:
z ∈ Rm : (z − α)tM(ξ)(z − α) ≤ c2,
contiene la verdadera media con probabilidad P (χ2m ≤ c2), es decir,
es el elipsoide de conanza de la media α con un nivel de conanza
que lógicamente depende de c.
3. Por otro lado el elipsoide:
Eξ = z ∈ Rm : ztM−1(ξ)z ≤ m
contendrá los vectores f(x), x ∈ X, es decir, contendrá al conjunto
f(X) solamente si ξ es un diseño D−óptimo. Esto es debido al
Teorema de Equivalencia, que asegura lo siguiente:
mınξ∈Ξ
maxx∈X
f t(x)M−1(ξ)f(x) = m,
40 1. Diseño Óptimo
de modo que solamente si ξ es un diseño D−óptimo se cumple:
f t(x)M−1(ξ)f(x) ≤ m, x ∈ X.
Además como se vió más arriba el volumen de Eξ es proporcionala [detM(ξ)]1/2. De modo que el diseño D−óptimo será aquel que
haga máximo el volumen del elipsoide Eξ conteniendo el conjunto
f(X), el teorema de dualidad hace que esto sea equivalente a buscar
el elipsoide de volumen mínimo que contiene a f(X). Uno de los
inconvenientes de este criterio es que a veces el volumen del elipsoide
puede ser minimizado haciéndose estrecho y largo. Eso signica que
hay un funcional lineal de los parámetros, que es estimado con una
gran varianza. No obstante no es sencillo llevar a la práctica este
resultado para el cálculo del D-óptimo. Silvey y Titterington (1973)
proporcionan un método para su utilización.
Whittle (1973) y Kiefer (1974) amplían el Teorema de Equivalencia
para funciones criterio más generales. Con el objeto de enunciar estos re-
sultados damos una denición más restrictiva de función criterio. Para ello
nos jaremos en las propiedades que vericaban las funciones criterio vistas
anteriormente. Observamos que la mayoría de ellas son convexas y conti-
nuas. Con el objeto de salvaguardar estas propiedades daremos la siguiente
denición:
Denición 12. Diremos que una función criterio Φ en las condiciones
dadas en la sección anterior, es una función criterio convexa si cumple las
propiedades:
1. Existe UΦ abierto de L(M) tal que UΦ ⊃ M+ y Φ está denida,
es nita y convexa en UΦ.
2. Si:
Mn ∈M+, n = 1, 2, . . . y lımn→∞
Mn = M ∈M \M+
entonces:
lımn→∞
Φ(Mn) =∞,
1.8. Teorema de Equivalencia 41
lo que signicaría una especie de continuidad al pasar de M+ a
M\M+.
Observación 12. No es necesario que UΦ sea convexo. Entenderemos en-
tonces que Φ debe ser convexa en los subconjuntos convexos de UΦ.
Proposición 14. Si U es un abierto de L(M) y Φ es convexa y nita en
U , entonces Φ es continua en U .
Una demostración de este resultado puede encontrarse en Holmes (1975).
Proposición 15. Cualquier función criterio convexa, con la denición da-
da, es continua enM.
Demostración: La proposición anterior implica la continuidad en UΦ,
y por tanto en M+. Por otra parte la segunda condición de la denición
asegura la continuidad enM\M+.
Puesto que algunas de estas funciones no serán diferenciables conviene
dar la denición de derivada direccional siguiente:
Denición 13. Dada una función real Φ, convexa y denida en un subcon-junto convexo de un espacio euclídeo, y dados dos puntos de ese conjunto,
x y v, se dene la derivada direccional de Φ en el punto x y en la dirección
v como:
∂Φ(x, v) = lımβ→0+
Φ[(1− β)x+ βv]− Φ(x)β
.
Observación 13. Esta derivada direccional existe siempre gracias a la
convexidad de Φ. En efecto, demostraremos que la función:
ϕ : (0, 1) −→ R | β −→ Φ[(1− β)x+ βv]− Φ(x)β
,
es no decreciente en (0, 1). Por tanto el límite siguiente siempre existe,
siendo nito o innito negativo:
lımβ→0+
Φ[(1− β)x+ βv]− Φ(x)β
.
42 1. Diseño Óptimo
Veamos que ϕ es una función creciente. Para ello tomamos 0 < β1 < β2 < 1y calculamos:
Φ[(1− β1)x+ β1v]− Φ(x) = Φβ1
β2[(1− β2)x+ β2v] + (1− β1
β2)x − Φ(x)
≤ β1
β2Φ[(1− β2)x+ β2v] + (1− β1
β2)Φ(x)− Φ(x)
= β1
β2Φ[(1− β2)x+ β2v]− Φ(x).
Pueden darse otras deniciones de derivada direccional, pero nos interesará
la anterior debido al uso de funciones convexas. Si existe el gradiente de Φentonces por su denición, podemos escribir:
∂Φ(x, v) = tr[5Φ(x)](v − x) = 〈5Φ(x), v − x〉.
Recíprocamente, se puede denir el gradiente como aquella matriz que en-
caja en la expresión anterior.
Teorema 3 (teorema general de equivalencia). Sea Φ una función criterio
convexa y ξ? un diseño tal que:
∂Φ[M(ξ?),M(ξ)] > −∞, ξ ∈ Ξ.
Entonces son equivalentes:
1. ξ? es Φ-óptimo.
2. ξ? es Φ-óptimo local, es decir, para cada diseño ξ la función:
[0, 1) −→ R | β −→ Φ[(1− β)M(ξ?) + βM(ξ)],
tiene un mínimo local en β = 0.
3. ∂Φ[M(ξ?),M(ξ)] ≥ 0, ξ ∈ Ξ.
Obsérvese que este teorema aporta un criterio general (tercer apartado)
para contrastar si un diseño dado es o no Φ-óptimo, tanto si la función crite-
rio es diferenciable como si no lo es. Cuando la función Φ sea diferenciable,
se puede dar el siguiente teorema:
Teorema 4. Si Φ es diferenciable en un entorno de M(ξ?), entonces sonequivalentes:
1. ξ? es Φ-óptimo
1.9. Discriminación entre Modelos: T−optimización 43
2. f t(x)5 Φ[M(ξ?)]f(x) ≥ trM(ξ?)5 Φ[M(ξ?)], x ∈ X
3. mınx∈X f t(x)5Φ[M(ξ?)]f(x) =∑
x∈X ft(x)5Φ[M(ξ?)]f(x)ξ?(x)
La demostración de estos dos últimos teoremas puede encontrarse por
ejemplo en Pázman (1986), pág. 116-117. Disponemos así de un par de
condiciones para la búsqueda del soporte del óptimo. Si llamamos
ψ(x, ξ) = f t(x)5 Φ[M(ξ)]f(x)− trM(ξ)5 Φ[M(ξ)],
tenemos que ψ(x, ξ?) se anula en todos los puntos del soporte del óptimo,
y por otra parte, la segunda condición del teorema anterior nos dice que
ψ(x, ξ?) ≥ 0, ∀x ∈ X. De aquí concluimos que los puntos del soporte del
Φ-óptimo que están en el interior de X, son mínimos locales de la función
ψ(x, ξ?), y por tanto se verica
∂ψ(x, ξ?)∂x
= 0 ∀x ∈ Xξ? ∩X.
De este modo, cuando se tenga alguna sospecha de cómo puede ser el óp-
timo, estas dos condiciones podrían ayudar a encontrarlo. Posteriormente
habría que comprobar con el Teorema de Equivalencia que efectivamente
es el óptimo.
Observación 14. La función ψ(x, ξ), como ya se ha comentado, resulta
muy útil para buscar los puntos en los que tomar una observación con-
tribuye más a aproximarnos al diseño óptimo. Es decir, es una función
especialmente sensible al soporte del óptimo. Por este motivo una ligera
modicación suya es bautizada como función de sensibilidad por algunos
autores (véase por ejemplo Fedorov y Hackl (1997), pág. 33 y ss., para más
detalles en este sentido).
1.9. Discriminación entre Modelos: T−optimización
Una de las críticas más frecuentes que se le hacen a la teoría del Diseño
Óptimo de Experimentos es la necesidad de jar el modelo a la hora de
calcular diseños, aún antes de haber realizado experimento alguno. Aun-
que existen fenómenos, especialmente en procesos industriales, en los que
44 1. Diseño Óptimo
el modelo se conoce con antelación, es frecuente seleccionar el modelo ade-
cuado de entre dos ó varios modelos posibles. En estos casos es de gran
interés diseñar la mejor estrategia de discriminación entre modelos.
Un criterio óptimo para discriminar entre dos modelos de regresión
se denomina criterio T−óptimo y fue planteado por Atkinson y Fedorov
(1975a). Los mismos autores, Atkinson y Fedorov (1975b), han ampliado el
criterio para permitir la discriminación entre más de dos modelos, conside-
rando el caso homocedástico con observaciones normalmente distribuidas.
Se puede encontrar un estudio intensivo de la técnica para modelos linea-
les en Atkinson y Donev (1992). López-Fidalgo et al. (2007b) extienden
este criterio a modelos no normales basándose en la distancia de Kullback-
Leibler.
Sea el modelo general
y = η(x, θ) + ε,
cumpliéndose la hipótesis habitual, de que el error ε sea independiente y
normalmente distribuido con media cero y varianza constante σ2.
Supongamos que η(x, θ) es una de las dos funciones conocidas, η1(x, θ1)y η2(x, θ2), donde θ1 ∈ Ω1 ⊂ Rm1 y θ2 ∈ Ω2 ⊂ Rm2 son los vectores de
parámetros desconocidos. Consideremos por ejemplo que η(x, θ) = η1(x, θ1)es el modelo verdadero con sus parámetros θ1 conocidos y que η2(x, θ2) esel otro modelo rival.
Denición 14. La suma de cuadrados de los errores de ajuste para el
primer modelo respecto al modelo rival viene dada por
T21(ξ) = mınθ2∈Ω2
∑xi∈X
(η(xi, θ)− η2(xi, θ2))2ξ(xi).
Para modelos lineales T21(ξ) es proporcional al parámetro de no cen-
tralidad de la distribución X 2 de la suma de los cuadrados de los residuos
del modelo rival. Más aún, T21 es proporcional al parámetro de no centrali-
dad del contraste F para falta de ajuste del modelo rival cuando el primer
modelo es verdadero.
1.9. Discriminación entre Modelos: T−optimización 45
Entonces diremos que ξ?T es el diseño T−óptimo si maximiza T21. Esto
implica que el diseño T−óptimo maximiza la potencia del test F para la
falta de ajuste del modelo rival cuando consideramos que el primer modelo
es el verdadero.
Para el caso de modelos no lineales en los parámetros, T21 sustituye al
verdadero parámetro de no centralidad por una aproximación asintótica.
En todo caso el diseño T−óptimo dependerá de la elección del modelo
verdadero y de sus parámetros.
Denición 15. Como hemos visto llamaremos a un diseño ξ?T que maxi-
mice T21 diseño T−óptimo y diremos que un diseño T−óptimo es regular
si el siguiente problema de optimización tiene una única solución,
Ω2(ξ) =
θ2 : θ2(ξ) = arg mınθ2∈Ω2
∑xi∈X
(η(xi, θ)− η2(xi, θ2))2ξ(xi)
.
En caso contrario diremos que el diseño es singular.
Para diseños regulares se verica el Teorema de Equivalencia en la
siguiente formulación.
Teorema 5. Sea ξ?T un diseño T−óptimo regular. Entonces se satisfacen
las siguientes condiciones:
1. Una condición necesaria y suciente para que el diseño ξ?T sea
T−óptimo es que ψ(x, ξ?T ) ≤ 0, x ∈ X siendo
ψ(x, ξ) = (η(x, θ)− η2(x, θ2))2 −∑xi∈X
(η(xi, θ)− η2(xi, θ2))2ξ(xi)
y θ2 la única solución del problema de optimización previamente
propuesto.
2. En los puntos de soporte del diseño T−óptimo, Xξ?T, la función
ψ(x, ξ?T ), con x ∈ Xξ?T, alcanza máximos.
46 1. Diseño Óptimo
3. Para cualquier otro diseño ξ para el que T21(ξ) < T21(ξ?T ), se tieneque
maxx∈X
ψ(x, ξ) > T21(ξ?T )
4. El conjunto de diseños T−óptimos es convexo.
Capítulo 2
Ecuación de Arrhenius
La primera parte del trabajo se centra en el diseño de experimentos para
determinar la variación de la velocidad con la que determinados reactivos
se convierten en unos productos en función de la temperatura a la que dicha
reacción se produzca.
2.1. Velocidad de las Reacciones Químicas
El método experimental más importante para el estudio del mecanismo
de las reacciones químicas es la medida de la velocidad con la cual las
reacciones se desarrollan y la dependencia de esta velocidad de reacción con
las concentraciones de las especies reaccionantes y con la temperatura. Este
tipo de estudios recibe el nombre de Cinética de las Reacciones Químicas
y los resultados obtenidos se resumen en lo que se conoce como ecuación
de velocidad que tiene la forma general siguiente:
velocidad = k(T )(función de la concentración de los reactivos).
La magnitud k(T ) se llama constante de velocidad y, si la función que
contiene las concentraciones de los reactivos expresa de forma correcta la
dependencia entre la velocidad y estas concentraciones, k(T ) debe dependertan solo de la temperatura, T .
47
48 2. Ecuación de Arrhenius
De esta forma, la información experimental acerca del proceso de la
reacción queda plasmada en su ecuación de velocidad. Las hipótesis mo-
leculares que puedan realizarse acerca de la forma cómo una reacción se
desarrolla deben acomodarse a la información proporcionada por la ecua-
ción de velocidad. El resultado es lo que recibe el nombre de mecanismo de
la reacción.
La velocidad de una reacción se expresa de ordinario en función de la
disminución de la concentración presente de uno de los reactivos producida
en un determinado intervalo de tiempo. De forma equivalente puede utili-
zarse el incremento de la concentración de cualquiera de los productos de
la reacción.
La velocidad de una reacción se considera siempre como una cantidad
positiva. Como ejemplo intuitivo, para la reacción:
A+B → C +D,
la velocidad, que ha de ser una función de las concentraciones y de la
temperatura, se establece en función del descenso de [A] en la forma:
velocidad = −d[A]dt
,
donde [A] es la concentración del reactivo A. Por el contrario si se mide el
aumento del compuesto C, se debe escribir:
velocidad =d[C]dt
.
El mismo criterio se adopta para reacciones con otra estequiometría,
por ejemplo:
A+ 2B → productos
velocidad = −d[A]dt
= −12d[B]dt
,
ya que, por cada molécula de A se consumen 2 moléculas de B, siendo así
la velocidad de disminución de este reactivo el doble que la del primero.
Se ha encontrado en un número considerable de reacciones que, a una
temperatura determinada, la velocidad de la reacción es proporcional a la
2.1. Velocidad de las Reacciones Químicas 49
concentración de uno, dos y a veces tres de los reactivos. Si se considera
una reacción en la que A, B, C, representan posibles reactivos, la ecuación
de velocidad puede tomar la forma siguiente:
velocidad = k1[A] Primer Orden
velocidad = k2[A][B] ó Segundo Orden
= k2[A]2
velocidad = k3[A][B][C] ó Tercer Orden
= k3[A]2[B] ó
= k3[A]3
Las reacciones que evolucionan de acuerdo con estas simples ecuaciones
se llaman reacciones de primero, segundo y tercer orden. Sin embargo, no
todas las reacciones obedecen a estas leyes tan sencillas. Algunas contienen
factores de concentración elevados a exponentes fraccionarios, mientras que
hay otras que consisten en ecuaciones algebraicas de mayor complejidad.
Existe un gran número de reacciones que pueden describirse cinéticamente
con ecuaciones de orden uno, dos y en bastante menor proporción, orden
tres.
La ecuación de velocidad no está necesariamente relacionada con la es-
tequiometría de la ecuación química que describe el proceso global, ya que,
generalmente, éste transcurre a través de numerosos pasos intermedios, lla-
mados reacciones elementales, con velocidades diferentes, cuya combinación
produce la reacción nal.
Las dimensiones de las constantes de velocidad de reacciones de prime-
ro, segundo y tercer orden se deducen de sus ecuaciones de velocidad. Para
la de primer orden la constante de velocidad tiene las dimensiones de tiem-
po inverso, generalmente s−1, siendo independiente de las unidades de la
concentración. Las dimensiones de las constantes de velocidad de segundo
orden incluyen ya dimensiones de concentración, de modo que sus dimen-
siones pueden ser: dm3 ·mol−1 ·s−1, cm3 ·mol−1 ·s−1, cm3 ·molecula−1 ·s−1,
50 2. Ecuación de Arrhenius
etc. Las constantes de velocidad de tercer orden son mucho menos frecuen-
tes y sus dimensiones hay que deducirlas de la correspondiente ecuación de
velocidad.
2.2. Dependencia de la Constante de Velocidad de la
Temperatura
La ecuación de velocidad y la constante de velocidad de una reacción se
determinan a partir de los datos cinéticos a una temperatura determinada.
Si las experiencias se realizan a diferentes temperaturas se advierte, en
general, que la dependencia con la concentración de los reactivos reejada
en la ecuación de velocidad, no cambia con la temperatura, pero sí que la
constante de velocidad es mucho mayor a temperaturas más altas.
Arrhenius (1889) demostró que la constante de velocidad crece de for-
ma exponencial con la temperatura. Quizá sea más preciso armar que, por
procedimientos puramente empíricos, demostró que, al representar gráca-
mente los valores de log k en función de 1/T , resulta una variación lineal
(Figura 2.1).
Empíricamente esta relación se puede escribir del modo siguiente:
k = Ae−Ea/RT ,
donde A es el denominado factor preexponencial, Ea se conoce con el nom-
bre de energía de activación, R es la constante de los gases y T es la
temperatura absoluta. El tratamiento de los resultados experimentales se
ha llevado tradicionalmente a cabo usando la expresión anterior en la forma
logarítmica:
log(k) = log(A)− EaR· 1T.
Las constantes A y Ea son así determinables a partir de la pendiente y
ordenada en el origen de la recta que representa la variación de los valores
de log(k) con el inverso de la temperatura, 1/T .
Aunque esta expresión es una relación empírica, la forma de la ecuación
puede justicarse, en principio, a partir de la relación termodinámica que
2.2. Dependencia de la Constante de Velocidad de la Temperatura 51
Figura 2.1. Crecimiento exponencial de la constante de velocidadrespecto a la temperatura y variación lineal de log k en función de 1/Tpara la reacción atmosférica NO + O3. Las medidas corresponden altrabajo de Moonen et al. (1998).
establece la dependencia de una constante de equilibrio químico con la
temperatura, relación que se conoce como ecuación de van't Ho1 (1884):
d log(K)dT
=∆HR · T 2
,
donde K es la constante de equilibrio y ∆H es el calor de reacción a presión
constante, también llamado entalpía de reacción. La forma integrada de la
ecuación de van't Ho es:
K = (const.) exp[− ∆HR · T
].
1Jacobus Henricus van't Ho (1852-1911), Químico holandés.
52 2. Ecuación de Arrhenius
Como ejemplo ilustrativo, considérese la siguiente reacción reversible:
A+B C +D,
cuya velocidad directa, v1, e inversa, v−1, son:
v1 = k1[A][B],
v−1 = k−1[C][D].
El estado de equilibrio viene determinado cuando la velocidad de ambos
procesos se iguala, es decir, v1 = v−1, en cuyo caso:
k1
k−1=
[C]eq[D]eq[A]eq[B]eq
= K.
Es posible identicar, en primera aproximación, la constante de equilibrio,
K, con el cociente de las contantes de velocidad del proceso directo e inver-
so. Ahora bien, si se expresan éstas según su dependencia de la temperatura
mediante la ecuación de Arrhenius:
k1 = A1 e−Ea1/RT , k−1 = A−1 e
−Ea−1/RT ,
se obtiene:
K =k1
k−1=
A1
A−1e−(Ea1−Ea−1 )/RT ,
ecuación que concuerda formalmente con la relación de van't Ho para una
situación de equilibrio.
2.3. Teoría de Arrhenius
Fue Arrhenius quién desarrolló el primer estudio teórico, en forma de
simple descripción cualitativa, para explicar el comportamiento molecular
que corresponde a la forma obtenida experimentalmente para la constante
de velocidad. Otras teorías posteriores, más elaboradas y de mayor carácter
cuantitativo, han apoyado estas ideas originales.
Arrhenius reconoció que en cualquier reacción puede admitirse que el
proceso tiene lugar mediante la formación de una especie química inter-
media, en la que se acumula una alta energía, conocida como complejo
2.4. Otras Teorías 53
activado, el cual se disocia con posterioridad para dar lugar a la formación
de los productos de la reacción. Si se supone que el complejo activado re-
quiere para formarse una energía, Ea, superior a la que poseen los reactivos,
el número de moléculas de complejo activo comparado con el de reactivos
puede estimarse con la ley de distribución de Boltzmann2 (Apéndice A):
Número de moléculas complejosNúmero de moléculas reactivos
= e−Ea/RT ,
y la teoría de Arrhenius expresa ahora que la velocidad de la reacción es
proporcional al número (o concentración) de complejos activos
v = A [Número ó Concentración de moléculas de complejos activos]
= A e−Ea/RT [Concentración de reactivos].
en la que A es el factor de proporcionalidad.
Mediante esta teoría lo que se viene a mostrar es que la constante
empírica Ea puede interpretarse como la energía del complejo activado
comparada con la de las moléculas del reactivo.
La hipótesis del complejo activado puede representarse esquemática-
mente en un gráco que muestra la energía del sistema en la ordenada
frente a la coordenada de reacción, que gura como abcisa, Figura 2.2. La
coordenada de reacción no es precisamente una distancia internuclear cual-
quiera, sino que más bien representa una medida de todas las distancias
internucleares que experimentan variaciones durante el transcurso de la
transformación de reactivos en productos.
2.4. Otras Teorías
La teoría de Arrhenius fue solo una descripción cualitativa que no tuvo
por objeto interpretar, desde un punto de vista molecular, la naturaleza
de la energía de activación y del factor preexponencial. Sin embargo, todas
las teorías posteriores que tratan de la determinación teórica de constantes
de velocidad de reacciones químicas contienen en germen la relación de
2Ludwig Eduard Boltzmann (1844-1906), Físico austriaco.
54 2. Ecuación de Arrhenius
Figura 2.2. Diagrama de activación, se representa la energía del sis-tema en la ordenada frente a la coordenada de reacción.
Arrhenius con dos parámetros independientes de la temperatura, Ea y A,
y su interpretación teórica presenta dicultades considerables.
Un grupo de estas teorías, englobadas bajo el calicativo genérico de
Teoría de Colisiones, iniciada por Trantz (1916) y Lewis (1918), tratan de
identicar el factor A con el número de colisiones entre moléculas. Si bien el
planteamiento parece correcto, el tratamiento encuentra serias dicultades
a la hora de considerar el potencial intermolecular. En este contexto es
particularmente útil el concepto de sección ecaz de reacción, σ. Mediante
consideraciones muy elementales puede decirse que el número de colisiones,
por unidad de tiempo en una unidad de volumen, que ocurren entre nAmoléculas del componente A y nB moléculas del componente B, que se
aproximan entre sí con velocidad v, es:
Número de colisiones = π(rA + rB)2 · v · nA · nB,
donde rA y rB son los radios de cada molécula, respectivamente.
Si cada colisión produjera reacción, esta expresión sería idéntica a la
velocidad de reacción; en general podemos considerar que sólo un cierto
2.4. Otras Teorías 55
número de estas colisiones son efectivas, introduciendo un factor de ecacia,
σ, que denominamos sección ecaz de reacción, de tal modo que la velocidad
de reacción entre A y B es:
velocidad = σ · v · nA · nB = k2 · nA · nB,
pudiéndose identicar la constante de velocidad de orden 2 para este pro-
ceso como:
k2 = σ · v.
Si las especies reaccionantes poseen velocidades según una distribución
de probabilidad con función de densidad f(T, v), la constante de velocidadexperimental sería un promedio según todas las velocidades de las partícu-
las:
k2(T ) =∫ ∞
0f(T, v)σ(v)v dv,
donde se ha considerado también que la sección ecaz suele ser función de
la velocidad relativa con que dos partículas colisionan.
Si se toma el sistema en equilibrio térmico, la función f(T, v) corres-
ponde a una distribución Maxwell3-Boltzmann, ver Apéndice A y Laidler
(1969), y por lo tanto la ecuación se reduce a:
k2(T ) =
[(2NA
RT
)3/2( 1µπ
)1/2 ∫ ∞0
E · σ(E) · e[(E0−E)/RT ] dE
]e−E0/RT ,
donde NA es el número de Avogadro y µ es la masa reducida del sistema
de dos partículas.
En general, las teorías de colisiones se elaboran sobre consideraciones
más o menos sustentadas por lo expresado anteriormente, en donde el ver-
dadero cuello de botella lo representa tanto la dependencia de σ con la
velocidad molecular como la función de distribución de velocidad molecu-
lar y la temperatura. En cualquier caso el resultado nal suele acomodarse
a una expresión que reproduce la relación de Arrhenius, como se ve en la
ecuación anterior.
3James Clerck Maxwell (1831-1879), Matemático y Físico escocés.
56 2. Ecuación de Arrhenius
Hay un grupo de teorías cinetoquímicas, iniciadas por Eyring (1935)
y Evans y Polanyi (1935), que efectúan el análisis del fenómeno reactivo
mediante la consideración de la especie intermedia denominada complejo
activado, como la especie que cruza la barrera de energía potencial que
debe existir entre reactivos y productos. En estas teorías, conocidas indis-
tintamente como Teoría del Complejo Activado ó del Estado de Transición,
se supone que puede determinarse la concentración de este complejo acti-
vado mediante consideraciones de Termodinámica Estadística más o menos
simplicadas.
En todas estas teorías se parte del establecimiento de las variaciones
de energía potencial de las moléculas de reactivo según distintas distancias
de aproximación y distintas geometrías moleculares. Esta función físico-
matemática, se conoce con el nombre de supercie de energía potencial
(en la mayor parte de los casos se tratará en realidad de hipersupercies).
El curso de la reacción se representa entonces como un movimiento a lo
largo de esta hipersupercie desde una zona de baja energía, determinada
por la geometría y distribución de los reactivos, hacia otras zonas de baja
energía, según la estructura de los productos. El sistema puede entonces
evolucionar según diferentes trayectorias con distinta probabilidad, según
las elevaciones energéticas que haya de superar, siendo la especie que
realiza dicho movimiento una especie intermedia entre los reactivos y los
productos, que constituye el complejo activado. Los cálculos que pueden
llevarse a cabo dentro de este contexto constituyen hoy en día una rama
muy activa dentro de la Fisico-Química conocida como Dinámica Molecular
(Hirst, 1990).
Un planteamiento elemental de este modelo, suciente para poner de
maniesto la relación entre esta teoría y la ecuación de Arrhenius, es el
siguiente.
Considérese que dos especies moleculares A y B, en su proceso reac-
cionante, establecen una especie intermedia, (AB)‡, de modo que podemos
2.4. Otras Teorías 57
considerar que básicamente ocurre:
A+B (AB)‡ → productos.
La velocidad del proceso está controlada por la descomposición de la espe-
cie intermedia que hace de complejo activado, también llamado estado de
transición.
La concentración de complejo activado, al menos formalmente, puede
establecerse en función de la condición de equilibrio:
K‡ =[AB‡][A][B]
,
[AB‡] = K‡[A][B],
donde K‡ representa una verdadera constante de equilibrio entre los reac-
tivos y el complejo AB‡. Su valor es, en principio, desconocido pero puede
estimarse sobre bases de Física Molecular. En líneas generales el resultado
que se obtiene puede alcanzarse también según las siguientes consideracio-
nes simples: la velocidad con la que el complejo se destruye puede estimarse
suponiendo que se romperá para dar la molécula de los productos cuando
una vibración apropiada, con amplitud sucientemente grande, ayude a dis-
tender el complejo hasta su ruptura. La frecuencia de esta vibración será
por lo tanto, en cierto modo similar a la velocidad con que el complejo se
disocia. El complejo activo será una substancia inestable que se mantiene
unido mediante enlaces muy débiles. Por consiguiente, las vibraciones de
estos enlaces habrán de tener frecuencias muy bajas y la energía media
por cada grado de libertad de vibración debe ser del orden de kT (donde
k = R/NA, representa la constante de Boltzmann). Por lo tanto, puede
aproximarse la energía de vibración de un enlace a su energía térmica:
hν = kT,
donde hν es la energía del cuanto de vibración y h, la constante de Planck4.
Según este simple razonamiento,que puede justicarse sobre bases teóricas
más rmes basadas en Física Molecular (Eyring et al., 1980), la velocidad
4Max Karl Ernst Ludwig Planck (1858-1947), Físico alemán.
58 2. Ecuación de Arrhenius
de reacción en el estado de transición es:
velocidad = −d[A]dt
= −d[B]dt
= K‡kT
h[A][B],
con lo que es fácil deducir que la constante de velocidad para una reacción
de este tipo es:
k2 = K‡kT
h.
Este resultado obtiene su signicado cuando la constante de equilibrio
se interpreta termodinámicamente:
∆G‡ = −RTlnK‡,
∆G‡ = ∆H‡ − T∆S‡,
donde ∆G‡, ∆H‡ y ∆S‡ son respectivamente la energía libre, entalpía y
entropía de formación del complejo activo en condiciones termodinámicas
estándar; en este contexto, se denominan parámetros de activación. Al sus-
tituir estas relaciones en la ecuación que da la constante de velocidad, se
obtiene:
k2 =(kT
h
)e∆S‡/RK‡e−∆H‡/RT ,
la cual concuerda con la ecuación de Arrhenius, si se identica:
A =kT
he∆S‡/R,
Ea = ∆H‡,
con lo que se interpreta el factor preexponencial en términos de una en-
tropía, es decir, en términos de una probabilidad asignable a las distintas
trayectorias que el complejo activado puede tomar a lo largo de la supercie
de energía potencial, mientras que la energía de activación se relaciona con
la entalpía de formación del complejo activo.
2.5. La Ecuación de Arrhenius y Fenómenos de Transporte
Existen otros fenómenos cinéticos de tipo sicoquímico que pueden in-
terpretarse a través de los mismos modelos expuestos en los apartados
anteriores y cuya base formal se apoya en la existencia de una dependencia
2.5. La Ecuación de Arrhenius y Fenómenos de Transporte 59
tipo Arrhenius respecto a las variaciones de temperatura. Algunos de estos
fenómenos son: la difusión, la viscosidad y la conductividad electrolítica de
las disoluciones iónicas.
La difusión es el fenómeno de transporte de materia impulsado por
un gradiente de concentración. Cuando el proceso tiene lugar en una sola
dirección la ecuación fenomenológica es del tipo siguiente (Ley de Fick5):
Jm =1A· dmdt
= −D∇C,
donde Jm representa el ujo de masa, m, que se transporta en la unidad de
tiempo, t, a través de una determinada área, A, transversal a la dirección del
transporte, y ∇C representa el gradiente de concentración en la dirección
del transporte de masa. El coeciente que relaciona la fuerza impulsora
o gradiente, con el efecto producido, o ujo de materia, se conoce como
coeciente de difusión, D. El coeciente de difusión es característico del
medio en el que se produce la difusión, del tipo de sustancia que se difunde,
de la temperatura y de otros factores. Cabe resaltar en este contexto que la
dependencia del coeciente de difusión de la temperatura sigue la ecuación
de Arrhenius en una gran variedad de sistemas, de modo que se puede
escribir:
D(T ) = D0e−ED/RT ,
pudiéndose hablar de una energía de activación del proceso de difusión
cuya interpretación puede hacerse formalmente con modelos similares a los
desarrollados para la constante de velocidad.
En particular, cuando la sustancia que se transporta es un electrólito,
el ujo de materia implica también un ujo de carga, es decir, una intensi-
dad de corriente, mientras que un gradiente de concentración iónica puede
relacionarse con un gradiente de potencial electroquímico. Se desprende de
estas consideraciones que entre el coeciente de difusión y el coeciente de
conducción electrolítica, o conductividad, existirá una relación directa. De
hecho los coecientes de conductividad electrolítica presentan también una
dependencia tipo Arrhenius de la temperatura (Glasstone et al., 1941).
5Adolf Eugen Fick (1829-1901), Fisiólogo alemán.
60 2. Ecuación de Arrhenius
El fenómeno de la viscosidad está relacionado con la capacidad de ujo
de gases o líquidos cuando se les aplica una fuerza deformadora.
Considerándose un uido constituido por diversas capas susceptibles
de sufrir deslizamiento unas respecto de las otras. La aplicación de una
Figura 2.3. Aplicada una fuerza de cizalla sobre la primera capa deluido, produce un gradiente de velocidad en las distintas capas a lolargo del eje z.
fuerza de cizalla, Fx, a una de las capas, provoca el deslizamiento de todas
las demás como consecuencia de la fricción que existe entre las mismas,
Figura 2.3. La fricción puede interpretarse en términos de una determinada
capacidad del sistema para intercambiar cantidad de movimiento entre las
diversas capas, lo que reduce su velocidad en la dirección x, a medida que la
capa está más distanciada de la primera, la ley de Newton, que interpreta
este fenómeno para una gran variedad de uidos, es la siguiente:
FxA
= ηdvxdz
,
es decir, se relaciona el efecto producido, gradiente de velocidades dvx/dz,
con la causa, que es la fuerza de cizalla aplicada a la primera capa por
unidad de área. El coeciente η, conocido como coeciente de viscosidad,
2.5. La Ecuación de Arrhenius y Fenómenos de Transporte 61
caracteriza la uidez de la sustancia y tiene la particularidad de depender de
la temperatura a través de una expresión similar a la ecuación de Arrhenius:
η = BeEvis/RT ,
propuesta por J. de Guzmán en 1913 y por el propio Arrhenius en 1916.
Los ejemplos anteriores ponen de maniesto que la ecuación de Arrhenius
representa un modelo muy adecuado para interpretar la evolución de nume-
rosos fenómenos físicos y sicoquímicos con la temperatura, cuya aplicación
se encuentra ampliamente extendida. Estos hechos justican cualquier es-
fuerzo de análisis que conduzca a elevar la ecacia de las interpretaciones
realizadas a través de su aplicación.
Capítulo 3
Diseños Óptimos para la
Ecuación de Arrhenius
3.1. Necesidad de Diseños Óptimos
Existen en la literatura trabajos en los que se proponen diseños ópti-
mos para modelos encargados de describir el equilibrio enzimático, como el
de Michaelis-Menten (Dette y Wong, 1999; López Fidalgo y Wong, 2002;
Dette et al., 2003; entre otros muchos) usados principalmente en análisis
farmacológicos y en biología (Endrenyi, 1981). Asímismo existen trabajos,
que desde la perspectiva del diseño óptimo, se acercan a la cinética de las
reacciones químicas, planteando diseños para estimar el orden de una reac-
ción (Atkinson, 1998; Atkinson y Bogacka, 1997). Como hemos visto en la
Sección 2.2, la ecuación de velocidad y la constante de velocidad se deter-
minan a temperatura constante. El objetivo es proponer diseños óptimos
para la modelización de la relación entre la constante de velocidad y la
temperatura.
Como se ha visto hasta aquí, la ecuación de Arrhenius justica la rela-
ción entre la constante de velocidad de una reacción química y la tempera-
tura a la que esta se produce, creciendo exponencialmente con el aumento
63
64 3. Diseños Óptimos para la Ecuación de Arrhenius
de la temperatura. Asímismo, se ha expuesto cómo otros fenómenos de
transporte también poseen una dependencia del tipo Arrhenius respecto
de la temperatura. Fenómenos como la difusión, la viscosidad y la conduc-
tividad electrolítica de disoluciones iónicas explican las variaciones de sus
coecientes respecto a la temperatura mediante el modelo no lineal plan-
teado en dicha ecuación. Es ésta por lo tanto una de las razones de mayor
peso que ha inuido en el desarrollo de diseños óptimos para la ecuación
de Arrhenius que se plantean.
De los múltiples fenómenos cuya dependencia con la temperatura pue-
de ser explicada mediante la ecuación planteada por Arrhenius (1889), esta
parte del trabajo se centra en la cinética de las reacciones químicas que
se producen en la estratosfera. Los diferentes gases allí presentes, activa-
dos por radiaciones procedentes tanto del sol como del espacio, reaccionan
produciendo fenómenos de un gran interés tanto desde el punto de vista
cientíco como social y económico. El Efecto Invernadero y la reducción de
la Capa de Ozono son fenómenos en cuyas raíces encontramos el estudio
cinético de las reacciones químicas producidas en la estratosfera.
Las circunstancias especiales que aprovecha y explota este trabajo son
dos. Por un lado la disciplina del Diseño Óptimo de Experimentos, cuyo
principal objetivo es lograr la mejor estimación posible de los parámetros
desconocidos que aparecen en el modelo. En segundo lugar la ecuación de
Arrhenius, cuyo objetivo es modelizar la constante de velocidad en función
de las temperaturas estratosféricas, diferentes a las de condiciones normales,
junto con la variación climática que está experimentando el planeta.
Durante la búsqueda bibliográca previa al desarrollo del trabajo, y
ante el abanico de posibles fenómenos físicos y químicos que podían ser
utilizados en los ejemplos, nos llamó la atención la existencia de un Pa-
nel de Expertos 1 que bajo la supervisión de la National Aeronautics and
Space Administration (NASA) generaba periódicamente un informe con
los valores recomendados para los parámetros de la ecuación de Arrhenius
para numerosas reacciones de carácter atmosférico. El objetivo de dichos
1Jet Propulsion Laboratory : http://jpldataeval.jpl.nasa.gov
3.2. Modelo no Lineal 65
informes aparece reejado en la introducción del informe número 13 (Jet
Propulsion Laboratory, 2000), donde se realiza un especial énfasis en la
generación de modelos para el estudio de la evolución de la capa de ozono
y sus posibles alteraciones causadas por fenómenos naturales o antropo-
génicos, para ello recalca la importancia de poseer valores contrastados y
comparados de estos parámetros. Este informe y la posterior aparición del
número 14, (Jet Propulsion Laboratory, 2003), permitieron facilitar la tarea
de búsqueda bibliográca de ejemplos y experimentos contrastados permi-
tiendo comparar los diseños propuestos con los que realmente se estaban
llevando a cabo en los laboratorios.
Así mismo los valores de referencia planteados para los parámetros
de muchas de las reacciones sufrían en el período de 2 años importantes
correcciones en sus valores. Los factores de incertidumbre que se facilitaban
para los parámetros, sobre todo en el caso del parámetro exponencial Ea/R,
oscilaban entre el 5% y el 40%, con lo que el objetivo del Diseño Óptimo de
Experimentos, reducción de la varianza de la estimación de los parámetros,
era plenamente acertado.
Por otro lado se observa en la literatura una carencia de justicación
teórica de los diseños empleados experimentalmente. Normalmente los pun-
tos donde se han venido tomado medidas experimentales se encuentran
distribuidos a lo largo del espacio de diseño sin un criterio determinado,
con la excepción de dar especial relevancia a temperaturas problemáticas
por cuestiones experimentales. La elección de una estrategia correcta en el
diseño del experimento se ha demostrado de crucial importancia de cara a
la abilidad de nuestras inferencias.
3.2. Modelo no Lineal
La primera etapa del Diseño Óptimo de Experimentos es la elección del
modelo. Para el caso de reacciones bimoleculares, como las empleadas en los
ejemplos, la ecuación de Arrhenius se adapta perfectamente y se encuentra
plenamente justicada su utilización. Tal y como se ha mencionado, el
66 3. Diseños Óptimos para la Ecuación de Arrhenius
objetivo inicial de Arrhenius (1889) fue el de explicar la variación lineal del
logaritmo de la constante de velocidad, log k, en función del inverso de la
temperatura, 1/T .
Muchos otros autores con anterioridad a Arrhenius intentaron explicar
la variación de dicha constante de velocidad a través de diferentes modelos,
Warder en 1881, Urech en 1884, Hood en 1885, Sphor en 1888, van't Ho
en 1884, Hecht y Conrad en 1989, etc. y nalmente Arrhenius de forma
acertada en 1889, vease Logan (1982) y Laidler (1984).
El modelo planteado por Arrhenius y utilizado desde entonces se ex-
presa empíricamente de la forma:
E(k) = Ae−B/T , var(k) = σ2, T ∈ X = [T1, T2], T1 ≥ 0.
Este modelo es no lineal en sus parámetros y en él no se pueden em-
plear directamente los procedimientos clásicos anteriormente descritos. Los
parámetros A y B son independientes de la temperatura, aunque para
reacciones más complejas se incluyan modicaciones en el modelo en las
que no se va a entrar. El parámetro A, es conocido como parámetro A de
Arrhenius o frecuencia y el parámetro B expresa la temperatura de activa-
ción, B = E/R, siendo E la diferencia de energías entre el estado activado
y el estado nal y R la constante universal de los gases.
Una manera de enfrentarse a estos modelos no lineales es mediante la
linealización,
log k = logA− B
T.
Esta linealización pueden incurrir en cambios importantes en la dis-
tribución de los residuos e incluye importantes problemas de heterocedas-
ticidad en los datos, Kli£ka y Kubá£ek (1997). Obviamente se obtendrán
mejores resultados empleando métodos no lineales de mínimos cuadrados.
El trabajo aquí desarrollado requiere el uso de estos métodos.
Para poder emplear entonces las herramientas anteriormente expuestas
se linealizará, expresando el modelo mediante su desarrollo de Taylor y
quedándonos con la parte lineal. El inconveniente que se presenta es que
3.3. Matriz de Información y Criterios de Optimización 67
esta matriz depende de los propios parámetros, por lo que se necesitarán
unos valores iniciales de los mismos para obtener los diseños deseados. Dicho
de otro modo, los diseños óptimos (aquellos que proporcionan una mejor
estimación de los parámetros) conseguidos mediante este procedimiento van
a depender de los propios parámetros y para cada valor inicial de éstos,
proporcionarán distintos diseños. En nuestro caso y para nuestros ejemplos
usaremos los datos proporcionados por el Jet Propulsion Laboratory (2003)
como valores iniciales.
Este caso particular de diseños se conoce como diseños localmente óp-
timos, es decir, óptimos cuando se sabe que los parámetros iniciales están
muy cercanos a ciertos valores especícos. En este sentido puede consultarse
Cherno (1953) o Frischmuth (1989).
El espacio de diseño X, donde varía la temperatura T , es acotado y ce-
rrado por las circunstancias experimentales. Se ha tomado la determinación
de expresar sus extremos como múltiplos de B, que lleva a la obtención de
resultados más claros y simplicados. Por lo tanto se ha considerado como
espacio de diseño X = [aB, bB], siendo B la mejor estimación del paráme-
tro exponencial y a y b constantes seleccionables para la especicación de
los límites inferior y superior del intervalo donde varía la temperatura.
3.3. Matriz de Información y Criterios de Optimización
Sean θt = (A,B) los parámetros a estimar del modelo, y sea f(T ) =∂E(k)/ ∂θ evaluada en unos valores concretos de los parámetros. Estos son
las mejores estimaciones disponibles a priori de los parámetros y el cálculo
de la matriz de información y de los diseños óptimos dependerán de estos
valores iniciales.
La matriz de información de Fisher para un diseño particular ξ y bajo
condiciones de normalidad de los datos, suponiendo que la varianza es uno,
σ2 = 1, es proporcional a la siguiente expresión (Observación 2),
M(ξ) =∑x∈X
f(T )f t(T )ξ(T ).
68 3. Diseños Óptimos para la Ecuación de Arrhenius
Entonces para el modelo planteado por la ecuación de Arrhenius se
tiene que
f(T ) =
(e−B/T
−Ae−B/T
T
), T ∈ X,
siendo la matriz de información de Fisher en este caso,
M(ξ, θ) =∑T∈X
(e−2B/T −Ae−2B/T
T
−Ae−2B/T
TA2e−2B/T
T 2
)ξ(T ).
La matriz de información de Fisher obtenida verica las propiedades
enunciadas con anterioridad, Proposición 2, propiedades que han sido apli-
cadas en los cálculos necesarios para la obtención de diseños óptimos.
Tal y como se ha visto en la Proposición 3, cuando N es sucientemente
grande, la covarianza de los estimadores de θ es aproximadamente σ2/N
veces la inversa de esta matriz.
A la hora de obtener Diseños Óptimos para la estimación de los pará-
metros de la ecuación de Arrhenius se han usado los criterios de D−optimi-
zación y c−optimización expuestos en la Sección 1.7. El criterio de D−opti-mización, minimiza el volumen de la región de conanza de las estimaciones
de los parámetros y es equivalente a través del Teorema de Equivalencia
con el criterio de G−optimización, que minimiza la varianza generalizada
de la predicción. El criterio de c−optimización se centra en la estimación
eciente de combinaciones lineales de los parámetros y en particular, como
se verá, proporciona los mejores diseños para estimar cada uno de los pará-
metros. A través de los criterios compuestos, se han combinado los diseños
óptimos para cada uno de los parámetros, con el objetivo de obtener un
diseño que combine al máximo la estimación de ambos parámetros.
Según lo visto, estos criterios son convexos y estrictamente decrecientes
y por lo tanto el objetivo es la obtención de diseños con valores lo más
pequeños posibles para estas funciones criterio. El diseño, de entre todos
los posibles sobre el espacio diseño X, que minimice estas funciones criterio
será el diseño, D−óptimo o c−óptimo respectivamente.
3.4. Diseño D−Óptimo 69
A la hora de medir las ventajas de cada uno de estos diseños óptimos
planteados, se ha usado la denición de eciencia (Denición 7), consi-
derando siempre que los diseños a comparar poseen el mismo número de
observaciones.
3.4. Diseño D−Óptimo
Para estimar ambos parámetros simultáneamente, se puede usar el cri-
terio de D−optimización. Como ya hemos dicho este diseño minimiza la
región de conanza de ambos parámetros, en el caso particular de 2 pa-
rámetros, m = 2, minimiza el volumen del elipsoide de conanza de las
estimaciones de los parámetros.
En nuestro caso se ha usado como criterio de D−optimización la fun-
ción ΦD[M(ξ)] = detM−1/m(ξ), donde m es el número de parámetros del
modelo (Sección 1.7.1). Utilizando el Teorema de Equivalencia (Teorema
2), tendremos que un diseño ξ?D será D−óptimo si, y sólo si es G−óptimo.
Por lo tanto los diseños obtenidos minimizando el valor de la función cri-
terio ΦD minimizarán también la varianza generalizada de la predicción de
la respuesta en T , f t(T )M(ξ)−1f(T ).
Para asegurar que el diseño propuesto es verdaderamente D−óptimo,
se ha usado nuevamente el Teorema de Equivalencia (Teorema 4). Al ser
los criterios convexos y diferenciables tendremos que un diseño ξ?Φ será
Φ-óptimo si, y sólo si:
ψ(T, ξ?Φ) = f t(T )∇Φ(ξ?Φ)f(T )− trM(ξ?Φ)∇Φ(ξ?Φ) ≥ 0, T ∈ X,
vericándose la igualdad en los puntos de soporte Xξ?Φ. Por simplicidad en
la notación, Φ(M) equivale a Φ[M(ξ)] y ∇Φ(ξ) es el gradiente de Φ(ξ).
Que aplicado a nuestra función ΦD dice que un diseño ξ?D seráD−óptimo
si, y sólo si:
f t(T )M(ξ?D)−1f(T ) ≤ m, T ∈ [aB, bB],
70 3. Diseños Óptimos para la Ecuación de Arrhenius
donde el número de parámetros esm = 2, satisfaciéndose la igualdad al me-
nos en los puntos donde se toman observaciones, también llamados puntos
de soporte del diseño (Teorema 2).
Utilizando las propiedades enumeradas en la Sección 1.7.1 y partiendo
de diseños con dos puntos en su soporte, t1B, t2B ∈ X, y pesos p y 1− prespectivamente, se obtiene que los diseños que minimicen el valor de la
función criterio serán aquellos que maximicen el valor del
detM(ξ) =p(1− p)A2e−2(t1+t2)/t1t2(t1 − t2)2
(t1t2B)2t1, t2 ∈ [a, b].
El máximo de esta expresión se alcanzará para valores de p = 1/2. Seencontrará el diseñoD−óptimo derivando respecto a t1 y t2 y comprobando
los diseños con soporte en los extremos del espacio de diseño, este diseño se
vericará como el correcto a través del Teorema de Equivalencia (Teorema
2).
El diseño propuesto como D−óptimo posee dos puntos en su soporte
con pesos iguales para cada punto en el espacio de diseño X = [aB, bB]:
Si tD = b/(1+b) ∈ [a, b], entonces ξ?D tiene como puntos de soporte
a tDB y bB.
Si tD = b/(1+b) /∈ [a, b], entonces ξ?D tiene como puntos de soporte
a aB y bB.
Se presenta a continuación un ejemplo de la aplicación de este diseño
D−óptimo a un caso real.
Ejemplo 1. Veamos que el diseño D−óptimo generado para estimar los
parámetros de la ecuación de Arrhenius para la reacción química de interés
en la modelización atmósférica: NO+O3 → NO2 +O2 satisface el Teorema
de Equivalencia.
Supongamos que se desean estimar los parámetros A y B para el rango
de temperaturas X = [aB, bB] = [212, 422], usando como aproximaciones
iniciales de los valores de los parámetros A = 3.0×10−12 y B = 1500 (±200)(Jet Propulsion Laboratory, 2003). Como puede comprobarse el factor de
3.4. Diseño D−Óptimo 71
incertidumbre presentado por el parámetro B es considerable por lo que re-
sulta acertado el planteamiento de diseños óptimos que nos lleven a reducir
la varianza de las estimaciones.
El diseño D−óptimo obtenido para este experimento tiene como puntos
de soporte los valores tDB = 329.3 y bB = 422 tomando el mismo número
de observaciones en cada punto. Este diseño expresado con la notación
clásica del diseño óptimo de experimentos tiene la siguiente forma:
ξ?D =
(tDB bB
1/2 1/2
)=
(329.3 4221/2 1/2
).
El la Figura 3.1 se representa de forma gráca los valores de la varianza
generalizada frente a la temperatura en los valores del espacio de diseño.
Con esto se demuestra que el Teorema de Equivalencia se verica y que
la desigualdad se mantiene para T ∈ [212, 422], satisfaciéndose únicamente
la igualdad para los puntos de soporte del diseño. Basándose en la deni-
aB tDB bBTemperatura
0
0.5
1
1.5
2
2.5
3
aB tDB bB
001.nb 1
Figura 3.1. Gráca de la varianza generalizada para el Ejemplo 1.
ción de eciencia de un diseño, y siempre considerando que los diseños a
comparar toman el mismo número de observaciones, se ha comparado la
72 3. Diseños Óptimos para la Ecuación de Arrhenius
eciencia de diversos diseños con el diseño D−óptimo obtenido. Los diseños
a comparar son los siguientes:
El diseño llevado a cabo por Ray y Watson (1981) en su trabajo
experimental. En él tomaron un total de 75 observaciones, (N =75), en 6 puntos distintos, con diferentes pesos para cada punto del
soporte:
ξexp =
(212 241 273 299 361 422
12/75 9/75 8/75 24/75 12/75 10/75
).
Un diseño uniformemente distribuido, de pesos iguales y con sus
puntos de soporte uniformemente distribuidos a lo largo del espacio
de diseño: este diseño tiene un valor constante d como parámetro
de espaciamiento entre los puntos de su soporte. Este parámetro es
la distancia que hay entre dos observaciones consecutivas.
Un diseño aritméticamente distribuido, de pesos iguales y con sus
puntos espaciados por un parámetro que crece en forma de progre-
sión aritmética, (id), desde el centro hasta los extremos del espacio
de diseño X, con i = 1, . . . , N/2. Sólo en el caso en el que N es
impar el centro de X es un punto de soporte de este diseño.
Un diseño geométricamente distribuido, igual que el caso aritméti-
co pero con el parámetro de espaciado creciendo en forma de una
progresión geométrica, (di),
Un diseño distribuido de forma lineal inversa: en este diseño, el
intervalo [Ae−1/a, Ae−1/b] es dividido de forma uniforme y se toman
como puntos de soporte para el diseño los puntos obtenidos a través
de la inversa de la función de regresión, ecuación de Arrhenius, en
el espacio de diseño X = [aB, bB].
Todos los diseños aquí planteados tienen el mismo número de pun-
tos en su soporte, N = 6, y salvo el primero, son simétricos respecto
3.5. Método de Elfving y Diseños c−Óptimos 73
al centro del espacio de diseño X = [212, 422]. Comparando cada di-
seño con el D−óptimo, ξ?D, calculando los valores de la función crite-
rio, ΦD(ξ) = detM−1/2(ξ), y obteniendo su eciencia respecto al óptimo,
effD(ξ) = ΦD(ξ?D)/ΦD(ξ), se obtienen los resultados que se muestran el la
Tabla 3.1.
effD(ξ)
Diseño Ray y Watson 0.55Diseño Uniforme 0.61Diseño Aritmético 0.63Diseño Geométrico 0.66Diseño Lineal Inverso 0.67
Tabla 3.1. D−eciencias del diseño experimental de Ray y Watson(1981) y de otros cuatro posibles diseños para estimar los parámetrosde la ecuación de Arrhenius.
3.5. Método de Elfving y Diseños c−Óptimos
Si el interés se centra en la estimación de una combinación lineal de
los parámetros, como por ejemplo ctθ, o bien en estimaciones individua-
les para A o B, entonces se puede usar el criterio c−óptimo. Como he-
mos visto en la Sección 1.7.3, una forma elegante de encontrar el diseño
óptimo para estimar una combinación de los parámetros fue proporcio-
nado por Elfving (1952). Para un modelo dado, con una función de re-
gresión f(T ), el método dene en primer lugar el conjunto de Elfving,
Λ = cierre convexo de (f(X) ∪ −f(X)).
El punto de intersección de la línea recta denida por el vector c con
la frontera del conjunto de Elfving, Λ, determina el diseño c−óptimo como
una combinación convexa de vértices de Λ. Estos vértices corresponden a
los puntos de soporte del diseño óptimo y los pesos de las combinaciones
convexas se corresponden con los pesos de cada punto en el diseño.
74 3. Diseños Óptimos para la Ecuación de Arrhenius
Además el valor de la función criterio para el diseño óptimo, ξ?c , es
equivalente a Φc(ξ?c ) = (‖c‖/‖c?‖)2, donde c? es el vector denido por el
punto de corte de la línea denida por el vector c con la frontera de Λ(Cherno, 1972).
El conjunto de Elfving Λ para el modelo planteado por la ecuación de
Arrhenius se muestra en la Figura 3.2. Para estimar los parámetros A y B,
se asignará a c los valores ct = (1, 0) y ct = (0, 1), siendo cada uno de los
diseños cA− y cB−óptimo respectivamente.
xb
yb
xc
yc
xa
ya
x*
y*
Figura 3.2. Conjunto de Elfving para la ecuación de Arrhenius. Lospuntos f(aB) = (xa, ya)
t y f(bB) = (xb, yb)t son los valores de f en
los extremos del espacio de diseño X. Los puntos f(tcB) = (xc, yc)t y
f(bB) = (xb, yb)t denen, en este caso, los puntos de soporte para los
diseños cA− y cB−óptimos. Los Puntos c?A = (x?, 0)t y c?B = (0, y?)t
son combinaciones convexas de (xc, yc) y (xb, yb) y los pesos de estascombinaciones son los pesos de los diseños óptimos.
Los extremos de la línea recta que unen el extremo de la curva f(X),f(bB) = (xb, yb)t, y el punto tangente sobre −f(X), −f(tcB) = (xc, yc)t, oel inicio de la curva −f(X), −f(aB) = (−xa,−ya)t, denen los puntos de
soporte para los diseños que estiman de forma óptima A y B. Los puntos de
corte de esta línea recta con ambos ejes, c?A = (x?, 0)t y c?B = (0, y?)t, de-nen los pesos para los diseños cA− y cB−óptimos respectivamente (Figura
3.2).
3.5. Método de Elfving y Diseños c−Óptimos 75
De la geometría de la Figura 3.2 junto con el método de Elfving, siendo
δ la solución principal de la ecuación δe(δ+1) = 1, δ = 0.278, se tiene queel diseño cA−óptimo puede tener una de las siguientes formas:
Si tc = b/(1 + b + δb) ∈ [a, b], entonces ξ?cA tiene como puntos de
soporte a tcB y bB, y el diseño cA−óptimo es:
ξ?cA =
(tcB bBtce1/tc
tce1/tc+be1/bbe1/b
tce1/tc+be1/b
).
Si tc = b/(1 + b + δb) /∈ [a, b], entonces ξ?cA tiene como puntos de
soporte a aB y bB, y el diseño cA−óptimo es:
ξ?cA =
(aB bBae1/a
ae1/a+be1/bbe1/b
ae1/a+be1/b
).
De la misma forma se tiene que el diseño cB−óptimo puede tener una
de las siguientes formas:
Si tc = b/(1 + b + δb) ∈ [a, b], entonces ξ?cB tiene como puntos de
soporte a tcB y bB, y el diseño cB−óptimo es:
ξ?cB =
(tcB bBe1/tc
e1/tc+e1/be1/b
e1/tc+e1/b
).
Si tc = b/(1 + b + δb) /∈ [a, b], entonces ξ?cB tiene como puntos de
soporte a aB y bB, y el diseño cB−óptimo es:
ξ?cB =
(aB bBe1/a
e1/a+e1/be1/b
e1/a+e1/b
).
Para ambas opciones, tc ∈ [a, b] y tc /∈ [a, b], los diseños cA− y cB−óptimos
tienen los mismos puntos de soporte y los pesos únicamente dependen de b
y de tc o a. Los diseños no dependen del valor inicial considerado para A,
pero sí que dependen implícitamente de B, a = T1/B y b = T2/B, siendo
T1 y T2 los límites inferior y superior del espacio de diseño X.
76 3. Diseños Óptimos para la Ecuación de Arrhenius
Los valores de la función criterio, que salvo una constante multiplicativa
son las varianzas de los estimadores, Φc(ξ) = ctM(ξ)−1c, son:
Si tc ∈ [a, b], entonces
ΦcA(ξ?cA) =
(tce
1/tc + be1/b
b− tc
)2
,
ΦcB (ξ?cB ) =
(tcbB(e1/tc + e1/b)
A(b− tc)
)2
.
Si tc /∈ [a, b], entonces
ΦcA(ξ?cA) =
(ae1/a + be1/b
b− a
)2
,
ΦcB (ξ?cB ) =
(abB(e1/a + e1/b)
A(b− a)
)2
.
Y las eciencias de cada uno de estos diseños para estimar el otro
parámetro dependen de b y de tc o a, y se corresponden con las expresiones:
Si tc ∈ [a, b], entonces
effcA(ξ?cB ) =ΦcA(ξ?cA)ΦcA(ξ?cB )
=(tce1/tc + be1/b)2
(e1/tc + e1/b)(t2ce1/tc + b2e1/b),
effcB (ξ?cA) =ΦcB (ξ?cB )ΦcB (ξ?cA)
=tcb(e1/tc + e1/b)2
(be1/tc + tce1/b)(tce1/tc + be1/b).
Si tc /∈ [a, b], entonces
effcA(ξ?cB ) =ΦcA(ξ?cA)ΦcA(ξ?cB )
=(ae1/a + be1/b)2
(e1/a + e1/b)(a2e1/a + b2e1/b),
effcB (ξ?cA) =ΦcB (ξ?cB )ΦcB (ξ?cA)
=ab(e1/a + e1/b)2
(be1/a + ae1/b)(ae1/a + be1/b).
En la Figura 3.3 se muestra el comportamiento de la eciencia del diseño
cA−óptimo para estimar B. La gráca corresponde a la representación de
la función effcA(ξ?cB ) para valores de b ∈ [0, 1.5] y a ∈ [0, b]. La eciencia esalta para valores de a cercanos al valor de b y toma el valor 1 para el caso
3.5. Método de Elfving y Diseños c−Óptimos 77
0
0.5
1 0.5
1
1.5
0.8
0.85
0.9
0.95
1
1.5 0
a
eff
b
0
0.5
1
0.8
0.85
0.9
0.95
1
Figura 3.3. Eciencia del diseño cA−óptimo para estimar B, effcA(ξ?cB).
particular en que a = b, en este caso el diseño posee un único punto en su
soporte. La eciencia disminuye según aumenta la distancia entre ambos
puntos, estando acotada inferiormente por el valor (1 + e1/a)−1 cuando b
tiende a innito.
Igualmente, en la Figura 3.4 se muestra el comportamiento de la e-
ciencia del diseño cB−óptimo para estimar el parámetro A. La gráca
corresponde a la representación de la función effcB (ξ?cA) para valores de
b ∈ [0, 1.5] y a ∈ [0, b]. Nuevamente la eciencia es alta para valores de a
cercanos a b e igual que en el caso anterior toma el valor de 1 para el diseño
con un único punto de soporte en que a = b. La eciencia disminuye tam-
bién en este caso cuando la distancia entre ambos valores aumenta pero, a
diferencia del caso anterior, ahora tiende a 0 cuando b tiende a innito.
De forma más genérica, podría interesarnos estimar ctθ, con ct = (c1, c2),y c1 6= 0. Obviamente este problema es equivalente a estimar ct = (1, c1/c2),o lo que es lo mismo (1, cA/B) siendo c arbitrario. Usando el argumento
de Elfving se prueba que:
78 3. Diseños Óptimos para la Ecuación de Arrhenius
0
0.5
1 0.5
1
1.5
0.85
0.9
0.95
1
1.5 0
a
eff
b
0
0.5
1
0.85
0.9
0.95
1
Figura 3.4. Eciencia del diseño cB−óptimo para estimar A, effcB (ξ?cA).
Si tc = b/(1 + b + δb) ∈ [a, b], y si (−1/tc) ≤ c ≤ (−1/b) entoncestendremos un diseño óptimo con un único punto en su soporte en
−B/c, tomando la función característica en ese caso el valor de
e−2c. En caso contrario ξ?c tiene como puntos de soporte a tcB y
bB, con peso en tcB igual a
ptc =tc(1 + bc)e1/tc
tc(1 + bc)e1/tc + b(1 + tcc)e1/b,
y 1 − ptc en bB. El valor de la función criterio, i.e. la varianza de
la estimación, para el diseño c−óptimo es
Φc(ξ?c ) =e2/b(1 + b+ bc+ bδ + (1 + bc)e1+δ)2
b2(1 + δ)2.
Si tc = b/(1 + b + δb) /∈ [a, b] y (−1/a) ≤ c ≤ (−1/b) entonces
nuevamente tendremos un diseño óptimo con un único punto en su
soporte en −B/c y el valor de la función característica en este caso
es e−2c. En caso contrario ξ?c tiene como puntos de su soporte a aB
3.6. Diseños Óptimos Compuestos 79
y bB, con peso en aB igual a
pa =a(1 + bc)e1/a
a(1 + bc)e1/a + b(1 + ac)e1/b
y 1− pa en bB. El valor de la función criterio, i.e. la varianza de la
estimación, para el diseño c−óptimo es
Φc(ξ?c ) =(a(1 + bc)e1/a + b(1 + ac)e1/b)2
(b− a)2.
3.6. Diseños Óptimos Compuestos
En el modelo planteado por la ecuación de Arrhenius puede resultar
de mayor interés, o requerir mayor precisión, la estimación de uno de los
dos parámetros en lugar de la estimación del otro. La eciencia de la es-
timación de uno de los parámetros ha de ser, por lo tanto, mayor que la
eciencia de la estimación del otro. Como hemos visto en la Sección 1.7.4,
es posible combinar criterios para obtener un diseño que satisfaga en de-
terminada proporción los criterios a combinar. Para este caso particular,
combinaremos los diseños cA− y cB−óptimos mediante una nueva función
criterio compuesta por ΦcA y por ΦcB :
Φλ(ξ) = λΦcA(ξ)
ΦcA(ξ?cA)+ (1− λ)
ΦcB (ξ)ΦcB (ξ?cB )
=λ
effcA(ξ)+
1− λeffcB (ξ)
.
En esta expresión, 0 ≤ λ ≤ 1 es una constante seleccionada por el
usuario que regula el peso asignado a la estimación de cada parámetro. La
nueva función criterio compuesta es una función convexa ya que resulta de
una combinación convexa de dos funciones criterio también convexas y por
lo tanto el problema de optimización es esencialmente el mismo que en el
caso de un problema de diseño óptimo con una única función criterio.
El diseño que minimice el valor de Φλ(ξ), para un λ jo, será un diseño
óptimo compuesto. El valor de λ representa el peso asignado a cada criterio
presente en la combinación de las funciones criterio. En el caso de asignar
un valor cercano a la unidad, esto sugiere que la estimación de A es más
80 3. Diseños Óptimos para la Ecuación de Arrhenius
importante y por lo tanto al diseño cA−óptimo se le asigna mayor peso en
la combinación.
Como las varianzas de las estimaciones, los valores de las funciones cri-
terio Φ(ξ?c ), pueden tomar valores muy diferentes en virtud de las diferentes
magnitudes de cada parámetro, se estandarizan dividiéndolas por sus va-
lores óptimos, dando así lugar a la formulación presentada para la función
criterio compuesta Φλ(ξ).
Para poder llevar a cabo los cálculos, es conveniente jar el valor de λ
y encontrar los diseños que minimicen Φλ(ξ) de entre todos los de la forma
ξz,p =
(zB bB
p 1− p
).
Fijando b y λ, se buscan valores para z y p que minimicen Φλ(ξ). Paradeterminar si el diseño obtenido es verdaderamente óptimo, se usa una vez
más el Teorema de Equivalencia, Teorema 4, vericándose en el caso de
optimalidad que(∂ψ
∂x
)x=zB
= 0 al mismo tiempo que ψ(zB, ξz,p) = 0.
La primera de estas condiciones puede simplicarse, López-Fidalgo y
Wong (2002), considerando que:
∇Φλ(ξz,p) = −M−1(ξz,p)
λΦcA (ξ?cA
) 0
0 1−λΦcB (ξ?cB
)
M−1(ξz,p).
Puede ser útil representar grácamente los valores de la eciencia del
diseño compuesto respecto a los diseños óptimos de cada criterio que forma
parte de la combinación, frente a los valores de λ ∈ [0, 1]. En este caso
se representaría la eciencia del diseño compuesto obtenido frente a los
diseños óptimos para calcular A y B respectivamente. Cook y Wong (1994),
muestran como, en el caso de combinaciones de dos criterios, una de las
eciencias es no decreciente mientras que la otra es no creciente frente a λ.
3.6. Diseños Óptimos Compuestos 81
La pendiente de dichas curvas expresan la pérdida que debemos sufrir en la
estimación de uno de los parámetros para mejorar en la estimación del otro.
El punto de corte de ambas curvas dará el valor de λ para el cual el diseño
compuesto resulta igual de óptimo en la estimación de ambos parámetros
del modelo. Imhof y Wong (2000) han demostrado que este tipo de diseños
óptimos se corresponden con el concepto de diseños óptimos maximin,
ya que maximizan la eciencia mínima obtenida para ambos criterios. La
representación gráca de las eciencias ayuda al investigador en la toma
de decisiones a la hora de plantear un diseño de compromiso que satisfaga
dos objetivos, en principio, contradictorios.
Ejemplo 2. A modo de ejemplo se ha calculado el diseño óptimo que
estime los parámetros de Arrhenius para la reacción entre HO2 y el ozono.
Tal y como se ha descrito anteriormente, se han representado las eciencias
del diseño compuesto frente a los diseños cA− y cB−óptimos en función del
valor de λ. Igualmente que Sinha et al. (1987) en su trabajo experimental,
se ha considerado X = [243, 413] como el espacio de diseño cubierto por
el rango de temperaturas y se han usado como aproximaciones iniciales
de los parámetros los valores A = 1.0 × 10−14 y B = 490(+160,−80)(Jet Propulsion Laboratory, 2003), que nuevamente presentan un grado
importante de incertidumbre que sugiere y justica la necesidad de un
diseño óptimo.
Como se observa en la Figura 3.5, el diseño óptimo compuesto es el que
corresponde al valor de λ = 0.48 que asigna eciencias por encima del 98 %para la estimación de ambos parámetros. Este diseño óptimo compuesto
tiene como puntos de soporte zB = aB = 243 y bB = 413 con un peso
para el punto zB = 243 correspondiente a p = 0.64.
Si se jase una eciencia mínima para la estimación de un parámetro
determinado el diseño compuesto asignaría el valor de λ correspondiente
necesario para alcanzar esta eciencia maximizando al mismo tiempo la
eciencia de la estimación del otro parámetro, sujeta a la restricción esta-
blecida. Por ejemplo, se puede observar en la Figura 3.5, que para estimar B
con una eciencia mínima del 99 %, necesitaría jarse el valor de λ = 0.37.
82 3. Diseños Óptimos para la Ecuación de Arrhenius
0 0.25 0.37 0.5 0.75 1l
0.94
0.96
0.98
0.99
1
aicneicifE
0 0.25 0.37 0.5 0.75 1
0.94
0.96
0.98
0.99
1
effcA xl effcB xl
ejemplotbab.nb 1
Figura 3.5. Representación gráca de las eciencias del diseño com-puesto para estimar A y B respectivamente
Este valor de λ aseguraría simultáneamente una eciencia en la estimación
de A del 97.5 %, máxima de entre todos los diseños sujetos a la restricción
planteada.
Se pueden encontrar justicaciones y ampliaciones del uso de esta téc-
nica en los trabajos de Huang y Wong, (1998a; 1998b) y Cook y Wong
(1994).
3.7. Comparación con otros Diseños
Los diseños óptimos obtenidos hasta aquí, y diseñados para la estima-
ción de los parámetros del modelo planteado por la ecuación de Arrhenius,
poseen como soporte uno o dos puntos distintos. Estos diseños con tan po-
cos puntos no nos permiten observar la adecuación de los puntos al modelo,
circunstancia altamente valorada por los autores de los experimentos, per-
mitiendo detectar la falta de ajuste o adecuación al modelo. Para evitar este
inconveniente, los diseños usados en la práctica tienen más de dos puntos
3.7. Comparación con otros Diseños 83
en su soporte, véanse por ejemplo los diseños usados en los experimentos
llevados a cabo por Sinha et al. (1987) o Ray y Watson (1981).
Ahora bien, una vez calculados los diferentes diseños óptimos, pueden
compararse diferentes diseños calculando sus eciencias respecto a los óp-
timos y reunir así suciente información como para elegir el más adecuado
a los intereses del experimento.
A la hora de comparar, se han calculado los valores de las funciones
criterio para estimar de forma óptima A y B de un diseño genérico con N
puntos y con pesos iguales en cada punto,
ξexp =
(t1B t2B . . . tNB
1/N 1/N . . . 1/N
),
Para este experimento genérico, los valores de las funciones criterio que
determinan los diseños cA− y cB−óptimos respectivamente son:
ΦcA(ξexp) =N∑N
i=1
(e−1/ti
ti
)2
∑Ni=1
(e−1/ti
)2∑Ni=1
(e−1/ti
ti
)2−(∑N
i=1e−2/ti
ti
)2 ,
ΦcB (ξexp) =NB2
∑Ni=1
(e−1/ti
)2A2∑N
i=1
(e−1/ti
)2∑Ni=1
(e−1/ti
ti
)2−(∑N
i=1e−2/ti
ti
)2 .
Para obtener las eciencias, se dividen los valores obtenidos en ellas por
los diseños óptimos correspondientes, ΦcA(ξ?cA) y ΦcB (ξ?cB ) calculados en
la Sección 3.5, por el valor de la función criterio correspondiente para el
experimento genérico, ξexp,
effcA(ξexp) =ΦcA(ξ?cA)ΦcA(ξexp)
, effcB (ξexp) =ΦcB (ξ?cB )ΦcB (ξexp)
,
estas expresiones resultan ser independientes de A y únicamente dependen
de B implícitamente a través de los puntos a, b, t1 . . . tN .
Para poder comparar los diseños óptimos calculados, se supone que los
diseños que se comparan toman el mismo número de observaciones en el
espacio de diseño X = [aB, bB].
84 3. Diseños Óptimos para la Ecuación de Arrhenius
Al igual que en el Ejemplo 1, se considera un parámetro de espaciado
entre puntos consecutivos del diseño y se usan diseños simétricos respecto al
centro del espacio de diseño, con pesos iguales para cada punto del soporte,
1/N , y formando parte de los puntos de soporte del diseño los extremos del
espacio de diseñoX = [aB, bB]. La comparación se realizará con los mismos
diseños enumerados en el Ejemplo 1, i.e. diseños con una distribución de
puntos Uniforme, Aritmética, Geométrica o Lineal Inversa.
Y como ejemplos ilustrativos nuevamente se usarán las reacciones de
interés en la Química atmosférica que ya se han empleado en los anteriores
ejemplos.
Ejemplo 3. Para la reacción NO+O3 → NO2 +O2, cubriendo el rango de
temperaturas del espacio de diseño los valoresX = [aB, bB] = [212, 422] taly como hacen en su trabajo experimental Ray y Watson (1981), y conside-
rando como valores iniciales, es decir mejores aproximaciones a los valores
de los parámetros, A = 3.0 × 10−12 y B = 1500(±200) (Jet Propulsion
Laboratory, 2003). Los diseños cA− y cB−óptimos obtenidos tienen como
puntos de soporte las temperaturas tcB y bB,
ξ?cA =
(310.4 4220.73 0.27
), ξ?cB =
(310.4 4220.78 0.22
).
Los resultados para las eciencias calculadas de diferentes posibles diseños
genéricos de la forma de ξexp, con los puntos de soporte distribuidos también
de diferentes formas, se presentan en la Tabla 3.2.
Como se puede observar en los resultados, se puede identicar el diseño
que aporta la mayor eciencia a la estimación de cada parámetro, en este
caso particular es el de distribución Geométrica el que nos asegura el mayor
grado de eciencia en ambos casos.
Ejemplo 4. Se puede observar una situación diferente en el siguiente ejem-
plo. Para la reacción del HO2 con el ozono, y para temperaturas cubriendo
el intervalo X = [aB, bB] = [243, 413] tal y como usan Sinha et al. (1987).
Tomando como mejores estimaciones disponibles los valores A = 1.0×10−14
3.7. Comparación con otros Diseños 85
NO +O3 effcA(ξexp) effcB
(ξexp)
ξexp N = 4 N = 6 N = 10 N = 4 N = 6 N = 10
Uniforme 0.62 0.58 0.53 0.59 0.57 0.54Aritmético 0.71 0.67 0.59 0.69 0.68 0.63Geométrico 0.77 0.77 0.64 0.74 0.80 0.71Lineal Inverso 0.51 0.52 0.51 0.50 0.52 0.51
Tabla 3.2. Eciencias de cuatro posibles diseños genéricos, con dife-rentes valores de N (puntos experimentales distintos), para la estima-ción de los parámetros A y B de la reacción NO +O3.
y B = 490(+160,−80) (Jet Propulsion Laboratory, 2003), obtenemos los
siguientes diseños cA− y cB−óptimos,
ξ?cA =
(243 4130.57 0.43
), ξ?cB =
(243 4130.70 0.30
).
Se presentan, igual que para el ejemplo anterior, los resultados para las
eciencias calculadas de diferentes posibles diseños genéricos de la forma
de ξexp, con los puntos de soporte distribuidos también de diferentes formas,
Tabla 3.3.
HO2 +O3 effcA(ξexp) effcB
(ξexp)
ξexp N = 4 N = 6 N = 10 N = 4 N = 6 N = 10
Uniforme 0.57 0.49 0.43 0.55 0.48 0.43Aritmético 0.53 0.43 0.34 0.52 0.42 0.35Geométrico 0.51 0.36 0.26 0.50 0.37 0.27Lineal Inverso 0.58 0.49 0.43 0.57 0.49 0.44
Tabla 3.3. Eciencias de cuatro posibles diseños genéricos, con dife-rentes valores de N , para la estimación de los parámetros A y B de lareacción HO2 +O3.
Nuevamente, de estos resultados podemos elegir el diseño de mayor
eciencia en la estimación de los parámetros. Para este caso, en el que los
extremos del espacio de diseño son los puntos de soporte de los diseños
86 3. Diseños Óptimos para la Ecuación de Arrhenius
cA− y cB−óptimos, el experimento genérico de mayor eciencia no resulta
ser el de distribución geométrica sino el lineal inverso o en algún caso el
uniforme, con valores de eciencia muy similares.
Capítulo 4
Fenómenos de Adsorción
La adsorción es un fenómeno supercial que consiste en la deposición
de una sustancia sobre la supercie de otra, generalmente un sólido con
supercie muy rugosa, o bien namente pulverizado, formas en las que pre-
senta una mayor área supercial por unidad de masa. La fuerza impulsora
está relacionada con el exceso de energía que poseen, por regla general, las
moléculas de la interfase en comparación con las de la fase interior de la
sustancia.
La sustancia que adsorbe se denomina adsorbente, mientras que la que
es adsorbida se denomina adsorbato. En la adsorción se alcanza un equilibrio
entre sustancia adsorbida y sustancia no adsorbida, la cual se mantiene en
contacto con el adsorbente en forma de gas (o vapor) o en forma de soluto
de una disolución.
4.1. Generalidades
Como apunte histórico puede decirse que el fenómeno de la adsorción
se conoce desde el siglo XVIII. El sueco Scheele1, en 1773, y el italiano
Fontana2, en 1777, observaron la adsorción de gases por carbón, y el ruso
1Carl Wilhelm Scheele (1742-1786).2Felice Fontana (1730-1805).
87
88 4. Fenómenos de Adsorción
Lovitz3, en 1785, registró la adsorción de sustancias orgánicas en disolución
acuosa por carbón namente pulverizado. Una de las primeras aplicaciones
del fenómeno de la adsorción de gases por carbón tuvo lugar, por ejemplo,
en la creación de la máscara antigás para la protección contra los gases
tóxicos, durante la primera guerra mundial. Indudablemente, el fenómeno
tiene una enorme importancia en el comportamiento sicoquímico de múl-
tiples procesos naturales y en general en la industria (catálisis, corrosión,
medio ambiente, alimentación, etc.; ver por ejemplo Gregg y Sing, 1982).
Convencionalmente, se habla de sisorción y quimisorción, según la
magnitud de las fuerzas que actúan: fuerzas de naturaleza física, general-
mente débiles, originadas por interacción dipolar o multipolar, o fuerzas de
tipo químico, fuerzas propiamente de enlace. Es natural que sea muy difícil
establecer con claridad una separación entre estos dos comportamientos,
por lo que existe cierto margen de casos intermedios. Además, siempre que
se presenta quimisorción aparecen también, en mayor o menor grado, fenó-
menos de sisorción, pues las fuerzas que actúan en éste último caso, son
fuerzas de tipo general.
En los procesos de adsorción, la supercie desempeña un papel funda-
mental. La supercie de un sólido no es, en modo alguno, regular, por el
contrario, presenta numerosas rugosidades, prominencias, poros, etc. que
hacen que su valor sea mucho mayor del que podría calcularse por méto-
dos geométricos (Aspectos fractales de la supercie de los sólidos: ver, por
ejemplo, Avnir (1989)). El sistema de poros puede ser muy complicado y
extenso, llegando a ser su área supercial varios órdenes de magnitud supe-
rior a la de la supercie aparente. El tamaño de los poros y, en particular,
su diámetro es muy variable; convencionalmente se habla de macroporos
(diámetro & 20nm), microporos (. 1.5nm) y mesoporos (con tamaños in-
termedios). El tamaño de los poros tiene un interés considerable, ya que
para que su supercie pueda adsorber es preciso que las moléculas de ad-
sorbato puedan penetrar a su través.
3Tobias E. Lovitz (1757-1804).
4.2. Método Experimental 89
Las áreas suelen expresarse como área especíca, s, que es el área que
presenta 1 g de sólido, y suelen medirse en m2 g−1. La mayor parte de
los sólidos implicados en procesos de adsorción de cierto interés suelen
tener áreas especícas muy grandes, de hasta un orden de magnitud de
1000 m2 g−1.
4.2. Método Experimental
Puede resultar de interés en este punto una somera descripción del
método experimental habitualmente utilizado en la obtención de datos de
adsorción. Una descripción detallada de estos procedimientos puede encon-
trarse en la correspondiente monografía de la IUPAC (1985).
Desde un punto de vista fenomenológico hay dos magnitudes experi-
mentales de importancia. Una es la cantidad de adsorbato por unidad de
adsorbente, magnitud que designaremos por n, y la otra es el calor de ad-
sorción. Según el método de medida que se utilice será más conveniente
expresar n en unas u otras unidades. Las más corrientes son gramos, moles
o centímetros cúbicos (en condiciones normales de presión, p, y tempera-
tura, T : 1 atm y 0C) de adsorbato por gramo de adsorbente.
La cantidad adsorbida, n, depende de la temperatura, la presión o la
concentración de adsorbato, y la naturaleza sicoquímica del sistema. Si
n se expresa por gramo de adsorbente, depende también de la supercie
especíca de éste:
n = f(T, p, s, naturaleza del sistema).
Hay dos métodos generales para determinar n en sistemas sólido-gas:
el volumétrico y el gravimétrico (Adamson y Gast, 1997). En el método
volumétrico el adsorbente se coloca en un bulbo termostatizado (T = cte.),
conectado a un sistema manométrico que facilita la medida de la presión en
su interior. Se permite al adsorbato, en fase gaseosa, ponerse en contacto
con el sólido adsorbente. A medida que se produce la adsorción la presión
del gas disminuye hasta que se alcanza el equilibrio. De la diferencia de
90 4. Fenómenos de Adsorción
la presión de equilibrio respecto de la presión inicial se puede deducir el
volumen de gas adsorbido.
En el método gravimétrico se procede de forma muy parecida, excepto
que la cantidad de gas adorbido se deduce por pesada del sólido adorben-
te, antes y después de alcanzarse el equilibrio de adsorción. Los equipos
utilizados en este menester son especialmente sensibles.
Generalmente, las experiencias se llevan a cabo a temperatura constan-
te, obteniéndose la isoterma de adsorción.
La otra magnitud experimental de importancia la constituye el calor de
adsorción. La medida del calor desarrollado durante el proceso de adsorción
de un gas puede determinarse con ayuda de un calorímetro convencional. En
los fenómenos de adsorción, y muy especialmente en los de sisorción, el ca-
lor desarrollado es muy pequeño, por lo que se necesita una alta sensibilidad
en la determinación calorimétrica. Experimentalmente se ha comprobado
que, al igual que ocurre en los fenómenos de condensación y solidicación,
el calor de adsorción es siempre negativo, es un calor liberado por el sis-
tema, es decir, el fenómeno de adsorción es un fenómeno exotérmico. Esto
explica que la capacidad adsorbente de un sólido disminuya al aumentar la
temperatura.
4.3. Quimisorción
La quimisorción es debida a la formación de un verdadero enlace quí-
mico entre el adsorbente y el adsorbato. Es, pues, un verdadero proceso
de reacción química, y de ello se derivan sus características: las moléculas
quimisorbidas son nuevas especies químicas; el calor de adsorción suele ser
grande, mayor que el de condensación; la velocidad de reacción es general-
mente pequeña, como corresponde a un proceso con energía de activación
más o menos notable, etc.
El enlace químico es de corto alcance y solo lo pueden formar las molé-
culas en contacto directo con la supercie, situadas a la distancia de enlace.
4.4. Modelo de Langmuir 91
Por lo tanto, se formará una monocapa quimisorbida. Además, las inter-
acciones adsorbente/adsorbato son intensas, por lo que la heterogeneidad
de la supercie juega un papel determinante. La quimisorción no destruye
la red cristalina del sólido adsorbente, limitándose a añadir encima de ella
la capa de moléculas adsorbidas. Solamente si la reacción química es muy
favorable, el ataque continúa hacia el interior del sólido rompiéndose su red
y formando nuevos productos.
4.4. Modelo de Langmuir
La isoterma para describir los procesos de quimisorción deberá tomar
en cuenta estas dos características principales: la formación de la monocapa
y la heterogeneidad de la supercie. No existe ningún modelo plenamente
satisfactorio, aunque alguno, en determinados casos, resulta aceptable.
El modelo de Langmuir4 es el más simple y el más antiguo. La deducción
que se sigue a continuación es básicamente la proporcionada por Langmuir
(1918), en la que se utilizan argumentos relacionados con las velocidades
de condensación y de evaporación. En principio, se supone que la supercie
se encuentra constituída por un determinado número de centros activos,
S, en los que S1 se encuentran ocupados y S0 = S - S1 están libres. Si
la velocidad de condensación se toma como proporcional a S1, k1S1, y la
de condensación como proporcional al número total de centros, S0 y a la
presión, p, del gas, k2pS0, en el equilibrio se cumplirá:
k1S1 = k2pS0 = k2p(S − S1).
Según esto, la fracción de centros ocupados (supercie cubierta), θ =S1/S, puede expresarse:
θ =bp
1 + bp,
donde:
b =k2
k1.
4Irving Langmuir (1881-1957), Químico y Físico norteamericano.
92 4. Fenómenos de Adsorción
De forma alternativa, la fracción de supercie cubierta puede represen-
tarse como, θ = n/nm, donde n representa el número de moles de sustancia
adsorbida, por gramo de adsorbente, en unas determinadas condiciones y
nm es el número de moles necesario para cubir totalmente la supercie de
esta misma cantidad de adsorbente, formando una monocapa. Así:
n =nmbp
1 + bp.
Como se ve en la Figura 4.1, a baja presión la cantidad de sustancia
adsorbida, n ' nmbp, puede tomarse proporcional a la presión, p, mientras
que a valores altos tiende al valor de saturación, nm.
p
nnm
nm
langmuir.nb 1
Figura 4.1. Perl de la isoterma de Langmuir para dos valores dife-rentes del parámetro b.
4.5. Fisisorción
Cuando las fuerzas que actúan entre adsorbato y adsorbente son de tipo
físico, similares a las que existen entre moléculas en estado líquido o gaseo-
so, el fenómeno se cataloga como sisorción, siendo el calor desarrollado del
mismo orden de magnitud que el calor latente de vaporización del adsorbato
(1 - 5 kJ/mol). Además, los procesos de sisorción son considerablemente
4.5. Fisisorción 93
más rápidos que los de quimisorción, al ser su energía de activación no-
tablemente inferior, e incluso nula. Las características diferenciales entre
ambos tipos de adsorción se resumen en considerar que en quimisorción
se forman verdaderos enlaces químicos con el adsorbente, mientras que en
sisorción el comportamiento es similar a una condensación.
En sisorción se obtienen isotermas que presentan formas diferentes
según la naturaleza del sistema del que se trata. Aunque existe una amplia
variedad y no siempre es posible clasicar todos los comportamientos en
unos pocos tipos, la mayor parte de ellos corresponden a algunos de los cinco
tipos de la clasicación llevada a cabo por Brunauer, Deming, Deming y
Teller (BDDT) que se presenta en la Figura 4.2.
p0 p
n
I
isotermas.nb 1
p0 p
n
II
nm
isotermas.nb 1
p0 p
n
III
isotermas.nb 1
p0 p
n
IV
isotermas.nb 1
p0 p
n
V
isotermas.nb 1
Figura 4.2. Cinco tipos de isotermas, según la clasicación BDDTdada por Brunauer et al. (1940).
De los cinco tipos, Brunauer et al. (1940), el tipo I representa claramen-
te el comportamiento establecido por el modelo de Langmuir, si bien hay
que resaltar que no existen estudios experimentales en los que se observe de
94 4. Fenómenos de Adsorción
forma continuada este comportamiento hasta valores de presión próximos
a la presión de vapor del adsorbato, p0 (la presión de vapor representa la
presión de equilibrio entre las fases de vapor y de líquido del adsorbato).
En las isotermas de los tipos II y III, la curva de adsorción crece asintóti-
camente en p0. Este comportamiento se observa en fenómenos de adsorción
de gases en sólidos pulverizados. El crecimiento aparentemente ilimitado
de la capa adsorbida parece ser debido a la condensación en los intersticios
existentes entre las pequeñas partículas. Las isotermas de los tipos IV y V
representan comportamientos de adsorción de gases sobre sólidos porosos.
Todos estos comportamientos se pueden explicar satisfactoriamente a
partir de la teoría de Brunauer, Emmett y Teller, que constituye el modelo
básico de sisorción y que se expone a continuación.
4.6. Modelo de Brunauer, Emmett y Teller (BET)
Este modelo fue principalmente desarrollado con el objetivo de pro-
porcionar una interpretación del comportamiento de adsorción de gases en
sólidos pulverizados, de importancia práctica considerable al ser el fenó-
meno que se encuentra con mayor frecuencia (Brunauer et al., 1938). Se
basa en dos suposiciones principales:
La supercie del adsorbente se supone uniforme.
Las moléculas del gas se adsorben sobre la supercie en capas su-
cesivas, completas o no, en equilibrio dinámico entre sí y con el gas
no adsorbido.
Se supone, así mismo, que el modelo de adsorción de Langmuir es aplicable
a cada capa, con la diferencia de que para la primera capa, la energía libre
de adsorción, ∆G1, puede tomar un valor determinado según la interacción
entre el adsorbato y el adsorbente, pero para las capas sucesivas este pará-
metro es igual a ∆Gv, energía libre de vaporización del adsorbato en fase
líquida. Una suposición adicional es que la condensación/evaporación sólo
tiene lugar sobre la supercie de trabajo.
4.6. Modelo de Brunauer, Emmett y Teller (BET) 95
Figura 4.3. Adsorción en multicapas
La Figura 4.3 muestra esquemáticamente esta situación, en donde S0
representa la fracción de supercie libre de adsorbato, S1, la fracción de
supercie cubierta con una única capa de moléculas (monocapa), S2, la
fracción de supercie cubierta con doble capa, etc. La condición de que se
alcanza el equilibrio entre cada capa impone las relaciones siguientes. Para
la primera capa5:
pS0 = S1 exp[−∆G1/RT ],
y para las capas sucesivas:
pSi−1 = Si exp[−∆Gv/RT ],
lo cual puede escribirse de forma más simple:
S1 = yS0 S2 = xS1,
y
Si = xi−1S1 = yxi−1S0 = cxiS0,
donde:
y = p exp[∆G1/RT ] x = p exp[∆Gv/RT ],
y
c =y
x= exp[(∆G1 −∆Gv)/RT ] ' exp[(∆H1 −∆Hv )/RT ].
5∆G = ∆H − T∆S, representa la energía libre de Gibbs de equilibrio, siendo ∆H, laentalpía, es decir el calor desarrollado a presión constante, y ∆S, la entropía. Mientras quela entalpía es diferente para la interacción del adsorbente con la primera capa de adsorbato ycon las capas sucesivas, la entropía del proceso de adsorción se toma como aproximadamente lamisma para todas las capas.
96 4. Fenómenos de Adsorción
Con estas consideraciones, puede determinarse la fracción de supercie
cubierta:n
nm=∑∞
i=1 iSi∑∞i=1 Si
= cS0
∑∞i=1 ix
i
S0 + cS0∑∞
i=1 xi.
La sustitución del resultado algebraico en las correspondientes sumas da:
n
nm=
cx(1−x)2
1 + cx1−x
,
que puede reordenarse como:
θ =n
nm=
cx
(1− x)[1 + (c− 1)x]=
11− x
− 11 + (c− 1)x
,
donde x = p/p0, V es el volumen de gas adsorbido y p0 = exp[−∆Gv/RT ],es su presión de vapor.
0.2 0.4 0.6 0.8 1x
n
c=20050 10 3 1 0.1
isotermas.nb 1
Figura 4.4. Isoterma BET según diferentes valores del parámetro c
A la ecuación anterior se la conoce como isoterma BET y en la Figura
4.4 se presenta la forma de la curva prevista por esta ecuación. Se puede
comprobar que, según los valores del parámetro c, la forma de la isoterma
es distinta; la ecuación puede expresarse como la diferencia de dos hipér-
bolas en las que el parámetro c gura solamente en el sustraendo. Además,
4.7. Desviaciones de la Isoterma BET: Isoterma GAB 97
a valores grandes de c aparece un punto de inexión cuyas coordenadas
pueden determinarse:
xinex. =(c− 1)2/3 − 1
(c− 1) + (c− 1)2/3,(
n
nm
)inex.
=1c
[(c− 1)1/3 + 1][(c− 1)2/3 − 1].
Puesto que sólo los valores reales y positivos de x tiene sentido físico,
el punto de inexión aparecerá únicamente para c > 2. Para valores supe-
riores, la curva presenta un comportamiento similar a la isoterma Tipo II,
y el hombro es tanto más pronunciado cuanto mayor es el valor de c. Por el
contrario, para c < 2 el punto de inexión aparece a valores de x negativos
(2 > c > 1) o imaginarios (c < 1), es decir, sin interés físico. Para estos
casos la curva se asemeja a una isoterma del Tipo III.
Según las ecuaciones previas, se ve que el valor de c representa una
constante de equilibrio. Como magnitud termodinámica, su logaritmo está
en relación directa con el calor desarrollado en el proceso de adsorción, que
puede expresarse como diferencia del calor de adsorción de la primera ca-
pa, ∆H1 y el de las demás (calor de condensación), ∆Hv . Cuando ambos
valores son parecidos (c < 2) el comportamiento es del Tipo III. Por el
contrario, cuando los valores dieren bastante y c es grande, la adsorción
es fuerte y aparece un punto de inexión característico del Tipo II; es como
si se produjera la adsorción preferente en la primera capa, seguida de la
adsorción más débil en las restantes. En particular, cuando c es grande y el
margen de valores de x no es muy amplio, el comportamiento se asemeja a
la isoterma Tipo I, o isoterma de Langmuir (se obtiene de la fracción de su-
percie cubierta, n/nm, considerando que solamente se forma la monocapa,
es decir, i = 1).
4.7. Desviaciones de la Isoterma BET: Isoterma GAB
La mayor utilidad del modelo BET aplicado a procesos de adsorción
descritos por isotermas del Tipo II y III estriba en la determinación de
98 4. Fenómenos de Adsorción
la capacidad de la monocapa, nm, a partir de la cual se puede estimar la
supercie especíca del sólido adsorbente, de la misma forma que en los
casos de adsorción Tipo I. Una vez sabido cuántas moléculas cubren com-
pletamente la unidad de supercie, basta multiplicar por el área que ocupa
cada molécula para obtener la supercie. Este dato es de de gran relevan-
cia, por ejemplo, en catálisis heterogénea, pues es el factor determinante de
la velocidad de reacción.
Cuando la supercie del sólido adsorbente contiene mesoporos, cuyo
tamaño permite la inclusión de moléculas de adsorbato, el efecto que se
produce es la creación de capas de adsorción internas sobre las que, con-
trariamente a lo que ocurre en las externas, la cantidad de sustancia que
puede adsorberse tiene un límite: hasta que el poro se llena completamente.
Como consecuencia, las isotermas presentan dos características principales:
saturación de la adsorción a presiones altas y aparición de histéresis en el
supuesto proceso de desorción (la histéresis aparece cuando el proceso de
desorción no se corresponde con el inverso de adsorción).
Las formas de las isotermas Tipos IV y V corresponden a este compor-
tamiento. Estas isotermas caracterizan, además, procesos de adsorción en
los que la interacción gas-sólido es muy débil y, en este contexto, el agua
constituye un adsorbato de gran interés. La adsorción de humedad durante
las etapas de fabricación, almacenamiento y distribución de alimentos, pro-
ductos farmacéuticos, y otras sustancias de gran aplicación, en estado de
pulverización, es de vital importancia a la hora de controlar sus propieda-
des sicoquímicas a lo largo del tiempo. Cuando el adsorbato es vapor de
agua, la magnitud x = p/p0 se denomina actividad del agua y se designa
como a o aw.
El tratamiento completo cuantitativo de estos fenómenos de adsorción
es complicado y no existe ningún modelo completamente satisfactorio. No
obstante, debido, en parte, al considerable éxito del modelo BET, se han
introducido una serie de modicaciones que proporcionan una aceptable
4.7. Desviaciones de la Isoterma BET: Isoterma GAB 99
descripción de los procesos de adsorción cuando ocurre en un número li-
mitado de capas. De entre las numerosas correcciones habitualmente uti-
lizadas cabe destacar la denominada ecuación GAB (Guggenheim, 1966;
Anderson, 1946; de Boer, 1953), que goza de gran aceptación en el campo
de las Ciencias de los Alimentos (van den Berg, 1984), a cuya descripción
dedicaremos el resto de esta sección. Con esta ecuación pueden ajustarse
datos de adsorción de agua hasta un valor de aw = 0, 90, mientras que con
la ecuación del modelo BET, el margen de aplicación queda restringido a
valores de aw entre 0,05 y 0,35.
Si en la deducción de la isoterma BET se considera que el número de
capas está limitado a N , las sumas de la ecuación que determina la fracción
de supercie cubierta deben efectuarse entre i = 1 e i = N . El resultado
nal es, entonces (Brunauer et al., 1938):
n
nm=
cx
1− x
[1− (N + 1)xN +NxN+1
1 + (c− 1)x− cxN+1
].
La ecuación anterior y la denominada como isoterma BET interpretan
las isotermas I, II y III, para sólidos no porosos y porosos. La forma de
las isotermas IV y V son similares a la II y III excepto en el comporta-
miento de saturación que presentan a altas presiones, justo por debajo de
la presión de vapor, p0. Este hecho fue interpretado por Brunauer et al.
(1940) en el sentido de que a medida que la presión se acerca al valor de
saturación, la energía de interacción entre las capas se hace mayor que el
calor de condensación, lo que hace que el proceso de adsorción deje de ser
termodinámicamente favorable a partir de una determinada capa. Con esta
suposición adicional y siguiendo un procedimiento similar a los casos an-
teriores, puede deducirse la ecuación que describe el comportamiento de la
adsorción para las isotermas Tipos IV y V:
n
nm=
cx
1− x
[1 + (Ng/2−N)xN−1 − (Ng −N + 1)xN +NgxN+1/2
1 + (c− 1)x+ (cg/2− c)xN − cgxN+1/2
].
Esta ecuación se conoce habitualmente como isoterma BDDT. El pará-
metro g = exp(q/RT ) y q es el calor de adsorción en exceso que se supone
100 4. Fenómenos de Adsorción
se desarrolla en la deposición de la N-esima capa, la última capa. El resto
de los símbolos mantienen su signicado.
Si se expresa g/2 = k, la isoterma BDDT, para N = 1, se reduce a la
siguiente forma (Caurie, 2006):
n
nm=
ckx
1 + ckx,
donde el parámetro k se toma como un coeciente de corrección sobre x.
Cuando este parámetro es k = 1, la ecuación anterior se reduce a la isoterma
Langmuir (N = 1):n
nm=
cx
1 + cx.
Si, de modo equivalente, se introduce k, como coeciente corrector de
x, en la isoterma BET limitada a N capas, se obtiene:
n
nm=
ckx
1− kx
[1− (N + 1)(kx)N +N(kx)N+1
1 + (c− 1)kx− c(kx)N+1
],
que puede reorganizarse del modo siguiente:
n
nm=ckx[(1− (kx)N )/(1− kx)] + [(n/nm)−N ]c(kx)N+1
1 + (c− 1)kx.
Tanto en el modelo BET como en el BDDT, n/nm = N (número de
capas adsorbidas) y, por lo tanto, en la ecuación anterior, n/nm −N = 0,con lo que se reduce a:
n
nm=
ckx[1− (kx)N ](1− kx)[1 + (c− 1)kx]
.
Si k 1 y N , entonces (kx)N puede ser despreciable, en cuyo caso la
ecuación anterior toma la forma simplicada:
n
nm=
ckx
(1− kx)[1 + (c− 1)kx],
que se conoce como ecuación o isoterma GAB (Guggenheim, 1966; Ander-
son, 1946; de Boer, 1953).
4.7. Desviaciones de la Isoterma BET: Isoterma GAB 101
Por otra parte, sin considerar (kx)N despreciable y suponiendo k = 1se obtiene la ecuación de Pickett (Pickett, 1945):
n
nm=
cx(1− xN )(1− x)[1 + (c− 1)x]
,
que representa otra de las numerosas correcciones aplicadas a la isoterma
BET, si bien de menor alcance e importancia que la ecuación GAB.
La utilización de las isotermas de adsorción es muy amplia en numerosos
fenómenos de naturaleza sicoquímica y su aplicación está muy extendi-
da. Resulta por tanto de gran interés cualquier esfuerzo que contribuya
a aumentar la abilidad de las conclusiones que puedan obtenerse de la
aplicación de estos modelos.
Capítulo 5
Diseños Óptimos para
las Isotermas de
Adsorción BET y GAB
5.1. Aplicaciones de los Fenómenos de Adsorción
A lo largo del Capítulo 4 se han desarrollado las nociones teóricas que
permiten plantear los modelos que se han venido usando de forma clásica
en la literatura para explicar los fenómenos superciales de adsorción de
gases sobre sólidos (Adamson y Gast, 1997). La correcta modelización de
los fenómenos de adsorción es fundamental en numerosos procesos indus-
triales de naturaleza química. Cabe destacar como etapas claves la correcta
elección del modelo (isoterma) así como la correcta estimación de los pa-
rámetros. El objetivo del trabajo es facilitar estas tareas mediante diseños
óptimos que permitan el ahorro de tiempo y dinero aumentando a la vez
la calidad de las estimaciones y por lo tanto la calidad de las decisiones
tomadas a la vista de los datos.
De entre los fenómenos físicoquimicos en los que las medidas de adsor-
ción de gases y vapores sobre sólidos resultan de interés, podemos destacar
103
104 5. Diseño Óptimo: Isotermas BET y GAB
la captación de sustancias químicas por los suelos (Shonnard et al., 1993),
la adsorción de agua por alimentos lo cual controla su estabilidad durante
el tiempo de almacenamiento (esta magnitud es una variable de suma im-
portancia en la determinación de periodos de caducidad de los productos
alimenticios) (Arslan y Togrul, 2005), en procesos de teñido de bras tex-
tiles, en la descontaminación de residuos líquidos industriales (Avom et al.,
2001), etc. En todos estos procesos uno de los parámetros fundamentales es
el área supercial del sólido adsorbente así como la distribución y tamaño
del poro. Estos parámetros resultan de interés en adsorbentes industria-
les, catalizadores, pigmentos, cerámicas, materiales de construcción, entre
otros.
Como ya se ha mencionado, el fenómeno de la adsorción consiste en la
deposición de uno o más componentes gaseosos sobre la supercie de un
sólido. El fenómeno tiene lugar cuando un gas susceptible de ser adsorbido
(adsorbato) entra en contacto con la supercie del sólido (adsorbente). La
distribución del adsorbato sobre el adsorbente puede ser en forma una única
capa, monocapa, o en forma de multicapa.
Fenomenológicamente, la adsorción se describe en términos de una fun-
ción de desarrollo empírico o teórico, n = f(P, T ) donde n es la cantidad
adsorbida, P = p/p0, donde p es la presión parcial de equilibrio del gas
sobre el adsorbente y p0 es la presión de saturación o presión de vapor,
y T es la temperatura. Cuando la temperatura se mantiene constante, la
relación anterior se denomina isoterma de adsorción.
La cantidad de adsorbato necesario para cubrir la supercie del adsor-
bente con una única capa de moléculas se denomina capacidad de la mo-
nocapa, nm, pudiéndose calcular el área supercial del adsorbente a partir
de dicho valor, sabiendo el área efectiva ocupada por cada molécula de ad-
sorbato. Este tipo de medidas tiene gran interés en la determinación del
tamaño del poro en sólidos porosos, en el cálculo del tamaño de partícula
en sólidos pulverizados y en la determinación de la ecacia de catalizadores
en catálisis heterogénea entre otras aplicaciones.
5.1. Aplicaciones de los Fenómenos de Adsorción 105
Existe una amplia variedad de modelos usados en la literatura para
describir los fenómenos de adsorción. De entre los desarrollados de forma
teórica y sobre los que nos hemos centrado en el Capítulo 4 es de destacar
el modelo de Langmuir (1918) para adsorción en monocapa. La obtención
de diseños óptimos para el modelo de Langmuir ya ha sido abordada con
anterioridad, ya que dicho modelo es formalmente equivalente al modelo
de catálisis enzimática de Michaelis-Menten para el que se han calculado
diseños óptimos en múltiples trabajos (Currie, 1982; López-Fidalgo yWong,
2002; Dette et al., 2003).
De entre los modelos más utilizados para describir los fenómenos de
adsorción multicapa es de destacar el modelo BET (Brunauer et al., 1938) y
su extensión, el modelo GAB (Guggenheim, 1966; Anderson, 1946; de Boer,
1953), cuya justicación teórica ha sido desarrollada en el Capítulo 4. El
modelo BET tiene la ventaja de su simplicidad y cuenta con la aprobación
de la International Union of Pure and Applied Chemistry (IUPAC, 1985).
Por otro lado el modelo GAB se utiliza cuando el margen de presiones es
mayor, y ha sido recomendado para la caracterización de la adsorción de
vapor de agua en alimentos por el European Project Group COST 90 (Wolf
et al., 1985).
Es asimismo destacable la existencia de multitud de modelos semi-
empíricos y modelos modicados que se utilizan principalmente en la indus-
tria alimenticia para la caracterización de la adsorción de vapor de agua.
Como se ha mencionado anteriormente el contenido de vapor de agua es una
variable crucial en la determinación de la calidad de determinados produc-
tos alimenticios. De entre la multitud de modelos semi-empíricos existentes
en la literatura podemos citar Oswin (1946), Hailwood y Horrobin (1946),
Halsey (1948), Chirife y Iglesias (1978), Ferro Fontan et al. (1982) , entre
otros muchos
Como hemos dicho, existe un amplio interés en la modelización de los
fenómenos de adsorción en procesos industriales de naturaleza química.
En este sentido, el objetivo de este trabajo se centra en la elaboración de
diseños óptimos que permitan a los investigadores discriminar entre posibles
106 5. Diseño Óptimo: Isotermas BET y GAB
isotermas, asunto que presumimos es de un alto interés para la comunidad
cientíca internacional (Timmermann et al., 2001; Timmermann, 2003).
Una vez elegida la isoterma, la aplicación de diseños D− y c−óptimos
(Secciones 1.7.1 y 1.7.3) permiten al experimentador una mejor estimación
de los parámetros de interés, al mismo tiempo que son capaces de medir la
eciencia de los diseños experimentales utilizados mediante su comparación
con los óptimos.
Nuestro trabajo se ha centrado en la adsorción de vapor de agua por
productos alimenticios, sobre todo a la hora de mostrar ejemplos y aplica-
ciones del trabajo. Como ya se ha dicho, la cantidad de humedad presente
en los alimentos es una variable crítica para juzgar la calidad de determi-
nados productos alimenticios y la caracterización del proceso de adsorción
por parte de estos es necesaria para realizar estimaciones de vida útil del
producto al mismo tiempo que durante procesos de secado, almacenado y
en el diseño de contenedores y sistemas de embalaje. Hasta tal punto es
importante el seguimiento de el proceso de adsorción que son frecuentes
los controles sobre cereales y hortalizas (Al-Muhtaseb et al., 2004), frutas
(Moraga et al., 2006) y especias (Cepeda et al., 1999) así como la monito-
rización de la estabilidad de los alimentos en procesos de preservado como
el congelado o el secado (Jouppila y Roos, 1997) que aseguren una máxima
calidad del producto nal.
El interés en estos ejemplos de adsorción de vapor de agua sobre pro-
ductos alimenticios, maniestado por la cantidad de bibliografía hallada,
se debe al alto interés práctico de estos procesos. La extensión de los re-
sultados presentados es inmediata a cualquier otro fenómeno de adsorción
como los ya mencionados.
5.2. Isotermas de Adsorción
De las diferentes teorías y modelos de adsorción presentes en la litera-
tura la obtención y representación de los datos a temperatura constante
5.2. Isotermas de Adsorción 107
(isoterma) es no sólo la mas conveniente sino también la forma más ade-
cuada para obtener conclusiones teóricas.
Al tratar de adsorción de vapor de agua utilizaremos la notación más
frecuentemente usada en este campo: la cantidad de agua adsorbida we = n
se expresa en términos de cantidad de agua adsorbida por cantidad de
adsorbente, y la actividad del agua aw = p/p0, donde p es la presión de
vapor del agua contenida en el producto y p0 es la presión de vapor de agua
pura a la temperatura a la que se lleve a cabo el experimento. La actividad
del agua puede variar en el intervalo [0, 1], siendo 0 la ausencia total de
agua y 1 un 100 % de humedad.
De las isotermas planteadas en el Capítulo 4 la isoterma Langmuir coin-
cide formalmente con el modelo de Michaelis-Menten (Perso y Thomas,
1988).
La isoterma de adsorción BET (Brunauer et al., 1938) es uno de los
modelos más utilizados para explicar la adsorción multicapa. Representa
la cantidad de gas o agua adsorbida, we, en términos de la presión de
equilibrio o actividad del agua aw, siguiendo una distribución normal de
media y varianza:
E(we) =wmBcBaw
(1− aw)(1 + (cB − 1)aw), var(we) = σ2.
En este modelo no lineal en los parámetros, el parámetro wmB es la
capacidad de la monocapa mientras que cB está relacionado exponencial-
mente con la entalpía de adsorción como ya se ha comentado durante el
desarrollo teórico del modelo. Ambos parámetros son necesarios para la
caracterización del fenómeno de adsorción mientras que la capacidad de
la monocapa, nm, se emplea para determinar el área supercial del ad-
sorbente. Cuanto mejor sean las estimaciones de estos parámetros mejores
conclusiones y resultados se obtendrán.
108 5. Diseño Óptimo: Isotermas BET y GAB
Tradicionalmente el modo de enfrentarse a estos modelos no lineales es
mediante linealizaciones,
F (BET ) ≡ aw(1− aw)we(aw)
=1
cBwmB+cB − 1cBwmB
aw,
representando la relación lineal existente entre F (BET ) y aw (Adamson y
Gast, 1997).
El informe de la IUPAC, Commission on Colloid and Surface Che-
mistry of the International Union of Pure and Applied Chemistry (1985),
recomienda el modelo BET como un método estándar en la evaluación de
capacidad de la monocapa en actividades del adsorbato no superiores a
p/p0 = 0.3, aunque en adsorción de vapor de agua sobre alimentos este
límite superior suele extenderse hasta 0.5. Las razones para este límite se
justican en la pérdida de la relación lineal entre F (BET ) y aw para valores
fuera de ese rango. Ahora bien, son numerosos los trabajos en los que sus
autores muestran su preocupación por las alteraciones que pueden incluir
las linealizaciones y someten a métodos de regresión no lineales los datos
obteniendo resultados muy satisfactorios para rangos mucho más amplios
(Belarbi et al., 2000; Saevels et al., 2004). Otros autores, aún observan-
do estos problemas, continúan despreciando las medidas por encima de un
cierto límite (Moraga et al., 2006).
Por otro lado, la isoterma de adsorción GAB (Guggenheim, 1966; An-
derson, 1946; de Boer, 1953), ha sido usada de forma extensiva a la hora
de describir el fenómeno de adsorción por parte de productos alimenticios.
Este modelo como modicación de la isoterma BET introduce la idea de
que después de la primera capa adsorbida las capas subsiguientes presen-
tan las mismas propiedades entre sí aunque distintas a las propiedades del
vapor o gas condensado. Esta nueva interpretación exige la introducción
de un nuevo parámetro que explica la relación entre las capas consecutivas
de vapor adsorbido. La cantidad de gas o agua adsorbida we sigue una
distribución normal de media y varianza:
E(we) =wmGcGkaw
(1− kaw)(1 + (cG − 1)kaw), var(we) = σ2.
5.2. Isotermas de Adsorción 109
Nuevamente el modelo resulta ser no lineal en los parámetros, siendo los
parámetros wmG y cG análogos en signicado a los del modelo BET, esto
es capacidad de la monocapa y constante energética; el nuevo parámetro
introducido, k, es una medida de la entalpía libre de las moléculas del
adsorbato entre las capas más allá de la primera.
Al igual que para la isoterma BET, el modelo no lineal se ha venido
linealizando a la hora de realizar el ajuste,
F (GAB) ≡ aw(1− kaw)we(aw)
=1
cGkwmG+cG − 1cGwmG
aw,
representando nuevamente la relación lineal existente entre F (GAB) y aw(Adamson y Gast, 1997).
El uso de la isoterma GAB se extiende hasta valores de actividad de
agua aw = 0.8−0.9 y debido a su mejor adaptabilidad en la linealización a
los datos de adsorción de vapor de agua sobre alimentos (Wolf et al., 1985).
La utilización de las linealizaciones pueden incurrir en cambios impor-
tantes en la distribución de los residuos, por lo que la utilización de métodos
no lineales de mínimos cuadrados es mucho más recomendable. Presenta-
mos las versiones linealizadas por su tratamiento clásico en textos e incluso
en recientes artículos de investigación aunque el trabajo aquí desarrollado
requiere la utilización de los métodos no lineales.
El cálculo de diseños óptimos para estos modelos no lineales se basa
en la utilización de la matriz de información de Fisher como herramienta
en la estimación de los parámetros y requiere suponer la normalidad en las
observaciones. La dependencia de dicha matriz de los propios parámetros
hace necesario la existencia de unas estimaciones iniciales de los valores
que estos tomarán. En el campo de la adsorción de vapor de agua por
parte de alimentos existen multitud de referencias de las que poder obtener
dichos valores así como el carácter de control dichas medias que hace que
se repitan cíclicamente en el tiempo.
110 5. Diseño Óptimo: Isotermas BET y GAB
El espacio de diseño X donde varía la actividad del agua, aw = p/p0
está jado teóricamente en el intervalo X = [0, 1] aunque existe una impo-
sibilidad muy alta de tomar observaciones en valores extremos. Usualmente
el espacio de diseño estará delimitado por 0.05 como extremo inferior y se-
gún la naturaleza de las observaciones el extremo superior podrá oscilar
entre 0.3 y 0.9.
5.3. Discriminación entre Modelos: BET o GAB
Como se ha dicho hasta ahora, el proceso de adsorción viene carac-
terizado por una isoterma. Dentro de la adsorción multicapa existen dos
modelos diferentes que pueden explicar el proceso de adsorción, especial-
mente sobre productos alimenticios. La primera decisión que ha de tomarse
a la hora de caracterizar un proceso de adsorción es la elección de la isoter-
ma que mejor ajustará a los datos experimentales y que por lo tanto mejor
ayudará a entender el fenómeno.
De las dos isotermas más usadas que mejor explican el fenómeno de
adsorción multicapa, modelos BET y GAB, la principal diferencia que los
experimentadores encuentran en su aplicación es el rango de actividad del
agua recomendado para cada una de ellas: mientras que para la isoterma
BET el espacio de diseño recomendado en la literatura es XB = [0.05, 0.3−0.5], para la isoterma GAB el espacio del diseño recomendado es mayor
XG = [0.05, 0.8−0.9]. El modelo BET fuera del rango de valores XB parece
no ajustarse de forma adecuada a los datos experimentales (Timmermann,
2003), aunque de acuerdo con la literatura esta falta de ajuste es causada
por la utilización de la versión linealizada del modelo en lugar de aplicar
los métodos adecuados de regresión no lineal. La simplicidad del modelo
BET es en muchos casos preferida a la modicación incluida en el modelo
GAB (Belarbi et al., 2000; Saevels et al., 2004).
Como ya hemos mencionado antes el modelo GAB es una modicación
del modelo BET en el que se incluye un nuevo parámetro k, siendo am-
bos modelos equivalentes para el valor de k = 1. Se puede observar cómo
5.3. Discriminación entre Modelos: BET o GAB 111
frecuentemente en la literatura, el modelo GAB es tratado como un mode-
lo puramente empírico con valores de k > 1 que no guardan relación con
el signicado físico del parámetro, como es resaltado por Lewicki (1997).
Este hecho lleva a muchos investigadores a preferir la simplicidad del mo-
delo BET y extender el rango de actividad del agua hasta 0.8 o incluso
valores más altos, mientras que en otros, aún preriendo el modelo BET,
mantienen las medidas en rangos de actividad del agua reducidos.
5.3.1. T−optimización.
El objetivo es obtener diseños que nos permitan discriminar entre am-
bos modelos posibles, respondiendo así a una necesidad real que permita a
los investigadores decidir si es adecuada la elección del modelo modicado
GAB o bien si por el contrario el modelo BET puede ser utilizado para
explicar el fenómeno de adsorción en márgenes de actividad del agua en
principio no recomendables.
El criterio óptimo más usado para encontrar diseños que permitan una
discriminación entre modelos es T−optimización, propuesto por Atkinson y
Fedorov (1975a) y que ha sido recientemente extendido mediante un criterio
de parada para el algoritmo a través de una cota inferior de la eciencia
del diseño (López-Fidalgo et al., 2007b).
Un diseño apropiado para la discriminación de modelos es aquel que
proporciona un alto valor para la suma de cuadrados de los errores del
modelo incorrecto; por lo tanto dados dos modelos entre los que elegir,
podremos plantear dos funciones criterio de T−optimización dependiendo
del modelo que consideremos verdadero en cada caso. En nuestro caso el
objetivo es comprobar cuando en valores de actividad del agua amplios,
XG, el modelo GAB puede ser sustituido por el modelo BET, más sencillo.
El diseño T−óptimo proporcionará el contraste F de mayor potencia para
la falta de ajuste del modelo BET suponiendo que el modelo GAB es el
adecuado (Atkinson et al., 1998).
112 5. Diseño Óptimo: Isotermas BET y GAB
Consideremos un modelo genérico no lineal
we = η(aw) + ε, aw ∈ X,
siendo la variable aleatoria ε independiente y normalmente distribuida
con media cero y varianza constante σ2. La función η(aw) será o bien
el modelo GAB, ηG(aw, θG), o el modelo BET, ηB(aw, θB), siendo θtG =(wmG, cG, k) ∈ ΩB ⊂ R3 y θtB = (wmB, cB) ∈ ΩG ⊂ R2 los vectores
de parámetros. Tal y como hemos especicado antes, supondremos que
η(aw) = ηG(aw, θG) será el modelo verdadero con sus parámetros θG co-
nocidos.
La función criterio de T−optimización resulta ser en este caso la si-
guiente
TBG(ξ) = mınθB∈ΩB
∑i
(η(awi)− ηB(awi, θB))2ξ(awi).
Y llamaremos a un diseño que maximice la función TBG(ξ), diseño T−óptimo,
ξ?T .
Para diseños regulares y tal y como hemos visto en la Sección 1.9 el
Teorema de Equivalencia (Teorema 5) nos proporciona una herramienta
para comprobar el diseño: un diseño ξ?T is T−óptimo si y sólo si
ψ(aw, ξ?T ) = (η(aw)−ηB(aw, θB))2−∑i
(η(awi)−ηB(awi, θB))2ξ(awi) ≤ 0,
con aw ∈ X, vericándose la igualdad en los puntos de soporte del diseño
T−óptimo, Xξ?T.
Sea ξ un diseño cualquiera, entonces la proporción dada por effBG(ξ) =TBG(ξ)/TBG(ξ?T ) es una medida de la eciencia de ξ respecto al diseño
T−óptimo ξ?T . Esta eciencia se considera como una medida de la bondad
o adecuación del diseño respecto al criterio de T−optimización, aunque
no tiene la interpretación directa en ahorro de observaciones como en los
criterios homogéneos.
La construcción de diseños T−óptimos requiere la utilización de un
algoritmo numérico debido a la necesidad de estimar θB para el modelo
5.3. Discriminación entre Modelos: BET o GAB 113
rival. La función criterio TBG(ξ) tiene como argumento a θB y esta esti-
mación cambiará de valores en cada paso del algoritmo. En la práctica se
ha usado un algoritmo de primer orden para encontrar el diseño T−óptimo
(Atkinson y Fedorov, 1975a). El procedimiento es iterativo y se desarrolla
de la siguiente manera:
Paso 1: Para un diseño inicial dado ξs con los siguientes puntos en
su soporte aw1, aw2, . . . , aws, consideremos
θB,s(ξs) = arg mınθB∈ΩB
∑i
(η(awi)− ηB(awi, θB))2ξs(awi).
Paso 2: Encontrar el punto aws+1 tal que,
aws+1 = arg maxaw∈X
(η(aw)− ηB(aw, θB,s))2.
Paso 3: Sea ξaws+1un diseño unipuntual en aws+1. Se construye un
nuevo diseño de la siguiente forma:
ξs+1 = (1− αs+1)ξs + αs+1ξaws+1.
Siendo αs una secuencia de valores que, por lo general, veriquenlas siguientes condiciones,
lıms→∞
αs = 0,∞∑s=0
αs =∞,∞∑s=0
α2s <∞.
Paso 4: Para concluir el algoritmo se plantea una condición de
parada a través de una cota inferior de la eciencia effBG(ξ)[1 +
maxaw∈X ψ(aw, ξs)TBG(ξs)
]−1
> δ,
con 0 < δ < 1 un valor prejado, e.g. δ = 0.998 (López-Fidalgo et
al., 2007b).
5.3.2. Ejemplos. Con el objetivo de ilustrar la aplicación del cálculo
de diseños T−óptimos, se presentan a continuación dos ejemplos. El es-
pacio de muestreo en ambos es el de mayor margen XG = [0.05, 0.8], quesupuestamente sólo es aceptable para el modelo GAB. Por lo tanto se ha
114 5. Diseño Óptimo: Isotermas BET y GAB
considerado el modelo GAB como el modelo verdadero y el modelo BET
como el modelo rival. Para calcular los diseños con máxima capacidad de
discriminación, se necesitan estimaciones iniciales para θtG = (wmG, cG, k)que han sido obtenidas de trabajos experimentales reales.
Ejemplo 5. En el trabajo de Cepeda et al. (1999) se estudia la adsorción
de vapor de agua por parte de café con el objetivo de poder predecir sus
propiedades higroscópicas y diseñar recipientes para su conservación ópti-
ma durante el período de almacenaje. En este trabajo se recalca la ausencia
de estudios de adsorción en la literatura para el café torrefacto (café tos-
tado con azucar). Los resultados que se dan a una temperatura de 25C,son las siguientes estimaciones de los parámetros para la isoterma GAB
wmG = 0.03445 g de H2O adsorbida / g de café, cG = 11.70 y k = 0.994.Recordemos que para k = 1 las isotermas GAB y BET son equivalentes,
por lo que parece que el uso del modelo más complicado podría evitar-
se. Para comparar ambos modelos se ha obtenido el diseño T−óptimo que
permitirá el contraste F para la falta de ajuste del modelo BET.
Después de 182 iteraciones del algoritmo de primer orden descrito pre-
viamente (menos de 2 segundos de tiempo de cálculo), con αs = 1/(s+ 1)el algoritmo converge y la condición de parada se satisface obteniéndose un
diseño concentrado en tres puntos experimentales, con sus respectivos pe-
sos indicando la proporción de medidas que han de tomarse en cada punto.
El diseño se ha calculado jando una cota inferior de la eciencia mayor
que δ = 0.998.
ξ?T =
(0.056 0.62 0.8
27182
47
51182
)=
(0.056 0.62 0.80.15 0.57 0.28
).
Para comprobar el diseño propuesto se utilizará el Teorema de Equi-
valencia (Teorema 5) que ha de vericarse. La función de sensibilidad de
dicho teorema se ha representado grácamente en la Figura 5.1 comprobán-
dose que ψ(aw, ξ?T ) ≤ 0 y que en los puntos de soporte se alcanzan sendos
máximos.
5.4. Diseños Óptimos para la Estimación de los Parámetros 115
Ejemplo 6. El mismo trabajo (Cepeda et al., 1999), presenta experimen-
tos de adsorción para café tostado ordinario, obteniéndose a 25 las si-
guientes estimaciones para los parámetros de la isoterma GAB wmG =0.04203 g de H2O adsorbida / g de café, cG = 4.186 y k = 0.941
El diseño T−óptimo obtenido después de 270 iteraciones del algoritmo
y para la misma cota inferior de la eciencia es el siguiente diseño, nueva-
mente con tres puntos diferentes en su soporte (menos de 2 segundos de
tiempo de cálculo).
ξ?T =
(0.099 0.64 0.8
47270
74135
518
)=
(0.099 0.64 0.80.17 0.55 0.28
).
Una vez más y con el objetivo de comprobar si el diseño es óptimo,
el Teorema de Equivalencia (Teorema 5) nos proporciona una herramienta
adecuada. La función de sensibilidad nuevamente se representa en la Figura
5.1.
0.056 0.62 0.8Actividad del Agua
-3´10-7
-2´10-7
-1´10-7
0
1´10-7
0.056 0.62 0.8
0.099 0.64 0.8Actividad del Agua Agua
-0.000015
-0.00001
-5´10-6
0
5´10-6
0.099 0.64 0.8
Figura 5.1. Representación gráca de la condición dada por el Teore-ma de Equivalencia (Teorema 5) para el Ejemplo 5 (izquierda) y parael Ejemplo 6 (derecha).
5.4. Diseños Óptimos para la Estimación de los
Parámetros
El criterio de T−optimzación proporciona el mejor diseño para discri-
minar entre el modelo GAB y el modelo BET; una vez que el modelo se
ha elegido el objetivo es la mejor estimación posible de los parámetros del
116 5. Diseño Óptimo: Isotermas BET y GAB
mismo. Los criterios que se han usado son los de D− y c−optimación. El
criterio de D−optimización obtendrá el diseño que minimize el volumen
del elipsoide de conanza de los parámetros (Sección 1.7.1), mientras que
el criterio de c−optimización se usará para estimar combinaciones lineales
de los parámetros, en particular para obtener estimaciones individuales de
cada parámetro (Sección 1.7.3).
Sea entonces θ el vector de parámetros a estimar y sea f(aw) = ∂E(we)/∂θ evaluada en unas estimaciones iniciales de los parámetros. Estos valores
serían las mejores estimaciones de los parámetros antes del comienzo del
experimento. Bajo las condiciones de normalidad, la matriz de información
de Fisher para un diseño ξ es,
M(ξ, θ) =∑aw∈X
f(aw)f t(aw)ξ(aw).
Cuando el número de observaciones N es lo sucientemente grande la
matriz de covarianzas de los estimadores es aproximadamente σ2/N veces
la inversa de esta matriz (Proposición 3).
Los criterios usados para obtener los mejores estimadores de los pa-
rámetros vienen dados por las funciones criterio respectivas: la función
criterio de D−optimación, ΦD[M(ξ, θ)] = detM(ξ, θ)−1/m, siendo m el
número de parámetros del modelo, y la función criterio de c−optimización,
Φc[M(ξ, θ)] = ctM(ξ, θ)−1c, siendo ctθ la combinación lineal de los pará-
metros que se desea estimar.
Ambas funciones criterio, según ya hemos visto, son convexas y estric-
tamente decrecientes y por lo tanto buscaremos diseños con valores lo más
pequeños posibles para las funciones criterio. Un diseño que minimice las
funciones criterio anteriores de entre todos los posibles diseños en X se
llamará diseño D− o c−óptimo respectivamente.
La ventaja de trabajar con diseños aproximados es que la optimali-
dad de un diseño puede comprobarse mediante el Teorema de Equivalencia
(Teorema 4) que al mismo tiempo puede proporcionarnos métodos para la
construcción de diseños óptimos (Atkinson y Donev, 1992; Fedorov y Hackl,
5.5. Diseños Óptimos para el Modelo BET 117
1997). La condición de optimalidad para una función criterio Φ genérica,
convexa, estrictamente decreciente y diferenciable, es que un diseño ξ?Φ será
Φ−óptimo si y sólo si,
ψ(aw, ξ?Φ) = f t(aw)∇Φ(ξ?Φ)f(aw)− trM(ξ?Φ, θ)∇Φ(ξ?Φ) ≥ 0, aw ∈ X,
vericándose la igualdad en los puntos de soporte Xξ?Φ. Por simplicidad en
la notación, Φ(M) equivale a Φ[M(ξ, θ)] y ∇Φ(ξ) es el gradiente de Φ(ξ).
A la hora de medir las diferencias entre un diseño propuesto y el óptimo
se ha usado la denición de eciencia (Denición 7).
Es importante resaltar que ambos modelos, BET y GAB, son parcial-
mente no lineales, es decir, que los modelos son lineales para el parámetro
de la capacidad de la monocapa, wm, y no lineales para el resto de los
parámetros. Esto signica que los diseños D− y c−óptimos serán indepen-
dientes de las estimaciones iniciales del parámetro wm y sólo dependerán
de los verdaderos parámetros no lineales.
5.5. Diseños Óptimos para el Modelo BET
Para el modelo de adsorción BET, siendo el vector de parámetros θtB =(wmB, cB) y f(aw) = ∂E(we)/∂θB evaluada en las estimaciones iniciales
de los parámetros θB,
f(aw) =
(cBaw
(1−aw)(1+(cB−1)aw)wmBaw
(1+(cB−1)aw)2
), aw ∈ XB = [aw0, awF ],
siendo la matriz de información de Fisher en este caso,
M(ξ, θB) =∑
aw∈XB
( cBaw(1−aw)(1+(cB−1)aw)
)2wmBcBa
2w
(1−aw)(1+(cB−1)aw)3
wmBcBa2w
(1−aw)(1+(cB−1)aw)3(wmBaw)2
(1+(cB−1)aw)4
ξ(aw).
5.5.1. Diseños D−óptimos.
Para estimar simultáneamente los dos parámetros del modelo BET se
puede usar el criterio deD−optimización, obteniéndose el diseñoD−óptimo
118 5. Diseño Óptimo: Isotermas BET y GAB
concentrado en 2 puntos, tal que maximiza el determinate de la matriz de
información, lo que equivale a minimizar el volumen del elipsoide de con-
anza de los parámetros.
Para el modelo BET, el diseño D−óptimo ξ?D está igualmente concen-
trado sobre dos puntos experimentales en XB:
Si awD ∈ XB, entonces ξ?D está concentrado en awD y awF .
Si awD /∈ XB, entonces ξ?D está concentrado en aw0 y awF .
Siendo awD la única solución en XB de la ecuación:
a3wD − a2
wD
(2awF +
1cB − 1
)+ awD
(awF +
2cB − 1
)− awFcB − 1
= 0.
Se puede comprobar numéricamente que es la única solución en dicho in-
tervalo utilizando el Teorema de Sturm. Que el diseño ξ?D sea igualmente
concentrado signica que la mitad de las observaciones se toman en cada
uno de los dos puntos del soporte.
El Teorema de Equivalencia proporciona la condición que permite com-
probar la D−optimización del diseño ξ?D. Por lo tanto, el diseño ξ?D será
D−óptimo si y sólo si:
f t(aw)M(ξ?D)−1f(aw) ≤ m, aw ∈ XB,
dondem = 2 el número de parámetros del modelo, vericándose la igualdad
de la expresión anterior en los puntos de soporte del diseño. Los valores de
awD en función del parámetro no lineal del modelo cB ∈ [1, 30] se han
representado grácamente en la Figura 5.2.
Ejemplo 7. En la mayoría de las ocasiones, el diseño D−óptimo puede
que no satisfaga las necesidades de un experimentador debido a su forma
extrema, con únicamente dos puntos en su soporte e incluso, en algunos
casos, los dos extremos del espacio de diseño. En experimentos reales suele
ser frecuente la toma de medidas en un número mayor de puntos de sopor-
te. Normalmente los puntos se distribuyen a lo largo del espacio de diseño
5.5. Diseños Óptimos para el Modelo BET 119
5 10 15 20 25 30cB
0.1
0.2
0.3
0.4
0.5
awD
[email protected],0.8D
[email protected],0.5D
Figura 5.2. Valores de awD en función de cB para el espacio de diseñoXB y para el espacio de diseño extendido XG. En ambos casos paravalores cB > 20, awD = aw0 = 0.05.
sin ningún tipo de criterio. En la mayor parte de los casos el equipamien-
to cientíco o la intuición del experimentador hacen que los puntos sigan
determinados patrones.
El diseño D−óptimo proporciona una herramienta al experimentador
de tal forma que puede medir la eciencia de cualquier diseño experimental
ξ. El contraste de cualquier diseño con el D−óptimo puede llevarse a cabo
comparando el valor de la función criterio ΦD(ξ) = detM(ξ, θB)−1/2 de am-
bos diseños mediante el cálculo de la eciencia effD(ξ) = ΦD(ξ?D)/ΦD(ξ).
En el ejemplo que se discute, se han medido las eciencias de diferen-
tes tipos de diseños en comparación con el D−óptimo. Todos los diseños
comparados se han supuesto con 6 puntos en su soporte e igualmente dis-
tribuidos, esto signica que en cada punto del soporte se han tomado N/6observaciones. El número total de observaciones N será constante en todos
los diseños y ha de ser prejado por el experimentador atendiendo a las
restricciones y costes del experimento. Los diseños que se han comparado
son los siguientes:
Un diseño uniforme, en el que los puntos del soporte del diseño
se encuentran uniformemente distribuidos a lo largo del espacio de
120 5. Diseño Óptimo: Isotermas BET y GAB
diseño con un parámetro de espaciamiento constante, d, que es la
distancia entre dos observaciones consecutivas.
Un diseño aritmético, en el que el parámetro de espaciamiento crece
siguiendo una progresión aritmética (id) de izquierda a derecha delespacio de diseño, con i = 0, . . . , 5.
Un diseño geométrico (izquierda), en el que el parámetro de espa-
ciamiento crece siguiendo una progresión geométrica di de izquierda
a derecha del espacio de diseño.
Un diseño geométrico (derecha), en el que la progresión geométrica
va de derecha a izquierda del espacio de diseño.
Un diseño lineal inverso, en el que el intervalo [ηB(aw0), ηB(awF )] esuniformemente dividido y esos puntos proyectados sobre el espacio
de diseño XB a través de la inversa de la función de regresión.
En todos estos casos el parámetro d se ha jado de forma que los puntos
inicial y nal del espacio de diseño siempre formen parte del soporte del
diseño resultante.
Las eciencias de estos cinco diseños experimentales se presentan en
la Figura 5.3 frente a estimaciones iniciales del parámetro no lineal del
modelo, cB. Estos grácos pueden ser usados por el experimentados para
seleccionar o rechazar unos u otros diseños según las estimaciones iniciales
del parámetro cB.
5.5.2. Diseños c-óptimos.
Para estimar combinaciones lineales de los parámetros, ctθB, usaremos
el criterio de c−optimización. Este criterio es especialmente útil cuando
deseamos obtener estimaciones individuales de cada uno de los paráme-
tros. En el caso de desear estimar únicamente el parámetro que indica la
capacidad de la monocapa, wmB, bastará con obtener el diseño c−óptimo
con ct = (1, 0) y dicho diseño se denominará wmB−óptimo.
5.5. Diseños Óptimos para el Modelo BET 121
5 10 15 20 25 30cB
0.4
0.5
0.6
0.7
eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
[email protected],0.5D
5 10 15 20 25 30cB
0.4
0.5
0.6
0.7
eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
[email protected],0.8D
Figura 5.3. Eciencias de los dinco diseños experimentales en com-paración con el diseño D−óptimo. La eciencia permite al experimen-tador escoger la distribución de los puntos experimentales más apro-
piada.
Elfving (1952) propuso un método gráco para el cálculo de diseños
c−óptimos. El método dene el conjunto de Elfving como Λ = cierre con-
vexo de (f(XB) ∪ −f(XB)). El diseño c−óptimo, ξ?c , vendrá dado por c?,
denido por la intersección de la recta denida por el vector c y la frontera
del conjunto de Elfving Λ. Este punto de intersección podrá denirse como
una combinación convexa de los vértices de Λ, siendo los vértices de Λ los
puntos de soporte del diseño y siendo los coecientes de dicha combinación
convexa los pesos de cada punto del diseño. Además el valor de la función
criterio es equivalente a Φc(ξ?c ) = (||c||/||c?||)2.
El conjunto de Elfving Λ para el modelo BET se muestra en la Figura
5.4. Los vértices de la frontera de dicho conjunto son los siguientes puntos
junto con sus simétricos por el origen:
1. El punto nal de la curva f(XB), f(awF ) = (xF , yF ).
2. El punto tangencial f(aws) = (xs, ys) de la recta con extremo
f(awF ),
aws =1√
awF (1− cB).
3. O bien el punto inicial de la curva f(XB), f(aw0) = (x0, y0), oel punto tangencial f(awt) = (xt, yt) de la recta con extremo en
122 5. Diseño Óptimo: Isotermas BET y GAB
- xF
- yF
- x0
- y0
xt
yt
xs
ys
x*
y*
Figura 5.4. Conjunto de Elfving para el modelo BET. Los pun-tos f(aw0) = (x0, y0)
t y f(awF ) = (xF , yF )t son los valores de fpara los extremos del espacio de diseño XB . En este caso particu-lar los diseños c−óptimos están denidos por f(awt) = (xt, yt)
t yf(awF ) = (xF , yF )t. Los puntos (x?, 0)t y (0, y?)t son combinacionesconvexas de estos dos puntos f(awt), f(awF ) y los coecientes de estascombinaciones son los pesos de cada uno de ellos en los diseños óptimos
f(awF ). Donde awt es la solución real en XB de la ecuación
−a4wtawF (1−cB)2+2a3
wta2wF (1−cB)2+a2
wt(a3wF (cB−1)2−2cBa2
wF (cB−1)
+ 6a2wF (cB − 1)− awF (4cB − 6)− 1)− 2awtawF + a2
wF = 0.
4. Los puntos de la curva f(XB) entre los puntos 2. y 3.
El punto de corte x? de Λ con el vector ct = (1, 0) puede expresarse
como una combinación lineal de f(awF ) y de −f(awt) o −f(aw0). Estospuntos son los puntos de soporte del diseño wmB−óptimo y los pesos vie-
nen dados por los coecientes de la combinación convexa. Equivalentemen-
te, el punto de corte y? de Λ con el vector ct = (0, 1) puede expresarse
como una combinación convexa de −f(awF ) y o bien f(awt) o f(aw0). Estacombinación convexa nos da los puntos de soporte y los pesos del diseño
cB−óptimo.
5.5. Diseños Óptimos para el Modelo BET 123
Mediante el criterio geométrico de Elfving, Figura 5.4, se obtienen los
diseños wmB− y cB−óptimos:
ξ?wmB =
(awc awF
pwmB (1− pwmB )
),
pwmB =awF (1 + awc(cB − 1))2
awc + awF (1 + awc(cB − 1)(4 + awc(cB − 1) + awF (cB − 1))).
ξ?cB =
(awc awF
pcB (1− pcB )
),
pcB =awF (awc − 1)(1 + awc(cB − 1))
awc + awF (1 + awc(awc + awF − 4− c(awc + awF − 2))).
siendo awc = awt si awt ∈ XB y awc = aw0 en caso contrario.
Al igual que en el caso de los diseños D−óptimos, se han representado
grácamente en la Figura 5.5 los valores de awc frente a cB para los dos
márgenes de actividad del agua diferentes. También se ha representado la
proporción de observaciones que han de tomarse en cada punto del soporte
de los diseños wmB− y cB−óptimos.
5 10 15 20 25 30cB
0.1
0.2
0.3
0.4
awc
[email protected],0.8D
[email protected],0.5D
5 10 15 20 25 30cB
0.2
0.4
0.6
0.8
pcB
pwm B
pcB
pwm B
Figura 5.5. Izquierda, variación de awc frente a cB para los dos es-pacios de diseño diferentes. Derecha, representación de la proporciónde observaciones que han de tomarse en awc para obtener los diseñoswmB− y cB−óptimos. Los cuadrados representan la variación de laproporción para el espacio de diseño XB = [0.05, 0.5] mientras que lostriángulos lo hacen para XB = [0.05, 0.8].
Ejemplo 8. Como ya se ha mostrado en el caso de los diseños D−óptimos,
los diseños wmB− y cB−óptimos, ξ?wmB y ξ?cB , son una herramienta para
124 5. Diseño Óptimo: Isotermas BET y GAB
el experimentador que permite medir la eciencia de cualquier diseño ex-
perimental propuesto, ξ, en el caso de necesitar únicamente la estimación
de uno de los parámetros del modelo. Cualquier diseño se puede comparar
al correspondiente c−óptimo mediante la evaluación de la función criterio
Φc(ξ) = ctM(ξ, θB)−1c, siendo ct = (1, 0) para el diseño wmB−óptimo o
ct = (0, 1) para el diseño cB−óptimo. Entonces la eciencia en comparación
con cada diseño c−óptimo será, effc(ξ) = Φc(ξ?c )/Φc(ξ).
Al igual que en el Ejemplo 7, se ha calculado la eciencia de los cinco di-
seños experimentales antes propuestos con 6 puntos de soporte e igualmente
distribuidos, tomando en cada punto N/6 de la observaciones, respecto a
ambos diseños c−óptimos.
Las eciencias para estos cinco diseños y para los dos espacios de diseño
se han representado grácamente en la Figura 5.6 frente a diferentes valores
del parámetro no lineal cB.
Se pueden resaltar una serie de diferencias entre las eciencias para la
estimación de wmB o de cB. Por ejemplo, para estimar wmB con estimacion
inicial del valor de cB > 10, el mejor diseño experimental de los cinco
propuestos, resulta ser el que sigue una progresión geométrica de derecha a
izquierda de XB, mientras que el de menor eciencia de los cinco resulta ser
el geométrico (izquierda). Por el contrario, para estimar cB en las mismas
condiciones los resultados con completamente opuestos.
5.6. Diseños Óptimos para el Modelo GAB
Al igual que para el modelo BET, también se pueden obtener los diseños
D− y c−óptimos para la isoterma GAB, siendo θtG = (wmG, cG, k) el vectorde parámetros desconocidos que se desean estimar y tomando f(aw) =∂E(we)/∂θG, evaluada en unos valores nominales, mejores estimaciones
iniciales disponibles de los parámetros θG,
5.6. Diseños Óptimos para el Modelo GAB 125
5 10 15 20 25 30cB
0.3
0.4
0.5
0.6
0.7
0.8
wmB-eff
[email protected],0.5D
lineal inverso
geométrico izq.
geométrico dcha.
aritmetico
uniforme
5 10 15 20 25 30cB
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9cB-eff
[email protected],0.5D
5 10 15 20 25 30cB
0.3
0.4
0.5
0.6
0.7
0.8
wmB-eff
[email protected],0.8D
5 10 15 20 25 30cB
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9cB-eff
[email protected],0.8D
Figura 5.6. Eciencias de los cinco diseños. Izquierda, eciencias delos diseños para la estimación de wmB para los dos posibles espaciosde diseño. Derecha, eciencias para la estimación de cB .
f(aw) =
cGkaw
(1−kaw)(1+(cG−1)kaw)wmGkaw
(1+(cG−1)kaw)2
wmGcGaw(1+(cG−1)k2a2w)
(1−kaw)2(1+(cG−1)kaw)2
, aw ∈ XG = [aw0, awF ],
y la matriz de información,
I(ξ, θG, aw) =c2Gk
2a2w
(1−kaw)2(1+(cG−1)kaw)2wmGcGk
2a2w
(1−kaw)(1+(cG−1)kaw)3
wmGc2Gka
2w(1+(cG−1)k2a2
w)
(1−kaw)3(1+(cG−1)kaw)3
wmGcGk2a2w
(1−kaw)(1+(cG−1)kaw)3
w2mGk
2a2w
(1+(cG−1)kaw)4
w2mGcGka
2w(1+(cG−1)k2a2
w)
(1−kaw)2(1+(cG−1)kaw)4
wmGc2Gka
2w(1+(cG−1)k2a2
w)
(1−kaw)3(1+(cG−1)kaw)3
w2mGcGka
2w(1+(cG−1)k2a2
w)
(1−kaw)2(1+(cG−1)kaw)4
w2mGc
2Ga
2w(1+(cG−1)k2a2
w)2
(1−kaw)4(1+(cG−1)kaw)4
,
M(ξ, θG) =∑
aw∈XG
I(ξ, θG, aw) · ξ(aw).
126 5. Diseño Óptimo: Isotermas BET y GAB
5.6.1. Diseños D−óptimos.
Con el objetivo de estimar simultáneamente los tres parámetros del
modelo GAB, θG, se han calculado los diseños D−óptimos. En este caso,
a diferencia de la isoterma BET, la obtención de una expresión analítica
que nos especique los diseños no es posible. De todas formas el procedi-
miento se realiza de manera análoga. El objetivo es encontrar un diseño
que minimize la expresión ΦD[M(ξ, θG)] = detM(ξ, θG)−1/m, m = 3, quees equivalente a encontrar un diseño que maximice log(detM(ξ, θG)).
Los diseños D−óptimos serán igualmente distribuidos y concentrado
en tres puntos,
ξ?D =
(aw1 aw2 awF
1/3 1/3 1/3
),
siendo awF el extremo superior del espacio de diseño XG, aw2 ∈ XG y
siendo aw1 un punto del interior de XG o el extremo inferior de XG, aw0.
Los diseños D−óptimos para el modelo GAB en el espacio de diseño
XG = [0.05, 0.8] se han calculado numéricamente para diferentes estima-
ciones iniciales de los parámetros no lineales. Los puntos de soporte aw1
y aw2 de estos diseños se han representado grácamente en la Figura 5.7.
Como el modelo es parcialmente no lineal los diseños D−óptimos dependen
únicamente de los parámetros cG, k y del espacio de diseño que se elija. Los
diseños siempre tienen entre sus puntos de soporte el extremo superior de
XG, awF ; los otros dos puntos del soporte, aw1 y aw2 se han obtenido para
diferentes valores del parámetro cG ∈ (1, 30] y para dos valores diferentes
del parámetro k = 0.5, 0.8.
Nuevamente el Teorema de Equivalencia, nos proporciona una herra-
mienta para comprobar la optimalidad de los diseños obtenidos,
f t(aw)M(ξ?D)−1f(aw) ≤ m, aw ∈ XG.
Ejemplo 9. Como se ha hecho en el Ejemplo 7, se han calculado las e-
ciencias de cinco diseños experimentales diferentes con 6 puntos de soporte
5.6. Diseños Óptimos para el Modelo GAB 127
5 10 15 20 25 30cG
0.1
0.2
0.3
0.4
0.5
0.6
awD
á,ó ® k=0.5à,ò ® k=0.8
aw2
aw1
aw2
aw1
Figura 5.7. Valores de aw1 y aw2 frente a cG y para dos valoresdiferentes de k = 0.5, 0.8.
5 10 15 20 25 30cG
0.3
0.4
0.5
0.6
0.7
0.8
eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
k=0.5
5 10 15 20 25 30cG
0.3
0.4
0.5
0.6
0.7
0.8
eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
k=0.8
Figura 5.8. Eciencias de los cinco diseños experimentales en com-paración con el diseño D−óptimo.
cada uno y con la misma proporción de observaciones en cada punto, N/6,mostrándose en la Figura 5.8. El espacio de diseño seleccionado para la
isoterma GAB es XG = [0.05, 0.8] y las eciencias se han obtenido para
dos estimaciones iniciales diferentes del parámetro k = 0.5, 0.8. La ecien-
cia representa el cociente entre el valor de la función criterio de diseño
D−óptimo y el valor de dicha función criterio del diseño experimental. Es-
te valor, igual que en los ejemplos anteriores, se encuentra entre 0 y 1.Cuando se expresa en porcentaje, representa la fracción de observaciones
que se han de realizar si se usa el diseño óptimo, para obtener la misma
precisión que la dada por el diseño experimental que se compara.
128 5. Diseño Óptimo: Isotermas BET y GAB
En este caso, el diseño aritmético es el que proporciona valores de e-
ciencia más elevados para valores de cG altos, mientras que para valores
pequeños del parámetro el mejor diseño es el uniforme. Como en los ejem-
plos anteriores, resulta difícil dar un consejo general al experimentador para
una elección correcta del diseño. Ahora bien, el diseño óptimo nos permite
medir la eciencia de cualquier diseño en particular y por lo tanto nos pro-
porciona la suciente información como para elegir el diseño menos malo
posible.
5.6.2. Diseños c−óptimos.
Los diseños c−óptimos para el modelo GAB presentan la dicultad
añadida de la dimensión del vector de parámetros θG, en este caso tres,
representándose el conjunto de Elfving en R3. La obtención de las com-
binaciones convexas es por lo tanto más complicada que la obtención de
las mismas para el modelo BET. El método propuesto por Elfving (1952)
es válido para cualquier dimensión del vector de parámetros, aunque su
uso geométrico es muy complicado para más de dos parámetros y por lo
tanto muy raramente usado. López-Fidalgo y Rodríguez-Díaz (2004) han
propuesto un procedimiento por el que se obtienen los diseños c−óptimos
basándose en el procedimiento de Elfving, pero evitando las necesidades
geométricas del método.
Para obtener los diseños c−óptimos, es necesario determinar el punto
de intersección u? de la recta dada por el vector c y el conjunto de Elfving
Λ = cierre convexo de (f(XG)⋃−f(XG)). Este punto de corte se podrá
entonces expresar como combinación convexa de los vértices de Λ. El teo-rema de Caratheodory nos dice que para cada punto de la frontera de Λexiste una combinación convexa de como mucho m puntos, siendo m = 3el número de parámetros del modelo para el modelo GAB. En general, el
punto de corte u? vendrá dado por,
u? = p1ε1f(aw1) + p2ε2f(aw2) + p3ε3f(aw3),
5.6. Diseños Óptimos para el Modelo GAB 129
siendo (aw1, aw2, aw3) los puntos de soporte, εi = ±1, el signo de cada
término de la combinación convexa y (p1, p2, p3), los pesos, tales que 0 <pi < 1 y p1 + p2 + p3 = 1. Sea entonces c = (1, c2, c3) el vector no nulo quedetermina la combinación lineal de los parámetros que se desea estimar.
Para c2 = c3 = 0, el diseño c−óptimo que se obtendrá será el diseño
wmG-óptimo que nos permitirá obtener la mejor estimación posible de la
capacidad de la monocapa. El punto de corte u? = (u?1, u?2, u
?3) no sólo se
encontrará en Λ sino que además se encontrará en la recta denida por el
vector c, y por lo tanto vericará las siguientes ecuaciones,u?2 = c2u?1,
u?3 = c3u?1.
Considerando ambas condiciones, u? ∈ Λ y u? en la recta denida por
c, el sistema a resolver se transforma en el siguiente,(d2(aw2) d2(aw3)d3(aw2) d3(aw3)
)(p2
p3
)= −ε1
(h2(aw1)h3(aw1)
),
D(aw1, aw2, aw3)p = −ε1H(aw1),
siendo di(awj) = εjhi(awj)− ε1hi(aw1) y hi(aw) = fi(aw)− cif1(aw).
La solución, según la ecuación anterior, p estará en función de (aw1, aw2, aw3),
p = p(aw1, aw2, aw3) = −ε1D(aw1, aw2, aw3)−1H(aw1),
siendo p1 = 1− p2 − p3.
La combinación lineal de los parámetros dada por c = (1, c2, c3) se haconsiderado no nula en su primera componente. Por lo tanto, maximizar el
módulo del vector en ambas posibles direcciones de la recta determinada
por c, sujeto a las condiciones de estar en Λ, es equivalente a maximizar el
cuadrado de la primera componente de u,
130 5. Diseño Óptimo: Isotermas BET y GAB
u21(aw1, aw2, aw3) = ((1− p2 − p3)ε1f1(aw1) + p2ε2f1(aw2) + p3ε3f1(aw3))2
sujeto a:
pi ≥ 0, i = 2, 3
p2 + p3 ≤ 1
Este es un problema de programación matemática que depende de
(aw1, aw2, aw3).
Este problema ha de resolverse para todas las posibles combinaciones
del vector de signo ε no simétricas entre sí.
El procedimiento se puede resumir algorítmicamente de la forma si-
guiente:
Paso 1: Elegir un vector de signo ε.
Paso 2: Calcular el valor de p = −ε1D(aw1, aw2, aw3)−1H(aw1).
Paso 3: Resolver el problema de programación planteado anterior-
mente encontrando un máximo de u21(aw1, aw1, aw1).
Paso 4: Elegir un nuevo vector de signo ε y repetir desde el Paso
2.
Paso 5: Cuando se han elegido todos los vectores de signo posibles,
los puntos de soporte de nuestro diseño serán (aw1, aw2, aw3) talesque u2
1(aw1, aw2, aw3) es el mayor de todos los obtenidos.
Este algoritmo permite el cálculo de los diseños c−óptimos ξ?wmG , ξ?cG
y
ξ?k, que permiten la obtención de las mejores estimaciones posibles para cada
uno de los parámetros de θG de forma individual. Los vectores c que pro-
porcionan estos diseños son (1, 0, 0), (0, 1, 0) y (0, 0, 1) respectivamente. El
valor de la función criterio que se ha de minimizar es Φc(ξ) = ctM(ξ, θG)−1c
y el Teorema de Equivalencia (Teorema 4) proporciona una herramienta
para comprobar la optimalidad del diseño obtenido. Además el mismo teo-
rema proporciona una cota inferior de la eciencia que puede utilizarse
5.6. Diseños Óptimos para el Modelo GAB 131
como condición de parada en el procedimiento numérico de resolución del
problema de programación.
1 +ınfaw∈XG ψ(aw, ξ)
Φc(ξ)=
1+ınfaw∈XG [−f t(aw)M(ξ, θG)−1cctM(ξ, θG)−1f(aw) + tr(ctM(ξ, θG)−1c)]
ctM(ξ, θG)−1c> δ,
siendo 0 < δ < 1 un valor apropiado para la eciencia deseada.
Los diseños c−óptimos están concentrados en 3 o menos puntos expe-
rimentales (Teorema de Caratheodory), que son los vértices del conjunto
de Elfving Λ en R3. Para cada combinación lineal de los parámetros dada
por c, el diseño c−óptimo proporcionará el mejor diseño para estimarla.
En particular, y como ya hemos mencionado, pueden resultar de interés los
diseños wmG−, cG− y k−óptimos. La forma general de un diseño c−óptimo
será la siguiente:
ξ?c =
(aw1 aw2 awF
pc qc rc
),
siendo awF el extremo superior del espacio de diseño XG, aw2 ∈ XG y aw1
se encuentra o bien el el interior de XG o coincide con el extremo inferior
de XG, aw0.
Los puntos de soporte de los diseños c−óptimos en el espacio de diseño
XG = [0.05, 0.8] se han calculado de forma numérica y la no linealidad
parcial del modelo hace que los diseños sólo dependan de los parámetros
no lineales cG, k y del espacio de diseño. Los puntos de soporte aw1 y
aw2 se representan grácamente en la Figura 5.9 para diferentes valores
de cG ∈ (1, 30] y para dos estimaciones iniciales diferentes del parámetro
k = 0.5, 0.8.
La estimación de la capacidad de la monocapa es, como ya hemos visto,
de especial interés ya que se usa para medir el area supercial efectiva y
es un método usado de forma exhaustiva en muchos procesos industriales.
Como ejemplo ilustrativo se muestran los pesos (pwmG , qwmG , rwmG) para el
132 5. Diseño Óptimo: Isotermas BET y GAB
5 10 15 20 25 30cG
0.1
0.15
0.2
0.25aw1
á,ó ® k=0.5à ® k=0.8
5 10 15 20 25 30cG
0.45
0.5
0.55
0.6
0.65
0.7
aw2
á,ó ® k=0.5à ® k=0.8
Figura 5.9. Para k = 0.8, los tres diseños c−óptimos están con-centrado en aw1, aw2 , awF . Se representa grácamente la evolución deaw1, aw2 frente a cG, . Para k = 0.5, los diseños wmG− y k−óptimostambién están concentrado en aw1, aw2 , awF . Se representa gráca-mente la evolución de aw1, aw2 frente a cG, . Para k = 0.5, el diseñocG−óptimo está concentrado en los tres mismos puntos para cG < 5,, pero para cG ≥ 5 el diseño se convierte en singular y se encuentraconcentrado únicamente en aw1 y aw2, M.
diseño wmG−óptimo y se representan grácamente en la Figura 5.10 frente
a diferentes valores de cG y k.
5 10 15 20 25 30
0.2
0.4
0.6
0.8
1
pwmG
qwmG
rwmG
á,ó® k=0.5à,ò® k=0.8
Figura 5.10. Representación de los pesos (pwmG , qwmG , rwmG) frentea cG y para valores de k = 0.5, 0.8. Los símbolos huecos son la evoluciónde los pesos para k = 0.5 mientras que los sólidos los son para k = 0.8.La distancia desde el eje horizontal al los cuadrados es equivalente alpeso pwmG , la distancia del cuadrado al triángulo es equivalente al pesoqwmG y la distancia entre el triángulo al eje superior 1 es equivalenteal peso rwmG .
5.7. Comparación de los Diseños 133
5 10 15 20 25 30cG
0.1
0.2
0.3
0.4
0.5
0.6
wmG-eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
k=0.5
5 10 15 20 25 30cG
0.1
0.2
0.3
0.4
0.5
0.6
wmG-eff
lineal inversogeométrico izq.geométrico dcha.aritméticouniforme
k=0.8
Figura 5.11. Eciencias de los cinco diseños experimentales en com-paración con el diseño wmG−óptimo.
Cabe destacar, como se observa en la Figura 5.9, que el diseño cG−óptimo
para la estimación inicial del parámetro k = 0.5 resulta ser singular, estan-
do concentrado únicamente en dos puntos, en lugar de tres,
ξ?cG =
(aw1 aw2
pcG qcG
).
Ejemplo 10. Como se ha dicho, los diseños óptimos son herramientas
útiles para medir la eciencia de cualquier diseño que se desee llevar a
cabo. La eciencia se obtiene mediante la comparación de los valores de la
función criterio del diseño óptimo con el del diseño experimental,effc =Φc(ξ?c )/Φc(ξ).
Como en los ejemplos anteriores se comparan los cinco diseños propues-
tos con 6 puntos experimentales en su soporte e idénticamente distribuidos.
Estos diseños se han comparado con el diseño wmG−óptimo y se muestran
en la Figura 5.11 para diferentes valores de cG y k.
En este caso los valores de eciencia más altos se obtienen para la
estimación de k = 0.5 con los diseños uniforme y aritmético mientras que
para k = 0.8 el diseño con mayor eciencia es el diseño uniforme.
5.7. Comparación de los Diseños
Según se ha planteado el trabajo, la elección del modelo parece inde-
pendiente de la estimación de los parámetros de interés. En algunos casos
134 5. Diseño Óptimo: Isotermas BET y GAB
effΦ(ξ?T ) GAB BET
ξ?T D− wmG− cG− k− D− wmB− cB−
Example 5 0.84 0.88 0.25 0.99 0.52 0.44 0.19Example 6 0.81 0.69 0.28 0.88 0.59 0.40 0.27Tabla 5.1. D− y c− eciencias de los diseños T−optimum obtenidosen los Ejemplos 5 y 6.
el experimentador podrá permitirse realizar dos tandas de experimentos.
La primera para vericar si es o no adecuada la elección del modelo más
complejo, GAB, frente al modelo más sencillo, BET y una vez elegido el
modelo diseñar de acuerdo a sus intereses utilizando los criterios de D−o c−optimización. En el caso que esto sea posible, podemos utilizar las
medidas tomadas en el primer experimento de discriminación para obtener
unas nuevas estimaciones iniciales de los parámetros no lineales, resultando
de interés conocer la eciencia del diseño T−óptimo para estimar paráme-
tros individuales. En otros casos puede que no haga falta la segunda tanda
de experimentos porque la eciencia del diseño T−óptimo puede resultar
suciente para la caracterización de fenómeno.
El cálculo de las D− y c−eciencias de los diseños T−óptimos cal-
culados puede entonces resultar muy interesante proporcionando al expe-
rimentador información acerca de la conveniencia de una segunda tanda
de experimentos destinados especícamente a la estimación de los pará-
metros después de la fase de discriminación de los modelos. En la Tabla
5.1 se muestran las eciencias de los diseños T−óptimos obtenidos para
los Ejemplos 5 y 6 respecto al diseño D−óptimo y a los diferentes diseños
c−óptimos, para ambos resultados posibles del proceso de discriminación.
Cabe destacar que las eciencias de los diseños óptimos destinados a
estimar los parámetros del modelo GAB resultan más altas que para el
modelo BET, debiéndose a que el criterio de T−optimización considera
el modelo GAB como el adecuado para caracterizar el fenómeno mientras
que el modelo BET será el modelo alternativo. También destacar la alta
5.7. Comparación de los Diseños 135
eciencia del diseño T−óptimo para la estimación del parámetro k del
modelo GAB. Recordemos una vez más que ambos modelos se diferencian
en la inclusión de este nuevo parámetro y que para valores de k = 1 ambos
modelos coinciden. En el Ejemplo 5 la estimación inicial del parámetro
k = 0.994 es muy cercana a 1 y por lo tanto el diseño que nos permita
estimar con mayor eciencia k será un diseño que también nos permita
discriminar entre ambos modelos.
Capítulo 6
Estimadores Combinados
en Quimiometría
En el Capítulo 3 se trató de la estimación de los parámetros A y B de
la ecuación de Arrhenius considerando que la magnitud que actúa como
variable dependiente, k(T ), es directamente medible. Esta consideración
no es estrictamente cierta, puesto que en realidad su determinación se lleva
a cabo mediante medidas de concentración frente al tiempo utilizando un
modelo cinético previo que relaciona estas dos magnitudes. En vista de esto
nos proponemos analizar las particularidades del proceso de estimación
en dos pasos frente a estimadores combinados y desarrollar una primera
aproximación al problema en estos casos (Borjas, 1982).
En un primer lugar y de forma muy descriptiva, vamos a desarrollar
algunos casos en los que se presentarían modelos consecutivos en dos o más
pasos en relación con medidas relacionadas con la ecuación de Arrhenius,
posteriormente presentaremos un caso simplicado sobre el que analizare-
mos la estimación en dos pasos frente a la estimación combinada.
137
138 6. Estimadores Combinados en Quimiometría
6.1. Ecuaciones de Velocidad
La constante de velocidad k(T ) que gura como variable dependiente
en la ecuación de Arrhenius corresponde a un parámetro cinético que se
determina mediante diferentes modelos según la ecuación de velocidad del
proceso cinético al que corresponde. Se entiende por ecuación de veloci-
dad la ecuación diferencial que relaciona la velocidad con que evolucionan
reactivos y productos en función de sus concentraciones (Moore y Pearson,
1981; House, 2007). En términos genéricos, como ya se ha expuesto en la
Sección 2.1, las ecuaciones de velocidad pueden ser de orden cero, de orden
uno o de orden dos. A una somera descripción de estas ecuaciones cinéticas
dedicaremos el siguiente apartado.
6.1.1. Procesos Cinéticos de Orden Cero.
El caso más sencillo que puede encontrarse es un proceso cinético de or-
den cero (Tokunaga et al., 2006), que se podría describir esquemáticamente
de la siguiente forma,
Sk0(T )
GGGGGGGGGGAP,
donde S representa el sustrato que se transforma en el producto P a lo
largo del tiempo. En el momento inicial la cantidad de sustrato vendrá
dada por [S](0) mientras que en un instante de tiempo t la cantidad inicial
de sustrato se habrá reducido y se habrá convertido en una cantidad de
producto [P ](t), de tal forma que [S](t) = [S](0) − [P ](t). Si el procesoocurre según un modelo de orden cero la velocidad será constante y vendrá
dada por
v = −d[S](t)dt
=d[P ](t)dt
= k0(T ),
cuya integración, a temperatura constante, da la evolución temporal del
sustratro que reacciona:
[S](t) = [S](0)− k0(T )t,
6.1. Ecuaciones de Velocidad 139
o bien la cantidad de producto que se forma:
[P ](t) = [S](0)− [S](t) = k0(T )t.
Esta constante de velocidad de orden cero depende de la temperatura
según la relación de Arrhenius,
k0(T ) = A0 exp(−B0/T ),
siendo A0 y B0 constantes frente a la temperatura.
El proceso experimental se cifra en la determinación de la concentración
[P] o [S] a distintos tiempos bajo condiciones de temperatura constante, ob-
teniéndose el valor k0 como la pendiente de cualquiera de los dos modelos
lineales. Repitiéndose estas mediciones a distintas temperaturas y poste-
riormente realizando una nueva regresión, se obtendrán los parámetros A0
y B0 de la ecuación de Arrhenius.
6.1.2. Procesos Cinéticos de Orden Uno.
En una reacción de orden uno, el esquema inicial puede ser el mismo
que en el caso anterior:
Sk1(T )
GGGGGGGGGGAP,
habiendo reaccionado en un instante t de tiempo una cantidad de sustrato
equivalente a la cantidad de producto formado. La diferencia con las reac-
ciones de orden cero está en que la velocidad, en lugar de ser constante,
disminuye de forma proporcional con la concentración de sustrato (Chou y
Chang, 2007), tomando la siguiente forma,
v = −d[S](t)dt
=d[P ](t)dt
= k1(T )[S](t) = k1(T )([S](0)− [P ](t)),
cuya integración, a temperatura constante, da lugar a la evolución frente
al tiempo de la concentración de sustrato,
[S](t) = [S](0)− [P ](t) = [S](0) exp(−k1(T )t),
140 6. Estimadores Combinados en Quimiometría
o de la concentración del producto,
[P ](t) = [S](0)[1− exp(−k1(T )t)].
Nuevamente la constante de velocidad de orden uno, k1(T ), dependede la temperatura según la relación de Arrhenius:
k1(T ) = A1 exp(−B1/T ),
siendo A1 y B1 constantes frente a la temperatura. El proceso experimental
a seguir resulta equivalente al caso de orden cero, con la salvedad de la no
linealidad de ambos modelos que se encadenan.
6.1.3. Procesos Cinéticos de Orden Dos.
Los procesos de orden dos pueden presentarse, al menos, de dos formas
diferentes. Consideremos en primer lugar la reacción entre dos sustratos S1
y S2:
S1 + S2
k2(T )GGGGGGGGGGAP.
Si en el instante inicial las cantidades de sustratos son [S1](0) y [S2](0),en un instante cualquiera t de tiempo se habrá formado una cantidad de
producto [P ](t), de forma que, suponiendo una estequiometría 1:1 en la
reacción (es decir una molécula de S1 reacciona con una molécula de S2),
al tiempo t, se tiene: [S1](t) = [S1](0)− [P ](t) y [S2](t) = [S2](0)− [P ](t),y la velocidad de la reacción vendrá dada por,
−d[S1](t)dt
= −d[S2](t)dt
=d[P ](t)dt
= k2(T )[S1](t)[S2](t)
= k2(T )([S1](0)− [P ](t))([S2](0)− [P ](t)).
Separando las variables de le ecuación diferencial anterior, e integrando
a temperatura constante se obtiene la ecuación integrada,
1[S1](0)− [S2](0)
log[S2](0)([S1](0)− [P ](t))[S1](0)([S2](0)− [P ](t))
= k2(T )t,
6.1. Ecuaciones de Velocidad 141
que puede expresarse de forma explícita según las ecuaciones siguientes,
[S1](t)[S2](t)
=[S1](0)[S2](0)
exp (k2(T )([S1](0)− [S2](0)))t
o bien,
[P ](t) =[S1](0)[S2](0)(1− exp(([S1](0)− [S2](0))k2(T )t))[S2](0)− [S1](0) exp(([S1](0)− [S2](0))k2(T )t)
que resulta ser una ecuación también de forma exponencial y donde la cons-
tante de velocidad también depende de la temperatura según una relación
de Arrhenius,
k2(T ) = A2 exp(−B2/T )
en la que A2 y B2 son constantes frente a la temperatura.
Resulta de interés considerar el caso particular en el que la concentra-
ción inicial de uno de los reactivos es mucho mayor que la del otro (Karakaya
et al., 2005). Por ejemplo, considérese que [S2](0) [S1](0) y que, por lo
tanto, [S2](0) [P ](t) en cualquier instante de tiempo. Puede entonces to-
marse como aproximación considerar [S2](t) ' [S2](0) constante a lo largo
del tiempo. En estas circunstancias, tanto la ecuación de velocidad:
−d[S1](t)dt
=d[P ](t)dt
= k2(T )[S1](t)[S2](0) = k2(T )[S2](0)([S1](0)−[P ](t)),
como la forma integrada:
log([S1](0)− [P ](t))
[S1](0)= −k2(T )[S2](0)t,
o bien
[P ](t) = [S1](0)(1− exp(−k2(T )[S2](0)t)),
se reducen a expresiones cinéticas similares a las de un proceso de pseudo
orden uno, en el que la constante de velocidad, denominada en este caso
constante de experimental, kexp, es
kexp([S2];T ) = k2(T )[S2].
En la práctica resulta muy corriente recurrir a estas condiciones de
trabajo, por lo que la determinación de los parámetros de activación de
142 6. Estimadores Combinados en Quimiometría
la ecuación de Arrhenius para k2, contiene una estimación en tres pasos
sucesivos. En primer lugar a temperatura constante se realizan diferentes
determinaciones de kexp([S2];T ) variando la concentración del sustrato [S2]que se considera permanece constante frente al tiempo, a continuación se
obtiene k2(T ) y por último se obtienen A2 y B2 parámetros de la ecuación
de Arrhenius.
La segunda reacción de orden dos que consideraremos es el caso parti-
cular de que se trate de una reacción del tipo:
2Sk2(T )
GGGGGGGGGGAP,
en la que se trata de que un mismo sustrato se dimeriza (Mata-Segreda,
2002), el planteamiento cinético es en este caso,
−d[S](t)dt
= +d[P ](t)dt
= k2(T )[S](t)2 = k2(T )([S](0)− [P ](t))2,
donde [P ](t) = [S](0)− [S](t) es la cantidad de sustrato que ha reaccionado
hasta el instante t de tiempo. La ecuación integrada una vez separadas las
variables resulta ser,
[P ](t) =k2(T )[S2](0)2t
1 + k2(T )[S2](0)2t,
o bien,
[S](t) =[S2](0)
1 + k2(T )t[S2](0).
En este caso el modelo resulta ser una hipérbola. La constante de velo-
cidad k2 depende asimismo de la temperatura a través de la ecuación de
Arrhenius.
6.2. Caso Simplicado
Con el objetivo de analizar la eciencia de la estimación en dos pasos
y de cara a comparar dicha estimación con un estimador combinado como
veremos más adelante, hemos simplicado un caso particular de estimación
de los parámetros de la ecuación de velocidad de un proceso cinético de
6.2. Caso Simplicado 143
orden cero seguido de la estimación de los parámetros de la ecuación de
Arrehnius.
En primer lugar el proceso cinético de orden cero que consideraríamos,
Sk(T )
GGGGGGGGGAP,
sería tal que pudiésemos medir la concentración de productos generados en
un instante de tiempo dado, siendo dicha concentración en el instante inicial
cero. Al ser el proceso cinético de orden cero, a temperatura constante, la
concentración de productos será proporcional al instante de tiempo y la
constante de proporcionalidad será la velocidad de la reacción.
[P ](t) = kt.
La constante k será la constate de velocidad de la reacción y dependerá
de la temperatura siguiendo la ecuación de Arrhenius,
k(T ) = A exp(−B/T ),
siendo A y B los parámetros ya descritos en el Capítulo 2.
El carácter no lineal de la ecuación de Arrhenius presenta dicultades
a la hora de plantear la estimación combinada. Dicha ecuación se podría
desarrollar de la siguiente forma,
k(T ) ≈ A exp(−B/T0) +B(A exp(−B/T0))
T 20
(T − T0),
donde T0 es una temperatura de control, por ejemplo 25C, es decir 298K.
Esta simplicación del modelo no lineal de Arrhenius por su desarrollo de
Taylor alrededor de la temperatura de control puede ser aceptable en inter-
valos pequeños de temperatura, aproximándose la variación de la constante
de velocidad con la temperatura mediante una recta. Resulta además que
el valor A exp(−B/T0) es la constante k a temperatura T0, k(T0), y por lo
tanto la expresión podría aproximarse,
k(T ) ≈ k(T0) +Bk(T0)T 2
0
(T − T0) = k(T0)(1− B
T0) +
Bk(T0)T 2
0
T.
144 6. Estimadores Combinados en Quimiometría
De esta forma el problema queda reducido a dos modelos lineales conse-
cutivos con parámetros de interés k(T0) y B, con los que la determinación
de A es inmediata.
6.3. Estimación en dos Pasos frente a la Estimación
Combinada
De forma práctica el caso simplicado conllevaría la realización sucesiva
de varios experimentos para lograr las estimaciones de los parámetros de
la ecuación de Arrhenius. En primer lugar habría que diseñar y jar los ex-
perimentos a realizar tomando medidas de la evolución de la concentración
de los productos a lo largo del tiempo t1, . . . , tn y en condiciones de tem-
peratura constante, estableciendo un conjunto de temperaturas T1, . . . , Tm
para las que se llevaría a cabo los experimentos.
En la práctica este tipo de estimaciones se realizan en dos pasos de la
siguiente manera. Una vez jada una temperatura T y al ser la cinética de
la reacción de orden cero tendremos que,
z(t) = yt+ ε,
donde t es la variable independiente, z la variable dependiente e y el pa-
rámetro desconocido. Una vez realizados los experimentos planteados a las
diferentes temperaturas y estimados los diferentes parámetros y tendremos,
y(T ) = α+ βT + ε.
Donde T es la variable independiente y cuyos valores hemos jado, y es en
este caso la variable dependiente, no observable directamente sino que ha
sido obtenida como un parámetro de la ecuación cinética de orden cero y
por último α y β los parámetros de interés.
La estimación combinada por el contrario realiza una única estimación
de los parámetros de interés, α y β, con las mismas observaciones,
z(t, T ) = αt+ βtT + ε
6.3. Estimación en dos Pasos frente a la Estimación Combinada 145
siendo t y T variables independientes y z la variable dependiente y física-
mente medible.
La comparación de ambos métodos de estimación se realizará mediante
el cálculo de las matrices de covarianzas de los parámetros α y β, prerién-
dose el método de menor covarianza ya que no existen diferencias experi-
mentales en el modo de realizar los experimentos sino que las diferencias
radican en el tratamiento de los datos.
De los dos métodos a comparar, la estimación en dos pasos es el que
se lleva a cabo en la práctica mientras que la estimación combinada se
evita, tal vez por su aparente mayor complejidad y por las dicultades que
conlleva presentar resultados de forma diferente, aún pudiendo ser mejores.
6.3.1. Estimación en dos Pasos: I.
A efectos de notación consideraremos zij = z(ti, Tj), y consideraremos
que la variable aleatoria zij condicionada al verdadero y desconocido valor
de yj = y(Tj) seguirá la distribución normal,
zij |yj ≡ N(yjti, σ2),
siguiendo la variable aleatoria yj una distribución normal,
yj ≡ N(α+ βTj , τ2).
Entonces el estimador yj condicionado al verdadero valor de yj seguirá una
distribución,
yj |yj ≡ N(yj , σ2(XttXt)−1),
donde Xt es el vector formado por los tiempos Xt = (t1, . . . , tn)t en los que
se toman observaciones.
Por lo tanto el proceso de estimación en dos pasos consistirá primero
en la obtención de yj para las diferentes temperaturas jadas T1, . . . , Tn de
tal forma que,
yj ≡ N(α+ βTj , σ2(Xt
tXt)−1 + τ2),
146 6. Estimadores Combinados en Quimiometría
siendo las estimaciones de los diferentes yj con j = 1, . . . ,m las dadas por,
Y = ((XttXt)−1Xt
tZ)t = ZtXt(XttXt)−1,
con Z la matriz de las observaciones, de dimensiones n ×m, y siendo las
estimaciones de las yj independientes.
Los estimadores de los parámetros de interés α y β, serán,(α
β
)= (Xt
TXT )−1XtT Y = (Xt
TXT )−1XtT (Xt
tXt)−1XttZ,
siendo
XT =
1 T1
......
1 Tm
.
Resultando ser la matriz de covarianzas de los estimadores de los pa-
rámetros de interés,
ΣI(α,β)t
= (XtTXT )−1(σ2(Xt
tXt)−1 + τ2).
6.3.2. Estimación en un Paso o Combinada: II.
Respecto a la estimación combinada podemos considerar la estimación
mediante un único paso. Considerando que la variable aleatoria yj sigue
una distribución normal,
yj ≡ N(α+ βTj , τ2),
y que la variable aleatoria zij condicionada al verdadero y desconocido valor
de y sigue una distribución normal,
zij |yj ≡ N(yjti, σ2),
tendremos que la variable aleatoria zij seguira la siguiente distribución
normal,
zij ≡ N(αti + βtiTj , τ2t2j + σ2)
6.3. Estimación en dos Pasos frente a la Estimación Combinada 147
Entonces tendremos que una vez tomadas las observaciones zij como
resultado de los experimentos llevados a cabo a temperaturas constantes
Tj , j = 1, . . . ,m, y para cada una de estas en los instantes de tiempo ti,
i = 1, . . . , n, podemos obtener las estimaciones de los parámetros de interés
α y β, (α
β
)= (Xt
tTΣ−1z XtT )−1Xt
tTΣ−1z Z,
siendo
XtT =
t1 t1T1
......
tn tnT1
......
t1 t1Tm...
...
tn tnTm
=
Xt XtT1
......
Xt XtTm
,
con Σz la matriz de las covarianzas de las observaciones, formada por m
cajas diagonales idénticas,
Σz =
Σ
. . .
Σ
,
teniendo cada una de estas cajas Σ la forma,
Σ =
τ2t21 + σ2
. . .
τ2t2n + σ2
,
y por último formando, en este caso, las observaciones zij un vector,
Z = (z11, . . . , zn1, . . . , z1m, . . . , znm)t.
148 6. Estimadores Combinados en Quimiometría
Operando algebraicamente podemos expresar los estimadores de α y β
como, (α
β
)= (Xt
tΣ−1Xt)−1(Xt
TXT )−1XtTZ
tΣ−1Xt,
siendo Z la matriz n×m de las observaciones.
Resultando ser la matriz de covarianzas de los estimadores de los pa-
rámetros de interés,
ΣII(α,β)t
= (XtTXT )−1(Xt
tΣ−1Xt)−1.
6.3.3. Comparación de ambos Métodos.
Ambas estrategias, obtienen estimadores de los parámetros de interés
α y β que es el objetivo nal de los experimentos, pero las matrices de
covarianzas de los mismos poseen estructuras diferentes,
ΣI(α,β)t
= (XtTXT )−1(σ2(Xt
tXt)−1 + τ2),
ΣII(α,β)t
= (XtTXT )−1(Xt
tΣ−1Xt)−1.
Las matrices se diferencian en los factores escalares que las multiplican.
Llamaremos a estos factores KI y KII respectivamente, cuyos valores son,
KI = (σ2(XttXt)−1 + τ2) = τ2 +
σ2∑ni=1 t
2i
,
KII = (XttΣ−1Xt)−1 =
(n∑i=1
t2iτ2t2i + σ2
)−1
.
Para comparar los dos métodos considerados analizaremos la diferencia
entre las matrices de covarianzas de los estimadores. El cociente de ambos
factores KI y KII nos permitirá saber cual de los dos métodos proporciona
6.3. Estimación en dos Pasos frente a la Estimación Combinada 149
estimadores con menor covarianza que es lo deseado,
KI
KII=
(τ2 +
σ2∑ni=1 t
2i
)( n∑i=1
t2iτ2t2i + σ2
)
=n∑i=1
(τ/σ)2t2i + t2i /∑n
i=1 t2i
(τ/σ)2t2i + 1
Si calculamos los límites del cociente KI/KII cuando τ y σ tienden a cero,
lımτ→0
KI
KII= 1, lım
σ→0
KI
KII= n.
Mientras que si calculamos los límites de la expresión cuando τ y σ tienden
a innito,
lımτ→∞
KI
KII= n, lım
σ→∞
KI
KII= 1.
Además ambas constantes son iguales en el caso en el que sólo se tome una
observación en el tiempo, es decir en el caso en que n = 1. Resaltar tam-
bién que el cociente de ambas constantes posee una singularidad cuando
σ = τ = 0, lo que no presenta interés alguno desde el punto de vista esta-
dístico ya que en ausencia de varianzas las medidas a tomar se ajustarían
perfectamente a un único juego de parámetros.
Podemos comprobar además que para valores positivos de las respecti-
vas desviaciones típicas se cumplirá,
KI > KII .
Considerando los límites anteriores bastará con vericar que el cociente
resulta monótonamente decreciente al aumentar σ para valores jos de τ y
que resulta monónotonamente creciente al aumentar τ para valores jos de
σ. Esto se puede comprobar realizando el cambio de variable (τ/σ)2 = x
y considerando que x ∈ (0,∞) corresponde a todas las posibles parejas de
desviaciones típicas (τ, σ).
KI
KII=
n∑i=1
xt2i + t2i /∑n
i=1 t2i
xt2i + 1,
150 6. Estimadores Combinados en Quimiometría
vericándose que el límite cuando x → 0 es 1 mientras que cuando x →∞ es n. El cociente de ambas constantes resulta ser suma de funciones
monónotonas crecientes y mayores que uno para x ∈ (0,∞) y por lo tanto
podemos asegurar que se verica la desigualdad KI > KII .
Este resultado teórico justica las diferencias observadas en las simu-
laciones que llevamos a cabo en la etapa inicial del trabajo. Presentándose
la estructura de covarianzas de los parámetros diferente según el método
utilizado, obteniéndose eso si estimadores correctos en ambos casos.
Como conclusión podríamos decir que el método combinado, sin pre-
sentar diferencias en el desarrollo de la experimentación obtiene unos esti-
madores más precisos que el método en dos pasos. Este resultado contrasta
con la preferencia en el caso real por el método en dos pasos, pudiéndose
observar como la totalidad de los ejemplos citados utilizan este método.
Para el caso simplicado con el que hemos trabajado, el cálculo de diseños
D−óptimos da lugar a diseños concentrados en los extremos de los espacios
del diseño al ser ambos modelos lineales en los factores.
Hemos querido presentar aquí este resultado para llamar la atención
sobre este problema que ha surgido, como algunos otros, en el desarrollo
de los trabajos expuestos en los capítulos anteriores. Quedando abierta la
linea del análisis de los estimadores y el cálculo de los diseños óptimos para
los problemas reales, con modelos no lineales, que podemos encontrar en la
estimación de ecuaciones de velocidad y de los parámetros de la ecuación
de Arrhenius.
Conclusiones
El objetivo principal de este trabajo ha sido proponer diseños óptimos
que permitan una discriminación entre modelos o una estimación más e-
ciente de los parámetros estadísticos que se obtienen. Los modelos con los
que se ha trabajado son la ecuación de Arrhenius y los modelos de adsorción
BET y GAB. Se ha presentado una variedad de diseños óptimos de diferen-
tes características, que se han comparado a través del cálculo de eciencias
con diseños utilizados en casos experimentales. Como resultado se ha obte-
nido una herramienta que permite al experimentador la elección del diseño
más adecuado en términos de eciencia, o lo que es lo mismo, en términos
de ahorro de observaciones. Durante el trabajo se han utilizado los criterios
de D−, c− y T−optimización junto con el cálculo de diseños compuestos y
se han analizado las necesidades reales de los experimentadores buscando
dar respuesta a problemas que aparecen durante los experimentos y que
preocupan a la comunidad cientíca.
Durante el estudio de los procedimientos experimentales que se realizan
para caracterizar procesos cinéticos, apareció la necesidad de llevar a cabo
experimentos de cinética de reacciones en dos pasos. Se ha analizado la
diferencia entre estimadores en dos pasos y estimadores combinados cuan-
do el experimento consta de dos procesos de regresión, estimándose en el
151
152 Conclusiones
primero de ellos la variable dependiente del segundo modelo. El análisis de
un modelo simplicado ha permitido demostrar la menor varianza de los
estimadores combinados frente a los estimadores en dos pasos.
A continuación enumeramos las principales conclusiones del trabajo
para permitir una consideración global del mismo:
a) Respecto a los diseños D−óptimos calculados para la ecuación de
Arrhenius, con dos puntos en su soporte, el extremo superior del espacio del
diseño siempre forma parte del diseño, mientras que el segundo punto puede
ser o bien un punto interior o el extremo inferior. Este diseño no reduce
las dicultades de las observaciones extremas, pero facilita el desarrollo del
experimento, al reducir el número de condiciones experimentales diferentes.
b) Destacar que de los experimentos con N = 6 puntos de soporte,
cuya eciencia ha sido calculada, el de menor eciencia resulta ser el que
ha sido obtenido de un trabajo experimental real (Ray y Watson, 1981). El
de mayor eciencia resulta ser el diseño linear inverso, que depende para
su construcción de las estimaciones iniciales de los parámetros.
c) Los cálculos de los diseños c−óptimos han permitido obtener las e-
ciencias analíticas para diseños genéricos con N puntos en su soporte y
con la misma proporción de observaciones asignadas a cada punto. De los
ejemplos planteados destacar que en muy pocas ocasiones el aumento del
número de puntos del diseño conlleva un aumento en la eciencia. La re-
comendación de un diseño en particular se hace especialmente complicada,
dependiendo del número de puntos y de la estimación inicial del parámetro
B, por ello resulta interesante la obtención de las expresiones analíticas.
d) Se ha observado en la bibliografía, la alta incertidumbre del paráme-
tro B. Los diseños compuestos calculados permiten estimar ambos paráme-
tros jado una eciencia mínima para la estimación de dicho parámetro.
e) Respecto al cálculo de diseños T−óptimos para la discriminación
entre los modelos BET y GAB, dichos diseños han de ser calculados numé-
ricamente jando unas estimaciones iniciales de los parámetros del modelo
GAB. En los ejemplos obtenidos los diseños poseen tres puntos, el extremo
Conclusiones 153
superior, el extremo inferior o un punto muy cercano a él y un punto inter-
medio, para el que se han de realizar más de la mitad de las observaciones.
f) Los diseños D−óptimos calculados para el modelo BET, poseen dos
puntos, incluyendo el extremo superior del espacio del diseño y, o bien un
punto interior o el extremo inferior. Respecto a las eciencias de los 5 dise-
ños experimentales comparados, con N = 6 puntos, sus valores dependen
del espacio del diseño considerado y del valor del parámetro no lineal cB.
Los grácos de la Figura 5.3 permiten la elección del más adecuado para
los dos espacios del diseño considerados y valores de c ∈ [1, 30].
g) Se han obtenido los diseños c−óptimos que permiten estimaciones
individuales de los parámetros del modelo BET. La comparación de las
eciencias de los 5 diseños experimentales propuestos, presenta la particu-
laridad de que los mejores diseños para la estimación del parámetro wmBresultan ser los menos adecuados para la estimación de cB y viceversa.
h) Los diseños tanto D− como c−óptimos para el modelo GAB han
de ser calculados de forma numérica. Destacar que el extremo superior del
espacio del diseño, forma parte de los diseños óptimos salvo para el diseño
cG−óptimo que resulta ser singular para estimaciones iniciales de k = 0.5y valores de cG > 5. De los cálculos de eciencias, cabe destacar el buen
comportamiento del diseño uniforme.
i) Del cálculo de las eciencias de los diseños T−óptimos, cabe des-
tacar la obtención de eciencias más altas cuando son comparados con
los diseños óptimos obtenidos para el modelo GAB, ya que el criterio de
T−optimización empleado considera el modelo GAB como el verdadero.
Para valores iniciales de k cercanos a 1 (recordemos que cuando k = 1 am-
bos modelos son el mismo) el modelo que permite la discriminación, posee
una altísima eciencia para la estimación del parámetro k.
j) La comparación del proceso de estimación en dos pasos, frente a la es-
timación combinada, que se ha tratado en el Capítulo 6, da como resultado
la menor varianza de los estimadores combinados frente a los estimadores
en dos pasos, que tradicionalmente son utilizados en estos métodos.
154 Conclusiones
Discusión de los Resultados
Rodríguez Díaz (2000), en su tesis doctoral, realiza una crítica a la
teoría del Diseño Óptimo de Experimentos. En ella enumera seis inconve-
nientes de la teoría del Diseño que nos pueden permitir realizar un balance
del trabajo desarrollado.
i) En primer lugar se observa que la teoría del Diseño Óptimo requiere la
elección previa del modelo, sin contar con las observaciones, siendo incapaz
por tanto de descubrir la falta de ajuste al modelo planteado. En los casos
prácticos presentados, este problema es menor ya que, tanto el modelo
planteado por Arrhenius como las isotermas de adsorción desarrolladas por
Brunauer-Emmett-Teller y Guggenheim-Anderson-de Boer, se encuentran
fuertemente justicados teóricamente (Capítulos 2 y 4) y se vienen usando
ampliamente en el estudio de los fenómenos ya citados en este trabajo. Por
lo tanto el hecho de elegir con anterioridad el modelo no es, en este caso,
un inconveniente que pueda inuir de forma negativa en las estimaciones
obtenidas de los experimentos. Ahora bien, el criterio de T−optimización
da respuesta a discriminación entre modelos rivales, como hemos visto en
el Capítulo 4, permitiendo elegir el modelo que mejor explique los datos.
El mejor ajuste de los datos experimentales a un modelo, no debe justicar
la obtención de valores de los mismos sin signicado físico, tratando en ese
caso el modelo de forma puramente empírica (Lewicki, 1997).
ii) Para el caso de modelos no lineales se plantea la dicultad de elección
de los valores iniciales. Durante el desarrollo de este trabajo se decidió apli-
car los diseños óptimos obtenidos a casos de Química atmosférica (ecuación
de Arrhenius) y de adsorción de vapor de agua en alimentos (isotermas BET
y GAB). Esta decisión no fue fruto de un capricho ni de una casualidad.
Para el primer caso, la existencia de los informes generados por el Panel
de Expertos, (Jet Propulsion Laboratory, 2000, 2003), permiten disponer
de un amplio repositorio de parámetros contrastados que pueden usarse
como valores iniciales amparados por la reputación de la NASA. Además
Discusión de los Resultados 155
los altos márgenes de los límites de conanza de los parámetros sirven pa-
ra incentivar la búsqueda de diseños que permitan aumentar la eciencia
de los diseños utilizados y reducir así la incertidumbre de los parámetros.
La importancia de disponer de parámetros lo más ajustados posibles en la
modelización de fenómenos como el Efecto Invernadero y la evolución de la
Capa de Ozono, son cuestiones de un amplio interés cientíco, económico y
social, que han sido determinantes a la hora de profundizar en el tema. En
el segundo caso el carácter aplicado de las medidas de adsorción de vapor
de agua en alimentos es muy amplio. La bibliografía relacionada con este
fenómeno es muy elevada existiendo numerosas publicaciones relacionadas
con la Tecnología de los Alimentos, donde se caracterizan los procesos de
adsorción en frutas, verduras, cereales, productos lácteos, etc. Es de sumo
interés conocer estimaciones precisas de la adsorción en alimentos para po-
der llevar a cabo procesos de congelado, desecado, envasado o exportación
pudiéndose garantizar la calidad nal del producto.
iii) A la hora de seleccionar el criterio de optimización, esta elección se
realiza de nuevo sin antes haber observado los datos. Así, un diseño pue-
de ser óptimo para un criterio de interés pero desafortunado desde otro
punto de vista. Para ello, se ha hecho hincapié en el desarrollo de diseños
compuestos, que permiten combinar varios criterios a la hora de plantear
diseños óptimos, permitiendo jar los grados de satisfacción de cada criterio
en el nuevo diseño. Así mismo, se ha intentado relacionar los diseños plan-
teados, calculando la eciencia de los diferentes diseños óptimos respecto
a demás criterios. Hay que resaltar también que la variedad de criterios
puede ser una ventaja para el investigador ya, que le permite elegir la más
conveniente de entre las diversas opciones.
iv) La evolución de la teoría de diseño óptimo en dos corrientes parale-
las e irreconciliables, diseños exactos frente a diseños aproximados. Acerca
de esta división, conviene decir que, en nuestro caso y sobretodo en el caso
particular de la Química atmosférica y de la adsorción de vapor de agua,
de donde proceden los ejemplos utilizados, el tamaño de los diseños es alto,
por lo que es fácilmente aplicable la idea del diseño aproximado y de la
156 Conclusiones
probabilidad discreta, ξ(x) con x ∈ X. Además, la posibilidad de usar el
Teorema de Equivalencia, que no se verica en el caso de diseños exactos,
permite la realización de los cálculos de optimización y proporciona una
herramienta fundamental para comprobar que verdaderamente los diseños
propuestos son los que minimizan los valores de las funciones criterio.
v) Los diseños óptimos, muy frecuentemente obligan a tomar observa-
ciones en condiciones extremas. En el caso de la ecuación de Arrhenius,
los principales problemas de la obtención de buenas estimaciones de los
parámetros provienen de las dicultades experimentales a altas y bajas
temperaturas. Los espacios de diseño planteados en los ejemplos presenta-
dos, se han obtenido de trabajos experimentales reales y en algunos casos,
los puntos del diseño óptimo son más asequibles y menos costosos de obte-
ner que los extremos del espacio de diseño. Además, la concentración de las
observaciones en los puntos de soporte frente a la dispersion tradicional de
éstas, tiene clarísimas e importantes ventajas experimentales para los in-
vestigadores, simplicando las dicultades técnicas, como la estabilización
de la temperatura deseada y los cambios en el instrumental que surgen al
tener que tomar medidas en muchos y diferentes puntos. En el caso de los
fenómenos de adsorción, los razonamientos aplicados para la ecuación de
Arrhenius son igualmente válidos. La repetición de experimentos a presio-
nes dadas se puede llevar a cabo de forma mucho más económica, e incluso
de forma simultánea, usando las mismas condiciones de presión y tempe-
ratura de la cámara donde se lleva a cabo el experimento para replicarlo.
vi) La no invariancia de algunos criterios por cambios de escala, aunque
no se ha abordado en profundidad en este trabajo, quedando para futuros
desarrollos del mismo, sí se ha tenido en cuenta a la hora de plantear diseños
compuestos, en los que se estandariza la función criterio dividiendo cada
sumando por el valor de la función criterio para el diseño óptimo en cada
caso. Así se evita la inuencia que las diferencias entre las magnitudes de
cada parámetro puedan tener en la obtención del diseño óptimo.
Líneas Futuras de Investigación 157
Líneas Futuras de Investigación
Este trabajo ha servido para establecer un primer contacto y sentar las
bases del cálculo de diseños óptimos para diferentes modelos no lineales,
quedando abiertos diferentes caminos por donde es posible continuar.
Puede plantearse el cálculo y el estudio de las eciencias de diseños
óptimos bajo diferentes criterios a los aquí considerados, A−, E−, L−,Φp−optimización (Rodríguez-Díaz, 2000), analizándose las posibles venta-
jas y desventajas de cada criterio entre sí y frente a los diseños ya calculados.
Así mismo, queda abierta la posibilidad de generar código o programas
informáticos especícos, no sólo para calcular los diseños, sino para sugerir
diseños de eciencia máxima para un número de puntos experimentales
jados por el experimentador así como obtener el ajuste de los modelos.
El estudio de sensibilidad, analizando las uctuaciones de los valores de
la eciencia frente a las variaciones en las estimaciones iniciales de los pará-
metros, no ha sido considerado y queda pendiente para futuros desarrollos
del trabajo, así como la consideración de condiciones de heterocedasticidad.
La inclusión de modicaciones en el modelo de Arrhenius, también pue-
de ser considerada. Rodríguez-Díaz y Santos-Martín (2007) ya han consi-
derado el diseño óptimo de experimentos para la modicación propuesta
por Laidler (1984), para rangos de temperaturas muy amplios, que permite
que el factor preexponencial A sea proporcional a la temperatura T ele-
vada a una cierta potencia m, siendo la nueva expresión para el modelo:
k = ATme−B/T . Queda pendiente el cálculo de diseños T−óptimos que
facilite la discriminación entre ambos modelos.
Con relación a los modelos de fenómenos de adsorción se ha mencio-
nado la existencia de isotermas modicadas y de modelos semi-empíricos,
Oswin (1946), Hailwood y Horrobin (1946), Halsey (1948), Chirife y Igle-
sias (1978), Ferro Fontan et al. (1982), para los que cabe la posibilidad de
determinar diseños óptimos.
En otro campo diferente hay destacar la modicación de la ecuación
de Arrhenius en la caracterización de la uencia plástica de materiales
158 Conclusiones
metálicos sometidos a fuerzas de torsión a altas temperaturas. Este com-
portamiento viene caracterizando mediante la ecuación de Garofalo y =Ae−B/T sinh(ασ)n, siendo los parámetros θ = (A,B, α, n) (Garofalo, 1965).La ecuación tiene aplicación directa en la Tecnología de Materiales, y la
realización de experimentos a altas temperaturas, difíciles de alcanzar y
controlar, hacen del cálculo de diseño de experimentos una herramienta
muy interesante.
También queda pendiente la obtención de diseños óptimos para medi-
das en equilibrio, que surgen cuando, en fenómenos de adsorción y debido al
equipo disponible, no es posible controlar la presión del adsorbato, hacién-
dola permanecer constante a lo largo del tiempo. En estos casos el experi-
mento transcurre hasta que la cantidad de adsorbato que se ha depositado
sobre la supercie de adsorbente no varía, midiéndose en ese instante, la
presión del gas en el equilibrio, y la cantidad del mismo que se ha depo-
sitado sobre la supercie. Ambas variables, tanto la dependiente como la
independiente, son en este caso observadas y medidas en el equilibrio.
El estudio de las propiedades de los estimadores combinados frente a
la estimación en dos pasos, para los diferentes modelos no lineales men-
cionados en el Capítulo 6, queda también pendiente. El cálculo de diseños
de experimentos que permitan responder a las necesidades experimentales
en estos casos, se presenta también como una interesante línea futura de
trabajo.
Conclusions
The main purpose of this work has been to obtain optimum designs to
discriminate between competing models or to obtain an ecient estimation
of the unknown parameters. The models used are the Arrhenius equation
and the BET and GAB adsorption models. A variety of optimum designs
with dierent characteristics has been presented, and have been compared
to designs used in real experiments through the obtention of eciency
measures. As a result, a tool helping the experimenter with the election of
the most adequate design in terms of eciency has been obtained, being the
eciency concept equivalent to a reduction of the number of observations.
The optimality criteria that have been used are D−, c− and T−optimality
and real experimental needs have been analyzed to answer real problems
that appear throughout the experiments.
While studying the experimental procedures to characterize kinetic pro-
cesses, the need to perform kinetic experiments in two stages appeared.
Dierences between two stage and pooled estimators have been analyzed.
This appears when the experiment includes two regression steps, estima-
ting in the rst regression the dependent variable of the second model. A
159
160 Conclusions
simplied sample has been analyzed and its results have shown the advan-
tages of the pooled estimation strategy that obtains estimators with lower
variances.
In the following paragraphs, a sequence of conclusion is presented for
the shake of a clearer global view:
a) Regarding D−optimum designs obtained for Arrhenius equation,
supported at two dierent points, the upper limit of the design space al-
ways belongs to the design, while the second point is either an interior
point or the lower extreme. This design does not reduce the diculty of
obtaining observations for extreme points but makes the development of
the experiment easier, by reducing the number of dierent experimental
conditions.
b) From the comparison of the experimental designs with N = 6 sup-
port points, for which the eciency has been obtained, we can state that
the one with the lowest eciency is the obtained from a real experimental
work (Ray y Watson, 1981). The one with highest eciency happened to be
the linear inverse design, which needs initial best guesses of the parameters
for its construction.
c) The c−optimal designs have given way to the obtention of analytical
expressions of the eciencies for generic designs with N support points,
and equally weighted. From the examples obtained it can be pointed out
that in very few occasions, the increase of the number of support points
in a design leads to an eciency increase. It is quite dicult to give a
general recommendation for practitioners. Eciencies depend on the num-
ber of points and on the initial best guess of B. Therefore the analytical
expressions of the eciencies result of a great interest.
d) The high uncertainty of the parameter B is made clear along litera-
ture. Compound designs face the estimation of all parameters with a xed
minimum eciency for the estimation of this parameter.
Conclusions 161
e) The T−optimum designs obtained for the discrimination between
BET and GAB adsorption models, have to be numerically computed, set-
ting initial estimations for the parameters of the GAB model. In the propo-
sed examples the designs are supported at three support points, the upper
bound of the space design, either the lower bound or a very closed point,
and a middle point that retains more than half of the observations.
f) D−optimum designs obtained for the BET model, are supported
at two dierent points, including the upper bound of the design space and
either a interior point or the lower bound. Regarding the eciencies of the 5compared experimental designs , with N = 6 points, their values depend on
the space design and on the initial best guesses on the non linear parameter
cB. Figure 5.3 allows the election of the most convenient design for both
space designs considered and for values of c ∈ [1, 30].
g) c−optimum designs for obtaining individual estimations of the pa-
rameters of the BET model have been computed. The comparison of the
eciencies of the 5 proposed experimental designs concludes that the best
designs to estimate the parameter wmB turns to be the less adequate for
the estimation of cB, and viceversa.
h) Both D− and c−optimum designs for GAB model have been nu-
merically computed. Emphasize that the upper limit of the design space
is present in all the possible designs, except for the cG−óptimum design,
which happens to be singular for the initial best guesses of k = 0.5 and
values of cG > 5. From the eciencies obtained the good performance of
the uniform design should be noticed.
i) Eciencies for the T−optimum designs have been obtained, getting
higher eciencies while comparing to optimum designs obtained for the
GAB model, probably because T−optimality criterion uses GAB model as
the true one. For initial best guesses of parameter k close to 1 (for k = 1both models are equivalent), the discriminating design has a very high
eciency for estimating parameter k.
162 Conclusions
j) Comparison of the two stages estimation versus pooled estimation,
analyzed in Chapter 6, gives as result the obtention of estimators with
lower variance for the pooled estimation strategy, against the two stages
estimators that are traditionally used in these methods.
Results Discussion
Rodríguez Díaz (2000), in his PhD report, carries out possible criticisms
to Optimum Experimental Designs. His six dierent mentioned drawbacks
can help us to perform a critical analysis of our work.
i) Optimum Design theory is blamed to be strongly model dependent.
The model has to be chosen even before considering the observations, there-
fore it may be imposible to detect the lack of t in the model. In the practical
samples here presented this initial model assumption is a minor problem.
The models proposed by Arrhenius as well as the adsorption isotherms de-
veloped by Brunauer-Emmett-Teller and Guggenheim-Anderson-de Boer
are strongly theoretically justied (Chapters 2 and 4) and are widely used
in the modeling of the phenomena mentioned along our work. Therefore,
the prior election of the model is not an strong inconvenience in our deve-
lopments as it does not to produce wrong estimations of the parameters.
However, T−optimality criteria helps to answer the discrimination problem
between rival models, as those seen in Chapter 4, allowing the election of
the model that would best explain the behaviour of the phenomena. It
must be pointed out that the best possible t will never justify the obten-
tion of parameters with values unwanted by the physics behind the model,
considering in these cases the model as an empirical one (Lewicki, 1997).
ii) For the case of non linear models, the election of prior estimations of
the unknown parameters turns out to be also a problem. In the development
of our work the application of optimum designs to atmospheric processes
(Arrhenius equation) and to moisture adsorption on food stu (BET and
GAB isotherms) was considered. For the rst case, the existence of a co-
llection of reports from the Panel of Experts, (Jet Propulsion Laboratory,
Results Discussion 163
2000, 2003), facilitates the use of a wide estimations repository with the
reputation provided by NASA. It was also interesting to obtain optimum
designs because the high uncertainty of the published parameters. It could
be reduced by the use of optimum experiments that would lead to increase
the eciency of the experiments, and therefore to reduce their uncertainty.
Correct estimations of the parameters are crucial for the correct modeling
of phenomena such as the Greenhouse Eect and the depletion of the Ozo-
ne Layer. These are topics of great interest from the scientic, social and
economic point of view. For the second case, the applied character of the
measurements for the characterization of moisture adsorption on food stu
is of great interest. There are several bibliographic references related to
Food Technology where the characterization of the adsorption processes on
fruits, vegetables, grain, dairy products, etc. are carried out. It is of the
highest interest to know precise estimations of the parameters to proceed
with freezing, drying, storing or exporting in the best conditions and to
assure the nal quality of the products.
iii) In order to select the optimization criterion, the election is made
once again without prior knowledge of the observations. Therefore, a design
can be optimum for a certain criterion but unfortunate from other points of
view. Compound designs have been considered to combine several criteria
while obtaining optimum designs, allowing the establishment of levels for
each considered criterion in a new design. On the other hand, the optimum
designs obtained have been compared through the eciency of each design
with respect to other criteria. It should be pointed out that the wide variety
of optimization criteria is an advantage for the researcher, because it allows
the election of the most adequate option for each circumstance.
iv) Optimum experimental designs have evolved in two parallel lines,
exact versus approximate designs. In our samples, especially in atmosp-
heric Chemistry and in moisture adsorption phenomena, the number of
observations of each experiment is higher enough as to apply the idea of
approximate designs and the concept of discrete measure, ξ(x) with x ∈ X.
Besides, the possibility of applying the Equivalence theorem, which is not
164 Conclusions
veried for exact designs, provides a fundamental tool to obtain and check
the optimality of a design, and so minimizing the value of the criterion
function.
v) Diculties appear due to extreme observations, frequently requested
by optimum designs. This is not new. For the Arrhenius equation the pro-
blems of obtaining accurate estimations of the parameters are related to
the diculties of taking observations at extreme temperatures. The design
spaces have been obtained from the examples used, which correspond to
real experimental works. In some cases the support points of the optimal
designs are more aordable and less costly to obtain than the extremes
of the design space. The observations gathered at the support point ver-
sus the traditional spacing, have very important experimental advantages
for the researchers, simplifying some technical diculties, such as tempe-
rature stabilization and the changes in the equipment that appear, when
dierent observations have to be carried out at dierent support points.
These reasons also apply to the adsorption phenomena. The replication of
an experiment at a given pressure is much more economic, being possible
to carry out several experiments under the same conditions of pressure and
temperature at the same time.
vi) The no invariance of some criteria with respect to scale changes.
Although it has not been deeply considered in this work, it has been ta-
ken partially into account when obtaining the compound designs. In these
designs the criterion function is standardized by its value for the opti-
mum design in each case. Future developments of this work remain open to
coming studies. Thus, the inuence of the dierences between parameter
quantities can be avoided during the obtention of the optimum design.
Issues for Further Research
This work has established a rst contact with, and set the foundations
for, the obtention of optimum designs for dierent non linear models, lea-
ving dierent open topics for further research.
Issues for Further Research 165
The obtention and study of dierent optimum designs under dierent
criteria (A−, E−, L−, Φp−optimality, Rodríguez-Díaz, 2000), from the he-
reby used, can be approached analyzing the advantages and disadvantages
of each of them in terms of eciency.
The option to develop specic code or computer programs, not only
to obtain optimum designs, but also to suggest maximum ecient designs
with a xed number of support points, as required by the required by the
researcher, as well as to t the model and to obtain parameter estimators,
can be committed.
The study of sensibility, analyzing the variations of the eciency versus
the initial best guesses of the parameters, has not been considered and
remains as an open issue for future research developments. Neither the
heteroscedastic assumptions have been included.
The inclusion of possible changes in the Arrhenius model, could also be
considered. Rodríguez-Díaz and Santos-Martín 2007, have already conside-
red the variation proposed by Laidler (1984), adequate for wide tempera-
ture ranges. It allows that the preexponential factor A be proportional to
temperature Tm, so the new expression is k = ATme−B/T . The obtention
of T−optimum designs to discriminate between both models is still open.
Regarding the adsorption models, the existence of modied isotherms
and semi-empirical models, Oswin (1946), Hailwood and Horrobin (1946),
Halsey (1948), Chirife and Iglesias (1978),Ferro Fontan et al. (1982), has
already been mentioned, and there are still possibilities to determine opti-
mum designs for them.
In a dierent eld, the correction of Arrhenius equation for characte-
rizing plastic uency of metallic materials, subjected to torsion tensions
at high temperatures, may be an issue for future studies. The behaviour
is characterized by the Garofalo equation y = Ae−B/T sinh(ασ)n, beingthe unknown parameters θ = (A,B, α, n) (Garofalo, 1965). The equation
has a direct application in Material Technology, and the experiments at
166 Conclusions
high temperatures, hard to reach and to control, make the obtention of
experimental designs an interesting and useful aim.
It is also open for study the obtention of optimum experimental designs
for measurement taken at equilibrium. This is found in adsorption pheno-
mena, that due to the technical equipment, make uncontrollable the adsor-
bate pressure. In these cases, the experiment proceeds until the amount of
adsorbate laid on the surface of the adsorbent does not change with time.
The pressure of the gas at equilibrium, and the amount of it laid on the
surface, are then measured. Both variables are then observed and measured
at the equilibrium.
The study of the properties of pooled estimators versus the two stage
estimations, for dierent non linear models mentioned in Chapter 6, is
also an open issue. The obtention of optimum experimental designs that
may give answer to experimental needs in those cases, also appears as an
interesting and prospective further research.
Apéndice A
Distribución de
Boltzmann
En la década de 1860, Clausius1 propuso una denición de Entropía,
S, como función termodinámica que en sistemas aislados solamente puede
aumentar, siendo el valor máximo el que caracteriza el estado de equilibrio.
En la década siguiente, Ludwig Boltzmann indagó acerca del signicado
de esta función misteriosa. En aquellos momentos, hablar en términos mo-
leculares era algo más que una proeza, puesto que entidades tales como
átomos, moléculas, etc. eran considerados como meras cciones intelectua-
les, hipótesis más o menos plausibles todavía sin pruebas experimentales.
Algunas ideas de la mecánica son aplicables tanto a moléculas y áto-
mos individuales como a sistemas de muchas partículas. Este es el caso
de conceptos como el de masa, velocidad, energía, por ejemplo. En cam-
bio, conceptos como temperatura, entropía, no son asociables más que a
grandes colectivos de partículas.
Como ejemplo simple para ilustrar estos hechos consideraremos lo que
ocurre en la expansión de un gas que pasa de ocupar un pequeño volumen
1Rudolf Clausius (1822-1888), Físico alemán.
167
168 A. Distribución de Boltzmann
a llenar totalmente el volumen de un recipiente mayor. El sistema evo-
luciona hacia una distribución homogénea en la que las partículas ocupan
todo el volumen, es decir, evoluciona desde un estado poco probable -la acu-
mulación de partículas en un volumen relativamente pequeño- hacia una
conguración más probable -todas las moléculas repartidas en el volumen
total de modo homogéneo, uniforme-. Parece de esta forma que puede aso-
ciarse el concepto de evolución hacia el equilibrio (entropía) con el concepto
de probabilidad. Los distintos estados que ha adoptado un sistema desde
un estado de no equilibrio hasta alcanzar el equilibrio son cada vez más
probables. El sistema evoluciona de modo que la probabilidad de su estado
no puede más que crecer, tal como ocurre con la entropía.
Para tratar de relacionar la probabilidad con la entropía, introduci-
mos el concepto de microestados -conguraciones moleculares posibles- en
contraposición de macroestados -estados macroscópicos reales del sistema-
La idea intuitiva de probabilidad nos conduce a la regla de Laplace del
cociente de los casos favorables respecto de los casos totales. La probabili-
dad es, así, proporcional al número de posibles microestados, W .
La probabilidad es una función multiplicativa, es decir, que si un siste-
ma se puede encontrar en W1 microestados posibles y otro puede hallarse
en W2 microestados posibles, el sistema resultante de la unión de ambos
podrá encontrarse en W1 ·W2 microestados posibles. Sin embargo, la en-
tropía, como función termodinámica, está denida como aditiva. La forma
más simple de relacionar ambas es a través de la función logarítmica. Bol-
tzmann, concretamente propuso la relación siguiente:
S = k logW,
donde k es una constante que permite generalizar la relación y que deno-
minaremos constante de Boltzmann. Su signicación habrá que buscarla en
consideraciones físicas.
Esta relación es la clave de la conexión entre el mundo microscópico y
el macroscópico y constituye la base de la Mecánica Estadística.
A. Distribución de Boltzmann 169
Para la determinación del número de microestados, la idea fundamen-
tal es que, en un sistema aislado, todos los microestados son igualmente
probables. Esta es la hipótesis más simple que puede formularse para cuya
aclaración se propone un ejemplo sencillo.
Supongamos un sistema con cuatro partículas subdividido en dos partes
por una pared dotada de un oricio a través del cual pueden pasar estas
partículas. Consideramos como un macroestado el número de moléculas en
cada lado de la pared, de modo que un macroestado vendrá caracterizado
por dos números, nA y nB, correspondientes al número de moléculas en la
división A y en la división B, respectivamente. De esta forma se comprueba
que puede haber cinco posibles macroestados:
nA nB
0 41 32 23 14 0
Tomando como microestados las posibles distribuciones de las partí-
culas concretas, compatibles con las condiciones de cada macroestado, los
microestados serán aquellas disposiciones que especiquen con detalle qué
moléculas se hallan en cada subsistema, en lugar de limitarse a decir cuán-
tas hay en cada uno de ellos. Naturalmente, la especicación de cuántas
(macroestado) es mucho menos detallada que la especicación de cuáles
(microestados). En la tabla siguiente se presentan de modo explícito los
microestados y el número de ellos, W , compatibles con cada macroestado:
Con este ejemplo se muestra, también de modo explícito el principio
de evolución del sistema del estado menos probable (0, 4) al más probable
(2, 2). En la práctica, efectivamente, si un gas se encuentra en un recipiente
de pequeño volumen y éste se destapa , el gas se expande espontáneamente
hasta ocupar homogéneamente todo el volumen que le es accesible.
170 A. Distribución de Boltzmann
Macrtoestados Microestados
nA nB Partículas en A y en B W
0 4 ∅ | 1, 2, 3, 4 11 3 1 | 2, 3, 4 2 | 1, 3, 4 3 | 1, 2, 4 4 | 1, 2, 3 42 2 1, 2 | 3, 4 1, 3 | 2, 4 1, 4 | 2, 3 2, 3 | 1, 4 2, 4 | 1, 3 3, 4 | 1, 2 63 1 1, 2, 3 | 4 1, 2, 4 | 3 2, 3, 4 | 1 1, 3, 4 | 2 44 0 1, 2, 3, 4 | ∅ 1
Si en lugar de cuatro moléculas o partículas se tiene un número n,
de modo que la distribución es de nA y de nB = n − nA, el número de
microestados posibles para un determinado macroestado puede determi-
narse fácilmente, según la combinatoria elemental, mediante la expresión
siguiente:
W =(nA + nB)!nA! nB!
En la práctica, la mayor parte de los sistemas naturales no son sistemas
aislados, sino que se habla de sistemas en los que el parámetro constante
es la temperatura. En este caso los microestados correspondientes a un
macroestado ya no son igualmente probables sino que su probabilidad de-
pende tanto de la energía como de la temperatura. Aquí la distribución
de probabilidades es de gran interés práctico y se conoce como función de
distribución canónica.
Para pasar de la situación anterior -sistema aislado con microestados
de la misma probabilidad- al caso presente, se supondrá que el sistema se
encuentra en contacto con una fuente térmica exterior que hace las veces
de termostato manteniendo constante su temperatura. Además, se consi-
derará que el conjunto de nuestro sistema y la fuente térmica constituyen
un sistema aislado del exterior.
Si consideramos el conjunto aislado de nuestro sistema más la fuente
térmica, cada microestado de este conjunto será la combinación de un mi-
croestado del sistema y de un microestado de la fuente térmica, de modo
que el número total de microestados del conjunto, W , será el producto del
número de microestados del sistema, W1, y del número de microestados de
A. Distribución de Boltzmann 171
la fuente térmica, W2:
W = W1 ·W2
Todos estos microestados compuestos tienen la misma probabilidad ya que
corresponden a un sistema aislado. Nuestro problema estriba, sin embargo,
en conocer la probabilidad de cada microestado concreto del sistema 1,nuestro sistema. La respuesta a esta cuestión es simple: un microestado
del sistema 1 será tanto más probable cuanto mayor sea el número de
microestados del sistema 2 fuente térmica con los que pueda combinarse
para formar microestados del conjunto aislado, 1 + 2.
Supóngase que un micro estado del sistema 1 tenga una energía E mien-
tras que el sistema conjunto 1+2 tenga la energía Etot. Los microestados de
2 combinables con el microestado de 1 para dar microestados del conjunto
con energía Etot serán aquellos microestados de 2 con energía Etot − E.
Para conocer cuánto vale el número de estos microestados, W2, se recurrirá
a la relación de Boltzmann según la cual S2 = k logW2, o bien:
W2(Etot − E) = exp[S2
k
]Sin embargo, dado que Etot E, puesto que la fuente térmica es mucho
mayor que el sistema 1, se puede escribir el siguiente desarrollo en serie:
S2(Etot − E) = S2(Etot)−(∂S2
∂E
)E +
12
(∂2S2
∂2E
)E2 − . . .
Mediante consideraciones termodinámicas simples, que evitamos abordar
por motivos de espacio, puede demostrarse que:(∂S2
∂E
)=
1T(
∂2S2
∂2E
)=
1C2T 2
donde T es la temperatura del sistema y de la fuente térmica, y C2 es la ca-
pacidad caloríca de la fuente. Como la fuente puede tomarse muy grande
en comparación a la del sistema, este término se hace prácticamente des-
preciable (ya que C2T2 tomaría valores comparativamente muy elevados).
172 A. Distribución de Boltzmann
En consecuencia, el desarrollo puede truncarse del modo siguiente:
S2(Etot − E) ' S2(Etot)−E
T
siendo S2(Etot) una constante que no depende de E.
De esta forma, el número de microestados W2 toma el siguiente valor:
W2(Etot − E) = exp[S2(Etot)
k
]· exp
[− E
kT
]y puesto que el primer término exponencial es constante y la probabilidad
del microestado es proporcional aW2(Etot−E) puede nalmente escribirse
que la probabilidad es:
Pr(E) ∝ exp[− E
kT
]expresión que se conoce como distribución de Boltzmann y que es la base de
la interpretación estadística de numerosos fenómenos sicoquímicos sobre
bases moleculares.
A.1. Aplicación a la Deducción de la Distribución de
Maxwell de las Velocidades de las Moléculas de un
Gas
Un ejemplo sencillo de la aplicación de la distribución de Boltzmann lo
constituye la deducción de la distribución de las velocidades de las molé-
culas de un gas ideal monoatómico.
En este caso, la energía que corresponde a una molécula de masa m,
con velocidad v, es simplemente su energía cinética, es decir:
E =12mv2.
Según lo deducido anteriormente, la probabilidad de que una molécula ten-
ga velocidad v es:
Pr(v) ∝ exp[−mv
2
2kT
],
A.1. Aplicación a la distribución de Maxwell 173
por otra parte, el número de microestados con velocidad | v | es:
g(v) = 4πv2dv,
puesto que éste representa el volumen de la capa esférica de radio v y
espesor dv en donde pueden encontrarse los vectores v con módulos com-
prendidos entre | v | y | v + dv |. Así, se tiene que la probabilidad de que
la componente vx, por ejemplo, se encuentre entre | vx | y | vx + dvx | es:
Pr(vx)dvx =( m
2πkT
)1/2exp
[−mv
2x
2kT
]dvx
donde (m/2πkT )1/2 representa un factor de normalización de tal forma que∫ +∞
−∞Pr(vx)dvx = 1.
Esta función de distribución toma la forma de una campana de Gauss.
Por otra parte, la función de distribución del módulo de la velocidad
| v |, denido como | v2 |= v2x + v2
y + v2z viene dada por la expresión:
Pr(v)dv = f(T, v)dv =( m
2πkT
)3/24πv2 exp
[−mv
2
2kT
]dv.
Que representa la denominada distribución de Maxwell-Boltzmann.
Bibliografía
K. M. Abdelbasit y R. L. Plackett. Experimental design for binary data.
J. Amer. Statist. Assoc., 78(381):9098, 1983.
A. W. Adamson y A. P. Gast. Physical Chemistry of Surfaces. Wiley, New
York, 1997.
A. H. Al-Muhtaseb, W. A. M. McMinn, y T. R. A. Magee. Water sor-
ption isotherm of starch powders. Part 1: Mathematical description of
experimental data. J. Food Eng., 61:297307, 2004.
R. B. Anderson. Modications on the Brunnauer, Emmet and Teller equa-
tion. J. Am. Chem. Soc., 68:686691, 1946.
R. Ardanuy, J. López-Fidalgo, P. J. Laycock, y W. K. Wong. When is
an equally-weighted design D-optimal? Ann. Inst. Statist. Math., 51(3):
531540, 1999.
S. Arrhenius. Ober die reacktionsgeschwindigkeit bei der inversion von
rohrzucker durch saüren. Z. Physik. Chem., 4:226248, 1889.
N. Arslan y H. Togrul. Modelling of water sorption isotherms of macaro-
ni stored in a chamber under controlled humidity and thermodynamic
approach. J. Food Eng., 69:133145, 2005.
175
176 Bibliografía
A. Ash y A. Hedayat. An introduction to design optimality with an over-
view of the literature. Comm. Statist. ATheory Methods, 7(14):1295
1325, 1978.
A. C. Atkinson. Developments in the design of experiments. Internat.
Statist. Rev., 50:161177, 1982.
A. C. Atkinson. New developments and applications in experimental design,
volume 34 of IMS Lecture Notes - Monograph Series, capítulo Optimum
experimental designs for chemical kinetics and clinical trials, páginas
3649. 1998.
A. C. Atkinson y B. Bogacka. Compound, D- and Da-optimum designs for
determining the order of a chemical reaction. Technometrics, 39:347356,
1997.
A. C. Atkinson y A. Donev. Optimum Experimental Designs. Oxford
University Press, New York, 1992.
A. C. Atkinson y V. V. Fedorov. The design of experiments for discrimi-
nating between two rival models. Biometrika, 62:5770, 1975a.
A. C. Atkinson y V. V. Fedorov. Optimal design: Experiments for discri-
minating between several models. Biometrika, 62:289303, 1975b.
A. C. Atkinson y W. G. Hunter. The design of experiments for parameter
estimation. Technometrics, 10(2):271289, 1968.
A. C. Atkinson, B. Bogacka, y M. B. Bogacki. D− and T−optimum designs
for the kinetics of a reversible chemical reaction. Chemom. Intell. Lab.
Syst., 43:185198, 1998.
A. C. Atkinson, A. Donev, y R. Tobias. Optimum Experimental Designs,
with SAS. Oxford University Press, 2007.
D. Avnir, editor. The Fractal Approach to Heterogeneous Chemistry. Wiley,
New York, 1989.
J. Avom, J. Ketcha Mabdcam, M. R. L. Matip, y P. Germain. Adsorption
isotherme del lácide acétique par des charbons dórigine vegétale. Afr. J.
Sci. Techol., 2:17, 2001.
Bibliografía 177
A. Belarbi, Ch. Aymard, J. M. Meot, A. Themelin, y M. Reynes. Water
desorption isotherms for eleven varieties of dates. J. Food Eng., 43:103
107, 2000.
M. P. F. Berger y W.-K. Wong, editores. Applied Optimal Designs. Wiley,
2005.
G. J. Borjas. On regressing regresion coecients. JSPI, 7:131137, 1982.
G. E. P. Box y W. G. Hunter. Sequential design of experiments for non-
linear models, IBM Scientic Computing Synposium in Statistics, pági-
nas 111137. 1965.
G. E. P. Box y H. L. Lucas. Design of experiments in non-linear situations.
Biometrika, 46:7790, 1959.
M. J. Box. The use of designed experiments in non linear model building,
The future of Statistics, páginas 241268. 1968a.
M. J. Box. The ocurrence of replications in optimal designs of experiments
to estimate parameters in nonlinear models. J. Roy. Statist. Soc. Ser.
B, 30:290302, 1968b.
M. J. Box. The design of experiments and non linear model-building under
a variety of error structures. PhD thesis, University of London, 1969.
M. J. Box. Some experiences with a nonlinear experimental design criterion.
Technometrics, 12:569589, 1970.
L. D. Brown, I. Olkin, J. Sacks, y H. P. Wynn. Jack Carl Kiefer Collected
papers III. Springer Verlag, New York, 1985.
S. Brunauer, P. H. Emmett, y E. Teller. Adsorption of gases in multimole-
cular layers. J. Am. Chem. Soc., 60:309319, 1938.
S. Brunauer, L. S. Deming, W. E. Deming, y E. Teller. On a theory of the
van der Waals adsorption of gases. J. Am. Chem. Soc., 62:17231732,
1940.
M. Caurie. The derivation of the GAB adsorption equation from the BDDT
adsorption theory. Int. J. Food Sci. Technol., 41:173179, 2006.
178 Bibliografía
E. Cepeda, R. Ortíz de Latierro, M. J. San José, y M. Olazar. Water
sorption isotherms of roasted coee and coee roasted with sugar. Int.
J. Food Sci. Technol., 34, 1999.
H. Cherno. Locally optimal designs for estimating parameters. Ann.
Math. Stat., 24:586602, 1953.
H. Cherno. Sequential Analysis and Optimal Design. PA:SIAM. CBMS-
NSF, Philadelphia, 1972.
J. Chirife y H. A. Iglesias. Equations for tting water sorption isotherms
of foods: Part 1 A review. J. Food Technol., 13:159174, 1978.
M.-S. Chou y K.-L. Chang. UV/ozone degradation of gaseous hexamethyl-
disilazane (HMDS). Chemosphere, 69:697704, 2007.
R. D. Cook y W. K. Wong. On the equivalence of constrained and com-
pound optimal designs. J. Amer. Statist. Assoc., 89:687692, 1994.
D. J. Currie. Estimating Michaelis-Menten parameters: bias, variance and
experimental design. Biometrics, 38:8292, 1982.
J. H. de Boer. The dynamic character of adsorption. Oxford: Clarendon
Press, 1953.
J. de Guzmán. Relación entre la uidez y el calor de fusión. Anales de la
Sociedad Española de Física y Qímica, 11:353362, 1913.
H. Dette y W. K. Wong. Optimal desings when the variance is a function
of its mean. Biometrics, 55:925929, 1999.
H. Dette, V. B. Melas, y A. Pepelyshev. Standarized maximin E−optimal
designs for the Michaelis-Menten model. Statist. Sinica, 13(4):11471163,
2003.
N. R. Draper y W. G. Hunter. The use of prior information in the design
of experiments for parameter estimation in non-linear situation: Multi-
response case. Biometrika, 54:662665, 1967.
S. Ehrenfeld. On the eciency of the experimental designs. Ann. Math.
Stat., 26:247255, 1955.
Bibliografía 179
G. Elfving. Optimum allocation in linear regression theory. Ann. Math.
Stat., 23:255262, 1952.
L. Endrenyi. Design of Experiments for Estimating Enzyme and Pharma-
cokinetic Parameters. Plenum Press, 1981.
M. G. Evans y M. Polanyi. Application of the transition-state method
to the calculation of reactions velocities, especially in solution. Trans.
Faraday Soc., 31:875894, 1935.
H. Eyring. Activated complex in chemical reactions. J. Chem. Phys., 3:
107115, 1935.
H. Eyring, S. H. Lin, y S. M. Lin. Basic Chemical Kinetics. J. Wiley, New
York, 1980.
V. V. Fedorov. Theory of optimal experiments. Technical report, Depar-
tament of Statistics, Purdue University, 1972.
V. V. Fedorov y P. Hackl. Model-Oriented Design of Experiments. Lecture
Notes in Statistics. Spinger, New York, 1997.
C. Ferro Fontan, J. Chirife, E. Sancho, y H. A. Iglesias. Analysis of a model
for water sorption phenomena in foods. J. Food Sci., 47:15901594, 1982.
I. Ford, D. M. Tittterington, y C. P. Kitsos. Recent advances in nonlinear
experimental design. Technometrics, 31(1):4960, 1989.
K. Frischmuth. On locally D-optimal experimental design. Rostock. Math.
Kolloq., 36:5164, 1989.
Z. Galil y J. Kiefer. Time -and space- saving computer methods, related
to Mitchell's DETMAX, for nding D-optimum designs. Technometrics,
22(3):301313, 1980.
F. Garofalo. Fundamentals of Creep and Creep Rupture in Metals. McMi-
llan, 1965.
S. Glasstone, K. J. Laidler, y H. Eyring. The Theory of Rate Processes.
McGraw-Hill, New York, 1941.
S. J. Gregg y K. S. W. Sing. Adsorption, surface area and porosity. Aca-
demic Press, London, 1982.
180 Bibliografía
E. A. Guggenheim. Application of statistical mechanics. Oxford: Clarendon
Press, 1966.
A. J. Hailwood y S. Horrobin. Absorption of water by polymers: Analysis
in terms of a simple model. J. Chem. Soc., Faraday Trans. B, 42:8489,
1946.
G. Halsey. Pysical adsorption of non-uniform surfaces. J. Chem. Phys., 16:
931937, 1948.
R. H. Hardin y N. J. A. Sloane. Operating manual for GOSSET: A general-
purpose program for constructing experimental designs. Technical re-
port, Mathematical Sciences Research Center, AT&T Bell Laboratories,
Murray Hill, New Jersey, 1994.
D. H. Hill. D-optimal designs for partially nonlinear regression models.
Technometrics, 22(2):275276, 1980.
D. M. Hirst. A Computational Approach to Chemistry. Blackwell Sci. Pub.,
Oxford, 1990.
P. G. Hoel. Eciency problems in polynomial estimation. Ann. Math.
Stat., 29:307316, 1958.
R. B. Holmes. Geometric Functional Analysis and its Applications. Sprin-
ger, New york, 1975.
J. E. House. Principies of Chemical Kinetics. Elsevier, 2007.
Y. C. Huang y W. K. Wong. Sequential construction of multiple-objective
designs. Biometrics, 54:188197, 1998a.
Y. C. Huang y W. K. Wong. Multiple-objective designs for biomedical
studies. J. Biopharm. Stat., 8:635643, 1998b.
L. Imhof y W. K. Wong. A graphical method for nding maximin designs.
Biometrics, 56:113117, 2000.
M. Imhof, J. López-Fidalgo, y W. K. Wong. Eciences of optimal aproxi-
mate designs for small samples. Statist. Neerlandica, 55:301315, 2001.
IUPAC, Commission on Colloid and Surface Chemistry of the International
Union of Pure and Applied Chemistry. Reporting physisorption data for
Bibliografía 181
gas/solid systems - with special references to the determination of surface
area and porosity. Pure Appl. Chem., 57:603619, 1985.
Jet Propulsion Laboratory. Chemical kinetics and photochemical data for
use in stratospheric modelling, suplement to evaluation 12: Update of key
reactions. Technical Report Evaluation Number 13, California Institute
of Technology, NASA, Pasadena, California, March 2000.
Jet Propulsion Laboratory. Chemical kinetics and photochemical data for
use in atmospheric studies. Technical Report Evaluation Number 14, Ca-
lifornia Institute of Technology, NASA, Pasadena, California, February
2003.
R. C. St. John y N. R. Draper. D-optimality for regression design: A review.
Technometrics, 17(1):1523, 1975.
K. Jouppila y Y. H. Roos. Water soprtion isotherms of freeze-dried milk
products: applicability of linear and non-linear regression analysis in mo-
delling. Int. J. Food Sci. Technol., 32:459471, 1997.
P. Karakaya, M. Sidhoum, C. Christodoulatos, S. Nicolich, y W. Balas.
Aqueous solubility and alkaline hydrolysis of the novel high explosive
hexanitrohexaazaisowurtzitane (CL-20). J. Hazard. Mater., B120:183
191, 2005.
S. Karlin y W. Studden. Optimal experimental designs. Ann. Math. Stat.,
37:783810, 1966.
A. I. Khuri y J. Lee. A graphical approach for evaluating and comparing
designs for nonlinear models. Comput. Statist. Data Anal., 27(4):433
443, 1998.
J. Kiefer. General equivalence theory for optimum designs (Aproximate
theory). Ann. Statist., 2(5):848879, 1974.
J. Kiefer y J. Wolfowitz. Optimum design in regresion problems. Ann.
Math. Stat., 30:271294, 1959.
J. Kiefer y J. Wolfowitz. The equivalence of two extremum problems.
Canad. J. Math., 12:363366, 1960.
182 Bibliografía
R. Kli£ka y L. Kubá£ek. Statistical properties of linearization of the
Arrhenius equation via the logarithmic transformation. Chemom. In-
tell. Lab. Syst., 39:6975, 1997.
K. J. Laidler. Theories of Chemical Reaction Rates. McGraw-Hill Book
Co, New York, 1969.
K. J. Laidler. The development of the Arrhenius equation. J. Chem. Ed.,
61(6):494498, 1984.
I. Langmuir. The adsorption of gases on plane surfaces of glass, mica and
platinum. J. Am. Chem. Soc., 40(9):13611403, 1918.
K. Levenberg. A method for the solution of certain problems in least
squares. Quart. Appl. Math., 2:164168, 1944.
P. P. Lewicki. The applicability of the GAB model to food water sorption
isotherms. Int. J. Food Sci. Technol., 32:553557, 1997.
W. C. McC. Lewis. Studies in catalysts. IX. The calculation in absolu-
te measure of velocity constants and equilibrium constants in gaseous
systems. J. Chem. Soc., Abstracts, 113:471492, 1918.
S. R. Logan. The origin and status of the Arrhenius equation. J. Chem.
Ed., 59(4):279281, 1982.
J. López-Fidalgo y W. K. Wong. Design for the Michaelis-Menten model.
J. Theoret. Biol., 215:111, 2002.
J. López-Fidalgo y J. M. Rodríguez-Díaz. Elfving's method for m-
dimensional models. Metrika, 59(3), 2004.
J. López-Fidalgo, J. M. Rodríguez-Díaz, y B. Torsney, editores. mODa8-
Advances in Model-Oriented Design and Analysis. Springer, 2007a.
J. López-Fidalgo, C. Trandar, y Ch. Tommasi. An optimal experimental
design criterion for discriminating between non-normal models. J. Roy.
Statist. Soc. Ser. B, 69(2):112, 2007b.
D. Marquardt. An algorithm for least-squares estimation of nonlinear pa-
rameters. SIAM J. Appl. Math., 11:431441, 1963.
Bibliografía 183
J. F. Mata-Segreda. Hydroxide as general base in the saponication of
ethyl acetate. J. Am. Chem. Soc., 124:22592262, 2002.
V. B. Melas. Functional Approach to Optimal Experimental Design. Lecture
Notes in Statistics. Springer, 2005.
T. J. Mitchell. An algorithm for the construction of D-optimal experimental
designs. Technometrics, 16(2):203210, 1974.
P. C. Moonen, J. N. Cape, R. L. Storeton-West, y R. McColm. Measure-
ment of the NO+O3 reaction rate at atmospheric pressure using realistic
mixing ratios. J. Atmos. Chem., 29:299314, 1998.
J. W. Moore y R. G. Pearson. Kinetics and Mechanism. A study of homo-
geneous Chemical reactions. Wiley, 1981.
G. Moraga, N. Martínez Navarrete, y A. Chiralt. Water sorption isotherms
and phase transitions in kiwifruit. J. Food Eng., 72:147156, 2006.
A. K. Nigam, S. C. Gupta, y S. Gupta. A new algorithm for extreme vertices
designs for linear mixture models. Technometrics, 25(4):367371, 1983.
C. R. Oswin. The kinetics of package life. III. The isotherm. Chem. Ind.
(London), 65:419423, 1946.
A. Pázman. Singular experimental designs (Standard and Hilbert-space
approaches). Math. Operationsforsch. Statist. Ser. Statist., 11(1):137
149, 1980.
A. Pázman. Foundations of Optimum Experimental Design. D. Reidel
publishing company, Dordrecht, 1986.
P. Perso y J. F. Thomas. Estimating Michaelis-Menten or Langmuir isot-
herm constants by weighted nonlinear least squares. Soil Sci. Soc. Am.
J., 52:886889, 1988.
G. Pickett. Modication of the Brunauer-Emmet-Teller theory of multi-
molecular adsorption. J. Am. Chem. Soc., 67:19581962, 1945.
G. Pistone, E. Riccomagno, y H. P. Wynn. Algebraic Statistics: Compu-
tational Commutative Algebra in Statistics. Chapman & Hall, 2000.
184 Bibliografía
F. Pukelsheim. Optimal Design of Experiments. John Wiley and Sons, New
York, 1993.
D. Rasch y P. Darius. Computer Aided Design of Experiments. Compu-
tational Statistics. Physica-Verlag, Heidelberg, 1995.
G. W. Ray y R. T. Watson. Kinetics of the reaction NO+O3 → NO2 +O2
from 212 to 422. J. Phys. Chem., 85:16731676, 1981.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Optimal designs for the
Arrhenius model. En 5th Congress of Romanian Mathematicians, pá-
ginas 7576, 2003.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Optimal designs for the
Arrhenius equation. Chemom. Intell. Lab. Syst., 77:131138, 2005.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Optimum designs for the des-
cription of sorption data using isotherm equations. En International
Congress of Mathematicians, página 62, 2006a.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Optimum designs for adsor-
ption models. En International Conference on Mathematical and Statis-
tical Modelling, página 93, 2006b.
L. J. Rodríguez-Aragón y J. López-Fidalgo. T−, D− and c− optimum
designs for BET and GAB adsorption isotherms. Chemom. Intell. Lab.
Syst., 89:3644, 2007a.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Application of optimum de-
signs to the characterization of adsorption isotherms. En 8th Model
Oriented Design and Analysis Workshop, página 62, 2007b.
L. J. Rodríguez-Aragón y J. López-Fidalgo. Diseño óptimo de experimentos
en quimiometría. En XXX Congreso Nacional de la Sociedad Estadística
Española, página 147, 2007c.
J. M. Rodríguez-Díaz. Criterios Característicos en Diseño Óptimo de Ex-
perimentos. PhD thesis, Universidad de Salamanca, 2000.
J. M. Rodríguez-Díaz y M. T. Santos-Martín. Optimal designs for a mo-
died exponential model. En 8th Model Oriented Design and Analysis
Bibliografía 185
Workshop, páginas 6263, 2007.
C. Rodríguez Torreblanca y I. M. Ortíz Rodríguez. Diseño Óptimo de Ex-
perimentos para Modelos de Regresión. Universidad de Almería, Sevicio
de Publicaciones, Almería, 1999.
D. Ruppert, N. Cressie, y R. J. Carroll. A transformation/weighting model
for estimating Michaelis-Menten parameters. Biometrics, 45:637656,
1989.
S. Saevels, A. Z. Berna, J. Lammertyn, C. di Natale, y B. M. Nicolaï. Cha-
racterisation of QMB sensors by means of the BET adsorption isotherm.
Sens. Actuators, B, 101:242251, 2004.
R. Schwabe. Optimum Designs for Multi-Factor Models. Springer, New
York, 1996.
K. R. Shah y B. K. Sinha. Theory of Optimal Design. Lecture Notes in
Statistics. Springer Verlag, New York, 1989.
D. R. Shonnard, R. L. Bell, y A. P. Jackman. Eects of nonlinear sorption
on the diusion of benzene and dichloromethane from two air-dry soils.
Environ. Sci. Technol., 27:457466, 1993.
S. D. Silvey. Optimal Design. Chapman & Hall, London, 1980.
S. D. Silvey y D. M. Titterington. A geometric aproach to optimal design
theory. Biometrika, 60(1):2132, 1973.
A. Sinha, E. R. Lovejoy, y C. J. Howard. Kinetic study of the reaction of
HO2 with ozone. J. Chem. Phys., 87(4):21222128, 1987.
K. Smith. On the standard deviations of adjusted and interpolates values
of an observed polynomial functions and its constants and the guidance
they give towards a proper choice of the distribution of observations.
Biometrika, 12:185, 1918.
R. D. Snee y W. Marquardt. Extreme vertices designs for linear mixture
models. Technometrics, 16(3):399408, 1974.
E. O. Timmermann. Multilayer sorption parameters: BET or GAB values?
Colloids Surf., A, 220:235260, 2003.
186 Bibliografía
E. O. Timmermann, J. Chirife, y H. A. Iglesias. Water sorption isotherms
of foods and foodstus: BET or GAB parameters? J. Food Eng., 48:
1931, 2001.
D. M. Titterington. Optimal designs: Some geometrical aspects of D-
optimality. Biometrika, 2(313320), 1976.
M. Tokunaga, J. Kiyosu, Y. Obora, y Y. Tsuji. Kinetic resolution displaying
zeroth order dependence on substrate consumption: Copper-catalyzed
asymmetric alcoholysis of azlactones. J. Am. Chem. Soc., 128:4481
4486, 2006.
M. Trautz. The law of reaction velocity and of equilibrium in gases. the
additivity of Cv-3/2R. new determinations of the integration constants
and of the molecular diameter. Z. Anorg. Allgem. Chem., 96:128, 1916.
C. van den Berg. Engineering and Food: Engineering Sciences in the Food
Industry, volume 1, capítulo Description of water activity of foods for
Engineering purposes by means of the GAB model of sorption, páginas
311321. Elsevier, London, 1984.
J. H. van't Ho. Etudes de Dynamique Chimique. F. Muller & Co., Ams-
terdam, 1884.
A. Wald. On the ecient design of statistical investigations. Ann. Math.
Stat., 14:134140, 1943.
W. J. Welch. Branch-and-bound search for experimental design based on
D-optimality and other criteria. Technometrics, 24(1):4148, 1982.
L. V. White. An extension of the general equivalence theorem to nonlinear
models. Biometrika, 60(2):354348, 1973.
P. Whittle. Some general points in the theory of optimal experimental
design. J. Roy. Statist. Soc. Ser. B, (1):123130, 1973.
W. Wolf, W. E. L. Spiess, y G. Jung. Standardization of isotherm measu-
rements (COST-project 90 and 90 bis). En D. Simatos y J. L. Multon,
editores, Properties of water in foods, páginas 661679. Martinum Nij-
ho, Dordrecht, 1985.