Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...
Transcript of Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...
-
CENTRO DE INVESTIGACIÓN Y DE ESTUDIOS AVANZADOS
DEL INSTITUTO POLITÉCNICO NACIONAL
DEPARTAMENTO DE CONTROL AUTOMÁTICO
Sistemas difusos jerárquicos para modelado y control
TESIS QUE PRESENTA EL:
Ing. Fernando Gómez Salas
PARA OBTENER EL GRADO DE
MAESTRO EN CIENCIAS
EN LA ESPECIALIDAD DE
CONTROL AUTOMÁTICO
DIRECTOR DE TESIS:
Dr. Wen Yu Liu
México, D.F. Octubre del 2005
-
Dedicatoria
A toda mi familia , por haberme apoyado en todo momento para el logro de mis objetivos.
-
ii
-
Agradecimientos
Deseo expresar mi gratitud a los esfuerzos de la gente que devotamente me ayudaron a
la realización de esta tesis
CINVESTAV: Antonio Osorio Cordero, José de Jesús Mesa Serrano, Noemí García
Gutiérrez, Graciela Meza Castellanos, Carlos Guerrero Rojo y Sheila Montiel.
A mis asesores: Dr. Francisco José Ruiz Sánchez y al Dr. Ieroham Barouh por las
críticas constructivas para mejorar el presente trabajo
A Mis amigos : Beto, Edgar, Armando, Gabriela, Roxana, Omar, Laura, Saraí, Rosa,
Sheila y Rigoberto.
Mil gracias a mi familia: A mis abuelos Jorge Salas y Margarita Zúñiga, a mis padres
Antonia Salas y Ernesto Gómez, a mis tíos Roberto Salas, Carmen Salas y Miguel Salas, a
mi hermano Israel Gómez y a mis primos Zoe, Zaira, Laura, Pepe y Bruno.
Por último mi especial gratitud al Dr. Wen Yu Liu por dirigirme en este trabajo de tesis
y enseñarme lo difuso que suele ser la vida.
Mil gracias al CONACYT por apoyarme con una beca, sin la cuál no hubiera sido posible
terminar este trabajo de tesis y al departamento de Control Automático por proporcionarme
los medios necesarios para mi formación académica y por las facilidades otorgadas durante
mi estancia.
-
iv
-
Resumen
En este trabajo se presenta un algoritmo jerárquico de aprendizaje tipo backpropagation
para la identificación de sistemas sin utilizar estructuras complejas de entrenamiento y un
algoritmo para el diseño de controladores difusos jerárquico. Este nuevo esquema de apren-
dizaje es aplicado a sistemas de identificación vía aprendizaje difuso jerárquico. El algoritmo
de aprendizaje emplea un factor de aprendizaje de tiempo variable, el cual es determinado
a partir de los datos de entrada-salida y a partir de la estructura del sistema. Este método
sugiere ser más sencillo que el aprendizaje normal debido a su estructura jerárquica, lo que
implica que podemos entrenar exactamente los parámetros de cada sub-bloque del sistema
jerárquico independientemente. Por otra parte, el algoritmo para el diseño de controladores
difusos jerárquicos es desarrollado de tal forma que uno puede fácilmente diseñar las reglas
difusas del sistema en forma jerárquica mediante el uso del método de mapeo de variables
y un índice de aproximación φ. En contraste con el método convencional de una sola capa,
el nuevo método llamado jerárquico, posee la gran ventaja de que el número de reglas del
sistema solamente se incrementa linealmente con el número de variables de entrada.
La efectividad del método propuesto para la identificación de sistemas se verifica a través
de un ejemplo de cinco dimensiones y mediante la predicción de una serie de tiempo de tipo
Mackey-Glass. De manera similar para mostrar la efectividad del algoritmo correspondiente
al diseño de controladores difusos jerárquicos, el algoritmo propuesto se valida a través del
diseño de un controlador difuso jerárquico para el sistema riel-esfera. Los resultados de las
simulaciones se presentan para ilustrar la efectividad y la confiabilidad de estos algoritmos.
-
vi
-
Índice general
1. Introducción 1
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Descripción de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Sistemas difusos 7
2.1. Estructura de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Fuzzificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.2. Mecanismo de inferencia difusa . . . . . . . . . . . . . . . . . . . . . 9
2.1.3. Defuzzicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2. Tipos de Sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1. Mamdani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2. Takagi-Sugeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3. Sistemas difusos jerárquicos vía aprendizaje para identificación de sis-
temas 19
3.1. El sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2. Identificación de sistemas vía aprendizaje difuso jerárquico . . . . . . . . . . 21
3.2.1. Error backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.2. Algoritmo para identificación de sistemas no lineales . . . . . . . . . 28
-
viii ÍNDICE GENERAL
3.3. Aprendizaje de un controlador en sistemas difusos . . . . . . . . . . . . . . . 30
3.4. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.1. Ejemplo de cinco dimensiones . . . . . . . . . . . . . . . . . . . . . . 32
3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass . . . . . . . . . 36
3.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4. Sistemas difusos jerárquicos vía mapeo de variables para control difuso 43
4.1. El sistema de estructura jerárquica . . . . . . . . . . . . . . . . . . . . . . . 44
4.2. El sistema difuso limpio-jerárquico L-HFS . . . . . . . . . . . . . . . . . . . 46
4.2.1. Algoritmo para la construcción del sistema difuso límpido-jerárquico . 51
4.3. Aplicación del L-HFS al sistema riel-esfera . . . . . . . . . . . . . . . . . . . 53
4.3.1. El sistema riel-esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3.2. Implementación del algoritmo L-HFS . . . . . . . . . . . . . . . . . . 55
4.4. Aplicación en tiempo real . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.1. Descripción del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.2. Construcción del controlador difuso jerárquico para el sistema riel-esfera 67
4.4.3. Implementación al sistema real y resultados experimentales . . . . . . 73
4.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5. Conclusiones y trabajos futuros 81
5.1. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
-
Índice de figuras
2.1. Esquema general del control difuso. . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Función de membresía del singleton. . . . . . . . . . . . . . . . . . . . . . . . 9
3.1. (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-
sentación para el sistema lógico difuso convencional de una sola capa. . . . . 20
3.2. Sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3. Un sistema difuso jerárquico para identificación. . . . . . . . . . . . . . . . . 26
3.4. Entrenamiento en el caso general para la identificación de sistemas. . . . . . 29
3.5. Diagrama a bloques que representa el aprendizaje de tipo Off-Line. . . . . . . 30
3.6. Entrenamiento para sistemas de control usando sistemas difusos jerárquicos. 31
3.7. Estructura jerárquica difusa para identificar el sistema no lineal definido por
( 3.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.8. Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas. 34
3.9. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0
-
x ÍNDICE DE FIGURAS
3.14. Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas. 38
3.15. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predic-
ción en una serie de tiempo tipo Mackey-Glass cuando 0
-
ÍNDICE DE FIGURAS xi
4.18. Reestructura para la base de reglas de una sola capa . . . . . . . . . . . . . . 63
4.19. Nuevas reglas para Fr, Fθ y Fu. . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.20. Funciones de membresía para las variables de salida; (a) Funciones de salidas
(b) Gráfica de la operación ( P OR PG ); (c) Gráfica de la operación ( P OR
NG ); (d) Gráfica de la operación ( PG OR N ); (e) Gráfica de la operación
( PG OR PG ) y (f) (b) Gráfica de la operación ( NG OR NG ). . . . . . . 64
4.21. Descripción del sistema riel esfera. . . . . . . . . . . . . . . . . . . . . . . . 66
4.22. Estructura del jerárquica para el sistema barra-esfera en tiempo real. . . . . . 67
4.23. Reglas difusas para el ejemplo en tiempo real del sistema riel-esfera . . . . . . 69
4.24. Unidades Fr, Fθ y Fu para el sistema barra-esfera. . . . . . . . . . . . . . . . 70
4.25. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable r (b) Membresías de entrada para la variable ṙ (c)
Producto algebraico A∗ = A ·B y (c) Producto algebraico B∗ = C ·D. . . . . 724.26. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable θ (b) Membresías de entrada para la variable θ̇ (c)
Producto algebraico C∗ = E · F y (c) Producto algebraico D∗ = G ·H. . . . . 724.27. El sistema riel-esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.28. Diagrama a bloques en simulink para el controlador en tiempo real del sistema
riel-esfera usado por Ortiz [22]. . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.29. Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera jerárquico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.30. Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera de lógica convencional. . . . . . . . . . . . . . . . . . . . . . . . . 76
4.31. Resultados de la aplicación en tiempo real del sistema barra-esfera. (a) Sistema
difuso jerárquico de 12 reglas y (b) sistema difuso convencional de una sola
capa de 16 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.32. Señal de control (a) para el sistema difuso jerárquico y (b) para el sistema
convencional de la lógica difusa. . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.33. Salida de control PD-difuso para el sistema riel-esfera. . . . . . . . . . . . . 78
-
xii ÍNDICE DE FIGURAS
4.34. Salida de control PD para el sistema riel-esfera. . . . . . . . . . . . . . . . . 78
-
Capítulo 1
Introducción
Desde que el control difuso fue propuesto por E. H. Mamdani en 1974, diferentes estu-
dios aplicados a la teoría del control difuso han mostrado que el aprendizaje difuso y/o los
algoritmos de control difuso son de las áreas más activas y fructíferas de la investigación en
los últimos años dentro del campo de la lógica difusa. A partir de la década de los ochentas,
la lógica difusa ha desempeñado una función vital en el avance de soluciones prácticas y sen-
cillas para una gran diversidad de aplicaciones en la ingeniería y la ciencia. Debido a su gran
importancia en los sistemas de navegación de vehículos espaciales, control de vuelo, control
satelital de altitud, control de velocidad en mísiles y similares, el área de la lógica difusa se
ha vuelto una parte importante e integral de los procesos industriales y de manufactura.
Desde el punto de vista conceptual, el diseño de sistemas difusos a partir de los pares
de entrada-salida, han sido clasificados en dos tipos. El primer tipo de clasificación sugiere
que las reglas del tipo Si− entonces sean generadas a través de los pares de entrada-saliday la estructura del sistema difuso sea construida a partir de estas reglas, del mecanismo
de inferencia difusa, del fuzzificador y del defuzzificador. En la segunda clasificación, la
estructura del sistema difuso se especifica primeramente por lo que algunos parámetros en la
estructura difusa son libres de cambio y estos se determinan de acuerdo a los pares de entrada-
salida. Aunque regularmente algunas aplicaciones del control difusos a procesos industriales
han producido resultados superiores a sus equivalentes obtenidos por el control clásico [25],
-
2 Introducción
el dominio de estas aplicaciones ha experimentado una seria limitación al expander este a
sistemas más complejos, debido a que aún no existe una teoría completa para determinar el
rendimiento del sistemas a partir del cambio en sus parámetros o variables.
Sin embargo, al expandir algunas de estas aplicaciones a sistemas más complejos, el
número de reglas difusas relacionadas con el proceso se incrementan de forma exponencial
con el número de variables relacionadas al sistema. Específicamente este problema llamado
la maldición de la dimensionalidad1 establece que con el uso de n variables y m conjuntos
definidos por cada variable, se necesitarían mn reglas difusas para construir un controlador
difuso completo, i.e., conforme n crece, la base de reglas rápidamente sobrecarga la memoria
de cualquier dispositivo de computo haciendo que el controlador difuso sea difícil de imple-
mentar además de que se define un tiempo de respuesta imposible para procesos rápidos en
tiempo real [37] [35] [36].
Para tratar este problema Raju, Zhou, y Kisner propusieron el uso de sistemas difusos
jerárquicos [37] [3], los cuales consisten en un número de sistemas difusos de baja dimensión
conectados uno a otro de forma jerárquica. La ventaja que propone este enfoque jerárquico
para los sistema difusos, es que el número total de reglas difusas del controlador se incrementa
solamente de forma lineal con el número de variables de entrada y por tanto que sea más
sencillo de implementar reduciendo así el costo computacional y consecuentemente el tiempo
de computo.
1.1. Motivación
Debido al efecto tecnológico causado por el uso de las computadoras a partir de la década
de los 80´s y 90´s, el uso de controladores automáticos asistidos por microcomputadoras
ha crecido considerablemente en muchas de las aplicaciones industriales y militares de la
actualidad. En la gran mayoría de los casos, un control computarizado genera una acción
rápida y precisa de control para sistemas de control basados en la experiencia, sin embargo
1Esta expresión no es única de los sistema difusos y establece lo siguiente:
“La complejidad de un problema incrementa exponencialmente con el número de variables relacionadas”.
-
1.1 Motivación 3
estas acciones se realizan generalmente con una baja calidad en el control comparadas con
la habilidad mostrada por un operador humano experto. Para resolver este problema, los
métodos del control difuso hicieron posible que los ingenieros tuvieran herramientas para
diseñar sistemas de control de excelente calidad, sin embargo, conforme las plantas modernas
con múltiples entradas y salidas se han vuelto más y más complejas, la implementación de este
tipo de controladores se ha tornado más difícil debido a la maldición de la dimensionalidad.
Las limitaciones causadas por la maldición de la dimensionalidad, sugirieron una nueva
metodología para el diseño de sistema difusos a través del uso de una estructura jerárquica.
Aunque los sistemas difusos jerárquicos denotan ser la mejor opción para evitar el crecimiento
del número de reglas difusas de forma exponencial, algunos de estos métodos usan estructuras
complejas y en algunos casos estos abarcan solamente algunos problemas específicos.
La finalidad del presente trabajo, es la de dar a conocer un nuevo algoritmo jerárquico
de aprendizaje tipo backpropagation para la identificación de sistemas no lineales sin utilizar
estructuras complejas de entrenamiento y la de ofrecer una metodología del nuevo enfoque
difuso jerárquico mediante el diseño un controlador difuso en tiempo real para el sistema
riel-esfera. Este sistema se utiliza para ejemplificar y justificar el desarrollo de esta tesis,
en particular, el prototipo esta ubicado en el Centro de Servicios Experimentales (CSE) del
Departamento de Control Automático (DCA) del CINVESTAV-IPN.
Finalmente mencionaremos los casos en los que es necesario utilizar sistemas difusos
jerárquicos:
1. En procesos complejos, gran número de variables de entrada y/o salida.
2. En procesos no lineales complejos.
3. Cuando la introducción de la experiencia de un “experto” se base en una gran cantidad
de variables imprecisas obtenidos a partir de su experiencia.
4. Cuando sea necesario optimizar recursos (memoria del controlador).
5. En general, cuando se quieran representar y operar con una gran variedad de parámet-
ros que tengan cierto grado de imprecisión o incertidumbre.
-
4 Introducción
1.2. Justificación
Al leer algunos artículos y libros de texto referentes a la teoría del control difuso, el
lector crea una opinión acerca de como trabaja y se desempeña el control lógico difuso. En lo
particular, es fácil observar que la mayoría de la literatura no ofrece los suficientes conceptos
fundamentales sobre la teoría difusa y el control difuso. Sin embargo, cuando el lector localiza
cuales son estos conceptos, este comienza a adquirir una opinión diferente acerca de ¿cómo?
y cuando el control difuso trabaja, además de la habilidad para reconocer cuando este es más
práctico2 que el control convencional. De acuerdo con D. Abramovithc 1994 [1], es claro que
la lógica difusa puede ser mucho más útil de lo que sus opositores harían creer. Cualquier
aplicación candidata al control difuso es aquella que relacione una “interacción humana” y
una “regla de control” previamente establecida, i.e., estos son problemas donde la diferencia
entre el bien y el mal no es binaria. En la actualidad, el uso del control difuso convencional
satisface el objetivo de controlar cualquier proceso basado en la información cualitativa de
los procesos.
Aunque el creciente número de aplicaciones de los controladores difusos han sido re-
stringidos en gran medida a la falta de seguridad en su desempeño, en los últimos años el
mundo actual ha sido incitado en considerar y aplicar esta área para su uso en los sistemas de
control. En contraste con el controlador difuso convencional, el controlador difuso jerárquico
no sólo controla el sistema deseado de forma adecuada, sino que también reduce el efecto
causado por la maldición de la dimensionalidad, de tal forma que permite la implementación
del controlador difuso en forma práctica y sencilla. Por otra parte, la construcción de sis-
temas difusos en jerarquías, ofrecen la grandes recompensas de modelar no linealidades sin
la necesidad de emplear algoritmos complejos y por supuesto el de dar soporte a algunos
controladores convencionales en donde el margen de error es crítico.
Finalmente existen algunos problemas, en donde, los sistema de control han sido diseñado
específicamente para trabajar bajo el control de un operador humano. Mediante el uso de
sensores extras y tiempos de muestreo más rápidos que los ofrecidos por un operador humano,
2En costo e implementación.
-
1.3 Descripción de la tesis 5
el control difuso fácilmente ofrece el mismo desempeño realizado por este último. Es por
tanto, que la contribución real que ofrecen los sistemas difusos jerárquicos a las áreas de la
ingeniería, ciencia, negocios, medicina, psicología y similares, es de suma importancia en la
actualidad.
1.3. Descripción de la tesis
Este trabajo de tesis que se presenta, consiste de temas distribuidos en cinco capítulos,
divididos de la siguiente manera:
En el capítulo 1 se realiza una breve introducción al tema de tesis. En el capítulo 2, se
da una introducción referente al concepto de sistema difuso y a los mecanismos de inferencia
difusa tipo Sugeno y Mamdani. El capítulo 3, muestra la motivación de utilizar los sistemas
difusos jerárquicos para la identificación de sistemas, además de tratar el análisis completo
para la construcción del algoritmo jerárquico de aprendizaje tipo-backpropagation para la
identificación de sistemas. Este capítulo, también incluye un par de ejemplos para mostrar
la efectividad de método propuesto. En el capítulo 4 se aborda el análisis y la justificación
de los sistemas difusos jerárquicos en los esquemas de control mediante el uso de variables de
mapeo. Este capítulo también presenta el diseño y la implementación de un algoritmo para
el diseño de controladores difusos jerárquicos. Al final del mismo, se presenta la aplicación
en tiempo real para mostrar la efectividad del algoritmo propuesto. Por último, el capítulo 5
describe las conclusiones generales del trabajo realizado y las perspectivas de investigación
para trabajos futuros.
-
6 Introducción
-
Capítulo 2
Sistemas difusos
El sistema de inferencia difusa es una estructura computacional muy popular basada en
los conceptos de la teoría difusa, en reglas del tipo si-entonces y en métodos de inferencia
difusa. Los sistemas de inferencia difusa, actualmente han encontrado diversas aplicaciones
exitosas dentro de una gran variedad de áreas tales como el control automático, la clasificación
de datos, el análisis de decisiones, los sistemas expertos, la predicción de series de tiempo,
la robótica y en el reconocimiento de patrones. A causa de su naturaleza multidisciplinaria,
los sistemas de inferencia difusa son conocidos como sistemas experto, modelos difusos,
controladores lógicos difusos o simplemente como sistemas difusos.
2.1. Estructura de los sistemas difusos
Motivado por Zadeh y validado por Mamdani, el uso de los sistemas difusos han sido
aplicados en una gran variedad de áreas tales como el control automático, el procesamiento
digital de señales, las comunicaciones, los sistemas expertos, la medicina, etc. Sin embargo,
las aplicaciones más significativa de los sistemas difusos se han concentrado específicamente
en el área del control automático.
Esencialmente un sistema difuso, es una estructura basada en conocimiento definida
a través de un conjunto de reglas difusas del tipo si-entonces, las cuales, contienen una
-
8 Sistemas difusos
Mecanismo de
inferencia
Base de reglas
Fuzzificador Deffuzificador
Proceso
Controlador difuso
difuso difuso
Control actual no difusoSalida del proceso y estado
ui yi
Figura 2.1: Esquema general del control difuso.
cuantificación lógica difusa de la descripción lingüística del experto de como realizar un
control adecuado.
La figura 2.1 ilustra el diagrama a bloques y los componentes básicos de un sistema difuso
en donde los conjuntos clásicos Ui y Yi son llamados el universo del discurso para ui y yirespectivamente. En particular, ui ∈ Ui con i = 1, 2, 3, ..., n y yi ∈ Yi con i = 1, 2, ...,mdefinen las entradas y salidas correspondientes del sistema difuso.
De acuerdo a la figura 2.1, es fácil observar que el sistema difuso utiliza conjuntos difusos,
definidos por la base de reglas difusa, para cuantificar la información en la base de reglas
y que el mecanismo de inferencia opera sobre estos conjuntos difusos para producir nuevos
conjuntos difusos, por tanto, es necesario especificar como el sistema convertirá las entradas
numéricas ui ∈ Ui en conjuntos difusos, un proceso llamado “fuzzificación”, tales que ellospuedan ser utilizados por el sistema difuso. De igual forma, el proceso llamado defuzzificación
describe el mapeo de un espacio de acciones de control difuso en acciones de control no difuso.
La defuzzificación por tanto, genera una acción de control no difusa la cual denotamos
generalmente por ycrispq y es la mejor representación de una salida difusa inferida.
A continuación examinaremos en detalle los elementos que conforman un sistema difuso.
-
2.1 Estructura de los sistemas difusos 9
Figura 2.2: Función de membresía del singleton.
2.1.1. Fuzzificación
El proceso de la fuzzificación consiste en una transformación de un dato o de un conjunto
clásico a su correspondiente conjunto difuso, por tanto, denotemos por U∗i , el conjunto detodos lo posibles conjuntos difusos que pueden ser definidos por Ui y dado ui ∈ Ui, denotemosla transformación difusa de ui a un conjunto difuso por A
fuzi , el cual es definido en el universo
del discurso Ui.La transformación de un conjunto clásico a un conjunto difuso se produce mediante el uso
del operador de fuzzifiaciónF , Passino [23], definido porF : Ui → U∗i en dondeF(ui) = Afuzi .Regularmente el uso del fuzzificador tipo singlenton es el más utilizado para las aplica-
ciones en área del control automático y este es definido como un conjunto difuso Afuzi ∈ U∗icon función de membresía
µAfuzi(x) =
(1 si x = ui
0 en otro caso. (2.1)
Cualquier conjunto difuso con la forma (2.1) en su función de membresía es llamado “sin-
glenton1”, figura (2.2).
2.1.2. Mecanismo de inferencia difusa
El mecanismo de inferencia difusa es el núcleo de cualquier controlador difuso. Su com-
portamiento dinámico es en general caracterizado por un conjunto de reglas difusas de la1Note que la función discreta impulso puede ser utilizada para representar la función de membresía de
un singlenton.
-
10 Sistemas difusos
forma
Si x es A entonces y es B (2.2)
en donde A y B son valores lingüísticos definidos por un conjunto difuso en un universo
X y Y respectivamente. La cláusula Si, un antecedente, es una condición en el dominio de
aplicación; la cláusula entonces, una consecuencia, es una acción de control dado al proceso
bajo control.
Con un conjunto de reglas difusas, el mecanismo de inferencia difusa es capaz de derivar
una acción de control para un conjunto de valores de entrada. En otras palabras, una acción
de control es determinada por las entradas observadas, las cuales representan el estado del
proceso a ser controlado mediante el uso de las reglas de control.
La expresión “Si x es A entonces y es B”, la cual se abrevia regularmente como A→ B,en esencia, es una relación binaria R de las variables x y y en el espacio del producto X×Y .Existen diversos métodos de inferencia difusa que pueden ser formulados a través de los
operadores2 t-norma y s-norma para calcular la relación difusa R=A → B. En general, lossiguientes métodos son los más utilizados:
1. Implicación de Dienes-Rescher [28]: En esta implicación la regla difusa (2.2) es inter-
pretada como una relación RD en A×B con función de membresía
µRD(x, y) = máx[1− µA(x), µB(y)] (2.3)
2. Implicación Lukasiewics [28]: Específicamente, la regla difusa (2.2) es interpretada como
una relación difusa RL en A×B con función de membresía
µRL(x, y)=mı́n[1, 1− µA(x) + µB(y)] (2.4)
3. Implicación de Zadeht [28]: Aquí la regla difusa (2.2) es interpretada como una relación
difusa RZ en A×B con función de membresía
µRL(x, y)máx [mı́n(µA(x), µB(y)), 1− µA(x)] (2.5)2Vea [14] y [15] para más información acerca de estos operadores.
-
2.1 Estructura de los sistemas difusos 11
4. Implicación Mamdani [28]: La regla difusa (2.2) es interpretada como una relación RMen A×B con función de membresía
µRM (x, y) = mı́n [µA, µB] , ó µRM = µA(x) · µB(x) (2.6)
Aunque estas cuatro ecuaciones representan diferentes interpretaciones de la regla di-
fusa (2.2), la implicación de Mamdani, es la más utilizada para aplicaciones en los
sistemas difusos, ecuación (2.6).
En general el operador inferencia se aproxima por medio de una t-norma.
2.1.3. Defuzzicación
La defuzzificación es definida como un mapeo de un conjunto difuso B0 en V ⊂ R (quees la salida de la inferencia difusa) a un elemento de un conjunto clásico ycrispq = y
∗ ∈ V.Conceptualmente, la tarea de defuzzificar es especificar un punto, elemento de V, que reflejela mejor representación del conjunto difuso B0. A la fecha no existe un algoritmo óptimo para
la defuzzificación, sin embargo, algunos métodos de defuzzifiacación son prácticos. Como es
común, a continuación detallaremos dos de las técnicas más utilizadas para la defuzzificación.
El defuzzificador centro de gravedad (COG): especifica la salida y∗ como el
centro del área cubierta por la función de membresía del conjunto difuso B, y esta es
dada por
y∗ = ycrispq =
PRi=1 b
qi
YyqµB̂iq(yq)dyqPR
i=1
Yyq(yq)dyq
(2.7)
en donde R es el número de reglas difusas, bqi es el centro del área de la función de
membresía de BPq asociado con el conjunto difuso implicado B̂iq para la i − ésima
regla3 (j, k, ..., l; p, q)i, y Yyq
µB̂iq(yq)dyq (2.8)
3Por simplicidad usaremos (j, k, ..., l; p, q)i = Ri para denotar la i − ésima regla difusa de una base dereglas difusa tipo MISO.
-
12 Sistemas difusos
denota el área bajo µB̂iq(yq). Note que el sistema difuso debe ser definido tal que
RXi=1
Yyq
µB̂iq(yq)dyq 6= 0 (2.9)
para toda ui, o la salida ycrispq , no será definida apropiadamente. Este valor no debe
ser cero si existe una regla seleccionada para cada posible combinación de las entradas
del sistema difuso y si todo el conjunto difuso de la consecuencias tiene área distinta
de cero.
Defuzzificador centro promedio: El defuzzificador centro promedio determina la
salida clásica ycrispq usando los centros de cada salida de la funciones de membresía. El
valor óptimo o máximo de cada conclusión es representada mediante el conjunto difuso
implicado:
ycrispq =
PRi=1 b
qi supyq
nµB̂iq(yq)
oPR
i=1 supyq
nµB̂iq(yq)
o (2.10)donde el “sup” denota el supremo (supx {µ(x)} puede ser simplemente pensado comoal valor más alto de µ(x)) y bqi es el centro del área de la función de membresía de B
Pq
asociado con el conjunto de implicación difusa B̂iq para la i−ésima regla (j, k, ..., l; p, q)i.Note que el sistema difuso pude ser definido como
RXi=1
bqi supyq
nµB̂iq(yq)
o6= 0 (2.11)
para toda ui, en donde el supyqnµB̂iq(yq)
oes regularmente fácil de calcular si µB̂iq(yq) =
1 para al menos un yq, entonces para varias estrategias de inferencias podemos utilizar
los cálculos4 correspondientes para la i − ésima regla (j, k, ..., l; p, q)i por lo que elconjunto difuso de implicaciones B̂iq es definido en su función de membresía como
µB̂iq(yq) = µi(µ1, µ2, ..., µn) ∗ µBPq (yq) (2.12)
4Para ver los cálculos correspondientes al conjunto difuso B̂iq véase [23].
-
2.2 Tipos de Sistemas difusos 13
y obtener
supyq
nµB̂iq(yq)
o= µi(µ1, µ2, ..., µn) (2.13)
Por lo tanto, la ecuación para la defuzzificación centro promedio esta dada por
ycrispq =
PRi=1 b
qiµi(u1, u2, ..., un)PR
i=1 µi(u1, u2, ..., un)(2.14)
donde se debe asegurar quePR
i=1 µi(u1, u2, ..., un) 6= 0 para toda ui.
2.2. Tipos de Sistemas difusos
En estas sección se presentan los controladores difusos de tipo Mamdani y Sugeno, los
cuales han sido utilizados exitosamente en una gran variedad de aplicaciones en la comunidad
del control difuso. Aunque, el objetivo del controlador difuso Mamdani es el de representar
a un exitoso operador humano, el controlador difuso de tipo Sugeno sugiere ser más eficiente
en cálculos y en métodos de adaptación (learning).
2.2.1. Mamdani
En esta subsección definiremos la construcción de un sistema difuso tipo Mamdani.
Primero, considérese una base de reglas difusas del tipo MISO descritas por (2.15)
R1 : Si u1 es Aj1 y u2 es A
k2 y,..., y un es A
ln entonces y1 es B
r1
...
Rj : Si u1 es Aj1 y u2 es A
k2 y,..., y un es A
ln entonces yj es B
sj
...
Rm : Si u1 es Aj1 y u2 es A
k2 y,..., y un es A
ln entonces ym es B
tm
(2.15)
en donde Aji , Ak2,..., A
ln y B
sj para R
j, representan los valores lingüísticos correspondientes,
Passino [23].
-
14 Sistemas difusos
Si la entrada al sistema difuso es dado por
ui = x∗i (2.16)
entonces, haciendo uso del fuzzificador singlenton
µ =
(1 si xi = x∗i0 en otro caso
(2.17)
se tiene que ¡ui es A
ji
¢→ µAji (x
∗i ) (2.18)
en donde Aji denota el valor lingüístico correspondiente a la i− ésima entrada de la j− ésimaregla difusa Rj correspondiente a la base de reglas difusas descritas por (2.15). Al hacer uso
de la ecuación (2.16), la j − ésima regla difusa de la base de reglas (2.15) es representa por
Rj : Si x∗1 es Aj1 y x
∗2 es A
k2 y,..., y x
∗n es A
ln entonces yj es B
sj (2.19)
en donde la operación difusa de la j − ésima regla (2.19) es definida pornYi
µAji(x∗i ) (2.20)
El motor de inferencia difusa que utiliza esta base de reglas difusas es el mecanismo de
inferencia del producto o implicación de Mamdani, por lo que para la j − ésima regla setiene que:
nYi
µAji(x∗i )µB̃j (y) (2.21)
y la l−regla p se obtiene mediante el operador “OR”
µp =M
máxl=1
"nYi
µAji(x∗i )µB̃j=l (y)
#(2.22)
en donde el índiceM representa el número de reglas para (2.15) y B̃sj denota el valor lingüís-
tico correspondiente a la salida yj de la j − ésima regla difusa Rj, con j = l.
-
2.2 Tipos de Sistemas difusos 15
El método de defuzzificación puede ser obtenido suponiendo que yj es centro de B̃j, la
altura de la l − regla del conjunto difuso esnYi
µAji(x∗i )µBj
¡yj¢
(2.23)
y
µB̃j¡yj¢= 1 (2.24)
es un conjunto difuso normalizado, sustituyendo la ecuación (2.24) en la ecuación (2.23) se
obtiene que el centro promedio es dado por
y∗ =
mXj=1
yj
ÃnYi
µAji(x∗i )
!mXj=1
ÃnYi
µAji(x∗i )
!
Teorema 2.1 Sistemas difusos con base de reglas difusas, mecanismos de inferencia tipo
producto, fuzzificador singlenton y defuzzificador centro promedio poseen el siguiente mapeo
no lineal
ycrisp =
mXj=1
yj
ÃnYi
µAji(xi)
!mXj=1
ÃnYi
µAji(xi)
! (2.25)
2.2.2. Takagi-Sugeno
El modelo difuso de Takagi-Sugeno (también conocido como modelo TKS) fue propuesto
por Takagi, Sugeno y Kang [9], en un esfuerzo para formalizar un método sistemático para
generar reglas difusas a partir de un conjunto de datos de entradas y salidas. Una típica
regla difusa en el modelo de Sugeno tiene la forma
Si x es A y y es B entonces z = f(x, y) (2.26)
-
16 Sistemas difusos
donde A y B son conjuntos difusos en el antecedente, mientras z = f(x, y) es una función
clásica en la consecuencia. Usualmente f(x, y) es un polinomio en la variables de entrada x y
y, pero este puede ser cualquier función mientras pueda describir apropiadamente la salida del
modelo dentro de la región difusa especificada por la regla de antecedentes. Cuando f(x, y)
es un polinomio de primer orden, el sistema resultante de inferencia difusa es llamado modelo
difuso de Sugeno de primer orden. Cuando f es una constante, entonces tenemos un modelo
difuso de Sugeno de orden cero, el cual puede ser visto como un caso especial de la regla de
inferencia difusa de Mamdani, en la cual cada regla es especificada por un singletón (o una
consecuencia pre-defuzzificadora ), o un caso especial del modelo Tsukamoto. Sin embargo,
un modelo de Sugeno de orden cero es equivalente a una red de funciones básica radiales.
Un caso especial del modelo difuso lingüístico se obtiene cuando la consecuencia, el con-
junto difuso Bi, es formado por conjuntos difusos de singlentones. Estos sistemas se repre-
sentan simplemente como números reales bi, obteniéndose las siguientes reglas:
Ri : Si x es Ai entonces y = bi, i = 1, 2, ...,K. (2.27)
Este modelo se llama modelo singletón. Un método simplificado de inferencia-defuzzificación
se utiliza generalmente con este modelo:
y =
PKi=1 βibiPKi=1 βi
(2.28)
Este método de defuzzification se llama el medio difuso “fuzzy mean”. El modelo difuso del
singleton pertenece a una clase general de las funciones aproximadoras, llamadas la extensión
de las funciones básicas (Friedman, 1991) tomando la forma:
y =KXi=1
φ(x)bi (2.29)
La mayoría de las estructuras usadas en la identificación de sistemas no lineales, tales como
las redes neuronales artificiales, las redes neuronales de funciones básicas radiales [8], o tiras
(splines), pertenecen a esta clase de sistemas.
-
2.3 Conclusiones del capítulo 17
2.3. Conclusiones del capítulo
En este capítulo, se discutió en gran detalle la estructura de los sistemas difuso y dos
de los mecanismos de inferencia difusa más utilizados en la comunidad del control difuso: el
modelo difuso Sugeno y el modelo difuso Mamdani.
De acuerdo a la primera sección, es fácil observar que el sistema de inferencia difusa es
una de las herramientas de modelado más importantes del control difuso debido a que su
estructura se basa estrictamente en la teoría de la lógica difusa.
Por otra parte, los sistemas de inferencia difusa definidos aquí, basados en alguno de
los métodos propuestos, dan la posibilidad de representar conceptualmente el mejor mapeo
no lineal de salida de un sistema difuso con el objetivo de simular el conocimiento de un
operador humano experto a un bajo costo y eficientemente sin la necesidad de reemplazar al
operador debido a largas jornadas de trabajo.
En el siguiente capítulo, el modelo de inferencia Mamdani será usa elaborar la construc-
ción de un método tipo-backpropagation en la identificación de sistemas.
-
18 Sistemas difusos
-
Capítulo 3
Sistemas difusos jerárquicos vía
aprendizaje para identificación de
sistemas
En los sistemas difusos convencionales o de tipo estándar, el número de reglas aumenta de
forma exponencial con el crecimiento en el número de variables de entrada, esto es, suponga
que existen n variables de entrada y m funciones de membresía para cada variable, entonces
necesitaremos mn reglas para construir un controlador difuso completo y tan rápido como
n aumente su tamaño, la base de reglas difusas sobrecargará rápidamente la memoria de
cualquier sistema de computo y por supuesto, hará difícil la implementación del controlador
difuso. En general, la complejidad de un problema aumenta de forma exponencial debido al
número de las variables implicadas, este fenómeno llamado la “maldición de la dimensional-
idad”, no es único de los sistemas difusos y es la idea original que motivó el estudio de los
sistemas difusos jerárquicos (HFSs), Brown [3] y Zhou [37].
-
20 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
(c)
Figura 3.1: (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-
sentación para el sistema lógico difuso convencional de una sola capa.
3.1. El sistema difuso jerárquico
Los sistemas difusos jerárquicos consisten de un número de sistemas difusos de baja
dimensión distribuidos de forma jerárquica, los cuales, poseen la gran ventaja de que el
número total de reglas de su base de conocimiento aumentan de forma lineal con el número
de las variables de entrada implicadas, Zhou [37]. Esta arquitectura se representa en la figura
3.1(a) y (b) con 4 (n = 4) variables de entradas y 5 (m = 5) funciones de membresía, se
obtiene que cada sistema difuso de baja dimensión consiste de 52 (m2) reglas y por tanto el
número total de reglas es 3× 52 = 75[(n− 1)m2], la cual representa una función lineal de lasn variables de entrada. En contraste con esto, podemos verificar que el número de reglas del
sistemas difuso convencional, figura 3.1(c), es de 54 = 625 reglas y por tanto, concluir que el
número total de reglas difusas se reduce considerablemente bajo el esquema de los sistemas
difusos jerárquicos.
Comentario 3.1 Los sistemas difusos jerárquicos consisten de un número de sistemas di-
-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 21
fusos de baja dimensión conectados en un arreglo jerárquico, por tanto no existe restricción
alguna para aplicar el orden en las jerarquías, figura 3.1(a) y (b).
Para eliminar el problema concerniente al fenómeno de la “maldición de la dimension-
alidad” y consecuentemente los problemas de implementación, el presente trabajo propone
un nuevo enfoque para la determinación de las reglas correspondientes a cada unidad lógica
difusa (FLU1) de un sistema jerárquico difuso dado vía aprendizaje difuso jerárquico.
3.2. Identificación de sistemas vía aprendizaje difuso
jerárquico
En los últimos años, las redes neuronales y la lógica difusa han sido clasificadas como
aproximadores universales debido a que éstas pueden aproximar ciertas funciones no lin-
eales a cualquier exactitud prescrita. Resultados recientes muestran que el procedimiento de
fusión en este tipo de tecnologías parecen ser muy efectivos para la identificación de sistemas
no lineales, Brown (1994) [2], Chen (2001) [4] y Lin (1996) [16]. Aunque los métodos co-
mo el gradiente descendiente y el backpropagation generalmente son usados para ajustar los
parámetros de las funciones de membresía y los pesos de defuzzificación para redes neuronales
difusas, la convergencia lenta de aprendizaje y los mínimos locales son principalmente los
inconvenientes que presentan estos algoritmos, Lin (1995) [17]. Debido a esto, algunas mod-
ificaciones fueron derivadas en publicaciones recientes: En el 2001 Chen [5], sugiere una ley
de robustez en el algoritmo backpropagation para resistir los efectos del ruido y el no aceptar
errores derivados durante la aproximación. Por su parte, Brown (1994) [2], propone el uso de
funciones de membresía B-spline para minimizar una función objeto robusta demostrando
velocidad de convergencia en sus algoritmos y por último Wu (2000) [33] aplica redes neu-
ronales del tipo RBF para determinar la estructura y los parámetros de un sistema neuronal
difuso.
1Fuzzy Logic Unit
-
22 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
Analizando la bibliografía anterior se observa que existen diversos métodos correspondi-
entes para la identificación de sistemas, los cuales pueden ser aplicados efectivamente para
resolver el problema de la identificación, sin embargo, desde el punto de vista del diseño
Wang (1999) en [29], señala que es muy dificil aplicar técnicas de aprendizaje a los sistemas
difusos jerárquicos si se usa el algoritmo backpropagation, por otra parte, Yu (2004) en [31],
demuestra que el uso de algoritmos de entrenamiento resultan ser extremadamente complejos
aún para el caso de una red neuronal difusa de una capa y consecuentemente para el uso de
sistemas difusos jerárquicos. Aunque usando técnicas como el backpropagation y el algoritmo
del gradiente descendiente podemos simplificar el entrenamiento para redes neuronales mul-
ticapas, ¿Será posible entrenar sistemas difusos jerárquicos por medio de técnicas similares?.
Hasta ahora, lo mejor de nuestro conocimiento para el entrenamiento de los sistemas difusos
jerárquicos es el usado algoritmo convencional del gradiente descendiente.
Debido al problema2 que enfrenta el diseño de los sistemas difusos convencionales con una
precisión establecida, el propósito fundamental de este capitulo, es el de introducir un método
tipo backpropagation para la identificación de sistema vía sistemas difusos jerárquicos. En
ciertos casos, el diseño de un sistema difuso también es limitado cuando no podemos decidir la
función de membresía de prioridad, por lo que generalmente, se recomienda el uso del dato
de entrada-salida para entrenar los parámetros de la función de membresía, por ejemplo
ANFIS [10] y el aprendizaje por el método del gradiente [28], sin embargo para evitar esta
limitación, en el presente trabajo se asume que ambas funciones de membresía, premisa y
consecuencia, son desconocidas.
El nuevo algoritmo que se presenta a continuación es tan sencillo que podemos entrenar
exactamente los parámetros de cada sub-bloque independientemente con diferentes veloci-
dades en el aprendizaje. Adicionalmente, un par de ejemplos se incluyen para ilustrar la
efectividad del algoritmo sugerido.
2Problema causado por la “maldición de la dimensionalidad”.
-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 23
3.2.1. Error backpropagation
Generalmente un modelo convencional difuso con una salida es representado como una
colección de reglas difusas en el siguiente formato (por ejemplo, el modelo difuso de Mamdani
[28])
Ri: Si x1 is Ai1 y · · · y xn is Ain entonces by is Bi (3.1)en donde l (i = 1, 2, . . . , l) representa las reglas difusas del tipo si-entonces para desarrollar
un mapeo del vector lingüístico de entrada X = [x1, · · · , xn] ∈ 1) es un sistema difuso con np variables de entrada y una solasalida, por lo tanto, la base de reglas definidas para el sistema difuso de este nivel es
construido a través de
Ri : xp,1 es Aip,1 y . . . y xp,np1 es Aip,np1
y ŷp−1,1 es Dip−1,1 y . . . y ŷp−1,np2 es Dip−1,np2 =⇒ ŷp es B
ip
en donde i = 1, . . . , lp, byp−1,j es la j− ésima salida en el nivel p−1, xp,j es la j− ésimaentrada en el nivel p, np1 + np2 = np, np1 ≥ 0 y np2 ≥ 0. Si np1 6= 0 el sistema
-
24 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
Figura 3.2: Sistema difuso jerárquico
jerárquico es llamado de arquitectura incremental y cuando np = np2, este es llamado
de arquitectura agregada, Chung [6].
Por último, la construcción continua hasta p = o.
De acuerdo al diseño convencional de los sistemas difuso, existen varias estrategias para
representar la salida de estos, el presente trabajo considera el uso del mecanismo de inferencia
tipo producto, el uso del fuzzificador singlenton y del defuzzificador centro promedio por lo
que el mapeo no lineal
by =lP
i=1
wi
"nQ
j=1
µAij (xj)
#lP
i=1
"nQ
j=1
µAij (xj)
#
representa la salida ŷ del sistema difuso definido a partir de la base de reglas difusas definidas
por (3.1), en donde µAij representa las funciones de membresía de los conjuntos difusos Aij y
wi es la moda de µBi1, es decir, µBi1 = 1.
Adicionalmente, para el sistema difuso jerárquico de la figura 3.2, se tiene que la salida
-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 25
definida para el primer nivel (p = 1) es descrita por
by1 =l1Pi=1
wi1
"n1Qj=1
µAij (xj)
#l1Pi=1
"n1Qj=1
µAij (xj)
# (3.2)en donde µAij representa las funciones de membresía de los conjuntos difusos A
ij y wi es la
moda de µBi1 , es decir, µBi1 = 1
Similarmente, el p− ésimo nivel (p > 1) es dado por
ŷp =
lpXi=1
wip
"np1Yi=1
µAip,j(xp,j)
np2Yi=1
µDip,j(ŷp−1,j)
#lpXi=1
"np1Yi=1
µAip,j(xp,j)
np2Yi=1
µDip,j(ŷp−1,j)
# (3.3)en donde µAip,j y µDip,j son las funciones de membresía de los conjuntos difusos A
ip,j y D
ip,j
respectivamente y wip es la media de µBip , i.e., µBip = 1.
A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la
técnica sugerida “tipo-backpropagation” en los sistemas difusos jerárquicos.
Considere los tres bloques difusos Fs1, Fs2 y Fs3 que conforman el sistema difuso
jerárquico definido en la figura (3.3). Observe que para cada subsistema, existen l reglas
difusas, n entradas y 1 salida. Al hacer uso del fuzzificador singlenton, de la implicación
de Mamdani y del defuzzificador centro promedio, la salida de cada sistema difuso puede
ser expresada como (3.2), en donde µAij = exp∙−³xj−cijσij
´2¸es la función de membresía del
conjunto difuso Aij, w̄i es el punto en el cual µBi = 1 y ŷ es la salida de cada sistema difuso.
Ahora bien, defínase
zi(x) :=nY
j=1
exp
"−µxj − cijσij
¶2#y ŷ =
a
bcon
a :=lX
i=1
wizi, b :=lX
i=1
zi
-
26 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
Fs3
Fs1
Fs2
Planta
Figura 3.3: Un sistema difuso jerárquico para identificación.
El objetivo de la de identificación es el de determinar los parámetros wi, cij y σij tal que la
salida ŷ del sistema difuso jerárquico converja a la salida de la planta y.
Al usar la técnica del gradiente descendiente para determinar los parámetros wi, cij y σij,
el gradiente es determinado a través del uso de la regla de la cadena, por lo que se tiene que
∂J
∂wi=
∂J
∂ŷ
∂ŷ
∂wi= (ŷ − y)
∂¡ab
¢∂wi
=(ŷ − y)
bzi
y wi es actualizado por
wi(k + 1) = wi(k) +∆wi
= wi(k)− η ∂J∂wi
= wi(k)− ηzi
b(ŷ − y) (3.4)
Para determinar los incrementos en cij y ∆cij, como
∂ex
∂x= ex, entonces
∂J
∂cij=
∂J
∂ŷ
∂ŷ
∂zi∂zi
∂cij= (ŷ − y)
∙wi
b− a
b2
¸zi
"2
¡xj − cij
¢¡σij¢2
#por lo que el vector cij es actualizado por
cij(k + 1) = cij(k)− 2η(ŷ − y)zi
(wi − ŷ)¡xj − cij
¢b¡σij¢2 .
-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 27
Similarmente, como
∂J
∂σij=
∂J
∂ŷ
∂ŷ
∂zi∂zi
∂σij= (ŷ − y)
∂¡ab
¢∂zi
nYj=1
exp
"−µxj − cijσij
¶2#"2
¡xj − cij
¢2¡σij¢3
#
, σij es actualizado por
σij(k + 1) = σij(k)− 2η(ŷ − y)zi
(wi − ŷ)¡xj − cij
¢2b¡σij¢3 .
Si definimos el error de identificación como e = ŷ(k)− y(k). El método del gradiente descen-diente puede escribirse en en términos del error
wi(k + 1) = wi(k)− ηzi
be (3.5)
cij(k + 1) = cij(k)− 2ηzi(k)
(wi(k)− ŷ(k))¡xj(k)− cij(k)
¢b(k)
¡σij(k)
¢2 eσij(k + 1) = σ
ij(k)− 2ηzi(k)
(wi(k)− ŷ(k))¡xj(k)− cij(k)
¢2b(k)
¡σij(k)
¢3 e.Las entradas y las salidas de cada subsistema están definidas como se muestra en la figura
(3.3), por lo que el índice de desempeño es modificado de tal forma que J = 12(ŷ3 − y)2.
Para el módulo Fs3, el algoritmo de aprendizaje es el mismo descrito por la ecuación (3.5),
solamente que debemos agregar los subíndices correspondientes en cada una de las variable,
por ejemplo, wi(k+1)→ wi3(k+1), cij(k+1)→ ci3(k+1), σij(k+1)→ σi3(k+1), x3,1 = ŷ1(k),x3,2(k) = ŷ2(k), e = ŷ3(k)− y(k) = e3 y
ŷ3 =
l3Xi=1
wi3
"n3Yi=1
µAi3,j(x3,j)
#l3Xi=1
"n3Yi=1
µAi3,j(x3,j)
# . (3.6)Para el subsistema Fs2, si deseamos actualizar wi2, debemos calcular
∂J
∂wi2=
∂J
∂ŷ3
∂ŷ3∂ŷ2
∂ŷ2∂wi2
-
28 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
de la figura (3.3), sabemos que ∂ŷ3∂ŷ2
corresponde a x3,2(k), por lo que
∂J
∂ŷ3= ŷ3 − y.
∂ŷ3∂ŷ2
=∂ŷ3∂zi3
∂zi3∂ŷ2
=
∙a3b23− w
i3
b3
¸zi3
"2ŷ2 − ci3,2¡σi3,2
¢2#, (3.7)
ya que a3b23− ȳi
b3=
ŷ3−ȳi3b3, y
∂J
∂wi2=
zi2b22ŷ3 − wi3
b3zi3ŷ2 − ci3,2¡σi3,2
¢2 e3(k)por lo que ȳj2 es actualizado por
wi2(k + 1) = wi2(k)− η
zi2b22ŷ3 − wi3
b3zi3ŷ2 − ci3,2¡σi3,2
¢2 e3(k). (3.8)Comparando la ecuación (3.8) con (3.4), definimos
e2 = 2y3 − wi3
b3zi3ŷ2 − ci3,2¡σi3,2
¢2 e3(k)Usando la ecuación (3.7) e2 puede escribirse como
∂ŷ3∂ŷ2
e3(k). Similarmente e1 =∂ŷ3∂ŷ1
e3(k),
donde∂ŷ3∂ŷ1
= 2y3 − wi3
b3zi3ŷ2 − ci3,1¡σi3,1
¢2 .Así con e1(k) y e2(k) podemos entrenar el subsistema Fs1 y Fs2 independientemente por el
algoritmo normal, Jang [10].
3.2.2. Algoritmo para identificación de sistemas no lineales
Nuestro propósito en esta subsección es el de presentar un algoritmo para el caso general
de la identificación de sistemas mostrado en la figura 3.4, por lo que el procedimiento de
entrenamiento es el siguiente:
-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 29
qp
Figura 3.4: Entrenamiento en el caso general para la identificación de sistemas.
Algoritmo 3.1 Algoritmo para la identificación de sistemas
Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de
cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico
deben ser entradas del siguiente nivel.
Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error
de identificación es
eo(k) = ŷo(k)− y(k)
donde eo(k) es el error de identificación, ŷo(k) es la salida del sistema difuso jerárquico
completa y y(k) es la salida de la planta. Entonces propagando el error hacia atrás se forma
la estructura del sistema difuso jerárquico. De acuerdo con la figura (3.4), podemos calcular
el error para el bloque p (definido como ep) formado a través del bloque q (definido como eq).
Recordando la discusión anterior de la regla de la cadena se tiene
ep = 2yq − wiq
bqziqŷp − ciq,p¡σiq,p
¢2 eq. (3.9)Paso 3: Actualice los parámetros de la función gausiana ( funciones de membresía:
premisa y consecuencia) para cada bloque independientemente, por lo que el algoritmo tipo
backpropagation para p− ésimo bloque es
wip(k + 1) = wip(k)− η
zipbpep,
-
30 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
Controladordifuso Planta
HFS Σ
Bloque de control
Bloque de identificación
Figura 3.5: Diagrama a bloques que representa el aprendizaje de tipo Off-Line.
cip,j(k + 1) = cjp,i(k)− 2ηzip(k)
¡wip(k)− ŷp(k)
¢ ¡xp,j(k)− cip,j(k)
¢bp(k)
¡σip.j(k)
¢2 ep,σip,j(k + 1) = σ
ip,j(k)− 2ηzip(k)
¡wip(k)− ŷp(k)
¢ ¡xp,j(k)− cip,j(k)
¢2bp(k)
¡σip,j(k)
¢3 ep,en donde zip =
npYj=1
exp
∙−³xp.j−cip,j
σip,j
´2¸y bp =
lpYj=1
zip.
Como se ha señalado, varias aplicaciones en el área del control automático y en el área
de la identificación de sistemas han sido desarrolladas. En efecto, el uso de sistemas difusos
jerárquicos para la identificación de sistemas es en general un método universal, el cual,
también pude ser aplicado para el aprendizaje de controladores difusos o de tipo convencional.
3.3. Aprendizaje de un controlador en sistemas difusos
Basados en los resultados de la sección anterior, es fácil observar que se pueden determinar
de manera similar al problema de identificación los parámetros wi, cij y σij tal que la salida
û del sistema difuso jerárquico converja a la salida de un controlador convencional u, figura
3.5. Por tanto, el propósito general de esta sección, es el de presentar el siguiente algoritmo
para el aprendizaje de tipo off-line.
-
3.3 Aprendizaje de un controlador en sistemas difusos 31
qp
Figura 3.6: Entrenamiento para sistemas de control usando sistemas difusos jerárquicos.
Algoritmo 3.2 Aprendizaje de un controlador vía sistemas difusos jerárquicos
Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de
cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico
deben ser entradas del siguiente nivel.
Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error
de control es
eo(k) = ûo(k)− u(k)
donde eo(k) es el error de control, ûo es la salida del controlador difuso jerárquico completo
y u(k) es la salida del controlador convencional. Entonces propagando el error hacia atrás
se forma la estructura del sistema difuso jerárquico. De acuerdo con la figura 3.6, podemos
calcular el error para el bloque p (definido como ep) formado a través del bloque q (definido
como eq). Recordando la discusión anterior de la regla de la cadena se tiene
ep = 2uq − wiq
bqziqûp − ciq,p¡σiq,p
¢2 eq. (3.10)Paso 3: Entrene la función gausiana ( función de membresía en la parte de la premisa
y consecuencia) para cada bloque independientemente, para el p− ésimo bloque, el algoritmotipo backpropagation es el siguiente
wip(k + 1) = wip(k)− η
zipbpep,
-
32 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
cip,j(k + 1) = cjp,i(k)− 2ηzip(k)
¡wip(k)− ûp(k)
¢ ¡xp,j(k)− cip,j(k)
¢bp(k)
¡σip.j(k)
¢2 ep,σip,j(k + 1) = σ
ip,j(k)− 2ηzip(k)
¡wip(k)− ûp(k)
¢ ¡xp,j(k)− cip,j(k)
¢2bp(k)
¡σip,j(k)
¢3 ep,en donde zip =
npYj=1
exp
∙−³xp.j−cip,j
σip,j
´2¸y bp =
lpYj=1
zip.
Para validar el desempeño de los sistemas difusos jerárquicos en la identificación de
sistemas y la efectividad del método propuesto, a continuación se presenta la simulación
numérica con los siguientes ejemplos propuestos por Chung [6].
3.4. Simulaciones
El primer sistema, un ejemplo de cinco dimensiones, es usado para validar la importancia
del método difuso jerárquico y el método de análisis correspondiente a la subsección anterior.
Por otra parte, el segundo ejemplo, la predicción de una serie de tiempo tipo Mackey-Glass,
es empleado para ilustrar el buen comportamiento en el aprendizaje y demostrar la excelente
habilidad en la generalización del método tipo backpropagation.
3.4.1. Ejemplo de cinco dimensiones
La planta no lineal a identificar fue originalmente usada por Friedman para evaluar el
algoritmo de modelado MARS [7], definida por
y = 10 sin(πx1x2) + 20(x3 − 0,5)2 + 10x4 + 5x5. (3.11)
en donde el vector de entrada es
x(k) = [x1, x2, x3, x4, x5].
-
3.4 Simulaciones 33
Fs3
Fs1
Fs2
Planta
Figura 3.7: Estructura jerárquica difusa para identificar el sistema no lineal definido por (
3.11).
Para la identificación del sistema no lineal definido por (3.11), se utilizó el modelo de la
estructura jerárquica difusa definido en la figura 3.7. La identificación se realizó por com-
putadora con la ayuda de Matlab usando dos reglas difusas para cada bloque difuso jerárquico
l1 = l2 = l3 = 2 y definiendo el número total de entradas para cada bloque como n1 = 3,
n2 = 2 y n3 = 2. Observe que el número de entradas y de reglas difusas definidas en cada
bloque difuso pueden ser definidas arbitrariamente por ejemplo l1 = l2 = l3 = 3 y n1 = 2,
n2 = 2 y n3 = 3 , sin embargo, para mostrar la efectividad del algoritmo en la reducción de
las reglas difusas se utiliza el formato propuesto. La simulación utiliza 200 datos de entre-
namiento para el ejemplo, en donde la señal de entrada para el entrenamiento es aleatoria
en el rango de [0, 1].
Las figuras 3.8, 3.9, 3.10 y 3.11 muestran los resultados de la simulación numérica para
el sistema descrito por la ecuación (3.11) a través del uso de sistemas difusos jerárquicos y
el método convencional de identificación propuesto por Brown [2], Jang [10] y Lin [16]. En
las figuras 3.8 y 3.9, se presentan la salida de la planta y el modelo identificado a través del
uso de los sitemas jerárquicos difusos. Como se puede observar en la figura 3.9, este modelo
identificado representa una mejor aproximación de la planta no lineal con respecto a los
resultados mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.
-
34 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
0 20 40 60 80 100 120 140 160 180 2000
5
10
15
20
25
30Sistema difuso jerárquico
Tiempo
Salida de la plantaModelo identificado
Figura 3.8: Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas.
5 10 15 20 25 30 35 40 45 50 55
5
10
15
20
25
Sistema difuso jerárquico
Tiempo
Salida de la plantaModelo identificado
Figura 3.9: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0
-
3.4 Simulaciones 35
0 20 40 60 80 100 120 140 160 180 200-5
0
5
10
15
20
25
30
Tiempo
Sistema difuso convencional
Salida de la plantaModelo identificado
Figura 3.10: Identificación para un sistema difuso convencional con 12 reglas difusas.
5 10 15 20 25 30 35 40 45 50 55-5
0
5
10
15
20
25
Tiempo
Sistema difuso convencional
Salida de la plantaModelo identificado
Figura 3.11: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0
-
36 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
0 20 40 60 80 100 120 140 160 180 2000
10
20
30
40
50
60
Tiempo
Err
or
cuad
rátic
o m
edio
Error cuadrático medio para el ejemplo de cinco dimensiones
Sistema difuso jerárquicoSistema difuso convencional
Figura 3.12: Comparación del desempeño entre los métodos convencional y jerárquico para
el ejemplo de cinco dimensiones.
Comparando el desempeño del algoritmo tipo-backprpagation propuesto (mse:0.5070) con-
tra el método convencional de la lógica difusa (mse: 4.4919), figura 3.12, es posible observar
que podemos modelar sistemas no lineales con un número menor de reglas difusas y conse-
cuentemente, con una mayor velocidad de convergencia en el algoritmo propuesto.
3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass
Sea {x(t), t = 1, 2, 3, . . . , } una serie de tiempo, el problema de predicción en una serie detiempo puede ser formulada como la determinación del mapeo de
[x(t− (m− 1)∆t), . . . , x(t−∆t), x(t)] ∈ Rm → x(t+ ls) ∈ R.
Para verificar el mapeo, la generalización y la habilidad de aprendizaje, una estructura
jerárquica difusa es propuesta para predecir la serie de tiempo caótica de Mackey-Glass,
figura 3.13 [20].
-
3.4 Simulaciones 37
Fs3
Fs1
Fs2
Planta
Figura 3.13: Estructura jerárquica difusa para identificar la serie de tiempo Mackey-Glass.
La serie de Mackey-Glass es generada por la ecuación diferencial:
ẋ(t) =0,2x(t− τ)1 + x10(t− τ) .
De acuerdo con ejemplo propuesto por Chung [6], en nuestra simulación se establece que
τ = 30, m = 6, ∆t = 6, ls = 6 y un total de 1200 datos se recolectaron con el siguiente
formato
[x(t− 30), x(t− 24), x(t− 18), x(t− 12), x(t− 6), x(t);x(t+ 6)] (3.12)
en donde t = 130 − 1329. La ecuación (3.12), corresponde al problema de un mapeo de 6entradas- 1 salida.
Las figuras 3.14, 3.15, 3.16 y 3.17 muestran los resultados de la simulación para el sistema
descrito por la ecuación (3.12) correspondiente al problema de un mapeo de 6 entradas-1
salida.a través del uso de los sistemas difusos jerárquicos y el método convencional de iden-
tificación propuesto por Brown [2], Jang [10] y Lin [16]. Las figuras 3.14 y 3.15, presentan
la señal de salida para la planta y el modelo identificado a través del uso de los sistemas
jerárquicos difusos. Como se puede observar en la figura 3.15, este modelo identificado repre-
senta una mejor aproximación del mapeo de 6 entradas-1 salida con respecto a los resultados
mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.
-
38 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
0 200 400 600 800 1000 12000
0.2
0.4
0.6
0.8
1
1.2
1.4
Tiempo
Sistema difuso jerárquico
Salida de la plantaModelo identificado
Figura 3.14: Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas.
450 460 470 480 490 500 510 520 530 540 550
0.8
0.9
1
1.1
1.2
1.3
Tiempo
Sistema difuso jerárquico
Salida de la plantaModelo identificado
Figura 3.15: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción
en una serie de tiempo tipo Mackey-Glass cuando 0
-
3.4 Simulaciones 39
200 400 600 800 1000 12000
0.5
1
1.5Sistema difuso convencional
Tiempo
Salida de la plantaModelo identificado
Figura 3.16: Identificación para un sistema difuso convencional con 12 reglas difusas.
580 590 600 610 620 630 640 650 660 670 680
0.8
0.85
0.9
0.95
1
1.05
1.1
1.15
1.2
1.25
1.3
Sistema difuso convencional
Tiempo
Salida de la plantaModelo identificado
Figura 3.17: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción
en una serie de tiempo tipo Mackey-Glass cuando 0
-
40 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
0 200 400 600 800 1000 12000
0.005
0.01
0.015
0.02
0.025
Tiempo
Err
or
med
io c
uad
rátic
o
Error medio cuadrático para la predicción de una serie de tiempo tipo Mackey-Glass
Sistema difuso jerárquicoSistema difuso convencional
Figura 3.18: Comparación del desempeño entre los métodos convencional y jerárquico para
la predicción de una serie de tiempo tipo Mackey-Glass .
Comparando nuevamente el desempeño del algoritmo tipo-backprpagation propuesto (6
reglas difusas, mse: 0.0019) con el método convencional difusa (12 reglas difusas, mse: 0.0043),
figura 3.18, es fácil observar que el modelar sistemas no lineales (serie de Mackey-Glass) me-
diante el nuevo enfoque jerárquico, evita que la base de reglas difusas sobrecargé rápidamente
la memoria de cualquier sistema de computo.
Una vez que se ha verificado la correspondencia entre el mapeo, la generalización y la
habilidad de aprendizaje entre los sistemas difusos convencionales y los sistemas difusos
jerárquicos, se está en condiciones de confirmar que el enfoque difuso jerárquico permite
modelar sistemas con una gran reducción significativa en el número de reglas difusas y por
supuesto con mayor velocidad de convergencia y cálculos en computo con respecto a los
ofrecidos por los métodos convencionales.
-
3.5 Conclusiones del capítulo 41
3.5. Conclusiones del capítulo
Es fácil observar que existen diversos métodos para la identificación de sistemas, los
cuales pueden ser aplicados efectivamente para resolver el problema de la identificación, sin
embargo, desde el punto de vista del diseño difuso, una de las preocupaciones importantes
en los sistemas de la lógica difusa, es el cómo reducir el número total de reglas implicadas y
el de sus correspondientes requerimientos en cómputo.
Aunque los métodos como el gradiente descendiente y el backpropagation generalmente
son usados para la identificación de los sistemas, la convergencia lenta de aprendizaje y
los mínimos locales son principalmente los inconvenientes que presentan estos algoritmos.
Debido a esto, los resultados presentados en este capítulo muestran que usando la técnica
tipo-backpropagation y el algoritmo del gradiente descendiente podemos simplificar el entre-
namiento para los sistemas difusos jerárquicos, además de reducir el número total de reglas
implicadas y el de sus correspondientes requerimientos en cómputo. Adicionalmente, el par de
ejemplos incluidos en este capítulo sirven para ilustrar la efectividad del algoritmo sugerido.
En el siguiente capítulo, la idea general de los sistemas difusos jerárquicos descrita en
este capítulo será usada para diseñar un sistema de control difuso jerárquico.
-
42 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
-
Capítulo 4
Sistemas difusos jerárquicos vía
mapeo de variables para control difuso
La tendencia actual para el desarrollo en sistemas de control es principalmente en los
sistemas no lineales. Sin embargo, si es posible aproximarlos mediante modelos lineales,
podemos aprovechar uno o más métodos de diseño bien desarrollados, Ogata [21]. En un
sentido práctico, las especificaciones de desempeño para un sistema particular sugieren que
método usar. En el caso de los sistema de control difuso, una de las preocupaciones impor-
tantes es el cómo evitar el fenómeno relacionado a la “maldición de la dimensionalidad”,
Waratt [32]. Para eliminar el problema concerniente a este fenómeno y consecuentemente los
problemas de implementación, el presente trabajo propone un enfoque nuevo para la deter-
minación de las reglas correspondientes a cada unidad lógica difusa (FLU1) de un sistema
jerárquico difuso debido a la construcción de este a partir del controlador difuso convencional,
figura 4.1.
El uso de este enfoque establece que las salidas de la capa previa y las entradas de las
capas siguientes sean definidas como variables de mapeo intermedio. Mientras tanto, las
salidas de la primera capa de unidades lógicas difusas (FLUs) y las entradas de las otras
FLUs sean simplemente definidas a través del mapeo de las variables intermedias.
1Unidad lógica difusa definida previamente en el capitulo 3
-
44 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
Controladordifuso Planta
Controladordifuso
M1
M2
M3
Controlador difuso jerárquico
Figura 4.1: Arquitectura de un controlador difuso a) Sistema de control b) Control difuso
convencional y c) Control difuso jerárquico.
Por lo tanto, el objetivo principal de este capítulo es el de presentar una solución en
esquemas jerárquicos para la reconstrucción del controlador vía mapeo de variables con el
fin de evitar la maldición de la dimensionalidad y consecuentemente disminuir las dificultades
de diseño e implementación de los sistemas difusos.
4.1. El sistema de estructura jerárquica
Uno de los propósitos fundamentales de utilizar sistemas difusos jerárquicos (HFS), es el
de minimizar el tamaño de una base de reglas difusas mediante la eliminación de la “maldición
de la dimensionalidad”, sin embargo, a pesar de la eficiente reducción de reglas, el sistema
difuso jerárquico se torna más complejo para su diseño e implementación en los diseños de
control. Más específicamente, esta limitación se debe a que la mayoría de las unidades de la
lógica difusa (FLUs) que constituyen un (HFS), se usan como variables de entrada de las
siguiente capa jerárquica, líneas punteadas en la figura 4.2.
Debido a esto, las reglas implicadas en las capas medias de la estructura jerárquica care-
-
4.1 El sistema de estructura jerárquica 45
Figura 4.2: Sistema difuso jerárquico.
C.V ( Variables de consecuencia )
A.V ( Variables del antecedente escogidasde las variables de entrada de la primera capa )
Figura 4.3: Sistema de lógica difusa de estructura jerárquica.
cen de significado físico y llegan a ser tan prominentes como el gran crecimiento desmesurado
de capas en un (HFS), Brown [3] y Wang [29]. Para tratar este problema y el de su imple-
mentación, Joo (1999) [12] define que el diseño de los sistema difuso jerárquicos se debe
relacionar como un sistema de lógica difusa de estructura jerárquica (S-HFS2) tal y como se
muestra en la figura 4.3.
En la primera capa del S-HFS, todas las variables de entrada pueden ser usadas como
variables lingüísticas de antecedentes, siempre y cuando las variables del sistema sean uti-
2Structure-hierarchical fuzzy system
-
46 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
lizadas normalmente como variables de entrada en esta capa. En la segunda capa, las salidas
de la primer capa no deben ser utilizadas como variables lingüísticas de antecedentes ya que
estas tienen poco significado físico. En vez de esto, éstas son usadas en las partes entonces
de las reglas difusas de esta capa, conclusiones. Las variables lingüísticas de antecedentes de
la capa siguiente, por ejemplo, pueden ser seleccionadas de los representantes elegidos de las
variables de entrada de la capa anterior. Consecuentemente, sólo las variables con significado
físico se utilizan en los antecedentes de las reglas difusas y las reglas difusas que resultan
llegan a ser fáciles de diseñar. Finalmente, el uso de este esquema facilita el diseño de las
reglas difusas implicadas en las capas medias de la estructura jerárquica sin la necesidad de
reajustar o rediseñar las reglas correspondientes a cada unidad lógica difusa (FLU).
4.2. El sistema difuso limpio-jerárquico L-HFS
Como se mencionó al inicio de este capítulo, el eliminar el excedente de reglas difusas
en los sistemas difusos convencionales, consiste en la reconstrucción del controlador difuso
convencional en un controlador difuso jerárquico. En esta sección, el nuevo método basado en
el mapeo de variables se designa como un sistema difuso limpio-jerárquico, el cual, es exhibido
a fin de obtener las bases de reglas difusas correspondientes al sistema difuso jerárquico.
A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la
técnica sugerida L-HFS y después, en la siguiente sección, aplicaremos la técnica a un sistema
en particular3 a fin de obtener un sistema difuso jerárquico para el sistema.
Considere el sistema descrito en la figura 4.4 y la base de reglas difusas descrita en la
figura 4.5. De acuerdo con el sistema y la base de reglas difusas, se puede observar que
las tres variables de entrada son θ, θ̇ y x. Por otra parte, F1 y F2, se definen como las
unidades de lógica difusa (FLUs) de la primera y segunda capa respectivamente. Las salidas
lingüísticas difusas definidas en la figura 4.5, se obtienen mediante el acceso aleatorio4, las
cuales son usadas para generar una base en el mapeo de la base de reglas difusas. Como
3Sistema riel-esfera4Método usado por Lee en [19].
-
4.2 El sistema difuso limpio-jerárquico L-HFS 47
F1
F2
Figura 4.4: Diagrama a bloques de un sistema difuso jerárquico (HFS).
ejemplo, definamos cada variable de entrada con tres términos lingüísticos : N es negativo,
C es cero y P es positivo. De esta manera, podemos obtener 27 (3×3×3=27) reglas difusas.La reglas difusas de la figura 4.5 son las siguientes:
si θ es P , y θ̇ es P y x es P , entonces u es P ,
si θ es P , y θ̇ es C y x es P , entonces u es N ,...
si θ es N , y θ̇ es N y x es N , entonces u es N .
.
Primero, de acuerdo a la figura 4.4, las variables de entrada definidas para el módulo F1son
³θ, θ̇´. De acuerdo a la figura 4.5, uno fija los valores θ y θ̇ para escoger cada columna
vertical y comenzar el proceso de reducción como lo muestra la figura 4.6.
Intuitivamente, existen cinco tipos diferentes de renglones, por tanto, solamente necesita-
mos de cinco variables de mapeo para la salida intermedia uθ. Definiendo las cinco variables
de mapeo como Av, Bv, Cv, Dv y Ev, respectivamente (la figura 4.7 denota la relación de es-
tas variables). A continuación, seleccionemos el primer renglón de la figura 4.7 para explicar
que θ es P y que θ̇ es también P y a su vez, este es mapeado a la variable A. Obviamente,
de la figura 4.7, el FLU de F1 mostrado en la figura 4.8 puede ser construido a través de las
-
48 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
1
4
2
3
5
Figura 4.5: Reglas mediante el acceso aleatorio.
1
4
2
3
5
Figura 4.6: El proceso de reducción.
-
4.2 El sistema difuso limpio-jerárquico L-HFS 49
N N
N N
N N N
N N N
N N N
C
C C
C
C C
P P
P
P
P
P P
P
Av
Dv
Bv
Cv
Ev
Figura 4.7: La relación de los renglones y las variables de mapeo.
reglas si-entonces como sigue:
si θ es P y θ̇ es P entonces u0 es Av,
si θ es P y θ̇ es C entonces u0 es Bv,...
si θ es N y θ̇ es N entonces u0 es Ev.
.
De acuerdo con la figura 4.7, la relación que existen entre u0 y x es equivalente a la relación
entre las variables de mapeo (Av, Bv, Cv, Dv y Ev ) y a x. Por tanto, la tabla de la figura
4.9 puede ser construida como sigue:
si u0 es Av y x es P entonces u es P ,
si u0 es Av y x es C entonces u es Z,...
si u0 es Ev y x es N entonces u es N .
.
Las reglas de la tabla de la figura 4.8 y 4.9 son lo que deseábamos para F1 y F2 respectiva-
mente.
-
50 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
Figura 4.8: Reglas para F1.
Comentario 4.1 Para comprobar que se puede conseguir el mismo modelo de entrada-salida
antes y después de aplicar el método L-HFS, supóngase que tenemos un sistema con tres
variables de entrada y una base de reglas difusas definidas por la tabla de la figura 4.5.
Mediante el método convencional de la lógica difusa de una sola capa, la salida de u puede
ser expresada como sigue:
si θ es P y θ̇ es P y x es P entonces u es P.
Sin embargo, usando método L-HFS, podemos conseguir la misma salida u mediante el uso
de la tablas de las figuras 4.8, 4.9 y 4.4 respectivamente. Por lo que la descripción es la
siguiente:
si θ es P y θ̇ es P entonces u0 es Av.
si u0 es Av y x es P entonces u es P ,
De esta descripción , es obvio que podemos conseguir al mismo modelo de la entrada-
salida antes y después la descomposición L-HFS. Por otra parte, para un sistema de tres
variables de entrada, en el sistema convencional de la lógica difusa de una sola capa, las
reglas totales son 27 (3× 3× 3). Sin embargo, usando método de L-HFS, las reglas totales
-
4.2 El sistema difuso limpio-jerárquico L-HFS 51
Figura 4.9: Reglas para F2.
son únicamente 24. Claramente, se ve de las tablas de la figura 4.8, 4.9 y 4.4. Eso significa
que hay 9 reglas para conseguir la salida de u0 y 15 reglas para conseguir la salida de u.
En cuanto a un sistema de n variables de entrada, el mismo modelo de la entrada-salida se
puede obtener antes y después la descomposición L-HFS y el número de reglas totales será
reducido considerablemente.
4.2.1. Algoritmo para la construcción del sistema difuso límpido-
jerárquico
Nuestro propósito en esta subsección es el presentar un algoritmo para el caso general en
la construcción de sistemas difusos jerárquicos, por lo que el procedimiento de construcción
es el siguiente:
Algoritmo 4.1 Construcción de sistemas L-HFS vía mapeo de variables.
Paso 1: Determine la forma del HFS y etiquete los FLU de 1i a ni de la i-ésima capa
como lo muestra la figura 4.10.
Paso 2: De la figura 4.10, fije las variable de entrada x1, x2 y use el proceso de reduc-
ción para obtener el mapeo de las variables de salida FLU (11). Use de manera similar el
procedimiento para ejecutar el mapeo de las variables de salida para obtener 21,31,. . .,n1.
-
52 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
1i
12 22 n2
11 21 31 41 n1
Figura 4.10: Diagrama de un HFS.
Paso 3: De la figura 4.10, fije las variables de entrada x1,x2,x3,x4 y utilice el proceso
de reducción para obtener el mapeo de las variables de salida FLU (12). De la misma man-
era utilice el procedimiento para ejecutar el mapeo de las variables de salida para obtener
22,32,. . .,n2.
Paso 4: Repita el procedimiento del paso anterior hasta agotar todas las combinaciones
y hasta que la segunda capa se alcance.
Paso 5: En la capa final, podemos tabular las reglas finales FLU de las salidas lingüísticas
relacionadas a las variables de mapeo de la capa anterior.
Paso 6: Si al aplicar el proceso de mapeo de reducción para la i-ésima capa FLU (1i), no
se observa reducción alguna para el mapeo de las variables de salida, redefiniremos el módulo
o los módulos correspondiente mediante el uso del operador mínimo5, aplicado a cada una de
las premisas de las reglas difusas del o de los módulos correspondientes, de tal manera que
esta operación redefina la nueva consecuencia de la regla difusa correspondiente.
Paso 7: Por último las nuevas reglas difusas se comparan mediante el uso de un índice
de aproximación, el cual, de manera simple nos lleva a un proceso de reducción sencillo para
los módulos correspondientes.
A continuación se define el proceso de reducción del índice φ.
5Vea [14] y [15] para más información acerca del operador.
-
4.2 El sistema difuso limpio-jerárquico L-HFS 53
1 µ (x)
0.5
A
Figura 4.11: Un número triangular difuso en donde a1, a2 y a3 describen respectivamente la
tripleta (a1, a2, a3).
Definición 4.1 Sean las reglas mostradas en las ecuaciones 4.1 y 4.2, la i-ésima y j-ésima
regla difusa correspondientes a una base de reglas difusa de tipo MISO.
Ri : Si u1 es Aj1 y u2 es A
k2 y ... y un es A
ln, entonces yi es B
ri (4.1)
Rj : Si u1 es Aj1 y u2 es A
k2 y ... y un es A
ln, entonces yj es B
sj (4.2)
Se dice que Bsj = Bri si Z
µRi
α (x)dx =
ZµR
j
β (x)dx (4.3)
y además existe un índice φ ∈ R, tal que3X
i=1
|αi − βi| < φ (4.4)
en donde 4.3 denota el área bajo la curva de las funciones de membresía µRi
α (x) y µRj
β (x).
Note que para el índice de la ecuación (4.4), αi y βi representan los valores correspondiente
a las tripleta definidas por las funciones de membresía µRi
α = mı́nnµAj1
, µAk2 , ..., µAln
oy
µRj
β = mı́nnµAj1
, µAk2 , ..., µAln
orespectivamente, figura 4.11.
A continuación para validar el desempeño de los sistemas difusos jerárquicos en los sistema
de control difuso se desarrolla un ejemplo para mostrar la efectividad del método en el sistema
riel-esfera propuesto por Ortiz [22].
-
54 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
Figura 4.12: Sistema riel-esfera.
4.3. Aplicación del L-HFS al sistema riel-esfera
El objetivo central de esta sección es el de presentar la construcción de un controlador
difuso jerárquico mediante el uso de la técnica L-HFS. En esta sección, consideraremos el
sistema no lineal riel-esfera como ejemplo de un sistema difuso convencional y posteriormente
aplicaremos la técnica propuesta al sistema en particular a fin de obte