Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...

CENTRO DE INVESTIGACIÓN Y DE ESTUDIOS AVANZADOS

DEL INSTITUTO POLITÉCNICO NACIONAL

DEPARTAMENTO DE CONTROL AUTOMÁTICO

Sistemas difusos jerárquicos para modelado y control

TESIS QUE PRESENTA EL:

Ing. Fernando Gómez Salas

PARA OBTENER EL GRADO DE

MAESTRO EN CIENCIAS

EN LA ESPECIALIDAD DE

CONTROL AUTOMÁTICO

DIRECTOR DE TESIS:

Dr. Wen Yu Liu

México, D.F. Octubre del 2005

Dedicatoria

A toda mi familia , por haberme apoyado en todo momento para el logro de mis objetivos.

Agradecimientos

Deseo expresar mi gratitud a los esfuerzos de la gente que devotamente me ayudaron a

la realización de esta tesis

CINVESTAV: Antonio Osorio Cordero, José de Jesús Mesa Serrano, Noemí García

Gutiérrez, Graciela Meza Castellanos, Carlos Guerrero Rojo y Sheila Montiel.

A mis asesores: Dr. Francisco José Ruiz Sánchez y al Dr. Ieroham Barouh por las

críticas constructivas para mejorar el presente trabajo

A Mis amigos : Beto, Edgar, Armando, Gabriela, Roxana, Omar, Laura, Saraí, Rosa,

Sheila y Rigoberto.

Mil gracias a mi familia: A mis abuelos Jorge Salas y Margarita Zúñiga, a mis padres

Antonia Salas y Ernesto Gómez, a mis tíos Roberto Salas, Carmen Salas y Miguel Salas, a

mi hermano Israel Gómez y a mis primos Zoe, Zaira, Laura, Pepe y Bruno.

Por último mi especial gratitud al Dr. Wen Yu Liu por dirigirme en este trabajo de tesis

y enseñarme lo difuso que suele ser la vida.

Mil gracias al CONACYT por apoyarme con una beca, sin la cuál no hubiera sido posible

terminar este trabajo de tesis y al departamento de Control Automático por proporcionarme

los medios necesarios para mi formación académica y por las facilidades otorgadas durante

mi estancia.

Resumen

En este trabajo se presenta un algoritmo jerárquico de aprendizaje tipo backpropagation

para la identificación de sistemas sin utilizar estructuras complejas de entrenamiento y un

algoritmo para el diseño de controladores difusos jerárquico. Este nuevo esquema de apren-

dizaje es aplicado a sistemas de identificación vía aprendizaje difuso jerárquico. El algoritmo

de aprendizaje emplea un factor de aprendizaje de tiempo variable, el cual es determinado

a partir de los datos de entrada-salida y a partir de la estructura del sistema. Este método

sugiere ser más sencillo que el aprendizaje normal debido a su estructura jerárquica, lo que

implica que podemos entrenar exactamente los parámetros de cada sub-bloque del sistema

jerárquico independientemente. Por otra parte, el algoritmo para el diseño de controladores

difusos jerárquicos es desarrollado de tal forma que uno puede fácilmente diseñar las reglas

difusas del sistema en forma jerárquica mediante el uso del método de mapeo de variables

y un índice de aproximación φ. En contraste con el método convencional de una sola capa,

el nuevo método llamado jerárquico, posee la gran ventaja de que el número de reglas del

sistema solamente se incrementa linealmente con el número de variables de entrada.

La efectividad del método propuesto para la identificación de sistemas se verifica a través

de un ejemplo de cinco dimensiones y mediante la predicción de una serie de tiempo de tipo

Mackey-Glass. De manera similar para mostrar la efectividad del algoritmo correspondiente

al diseño de controladores difusos jerárquicos, el algoritmo propuesto se valida a través del

diseño de un controlador difuso jerárquico para el sistema riel-esfera. Los resultados de las

simulaciones se presentan para ilustrar la efectividad y la confiabilidad de estos algoritmos.

Índice general

1. Introducción 1

1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Descripción de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Sistemas difusos 7

2.1. Estructura de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1.1. Fuzzificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.2. Mecanismo de inferencia difusa . . . . . . . . . . . . . . . . . . . . . 9

2.1.3. Defuzzicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2. Tipos de Sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1. Mamdani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.2. Takagi-Sugeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3. Sistemas difusos jerárquicos vía aprendizaje para identificación de sis-

temas 19

3.1. El sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.2. Identificación de sistemas vía aprendizaje difuso jerárquico . . . . . . . . . . 21

3.2.1. Error backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2.2. Algoritmo para identificación de sistemas no lineales . . . . . . . . . 28

viii ÍNDICE GENERAL

3.3. Aprendizaje de un controlador en sistemas difusos . . . . . . . . . . . . . . . 30

3.4. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.1. Ejemplo de cinco dimensiones . . . . . . . . . . . . . . . . . . . . . . 32

3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass . . . . . . . . . 36


4. Sistemas difusos jerárquicos vía mapeo de variables para control difuso 43

4.1. El sistema de estructura jerárquica . . . . . . . . . . . . . . . . . . . . . . . 44

4.2. El sistema difuso limpio-jerárquico L-HFS . . . . . . . . . . . . . . . . . . . 46

4.2.1. Algoritmo para la construcción del sistema difuso límpido-jerárquico . 51

4.3. Aplicación del L-HFS al sistema riel-esfera . . . . . . . . . . . . . . . . . . . 53

4.3.1. El sistema riel-esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.3.2. Implementación del algoritmo L-HFS . . . . . . . . . . . . . . . . . . 55

4.4. Aplicación en tiempo real . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.4.1. Descripción del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4.4.2. Construcción del controlador difuso jerárquico para el sistema riel-esfera 67

4.4.3. Implementación al sistema real y resultados experimentales . . . . . . 73


5. Conclusiones y trabajos futuros 81

5.1. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Índice de figuras

2.1. Esquema general del control difuso. . . . . . . . . . . . . . . . . . . . . . . . 8

2.2. Función de membresía del singleton. . . . . . . . . . . . . . . . . . . . . . . . 9

3.1. (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-

sentación para el sistema lógico difuso convencional de una sola capa. . . . . 20

3.2. Sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3. Un sistema difuso jerárquico para identificación. . . . . . . . . . . . . . . . . 26

3.4. Entrenamiento en el caso general para la identificación de sistemas. . . . . . 29

3.5. Diagrama a bloques que representa el aprendizaje de tipo Off-Line. . . . . . . 30

3.6. Entrenamiento para sistemas de control usando sistemas difusos jerárquicos. 31

3.7. Estructura jerárquica difusa para identificar el sistema no lineal definido por

( 3.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.8. Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas. 34

3.9. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco

dimensiones cuando 0

x ÍNDICE DE FIGURAS

3.14. Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas. 38

3.15. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predic-

ción en una serie de tiempo tipo Mackey-Glass cuando 0

ÍNDICE DE FIGURAS xi

4.18. Reestructura para la base de reglas de una sola capa . . . . . . . . . . . . . . 63

4.19. Nuevas reglas para Fr, Fθ y Fu. . . . . . . . . . . . . . . . . . . . . . . . . . 64

4.20. Funciones de membresía para las variables de salida; (a) Funciones de salidas

(b) Gráfica de la operación ( P OR PG ); (c) Gráfica de la operación ( P OR

NG ); (d) Gráfica de la operación ( PG OR N ); (e) Gráfica de la operación

( PG OR PG ) y (f) (b) Gráfica de la operación ( NG OR NG ). . . . . . . 64

4.21. Descripción del sistema riel esfera. . . . . . . . . . . . . . . . . . . . . . . . 66

4.22. Estructura del jerárquica para el sistema barra-esfera en tiempo real. . . . . . 67

4.23. Reglas difusas para el ejemplo en tiempo real del sistema riel-esfera . . . . . . 69

4.24. Unidades Fr, Fθ y Fu para el sistema barra-esfera. . . . . . . . . . . . . . . . 70

4.25. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías

de entrada para la variable r (b) Membresías de entrada para la variable ṙ (c)

Producto algebraico A∗ = A ·B y (c) Producto algebraico B∗ = C ·D. . . . . 724.26. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías

de entrada para la variable θ (b) Membresías de entrada para la variable θ̇ (c)

Producto algebraico C∗ = E · F y (c) Producto algebraico D∗ = G ·H. . . . . 724.27. El sistema riel-esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

4.28. Diagrama a bloques en simulink para el controlador en tiempo real del sistema

riel-esfera usado por Ortiz [22]. . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.29. Diagrama de bloques en simulink para el controlador en tiempo real del sistema

riel-esfera jerárquico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.30. Diagrama de bloques en simulink para el controlador en tiempo real del sistema

riel-esfera de lógica convencional. . . . . . . . . . . . . . . . . . . . . . . . . 76

4.31. Resultados de la aplicación en tiempo real del sistema barra-esfera. (a) Sistema

difuso jerárquico de 12 reglas y (b) sistema difuso convencional de una sola

capa de 16 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.32. Señal de control (a) para el sistema difuso jerárquico y (b) para el sistema

convencional de la lógica difusa. . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.33. Salida de control PD-difuso para el sistema riel-esfera. . . . . . . . . . . . . 78

xii ÍNDICE DE FIGURAS

4.34. Salida de control PD para el sistema riel-esfera. . . . . . . . . . . . . . . . . 78

Capítulo 1

Introducción

Desde que el control difuso fue propuesto por E. H. Mamdani en 1974, diferentes estu-

dios aplicados a la teoría del control difuso han mostrado que el aprendizaje difuso y/o los

algoritmos de control difuso son de las áreas más activas y fructíferas de la investigación en

los últimos años dentro del campo de la lógica difusa. A partir de la década de los ochentas,

la lógica difusa ha desempeñado una función vital en el avance de soluciones prácticas y sen-

cillas para una gran diversidad de aplicaciones en la ingeniería y la ciencia. Debido a su gran

importancia en los sistemas de navegación de vehículos espaciales, control de vuelo, control

satelital de altitud, control de velocidad en mísiles y similares, el área de la lógica difusa se

ha vuelto una parte importante e integral de los procesos industriales y de manufactura.

Desde el punto de vista conceptual, el diseño de sistemas difusos a partir de los pares

de entrada-salida, han sido clasificados en dos tipos. El primer tipo de clasificación sugiere

que las reglas del tipo Si− entonces sean generadas a través de los pares de entrada-saliday la estructura del sistema difuso sea construida a partir de estas reglas, del mecanismo

de inferencia difusa, del fuzzificador y del defuzzificador. En la segunda clasificación, la

estructura del sistema difuso se especifica primeramente por lo que algunos parámetros en la

estructura difusa son libres de cambio y estos se determinan de acuerdo a los pares de entrada-

salida. Aunque regularmente algunas aplicaciones del control difusos a procesos industriales

han producido resultados superiores a sus equivalentes obtenidos por el control clásico [25],

2 Introducción

el dominio de estas aplicaciones ha experimentado una seria limitación al expander este a

sistemas más complejos, debido a que aún no existe una teoría completa para determinar el

rendimiento del sistemas a partir del cambio en sus parámetros o variables.

Sin embargo, al expandir algunas de estas aplicaciones a sistemas más complejos, el

número de reglas difusas relacionadas con el proceso se incrementan de forma exponencial

con el número de variables relacionadas al sistema. Específicamente este problema llamado

la maldición de la dimensionalidad1 establece que con el uso de n variables y m conjuntos

definidos por cada variable, se necesitarían mn reglas difusas para construir un controlador

difuso completo, i.e., conforme n crece, la base de reglas rápidamente sobrecarga la memoria

de cualquier dispositivo de computo haciendo que el controlador difuso sea difícil de imple-

mentar además de que se define un tiempo de respuesta imposible para procesos rápidos en

tiempo real [37] [35] [36].

Para tratar este problema Raju, Zhou, y Kisner propusieron el uso de sistemas difusos

jerárquicos [37] [3], los cuales consisten en un número de sistemas difusos de baja dimensión

conectados uno a otro de forma jerárquica. La ventaja que propone este enfoque jerárquico

para los sistema difusos, es que el número total de reglas difusas del controlador se incrementa

solamente de forma lineal con el número de variables de entrada y por tanto que sea más

sencillo de implementar reduciendo así el costo computacional y consecuentemente el tiempo

de computo.

1.1. Motivación

Debido al efecto tecnológico causado por el uso de las computadoras a partir de la década

de los 80´s y 90´s, el uso de controladores automáticos asistidos por microcomputadoras

ha crecido considerablemente en muchas de las aplicaciones industriales y militares de la

actualidad. En la gran mayoría de los casos, un control computarizado genera una acción

rápida y precisa de control para sistemas de control basados en la experiencia, sin embargo

1Esta expresión no es única de los sistema difusos y establece lo siguiente:

“La complejidad de un problema incrementa exponencialmente con el número de variables relacionadas”.

1.1 Motivación 3

estas acciones se realizan generalmente con una baja calidad en el control comparadas con

la habilidad mostrada por un operador humano experto. Para resolver este problema, los

métodos del control difuso hicieron posible que los ingenieros tuvieran herramientas para

diseñar sistemas de control de excelente calidad, sin embargo, conforme las plantas modernas

con múltiples entradas y salidas se han vuelto más y más complejas, la implementación de este

tipo de controladores se ha tornado más difícil debido a la maldición de la dimensionalidad.

Las limitaciones causadas por la maldición de la dimensionalidad, sugirieron una nueva

metodología para el diseño de sistema difusos a través del uso de una estructura jerárquica.

Aunque los sistemas difusos jerárquicos denotan ser la mejor opción para evitar el crecimiento

del número de reglas difusas de forma exponencial, algunos de estos métodos usan estructuras

complejas y en algunos casos estos abarcan solamente algunos problemas específicos.

La finalidad del presente trabajo, es la de dar a conocer un nuevo algoritmo jerárquico

de aprendizaje tipo backpropagation para la identificación de sistemas no lineales sin utilizar

estructuras complejas de entrenamiento y la de ofrecer una metodología del nuevo enfoque

difuso jerárquico mediante el diseño un controlador difuso en tiempo real para el sistema

riel-esfera. Este sistema se utiliza para ejemplificar y justificar el desarrollo de esta tesis,

en particular, el prototipo esta ubicado en el Centro de Servicios Experimentales (CSE) del

Departamento de Control Automático (DCA) del CINVESTAV-IPN.

Finalmente mencionaremos los casos en los que es necesario utilizar sistemas difusos

jerárquicos:

1. En procesos complejos, gran número de variables de entrada y/o salida.

2. En procesos no lineales complejos.

3. Cuando la introducción de la experiencia de un “experto” se base en una gran cantidad

de variables imprecisas obtenidos a partir de su experiencia.

4. Cuando sea necesario optimizar recursos (memoria del controlador).

5. En general, cuando se quieran representar y operar con una gran variedad de parámet-

ros que tengan cierto grado de imprecisión o incertidumbre.

4 Introducción

1.2. Justificación

Al leer algunos artículos y libros de texto referentes a la teoría del control difuso, el

lector crea una opinión acerca de como trabaja y se desempeña el control lógico difuso. En lo

particular, es fácil observar que la mayoría de la literatura no ofrece los suficientes conceptos

fundamentales sobre la teoría difusa y el control difuso. Sin embargo, cuando el lector localiza

cuales son estos conceptos, este comienza a adquirir una opinión diferente acerca de ¿cómo?

y cuando el control difuso trabaja, además de la habilidad para reconocer cuando este es más

práctico2 que el control convencional. De acuerdo con D. Abramovithc 1994 [1], es claro que

la lógica difusa puede ser mucho más útil de lo que sus opositores harían creer. Cualquier

aplicación candidata al control difuso es aquella que relacione una “interacción humana” y

una “regla de control” previamente establecida, i.e., estos son problemas donde la diferencia

entre el bien y el mal no es binaria. En la actualidad, el uso del control difuso convencional

satisface el objetivo de controlar cualquier proceso basado en la información cualitativa de

los procesos.

Aunque el creciente número de aplicaciones de los controladores difusos han sido re-

stringidos en gran medida a la falta de seguridad en su desempeño, en los últimos años el

mundo actual ha sido incitado en considerar y aplicar esta área para su uso en los sistemas de

control. En contraste con el controlador difuso convencional, el controlador difuso jerárquico

no sólo controla el sistema deseado de forma adecuada, sino que también reduce el efecto

causado por la maldición de la dimensionalidad, de tal forma que permite la implementación

del controlador difuso en forma práctica y sencilla. Por otra parte, la construcción de sis-

temas difusos en jerarquías, ofrecen la grandes recompensas de modelar no linealidades sin

la necesidad de emplear algoritmos complejos y por supuesto el de dar soporte a algunos

controladores convencionales en donde el margen de error es crítico.

Finalmente existen algunos problemas, en donde, los sistema de control han sido diseñado

específicamente para trabajar bajo el control de un operador humano. Mediante el uso de

sensores extras y tiempos de muestreo más rápidos que los ofrecidos por un operador humano,

2En costo e implementación.

1.3 Descripción de la tesis 5

el control difuso fácilmente ofrece el mismo desempeño realizado por este último. Es por

tanto, que la contribución real que ofrecen los sistemas difusos jerárquicos a las áreas de la

ingeniería, ciencia, negocios, medicina, psicología y similares, es de suma importancia en la

actualidad.

1.3. Descripción de la tesis

Este trabajo de tesis que se presenta, consiste de temas distribuidos en cinco capítulos,

divididos de la siguiente manera:

En el capítulo 1 se realiza una breve introducción al tema de tesis. En el capítulo 2, se

da una introducción referente al concepto de sistema difuso y a los mecanismos de inferencia

difusa tipo Sugeno y Mamdani. El capítulo 3, muestra la motivación de utilizar los sistemas

difusos jerárquicos para la identificación de sistemas, además de tratar el análisis completo

para la construcción del algoritmo jerárquico de aprendizaje tipo-backpropagation para la

identificación de sistemas. Este capítulo, también incluye un par de ejemplos para mostrar

la efectividad de método propuesto. En el capítulo 4 se aborda el análisis y la justificación

de los sistemas difusos jerárquicos en los esquemas de control mediante el uso de variables de

mapeo. Este capítulo también presenta el diseño y la implementación de un algoritmo para

el diseño de controladores difusos jerárquicos. Al final del mismo, se presenta la aplicación

en tiempo real para mostrar la efectividad del algoritmo propuesto. Por último, el capítulo 5

describe las conclusiones generales del trabajo realizado y las perspectivas de investigación

para trabajos futuros.

6 Introducción

Capítulo 2

Sistemas difusos

El sistema de inferencia difusa es una estructura computacional muy popular basada en

los conceptos de la teoría difusa, en reglas del tipo si-entonces y en métodos de inferencia

difusa. Los sistemas de inferencia difusa, actualmente han encontrado diversas aplicaciones

exitosas dentro de una gran variedad de áreas tales como el control automático, la clasificación

de datos, el análisis de decisiones, los sistemas expertos, la predicción de series de tiempo,

la robótica y en el reconocimiento de patrones. A causa de su naturaleza multidisciplinaria,

los sistemas de inferencia difusa son conocidos como sistemas experto, modelos difusos,

controladores lógicos difusos o simplemente como sistemas difusos.

2.1. Estructura de los sistemas difusos

Motivado por Zadeh y validado por Mamdani, el uso de los sistemas difusos han sido

aplicados en una gran variedad de áreas tales como el control automático, el procesamiento

digital de señales, las comunicaciones, los sistemas expertos, la medicina, etc. Sin embargo,

las aplicaciones más significativa de los sistemas difusos se han concentrado específicamente

en el área del control automático.

Esencialmente un sistema difuso, es una estructura basada en conocimiento definida

a través de un conjunto de reglas difusas del tipo si-entonces, las cuales, contienen una

8 Sistemas difusos

Mecanismo de

inferencia

Base de reglas

Fuzzificador Deffuzificador

Proceso

Controlador difuso

difuso difuso

Control actual no difusoSalida del proceso y estado

ui yi

Figura 2.1: Esquema general del control difuso.

cuantificación lógica difusa de la descripción lingüística del experto de como realizar un

control adecuado.

La figura 2.1 ilustra el diagrama a bloques y los componentes básicos de un sistema difuso

en donde los conjuntos clásicos Ui y Yi son llamados el universo del discurso para ui y yirespectivamente. En particular, ui ∈ Ui con i = 1, 2, 3, ..., n y yi ∈ Yi con i = 1, 2, ...,mdefinen las entradas y salidas correspondientes del sistema difuso.

De acuerdo a la figura 2.1, es fácil observar que el sistema difuso utiliza conjuntos difusos,

definidos por la base de reglas difusa, para cuantificar la información en la base de reglas

y que el mecanismo de inferencia opera sobre estos conjuntos difusos para producir nuevos

conjuntos difusos, por tanto, es necesario especificar como el sistema convertirá las entradas

numéricas ui ∈ Ui en conjuntos difusos, un proceso llamado “fuzzificación”, tales que ellospuedan ser utilizados por el sistema difuso. De igual forma, el proceso llamado defuzzificación

describe el mapeo de un espacio de acciones de control difuso en acciones de control no difuso.

La defuzzificación por tanto, genera una acción de control no difusa la cual denotamos

generalmente por ycrispq y es la mejor representación de una salida difusa inferida.

A continuación examinaremos en detalle los elementos que conforman un sistema difuso.

2.1 Estructura de los sistemas difusos 9

Figura 2.2: Función de membresía del singleton.

2.1.1. Fuzzificación

El proceso de la fuzzificación consiste en una transformación de un dato o de un conjunto

clásico a su correspondiente conjunto difuso, por tanto, denotemos por U∗i , el conjunto detodos lo posibles conjuntos difusos que pueden ser definidos por Ui y dado ui ∈ Ui, denotemosla transformación difusa de ui a un conjunto difuso por A

fuzi , el cual es definido en el universo

del discurso Ui.La transformación de un conjunto clásico a un conjunto difuso se produce mediante el uso

del operador de fuzzifiaciónF , Passino [23], definido porF : Ui → U∗i en dondeF(ui) = Afuzi .Regularmente el uso del fuzzificador tipo singlenton es el más utilizado para las aplica-

ciones en área del control automático y este es definido como un conjunto difuso Afuzi ∈ U∗icon función de membresía

µAfuzi(x) =

(1 si x = ui

0 en otro caso. (2.1)

Cualquier conjunto difuso con la forma (2.1) en su función de membresía es llamado “sin-

glenton1”, figura (2.2).

2.1.2. Mecanismo de inferencia difusa

El mecanismo de inferencia difusa es el núcleo de cualquier controlador difuso. Su com-

portamiento dinámico es en general caracterizado por un conjunto de reglas difusas de la1Note que la función discreta impulso puede ser utilizada para representar la función de membresía de

un singlenton.

10 Sistemas difusos

forma

Si x es A entonces y es B (2.2)

en donde A y B son valores lingüísticos definidos por un conjunto difuso en un universo

X y Y respectivamente. La cláusula Si, un antecedente, es una condición en el dominio de

aplicación; la cláusula entonces, una consecuencia, es una acción de control dado al proceso

bajo control.

Con un conjunto de reglas difusas, el mecanismo de inferencia difusa es capaz de derivar

una acción de control para un conjunto de valores de entrada. En otras palabras, una acción

de control es determinada por las entradas observadas, las cuales representan el estado del

proceso a ser controlado mediante el uso de las reglas de control.

La expresión “Si x es A entonces y es B”, la cual se abrevia regularmente como A→ B,en esencia, es una relación binaria R de las variables x y y en el espacio del producto X×Y .Existen diversos métodos de inferencia difusa que pueden ser formulados a través de los

operadores2 t-norma y s-norma para calcular la relación difusa R=A → B. En general, lossiguientes métodos son los más utilizados:

1. Implicación de Dienes-Rescher [28]: En esta implicación la regla difusa (2.2) es inter-

pretada como una relación RD en A×B con función de membresía

µRD(x, y) = máx[1− µA(x), µB(y)] (2.3)

2. Implicación Lukasiewics [28]: Específicamente, la regla difusa (2.2) es interpretada como

una relación difusa RL en A×B con función de membresía

µRL(x, y)=mı́n[1, 1− µA(x) + µB(y)] (2.4)

3. Implicación de Zadeht [28]: Aquí la regla difusa (2.2) es interpretada como una relación

difusa RZ en A×B con función de membresía

µRL(x, y)máx [mı́n(µA(x), µB(y)), 1− µA(x)] (2.5)2Vea [14] y [15] para más información acerca de estos operadores.

2.1 Estructura de los sistemas difusos 11

4. Implicación Mamdani [28]: La regla difusa (2.2) es interpretada como una relación RMen A×B con función de membresía

µRM (x, y) = mı́n [µA, µB] , ó µRM = µA(x) · µB(x) (2.6)

Aunque estas cuatro ecuaciones representan diferentes interpretaciones de la regla di-

fusa (2.2), la implicación de Mamdani, es la más utilizada para aplicaciones en los

sistemas difusos, ecuación (2.6).

En general el operador inferencia se aproxima por medio de una t-norma.

2.1.3. Defuzzicación

La defuzzificación es definida como un mapeo de un conjunto difuso B0 en V ⊂ R (quees la salida de la inferencia difusa) a un elemento de un conjunto clásico ycrispq = y

∗ ∈ V.Conceptualmente, la tarea de defuzzificar es especificar un punto, elemento de V, que reflejela mejor representación del conjunto difuso B0. A la fecha no existe un algoritmo óptimo para

la defuzzificación, sin embargo, algunos métodos de defuzzifiacación son prácticos. Como es

común, a continuación detallaremos dos de las técnicas más utilizadas para la defuzzificación.

El defuzzificador centro de gravedad (COG): especifica la salida y∗ como el

centro del área cubierta por la función de membresía del conjunto difuso B, y esta es

dada por

y∗ = ycrispq =

PRi=1 b

qi

YyqµB̂iq(yq)dyqPR

i=1

Yyq(yq)dyq

(2.7)

en donde R es el número de reglas difusas, bqi es el centro del área de la función de

membresía de BPq asociado con el conjunto difuso implicado B̂iq para la i − ésima

regla3 (j, k, ..., l; p, q)i, y Yyq

µB̂iq(yq)dyq (2.8)

3Por simplicidad usaremos (j, k, ..., l; p, q)i = Ri para denotar la i − ésima regla difusa de una base dereglas difusa tipo MISO.

12 Sistemas difusos

denota el área bajo µB̂iq(yq). Note que el sistema difuso debe ser definido tal que

RXi=1

Yyq

µB̂iq(yq)dyq 6= 0 (2.9)

para toda ui, o la salida ycrispq , no será definida apropiadamente. Este valor no debe

ser cero si existe una regla seleccionada para cada posible combinación de las entradas

del sistema difuso y si todo el conjunto difuso de la consecuencias tiene área distinta

de cero.

Defuzzificador centro promedio: El defuzzificador centro promedio determina la

salida clásica ycrispq usando los centros de cada salida de la funciones de membresía. El

valor óptimo o máximo de cada conclusión es representada mediante el conjunto difuso

implicado:

ycrispq =

PRi=1 b

qi supyq

nµB̂iq(yq)

oPR

i=1 supyq

nµB̂iq(yq)

o (2.10)donde el “sup” denota el supremo (supx {µ(x)} puede ser simplemente pensado comoal valor más alto de µ(x)) y bqi es el centro del área de la función de membresía de B

Pq

asociado con el conjunto de implicación difusa B̂iq para la i−ésima regla (j, k, ..., l; p, q)i.Note que el sistema difuso pude ser definido como

RXi=1

bqi supyq

nµB̂iq(yq)

o6= 0 (2.11)

para toda ui, en donde el supyqnµB̂iq(yq)

oes regularmente fácil de calcular si µB̂iq(yq) =

1 para al menos un yq, entonces para varias estrategias de inferencias podemos utilizar

los cálculos4 correspondientes para la i − ésima regla (j, k, ..., l; p, q)i por lo que elconjunto difuso de implicaciones B̂iq es definido en su función de membresía como

µB̂iq(yq) = µi(µ1, µ2, ..., µn) ∗ µBPq (yq) (2.12)

4Para ver los cálculos correspondientes al conjunto difuso B̂iq véase [23].

2.2 Tipos de Sistemas difusos 13

y obtener

supyq

nµB̂iq(yq)

o= µi(µ1, µ2, ..., µn) (2.13)

Por lo tanto, la ecuación para la defuzzificación centro promedio esta dada por

ycrispq =

PRi=1 b

qiµi(u1, u2, ..., un)PR

i=1 µi(u1, u2, ..., un)(2.14)

donde se debe asegurar quePR

i=1 µi(u1, u2, ..., un) 6= 0 para toda ui.

2.2. Tipos de Sistemas difusos

En estas sección se presentan los controladores difusos de tipo Mamdani y Sugeno, los

cuales han sido utilizados exitosamente en una gran variedad de aplicaciones en la comunidad

del control difuso. Aunque, el objetivo del controlador difuso Mamdani es el de representar

a un exitoso operador humano, el controlador difuso de tipo Sugeno sugiere ser más eficiente

en cálculos y en métodos de adaptación (learning).

2.2.1. Mamdani

En esta subsección definiremos la construcción de un sistema difuso tipo Mamdani.

Primero, considérese una base de reglas difusas del tipo MISO descritas por (2.15)

R1 : Si u1 es Aj1 y u2 es A

k2 y,..., y un es A

ln entonces y1 es B

r1

...

Rj : Si u1 es Aj1 y u2 es A

k2 y,..., y un es A

ln entonces yj es B

sj

...

Rm : Si u1 es Aj1 y u2 es A

k2 y,..., y un es A

ln entonces ym es B

tm

(2.15)

en donde Aji , Ak2,..., A

ln y B

sj para R

j, representan los valores lingüísticos correspondientes,

Passino [23].

14 Sistemas difusos

Si la entrada al sistema difuso es dado por

ui = x∗i (2.16)

entonces, haciendo uso del fuzzificador singlenton

µ =

(1 si xi = x∗i0 en otro caso

(2.17)

se tiene que ¡ui es A

ji

¢→ µAji (x

∗i ) (2.18)

en donde Aji denota el valor lingüístico correspondiente a la i− ésima entrada de la j− ésimaregla difusa Rj correspondiente a la base de reglas difusas descritas por (2.15). Al hacer uso

de la ecuación (2.16), la j − ésima regla difusa de la base de reglas (2.15) es representa por

Rj : Si x∗1 es Aj1 y x

∗2 es A

k2 y,..., y x

∗n es A

ln entonces yj es B

sj (2.19)

en donde la operación difusa de la j − ésima regla (2.19) es definida pornYi

µAji(x∗i ) (2.20)

El motor de inferencia difusa que utiliza esta base de reglas difusas es el mecanismo de

inferencia del producto o implicación de Mamdani, por lo que para la j − ésima regla setiene que:

nYi

µAji(x∗i )µB̃j (y) (2.21)

y la l−regla p se obtiene mediante el operador “OR”

µp =M

máxl=1

"nYi

µAji(x∗i )µB̃j=l (y)

#(2.22)

en donde el índiceM representa el número de reglas para (2.15) y B̃sj denota el valor lingüís-

tico correspondiente a la salida yj de la j − ésima regla difusa Rj, con j = l.

2.2 Tipos de Sistemas difusos 15

El método de defuzzificación puede ser obtenido suponiendo que yj es centro de B̃j, la

altura de la l − regla del conjunto difuso esnYi

µAji(x∗i )µBj

¡yj¢

(2.23)

y

µB̃j¡yj¢= 1 (2.24)

es un conjunto difuso normalizado, sustituyendo la ecuación (2.24) en la ecuación (2.23) se

obtiene que el centro promedio es dado por

y∗ =

mXj=1

yj

ÃnYi

µAji(x∗i )

!mXj=1

ÃnYi

µAji(x∗i )

!

Teorema 2.1 Sistemas difusos con base de reglas difusas, mecanismos de inferencia tipo

producto, fuzzificador singlenton y defuzzificador centro promedio poseen el siguiente mapeo

no lineal

ycrisp =

mXj=1

yj

ÃnYi

µAji(xi)

!mXj=1

ÃnYi

µAji(xi)

! (2.25)

2.2.2. Takagi-Sugeno

El modelo difuso de Takagi-Sugeno (también conocido como modelo TKS) fue propuesto

por Takagi, Sugeno y Kang [9], en un esfuerzo para formalizar un método sistemático para

generar reglas difusas a partir de un conjunto de datos de entradas y salidas. Una típica

regla difusa en el modelo de Sugeno tiene la forma

Si x es A y y es B entonces z = f(x, y) (2.26)

16 Sistemas difusos

donde A y B son conjuntos difusos en el antecedente, mientras z = f(x, y) es una función

clásica en la consecuencia. Usualmente f(x, y) es un polinomio en la variables de entrada x y

y, pero este puede ser cualquier función mientras pueda describir apropiadamente la salida del

modelo dentro de la región difusa especificada por la regla de antecedentes. Cuando f(x, y)

es un polinomio de primer orden, el sistema resultante de inferencia difusa es llamado modelo

difuso de Sugeno de primer orden. Cuando f es una constante, entonces tenemos un modelo

difuso de Sugeno de orden cero, el cual puede ser visto como un caso especial de la regla de

inferencia difusa de Mamdani, en la cual cada regla es especificada por un singletón (o una

consecuencia pre-defuzzificadora ), o un caso especial del modelo Tsukamoto. Sin embargo,

un modelo de Sugeno de orden cero es equivalente a una red de funciones básica radiales.

Un caso especial del modelo difuso lingüístico se obtiene cuando la consecuencia, el con-

junto difuso Bi, es formado por conjuntos difusos de singlentones. Estos sistemas se repre-

sentan simplemente como números reales bi, obteniéndose las siguientes reglas:

Ri : Si x es Ai entonces y = bi, i = 1, 2, ...,K. (2.27)

Este modelo se llama modelo singletón. Un método simplificado de inferencia-defuzzificación

se utiliza generalmente con este modelo:

y =

PKi=1 βibiPKi=1 βi

(2.28)

Este método de defuzzification se llama el medio difuso “fuzzy mean”. El modelo difuso del

singleton pertenece a una clase general de las funciones aproximadoras, llamadas la extensión

de las funciones básicas (Friedman, 1991) tomando la forma:

y =KXi=1

φ(x)bi (2.29)

La mayoría de las estructuras usadas en la identificación de sistemas no lineales, tales como

las redes neuronales artificiales, las redes neuronales de funciones básicas radiales [8], o tiras

(splines), pertenecen a esta clase de sistemas.

2.3 Conclusiones del capítulo 17

2.3. Conclusiones del capítulo

En este capítulo, se discutió en gran detalle la estructura de los sistemas difuso y dos

de los mecanismos de inferencia difusa más utilizados en la comunidad del control difuso: el

modelo difuso Sugeno y el modelo difuso Mamdani.

De acuerdo a la primera sección, es fácil observar que el sistema de inferencia difusa es

una de las herramientas de modelado más importantes del control difuso debido a que su

estructura se basa estrictamente en la teoría de la lógica difusa.

Por otra parte, los sistemas de inferencia difusa definidos aquí, basados en alguno de

los métodos propuestos, dan la posibilidad de representar conceptualmente el mejor mapeo

no lineal de salida de un sistema difuso con el objetivo de simular el conocimiento de un

operador humano experto a un bajo costo y eficientemente sin la necesidad de reemplazar al

operador debido a largas jornadas de trabajo.

En el siguiente capítulo, el modelo de inferencia Mamdani será usa elaborar la construc-

ción de un método tipo-backpropagation en la identificación de sistemas.

18 Sistemas difusos

Capítulo 3

Sistemas difusos jerárquicos vía

aprendizaje para identificación de

sistemas

En los sistemas difusos convencionales o de tipo estándar, el número de reglas aumenta de

forma exponencial con el crecimiento en el número de variables de entrada, esto es, suponga

que existen n variables de entrada y m funciones de membresía para cada variable, entonces

necesitaremos mn reglas para construir un controlador difuso completo y tan rápido como

n aumente su tamaño, la base de reglas difusas sobrecargará rápidamente la memoria de

cualquier sistema de computo y por supuesto, hará difícil la implementación del controlador

difuso. En general, la complejidad de un problema aumenta de forma exponencial debido al

número de las variables implicadas, este fenómeno llamado la “maldición de la dimensional-

idad”, no es único de los sistemas difusos y es la idea original que motivó el estudio de los

sistemas difusos jerárquicos (HFSs), Brown [3] y Zhou [37].

20 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

(c)

Figura 3.1: (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-

sentación para el sistema lógico difuso convencional de una sola capa.

3.1. El sistema difuso jerárquico

Los sistemas difusos jerárquicos consisten de un número de sistemas difusos de baja

dimensión distribuidos de forma jerárquica, los cuales, poseen la gran ventaja de que el

número total de reglas de su base de conocimiento aumentan de forma lineal con el número

de las variables de entrada implicadas, Zhou [37]. Esta arquitectura se representa en la figura

3.1(a) y (b) con 4 (n = 4) variables de entradas y 5 (m = 5) funciones de membresía, se

obtiene que cada sistema difuso de baja dimensión consiste de 52 (m2) reglas y por tanto el

número total de reglas es 3× 52 = 75[(n− 1)m2], la cual representa una función lineal de lasn variables de entrada. En contraste con esto, podemos verificar que el número de reglas del

sistemas difuso convencional, figura 3.1(c), es de 54 = 625 reglas y por tanto, concluir que el

número total de reglas difusas se reduce considerablemente bajo el esquema de los sistemas

difusos jerárquicos.

Comentario 3.1 Los sistemas difusos jerárquicos consisten de un número de sistemas di-

3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 21

fusos de baja dimensión conectados en un arreglo jerárquico, por tanto no existe restricción

alguna para aplicar el orden en las jerarquías, figura 3.1(a) y (b).

Para eliminar el problema concerniente al fenómeno de la “maldición de la dimension-

alidad” y consecuentemente los problemas de implementación, el presente trabajo propone

un nuevo enfoque para la determinación de las reglas correspondientes a cada unidad lógica

difusa (FLU1) de un sistema jerárquico difuso dado vía aprendizaje difuso jerárquico.

3.2. Identificación de sistemas vía aprendizaje difuso

jerárquico

En los últimos años, las redes neuronales y la lógica difusa han sido clasificadas como

aproximadores universales debido a que éstas pueden aproximar ciertas funciones no lin-

eales a cualquier exactitud prescrita. Resultados recientes muestran que el procedimiento de

fusión en este tipo de tecnologías parecen ser muy efectivos para la identificación de sistemas

no lineales, Brown (1994) [2], Chen (2001) [4] y Lin (1996) [16]. Aunque los métodos co-

mo el gradiente descendiente y el backpropagation generalmente son usados para ajustar los

parámetros de las funciones de membresía y los pesos de defuzzificación para redes neuronales

difusas, la convergencia lenta de aprendizaje y los mínimos locales son principalmente los

inconvenientes que presentan estos algoritmos, Lin (1995) [17]. Debido a esto, algunas mod-

ificaciones fueron derivadas en publicaciones recientes: En el 2001 Chen [5], sugiere una ley

de robustez en el algoritmo backpropagation para resistir los efectos del ruido y el no aceptar

errores derivados durante la aproximación. Por su parte, Brown (1994) [2], propone el uso de

funciones de membresía B-spline para minimizar una función objeto robusta demostrando

velocidad de convergencia en sus algoritmos y por último Wu (2000) [33] aplica redes neu-

ronales del tipo RBF para determinar la estructura y los parámetros de un sistema neuronal

difuso.

1Fuzzy Logic Unit


Analizando la bibliografía anterior se observa que existen diversos métodos correspondi-

entes para la identificación de sistemas, los cuales pueden ser aplicados efectivamente para

resolver el problema de la identificación, sin embargo, desde el punto de vista del diseño

Wang (1999) en [29], señala que es muy dificil aplicar técnicas de aprendizaje a los sistemas

difusos jerárquicos si se usa el algoritmo backpropagation, por otra parte, Yu (2004) en [31],

demuestra que el uso de algoritmos de entrenamiento resultan ser extremadamente complejos

aún para el caso de una red neuronal difusa de una capa y consecuentemente para el uso de

sistemas difusos jerárquicos. Aunque usando técnicas como el backpropagation y el algoritmo

del gradiente descendiente podemos simplificar el entrenamiento para redes neuronales mul-

ticapas, ¿Será posible entrenar sistemas difusos jerárquicos por medio de técnicas similares?.

Hasta ahora, lo mejor de nuestro conocimiento para el entrenamiento de los sistemas difusos

jerárquicos es el usado algoritmo convencional del gradiente descendiente.

Debido al problema2 que enfrenta el diseño de los sistemas difusos convencionales con una

precisión establecida, el propósito fundamental de este capitulo, es el de introducir un método

tipo backpropagation para la identificación de sistema vía sistemas difusos jerárquicos. En

ciertos casos, el diseño de un sistema difuso también es limitado cuando no podemos decidir la

función de membresía de prioridad, por lo que generalmente, se recomienda el uso del dato

de entrada-salida para entrenar los parámetros de la función de membresía, por ejemplo

ANFIS [10] y el aprendizaje por el método del gradiente [28], sin embargo para evitar esta

limitación, en el presente trabajo se asume que ambas funciones de membresía, premisa y

consecuencia, son desconocidas.

El nuevo algoritmo que se presenta a continuación es tan sencillo que podemos entrenar

exactamente los parámetros de cada sub-bloque independientemente con diferentes veloci-

dades en el aprendizaje. Adicionalmente, un par de ejemplos se incluyen para ilustrar la

efectividad del algoritmo sugerido.

2Problema causado por la “maldición de la dimensionalidad”.


3.2.1. Error backpropagation

Generalmente un modelo convencional difuso con una salida es representado como una

colección de reglas difusas en el siguiente formato (por ejemplo, el modelo difuso de Mamdani

[28])

Ri: Si x1 is Ai1 y · · · y xn is Ain entonces by is Bi (3.1)en donde l (i = 1, 2, . . . , l) representa las reglas difusas del tipo si-entonces para desarrollar

un mapeo del vector lingüístico de entrada X = [x1, · · · , xn] ∈ 1) es un sistema difuso con np variables de entrada y una solasalida, por lo tanto, la base de reglas definidas para el sistema difuso de este nivel es

construido a través de

Ri : xp,1 es Aip,1 y . . . y xp,np1 es Aip,np1

y ŷp−1,1 es Dip−1,1 y . . . y ŷp−1,np2 es Dip−1,np2 =⇒ ŷp es B

ip

en donde i = 1, . . . , lp, byp−1,j es la j− ésima salida en el nivel p−1, xp,j es la j− ésimaentrada en el nivel p, np1 + np2 = np, np1 ≥ 0 y np2 ≥ 0. Si np1 6= 0 el sistema


Figura 3.2: Sistema difuso jerárquico

jerárquico es llamado de arquitectura incremental y cuando np = np2, este es llamado

de arquitectura agregada, Chung [6].

Por último, la construcción continua hasta p = o.

De acuerdo al diseño convencional de los sistemas difuso, existen varias estrategias para

representar la salida de estos, el presente trabajo considera el uso del mecanismo de inferencia

tipo producto, el uso del fuzzificador singlenton y del defuzzificador centro promedio por lo

que el mapeo no lineal

by =lP

i=1

wi

"nQ

j=1

µAij (xj)

#lP

i=1

"nQ

j=1

µAij (xj)

#

representa la salida ŷ del sistema difuso definido a partir de la base de reglas difusas definidas

por (3.1), en donde µAij representa las funciones de membresía de los conjuntos difusos Aij y

wi es la moda de µBi1, es decir, µBi1 = 1.

Adicionalmente, para el sistema difuso jerárquico de la figura 3.2, se tiene que la salida


definida para el primer nivel (p = 1) es descrita por

by1 =l1Pi=1

wi1

"n1Qj=1

µAij (xj)

#l1Pi=1

"n1Qj=1

µAij (xj)

# (3.2)en donde µAij representa las funciones de membresía de los conjuntos difusos A

ij y wi es la

moda de µBi1 , es decir, µBi1 = 1

Similarmente, el p− ésimo nivel (p > 1) es dado por

ŷp =

lpXi=1

wip

"np1Yi=1

µAip,j(xp,j)

np2Yi=1

µDip,j(ŷp−1,j)

#lpXi=1

"np1Yi=1

µAip,j(xp,j)

np2Yi=1

µDip,j(ŷp−1,j)

# (3.3)en donde µAip,j y µDip,j son las funciones de membresía de los conjuntos difusos A

ip,j y D

ip,j

respectivamente y wip es la media de µBip , i.e., µBip = 1.

A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la

técnica sugerida “tipo-backpropagation” en los sistemas difusos jerárquicos.

Considere los tres bloques difusos Fs1, Fs2 y Fs3 que conforman el sistema difuso

jerárquico definido en la figura (3.3). Observe que para cada subsistema, existen l reglas

difusas, n entradas y 1 salida. Al hacer uso del fuzzificador singlenton, de la implicación

de Mamdani y del defuzzificador centro promedio, la salida de cada sistema difuso puede

ser expresada como (3.2), en donde µAij = exp∙−³xj−cijσij

´2¸es la función de membresía del

conjunto difuso Aij, w̄i es el punto en el cual µBi = 1 y ŷ es la salida de cada sistema difuso.

Ahora bien, defínase

zi(x) :=nY

j=1

exp

"−µxj − cijσij

¶2#y ŷ =

a

bcon

a :=lX

i=1

wizi, b :=lX

i=1

zi


Fs3

Fs1

Fs2

Planta

Figura 3.3: Un sistema difuso jerárquico para identificación.

El objetivo de la de identificación es el de determinar los parámetros wi, cij y σij tal que la

salida ŷ del sistema difuso jerárquico converja a la salida de la planta y.

Al usar la técnica del gradiente descendiente para determinar los parámetros wi, cij y σij,

el gradiente es determinado a través del uso de la regla de la cadena, por lo que se tiene que

∂J

∂wi=

∂J

∂ŷ

∂ŷ

∂wi= (ŷ − y)

∂¡ab

¢∂wi

=(ŷ − y)

bzi

y wi es actualizado por

wi(k + 1) = wi(k) +∆wi

= wi(k)− η ∂J∂wi

= wi(k)− ηzi

b(ŷ − y) (3.4)

Para determinar los incrementos en cij y ∆cij, como

∂ex

∂x= ex, entonces

∂J

∂cij=

∂J

∂ŷ

∂ŷ

∂zi∂zi

∂cij= (ŷ − y)

∙wi

b− a

b2

¸zi

"2

¡xj − cij

¢¡σij¢2

#por lo que el vector cij es actualizado por

cij(k + 1) = cij(k)− 2η(ŷ − y)zi

(wi − ŷ)¡xj − cij

¢b¡σij¢2 .


Similarmente, como

∂J

∂σij=

∂J

∂ŷ

∂ŷ

∂zi∂zi

∂σij= (ŷ − y)

∂¡ab

¢∂zi

nYj=1

exp

"−µxj − cijσij

¶2#"2

¡xj − cij

¢2¡σij¢3

#

, σij es actualizado por

σij(k + 1) = σij(k)− 2η(ŷ − y)zi

(wi − ŷ)¡xj − cij

¢2b¡σij¢3 .

Si definimos el error de identificación como e = ŷ(k)− y(k). El método del gradiente descen-diente puede escribirse en en términos del error

wi(k + 1) = wi(k)− ηzi

be (3.5)

cij(k + 1) = cij(k)− 2ηzi(k)

(wi(k)− ŷ(k))¡xj(k)− cij(k)

¢b(k)

¡σij(k)

¢2 eσij(k + 1) = σ

ij(k)− 2ηzi(k)

(wi(k)− ŷ(k))¡xj(k)− cij(k)

¢2b(k)

¡σij(k)

¢3 e.Las entradas y las salidas de cada subsistema están definidas como se muestra en la figura

(3.3), por lo que el índice de desempeño es modificado de tal forma que J = 12(ŷ3 − y)2.

Para el módulo Fs3, el algoritmo de aprendizaje es el mismo descrito por la ecuación (3.5),

solamente que debemos agregar los subíndices correspondientes en cada una de las variable,

por ejemplo, wi(k+1)→ wi3(k+1), cij(k+1)→ ci3(k+1), σij(k+1)→ σi3(k+1), x3,1 = ŷ1(k),x3,2(k) = ŷ2(k), e = ŷ3(k)− y(k) = e3 y

ŷ3 =

l3Xi=1

wi3

"n3Yi=1

µAi3,j(x3,j)

#l3Xi=1

"n3Yi=1

µAi3,j(x3,j)

# . (3.6)Para el subsistema Fs2, si deseamos actualizar wi2, debemos calcular

∂J

∂wi2=

∂J

∂ŷ3

∂ŷ3∂ŷ2

∂ŷ2∂wi2


de la figura (3.3), sabemos que ∂ŷ3∂ŷ2

corresponde a x3,2(k), por lo que

∂J

∂ŷ3= ŷ3 − y.

∂ŷ3∂ŷ2

=∂ŷ3∂zi3

∂zi3∂ŷ2

=

∙a3b23− w

i3

b3

¸zi3

"2ŷ2 − ci3,2¡σi3,2

¢2#, (3.7)

ya que a3b23− ȳi

b3=

ŷ3−ȳi3b3, y

∂J

∂wi2=

zi2b22ŷ3 − wi3

b3zi3ŷ2 − ci3,2¡σi3,2

¢2 e3(k)por lo que ȳj2 es actualizado por

wi2(k + 1) = wi2(k)− η

zi2b22ŷ3 − wi3

b3zi3ŷ2 − ci3,2¡σi3,2

¢2 e3(k). (3.8)Comparando la ecuación (3.8) con (3.4), definimos

e2 = 2y3 − wi3

b3zi3ŷ2 − ci3,2¡σi3,2

¢2 e3(k)Usando la ecuación (3.7) e2 puede escribirse como

∂ŷ3∂ŷ2

e3(k). Similarmente e1 =∂ŷ3∂ŷ1

e3(k),

donde∂ŷ3∂ŷ1

= 2y3 − wi3

b3zi3ŷ2 − ci3,1¡σi3,1

¢2 .Así con e1(k) y e2(k) podemos entrenar el subsistema Fs1 y Fs2 independientemente por el

algoritmo normal, Jang [10].

3.2.2. Algoritmo para identificación de sistemas no lineales

Nuestro propósito en esta subsección es el de presentar un algoritmo para el caso general

de la identificación de sistemas mostrado en la figura 3.4, por lo que el procedimiento de

entrenamiento es el siguiente:


qp

Figura 3.4: Entrenamiento en el caso general para la identificación de sistemas.

Algoritmo 3.1 Algoritmo para la identificación de sistemas

Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de

cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico

deben ser entradas del siguiente nivel.

Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error

de identificación es

eo(k) = ŷo(k)− y(k)

donde eo(k) es el error de identificación, ŷo(k) es la salida del sistema difuso jerárquico

completa y y(k) es la salida de la planta. Entonces propagando el error hacia atrás se forma

la estructura del sistema difuso jerárquico. De acuerdo con la figura (3.4), podemos calcular

el error para el bloque p (definido como ep) formado a través del bloque q (definido como eq).

Recordando la discusión anterior de la regla de la cadena se tiene

ep = 2yq − wiq

bqziqŷp − ciq,p¡σiq,p

¢2 eq. (3.9)Paso 3: Actualice los parámetros de la función gausiana ( funciones de membresía:

premisa y consecuencia) para cada bloque independientemente, por lo que el algoritmo tipo

backpropagation para p− ésimo bloque es

wip(k + 1) = wip(k)− η

zipbpep,


Controladordifuso Planta

HFS Σ

Bloque de control

Bloque de identificación

Figura 3.5: Diagrama a bloques que representa el aprendizaje de tipo Off-Line.

cip,j(k + 1) = cjp,i(k)− 2ηzip(k)

¡wip(k)− ŷp(k)

¢ ¡xp,j(k)− cip,j(k)

¢bp(k)

¡σip.j(k)

¢2 ep,σip,j(k + 1) = σ

ip,j(k)− 2ηzip(k)

¡wip(k)− ŷp(k)


¢2bp(k)

¡σip,j(k)

¢3 ep,en donde zip =

npYj=1

exp

∙−³xp.j−cip,j

σip,j

´2¸y bp =

lpYj=1

zip.

Como se ha señalado, varias aplicaciones en el área del control automático y en el área

de la identificación de sistemas han sido desarrolladas. En efecto, el uso de sistemas difusos

jerárquicos para la identificación de sistemas es en general un método universal, el cual,

también pude ser aplicado para el aprendizaje de controladores difusos o de tipo convencional.

3.3. Aprendizaje de un controlador en sistemas difusos

Basados en los resultados de la sección anterior, es fácil observar que se pueden determinar

de manera similar al problema de identificación los parámetros wi, cij y σij tal que la salida

û del sistema difuso jerárquico converja a la salida de un controlador convencional u, figura

3.5. Por tanto, el propósito general de esta sección, es el de presentar el siguiente algoritmo

para el aprendizaje de tipo off-line.

3.3 Aprendizaje de un controlador en sistemas difusos 31

qp

Figura 3.6: Entrenamiento para sistemas de control usando sistemas difusos jerárquicos.

Algoritmo 3.2 Aprendizaje de un controlador vía sistemas difusos jerárquicos

Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de

cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico

deben ser entradas del siguiente nivel.

Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error

de control es

eo(k) = ûo(k)− u(k)

donde eo(k) es el error de control, ûo es la salida del controlador difuso jerárquico completo

y u(k) es la salida del controlador convencional. Entonces propagando el error hacia atrás

se forma la estructura del sistema difuso jerárquico. De acuerdo con la figura 3.6, podemos

calcular el error para el bloque p (definido como ep) formado a través del bloque q (definido

como eq). Recordando la discusión anterior de la regla de la cadena se tiene

ep = 2uq − wiq

bqziqûp − ciq,p¡σiq,p

¢2 eq. (3.10)Paso 3: Entrene la función gausiana ( función de membresía en la parte de la premisa

y consecuencia) para cada bloque independientemente, para el p− ésimo bloque, el algoritmotipo backpropagation es el siguiente

wip(k + 1) = wip(k)− η

zipbpep,


cip,j(k + 1) = cjp,i(k)− 2ηzip(k)

¡wip(k)− ûp(k)


¢bp(k)

¡σip.j(k)

¢2 ep,σip,j(k + 1) = σ

ip,j(k)− 2ηzip(k)

¡wip(k)− ûp(k)


¢2bp(k)

¡σip,j(k)

¢3 ep,en donde zip =

npYj=1

exp

∙−³xp.j−cip,j

σip,j

´2¸y bp =

lpYj=1

zip.

Para validar el desempeño de los sistemas difusos jerárquicos en la identificación de

sistemas y la efectividad del método propuesto, a continuación se presenta la simulación

numérica con los siguientes ejemplos propuestos por Chung [6].

3.4. Simulaciones

El primer sistema, un ejemplo de cinco dimensiones, es usado para validar la importancia

del método difuso jerárquico y el método de análisis correspondiente a la subsección anterior.

Por otra parte, el segundo ejemplo, la predicción de una serie de tiempo tipo Mackey-Glass,

es empleado para ilustrar el buen comportamiento en el aprendizaje y demostrar la excelente

habilidad en la generalización del método tipo backpropagation.

3.4.1. Ejemplo de cinco dimensiones

La planta no lineal a identificar fue originalmente usada por Friedman para evaluar el

algoritmo de modelado MARS [7], definida por

y = 10 sin(πx1x2) + 20(x3 − 0,5)2 + 10x4 + 5x5. (3.11)

en donde el vector de entrada es

x(k) = [x1, x2, x3, x4, x5].

3.4 Simulaciones 33

Fs3

Fs1

Fs2

Planta

Figura 3.7: Estructura jerárquica difusa para identificar el sistema no lineal definido por (

3.11).

Para la identificación del sistema no lineal definido por (3.11), se utilizó el modelo de la

estructura jerárquica difusa definido en la figura 3.7. La identificación se realizó por com-

putadora con la ayuda de Matlab usando dos reglas difusas para cada bloque difuso jerárquico

l1 = l2 = l3 = 2 y definiendo el número total de entradas para cada bloque como n1 = 3,

n2 = 2 y n3 = 2. Observe que el número de entradas y de reglas difusas definidas en cada

bloque difuso pueden ser definidas arbitrariamente por ejemplo l1 = l2 = l3 = 3 y n1 = 2,

n2 = 2 y n3 = 3 , sin embargo, para mostrar la efectividad del algoritmo en la reducción de

las reglas difusas se utiliza el formato propuesto. La simulación utiliza 200 datos de entre-

namiento para el ejemplo, en donde la señal de entrada para el entrenamiento es aleatoria

en el rango de [0, 1].

Las figuras 3.8, 3.9, 3.10 y 3.11 muestran los resultados de la simulación numérica para

el sistema descrito por la ecuación (3.11) a través del uso de sistemas difusos jerárquicos y

el método convencional de identificación propuesto por Brown [2], Jang [10] y Lin [16]. En

las figuras 3.8 y 3.9, se presentan la salida de la planta y el modelo identificado a través del

uso de los sitemas jerárquicos difusos. Como se puede observar en la figura 3.9, este modelo

identificado representa una mejor aproximación de la planta no lineal con respecto a los

resultados mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.


0 20 40 60 80 100 120 140 160 180 2000

5

10

15

20

25

30Sistema difuso jerárquico

Tiempo

Salida de la plantaModelo identificado

Figura 3.8: Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas.

5 10 15 20 25 30 35 40 45 50 55

5

10

15

20

25

Sistema difuso jerárquico

Tiempo


Figura 3.9: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco


3.4 Simulaciones 35

0 20 40 60 80 100 120 140 160 180 200-5

0

5

10

15

20

25

30

Tiempo

Sistema difuso convencional


Figura 3.10: Identificación para un sistema difuso convencional con 12 reglas difusas.

5 10 15 20 25 30 35 40 45 50 55-5

0

5

10

15

20

25

Tiempo



Figura 3.11: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco



0 20 40 60 80 100 120 140 160 180 2000

10

20

30

40

50

60

Tiempo

Err

or

cuad

rátic

o m

edio

Error cuadrático medio para el ejemplo de cinco dimensiones

Sistema difuso jerárquicoSistema difuso convencional

Figura 3.12: Comparación del desempeño entre los métodos convencional y jerárquico para

el ejemplo de cinco dimensiones.

Comparando el desempeño del algoritmo tipo-backprpagation propuesto (mse:0.5070) con-

tra el método convencional de la lógica difusa (mse: 4.4919), figura 3.12, es posible observar

que podemos modelar sistemas no lineales con un número menor de reglas difusas y conse-

cuentemente, con una mayor velocidad de convergencia en el algoritmo propuesto.

3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass

Sea {x(t), t = 1, 2, 3, . . . , } una serie de tiempo, el problema de predicción en una serie detiempo puede ser formulada como la determinación del mapeo de

[x(t− (m− 1)∆t), . . . , x(t−∆t), x(t)] ∈ Rm → x(t+ ls) ∈ R.

Para verificar el mapeo, la generalización y la habilidad de aprendizaje, una estructura

jerárquica difusa es propuesta para predecir la serie de tiempo caótica de Mackey-Glass,

figura 3.13 [20].

3.4 Simulaciones 37

Fs3

Fs1

Fs2

Planta

Figura 3.13: Estructura jerárquica difusa para identificar la serie de tiempo Mackey-Glass.

La serie de Mackey-Glass es generada por la ecuación diferencial:

ẋ(t) =0,2x(t− τ)1 + x10(t− τ) .

De acuerdo con ejemplo propuesto por Chung [6], en nuestra simulación se establece que

τ = 30, m = 6, ∆t = 6, ls = 6 y un total de 1200 datos se recolectaron con el siguiente

formato

[x(t− 30), x(t− 24), x(t− 18), x(t− 12), x(t− 6), x(t);x(t+ 6)] (3.12)

en donde t = 130 − 1329. La ecuación (3.12), corresponde al problema de un mapeo de 6entradas- 1 salida.

Las figuras 3.14, 3.15, 3.16 y 3.17 muestran los resultados de la simulación para el sistema

descrito por la ecuación (3.12) correspondiente al problema de un mapeo de 6 entradas-1

salida.a través del uso de los sistemas difusos jerárquicos y el método convencional de iden-

tificación propuesto por Brown [2], Jang [10] y Lin [16]. Las figuras 3.14 y 3.15, presentan

la señal de salida para la planta y el modelo identificado a través del uso de los sistemas

jerárquicos difusos. Como se puede observar en la figura 3.15, este modelo identificado repre-

senta una mejor aproximación del mapeo de 6 entradas-1 salida con respecto a los resultados

mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.


0 200 400 600 800 1000 12000

0.2

0.4

0.6

0.8

1

1.2

1.4

Tiempo



Figura 3.14: Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas.

450 460 470 480 490 500 510 520 530 540 550

0.8

0.9

1

1.1

1.2

1.3

Tiempo



Figura 3.15: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción

en una serie de tiempo tipo Mackey-Glass cuando 0

3.4 Simulaciones 39

200 400 600 800 1000 12000

0.5

1

1.5Sistema difuso convencional

Tiempo


Figura 3.16: Identificación para un sistema difuso convencional con 12 reglas difusas.

580 590 600 610 620 630 640 650 660 670 680

0.8

0.85

0.9

0.95

1

1.05

1.1

1.15

1.2

1.25

1.3


Tiempo


Figura 3.17: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción

en una serie de tiempo tipo Mackey-Glass cuando 0


0 200 400 600 800 1000 12000

0.005

0.01

0.015

0.02

0.025

Tiempo

Err

or

med

io c

uad

rátic

o

Error medio cuadrático para la predicción de una serie de tiempo tipo Mackey-Glass

Sistema difuso jerárquicoSistema difuso convencional

Figura 3.18: Comparación del desempeño entre los métodos convencional y jerárquico para

la predicción de una serie de tiempo tipo Mackey-Glass .

Comparando nuevamente el desempeño del algoritmo tipo-backprpagation propuesto (6

reglas difusas, mse: 0.0019) con el método convencional difusa (12 reglas difusas, mse: 0.0043),

figura 3.18, es fácil observar que el modelar sistemas no lineales (serie de Mackey-Glass) me-

diante el nuevo enfoque jerárquico, evita que la base de reglas difusas sobrecargé rápidamente

la memoria de cualquier sistema de computo.

Una vez que se ha verificado la correspondencia entre el mapeo, la generalización y la

habilidad de aprendizaje entre los sistemas difusos convencionales y los sistemas difusos

jerárquicos, se está en condiciones de confirmar que el enfoque difuso jerárquico permite

modelar sistemas con una gran reducción significativa en el número de reglas difusas y por

supuesto con mayor velocidad de convergencia y cálculos en computo con respecto a los

ofrecidos por los métodos convencionales.

3.5 Conclusiones del capítulo 41

3.5. Conclusiones del capítulo

Es fácil observar que existen diversos métodos para la identificación de sistemas, los

cuales pueden ser aplicados efectivamente para resolver el problema de la identificación, sin

embargo, desde el punto de vista del diseño difuso, una de las preocupaciones importantes

en los sistemas de la lógica difusa, es el cómo reducir el número total de reglas implicadas y

el de sus correspondientes requerimientos en cómputo.

Aunque los métodos como el gradiente descendiente y el backpropagation generalmente

son usados para la identificación de los sistemas, la convergencia lenta de aprendizaje y

los mínimos locales son principalmente los inconvenientes que presentan estos algoritmos.

Debido a esto, los resultados presentados en este capítulo muestran que usando la técnica

tipo-backpropagation y el algoritmo del gradiente descendiente podemos simplificar el entre-

namiento para los sistemas difusos jerárquicos, además de reducir el número total de reglas

implicadas y el de sus correspondientes requerimientos en cómputo. Adicionalmente, el par de

ejemplos incluidos en este capítulo sirven para ilustrar la efectividad del algoritmo sugerido.

En el siguiente capítulo, la idea general de los sistemas difusos jerárquicos descrita en

este capítulo será usada para diseñar un sistema de control difuso jerárquico.

Capítulo 4

Sistemas difusos jerárquicos vía

mapeo de variables para control difuso

La tendencia actual para el desarrollo en sistemas de control es principalmente en los

sistemas no lineales. Sin embargo, si es posible aproximarlos mediante modelos lineales,

podemos aprovechar uno o más métodos de diseño bien desarrollados, Ogata [21]. En un

sentido práctico, las especificaciones de desempeño para un sistema particular sugieren que

método usar. En el caso de los sistema de control difuso, una de las preocupaciones impor-

tantes es el cómo evitar el fenómeno relacionado a la “maldición de la dimensionalidad”,

Waratt [32]. Para eliminar el problema concerniente a este fenómeno y consecuentemente los

problemas de implementación, el presente trabajo propone un enfoque nuevo para la deter-

minación de las reglas correspondientes a cada unidad lógica difusa (FLU1) de un sistema

jerárquico difuso debido a la construcción de este a partir del controlador difuso convencional,

figura 4.1.

El uso de este enfoque establece que las salidas de la capa previa y las entradas de las

capas siguientes sean definidas como variables de mapeo intermedio. Mientras tanto, las

salidas de la primera capa de unidades lógicas difusas (FLUs) y las entradas de las otras

FLUs sean simplemente definidas a través del mapeo de las variables intermedias.

1Unidad lógica difusa definida previamente en el capitulo 3

44 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Controladordifuso Planta

Controladordifuso

M1

M2

M3

Controlador difuso jerárquico

Figura 4.1: Arquitectura de un controlador difuso a) Sistema de control b) Control difuso

convencional y c) Control difuso jerárquico.

Por lo tanto, el objetivo principal de este capítulo es el de presentar una solución en

esquemas jerárquicos para la reconstrucción del controlador vía mapeo de variables con el

fin de evitar la maldición de la dimensionalidad y consecuentemente disminuir las dificultades

de diseño e implementación de los sistemas difusos.

4.1. El sistema de estructura jerárquica

Uno de los propósitos fundamentales de utilizar sistemas difusos jerárquicos (HFS), es el

de minimizar el tamaño de una base de reglas difusas mediante la eliminación de la “maldición

de la dimensionalidad”, sin embargo, a pesar de la eficiente reducción de reglas, el sistema

difuso jerárquico se torna más complejo para su diseño e implementación en los diseños de

control. Más específicamente, esta limitación se debe a que la mayoría de las unidades de la

lógica difusa (FLUs) que constituyen un (HFS), se usan como variables de entrada de las

siguiente capa jerárquica, líneas punteadas en la figura 4.2.

Debido a esto, las reglas implicadas en las capas medias de la estructura jerárquica care-

4.1 El sistema de estructura jerárquica 45

Figura 4.2: Sistema difuso jerárquico.

C.V ( Variables de consecuencia )

A.V ( Variables del antecedente escogidasde las variables de entrada de la primera capa )

Figura 4.3: Sistema de lógica difusa de estructura jerárquica.

cen de significado físico y llegan a ser tan prominentes como el gran crecimiento desmesurado

de capas en un (HFS), Brown [3] y Wang [29]. Para tratar este problema y el de su imple-

mentación, Joo (1999) [12] define que el diseño de los sistema difuso jerárquicos se debe

relacionar como un sistema de lógica difusa de estructura jerárquica (S-HFS2) tal y como se

muestra en la figura 4.3.

En la primera capa del S-HFS, todas las variables de entrada pueden ser usadas como

variables lingüísticas de antecedentes, siempre y cuando las variables del sistema sean uti-

2Structure-hierarchical fuzzy system


lizadas normalmente como variables de entrada en esta capa. En la segunda capa, las salidas

de la primer capa no deben ser utilizadas como variables lingüísticas de antecedentes ya que

estas tienen poco significado físico. En vez de esto, éstas son usadas en las partes entonces

de las reglas difusas de esta capa, conclusiones. Las variables lingüísticas de antecedentes de

la capa siguiente, por ejemplo, pueden ser seleccionadas de los representantes elegidos de las

variables de entrada de la capa anterior. Consecuentemente, sólo las variables con significado

físico se utilizan en los antecedentes de las reglas difusas y las reglas difusas que resultan

llegan a ser fáciles de diseñar. Finalmente, el uso de este esquema facilita el diseño de las

reglas difusas implicadas en las capas medias de la estructura jerárquica sin la necesidad de

reajustar o rediseñar las reglas correspondientes a cada unidad lógica difusa (FLU).

4.2. El sistema difuso limpio-jerárquico L-HFS

Como se mencionó al inicio de este capítulo, el eliminar el excedente de reglas difusas

en los sistemas difusos convencionales, consiste en la reconstrucción del controlador difuso

convencional en un controlador difuso jerárquico. En esta sección, el nuevo método basado en

el mapeo de variables se designa como un sistema difuso limpio-jerárquico, el cual, es exhibido

a fin de obtener las bases de reglas difusas correspondientes al sistema difuso jerárquico.

A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la

técnica sugerida L-HFS y después, en la siguiente sección, aplicaremos la técnica a un sistema

en particular3 a fin de obtener un sistema difuso jerárquico para el sistema.

Considere el sistema descrito en la figura 4.4 y la base de reglas difusas descrita en la

figura 4.5. De acuerdo con el sistema y la base de reglas difusas, se puede observar que

las tres variables de entrada son θ, θ̇ y x. Por otra parte, F1 y F2, se definen como las

unidades de lógica difusa (FLUs) de la primera y segunda capa respectivamente. Las salidas

lingüísticas difusas definidas en la figura 4.5, se obtienen mediante el acceso aleatorio4, las

cuales son usadas para generar una base en el mapeo de la base de reglas difusas. Como

3Sistema riel-esfera4Método usado por Lee en [19].

4.2 El sistema difuso limpio-jerárquico L-HFS 47

F1

F2

Figura 4.4: Diagrama a bloques de un sistema difuso jerárquico (HFS).

ejemplo, definamos cada variable de entrada con tres términos lingüísticos : N es negativo,

C es cero y P es positivo. De esta manera, podemos obtener 27 (3×3×3=27) reglas difusas.La reglas difusas de la figura 4.5 son las siguientes:

si θ es P , y θ̇ es P y x es P , entonces u es P ,

si θ es P , y θ̇ es C y x es P , entonces u es N ,...

si θ es N , y θ̇ es N y x es N , entonces u es N .

.

Primero, de acuerdo a la figura 4.4, las variables de entrada definidas para el módulo F1son

³θ, θ̇´. De acuerdo a la figura 4.5, uno fija los valores θ y θ̇ para escoger cada columna

vertical y comenzar el proceso de reducción como lo muestra la figura 4.6.

Intuitivamente, existen cinco tipos diferentes de renglones, por tanto, solamente necesita-

mos de cinco variables de mapeo para la salida intermedia uθ. Definiendo las cinco variables

de mapeo como Av, Bv, Cv, Dv y Ev, respectivamente (la figura 4.7 denota la relación de es-

tas variables). A continuación, seleccionemos el primer renglón de la figura 4.7 para explicar

que θ es P y que θ̇ es también P y a su vez, este es mapeado a la variable A. Obviamente,

de la figura 4.7, el FLU de F1 mostrado en la figura 4.8 puede ser construido a través de las


1

4

2

3

5

Figura 4.5: Reglas mediante el acceso aleatorio.

1

4

2

3

5

Figura 4.6: El proceso de reducción.


N N

N N

N N N

N N N

N N N

C

C C

C

C C

P P

P

P

P

P P

P

Av

Dv

Bv

Cv

Ev

Figura 4.7: La relación de los renglones y las variables de mapeo.

reglas si-entonces como sigue:

si θ es P y θ̇ es P entonces u0 es Av,

si θ es P y θ̇ es C entonces u0 es Bv,...

si θ es N y θ̇ es N entonces u0 es Ev.

.

De acuerdo con la figura 4.7, la relación que existen entre u0 y x es equivalente a la relación

entre las variables de mapeo (Av, Bv, Cv, Dv y Ev ) y a x. Por tanto, la tabla de la figura

4.9 puede ser construida como sigue:

si u0 es Av y x es P entonces u es P ,

si u0 es Av y x es C entonces u es Z,...

si u0 es Ev y x es N entonces u es N .

.

Las reglas de la tabla de la figura 4.8 y 4.9 son lo que deseábamos para F1 y F2 respectiva-

mente.


Figura 4.8: Reglas para F1.

Comentario 4.1 Para comprobar que se puede conseguir el mismo modelo de entrada-salida

antes y después de aplicar el método L-HFS, supóngase que tenemos un sistema con tres

variables de entrada y una base de reglas difusas definidas por la tabla de la figura 4.5.

Mediante el método convencional de la lógica difusa de una sola capa, la salida de u puede

ser expresada como sigue:

si θ es P y θ̇ es P y x es P entonces u es P.

Sin embargo, usando método L-HFS, podemos conseguir la misma salida u mediante el uso

de la tablas de las figuras 4.8, 4.9 y 4.4 respectivamente. Por lo que la descripción es la

siguiente:

si θ es P y θ̇ es P entonces u0 es Av.

si u0 es Av y x es P entonces u es P ,

De esta descripción , es obvio que podemos conseguir al mismo modelo de la entrada-

salida antes y después la descomposición L-HFS. Por otra parte, para un sistema de tres

variables de entrada, en el sistema convencional de la lógica difusa de una sola capa, las

reglas totales son 27 (3× 3× 3). Sin embargo, usando método de L-HFS, las reglas totales


Figura 4.9: Reglas para F2.

son únicamente 24. Claramente, se ve de las tablas de la figura 4.8, 4.9 y 4.4. Eso significa

que hay 9 reglas para conseguir la salida de u0 y 15 reglas para conseguir la salida de u.

En cuanto a un sistema de n variables de entrada, el mismo modelo de la entrada-salida se

puede obtener antes y después la descomposición L-HFS y el número de reglas totales será

reducido considerablemente.

4.2.1. Algoritmo para la construcción del sistema difuso límpido-

jerárquico

Nuestro propósito en esta subsección es el presentar un algoritmo para el caso general en

la construcción de sistemas difusos jerárquicos, por lo que el procedimiento de construcción

es el siguiente:

Algoritmo 4.1 Construcción de sistemas L-HFS vía mapeo de variables.

Paso 1: Determine la forma del HFS y etiquete los FLU de 1i a ni de la i-ésima capa

como lo muestra la figura 4.10.

Paso 2: De la figura 4.10, fije las variable de entrada x1, x2 y use el proceso de reduc-

ción para obtener el mapeo de las variables de salida FLU (11). Use de manera similar el

procedimiento para ejecutar el mapeo de las variables de salida para obtener 21,31,. . .,n1.


1i

12 22 n2

11 21 31 41 n1

Figura 4.10: Diagrama de un HFS.

Paso 3: De la figura 4.10, fije las variables de entrada x1,x2,x3,x4 y utilice el proceso

de reducción para obtener el mapeo de las variables de salida FLU (12). De la misma man-

era utilice el procedimiento para ejecutar el mapeo de las variables de salida para obtener

22,32,. . .,n2.

Paso 4: Repita el procedimiento del paso anterior hasta agotar todas las combinaciones

y hasta que la segunda capa se alcance.

Paso 5: En la capa final, podemos tabular las reglas finales FLU de las salidas lingüísticas

relacionadas a las variables de mapeo de la capa anterior.

Paso 6: Si al aplicar el proceso de mapeo de reducción para la i-ésima capa FLU (1i), no

se observa reducción alguna para el mapeo de las variables de salida, redefiniremos el módulo

o los módulos correspondiente mediante el uso del operador mínimo5, aplicado a cada una de

las premisas de las reglas difusas del o de los módulos correspondientes, de tal manera que

esta operación redefina la nueva consecuencia de la regla difusa correspondiente.

Paso 7: Por último las nuevas reglas difusas se comparan mediante el uso de un índice

de aproximación, el cual, de manera simple nos lleva a un proceso de reducción sencillo para

los módulos correspondientes.

A continuación se define el proceso de reducción del índice φ.

5Vea [14] y [15] para más información acerca del operador.


1 µ (x)

0.5

A

Figura 4.11: Un número triangular difuso en donde a1, a2 y a3 describen respectivamente la

tripleta (a1, a2, a3).

Definición 4.1 Sean las reglas mostradas en las ecuaciones 4.1 y 4.2, la i-ésima y j-ésima

regla difusa correspondientes a una base de reglas difusa de tipo MISO.

Ri : Si u1 es Aj1 y u2 es A

k2 y ... y un es A

ln, entonces yi es B

ri (4.1)

Rj : Si u1 es Aj1 y u2 es A

k2 y ... y un es A

ln, entonces yj es B

sj (4.2)

Se dice que Bsj = Bri si Z

µRi

α (x)dx =

ZµR

j

β (x)dx (4.3)

y además existe un índice φ ∈ R, tal que3X

i=1

|αi − βi| < φ (4.4)

en donde 4.3 denota el área bajo la curva de las funciones de membresía µRi

α (x) y µRj

β (x).

Note que para el índice de la ecuación (4.4), αi y βi representan los valores correspondiente

a las tripleta definidas por las funciones de membresía µRi

α = mı́nnµAj1

, µAk2 , ..., µAln

oy

µRj

β = mı́nnµAj1

, µAk2 , ..., µAln

orespectivamente, figura 4.11.

A continuación para validar el desempeño de los sistemas difusos jerárquicos en los sistema

de control difuso se desarrolla un ejemplo para mostrar la efectividad del método en el sistema

riel-esfera propuesto por Ortiz [22].


Figura 4.12: Sistema riel-esfera.

4.3. Aplicación del L-HFS al sistema riel-esfera

El objetivo central de esta sección es el de presentar la construcción de un controlador

difuso jerárquico mediante el uso de la técnica L-HFS. En esta sección, consideraremos el

sistema no lineal riel-esfera como ejemplo de un sistema difuso convencional y posteriormente

aplicaremos la técnica propuesta al sistema en particular a fin de obte

Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...

Documents

Transcript of Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...