Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...

102
CENTRO DE INVESTIGACIÓN Y DE ESTUDIOS AVANZADOS DEL INSTITUTO POLITÉCNICO NACIONAL DEPARTAMENTO DE CONTROL AUTOMÁTICO Sistemas difusos jerárquicos para modelado y control TESIS QUE PRESENTA EL: Ing. Fernando Gómez Salas PARA OBTENER EL GRADO DE MAESTRO EN CIENCIAS EN LA ESPECIALIDAD DE CONTROL AUTOMÁTICO DIRECTOR DE TESIS: Dr. Wen Yu Liu México, D.F. Octubre del 2005

Transcript of Sistemas difusos jerárquicos para modelado y controlyuw/pdf/MaTesGSFJ.pdf.pdfsatelital de altitud,...

  • CENTRO DE INVESTIGACIÓN Y DE ESTUDIOS AVANZADOS

    DEL INSTITUTO POLITÉCNICO NACIONAL

    DEPARTAMENTO DE CONTROL AUTOMÁTICO

    Sistemas difusos jerárquicos para modelado y control

    TESIS QUE PRESENTA EL:

    Ing. Fernando Gómez Salas

    PARA OBTENER EL GRADO DE

    MAESTRO EN CIENCIAS

    EN LA ESPECIALIDAD DE

    CONTROL AUTOMÁTICO

    DIRECTOR DE TESIS:

    Dr. Wen Yu Liu

    México, D.F. Octubre del 2005

  • Dedicatoria

    A toda mi familia , por haberme apoyado en todo momento para el logro de mis objetivos.

  • ii

  • Agradecimientos

    Deseo expresar mi gratitud a los esfuerzos de la gente que devotamente me ayudaron a

    la realización de esta tesis

    CINVESTAV: Antonio Osorio Cordero, José de Jesús Mesa Serrano, Noemí García

    Gutiérrez, Graciela Meza Castellanos, Carlos Guerrero Rojo y Sheila Montiel.

    A mis asesores: Dr. Francisco José Ruiz Sánchez y al Dr. Ieroham Barouh por las

    críticas constructivas para mejorar el presente trabajo

    A Mis amigos : Beto, Edgar, Armando, Gabriela, Roxana, Omar, Laura, Saraí, Rosa,

    Sheila y Rigoberto.

    Mil gracias a mi familia: A mis abuelos Jorge Salas y Margarita Zúñiga, a mis padres

    Antonia Salas y Ernesto Gómez, a mis tíos Roberto Salas, Carmen Salas y Miguel Salas, a

    mi hermano Israel Gómez y a mis primos Zoe, Zaira, Laura, Pepe y Bruno.

    Por último mi especial gratitud al Dr. Wen Yu Liu por dirigirme en este trabajo de tesis

    y enseñarme lo difuso que suele ser la vida.

    Mil gracias al CONACYT por apoyarme con una beca, sin la cuál no hubiera sido posible

    terminar este trabajo de tesis y al departamento de Control Automático por proporcionarme

    los medios necesarios para mi formación académica y por las facilidades otorgadas durante

    mi estancia.

  • iv

  • Resumen

    En este trabajo se presenta un algoritmo jerárquico de aprendizaje tipo backpropagation

    para la identificación de sistemas sin utilizar estructuras complejas de entrenamiento y un

    algoritmo para el diseño de controladores difusos jerárquico. Este nuevo esquema de apren-

    dizaje es aplicado a sistemas de identificación vía aprendizaje difuso jerárquico. El algoritmo

    de aprendizaje emplea un factor de aprendizaje de tiempo variable, el cual es determinado

    a partir de los datos de entrada-salida y a partir de la estructura del sistema. Este método

    sugiere ser más sencillo que el aprendizaje normal debido a su estructura jerárquica, lo que

    implica que podemos entrenar exactamente los parámetros de cada sub-bloque del sistema

    jerárquico independientemente. Por otra parte, el algoritmo para el diseño de controladores

    difusos jerárquicos es desarrollado de tal forma que uno puede fácilmente diseñar las reglas

    difusas del sistema en forma jerárquica mediante el uso del método de mapeo de variables

    y un índice de aproximación φ. En contraste con el método convencional de una sola capa,

    el nuevo método llamado jerárquico, posee la gran ventaja de que el número de reglas del

    sistema solamente se incrementa linealmente con el número de variables de entrada.

    La efectividad del método propuesto para la identificación de sistemas se verifica a través

    de un ejemplo de cinco dimensiones y mediante la predicción de una serie de tiempo de tipo

    Mackey-Glass. De manera similar para mostrar la efectividad del algoritmo correspondiente

    al diseño de controladores difusos jerárquicos, el algoritmo propuesto se valida a través del

    diseño de un controlador difuso jerárquico para el sistema riel-esfera. Los resultados de las

    simulaciones se presentan para ilustrar la efectividad y la confiabilidad de estos algoritmos.

  • vi

  • Índice general

    1. Introducción 1

    1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

    1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.3. Descripción de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2. Sistemas difusos 7

    2.1. Estructura de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . 7

    2.1.1. Fuzzificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2.1.2. Mecanismo de inferencia difusa . . . . . . . . . . . . . . . . . . . . . 9

    2.1.3. Defuzzicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    2.2. Tipos de Sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2.2.1. Mamdani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2.2.2. Takagi-Sugeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.3. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    3. Sistemas difusos jerárquicos vía aprendizaje para identificación de sis-

    temas 19

    3.1. El sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    3.2. Identificación de sistemas vía aprendizaje difuso jerárquico . . . . . . . . . . 21

    3.2.1. Error backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    3.2.2. Algoritmo para identificación de sistemas no lineales . . . . . . . . . 28

  • viii ÍNDICE GENERAL

    3.3. Aprendizaje de un controlador en sistemas difusos . . . . . . . . . . . . . . . 30

    3.4. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    3.4.1. Ejemplo de cinco dimensiones . . . . . . . . . . . . . . . . . . . . . . 32

    3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass . . . . . . . . . 36

    3.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    4. Sistemas difusos jerárquicos vía mapeo de variables para control difuso 43

    4.1. El sistema de estructura jerárquica . . . . . . . . . . . . . . . . . . . . . . . 44

    4.2. El sistema difuso limpio-jerárquico L-HFS . . . . . . . . . . . . . . . . . . . 46

    4.2.1. Algoritmo para la construcción del sistema difuso límpido-jerárquico . 51

    4.3. Aplicación del L-HFS al sistema riel-esfera . . . . . . . . . . . . . . . . . . . 53

    4.3.1. El sistema riel-esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    4.3.2. Implementación del algoritmo L-HFS . . . . . . . . . . . . . . . . . . 55

    4.4. Aplicación en tiempo real . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    4.4.1. Descripción del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    4.4.2. Construcción del controlador difuso jerárquico para el sistema riel-esfera 67

    4.4.3. Implementación al sistema real y resultados experimentales . . . . . . 73

    4.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

    5. Conclusiones y trabajos futuros 81

    5.1. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

  • Índice de figuras

    2.1. Esquema general del control difuso. . . . . . . . . . . . . . . . . . . . . . . . 8

    2.2. Función de membresía del singleton. . . . . . . . . . . . . . . . . . . . . . . . 9

    3.1. (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-

    sentación para el sistema lógico difuso convencional de una sola capa. . . . . 20

    3.2. Sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    3.3. Un sistema difuso jerárquico para identificación. . . . . . . . . . . . . . . . . 26

    3.4. Entrenamiento en el caso general para la identificación de sistemas. . . . . . 29

    3.5. Diagrama a bloques que representa el aprendizaje de tipo Off-Line. . . . . . . 30

    3.6. Entrenamiento para sistemas de control usando sistemas difusos jerárquicos. 31

    3.7. Estructura jerárquica difusa para identificar el sistema no lineal definido por

    ( 3.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    3.8. Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas. 34

    3.9. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco

    dimensiones cuando 0

  • x ÍNDICE DE FIGURAS

    3.14. Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas. 38

    3.15. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predic-

    ción en una serie de tiempo tipo Mackey-Glass cuando 0

  • ÍNDICE DE FIGURAS xi

    4.18. Reestructura para la base de reglas de una sola capa . . . . . . . . . . . . . . 63

    4.19. Nuevas reglas para Fr, Fθ y Fu. . . . . . . . . . . . . . . . . . . . . . . . . . 64

    4.20. Funciones de membresía para las variables de salida; (a) Funciones de salidas

    (b) Gráfica de la operación ( P OR PG ); (c) Gráfica de la operación ( P OR

    NG ); (d) Gráfica de la operación ( PG OR N ); (e) Gráfica de la operación

    ( PG OR PG ) y (f) (b) Gráfica de la operación ( NG OR NG ). . . . . . . 64

    4.21. Descripción del sistema riel esfera. . . . . . . . . . . . . . . . . . . . . . . . 66

    4.22. Estructura del jerárquica para el sistema barra-esfera en tiempo real. . . . . . 67

    4.23. Reglas difusas para el ejemplo en tiempo real del sistema riel-esfera . . . . . . 69

    4.24. Unidades Fr, Fθ y Fu para el sistema barra-esfera. . . . . . . . . . . . . . . . 70

    4.25. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías

    de entrada para la variable r (b) Membresías de entrada para la variable ṙ (c)

    Producto algebraico A∗ = A ·B y (c) Producto algebraico B∗ = C ·D. . . . . 724.26. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías

    de entrada para la variable θ (b) Membresías de entrada para la variable θ̇ (c)

    Producto algebraico C∗ = E · F y (c) Producto algebraico D∗ = G ·H. . . . . 724.27. El sistema riel-esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

    4.28. Diagrama a bloques en simulink para el controlador en tiempo real del sistema

    riel-esfera usado por Ortiz [22]. . . . . . . . . . . . . . . . . . . . . . . . . . 74

    4.29. Diagrama de bloques en simulink para el controlador en tiempo real del sistema

    riel-esfera jerárquico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    4.30. Diagrama de bloques en simulink para el controlador en tiempo real del sistema

    riel-esfera de lógica convencional. . . . . . . . . . . . . . . . . . . . . . . . . 76

    4.31. Resultados de la aplicación en tiempo real del sistema barra-esfera. (a) Sistema

    difuso jerárquico de 12 reglas y (b) sistema difuso convencional de una sola

    capa de 16 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    4.32. Señal de control (a) para el sistema difuso jerárquico y (b) para el sistema

    convencional de la lógica difusa. . . . . . . . . . . . . . . . . . . . . . . . . . 77

    4.33. Salida de control PD-difuso para el sistema riel-esfera. . . . . . . . . . . . . 78

  • xii ÍNDICE DE FIGURAS

    4.34. Salida de control PD para el sistema riel-esfera. . . . . . . . . . . . . . . . . 78

  • Capítulo 1

    Introducción

    Desde que el control difuso fue propuesto por E. H. Mamdani en 1974, diferentes estu-

    dios aplicados a la teoría del control difuso han mostrado que el aprendizaje difuso y/o los

    algoritmos de control difuso son de las áreas más activas y fructíferas de la investigación en

    los últimos años dentro del campo de la lógica difusa. A partir de la década de los ochentas,

    la lógica difusa ha desempeñado una función vital en el avance de soluciones prácticas y sen-

    cillas para una gran diversidad de aplicaciones en la ingeniería y la ciencia. Debido a su gran

    importancia en los sistemas de navegación de vehículos espaciales, control de vuelo, control

    satelital de altitud, control de velocidad en mísiles y similares, el área de la lógica difusa se

    ha vuelto una parte importante e integral de los procesos industriales y de manufactura.

    Desde el punto de vista conceptual, el diseño de sistemas difusos a partir de los pares

    de entrada-salida, han sido clasificados en dos tipos. El primer tipo de clasificación sugiere

    que las reglas del tipo Si− entonces sean generadas a través de los pares de entrada-saliday la estructura del sistema difuso sea construida a partir de estas reglas, del mecanismo

    de inferencia difusa, del fuzzificador y del defuzzificador. En la segunda clasificación, la

    estructura del sistema difuso se especifica primeramente por lo que algunos parámetros en la

    estructura difusa son libres de cambio y estos se determinan de acuerdo a los pares de entrada-

    salida. Aunque regularmente algunas aplicaciones del control difusos a procesos industriales

    han producido resultados superiores a sus equivalentes obtenidos por el control clásico [25],

  • 2 Introducción

    el dominio de estas aplicaciones ha experimentado una seria limitación al expander este a

    sistemas más complejos, debido a que aún no existe una teoría completa para determinar el

    rendimiento del sistemas a partir del cambio en sus parámetros o variables.

    Sin embargo, al expandir algunas de estas aplicaciones a sistemas más complejos, el

    número de reglas difusas relacionadas con el proceso se incrementan de forma exponencial

    con el número de variables relacionadas al sistema. Específicamente este problema llamado

    la maldición de la dimensionalidad1 establece que con el uso de n variables y m conjuntos

    definidos por cada variable, se necesitarían mn reglas difusas para construir un controlador

    difuso completo, i.e., conforme n crece, la base de reglas rápidamente sobrecarga la memoria

    de cualquier dispositivo de computo haciendo que el controlador difuso sea difícil de imple-

    mentar además de que se define un tiempo de respuesta imposible para procesos rápidos en

    tiempo real [37] [35] [36].

    Para tratar este problema Raju, Zhou, y Kisner propusieron el uso de sistemas difusos

    jerárquicos [37] [3], los cuales consisten en un número de sistemas difusos de baja dimensión

    conectados uno a otro de forma jerárquica. La ventaja que propone este enfoque jerárquico

    para los sistema difusos, es que el número total de reglas difusas del controlador se incrementa

    solamente de forma lineal con el número de variables de entrada y por tanto que sea más

    sencillo de implementar reduciendo así el costo computacional y consecuentemente el tiempo

    de computo.

    1.1. Motivación

    Debido al efecto tecnológico causado por el uso de las computadoras a partir de la década

    de los 80´s y 90´s, el uso de controladores automáticos asistidos por microcomputadoras

    ha crecido considerablemente en muchas de las aplicaciones industriales y militares de la

    actualidad. En la gran mayoría de los casos, un control computarizado genera una acción

    rápida y precisa de control para sistemas de control basados en la experiencia, sin embargo

    1Esta expresión no es única de los sistema difusos y establece lo siguiente:

    “La complejidad de un problema incrementa exponencialmente con el número de variables relacionadas”.

  • 1.1 Motivación 3

    estas acciones se realizan generalmente con una baja calidad en el control comparadas con

    la habilidad mostrada por un operador humano experto. Para resolver este problema, los

    métodos del control difuso hicieron posible que los ingenieros tuvieran herramientas para

    diseñar sistemas de control de excelente calidad, sin embargo, conforme las plantas modernas

    con múltiples entradas y salidas se han vuelto más y más complejas, la implementación de este

    tipo de controladores se ha tornado más difícil debido a la maldición de la dimensionalidad.

    Las limitaciones causadas por la maldición de la dimensionalidad, sugirieron una nueva

    metodología para el diseño de sistema difusos a través del uso de una estructura jerárquica.

    Aunque los sistemas difusos jerárquicos denotan ser la mejor opción para evitar el crecimiento

    del número de reglas difusas de forma exponencial, algunos de estos métodos usan estructuras

    complejas y en algunos casos estos abarcan solamente algunos problemas específicos.

    La finalidad del presente trabajo, es la de dar a conocer un nuevo algoritmo jerárquico

    de aprendizaje tipo backpropagation para la identificación de sistemas no lineales sin utilizar

    estructuras complejas de entrenamiento y la de ofrecer una metodología del nuevo enfoque

    difuso jerárquico mediante el diseño un controlador difuso en tiempo real para el sistema

    riel-esfera. Este sistema se utiliza para ejemplificar y justificar el desarrollo de esta tesis,

    en particular, el prototipo esta ubicado en el Centro de Servicios Experimentales (CSE) del

    Departamento de Control Automático (DCA) del CINVESTAV-IPN.

    Finalmente mencionaremos los casos en los que es necesario utilizar sistemas difusos

    jerárquicos:

    1. En procesos complejos, gran número de variables de entrada y/o salida.

    2. En procesos no lineales complejos.

    3. Cuando la introducción de la experiencia de un “experto” se base en una gran cantidad

    de variables imprecisas obtenidos a partir de su experiencia.

    4. Cuando sea necesario optimizar recursos (memoria del controlador).

    5. En general, cuando se quieran representar y operar con una gran variedad de parámet-

    ros que tengan cierto grado de imprecisión o incertidumbre.

  • 4 Introducción

    1.2. Justificación

    Al leer algunos artículos y libros de texto referentes a la teoría del control difuso, el

    lector crea una opinión acerca de como trabaja y se desempeña el control lógico difuso. En lo

    particular, es fácil observar que la mayoría de la literatura no ofrece los suficientes conceptos

    fundamentales sobre la teoría difusa y el control difuso. Sin embargo, cuando el lector localiza

    cuales son estos conceptos, este comienza a adquirir una opinión diferente acerca de ¿cómo?

    y cuando el control difuso trabaja, además de la habilidad para reconocer cuando este es más

    práctico2 que el control convencional. De acuerdo con D. Abramovithc 1994 [1], es claro que

    la lógica difusa puede ser mucho más útil de lo que sus opositores harían creer. Cualquier

    aplicación candidata al control difuso es aquella que relacione una “interacción humana” y

    una “regla de control” previamente establecida, i.e., estos son problemas donde la diferencia

    entre el bien y el mal no es binaria. En la actualidad, el uso del control difuso convencional

    satisface el objetivo de controlar cualquier proceso basado en la información cualitativa de

    los procesos.

    Aunque el creciente número de aplicaciones de los controladores difusos han sido re-

    stringidos en gran medida a la falta de seguridad en su desempeño, en los últimos años el

    mundo actual ha sido incitado en considerar y aplicar esta área para su uso en los sistemas de

    control. En contraste con el controlador difuso convencional, el controlador difuso jerárquico

    no sólo controla el sistema deseado de forma adecuada, sino que también reduce el efecto

    causado por la maldición de la dimensionalidad, de tal forma que permite la implementación

    del controlador difuso en forma práctica y sencilla. Por otra parte, la construcción de sis-

    temas difusos en jerarquías, ofrecen la grandes recompensas de modelar no linealidades sin

    la necesidad de emplear algoritmos complejos y por supuesto el de dar soporte a algunos

    controladores convencionales en donde el margen de error es crítico.

    Finalmente existen algunos problemas, en donde, los sistema de control han sido diseñado

    específicamente para trabajar bajo el control de un operador humano. Mediante el uso de

    sensores extras y tiempos de muestreo más rápidos que los ofrecidos por un operador humano,

    2En costo e implementación.

  • 1.3 Descripción de la tesis 5

    el control difuso fácilmente ofrece el mismo desempeño realizado por este último. Es por

    tanto, que la contribución real que ofrecen los sistemas difusos jerárquicos a las áreas de la

    ingeniería, ciencia, negocios, medicina, psicología y similares, es de suma importancia en la

    actualidad.

    1.3. Descripción de la tesis

    Este trabajo de tesis que se presenta, consiste de temas distribuidos en cinco capítulos,

    divididos de la siguiente manera:

    En el capítulo 1 se realiza una breve introducción al tema de tesis. En el capítulo 2, se

    da una introducción referente al concepto de sistema difuso y a los mecanismos de inferencia

    difusa tipo Sugeno y Mamdani. El capítulo 3, muestra la motivación de utilizar los sistemas

    difusos jerárquicos para la identificación de sistemas, además de tratar el análisis completo

    para la construcción del algoritmo jerárquico de aprendizaje tipo-backpropagation para la

    identificación de sistemas. Este capítulo, también incluye un par de ejemplos para mostrar

    la efectividad de método propuesto. En el capítulo 4 se aborda el análisis y la justificación

    de los sistemas difusos jerárquicos en los esquemas de control mediante el uso de variables de

    mapeo. Este capítulo también presenta el diseño y la implementación de un algoritmo para

    el diseño de controladores difusos jerárquicos. Al final del mismo, se presenta la aplicación

    en tiempo real para mostrar la efectividad del algoritmo propuesto. Por último, el capítulo 5

    describe las conclusiones generales del trabajo realizado y las perspectivas de investigación

    para trabajos futuros.

  • 6 Introducción

  • Capítulo 2

    Sistemas difusos

    El sistema de inferencia difusa es una estructura computacional muy popular basada en

    los conceptos de la teoría difusa, en reglas del tipo si-entonces y en métodos de inferencia

    difusa. Los sistemas de inferencia difusa, actualmente han encontrado diversas aplicaciones

    exitosas dentro de una gran variedad de áreas tales como el control automático, la clasificación

    de datos, el análisis de decisiones, los sistemas expertos, la predicción de series de tiempo,

    la robótica y en el reconocimiento de patrones. A causa de su naturaleza multidisciplinaria,

    los sistemas de inferencia difusa son conocidos como sistemas experto, modelos difusos,

    controladores lógicos difusos o simplemente como sistemas difusos.

    2.1. Estructura de los sistemas difusos

    Motivado por Zadeh y validado por Mamdani, el uso de los sistemas difusos han sido

    aplicados en una gran variedad de áreas tales como el control automático, el procesamiento

    digital de señales, las comunicaciones, los sistemas expertos, la medicina, etc. Sin embargo,

    las aplicaciones más significativa de los sistemas difusos se han concentrado específicamente

    en el área del control automático.

    Esencialmente un sistema difuso, es una estructura basada en conocimiento definida

    a través de un conjunto de reglas difusas del tipo si-entonces, las cuales, contienen una

  • 8 Sistemas difusos

    Mecanismo de

    inferencia

    Base de reglas

    Fuzzificador Deffuzificador

    Proceso

    Controlador difuso

    difuso difuso

    Control actual no difusoSalida del proceso y estado

    ui yi

    Figura 2.1: Esquema general del control difuso.

    cuantificación lógica difusa de la descripción lingüística del experto de como realizar un

    control adecuado.

    La figura 2.1 ilustra el diagrama a bloques y los componentes básicos de un sistema difuso

    en donde los conjuntos clásicos Ui y Yi son llamados el universo del discurso para ui y yirespectivamente. En particular, ui ∈ Ui con i = 1, 2, 3, ..., n y yi ∈ Yi con i = 1, 2, ...,mdefinen las entradas y salidas correspondientes del sistema difuso.

    De acuerdo a la figura 2.1, es fácil observar que el sistema difuso utiliza conjuntos difusos,

    definidos por la base de reglas difusa, para cuantificar la información en la base de reglas

    y que el mecanismo de inferencia opera sobre estos conjuntos difusos para producir nuevos

    conjuntos difusos, por tanto, es necesario especificar como el sistema convertirá las entradas

    numéricas ui ∈ Ui en conjuntos difusos, un proceso llamado “fuzzificación”, tales que ellospuedan ser utilizados por el sistema difuso. De igual forma, el proceso llamado defuzzificación

    describe el mapeo de un espacio de acciones de control difuso en acciones de control no difuso.

    La defuzzificación por tanto, genera una acción de control no difusa la cual denotamos

    generalmente por ycrispq y es la mejor representación de una salida difusa inferida.

    A continuación examinaremos en detalle los elementos que conforman un sistema difuso.

  • 2.1 Estructura de los sistemas difusos 9

    Figura 2.2: Función de membresía del singleton.

    2.1.1. Fuzzificación

    El proceso de la fuzzificación consiste en una transformación de un dato o de un conjunto

    clásico a su correspondiente conjunto difuso, por tanto, denotemos por U∗i , el conjunto detodos lo posibles conjuntos difusos que pueden ser definidos por Ui y dado ui ∈ Ui, denotemosla transformación difusa de ui a un conjunto difuso por A

    fuzi , el cual es definido en el universo

    del discurso Ui.La transformación de un conjunto clásico a un conjunto difuso se produce mediante el uso

    del operador de fuzzifiaciónF , Passino [23], definido porF : Ui → U∗i en dondeF(ui) = Afuzi .Regularmente el uso del fuzzificador tipo singlenton es el más utilizado para las aplica-

    ciones en área del control automático y este es definido como un conjunto difuso Afuzi ∈ U∗icon función de membresía

    µAfuzi(x) =

    (1 si x = ui

    0 en otro caso. (2.1)

    Cualquier conjunto difuso con la forma (2.1) en su función de membresía es llamado “sin-

    glenton1”, figura (2.2).

    2.1.2. Mecanismo de inferencia difusa

    El mecanismo de inferencia difusa es el núcleo de cualquier controlador difuso. Su com-

    portamiento dinámico es en general caracterizado por un conjunto de reglas difusas de la1Note que la función discreta impulso puede ser utilizada para representar la función de membresía de

    un singlenton.

  • 10 Sistemas difusos

    forma

    Si x es A entonces y es B (2.2)

    en donde A y B son valores lingüísticos definidos por un conjunto difuso en un universo

    X y Y respectivamente. La cláusula Si, un antecedente, es una condición en el dominio de

    aplicación; la cláusula entonces, una consecuencia, es una acción de control dado al proceso

    bajo control.

    Con un conjunto de reglas difusas, el mecanismo de inferencia difusa es capaz de derivar

    una acción de control para un conjunto de valores de entrada. En otras palabras, una acción

    de control es determinada por las entradas observadas, las cuales representan el estado del

    proceso a ser controlado mediante el uso de las reglas de control.

    La expresión “Si x es A entonces y es B”, la cual se abrevia regularmente como A→ B,en esencia, es una relación binaria R de las variables x y y en el espacio del producto X×Y .Existen diversos métodos de inferencia difusa que pueden ser formulados a través de los

    operadores2 t-norma y s-norma para calcular la relación difusa R=A → B. En general, lossiguientes métodos son los más utilizados:

    1. Implicación de Dienes-Rescher [28]: En esta implicación la regla difusa (2.2) es inter-

    pretada como una relación RD en A×B con función de membresía

    µRD(x, y) = máx[1− µA(x), µB(y)] (2.3)

    2. Implicación Lukasiewics [28]: Específicamente, la regla difusa (2.2) es interpretada como

    una relación difusa RL en A×B con función de membresía

    µRL(x, y)=mı́n[1, 1− µA(x) + µB(y)] (2.4)

    3. Implicación de Zadeht [28]: Aquí la regla difusa (2.2) es interpretada como una relación

    difusa RZ en A×B con función de membresía

    µRL(x, y)máx [mı́n(µA(x), µB(y)), 1− µA(x)] (2.5)2Vea [14] y [15] para más información acerca de estos operadores.

  • 2.1 Estructura de los sistemas difusos 11

    4. Implicación Mamdani [28]: La regla difusa (2.2) es interpretada como una relación RMen A×B con función de membresía

    µRM (x, y) = mı́n [µA, µB] , ó µRM = µA(x) · µB(x) (2.6)

    Aunque estas cuatro ecuaciones representan diferentes interpretaciones de la regla di-

    fusa (2.2), la implicación de Mamdani, es la más utilizada para aplicaciones en los

    sistemas difusos, ecuación (2.6).

    En general el operador inferencia se aproxima por medio de una t-norma.

    2.1.3. Defuzzicación

    La defuzzificación es definida como un mapeo de un conjunto difuso B0 en V ⊂ R (quees la salida de la inferencia difusa) a un elemento de un conjunto clásico ycrispq = y

    ∗ ∈ V.Conceptualmente, la tarea de defuzzificar es especificar un punto, elemento de V, que reflejela mejor representación del conjunto difuso B0. A la fecha no existe un algoritmo óptimo para

    la defuzzificación, sin embargo, algunos métodos de defuzzifiacación son prácticos. Como es

    común, a continuación detallaremos dos de las técnicas más utilizadas para la defuzzificación.

    El defuzzificador centro de gravedad (COG): especifica la salida y∗ como el

    centro del área cubierta por la función de membresía del conjunto difuso B, y esta es

    dada por

    y∗ = ycrispq =

    PRi=1 b

    qi

    YyqµB̂iq(yq)dyqPR

    i=1

    Yyq(yq)dyq

    (2.7)

    en donde R es el número de reglas difusas, bqi es el centro del área de la función de

    membresía de BPq asociado con el conjunto difuso implicado B̂iq para la i − ésima

    regla3 (j, k, ..., l; p, q)i, y Yyq

    µB̂iq(yq)dyq (2.8)

    3Por simplicidad usaremos (j, k, ..., l; p, q)i = Ri para denotar la i − ésima regla difusa de una base dereglas difusa tipo MISO.

  • 12 Sistemas difusos

    denota el área bajo µB̂iq(yq). Note que el sistema difuso debe ser definido tal que

    RXi=1

    Yyq

    µB̂iq(yq)dyq 6= 0 (2.9)

    para toda ui, o la salida ycrispq , no será definida apropiadamente. Este valor no debe

    ser cero si existe una regla seleccionada para cada posible combinación de las entradas

    del sistema difuso y si todo el conjunto difuso de la consecuencias tiene área distinta

    de cero.

    Defuzzificador centro promedio: El defuzzificador centro promedio determina la

    salida clásica ycrispq usando los centros de cada salida de la funciones de membresía. El

    valor óptimo o máximo de cada conclusión es representada mediante el conjunto difuso

    implicado:

    ycrispq =

    PRi=1 b

    qi supyq

    nµB̂iq(yq)

    oPR

    i=1 supyq

    nµB̂iq(yq)

    o (2.10)donde el “sup” denota el supremo (supx {µ(x)} puede ser simplemente pensado comoal valor más alto de µ(x)) y bqi es el centro del área de la función de membresía de B

    Pq

    asociado con el conjunto de implicación difusa B̂iq para la i−ésima regla (j, k, ..., l; p, q)i.Note que el sistema difuso pude ser definido como

    RXi=1

    bqi supyq

    nµB̂iq(yq)

    o6= 0 (2.11)

    para toda ui, en donde el supyqnµB̂iq(yq)

    oes regularmente fácil de calcular si µB̂iq(yq) =

    1 para al menos un yq, entonces para varias estrategias de inferencias podemos utilizar

    los cálculos4 correspondientes para la i − ésima regla (j, k, ..., l; p, q)i por lo que elconjunto difuso de implicaciones B̂iq es definido en su función de membresía como

    µB̂iq(yq) = µi(µ1, µ2, ..., µn) ∗ µBPq (yq) (2.12)

    4Para ver los cálculos correspondientes al conjunto difuso B̂iq véase [23].

  • 2.2 Tipos de Sistemas difusos 13

    y obtener

    supyq

    nµB̂iq(yq)

    o= µi(µ1, µ2, ..., µn) (2.13)

    Por lo tanto, la ecuación para la defuzzificación centro promedio esta dada por

    ycrispq =

    PRi=1 b

    qiµi(u1, u2, ..., un)PR

    i=1 µi(u1, u2, ..., un)(2.14)

    donde se debe asegurar quePR

    i=1 µi(u1, u2, ..., un) 6= 0 para toda ui.

    2.2. Tipos de Sistemas difusos

    En estas sección se presentan los controladores difusos de tipo Mamdani y Sugeno, los

    cuales han sido utilizados exitosamente en una gran variedad de aplicaciones en la comunidad

    del control difuso. Aunque, el objetivo del controlador difuso Mamdani es el de representar

    a un exitoso operador humano, el controlador difuso de tipo Sugeno sugiere ser más eficiente

    en cálculos y en métodos de adaptación (learning).

    2.2.1. Mamdani

    En esta subsección definiremos la construcción de un sistema difuso tipo Mamdani.

    Primero, considérese una base de reglas difusas del tipo MISO descritas por (2.15)

    R1 : Si u1 es Aj1 y u2 es A

    k2 y,..., y un es A

    ln entonces y1 es B

    r1

    ...

    Rj : Si u1 es Aj1 y u2 es A

    k2 y,..., y un es A

    ln entonces yj es B

    sj

    ...

    Rm : Si u1 es Aj1 y u2 es A

    k2 y,..., y un es A

    ln entonces ym es B

    tm

    (2.15)

    en donde Aji , Ak2,..., A

    ln y B

    sj para R

    j, representan los valores lingüísticos correspondientes,

    Passino [23].

  • 14 Sistemas difusos

    Si la entrada al sistema difuso es dado por

    ui = x∗i (2.16)

    entonces, haciendo uso del fuzzificador singlenton

    µ =

    (1 si xi = x∗i0 en otro caso

    (2.17)

    se tiene que ¡ui es A

    ji

    ¢→ µAji (x

    ∗i ) (2.18)

    en donde Aji denota el valor lingüístico correspondiente a la i− ésima entrada de la j− ésimaregla difusa Rj correspondiente a la base de reglas difusas descritas por (2.15). Al hacer uso

    de la ecuación (2.16), la j − ésima regla difusa de la base de reglas (2.15) es representa por

    Rj : Si x∗1 es Aj1 y x

    ∗2 es A

    k2 y,..., y x

    ∗n es A

    ln entonces yj es B

    sj (2.19)

    en donde la operación difusa de la j − ésima regla (2.19) es definida pornYi

    µAji(x∗i ) (2.20)

    El motor de inferencia difusa que utiliza esta base de reglas difusas es el mecanismo de

    inferencia del producto o implicación de Mamdani, por lo que para la j − ésima regla setiene que:

    nYi

    µAji(x∗i )µB̃j (y) (2.21)

    y la l−regla p se obtiene mediante el operador “OR”

    µp =M

    máxl=1

    "nYi

    µAji(x∗i )µB̃j=l (y)

    #(2.22)

    en donde el índiceM representa el número de reglas para (2.15) y B̃sj denota el valor lingüís-

    tico correspondiente a la salida yj de la j − ésima regla difusa Rj, con j = l.

  • 2.2 Tipos de Sistemas difusos 15

    El método de defuzzificación puede ser obtenido suponiendo que yj es centro de B̃j, la

    altura de la l − regla del conjunto difuso esnYi

    µAji(x∗i )µBj

    ¡yj¢

    (2.23)

    y

    µB̃j¡yj¢= 1 (2.24)

    es un conjunto difuso normalizado, sustituyendo la ecuación (2.24) en la ecuación (2.23) se

    obtiene que el centro promedio es dado por

    y∗ =

    mXj=1

    yj

    ÃnYi

    µAji(x∗i )

    !mXj=1

    ÃnYi

    µAji(x∗i )

    !

    Teorema 2.1 Sistemas difusos con base de reglas difusas, mecanismos de inferencia tipo

    producto, fuzzificador singlenton y defuzzificador centro promedio poseen el siguiente mapeo

    no lineal

    ycrisp =

    mXj=1

    yj

    ÃnYi

    µAji(xi)

    !mXj=1

    ÃnYi

    µAji(xi)

    ! (2.25)

    2.2.2. Takagi-Sugeno

    El modelo difuso de Takagi-Sugeno (también conocido como modelo TKS) fue propuesto

    por Takagi, Sugeno y Kang [9], en un esfuerzo para formalizar un método sistemático para

    generar reglas difusas a partir de un conjunto de datos de entradas y salidas. Una típica

    regla difusa en el modelo de Sugeno tiene la forma

    Si x es A y y es B entonces z = f(x, y) (2.26)

  • 16 Sistemas difusos

    donde A y B son conjuntos difusos en el antecedente, mientras z = f(x, y) es una función

    clásica en la consecuencia. Usualmente f(x, y) es un polinomio en la variables de entrada x y

    y, pero este puede ser cualquier función mientras pueda describir apropiadamente la salida del

    modelo dentro de la región difusa especificada por la regla de antecedentes. Cuando f(x, y)

    es un polinomio de primer orden, el sistema resultante de inferencia difusa es llamado modelo

    difuso de Sugeno de primer orden. Cuando f es una constante, entonces tenemos un modelo

    difuso de Sugeno de orden cero, el cual puede ser visto como un caso especial de la regla de

    inferencia difusa de Mamdani, en la cual cada regla es especificada por un singletón (o una

    consecuencia pre-defuzzificadora ), o un caso especial del modelo Tsukamoto. Sin embargo,

    un modelo de Sugeno de orden cero es equivalente a una red de funciones básica radiales.

    Un caso especial del modelo difuso lingüístico se obtiene cuando la consecuencia, el con-

    junto difuso Bi, es formado por conjuntos difusos de singlentones. Estos sistemas se repre-

    sentan simplemente como números reales bi, obteniéndose las siguientes reglas:

    Ri : Si x es Ai entonces y = bi, i = 1, 2, ...,K. (2.27)

    Este modelo se llama modelo singletón. Un método simplificado de inferencia-defuzzificación

    se utiliza generalmente con este modelo:

    y =

    PKi=1 βibiPKi=1 βi

    (2.28)

    Este método de defuzzification se llama el medio difuso “fuzzy mean”. El modelo difuso del

    singleton pertenece a una clase general de las funciones aproximadoras, llamadas la extensión

    de las funciones básicas (Friedman, 1991) tomando la forma:

    y =KXi=1

    φ(x)bi (2.29)

    La mayoría de las estructuras usadas en la identificación de sistemas no lineales, tales como

    las redes neuronales artificiales, las redes neuronales de funciones básicas radiales [8], o tiras

    (splines), pertenecen a esta clase de sistemas.

  • 2.3 Conclusiones del capítulo 17

    2.3. Conclusiones del capítulo

    En este capítulo, se discutió en gran detalle la estructura de los sistemas difuso y dos

    de los mecanismos de inferencia difusa más utilizados en la comunidad del control difuso: el

    modelo difuso Sugeno y el modelo difuso Mamdani.

    De acuerdo a la primera sección, es fácil observar que el sistema de inferencia difusa es

    una de las herramientas de modelado más importantes del control difuso debido a que su

    estructura se basa estrictamente en la teoría de la lógica difusa.

    Por otra parte, los sistemas de inferencia difusa definidos aquí, basados en alguno de

    los métodos propuestos, dan la posibilidad de representar conceptualmente el mejor mapeo

    no lineal de salida de un sistema difuso con el objetivo de simular el conocimiento de un

    operador humano experto a un bajo costo y eficientemente sin la necesidad de reemplazar al

    operador debido a largas jornadas de trabajo.

    En el siguiente capítulo, el modelo de inferencia Mamdani será usa elaborar la construc-

    ción de un método tipo-backpropagation en la identificación de sistemas.

  • 18 Sistemas difusos

  • Capítulo 3

    Sistemas difusos jerárquicos vía

    aprendizaje para identificación de

    sistemas

    En los sistemas difusos convencionales o de tipo estándar, el número de reglas aumenta de

    forma exponencial con el crecimiento en el número de variables de entrada, esto es, suponga

    que existen n variables de entrada y m funciones de membresía para cada variable, entonces

    necesitaremos mn reglas para construir un controlador difuso completo y tan rápido como

    n aumente su tamaño, la base de reglas difusas sobrecargará rápidamente la memoria de

    cualquier sistema de computo y por supuesto, hará difícil la implementación del controlador

    difuso. En general, la complejidad de un problema aumenta de forma exponencial debido al

    número de las variables implicadas, este fenómeno llamado la “maldición de la dimensional-

    idad”, no es único de los sistemas difusos y es la idea original que motivó el estudio de los

    sistemas difusos jerárquicos (HFSs), Brown [3] y Zhou [37].

  • 20 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    (c)

    Figura 3.1: (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-

    sentación para el sistema lógico difuso convencional de una sola capa.

    3.1. El sistema difuso jerárquico

    Los sistemas difusos jerárquicos consisten de un número de sistemas difusos de baja

    dimensión distribuidos de forma jerárquica, los cuales, poseen la gran ventaja de que el

    número total de reglas de su base de conocimiento aumentan de forma lineal con el número

    de las variables de entrada implicadas, Zhou [37]. Esta arquitectura se representa en la figura

    3.1(a) y (b) con 4 (n = 4) variables de entradas y 5 (m = 5) funciones de membresía, se

    obtiene que cada sistema difuso de baja dimensión consiste de 52 (m2) reglas y por tanto el

    número total de reglas es 3× 52 = 75[(n− 1)m2], la cual representa una función lineal de lasn variables de entrada. En contraste con esto, podemos verificar que el número de reglas del

    sistemas difuso convencional, figura 3.1(c), es de 54 = 625 reglas y por tanto, concluir que el

    número total de reglas difusas se reduce considerablemente bajo el esquema de los sistemas

    difusos jerárquicos.

    Comentario 3.1 Los sistemas difusos jerárquicos consisten de un número de sistemas di-

  • 3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 21

    fusos de baja dimensión conectados en un arreglo jerárquico, por tanto no existe restricción

    alguna para aplicar el orden en las jerarquías, figura 3.1(a) y (b).

    Para eliminar el problema concerniente al fenómeno de la “maldición de la dimension-

    alidad” y consecuentemente los problemas de implementación, el presente trabajo propone

    un nuevo enfoque para la determinación de las reglas correspondientes a cada unidad lógica

    difusa (FLU1) de un sistema jerárquico difuso dado vía aprendizaje difuso jerárquico.

    3.2. Identificación de sistemas vía aprendizaje difuso

    jerárquico

    En los últimos años, las redes neuronales y la lógica difusa han sido clasificadas como

    aproximadores universales debido a que éstas pueden aproximar ciertas funciones no lin-

    eales a cualquier exactitud prescrita. Resultados recientes muestran que el procedimiento de

    fusión en este tipo de tecnologías parecen ser muy efectivos para la identificación de sistemas

    no lineales, Brown (1994) [2], Chen (2001) [4] y Lin (1996) [16]. Aunque los métodos co-

    mo el gradiente descendiente y el backpropagation generalmente son usados para ajustar los

    parámetros de las funciones de membresía y los pesos de defuzzificación para redes neuronales

    difusas, la convergencia lenta de aprendizaje y los mínimos locales son principalmente los

    inconvenientes que presentan estos algoritmos, Lin (1995) [17]. Debido a esto, algunas mod-

    ificaciones fueron derivadas en publicaciones recientes: En el 2001 Chen [5], sugiere una ley

    de robustez en el algoritmo backpropagation para resistir los efectos del ruido y el no aceptar

    errores derivados durante la aproximación. Por su parte, Brown (1994) [2], propone el uso de

    funciones de membresía B-spline para minimizar una función objeto robusta demostrando

    velocidad de convergencia en sus algoritmos y por último Wu (2000) [33] aplica redes neu-

    ronales del tipo RBF para determinar la estructura y los parámetros de un sistema neuronal

    difuso.

    1Fuzzy Logic Unit

  • 22 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    Analizando la bibliografía anterior se observa que existen diversos métodos correspondi-

    entes para la identificación de sistemas, los cuales pueden ser aplicados efectivamente para

    resolver el problema de la identificación, sin embargo, desde el punto de vista del diseño

    Wang (1999) en [29], señala que es muy dificil aplicar técnicas de aprendizaje a los sistemas

    difusos jerárquicos si se usa el algoritmo backpropagation, por otra parte, Yu (2004) en [31],

    demuestra que el uso de algoritmos de entrenamiento resultan ser extremadamente complejos

    aún para el caso de una red neuronal difusa de una capa y consecuentemente para el uso de

    sistemas difusos jerárquicos. Aunque usando técnicas como el backpropagation y el algoritmo

    del gradiente descendiente podemos simplificar el entrenamiento para redes neuronales mul-

    ticapas, ¿Será posible entrenar sistemas difusos jerárquicos por medio de técnicas similares?.

    Hasta ahora, lo mejor de nuestro conocimiento para el entrenamiento de los sistemas difusos

    jerárquicos es el usado algoritmo convencional del gradiente descendiente.

    Debido al problema2 que enfrenta el diseño de los sistemas difusos convencionales con una

    precisión establecida, el propósito fundamental de este capitulo, es el de introducir un método

    tipo backpropagation para la identificación de sistema vía sistemas difusos jerárquicos. En

    ciertos casos, el diseño de un sistema difuso también es limitado cuando no podemos decidir la

    función de membresía de prioridad, por lo que generalmente, se recomienda el uso del dato

    de entrada-salida para entrenar los parámetros de la función de membresía, por ejemplo

    ANFIS [10] y el aprendizaje por el método del gradiente [28], sin embargo para evitar esta

    limitación, en el presente trabajo se asume que ambas funciones de membresía, premisa y

    consecuencia, son desconocidas.

    El nuevo algoritmo que se presenta a continuación es tan sencillo que podemos entrenar

    exactamente los parámetros de cada sub-bloque independientemente con diferentes veloci-

    dades en el aprendizaje. Adicionalmente, un par de ejemplos se incluyen para ilustrar la

    efectividad del algoritmo sugerido.

    2Problema causado por la “maldición de la dimensionalidad”.

  • 3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 23

    3.2.1. Error backpropagation

    Generalmente un modelo convencional difuso con una salida es representado como una

    colección de reglas difusas en el siguiente formato (por ejemplo, el modelo difuso de Mamdani

    [28])

    Ri: Si x1 is Ai1 y · · · y xn is Ain entonces by is Bi (3.1)en donde l (i = 1, 2, . . . , l) representa las reglas difusas del tipo si-entonces para desarrollar

    un mapeo del vector lingüístico de entrada X = [x1, · · · , xn] ∈ 1) es un sistema difuso con np variables de entrada y una solasalida, por lo tanto, la base de reglas definidas para el sistema difuso de este nivel es

    construido a través de

    Ri : xp,1 es Aip,1 y . . . y xp,np1 es Aip,np1

    y ŷp−1,1 es Dip−1,1 y . . . y ŷp−1,np2 es Dip−1,np2 =⇒ ŷp es B

    ip

    en donde i = 1, . . . , lp, byp−1,j es la j− ésima salida en el nivel p−1, xp,j es la j− ésimaentrada en el nivel p, np1 + np2 = np, np1 ≥ 0 y np2 ≥ 0. Si np1 6= 0 el sistema

  • 24 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    Figura 3.2: Sistema difuso jerárquico

    jerárquico es llamado de arquitectura incremental y cuando np = np2, este es llamado

    de arquitectura agregada, Chung [6].

    Por último, la construcción continua hasta p = o.

    De acuerdo al diseño convencional de los sistemas difuso, existen varias estrategias para

    representar la salida de estos, el presente trabajo considera el uso del mecanismo de inferencia

    tipo producto, el uso del fuzzificador singlenton y del defuzzificador centro promedio por lo

    que el mapeo no lineal

    by =lP

    i=1

    wi

    "nQ

    j=1

    µAij (xj)

    #lP

    i=1

    "nQ

    j=1

    µAij (xj)

    #

    representa la salida ŷ del sistema difuso definido a partir de la base de reglas difusas definidas

    por (3.1), en donde µAij representa las funciones de membresía de los conjuntos difusos Aij y

    wi es la moda de µBi1, es decir, µBi1 = 1.

    Adicionalmente, para el sistema difuso jerárquico de la figura 3.2, se tiene que la salida

  • 3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 25

    definida para el primer nivel (p = 1) es descrita por

    by1 =l1Pi=1

    wi1

    "n1Qj=1

    µAij (xj)

    #l1Pi=1

    "n1Qj=1

    µAij (xj)

    # (3.2)en donde µAij representa las funciones de membresía de los conjuntos difusos A

    ij y wi es la

    moda de µBi1 , es decir, µBi1 = 1

    Similarmente, el p− ésimo nivel (p > 1) es dado por

    ŷp =

    lpXi=1

    wip

    "np1Yi=1

    µAip,j(xp,j)

    np2Yi=1

    µDip,j(ŷp−1,j)

    #lpXi=1

    "np1Yi=1

    µAip,j(xp,j)

    np2Yi=1

    µDip,j(ŷp−1,j)

    # (3.3)en donde µAip,j y µDip,j son las funciones de membresía de los conjuntos difusos A

    ip,j y D

    ip,j

    respectivamente y wip es la media de µBip , i.e., µBip = 1.

    A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la

    técnica sugerida “tipo-backpropagation” en los sistemas difusos jerárquicos.

    Considere los tres bloques difusos Fs1, Fs2 y Fs3 que conforman el sistema difuso

    jerárquico definido en la figura (3.3). Observe que para cada subsistema, existen l reglas

    difusas, n entradas y 1 salida. Al hacer uso del fuzzificador singlenton, de la implicación

    de Mamdani y del defuzzificador centro promedio, la salida de cada sistema difuso puede

    ser expresada como (3.2), en donde µAij = exp∙−³xj−cijσij

    ´2¸es la función de membresía del

    conjunto difuso Aij, w̄i es el punto en el cual µBi = 1 y ŷ es la salida de cada sistema difuso.

    Ahora bien, defínase

    zi(x) :=nY

    j=1

    exp

    "−µxj − cijσij

    ¶2#y ŷ =

    a

    bcon

    a :=lX

    i=1

    wizi, b :=lX

    i=1

    zi

  • 26 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    Fs3

    Fs1

    Fs2

    Planta

    Figura 3.3: Un sistema difuso jerárquico para identificación.

    El objetivo de la de identificación es el de determinar los parámetros wi, cij y σij tal que la

    salida ŷ del sistema difuso jerárquico converja a la salida de la planta y.

    Al usar la técnica del gradiente descendiente para determinar los parámetros wi, cij y σij,

    el gradiente es determinado a través del uso de la regla de la cadena, por lo que se tiene que

    ∂J

    ∂wi=

    ∂J

    ∂ŷ

    ∂ŷ

    ∂wi= (ŷ − y)

    ∂¡ab

    ¢∂wi

    =(ŷ − y)

    bzi

    y wi es actualizado por

    wi(k + 1) = wi(k) +∆wi

    = wi(k)− η ∂J∂wi

    = wi(k)− ηzi

    b(ŷ − y) (3.4)

    Para determinar los incrementos en cij y ∆cij, como

    ∂ex

    ∂x= ex, entonces

    ∂J

    ∂cij=

    ∂J

    ∂ŷ

    ∂ŷ

    ∂zi∂zi

    ∂cij= (ŷ − y)

    ∙wi

    b− a

    b2

    ¸zi

    "2

    ¡xj − cij

    ¢¡σij¢2

    #por lo que el vector cij es actualizado por

    cij(k + 1) = cij(k)− 2η(ŷ − y)zi

    (wi − ŷ)¡xj − cij

    ¢b¡σij¢2 .

  • 3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 27

    Similarmente, como

    ∂J

    ∂σij=

    ∂J

    ∂ŷ

    ∂ŷ

    ∂zi∂zi

    ∂σij= (ŷ − y)

    ∂¡ab

    ¢∂zi

    nYj=1

    exp

    "−µxj − cijσij

    ¶2#"2

    ¡xj − cij

    ¢2¡σij¢3

    #

    , σij es actualizado por

    σij(k + 1) = σij(k)− 2η(ŷ − y)zi

    (wi − ŷ)¡xj − cij

    ¢2b¡σij¢3 .

    Si definimos el error de identificación como e = ŷ(k)− y(k). El método del gradiente descen-diente puede escribirse en en términos del error

    wi(k + 1) = wi(k)− ηzi

    be (3.5)

    cij(k + 1) = cij(k)− 2ηzi(k)

    (wi(k)− ŷ(k))¡xj(k)− cij(k)

    ¢b(k)

    ¡σij(k)

    ¢2 eσij(k + 1) = σ

    ij(k)− 2ηzi(k)

    (wi(k)− ŷ(k))¡xj(k)− cij(k)

    ¢2b(k)

    ¡σij(k)

    ¢3 e.Las entradas y las salidas de cada subsistema están definidas como se muestra en la figura

    (3.3), por lo que el índice de desempeño es modificado de tal forma que J = 12(ŷ3 − y)2.

    Para el módulo Fs3, el algoritmo de aprendizaje es el mismo descrito por la ecuación (3.5),

    solamente que debemos agregar los subíndices correspondientes en cada una de las variable,

    por ejemplo, wi(k+1)→ wi3(k+1), cij(k+1)→ ci3(k+1), σij(k+1)→ σi3(k+1), x3,1 = ŷ1(k),x3,2(k) = ŷ2(k), e = ŷ3(k)− y(k) = e3 y

    ŷ3 =

    l3Xi=1

    wi3

    "n3Yi=1

    µAi3,j(x3,j)

    #l3Xi=1

    "n3Yi=1

    µAi3,j(x3,j)

    # . (3.6)Para el subsistema Fs2, si deseamos actualizar wi2, debemos calcular

    ∂J

    ∂wi2=

    ∂J

    ∂ŷ3

    ∂ŷ3∂ŷ2

    ∂ŷ2∂wi2

  • 28 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    de la figura (3.3), sabemos que ∂ŷ3∂ŷ2

    corresponde a x3,2(k), por lo que

    ∂J

    ∂ŷ3= ŷ3 − y.

    ∂ŷ3∂ŷ2

    =∂ŷ3∂zi3

    ∂zi3∂ŷ2

    =

    ∙a3b23− w

    i3

    b3

    ¸zi3

    "2ŷ2 − ci3,2¡σi3,2

    ¢2#, (3.7)

    ya que a3b23− ȳi

    b3=

    ŷ3−ȳi3b3, y

    ∂J

    ∂wi2=

    zi2b22ŷ3 − wi3

    b3zi3ŷ2 − ci3,2¡σi3,2

    ¢2 e3(k)por lo que ȳj2 es actualizado por

    wi2(k + 1) = wi2(k)− η

    zi2b22ŷ3 − wi3

    b3zi3ŷ2 − ci3,2¡σi3,2

    ¢2 e3(k). (3.8)Comparando la ecuación (3.8) con (3.4), definimos

    e2 = 2y3 − wi3

    b3zi3ŷ2 − ci3,2¡σi3,2

    ¢2 e3(k)Usando la ecuación (3.7) e2 puede escribirse como

    ∂ŷ3∂ŷ2

    e3(k). Similarmente e1 =∂ŷ3∂ŷ1

    e3(k),

    donde∂ŷ3∂ŷ1

    = 2y3 − wi3

    b3zi3ŷ2 − ci3,1¡σi3,1

    ¢2 .Así con e1(k) y e2(k) podemos entrenar el subsistema Fs1 y Fs2 independientemente por el

    algoritmo normal, Jang [10].

    3.2.2. Algoritmo para identificación de sistemas no lineales

    Nuestro propósito en esta subsección es el de presentar un algoritmo para el caso general

    de la identificación de sistemas mostrado en la figura 3.4, por lo que el procedimiento de

    entrenamiento es el siguiente:

  • 3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 29

    qp

    Figura 3.4: Entrenamiento en el caso general para la identificación de sistemas.

    Algoritmo 3.1 Algoritmo para la identificación de sistemas

    Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de

    cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico

    deben ser entradas del siguiente nivel.

    Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error

    de identificación es

    eo(k) = ŷo(k)− y(k)

    donde eo(k) es el error de identificación, ŷo(k) es la salida del sistema difuso jerárquico

    completa y y(k) es la salida de la planta. Entonces propagando el error hacia atrás se forma

    la estructura del sistema difuso jerárquico. De acuerdo con la figura (3.4), podemos calcular

    el error para el bloque p (definido como ep) formado a través del bloque q (definido como eq).

    Recordando la discusión anterior de la regla de la cadena se tiene

    ep = 2yq − wiq

    bqziqŷp − ciq,p¡σiq,p

    ¢2 eq. (3.9)Paso 3: Actualice los parámetros de la función gausiana ( funciones de membresía:

    premisa y consecuencia) para cada bloque independientemente, por lo que el algoritmo tipo

    backpropagation para p− ésimo bloque es

    wip(k + 1) = wip(k)− η

    zipbpep,

  • 30 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    Controladordifuso Planta

    HFS Σ

    Bloque de control

    Bloque de identificación

    Figura 3.5: Diagrama a bloques que representa el aprendizaje de tipo Off-Line.

    cip,j(k + 1) = cjp,i(k)− 2ηzip(k)

    ¡wip(k)− ŷp(k)

    ¢ ¡xp,j(k)− cip,j(k)

    ¢bp(k)

    ¡σip.j(k)

    ¢2 ep,σip,j(k + 1) = σ

    ip,j(k)− 2ηzip(k)

    ¡wip(k)− ŷp(k)

    ¢ ¡xp,j(k)− cip,j(k)

    ¢2bp(k)

    ¡σip,j(k)

    ¢3 ep,en donde zip =

    npYj=1

    exp

    ∙−³xp.j−cip,j

    σip,j

    ´2¸y bp =

    lpYj=1

    zip.

    Como se ha señalado, varias aplicaciones en el área del control automático y en el área

    de la identificación de sistemas han sido desarrolladas. En efecto, el uso de sistemas difusos

    jerárquicos para la identificación de sistemas es en general un método universal, el cual,

    también pude ser aplicado para el aprendizaje de controladores difusos o de tipo convencional.

    3.3. Aprendizaje de un controlador en sistemas difusos

    Basados en los resultados de la sección anterior, es fácil observar que se pueden determinar

    de manera similar al problema de identificación los parámetros wi, cij y σij tal que la salida

    û del sistema difuso jerárquico converja a la salida de un controlador convencional u, figura

    3.5. Por tanto, el propósito general de esta sección, es el de presentar el siguiente algoritmo

    para el aprendizaje de tipo off-line.

  • 3.3 Aprendizaje de un controlador en sistemas difusos 31

    qp

    Figura 3.6: Entrenamiento para sistemas de control usando sistemas difusos jerárquicos.

    Algoritmo 3.2 Aprendizaje de un controlador vía sistemas difusos jerárquicos

    Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de

    cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico

    deben ser entradas del siguiente nivel.

    Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error

    de control es

    eo(k) = ûo(k)− u(k)

    donde eo(k) es el error de control, ûo es la salida del controlador difuso jerárquico completo

    y u(k) es la salida del controlador convencional. Entonces propagando el error hacia atrás

    se forma la estructura del sistema difuso jerárquico. De acuerdo con la figura 3.6, podemos

    calcular el error para el bloque p (definido como ep) formado a través del bloque q (definido

    como eq). Recordando la discusión anterior de la regla de la cadena se tiene

    ep = 2uq − wiq

    bqziqûp − ciq,p¡σiq,p

    ¢2 eq. (3.10)Paso 3: Entrene la función gausiana ( función de membresía en la parte de la premisa

    y consecuencia) para cada bloque independientemente, para el p− ésimo bloque, el algoritmotipo backpropagation es el siguiente

    wip(k + 1) = wip(k)− η

    zipbpep,

  • 32 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    cip,j(k + 1) = cjp,i(k)− 2ηzip(k)

    ¡wip(k)− ûp(k)

    ¢ ¡xp,j(k)− cip,j(k)

    ¢bp(k)

    ¡σip.j(k)

    ¢2 ep,σip,j(k + 1) = σ

    ip,j(k)− 2ηzip(k)

    ¡wip(k)− ûp(k)

    ¢ ¡xp,j(k)− cip,j(k)

    ¢2bp(k)

    ¡σip,j(k)

    ¢3 ep,en donde zip =

    npYj=1

    exp

    ∙−³xp.j−cip,j

    σip,j

    ´2¸y bp =

    lpYj=1

    zip.

    Para validar el desempeño de los sistemas difusos jerárquicos en la identificación de

    sistemas y la efectividad del método propuesto, a continuación se presenta la simulación

    numérica con los siguientes ejemplos propuestos por Chung [6].

    3.4. Simulaciones

    El primer sistema, un ejemplo de cinco dimensiones, es usado para validar la importancia

    del método difuso jerárquico y el método de análisis correspondiente a la subsección anterior.

    Por otra parte, el segundo ejemplo, la predicción de una serie de tiempo tipo Mackey-Glass,

    es empleado para ilustrar el buen comportamiento en el aprendizaje y demostrar la excelente

    habilidad en la generalización del método tipo backpropagation.

    3.4.1. Ejemplo de cinco dimensiones

    La planta no lineal a identificar fue originalmente usada por Friedman para evaluar el

    algoritmo de modelado MARS [7], definida por

    y = 10 sin(πx1x2) + 20(x3 − 0,5)2 + 10x4 + 5x5. (3.11)

    en donde el vector de entrada es

    x(k) = [x1, x2, x3, x4, x5].

  • 3.4 Simulaciones 33

    Fs3

    Fs1

    Fs2

    Planta

    Figura 3.7: Estructura jerárquica difusa para identificar el sistema no lineal definido por (

    3.11).

    Para la identificación del sistema no lineal definido por (3.11), se utilizó el modelo de la

    estructura jerárquica difusa definido en la figura 3.7. La identificación se realizó por com-

    putadora con la ayuda de Matlab usando dos reglas difusas para cada bloque difuso jerárquico

    l1 = l2 = l3 = 2 y definiendo el número total de entradas para cada bloque como n1 = 3,

    n2 = 2 y n3 = 2. Observe que el número de entradas y de reglas difusas definidas en cada

    bloque difuso pueden ser definidas arbitrariamente por ejemplo l1 = l2 = l3 = 3 y n1 = 2,

    n2 = 2 y n3 = 3 , sin embargo, para mostrar la efectividad del algoritmo en la reducción de

    las reglas difusas se utiliza el formato propuesto. La simulación utiliza 200 datos de entre-

    namiento para el ejemplo, en donde la señal de entrada para el entrenamiento es aleatoria

    en el rango de [0, 1].

    Las figuras 3.8, 3.9, 3.10 y 3.11 muestran los resultados de la simulación numérica para

    el sistema descrito por la ecuación (3.11) a través del uso de sistemas difusos jerárquicos y

    el método convencional de identificación propuesto por Brown [2], Jang [10] y Lin [16]. En

    las figuras 3.8 y 3.9, se presentan la salida de la planta y el modelo identificado a través del

    uso de los sitemas jerárquicos difusos. Como se puede observar en la figura 3.9, este modelo

    identificado representa una mejor aproximación de la planta no lineal con respecto a los

    resultados mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.

  • 34 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    0 20 40 60 80 100 120 140 160 180 2000

    5

    10

    15

    20

    25

    30Sistema difuso jerárquico

    Tiempo

    Salida de la plantaModelo identificado

    Figura 3.8: Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas.

    5 10 15 20 25 30 35 40 45 50 55

    5

    10

    15

    20

    25

    Sistema difuso jerárquico

    Tiempo

    Salida de la plantaModelo identificado

    Figura 3.9: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco

    dimensiones cuando 0

  • 3.4 Simulaciones 35

    0 20 40 60 80 100 120 140 160 180 200-5

    0

    5

    10

    15

    20

    25

    30

    Tiempo

    Sistema difuso convencional

    Salida de la plantaModelo identificado

    Figura 3.10: Identificación para un sistema difuso convencional con 12 reglas difusas.

    5 10 15 20 25 30 35 40 45 50 55-5

    0

    5

    10

    15

    20

    25

    Tiempo

    Sistema difuso convencional

    Salida de la plantaModelo identificado

    Figura 3.11: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco

    dimensiones cuando 0

  • 36 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    0 20 40 60 80 100 120 140 160 180 2000

    10

    20

    30

    40

    50

    60

    Tiempo

    Err

    or

    cuad

    rátic

    o m

    edio

    Error cuadrático medio para el ejemplo de cinco dimensiones

    Sistema difuso jerárquicoSistema difuso convencional

    Figura 3.12: Comparación del desempeño entre los métodos convencional y jerárquico para

    el ejemplo de cinco dimensiones.

    Comparando el desempeño del algoritmo tipo-backprpagation propuesto (mse:0.5070) con-

    tra el método convencional de la lógica difusa (mse: 4.4919), figura 3.12, es posible observar

    que podemos modelar sistemas no lineales con un número menor de reglas difusas y conse-

    cuentemente, con una mayor velocidad de convergencia en el algoritmo propuesto.

    3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass

    Sea {x(t), t = 1, 2, 3, . . . , } una serie de tiempo, el problema de predicción en una serie detiempo puede ser formulada como la determinación del mapeo de

    [x(t− (m− 1)∆t), . . . , x(t−∆t), x(t)] ∈ Rm → x(t+ ls) ∈ R.

    Para verificar el mapeo, la generalización y la habilidad de aprendizaje, una estructura

    jerárquica difusa es propuesta para predecir la serie de tiempo caótica de Mackey-Glass,

    figura 3.13 [20].

  • 3.4 Simulaciones 37

    Fs3

    Fs1

    Fs2

    Planta

    Figura 3.13: Estructura jerárquica difusa para identificar la serie de tiempo Mackey-Glass.

    La serie de Mackey-Glass es generada por la ecuación diferencial:

    ẋ(t) =0,2x(t− τ)1 + x10(t− τ) .

    De acuerdo con ejemplo propuesto por Chung [6], en nuestra simulación se establece que

    τ = 30, m = 6, ∆t = 6, ls = 6 y un total de 1200 datos se recolectaron con el siguiente

    formato

    [x(t− 30), x(t− 24), x(t− 18), x(t− 12), x(t− 6), x(t);x(t+ 6)] (3.12)

    en donde t = 130 − 1329. La ecuación (3.12), corresponde al problema de un mapeo de 6entradas- 1 salida.

    Las figuras 3.14, 3.15, 3.16 y 3.17 muestran los resultados de la simulación para el sistema

    descrito por la ecuación (3.12) correspondiente al problema de un mapeo de 6 entradas-1

    salida.a través del uso de los sistemas difusos jerárquicos y el método convencional de iden-

    tificación propuesto por Brown [2], Jang [10] y Lin [16]. Las figuras 3.14 y 3.15, presentan

    la señal de salida para la planta y el modelo identificado a través del uso de los sistemas

    jerárquicos difusos. Como se puede observar en la figura 3.15, este modelo identificado repre-

    senta una mejor aproximación del mapeo de 6 entradas-1 salida con respecto a los resultados

    mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.

  • 38 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    0 200 400 600 800 1000 12000

    0.2

    0.4

    0.6

    0.8

    1

    1.2

    1.4

    Tiempo

    Sistema difuso jerárquico

    Salida de la plantaModelo identificado

    Figura 3.14: Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas.

    450 460 470 480 490 500 510 520 530 540 550

    0.8

    0.9

    1

    1.1

    1.2

    1.3

    Tiempo

    Sistema difuso jerárquico

    Salida de la plantaModelo identificado

    Figura 3.15: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción

    en una serie de tiempo tipo Mackey-Glass cuando 0

  • 3.4 Simulaciones 39

    200 400 600 800 1000 12000

    0.5

    1

    1.5Sistema difuso convencional

    Tiempo

    Salida de la plantaModelo identificado

    Figura 3.16: Identificación para un sistema difuso convencional con 12 reglas difusas.

    580 590 600 610 620 630 640 650 660 670 680

    0.8

    0.85

    0.9

    0.95

    1

    1.05

    1.1

    1.15

    1.2

    1.25

    1.3

    Sistema difuso convencional

    Tiempo

    Salida de la plantaModelo identificado

    Figura 3.17: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción

    en una serie de tiempo tipo Mackey-Glass cuando 0

  • 40 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

    0 200 400 600 800 1000 12000

    0.005

    0.01

    0.015

    0.02

    0.025

    Tiempo

    Err

    or

    med

    io c

    uad

    rátic

    o

    Error medio cuadrático para la predicción de una serie de tiempo tipo Mackey-Glass

    Sistema difuso jerárquicoSistema difuso convencional

    Figura 3.18: Comparación del desempeño entre los métodos convencional y jerárquico para

    la predicción de una serie de tiempo tipo Mackey-Glass .

    Comparando nuevamente el desempeño del algoritmo tipo-backprpagation propuesto (6

    reglas difusas, mse: 0.0019) con el método convencional difusa (12 reglas difusas, mse: 0.0043),

    figura 3.18, es fácil observar que el modelar sistemas no lineales (serie de Mackey-Glass) me-

    diante el nuevo enfoque jerárquico, evita que la base de reglas difusas sobrecargé rápidamente

    la memoria de cualquier sistema de computo.

    Una vez que se ha verificado la correspondencia entre el mapeo, la generalización y la

    habilidad de aprendizaje entre los sistemas difusos convencionales y los sistemas difusos

    jerárquicos, se está en condiciones de confirmar que el enfoque difuso jerárquico permite

    modelar sistemas con una gran reducción significativa en el número de reglas difusas y por

    supuesto con mayor velocidad de convergencia y cálculos en computo con respecto a los

    ofrecidos por los métodos convencionales.

  • 3.5 Conclusiones del capítulo 41

    3.5. Conclusiones del capítulo

    Es fácil observar que existen diversos métodos para la identificación de sistemas, los

    cuales pueden ser aplicados efectivamente para resolver el problema de la identificación, sin

    embargo, desde el punto de vista del diseño difuso, una de las preocupaciones importantes

    en los sistemas de la lógica difusa, es el cómo reducir el número total de reglas implicadas y

    el de sus correspondientes requerimientos en cómputo.

    Aunque los métodos como el gradiente descendiente y el backpropagation generalmente

    son usados para la identificación de los sistemas, la convergencia lenta de aprendizaje y

    los mínimos locales son principalmente los inconvenientes que presentan estos algoritmos.

    Debido a esto, los resultados presentados en este capítulo muestran que usando la técnica

    tipo-backpropagation y el algoritmo del gradiente descendiente podemos simplificar el entre-

    namiento para los sistemas difusos jerárquicos, además de reducir el número total de reglas

    implicadas y el de sus correspondientes requerimientos en cómputo. Adicionalmente, el par de

    ejemplos incluidos en este capítulo sirven para ilustrar la efectividad del algoritmo sugerido.

    En el siguiente capítulo, la idea general de los sistemas difusos jerárquicos descrita en

    este capítulo será usada para diseñar un sistema de control difuso jerárquico.

  • 42 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

  • Capítulo 4

    Sistemas difusos jerárquicos vía

    mapeo de variables para control difuso

    La tendencia actual para el desarrollo en sistemas de control es principalmente en los

    sistemas no lineales. Sin embargo, si es posible aproximarlos mediante modelos lineales,

    podemos aprovechar uno o más métodos de diseño bien desarrollados, Ogata [21]. En un

    sentido práctico, las especificaciones de desempeño para un sistema particular sugieren que

    método usar. En el caso de los sistema de control difuso, una de las preocupaciones impor-

    tantes es el cómo evitar el fenómeno relacionado a la “maldición de la dimensionalidad”,

    Waratt [32]. Para eliminar el problema concerniente a este fenómeno y consecuentemente los

    problemas de implementación, el presente trabajo propone un enfoque nuevo para la deter-

    minación de las reglas correspondientes a cada unidad lógica difusa (FLU1) de un sistema

    jerárquico difuso debido a la construcción de este a partir del controlador difuso convencional,

    figura 4.1.

    El uso de este enfoque establece que las salidas de la capa previa y las entradas de las

    capas siguientes sean definidas como variables de mapeo intermedio. Mientras tanto, las

    salidas de la primera capa de unidades lógicas difusas (FLUs) y las entradas de las otras

    FLUs sean simplemente definidas a través del mapeo de las variables intermedias.

    1Unidad lógica difusa definida previamente en el capitulo 3

  • 44 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    Controladordifuso Planta

    Controladordifuso

    M1

    M2

    M3

    Controlador difuso jerárquico

    Figura 4.1: Arquitectura de un controlador difuso a) Sistema de control b) Control difuso

    convencional y c) Control difuso jerárquico.

    Por lo tanto, el objetivo principal de este capítulo es el de presentar una solución en

    esquemas jerárquicos para la reconstrucción del controlador vía mapeo de variables con el

    fin de evitar la maldición de la dimensionalidad y consecuentemente disminuir las dificultades

    de diseño e implementación de los sistemas difusos.

    4.1. El sistema de estructura jerárquica

    Uno de los propósitos fundamentales de utilizar sistemas difusos jerárquicos (HFS), es el

    de minimizar el tamaño de una base de reglas difusas mediante la eliminación de la “maldición

    de la dimensionalidad”, sin embargo, a pesar de la eficiente reducción de reglas, el sistema

    difuso jerárquico se torna más complejo para su diseño e implementación en los diseños de

    control. Más específicamente, esta limitación se debe a que la mayoría de las unidades de la

    lógica difusa (FLUs) que constituyen un (HFS), se usan como variables de entrada de las

    siguiente capa jerárquica, líneas punteadas en la figura 4.2.

    Debido a esto, las reglas implicadas en las capas medias de la estructura jerárquica care-

  • 4.1 El sistema de estructura jerárquica 45

    Figura 4.2: Sistema difuso jerárquico.

    C.V ( Variables de consecuencia )

    A.V ( Variables del antecedente escogidasde las variables de entrada de la primera capa )

    Figura 4.3: Sistema de lógica difusa de estructura jerárquica.

    cen de significado físico y llegan a ser tan prominentes como el gran crecimiento desmesurado

    de capas en un (HFS), Brown [3] y Wang [29]. Para tratar este problema y el de su imple-

    mentación, Joo (1999) [12] define que el diseño de los sistema difuso jerárquicos se debe

    relacionar como un sistema de lógica difusa de estructura jerárquica (S-HFS2) tal y como se

    muestra en la figura 4.3.

    En la primera capa del S-HFS, todas las variables de entrada pueden ser usadas como

    variables lingüísticas de antecedentes, siempre y cuando las variables del sistema sean uti-

    2Structure-hierarchical fuzzy system

  • 46 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    lizadas normalmente como variables de entrada en esta capa. En la segunda capa, las salidas

    de la primer capa no deben ser utilizadas como variables lingüísticas de antecedentes ya que

    estas tienen poco significado físico. En vez de esto, éstas son usadas en las partes entonces

    de las reglas difusas de esta capa, conclusiones. Las variables lingüísticas de antecedentes de

    la capa siguiente, por ejemplo, pueden ser seleccionadas de los representantes elegidos de las

    variables de entrada de la capa anterior. Consecuentemente, sólo las variables con significado

    físico se utilizan en los antecedentes de las reglas difusas y las reglas difusas que resultan

    llegan a ser fáciles de diseñar. Finalmente, el uso de este esquema facilita el diseño de las

    reglas difusas implicadas en las capas medias de la estructura jerárquica sin la necesidad de

    reajustar o rediseñar las reglas correspondientes a cada unidad lógica difusa (FLU).

    4.2. El sistema difuso limpio-jerárquico L-HFS

    Como se mencionó al inicio de este capítulo, el eliminar el excedente de reglas difusas

    en los sistemas difusos convencionales, consiste en la reconstrucción del controlador difuso

    convencional en un controlador difuso jerárquico. En esta sección, el nuevo método basado en

    el mapeo de variables se designa como un sistema difuso limpio-jerárquico, el cual, es exhibido

    a fin de obtener las bases de reglas difusas correspondientes al sistema difuso jerárquico.

    A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la

    técnica sugerida L-HFS y después, en la siguiente sección, aplicaremos la técnica a un sistema

    en particular3 a fin de obtener un sistema difuso jerárquico para el sistema.

    Considere el sistema descrito en la figura 4.4 y la base de reglas difusas descrita en la

    figura 4.5. De acuerdo con el sistema y la base de reglas difusas, se puede observar que

    las tres variables de entrada son θ, θ̇ y x. Por otra parte, F1 y F2, se definen como las

    unidades de lógica difusa (FLUs) de la primera y segunda capa respectivamente. Las salidas

    lingüísticas difusas definidas en la figura 4.5, se obtienen mediante el acceso aleatorio4, las

    cuales son usadas para generar una base en el mapeo de la base de reglas difusas. Como

    3Sistema riel-esfera4Método usado por Lee en [19].

  • 4.2 El sistema difuso limpio-jerárquico L-HFS 47

    F1

    F2

    Figura 4.4: Diagrama a bloques de un sistema difuso jerárquico (HFS).

    ejemplo, definamos cada variable de entrada con tres términos lingüísticos : N es negativo,

    C es cero y P es positivo. De esta manera, podemos obtener 27 (3×3×3=27) reglas difusas.La reglas difusas de la figura 4.5 son las siguientes:

    si θ es P , y θ̇ es P y x es P , entonces u es P ,

    si θ es P , y θ̇ es C y x es P , entonces u es N ,...

    si θ es N , y θ̇ es N y x es N , entonces u es N .

    .

    Primero, de acuerdo a la figura 4.4, las variables de entrada definidas para el módulo F1son

    ³θ, θ̇´. De acuerdo a la figura 4.5, uno fija los valores θ y θ̇ para escoger cada columna

    vertical y comenzar el proceso de reducción como lo muestra la figura 4.6.

    Intuitivamente, existen cinco tipos diferentes de renglones, por tanto, solamente necesita-

    mos de cinco variables de mapeo para la salida intermedia uθ. Definiendo las cinco variables

    de mapeo como Av, Bv, Cv, Dv y Ev, respectivamente (la figura 4.7 denota la relación de es-

    tas variables). A continuación, seleccionemos el primer renglón de la figura 4.7 para explicar

    que θ es P y que θ̇ es también P y a su vez, este es mapeado a la variable A. Obviamente,

    de la figura 4.7, el FLU de F1 mostrado en la figura 4.8 puede ser construido a través de las

  • 48 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    1

    4

    2

    3

    5

    Figura 4.5: Reglas mediante el acceso aleatorio.

    1

    4

    2

    3

    5

    Figura 4.6: El proceso de reducción.

  • 4.2 El sistema difuso limpio-jerárquico L-HFS 49

    N N

    N N

    N N N

    N N N

    N N N

    C

    C C

    C

    C C

    P P

    P

    P

    P

    P P

    P

    Av

    Dv

    Bv

    Cv

    Ev

    Figura 4.7: La relación de los renglones y las variables de mapeo.

    reglas si-entonces como sigue:

    si θ es P y θ̇ es P entonces u0 es Av,

    si θ es P y θ̇ es C entonces u0 es Bv,...

    si θ es N y θ̇ es N entonces u0 es Ev.

    .

    De acuerdo con la figura 4.7, la relación que existen entre u0 y x es equivalente a la relación

    entre las variables de mapeo (Av, Bv, Cv, Dv y Ev ) y a x. Por tanto, la tabla de la figura

    4.9 puede ser construida como sigue:

    si u0 es Av y x es P entonces u es P ,

    si u0 es Av y x es C entonces u es Z,...

    si u0 es Ev y x es N entonces u es N .

    .

    Las reglas de la tabla de la figura 4.8 y 4.9 son lo que deseábamos para F1 y F2 respectiva-

    mente.

  • 50 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    Figura 4.8: Reglas para F1.

    Comentario 4.1 Para comprobar que se puede conseguir el mismo modelo de entrada-salida

    antes y después de aplicar el método L-HFS, supóngase que tenemos un sistema con tres

    variables de entrada y una base de reglas difusas definidas por la tabla de la figura 4.5.

    Mediante el método convencional de la lógica difusa de una sola capa, la salida de u puede

    ser expresada como sigue:

    si θ es P y θ̇ es P y x es P entonces u es P.

    Sin embargo, usando método L-HFS, podemos conseguir la misma salida u mediante el uso

    de la tablas de las figuras 4.8, 4.9 y 4.4 respectivamente. Por lo que la descripción es la

    siguiente:

    si θ es P y θ̇ es P entonces u0 es Av.

    si u0 es Av y x es P entonces u es P ,

    De esta descripción , es obvio que podemos conseguir al mismo modelo de la entrada-

    salida antes y después la descomposición L-HFS. Por otra parte, para un sistema de tres

    variables de entrada, en el sistema convencional de la lógica difusa de una sola capa, las

    reglas totales son 27 (3× 3× 3). Sin embargo, usando método de L-HFS, las reglas totales

  • 4.2 El sistema difuso limpio-jerárquico L-HFS 51

    Figura 4.9: Reglas para F2.

    son únicamente 24. Claramente, se ve de las tablas de la figura 4.8, 4.9 y 4.4. Eso significa

    que hay 9 reglas para conseguir la salida de u0 y 15 reglas para conseguir la salida de u.

    En cuanto a un sistema de n variables de entrada, el mismo modelo de la entrada-salida se

    puede obtener antes y después la descomposición L-HFS y el número de reglas totales será

    reducido considerablemente.

    4.2.1. Algoritmo para la construcción del sistema difuso límpido-

    jerárquico

    Nuestro propósito en esta subsección es el presentar un algoritmo para el caso general en

    la construcción de sistemas difusos jerárquicos, por lo que el procedimiento de construcción

    es el siguiente:

    Algoritmo 4.1 Construcción de sistemas L-HFS vía mapeo de variables.

    Paso 1: Determine la forma del HFS y etiquete los FLU de 1i a ni de la i-ésima capa

    como lo muestra la figura 4.10.

    Paso 2: De la figura 4.10, fije las variable de entrada x1, x2 y use el proceso de reduc-

    ción para obtener el mapeo de las variables de salida FLU (11). Use de manera similar el

    procedimiento para ejecutar el mapeo de las variables de salida para obtener 21,31,. . .,n1.

  • 52 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    1i

    12 22 n2

    11 21 31 41 n1

    Figura 4.10: Diagrama de un HFS.

    Paso 3: De la figura 4.10, fije las variables de entrada x1,x2,x3,x4 y utilice el proceso

    de reducción para obtener el mapeo de las variables de salida FLU (12). De la misma man-

    era utilice el procedimiento para ejecutar el mapeo de las variables de salida para obtener

    22,32,. . .,n2.

    Paso 4: Repita el procedimiento del paso anterior hasta agotar todas las combinaciones

    y hasta que la segunda capa se alcance.

    Paso 5: En la capa final, podemos tabular las reglas finales FLU de las salidas lingüísticas

    relacionadas a las variables de mapeo de la capa anterior.

    Paso 6: Si al aplicar el proceso de mapeo de reducción para la i-ésima capa FLU (1i), no

    se observa reducción alguna para el mapeo de las variables de salida, redefiniremos el módulo

    o los módulos correspondiente mediante el uso del operador mínimo5, aplicado a cada una de

    las premisas de las reglas difusas del o de los módulos correspondientes, de tal manera que

    esta operación redefina la nueva consecuencia de la regla difusa correspondiente.

    Paso 7: Por último las nuevas reglas difusas se comparan mediante el uso de un índice

    de aproximación, el cual, de manera simple nos lleva a un proceso de reducción sencillo para

    los módulos correspondientes.

    A continuación se define el proceso de reducción del índice φ.

    5Vea [14] y [15] para más información acerca del operador.

  • 4.2 El sistema difuso limpio-jerárquico L-HFS 53

    1 µ (x)

    0.5

    A

    Figura 4.11: Un número triangular difuso en donde a1, a2 y a3 describen respectivamente la

    tripleta (a1, a2, a3).

    Definición 4.1 Sean las reglas mostradas en las ecuaciones 4.1 y 4.2, la i-ésima y j-ésima

    regla difusa correspondientes a una base de reglas difusa de tipo MISO.

    Ri : Si u1 es Aj1 y u2 es A

    k2 y ... y un es A

    ln, entonces yi es B

    ri (4.1)

    Rj : Si u1 es Aj1 y u2 es A

    k2 y ... y un es A

    ln, entonces yj es B

    sj (4.2)

    Se dice que Bsj = Bri si Z

    µRi

    α (x)dx =

    ZµR

    j

    β (x)dx (4.3)

    y además existe un índice φ ∈ R, tal que3X

    i=1

    |αi − βi| < φ (4.4)

    en donde 4.3 denota el área bajo la curva de las funciones de membresía µRi

    α (x) y µRj

    β (x).

    Note que para el índice de la ecuación (4.4), αi y βi representan los valores correspondiente

    a las tripleta definidas por las funciones de membresía µRi

    α = mı́nnµAj1

    , µAk2 , ..., µAln

    oy

    µRj

    β = mı́nnµAj1

    , µAk2 , ..., µAln

    orespectivamente, figura 4.11.

    A continuación para validar el desempeño de los sistemas difusos jerárquicos en los sistema

    de control difuso se desarrolla un ejemplo para mostrar la efectividad del método en el sistema

    riel-esfera propuesto por Ortiz [22].

  • 54 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

    Figura 4.12: Sistema riel-esfera.

    4.3. Aplicación del L-HFS al sistema riel-esfera

    El objetivo central de esta sección es el de presentar la construcción de un controlador

    difuso jerárquico mediante el uso de la técnica L-HFS. En esta sección, consideraremos el

    sistema no lineal riel-esfera como ejemplo de un sistema difuso convencional y posteriormente

    aplicaremos la técnica propuesta al sistema en particular a fin de obte