39633286 Bases de Datos Difusas

download 39633286 Bases de Datos Difusas

of 38

Transcript of 39633286 Bases de Datos Difusas

  • 7/27/2019 39633286 Bases de Datos Difusas

    1/38

    2/2010

    Ing. Enrique Yaez

  • 7/27/2019 39633286 Bases de Datos Difusas

    2/38

    Introducciny Una de las caractersticas del lenguaje natural, que

    hace difcil su utilizacin en sistemas es su

    imprecisin. Por ejemplo conceptos como pequeoo grande, tienen significados diferentes de acuerdo alcontexto en el que se estn utilizando, e incluso dentrodel mismo contexto, pueden significar cosas diferentespara diferentes individuos.

  • 7/27/2019 39633286 Bases de Datos Difusas

    3/38

    Introducciny La teora de los conjuntos difusos desarrollada por

    Zadeh, provee una poderosa herramienta para la

    representacin y manejo de la imprecisin por lo queactualmente est siendo utilizada en varios campospara el diseo de sistemas basados en reglas difusas.

  • 7/27/2019 39633286 Bases de Datos Difusas

    4/38

    Introducciny El grado de pertenencia a un conjunto en la teora

    clsica tiene solo dos valores posibles: 0y1.

  • 7/27/2019 39633286 Bases de Datos Difusas

    5/38

    Introducciny La teora de conjuntos difusos, extiende la teora

    clsica de conjuntos al permitir que el grado de

    pertenencia de un objeto a un conjunto searepresentada como un nmero real entre 0 y 1

  • 7/27/2019 39633286 Bases de Datos Difusas

    6/38

    Conjuntos Difusosy La edad de una persona es un atributo que la

    caracteriza, entonces el concepto joven, puede ser

    representado por un conjunto difuso, de la forma:Joven = {0/15, 1/20, 1/25, 0/30}. Esto, quiere decir, quelas personas de 15 30 aos no son jvenes, pero si loson las personas de 20 25 aos. En tanto, que unapersona de 26 aos lo es con grado 0.8. En este caso elconjunto difuso es representado por valoresnumricos.

  • 7/27/2019 39633286 Bases de Datos Difusas

    7/38

    Conjuntos Difusosy El conjunto de las personas que son altas es un

    conjunto difuso, pues no est claro el lmite de altura

    que se establece a partir de que medida una persona esalta o no lo es. Ese lmite es difuso y, por lo tanto, elconjunto que lo delimita tambin lo ser. En este caso,el conjunto difuso es representado por escalaressimples.

  • 7/27/2019 39633286 Bases de Datos Difusas

    8/38

    Sistemas basados en reglas difusasy Un sistema basado en reglas difusas es un sistema

    basado en reglas donde la lgica difusa es utilizada

    como una herramienta para representar diferentesformas de conocimiento acerca del problema aresolver, as como para modelar las interacciones yrelaciones que existen entre sus variables.

  • 7/27/2019 39633286 Bases de Datos Difusas

    9/38

    Sistemas basados en reglas difusasy El modelo relacional no permiten el

    procesamiento de consultas del tipo:

    Encontrar a todos los gerentes cuyo sueldo nosea muy alto

    y Dado que ni el clculo ni el lgebra relacional, queestablecen el resultado de cualquier consulta comouna nueva relacin, tienen la capacidad de permitirconsultas de una manera difusa.

  • 7/27/2019 39633286 Bases de Datos Difusas

    10/38

    Modelos de Implementacin

    y El problema de la implementacin de los sistemasgestores de bases de datos difusas ha sido tratado endos vertientes principales:

  • 7/27/2019 39633286 Bases de Datos Difusas

    11/38

    Modelos de Implementaciny Iniciar con un sistema gestor de bases de datos relacionales

    (SGBD) con informacin precisa y desarrollar una sintaxisque permita formular consultas imprecisas, lo cual daorigen a extensiones SQL, como Fuzzy SQL, concapacidades de manejar la imprecisin.

    SGBD

    Gestor deconsultas

    imprecisas

  • 7/27/2019 39633286 Bases de Datos Difusas

    12/38

    Modelos de Implementaciny Construir un gestor de bases de datos relacionales

    difusas (SGBDRD) prototipo que implemente unmodelo concreto de base de datos relacional difusa en

    el que la informacin imprecisa pueda ser almacenada.Dentro de esta vertiente existen dos grandes ramas: Losmodelos a travs de unificacin por relaciones desimilitud y los modelos relacionales basados endistribuciones de probabilidades.

    SGBDRD

    distribuciones deprobabilidades

    relaciones desimilitud

  • 7/27/2019 39633286 Bases de Datos Difusas

    13/38

    Representacin de la informaciny Datos Precisos.

    y Manejados usualmente mediante la representacin

    provista por la base de datos relacional husped.y Datos Imprecisos.

    y Los modelos usualmente consideran dos tipos derepresentacin para los datos imprecisos adems de

    la informacin desconocida o indeterminada que semaneja mediante los tipos:

    unknown, undefined y null:

  • 7/27/2019 39633286 Bases de Datos Difusas

    14/38

    Tipo de dato Indefinido

    (undefined)

    y Cuando un atributo toma el valor undefined, esto refleja

    el hecho de que ningn valor de su dominio espermitido.

    y Por ejemplo: el nmero de telfono de alguien que notiene telfono.

  • 7/27/2019 39633286 Bases de Datos Difusas

    15/38

    Tipo de dato desconocido

    (unknown)

    y Los datos de este tipo expresan nuestra ignorancia

    sobre el valor que el atributo toma, sin embargo expresatambin que puede tomar uno de los valores deldominio.

    y Por ejemplo la fecha de nacimiento de alguien, ladesconocemos pero tiene que tener alguna.

  • 7/27/2019 39633286 Bases de Datos Difusas

    16/38

    Tipo de dato nulo (null)

    y Cuando un atributo toma el valor nulo, esto significa que

    no tenemos informacin sobre l, ya sea porque noconocemos su valor o porque es imposible asignarle unvalor del dominio.

    y Por ejemplo el email de alguien es null si desconocemossu valor o si lo tiene o no.

  • 7/27/2019 39633286 Bases de Datos Difusas

    17/38

    Operaciones relacionales difusasy Los diferentes operadores de comparacin que se

    utilizan para representar relaciones en la base de datos

    son los operadores relacionales. Para que estosfuncionen sobre informacin imprecisa es necesarioextender estos operadores.

  • 7/27/2019 39633286 Bases de Datos Difusas

    18/38

    Operaciones relacionales difusasy Igual a:

    y Este operador modela el concepto de igualdad para

    datos imprecisos.

  • 7/27/2019 39633286 Bases de Datos Difusas

    19/38

    Operaciones relacionales difusasy Aproximadamente igual:

    y Este operador define el grado en el que dos

    valores numricos (no difusos) sonaproximadamente iguales de acuerdo a si la diferenciade sus valores se encuentra dentro de un lmitepreestablecido. Y se calcula mediante la siguiente

    expresin:

  • 7/27/2019 39633286 Bases de Datos Difusas

    20/38

    l modelo GEFREDy El modelo relacional difuso GEFRED (GEneralized

    model for FuzzyRElational Databases) permiterepresentar los siguientes atributos difusos:y Atributodifuso de Tipo 1: Estos atributos son

    utilizados para representar valores precisos.

    y Atributodifusode Tipo 2: Estos atributos sonutilizados para representar valores imprecisos sobre

    referenc ial ordenado.y Atributodifusode Tipo 3: Estos atributos son

    utilizados para representar valores imprecisos sobrereferencial no ordenado.

  • 7/27/2019 39633286 Bases de Datos Difusas

    21/38

    Atributo difuso de Tipo 1y El dominioD, asociado a este tipo de atributo puede

    estar definido por:

    y valores numricos o por escalares simples, en amboscasos, el grado de posibilidad es 1, es decir con

    A(u) = 1.

  • 7/27/2019 39633286 Bases de Datos Difusas

    22/38

    Atributo difuso de Tipo 2y El dominio D, asociado a este tipo de atributo puede estar

    definido por:y valores numricos o por escalares simples, en ambos casos,

    con grado de posibilidad 1;y por etiquetas lingsticas;y por valores parcialmente desconocidos entre dos valores

    precisos;y por valores parcialmente desconocidos entre un valor preciso,

    en esos tres casos, con grado de posibilidad entre 0 y 1, es

    decir, con A (u) [0,1];y por valores desconocidos con grado de posibilidad 1;y por valores inaplicables con grado de posibilidad 0;y por valores nulos con grado de posibilidad 1.

  • 7/27/2019 39633286 Bases de Datos Difusas

    23/38

    Atributo difuso de Tipo 3y El dominio D, asociado a este tipo de atributo puede

    estar definido por:

    y

    valores excluyentes de nmeros o escalares con grado deposibilidad 1, es decir, con A (u) = 1;

    y por relaciones de similitud con grado de posibilidadentre 0 y 1, es decir, con A (u) [0,1];

    y por valores desconocidos con grado de posibilidad 1;

    y por valores inaplicables con grado de posibilidad 0

    y por valores nulos con grado de posibilidad 1.

  • 7/27/2019 39633286 Bases de Datos Difusas

    24/38

    Manejo de las BDRDy Para el manejo de las bases de datos relacionales

    difusas (BDRD) se utiliza el lenguaje Fuzzy SQL

    (FSQL) que es un lenguaje que deriva de SQL,incorporando las siguientes novedades.

  • 7/27/2019 39633286 Bases de Datos Difusas

    25/38

    Etiquetas Lingsticasy En las sentencias FSQL las etiquetas van

    precedidas del smbolo $, para poder distinguirlas

    fcilmente. Esta representada por el conjunto difusoLABEL

    y El conjunto difuso LABEL es definido por unadistribucin de posibilidad sobre un intervalo real [0,1]

    de la forma:

  • 7/27/2019 39633286 Bases de Datos Difusas

    26/38

    Etiquetas Lingsticasy Supongamos que sobre el atributo edad, adems de la etiqueta

    lingstica joven, se encuentra definidas otras dos etiquetas:maduro y mayor. La figura , muestra el dominio de la funcin

    de pertenencia para cada una de esas etiquetas. As, la edad 26tiene un grado de pertenencia 0.8 para la etiqueta lingsticajoven. Grficamente, la funcin de pertenencia, corresponde aun trapecio dado por sus 4 valores caractersticos, por ejemplo:{0/25, 1/30, 1/40, 0/45}, para la etiqueta lingstica maduro.

  • 7/27/2019 39633286 Bases de Datos Difusas

    27/38

    Relacin de similitudy Una relacin de similitud permite comparar etiquetas

    lingsticas definidas en dominios con referencial no

    ordenado. Esta relacin indica, que para cada dominio,es necesario definir una funcin de similitud quepermita medir la similitud o parecido entre dos valoresdel dominio.

    y

    Matemticamente, una funcin de similitud sr puedeser vista como el producto cartesiano sobre dosdominiosD, tal que:

  • 7/27/2019 39633286 Bases de Datos Difusas

    28/38

    Relacin de similitudy Supongamos que tenemos el atributo color de pelo, donde

    el dominio se encuentra definido por tres etiquetaslingsticas: Rubio, Moreno, y Pelirrojo. Es este caso el

    conjunto difuso definido por esas etiquetas, no seencuentra definido en un referencial ordenado, lo que hacenecesario la implementacin de una funcin de similitud,que por comodidad, normalmente se presenta en unformato de matriz, tal como lo muestra la tabla

  • 7/27/2019 39633286 Bases de Datos Difusas

    29/38

    Comparadores Difusosy Permiten comparar dos atributos o un atributo con una

    constante.

    y

    ConectivasLgicas:y Pueden usarse NOT,AND y OR, para enlazar

    condiciones difusas simples.

  • 7/27/2019 39633286 Bases de Datos Difusas

    30/38

    Umbral de Cumplimiento

    (threshold)y Tras cada condicin simple puede imponerse un

    umbral de cumplimiento mnimo (por defecto es 1),

    con el siguiente formato: THOLD

    La palabra reservada THOLD es opcional ypuede sustituirse por un comparador tradicional (=,

  • 7/27/2019 39633286 Bases de Datos Difusas

    31/38

    Constantes Difusasy Pueden usarse en el SELECT todas las constantes

    difusas ya definidas:

    y

    UNKNOWN, UNDEFINED y NULL,y $[a,b,c,d] (Distribucin de posibilidad Trapezoidal),

    y $label (Etiquetas),

    y [n,m] (Intervalo),

    y #n (valores aproximados).

  • 7/27/2019 39633286 Bases de Datos Difusas

    32/38

    Distribucin de posibilidad

    Trapezoidaly El conjunto difuso TRAPECIO es definido por una

    distribucin de posibilidad sobre un intervalo real [0,1]

    de la forma:

    y En que, para todo valor trapecio x de un atributo

    difuso Tipo 2, en un dominio ordenado U,caracterizado por el intervalo [a,b,c,d] con a

  • 7/27/2019 39633286 Bases de Datos Difusas

    33/38

    Intervaloy El conjunto difuso INTERVALO es definido por una

    distribucin de posibilidad sobre un intervalo real [0,1]

    de la forma:

    y En que, para todo valor x de un atributo difuso Tipo 2,en un dominio ordenado U, caracterizado por el

    intervalo = [n,m] con n

  • 7/27/2019 39633286 Bases de Datos Difusas

    34/38

    FuzzySQL (FSQL)y Obtener todas las personas cuya edad es

    aproximadamente 20 aos: (con grado mnimo 0.6):

    y SELECT * FROM Personas WHEREEdad FEQ #20THOLD 0.6;

  • 7/27/2019 39633286 Bases de Datos Difusas

    35/38

    FuzzySQL (FSQL)y Obtener todas las personas ms o menos Rubias

    (con grado mnimo 0.5) cuya edad es posiblemente

    superior a Joven (con grado mnimo 0.8):

    y SELECT * FROM Personas WHERE Pelo FEQ $RubioTHOLD 0.5ANDEdad FGT $Joven THOLD 0.8;

  • 7/27/2019 39633286 Bases de Datos Difusas

    36/38

    FuzzySQL (FSQL)y Equipos que tienen muchos ms de 3 (con grado

    mnimo 0.5) jugadoresAltos (con grado mnimo0.75):

    y SELECT Equipo,CDEG(*) FROM Personas GROUPBYEquipo HAVING $Muchos_Mas_Que[3] (AlturaFEQ $Alto 0.75) 0.5;

  • 7/27/2019 39633286 Bases de Datos Difusas

    37/38

    Ventajasy AlmacenarImprecisin, la informacin que

    tengamos de un atributo particular de un objeto,aunque esta informacin no sea el valor exacto.

    y Operar con esa informacin de forma coherente(especialmente en las operaciones de consulta).

    y Soporte a latomade decisionescomo una

    herramienta de consulta

  • 7/27/2019 39633286 Bases de Datos Difusas

    38/38

    Desventajasy Lenguaje de consulta incmodo, debido al gran

    nmero de parmetros que deben utilizarse

    y

    Comparadores abstractos que hacen difcil la decisinde cul debemos usar

    y Falta de estandarizacin, derivado de la pocapopularidad de este tipo de bases de datos