INTRODUCCIÓN AL ANÁLISIS DE DATOS SIMBÓLICOS€¦ · [Bravo et al. (1998)] a adaptée dans le...

22
INTRODUCCIÓN AL ANÁLISIS DE DATOS SIMBÓLICOS

Transcript of INTRODUCCIÓN AL ANÁLISIS DE DATOS SIMBÓLICOS€¦ · [Bravo et al. (1998)] a adaptée dans le...

INTRODUCCIÓN AL

ANÁLISIS DE

DATOS

SIMBÓLICOS

Objetos Simbólicos:

• Real-life objects are too complex to be represented by points in a vectorial space. [Bock&Diday, 2000]

• Symbolic objects overcome this limitation by representing concepts rather than individuals. [Bock&Diday, 2000]

• Knowledge extraction from large data bases is our main aim as in "Data Mining". [Diday, 1998]

• En análisis simbólico de datos transforma el Análisis de Datos en Minería de Datos.

Un poco de historia del ADS:

• L'ADS ou encore l'analyse des données appliquée

à des concepts, a été introduite par E.Diday [Diday

(1987a)], [Diday (1987b)], [Diday (1989)] pour

combler les insuffisances des méthodes de

l'analyse de données classique

• En analyse factorielle, l'analyse en composantes

principales (ACP) a été adaptée aux individus

décrits par un vecteur d'intervalles numériques

[Cazes et al. (1997)], [Verde et al. (1998)], [Lauro et

al. (1998)], [Chouakria (1998)], [Rodríguez 2000].

Un poco de historia del ADS: • Dans le domaine de la segmentation, [Ciampi et al.

(1995)] et [Perinel (1996)] ont développé une

extension des arbres standard de décision que

[Bravo et al. (1998)] a adaptée dans le cas de

données stratifiées.

• Les méthodes de classification ascendante telles

que les hiérarchies ou les pyramides [Diday

(1984)], [Bertrand (1986)], [Brito (1991)],

[Rodríguez (2000)] ont été récemment modifiées

dans le but d'accélérer les algorithmes et

d'améliorer l'interprétation des résultats

[Mfoumoune (1998)] et [Pak et al. (2005)].

Un poco de historia del ADS

Tabla clásica:

Symbolic Data Table:

Symbolic Object

Livraison Fournisseur Compagnie Ville

Liv1 F1 CNET Paris

Liv2 F2 MATRA Toulouse

Liv3 F3 EDF Clamart

Liv4 F1 CNET Lannion

Liv5 F3 EDF Clamart

Nous définissons: C1={Liv1,Liv2}, C2={Liv3, Liv5}, C3={Liv1, Liv3, Liv4, Liv5}.

Classe Fournisseur Compagnie Ville

C1 F1, F2 CNET,MATR

A

Paris, Toulouse

C2 F3 EDF Clamart

C3 F1,F3 CNET, EDF

Lannion,Clamart

Creando tablas simbólicas:

Creando tablas simbólicas:

Classical description of Schools

Town Nb of pupils Kind Level

Paris [320, 450] (100%)Public {1, 3}

Lyon [200, 380] (50%)Public , (50%)Private {2, 3}

Toulouse [210, 290] (50%)Public , (50%)Private {1, 2}

Symbolic description of the towns by the schools variables

Schools Town Nb of pupils Kind Level

Jaurès Paris 320 Public 1

Condorcet Paris 450 Public 3

Chevreul Lyon 200 Public 2

St Hélène Lyon 380 Private 3

St Sernin Toulouse 290 Public 1

St Hilaire Toulouse 210 Private 2

Tabla Simbólica

Base de datos

relacional

Creando tablas simbólicas:

Creando tablas simbólicas:

Creando tablas simbólicas:

¿Cómo se construyen las tablas simbólicas?

Análisis

Multivariado

Numérico

Análisis

Clásico

1002 1,600.00 Heredia 34 6486

1002 1,900.00 Alajuela 27 5367

1001 1,850.00 Alajuela 35 3245

1001 1,900.00 San Pedro 35 7635

1000 2,400.00 Grecia 39 3245

1001 1,750.00 San Pedro 28 1251

1000 2,500.00 Curridabat 36 3457

# Tarjeta Monto Sucursal Causal Id-trx

Millones…

Datos

[1.6,1.9] {Al-50%,Her-50%} 27(1/2),34(1/2) 1002

[1.75,1.9] {SP-66%,Al-33%} 28(1/3),35(2/3) 1001

[2.4,2.5] {Curr-50%,Gre-50%} 36(1/2),39(1/2) 1000

Monto Sucursal Causal # Tarjeta Análisis

Multivariado

Simbólico

Cientos…

Conceptos 534,5

122,2

255.4

Salario

From a Relational Database to a symbolic data table:

VSOG

Relational Data Base Symbolic Data Base

100% knowledge

15 Gigabyte

90 % knowledge

10.3 Megabyte

Symbolic Data Base:

Sortie Symbolique Entrée Symbolique

Principe 1

Principe 2

Principios del ADS:

Propagación

del ADS:

Admerex Data Base Example:

The RSDA Package:

Gracias….