Introduction aux classes empiétantes
description
Transcript of Introduction aux classes empiétantes
1
ENST Bretagne, département IASC
12/12/02
Introductionaux
classes empiétantes
François Brucker
Brest (Breizh)
2
ENST Bretagne, département IASC
12/12/02
‘‘Définition générale de la classification’’ : Le seul moyen de de faire une méthode instructive et naturelle,
c’est de mettre ensemble les choses qui se ressemblentet de séparer celles qui diffèrent les unes des autres.
Georges Leclerc de Buffon, naturaliste et écrivain, Histoire naturelle,1749.
2 grands types de critères :
• globaux (au niveau des classes)• locaux (au niveau des objets)
3
ENST Bretagne, département IASC
12/12/02
Une définition d’une classe
Ensemble X d’objets
Relation RSymétrique (x R y y R x)
Réflexive (x R x pour tout x de X)
On associe à R un graphe GR=(X,E)
C est une classe de X C est une clique maximale de GR
4
ENST Bretagne, département IASC
12/12/02
Une classification de (X,R)
(X,R) GR {C1, C2, …, Cp}
Ensemble de cliques maximales
5
ENST Bretagne, département IASC
12/12/02
Classification particulière
Partition
Critère global : Critère local :
Relation d’équivalence
• réflexive• symétrique• transitive
x R y et y R z x R zA B {A,B
6
ENST Bretagne, département IASC
12/12/02
non empiétance transitivité
Classe A Classe B
ami
moi
ami
7
ENST Bretagne, département IASC
12/12/02
y
x
z
t
On regarde par rapport à 2 éléments
Relation 2-transitive (Jardine et Sibson, 1971)
8
ENST Bretagne, département IASC
12/12/02
Se généralise à 3, 4, ..., n éléments.
x
y
z
Relation n-transitive (Jardine et Sibson, 1971)
9
ENST Bretagne, département IASC
12/12/02
Les classes formées par ces modèles relationnels
10
ENST Bretagne, département IASC
12/12/02
Une définition d’une classe
Ensemble X d’objets
On associe à chaque d(x,y)= un graphe G=(X,E)
C est une classe de X C est une clique maximale d’un G
Dissimilarité : d : X Rd(x,y)=d(y,x)d(x,y) 0d(x,x)=0
telle que
Propre si d(x,y)=0 x=y
11
ENST Bretagne, département IASC
12/12/02
Classification particulière
Arbre hiérarchique
Ultramétrique : U
u(x,y) max{u(x,z),u(z,y)}
A B {A,B
12
ENST Bretagne, département IASC
12/12/02
Le cas des hybrides
13
ENST Bretagne, département IASC
12/12/02
14
ENST Bretagne, département IASC
12/12/02
Réticulogramme
x
yz
t
u
v
w
15
ENST Bretagne, département IASC
12/12/02
Distance additive d’arbre
x
yz
t
u
v
w
Ce n’est pas à proprement parler un système de classes
16
ENST Bretagne, département IASC
12/12/02
Autre problème où l’empiétance est nécessaire : la sériation
Le problème est ici de classer des objets par ordre chronologique, les objetsétant décrit par une dissimilarité.
Une classification est alors la donnée d’un ordre compatible avec la dissimilarité
17
ENST Bretagne, département IASC
12/12/02
Lien entre sériation et classes
À la différence du modèle arboré, le problème de sériationest lié à un modèle de classe particulier : les hypergraphes d’intervalles
x y z t
Les classes d’une dissimilarité d sont un hypergraphe d’intervalleSi et seulement si il existe un ordre tel que toute classe de d
soit un intervalle de cet ordre.
18
ENST Bretagne, département IASC
12/12/02
Lien entre dissimilarités et classes
Il existe des bijections entre dissimilarités et classes
transformer une dissimilarité quelconqueen une dissimilarité d’un type particulier.
Dans ce cas, classifier c’est :
• ultramétriques hiérarchies (Jardine, Jardine et Sibson, 1967, Johnson, 1967, Benzecri, 1973)• dissimilarités fortement de Robinson pseudo-hiérarchies indicées (Durand, 1989)• quasi-ultramétriques quasi-hiérarchies indicées (Diatta et Fichet, 1994)
Les modèles de classe associés aux modèles de distancecorrespondent à des visions classificatoires différentes
19
ENST Bretagne, département IASC
12/12/02
Les k-ultramétriques(Jardine et Sibson, 1971)
Pour tout S X, |S|=k, a,b X : d(a,b) max{d(x,y) | x S {a,b}, y S}
Définition :
ie. Sur k+2 points, les deux plus grandes dissimilarités sont égales
d est une dissimilarité k-ultramétrique sur X ssi :
Intérêt : rendre compte des relations de k-transitivités
20
ENST Bretagne, département IASC
12/12/02
d est une dissimilarité fortement de Robinson sur X ssi :
• Il existe un ordre sur X • pour tout x y z d(x,z) max{d(x,y),d(y,z)}
• pour tout x y z• pour tout z t : d(x,z)=d(y,z) d(x,t)=d(y,t)• pour tout t x : d(x,z)=d(x,y) d(y,t)=d(z,t)
Définition :
Les pyramides(Diday, 1984 ; Fichet, 1984)
x y z t
Intérêt : problèmes de sériation
21
ENST Bretagne, département IASC
12/12/02
Les quasi-ultramétriques(Diatta et Fichet, 1994)
x y
z t
d est une dissimilarité quasi-ultramétrique ssi : pour tout {x,y,z,t} X :max { d(x,z), d(z,y) } d(x,y) d(z,t) max { d(t,x), d(t,y), d(x,y) }
Définition :
Intérêt (1/2): l’intersection de 3 classes est toujours l’intersection de 2 d’entres elles
22
ENST Bretagne, département IASC
12/12/02
Les quasi-ultramétriques :Intérêt (2/2)
yx
z
t
1. Les 2-boules sont exactement les cliques maximales (calculabilité)
2. L’intersection de 2 cliques maximales est une clique maximale (stabilité)
23
ENST Bretagne, département IASC
12/12/02
Relation entre les différents modèles
ultra-métrique
quasi-ultramétrique 3-ultramétrique
faible(etc.)
pyramides
distance d’arbre
24
ENST Bretagne, département IASC
12/12/02
• ultramétrique dendrogrammes
Problème : visualisation des classes d’une dissimilarité.
Visualisation des classes
• Modèles « classiques » : • Quasi-ultramétrique ?
• pyramides
1
2
3
4
5
6
25
ENST Bretagne, département IASC
12/12/02
Classes sur un chemin
x y z t
x y z t u vx y z t u v
x y z t
26
ENST Bretagne, département IASC
12/12/02
Classes sur un circuit
27
ENST Bretagne, département IASC
12/12/02
Classes sur un arbre
28
ENST Bretagne, département IASC
12/12/02
Visualisation 3D
29
ENST Bretagne, département IASC
12/12/02
Exemple : distance de mutationNombre de positions dans la protéine cytochrome-c où deux espèces ont deux
acides aminés différents (Fitch et Margoliash, 1967)
30
ENST Bretagne, département IASC
12/12/02
Ultramétrique sous dominante
31
ENST Bretagne, département IASC
12/12/02
32
ENST Bretagne, département IASC
12/12/02
33
ENST Bretagne, département IASC
12/12/02
34
ENST Bretagne, département IASC
12/12/02
35
ENST Bretagne, département IASC
12/12/02