1 IMAGERIE BIO – SANTE 17/07/2014
1
Apprentissage et imagerie
médicale : enjeux et
challenges Carole Lartizien
CREATIS, Lyon, France
2 IMAGERIE BIO – SANTE 17/07/2014
Place de l’imagerie médicale dans le diagnostic
• de plus en plus de données…
• Exemples d’applications à CREATIS
Imagerie médicale et apprentissage
• Théorie de l ’apprentissage supervisé
• Projets en cours à CREATIS
Les enjeux de l’apprentissage
3 IMAGERIE BIO – SANTE 17/07/2014
Imagerie du dépistage du cancer du sein
5
10%
0
Estimation locale de la déformation du tissu
sous compression
Carcinome canalaire infiltrant
– grade II
Mammographie Examen de référence
Echographie Examen complémentaire
Déformation du milieu
Elastographie ultrasonore Extraction d’informations sur les propriétés
mécaniques à partir des images échographiques
E. Brusseau, V. Detti, A. Coulon et al, "In vivo response to compression of 35 breast lesions observed with a
two−dimensional locally regularized strain estimation method", Ultrasound Med Biol, 40(2):300-312, 2014.
4 IMAGERIE BIO – SANTE 17/07/2014
Imagerie cardiaque
[Schaerer, Media 2010]
IRM ciné Segmentation 2D automatique du myocarde
Carte paramétrique de la déformation radiale (exprimée %)
http://www.creatis.insa-lyon.fr/inTag
5 IMAGERIE BIO – SANTE 17/07/2014
Imagerie préclinique des maladies digestives
0.3 mm
IRM 4.7T endoluminale
Endo-microscopie confocale
Endoscopie
Spectrophotométrie fibrée 1 mm
H. Dorez1, R. Sablong1, L. Canaple2, H. Saint-Jalmes3, S. Gaillard1, D. Moussata 1,4, O. Beuf1 1CNRS UMR 5220 / 2CNRS UMR 5242 / 3INSERM U642 / 4CHU Lyon Sud
6 IMAGERIE BIO – SANTE 17/07/2014
dossier patient
biochimie Images
Traitement d’images, extraction de métriques, prise de décision
APPRENDRE à partir de cas connus
7 IMAGERIE BIO – SANTE 17/07/2014
Exemple d’apprentissage en neuroimagerie
Segmentation automatique de structures cérébrales
Sélection d’atlas
Extraction de
caractéristiques
Modèle
discriminant
[Tong, Neuroimage 2013]
Classe -1
Classe 1
8 IMAGERIE BIO – SANTE 17/07/2014
Théorie de l’apprentissage supervisé
Etablir un modèle de décision f(x) à partir d’un ensemble d’observations xi ∈ X = ℝd de classe yi ∈ {-1,+1}
9 IMAGERIE BIO – SANTE 17/07/2014
Classification binaire ou multiclasse
Théorie de l’apprentissage supervisé
10 IMAGERIE BIO – SANTE 17/07/2014
Théorie de l’apprentissage supervisé
xi ∈ X = ℝd de classe yi ∈ Y = Z ,
avec d<D
fonction f(xi) x’i ∈ X = ℝD de classe yi ∈ Y =Z
Données Extraction de
caractéristiques Sélection Classification
11 IMAGERIE BIO – SANTE 17/07/2014
Théorie de l’apprentissage supervisé
Optimisation des différentes étapes basée sur une métrique dérivées de l’analyse psychophysique (courbe ROC, sensibilité, spécificité)
Données Extraction de
caractéristiques selection Classification
• Modèles génératifs • Modèles discriminatifs
• méthodes ‘filtre’: e.g. information mutuelle
• Méthodes ‘enveloppantes’ : e.g. algorithme génétique
• basées sur l’image • dérivées de
l’expertise clinique • métadonnées
0 0.2 0.4 0.6 0.8 1
1-spécificité
(Taux de faux positifs)
0.6
1
0.8
0.4
0.2
0 sen
sib
ilit
é
(Tau
x d
e v
rais
po
sit
ifs)
Seuil=1
Seuil=0.8
Seuil=0.5 Seuil=0.3
Seuil=0
AUC
12 IMAGERIE BIO – SANTE 17/07/2014
Données hétérogènes, corrélées, bruitées
Espace des caractéristiques de grande dimension
Base d’apprentissage de petite taille
Annotations difficilement accessibles: quelle vérité terrain?
Caractéristiques descriptives en imagerie médicale
Contourage manuelle de lésions
pulmonaires en imagerie TDM
Contourage manuelle d’une lésion
réalisé par 4 experts
[Biancardi, IJCARS 2010]
13 IMAGERIE BIO – SANTE 17/07/2014
Théorie de l’apprentissage supervisé
Etablir un modèle de décision à partir d’un ensemble d’objets xi ∈ X = ℝd de classe yi ∈ {-1,+1}
complexité Erreur
f1 - (3,3)
f2 + (0,0)
Erreur
(5,6)
(0,0)
Erreur
(4,4)
(6,4)
Recherche d’un compromis entre l’erreur empirique et la complexité du modèle de décision
Classe -1
Classe 1
f1
f2
14 IMAGERIE BIO – SANTE 17/07/2014
Formalisme mathématique basé sur la minimisation de l’erreur empirique sous contrainte de bonne généralisation
i
1
1min , x
n
if H
i
L y f fn
Fonction de perte
Résolution d’un problème quadratique
Fonction de régularisation
0
1
2
3
4
5
6
-2 -1 0 1 2
L(y,
f(x)
) yf(x)
coût empirique
Coût charnière
Coût charnièreau carré
Exemples de fonctions de perte
i i, x max 0,1 xi iL y f y f
Coût charnière
Théorie de l’apprentissage supervisé
15 IMAGERIE BIO – SANTE 17/07/2014
Exemple du SVM linéaire
i
1
1min , x
n
if H
i
L y f fn
A partir d’un ensemble d’apprentissage S= {(x1,y1),…(xn,yn)}
Trouver un séparateur linéaire
… maximisant la marge entre classes
: le séparateur à vaste marge
H(w, b) ={x ∊ ℝd | wTx + b = 0}
Classe -1
Classe 1
x1
x2
𝒘
yi = -1 w ⊤
xi + b ≤ -1
yi = +1 w ⊤
xi + b ≥ 1
f(x) = wTx + b
2
f w
i i, x max 0,1 xi iL y f y f
Avec
Théorie de l’apprentissage supervisé
16 IMAGERIE BIO – SANTE 17/07/2014
Détection automatique de lésions vasculaires en TDM
Contexte : • peu de données annotées,
• tâche de discrimination difficile
Méthode: • Extraction de caractéristiques
géométriques
• Apprentissage par SVM sur données non labellisées : détection de changement
16
A B C
Performance : • AUC >> Méthodes classiques par
segmentation de l’arbre vasculaire (source : Challenge MICCAI 2012
http://coronary.bigr.nl/stenoses/results/)
[Zuluaga, IJCARS 2010]
17 IMAGERIE BIO – SANTE 17/07/2014
Aide au diagnostic du cancer de la prostate par IRM multi-séquences
17
Hyposignal T2 ? Restriction de la diffusion? Hyper-vascularité ?
DCE
?
Lecteur 1 : pas de cible décrite
Lecteur 2 : une cible en zone périphérique
ADC
Faux positif : adénome de la zone
périphérique
T2w DCE
Contexte :
• Gain de l’IRM multi-séquences démontré pour le diagnostic in vivo
• Analyse des données complexe
• grande variabilité inter- et intra-lecteur
18 IMAGERIE BIO – SANTE 17/07/2014
SVM
vox = .78x.78x3 mm
T2w
0.8 0.9
vox = .78x.78x3 mm
? ?
? ? ?
T2w
CADx:
Aide au diagnostic du cancer de la prostate par IRM multi-séquences
Impact sur le diagnostic clinique
[Niaf, Radiology 2014]
• Etude psychophysique sur 7 radiologues juniors et 5 seniors
• Lecture de 30 cas • R1 et R2 : lectures sans CADx • R3 : lecture avec CADx
AU
C
70
80
90
100
R1 R2 R3
junior senior
19 IMAGERIE BIO – SANTE 17/07/2014
Les enjeux
Dimension >> Nombre d’observations
• Exemple: Extraction de caractéristiques par apprentissage de dictionnaire: existence d’une ‘signature’ du processus d’intérêt (point saillant, pathologie)
Données déséquilibrées, non étiquetées ou bruitées
• Exemple: prise en compte de l’incertitude d’étiquetage dans l’apprentissage d’un SVM : P-SVM [Niaf, IEEE TIP 2014]
Vérité terrain SVM P-SVM
20 IMAGERIE BIO – SANTE 17/07/2014
Les enjeux
Prise en compte des corrélations spatiales
• Modélisation de la corrélation dans le terme de régularisation
,
i
1
2
, i
1
1min , xx x
n
if H
i
N
s i j j
i j
L y f f S f fn
, i
,
1 x x
0 sinon
i j j
i j
S si et sont connectés
S
S matrice de dimension N x N
Vérité terrain SVM spatial-SVM
21 IMAGERIE BIO – SANTE 17/07/2014
Les enjeux
Détection de changement en présence de données bruitées : l0-SVDD
SVDD
outlier
l0-SVDD
Détection de zone épileptogène en IRM
SVDD l0-SVDD [El Azami, ESANN 2014]
22 IMAGERIE BIO – SANTE 17/07/2014
Les enjeux
Explosion des temps de calcul Accès à des ressources de calcul distribué
Utilisateurs
Exemple d’application
Infrastructure Supported by EGI Infrastructure
Uses biomed VO (most used EGI VO for life sciences in 2013)
VIP accounts for ~25% of biomed's activity
DIRAC
France-Grilles
Portail web
Virtual Imaging Platform http://www.creatis.insa-lyon.fr/vip
Débit artériel (mL.min-1.100g-1)
20
30
40
50
60
70
80
90
100
10
20
30
40
50
60
70
VIP consomme ~50
années CPU par mois
479 utilisateurs en Nov 2013
(175 en France) Cartographies des paramètres de perfusion hépatique
1 an de calcul réalisé en 9.5 jours sur la grille EGI
Index de perfusion
hépatique (%)
[Leporq, J Med Eng 2013]
23 IMAGERIE BIO – SANTE 17/07/2014
Remerciements
Imagerie du sein : • Elisabeth Brusseau [email protected]
Imagerie cardiaque : • Patrick Clarysse [email protected]
Imagerie digestive : • Olivier Beuf [email protected]
• Raphael Sablong [email protected]
• Hugo Dorez [email protected]
Imagerie vasculaire • Maciej Orkisz [email protected]
Calcul distribué : • Tristan Glatard [email protected]
• Sorina Pop [email protected]
Top Related