Apprentissage et imagerie médicale : enjeux et challenges

23
1 IMAGERIE BIO – SANTE 17/07/2014 Apprentissage et imagerie médicale : enjeux et challenges Carole Lartizien [email protected] CREATIS, Lyon, France

Transcript of Apprentissage et imagerie médicale : enjeux et challenges

1 IMAGERIE BIO – SANTE 17/07/2014

1

Apprentissage et imagerie

médicale : enjeux et

challenges Carole Lartizien

[email protected]

CREATIS, Lyon, France

2 IMAGERIE BIO – SANTE 17/07/2014

Place de l’imagerie médicale dans le diagnostic

• de plus en plus de données…

• Exemples d’applications à CREATIS

Imagerie médicale et apprentissage

• Théorie de l ’apprentissage supervisé

• Projets en cours à CREATIS

Les enjeux de l’apprentissage

3 IMAGERIE BIO – SANTE 17/07/2014

Imagerie du dépistage du cancer du sein

5

10%

0

Estimation locale de la déformation du tissu

sous compression

Carcinome canalaire infiltrant

– grade II

Mammographie Examen de référence

Echographie Examen complémentaire

Déformation du milieu

Elastographie ultrasonore Extraction d’informations sur les propriétés

mécaniques à partir des images échographiques

E. Brusseau, V. Detti, A. Coulon et al, "In vivo response to compression of 35 breast lesions observed with a

two−dimensional locally regularized strain estimation method", Ultrasound Med Biol, 40(2):300-312, 2014.

4 IMAGERIE BIO – SANTE 17/07/2014

Imagerie cardiaque

[Schaerer, Media 2010]

IRM ciné Segmentation 2D automatique du myocarde

Carte paramétrique de la déformation radiale (exprimée %)

http://www.creatis.insa-lyon.fr/inTag

5 IMAGERIE BIO – SANTE 17/07/2014

Imagerie préclinique des maladies digestives

0.3 mm

IRM 4.7T endoluminale

Endo-microscopie confocale

Endoscopie

Spectrophotométrie fibrée 1 mm

H. Dorez1, R. Sablong1, L. Canaple2, H. Saint-Jalmes3, S. Gaillard1, D. Moussata 1,4, O. Beuf1 1CNRS UMR 5220 / 2CNRS UMR 5242 / 3INSERM U642 / 4CHU Lyon Sud

6 IMAGERIE BIO – SANTE 17/07/2014

dossier patient

biochimie Images

Traitement d’images, extraction de métriques, prise de décision

APPRENDRE à partir de cas connus

7 IMAGERIE BIO – SANTE 17/07/2014

Exemple d’apprentissage en neuroimagerie

Segmentation automatique de structures cérébrales

Sélection d’atlas

Extraction de

caractéristiques

Modèle

discriminant

[Tong, Neuroimage 2013]

Classe -1

Classe 1

8 IMAGERIE BIO – SANTE 17/07/2014

Théorie de l’apprentissage supervisé

Etablir un modèle de décision f(x) à partir d’un ensemble d’observations xi ∈ X = ℝd de classe yi ∈ {-1,+1}

9 IMAGERIE BIO – SANTE 17/07/2014

Classification binaire ou multiclasse

Théorie de l’apprentissage supervisé

10 IMAGERIE BIO – SANTE 17/07/2014

Théorie de l’apprentissage supervisé

xi ∈ X = ℝd de classe yi ∈ Y = Z ,

avec d<D

fonction f(xi) x’i ∈ X = ℝD de classe yi ∈ Y =Z

Données Extraction de

caractéristiques Sélection Classification

11 IMAGERIE BIO – SANTE 17/07/2014

Théorie de l’apprentissage supervisé

Optimisation des différentes étapes basée sur une métrique dérivées de l’analyse psychophysique (courbe ROC, sensibilité, spécificité)

Données Extraction de

caractéristiques selection Classification

• Modèles génératifs • Modèles discriminatifs

• méthodes ‘filtre’: e.g. information mutuelle

• Méthodes ‘enveloppantes’ : e.g. algorithme génétique

• basées sur l’image • dérivées de

l’expertise clinique • métadonnées

0 0.2 0.4 0.6 0.8 1

1-spécificité

(Taux de faux positifs)

0.6

1

0.8

0.4

0.2

0 sen

sib

ilit

é

(Tau

x d

e v

rais

po

sit

ifs)

Seuil=1

Seuil=0.8

Seuil=0.5 Seuil=0.3

Seuil=0

AUC

12 IMAGERIE BIO – SANTE 17/07/2014

Données hétérogènes, corrélées, bruitées

Espace des caractéristiques de grande dimension

Base d’apprentissage de petite taille

Annotations difficilement accessibles: quelle vérité terrain?

Caractéristiques descriptives en imagerie médicale

Contourage manuelle de lésions

pulmonaires en imagerie TDM

Contourage manuelle d’une lésion

réalisé par 4 experts

[Biancardi, IJCARS 2010]

13 IMAGERIE BIO – SANTE 17/07/2014

Théorie de l’apprentissage supervisé

Etablir un modèle de décision à partir d’un ensemble d’objets xi ∈ X = ℝd de classe yi ∈ {-1,+1}

complexité Erreur

f1 - (3,3)

f2 + (0,0)

Erreur

(5,6)

(0,0)

Erreur

(4,4)

(6,4)

Recherche d’un compromis entre l’erreur empirique et la complexité du modèle de décision

Classe -1

Classe 1

f1

f2

14 IMAGERIE BIO – SANTE 17/07/2014

Formalisme mathématique basé sur la minimisation de l’erreur empirique sous contrainte de bonne généralisation

i

1

1min , x

n

if H

i

L y f fn

Fonction de perte

Résolution d’un problème quadratique

Fonction de régularisation

0

1

2

3

4

5

6

-2 -1 0 1 2

L(y,

f(x)

) yf(x)

coût empirique

Coût charnière

Coût charnièreau carré

Exemples de fonctions de perte

i i, x max 0,1 xi iL y f y f

Coût charnière

Théorie de l’apprentissage supervisé

15 IMAGERIE BIO – SANTE 17/07/2014

Exemple du SVM linéaire

i

1

1min , x

n

if H

i

L y f fn

A partir d’un ensemble d’apprentissage S= {(x1,y1),…(xn,yn)}

Trouver un séparateur linéaire

… maximisant la marge entre classes

: le séparateur à vaste marge

H(w, b) ={x ∊ ℝd | wTx + b = 0}

Classe -1

Classe 1

x1

x2

𝒘

yi = -1 w ⊤

xi + b ≤ -1

yi = +1 w ⊤

xi + b ≥ 1

f(x) = wTx + b

2

f w

i i, x max 0,1 xi iL y f y f

Avec

Théorie de l’apprentissage supervisé

16 IMAGERIE BIO – SANTE 17/07/2014

Détection automatique de lésions vasculaires en TDM

Contexte : • peu de données annotées,

• tâche de discrimination difficile

Méthode: • Extraction de caractéristiques

géométriques

• Apprentissage par SVM sur données non labellisées : détection de changement

16

A B C

Performance : • AUC >> Méthodes classiques par

segmentation de l’arbre vasculaire (source : Challenge MICCAI 2012

http://coronary.bigr.nl/stenoses/results/)

[Zuluaga, IJCARS 2010]

17 IMAGERIE BIO – SANTE 17/07/2014

Aide au diagnostic du cancer de la prostate par IRM multi-séquences

17

Hyposignal T2 ? Restriction de la diffusion? Hyper-vascularité ?

DCE

?

Lecteur 1 : pas de cible décrite

Lecteur 2 : une cible en zone périphérique

ADC

Faux positif : adénome de la zone

périphérique

T2w DCE

Contexte :

• Gain de l’IRM multi-séquences démontré pour le diagnostic in vivo

• Analyse des données complexe

• grande variabilité inter- et intra-lecteur

18 IMAGERIE BIO – SANTE 17/07/2014

SVM

vox = .78x.78x3 mm

T2w

0.8 0.9

vox = .78x.78x3 mm

? ?

? ? ?

T2w

CADx:

Aide au diagnostic du cancer de la prostate par IRM multi-séquences

Impact sur le diagnostic clinique

[Niaf, Radiology 2014]

• Etude psychophysique sur 7 radiologues juniors et 5 seniors

• Lecture de 30 cas • R1 et R2 : lectures sans CADx • R3 : lecture avec CADx

AU

C

70

80

90

100

R1 R2 R3

junior senior

19 IMAGERIE BIO – SANTE 17/07/2014

Les enjeux

Dimension >> Nombre d’observations

• Exemple: Extraction de caractéristiques par apprentissage de dictionnaire: existence d’une ‘signature’ du processus d’intérêt (point saillant, pathologie)

Données déséquilibrées, non étiquetées ou bruitées

• Exemple: prise en compte de l’incertitude d’étiquetage dans l’apprentissage d’un SVM : P-SVM [Niaf, IEEE TIP 2014]

Vérité terrain SVM P-SVM

20 IMAGERIE BIO – SANTE 17/07/2014

Les enjeux

Prise en compte des corrélations spatiales

• Modélisation de la corrélation dans le terme de régularisation

,

i

1

2

, i

1

1min , xx x

n

if H

i

N

s i j j

i j

L y f f S f fn

, i

,

1 x x

0 sinon

i j j

i j

S si et sont connectés

S

S matrice de dimension N x N

Vérité terrain SVM spatial-SVM

21 IMAGERIE BIO – SANTE 17/07/2014

Les enjeux

Détection de changement en présence de données bruitées : l0-SVDD

SVDD

outlier

l0-SVDD

Détection de zone épileptogène en IRM

SVDD l0-SVDD [El Azami, ESANN 2014]

22 IMAGERIE BIO – SANTE 17/07/2014

Les enjeux

Explosion des temps de calcul Accès à des ressources de calcul distribué

Utilisateurs

Exemple d’application

Infrastructure Supported by EGI Infrastructure

Uses biomed VO (most used EGI VO for life sciences in 2013)

VIP accounts for ~25% of biomed's activity

DIRAC

France-Grilles

Portail web

Virtual Imaging Platform http://www.creatis.insa-lyon.fr/vip

Débit artériel (mL.min-1.100g-1)

20

30

40

50

60

70

80

90

100

10

20

30

40

50

60

70

VIP consomme ~50

années CPU par mois

479 utilisateurs en Nov 2013

(175 en France) Cartographies des paramètres de perfusion hépatique

1 an de calcul réalisé en 9.5 jours sur la grille EGI

Index de perfusion

hépatique (%)

[Leporq, J Med Eng 2013]